WebBaseLoader
这部分介绍了如何使用 WebBaseLoader 从 HTML 网页加载所有文本到我们可以在后续使用的文档格式中。有关加载网页的更多自定义逻辑,请查看一些子类示例,如 IMSDbLoader、AZLyricsLoader 和 CollegeConfidentialLoader。
如果您不想担心网站爬虫、绕过 JS 阻止的网站和数据清理,请考虑使用 FireCrawlLoader 或更快的选项 SpiderLoader。
概述
集成细节
- TODO: 填写表格特性。
- TODO: 如果不相关,请删除 JS 支持链接,否则确保链接正确。
- TODO: 确保 API 参考链接正确。
| 类别 |
|---|