WebBaseLoader
这部分介绍了如何使用 WebBaseLoader
从 HTML
网页加载所有文本到我们可以在后续使用的文档格式中。有关加载网页的更多自定义逻辑,请查看一些子类示例,如 IMSDbLoader
、AZLyricsLoader
和 CollegeConfidentialLoader
。
如果您不想担心网站爬虫、绕过 JS 阻止的网站和数据清理,请考虑使用 FireCrawlLoader
或更快的选项 SpiderLoader
。
概述
集成细节
- TODO: 填写表格特性。
- TODO: 如果不相关,请删除 JS 支持链接,否则确保链接正确。
- TODO: 确保 API 参考链接正确。
类别 |
---|