Skip to main content

BeautifulSoup

BeautifulSoup 是一个用于解析的 Python 包 HTML 和 XML 文档(包括处理格式错误的标记,即未闭合的标签,因此得名标记汤)。 它为解析的页面创建一个解析树,可以用于从 HTML 中提取数据,[3] 这 对于网络爬虫非常有用。

安装和设置

pip install beautifulsoup4

文档转换器

查看使用示例

from langchain_community.document_loaders import BeautifulSoupTransformer

Was this page helpful?


You can also leave detailed feedback on GitHub.

扫我,入群扫我,找书