ProvidersMoreHTML 转文本On this pageHTML 转文本 html2text 是一个将 HTML 页面转换为干净、易读的纯 ASCII 文本 的 Python 包。 ASCII 也恰好是有效的 Markdown(一种文本到 HTML 的格式)。 安装与设置 pip install html2text 文档转换器 查看使用示例。 from langchain_community.document_loaders import Html2TextTransformer