6大核心模块(Modules)
文档加载器(Document Loaders)

LangChain

文档加载器#

概念指南 (opens in a new tab)

将语言模型与自己的文本数据结合使用是区分它们的强大方式。 这样做的第一步是将数据加载到“文档”中-一种花哨的方式来说一些文本片段。 该模块旨在使这个过程变得容易。

这样做的主要驱动因素是Unstructured (opens in a new tab) Python 包。 该软件包是将所有类型的文件-文本、PowerPoint、图像、HTML、PDF 等-转换为文本数据的好方法。

有关如何设置 Unstructured 的详细说明,请参见此处 (opens in a new tab)的安装指南。

提供以下文档加载器: