Dedoc
Dedoc
支持 DOCX
、XLSX
、PPTX
、EML
、HTML
、PDF
、图像等。
支持格式的完整列表可以在 这里 找到。
安装和设置
Dedoc 库
您可以使用 pip
安装 Dedoc
。
在这种情况下,您需要安装依赖项,
请访问 这里
以获取更多信息。
pip install dedoc
Dedoc API
如果您要使用 Dedoc
API,您无需安装 dedoc
库。
在这种情况下,您应该运行 Dedoc
服务,例如 Docker
容器(请参见
文档
以获取更多详细信息):
docker pull dedocproject/dedoc
docker run -p 1231:1231
文档加载器
-
对 于处理任何格式的文件(由
Dedoc
支持),您可以使用DedocFileLoader
:from langchain_community.document_loaders import DedocFileLoader
-
对于处理 PDF 文件(有或没有文本层),您可以使用
DedocPDFLoader
:from langchain_community.document_loaders import DedocPDFLoader
-
对于处理任何格式的文件而无需安装库, 您可以使用
Dedoc API
和DedocAPIFileLoader
:from langchain_community.document_loaders import DedocAPIFileLoader
有关更多详细信息,请参见使用示例。