Skip to main content

Doctran

Doctran 是一个 Python 包。它使用大型语言模型和开源 自然语言处理库,将原始文本转换为干净、结构化、信息密集的文档 这些文档经过优化以便于向量空间检索。你可以把 Doctran 想象成一个黑箱, 杂乱的字符串输入,干净、标记的字符串输出。

安装和设置

pip install doctran

文档转换器

文档审问器

查看 DoctranQATransformer 的使用示例

from langchain_community.document_loaders import DoctranQATransformer

属性提取器

查看 DoctranPropertyExtractor 的使用示例

from langchain_community.document_loaders import DoctranPropertyExtractor

文档翻译器

查看 DoctranTextTranslator 的使用示例

from langchain_community.document_loaders import DoctranTextTranslator

Was this page helpful?


You can also leave detailed feedback on GitHub.

扫我,入群扫我,找书