DuckDB

DuckDB 是一个内嵌式 SQL OLAP 数据库管理系统。

加载一个每行一个文档的 DuckDB 查询。

%pip install --upgrade --quiet  duckdb

<!--IMPORTS:[{"imported": "DuckDBLoader", "source": "langchain_community.document_loaders", "docs": "https://python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.duckdb_loader.DuckDBLoader.html", "title": "DuckDB"}]-->
from langchain_community.document_loaders import DuckDBLoader

%%file example.csv
Team,Payroll
Nationals,81.34
Reds,82.20

Writing example.csv

loader = DuckDBLoader("SELECT * FROM read_csv_auto('example.csv')")

data = loader.load()

print(data)

[Document(page_content='Team: Nationals\nPayroll: 81.34', metadata={}), Document(page_content='Team: Reds\nPayroll: 82.2', metadata={})]

指定哪些列是内容与元数据

loader = DuckDBLoader(
    "SELECT * FROM read_csv_auto('example.csv')",
    page_content_columns=["Team"],
    metadata_columns=["Payroll"],
)

data = loader.load()

print(data)

[Document(page_content='Team: Nationals', metadata={'Payroll': 81.34}), Document(page_content='Team: Reds', metadata={'Payroll': 82.2})]

向元数据添加来源

loader = DuckDBLoader(
    "SELECT Team, Payroll, Team As source FROM read_csv_auto('example.csv')",
    metadata_columns=["source"],
)

data = loader.load()

print(data)

[Document(page_content='Team: Nationals\nPayroll: 81.34\nsource: Nationals', metadata={'source': 'Nationals'}), Document(page_content='Team: Reds\nPayroll: 82.2\nsource: Reds', metadata={'source': 'Reds'})]

DuckDB

指定哪些列是内容与元数据

向元数据添加来源

相关

Was this page helpful?

You can also leave detailed feedback on GitHub.

指定哪些列是内容与元数据​

向元数据添加来源​

相关​

Was this page helpful?

You can also leave detailed feedback on GitHub.

指定哪些列是内容与元数据

向元数据添加来源

相关