Skip to main content

Azure Blob Storage 容器

Azure Blob Storage 是微软的云对象存储解决方案。Blob 存储经过优化,适合存储大量非结构化数据。非结构化数据是指不遵循特定数据模型或定义的数据,例如文本或二进制数据。

Azure Blob Storage 旨在:

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 流式传输视频和音频。
  • 写入日志文件。
  • 存储用于备份和恢复、灾难恢复以及归档的数据。
  • 存储供本地或 Azure 托管服务分析的数据。

本笔记本涵盖如何从 Azure Blob Storage 的容器中加载文档对象。

%pip install --upgrade --quiet  azure-storage-blob
<!--IMPORTS:[{"imported": "AzureBlobStorageContainerLoader", "source": "langchain_community.document_loaders", "docs": "https://python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.azure_blob_storage_container.AzureBlobStorageContainerLoader.html", "title": "Azure Blob Storage Container"}]-->
from langchain_community.document_loaders import AzureBlobStorageContainerLoader
loader = AzureBlobStorageContainerLoader(conn_str="<conn_str>", container="<container>")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': '/var/folders/y6/8_bzdg295ld6s1_97_12m4lr0000gn/T/tmpaa9xl6ch/fake.docx'}, lookup_index=0)]

指定前缀

您还可以指定前缀,以更精细地控制要加载的文件。

loader = AzureBlobStorageContainerLoader(
conn_str="<conn_str>", container="<container>", prefix="<prefix>"
)
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': '/var/folders/y6/8_bzdg295ld6s1_97_12m4lr0000gn/T/tmpujbkzf_l/fake.docx'}, lookup_index=0)]

相关


Was this page helpful?


You can also leave detailed feedback on GitHub.

扫我,入群扫我,找书