MyScale
本页面介绍如何在LangChain中使用MyScale向量数据库。 内容分为两个部分:安装和设置,以及对特定MyScale包装器的参考。
使用MyScale,您可以管理结构化和非结构化(向量化)数据,并使用SQL对这两种类型的数据执行联合查询和分析。此外,MyScale基于ClickHouse构建的云原生OLAP架构,即使在大规模数据集上也能实现闪电般的数据处理速度。
介绍
您现在可以在我们的SaaS上注册并立即启动集群!
如果您还对我们如何将SQL与向量集成感兴趣,请参考此文档以获取进一步的语法参考。
我们还在huggingface上提供实时演示!请查看我们的huggingface空间!他们在眨眼之间搜索数百万个向量!
安装和设置
- 使用
pip install clickhouse-connect
安装 Python SDK
设置环境
有两种方法可以为 myscale 索引设置参数。
- 环境变量
在运行应用程序之前,请使用 export
设置环境变量:
export MYSCALE_HOST='' MYSCALE_PORT= MYSCALE_USERNAME= MYSCALE_PASSWORD= ...
您可以在我们的 SaaS 上轻松找到您的账户、密码和其他信息。有关详细信息,请参阅 此文档
MyScaleSettings
下的每个属性都可以使用前缀 MYSCALE_
设置,并且不区分大小写。
-
创建带有参数的
MyScaleSettings
对象from langchain_community.vectorstores import MyScale, MyScaleSettings
config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)
包装器
支持的函数:
add_texts
add_documents
from_texts
from_documents
similarity_search
asimilarity_search
similarity_search_by_vector
asimilarity_search_by_vector
相似性搜索与相关性评分
删除
向量存储
存在一个 MyScale 数据库的封装器,允许您将其用作向量存储, 无论是用于语义搜索还是类似示例检索。
要导入此向量存储:
from langchain_community.vectorstores import MyScale
有关 MyScale 封装器的更详细说明,请参见 此笔记本