Google Vertex AI 向量搜索
本笔记本展示了如何使用与 Google Cloud Vertex AI 向量搜索
向量数据库相关的功能。
Google Vertex AI 向量搜索,前身为 Vertex AI 匹配引擎,提供行业领先的高规模低延迟向量数据库。这些向量数据库通常被称为向量相似性匹配或近似最近邻 (ANN) 服务。
注意:Langchain API 期望已经创建的端点和部署的索引。索引创建时间可能需要长达一个小时。
要了解如何创建索引,请参考 创建索引并将其部署到端点 部分。 如果您已经部署了索引,请跳到 从文本创建向量存储。
创建索引并将其部署到端点
- 本节演示如何创建一个新的索引并将其部署到一个端点。
# TODO : Set values as per your requirements
# Project and Storage Constants
PROJECT_ID = "<my_project_id>"
REGION = "<my_region>"
BUCKET = "<my_gcs_bucket>"
BUCKET_URI = f"gs://{BUCKET}"
# The number of dimensions for the textembedding-gecko@003 is 768
# If other embedder is used, the dimensions would probably need to change.
DIMENSIONS = 768
# Index Constants
DISPLAY_NAME = "<my_matching_engine_index_id>"
DEPLOYED_INDEX_ID = "<my_matching_engine_endpoint_id>"
# Create a bucket.
! gsutil mb -l $REGION -p $PROJECT_ID $BUCKET_URI
使用 VertexAIEmbeddings 作为嵌入模型
from google.cloud import aiplatform
from langchain_google_vertexai import VertexAIEmbeddings
aiplatform.init(project=PROJECT_ID, location=REGION, staging_bucket=BUCKET_URI)
embedding_model = VertexAIEmbeddings(model_name="textembedding-gecko@003")