Browserbase
Browserbase 是一个开发者平台,用于可靠地运行、管理和监控无头浏览器。
为您的 AI 数据检索提供支持:
安装和设置
- 从 browserbase.com 获取 API 密钥和项目 ID,并将其设置为环境变量 (
BROWSERBASE_API_KEY
,BROWSERBASE_PROJECT_ID
)。 - 安装 Browserbase SDK:
% pip install browserbase
加载文档
您可以使用 BrowserbaseLoader
将网页加载到 LangChain 中。可选地,您可以设置 text_content
参数以将页面转换为仅文本表示。
<!--IMPORTS:[{"imported": "BrowserbaseLoader", "source": "langchain_community.document_loaders", "docs": "https://python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.browserbase.BrowserbaseLoader.html", "title": "Browserbase"}]-->
from langchain_community.document_loaders import BrowserbaseLoader
loader = BrowserbaseLoader(
urls=[
"https://example.com",
],
# Text mode
text_content=False,
)
docs = loader.load()
print(docs[0].page_content[:61])
加载器选项
urls
必填。要获取的 URL 列表。text_content
仅检索文本内容。默认值为False
。api_key
可选。Browserbase API 密钥。默认值为BROWSERBASE_API_KEY
环境变量。project_id
可选。Browserbase 项目 ID。默认值为BROWSERBASE_PROJECT_ID
环境变量。session_id
可选。提供现有的会话 ID。proxy
可选。启用/禁用代理。
加载图像
您还可以加载网页的截图(以字节形式)用于多模态模型。
使用 GPT-4V 的完整示例:
<!--IMPORTS:[{"imported": "HumanMessage", "source": "langchain_core.messages", "docs": "https://python.langchain.com/api_reference/core/messages/langchain_core.messages.human.HumanMessage.html", "title": "Browserbase"}, {"imported": "ChatOpenAI", "source": "langchain_openai", "docs": "https://python.langchain.com/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html", "title": "Browserbase"}]-->
from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()
screenshot = browser.screenshot("https://browserbase.com")
result = chat.invoke(
[
HumanMessage(
content=[
{"type": "text", "text": "What color is the logo?"},
GPT4VImage(screenshot, GPT4VImageDetail.auto),
]
)
]
)
print(result.content)