Browserbase

Browserbase 是一个开发者平台，用于可靠地运行、管理和监控无头浏览器。

为您的 AI 数据检索提供支持：

无服务器基础设施提供可靠的浏览器，从复杂的用户界面中提取数据
隐身模式包含指纹识别策略和自动验证码解决功能
会话调试器用于检查您的浏览器会话，包括网络时间线和日志
实时调试快速调试您的自动化

安装和设置

从 browserbase.com 获取 API 密钥和项目 ID，并将其设置为环境变量 (BROWSERBASE_API_KEY, BROWSERBASE_PROJECT_ID)。
安装 Browserbase SDK：

% pip install browserbase

加载文档

您可以使用 BrowserbaseLoader 将网页加载到 LangChain 中。可选地，您可以设置 text_content 参数以将页面转换为仅文本表示。

<!--IMPORTS:[{"imported": "BrowserbaseLoader", "source": "langchain_community.document_loaders", "docs": "https://python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.browserbase.BrowserbaseLoader.html", "title": "Browserbase"}]-->
from langchain_community.document_loaders import BrowserbaseLoader

loader = BrowserbaseLoader(
    urls=[
        "https://example.com",
    ],
    # Text mode
    text_content=False,
)

docs = loader.load()
print(docs[0].page_content[:61])

加载器选项

urls 必填。要获取的 URL 列表。
text_content 仅检索文本内容。默认值为 False。
api_key 可选。Browserbase API 密钥。默认值为 BROWSERBASE_API_KEY 环境变量。
project_id 可选。Browserbase 项目 ID。默认值为 BROWSERBASE_PROJECT_ID 环境变量。
session_id 可选。提供现有的会话 ID。
proxy 可选。启用/禁用代理。

加载图像

您还可以加载网页的截图（以字节形式）用于多模态模型。

使用 GPT-4V 的完整示例：

<!--IMPORTS:[{"imported": "HumanMessage", "source": "langchain_core.messages", "docs": "https://python.langchain.com/api_reference/core/messages/langchain_core.messages.human.HumanMessage.html", "title": "Browserbase"}, {"imported": "ChatOpenAI", "source": "langchain_openai", "docs": "https://python.langchain.com/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html", "title": "Browserbase"}]-->
from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()

screenshot = browser.screenshot("https://browserbase.com")

result = chat.invoke(
    [
        HumanMessage(
            content=[
                {"type": "text", "text": "What color is the logo?"},
                GPT4VImage(screenshot, GPT4VImageDetail.auto),
            ]
        )
    ]
)

print(result.content)

Browserbase

安装和设置

加载文档

加载器选项

加载图像

相关

Was this page helpful?

You can also leave detailed feedback on GitHub.

安装和设置​

加载文档​

加载器选项​

加载图像​

相关​

Was this page helpful?

You can also leave detailed feedback on GitHub.

安装和设置

加载文档

加载器选项

加载图像

相关