浏览器插件

让 AI 员工在沙箱中操作浏览器——网页浏览、截图、表单填写。

概述

浏览器插件让 AI 员工能够在隔离的浏览器环境中操作网页,适用于 Web 测试、内容发布、信息采集等场景。底层基于 Playwright + Chromium 实现。

工具列表

工具名功能主要参数
browser_navigate导航到指定 URLurl — 目标网址
browser_snapshot获取页面文本快照返回 DOM 可见文本内容
browser_screenshot页面截图返回 base64 编码的图片
browser_click点击页面元素selector — CSS 选择器
browser_type在输入框中输入文本selector + text

与工作电脑的关系

浏览器插件有两种执行模式:

场景执行位置说明
AI 员工有工作电脑Docker 容器内的 Playwright使用 node_browse 工具,在容器内操作
AI 员工无工作电脑OpenVort 内置浏览器沙箱使用 browser_* 工具,在服务端沙箱操作

当 AI 员工绑定了在线的工作电脑时,内置的 browser_* 工具会被自动屏蔽,改用 node_browse 在容器内操作,避免冲突。

使用场景

  • Web 应用测试 — 打开被测页面、操作表单、截图记录结果
  • 内容发布 — 登录内容平台、填写文章、上传图片、发布
  • 信息采集 — 访问网页、提取关键信息
  • 竞品分析 — 浏览竞品页面、截图对比

使用示例

用户: 帮我看看我们的首页加载正不正常

AI: 好的,我来打开看看。
  浏览 https://example.com
  [截图: 首页加载结果]

AI: 首页加载正常,耗时约 1.2 秒。页面结构完整,没有明显问题。

安全说明

  • 浏览器在隔离沙箱中运行,不影响宿主机
  • 每次会话结束后浏览器状态自动清理
  • 不会泄露宿主机的 Cookie 或登录态