浏览器插件
让 AI 员工在沙箱中操作浏览器——网页浏览、截图、表单填写。
概述
浏览器插件让 AI 员工能够在隔离的浏览器环境中操作网页,适用于 Web 测试、内容发布、信息采集等场景。底层基于 Playwright + Chromium 实现。
工具列表
| 工具名 | 功能 | 主要参数 |
|---|---|---|
browser_navigate | 导航到指定 URL | url — 目标网址 |
browser_snapshot | 获取页面文本快照 | 返回 DOM 可见文本内容 |
browser_screenshot | 页面截图 | 返回 base64 编码的图片 |
browser_click | 点击页面元素 | selector — CSS 选择器 |
browser_type | 在输入框中输入文本 | selector + text |
与工作电脑的关系
浏览器插件有两种执行模式:
| 场景 | 执行位置 | 说明 |
|---|---|---|
| AI 员工有工作电脑 | Docker 容器内的 Playwright | 使用 node_browse 工具,在容器内操作 |
| AI 员工无工作电脑 | OpenVort 内置浏览器沙箱 | 使用 browser_* 工具,在服务端沙箱操作 |
当 AI 员工绑定了在线的工作电脑时,内置的 browser_* 工具会被自动屏蔽,改用 node_browse 在容器内操作,避免冲突。
使用场景
- Web 应用测试 — 打开被测页面、操作表单、截图记录结果
- 内容发布 — 登录内容平台、填写文章、上传图片、发布
- 信息采集 — 访问网页、提取关键信息
- 竞品分析 — 浏览竞品页面、截图对比
使用示例
用户: 帮我看看我们的首页加载正不正常
AI: 好的,我来打开看看。
浏览 https://example.com
[截图: 首页加载结果]
AI: 首页加载正常,耗时约 1.2 秒。页面结构完整,没有明显问题。
安全说明
- 浏览器在隔离沙箱中运行,不影响宿主机
- 每次会话结束后浏览器状态自动清理
- 不会泄露宿主机的 Cookie 或登录态