BrowserBC是什么
BrowserBC 是 Einsia AI 旗下 Navers Lab 发布的开源项目,核心目标是将人类在浏览器中的操作轨迹转化为可复用的自然语言技能(Skill),让 Web Agent 能”克隆”人类操作经验,更高效地完成同类任务。用户只需在浏览器中把任务做一遍,系统能自动将这段操作蒸馏成一份结构化的”技能卡”,交给任意模型执行,实现”做一次、复用无数次”。
![]()
BrowserBC的主要功能
- 轨迹录制:通过浏览器扩展完整记录任务全过程,包括页面截图、DOM 快照、用户动作(点击、输入、跳转)、页面反馈及最终状态。
- 智能蒸馏:将原始嘈杂轨迹清洗、去噪后,按语义切分为连贯子过程,再转写为结构化的自然语言技能卡(Skill Card),剥离坐标、选择器等脆弱细节,保留”该做什么、怎么判断完成、失败了怎么办”等可迁移的过程性知识。
- 技能图管理:将海量技能组织成可扩展的 skill graph,通过语义相似度自动合并、特化、链接相关技能,避免重复冗余。
- 技能检索与执行:Agent 根据检索到的技能卡指导,结合实时页面状态自主落地操作,而非机械复刻坐标。
- 本地部署:提供 Journey Forge Local 版本,纯 Python 运行,数据完全本地存储,支持 Claude Code 和 Claude Desktop 集成。
![]()
微信关注回复 “开源”,加入AI开源项目交流群
如何使用BrowserBC
- 配置并运行本地服务器:复制配置文件并设置 LLM API Key,启动服务器后访问 http://127.0.0.1:8099/ 控制面板。
- 构建并加载浏览器扩展:在
extension 目录下安装依赖并构建,然后在 Chrome 扩展管理中以开发者模式加载 extension/dist/chrome-mv3。 - 录制任务:使用扩展录制浏览器操作,停止后标记任务意图并上传。
- 自动蒸馏:后台流水线自动完成 atomize(原子化)→ classify(分类)→ bucket(分桶)→ distill(蒸馏)→ install(安装),约 1-3 分钟生成技能。
- 使用技能:
- Claude Code:技能自动安装到
~/.claude/skills/ 目录下。 - Claude Desktop:从控制面板下载
.zip 文件,在 Settings → Skills 中上传。
- 配置浏览器执行(可选):在控制面板中配置 Playwright MCP,使 Claude Desktop 能够实际点击/输入/导航。
BrowserBC的核心优势
- 技能可迁移:技能是自然语言形式的”过程性先验”,可在不同模型之间自由传递和复用。强模型蒸馏一次,小模型也能便宜复用。
- 剥离脆弱细节:不克隆坐标或 DOM 选择器,而是克隆”做什么 + 怎么判断完成”,使技能在页面布局变化时仍能举一反三。
- 显著提升成功率:在 WebArena-Hard 上成功率从 60.5% 提升至 81.4%(+20.9%),在 ClawBench 上从 32.9% 提升至 68.4%(+35.5%)。
- 提升交互效率:平均工具调用次数从 31.2 次降至 22.7 次(减少 27.3%),有效削减试探性导航。
- 跨域迁移潜力:过程性先验可以跨越浏览器边界,初步研究显示可迁移到 OSWorld 桌面环境。
- 数据隐私安全:本地部署版本所有数据存储在本地,仅蒸馏时调用配置的 LLM API。
BrowserBC的官网地址
- 项目博客:https://lab.einsia.ai/browserbc/
- GitHub 仓库:https://github.com/Einsia/Browser-BC
- 论文:https://lab.einsia.ai/browserbc/paper
BrowserBC的同类竞品对比
维度 | BrowserBC | 传统 RPA / 按键精灵 | Playwright / MCP 工具 | 通用 Web Agent(如 Claude/Codex) | 核心定位人类轨迹 → 可复用技能录制坐标 → 机械回放浏览器控制 API从零探索网页
复用方式自然语言技能卡,语义化复用固定坐标/选择器回放需编写代码脚本每次任务重新摸索
页面变化适应性强(剥离脆弱细节)极弱(布局一变即失效)中等(需维护选择器)强(实时感知页面)
知识积累可积累技能图,持续扩展脚本堆积,难以管理依赖代码库维护无积累,每次从零开始
执行成本强模型蒸馏一次,小模型便宜复用运行成本低开发成本高每次需调用最强模型
数据隐私本地部署,数据不出机器本地运行本地/云端均可通常依赖云端 API
BrowserBC的应用场景
- 旅行预订与比价:在 Airbnb、Booking 等预订网站输入时间、地点、人数,应用筛选器(评分、价格、设施),阅读搜索结果并排序找出最优住宿选项。
- 电商购物与筛选:在购物平台搜索商品、应用多重筛选条件(价格区间、品牌、评分)、对比商品详情、加入购物车并完成结算流程。
- 后台管理操作:在电商后台、CMS 系统或管理面板中执行商品上架、订单处理、库存更新、用户权限配置等重复性管理任务。
- 社区论坛互动:在 Reddit 等论坛中搜索话题、筛选帖子、参与讨论、收集信息或执行版主管理操作。
- 跨站点信息整合:需要从多个网站采集、对比并整合信息的任务,如跨平台比价、多源数据汇总、竞品监控等。
- 开发工具使用:在 GitHub、GitLab 等开发平台执行代码仓库操作(登录、创建项目、提交 Issue、合并请求)、CI/CD 配置或文档查阅。