当前位置: 首页 > news >正文

Browser Use — AI驱动浏览器自动化的全新范式

什么是 Browser Use?

Browser Use 是一个开源的浏览器自动化工具生态,核心项目包括browser-harness—— 一个轻量级、可编辑的 CDP (Chrome DevTools Protocol) 控制层,让 AI 能够直接操控你的真实 Chrome 浏览器。

它的设计理念是:“你将永远不再亲自操作浏览器”。AI 代理通过截图、坐标点击和 JS 执行来操控页面,仿佛给浏览器装上了眼睛和双手。

为什么选择 Browser Use?

1. 极简架构

核心代码只有约 1000 行,分布在 4 个文件中。没有冗余的抽象层、重试框架或复杂配置。

2. 截图优先的交互模式

传统自动化工具(Selenium/Playwright)要求你找到选择器才能点击。Browser Harness 反其道而行之:

  • 先截图→ 看像素坐标
  • 坐标点击click_at_xy(x, y)→ 穿透 iframe/阴影 DOM/跨域
  • 再截图验证结果

3. 连接真实 Chrome

不需要启动新的浏览器实例。直接连接你正在使用的 Chrome,登录态、Cookie、扩展全部保留。

4. 原始 CDP 能力

可以直接调用任意 Chrome DevTools 协议方法,没有封装损耗。

快速上手

安装

Setup prompt

Set up https://github.com/browser-use/browser-harnessforme. Read`install.md`and follow the steps toinstallbrowser-harness and connect it to my browser.
gitclone https://github.com/browser-use/browser-harnesscdbrowser-harness uv toolinstall-e.

连接浏览器

  1. 在 Chrome 地址栏输入chrome://inspect/#remote-debugging
  2. 勾选 “Allow remote debugging for this browser instance”
  3. 运行测试:
browser-harness<<'PY' new_tab("https://example.com") wait_for_load() print(page_info()) PY

第一个脚本

browser-harness<<'PY'new_tab("https://www.baidu.com")wait_for_load()capture_screenshot("baidu.png")click_at_xy(500,300)wait_for_load()print(page_info())PY

主要能力

能力说明
页面导航打开新标签页、切换标签页、跳转 URL
截图识别截取页面截图,通过像素坐标点击
坐标点击click_at_xy(x, y) 穿透 iframe/Shadow DOM
JS 执行在页面中运行 JavaScript
HTTP 请求http_get(url) 直接发请求,不走浏览器
原始 CDP调用任意 Chrome DevTools 协议
云浏览器连接 Browser Use 云端隔离浏览器

设计哲学

Browser Harness 坚持以下原则:

  • 坐标点击优先:通过Input.dispatchMouseEvent在合成层级发送鼠标事件,穿透 iframe/阴影 DOM/跨域限制
  • 连接真实浏览器:不启动新实例,直接复用用户的 Chrome
  • 核心保持简洁:不添加重试框架、会话管理器、配置系统
  • 自我进化:代理在执行中发现缺失的工具函数时,可以直接写入agent_helpers.py

总结

Browser Use 代表了浏览器自动化的新范式——不再是"找选择器→点击",而是"截图→坐标点击→验证",更接近人类操作浏览器的方式。配合 LLM 的视觉能力,可以处理任何复杂度的 Web 任务。

  • GitHub: https://github.com/browser-use/browser-harness
  • 官网: https://browser-use.com

这篇介绍博客也是使用了Browser Use完整流程发布的,然后我再进行编辑修改的;


安装到发布文章接近300w token消耗还是挺大的,差不多3毛钱左右

http://www.rkmt.cn/news/1437669.html

相关文章:

  • JDK8 Optional详解入门:彻底告别Java空指针异常
  • MATLAB近场动力学三模型对比包:含稳定化实现、零能模式修正与能量/位移可视化
  • PHP人脸识别与图像AI处理集成
  • Matlab版双强度GS相位恢复工具包:含仿真、迭代求解与标准流程脚本
  • Python算法基础篇之斐波那契数列详解
  • 别再踩坑了!Ubuntu 22.04 上 Zabbix 6.0 保姆级安装与配置全记录(含MySQL 8.0适配)
  • CASME2微表情识别工具:支持摄像头实时捕捉、单图识别与视频逐帧分析
  • 锂离子电池RUL预测实战包:Python代码+多尺度采样数据+预训练时序模型
  • CentOS 7上Python 3连接达梦数据库:保姆级dmPython驱动编译安装指南(含环境变量避坑)
  • 避坑指南:在Ubuntu 20.04上从零搭建OSTrack训练环境(含GOT-10k数据集处理)
  • 【Gemini中文处理能力深度测评】:20年NLP专家实测12项指标,98.7%准确率背后的3大技术突破
  • 使用C语言重写“strcat”和“strcmp”两个方法
  • 别再死记硬背公式了!用Python从零手搓一个BP神经网络(附完整代码)
  • ICM20948九轴DMP姿态解算工程套件:含驱动配置、串口调试与3D可视化工具
  • PACS 影像云解决方案深度评测与选型指南
  • 告别重装烦恼:用CGI-Plus v5.0.0.6单文件版,5分钟搞定Windows系统备份与还原
  • 龙城秘境手游官网下载:2026 年 6 月最新官方下载渠道
  • Linux Mint系统恢复翻车实录:手把手教你正确配置Timeshift快照(附断电重启大法)
  • 新手学习全过程实录06——零基础搭建鸿蒙天气应用
  • 校园外卖系统毕业设计全套:SpringBoot+Vue可运行源码+数据库+论文+答辩PPT+实操视频
  • 厨房质检员——从阿明的“祖传配方“到标准化质检,看测试金字塔的落地
  • 视频号解析接口上线!无需登录,复制链接直接解析
  • 2026可靠科尔摩根驱动器选购推荐:伦茨制动器、伦茨变频器、伦茨控制器、伦茨电机、伦茨直流调速器、伦茨维修、伦茨驱动器选择指南 - 优质品牌商家
  • 无人机非定常气流控制与VPM模型实时实现
  • 再薅嘉立创羊毛
  • 联想电脑丢了F11一键还原?手把手教你用官方工具找回原厂系统(含Office)
  • 别再手动跑实验了!用Python脚本一键搞定YOLOv8消融实验(附完整代码)
  • 2026建筑用环氧厚浆漆优质供应商推荐:醇酸调和漆、醇酸防锈漆、醇酸面漆、金淇顿涂料、钢结构快干防锈漆、丙烯酸脂肪族聚氨酯面漆选择指南 - 优质品牌商家
  • 5、What makes an AI company:造就一家人工智能公司需要什么
  • AI视频生成技术演进路线图:从Stable Video到实时神经渲染,2024-2030关键拐点全解析