当前位置：首页 > news >正文

Browser Use — AI驱动浏览器自动化的全新范式

news 2026/6/1 1:59:13

什么是 Browser Use？

Browser Use 是一个开源的浏览器自动化工具生态，核心项目包括browser-harness—— 一个轻量级、可编辑的 CDP (Chrome DevTools Protocol) 控制层，让 AI 能够直接操控你的真实 Chrome 浏览器。

它的设计理念是：“你将永远不再亲自操作浏览器”。AI 代理通过截图、坐标点击和 JS 执行来操控页面，仿佛给浏览器装上了眼睛和双手。

为什么选择 Browser Use？

1. 极简架构

核心代码只有约 1000 行，分布在 4 个文件中。没有冗余的抽象层、重试框架或复杂配置。

2. 截图优先的交互模式

传统自动化工具（Selenium/Playwright）要求你找到选择器才能点击。Browser Harness 反其道而行之：

先截图→ 看像素坐标
坐标点击click_at_xy(x, y)→ 穿透 iframe/阴影 DOM/跨域
再截图验证结果

3. 连接真实 Chrome

不需要启动新的浏览器实例。直接连接你正在使用的 Chrome，登录态、Cookie、扩展全部保留。

4. 原始 CDP 能力

可以直接调用任意 Chrome DevTools 协议方法，没有封装损耗。

快速上手

安装

Setup prompt

Set up https://github.com/browser-use/browser-harnessforme. Read`install.md`and follow the steps toinstallbrowser-harness and connect it to my browser.

gitclone https://github.com/browser-use/browser-harnesscdbrowser-harness uv toolinstall-e.

连接浏览器

在 Chrome 地址栏输入chrome://inspect/#remote-debugging
勾选 “Allow remote debugging for this browser instance”
运行测试:

browser-harness<<'PY' new_tab("https://example.com") wait_for_load() print(page_info()) PY

第一个脚本

browser-harness<<'PY'new_tab("https://www.baidu.com")wait_for_load()capture_screenshot("baidu.png")click_at_xy(500,300)wait_for_load()print(page_info())PY

主要能力

能力	说明
页面导航	打开新标签页、切换标签页、跳转 URL
截图识别	截取页面截图，通过像素坐标点击
坐标点击	click_at_xy(x, y) 穿透 iframe/Shadow DOM
JS 执行	在页面中运行 JavaScript
HTTP 请求	http_get(url) 直接发请求，不走浏览器
原始 CDP	调用任意 Chrome DevTools 协议
云浏览器	连接 Browser Use 云端隔离浏览器

设计哲学

Browser Harness 坚持以下原则：

坐标点击优先：通过Input.dispatchMouseEvent在合成层级发送鼠标事件，穿透 iframe/阴影 DOM/跨域限制
连接真实浏览器：不启动新实例，直接复用用户的 Chrome
核心保持简洁：不添加重试框架、会话管理器、配置系统
自我进化：代理在执行中发现缺失的工具函数时，可以直接写入agent_helpers.py

总结

Browser Use 代表了浏览器自动化的新范式——不再是"找选择器→点击"，而是"截图→坐标点击→验证"，更接近人类操作浏览器的方式。配合 LLM 的视觉能力，可以处理任何复杂度的 Web 任务。

GitHub: https://github.com/browser-use/browser-harness
官网: https://browser-use.com

这篇介绍博客也是使用了Browser Use完整流程发布的，然后我再进行编辑修改的；

安装到发布文章接近300w token消耗还是挺大的，差不多3毛钱左右

http://www.rkmt.cn/news/1437669.html

相关文章：

JDK8 Optional详解入门：彻底告别Java空指针异常

MATLAB近场动力学三模型对比包：含稳定化实现、零能模式修正与能量/位移可视化

PHP人脸识别与图像AI处理集成

Matlab版双强度GS相位恢复工具包：含仿真、迭代求解与标准流程脚本

Python算法基础篇之斐波那契数列详解

别再踩坑了！Ubuntu 22.04 上 Zabbix 6.0 保姆级安装与配置全记录（含MySQL 8.0适配）

CASME2微表情识别工具：支持摄像头实时捕捉、单图识别与视频逐帧分析

锂离子电池RUL预测实战包：Python代码+多尺度采样数据+预训练时序模型

CentOS 7上Python 3连接达梦数据库：保姆级dmPython驱动编译安装指南（含环境变量避坑）

避坑指南：在Ubuntu 20.04上从零搭建OSTrack训练环境（含GOT-10k数据集处理）

【Gemini中文处理能力深度测评】：20年NLP专家实测12项指标，98.7%准确率背后的3大技术突破

使用C语言重写“strcat”和“strcmp”两个方法

别再死记硬背公式了！用Python从零手搓一个BP神经网络（附完整代码）

ICM20948九轴DMP姿态解算工程套件：含驱动配置、串口调试与3D可视化工具

PACS 影像云解决方案深度评测与选型指南

告别重装烦恼：用CGI-Plus v5.0.0.6单文件版，5分钟搞定Windows系统备份与还原

龙城秘境手游官网下载：2026 年 6 月最新官方下载渠道

Linux Mint系统恢复翻车实录：手把手教你正确配置Timeshift快照（附断电重启大法）

新手学习全过程实录06——零基础搭建鸿蒙天气应用

校园外卖系统毕业设计全套：SpringBoot+Vue可运行源码+数据库+论文+答辩PPT+实操视频

厨房质检员——从阿明的“祖传配方“到标准化质检，看测试金字塔的落地

视频号解析接口上线！无需登录，复制链接直接解析

2026可靠科尔摩根驱动器选购推荐：伦茨制动器、伦茨变频器、伦茨控制器、伦茨电机、伦茨直流调速器、伦茨维修、伦茨驱动器选择指南 - 优质品牌商家

无人机非定常气流控制与VPM模型实时实现

再薅嘉立创羊毛

联想电脑丢了F11一键还原？手把手教你用官方工具找回原厂系统（含Office）

别再手动跑实验了！用Python脚本一键搞定YOLOv8消融实验（附完整代码）

2026建筑用环氧厚浆漆优质供应商推荐：醇酸调和漆、醇酸防锈漆、醇酸面漆、金淇顿涂料、钢结构快干防锈漆、丙烯酸脂肪族聚氨酯面漆选择指南 - 优质品牌商家

5、What makes an AI company：造就一家人工智能公司需要什么

AI视频生成技术演进路线图：从Stable Video到实时神经渲染，2024-2030关键拐点全解析