当前位置: 首页 > news >正文

使用 Webwright 在 CSDN 自动发文:Python 浏览器自动化实践

前言

最近发现微软开源了一个非常有意思的项目 ——Webwright,它是一个让 LLM 具备浏览器操作能力的框架。今天我们就用它环境中的 Playwright 来实现 CSDN 自动发文。

什么是 Webwright?

Webwright 给 LLM 提供了一个终端,可以启动多个浏览器会话来检查页面并完成 Web 任务。它的核心理念是:

  • 代码即操作:用 Python 脚本驱动浏览器,而不是逐步预测点击坐标
  • 工作区即状态:持久化产物是代码和日志,而不是浏览器会话
  • 轻量级设计:核心代理循环仅约 450 行代码

环境搭建

# 创建 Python 3.11 虚拟环境 py -3.11 -m venv venv311 # 激活环境 .\venv311\Scripts\Activate.ps1 # 克隆 Webwright git clone https://github.com/microsoft/webwright.git # 安装 pip install -e .\webwright playwright install chromium

自动发文原理

使用 Playwright 的持久化浏览器上下文(Persistent Context),可以保存登录状态。脚本会:

  1. 打开 CSDN 博客编辑器
  2. 检测登录状态,未登录则等待手动登录
  3. 自动填写标题和 HTML 内容
  4. 通过 CKEditor API 填充正文,然后点击发布

代码示例

from playwright.async_api import async_playwright async with async_playwright() as p: browser = await p.chromium.launch_persistent_context( user_data_dir="user_data", headless=False, ) page = browser.pages[0] await page.goto("https://editor.csdn.net/md") # 填写内容、发布...

小结

Webwright 将浏览器视为 agent 可以启动、检查和丢弃的工具,而持久化产物是本地工作区中的代码和日志。这种设计让浏览器自动化变得更加可靠和可复现。


本文由 Playwright (Webwright 环境) 自动发布,展示了 Python 浏览器自动化的实际应用。

http://www.rkmt.cn/news/1483384.html

相关文章:

  • 自动化构建-make/Makefile
  • 终极文件编码检测工具:EncodingChecker让你的乱码问题5分钟解决
  • 从“只会敲代码”到“能做项目”:计算机专业的能力跃迁之路
  • STM32MP157双核开发实战:用STM32CubeIDE搞定M4核固件,并与A7核Linux通信(OpenAMP示例解析)
  • 杨逢昌——管理咨询与6S实战专家
  • 贝叶斯逻辑回归与并行MCMC方法实践指南
  • Mac —— Docker Desktop(Milvus和Redis)部署
  • 2026年泉州管道疏通推荐 千里到管道疏通24年匠心保障快速上门 - 本地品牌推荐
  • 告别虚拟机:在Windows 11的WSL2里一键部署Empire 4.2渗透测试环境
  • 别再乱用data和xdata了!深入解析51单片机不同存储区的访问速度与功耗影响
  • 抖音无水印视频批量下载完整指南:告别繁琐手动操作
  • 想知道闻喜哪家玻璃厂实力强?这几家品质过硬口碑好选了准不踩坑
  • 别再死记硬背了!用Python+spaCy实战NLP句法分析,5分钟搞定依存关系可视化
  • HarmonyOS Hi3861 WiFi实战:手把手教你用C代码实现一个简易的无线中继器(STA+AP混合模式)
  • 2026年济南门窗定制小区定制哪家好?泉米阁领先 - myqiye
  • 多平台电商通用采集系统:一套代码打通淘宝/天猫/1688/京东/拼多多/抖音
  • WPS双进程之谜:手动关闭wpscloudsv,实测能省多少内存?(附详细步骤)
  • 2026年 HC420/780DPD+Z 双相高强钢镀锌板推荐榜:卓越强度与抗腐蚀性能深度解析 - 品牌发掘
  • Empire 4.2实战:用Docker Compose一键拉起完整靶场(含监听器、后门生成)
  • 蜘蛛池是什么,池录入效果怎样
  • AI 生成C# WinForm 窗体 = 目前就是垃圾
  • 论云上自动化运维及其应用
  • 在个人电脑上高效跑WRF:利用多核并行(mpirun)与CONUS物理方案加速你的天气模拟
  • UART非阻塞式打印
  • ArcGIS Pro新手必看:5分钟搞定土地利用TIFF转SHP矢量图(附广东遂溪案例)
  • TensorFlow Serving:生产环境的模型推理服务方案
  • 避坑指南:解决Linux服务器安装Matlab 2018b时的‘sudo not found’和激活文件路径错误
  • 给程序员讲群论:用‘同构’和‘同态’理解API设计与微服务通信
  • Behance设计作品批量采集系统:多格式素材下载、高清原图提取与自动分类
  • 别再死记硬背了!一张图+Python脚本帮你彻底搞懂ISO15765-2网络层多帧传输与流控