当前位置: 首页 > news >正文

通过ai工具结合agent_操作WindowsUI实现工作_工具思路收集_测试winright_midscene随时更新---AI大模型应用探索0042

前段时间从同事那里知道,他们在用winright,这个是通过识别WindowsUI上的组件,然后

录成流程来进行自动化操作。这个效果还可以。但是对复杂的界面,以及java swing javafx等的界面,可能就不行了。

之前用的midscene+qwenpaw 这个效果还是不错的。可以用视觉识别来操作电脑,但是特点就是很慢,慢到你无法接受,准确度上,有时候会点错,但是ai会自动纠正,但是就是慢,所以后来,就想了一个办法,就是,普通的操作,只是点击坐标的,就把坐标弄到一个流程的json文件中,然后让ai去调用,这样就快了,只有这需要ai的智商去判断的时候,再把ai叫出来,这个是一个方式,这个效果不错。

http://www.rkmt.cn/news/1507621.html

相关文章:

  • 从“我以为”到“可验证”:Aspice SWE.1如何重塑我们写软件需求规格说明(SRS)的习惯
  • 创业团队技术选型:消息队列的选型决策与成本模型
  • 2026年6月,探寻秦皇岛地区专业可靠的平面设计服务团队 - 品牌鉴赏官2026
  • 别再用pow函数求立方根了!C/C++里这个二分法技巧更稳(附精度控制详解)
  • RuoYi-Vue Pro工作流审批系统架构设计与技术实现深度解析
  • FanControl V269终极指南:Windows平台风扇控制的专业级解决方案
  • 从双寡头到多智能体:用反应函数法分析AI智能体在模拟环境中的竞争策略
  • 40+格式一网打尽:open3mod让你的3D模型查看体验起飞 [特殊字符]
  • 详细讲述软件实验室CMA资质认定中最复杂的一部分——记录
  • 2026年硫酸锌原料采购指南:一水硫酸锌供应商可靠性深度分析(附黄原胶配套服务) - 优质品牌商家
  • 从Laravel源码看PHP ?? 和 ?: 的高阶用法与最佳实践
  • ARM CoreSight调试实战:用Lauterbach工具解析ETM/PTM跟踪数据(附配置流程)
  • LabVIEW+汇川H5U+EtherCAT伺服+海康相机联合调试工程包(含视觉对位与运动控制完整源码)
  • 阿里AI与即时零售投入制衡估值,人事业务调整如何影响未来走向?
  • MATLAB GUI效率翻倍秘诀:利用‘默认回调’(defaultLineButtonDownFcn)实现代码复用与全局管理
  • 2026年当前护套品牌推荐:聚焦工业管线防护的可靠选择 - 品牌鉴赏官2026
  • 计算机毕业设计之基于人脸识别的药物交易平台
  • openEuler网络配置与管理:从基础到高级的完整教程
  • 基于Multisim的高频谐振放大器仿真与性能调优实战
  • 3分钟掌握漫画翻译神器:BallonTranslator完全指南
  • 2026年成都快充充电桩销售公司怎么选?行业现状与实力厂商深度分析 - 优质品牌商家
  • 图解博通BCM575 RDMA网卡的PBL:如何像管理虚拟内存一样管理DMA缓冲区?
  • MATLAB版经典光流法实现:含可直接运行的配准函数与可视化示例
  • 小白也能装好的 Claude Code Windows 教程:从 Node.js 到 api 接入,手把手跑通全流程
  • 2026年6月当阳汽车音响改装车行盘点:专业服务商深度解析 - 品牌鉴赏官2026
  • 告别卡顿!用StreamingLLM的Sink Token技术,让你的大模型对话无限长
  • 2026年近期韶关专业中空空调工程批发厂家深度盘点与选购全攻略 - 品牌鉴赏官2026
  • 从一根网线说起:POE供电设备的雷击与静电防护,你的设计真的安全吗?
  • 从‘活死人之园’到PVZ:宝开游戏的设计演变与冷知识盘点
  • 如何三步永久保存微信聊天记录:开源工具WeChatMsg完全操作手册