当前位置: 首页 > news >正文

影刀RPA新手教程_XPath语法速查表从入门到实战的15个核心表达式

影刀RPA新手教程:XPath语法速查表从入门到实战的15个核心表达式

很多刚接触影刀RPA的朋友跟我说,元素定位是卡住时间最长的环节。点击"捕获元素"按钮抓到的路径动不动就失效,一换页面就不认了。

其实原因很简单:系统自动生成的XPath太"死"了,页面稍微变化就找不到元素。学会手写XPath,你的自动化流程稳定性直接上一个台阶。

我也是非技术出身,今天就按最实用的方式整理一份XPath速查手册。

XPath的四种最常用写法

影刀RPA的"捕获元素"功能虽然方便,但自动生成的路径类似这样:

/html/body/div[3]/div[2]/div[1]/div[5]/span

这种路径一旦页面加了广告位或改了布局,就全废了。下面四种手写方式要掌握:

1. 属性精确匹配

店群矩阵自动化突破运营极限!

最稳的方式,通过元素的id、class等属性定位:

# 通过id定位(唯一性最高) //*[@id="search-input"] # 通过class定位 //input[@class="search-key"] ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/dd08eef48f9646428192fa175b6486dd.png#pic_center) # 通过任意属性定位 //a[@href="/login"]

@表示"属性",*表示"任意标签"。影刀RPA中点击"捕获元素"后,可以在高级编辑里把自动生成的路径替换成手写的。

2. 文本内容匹配

当你只知道元素里的文字,不知道它是什么标签时:

# 精确匹配文本 //*[text()="登录"] # 模糊匹配(包含某段文字) //*[contains(text(),"拼多多")]

实测好用:电商页面很多按钮文字会带空格,这时候contains(text(),'搜索')text()='搜索'稳得多。

3. 参照物定位

这是我采集小红书数据时最常用的技巧。你不知道目标元素怎么定位,但你知道它旁边有个固定文字:

# 场景:要找"粉丝数"数字,先定位"粉丝"标签 //*[contains(text(),"粉丝")]/../following-sibling::*[1] # 场景:要找价格,通过"¥"符号定位 //*[contains(text(),"¥")]/ancestor::div[1]//*[@class="price"]

/..表示回到父级,following-sibling是后面的兄弟节点,ancestor是祖先节点。

4. 层级与序号定位

# 取第3个匹配的元素 (//div[@class="item"])[3] # 取最后一个 (//div[@class="item"])[last()] # 取某标签下的第一个子元素 //ul[@class="list"]/li[1]

五个容易踩坑的场景

场景典型报错解决方案
动态class名“未找到元素”contains(@class,"固定部分")替代@class=全名
iframe内元素捕获不到先用"切换到iframe"指令,再捕获内部元素
元素未加载“元素不存在”在操作前加"等待元素出现"指令,超时设10秒

| 多个匹配结果 | 操作了错误元素 | 加序号[N]或用父级缩小范围 |
| 隐藏元素 | 无报错但无效 | 检查display:none,先滚动到可见区域 |

影刀RPA的一个细节:在"捕获元素"弹窗里,右键已捕获的元素可以选"编辑XPath",这里改路径比在指令面板里逐层点方便得多。

三个推荐工具

temu店群自动化报活动案例

XPath Helper(Chrome插件):打开任意网页,按Ctrl+Shift+X打开调试面板,输入XPath表达式,实时高亮匹配结果。这是学习XPath最快的方式。

影刀内置的元素编辑器:捕获元素后点"验证",如果匹配数是0就是路径写错了,匹配数大于1就说明不够精确,需要加序号。

浏览器F12控制台:在Console里输入$x('//div[@class="item"]')能直接看匹配了几个元素。$x是Chrome内置的XPath查询函数。

实战:拼多多商品标题定位

假设拼多多商品列表的HTML结构是这样的:

<divclass="goods-item"><divclass="goods-title">【官方补贴】冬季羽绒服男款加厚保暖</div><divclass="goods-price">¥89.9</div>![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/dc38a85134fe4acabdfa795688e0d916.png#pic_center)</div>

直接捕获很可能拿到一个包含数字索引的长路径。手写的话:

# 捕获元素:拼多多商品列表页——商品标题 //div[contains(@class,"goods-title")] # 捕获元素:拼多多商品列表页——商品价格(取第一个) (//div[contains(@class,"goods-price")])[1]

contains写法不依赖精确class名,页面加了goods-title v2这种后缀也不影响。


#影刀RPA #RPA自动化 #XPath #元素定位 #数据采集

作者:林焱

本文为《影刀RPA学习手册》系列文章之一,内容源于实操经验的整理与分享。

http://www.rkmt.cn/news/1528103.html

相关文章:

  • 从Notebook到生产环境的ML模型部署实战指南
  • 用HAL库重写那个“只能收一个字节”的STM32串口中断,我发现了CubeMX没告诉你的细节
  • 线性回归实战指南:从零搭建可解释的业务预测模型
  • QGIS 3.34.0尝鲜3DTiles:大雁塔模型加载实测与性能优化踩坑全记录
  • 温度依赖型神经网络模型设计与热力学特性分析
  • ESXi 7.0安装后必做的10项安全加固与网络配置(附免费许可证使用指南)
  • HC32单片机I2C驱动避坑指南:从状态码解析到稳定读写(基于M0P_I2C0)
  • LLM评估不是打分游戏:构建可归因、可迭代的深度评估框架
  • STM32串口中断只能收一个字节?别急着改代码,先检查这三个地方(附排查流程图)
  • 告别VIM手动敲代码!用coc.nvim+Node.js打造你的智能补全环境(附完整插件清单)
  • 2026年广州钢结构厂家实力解析:从设计到施工,谁更靠谱? - 优质品牌商家
  • HumanoidKick足球冠军级人形机器人 全部伺服调控、地形步态、故障防护、集群协同、仿真建模、加密权限类源码、物理参数、算法公式、通讯协议、权限规则均为足球冠军级人形机器人行业通用客观标准内
  • 视频转PPT终极指南:3步从视频中智能提取幻灯片内容
  • 嵌入式Linux音频处理实战:手把手教你用SpeexDSP给麦克风降噪(附完整C代码)
  • TongWeb8安全配置全解析:从默认限制到生产环境最佳实践
  • vSphere DRS罢工了?先别急着重启,检查下vCLS代理虚拟机的状态
  • Java时序预测实战:用DJL嵌入PyTorch模型实现毫秒级推理
  • SATA控制器寄存器详解:命令完成、错误处理与中断聚合机制
  • 别再乱装CMake了!手把手教你正确配置CMake路径,彻底告别‘CMAKE_ROOT’错误
  • 【课程设计/毕业设计】基于 SpringBoot 的体育俱乐部赛事数据管理系统的设计与实现 前后端分离模式下足球团队管理系统【附源码、数据库、万字文档】
  • 联邦学习实战指南:破解数据孤岛与隐私合规难题
  • AI Agent:智能助手,你的24小时在线管家
  • 别小看这颗‘可选’电容!聊聊前馈电容在改善电源瞬态响应时,那些容易踩的坑
  • 2026年东莞本地钨钢回收商家怎么选择,锡渣回收/锡膏回收/废锡回收/钨钢回收/钨钢钻头回收,钨钢回收企业哪个好 - 品牌推荐师
  • 大模型与自动驾驶的共同瓶颈:统计拟合为何无法替代因果推理
  • 7个生产就绪智能体项目:从AI Demo到交付型工程师的实战路径
  • 2026年四川移动房屋选购指南:从太空舱到智慧厕所,一文读懂品质与成本平衡! - 优质品牌商家
  • AI Agent Harness Engineering 创业必备:技术选型、团队搭建与融资策略全解析
  • 不只是去水印:用Lama Cleaner搭配CUDA,让你的老旧显卡在Windows上也能加速AI修图
  • 2026年粘结砂浆厂家专业度深度分析:从产品体系到工程交付的多维评估 - 优质品牌商家