尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

爬取京东商品评论 - f

爬取京东商品评论 - f
📅 发布时间:2026/6/20 17:01:10

代码:

#导入自动化模块
from DrissionPage import ChromiumPage
import time
import json
#打开浏览器(实例化浏览器对象)
dp = ChromiumPage()
#访问网站
dp.get('https://item.jd.com/10167235203199.html')
#等待加载
time.sleep(2)
#监听数据包
dp.listen.start('getLegoWareDetailComment')
#下滑页面
dp.scroll.to_bottom()
#自动点击打开评论页面(元素定位)
dp.ele('css:#comment-root > div.all-btn').click()
#等待数据包加载
resp = dp.listen.wait()
#获取响应的数据内容
json_data = resp.response.body
print(json_data)
#循环遍历,提取列表里面的元素
for index in comments:
#提取具体每条评论保存字典中dit = {'昵称':index['nickname'],'评分':index['score'],'评论内容':index['content'],'点赞数':index['likeCount'],'回复数':index['replyCount'],'产品型号':index['productName'],'产品颜色':index['productColor'],'发布地区':index['area'],'评论时间':index['createTime'],
}
print(dit)

访问网站需要修改、监听数据包需要修改、打印dit字典内容需要修改、自动点击打开评论页面需要修改
需要添加将爬取的数据转为json进行存储的代码
修改之后的代码:

#导入自动化模块
from DrissionPage import ChromiumPage
import time
import json
#打开浏览器(实例化浏览器对象)
dp = ChromiumPage()
#访问网站
dp.get('https://item.jd.com/10167235203199.html')
#等待加载
time.sleep(2)
#监听数据包
dp.listen.start('getLegoWareDetailComment')
#下滑页面
dp.scroll.to_bottom()
#自动点击打开评论页面(元素定位)
dp.ele('css:#comment-root > div.all-btn').click()
#等待数据包加载
resp = dp.listen.wait()
#获取响应的数据内容
json_data = resp.response.body
print("获取到API响应数据")#提取评论列表
if json_data and 'commentInfoList' in json_data:comments = json_data['commentInfoList']print(f"找到 {len(comments)} 条评论")#循环遍历,提取列表里面的元素for index in comments:#提取具体每条评论保存字典中dit = {'昵称': index.get('userNickName', '未知用户'),'评分': index.get('commentScore', 0),'评论内容': index.get('commentData', ''),'点赞数': index.get('praiseCnt', 0),'回复数': index.get('replyCnt', 0),'产品型号': '','产品颜色': '','发布地区': index.get('publishArea', ''),'评论时间': index.get('commentDate', '')}print("\n提取到的评论:")print(dit)
else:print("没有找到评论列表")print("响应数据的键:", list(json_data.keys()) if json_data else "无数据")

以json形式存储:

#导入自动化模块
from DrissionPage import ChromiumPage
import time
import json
import os# 确保输出目录存在
output_dir = './dashuju/output'
os.makedirs(output_dir, exist_ok=True)# 输出JSON文件路径
output_file = os.path.join(output_dir, 'jd_phone_comments.json')#打开浏览器(实例化浏览器对象)
dp = ChromiumPage()
#访问网站
dp.get('https://item.jd.com/10167235203199.html')
#等待加载
time.sleep(2)
#监听数据包
dp.listen.start('getLegoWareDetailComment')
#下滑页面
dp.scroll.to_bottom()
#自动点击打开评论页面(元素定位)
dp.ele('css:#comment-root > div.all-btn').click()
#等待数据包加载
resp = dp.listen.wait()
#获取响应的数据内容
json_data = resp.response.body
print("获取到API响应数据")#提取评论列表
processed_comments = []
if json_data and 'commentInfoList' in json_data:comments = json_data['commentInfoList']print(f"找到 {len(comments)} 条评论")#循环遍历,提取列表里面的元素for index in comments:#提取具体每条评论保存字典中dit = {'昵称': index.get('userNickName', '未知用户'),'评分': index.get('commentScore', 0),'评论内容': index.get('commentData', ''),'点赞数': index.get('praiseCnt', 0),'回复数': index.get('replyCnt', 0),'产品型号': '','产品颜色': '','发布地区': index.get('publishArea', ''),'评论时间': index.get('commentDate', '')}processed_comments.append(dit)print("\n提取到的评论:")print(dit)# 保存评论数据到JSON文件try:with open(output_file, 'w', encoding='utf-8') as f:json.dump(processed_comments, f, ensure_ascii=False, indent=2)print(f"\n评论数据已成功保存到: {output_file}")print(f"共保存 {len(processed_comments)} 条评论")except Exception as e:print(f"保存JSON文件失败: {e}")
else:print("没有找到评论列表")print("响应数据的键:", list(json_data.keys()) if json_data else "无数据")

相关新闻

  • 力扣 Hot 100 之 206. 反转链表:面试官的“开胃菜”
  • 10394_基于Springboot的社区生活事务管理系统
  • vue基于Spring Boot的灌区取用水量调配信息管理系统的应用和研究_2dw80bw4

最新新闻

  • Express.js终极实战指南:从零构建企业级Web应用
  • 嵌入式GUI显示驱动配置实战:从emWin框架到自定义驱动开发
  • YOLOv8轻量微调方案:C2PSA注意力与Mona认知适配器集成
  • 照片清晰度不够,用这个方法无损提升细节 - 软件工具教程方法
  • 海南怎么登报挂失?2026最新流程避坑指南 - 资讯速览
  • 2026南宁奢侈品回收行业白皮书:出手名贵腕表怕信息泄露,私密交易一对一全程保护隐私 - 讯息早知道

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号