尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

102302110_高悦_综合实践个人总结报告

102302110_高悦_综合实践个人总结报告
📅 发布时间:2026/6/19 16:13:13

一、食材、菜谱数据库整理

在组员爬取的生鲜商品信息和菜谱数据存在字段冗余、数值缺失、内容重复等问题,无法直接用于我们的项目。因此,我主要负责对这些原始数据进行系统化整理与清洗。
具体工作包括:

1.字段规范化处理

对不同来源的数据字段进行统一命名,例如保留商品名关键字,去除多余的修饰词,使我们页面上的品名更加直观。

2.数据去重与筛选

针对重复爬取的生鲜商品和菜谱信息,利用主键字段和内容比对方式进行去重,保留信息完整、质量较高的数据记录,提高数据库整体可靠性。

3.缺失值与异常值处理

对价格、简介等缺失的的数据进行补充或删除。

4.数据格式统一

将不同格式的数据统一为项目所需的数据库格式,为后续页面展示、查询和功能实现打下基础。

清洗前

image

清洗后

image

通过以上整理与清洗工作,使原本杂乱的原始数据转变为可直接使用的数据库。

二、页面前端逻辑调整与优化

我调整了首页“水果”部分的展示逻辑,将前面的图片换成了拥有菜谱的食材。

image

三、综合实践报告的撰写与整合

最后,我承担了综合实践报告的撰写与整合工作。对项目过程进行整体的复盘和总结,也对技术路线、分工情况和成果进行系统梳理。

四、心得体会

在数据清洗中,我更深刻认识到数据清洗在实际项目中的重要性。在实际爬虫的过程中,可能由于页面反爬、具体字段匹配有差错等种种问题,导致爬取下来的原始数据无法直接为数据库所用,这是就需要对数据进行清洗和处理。一开始我用了pandas库对里面的数据进行提炼,但是发现提取关键词的功能很鸡肋,总是还有特别多冗余的信息,于是我再多次清洗以后再自己检查补全了。
能和大家一起完成这样一个项目,非常感谢同组大家的付出,不厌其烦地帮助我解决一些我工作上出现的问题,我也学习到了更多的前后端、数据库、数据采集等等方面的知识。

相关新闻

  • AI报告审核助手:首批数字员工的核心落地形态与技术演进
  • 如何通过ERP系统提升服装公司的管理效率?
  • Hotkey Detective终极指南:3步解决Windows热键冲突难题

最新新闻

  • 2026最新发布:安徽理工技师学院怎么报名?有哪些专业?——淮南初三家长必看 - 小张zc
  • CPPM采购证书对职业发展有帮助吗【0610-9】 - 众智商学院课程中心
  • 最新发布:合肥医药卫生学校2026年招生简章:3+2直通大专,护理与医学影像两大王牌专业等你来 - 小张zc
  • 2026印尼旅行社选择推荐:宜事旅游靠谱专业服务让巴厘岛和科莫多旅行更省心 - GEORANK
  • 20260422
  • 2026重庆、四川、贵州、云南等区域不锈钢管行业厂商实力测评分析 - 速递信息

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号