当前位置: 首页 > news >正文

实验三:学生用户画像

学生用户画像-考勤主题扩展标签构建与考勤画像可视化分析

  • 实验背景

1.1实验目的

基于已完成的学生考勤主题标签表(student_attendance_stats),使用 K-Means 聚类算法对学生考勤行为进行自动分群。通过迟到、早退、请假、校服违规次数等核心指标,识别不同类型的考勤群体,生成可解释的考勤画像,为校园学生管理、行为分析提供精准数据支撑

基于已完成 K-Means 聚类并标注考勤群体的学生考勤主题标签表,本实验聚焦“纪律高危型”群体,分析其行为特征。相比其他群体,该群体存在高频违纪、多维度异常叠加等行为特征,是校园考勤管理中风险最高、影响最大的群体。通过专项画像分析,可为精准干预和重点整治提供数据支撑,助力校园精细化管理。

1.2 实验环境

1.助睿数智(Uniplore)的数据集成平台 (ETL)​

2.数据库:MySQL(含订单数据和产品信息表)​

3.数据准备:学生考勤主题标签表(student_attendance_stats)

1.3 实验流程

通过对数据的观察,以及对考勤分群的业务需求分析,确定本次建模分析思路如下:

数据维度清晰、变量数量适中,聚焦考勤行为核心指标,无需复杂降维。基于考勤业务理解,将变量聚焦在迟到次数、早退次数、请假次数、校服违规次数四类行为维度,每个维度直接反映一类考勤特征,变量间业务含义独立、相关性低,可直接用于 K-Means 聚类建模,避免变量冗余导致模型解释困难。

本次建模采用次数类连续变量,数据类型单一、适配 K-Means 算法要求。考勤次数均为非负整数,属于连续型变量,满足 K-Means 对数据类型的要求,无需进行哑变量编码、二值化或特殊转换,可直接输入模型,简化预处理流程,保证聚类结果稳定可靠。

学生基础离散属性(性别、年级、住校状态等)不参与聚类建模,仅作为后续画像标签的辅助解释变量。

  • 实验步骤

1.AI Studio聚类建模

    1. 新建工作流

1.2 数据导入

1.3K-Means聚类建模

1.4 结果输出与保存

2.分析聚类簇编号对应的考勤群体分类

2.1 连接数据源

2.2 构建数据集

2.3 制作工作表

2.4搭建仪表盘

3.1新增扩展字段

3.2聚类簇编号数据获取

3.3 字段选择

3.4聚类簇编号映射

3.5 更新学生考勤主题标签

3.6运行转换流

3.7 查看结果

考勤画像可视化分析

4.1 进入助睿BI

4.2 构建数据集

4.3 制作工作表

4.3.1 整体状况指标卡

4.3.1.1 纪律高危型总人数

4.3.1.2 记录高危型男生人数

4.3.1.3 记录高危型女生人数

4.3.1.4 纪律高危型未知性别人数

4.3.2 纪律高危型学生性别特征分析

4.3.2.1 纪律高危型学生男女人数占比

4.3.2.2 全校学生男女人数占比

4.3.3 纪律高危型学生年纪特征分析

4.3.4纪律高危型学生校区类型 + 年级交叉特征分析

4.3.5不同校区类型各年级学生人数

4.3.6纪律高危型学生班级特征分析

  1. 搭建综合仪表盘

三、实验结果

http://www.rkmt.cn/news/1465712.html

相关文章:

  • 第一次给采集程序接入代理IP,从配置到稳定走代理的完整步骤
  • 西藏林芝寄件不必奔波往返网点,四款全国低价寄快递微信工具足不出户约上门,大小包裹快递物流直达全国 - 时讯资讯
  • 2026年Q2淮南牛肉汤歌、淮南牛肉汤动漫歌 权威推荐TOP5榜 - 安互工业信息
  • 2026最新焊接工作站工厂实测评测:四大品牌核心能力横向对比 - 奔跑123
  • 别再搞混了!ArcMap里‘定义投影’和‘投影’到底啥区别?手把手教你选对工具
  • 记一次网卡故障
  • Matlab车辆检测全流程代码包:从图像预处理到HOG+SVM识别,含多组实测样例与结果图
  • OpenAI 推 ChatGPT 会话控制功能,却难敌模型迭代,企业治理挑战重重!
  • 从PRONOSTIA平台到你的模型:手把手教你用FEMTO-ST轴承数据做寿命预测
  • 炉石传说HsMod终极指南:如何用5个实用功能彻底优化你的游戏体验
  • 数据科学家的数学实战手册:从故障归因到模型创造
  • p08 2.3 贝尔曼方程_cdn
  • 重庆市日立中央空调维修师傅电话|各区金牌师傅,靠谱选欧米到家 - 欧米到家
  • 用PCF8591做个简易光控灯:单片机IIC实战,手把手教你AD/DA联动
  • Lingo软件安装步骤(附安装包)Lingo 18.0 超详细下载安装教程
  • 性价比高的美白牙膏怎么选?敏感牙人群要注意什么 - 资讯焦点
  • 数智为翼 聚力共赢 | 量讯物联北京私享会暨中国特许加盟展精彩回顾
  • 2026年最新巴中市黄金回收白银回收铂金回收彩金回收TOP5靠谱门店甄选 识店+辨价+安全交易指南及联系方式推荐 - 前途无量YY
  • MuleSoft企业级AI编排:LLM与ERP/CRM安全集成实战
  • 响应面驱动的复杂黑箱模型优化算法【附代码】
  • Python包管理实战:PyPI、pip与虚拟环境全解析
  • Agent Runtime 范式革命:会话即持久化事件日志
  • 2026年最新白城市黄金回收白银回收铂金回收彩金回收TOP5靠谱门店甄选 识店+辨价+安全交易指南及联系方式推荐 - 前途无量YY
  • Anthropic API架构变革:上下文编排层归零与客户端适配指南
  • 探果AI(Tengo AI)办公AI实战:5分钟搞定复杂环境,避坑指南在此
  • Claude 提示缓存机制深度解析:自动缓存、显式断点与 20 块回顾窗口
  • 毕业论文开题全攻略:从选题焦虑到顺利通关的实战经验
  • 手机号定位神器:3秒查询号码归属地,地图精准定位位置
  • 2026年泰州装修公司|泰州装修设计公司实力排行 - 奔跑123
  • 黄小宇GEO实验:大模型可见度监控系统设计与Python实现