【无标题】学生用户画像—考勤主题扩建标签构建
一、实验说明1.1实验目的基于已完成的学生考勤主题标签表student_attendance_stats使用K-Means聚类算法对学生考勤行为进行自动分群。通过迟到、早退、请假、校服违规次数等核心指标识别不同类型的考勤群体生成可解释的考勤画像为校园学生管理、行为分析提供精准数据支撑。1.2实验环境工具数据集成平台助睿ETL、人工智能平台AI Studio、助睿BI可视化探索平台数据库MySQL团队私有数据库前置数据学生考勤主题标签表sudent_attendance_stats二、实验数据与建模思路2.1数据构成使用上一实验输出的student_attendance_stats表包含学生基础信息与考勤次数统计结果为聚类建模提供干净、标准化的特征数据。2.2核心字段字段名说明类型student_id学生ID连续整数late_count迟到次数连续整数early_leave_count早退次数连续整数leave_count请假次数连续整数uniform_violate_count没穿校服次数连续整数2.3建模思路聚焦迟到、早退、请假、校服违规四项核心指标均为非负整数连续变量无需哑变量编码学生离散属性仅用于后续画像解读不参与聚类以保证模型稳定可解释。三、实验步骤聚类建模可视化分析标签回写3.1 AI Studio聚类建模进入实验平台左侧菜单“人工智能” → AI Studio。3.1.1新建工作流点击“” → “新建工作流”命名为“学生考勤聚类分析”。3.1.2数据导入拖拽“数据库加载”组件配置团队私有数据库连接选择表student_attendance_stats。仅保留字段student_id, class_id, late_count, early_leave_count, leave_count, uniform_violate_count其余字段跳过(skip)。[reference:0]3.1.3 K-Means聚类建模拖拽“K-Means”组件并与数据库加载组件连接。设置簇数量 3其他默认。运行后每个学生获得簇标签C1/C2/C3。[reference:1]3.1.4 结果输出与保存拖拽“数据入库”组件新建表student_cluster将聚类结果写入数据库。[reference:2]3.2 分析聚类簇编号对应的考勤群体分类助睿BI可视化3.2.1连接数据源点击“助睿BI”进入平台在“数据源”中新建MySQL连接输入团队私有数据库信息测试连接成功。3.2.2构建数据集新建数据集“聚类簇编号数据集”基于student_cluster表将字段备注改为中文学生ID、迟到次数、聚类簇编号等。[reference:4]3.2.3 制作工作表6组散点图共制作6张工作表以“迟到vs早退”为例X轴late_countY轴early_leave_count颜色依据Cluster分组信息点显示student_id。3.2.4搭建仪表盘新建仪表盘“聚类簇分析”添加文本标题并将6张工作表拖入画布调整布局后保存发布。[reference:6]3.2.5 聚类群体画像解读基于散点图分布特征得出业务含义[reference:7]簇编号颜色群体分类核心特征C1蓝色自律模范型全维度异常次数极低出勤稳定纪律意识强C2青色轻微波动型偶发校服违规或请假整体纪律可控C3黄色纪律高危型高频违纪行为叠加存在极端离群记录3.3将映射结果加入学生考勤主题标签表3.3.1新增扩展字段在ETL项目中新建转换流“增加考勤主题扩展标签字段”执行SQL添加cluster和attendance_group字段。[reference:8]3.3.2聚类簇编号数据获取新建转换流“增加考勤群体分类标签”用表输入读取student_cluster表student_id, Cluster。[reference:9]3.3.3字段选择使用字段选择组件仅保留student_id和Cluster并将student_id类型转为Integer。[reference:10]3.3.4聚类簇编号映射值映射添加值映射组件源字段Cluster →目标字段attendance_group映射C1→轻微波动型, C2→自律模范型, C3→纪律高危型。[reference:11]3.3.5更新学生考勤主题标签表使用更新组件目标表student_attendance_stats查询关键字student_id更新字段Cluster→cluster, attendance_group→attendance_group。[reference:12]3.3.6运行转换流3.3.7查看结果在元数据中预览student_attendance_stats表确认cluster和attendance_group字段已填充。[reference:13]四、纪律高危型学生专题画像分析可视化深入探索4.1实验目的基于已完成K-Means聚类并标注考勤群体的学生考勤主题标签表本实验聚焦“纪律高危型”群体分析其行为特征。相比其他群体该群体存在高频违纪、多维度异常叠加等行为特征是校园考勤管理中风险最高、影响最大的群体。通过专项画像分析为精准干预和重点整治提供数据支撑助力校园精细化管理。[reference:14]4.2数据准备与数据集构建基于student_attendance_stats表构建数据集“学生考勤主题数据集”字段备注已在建表时配置无需修改。[reference:15]4.3制作专题分析工作表4.3.1整体概况指标卡分别制作“纪律高危型总人数”“纪律高危型男生人数”“纪律高危型女生人数”“高危型未知性别人数”指标卡。[reference:16]从整体指标卡可以看到纪律高危型学生总人数为421人其中男生45人、女生38人、未知性别338人。高危群体整体规模清晰其中男生人数多于女生说明高危群体存在明显的性别分布特点需要从性别角度进一步深入分析。[reference:17]4.3.2 纪律高危型学生性别特征分析制作饼图“纪律高危型学生男女人数占比”过滤性别未知数据并制作“全校学生男女人数占比”作为对比。[reference:18]分析发现全校性别分布中男生占比53.03%女生占比46.97%而在纪律高危型群体中男生占比进一步上升至54.22%女生占比则下降至45.78%。这表明纪律高危型学生中男生占比偏高并非由全校性别基数差异导致而是男生在考勤违纪行为上的真实风险更高。[reference:19]4.3.3纪律高危型学生年级特征分析制作柱状图“纪律高危型学生年级特征分析”。[reference:20]从年级分布柱状图可以看出纪律高危型学生在各年级的分布存在明显差异其中高三年级的高危学生人数最多高一和高二年级的高危学生人数相对较少。这可能与高三学生面临的升学压力、在校时间长度以及部分学生的课程安排调整有关。[reference:21]4.3.4 校区类型年级交叉特征分析制作堆叠柱状图“纪律高危型学生校区类型与年级交叉特征分析”并制作“不同校区类型各年级学生人数”作为基数对比。[reference:22]分析发现老校区是高危学生的主要聚集地各年级高危人数均明显高于新校区其中高一80人、高二130人、高三261人高三年级高危人数达到峰值。新校区的高危学生整体规模较小仅高一10人、高二19人有少量分布高三年级无高危学生记录。综合来看老校区尤其是高三年级是纪律高危型学生的核心聚集区。[reference:23]4.3.5纪律高危型学生班级特征分析制作水平条图“纪律高危型学生班级特征分析”。[reference:24]从班级水平条图可以清晰看到纪律高危型学生高度集中在少数班级其中高三09班高危人数最多38人其次为高三08班、高三02班等多数班级高危人数极少呈现明显的班级聚集性。高危行为与班级管理强度、班风氛围、同伴影响密切相关少数薄弱班级需要重点整治。[reference:25]4.4 搭建综合仪表盘新建仪表盘“纪律高危型学生用户画像分析”添加文本标题并将以上制作的工作表全部拖拽至画布中调整布局添加分析结论文本组件形成完整分析仪表盘。[reference:26]五、实验总结与分析结论整体概况纪律高危型学生存在高频迟到、早退、请假及校服违规行为多维度违纪叠加是校园考勤管理中最需重点关注的群体。该群体人数占比虽可控但行为影响大易引发不良风气需专项治理。[reference:27]核心特征性别特征男生为高危群体主体占比显著高于女生是高危行为的主要发生对象与男生规则意识薄弱、时间观念不足相关。[reference:28]年级特征高度集中于高年级随年级升高高危学生占比明显上升高年级学生学业压力大、自主空间广对考勤纪律重视度下降。[reference:29]校区特征高危学生高度集中在老校区新校区风险较低与校区通勤条件、管理模式、学风氛围密切相关。[reference:30]班级特征存在明显班级聚集性集中在少数管理薄弱、班风涣散的班级与班级管理强度、同伴效应直接相关。[reference:31]管理建议重点关注高年级男生群体针对性开展考勤纪律教育与时间管理培训强化规则意识减少违纪行为发生。[reference:32]加强老校区高年级管理针对老校区优化通勤管理、强化考勤监督营造严谨学风氛围降低学生违纪风险。[reference:33]整治高危学生集中班级加强班主任监管力度整顿班风建立班级考勤责任制阻断不良风气传染。[reference:34]建立高危学生台账一对一建档家校联动制定个性化矫正方案跟踪干预效果防止违纪行为固化。[reference:35]本次实验基于学生考勤次数数据通过K-Means聚类算法完成学生考勤群体自动划分利用次数特征建模保证了聚类结果的稳定性与可解释性。借助助睿BI平台实现可视化分析为机器生成的聚类簇赋予明确的业务含义精准划分出自律模范型、轻微波动型、纪律高危型三类学生群体。最终将聚类标签回写至原始考勤表完成考勤主题扩展标签构建为校园学生精细化管理、行为干预和个性化教育提供了可靠的数据支撑。[reference:36]实验人助睿实验平台|报告日期2026年5月24日实验环境Uniplore Data Science Platform (AI Studio ETL 助睿BI)