



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高职院校学生消费行为分析摘要:校园一卡通积累了海量的学生消费数据和日常行为数据,通过对这些海量数据进行分析,可以辅助教务处和学生处的教学管理和学生管理,甚至能改变传统教育模式。本文尝试将数据挖掘技术应用于校园一卡通的数据挖掘,采用K-means聚类算法,对预处理后的学生日常消费、图书借阅、寝室门禁等进行聚类,分析高职院校在校学生的消费水平和行为偏好。 关键词:校园大数据;聚类算法;消费行为;一卡通 随着高校智慧校园建设1的不断推进,以及相关业务系统逐步上线,校园信息化环境中积累的数据也在逐渐膨胀,已经形成了一个比较完整的校园大数据环境2,校园一卡通系统作为智慧校园的重要组成部分,是高校核心业务
2、系统之一,记录了学生校园生活当中的行为痕迹,通过对消费数据分析,了解当前学生的消费水平与在校生活情况,为提升学校管理决策能力提供了数据基础。 1高校一卡通系统概述 校园一卡通(架构如图1所示)作为智慧校园建设下基础业务系统3,整合学校的资源,将学生在校的各类消费行为、学习行为、生活行为等功能集中于一张IC卡上,将学生在校的各类信息与资源进行有效的整合与集成,方便了学生的生活与学校的管理。图1一卡通架构图一般来说,高校的一卡通系统均包含以下功能:金融服务功能、身份认证功能、信息服务功能、整合服务功能。(1)金融服务功能:包含日常消费、充值功能(在线)、电子钱包的圈存、缴费管理功能等,实现了校园内
3、货币结算的数字化和电子化。(2)身份认证功能:包含签到功能、会议签到功能、图书借阅功能、楼宇门禁、上机认证等,用于识别在校人员身份的基本功能。(3)信息服务功能:包括流水查询功能、线上查询功能(公众号、APP)等。(4)整合服务功能:主要目的是实现各不同系统与部门之间数据共享、数据对接等要求,通过校园一卡通系统实现与图书系统、教务系统之间的数据整合。这四类功能系统在发挥作用的同时产生了大量的数据,比如消费数据、学校门禁数据、计算机上机数据等,这些数据通过一卡通系统平台最终进入数据库之中,形成了一个庞大的数据资源。 2基于一卡通的学生消费、行为数据的分析 2.1原始数据来源。本文的数据来源于浙江
4、农业商贸职业学院校园一卡通及其相关系统,研究对象是2018学年上半学期的800个学生的一卡通使用数据,其中包含学生的基本信息数据、一卡通消费记录数据(食堂、超市、洗浴)、图书馆借阅数据和寝室门禁数据。通过编写SQL语句,将所需要的数据从数据库(SQLServer2008)中筛选出来,以csv文件导出,作为学生消费行为数据挖掘的原始数据。2.2原始数据预处理。要进行大数据分析,需对一卡通原始数据进行预处理转换成统计数据,预处理一般包含数据清洗、数据集成、数据转换三个部分。(1)数据清洗:是指发现并纠正数据文件中可能存在错误的过程,包括缺失值数据(不完整数据)的处理和噪声数据的清理。如原始数据中退
5、学、休学的学生消费数据就是噪声数据,需将其剔除,实现数据降噪。(2)数据集成:学生的成绩数据,图书借阅数据,一卡通消费和数据在经过数据清理后得到各自维度的数据,利用相关中间件技术将各维数据进行整合,如通过学生证号码的唯一性将已处理好图书借阅信息进行累加、消费金额进行加权平均等操作。(3)数据转换:数据转换是将已经经过数据清理和数据集成两步之后的数据格式和结构进行转化的过程,这一过程使数据具有一致性,适合数据挖掘。经过上述数据处理环节,我们选取了相对全面、完整的学生行为特征字段(如表1所示),形成基础数据集之后我们针对具体问题的分析选择这个基础数据集中特定的字段。2.3算法的选择与实现。本文将采
6、用数据挖掘中的K-means聚类分析算法,K-means是一种使用最为广泛的基于划分的聚类方法。它以特征距离作为标准,即数据对象间的距离越小,则它们的相似性越高,它们划分在同一类的可能性越大。K-means聚类算法4的伪代码,如表2所示。 3聚类结果分析 通过选取预处理后的学生消费行为数据中的相关字段,对学生的行为数据、消费数据分别进行K-means聚类分析,表4、表5分别展示学生行为数据聚类结果和学生消费数据聚类结果。从上述行为数据聚类的结果中来看,第一类学生:早餐的频率较低,中餐、晚餐比较正常,说明该类学生可能存在晚起的现象,作息不太规律;第二类学生:三餐规律,基本在食堂就餐,图书借阅、打
7、水和洗浴频率也较正常,说明该类学生生活比较规律;第三类学生,早餐和晚餐就餐频率极低,打水、洗浴无相关记录,说明该类学生不住校,应该以走读为主,较少参加班级活动;第四类学生,三餐次数和打水、洗浴次数较第二类同学略少,说明该类同学可能周末经常回家;第五类学生,打水次数较低,可能存在违规电器,三餐在食堂就餐频率较少,晚餐叫外卖的可能性比较大,说明该学生生活不规律。从上述消费数据的聚类结果来看,第一类学生:消费总额、午餐均价、消费总次数均接近样本总量均值,说明该类学生消费水平中等,消费稳定,校内消费占整体消费水平较高;第二类学生:超市消费占总消费比例较高,消费总次数偏低,可能较多的校外消费(外出就餐、
8、外卖等);第三类学生:消费总金额和食堂消费金额两项水平高,说明该类学生校内消费水平较高,生活水平较好;第四类学生:消费水平居中,消费总金额较少,该类学生可能走读或者存在大量的校外消费。第五类学生:各项消费指数均低于均值,该类学生消费水平较低或者生活比较节俭。 4结语 笔者通过学生一卡通数据进行清洗、集成、转换等数据预处理手段,将原始数据转化成包含学生行为特征字段的统计数据,结合数据挖掘技术,使用K-means算法将学生分为5个群体,分析不同类别学生的行为特征和消费特征。然而本文在对行为数据分析的过程中,研究对象所在的学生行为数据还不是很完善,并未包含其他业务系统数据(教务系统、学工系统等),所以将在后续的研究中获取更加全面的数据,对学生的在校行为更加精准的判断,有利于对行为分析更好的研究。 参考文献 1王曦.“互联网+智慧校园”的立体架构及应用研究J.中国电化教育,2016(10). 2刘志宏,喻晓旭.基于数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年快递绿色运输路线规划操作竞赛考核试卷
- 2025年新能源行业储能系统钒电池效率提升技术优化考核试卷
- 2025年物流数字化转型公共数据开放利用合规考核试卷
- 104.工业机器人故障树分析维护考核试卷
- 2025年中药饮片进口检验标准中医药现代化合规考核试卷
- 小学数学结构化教学的现实路径
- 考点攻克人教版八年级上册物理《物态变化》同步练习试题(解析卷)
- 考点解析人教版八年级物理上册第4章光现象-光的色散章节测试试题
- 综合解析苏科版九年级物理上册《机械能和内能》专题训练试题(解析卷)
- 考点解析人教版八年级物理上册第4章光现象定向测评试卷(解析版含答案)
- 工业皮带专业知识培训课件
- 新生儿患者安全知识培训课件
- 2025至2030全球及中国便携式风扇行业发展趋势分析与未来投资战略咨询研究报告
- 2025年救护车司机驾驶员资格考试考前真题训练题库及答案
- 公路工程重大风险安全管控方案
- 《市场监管部门标识规范》编制说明
- 学校工作汇报会议
- 2025广东深圳市福田区选用劳务派遣人员308人笔试历年参考题库附带答案详解
- 纪委编外考试试题及答案
- 江苏定向考试题目及答案
- 学习解读《水利水电建设工程验收规程》SLT223-2025课件
评论
0/150
提交评论