版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科毕业论文〔设计〕论文(设计)题目:大数据在高校中的应用研究系别:信息工程系:信息管理与信息系统::年月日陇桥学院本科毕业论文〔设计〕原创性声明本人郑重声明:所呈交的论文〔设计〕是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文〔设计〕不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承当。作者签名:年月日大数据在高校中的应用研究摘要大数据技术在各行各业中的应用越来越广泛与深入,其在高校的开展也是势不可挡,信息化的高校建设更适应现如今的社会。大数据在我国高校的应用要吸取国外经验、发挥本国优势。大数据教育和传统教育比照起来有很大的优势,我们应扩大这种优势。大数据不是无根之木、无源之水,应用大数据技术,应注意到数据从收集到使用的整个过程中的每个细节,可能每个过程都有现阶段的技巧或是问题,我们要努力掌握技巧、解决问题。国家很看好大数据在高校的开展,社会也是很认同的,事实上高校也是有这类需求的,因此,我们应该积极推动大数据在高校中的应用,但在此之前,我们也应做好大数据在高校中的引用研究。本文先是对大数据的概念及来源做了一些介绍,然后讲述在高校中大数据技术可以在那些方面发挥巨大作用,接下来举了例子详细说明大数据在高校招生工作中的使用即是在高校招生决策支持系统中大数据技术是如何发挥作用,然后讲述了大数据在高校中应用的难点所在以及使用大数据技术的一些策略,最后那么是展望未来大数据在高校的开展。[关键词]大数据;高校;信息化ApplicationofbigdataintheCollegeABSTRACTTheapplicationofbigdatatechnologyinallwalksoflifemoreandmorewidelyanddeeply,inthedevelopmentofcollegesanduniversitiesisatrendwhichcannotbehaltedmoreadapttotheconstructionofcollegesanduniversities,theinformationsocietytoday.BigdataapplicationinChineseuniversitiestolearnforeignexperiencetoplaytheirownadvantages.Bigdatacontrasteducationandtraditionaleducationhasagreatadvantage,weweshouldexpandthisadvantage.Bigdataisthewood,passivewater,bigdatatechnology,shouldpayattentiontothedatacollectedfromeverydetailofthewholeprocessinuse,mayeachprocesshastheskillsorproblems,weshouldstrivetomastertheskillstosolveproblems.ThecountryisveryoptimisticaboutthelargethenumberofAccordingtothedevelopmentinCollegesanduniversities,thesocietyisrecognized,infactthereisinsuchdemand,therefore,weshouldactivelypromotetheapplicationofbigdatainuniversities,butbeforethat,weshouldalsomakereferencetostudylargedatainuniversities.Inthispaper,wefirstintroducesomeconceptsandthesourcesofdata,thentellsthebigdatatechnologycanplayasignificantroleinthe,thenextexampledetailingthebigdatausedincollegeenrollmentworkisinCollegeEnrollmentDecisionSupportSysteminbigdatatechnologyishowtoplaytherole,thentellsthestoryofsomestrategiesforthedataintheapplicationofthedifficultyandtheuseofbigdatatechnology,finally,thereistheprospectofthefutureofbigdatainCollegesanduniversitiesofChina.[Keywords]data;university;informationtechnology
目录TOC\o"1-3"\h\u10916一、引言126222二、大数据在高校的开展316947〔一〕大数据3178331.大数据的概念及目标3272372.大数据与传统数据的区别321640〔二〕高校中所需的大数据471771.高校中的数据源4181662.高校中的大数据的特点518513〔三〕大数据教育与传统教育相比的优势527270三、大数据在高校中的运用719207〔一〕就业情况分析726201〔二〕学习行为分析826456〔三〕个体分析93883〔四〕学科规划927696〔五〕舆情预测96357〔六〕心理咨询1017466〔七〕校友联络1030913四、大数据技术在高校招生工作中的具体应用105878〔一〕大数据下的高校招生决策支持系统粗略设计11105351.录取生源结构分析1129612.学生成绩分析11151173.学生毕业去向分析11860〔二〕系统结构设计1243701.根底业务系统13290583.决策分析系统13233844.人机交互系统1327286〔三〕系统功能模块设计13194721.用户管理模块13229652.数据管理模块14152273.决策支持模块1421305〔四〕决策方法构建方案1532065〔五〕大数据技术在招生决策中的应用1629201〔六〕数据挖掘的数据准备1799391.数据选择17192402.数据清理17250293.数据集成1828876五、应用难点和一些对策1811880〔一〕从技术层面来看1859881.可用数据源18100092.数据存储19271113.多种数据的整合1956084.数据分析的持续性2056565.数据挖掘的复杂性209376〔二〕从实施层面来看20145161.数据共享意识20139852.人员配备与组织结构21252913.个人隐私保护2112075六、大数据在高校应用的策略2220323〔一〕建立科学的数据规划2214049〔二〕加强数据的质量管理2224417〔三〕部门合作与管理2325250六、展望2321904参考文献25大数据在高校中的应用研究一、引言这是个数据爆发的时代。当人类进入信息时代后,数据作为这个时代独一无二的传媒介质便在我们的生活中无处不在。尤其是伴随着物联网和互联网的快速开展,我们的一切都在被记录、被数据化。一份国际数据资讯公司的报告提到,数据数量一直在快速增长,这个速度不仅是指数据流的增长,还包括许多全新的数据种类的增多。现今数据容量增长的速度,已经大大超过了硬件技术的开展速度,到2023年产生的数量将增至44ZB〔十万亿亿字节〕,超出存储空间6ZB〔1ZB相当于343.6亿部32GB智能的存储容量〕。这些数据正是在告知我们人类已经进入了一个深度研究数据内在信息和核心价值的大数据时代。“大数据〞一词来自于未来学家托夫勒于1980年所著的《第三次浪潮》。而最早开始对大数据进行应用探索的是2005年雅虎公司的Hadoop工程。Hadoop其最初知识用来解决网页搜索问题的一个工程,后被ApacheSoftwareFoundation公司引入并成为开源应用。Hadoop是有多个软件产品组成的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。在这个“第三次的浪潮〞中,教育行业在其中有着相当重要的的地位,而其中的高校更是如此,它不但是这场浪潮的参与者,更是大数据开展的推动者。做为教育行业中典型代表的高校理应更好的管理和利用所拥有的大规模的数据和信息资源,而这也是顺应大数据时代开展趋势、推动自身信息化建设和开展的一个绝佳契机,更是为在以后的教育和科研工作中发挥出举足轻重的作用。作为信息化高度开展的美国,政府为了顺应、推动大数据这一开展趋势,2023年3月美国奥巴马政府宣布投资2亿元用于“大数据的研究和开展方案〞,从此大数据从商业行为上升到国家战略层面。作为世界大国的我国,对于大数据也很早就给予高度的关注,2023年2月中国工信部发布了《物联网十二五规划》,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这成为支持中国大数据产业开展的重要依据;2023年9月经李克强总理签批,国务院印发《促进大数据开展行动纲要》;在《十二五规划纲要》、《十三五规划纲要》等国家战略部署中,也曾屡次提到对于大数据的开展。而国家在高校教育中的大数据的开展方面也是十分重视的,《国家中长期教育改革和开展规划纲要〔2023-2023年〕》明确提出,在加快教育信息化开展进程中要“加强优质资源教育资源开发与应用……促进优质教育资源普及共享〞。图12023-2023年全球大数据市场规模我国在高校大数据研究开展方面有着独特的优势。据国家统计局2023年的一份报告显示,我国目前在校大学生约2468万人。《2023年中国大数据交易白皮书》中提到2023年在线教育用户人数达6720万人,同比增长13.8%,预计到2023年将到达12032.6万人。大数据在高校中的根底变的越来越牢固,但到底我们应该怎样去合理而高效地运用呢,这就是论文的主题大数据在高校的应用研究。二、大数据在高校的开展〔一〕大数据1.大数据的概念及目标最早提出“大数据〞时代到来的是全球最著名管理咨询公司之一的麦肯锡公司。2023年5月麦肯锡发布《大数据:下一个竞争、创新和生产力的前沿领域》报告,提到:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量的数据的挖掘和应用,预示着新一波的生产率增长和消费者盈余浪潮的到来〞,提出了大数据时代到来。全球最具权威的IT研究与参谋咨询公司,高德纳咨询公司在2023年对大数据解释为:“大数据是大量、高速以及多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力和优化处理。〞维基百科对于大数据的定义那么更为简单:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可以容忍时间的数据集。对于大数据的定义有很多,但无论哪种定义都实际上强调大数据的目标,即获取知识和推测趋势、掌握个性化特征、通过分析辨识真相。所以,大数据技术的战略层面意义不仅仅是掌握海量的数据信息,而是在于通过将各种数据集合整理后的分析得到大量额外的有价值的信息和数据关系,从而帮助人们优化决策和行为模式。2.大数据与传统数据的区别信息大爆炸在提醒着我们,未来将因大数据技术而改变。与传统的数据相比,大数据如此受欢送,是因为大数据本身的特点。与传统数据最关键的区别是:其一,数据收集的来源不同。传统的数据库只是收集根底数据,仅仅使用的是数据本身的含义,而没有深入的挖掘数据的价值。不同的是大数据从传统的数据中整理和分析,对数据之间的关联更加的重视,也就是主要研究数据之间的关系;其二,数据的应用方向不同。传统的数据库主要功能是存储和查询,以对过去产生的数据保存为核心。不同的是大数据是以预测事物开展为核心,通过对庞大数据的科学分析,从而的到将来开展的趋势和将来事件发生的可能性。通过对海量数据进行分析,得到的开展趋势在未来或推断未来的可能性。〔二〕高校中所需的大数据1.高校中的数据源社会每时每刻都会产生大量的数据,高校更是如此。我国自从教育信息化以来,高校有许多数据被收集并保存下来,从学生来看,有联系方式、宿舍信息、班级信息等根本信息,食堂消费记录、宿舍晚归等生活信息,选课、课后作业完成情况、图书借阅记录、历次学习成绩等学习信息,参加的社团、比赛、讲座等第二课堂信息;从教师来看,有教学任务、课件等教学信息,论文报告、科学研究数据等科研信息;从学校管理者来看,有学校的资产信息、师资信息、社团活动信息、讲座举办信息、招生就业信息等等。随着高校教育信息化建设的不断深化和逐渐加强,比以往更庞大的数据在快速的积累保存,这些对于高校来说,是一个珍贵的资产。这些庞大的数据并不仅是简单的数据的积累、记录和保存,如果能有效利用它们,其隐含的价值会对高校的现代化建设产生相当积极的效果。举例来说,通过对“课程+成绩+就业〞等相关数据的科学深入分析,就能在一定程度上对学生选课、教师授课、学校的排课的相关内容进行有效的指导和建议;还有通过对“学生的图书借阅记录+学生选课信息+学生课程成绩〞等相关数据的分析,就可以了对学生的兴趣爱好有一定的掌握,并可以对学生未来就业做出具体符合的建议。在如今的时代,信息就是金钱,大数据技术应用于高校教育信息化将会有更多更加突出表现,展现出其重要的作用。2.高校中的大数据的特点复旦大学信息办主任宓咏认为,高校信息化过程中产生的数据来自于不同的层次和分类,既有人事、财务、资产、科研等常规管理型业务产生的结构化数据,又有多媒体教学资源等非结构化数据;既有用户使用网络产生的行为数据,又有物联网、移动互联网感知到的位置数据等。这些数据围绕着对教师和学生的效劳与管理而产生,存在碎片化、持续性等特点。“碎片化〞是指无论是业务数据、教学资源数据或网络行为数据,在某种方面来说都是反映行为个体的一个属性。举例来说,从图书馆获得的论文数据和从科研管理部门拿到的工程数据,都直接或间接反映了教师的科研能力的一个方面,只有将许许多多来自不同地方的数据进行有效整合,并进行量化分析建模,如此便可以具体准确地判断教师的个人能力。“持续性〞那么表达了校园科研、教学和管理业务等的规律,比方校园一卡通消费、上网时长、每个学期选修课程、专业课成绩、获得学分以及重修重考等数据能够相对的反映一个学生的生活习惯、个人爱好和学习进步的趋势等,但这必须建立在长期和持续的数据、分析的根底上,如假设仅靠短期的数据分析所获得的结论那么对指导教育教学活动并无多大益处。高校信息化过程中产生的这些数据,在整体上是满足数量大、种类多、产生快、真实可信和具备分析价值等特点,当然也是完全符合大数据特征的。〔三〕与传统教育相比的优势传统教育的课堂教学活动是以教师为中心的。首先,教师不能完全照顾到课堂中根底和兴趣不尽相同的每个学生,学生只能被动听教师的讲授,因此学生学习的主动性、自主性较低;其次,由于局限于校园和课堂,优秀教师及教育资源的施教面受到限制,不能实现最大化利用和资源共享。而作为大数据教育,一方面,学生能够做到根据自己的需要自主安排学习方案,自主决定学习时间、地点和选择学习内容。在网络化的教育模式中,学生学习的自主性、个性化和能动性得到了充分的发挥。同时,教育资源也得到了充分利用和共享,通过远程传输,同样教育资源的施教能力在空间和时间上被放大了,在不同的时间、有更多的处于不同地域、地点的学生可以学习同一教师所讲授的课程,从而满足了更多求学者的受教育需求。当然,这也意味着,网络教育对学生的学习主动性和自学能力提出了较高的要求。大数据教育的网络课程表现形式生动形象、信息容量大、更新快,可综合计算机多媒体信息处理技术的运用,使网络课程表现教学内容的形式更加丰富多彩、生动形象,这些表现形式包括文字、声音、图表、影像、动画等。网络课程的突出特点是多媒体和交互性。一方面,教学内容的表现不再只是枯燥的文字和图表,而是配合有精彩动画、影像和声音;另一方面,学生在学习过程中,不再只是被动的看和听,还可以参与实际的模拟操作,与教学内容进行交互。大数据技术的重大意义不仅在于可以实现教学信息和内容的远程传输和资源共享,更是使得网络可以在任何时间和地点,让教师和学生、学生和学生间进行全方位的双向交互。这种交互既可以是实时的,也可以是非实时的。计算机网络使真正的教师与学生、学生与学生之间双向互动、实时全交互的实现成为可能。大数据教育运用了信息数据库管理技术和双向交互功能,为个性化教学提供了有效的实现途径与条件。一方面,系统可对学生的个性资料、学习过程和阶段情况实现完整的跟踪记录、储存;另一方面,教学和学习效劳系统那么可基于系统记录的个人资料,进行针对不同学生的个别或个性化学习建议等。三、大数据在高校中的运用高校是数据生产大户,很多高校正在使用大数据技术解决遇到的实际问题,如美国德克萨斯大学利用大数据技术分析学校用户IT使用行为产生的数据,确定用户行为异常,审计IT根底环境,制定平安防护措施。还有一些应用场景如分析学生参与网络课堂产生的数据,进而确定如何改良课程讲述方式,到达因材施教的教育目标。在我国,高校数量众多并且规模较大,许多高校都是万人以上的,在高校里的学生从招生、学籍、选课、成绩、食堂、活动等方面产生大量的数据,更何况还有教师和管理人员。在大数据时代,只有用好这些数据,才能更好地帮助教学、科研、学生管理等工作,大大提高高校的信息化水平,以及在就业情况分析、学习行为分析、学科规划、心理咨询、校友联络等方面借助大数据分析技术,挖掘数据中潜在的价值。〔一〕就业情况分析我国自从市场经济下高校扩招后,就业制度改革不断深化、高校毕业生人数逐年增加、社会高校毕业生就业形势越来越严峻,就业问题几乎成为每个大学生都要面临的一个难题,在这个环境下研究高校毕业生就业问题就有着紧迫性和重要性。传统的就业分析通常都是从就业单位、就业地区、所在院系专业、性别、签约类别、就业预期、就业年份等因素来分析,得到的只是一般意义上的统计结果,对于指导单个学生的就业以及预测未来的就业情况发挥的作用比拟有限。而在大数据分析技术下,那么可以将学生就业模型涉及到的学习情况、社团信息、生活信息、校外实习、参加的竞赛及获奖情况、所投公司当年的招聘方案、历届学生在所投公司的表现等众多的信息进行收集,构成就业分析模型。除了数据统计分析之外,我们还可以对数据进行监督学习和无监督学习。监督学习使用先验知识对数据进行分类;无监督学习那么由计算机自己学习处理数据,并在做出判断后给予一定的鼓励或惩罚。在进行就业分析时,我们可以首先协作筛选,通过分析已就业学生的成绩、参加的社团活动、关注的行业、性格特点、就业单位、就业岗位等,计算学生之间的相似度,为即将毕业的学生推荐适合的就业单位和岗位,提供个性化的效劳;其次是聚类,这是一种无监督的机器学习方法,我们可以通过不同的维度将未能及时就业的学生进行分析,从中找出其共同的特点,再通过比拟在校学生的相关属性,及时对学生给出预警,以便其在后续的学习和生活中加以改良。〔二〕学习行为分析为了支持学生的自主学习,高校一般都在使用着学习管理系统,如Blackboard〔Blackboard在线教学管理平台是目前市场上唯一支持百万级用户的教学平台,拥有美国近50%的市场份额〕、Sakai等。这些学习管理系统为学生、教师提供了课程学习和交流的场所。美国教育部教育技术办公室认为教育数据分为键击层、答复层、学期层、学生层、教室层、教师层和学校层,数据就寓居在这些不同的层之中。大数据分析可以应用于教育中的数据挖掘。一般高校每年的开课数在数千门,学生数在数万人,产生的数据量非常大。目前教育机构已经积累了大量数据,使研究者有更多的新时机探究学生学习环境和状态。应用大数据分析技术使得监控学生的每一个学习行为变为了可能,学生在答复一个问题时用了多长时间,哪些问题被跳过了,为了答复以下问题而作的研究工作等都可以获得,通过监测这些信息,形成教育大数据库,全面掌握学生学习的全过程,发现学生的学习常态。通过数据流的变动分析,总结教育规律、调整教学内容和教学模式,客观全面地评价学生学习成果和自身的教学成果,用这些学生学习的行为档案创造适应性的学习系统提高学生的学习效果。〔三〕个体分析对于教育领域来说,大数据的应用让研究个体学习也成为了可能,让专门培养和针对性训练成为可能。通过学校数据中心分析学生的各类信息,如考试成绩的变化、借阅图书的种类、一卡通消费额度等信息,综合性地分析判断学生的状态。根据分析结果,对于不同的学生因地制宜地制定相应的教学模式、培养方案。另外,也可以借助学校的微信公众平台为学生推送其感兴趣的资讯信息。〔四〕学科规划促进学科交叉融合开展,构筑有生命力的学科生态,打造凸显核心竞争力的高水平学科是学校学科规划的重要任务。借助大数据分析技术,充分收集各学科的教学状态数据、科研工程数据、前沿开展动态等信息,从而分析学科建设存在的缺乏,确定学科未来开展的方向,开掘出潜在的具有国际视野的学科带头人。〔五〕舆情预测学生中存在的问题和困惑,往往最先通过网络显露和传播。如果学生的意见和建议得不到重视或延误解决,就可能在网上形成炒作,个体情绪可能传染到群体,演变为群体的不满情绪,使网络成为舆论的放大器。通过分析学生网络访问轨迹实现积累监测,利用其需求、行为、动向等众多数据资源加强舆情分析和预警。另外,通过对学生数据的追踪和分析,能够发现情绪不稳定的学生或者受不法分子蛊惑的学生,及时将有可能发生的悲剧扼杀在摇篮里。因此,精准的预测分析能提升舆情管理工作水平,提高校园管理水平。〔六〕心理咨询论坛、微博等平台上每天都会产生由评论、帖子、留言等数据,这些数据集反映了师生的思想情况、情感走向和行为动态,对这些数据进行科学的存储、管理并使用大数据技术进行有效的分析利用,建立师生思想情感模型,对掌握师生心理健康程度,有针对性地加强对师生的心理辅导有着重要的意义。〔七〕校友联络校友资源犹如一座座宝藏,对高校的开展建设有着不可替代的重要作用,是高校工作的重要组成局部。如何有效地把校友联络起来、团结起来,对学校的建设和开展具有重要意义。利用传统的管理方法,仅校友信息收集就要消耗大量的时间和精力。利用大数据技术,收集各类社交网站上的非结构化数据,通过分类、聚类等数据挖掘方法,确定校友身份并收集其联系方式、参加的活动信息等,可以大大提高校友数据收集的效率,为以后利用校友资源提供良好的根底。总之,大数据的教育应用可以为学生提供一个量身定做个性化的学习环境、一个灵活多变可控的教育系统、一个教育问题早期预警的系统,为教师了解学生学习途径和方法提供了崭新的、可视的、可量化的新手段,为管理者提供可视、具体、动态的平台。四、大数据技术在高校招生工作中的具体应用人才培养质量是衡量高等学校办学水平的最重要标准,是高校开展的命脉所在。要想育好才就必须先选好才,招收高质量的新生是提高高校人才培养质量的重要环节之一。所以高校应努力做好提高生源质量、招收优质新生的高校招生工作。常见的提高生源质量方法有:改善教学条件、提高教学质量,优化招生方案;加强招生管理统计,提高生源质量;加大招生宣传力度、扩大学校知名度、建立生源基地;多渠道、多形式选拔优秀考生;完善招生制度,做好录取工作。〔一〕大数据下的高校招生决策支持系统粗略设计为了更好的优化高校招生方案、更有针对性的开展招生宣传工作、更高效和深入的推进优质生源基地建设、完善自主选拔录取工作、强化学生日常管理,为学校招生决策层提供更为有力的决策依据,结合以往的总结和经验、学校招生工作的实际需求确立了以下三个分析与决策主题:1.录取生源结构分析对于录取生源结构进行总体分析,可以对录取学生的情况进行综合且具体的了解和掌握,为今后的学生管理、教学安排、学校的招生宣传、专业设置、招生方案的优化提供有意义的指导。2.学生成绩分析学生的成绩分析主要基于高考成绩和在校学籍成绩两局部。高考成绩是高校录取学生的重要依据,假设是建立数据库也是学生招生属性的重要组成局部。学生的在校学籍成绩是入校学生在高校中学习情况的直观表现,经过整合后的如在校加权平均成绩等,都是评判人才培养质量的重要指标。通过对本主题的分析,可以研究影响学生在校成绩上下的因素,探讨高考成绩和其他相关招生属性与该生在高校中成绩的潜在关联关系。更甚可以以此为着力点完善高校招生工作和教务管理工作的联动机制,优化和完善学校的人才培养机制。3.学生毕业去向分析学生的招生工作、教学环节、就业效劳对高校的人才培养工作来说,也就是一个“选才〞、“育才〞、“成才〞的过程。学生毕业后的去向是真正的对高校人才培养效果的考验。打个比方的话,招生和就业就好似高校的“入口〞和“出口〞,看起来关系不大,但其实是有内在联动的。具体来说就业率总是考生和家长在高考填报志愿时必然关心的问题,所以是直接影响着高校生源质量的好坏,尤其放在如今就业形势日益严峻的大环境下。通过对本主题的分析,以倒推的方法研究毕业学生的去向和招生属性、学籍成绩的内在关系,可以更好地为开展招生工作提供决策信息,更有效的指导招生工作的展开。〔二〕系统结构设计在招生决策支持系统的设计中,使用基于大数据下数据挖掘或数据仓库之类的新型决策支持系统体系结构。该系统的主体组成局部如下:根底业务系统、数据挖掘系统、决策分析系统以及人机交互系统等,整体系统结构如图2所示。图图2招生决策支持系统的结构图1.根底业务系统决策支持系统所使用的大数据多数来自根底业务系统,所以根底业务系统是建立数据仓库及数据挖掘的根底。上文所说的业务系统主要有高校招生网上录取系统、学籍管理系统和毕业生信息管理系统。2.数据仓库数据仓库又是决策支持系统中数据存储及组织等功能的根底,在该系统中处于核心的地位,它将所收集到的根底业务数据事物集进行集成、转换与综合,重组成用于分析的数据视图等资料。可以基于SQL数据库系统构建招生决策数据仓库等。3.决策分析系统不同的用户可以从不同级别的数据层,利用不同的分析工具来提取不同类型的信息。可以基于已建立的招生决策数据仓库等,构建多维数据集,通过联机分析处理对学生历史数据进行分析,通过数据挖掘发现数据中的潜在模式和有价值信息。4.人机交互系统人机交互系统是决策支持系统的用户界面,根据系统用户提供的信息,为其返回决策分析的结果。可尝试采用C#语言基于C/S架构构建人机交互系统。〔三〕系统功能模块设计根据初步设计的功能需求以及所有的数据资源集合,招生决策支持系统可分为三个模块:1.用户管理模块本模块完成对系统登录用户的管理功能,包括用户管理、角色定制、权限分配三个子模块。用户管理子模块:可已对系统登陆用户的资料、密码等信息进行维护。〔2〕角色定制子模块:本系统的用户角色主要有超级管理员、招生管理员、学籍管理员、就业管理员、招生决策员等。可通过此模块实现对用户角色的分配,使之享有相应的权限。只有超级管理员才有对用户管理、权限分配的权限,超级管理员应只有一人。〔3〕权限分配子模块:通过配置角色,将权限细那么配置到角色上。权限细那么包括可访问的模块及功能、可访问的数据字段、数据字段的读写权限等。2.数据管理模块本模块完成对系统数据管理的功能,包括数据展示、数据维护、数据预处理三个子模块。数据展示子模块:拥有相应权限的用户可通过此模块实现对数据仓库中数据的浏览。浏览方式为字段查看和图表查看。〔2〕数据维护子模块:拥有相应权限的用户可对相应的数据进行维护。如就业管理员只可对就业数据进行维护。〔3〕数据预处理子模块:可对数据进行简单的离散化分档处理、缺失值处理等。字段包括毕业学校、高考成绩、专业志愿、在校成绩、专业科类等。3.决策支持模块用户通过本模块完成数据挖掘工作,其后用户可以通过可视化界面而直观获取决策信息。决策支持模块又分为关联规那么挖掘子模块、聚类分析子模块和决策树分析子模块三局部。招生决策支持系统功能结构如图3所示。图3系统功能结构图高校招生决策支持系统图3系统功能结构图高校招生决策支持系统数据展示数据维护数据预处理数据管理关联规那么聚类分析决策分析决策支持用户管理角色定制权限分配用户管理解决不同类型、不同程度的问题,需要采用不同的决策方法、构建不同的模型,在系统设计中需要充分利用现有的算法和工具,来完成数据的分析和挖掘,针对上文确立的三个决策主题可构建以下方案:对于录取生源结构主题可采用聚类算法进行分析,将学生按照某些特征自动分成假设干个簇,针对每个簇的个性特征总结出有价值的决策信息以利于开展更有针对性的学生管理工作。2.对于学生成绩主题尤其是在校学籍成绩的分析可采用决策树算法进行分类分析。试研究可能影响学生在高校学籍成绩上下的因素有哪些,从而调整相应的招生策略以争夺更为优质的生源。 3.对于学生毕业去向主题可采用关联规那么算法进行挖掘分析。通过对学生的毕业去向与招生数据、学籍数据各属性间的各种关联关系的研究探寻有价值的决策信息。4.对于一些根本的数据分析和统计工作可借助联机分析处理技术来实现。联机分析处理从数据仓库中集成的数据出发,可构建面向分析的多维数据模型,从多个不同的角度对数据进行分析和比拟。〔五〕大数据技术在招生决策中的应用招生决策数据仓库建好以后,除了进行联机分析外,还要利用数据挖掘等技术对数据仓库中的数据进行特定的、更为深入的分析处理,以便从大量数据中挖掘出以前未发现的但隐式存在的知识,以便于招生决策支持。一般来说,数据挖掘是一个利用各种分析方法和分析工具,在大规模的海量的数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来作出决策和预测。支持大规模的数据分析方法及过程,选择及建立适合数据挖掘应用的数据环境是研究数据挖掘的一个重要问题。数据挖掘一般步骤如图4所示。图4图4数据挖掘的根本过程选择预处理挖掘转换分析原始数据被选择的数据预处理后的数据转换后的数据被抽取的数据分析的结果确定业务对象分析和知识同化数据准备数据挖掘数据挖掘的过程中各个步骤根本内容如下:〔1)确定业务对象:开始数据挖掘之前,最根本的就是对数据和实际业务问题的理解,在这之上提出问题,给出目标的明确定义。前面提到的三个分析决策主题就是该系统的数据挖掘目标域。〔2)数据准备:获取原始的数据,并从中抽取一定数量的子集,建立数据挖掘库。前面提到的招生决策数据仓库就可直接作为数据挖掘库。〔3)数据挖掘:根据数据挖掘任务和数据性质选择适宜的数据挖掘工具和挖掘模式。〔4)结果分析:对挖掘结果进行解释并评估。〔5)知识同化:知识同化是指将分析所得到的知识集合集成到业务信息系统的中的组织结构内。〔六〕数据挖掘的数据准备数据准备是确保数据挖掘能够成功的必要条件,数据准备在整个挖掘过程中可以占到总工作量的70%左右,数据准备工作做得是否充分将直接关系到数据挖掘的效率及质量。数据仓库是为决策支持系统中所有的分析应用提供数据源支撑,而数据挖掘是分析应用的一种,数据质量高的数据仓库可以让数据挖掘过程省去一局部预处理过程,但是不可能代替。因此,在进行数据挖掘之前仍需要对数据仓库所存储的待挖掘数据进行再加工,数据挖掘的数据准备一般包括数据选择、数据清理和数据集成等。1.数据选择在粗略的系统中由于对高校而言,可能有绝大局部生源来自某些个别省份、由于学校性质所有大比例的文科学生或理科学生等等最为关心目标的进行数据挖掘,而小对于生源较少的特征可留到系统完善后研究。比方对于兰州商学院陇桥学院而言,就可主要对甘肃省内、理工科类的招生录取数据以及与之相匹配的学籍数据、就业数据研究,其余如外省、文科类的相关数据暂不采用。2.数据清理数据清理主要包括缺失值、噪声数据、异常数据的处理,重复数据检查与数据的有效性验证等局部。对于高校招生决策支持系统可采用忽略元组、填补、推测的方法处理缺失值。如:对于不具普遍性的小局部高水平运发动因录取方式不同导致信息缺失或不完整的,可直接删除;对于个别学生的就业去向如果有缺失现象,可根据毕业时留存于学校的三方协议进行手工填补;但对于数据量很大时可采用概率最大值“派遣〞进行自动填补或者结合该生所在班级、专业总体签约率推算出可能的就业去向。3.数据集成数据集成的步骤主要是要对数据冗余、实体不一致性、数据值冲突等问题进行处理。由于待挖掘数据直接来源于招生决策数据仓库,在之前的数据提取、转换和加载过程中已经对源数据做过了相应的处理,在此只需将不同数据集市的数据进行相应的集成整合即可。五、应用难点和一些对策大数据在高校应用的美好前景令人神往,但目前大数据的应用还存在很多应用难点,主要有问题有技术层面的也有实施层面的,如何收集信息,收集何种信息,如何存储收集到的信息,如何整合信息,如何分析信息,如何保护信息等等一系列的问题需要解决。MOOC等高校大数据应用的不断兴起给高校开展带来了新支点的同时,也是带来了极大的挑战,为了应对这种挑战,高校应当充分发挥大数据在其中的支撑作用。在人才培养、科学研究和管理等方面广泛收集过程数据,结合可视化技术充分分析和挖掘蕴含在数据之中的丰富价值。同时我们需要在高校内倡导和强化数据文化,建立持久运作的收集、分析数据并将分析结果转换为教育决策和实践的体系,真正发挥大数据在高校开展中的价值。〔一〕从技术层面来看1.可用数据源关于大数据的一个普遍观点是,数据自己可以说明一切,数据自身就是事实。但实际情况是,如果不仔细甄别,数据也会欺骗,就像人们有时会被自己的双眼欺骗一样。高质量数据的获取是确保信息可用性的重要前提。高校数据的来源多种多样,包括各职能部门的根本业务数据、教学资源的多媒体数据、使用网络的行为数据、无线网络感知的位置数据等。数据模态千差万别,如关系数据、标量数据、图数据、流数据、XML数据、矢量数据等。既有重复性数据,又有冗余性数据,质量参次不齐,加工整理困难。这些校园化数据是否可用给大数据在高校中的推进带来极大的挑战。2.数据存储高校中大数据开展面临的其中一个问题是来自不同地方、不同标准、数据量大、多种结构形式、实时性等多样化要求的数据信息。这种问题无疑增加了数据采集和整合的困难,故此应完善基于块和文件的存储系统的架构设计,以克服存在的问题。数据不断增长造成单机系统性能不断下降,即使不断提升硬件配置也难以跟上数据的增长速度。然而,当今主流的计算机硬件比拟廉价而且可以扩展,现在购置八台8内核、128GB内存的机器比购置一台64内核、TB级别内存的效劳器划算得多,而且还可以增加或减少机器来应对将来的变化。因此分布式架构策略对于海量数据来说是比拟适合的,许多海量数据系统选择将数据放在多个机器中。3.多种数据的整合众所周知,在大数据的应用中数据不整合就发挥不出数据的潜在价值,高校大数据面临的一个重要问题就是数据融合,异构数据库进行数据整合并非易事,要解决冗余、歧义等脏数据的清洗问题。作为高等院校,大数据的融合应该走在前列,必须彻底打通高校所谓的数据孤岛,将各个业务充分整合。然而,由于传统的业务系统缺乏长期规划,采用的技术包罗万象。据调研发现,目前高校所采用的数据库包括Oracle、Sybase、MicrosoftSQLServer、Mysql、VisualFoxProd等等。有些学校或部门甚至没有数据库,而是采用Excel管理数据。在这种根底上实现数据的有效融合,形成高质量的大数据,对于融合技术是一个重要的难题。在大数据时代,异构的数据类型、广泛存在的数据来源、参差不齐的数据质量给数据集成带来了新的挑战。高校应该探索融合结构化、半结构化、非结构化数据的统一模型,以提高数据采集的质量,更有效的融合多种类型的数据。4.数据分析的持续性教育的规律有时很难理清,成功的个体也未必能够简单复制,评价教育本身的指标都有一定程度的缺陷,需要几年甚至更长期的监测和不断的更正。因此,高校中的大数据分析,不仅仅是横向的比照,如职能部门间、兄弟院校间,更需要纵向历史数据的比照。无论是数据收集、数据清洗还是数据挖掘的模型,都需要随着每天产生的大量详实而琐碎的数据信息进行调整和修正,这也是一个不小的挑战。5.数据挖掘的复杂性大数据分析无疑是整个大数据时代的核心所在,因为大数据的价值就产生于数据分析过程中。在高校大数据的应用中,无论是做个性分析还是舆情预测,都需要搭造特定的挖掘模型。教育行业因为其特殊性,传统的分析技术如数据挖掘、机器学习、统计分析等并不能完全满足高校大数据分析的需求,因此,需要在数据预处理、算法模型、评价指标等方面做出调整。当然,数据挖掘的复杂性,不仅是高校大数据所面临的挑战,也是整个大数据领域的巨大挑战。〔二〕从实施层面来看1.数据共享意识海量数据是大数据时代的必要根底,高校中的大数据,其中很大一局部来源于各职能部门。而现状是大量的数据分布在各个互相独立的职能部门中,甚至大量的信息资源成为了个别部门的私有财产。造成这种状况的原因一方面是时间跨度长,数据整理工作难度较大、工作优先级较低;另一方面是业务部门并不清楚哪些数据是可以被分享的、哪些数据是不能被分享的。归根结底,还是资源分享的意识不够。但是,信息资源只有在相互流动、形成规模效应的前提下才能够发挥出最大的价值,因此,还需要加强高校的数据共享意识。2.人员配备与组织结构高校内部对于各职能部门间信息资源规划缺位,导致了建设进度不同、资源投入有差距、各部门各显神通一窝蜂建设,增加了数据资源共享共用的壁垒。在大力推行教育信息化之前,很多学校并没有专门的信息化部门,技术人员储藏缺乏,甚至没有。高校大数据的推行需要一批既懂得相关技术,又熟悉业务流程的技术人员。人才的匮乏也是非常不利的一点因素,相比于商业环境下对研究实效的追逐,教育研究的缓慢与空洞有着明显的区别。3.个人隐私保护维克托·迈尔-舍恩伯格在他的著作《删除》中讲述了预防和减轻数字化对隐私所构成的挑战。个人在信息分享中往往扮演者中心的角色,因此要调整每个人对信息的认知,让大家了解信息对于个人的重要性以及个人信息泄露的危害性。鼓励个人在分享数据的时候要注意“数字化节制〞,即尽可能的远离透露个人信息的互动,而在不得不参与的时候在个人信息的分享的时候更加谨慎,有选择的分享自己的信息,拒绝分享与活动无关的信息内容。大数据分析的数据根底必然建立在获取更多个人信息之上,而且通过分析还可以使数据之间产生关联关系,进而揭示更多的个人隐私。然而为了保护隐私就将所有数据加以隐藏,那么数据的价值就无法表达。教育说到底是一个交互的过程,交互的内容收集一定程度上与隐私等是矛盾的。目前大数据的开展仍然面临着许多问题,平安与隐私问题是人们公认的关键问题之一,如教师的工资收入,学生的生活习惯、好友联络情况、阅读习惯、检索习惯等。多项案例实际说明,即使无害的数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建莆田市国有资产投资集团有限责任公司招聘企业员工13人笔试历年常考点试题专练附带答案详解
- 2026福建福州建工福厝置业有限责任公司项目建设合同制人员招聘14人笔试历年典型考点题库附带答案详解
- 2026福建福州市两江四岸客运有限公司招聘1人笔试历年备考题库附带答案详解
- 2026福建省粮油食品进出口集团有限公司及其权属企业招聘综合笔试历年备考题库附带答案详解
- 2026福建省国资教育投资有限公司笔试笔试历年常考点试题专练附带答案详解
- 2026福建漳州市凌波酒店管理集团有限公司招聘69人笔试历年典型考点题库附带答案详解
- 2026浙江温州龙港市市属国有企业面向社会招聘工作人员21人笔试历年备考题库附带答案详解
- 2026江西吉安市青原区两山人力资源服务有限公司面向社会招聘10人笔试历年典型考点题库附带答案详解
- 2026年内蒙古鄂尔多斯市电气化工程有限公司招聘20人笔试历年备考题库附带答案详解
- 2026宝鸡吉利汽车部件有限公司招聘(192人)笔试历年常考点试题专练附带答案详解
- 施工现场迎检布置实施方案
- GB/T 1969-2026多孔陶瓷渗透率试验方法
- 2025年湖南省张家界市事业单位人员招聘笔试试题及答案详解
- 2026贵州省专业技术人员继续教育公需科目考试题库
- 2026年重庆市中考历史真题(原卷版+解析版)
- 2025-2026学年广东省梅州市五华县八年级下册期末数学试题 含答案
- 2026年高考陕晋青宁卷地理高考真题试题(含答案解析)
- 2026年黑龙江、吉林、辽宁、内蒙古高考物理试卷(含答案及解析)
- 2026年小学一年级数学第二学期期末考试卷及答案(共四套)
- 2026年秋季新教材统编版九年级上册道德与法治全册知识点背诵提纲精简版
- 2026上海奉贤区区属国有企业招聘笔试参考题库及答案详解
评论
0/150
提交评论