2024年上海高职院校学生技能大赛赛项规程-大数据应用开发师生同赛_第1页
2024年上海高职院校学生技能大赛赛项规程-大数据应用开发师生同赛_第2页
2024年上海高职院校学生技能大赛赛项规程-大数据应用开发师生同赛_第3页
2024年上海高职院校学生技能大赛赛项规程-大数据应用开发师生同赛_第4页
2024年上海高职院校学生技能大赛赛项规程-大数据应用开发师生同赛_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024上海高职院校学生技能大赛赛项规程大数据应用开发师生同赛电子与信息类目录 11.1项目描述 11.2竞赛目的 11.3相关文件 2 2 63.1竞赛模块 63.2模块简述 63.2.1模块A:大数据平台及组件搭建 63.2.2模块B:大数据平台管理与运维 63.2.3模块C:数据采集与处理 73.2.4模块D:大数据分析与挖掘 73.2.4模块E:数据可视化 73.2.4模块F:大数据综合分析及报告撰写 73.3命题方式 73.4命题方案 8 8裁判组构成 84.1评价分(主观) 84.2测量分(客观) 94.3评分流程说明 4.4评分细则 4.5成绩公布方法 12 147.1赛场条件 7.3赛场布置 7.4参赛院校选手和教师的管理 8.1公众要求 8.2赛事宣传要求 15第1页共15页1.1项目描述(一)参赛学生必须为高等职业学校专科、高等职业学校本科全日制在籍学(二)每支参赛队有4名选手组成,其中1名教师,3名学生。本赛项为师(三)本赛项为单一场次,所有参赛队在现场根据任务说明,在4小时内互1.2竞赛目的大数据技术与应用赛项旨在适应大数据产业对高素质技术技能型人才的迫第2页共15页(1)大数据竞赛智能评分系统使用文档(2)大数据竞赛样题文件(3)电脑使用文档选手掌握,并熟练使用PC电脑及windows10操作系统。第3页共15页Hadoop集群分布式管理方式与规则·Hbase列式数据库的结构·Spark计算引擎的使用方式及数据调用过程·HDFS配置参数的意义及修改方式●大数据集群监控服务配置与管理C第4页共15页·独立完成编写程序,构建爬虫需求●根据指定信息要求进行爬取数据项·将复杂的业务逻辑转化成合理的技术实现·编写典型数据聚类算法程序,并对数据进行分析与挖掘·编写典型数据降维算法程序,并对数据进行分析与挖掘编写典型数据分类算法程序,并对数据进行分析与挖掘编写线性回归算法程序,并对数据进行分析与挖掘·编写关联分析算法程序,并对数据进行分析与挖掘●编写LDA机器学习算法程序,并对数据进行分析与挖掘●编写K均值聚类机器学习算法程序,并对数据进行分析与挖掘E●典型图表的应用场景及代表意义第5页共15页·使用标准化语句读取数据库或数据仓库中的数据●使用Echarts数据可视化图表库绘制折线图、饼形图、柱形图、直方图等图表·根据JSON语句规则,对数据进行交换格式转换F·业务场景理解:基于大数据思维,根据业务场景,能够理解并运用大数据技术解决企业实际的生产及管理问题·逻辑思维与分析方法:掌握逻辑思维与分析方法,提高从数据中发现问题和规律的能力·报告撰写规范与技巧:了解报告撰写的基本规范和技巧,使数据分析结果更具有说服力·业务领域知识:学习相关行业的基本知识,为数据分析提供业务背景·学习大数据新技术:关注大数据领域的新技术、新方法,不断提升自己的技能水平·大数据技术应用与设计:综合运用大数据平台及相关组件、算法等,设计并解决企业业务场景中的问题·撰写数据分析报告:基于数据分析结果,撰写具备逻辑性、说服力的报告与团队协作解决问题:在团队中发挥积极作用,与其他成员协作●应用业务知识进行数据分析:结合行业知识,针对业务需求进行数据分析·独立解决问题:在遇到问题时,能够独立寻找解决方案并付诸实践●撰写高质量的分析报告:以创新思维和专业知识撰写高质量的分第6页共15页竞赛时间A大数据平台及组件搭建0B大数据平台管理与运维0C0D大数据分析与挖掘0E数据可视化0F大数据综合分析及报告撰写0总计竞赛整体时长为240分钟,各个模块的答题时间可根据作答情况自行调整,第7页共15页3.2.4模块D:大数据分析与挖掘3.2.4模块E:数据可视化观的展示,通过使用Echarts数据可视化图表库绘制折线图、饼3.2.4模块F:大数据综合分析及报告撰写3.3命题方式本项目为提前公布试题的项目,于赛前2周公布样第8页共15页赛样题进行修订,修订比例一般不超过30%。修订时方案,裁判组成员均可提出修订意见,最终修改由裁举手表决通过确定),并由全体裁判签字确认。3.4命题方案4.1评价分(主观)评价分(Judgement)打分方式:各裁判单独评分,根据裁判数量,计算所有裁判评分的平均值。裁判相互间分差必须小于等于第9页共15页报告中未体现出业务问题解决,没有实质内容,未体现团队协作、独立思考、创新思维等;1-4分报告中体现出业务问题解决思路、技术应用,有实有一定的团队协作、独立思考、创新思维等方面的体现;5-8分报告中体现出业务问题解决思路、技术应用、技术面的体现;报告中体现出业务问题解决思路、技术应用、技术有实质内容阐述,有明确的团队协作、独立思考、创新思维等方面的体现,创新性较为突出,具有前瞻性;4.2测量分(客观)测量分(Measurement)打分方式:按模块设置若干个评分组,每组由2名类型示例最高分值正确分值不正确分值按照虚拟机名称,修改对应主机名(分别为master、slavel、slave2,使用hostnamect1命令)是否与答案匹配,代码及结果完全全匹配得分,不匹配220系统评分—→分数复核→模块B系统评分→分数复核→模块C系统评分→分数复核→第10页共15页系统评分→分数复核→系统评分→分数复核一→裁判评分分数复核一>主要知识点与技能点子任务一:免密java环境搭建,安装包3p配置。则,大数据集群动态存储方式,大525spark集群的运行原理,spark5第11页共15页置文件。配置项。子任务一:5据装载,mapreduce程序运行,sparkshell,spark程序的运行,数据调用过程。数据理子任务一:完整的赛搭建)的数据。掌握网页基本结构,利用chrome查看网页源码,网络爬虫常见库使用(python)。子任务二:清洗,合并,入库爬取数据。程序连接操作数据库的方法。5据分析与挖掘务描述构建数据仓库,并导入数据。据的导入导出。5体任务描述统计数据的汇总,分布。基于大数据思维,根据业务场5法分析数据。典型数据聚类算法,典型数据聚类机器学习算法。数据以及数据仓库中的数据用图标工具(如echart)制作折现图,饼图,柱状图,散点图,气泡图等。式,常见图表的绘制方式及参数意义,典型图表的应用场景及代表意义,图表间协同展现的逻辑关系。析及报告推理能力,以及运用文字和图标图第12页共15页撰写过数据洞察数据背后的进的建议。析方法,具备从数据中发现问题和有说服力。大赛现场设立仲裁组,仲裁组由督考、裁判长和场地负责人组成。裁判长对成绩复核,并将参赛选手成绩汇总,各裁判员最终签字确认后,成绩经裁判长和督考确认后当场公布,无异议后,比赛结果由各参赛院校领队(1)本竞赛项目,所有配套的文件及手册均采用简体中文编写。(2)参赛选手应在竞赛前15分钟,凭竞赛抽签单和身份证进入考场。(3)进入赛场后,参赛选手应按照抽签单进入指检查无误并向裁判确认后方可开始竞赛。(4)参赛选手应准时参赛,迟到10分钟以上,将不得入场,按自动弃权(5)参赛选手在竞赛期间可饮水、上洗手间,但其(6)裁判发出开始竞赛时间信号后,参赛选手方可进行操作。(7)参赛选手须独立完成所有项目,除征得裁判长许可,否则严禁与其他(8)竞赛期间,参赛选手若遇到设备问题应向监考裁判举手示意,若为设(9)竞赛期间,选手只能访问自己竞赛账号,不得对尝试破解他人账号,(10)参赛选手离开赛场前应保证所有电脑设备处于开机状态,如进行关机第13页共15页导致的一切后果,将由选手负责。(11)监考裁判发出结束竞赛时间信号后,参赛选手应立即停止操作,依次有序离开赛场。序号主体设备名称型号1大数据竞赛平台套1(以每一个选手必须配备)序号设备名称型号1CPU:I5及以上;内存:8GB及以上;硬盘:200G及以上;配件:显示器、鼠标、键盘;网络:具备千兆以上的局网环台1本竞赛无需选手自备任何材料、设备和工具。序号设备和材料名称第14页共15页1参赛选手禁止携带除抽签单、身份证、笔以外的任何物品进入竞赛7.1赛场条件(2)卫生间、医疗、维修服务、生活补给站和垃圾分类回收点都在警戒线(3)设置安全通道和警戒线,确保进入赛场的大赛参观、采访、视察的人7.2赛项保障(1)建立完善的赛项保障组织管理机制,做到各竞赛单元均有专人负责指(3)设置技术保障组,为竞赛设备、软件与竞赛设施提供保养、维修等服(4)设置医疗保障服务站,提供可能发生的急救、伤口处理等应急服务。(5)设置外围安保组,对赛场核心区域的外围进行警戒与引导服务。7.3赛场布置(2)赛场平面图上应标明安全出口、消防通道、警戒区、紧急事件发生时(3)赛场的标注、标识应进行统一设计,按规定使用大赛的标注、标识。7.4参赛院校选手和教师

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论