2024-2025年度安徽省职业院校技能大赛大数据应用与服务(教师赛)_第1页
2024-2025年度安徽省职业院校技能大赛大数据应用与服务(教师赛)_第2页
2024-2025年度安徽省职业院校技能大赛大数据应用与服务(教师赛)_第3页
2024-2025年度安徽省职业院校技能大赛大数据应用与服务(教师赛)_第4页
2024-2025年度安徽省职业院校技能大赛大数据应用与服务(教师赛)_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、赛项信息

赛项类别

☑每年赛隔年赛(奇数年/偶数年)

赛项组别

☑中等职业教育□高等职业教育

□学生赛(□个人/□团体)☑教师赛(试点)□师生联队赛(试点)

涉及专业大类、专业类、专业及核心课程

核心课程

专业大类专业类专业名称(对应每个专业,明确涉及的专业核心课

程)

图形图像处理、数字媒体技术应用、网页

设计与制作、数据库应用与数据分析、程

序设计基础、信息技术设备组装与维护。

对接真实职业场景或工作情境,在校内外

710201计算机

进行办公自动化应用、计算机设备维护与

应用

销售、计算机信息管理、信息系统管理维

护等实训。在计算机、通信和其他电子设

备制造业、软件和信息技术服务业等单位

进行岗位实习。

常用工具软件、计算机程序设计、数据库

71电子与

7102计算机应用、软件工程基础、图形图像处理、网

信息大类

类页设计与制作、工程制图软件应用、Web

程序设计、软件测试技术。对接真实职业

场景或工作情境,学生在校内外进行软件

710203软件与设计与测试、数据库应用技术、信息服务

信息服务业务技能等实训。在软件与信息服务相关

企业、生产性实训基地等场所进行岗位实

习,积累实际工作经验。就业岗位包括但

不限于计算机操作员、制图员、计算机软

件产品检验员、计算机程序设计员、计算

机软件技术人员等。

1

大数据技术应用基础、数据库应用与数据

分析、数据采集与处理技术应用、数据可

视化技术应用、Web前端开发技术基础、

大数据编程基础、计算机网络基础、操作

系统基础。对接真实职业场景或工作情境,

学生在校内外进行数据采集与标注、数据

710205大数据

处理与可视化等实训,通过项目驱动的方

技术应用

式,提升实践能力和团队协作能力。在大

数据应用与服务相关企业、生产性实训基

地等单位进行岗位实习,深入了解大数据

技术在各行业的应用,如数据分析师、大

数据工程师、数据挖掘工程师等岗位,积

累实际工作经验。

对接产业行业、对应岗位(群)及核心能力

核心能力

产业行业岗位(群)

(对应每个岗位(群),明确核心能力要求)

大数据平台搭建、部署与管理,Linux操作系统管理

大数据平台运维

与维护,数据库建库、建表与SQL数据处理

战略性新兴对数据进行采集、加载和存储,数据标准化、数据清

数据获取与清洗

产业-新理、数据转换、数据验证

一代信息技数据的统计汇总、分区操作、分组操作,数据可视化

数据分析与可视化

术效果的开发

熟练操作计算机和应用办公软件,常用软件工具的

计算机软硬件操作

使用

二、竞赛目标

习近平总书记强调“数字经济已成为驱动经济发展的新引擎”,而

“十四五”规划亦明确指出“要加快数字化发展,建设数字中国,利用

数据资源推动各领域创新发展,加速传统产业数字化改造,孕育新兴产

业和全新业态”。在此背景下,大数据无疑成为推动社会变革的重要力

量。本赛事正是为了响应大数据产业对高端技术人才的迫切需求,特别

是结合安徽作为数字经济创新发展高地的特色而设立,旨在培养更多适

应安徽乃至全国大数据产业需求的高素质人才。

本赛事全面涵盖了大数据行业的核心工作流程及关键岗位,通过竞

赛的方式,丰富教学内容,完善学习领域课程体系,确保人才培养目标

与安徽及全国大数据行业的实际需求紧密相连。同时,积极探索并实践

新型人才培养模式,构建多维度、多元化的大数据人才培养框架,旨在

提升专业服务于社会与行业发展的能力。在此基础上,借鉴技能大赛的

2

先进经验,深化产教融合、校企合作,以赛促教、以赛促学,展现安徽

教师风采,提升中职院校教师的专业技能与职业素养,弘扬工匠精神。

同时,利用大赛的平台效应,展现安徽职业教育的丰硕成果,为地方产

业转型升级特别是大数据产业的蓬勃发展贡献力量,进一步增强安徽职

业教育的社会影响力和吸引力。

三、参赛对象

参赛选手须为职业院校教龄2年以上(含)的在职教师。

四、竞赛内容

赛项设计时长3小时、满分为100分。参赛队伍的成绩由数据建模与

应用、业务场景应用与开发、模型应用与优化、工作任务展示四个部分

组成,分数占比为40%、20%、20%、20%。

一、数据建模与应用

要求参赛者能够娴熟运用各类数据分析工具和技术手段,完成数据

抽取(Extract)、转换(Transform)以及加载(Loading)的全流程ETL

操作,将原始数据转化为结构清晰、标准统一且适合深入分析的数据形

态,从而为后续的数据挖掘、模型构建及业务洞察奠定坚实可靠的数据

质量基础。

理解业务需求,根据业务逻辑抽象出实体关系模型(ER图),定义

主题域、事实表与维度表,构建符合星型、雪花型或其他复合模式的数

据仓库模型。设计合适的数据表结构、字段属性、键值关联等,保证数

据在逻辑层面上的完整性、一致性和可扩展性。选择合适的索引策略、

分区方案和数据分布策略,将逻辑模型落实到具体的数据库管理系统

中。设计合理的数据抽取、转换和加载流程,确保数据从源系统到数据

仓库的准确无误流转。

二、业务场景应用与开发

3

利用诸如微服务架构、容器化技术、大数据分析以及人工智能(如

机器学习和深度学习)等前沿技术,针对不同行业的具体业务场景,精

心设计并高效实现定制化的应用程序及解决方案。精深把握各行业业务

逻辑,巧妙嫁接各类领先技术,深度发掘数据潜力,以技术创新引领业

务实践,不断催生适应市场需求、助力业务跃迁的高性能应用场景。

三、模型应用与优化

基于模型应用与优化的业务场景深化,是对前期业务场景应用与开

发成果的再升级和精细化管理。以模型为核心,通过模拟仿真、训练优

化和持续迭代的方式,让技术更好地服务于业务,挖掘深层价值,驱动

业务效能持续提升和创新突破。

四、工作任务展示

参赛选手围绕“技能水平、职业素养、应用价值、团队合作、创新

创意”要素,自主进行内容设计,假定在1小时内2-4人团队可以完成的

工作任务,主要介绍技能要点、主要成果、项目创新等方面,介绍可以

通过PPT、视频等形式展示(不局限以上形式)。

逐项说明赛项模块、比赛时长及分值配比:

评分竞赛总分

模块

方式时长分数比例

数据建模与应用系统评分704040%

业务场景应用与开发系统评分452020%

模型应用与优化系统评分452020%

工作任务展示专家评分202020%

合计180分钟100分

4

五、竞赛方式

(一)竞赛形式

本赛项为个人赛。

组队方式

1.竞赛以院校为单位组队参赛

2.各参赛队竞赛使用台位在比赛当天抽签确定。

(三)报名资格

参赛选手须为职业院校教龄2年以上(含)的在职教师。

六、竞赛流程

竞赛日程规划

比赛限定在1天内进行,比赛场次为1场,竞赛时间为3小时,具体

安排如下:

时间流程内容备注

参赛报到15:00-16:00

赛前一天报到

赛前参赛队报到参赛者熟悉场地16:30-17:00

(全天)

参赛说明会16:30-17:30

竞赛开幕式竞赛开幕式08:00-08:30

08:30-09:00

抽签入场

上午正式竞赛

赛中09:00-11:00

竞赛当天

14:00-14:30

检录入场

下半正式竞赛

14:30-16:30

赛后闭幕式颁奖、成绩点评16:30-19:30

七、竞赛规则

5

1、参赛队伍(选手)使用报到时抽签的赛位号,入场时依据赛位

号(赛位号由1位字母和2位数字组成)进行检录、查询赛场的位置,

并按照赛位位置进行比赛。

2、参赛选手须提前15分钟入场,入场必须佩戴参赛证并出示身份

证等证件。不得私自携带任何软硬件工具(各种便携式电脑、各种移动

存储设备等)、技术资源、通信工具。按赛位号入座,检查比赛所需竞

赛设备齐全后,由参赛选手签字确认方可开始比赛,裁判长宣布比赛开

始后,各参赛队伍(选手)通过赛位号找到比赛位,进行竞赛,按照竞

赛模块要求完成比赛,每个参赛队内部成员之间可以互相沟通,但不得

向任何其他人员讨论问题,并按照任务要求提交和保存竞赛结果;竞赛

过程中,参赛选手若有任何需求、疑问,需举手示意工作人员,由裁判

长确认后,在工作人员的帮助下进行处理。(注:竞赛过程中如果出现

设备故障时,参赛选手应立即提出请示,由现场技术支持到赛位处确认

原因,因设备自身故障而耽误的时间,由大赛裁判组将该参赛队的比赛

时间酌情增补);如非设备自身故障,则不予考虑,并扣除该部分功能

分。竞赛结束(或提前完成)后,参赛队要确认成功提交竞赛要求的文

件,裁判员签字确认,参赛队在确认后不得再进行任何操作。

3、比赛结束前5分钟,裁判长提醒比赛即将结束,各参赛队(选手)

应准备停止操作,着手进行现场清理工作。参赛队完成任务并决定结束

比赛时,应提醒现场技术支持人员到比赛工位处确认,助理裁判记录结

束时间,并提交比赛结果,参赛队需求规划总监签字确认,参赛队伍应

对赛位进行清理,但不得进行其他活动,现场技术支持人员检查后,清

点工具、设备且选手签字确认,留需求规划总监在现场,其余人退出考

场。

6

4、本次大赛参赛作品的知识产权归参赛团队所有,大赛组委会有

权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指

定及授权媒体发布、官方网站浏览及下载、展览。

八、技术规范

(一)技术规范

本赛项以专业技术标准、行业技能标准、软件开发标准为准则:

专业技术标准

编号标准号标准名称

1GB/T11457-2006信息技术、软件工程术语

2GB8566-88计算机软件开发规范

3GB/T12991-2008信息技术数据库语言SQL第1部分:框架

4GB/T21025-2007XML使用指南

5GB/T28821-1012关系数据管理系统技术要求

大数据相关标准

编号标准号标准名称

1GB/T38672-2020信息技术大数据接口基本要求

2GB/T38673-2020信息技术大数据系统基本要求

3GB/T38676-2020信息技术大数据存储与处理系统功能测试要求

4GB/T38643-2020信息技术大数据分析系统功能测试要求

5GB/T38675-2020信息技术大数据计算系统通用要求

6GB/T38633-2020信息技术大数据系统运维和管理功能要求

7GB/T38672-2020信息技术大数据接口基本要求

8GB/T38673-2020信息技术大数据系统基本要求

7

软件开发标准

编号标准号标准名称

1GB/T8566-2001信息技术软件生存周期过程

2GB/T15853-1995软件支持环境

3GB/T14079-1993软件维护指南

4GB/T17544-1998信息技术软件包质量要求和测试

(二)设备使用与操作规范

1.计算机电源应保持良好,插座不得松动,发现有漏电现象应立即

切断电源。

2.开机前应检查有无异常情况。

3.开机前先接电源、开外设,最后开主机。

4.不能带电插拔外设及主机。

5.如发现计算机有不正常现象时应立即停止操作,请裁判员检查后

方可用机。

6.做好数据资料的保密工作。

(三)操控人员应具备的专业知识

操控人员应具备数据采集与处理、数据分析与可视化、数据标注、

大数据业务分析方法和方案架构、运行维护数据库系统等专业知识。

(四)操控人员应具备的技术技能

操控人员应具备分析系统数据来源、分析数据应用需求、设计数据

资源整合解决方案、数据可视化、运行维护数据库系统、数据和信息处

理等技术技能。

九、技术环境

(一)竞赛环境

8

赛场内设选手检录区、选手休息区、竞赛区、裁判组工作区、技术

支持区、服务保障区、加密裁判封闭区、配件仓库、保密室等。

1.选手检录区:选手等待检录、检录、一次加密、二次加密等职能

区域。

2.选手休息区:选手检录前及竞赛离场休息、指导教师休息区域。

3.竞赛区:每个参赛队伍的比赛占地面积平均不少于9平方米。每

个竞赛工位设工位编号,竞赛工位相对独立,确保选手独立开展竞赛,

不受外界影响。赛场内安装摄像头,确保每个竞赛工位无盲区监控。赛

场环境的供电采用双强电设备,确保比赛用电的高可靠,各工位分区供

电,强电弱电分开布线;场地采光、照明和通风良好,工位及竞赛桌面

照度大于500lux。赛项赛场整体平面布局如图所示。

(1)整个比赛场地应保持通畅和开放,并配备防火防爆及其他安

全设施。

(2)赛场周边设有卫生间、维修服务、医疗、生活补给站等公共

服务区和紧急疏散通道,并在赛场周围设置隔离带。

(3)设立赛场开放区和安全通道,赛场走廊安装玻璃墙,透明、

通亮,适合督巡,便于竞赛督查组巡视和竞赛接受采访,保证大赛安全

有序进行和扩大社会影响力。

(4)场地配套提供稳定的水、电、气源和供电应急设备,并有保

安、公安、消防、设备维修和电力抢险人员待命,以防突发事件。

(5)学生组、教师组技能竞赛在多工位进行。

(6)场内设施及布局。

4.裁判组工作区:供裁判工作及休息,相对封闭,配讲台、办公桌、

椅,电脑、投影仪、打印机等。

5.技术支持区:供技术支持人员工作及休息,为竞赛提供技术支持。

9

6.服务保障服务区:提供医疗等服务保障,以及竞赛期间备餐点,

当地医疗机构要选派2名医务人员到赛场医疗点值班,处理比赛中突

发情况问题。

7.加密裁判封闭区:一二次加密裁判在竞赛加密和解密期间,实现

封闭管理所待区域,该区域不得提供任何与外界通讯途径;

8.配件仓库区:赛场所有实操易损配件(键盘、鼠标、网线等)、

文具备货点,备件数量应达到赛场所需配件10%,配件仓库严禁外人进

入,钥匙由裁判长掌握。

9.保密室:保密室设在赛场附近,室内安装监控设备,安排专人值

班,保密室钥匙由裁判长和监督组长分别掌握。

(二)技术平台

(1)硬件平台

序号设备名称数量备注

1.CPU:不少于2路20核心,40线程,主

频不低于2.0GHz;

1服务器1台/每5支队伍2.内存:不少于256GB;

3.硬盘:不少于1TBNVMESSD;

4.网卡:至少双千兆网口;

1.CPU:i5及以上;

2.内存:不少于16GB;

2PC机3台/每支队伍

3.硬盘:不少于500GBSSD;

4.显示器:1920*1080及以上;

3交换机1台/每10台服务器24口及以上千兆交换机

(2)软件系统

序号软件类别软件名称和版本或要求说明单位

1.选手端支持考核模块展示全部的考核题目,

考核题目支持模块说明,展示当前任务进行介

1机器评分系统套1

绍;支持考核条件列表,针对于每一个考核条

件提示操作环境、得分分值、总分值等信息;

10

2.选手端支持一个或多个操作环境,操作环境

列表显示环境名称、连接方式、用户名、密码、

端口、IP等信息;支持操作环境启动功能,支

持密码隐藏、复制的功能;

3.选手端实操赛题支持自主检测功能,系统内

置考核条件模版,在设置赛题时将赛题与考核

条件匹配,系统自动对比正确性,评判出相应

的分数;

4.竞赛监控端支持竞赛任务检测条件,包括检

查命令执行结果不包含某个关键词、判断文件

是否存在、检查命令执行结果包含某个关键

词、判断文件是否存在关键字等;

5.竞赛展示系统包括实操模块、解题个数分配、

态势图、步骤完成度、得分排行榜等模块;

6.支持实时展示每个赛题、每个考核点的详细

得分;

7.支持记录每支队伍的每道赛题、每个得分点

的答题日志,支持记录答题时间、答题次数;

大数据集群操

2CentOSLinuxrelease7套1

作系统

大数据平台组

3Hadoop2.7.7以上套1

4Yarn3.1.3套1

5ZooKeeper3.4.14以上套1

6Hive2.3.4/3.1.2套1

7JDK1.8套1

8Scala2.11以上套1

9Spark3.0.0/3.1.1套1

10Flume1.9.0套1

11Kafka2.1以上套1

12Sqoop1.4.7以上套1

13Flink1.14.0套1

14Redis6.2.6套1

15Excel2016套1

16HBase2.2.3套1

17关系型数据库MySQL5.7及以上套1

11

18开发语言JavaScript套1

19Java1.8套1

20html/html5+CSS套1

21Python3.6/3.7套1

22开发库numpy1.18.5套1

23pandas1.3.4/2.1.3套1

24matplotlib3.5.0套1

25Vue.js3.2套1

26ECharts5.1以上套1

27pyecharts2.0.4套1

28snownlp0.12.3套1

29seaborn0.11.2套1

30openpyxl3.0.9套1

31lxml4.9.3套1

32开发工具IDEA2022(CommunityEdition)套1

33PyCharm2023(CommunityEdition)套1

34HBuilderX3套1

35Visualstudiocode1.79以上套1

36数据库工具Navicat套1

37浏览器Chrome套1

38SSH连接工具Xshell或MobaXterm或系统自带终端工具套1

39文档编辑器WPS套1

40数据采集doccano1.8.4套1

41输入法搜狗拼音输入法套1

42PC操作系统Windows1064位套1

十、赛项安全

(一)比赛环境

1.执委会须在赛前组织专人对比赛现场、住宿场所和交通保障进行

考察,并对安全工作提出明确要求。赛场的布置,赛场内的器材、设备,

应符合国家有关安全规定。如有必要,也可进行赛场仿真模拟测试,以

发现可能出现的问题。承办单位赛前须按照执委会要求排除安全隐患。

12

2.赛场周围要设立警戒线,防止无关人员进入发生意外事件。比赛

现场内应参照相关职业岗位的要求为选手提供必要的劳动保护。在具有

危险性的操作环节,裁判员要严防选手出现错误操作。

(二)生活条件

比赛期间,原则上由执委会统一安排参赛选手和指导教师食宿。承

办单位须尊重少数民族的信仰及文化习俗,根据国家相关的民族政策,

安排好少数民族选手和教师的饮食起居。

(三)组队责任

1.各学校组织代表队时,须安排为参赛选手购买大赛期间的人身意

外伤害保险。

2.各学校代表队组成后,须制定相关管理制度,并对所有选手、指

导教师进行安全教育。

(四)应急处理

比赛期间发生意外事故,发现者应第一时间报告赛项执委会,同时

采取措施避免事态扩大。执委会应立即启动预案予以解决并报告组委

会。赛项出现重大安全问题可以停赛,是否停赛由赛项执委会决定。事

后,执委会应向组委会报告详细情况。

十一、成绩评定

(一)评分标准制定原则

竞赛评分制定严格遵守公平、公正的原则,大数据应用与服务赛项

评分采用赛项结果评分方法,始终贯彻落实竞赛一贯坚持的公平、公正

和公开原则。

1.参与竞赛成绩管理的组织机构包括裁判组、监督仲裁组等,裁判

组实行“裁判长负责制”。

2.裁判评分方法,根据评分标准,各项目评分裁判根据选手操作过

程和操作结果进行评分,独立评分。

13

3.成绩产生方法。为保证公开、公平、公正、透明地进行成绩评定,

在裁判员的评分中,取两个评分裁判平均分作为选手技能得分。

4.成绩审核方法为各裁判员首先审核自身对选手的原始打分成绩,

并签名,裁判长对所有裁判员的打分成绩进行审核,并签名,再由监

督组对竞赛成绩抽检复核。

(二)评分方法

1.选手在完成任务之后,机器自动评分部分的任务,将由机器自动

阅卷并评分;结果评分的任务,将完成结果拷贝至U盘中,由参赛

选手队长签字确认(签工位号)。评分采取分步得分、累计总分的计分

方式。不计参赛选手的个人得分,只记录团体得分。

2.参赛队提交比赛任务结束请求或者在比赛时间终止后,不得再进

行任何操作。否则,视为比赛作弊,给参赛队记警告一次。在竞赛过程

中,选手如有不服从裁判判决、扰乱赛场秩序、舞弊等不文明行为,由

裁判长按照规定扣减相应分数并且给予警告,情节严重的取消竞赛资

格,竞赛成绩记0分,队员退出比赛现场。

(三)评分细则

本赛项成绩满分为100分。

实操考核:在比赛开始时,向选手公布实操题目,选手按照试题要

求现场进行操作,考试系统是时出具分数。

工作任务展示:以汇报展示形式开展,由专家评审组进行成绩评定,

综合计算总成绩。

模块主要知识与技能点分值

大规模数据获取与存储

20

数据建模与应用数据清洗与预处理技术

数据仓库模型设计与实现20

14

业务逻辑理解与系统需求分析

业务场景应用与

20

开发

数据分析技术应用

模型选择与评估标准理解

模型应用与优化模型训练与调优技术20

自然语言处理技术

技术水平

1.熟练掌握本专业或工作岗位的技能。

2.技能操作规范,符合行业和岗位标准。12

3.具备较高的技能操作水平及解决复杂问题的综合

能力。

职业素养

1.展现较好的职业伦理,具有工匠精神。

2.展现学校对学生全面培养、基本素养培育和成长

发展的成效。2

3.展现职业教育育人成果,体现产教融合、科教融

汇。

4.具备良好的职业道德、职业精神、职业素养。

应用价值

1.有助于解决生产一线实际问题或现实困难。

2.能够促进职业学校学生高质量就业,包括直接、

间接推动扩大就业规模等。

2

工作任务展示3.对推动产业转型升级、区域经济发展、乡村振兴、

城市社区治理、城乡融合发展等具有积极作用。

4.符合绿色低碳节能的可持续发展理念,有利于改

善人民生活、提升人民生活质量。

团队合作

1.团队成员能够准确理解共同目标和任务,清楚自

己的角色定位和职责。

2.团队成员在比赛中能够有效沟通、紧密协作。2

3.团队成员能够相互补台,共同应对突发情况。

4.团队成员相互尊重、信任和支持,拥有良好的团

队氛围。

创新创意

1.体现原始创意、创新。

2.体现面向职业和岗位的创意及创新,侧重于工作

2

流程创新、实用技术创新、产品(技术)数字化改

良、应用性优化、民生类创意等。

3.体现团队成员创新精神和创新能力

合计100

15

十二、奖项设置

本赛项奖项设单人奖。设奖比例为:以赛项实际参赛选手总数为基

数,一、二、三等奖获奖比例分别为10%、20%、30%(小数点后四舍五

入)。

如出现参赛选手总分相同情况,依序按照模块二、模块一、模块三

得分高低进行排名,在前序模块得分相同的情况下,按照后续模块得分

排名。如果所有任务分值相同,则查看文档撰写规范、职业素养的分

值进行排序。

十三、赛项预案

1.竞赛软硬件环境和电脑在比赛前进行压力测试,验证功能正常。

竞赛现场准备有2-4套完整的竞赛平台设备用于备份。每组配备一台备

用PC机保证在出现非选手原因的损坏时,经现场裁判认定,裁判长确认

后,由赛场技术支持人员予以及时更换。

2.竞赛过程中出现设备掉电、故障等意外时,现场裁判需及时确认

情况,安排赛场技术支持人员进行处理,现场裁判登记详细情况,填写

补时登记表,报裁判长批准后,可安排延长补足相应选手的比赛时间。

3.本赛项竞赛过程中各个竞赛工位为独立供电且各个参赛队均采

用独立网络进行竞赛,如在竞赛时某参赛队出现意外境况不会影响其它

队伍正常比赛。

4.竞赛平台采用分布式高可用型部署方式,所有平台关键组件均有

至少三套环境进行支撑,且整套平台采用异地灾备模式,在主竞赛平台

所在区域外(承办院校内),设置异地灾备模式的从竞赛平台,主从竞

赛平台间实现设备、数据、应用组件间的实时同步。

16

5.竞赛平台数据库采用分布式高可用型部署方式,数据均保存三个

备份,三个备份实时进行同步,从而保障竞赛数据、选手答题过程、竞

赛成绩等内容的数据安全。

所有区域间均采用双网络链路设计,实现网络的高可用性。

十四、竞赛须知

(一)参赛队须知

1.参赛队名称统一使用规定的代表队名称。

2.参赛队员在报名获得审核确认后,原则上不再更换,如筹备过程

中,选手因故不能参赛,所在学校需出具书面说明并按相关规定补充

人员并接受审核;开赛前10日以内,参赛队不得更换参赛队员,允许缺

员比赛。

3.参赛队按照大赛赛程安排凭大赛组委会颁发的参赛证和有效身

份证件参加比赛及相关活动。

4.参赛队统一安排参加比赛前熟悉场地环境的活动。

5.各参赛队准时参加赛前领队会,领队会上举行抽签仪式抽取场次

号。

6.各参赛队要注意饮食卫生,防止食物中毒。

7.各参赛队要发扬良好道德风尚,听从指挥,服从裁判,不弄虚作

假。

(二)参赛选手须知

1.参赛选手应遵守比赛规则,尊重裁判和赛场工作人员,自觉遵守

赛场秩序,服从裁判的管理。

2.参赛选手应佩戴参赛证,带齐身份证、注册的学生证。在赛场的

着装,应符合职业要求。在赛场的表现,应体现自己良好的职业习惯和

职业素养。

17

3.进入赛场前须将手机等通讯工具交赛场相关人员保管,不能带入

赛场。未经检验的工具、电子储存器件和其他不允许带入赛场物品,一

律不能进入赛场。

4.比赛过程中不准互相交谈,不得大声喧哗;不得有影响其他选

手比赛的行为,不准有旁窥、夹带等作弊行为。

5.参赛选手在比赛的过程中,应遵守安全操作规程,文明的操作。

通电调试设备时,应经现场裁判许可,在技术人员监护下进行。

6.比赛过程中需要去洗手间,应报告现场裁判,由裁判或赛场工作

人员陪同离开赛场。

7.完成比赛任务后,需要在比赛结束前离开赛场,需向现场裁判示

意,在赛场记录上填写离场时间并签工位号确认后,方可离开赛场到指

定区域等候评分,离开赛场后不可再次进入。未完成比赛任务,因病或

其他原因需要终止比赛离开赛场,需经裁判长同意,在赛场记录表的相

应栏目填写离场原因、离场时间并签工位号确认后,方可离开;离开

后,不能再次进入赛场。

8.裁判长发出停止比赛的指令,选手(包括需要补时的选手)应

立即停止操作进入通道,在现场裁判的指挥下离开赛场到达指定的区

域等候评分。需要补时的选手在离场后,由现场裁判召唤进场补时或

比赛结束后自然延时补时。

9.赛场工作人员叫到工位号、在等待评分的选手,应迅速进入赛

场,与评分裁判一道完成比赛成绩评定。在评分过程中,选手应配合

评分裁判,按要求进行设备的操作;可与裁判沟通,解释设备运行中的

问题;不可与裁判争辩、争分,影响评分。

10.遇突发事件,立即报告裁判和赛场工作人员,按赛场裁判和工

作人员的指令行动。

(三)工作人员须知

18

1.工作人员必须服从赛项组委会统一指挥,佩戴工作人员标识,认

真履行职责,做好服务赛场、服务选手的工作。

2.工作人员按照分工准时上岗,不得擅自离岗,应认真履行各自的

工作职责,保证竞赛工作的顺利进行。

3.工作人员应在规定的区域内工作,未经许可,不得擅自进入竞赛

场地。如需进场,需经过裁判长同意,核准证件,有裁判跟随入场。

4.如遇突发事件,须及时向裁判长报告,同时做好疏导工作,避免

重大事故发生,确保竞赛圆满成功。

5.竞赛期间,工作人员不得干涉及个人工作职责之外的事宜,不得

利用工作之便,弄虚作假、徇私舞弊。如有上述现象或因工作不负责任

的情况,造成竞赛程序无法继续进行,由赛项组委会视情节轻重,给予

通报批评或停止工作,并通知其所在单位做出相应处理。

十五、申诉与仲裁

1.各参赛队对不符合赛项规程规定的设备、工具、材料、计算机软

硬件、竞赛执裁、赛场管理及工作人员的不规范行为等,可向赛项仲裁

组提出申诉,申诉主体为参赛队领队。

2.仲裁人员的姓名、联系方式、工作地点应该在竞赛期间向参赛队

和工作人员公示,确保信息畅通并同时接受大众监督。

3.申诉启动时,由参赛队领队向赛项仲裁工作组递交亲笔签字同

意的书面申诉报告。申诉报告应对申诉事件的现象、发生时间、涉及人

员、申诉依据等进行充分、实事求是的叙述。非书面申诉不予受理。

4.提出申诉应在赛项比赛结束后2小时内提出。超过2小时不予受

理。

5.赛项仲裁组在接到申诉报告后的2小时内组织复议,并及时将复

议结果以书面形式告知申诉方。申诉方对复议结果仍有异议,可由领队

向大赛仲裁工作组提出申诉。大赛仲裁工作组的仲裁结果为最终结果。

19

6.申诉方不得以任何理由拒绝接收仲裁结果;不得以任何理由采取

过激行为扰乱赛场秩序。仲裁结果由申诉人签收,不能代收;如在约定

时间和地点申诉人离开,视为自行放弃申诉。

7.申诉方可随时提出放弃申诉。

十六、竞赛观摩

1.赛程安排注重观赏性与开放性。为了进一步增强职业教育吸引

力,宣传职业教育的地位和作用,展示职业教育发展成果,形成全社会

关心、重视和支持职业教育的良好氛围,提高职业院校技能大赛的观赏

性,本赛项为业内提供了观摩体验场所。

2.通过休息室大屏幕的直播观摩比赛现场全过程。观摩人员需遵守

场地规则,服从工作人员管理。当观摩人数超出赛场容量时,赛项执委

会将根据现场情况控制观摩人员进入赛场。

十七、竞赛直播

1.赛场内部署无盲点录像设备,能实时录制并播送赛场情况,本

赛项竞赛时采用全过程录像;赛场外指导教师休息区有大屏幕或投影,

同步显示赛场内竞赛状况;

2.在不影响比赛的前提下,全过程、全方位安排现场直播,并设直

播观摩区,让所有参赛教师和社会人员等观看比赛。赛后邀请媒体采访

优秀选手、裁判专家或企业人士,突出赛项的技能重点与优势特色,为

大赛宣传、资源转化提供全面的信息资料。视频资料也作为竞赛成果提

交赛项执委会,作为竞赛历史材料供后续赛项提高进行参考,竞赛过程

可作为教学资料进行资源转换,促进相关专业教学发展。

十八、赛项成果

大数据应用与服务资源转化工作由赛项执委会负责,依照有关要

求,通过多手段、全方位对赛项资源优秀成果进行转换,赛后三个月内

完成资源转化工作,并向大赛执委会办公室提交大赛成果资源转化方

案如下表,三个月内完成资源转化工作。

20

一级二级

内容简述转化方式进度安排备注

资源项资源项

介绍大赛主题、目1.承办校比赛当天全程摄

赛项的、意义以及实施过15分钟视赛后像,拍摄比赛各个阶段

宣传片程,突出展现参赛1个月

选手同台竞技的风2.承办校拍摄教师休息区

采和大屏展示区采集素材

风采

1.承办校闭幕式之后,访谈

展示

介绍选手日常学拍摄大赛一等奖参赛队

获奖选2.赛项执委会通知各个参

习、备赛、参赛、10分钟视赛后

手风采

2个月赛队留存日常训练视频,比

展示片获奖等环节的感频

赛当天提供给承办单位用

于剪辑

技能训练介绍大赛训练过形成集训赛后

赛项专家组完成

推广大纲3个月

程要点方案

十九、竞赛样题

模块一:数据建模与应用

任务1:数据清洗与预处理

任务说明:

编写MapReduce程序,对“ip.txt”与“log.txt”数据进行预处理、

压缩等操作。

子任务1:IP数据清洗与预处理

编写MapReduce程序,对“ip.txt”与“log.txt”数据进行预处理、

压缩等操作。

(1)请编写MapReduce程序,将原始数据中的各个字段使用制表符

“\t”分隔,且处理后的数据应保证行序不变

(2)查看“ip_processed.txt”文件的第5000至5010行数据

子任务2:Log数据清洗与预处理

部分数据(log.txt)展示如下:

21

1、26--[21/Aug/2017:23:59:03+0800]"HEAD/

HTTP/1.1"3010"-""Mozilla/5.0(compatible;MSIE9.0;Windows

NT6.1;Win64;x64;Trident/5.0)"

2、6--[21/Aug/2017:23:59:03+0800]"HEAD/

HTTP/1.1"3010"-""Mozilla/5.0(compatible;MSIE9.0;Windows

NT6.1;Win64;x64;Trident/5.0)"

3、8--[21/Aug/2017:23:59:12+0800]"POST

/shop/updateDurationVideoHTTP/1.1"2002

"/shop/initplay/602""Mozilla/5.0(Windows

NT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)

Chrome/51.0.2704.106Safari/537.36"

(1)请编写MapReduce程序,提取文本中的字段

(2)查看“log_processed.txt”文件的第500至505行数据

任务2:数据仓库模型建设

任务说明:

基于Hive数据仓库,针对特定问题场景完成数据统计分析。

子任务1:基于Hive数据仓库,针对特定问题场景完成数据统计分

Hive数据表字段信息:

ip数据表说明

log数据表说明:

22

(1)在Hadoop上,启动Hive服务,创建“web”数据库,执行指令

“showdatabases;”并输出相应结果。

(2)创建库表并查看输出相应字段信息

(3)导入数据到Hive表中

(4)统计“该网站用户访问次数最多的10个页面”

(5)统计“该网站的跳转来源类型”

(6)针对“log”数据表,统计该网站在“2017年8月22日”内,

各每小时的浏览量(PageViews,PV)和访客量(UniqueVisitors,

UV)

(7)构建企业白名单,根据“ip”表,获得“北京市东城区”的

所有IP地址范围,统计“log”表中“ip字段”属于上述范围的记录更

新白名单记录并统计白名单中数据数量。

模块二:业务场景应用与开发

任务1:行业用户行为分析

任务说明:

在近年来的信息化浪潮中,移动通信网络和互联网技术的深度融合

与发展,使得移动互联网以其无所不在的影响力,深入渗透到人们的日

常生活与工作中。无论是老少妇孺,皆能轻松借助互联网用户使用者的

身份,享受到互联网带来的种种便利。

随着运营商(电信、移动、联通)业务规模的不断扩大,人们可随

时随地通过移动终端接入移动通信网络来访问互联网,进行网络购物、

新闻浏览、视频观看、微信聊天、扫脸支付等各种丰富多彩的活动。

23

而在这些交互过程中,每一个访问行为都会产生大量的数据,这些

数据通过运营商的网络进行传输。这些数据中,包含了诸多有关移动用

户的信息资源,如用户位置、设备类型、网络类型,以及每个请求的目

标地址等。这些数据不仅反映了用户的业务使用状况、网络访问内容,

还揭示了其消费行为偏好、移动路线轨迹等潜在信息。因此,准确分析

并挖掘这些数据背后的价值已经成为通信运营商的当务之急。

本项目旨在利用先进的大数据技术深入剖析中国通信行业用户的

上网行为数据,以更好地了解用户的需求、偏好和消费习惯。通过收集

和分析用户上网日志、中国各地区的信息以及其他相关数据,我们将能

够挖掘出许多有价值的信息,例如用户所处的地理位置、上网时段、常

用设备以及高频访问的网页等。

这些信息的挖掘将有助于通信企业更准确地了解用户的需求和行

为特点,从而更好地定位产品和服务,提高市场竞争力。同时,这些信

息还能够为政府部门提供决策支持,帮助其更好地了解互联网发展状况

和用户行为偏好,制定出更加科学合理的政策和规划。

(1)在comm数据库下创建一个名为dim_date的外部表,如果

表已存在,则先删除。

(2)在comm数据库下创建一个名为dim_area的外部表,如果

表已存在,则先删除。

(3)统计不同省份用户访问量

(4)统计每天不同经济大区用户访问量

(5)统计不同时间段的网页浏览量

(6)统计节假日和工作日的各个时间段内网页的平均浏览量

(7)不同网站访客的设备类型统计

(8)不同网站的上网模式统计

(9)不同域名的用户访问量

24

模块三:模型应用与优化

任务1:舆情文本分析

项目背景:

随着科技的进步,网络媒体已经成为主要的信息传播途径,抖音、

B站、微博等非受控渠道成为人们发表个人观点的主要方式。用户可以

很轻易的在网络平台分享自己对产品感受,表达自己的观点和看法。

同时,企业的负面事件会很快在网络上形成舆论,个别人在其中故

意挑动情绪,容易导致网络非理性情绪的蔓延,进而产生严重的不良影

响,给企业带来巨大的舆论压力。然而,在处理舆情信息时,面对海量

信息,其中重复和混杂的现象相当普遍,传统的手工处理方式根本无法

胜任。通过文本技术对舆情文本进行处理,第一时间推送分析结果,有

助于帮助企业及时获取危机信息、维护企业利益。

(1)读取名为“网络评论数据”的csv文件

(2)“发布时间”列拆分为“日期”和“时间”两列

(3)数据清洗,将文本中的无关字符、数字、字母和空格删除

(4)去除停用词,结果数据另存至一个新的列表中

(5)配置词云对象,生成词云图像

(6)参照“程度级别词语.txt”文件完成索引的提取

(7)计算句子情感值

(8)按照日期计算总情感值

(9)绘制多个子图(4个),从不同层面对舆情数据进行可视化展

(10)根据日期筛选数据,定义三个时间点,将字符串转换成日期

(11)主题词提取

(12)提取负面言论ID,查看其评论内容

模块四:工作任务展示

25

任务:大数据技术在舆情文本分析中的创新应用与落地规划

展示内容:应聚焦舆情文本分析的关键技术,如数据预处理、特征

提取、数据可视化及机器学习等,探索舆情文本分析在揭示用户需求、

行为特点等方面的潜力,突出舆情数据的可视化成果,以及如何将舆情

文本分析与其他大数据技术结合,形成创新解决方案。

展示要求:需明确落地规划,包括实施步骤、所需资源、预期目标

等,特别是如何将舆情分析结果应用于实际业务,提升决策效率。展示

形式可为PPT、视频等,要求内容真实、条理清晰。

26

安徽省职业院校技能大赛

赛项规程

赛项名称:大数据应用与服务

英文名称:IndustrialInternetdatacollection

andapplication

赛项组别:中职组

赛项编号:

一、赛项信息

赛项类别

☑每年赛隔年赛(奇数年/偶数年)

赛项组别

☑中等职业教育□高等职业教育

□学生赛(□个人/□团体)☑教师赛(试点)□师生联队赛(试点)

涉及专业大类、专业类、专业及核心课程

核心课程

专业大类专业类专业名称(对应每个专业,明确涉及的专业核心课

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论