医学院大数据与人工智能教学实验平台建设需求_第1页
医学院大数据与人工智能教学实验平台建设需求_第2页
医学院大数据与人工智能教学实验平台建设需求_第3页
医学院大数据与人工智能教学实验平台建设需求_第4页
医学院大数据与人工智能教学实验平台建设需求_第5页
已阅读5页,还剩43页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XX医学院大数据与人工智能教学实验平台建设需求

1.建设目标与定位

通过大数据分析与人工智能应用教研实训平台建设探索我院应用型创业人

才培养需要的实验室建设和教学改革方向,实现企业、学校优质资源融合、教学

科研协同的实验教学新模式,服务学院向技术应用型大学转型需要。

大数据分析与人工智能应用教研实训平台将定位为学院课程体系建设平台、

应用型创业人才培养基地、社会咨询服务与培训基地。

2.建设思路

(1)统筹发展,科学交叉。大数据分析与人工智能应用教研实训平台由学

院统筹谋划,整体部署;工程技术学院为建设主体、各二级学院协同,共同规划

建设方案设计,并协同教务与科技部做好师资培养、课程安排等;实验中心科学

规划场地与装修、软硬件要求、标书制作、设备维护与调试等工作,全力推进中

心建设;公保部承担招标、采购等工作;相关职能部门全力配合中心建设工作推

进。

(2)技术驱动,创新人才培养。依托移动互联、云计算、大数据等新一代

信息技术,将教育技术与教学内容完美融合,打造以学生为中心的智能化、感知

化、泛在化的数据驱动的新型教育形态和教育模式,彻底转变传统理论教学,由

“经验教学”转为“基于任务驱动的教学”。

3.平台建设要求

提供统一的平台管理所有的课程教学资料、讲义、实验指导手册、实验数据

集、实验作业、实验报告书、实验成绩管理、用户管理等。

教师能够上传、下载、更新教学资源和实验资源,发布实验步骤、布置作业

及其评分标准、实验成绩管理等。

学生能够管理自身的个性化资料,包括实验报告、实验结果、以及自己的学

1

习与实验资料,同时允许在线实验操作,定时实验作业考试,查阅教师所上传的

大数据技术实验资料,以及实验资料的上传、移动、更新、删除、交互式编辑、

复制拷贝等操作。

教师、学生采用统一的登录入口进入实验平台,实验管理软件平台对接着后

面的虚拟化管理集群和物理集群对用户透明,支持虚拟机的按需分配,方便快速

地访问实验所需的实验资料和数据集。

实验管理系统封装虚拟机集群管理接口,教师或管理员在虚拟机云管理平台

上创建相应的实验环境,给每组学生分配定额的虚拟机,在虚拟机集群节点上部

署好相应的大数据分析软件,学生根据实验指导书中的步骤可以自主进行实验操

作。

4.平台建设目标

根据职业方向设置不同的课程学习路线,针对每门课程提供教学实验指导手

册、在线视频、资源包、实验示例代码等,让学生学以致用。项目案例提供行业

典型项目及行业数据,项目涉及互联网、运营商、金融、农村电子商务、政府等

领域。通过在线学习、原理验证、实训应用、综合分析及自主设计等多层次的实

验操作,为大数据教学提供一个完整的一体化的实验教学体系。

5.系统建设技术参数要求

数据分析与人工智能应用教研实训平台

序设单

数量技术参数

号备位

实一、实验管理平台系统

验1、系统支持教师用户和学生用户自定义首页默认布局设置。支持一键

1管1套恢复首页默认布局。教师用户首页支持全局模式、教学模式、备课模

理式和考试模式4种内置首页布局模式。

系本次项目提供100个用户使用授权,且支持100个学生(每个学生开

2

统启3个虚拟机)同时上课,届时将做并发测试,需无卡顿正常运行。

如有问题将做废标处理。

2、系统支持自定义排课功能,包含课程信息、上课班级、授课老师、

上课地点、上课时间等信息。

3、系统支持用户在线制作实验环境,满足不同的教学场景需求。支持

Docker容器,支持Linux操作系统,并且支持单机和集群模式,可以自

定义每一个虚机或容器的物理配置。

4、系统支持镜像管理功能,系统内置镜像不少于200个,支持对镜像

自定义标签,支持查询和复用。

5、系统支持对图像分类、目标检测、机器学习所需的数据集进行管理,

支持数据集的导入功能。

6、系统支持内置录屏功能,提供容器、虚机、Jupyter三种录屏环境。

支持对屏幕录像和文档素材进行管理,文档素材支持word、ppt和

excel格式。

7、系统支持实验报告模板管理,内置文档编辑器,支持在线编辑模板。

8、系统支持课程管理功能,包含系统内置课程和教师自建课程。可按

照课程标签快速筛选课程。支持对系统内置课程复用,方便快速创建

课程。

9、系统支持查看课程详情,包括上课时间、该课程累计上课次数、系

统和自建标签以及学习路径和班级信息展示。支持编辑所在院系、所

学专业、所在班级,支持自定义课程名称、课程封面图片。支持课程

发布、学生申请、课程共享功能的一键开关。

10、系统支持课程编辑,需包括课程介绍、课程大纲、课程目录、实

验报告、提问记录、分组记录等模块。支持内置文档编辑工具,支持

本地上传文档。

11、系统支持课程目录编辑。支持对章节内容的编辑,可以添加实验,

添加视频、课件。支持选择实验运行系统;支持从系统导入或自主上

传实验手册、报告模板、视频、课件等素材;支持手动排序功能。

12、系统支持对班级成员进行分组,支持手动和随机分组,可支持组

3

长设置。

13、系统支持学生查看每个实验章节详情,包括本节视频、实验环境

描述等信息,支持查看实验环境的节点数量、配置以及组网情况。支

持查看节点IP地址。

14、系统支持学生在线实验,支持删除实验、保存实验、临时关闭、

共享桌面、上传文件、下载文件、全屏操作、剪切板等8项基本环境

操作功能。学生实验时在未完成当前实验的情况下,不依赖于当前章

节编辑顺序,可随意跳转并完成实验。支持一键重置实验。支持小窗

口播放教学视频。

15、系统支持学生笔记功能,学生可按章节记录课堂笔记,并对自己

的笔记进行管理,支持笔记导出。

16、系统支持在线课堂功能,提供在线电子白板和在线讨论功能。支

持在线录屏、签到、随机提问、实验监控等功能。支持在线同步共享

实验环境界面让学生观看与学习。

17、在线课堂支持在线发起签到功能,支持设置学生签到时间,支持

每个班级的签到记录情况查询,支持手动补签操作。支持以EXCL表格

形式导出相关签到数据。

18、在线课堂支持互动电子白板功能,可支持多种批注工具(图形、

文字、手写等),支持实时批注与多用户实时批注功能。

19、在线课堂支持教学资源播放功能,支持教学视频,PPT教学资源

的同步播放。支持上传外部演示文件(PPT、Word、Excl等多种格式

文件),支持分享外部视频以供学生同步观看。支持在线课程录制,

支持对录制的视频进行查看、下载、以及删除操作。

20、在线课堂支持在线学习的用户设置上课状态,包含离开、举手、

未决定、困惑、悲伤、高兴、鼓掌、点赞、拍砖等,支持在线课堂中

的主持和演示权限设置,可设置其他演示者与主持人权限。

21、在线课堂支持课堂讨论模块,教师用户拥有开放讨论和清空讨论

权限,支持发送内置互动表情。

22、在线课堂支持在线随机点名提问功能,支持对学生回答打分。

4

23、在线课堂支持实验监控功能,支持查询学生在线实验情况,支持

一键提醒学生录屏,支持远程协助功能,可对学生主机进行操作指导。

24、系统支持教师创建六种教学工具:容器演示环境、虚机演示环境、

Jupyter演示环境、图像分类演示环境、目标检测演示环境、机器学

习演示环境。

25、机器学习演示环境支持通过鼠标拖拽算法的方式快速生成机器学

习训练模型,支持查看关键算法代码和算法说明,支持手动调参优化

模型。支持查看模型训练历史版本。系统支持用户查看模型训练样本

的模型评估报告,支持查看当前版本的模型训练的基本属性、机器学

习算法、算法属性。

26、机器学习演示环境支持类型转换、添加序号列、拆分、缺失值填

充、归一化、标准化、随机采样、系统采样、分层采样、去重、两表

连接等11种数据预处理方法;支持特征尺度变换、特征离散、主成分

分析、过滤式选择、随机森林特征等5种特征工程;支持分类算法、

聚类算法、回归算法、关联规则、文本分析等5大类共计17种机器学

习算法。

27、深度学习目标检测演示环境支持用户完成目标检测模型训练,支

持选择不同的数据集进行循环多次训练,支持分配数据集训练、验证

与测试的数据比例;支持设置模型训练参数,包含优化器、模型迭代

次数、Batch-size及学习率;支持设置神经网络框架与算法以及计算

资源环境等参数。支持对模型效果进行测试;支持展示模型应用效果。

28、深度学习目标检测演示环境支持训练监控功能,支持随时读取当

前训练信息与训练任务进度信息,查看训练数据信息,支持以

TensorBoard方式实时监控目标检测训练过程。

29、深度学习目标检测演示环境支持自动生成评估报告,评估报告包

含mAP、mAP@.50I0U>mAP@.75I0U>mAP(small)>mAP(medium))>

mAP(large)等6个mAP值的相关数据,支持以列表方式呈现模型训练

效果。

30、深度学习图像分类演示环境支持配置单点计算模式或分布式计算

5

模式;支持配置深度学习神经网络;支持配置底层计算框架,包含Keras

(vggl6>restnet50>alex>squeezenet、mobilenet>lenet>alexfcn、

xception>inception-vl>vggl9>vggfcn等共计11种);支持CPU、

GPU的单机或集群环境,支持单GPU卡或多GPU卡方式进行计算。

31、深度学习图像分类演示环境需支持随时读取当前训练信息与训练

任务进度信息,支持查看训练数据信息,支持以TensorBoard方式实

时监控图像分类训练过程。支持对模型效果进行测试;支持展示模型

应用效果。

32、深度学习图像分类演示环境需支持自动生成评估报告,评估报告

包含训练集、验证集、测试集的精确率、精准率、召回率、Fl-score

等4个指标的图表结果展示;系统自动计算出topl-top5的准确率;

并展示训练结果的混淆矩阵等指标结果信息。支持呈现模型训练效果。

33、系统支持学员管理,支持查看班级成员、查看课程申请和添加重

修学员,支持学员密码重置。

34、系统支持课堂管理功能。支持查看学生在线或离线情况、实验报

告提交情况,支持通过远程协助进入学生正在试验的环境;支持快照

管理,可查看和删除学生虚机快照。

35、系统支持虚机管理,可查看和关闭学生虚机。提供平台小助手模

块,可随时管理虚机,支持设置平台小助手的透明度。

36、系统支持教师编辑不同课程章节的课堂备注信息,并支持批量删

除及导出。

37、系统支持课件、视频、手册、图片、软件、数据及其他资源的上

传、下载、共享及删除等文件管理功能。支持提供个人网盘功能。

38、系统支持通过仪表盘展示Docker容器虚机资源使用情况,包含

CPU、内存和硬盘的使用比。支持对教师和学生的虚机进行查询、删除

等操作。

39、系统支持用户在保存实验时一键生成快照,支持对所有快照进行

查询、管理、删除等操作。

40、系统支持任务调度功能,支持对正在运行的测试或训练任务进行

6

暂停、终止操作,支持对已完成的任务进行筛选、查看、删除等操作。

41、系统支持在线考试功能,支持自定义系统内所有试题的难度系数

和权重。支持对试题来源、所属科目和试题题型等进行编辑和修改;

支持单选题、多选题、判断题、简答题、填空题及实验题等题型;考

试题支持在线编辑添加和word文件导入添加两种操作方式,系统内置

word试题模板;支持通过图形显示不同题型分配比例和数量统计。(用

户保留测试功能的权利)

42、在线考试支持编辑添加实验题,实验题支持容器、虚机、Jupyter

三种运行环境,支持单机、集群两种环境类别,支持设置主、从节点

的参数。

43、在线考试支持自动组卷和手动组卷两种方式添加试卷。通过对不

同题型所属的试题科目进行题目总数设定,支持自动计算总分数。完

成快速自动组卷。系统支持将任意已发布的试卷自动设为模板,支持

对模板试卷的复用功能。支持试卷以word格式批量导出。

44、在线考试支持查看试卷满分、最高分、最低分、平均分、及格率、

已提交人数等考试信息。支持查看学生的考试时间、答题时长、成绩、

及格状态等数据。支持以excel格式导出学生成绩。支持考试分析功

能,展示错题率统计图和成绩排名图。

45、系统支持自定义学习路径功能,支持对课程的学科分类、学科内

容及学科适用职业进行定位,支持对学习路径新增分类、新增路径小

类、新增岗位。支持学习路径的可视化分析,展示岗位能力达成图、

技术能力分布图、学习路径课程分布图。支持通过课程、班级以及姓

名筛选查看。

46、系统支持教师查看班级的实验报告分析,展示报告满分、最高分、

最低分、平均分和已提交人数等数据,展示整个班级成绩排名图和实

验分析图。支持学生查看个人实验报告分析,展示完成率、提交报告

次数和报告成绩分析图。

47、系统支持人脸表情识别功能。支持dlib库和训练好的人脸特征点

模型,系统内置68模型(s系pe_predictor_68_face」andmarks.dat),

7

支持使用OpenCV对图片进行操作,支持对识别出的人脸标注出特征

点。支持用户从本地上传图片,或使用系统内置图片,或使用摄像头

捕获图片上传至平台,本地上传图片类型支持jpg、png格式。系统通

过计算,以可视化的方式展示当前模型使用效果。

48、系统支持图片风格迁移功能。支持tensorflow实现图像风格迁移,

支持把一张图片的内容和一张图片的风格结合在一起,使内容图片的

风格变成风格图片的风格样式。支持7种风格图片模型,输入一张内

容图片,支持随机输出一张改变风格后的图片。支持用户从本地上传

图片,或使用系统内置图片,或使用摄像头捕获图片上传至平台,本

地上传图片类型支持jpg、png格式。系统通过计算,以可视化的方式

展示当前模型使用效果。

49、系统支持看图说话功能。支持tensorflow实现Google的

image-to-text模型,支持把图像转换成文字。支持根据输入的图片,

把图片内容描述以字符串的形式输出。支持用户从本地上传图片,或

使用系统内置图片,或使用摄像头捕获图片上传至平台,本地上传图

片类型支持jpg、png格式。系统通过计算,以可视化的方式展示当前

模型使用效果。(用户保留测试功能的权利)

50、系统支持Y0L0目标检测功能。支持使用Keras实现Y0L0v3模型

进行目标检测,对于紧凑密集或者高度重叠目标的检测有显著效果。

支持输入多张图片,并对图片中的物体检测标注,然后输出标注好后

的图片。支持用户从本地上传图片,或使用系统内置图片,或使用摄

像头捕获图片上传至平台,本地上传图片类型支持jpg、png格式。系

统通过计算,以可视化的方式展示当前模型使用效果。

51、系统支持识别人体关键点功能。支持使用TensorFlow实现

OpenPose模型,能够识别出人体的骨骼关键点,通过人体的关键点检

测,可以辨别出人体的姿态,通过人体的姿态可在一些场景下做出判

断并提醒。输入图片,然后通过处理,输出标注好人体关键点的图片。

支持用户从本地上传图片,或使用系统内置图片,或使用摄像头捕获

图片上传至平台,本地上传图片类型支持jpg、png格式。系统通过计

8

算,以可视化的方式展示当前模型使用效果。

52、系统支持性别年龄识别功能。支持使用tensorflow实现用于人的

年龄和性别的估算。首先识别出图片中的人脸,然后再通过人脸去识

别人的年龄和性别。通过输入一张有人脸的照片,能够识别出人脸和

人的性别和年龄,并标注在图像上,然后输出标注处理好的图像。支

持用户从本地上传图片,或使用系统内置图片,或使用摄像头捕获图

片上传至平台,本地上传图片类型支持jpg、png格式。系统通过计算,

以可视化的方式展示当前模型使用效果。(用户保留测试功能的权利)

53、系统支持磁盘管理功能,支持自动或手动清理磁盘。

54、系统支持组织管理、班级管理和用户管理。支持对系统账户进行

编辑、重置密码、禁用和删除操作。支持从回收站还原账户。

55、系统支持在线用户管理功能,支持查看系统当前在线用户的会话

编号、姓名、浏览器、操作系统、登录时间、登录IP、登录地点等信

息,支持对系统当前在线用户进行强退及批量强退操作。

56、系统支持登录日志管理功能,支持查看登录用户的姓名、账号、

浏览器、操作系统、登录IP、登录地点、登录状态、错误信息、操作

耗时、登录时间的信息,支持批量删除及导出操作。

57、系统支持操作日志管理功能,支持查看用户操作的姓名、操作模

块、错误信息、操作方法、请求参数、操作IP、操作时间、账号、操

作状态、操作耗时、操作内容、返回参数、操作地点等信息,支持删

除操作。

58、系统支持安全管理功能,支持对当前数据库进行备份,支持按时

间段查询所有备份的数据库信息、、支持备份的恢复与删除。

59、系统支持系统信息设置功能,支持自定义系统名称、技术支持的

名称、系统说明、系统LOGO等信息。支持一键还原初始设置。

60、系统支持添加、导入及批量删除敏感词,支持对已有敏感词状态

进行开启或关闭操作,支持对所选敏感词进行编辑及删除操作。

61、系统支持通知管理功能,支持对系统通知进行查看、撤销及删除

操作。

9

二、云计算管理系统

1、系统采用Docker底层虚拟化技术,对底层算力资源统一管理,池

化计算资源、存储资源、网络资源、软件资源。可实现对资源统一监

控,GPU、CPU统一调度,Pod资源管理,以及容器资源编排等功能。

(用户保留测试功能的权利)

2、系统支持docker管理模块。支持配额调度,支持启动/停止/重启

容器、暂停/恢复容器、删除容器、限制容器对CPU的使用、限制容器

对内存的使用、限制容器对Block10的使用。

3、支持私有DockerRegistry,用户可在本地地搭建私有Docker

Registry0

4、支持基于容器的应用部署、维护和滚动升级。

云5、支持负载均衡和服务发现。

计6、支持认证、授权、访问控制、API注册和发现等机制。

算7、支持维护集群状态,比如故障检测、自动扩展、滚动更新。

2管1套8、支持维护容器的生命周期,支持Volume(CVI)和网络(CNI)管

理理。

系9、支持秒级创建资源:即从用户在页面点击“创建”按钮,到集群资

统源成功创建完成所花费时间不能超过10秒钟。(用户保留测试功能的

权利)

10、系统支持管理模块。支持自定义配置,支持根据业务需求自定义

云主机配置,包括CPU、内存、镜像等。

11、支持创建快照,支持可分别针对系统盘和数据盘创建快照,并通

过快照恢复磁盘数据。

12、支持动态调整配置,无需重启和中断业务,即可调整虚拟机的CPU

和内存。

13、支持热迁移,实现跨主机的热迁移,保证云主机业务不中断。

14、支持加载安全组,支持针对单台戒多台云主机加载安全防护策略,

在入口和出口方向上过行数据包过滤。(用户保留测试功能的权利)

15、支持日志查看,查看云主机运行产生的日志。

10

16、支持WEB控制台,浏览器无需安装任何插件即可操作云主机,即

使云主机网络不通,管理员也可以进行维护。

17、支持分配浮动IP,支持为云主机分配公网IP,实现从公网访问该

云主机。

18、支持资源配额,为项目分配资源,实现资源隔离和限制。

19、支持虚拟机镜像查找及检索系统,支持多种虚拟机镜像格式(AKI、

AMI、ARI、ISO、QCOW2、Raw、VDKVHD、VMDK),支持创建上传镜像、

删除镜像、编辑镜像基本信息的功能。(用户保留测试功能的权利)

20、支持公有镜像和私有镜像两类。私有镜像仅供创建该镜像的用户

使用。也可以转化为公有镜像

22、支持创建网络,用户可以迅速创建属于自己的私有网络,包括虚

拟交换机、虚拟路由器、防火墙及分配私有/共有IP等。

23、支持网络拓扑,支持Linuxbridge等网络插件,支持flat、v2an、

gre、vxlan等网络拓扑结构。

24、支持自定义防火墙,云平台默认default策略禁止从外部访问云

主机,用户可在此策略的基础上,修改云主机在入口方向或出口方向

所允许和禁止的访问端口,也可自定义防火墙策略并绑定至云主机,

实现应用层访问的控制。

25、支持密钥对,用户可在云平台上生出密钥并将私钥下载到用户本

地,在创建云主机时选择对应的密钥对名称即可实现通过密钥方式登

录云主机,此功能保证云主机被访问的高度可控性。(用户保留测试

功能的权利)

25、支持操作日志,云平台记录用户在此平台的所有操作日志,提供

按条件的查询和导出功能。

26、支持身份认证,支持身份验证、安全策略管理和目录服务的功能。

27、支持监控集群整体资源使用情况,包括:cpu利用率,内存利用

率,硬盘利用率。

28、支持监控每一个项目(租户)的资源使用情况,包括:项目的CPU

利用率,项目内存利用率,项目的硬盘利用率,项目的浮动IP使用,

11

项目的安全组使用等。

29、支持监控系统服务运行状态,包括:计算服务,网络服务,块存

储服务,编排服务等。

30、支持监控所有计算节点虚拟机运行状态,数量等。

31、需与实验管理系统统一平台管理,界面无感切换,数据交换无缝

连接。

三、镜像仓库管理系统

1、基于角色的访问控制:用户和存储的镜像通过“项目”进行组织,

用户可以对项目下的docker镜像拥有不同的访问权限。(用户保留测

试功能的权利)

2、基于策略的复制:可以使用带有多个筛选器(存储仓库,标记和标

签)的策略在Harbor镜像仓库之间复制(同步)docker镜像。不论

遇到什么错误,Harbor都会自动重试复制。该功能非常适合负载均衡,

高可用,多数据中心,混合云和多云等场景。(用户保留测试功能的

权利)

3、支持LDAP/AD:Harbor支持与企业现有的LDAP/AD服务进行集成,

以进行用户身份验证和管理,并支持将LDAP中的组导入Harbor并为

31套其分配适当的项目角色。

4、支持项目级别的磁盘配额,可以设置每一个项目中的镜像个数和占

用磁盘空间。

5、镜像删除和垃圾数据收集:Harbor支持删除仓库中的docker镜像,

并回收硬盘空间。

6、图形化门户:用户可以轻松使用浏览器,搜索镜像仓库和管理项目。

7、审计:支持跟踪harbor镜像仓库的所有操作。

9、RESTfulAPI:harbor提供适用于大多数管理操作的RESTfulAPI,

易于与外部系统集成。通过嵌入式SwaggerUI提供可用于功能探索和

测试的API。

10、保存云计算管理系统所需的docker镜像:云计算管理系统提供教

学用的实验环境。构成云计算管理系统的系统镜像由harbor存储。(用

12

户保留测试功能的权利)

11.提供多用户管理:harbor支持为不同的教师创建独立账号。可使

不同的教师分别管理各自的镜像。

12、公开项目和私有项目:harbor基于项目管理镜像。教师在创建项

目时可以选择是否公开。公开项目中的镜像所有人都可以拉取,私有

项目中的镜像只有所有者可以拉取。

12、服务课工场:大数据实验管理平台系统的课工场功能允许教师自

定义docker镜像。harbor负责存储教师自定义的docker镜像。

13、镜像管理功能:要求能显示镜像列表、要求能显示镜像构建历史、

能从容器创建新镜像、要求能够从Dockerfile构建镜像、从registry

下载镜像、能将镜像上传到registry、要求能够删除Dockerhost中

的镜像、支持使用Dockerfile构建镜像。(用户保留测试功能的权利)

14、需与实验管理系统统一平台管理,界面无感切换,数据交换无缝

连接…

1)基础实验课:大数据开发技术(Hadoop)

课程内容资源需包含不少于17个实验手册和17个教学视频,教学视

频总时长不少于600分钟。每个实验手册有对应的操作讲解视频。所

有实验需提供集群实验为一主两从真分布式环境。课程提供实验内容

需包含【Hadoop安装部署、Hadoop常用命令、HDFS:lOUti1s方式读

取文件、URL方式读取文件、文件创建与写入、文件内容追加、文件

元数据获取、MapReduce编程:单词计数、数据过滤及保存、检索特定

41套群体搜索记录、UID去重、自定义计数器、Map端join、自定义Split

大小、Map端本地聚合、自定义分区、检索特定偏好用户】

2)基础实验课:分布式数据仓库(Hive)

课程内容资源需包含不少于27个实验手册和27个教学视频,教学视

频总时长不少于500分钟。每个实验手册有对应的操作讲解视频。所

有实验需提供集群实验为一主两从真分布式环境。课程提供实验内容

需包含【Hive数仓:元数据库MySQL安装、安装部署、导入集合类型

数据、创建删除数据库表、导入导出表数据、操作分区表、使用桶表、

13

修改表分区列、使用distributeby查询数据、使用clusterby查询

数据、使用UNIONALL合并表数据、使用JOIN联接查询、创建数据视

图、创建数据索引、自定义函数UDF、自定义函数UDTF、自定义函数

UDAF、分析车辆销售数据、分析搜狗搜索日志、ETL工具:Sqoop安装

部署、导入MySQL数据至HDFS、导出Hive数据至MySQL、调度引擎:

编译安装Azkaban、简易操作Azkaban、Azkaban脚本调度、Azkaban

调度搜狗日志分析任务、Azkaban调度微博数据分析任务】

3)数据库技术(NoSQL)课程资源包含不少于81个教学视频和23个实

验手册等教学内容,视频总时长1000分钟以上。每个实验手册有对应

的操作讲解视频。所有实验需提供集群实验为一主两从真分布式环境。

课程提供实验内容包含(Zookeeper分布式协调框架:Zookeeper安装

部署、Zookeeper编程、Kafka消息订阅系统:Kakfa安装部署、Kakfa

编程、HBase数据库:HBase安装部署、WEBUI界面、HBase表设计、

HBase客户端配置、HBase表操作、HBase比较过滤器、HBase列族过

滤器、HBase行键过滤器、HBase单列排除过滤器、HBase分页过滤器、

读取HBase表数据、存储数据至HBase表、HBase计数器、HBase协处

理器、Storm实时流计算框架:ETL导入数据、Storm安装部署、Storm

词频统计、Storm文本追加、Storm数据入库。】

4)消息发布订阅系统(Kafka)课程资源包含不少于11个实验手册

等教学内容。所有实验需提供集群实验为一主两从真分布式环境。课

程提供实验内容包含【Kafka消息订阅系统:Kafka安装部署、基本命

令、KafkaTopic,Kakfa生产者和消费者、Kafka编程、集成Flume、

结构化数据的发送与接收、非结构化数据的发送与接收、Spark消费

Kafka、编程实现Kafka集成Flume、KafkaOffsetMonitor安装与使用。]

5)Scala编程课程资源包含不少于36个教学视频和12个实验手册等

教学内容,视频总时长400分钟以上。课程提供实验内容包含【Scala

安装部署、Scala控制结构与函数、Scala数组、Scala元组与映射、

Scala类与对象、Scala包的导入、Scala类的继承、Scala文件操作

与类层级结构、Scala特质、Scalal匿名类与高阶函数、Scala样例

14

类与模式匹配、Scala隐式转换与隐式参数。】

6)大数据处理技术(Spark)-基础

课程资源包含不少于39个教学视频和13个实验手册等教学内容,视

频总时长400分钟以上。每个实验手册有对应的操作讲解视频。所有

实验需提供集群实验为一主两从真分布式环境。课程提供实验内容包

含【Spark安装部署:Standalone模式、OnYarn模式、Spark编程工

具:使用IDEA、SparkCore:Scala单词计数、Java单词计数、Spark

SQL:命令方式、普通样例类编程、领域API编程、SparkStreaming:

实时计算网络数据、实时计算HDFS数据、实时计算Flume数据、实时

计算Kafka数据、存储实时计算结果至HBase】。

7)大数据处理技术(Spark)-中级

课程资源包含不少于13个实验手册等教学内容。课程提供实验内容包

含【RDD编程、Scala编程、词频统计、Apache日志分析、SparkSQL

编程、实时词频统计、SparkMLlib编程、SparkGraphX编程、Spark

IndexedRDD编程、SparkR安装部署与编程、Alluxio安装部署与使用、

SparkKeystoneML编程、SparkBlinkDB编程】。

8)大数据处理技术(Spark)-高级

课程资源包含不少于5个实验手册等教学内容。课程提供实验内容包

含【分析日志流、分析Uber数据、分析犯罪数据、分析电商产品关注

度、分析流量日志。】

9)基础实验课:Python编程

课程资源包含不少于12个教学视频和12个实验手册等教学内容,视

频总时长200分钟以上。每个实验手册有对应的操作讲解视频。课程

提供实验内容包含【Python入门、变量与数据类型、运算符与表达式、

数据结构、使用字符串、控制结构、循环结构、类与对象、使用函数、

异常处理、操作文件、使用模块】

10)数据分析与挖掘

课程资源包含不少于7个教学视频和7个实验手册等教学内容,视频

总时长400分钟以上。每个实验手册有对应的操作讲解视频。课程提

15

供实验内容包含【Numpy介绍与使用、Pandas介绍与使用、数据绘图

可视化、数据预处理、数据分类与预测、数据聚类分析、时序数据分

析处理。】

11)大数据可视化技术

课程资源包含不少于14个教学视频和14个实验手册等教学内容,视

频总时长600分钟以上。每个实验手册有对应的操作讲解视频。课程

提供实验内容包含【Superset安装部署、Superset数据可视化、

Zeppelin安装部署与数据可视化、Anaconda可视化、Matplotlib可

视化、k-NearestNeighbor可视化、LinearRegression可视化、

SupportVectorMachine可视化、DecisionTree可视化、Random

Forest可视化、模型优化、Pandas可视化、数据降维可视化、Cluster

Analysis可视化。】

12)基础实验课:Docker平台应用

课程资源包含不少于23个教学视频和23个实验手册等教学内容,视

频总时长400分钟以上。课程提供实验内容包含【安装docker服务、

使用Dockerfile构建镜像、调试Dockerfile以及镜像命名、使用

dockercommit构建新镜像、使用公共Registry、搭建本地Registry、

搭建企业级docker仓库、运行容器和进入容器、docker容器的常用

操作、限制docker容器的内存、限制docker容器使用CPU、限制docker

容器的Block10、docker的原生网络、自定义docker容器网络、容

器之间和容器与外部的通信、docker存储bindmount、使用docker

managedvolume、容器之间共享数据、docker常用监控命令、使用weave

网路、使用WeaveScope容器地图、使用rancher搭建k8s集群、部

署Graylog日志系统】

13)基础实验课:Linux基础

课程资源包含9个实验手册等教学内容。课程提供实验内容包含

【Linux命令基础练习、Linux用户和权限管理、Linux软件包安装、

启动流程和服务管理、进程管理和计划任务、Linux系统监控和日志

管理、Apache服务、使用ssh远程管理Linux、mysql数据库管理】

16

14)基础实验课:java程序设计

课程资源包含不少于10个实验手册等教学内容。课程提供实验内容包

含【Java编程:JDK安装与配置、Java编程:人机猜拳游戏、Java编

程:设计编写宠物乐园程序、Java编程:设计投票程序、Java编程:

模拟银行取款业务、Java编程:实现用户的增删改查、Java编程:设

计图形化计算器、Java编程:读取文件目录、Java编程:模拟售票系

统、Java编程:简易聊天室】

15)基础实验课:数据统计建模与挖掘

课程资源包含不少于6个实验手册等教学内容。课程提供实验内容包

含【数据统计与建模:统计推断基础、数据统计与建模:统计分布、

数据统计与建模:假设检验、数据统计与建模:多变量线性回归、数

据统计与建模:广义线性模型、数据挖掘:数据关联分析】

16)基础实验课:数据库应用

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

含【数据准备操作、操作实验(一)、操作实验(二)、Python编程操作

RDB、Redis基本操作和实践、python访问Redis实现基本增删改查、

RDB与RDB+Redis架构SQL查询对比、RDB编程操作数据库业务移植到

RDB+Redis、学习并实践Phoenix+HBase安装部署、HBase原生查询实

践、程序读取数据插入HBase实践、Phoenix+HBase查询实践、学习

并实践GeoMesa+HBase部署、对比了解阿里云GeoGanos和GeoMesa、

GeoMesa时空数据操作、基于Java的编程操作GeoMesa、使用时空索

引和未使用索引的性能差异】

17)基础实验课:Mysql数据库

课程资源包含不少于10个实验手册等教学内容。课程提供实验内容包

含[MySql安装部署、数据库创建与管理、数据表创建与管理、数据

更新和数据查询、SQL编程基础、视图和索引、存储过程、触发器、

MySql用户管理与权限操作、MySql用户管理与权限操作】

18)基础实验课:数据分析技术(SPSS)

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

17

含【SPSS安装、SPSS窗口介绍、SPSS数据文件的建立、SPSS-单因素

方差分析、SPSS-多因素方差分析、SPSS-线性回归分析、SPSS-非线性

回归分析、SPSS-Logistic回归分析、SPSS-因子分析、SPSS-主成分

分析、SPSS-K-均值聚类分析、SPSS-分层聚类分析、SPSS-判别分析、

SPSS-信度分析、SPSS-尺度分析、SPSS-时间序列分析】

19)基础实验课:数据挖掘-典型算法

课程资源包含不少于13个实验手册等教学内容。课程提供实验内容包

含【Anaconda及PyCharm的安装与配置、使用sklearn进行数据预处

理基础梳理、利用apriori算法发现毒蘑菇近似特征、使用fpGrowth

算法发现购物关联、基于SVM分析UCI银行营销数据集、逻辑回归

LogistcalRegression分析莺尾花数据集、基于贝叶斯算法的莺尾花

数据分类、用LSTM实现股票预测、使用DBSCAN对红酒类型聚类、使

用K均值对UCIwine数据集进行分析、基于SK-learnLabel

Propagation的半监督算法实现、文本特征词的提取、word2vec及

doc2vec的训练及使用】(用户保留测试功能的权利)

20)基础实验课:机器学习-基础

课程资源包含不少于11个教学视频和11个实验手册等教学内容,视

频总时长300分钟以上。每个实验手册有对应的操作讲解视频。课程

提供实验内容包含【线性回归、逻辑回归、最大期望算法、主题模型、

聚类算法、支持向量机、决策树与随机森林、隐马尔科夫模型、Mahout

安装部署、Mahout聚类算法、Mahout分类算法】

21)基础实验课:机器学习-中级

课程资源包含不少于11个教学视频,视频总时长600分钟以上、不少

于11个实验手册等教学内容。每个实验手册有对应的操作讲解视频。

课程提供实验内容包含【动物图片识别、手写数字识别、SparkMLlib

库介绍与使用、莺尾花分类、棋类游戏、提取文章摘要、监督学习、

非监督学习、非监督学习自编码、气象数据分析、足球比赛聚类分析】

22)基础实验课:机器学习-高级

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

18

含【安装配置pycharm与anaconda、基于线性回归预测糖尿病、使用

决策树预测隐形眼镜类型、使用决策树对银行贷款进行建模、利用神

经网实现MINST手写数字识别、用CNN实现MNIST手写数字识别、使

用SVM实现手写数字识别、基于SVM分析Kaggle泰坦尼克数据集、使

用朴素贝叶斯分类器从个人广告中获取区域倾向、使用朴素贝叶斯对

莺尾花数据进行分类、在病马死亡数据集上运用AdaBoost、DBSCAN聚

类算法实践、使用K均值对莺尾花数据集进行分析、利用PCA分析莺

尾花数据、基于SVD构建餐馆菜肴推荐系统、用HMM求解最可能的天

气】(用户保留测试功能的权利)

23)基础实验课:深度学习-算法基础

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

含【安装配置pycharmanaconda、数据拟合与广义线性回归、SM0算法

求解SVM、构建BP神经网络、从零开始搭建神经网络、使用Tensorflow

实现Dropout、梯度下降优化神经网络1、梯度下降优化神经网络2、

Tensorflow神经网络优化策略、Mnist手写数据集识别、RNN实现二

进制加法、彩票预测1、彩票预测2、PCA主成分分析、基于马尔科夫

随机场的图像去噪方法、AutoEncoder自编码器】

24)基础实验课:深度学习-主流框架

课程资源包含不少于8个实验手册等教学内容。课程提供实验内容包

含【DeepLearning初窥:Theano简单应用、DeepLearning初窥:

TensorFlow简单应用、DeepLearning初窥:Keras识别手写字体、

DeepLearning初窥:Keras与Seikit-Learn混合编程、DeepLearning

初窥:KerasCNN图片分类、DeepLearning初窥:KerasLSTM影评

分类、DeepLearning初窥:Caffe手写数字识别、DeepLearning初

窥:CaffecifarlO图片分类】(用户保留测试功能的权利)

案例课:深度学习-典型实例

课程资源包含不少于8个实验手册等教学内容。课程提供实验内容包

含【DeepLearning实践:Python实现深度神经网络、DeepLearning

实践:CaffeCNN实现图片分类、DeepLearning实践:CNN实现图片

19

风格迁移、DeepLearning实践:自联想存储器的python实现、Deep

Learning实践:BP神经网络手写识别、DeepLearning实践:无监督

学习的自编码器实现、DeepLearning实践:自编码器进行人脸数据

降维、DeepLearning实践:有监督学习人脸识别】

25)基础实验课:AI-算法基础

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

含【安装配置pycharm与anaconda、prolog环境搭建、梵塔问题、农

夫过河问题、利用A-star算法寻路、二叉树遍历、搜索两点之间路径、

初识prolog、prolog家族关系判断、衣服搭配专家系统、Mycin专家

系统、在玩具数据集中比较不同的聚类算法、高斯混合模型、DBSCAN

聚类算法、jieba分词库使用、最大匹配算法】(用户保留测试功能

的权利)

26)案例课:数据挖掘-案例课

课程资源包含6个实验手册等教学内容。课程提供实验内容包含

[20newsgroup分类分析、KMeans聚类乳腺癌数据集分析、LDA主题

发现演练分析、服装数据集分析、使用K均值分析天平数据集、使用

决策树对三好学生评选进行建模】

27)案例课:机器学习-案例课

课程资源包含不少于6个实验手册等教学内容。课程提供实验内容包

含【机器学习-收入数据集分析、机器学习-房价预测案例建模、机器

学习-人脸识别数据集分析、机器学习-使用DBSCAN进行聚类、机器学

习-新闻分类、机器学习-用LSTM实现MNIST手写数字识别】

28)基础实验课:深度学习-案例课

课程资源包含不少于6个实验手册等教学内容。课程提供实验内容包

含【深度学习-SVM分类Iris数据集、深度学习一句子分类训练1、深

度学习一句子分类训练2、深度学习-蒙特卡罗方法计算圆周率、深度

学习-深度学习模型实用技巧、深度学习-约会网站配对效果判定】

29)基础实验课:数据分析与挖掘案例

课程资源包含不少于6个实验手册等教学内容。课程提供实验内容包

20

含【自动问答系统、消费指数预测、流失情况预测、热点话题发现、

fashion分类、语音处理】

30)课程资源包含不少于9个实验手册等教学内容。课程提供实验内

容包含【创建和操作Tensor、梯度下降和自动求梯度、深度学习基础、

Pytorch开发技巧、卷积神经网络、循环神经网络、算法优化、计算

机视觉、自然语言处理]

31)案例课:AI-案例课

32)基础实验课:计算机视觉

33)基础实验课:NLP自然语言处理

课程资源包含不少于16个实验手册等教学内容。课程提供实验内容包

含【NLP-相似度模型实验、WordCloud制作词云实验、NLTK工具包使

用、中文短文本分类实验、中文短文本聚类实验、word2Vec影评数据

分析、SVM分类垃圾短信、简易聊天机器人、基于TensorFlow的DeepQA

聊天机器人实验、LSTM情感分析实验、基于LSTM轻松生成各种古诗、

CNN与RNN中文文本分类-基于TENSORFLOW实现、利用Istm生成特定

作家小说、中英文翻译系统实验、语音识别实验、基于文本的个性化

推荐系统】(用户保留测试功能的权利)

34)课程资源包含不少于15个实验手册等教学内容。课程提供实验内

容包含【Kettle的安装与运行、Python环境的安装和运行、Python

导入数据并处理缺失值、异常数据、运用Kettle合并多源数据、运用

Kettle处理缺失数据和异常数据、用Python生成与读取CSV文件、

用Python读取与转换JS0N文件、将XML文件转换为JSON文件、使用

Kettle抽取本地XML文件、将JS0N文件转换为CSV文件、使用Kettle

抽取CSV数据并输出为文本、在Kettle中用正则表达式清洗数据、使

用Kettle过滤数据表、使用Kettle生成随机数并相加、清洗员工信

息、清洗在消费数据】

35)、基础实验课:PyTorch基础编程

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【环境部署、

21

Tensor基本用法、张量的科学计算、梯度和优化、线性回归和逻辑回

归、数据集加载和处理、可视化实现方法、单层神经网络实现iris数

据集分类、深度神经网络实现、卷积神经网络实现】

36)基础实验课:PyTorch图像分类与识别

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【CentOS实验

环境概览、CentOS7.9编程开发环境配置、Anaconda的安装部署、

Python开发环境部署、PyTorch等扩展库的安装及使用、基于AlexNet

网络的复杂样本多分类图像识别、编程实现VGGNet并以生物图像为例

解决二分类问题、基于GoogLeNet网络实现特定物体图像的识别应用、

构建ResNet网络进行室内外场景的自动识别、DenseNet编程及档案

照片分类识别实践应用】

37)基础实验课:PyTorch目标检测

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【CentOS命令

操作、Linux编程开发环境介绍、Anaconda的安装部署、Python集成

开发环境的安装及使用、PyTorch等扩展库的安装及张量的生成、图

像的矩阵化表示、图像读取与图像像素格式转换、OpenCV对视频文件

的操作、目标检测案例解析、基于CenterNet网络进行图像目标检测】

(用户保留测试功能的权利)

38)基础实验课:PyTorch目标分割

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【Linux实验环

境概览、Linux编程开发环境、Anaconda的安装部署、Python集成开

发环境、图像处理扩展库的安装、数字图像的计算机表示、VGG网络

模型编程及数据集图像目标辨识、设计实现ResNet模型进行目标分割

图像判别、基于FCN预训练模型进行图像的多目标分割、基于PyTorch

构建自己的目标分割网络并进行应用分析】

39)基础实验课:PyTorch目标跟踪

22

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【CentOS命令

操作基础、Linux编程开发环境介绍、Anaconda的安装部署、Python

程序开发IDE的安装及使用、PyTorch及OpenCV等图像处理扩展库的

安装、图像的矩阵化表示、图像读取与图像像素格式转换、OpenCV对

视频文件的操作、使用全卷积神经网络实现视频序列跟踪目标的精确

提取、构建SiameseFC网络实现视频目标跟踪】

40)基础实验课:PyTorch图像描述

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【CentOS命令

操作基础、Linux编程开发环境介绍、集成开发环境的安装部署、Pylhon

程序开发IDE的安装及使用、Python程序开发IDE的安装及使用、图

像的矩阵化表示、图像读取与图像像素格式转换、图像描述中语义分

割网络的设计与实现、编程实现基于LSTM网络的描述语句生成、图像

描述综合实例编程应用】

41)基础实验课:PyTorch图像超分辨率重建

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【Linux命令操

作基础、Linux实验环境部署、Conda的安装部署、Python集成开发

环境、图像处理扩展库的安装及使用、数字图像的矩阵化表示、图像

读取与图像像素格式转换、基于PyTorch的卷积神经网络编程实现、

图像超分辨率重建与深度残差网络、SRResNet算法及图像超分重建编

程实现】(用户保留测试功能的权利)

42)基础实验课:PyTorch图像生成

课程资源包含不少于10个教学视频,视频总时长60分钟以上、不少

于10个实验手册等教学内容。课程提供实验内容包含【CentOS命令

操作基础、Linux编程开发环境介绍、Anaconda的安装部署、Pylhon

程序开发IDE的安装及使用、PyTorch等扩展库的安装及张量的生成、

Pillow图像处理标准库的使用、PyTorch神经网络工具箱、基于反卷

23

积原理搭建最小均方误差图像生成网络模型、手写数字图像的生成器-

识别器网络模型编程实现、PyTorch神经网络工具箱】(用户保留测

试功能的权利)

44)情绪分析(实战案例)

项目通过工单历史数据和专席通话记录数据对用户情绪进行统计分

析,预防高危用户流失,降低投诉次数,提高用户体验。项目提供数

据、提供《实验手册》和《系统安装部署文档》、提供项目源代码及

代码注释。系统需至少提供以下功能模块:【1)申告量统计分析;2)

处理量统计分析;3)回单量统计分析;4)回单率统计分析;5)重障

量统计分析;6)重障率统计分析;7)及时量统计分析;8)及时率统

计分析;9)成功率统计分析;10)用户等级多维度统计分析。】

45)行业案例课:Fashion分类识别

项目通过对图像做出各种处理、分析,最终识别我们所要研究的目标。

项目提供实际数据、提供《实验手册》和《系统安装部署文档》、提

供项目源代码及代码注释。系统需至少提供以下功能模块:【数据预

处理、拆分训练集和测试集、数据建模、模型评估、模型优化、模型

应用】

46)搜索引擎构建(实战案例)

项目在线爬取互联网数据,通过对数据处理、建立索引等操作实现简

易的搜索引擎系统。项目实验数据为现场爬取,提供的测试数据约为

10M,全量数据约为10G。项目提供《实验手册》和《系统安装部署文

档》、提供项目源代码及代码注释。系统至少提供以下功能模块:[1)

在线互联网数据爬取、解析、处理;2)利用中文分词技术,建立数据

索引;3)基于HBase数据库和数据分词表构建简易搜索引擎;4)利

用简易搜索引擎系统完成对数据的搜索和查看。】

47)需与实验管理系统统一平台管理,界面无感切换,数据交换无缝

连接。

成熟产品、不接受后期定制开发。

51套

验1)行业案例课:顾客流失情况预测

24

管项目通过采用数据挖掘中的一些技术,首先对实验数据进行预处理,

理然后进行特征处理,并把数据拆分成训练集和测试集,建立决策树模

案型并拟合,最后模型优化和模型优劣判断。对客户流失数据进行分析,

例发现不同变量对用户流失的影响程度,进而建立客户流失预测模型,

课利用该模型,发现预测流失群体,预测流失趋势,进而制定有效的控

程制策略,最大限度地降低客户流失率。项目提供实际数据、提供《实

包验手册》和《系统安装部署文档》

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论