学院大数据教学平台及教学实战案例建设需求_第1页
学院大数据教学平台及教学实战案例建设需求_第2页
学院大数据教学平台及教学实战案例建设需求_第3页
学院大数据教学平台及教学实战案例建设需求_第4页
学院大数据教学平台及教学实战案例建设需求_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学院大数据教学平台及教学实战案例建设需求一、货物需求一览表序号货物设备名称单位数量备注1云计算资源管理平台套1网络版2大数据与人工智能实训管理平台套1网络版3Python编程实训平台套1网络版4大数据开发实训平台套1网络版5Python数据挖掘建模平台套1网络版6数据采集平台套1网络版7数据可视化平台套1网络版8基于评论数据推荐店铺食品实战案例套1网络版9基于食品综合数据分析客户喜爱度实战案例套1网络版10食品安全问题统计分析实战案例套1网络版11食品评论数据舆情分析实战案例套1网络版12食品生产情况分析实战案例套1网络版13食品营养信息数据分析实战案例套1网络版14自热食品营销分析实战案例套1网络版15不同类型谷物营养成分分析实战案例套1网络版16星巴克菜单营养成分分析实战案例套1网络版17世界各地食品成分探索分析实战案例套1网络版18儿童营养不良数据分析实战案例套1网络版19饮用水源营养状态等级分析实战案例套1网络版20宫颈癌危险因素分析实战案例实战案例套1网络版21乳腺癌数据分析与自动诊断实战案例套1网络版22基于药物成分和疗效的药品推荐实战案例套1网络版23空气污染致死因素分析实战案例套1网络版24健身实践调查数据分析实战案例套1网络版25常见疾病医疗对话数据分析实战案例套1网络版26餐饮大数据教学实训沙盘套127容器平台管理节点台328应用平台管理节点台129综合机柜台130机架式KVM切换器台131管理交换机台132应用交换机台233工作站电脑台7134音响系统套135多媒体讲台+教师椅套136双人桌子+电脑椅套3537综合布线系统套138系统集成服务批1二、设备技术参数表序号设备名称技术指标要求1云计算资源管理平台一、技术架构:1、平台基于高可用架构实现。具备标准性、轻量性、稳定性及安全性。2、平台各功能组件支持离线部署。支持在离线环境中进行平台部署及更新,支持使用离线部署包从低版本升级至高版本。3、平台不限制部署环境。兼容主流硬件厂商的x86/arm架构服务器,支持在裸金属平台、虚拟化平台、超融合平台、公/私有云平台中部署;支持在已有服务器或网络设备上利旧部署。4、平台支持最小3节点模式部署。各节点具备完整功能及高可用特性;即各个计算节点即是管理节点,又是计算、存储节点;计划内、外的单一节点故障不影响平台管理、用户业务的正常运行。5、平台支持OEM定制。支持按需修改Logo、平台名称等。二、集群管理:1、平台提供多节点高可用集群。提供最小3节点高可用集群,避免单点故障。2、平台支持按需创建命名空间。用户可根据业务需求创建多个命名空间,以实现工作空间隔离。3、平台支持对节点进行标签(Label)标注。通过配置节点标签,可将容器组(Pod)调度至指定节点(Node)运行。4、平台支持多种方式部署应用。支持通过标准镜像创部署应用;支持通过自定义yaml文件部署应用;支持应用秒级发布、更新、回滚;支持滚动更新、回滚应用,不中断业务运行;支持deployment、statefulset、daemonset、cronjob、job方式部署。5、平台提供服务(service)管理功能。支持为应用创建服务对象,应用间可使用服务名+端口访问,可避免服务重启、扩容、缩容后IP变更影响访问。6、平台提供容器组(Pods)管理功能。支持调整容器组副本数、异常自动恢复、查看容器组状态/日志;支持容器组快速迁移。7、平台提供存储卷(PersistentVolumeClaim)管理功能。支持创建持久化存储卷;支持创建单节点读写、多节点读写存储卷。8、平台提供配置字典(ConfigMap)管理功能。支持通过键值对方式存储非敏感数据;支持为应用创建配置文件。9、平台提供密文(Secret)管理功能。支持储存敏感对象(密码、令牌、密钥等);支持在不易暴露的状态下为应用提供敏感对象信息。10、平台提供容器健康检查功能。支持livenessProbe、readinessProbe、startupProbe类型探针。11、平台提供资源配额(ResourceQuota)功能。支持通过yaml文件为命名空间(Namespace)配置资源限制;支持限制可使用计算资源量(CPU、内存、GPU)、可使用存储卷总量、可创建资源对象数量(应用部署、存储卷、服务、配置字典、密文等)。12、平台提供权限管理功能。支持基于RBAC策略控制用户和应用对平台内各项资源的操作权限。13、平台提供GPU切片功能。支持多种应用场景:(1)支持为应用分配GPU切片,分配单位为单张GPU卡计算资源量的10%。(2)支持多个应用分配同一张GPU卡计算资源。(3)支持单个应用分配多张GPU卡计算资源。三、应用管理:1、 平台提供流量管理功能。支持控制服务间的流量和API调用:(1)支持按服务配置熔断器、超时和重试规则。(2)支持对应用新旧版本配置A/B测试、灰度测试、按比例切分灰度发布。四、仓库管理:1、 平台提供镜像管理功能。支持存储、管理Docker容器镜像;支持命令行上传Docker镜像。2、平台提供Chart包管理功能。支持存储、管理HelmChart包;支持通过Web页面、命令行方式上传Chart包。3、平台提供仓库日志查看功能。支持查看仓库相关操作日志记录。4、平台提供仓库同步功能。支持在不同仓库之间同步容器镜像、Chart包;支持设置同步规则;支持设置定时同步。五、应用市场:1、平台提供应用市场功能。支持展示基于HelmChart的集群应用;提供常见应用(如:Nginx、zookeeper、grafana、kafka、Jenkins、Gitlab)。2、平台提供从应用市场部署应用功能。支持在应用市场中一键将应用部署至集群环境;支持部署时修改应用配置。六、监控管理:1、平台提供资源监控功能。支持多种方式查看资源使用情况:(1) 支持查看集群整体资源使用情况,例如:CPU使用率、内存使用率、网络流量。(2) 支持查看存储资源使用情况,例如:存储使用率、IOPS。(3) 支持查看集群内资源使用情况,例如:deployment、statefulset、pod资源的cpu使用率、内存使用率。(4) 支持查看集群各节点资源使用情况,例如:CPU使用率、内存使用率、磁盘IO使用率。(5) 支持查看集群组件(ControllerManager、Kubelet、Scheduler、etcd)资源使用情况。七、备份与迁移:1、平台提供备份还原功能。支持对集群资源(命名空间、deployment、pod、数据卷等)进行备份、还原;支持手动备份、还原;支持定时备份。2、平台提供数据迁移功能。支持通过备份还原方式将集群资源(命名空间、deployment、pod、数据卷等)迁移至其它集群。2大数据与人工智能实训管理平台一、基础模块:1.平台使用B/S架构进行设计,通过浏览器即可访问系统。2.平台提供管理员、教师、助教、学生四种角色。管理员支持系统配置维护、镜像环境维护、课程管理、资源管理等功能;教师支持课程创建和维护、教学实训等功能;学生支持根据教师设置的课程及资源进行在线学习及实训。3.平台提供首页功能,进入首页后可展示所有课程分类和课程,支持一键进入课程进行在线学习及实训。首页支持显示轮播图,管理员可根据需要设置轮播图。4.支持用户根据关键词搜索课程,并一键进入课程详情进行在线学习及实训。5.支持在线教学、实训、作业、考试、资源维护等业务场景。二、课程及资源模块:1.支持课程分类管理,用户可创建及管理课程类别,并设置其他用户对课程类别的管理权限。2.支持通过复制课程模板或创建空白课程的方式创建课程,并设置课程名称、课程类别、课程显示情况、课程开始和结束时间、课程封面等基本信息。3.支持编辑课程详情,包括课程介绍、课程资源、实训训练、实训作业及课程考试等。4.支持对课程资源进行管理,用户可通过本地上传或引用平台资源库的资源构建课程,资源类型包括课程视频、PDF课件、PPT课件、实训指导书、课程代码及课程数据等。5.支持统计及显示课程资源总数,用户可根据自己的需要将课程资源自由排序。6.支持添加、删除和隐藏课程扩展资源,资源类型包括网页、网页地址、文件、文件夹、压缩包;支持扩展资源选用,可选用本地上传资源或者引用资源中心的个人工具库资源。7.支持对课程资源细粒度的控制管理,包括编辑资源名称、资源描述,显示或隐藏资源设置。支持设置资源的访问权限,用户可在达到指定权限要求之后访问课程资源,限制条件包括访问日期、成绩、小组及添加嵌套条件等。8.支持管理课程成员、学习小组和选课方式。教师可添加班级或单个学生为课程成员,并设置课程成员的访问权限和选课期限,课程权限类型包括教师、助教及学生,同时可设置用户选课期限。9.支持在课程成员中划分学习小组。分组方式包括自动分组及单一小组模式,支持设置小组组长及成员。10.支持设置课程选课方式,包括人工选课、访客模式及学生自助选课模式,访客模式可设置访问密码。11.课程支持创建在线聊天室及讨论区。教师和学生可在聊天室内实时进行聊天,针对性解决问题。教师可在讨论区内发布讨论话题,引导学生参与讨论。支持学生订阅讨论话题,并在帖子中进行发言。12.支持设置课程为模板,一键复制模板中的课程介绍、教学资源、实训训练、实训作业、课程考试、学习交流和扩展资源模块内容,快速创建一门新课,方便教师之间共享课程资源。13.提供课程单个及批量备份还原功能,支持对平台课程一键备份并设置备份数据内容(如课程资源、用户学习进度细节、题库、评论及成绩等);支持将备份课程还原为新课程或还原到指定课程。14.提供学情概览功能,教师可查看班级整体学习情况,包含班级学习活跃度、班级实训强度、作业概览、考试概览;学生可查看个人学情,包含学习活跃度、实训强度。15.提供资源中心模块,资源中心包含视频库、课件库、试题库、数据集、工具库等5类资源库。各类资源库需包含公共资源和个人资源管理功能,支持用户在对应资源库中上传视频、课件、试题、数据集及工具包。16.个人资源中,支持用户对已上传的资源进行编辑、查看、下载及共享。支持对已上传的资源在教学课程中进行引用。17.公共资源中,支持用户对资源进行查看、下载,并复制到个人资源中心。18.支持单个创建、批量上传题库资源,题目类型包括选择题、判断题、填空题、问答题及编程题。支持对题库资源进行编辑、查看、删除;编程题可设置输入输出格式、测试数据样例、测试数据及适用的编程语言。三、作业与考试支持:1.支持用户在课程中创建实训作业及考试。2.支持添加、编辑、删除和隐藏作业内容。支持创建报告式作业。报告式作业支持2种提交方式:学生个人提交和小组组长提交,在课程成员中分配学习小组后,可由组长代表组员提交作业。支持作业报告模板设置,教师可根据需要设置学生信息一栏中的字段,包括姓名、学号、专业、班级等,教师也可根据教学需求配置需要收集的报告信息,如实验编号、手机号等;报告正文可设置学生编辑权限,支持设置学生不可编辑区域内容,学生无法进行编辑修改。3.支持创建编程式作业。支持教师设置Python或Java语言编程题目,并添加数据样例和测试数据编程式作业的题目支持同步至“题库管理”模块中,创建新作业时,支持选择题库中的编程题。4.提供代码自动评阅功能,支持学生提交编程式作业后,系统自动评判代码输出结果。5.支持添加考试、组卷,组卷方式至少包括单个题目新增、从题库中选择及随机增加三种方式。6.支持对客观题实现自动评分,教师可在线查看和批阅试卷。7.支持学生对考试进行回顾,并查看考试答题情况。8.支持对考试结果进行统计分析,分析学生的合格情况。四、实训模块:1.支持平台的无缝集成。大数据与人工智能实训管理平台支持与Python编程实训平台、大数据开发实训平台、Python数据挖掘建模平台、数据采集平台、数据可视化平台等多模块综合实训平台无缝衔接,实现虚拟化和统一账户接口,单点登录。能够满足学生在平台中完成教学任务、理论知识点学习、实训训练、项目实操应用的完美结合。2.支持创建课程实训任务,并在实训中并上传对应的实训指导书、关联实验环境及实训作业。要求提供每种实验环境的适用场景说明。3.支持学生提交实训作业报告,教师可对作业报告模板进行设置。4.提供实训报告评阅功能,教师评阅时可以查看学生实训完成情况、代码文件等信息,支持输入评分和评语对学生的实验结果进行评阅,支持教师下载学生提交的报告进行存档。支持教师根据学生作业答题情况,将学生作业退回为草稿,由学生重新答题后提交作业进行审批。5.支持自定义实训时长,可选时长范围为30分钟到720分钟不等,在实验超时后用户可申请继续使用,否则系统将自动释放资源。6.提供快速实训功能,支持多种在线实训环境以满足不同的实训需求,可根据需求选择桌面化形式、Jupyter网页形式或综合实训平台。桌面化形式支持单实例和多实例环境,多实例环境可用于搭建集群。平台不同用户之间可实现计算资源隔离,保障用户计算资源的使用。7.支持分组实训,通过分配课程成员组成多个学习小组,不同的小组可以在指定实训环境中使用“小组共享空间”,快速分享实训文件进行组内协作。8.支持实训管理,管理员和教师可查看各班级、学生的实训情况,包括实训的镜像、实训状态、实训时长、实训次数等,并可对学生实训环境进行重新启动、停止或删除。9.支持教师在实训管理中,针对学生远程协助申请,支持一键进入该学生的实训环境进行操作。10.提供环境库功能,教师可根据需要基于平台提供的基础镜像自定义实训环境,并一键发布共享给其他教师学生。11.支持教师对自定义的实训环境设置实训CPU、内存资源。五、用户模块:1.在用户管理中,管理员支持查询用户信息,管理用户,用户信息包含用户名、姓名、学号、班级、角色、上次访问时间。支持对用户设置启用/禁用,编辑用户资料,批量选课,重置密码,删除等。2.支持3种创建用户方式,分别是:单个创建、批量创建、批量导入。其中,批量创建可以快速创建一定规律的多个用户,批量导入支持使用平台的xlsx格式模板文件,编辑用户信息,批量导入。3.在班级管理中,包含班级、专业、年级模块,支持创建专业、年级、班级,并管理班级信息、成员、对班级进行选课等。六、系统管理模块:1.支持管理员维护课程备份,支持批量备份课程,备份文件支持下载到本地保存。2.支持管理员还原课程备份,支持上传备份包一键还原课程内容,或者在课程备课中直接点击还原。3.支持管理员维护课程类别并管理所有课程,支持课程增删改查及批量排序操作,支持隐藏课程。4.支持管理员维护平台信息,支持自定义校园VI定制,包括但不限于平台名称、logo、轮播图。5.支持管理员维护用户信息,定义平台角色,自定义各角色的权限,对用户进行角色分配。6.支持管理员维护课程基础设置、备份设置、恢复设置功能。7.提供日志管理功能,支持对用户操作情况进行日志记录,支持管理员根据用户、日期、活动、操作等获取平台操作日志。3Python编程实训平台一、平台功能:1.平台支持与大数据与人工智能实训管理平台无缝集成,并可与管理平台实训指导书进行关联使用,也支持独立创建环境进行平台应用。2.平台底层基于容器化的服务器集群开展实训教学,通过容器技术提供各类主流大数据、人工智能计算框架。3.平台预装多种大数据、深度学习框架,包括但不限于:scikit-learn、TensorFlow、keras、PyTorch等。4.支持不同用户的实训环境互相隔离,用户间的资源使用互不干扰。5.支持实训环境资源配置,可根据教学不同阶段需要灵活配置实训环境的CPU、内存参数。6.支持实训环境与实训指导书进行关联,实训环境与实训指导书同屏显示,实训指导书提供实训目标、实验环境、实验内容、实训步骤详解等内容。7.支持快速切换实训环境,可视化显示原实训环境和新实训环境。8.支持实训环境一键全屏功能,隐藏实训指导书界面。9.提供复制粘贴功能,支持将外部文本内容复制粘贴到实训环境内,将实验环境内容复制粘贴到外部环境。10.支持上传文件,用户可将个人本地代码文件、配置文件、数据等上传至实训环境指定路径。11.支持文件下载,用户可将实训环境的代码文件、配置文件、数据等下载至本地电脑。12.支持实训环境重置。学生在实训过程中,因为配置错误、删除组件等问题导致环境无法正常运行,可以对环境进行重置,重置后实训环境将恢复到初始状态,学生可以进行重新配置和操作实训。13.支持实训环境时间记忆功能,误操作关闭实训环境界面时,重新进入该实训可继续上次实训时间点及页面操作。14.支持学生申请远程协助,教师可以远程协助学生解决实训中出现的问题。15.提供实训计时功能,教师可在管理平台中设置实训时长,实训倒计时结束后将关闭实训环境,自动释放资源。支持用户在实训过程中查看实训环境倒计时,并请求实训延时。16.支持实训报告与实训环境同屏显示,学生可在实训操作过程中编制实训作业报告并提交。17.支持实训报告在线编辑和提交,实训报告可上传本地或实训环境中的文件作为报告附件。18.支持对实训环境状态的管理,管理员及教师可在管理平台端查看学生课程实训环境使用信息,包括姓名、用户名、班级、课程名称、镜像名称等。支持批量/单独启动、停止、删除课程实训环境。4大数据开发实训平台一、平台功能:1.平台支持与大数据与人工智能实训管理平台无缝集成,并可与管理平台实训指导书进行关联使用,也支持独立创建环境进行平台应用。2.平台底层基于容器化的服务器集群开展实训教学,通过容器技术提供各类主流大数据框架,提供模版功能,可通过模版快速批量地为学生准备好实训环境。3.平台预装和配置了Hadoop和Spark的大数据运行环境,可直接调用和使用Hadoop的基础组件,支持直接启动Spark-shell进行操作。4.支持不同用户的实训环境互相隔离,用户间的资源使用互不干扰。5.实训环境使用桌面化形式,配置vim文本编辑、SSH远程登录、NTP时间同步等软件。6.实训环境提供大数据完全分布式集群,集群节点不少于3个。7.支持实训环境与实训指导书进行关联,实训指导书提供实训目标、实验环境、实验内容、实训步骤详解等内容。8.支持快速切换实训环境,可视化显示原实训环境和新实训环境。9.支持实训环境一键全屏功能,隐藏实训指导书界面。10.提供复制粘贴功能,支持将外部文本内容复制粘贴到实训环境内,将实验环境内容复制粘贴到外部环境。11.支持上传文件,用户可将个人本地代码文件、配置文件、数据等上传至实训环境指定路径。12.支持文件下载,用户可将实训环境的代码文件、配置文件、数据等下载至本地电脑。13.支持Linux命令行开发,包括Linux基础操作命令、软件包安装,删除,配置和管理。14.支持开启多个Linux命令行,进行分布式实验环境安装部署操作。15.提供分布式文件系统HDFS,用于大容量数据存储,支持网页查看HDFS文件列表。16.提供分布式计算框架MapReduce,用于大规模数据集的并行运算。支持任务运行过程中实时查看日志,可通过日志定位问题。17.支持集群资源管理YARN,为上层应用提供统一的资源管理和调度。可通过网页查看任务状态及运行总耗时等信息。18.提供数据仓库Hive,可将结构化的数据文件映射为一张数据库表,支持Hive表的导入导出功能。19.提供数据仓库HBase,基于列的模式,支持非结构化的数据存储。20.支持实训环境重置。学生在实训过程中,因为配置错误、删除组件等问题导致环境无法正常运行,可以对环境进行重置,重置后实训环境将恢复到初始状态,学生可以进行重新配置和操作实训。21.支持实训环境时间记忆功能,误操作关闭实训环境界面时,重新进入该实训可继续上次实训时间点及页面操作。22.支持远程协助申请,教师可以远程协助学生解决实训中出现的问题。23.实训倒计时结束,将关闭实训环境,自动释放资源,支持用户查看实训环境倒计时并提供延时功能。24.支持实训报告与实训环境同屏显示,学生可在实训操作过程中编制实训作业报告并提交。25.支持实训报告在线编辑和提交,实训报告可上传本地或实训环境中的文件作为报告附件。26.支持对实训环境状态的管理,管理员及教师可在管理平台端查看学生课程实训环境使用信息,包括姓名、用户名、班级、课程名称、镜像名称等。支持批量/单独启动、停止、删除课程实训环境。5Python数据挖掘建模平台一、基础模块:1.平台采用B/S架构,使用JAVA语言开发,采用分布式架构,基于SpringCloud构建,提供稳定可靠的服务调用、服务治理、服务降级能力。2.提供服务管理功能,查看服务上线情况,快速实现动态服务发现、服务配置及服务注册。3.提供数据空间,用户可以从本地上传自有数据,支持表结构化数据和非结构化数据,能够快速实现异构数据源之间的数据同步问题;支持共享数据集。4.支持增加多台PostgreSQL数据库服务器搭建分布式存储架构,使用JuiceFS分布式文件系统进行数据存储。5.支持与大数据与人工智能实训管理平台、数据采集平台、数据可视化平台的数据集模块互通,互通的平台可直接使用采集的数据集进行数据挖掘建模,构建指标绘制可视化图表等。6.提供工程模板功能,用户可通过模板快速创建包含数据和流程的工程。7.组件拖拽组件到画布的方式快速编排训练流程,支持流程节点编辑和参数配置。8.支持多任务的并行执行,在大量任务待执行的环境下,可提高系统运行效率,减少任务排队等待时间。9.使用工作流开发,包括但不限于串行工作流、并行工作流,满足开发中常见的多输入、多输出、多分支的场景。10.支持在有GPU节点情况下,算法组件可配置调用GPU资源进行任务计算。11.支持在线查看算法组件源代码,支持在线修改算法组件源代码,并一键将修改的算法组件保存为个人算法组件进行应用和管理。12.支持自动生成评估报告,评估报告包含精确率、精准率、召回率、F1-score等指标,并展示训练结果的混淆矩阵等指标结果信息,支持呈现模型训练效果。13.支持通过IDE工具编写与调试Python代码。14.提供个人算法管理,支持用户自定义算法配置,用户可创建自定义算法,支持配置数据输入输出节点、可设置参数、代码等多种参数。并对个人算法组件进行编辑和删除。15.支持定时训练任务,可以创建定时任务,选择任务来源,设置任务开始时间和调度方式。16.支持硬件计算能力、存储能力自由扩展,扩展不影响系统正常运行。17.支持模型管理,支持模型发布和分享。18.前后端以及内部各模块间都采用Restful接口交换数据,用户可以方便、快捷的通过浏览器在线浏览、测试各个接口。二、算法组件模块:1.支持Python计算引擎,支持使用Python进行算法开发。2.提供9大类共102种算法,其中统计分析16种、预处理29种、分类算法10种、聚类算法7种、回归算法5种、时间序列算法4种、关联规则3种、文本挖掘19种、绘图9种。分别为:(1)预处理算法包括:内容判断、字符串切分、字符串填充、字符串截取、字符串查找、字符串统计、英文大小写转换、主键合并、修改列名、分组聚合、列拆为多行、字符集转换、差分、数据抽取、数据拆分、数据排序、数据标准化、数据筛选、数据编码化、数据采样、新增序列、新增时间戳列、缺失值处理、行列转置、行扁平化、衍生变量、表堆叠、记录去重、Python脚本。(2)统计分析算法包括:LASSO回归、var方差函数、主成分分析、全表统计、分布函数、卡方检验、同比环比、因子分析、方差齐性检验、时序检验、时间聚合计算、正态性检验、相关性分析、移动计算、累计计算、频数统计。(3)时间序列算法包括:模型定阶、ARIMA、指数平滑法、模型残差检验。(4)分类算法包括:Adaboost、CART分类树、LGBM、K最近邻、单层感知机、支持向量机、朴素贝叶斯、神经网络、逻辑回归、随机森林。(5)回归算法包括:CART回归树、K最近邻回归、Lasso回归、支持向量回归、线性回归。(6)聚类算法包括:DBSCAN密度聚类、K-中心点聚类、KMeans、层次聚类、快速Kmeans、模糊聚类、高斯混合模型。(7)关联规则算法包括:Apriori、FP-Growth、HotSpot。(8)文本分析算法包括:文本过滤、词频统计、词汇分隔、序列定长、构造词汇索引、内容展平、关键词题分析、分词词汇索引映射、Hanlp分词与词性、追加词汇分词、TF-IDF、Word2Vec、向量空间、HT向量化、词袋向量、实体关系抽取、双向GRU、FastText、LDA主题分类。(9)绘图算法包括:地图、折线图、散点图、时序图、柱形图、漏斗图、词云图、饼图、雷达图。三、教学资源模块:提供Python数据挖掘教学案例不少于11个,配套实训指导书。包含但不限于:(1)航空公司客户价值分析。(2)中医证型关联规则。(3)市财政收入分析预测。(4)应用系统负载分析与磁盘容量预测。(5)信用卡高风险客户识别。(6)RFM在线零售客户分群。(7)气象与输电线路缺陷关联分析。(8)金融服务机构资金流量预测。(9)家用热水器用户行为分析。(10)商品评论情感分析。(11)线上教育平台运营数据分析。6数据采集平台一、基础模块:1.平台主体包括配置流程设计的客户端和包含主程序、采集节点、数据库的服务器端。2.提供公有云和私有云两种网络方式,支持服务器端分布式集群架构,可部署多个采集节点和数据库,实现大规模、高并发的云采集。3.支持热插拔添加集群,保证统正常运行。支持自动负载均衡算法,调整用户配额以保持资源公平利用。4.支持主程序在Windows、Linux服务器上部署,客户端在Windows、Linux、MacOS个人电脑上部署。5.支持自动折分云采集任务,智能分发到服务器端采集集群,自动汇总子任务数据。6.支持与大数据与人工智能实训管理平台、Python数据挖掘建模平台、数据可视化平台的数据集模块互通,互通的平台可直接使用采集的数据集进行数据挖掘建模,构建指标绘制可视化图表等。二、数据采集模块:1.提供互联网公开网页数据采集,支持使用采集模板或定制化采集。2.允许单用户同时进行多个采集工程,可导入之前采集完成的工程数据链接。3.提供实时查看运行中的日志和快照,支持自动过滤完全重复的数据。4.支持使用代理IP进行采集,提供接口获取IP,支持JSON和text两种模式,支持手动录入IP和隧道代理IP。5.支持模拟人工网页浏览操作,包括预登录、输入文本、点击元素、提取数据,支持可视化制作采集规则流程。6.提供高亮显示被选定元素。7.支持相对路径xpath元素选择。8.支持直接设置多页数据采集,包括翻页类型和参数配置。9.支持多层级网页数据采集,自动合并主从页面数据。10.支持翻页前进行校验页码是否可以翻页成功,可查看翻页快照情况。11.允许用户自由定制采集字段,支持在可视化规则流程出错时智能提示。12.支持文档、图片、视频等字段类型修改,可下载并有序存储文件。13.支持配置账号密码进行登录,记住cookie信息,确保登录后数据的采集。14.支持自动重试采集任务,可配置重试次数,支持自动检测问题。15.客户端和服务端支持定时控制,可预设单次采集时间,支持每天、每周、每月的定时采集。16.支持定时启动任务进行增量采集,实现定期自动更新数据。17.支持查看工程最近十次的日志记录。18.支持采集工程完成流程审批,实现公开模板。19.支持申请审批情况进行同步消息提醒。20.支持查看采集后的数据,并下载到本地。7数据可视化平台一、基础模块1.平台采用B/S架构,即浏览器/服务器架构,通过浏览器直接访问平台。2.支持与大数据与人工智能实训管理平台、Python数据挖掘建模平台、数据可视化平台的数据集模块互通,互通的平台可直接使用采集的数据集进行数据挖掘建模,构建指标绘制可视化图表等。二、数据源模块1.支持连接外部数据,支持融合第三方数据库,包括MySQL、PostgresSQL、Oracle、SQLServer、本地CSV等。2.支持数据集管理,提供数据集预览、修改、查看等管理功能。三、指标构建模块1.支持多维度字段分析,构建可视化指标,提供四则运算、分组聚合、筛选等功能。2.提供方便易用的SQL查询操作。3.支持SQL高级分析,可使用SQL命令对数据执行表关联、类型转换、值统计等操作。三、可视化模块1.提供丰富的可视化图表库,包括但不限于折线图、柱状图、饼图、散点图、词云图、雷达图、漏斗图、河流图、热力图、旭日图、箱线图、地图、仪表盘等,用户可根据数据自主选择图表展示方式。2.支持对不同的图表组件设置不同的样式,提供包括但不限于常见的标题设置、图例设置、自定义配色、距离调控等功能,满足不同需求场景。3.支持修改及查看绘制图表的ECharts源代码。四、仪表盘大屏模块1.提供仪表盘和大屏两种形式的展示功能,支持具有动态效果的图形化界面,提供常用的可视化模板,支持用户自定义展示布局及展示内容。2.提供固定布局和自由布局两种仪表盘搭建模式。3.固定布局提供一键主题设置,实现更为方便快捷的配色方案,提供不少于8种的主题风格选择。4.自由布局通过拖拉拽的方式来进行位置调整和尺寸控制,组件化部署搭建仪表盘效果。5.自由布局支持自定义画布颜色、背景图片等。6.自由布局提供丰富的可视化控件库,通过拖拽、简便配置即可完成美观的UI设计,包括但不限于图表组件、文本组件、边框组件、装饰组件等。7.支持一键导出图片格式的仪表盘文件。8.可将多张仪表盘共同组成可视化大屏,提供三种风格的大屏主题,每页大屏支持至少一个仪表盘。9.提供可视化大屏分享功能,可以生成公开或授权认证访问的浏览链接形式访问大屏,支持嵌入第三方业务系统。10.支持数据实时刷新功能,支持全屏预览,自适应分辨率以满足不同设备的查看需求。11.提供至少10个数据可视化教学案例。(1)售货机商务数据分析(2)网络招聘分析(3)福建省区酒饮退货数据分析(4)线上教育平台运营数据分析展示(5)公司产品情况综合分析(6)广告投放数据分析(7)生产设备故障分析与预判(8)新零售智能销售数据分析(9)上市企业财务指标分析(10)供应链销售数据分析8基于评论数据推荐店铺食品实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握食品评论数据分析和店铺整体情况分析的主要方法和技能,并为后续相关课程学习及将来从事食品生产的店铺运营工作奠定基础。本案例的分析目标如下。(1)掌握已有评论数据的概况,针对实际业务场景和需求对数据进行读取和理解。(2)基于评论数据,对评论本身进行统计分析,对店铺情况从多维度、多角度进行分析。(3)针对店铺整体情况对类似店铺进行聚类,提供消费者更多店铺选择。三、案例技术前置课程《Python编程基础》(一)课时设置:理论教学不少于24学时,实践教学不少于24学时,总计不少于48学时。(二)课程资源:包含实训指导书数量≥41份、课程视频数量≥41个、课程PPT数量≥8份、代码数量≥17份、数据数量≥1份。(三)课程内容包括但不限于:第1章准备工作:1.1认识Python。1.2.1Python开发环境介绍。1.2.2Python解释器下载安装。1.3.1安装PyCharm。1.3.2使用PyCharm。1.3.3在PyCharm中使用交互模式执行代码。第2章Python基础知识:2.1.1编写第一个Python程序。2.1.2缩进代码。2.2.1字符串基本操作。2.2.2字符串的索引及切片操作。2.2.3任务实现-字符串与数值处理。2.3.1Python常用运算符介绍。2.3.2任务实现-计算圆形的各参数。第3章Python数据结构:3.1认识数据结构3.2.1创建列表。3.2.3列表索引及切片操作。3.2.4为列表添加元素。3.2.5列表推导式。3.2.6任务实现-求解曲边图形面积。3.3.1创建字典。3.3.2字典的增删改查操作。3.3.3任务实现-单词词频统计。第4章程序流程控制语句:4.1.1考试成绩等级划分-任务描述。4.1.2条件判断及分支语句。4.1.3try-except语句。4.1.4任务实现-考试成绩等级划分。4.2.1循环语句。4.2.2任务实现-实现一组数的连加与连乘操作。4.3冒泡排序法排序第5章函数:5.1.1使用def定义函数。5.1.2任务实现-自定义求列表均值的函数。5.2使用lambda创建匿名函数。5.3存储并导入函数模块第6章面向对象编程:6.1认识面向对象。6.2.1创建Human类。6.2.2创建对象第7章文件基础:7.1.1读取文件数据。7.1.2任务实现-文件数据读取及词频统计。7.2将数据写入文件。第8章内置模块与第三方库:8模块和第三方库。(四)课程实验包括但不限于:实训1Python环境搭建。实训2使用PyCharm创建一个应声虫程序。实训3输入输出。实训4创建字符串变量并提取里面的数值。实训5计算圆形的各参数。实训6对用户星座进行分析。实训7通过表达式计算给定的三个数值均值、方差、标准差。实训8创建一个列表(list)并进行增删改查操作。实训9转换一个列表为元组(tuple)并进行取值操作。实训10创建一个字典(dict)并进行增删改查操作。实训11将两个列表转换为集合(set)并进行集合运算。实训12计算出斐波那契数列前两项给定长度的数列,并删除重复项和追加数列各项之和为新项。实训13用户自定义查询菜单,输出查询结果实训14简单的好友通讯录管理程序。实训15对两个给定的数进行最大公约数、最小公倍数的分析。实训16求解曲边图形面积。实训17单词词频统计。实训18实现考试成绩划分。实训19实现一组数的连加与连乘。实训20使用冒泡排序法排序。实训21输出数字金字塔。实训22猜数字游戏。实训23统计字符串内元素类型的个数。实训24自定义函数实现方差输出。实训25使用匿名函数添加列表元素。实训26存储并导入函数模块。实训27构建一个计算列表中位数的函数。实训28使用lambda表达式实现对列表中的数求平方。实训29创建Car类。实训30创建Car对象。实训31迭代Car对象。实训32产生Land_Rover对象(子类)。实训33在精灵宝可梦游戏创建小火龙角色,对给出的各属性进行迭代和私有化。实训34对小火龙游戏角色采用继承的方式。实训35对txt文件进行读写。实训36对csv文件进行读写。实训37os模块。实训38shutil模块。实训39计算iris数据集的均值。实训40编程实现文件在当前工作路径的查找。实训41文件数据读取及词频统计9基于食品综合数据分析客户喜爱度实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握食品菜谱数据分析、店铺销售数据分析和客户喜爱度分析的主要方法和技能,并为后续相关课程学习及将来从事食品生产运营工作奠定基础。本案例的分析目标如下。(1)掌握已有商品销售数据的概况,针对实际业务场景和需求对数据进行统计。(2)根据粽子的菜谱分析客户的口味、食材和常用调料偏好。(3)根据销售数据分析粽子价格,比较不同店铺不同地区价格的差异。根据售价和销量进行分析。(4)针对粽子的标题进行关键词分析,可发现店铺常用吸引消费者的字眼是哪些。三、案例技术前置课程《Python大数据数学基础》(一)课时设置:理论教学不少于38学时,实践教学不少于26学时,总计不少于64学时。(二)课程资源:包含实训指导书数量≥21份、课程视频数量≥37个、课程PPT数量≥8份、代码数量≥21份、数据数量≥8份。(三)课程内容包括但不限于:第1章绪论:1绪论。第2章微积分基础:2.1引言。2.2函数与极限。2.3导数与微分。2.4微分中值定理与导数的应用。2.5不定积分与定积分。第3章概率论与数理统计基础:集中趋势度量。集中趋势度量代码讲解。离散趋势度量及偏度与峰度度量。离散趋势度量及偏度与峰度度量代码讲解。3.2.1随机事件及其概率。3.2.2随机变量与概率分布。3.2.3随机变量的数字特征。3.2.4随机变量与概率分布及随机变量的数字特征代码讲解。3.3参数估计与假设检验以及章节小结。第4章线性代数基础:4.1.1行列式。4.1.2行列式代码讲解。4.2.1矩阵及其运算。4.2.2矩阵及其运算代码讲解。4.3.1矩阵的特征分解与奇异值分解。4.3.2矩阵的特征分解与奇异值分解代码讲解。第5章数值计算基础:5.1数值计算的基本概念。5.2插值方法。5.3函数逼近与拟合。5.4非线性方程(组)求根及小结。第6章多元统计分析:6.1.1一元线性回归。6.1.2多元线性回归。6.1.3Logistic回归。6.1.4回归分析代码讲解。6.2.1判别分析。6.2.2判别分析代码讲解。6.3.1聚类分析。6.3.2聚类分析代码讲解。6.4主成分分析。6.5因子分析。6.6典型相关分析及小结。6.7本章小结。(四)课程实验包括但不限于:实训1函数与极限。实训2导数。实训3微分。实训4微分中值定理与导数的应用。实训5不定积分与定积分。实训6数据分布特征的描述统计。实训7概率与概率分布。实训8参数估计与假设检验。实训9行列式。实训10矩阵及其运算。实训11矩阵的特征分解与奇异值分解。实训12误差。实训13插值方法。实训14函数逼近与拟合。实训15非线性方程(组)求根。实训16回归分析。实训17判别分析。实训18聚类分析。实训19主成分分析。实训20因子分析。实训21典型相关分析。10食品安全问题统计分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握使用食品安全预处理和数据分析的主要方法,并为后续相关课程学习及将来从事食品信息数据分析工作奠定基础。本案例的分析目标如下。(1)读取数据,查看数据结构,提取数据的有效信息。(2)数据处理,检查缺失值和重复值,为后续综合分析提供有效保障。(3)对历年报告数量、受害人性别、出现问题最多的产品、出现问题最多的食品类型、事件结果和事故症状等方面进行分析。三、案例技术前置课程《Python数据分析与应用》(一)课时设置:理论教学不少于36学时,实践教学不少于28学时,总计不少于64学时。(二)课程资源:包含实训指导书数量≥34份、课程视频数量≥65个、课程PPT数量≥7份、代码数量≥6份、数据数量≥7份。(三)课程内容包括但不限于:第1章Python数据分析概述:1.1认识数据分析。1.2熟悉Python数据分析的工具。1.3安装anaconda与启动jupyternotebook。1.4掌握jupyternotebook常用功能。第2章NumPy数值计算基础:。2.1.1Numpy简介2.1.2数组创建及基础属性。2.1.3初识数组的特点。2.1.4创建常用数组。2.1.5数组数据类型。2.1.6生成随机数。2.1.7一维数组的索引。2.1.8逻辑型索引。2.1.9多维数组的索引。2.1.10求解距离矩阵。2.1.11变化数组shape2.2.1Numpy矩阵介绍。2.2.2Numpy通用函数介绍。2.2.3通用函数的广播机制。2.3.1Numpy读写二进制文件。2.3.2Numpy读写txt文件。2.3.3利用Numpy对数据进行简单统计分析。第3章Matplotlib数据可视化基础:3.1.1Matplotlib介绍。3.1.2基础图形绘制。3.1.3常用参数设置。3.2.1绘制散点图。3.2.2散点图参数设置。3.2.3绘制折线图。3.3.1绘制直方图。3.3.2绘制饼图。3.3.3绘制箱线图。第4章pandas统计分析基础:4.1Pandas简介。4.2.1Pandas读取文本数据。4.2.2存储数据框。4.2.3Pandas读取excel文件。4.2.4将数据框存储为excel文件。4.3.1构建数据框。4.3.2查看数据框的常用属性。4.3.3按行列顺序访问数据框中的元素。4.3.4按行列名称访问数据框中的元素。4.3.5修改数据框中的元素。4.3.6删除数据框中的元素。4.3.7描述分析数据框中的元素。4.4.1转换成时间类型数据。4.4.2时间类型数据的常用操作。4.5.1groupby分组操作。4.5.2agg聚合操作。4.6.1生成透视表。4.6.2生成交叉表。第5章使用pandas进行数据预处理:5.1.1表堆叠。5.1.2主键合并。5.1.3重叠合并。5.2.1检测与处理重复值。5.2.2检测与处理缺失值。5.2.3检测与处理异常值。5.3标准化数据。5.4.1哑变量处理。5.4.2离散化连续型数据。第6章使用scikit-learn构建模型:6.1.1Scikit-Learm简介。6.1.2获取及认识datasets中的数据。6.1.3将数据集划分为训练集和测试集。6.1.4利用转化器进行数据转化操作。6.2构建并评价聚类模型。6.3构建并评价分类模型。6.4.1构建回归模型。6.4.2评价回归模型。(四)课程实验包括但不限于:实训1掌握NumPy数组对象ndarray。实训2掌握NumPy矩阵与通用函数。实训3利用NumPy进行统计分析。实训4创建数组并进行运算。实训5创建一个国际象棋的棋盘。实训6掌握绘图基础语法与常用参数。实训7分析特征间的关系。实训8分析特征内部数据分布与分散状况。实训9分析1996~2015年人口数据各个特征的分布与分散状况。实训10分析1996~2015年人口数据特征间的关系。实训11读写不同数据源的数据。实训12掌握DataFrame的常用操作。实训13转换与处理时间序列数据。实训14使用分组聚合进行组内计算。实训15创建透视表与交叉表。实训16读取并查看P2P网络贷款数据主表的基本信息。实训17提取用户信息更新表和登录信息表的时间信息。实训18使用分组聚合方法进一步分析用户信息更新表和登录信息表。实训19对用户信息更新表和登录信息表进行长宽表转换。实训20合并数据。实训21清洗数据。实训22标准化数据。实训23转换数据。实训24插补用户用电量数据缺失值。实训25合并线损,用电量趋势与线路告警数据。实训26标准化建模专家样本数据。实训27使用sklearn转换器处理数据。实训28构建并评价聚类模型。实训29构建并评价分类模型。实训30构建并评价回归模型。实训31使用sklearn处理wine和wine_quality数据集。实训32构建基于wine数据集的K-Means聚类模型。实训33构建基于wine数据集的分类模型。实训34构建基于wine_quality数据集的回归模型。11食品评论数据舆情分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握食品评论可视化展现和评论正负面情绪分析的主要方法和技能,并为后续相关课程学习及将来从事食品生产管控工作奠定基础。本案例的分析目标如下。(1)掌握已有食品评论数据的概况,针对实际业务场景和需求对数据进行检查。(2)基于现有食品评论数据,从时间维度上分析数据总量和评论星级的变化趋势,同时剔除无效用户数据。(3)针对评论的文本数据进行一系列预处理操作,构建基础模型辅助确定评论数据的正负面情感。三、案例技术前置课程《Python网络爬虫实战》(一)课时设置:理论教学不少于14学时,实践教学不少于18学时,总计不少于32学时。(二)课程资源:包含实训指导书数量≥25份、课程视频数量≥44个、课程PPT数量≥7份、代码数量≥3份、数据数量≥1份。(三)课程内容包括但不限于:第1章Python爬虫环境与爬虫简介:1.1.1常见网上冲浪过程。1.1.2爬虫的概念。1.1.3爬虫合法性。1.2认识反爬虫。1.3配置Python爬虫环境。第2章网页前端基础:2.1.1网络传输模型。2.1.2网络信息传输过程。2.2.1认识HTTP。2.2.2熟悉Cookie。第3章简单静态网页爬取:3.1认识静态网页。3.2.1创建工程。3.2.2生成HTTP请求。3.2.3完善HTTP请求。3.3.1为什么要解析网页。3.3.2初识Xpath。3.3.3Xpath相对路径及属性查找。3.3.4使用BeautifulSoup解析网页。3.3.5网页解析小结。3.4.1认识chrom开发者工具。3.4.2任务演练:爬取并存储网站首页数据。第4章认识动态网页:4.1认识动态网页。4.2.1通过网页源码追踪目标数据文件地址。4.2.2通过开发者工具追踪目标数据文件地址。4.2.3爬取数据并进行保存。4.3.1搭建Selenium环境。4.3.2利用Selenium获取网页数据。4.3.3利用Selenium控制点击操作。第5章模拟登录:5.1.1模拟登录的过程。5.1.2查找提交入口和表单数据。5.1.3提交表单完成模拟登录。5.1.4使用表单登录的注意事项。5.2使用Cookie登录方法实现模拟登录。5.3使用Selenium模拟登录。第6章Scrapy爬虫:6.1认识Scrapy。6.2.1创建项目。6.2.2指定字段及创建spiders。6.2.3完成spiders编写6.2.4运行程序保存数据。6.3.1任务介绍及项目创建。6.3.2获取所有页面的url。6.3.3获取每个页面的新闻二次页面url。6.3.4提取各新闻二次页面中的目标数据。6.3.5运行程序保存数据。第7章拓展:7拓展:终端协议及爬取工具介绍。(四)课程实验包括但不限于:。实训1使用Socket库进行TCP编程。实训2使用Socket库进行UDP编程。实训3使用Socket库连接百度首页。实训4urllib3库实现HTTP请求。实训5Requests库实现HTTP请求。实训6正则表达式模块解析网页。实训7Xpath解析网页。实训8Soup库解析网页。实训9MySQL数据存储。实训10生成GET请求并获取指定网页内容。实训11搜索目标节点并提取文本内容。实训12在数据库中建立新表并导入数据。实训13逆向分析爬取动态网页。实训14使用Selenium库爬取动态网页。实训15存储数据至MongoDB数据库。实训16爬取网页“”推荐图书的信息。实训17爬取某网页的Java图书信息。实训18将数据储存到MongoDB数据库中。实训19使用表单登录方法实现模拟登录。实训20使用Cookie登录方法实现模拟登录。实训21使用表单登录方法模拟登录某论坛。实训22使用浏览器Cookie模拟登录某论坛。实训23基于表单登录后的Cookie模拟登录某论坛。实训24使用Scrapy爬取网页动态。实训25定制BdRaceNews爬虫项目的中间件。12食品生产情况分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握食品生产数据可视化分析和不同国家的食品生产能力判定的主要方法和技能,并为后续相关课程学习及将来从事食品生产管控工作奠定基础。本案例的分析目标如下。(1)掌握已有食品生产数据的概况,针对实际业务场景和需求对数据进行读取和理解。(2)基于现有食品生产数据,主要从产量上对不同国家、不同产品进行统计分析,同时检验产品的相关性。(3)针对产品生产概况和生产力规模对国家进行分类。三、案例技术前置课程《Python机器学习算法实现》(一)课时设置:理论教学不少于36学时,实践教学不少于28学时,总计不少于64学时。(二)课程资源:包含实训指导书数量≥15份、课程视频数量≥49个、课程PPT数量≥9份、代码数量≥10份、数据数量≥7份。(三)课程内容包括但不限于:第1章机器学习绪论:1.1引言。1.2基本术语1.3假设空间&归纳偏好。第2章模型评估与选择。2.1经验误差与过拟合。2.2评估方法。2.3性能度量。2.4性能度量Python实现。第3章回归分析。3.1线性回归基本形式。3.2线性回归模型的Python实现。3.3波士顿房价预测的Python实现。4逻辑回归介绍。3.5研究生入学录取预测的Python实现。第4章决策树。4.1从女生相亲到决策树。4.2明天适合打球吗。4.3决策树拆分属性选择。4.4决策树算法家族。4.5泰坦尼克号生还者预测—数据预处理。4.6泰坦尼克号生还者预测—模型构建与预测。4.7决策树可视化。第5章神经网络。5.1单个神经元介绍。5.2经典网络结构介绍。5.3神经网络工作流程演示。5.4如何修正网络参数-梯度下降法。5.5网络工作原理推导。5.6网络搭建准备。5.7样本从输入层到隐层传输的Python实现。5.8网络输出的Python实现。5.9单样本网络训练的Python实现。5.10全样本网络训练的Python实现。5.11网络性能评价5.12调用sklearn实现神经网络算法。第6章KNN。6.1KNN算法介绍。6.2KNN算法解决鸢尾花分类问题。第7章朴素贝叶斯。7.1非洲人还是北美人。7.2为什么有“朴素”二字。7.3拉普拉斯修正。7.4用高斯朴素贝叶斯算法解决鸢尾花分类问题。第8章聚类分析。8.1聚类分析概述。8.2相似性度量。8.3K-Means聚类分析算法介绍。8.4利用K-Means算法对鸢尾花进行聚类。8.5聚类结果的性能度量。8.6调用sklearn实现聚类分析。第9章支持向量机。9.1间隔与支持向量。9.2对偶问题。9.3核函数。9.4软间隔与正则化。9.5支持向量机算法的Python实现。第10章小结。10.1小结。(四)课程实验包括但不限于:实训1完成波士顿房价预测模型。实训2对研究生是否被录取进行预测。实训3决策树算法自编。实训4用决策树算法构建鸢尾花分类模型。实训5自定义sigmoid激活函数。实训6网络输入到输出。实训7网络权值和阈值更新。实训8网络模型训练。实训9网络模型预测实训10求距离矩阵。实训11找邻居。实训12归类。实训13自编KNN算法实现鸢尾花分类。实训14对鸢尾花数据进行K-Means聚类。实训15用支持向量机解决鸢尾花分。13食品营养信息数据分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求能够掌握食品图像修改和根据食品图像判断食品种类的主要方法和技能,并为后续相关课程学习及将来从事食品数据分析工作奠定基础。本案例的分析目标如下。(1)掌握美食图片数据的概况,针对实际业务场景和需求对数据进行研究。(2)将图片数据按9:1的比例分成两部分,并对占比大的图片进行一系列修改操作。(3)构建机器学习模型辅助识别食品图片的种类。(4)比较多个机器学习模型的食品识别能力,选出能力最优的模型。三、案例技术前置课程《Python文本挖掘实战》(一)课时设置:理论教学不少于12学时,实践教学不少于4学时,总计不少于16学时(二)课程资源:包含实训指导书数量≥5份、课程视频数量≥11个、课程PPT数量≥1份、代码数量≥2份、数据数量≥1份。(三)课程内容包括但不限于:第1章文本预处理技术:。1.1文本挖掘概述。第2章常见文本分类器及评估:2.1文本预处理_正则表达式。2.2中文分词概述。2.2.1机械分词法。2.2.2马尔科夫链分词法。2.2.3隐马尔可夫模型(HMM)。2.2.4viterbi算法。2.2.5隐马尔可夫与viterbi算法应用。2.2.6jieba库_jieba分词。2.3绘制词云。第3章文本向量化表示:3.1文本向量化表示。第4章垃圾短信分类模型构建:4.1案例:垃圾短信识别_数据抽取。4.2案例:垃圾短信识别_文本清洗。4.3案例:垃圾短信识别_分词与去除停用词。4.4案例:垃圾短息识别_绘制词云。4.5案例:垃圾短信识别_文本向量化表示。4.6案例:垃圾短信识别_文本分类器。4.7案例:垃圾短信识别_分类模型评估。(四)课程实验包括但不限于:实训1正则表达式。实训2中文分词:匹配法。实训3中文分词:HMM。实训4中文分词:HMM的维特比算法实现分词。实训5绘制词云。实训6文本分类:数据探索。实训7文本分类:数据预处理。实训8文本分类:绘制词云图。实训9文本分类:识别垃圾短信。14自热食品营销分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:通过学习本案例,要求掌握食品销售数据可视化分析和营销战略分析的主要方法和技能,并为后续相关课程学习及将来从事食品生产运营工作奠定基础。本案例的分析目标如下。(1)掌握已有商品销售数据的概况,针对实际业务场景和需求对数据进行统计。(2)针对自热食品的品类、自热食品本身和店铺进行月销量表现分析。(3)针对自热食品的标题进行关键词分析。(4)针对各省份的店铺数量和全国自热食品店铺月销量分布进行分析,同时分析自热食品价格,比较不同店铺价格的差异。三、案例技术前置课程《Python数据可视化》(一)课时设置:理论教学不少于24学时,实践教学不少于24学时,总计不少于48学时。(二)课程资源:包含实训指导书数量≥26份、课程视频数量≥35个、课程PPT数量≥6份、代码数量≥3份、数据数量≥12份。(三)课程内容包括但不限于:第1章Matplotlib基础绘图:1.1Matplotlib绘制流程说明。1.2添加文本和修改绘图风格。1.3rc参数。1.4散点图。1.5折线图。1.6直方图和条形图。1.7饼图。1.8箱线图。1.9人口特征间分布。1.10人口各个特征分布。第2章Seaborn进阶绘图:2.1 seaborn基础介绍。2.2seaborn简单绘图。2.3seaborn绘图风格。2.4调色板1。2.5调色板2。2.6关系图。2.7分类图。2.8分布图。2.9回归图。2.10矩阵图。2.11网格图。第3章Pyecharts绘制基本图表:3.1Pyecharts基础介绍。3.2Pyecharts绘制日历图。3.3Pyecharts绘制漏斗图。3.4Pyecharts绘制仪表盘。3.5Pyecharts绘制水球图。3.6Pyecharts绘制关系图。3.7Pyecharts绘制直角坐标系图表。3.8Pyecharts绘制饼图。3.9Pyecharts绘制雷达图。3.10Pyecharts绘制词云图。3.11Pyecharts绘制柱状图。3.12Pyecharts绘制树形图。3.13Pyecharts绘制地理图表。3.14Pyecharts绘制3D图表。(四)课程实验包括但不限于:实训1绘图基础语法和常用参数。实训2分析特征间关系。实训3分析特征内部数据分布于分散状况。实训4分析1996-2015年人口数据特征间的关系。实训5分析1996-2015年人口数据各个特征的分布与分散状况。实训6实现scatterplot关系图。实训7实现lineplot关系图。实训8实现relplot关系图。实训9实现分类散点图。实训10实现分类分布图。实训11实现分类估计图。实训12实现kdeplot分布图。实训13实现rugplot分布图。实训14实现distplot分布图。实训15实现regplot回归图。实训16实现lmplot回归图。实训17实现heatmap矩阵图。实训18实现clustermap矩阵图。实训19实现FacetGrid网格图。实训20实现PairGrid网格图。实训21实现JoinGrid网格图。实训22Pyecharts绘制基本图表。实训23Pyecharts绘制直角坐标系图表。实训24Pyecharts绘制树形图表。实训25Pyecharts绘制地理图表。实训26Pyecharts绘制3D图表。15不同类型谷物营养成分分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:本案例要求收集包含多种类型的谷物数据,记录了每种谷物的蛋白质、脂肪、糖分等数据,基于获取的谷物数据进行分析,了解各种谷物富含的营养素,分析人体每天摄入的各类营养成分,并为人们提供不同谷物的选择方案。三、案例技术前置课程《Python特征工程实战》(一)课时设置:理论教学不少于24学时,实践教学不少于24学时,总计不少于48学时。(二)课程资源:包含实训指导书数量≥10份、课程视频数量≥65个、课程PPT数量≥7份、代码数量≥6个、数据数量≥6个。(三)课程内容包括但不限于:第1章特征工程介绍:1.1特征工程是什么。1.2特征工程效果评估。1.3定性还是定量。1.4数据的4个等级介绍1.5数据的4个等级演示。第2章数据预处理:。2.1探索性数据分析2.2探究不同类别样本的血糖浓度。2.3缺失值探索。2.4删除缺失值。2.5构建基线模型。2.6网格搜索优化。2.7利用0进行缺失值填充的模型性能。2.8利用均值进行缺失值填充的模型性能。2.9标准化和归一化介绍。2.10结合机器学习流水线进一步优化。2.11数据预处理小结。第3章特征构建:3.1特征构建引言。3.2分类数据的填充。3.3自定义分类数据填充器。3.4自定义定量数据填充器。3.5编码定类数据。3.6编码定序变量。3.7连续变量分箱。3.8在流水线中封装预处理操作。3.9拓展数值特征的模型基线。3.10多项式特征模型性能。第4章特征选择:4.1特征选择介绍。4.2数据导入及探索。4.3基于皮尔逊相关系数的特征选择。4.4特征选择前后模型性能比较。4.5基于假设检验的特征选择。4.6基于树的特征选择。4.7特征选择后模型性能探索。4.8基于线性模型的特征选择。4.9小结。第5章降维与特征转换:5.1特征转换介绍。5.2主成分分析(PCA)介绍。5.3PCA工作流程实现。5.4PCA方差分析。5.5利用sklearn实现PCA。5.6深入解释PCA之相关性探究。5.7深入解释PCA之线性变换。5.8深入解释PCA之数据分布探索。5.9PCA小结。5.10LDA工作流程及实现。5.11sklearn实现LDA。5.12LDA数据分布探索。5.13应用特征转换。5.14小结。第6章特征学习:6.1特征学习介绍。6.2受限玻尔兹曼机(RBM)工作原理。6.3MNIST数字识别任务介绍。6.4MNIST数据准备。6.5PCA特征分析。6.6RBM特征学习。6.7构建基线模型。6.8加入PCA进行模型优化。6.9加入RBM进行模型优化。6.10多层受限玻尔兹曼机第7章案例分析:表情识别:。7.1表情识别任务介绍7.2读取数据。7.3提取特征脸。7.4构建基线模型。7.5加入PCA过程。7.6加入LDA过程。(四)课程实验包括但不限于:实训1数据探索。实训2处理缺失值及构建基线模型。实训3训练模型及数据标准。实训4特征构建。实训5特征选择。实训6主成分分析(PCA)。实训7线性判别分析(LDA)。实训8应用特征转换。实训9基于特征学习的MNIST手写数字识别。实训10表情识别。16星巴克菜单营养成分分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:本案例数据集记录了星巴克食品和饮料菜单项的营养信息等数据,其中饮料的营养信息均为12盎司食用量,本案例基于获取的星巴克菜单的营养信息数据进行分析,了解各种菜品含有的营养素,分析人体每天摄入的各类营养成分,并为消费者的选餐和其他餐饮行业的菜品调整提供参考价值。三、案例技术前置课程《智能推荐算法》(一)课时设置:理论教学不少于12学时,实践教学不少于12学时,总计不少于24学时。(二)课程资源:包含课程视频≥18个、课程PPT≥2份、实训指导书≥3份、代码≥3份、数据≥2份。(三)课程内容包括但不限于:第1章智能推荐系统简介。1.1智能推荐简介。1.2基于内容的推荐。1.3协同过滤推荐。1.4基于深度学习的推荐&复合推荐。1.5智能推荐系统性能度量。第2章关联规则。2.1关联规则简介。2.2事务和项集。2.3支持度与置信度。2.4Apriori算法流程。2.5Apriori算法实现。第3章协同过滤。3.1协同过滤推荐算法流程。3.2新闻推荐数据介绍。3.3数据准备。3.4模型构建。3.5构建测试集用户网址浏览字典。3.6执行推荐操作。.7推荐结果评估。第4章FM&Ranking模型。4FM&Ranking模型(四)课程实验包括但不限于:实训1准备数据。实训2构建模型。实训3推荐与评估。17世界各地食品成分探索分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:本案例数据集记录了来自多个国家/地区的多种食品数据,其中包含成分,过敏原,营养成分等信息,本案例基于获取的食品数据进行分析,了解各食品的过敏原和营养成分等信息,分析人们对不同食品的过敏情况,根据人们的实际需求推荐相关的食品。三、案例技术前置课程《Linux操作系统基础》(一)课时设置:理论教学不少于16学时,实践教学不少于16学时,总计不少于32学时。(二)课程资源:包含实训指导书≥15份、课程视频≥25个、课程PPT≥5份、代码≥14份。(三)课程内容包括但不限于:第1章Linux概述:1.1Linux概述。第2章Linux系统安装:2.1创建虚拟机并配置Xshell连接。第3章Linux基本命令:3.1文件系统介绍。3.2语法格式。3.3创建和删除文件和目录。3.4查看文件内容。3.5创建硬链接和符号链接。3.6重定向相关命令。3.7用户和用户组。3.8权限相关命令。3.9动手实践2-5。3.10进程。第4章LinuxVi编程:4.1Vi编辑器介绍。4.2Vi编辑器快捷键。4.3Vi编辑器快捷方式补充。4.4Vi编辑器动手实践。第5章LinuxShell编程:5.1LinuxShell编程介绍。5.2Shell变量&字符串。5.3数组、注释和传参。5.4算术运算符。5.5if语句和其他运算符。5.6动手实践4-5。5.7for循环。5.8while循环。5.9case条件选择。(四)课程实验包括但不限于:实训1文件与目录管理。实训2查看文件内容。实训3Linux帮助命令。实训4输入输出重定向及其相关命令。实训5用户与用户组管理。实训6管理文件权限。实训7Linux进程管理。实训8Linux计划任务管理。实训9使用vim编辑器。实训10Shell编程之数值运算。实训11Shell编程之if条件语句。实训12Shell编程之for循环。实训13Shell脚本实现创建目录与权限设置。实训14Shell脚本计算斐波那契数列前10项和。实训15Shell脚本实现人机石头剪刀布游戏。18儿童营养不良数据分析实战案例一、案例资源:包含≥2份实训指导书、≥1份数据、≥1份代码、≥1份配置文档。二、案例要求:本案例要求基于获取的全球儿童营养不良进行分析,了解各国家/地区儿童营养不良的情况,分析不同情况下的营养不良产生的症状,为解决儿童营养不良的问题提供相应的方案。三、案例技术前置课程《Java编程基础》(一)课时设置:理论教学不少于16学时,实践教学不少于16学时,总计不少于32学时。(二)课程资源:包含视频≥31个、课程PPT≥17份、实训指导书≥6份、代码≥15份。(三)课程内容包括但不限于:第1章基础知识:1.1Java简介。1.2Java安装配置。1.3Java基础语法。1.4Java基本数据类型&引用数据类型。1.5Java变量。1.6JavaString类。1.7Java

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论