版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教案2024——2025学年第2学期课程名称大数据分析与应用(初级)课程代码13030009适用专业大数据管理与应用学时48学分3开课学院数字经济产业学院开课教研室大数据管理与应用授课教师职称授课班级
编写说明1.凡承担专业人才培养方案中开设课程的教师,在授课前均应按要求编写教案。2.任课教师在编写教案时要根据课程教学大纲(课程标准)要求,围绕课程教学目标设计和组织教学,选择有助于达成课程教学目标的教学策略和方法。3.任课教师在编写教案时应结合教学内容和教案基本要素制定详尽的授课内容、授课步骤、授课方法和手段。4.教案的基本设计单位是一次课程教学(一般为2学时),并应与教学日历安排相对应,每次课程应填写一份教案首页。5.任课教师在全部课程教学结束后应对教学实施情况进行总结。6.任课教师应在课程教学结束后一周内将教案提交给开课学院,开课学院纸质版教案整理后归档保存。
教案首页授课题目(项目或模块)第一章大数据分析概述授课时间第一周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:大数据的定义、特征、应用与挑战、意义与发展趋势。能力目标:理解大数据的定义和特征,掌握大数据分析的应用场景。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪课程导论(教材、课程内容体系、课程目标、课程背景与重要性、课程考核)▪什么是大数据教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材R多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):课程导论向学生介绍本门课程的基本情况、使用教材、课程内容体系、课程目标;向学生介绍大数据分析的行业背景,并结合数据展示大数据分析的行业需求与就业情况;向学生介绍本门课程的考核方式与成绩构成、在线学习资源、学习建议(先询问学生对本门课程的目标或心理预期,再根据学生的不同预期提供学习建议,引导学生明确学习目标、采取相应行动)。介绍完以上内容后找同学起来回答课程的考核方式和构成,确保学生清楚课程的考核方式和比例,强调考试课需要熟练掌握知识点、日常学习过程中注重积累、学习态度和目标要明确。课堂讲授(一)大数据的定义1.概念(讲授大数据的概念之前先提问学生认为什么是大数据,让学生先行思考,有大概想法再讲授大数据的概念,通过认知对比加深学生印象。)大数据(BigData)指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。2.为什么会有大数据存储和计算技术的发展、IT技术和移动互联网的发展。3.大数据的发展历程(二)大数据的特征1.Volume体量巨大(提问学生日常手机用到的储存空间是多少,了解的储存单位有哪些?通过提问引入大数据体量巨大的主题。)2.Variety种类繁多讲授结构化数据、非结构化数据、半结构化数据的概念及其例子,以及各自在大数据中所占比例。3.Velocity高处理速度1秒定律:要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值了。4.Value低价值密度以警察查看监控寻求嫌疑人线索为例进行讲述。(三)大数据的应用1.商业(用户画像、个性化推荐、精准营销)2.工业(产品调试)3.医疗(疾病预防、预测)4.城市治理(杭州城市大脑,减少交通拥堵)大数据的挑战大数据特征方面:数据规模、多样性与异构性、实时性要求、价值密度低。实用场景方面:隐私问题、数据的访问与共享、人机协作、数据的合理性。大数据的意义与发展趋势意义:思维的变革、商业的变革、管理的变革发展趋势:1.政策热度持续攀升;2.融合提速,不均衡现象突出(结合前面的行业需求数据讲解不均衡现象:行业分布不均衡、业务类型不均衡、地域分布不均衡。)3.创新与升级。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习大数据的概念、特征、意义与发展趋势。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):
教案授课题目(项目或模块)第一章大数据分析概述授课时间第二周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解大数据分析的概念、产生与发展、应用场景、流程、技术。能力目标:理解大数据分析的概念,掌握大数据分析的流程及技术。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪什么是大数据分析▪大数据分析的流程与常用技术教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材R多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生大数据的概念、4V特征。二、课堂讲授(一)什么是大数据分析1.大数据分析的概念数据分析是基于商业等目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的过程。2.大数据分析的产生与发展数据基础、商业智能的出现、技术基础3.大数据分析的应用场景举例1:“啤酒与尿布”“啤酒与尿布”的故事可以说是营销界的经典段子。这个故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员在分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,啤酒与尿布两件看上去毫无关系的商品会经常出现在同一个购物篮中,而且,啤酒与尿布在周末的时候销量明显会高于平时。这种独特的销售现象引起了管理人员的注意。他们经过后续调查发现,这种现象出现在年轻的父亲身上。举例2:大数据在疫情期间关于感染高峰时间的预测(二)大数据分析的流程与常用技术1.大数据分析的流程(1)大数据采集(2)大数据处理(3)大数据存储与管理(4)大数据分析(5)大数据可视化(6)数据分析报告2.大数据采集技术数据采集方法:WEB端、APP端、传感器、数据库、第三方。3.大数据预处理技术数据预处理技术:数据清洗、数据集成、数据归约、数据变换。4.大数据存储与管理技术结构化数据、半结构化数据、非结构化数据5.大数据分析技术离线批处理、实时流处理的原理及其应用平台。分析方法:描述型分析、诊断型分析、预测型分析、指令型分析。数据挖掘:分类、回归、关联、聚类。6.大数据可视化技术常见方法、常见可视化图表、图表类型的使用场景、BI工具、图形报表工具。(三)大数据分析相关职业及技能要求课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习大数据分析的概念、流程、技术。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)实验项目一:认识大数据分析工具授课时间第二周星期五第6-7节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:认识大数据分析工具Excel、Tableau、蓝鲸、SPSS,并进行数据分析操作。能力目标:掌握Excel、Tableau、蓝鲸、SPSS的应用场景及数据分析操作。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪认识大数据分析工具Excel▪认识大数据分析工具Tableau▪认识大数据分析工具“蓝鲸”▪认识大数据分析工具SPSS教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材R多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生大数据分析的概念、流程、技术。二、课堂讲授(一)认识大数据分析工具excel创建数据透视表和数据透视图、降序排序、添加标签、更改图表标题。(二)认识大数据分析工具Tableau1.介绍Tableau的安装2.将数据导入Tableau3.选择需要操作的工作表、建立数据源演示操作步骤4.进入工作表编辑页面5.介绍Tableau的操作页面、功能区域6.建立可视化图形演示操作步骤7.添加标记、修改图形名称让学生在Tableau中进行以上操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。(三)认识大数据分析工具“蓝鲸”1.介绍蓝鲸的下载与安装途径2.介绍蓝鲸启动后的页面3.介绍蓝鲸各功能板块中的组件4.演示在蓝鲸中导入数据表5.演示设置变量类型6.演示在蓝鲸中创建工作流让学生进行以上操作,并完成以下任务:在蓝鲸中导入“实操原始数据”Excel表格中的“空调销量”Sheet表数据添加“数据信息”、“数据表格”组件,查看组件返回结果(四)认识大数据分析工具SPSS介绍SPSS的主要窗口和视图界面,演示视图切换和窗口显示、导入数据、构建数据图表。在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):参考实验指导书完成实验一,并提交实验报告。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):
教案授课题目(项目或模块)第三章数据采集授课时间第三周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解大数据的来源与数据分类,了解数据采集的概念、方法、途径、流程、工具,了解爬虫技术。能力目标:掌握大数据的来源,掌握数据采集的流程、工具及其应用场景,掌握爬虫原理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪数据采集概述▪数据采集工具教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生利用数据操纵语言和数据查询语言的语法格式、子句类型。二、课堂讲授(一)业务理解与需求分析1.业务理解的主要工作2.需求分析的概念及流程(二)数据采集概述1.什么是数据采集提问学生:“采集”与“收集”有什么不同?数据采集,是指从数据源采集或获取数据的过程,即根据需求、数据源的类型、数据格式,以及数据量、数据产生速度等因素选择适当方法采集数据。2.大数据的来源讲述大数据来源前先讲大数据的分类。按照数据结构对数据分类:结构化数据、半结构化数据、非结构化数据。按照数据类型对数据分类:业务数据、行业数据、内容数据、线上和线下行为数据。数据来源系统:企业系统、机器系统、互联网系统、社交系统数据类型与数据源的关系补充:常用数据来源渠道及对应的数据源类型(演示百度指数(关注搜索关键词后趋势研究、需求图谱、人群画像的查看和显示结果)、国家统计局、中国互联网信息中心(CNNIC)、艾瑞咨询等部分网站的搜索方法、网站介绍和数据查看路径。)3.数据采集方法按数据来源分类:数据库(ETL工具)、系统日志(分布式日志采集系统)、网络数据(爬虫、开放API)、感知设备数据(设备自动采集)。按量化与否分类:定性数据(问卷调查、用户访谈)、定量数据(第三方平台统计、网络爬虫、网络日志、业务数据库)。按是否直接获取分类:直接来源(业务系统数据库、调查或实验)、间接来源(报纸、书籍、统计年鉴和相关网站等)。4.数据采集途径业务系统数据、日志数据、网络数据、感知设备数据5.数据采集的原则及时性原则、有效性原则、准确性原则、合法性原则6.数据采集流程及注意事项注意事项:要注意确定采集范围及人员分工、要注意准确识别信息需求、要注意明确分析对象、要注意按需求采集数据、要注意建立必要的数据指标规范、要注意数据采集后对数据进行检查(完整性、准确性、规范性)。(三)数据采集工具常用的数据采集工具根据其功能和来源大致分为三类:(1)平台提供的数据工具,主要包括平台店铺后台、生意参谋、京东商智、数据易道、多多情报通、逐鹿工具箱等。(2)网页数据采集工具(爬虫),主要包括八爪鱼、火车采集器、后羿采集、Python语言爬虫、数据导航网站等。网页数据采集的原理:网络爬虫(Crawler,又被称为网页蜘蛛Spider、网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。网络爬虫可分为两类:(1)通用爬虫,爬取对象从一些种子URL扩充到整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。(2)聚焦爬虫:选择性地爬取那些与预先定义好的主题相关页面的网络爬虫。爬虫道德(提醒学生在合法途径下采集数据,在满足需求的情况下,尽量降低给服务器带来的负担,不要一次性发送大量的请求)网页数据采集关键步骤:抓取目标的定义与描述、网页URL的搜索策略、网页内容解析。常用数据采集工具分类、功能及适用场景课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习大数据的来源与分类,数据采集的概念、流程和常用工具。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)第三章数据采集授课时间第四周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解八爪鱼数据采集器的功能页面,熟悉八爪鱼的数据采集步骤和操作。能力目标:能熟练运用八爪鱼数据采集器采集网页数据,并进行初步的数据处理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪八爪鱼的下载与安装▪八爪鱼的操作页面及功能介绍▪使用八爪鱼进行数据采集教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生大数据的分析流程、商务数据的来源渠道、商务数据的来源渠道、数据采集的原则、数据采集检查等问题。二、课堂讲授(一)八爪鱼的下载与安装展示八爪鱼的下载网址()与安装步骤。在课堂巡视并观察学生的软件下载和安装过程,对学生的问题进行指导与解答。(二)八爪鱼的操作页面及功能介绍1.操作页面的基本介绍2.新建任务、“自动识别网页”的功能演示3.选择网页元素(单个字段和全部字段)的操作演示4.启动本地采集功能、数据导出演示让学生进行自动采集和选取字段的操作,在课堂巡视并观察学生的操作过程,对学生的问题进行指导与解答。(三)使用八爪鱼进行数据采集1.采集列表数据演示豆瓣网站“最受关注图书榜-小说”的列表数据采集操作步骤:选中列表的第一行或第一项(注意:选中范围要包含需采集的全部字段)。在操作提示框中点击“选中(全部)子元素”--“选中全部(相似组)”--“采集数据”(提取数据:元素中数据内容)。(如果没有出现“选中子元素”选项,则继续选中第二个列表项,选中范围要与第一个完全相同,在操作提示框中点击“采集以下元素文本”,再点击目标字段,选择“提取文本/链接”)。点击“采集”--“本地采集”--“普通模式”--“导出数据”。让学生运用八爪鱼采集器进行网站列表数据的采集操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。2.采集详情页数据演示豆瓣网站“最受关注图书榜-小说”的详情页数据采集操作步骤:点击列表中第一个可以跳转到详情页的位置,通常是标题或图片。点击“选中全部(相似元素)”。在操作提示框中点击“循环点击每个链接/图片/元素”。进入详情页内后,选中需要的字段,点击“采集该元素的文本”(提取数据:文本内容)。点击“采集”--“本地采集”--“普通模式”--“导出数据”。让学生运用八爪鱼采集器进行网站详情页数据的采集操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。3.既采集列表页数据又采集详情页数据演示列表页和详情页数据采集操作步骤:选中一个列表数据(注意:选中范围要包含需采集的字段和要点击的项),在操作提示框中点击“选中子元素”。在操作提示框中点击“选中全部”--“采集数据”。点击页面中红框数据(可跳转的位置)--在操作提示框中选择“点击该链接(元素/图片)”。进入详情页内后,选中需要的字段,点击“选择该元素的文本”。点击“采集”--“本地采集”--“普通模式”--“导出数据”。让学生运用八爪鱼采集器进行网站列表页和详情页数据的采集操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。4.翻页采集多页数据演示翻页采集多页数据的设置及操作步骤:选中列表第1页的第一行或第一项数据。在操作提示框中点击“选中(全部)子元素”--“选中全部(相似组)”--“采集数据”(提取数据:元素中数据内容)。点击页面中表示翻页的按钮,在操作提示框中点击“循环点击下一页”。在高级设置中选中“Ajex加载”,并设置超时时间。点击“循环翻页”,设置翻页次数--“应用”。点击采集--本地采集--普通模式--导出数据。让学生运用八爪鱼采集器进行网站多页数据的采集操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。5.修改字段演示在八爪鱼内数据预览页面进行字段的修改、删除、替换等操作步骤让学生运用八爪鱼采集器对预览数据进行字段的修改、删除、替换等操作步骤,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):预习实验指导书实验项目三。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)实验项目二:数据采集授课时间第四周星期五第6-7节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:熟悉八爪鱼进行网页数据采集的步骤和操作。能力目标:熟练运用八爪鱼数据采集器采集网页数据,并进行初步的数据处理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪利用八爪鱼进行豆瓣读书名著数据的采集▪利用八爪鱼进行“大数据分析”岗位招聘数据的采集教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)☑练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾八爪鱼的数据采集操作。二、课堂实验(一)利用八爪鱼进行豆瓣读书名著数据的采集1.接入数据源打开八爪鱼软件,在左侧菜单栏点击“新建”--“自定义任务”,在新建任务页面中输入需要采集数据的网址,点击“保存设置”。2.建立采集任务(1)选中列表的第一行或第一项(注意:选中范围要包含需采集的全部字段),在操作提示框中点击“选中(全部)子元素”--“选中全部(相似组)”--“提取数据:元素中数据内容(采集数据)”。(2)点击页面中红框数据(可跳转的位置),在操作提示框中选择“点击该链接(元素/图片)”。(3)在页面跳转进入详情页面后,选中需要采集的字段范围,在操作提示框中选择“提取数据:文本内容”或者“提取数据:元素中数据内容”。(4)完成全部所需字段的提取操作后,点击右侧流程图中的“循环列表”回到列表页。将鼠标滚动到页面中翻页的区域,单击页面中表示翻页的按钮,在操作提示框中点击“循环点击(下一页)”。(5)在右侧的流程图中单击“循环翻页”,在基础设置下方设置翻页次数,点击应用。然后在右侧的流程图中单击“点击翻页”,单击“高级设置”,设置步骤执行前等待时间,点击应用。(6)在数据预览页面单击字段按钮,更改原始字段名为新字段名。3.数据导出完成采集任务设置后,在右上角点击“采集”,选择“本地采集”中的“普通模式”。数据采集结束以后,单击“导出数据”--“去重数据”,选择Excel文件类型保存。(二)利用八爪鱼进行“人工智能”岗位招聘数据的采集1.接入数据源2.建立采集任务(只需采集列表页数据即可)3.字段名修改4.数据导出与保存学生实践期间在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):利用八爪鱼采集招聘网站岗位数据,完成实验二提交实验报告与数据采集结果excel文件。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):4.凌洁.商务数据采集与处理[M].人民邮电出版社,2022.教案授课题目(项目或模块)第三章SQL基础授课时间第五周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解SQL的产生和发展、语言分类,了解数据定义语言的语句、语法结构。能力目标:掌握SQL语言的分类,掌握数据定义语言的语句、语法结构。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪SQL概述▪数据定义语言教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材R多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生大数据的概念、大数据分析的流程,大数据分析工具。讲课之前先了解学生此前是否已经学习过《数据库原理及应用》课程,对SQL语言是否有学习基础,而后根据学生情况调整教学内容和重难点讲授。二、课堂讲授(一)SQL概述1.SQL的产生和发展结构化查询语言(StructuredQueryLanguage),简称SQL,是数据库编程的核心语言。SQL是一个标准的数据库语言,是面向集合的描述性非过程化语言。SQL的强大功能:语法简单、高效的语言、容易理解。2.SQL的分类SQL语言有以下四大类:数据查询语言(DQL)数据查询语言,用于查询中的数据,分别为:SELECT、FROM、WHERE、ORDERBY、GROUPBY、HAVING等子句。数据定义语言(DDL)数据定义语言,用于创建、修改、删除数据库/数据表等,分别为:CREATE、ALTER、DROP。数据操纵语言(DML)数据操纵语言,用于对表中的数据进行新增、删除、修改操作,分别为:INSERT、DELETE、UPDATE。数据控制语言(DCL)数据控制语言,用于设置或者更改数据库用户或角色权限,分别为:GRANT、DENY、REVOKE。3.SQL与大数据分析(二)数据定义语言数据定义语言,用于创建、修改、删除数据库/数据表等,分别为:CREATE(创建)、ALTER(修改)、DROP(删除)。1.创建数据库(1)创建数据库概念创建数据库是指在数据库系统中划分一块空间,用来存储相应的数据。这是进行表操作的基础,也是进行数据库管理的基础。(2)创建数据库的语法结构createdatabase[ifnotexists]databasename[[default]charactersetcharset_name][[default]collatecollation_name];(3)数据库命名的规则不能与其他数据库重名,否则将发生错误。名称可以由任意字母、阿拉伯数字、下划线(_)和“$”组成,可以使用上述的任意字符开头,但不能使用单独的数字,否则会造成它与数值相混淆。名称最长可为64个字符,而别名最多可长达256个字符不能使用关键字作为数据库名、表名。讲解例题,介绍MySQLWorkbench的登录途径和操作页面,演示操作过程。让学生使用MySQLWorkbench创建一个名称为student的数据库,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。(4)创建表的语法结构补充“主键”的内涵、常用数据类型的写法(整数(int);小数(decimal);日期时间类型(date,time,datetime,year);字符串(char,varchar))。讲解例题,演示操作过程。让学生创建两个名称分别为class和student的数据表,观察学生的操作过程,对学生的操作问题进行指导与解答。2.修改数据库与数据表讲解例题,演示操作过程。3.删除数据库与数据表讲解例题,演示操作过程。补充在删除数据表之前对表格的备份操作。让学生进行上述操作,观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习SQL语言的分类,数据定义语言的语句、语法结构。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)第三章SQL基础授课时间第六周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解数据操纵语言的语句及语法结构,了解数据查询语言的语句及语法结构。能力目标:掌握数据操纵语言的语句及语法结构,掌握数据查询语言的语句及语法结构。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪数据操纵语言▪数据查询语言教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材R多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生SQL语言的分类,创建、修改、删除数据库和数据表的语法结构。二、课堂讲授(一)数据操纵语言1.表记录的插入讲解insertinto语句的语法格式,说明:(1)使用insert语句可以向表中插入一行数据,也可以插入多行数据,最好一次插入多行数据,各行数据之间用“,”分隔。(2)values子句包含各列需要插入的数据清单,数据的顺序要与列的顺序相对应。若表名后不给出列名,则在values子句中要给出每一列的值,如果列值为空,则值必须置为null,否则会出错。讲解例题,补充附加例题,演示操作过程。让学生完成向class表中插入数据和向student表中插入数据的操作,观察学生的操作过程,对学生的操作问题进行指导与解答。2.表记录的修改讲解update...set...语句的语法格式:updatetable_namesetcol_name1=expr1[,col_name2=expr2...][where子句]讲解例题,演示操作过程。让学生完成将文秘1901班班主任的名字修改为“张野”的操作,观察学生的操作过程,对学生的操作问题进行指导与解答。3.表记录的删除讲解delete…from…语句的语法格式,讲解例题3-16,演示操作过程。让学生完成删除class表中会电1901班的记录的操作,观察学生的操作过程,对学生的操作问题进行指导与解答。(二)数据查询语言1.查询(select)查询表中的所有字段,例题:SELECT*FROMstudent;查询表中的部分字段,例题:SELECTs_id,s_name,s_sexFROMstudent;2.条件查询(where)3.模糊匹配(like)两种通配符:“%”和下划线“_”。其中,“%”可以匹配一个或多个字符,可以代表任意长度的字符串,长度可以为0。“_”只匹配一个字符。演示讲解例题。4.范围条件匹配查询(between)讲解例题,在例题基础之上提问学生还可以如何写代码。5.集合判断(in)6.空值查询(isnull)7.排序(orderby)使用orderby的说明,讲解并演示例题。8.数量限制(limit)limit是用来限制查询结果的数量的子句。可以指定查询结果从哪条记录开始显示。还可以指定一共显示多少条记录。limit子句中有两个参数“初始位置”和“记录数”,“初始位置”是开始读取第1条记录的编号(注意:在MYSQL查询结果中,第1条位置编号为0),省略该参数则从第1条开始返回;“记录数”是指要查询记录的个数。9.去重(distinct)10.连接查询-连接(join)讲解全连接、内连接、外连接和交叉连接的原理及例题。11.聚合函数常用聚合函数:AVG(字段名)、MAX(字段名)、MIN(字段名)、SUM(字段名)、COUNT(*)。12.分组(groupby&having)讲解演示例题,讲解时让学生思考groupby后面跟的字段顺序不同显示结果有何不同,提供两张显示结果截图让学生进行判断。13.子查询重点讲解例题。补充:出现“ErrorCode:1175.YouareusingsafeupdatemodeandyoutriedtoupdateatablewithoutaWHEREthatusesaKEYcolumn.。。。”反馈,则输入代码:SETSQL_SAFE_UPDATES=014.分支判断15.联合查询在原例题基础之上提问学生还可以如何写代码。讲解并部分演示例题的操作过程,让学生完成部分操作,观察并指导学生的操作。课程与章节总结复习思考及作业布置(目的是帮助学生达成教学目标):复习数据操纵语言的语句及语法结构、数据查询语言的语句及语法结构。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)第四章数据预处理授课时间第七周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解数据处理的概念、意义、数据质量问题的来源,了解数据质量管理标准的6个维度,了解数据脱敏的概念、原则、方法。能力目标:理解数据处理的意义,掌握数据质量管理标准的6个维度,掌握数据脱敏的原则和方法。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪数据处理概述▪数据处理的主要工作教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生八爪鱼数据采集的操作步骤,数据采集完需要检查的内容。二、课堂讲授(一)数据处理概述1.数据处理的概念与意义先提问学生,让学生自行思考数据处理是什么、为什么要进行数据处理。数据处理是数据采集完以后将其导入大数据分析工具,在大数据分析之前对数据进行处理的有关工作。数据处理的意义是保证数据质量。2.数据质量问题的来源3.数据质量管理的必要性在讲述数据质量管理的必要性之前,先给学生看一副漫画,让学生思考漫画表达的含义,再引出“GIGO(GarbageInGarbageOut)”原则。4.数据质量管理标准的6个维度:完整性、唯一性、及时性、有效性、准确性、一致性。数据处理的主要工作1.数据脱敏(1)数据脱敏的概念又称数据去隐私化或数据变形,是在给定的规则、策略下对敏感数据(比如手机号、身份证号、银行卡等信息)进行转换、修改的技术手段,能够在很大程度上解决敏感数据在非可信环境中使用的问题。(2)数据脱敏的原则保持原有数据特征、保持数据之间的一致性、保持业务规则的关联性、多次脱敏之间的数据一致性。(3)数据脱敏的方法(在讲授脱敏方法之前,先让学生自己思考如何对敏感信息进行脱敏。而后讲授过程中用原始数据和脱敏后的数据做对比展示)遮蔽对敏感数据的全部或部分内容采用*或#等字符进行遮蔽替换用一个设定的虚拟值替换真值随机采用和元数据结构相同、内容相近的随机内容进行随机替换,确保数据格式不变偏移和取整保持了数据的安全性的同时保证了范围的大致真实性灵活编码2.数据清洗(1)缺失值的处理概念:缺失数据是指原始数据中存在的空缺或无效数据。数据缺失产生的原因:机械原因和人为原因。处理方法:删除个案删除个案就是将有缺失数据的个案都删除掉,不参加数据分析。适用于样本量很大、缺失数据的个案比例不太大的情况,而且有缺失数据的个案和无缺失数据的个案在分布上无显著差异时,才考虑使用,否则会使分析结果产生严重偏差。删除缺失值不删除有缺失数据的所有个案,仅在分析时删除相应变量的缺失数据,也就是对变量有完整回答的个案才能参与计算,对变量有缺失的个案不参加该次计算。适用于在样本量不大、缺失数据较少并且变量间不是高度相关的情况下。数据填补利用其它数据替代或估算缺失值的方法。用某个变量的样本均值、中位数或众数,代替无效值和缺失值。根据调查对象对其他问题的答案,通过变量之间的相关分析或逻辑推论进行估计。(2)异常值的处理根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据。(发现不一致时,要列出问卷序号、记录序号、变量名称、错误类别等,便于进一步核对和纠正。)异常值的表现:超出正常范围、逻辑上不合理或者相互矛盾。各行业和各场景下对待异常值的态度不同。异常值检测:简单统计量分析对变量进行描述性统计,进而查看哪些数据是不合理的。最常用的统计量是最大值和最小值,用来判断变量的取值是否超出了合理的范围。3σ原则如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过三倍标准差的值。如果数据不服从正态分布,用远离平均值多少倍标准差来描述。箱线图分析箱型图识别异常值的一个标准,异常值通常被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。按照处理方式可以分为图形法(箱型图或者正态分布图)和模型法。异常值的一般处理方法:(注意:先分析异常值出现的原因,再视具体情况判断异常值是否被舍弃。)(3)数据类型转换(4)重复值处理重复值的存在会影响数据分析结果的准确性,所以,在数据分析和建模之前需要进行数据重复性检验,如存在重复值,还需进行重复值的删除。处理方法:数据工具法、高级筛选法、COUNTIF函数法、条件格式法。(5)数据清洗的注意事项3.数据转换的常见策略(1)平滑处理:去除数据中的噪声,常用方法包括分箱、回归和聚类等。(2)标准化处理:将数据按照一定的比例缩放,主要有Min-Max标准化,Z-Score标准化等。(展开讲授Min-Max标准化和Z-Score标准化的原理及实例)(3)聚集处理:对数据进行汇总操作。如聚集日销售数据计算月和年销售量。(4)离散化处理:将连续属性数据取值范围划分为若干离散化的区间,分别用不同的符号或整数值代表落在每个子区间的数值。主要有等宽法、等频法等。(5)泛化处理:用更高层次的概念取代低层次的数据对象,例如,年龄是一个低层次的概念,经过泛化处理后会变成诸如青年、中年等高层次的概念。(6)属性构造:利用已有的属性集构造出新的属性,并将其加入现有的属性集合。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习数据处理的意义,掌握数据质量管理标准的6个维度,掌握数据脱敏的原则和方法。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)第四章数据预处理授课时间第八周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解数据处理的实践操作。能力目标:能够运用Excel软件和蓝鲸软件对数据进行预处理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪数据处理的实践操作教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生数据质量管理标准的6个维度、数据脱敏方法,数据清洗的内容、数据转换策略。二、课堂讲授(一)使用Excel进行数据处理1.用Excel进行数据清洗(1)重复数据处理数据工具法、高级筛选法、COUNTIF函数法、条件格式法演示操作步骤(2)缺失数据处理演示操作步骤(3)逻辑错误数据的处理演示操作步骤让学生对“会员信息表”Excel表格中的“会员信息表”Sheet表数据进行缺失数据处理、逻辑错误数据处理,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。2.用Excel进行数据转换演示数据抽取、字段合并、字段匹配、数据计算、数据分组、数据互换的操作步骤。让学生对“会员信息表”Excel表格中的“会员信息表”、“发货表”Sheet表分别进行上述数据处理操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。3.用Excel进行数据抽样提问:如何在会员信息表中根据会员编号抽取5位获奖会员?演示操作步骤,让学生进行操作。(二)使用蓝鲸进行数据处理1.数据清洗演示数据清洗中缺失值处理的操作步骤2.数据转换演示数据转换中数据标准化和离散化处理的操作步骤让学生对“网站流量数据”数据进行缺失值处理,对“消费者身体形态数据”数据进行标准化处理和离散化处理的操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习数据处理的实践操作。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):1.何伟,张良均.Python商务数据分析与实战[M].人民邮电出版社,2022.3.郑小玲,王静奕.Excel数据处理与分析实例教程(微课版第3版)[M].人民邮电出版社,2022.4.刘宝强.商务数据采集与处理(微课版)[M].人民邮电出版社,2019.教案授课题目(项目或模块)实验项目三:数据预处理(1)授课时间第八周星期五第6-7节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:使用Excel软件进行数据预处理操作。能力目标:熟练运用Excel软件对采集到的岗位招聘数据进行预处理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪使用Excel进行数据处理教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生数据清洗的内容与处理方法、数据转换的策略。二、课堂讲授运用Excel软件针对前面采集到的岗位招聘数据进行处理。1.“工作城市”字段提取运用“分列”功能对原始“工作地点”字段进行拆分,提取城市/区字段,具体操作步骤:选中拆分数据区域,单击“数据”--“分列”--在弹出的“文本分列向导”对话框中选择“分隔符号”,单击“下一步”按钮;在“文本分列向导”第2步对话框中,“分隔符号”中勾选所需分隔符号(如“其他”选项,输入“点"),单击“下一步”按钮;在“文本分列向导”第3步对话框中,分别设置分隔后每个列的属性(点击“数据预览”下每一列),在“列数据格式”下选“文本”,“目标区域”选择分列数据的起始单元格,点击“完成”按钮即拆分完成。演示操作步骤,让学生进行操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。2.薪资数据转换将原始数据范围抽取转换为最低薪酬、最高薪酬、平均薪酬、年薪、额外薪酬等,具体操作步骤:先利用“分列”功能对原始数据进行拆分,然后将年薪转换为月薪,将薪酬统一转换为完整数值。3.学历与经验要求拆分通过LEFT函数和FIND函数的嵌套使用提取经验要求数据,通过RIGHT函数、LEN函数和FIND函数的嵌套使用提取学历要求数据。让学生对之前采集到的岗位招聘数据进行上述处理操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):运用Excel软件或AI工具完成岗位招聘数据处理,提交实验报告。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)实验项目三:数据预处理(2)授课时间第九周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:使用AI工具进行数据预处理操作。能力目标:熟练运用AI工具对采集到的岗位招聘数据进行预处理。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪使用AI工具进行数据处理教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生数据清洗的内容与处理方法、数据转换的策略。二、课堂讲授运用AI工具针对前面采集到的岗位招聘数据进行处理。1.KIMI工具的使用打开KIMI网页,将需要处理的数据(如公司类型与规模字段)复制到聊天框内,然后输入指令,如“请帮我将上述数据拆分成3列,第一列首行命名为“行业”,第二列首行命名为“融资情况”,第三列首行命名为“公司规模”,其中,“融资情况”那一列根据数据实际情况处理,有就填,没有就空白。以表格形式返回。”,等待KIMI完成处理过程,再将数据复制粘贴到excel表格中。学生进行操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。2.酷表ChatExcel工具的使用打开ChatExcel页面,将需要处理的excel文件上传,然后在聊天框内输入指令,等待ChatExcel处理完毕后,可直接下载处理好的excel文档。学生进行操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。让学生对之前采集到的岗位招聘数据运用上述AI工具进行处理操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):运用Excel软件或AI工具完成岗位招聘数据处理,提交实验报告。思考:AI工具处理完的数据准确性如何?处理过程中是否遇到什么问题?运用AI工具进行数据处理的难点在哪?AI工具和Excel软件数据处理各有什么特点?本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):1.何伟,张良均.Python商务数据分析与实战[M].人民邮电出版社,2022.3.郑小玲,王静奕.Excel数据处理与分析实例教程(微课版第3版)[M].人民邮电出版社,2022.4.刘宝强.商务数据采集与处理(微课版)[M].人民邮电出版社,2019.教案授课题目(项目或模块)第五章数据基本统计分析授课时间第十周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解数据分析和数据指标的概念及其关系,了解数据指标的分类、数据分析方法,使用Excel、蓝鲸、SPSS软件进行数据分析操作。能力目标:理解数据指标与数据分析之间的关系,掌握数据分析的分类、数据分析方法,熟练掌握Excel、蓝鲸、SPSS软件的数据分析操作过程。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪数据分析指标▪数据分析方法▪数据分析的实践操作教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)£案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生数据处理的主要内容,Excel和蓝鲸数据处理的操作内容。二、课堂讲授(一)数据分析指标1.概念引入德鲁克的名言:“如果你不能衡量,那么你就不能有效增长”。对企业或组织来讲,衡量即按统一标准来定义、评价业务情况,这个标准即指标(Indicator)。然后引入指标的相关概念。(1)数据指标:说明总体数量特征的概念及其数值的综合。数据操作包括统计、查询、分析等,其针对的数据字段,本质上都是数据指标。(2)数据分析:是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的价值,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据统计分析离不开数据指标,数据指标贯穿数据统计分析过程。确定分析目标→确定数据指标→获取数据→生成数据指标→分析数据指标→得出结论。(3)完整的数据统计指标要素:指标的名称、统计的时间界限和空间范围、计量单位、计算方法(修饰词)、指标的数值。2.指标的分类定性指标与定量指标虚荣指标与可行动指标先见性指标与后见性指标相关性指标与因果性指标其他分类指标(按通用性分为宏观指标和特定指标;按重要性分为KPI指标(核心关键指标)和普通指标等等)3.电商常用数据指标(1)网页基础指标(PV、UV、VV、跳出率、退出率、平均访问时长、转化率、回购率等)(2)用户基础指标(ARPU、新增用户、活跃用户、留存率、流失率、一次性用户、使用时长、使用间隔、客单价)。4.数据指标的价值:改变行为、促成目标5.优秀的数据指标的特征:可比较、可理解、是比率(二)数据分析方法1.总量指标分析:反映社会经济现象在一定时间、空间条件下的总规模或总水平的综合指标,用绝对数表示。2.相对指标分析:相对数,应用对比的方法,将两个相互联系的指标数值加以对比计算的一种比值,说明现象之间的数量对比关系。3.平均指标分析:反映总体的一般水平的综合指标,又称平均数。4.变异指标分析:反映总体各单位标志值的差异程度,说明总体标志值的变异、离散程度。5.回归分析:在分析自变量和因变量之间相关关系的基础上,建立变量之间的方程。6.预测分析:利用科学的统计方法对事物的未来发展进行定量推测,并计算概率置信区间。(二)数据分析的实践操作1.使用Excel进行数据分析演示在Excel中对人力资源数据制作数据透视图和数据透视表,并进行总量指标分析、相对指标分析、平均指标分析、变异指标分析的操作。2.使用蓝鲸进行数据分析演示运用蓝鲸进行特征选择、特征统计、相关分析、线性回归分析的操作步骤。让学生对销售数据分别进行特征统计、相关分析、回归分析的操作,巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。3.使用SPSS进行数据分析演示运用SPSS对大数据专业人才薪资数据进行描述性统计分析、绘制自变量与因变量箱线图、创建虚变量、对数线性回归分析的操作步骤,并对回归分析结果进行解读。学生进行操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):复习数据分析的概念、数据分析方法,各软件数据分析的步骤。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)实验四:数据基本统计分析(1)授课时间第十一周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:使用SPSS软件进行基本统计分析,绘制箱线图。能力目标:熟练掌握SPSS软件的描述统计分析与箱线图绘制操作过程。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪使用SPSS软件对岗位招聘数据进行数据基本统计分析教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)□练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾提问学生数据分析的概念、完整的数据统计指标要素、电商常用数据指标、数据分析方法。二、课堂讲授1.使用SPSS软件进行描述统计分析打开处理好的岗位招聘数据工作表,操作如下:(1)在菜单栏中选择“分析”→“描述统计”→“描述”,在弹出的“描述”对话框中选择需要计算其基本统计量的变量到“变量”列表框中,此处选择的是“平均薪资(元/月)”,在“描述”对话框中单击“选项”按钮,弹出“描述:选项”对话框。在该对话框中勾选“平均值”、“标准偏差”、“最小值”、“最大值”、“峰度”和“偏度”这些能表示集中趋势、离散程度、分布形态的基本描述统计量,同时设置“显示顺序”为“变量列表”,单击“继续”→“确定”后得到输出结果。学生操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。2.使用SPSS软件绘制直方图、箱线图(1)在菜单栏中选择“图形”→“图表构建器”,在“图表构建器”对话框中单击“图库”选项卡,在“选择范围”列表框中选择“直方图”,然后在右侧预览框中将“简单直方图”拖入右上角图的空白区域。再将“变量”列表框内的变量“平均薪资(元/月)”拖拽到图表构建器窗口中的x轴上,单击“确定”后得到输出结果。(2)在菜单栏中选择“图形”→“图表构建器”,在“图表构建器”对话框中单击“图库”选项卡,在“选择范围”列表框中选择“箱图”,然后在右侧预览框中将“简单框图”拖入右上角图的空白区域。再将“变量”列表框内的变量“公司规模”拖拽到图表构建器窗口中的x轴上,将“平均薪资(元/月)”拖拽到图表构建器窗口中的y轴上,单击“确定”后得到输出结果。学生操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):完成实验四,提交实验报告。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)实验四:数据基本统计分析(2)授课时间第十二周星期三第1-2节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:使用SPSS软件进行回归分析,学习回归分析结果解读能力目标:熟练掌握SPSS软件的回归分析操作过程。素质目标:培养诚信守信、团结合作、积极沟通、乐观向上的品质和创新、思考、适应的能力。达成本次课教学目标的课程教学主要内容(课程教学内容与课程教学目标相匹配,支持课程教学目标达成):▪使用SPSS软件对岗位招聘数据进行回归分析教学方法(有效支持教学目标达成。请打√选择,可多选):项目教学法□讨论法□PBL(以问题为中心的教学法)☑练习法(习题或操作)R案例教学法□讲授法R其他□教学媒体(有助于教学目标达成。请打√选择,可多选):教材£多媒体R幻灯R录像□云平台空间£板书□其他£教学过程设计(包括教学内容、教学方法、板书设计、情境设计、提问、课堂讨论等师生互动的设计等。为学生建立深层次学习环境,支持教学目标达成):一、课程回顾SPSS软件的描述性统计分析。二、课堂实验打开处理好的岗位招聘数据工作表,操作如下:(1)单击“转换”---“创建虚变量”,选择需要转换的变量“公司类型”、“公司规模”、“学历要求”、“经验要求”等,勾选“创建主效应虚变量”,并在“根名称”中输入即将生成的虚变量的列名的根部名称,单击“确定”。(2)在菜单栏中选择“分析”→“回归”→“线性”,在弹出的“线性回归”对话框中设置自变量和因变量。将“对数平均薪资”放入“因变量”框内,将自变量放入自变量框内,单击“确定”,如图5-20所示。需要注意的是,如果某一个变量有n个虚变量,则在“自变量”框内放入n-1个虚变量,剩下的一个虚变量做基准,如“公司规模”有7类虚变量,则只放入6类虚变量。学生操作,在课堂巡视并观察学生的操作过程,对学生的操作问题进行指导与解答。学生对岗位招聘数据进行完整的数据分析操作,分析“公司类型”、“公司规模”、“学历要求”、“经验要求”等要素对岗位薪资的影响及其大小,总结岗位薪资的影响因素,并对结果进行解读。课程总结复习思考及作业布置(目的是帮助学生达成教学目标):完成岗位招聘数据的统计分析过程,提交实验报告。本部分教学内容的参考资料(为帮助学生达成教学目标而提供的辅助教材、参考书、文献、网络教学资源等):教案授课题目(项目或模块)第六章数据可视化授课时间第十二周星期五第6-7节授课时数2学时教学课型公共必修□基础必修□专业必修R专业组选□专业任选£专项实践□其他£本次课教学目标(本次课需要达成的思想道德、知识、能力、素质目标):思想道德目标:遵守国家法律法规,培养学生探索和分析数据的思维习惯,培养学生重视大数据的隐私安全、伦理问题和责权意识。知识目标:了解数据可视化的定义、作用、分类、原则,常用的可视化图表类型及适用场景,数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多囊卵巢综合征中西医结合诊疗指南重点2026
- 某市绿化工程施工组织设计方案技术标投标书
- 二级路施工方案
- 科技创新企业科技创新管理体系构建
- 宏观点评:输入性通胀初步显现
- 甲状腺癌术后护理指南
- 我国企业集团内部控制存在问题分析
- 丹霞地貌美学特征整 理及其在女装设计中的应用研究
- 2026年吉林省白山中小学教师招聘考试考试题库(含答案)
- 2026年保密宣传月保密知识题库完整参考答案
- 天津市十二区重点学校2025-2026学年高三下学期毕业联考-语文试卷
- 2026南昌县小蓝经开区项目人员招聘28人笔试备考试题及答案解析
- 2026年山西药科职业学院单招综合素质考试题库及答案详解(基础+提升)
- 造价咨询组织管理及协调制度实施细则
- 5G通信网络规划与优化-课程标准
- 中数联物流运营有限公司招聘笔试题库2026
- DB31∕T 1598-2025 城市轨道交通车辆寿命评估通 用要求
- 银行内部审计题库及答案
- 14K117-3 锥形风帽图集
- 电梯原理培训讲义
- DLT 572-2021 电力变压器运行规程
评论
0/150
提交评论