Excel商务数据分析与应用教学教案_第1页
Excel商务数据分析与应用教学教案_第2页
Excel商务数据分析与应用教学教案_第3页
Excel商务数据分析与应用教学教案_第4页
Excel商务数据分析与应用教学教案_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商务数据分析概述教学目标掌握商务数据分析的定义和特点;了解数据分析师的能力构成和商务数据分析的工作流程;了解如何根据岗位要求和自身特点制订能力提升计划。教学方式与课时安排课堂讲授:3学时演示汇报:3学时教学重点与难点帮助学生理解实践领域数据分析工作的开展方式和所需能力,理解工作所需能力与理论知识之间的区别帮助学生初步建立职业发展目标,并制定可行的能力提升方案教学过程课堂讲授:3学时商务数据分析的定义与特点(25分钟):导入。老师初步介绍本课程特点:注重实践性,以实践场景中的工作步骤为脉络展开,而不是以学科知识脉络展开。可借助微课1-1进行翻转课堂。布置学生现场分组讨论,尝试根据自己的理解总结商务数据分析的定义、特点,讨论完成后由部分小组展示汇报讨论结果。讲解。老师总结学生汇报成果。并按照课件和教材展开讲解。讲解过程再次强调本课程注重实用性,目标是建立使用专业知识解决实际问题的能力。商务数据分析中的常见问题(30分钟):导入。老师引导学生思考,定义中提到了“解决商业问题”,商业问题具体有哪些?布置学生现场分组讨论,商业领域有哪些问题,讨论完成后由部分小组展示汇报讨论结果。讲解。老师总结学生汇报成果。并按照课件和教材展开讲解。这是本章难点之一,老师在讲解中请注意添加实际例子帮助学生理解。可借助微课1-2进行翻转课堂,作为事例之一;若时间允许,可引导学生仿照微课对“团购”“短视频”分析的角度,分组对微课中未详细讲解的“出行”“O2O”行业进行分析。商务数据分析的工作流程(30分钟):讲解。老师讲解商务数据分析的工作流程,介绍每个环节要完成的主要工作;引导学生关注“实践数据解决方案”之外的步骤,因为在实际工作中数据分析师绝大部分工作时间都投入在这四个步骤上。讨论。学生分组讨论,每组可由老师指定(或学生自选)一个数据分析主题,按照图1.2分解每个步骤的工作内容,如:为什么要分析这个主题,要选取哪些数据来解决这个问题、要对数据进行哪些验证和加工工作,要用哪些分析方法来分析数据,分析结果可以转化为哪些工作改进计划,要如何推广分析工作的成果(向谁介绍工作成果、以什么方式宣传这个工作成果等)。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。数据分析师的能力构成(50分钟):讲解。老师讲解数据分析的团队合作,帮助学生理解数据分析师如何开展日常工作,可借助微课1-4进行翻转课堂。基于此推出数据相关专业岗位的能力构成。提问。老师可针对图1.3中4个数据相关工作岗位提问学生,每个岗位在图1.4中的三个技能轴上各需要掌握哪些,帮助学生加深理解。也可结合图1.2,提出某一个比较具体的商业问题,让学生回答需要和图1.3中哪些团队合作、各团队之间要如何配合,需要具备图1.4中哪些能力。讲解。老师基于招聘网站中的真实JD为学生示范如何从JD中分解能力要求;如何对比自己的能力与岗位能力要求之间的差异;如何根据差异制定行动计划。按照“实践练习”环节布置作业。讨论。如时间较为充裕,可由老师指定或学生自选,每组以一个招聘网站中的真实JD为素材,由学生仿照老师在上个环节的讲解从中分解能力要求。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。演示汇报:3学时学生分组汇报,老师点评。点评中请注意,学生在这个环节容易因为理解还不够深入,所以回答不够完整,内容不够具体。比如回答“求职目标”时会说“在互联网大厂从事商业分析工作”。这时候老师在点评时可以通过提问的方式提示学生加深思考,比如要求他们补充:从事什么业务的互联网(比如电商、广告平台、资讯等)?要分析哪个方向的问题(财务、市场、生产等,可参考图1.2)?会和哪些人合作,为此需要掌握哪些其他学科的知识(比如帮助销售团队提升业绩,要懂一些财务知识。如果这些知识数据科学专业培养计划中没有这些知识,要如何自己补充)?要求学生根据点评再次修改并提交报告。

第2章设定分析目标教学目标了解设定分析目标的重要性和一般步骤;熟悉了解业务背景和评价工作优先级的方法;掌握将业务问题转化为数据问题、为数据问题设计数据解决方案的方法;掌握数据分析报告中关于业务背景介绍部分的写作方法。教学方式与课时安排课堂讲授:3学时教学重点与难点本章涉及很多知识点(如2.2.1小节中提到了五力模型模型),讲解知识点的过程中要反复强调它们是“做什么用的”,通过目标将众多知识点串联成体系;也要注意通过实际例子来帮助学生理解。教学过程导入(20分钟):讲解。老师回顾图1.2,讲解设定分析目标的意义和评价分析目标是否合理的标准。可借助微课2-1进行翻转课堂。提问。老师展示几个分析目标,学生按照3个标准对目标进行评价。老师对学生回答做简要评价。设定分析目标的工作步骤(5分钟)讲解。老师讲解三个步骤的基本工作内容。设定目标的前期工作-了解业务和评价优先级(40分钟)讲解。老师讲解“了解业务”包含哪三各方面的具体工作、各自要如何完成,可以借助微课2-2进行翻转课堂。讨论。讲解完五力模型后,学生分组讨论,每组可由老师指定(或学生自选)一个行业,按照五力模型的框架,从五个方向分析行业的竞争情况。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。讲解。老师讲解如何在了解业务的基础上“评价优先级”明确分析目标(35分钟)讲解。老师讲解“业务语言”和“数据语言”的区别和对应关系。可以借助微课2-4进行翻转课堂。讨论。学生分组讨论,仿照2.3节第二段的例子,每个小组列举“多个业务问题对应同一种数据解决方案”和“一个业务问题需要多个数据解决方案支持”的具体例子;并从例子中选择一个问题,明确其分析目标。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。数据分析报告写作(35分钟)讲解。老师讲解数据分析报告相关的基础知识,重点解释何为“面向阅读者”的写作。可以从选择报告形式、安排报告内容、编辑排版内容三个方面进行讲解。可以借助微课2-6进行翻转课堂,将“有问题的做法”和“正确的示范”对照进行讲解。提问。老师可使用微课2-5中提到的几个场景进行提问,要求学生回答在某个场景中应当写作什么形式的报告、报告篇幅如何规划、选取哪些素材、汇报重点是什么等等。讲解。老师讲解“背景介绍”部分的重要性和写作方法。讨论。老师展示几个数据分析问题的基本介绍,学生分组讨论,每组一个题目,针对这个题目列出“背景介绍”部分的写作提纲,明确各段落的大意及各段之间的逻辑关系。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。

第3章获取、验证和加工数据教学目标了解数据获取、验证和加工的重要意义;熟悉通过Excel读入CSV等常见格式数据的方法;熟悉数据验证的基本思路,能够通过Excel实施数据验证;掌握通过Excel字符串公式等工具从文本数据中提取信息的方法;掌握通过Excel数据透视表等工具对数据进行分组加工的方法;掌握数据分析报告中数据说明部分的写作方法。教学方式与课时安排课堂讲授:3学时演示汇报:3学时教学重点与难点在实践场景中,获取、验证和加工数据环节一般会在数据分析过程中占据相当大部分的工作量,有时候甚至工作目标本身就是获取、验证和加工数据,建立用户画像的工作就是一项典型的加工数据的工作。但是这部分工作受到具体的数据情况和应用场景的影响特别大,单纯从理论层面很难给出全面又普适的行为指南,在各门专业课中也较少涉及到相关的讲解和练习。为此,在讲解过程中要特别注意引导学生理解“为什么”要做某一项操作,通过对目标的强调来使得学生不但“知其然”还“知其所以然”,避免只聚焦于具体操作。此外,本章案例以企业端实务为背景,对于尚未工作的学生而言,没有相关的生活或工作经验作为切入的依托点,会在理解背景方面遇到一定困难。微课3-1对这部分进行了比较详细的讲解,老师可依托微课进行讲解、组织讨论和问答,帮助学生加深对业务问题的理解;也可利用第2章介绍的设定分析目标的方法,要求学生在精读案例背景介绍后,完成一个明确的分析目标。本章包含大量Excel操作,可以作为预习内容提前要求学生自学,将课堂讲授时间更加集中在对上述两点内容的介绍。这个安排也是对实际工作环境的一种模拟,建立快速寻找答案、解决问题的自学能力。如果学生通过自学掌握相关内容有困难,可从演示汇报环节挪借1学时,不建议压缩对上述1/2两点内容的讲解时间。教学过程课堂讲授:3学时导入(25分钟):讲解。老师回顾图1.2,讲解获取、验证和加工数据的重要性。讲解。老师介绍案例背景。可借助微课3-1进行翻转课堂。讨论。学生在预习微课3-1和精读案例背景介绍的基础上,使用第2章介绍的相关内容,为案例要解决的问题定义一个明确的分析目标。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。获取数据(30分钟)讲解。老师介绍各种常见数据源。演示。老师演示3.2.2~3.2.3小节中与获取数据相关的操作。如学生程度较好,可由老师提出要求,学生完成操作。提问。老师针对各个常见数据源要求学生回答,每个数据源可以提供哪些数据,并列举至少一个可以通过这个数据源提供的数据解决的业务问题。比如:可以通过万得等付费终端获取上市公司的财务数据,可以使用这些数据对上市公司的盈利情况和财务健康度做出评估,作为投资的决策依据。验证数据(30分钟)讲解。老师讲解验证数据的基本思路。演示。老师演示3.3.2~3.3.3小节中与验证数据相关的操作,并讲解如何解读箱形图、散点图,如何根据分位数函数提供的结果对分布进行评价。如学生程度较好,可由老师提出要求,学生自行完成操作;或由老师展示成果,由学生直接进行解读,老师对回答做出评价。提问。老师简单总结讲解的各种数据验证项目。可以提出一种数据验证项目,要求学生解释为什么要进行这一类验证;举出某一个验证示例,要求学生回答它是从哪个角度对数据进行验证。老师可展示章案例数据,逐个变量要求学生回答如应如何对该变量进行验证。加工数据(35分钟)讲解。老师讲解加工数据的常用方法。演示。老师演示3.4.2~3.4.3小节中与加工数据相关的操作。讲解重点可放在VLOOKUP函数和函数嵌套:前者是Excel最常用的公式之一,准确理解各参数意义一般即可全面掌握;后者相对灵活,老师可在教材提供的几个例子基础上,再设计更多需要综合利用多个函数的场景,从思路上给学生更多启发。如学生程度较好,可由老师提出要求,学生自行完成操作;或由老师展示成果,由学生直接进行解读,老师对回答做出评价。提问。老师简单总结加工数据的常用方法,然后从思路和实践两个方向提问要求学生回答。例如:如果某电商企业要建立用户画像,需要获取哪些数据,如何将不同来源和粒度的数据合并为用户画像?想知道章案例数据中有多少条广告是用户在搜索51job相关搜索词时出现的,应该如何操作(对“搜索词”一列筛选包含“51job”或“前程无忧”的行,对一个变量的多个筛选条件取并集)?在上述记录中,由51job自己投放的广告有多少条,由其竞争对手投放的有多少条,要如何操作(可复习数据透视表的使用)?数据分析报告写作(15分钟)讲解。老师讲解数据分析报告中数据说明部分的重要性和写作方法。可以借助微课3-2进行翻转课堂。讨论。老师可以将数据说明与数据获取/验证/加工结合在一起进行提问。例如,在基于用户画像数据对用户行为进行分析后,需要写作一篇数据分析报告介绍用户的属性和行为进行介绍,这篇报告的数据说明表应当包含哪些行?可选择部分小组进行展示。在这个讨论中,学生容易混淆原始数据(如销售系统中的订单明细)和用于分析的数据(即基于原始数据加工生成的用户画像);老师要基于学生的展示成果引导他们加深对两者区别的理解。演示汇报:3学时学生分组汇报,老师点评。点评中请注意几类学生在初学时经常遇到的问题并进行矫正:1、(5)、b款中提到的混淆原始数据和分析数据的问题在文字部分介绍不全面,比如对于数据获取的来源、选取数据的标准、数据量等介绍不充分。这个问题在实践中经常会导致报告阅读者因缺乏必要信息而无法对于数据可靠性做出判断,从而对分析结果存疑要求学生根据点评再次修改并提交报告。

第4章探索数据的基本特征教学目标了解探索数据特征对于数据分析的重要意义;掌握衡量数据特征的常用指标,能够通过Excel公式计算这些指标;掌握常用数据图形的适用范围和绘图规范,能够使用Excel绘图工具绘制常用数据图形;熟悉组合图形的绘制规范,能够使用Excel绘图工具绘制常用的组合数据图形;掌握数据分析报告描述性分析部分的写作方法。教学方式与课时安排课堂讲授:6学时演示汇报:3学时教学重点与难点在掌握各种具体描述数据特征的方法之余,要注意引导学生建立描述数据基本特征的思路。想要全面地描述数据特征,一般要使用较多图表,在实践场景中,学生所展示的图表经常会缺乏关联,看起来像一堆数据素材的堆砌。老师在讲解本章内容时,可以在数据分析报告写作小节的讲解环节为学生展示一些进行描述性分析的基本思路,例如:先展示最重要关键的指标,再展示可能对它有影响力的因素;先展示总体情况,再展示各个组成部分的情况;先当前结果,再从时间维度上进行预测或回溯等。在实践练习展示环节的点评中,也要注意从内容整体性是否得到充分展示的角度做出评价,并督促学生做出修改。本章案例是一个当前社会较为关切、也存在较多分歧的问题,学生对此可能也持有不同观点。这是一个非常好的、插入思政与职业精神教育的环节:数据分析的全部价值在于通过数据发现和展示事物的客观规律,客观规律不因个人的生活经验、感情偏好而转移。从事数据分析工作的人要学会在工作场景中控制自己的本能好恶,追求更加客观、更加完整地呈现事实。同时,如果学生们对于这个问题的认知经过本章的学习和练习有所调整,大家的分歧得以弥合,则这一章的学习也将是一个数据对于提升沟通效率和效果的好例子,可以帮助同学们对于数据分析工作的实际价值有更深入的体会,建立职业自信心和荣誉感。本章包含大量Excel操作,可以作为预习内容提前要求学生自学,将课堂讲授时间更加集中介绍每个例子是出于什么“目标”才要进行的,如何根据这个目标选择了相关的“方法”。帮助学生巩固在“dothethingright”前先“dotherightthing”的思维习惯,不要在工作中一下子就陷入具体细节,而是要先对所从事的工作有全盘的规划和把控后再开始具体工作。反复强调并帮助学生建立这样的习惯,对避免第1点问题非常有效且重要。教学过程课堂讲授:6学时导入(5分钟):讲解。老师回顾图1.2,讲解掌握数据基本特征的重要性。介绍章案例背景(40分钟):讲解。老师讲解性别差异的衡量为什么是一个重要的问题?因为涵盖复杂的现实、存在广泛的分歧。强调数据对于解决这种存在广泛分歧问题的重要意义:建立一套统一的评价体系,将各方的思路统一到一个逻辑上来讲解。老师讲解由于性别差异问题的重要性,以及数据在解决此类问题时能起到的特殊作用,很多组织研究、发布、分析相关的指标体系。此处注意引导学生:数据并非代表绝对的正确或客观。每个指标(体系)都与设计者的立场、目的相关。可回顾上一章的内容,再次强调数据验证的重要性,验证本身包含验证数据记录和计算是否客观合理演示。老师将案例背景介绍中提及的GGGR指标体系和5种其他性别差异衡量指标(体系)做为预习任务提前分配给学生。要求每组学生查找到一项指标(体系)的出处,并在课上由不同小组来演示每个指标体系的指标构成和数据,对数据的可靠性做出简单的评价并阐述他们的理由。这个环节可以帮助学生体验如何基于搜索引擎寻找国际组织的数据,综合各种信息对获取的数据的可靠性进行基本评估;是进行二手研究时所需的关键能力之一。提问。老师根据演示环节中各组的展示结果,通过提问引导学生对各个指标体系之间的异同进行比较,对各个指标体系做出评价。讲解。老师介绍GGGR指标体系的构成和设计思路。指标:集中趋势与离中趋势(25分钟)讲解。老师讲解四类数据。提问。老师基于四类数据的特征,从正反两个方向提问:列举一些数据要求学生判断是哪一类数据,指定一种类别要求学生举出此类数据的实例。讲解。老师讲解集中趋势和离中趋势。配合4.2.1节中的测试成绩或类似的贴近学生日常生活的其他实例,帮助学生理解两类特征的意义。讲解。老师讲解常用的集中趋势和离中趋势指标,以及它们适用于哪些数据。提问。老师提出一些指标,要求学生回答适用于哪些类型的数据。提出一类数据,要求学生回答适用于这类数据的集中趋势指标和离中趋势指标有哪些。演示。老师演示4.2.1节中涉及的各种Excel操作。如学生程度较好,可由老师提出要求,学生完成操作。指标:绝对数与相对数据(15分钟)讲解。老师讲解绝对数、相对数,对比两者的区别和联系。讲解绝对数、相对数下细分的的几类指标。提问。老师列举各类常用指标,要求学生从绝对数、相对数的分类角度回答是那种指标。可使用章案例数据指标体系,也可使用GDP等宏观经济统计指标、财务指标等。这里的要点是通过实例帮助学生加深对概念的理解,所以选用的指标学生越熟悉越好。指标:先分组再计算每一组的指标取值(20分钟)讲解。老师讲解为什么要对一些数据先分组再计算。讲解。老师讲解分组计算数据特征的步骤和具体操作;介绍按照不同标准选择分组依据的区别、使用情况;介绍如何选择组界;介绍累计频数的概念和计算方式。提问。老师提出几个分析场景,由学生回答在每个场景中,要选择哪个指标作为分组依据、计算哪些指标。演示。老师演示4.2.4小节中涉及的各种Excel操作。如学生程度较好,可由老师提出要求,学生完成操作。图表:统计表及规范(20分钟)讲解。老师简单回顾4.2.4节中几个基本表格;讲解列联表;讲解制作统计表的格式规范。演示。老师演示4.3.1~4.3.2小节中涉及的各种Excel操作。如学生程度较好,可由老师提出要求,学生完成操作。图表:基于分析目标的图形分类(15分钟)讲解。老师讲解图形在数据分析中的重要性。提前要求学生预习微课4-3,可选取其中部分图形,在表现力层面对比图形与文字、表格。讲解。老师围绕图4.21从两个维度对数据图形进行分类:第一个维度,按照四种常见的分析目标,第二个维度按照Excel画图功能。图表:柱形图系列(20分钟)讲解。老师围绕图4.22概述此系列包含的图形,展示在Excel中绘制本系列图形所涉及的菜单项所在位置。提问。老师展示几个适用于本系列图形的分析目标与场景,学生回答应使用哪个具体图形。通过提问帮助学生加深理解,比如适用柱形图还是条形图。提问。老师分别展示图4.25、图4.26、图4.28、图4.29和图4.30,学生根据每张图回答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些具体调整?对每张图中展示的数据做出描述和解读。其中,在学生回答第二类问题时,老师要特别注意引导他们在答案中包含两部分内容:描述图中的数据特征,根据分析目标和数据特征做出解读(即,通过数据特征来回答分析目标提出的问题)。本部分(8)~(12)点教学中可贯彻这个训练,培养和强化学生在实际问题与数据特征之间建立关联的能力与习惯。图表:折线图系列(10分钟)讲解。老师围绕图4.33概述此系列包含的图形,展示在Excel中绘制本系列图形所涉及的菜单项所在位置。提问。老师展示几个适用于本系列图形的分析目标与场景,学生回答应使用哪个具体图形。通过提问帮助学生加深理解,比如柱形图和折线的区别、(百分比)堆积面积图和(百分比)堆积柱形图的区别。提问。老师展示图4.35,学生根据图形回答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些具体调整?对图中展示的数据做出描述和解读。讲解。老师总结在柱形图和折线图系列中使用的图形编辑技巧,并且回顾为什么要对图形进行相关的调整。图表:饼图系列(15分钟)讲解。老师围绕图4.36概述此系列包含的图形,展示在Excel中绘制本系列图形所涉及的菜单项所在位置。提问。老师展示几个适用于本系列图形的分析目标与场景,学生回答应使用哪个具体图形。通过提问帮助学生加深理解,比如同样是多层分类,字母饼图、复合条饼图、旭日图分别适用于什么样的场景;如果分类过多,使用饼图无法看清,应该如何做;如果分类不是完备互斥集要如何做;如果不能知道所有分类对应的数据,是否还可以使用饼图等。提问。老师分别展示图4.37、图4.38、图4.44,学生根据每张图回答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些具体调整?对每张图中展示的数据做出描述和解读。图表:散点图系列(20分钟)讲解。老师围绕图4.45概述此系列包含的图形,展示在Excel中绘制本系列图形所涉及的菜单项所在位置。提问。老师展示几个适用于本系列图形的分析目标与场景,学生回答应使用哪个具体图形,或如何进行设置。通过提问帮助学生加深理解,比如列举一个气泡图的应用场景,提问三个变量哪个做X轴、哪个做Y轴、哪个对应气泡大小。提问。老师分别展示图4.46、图4.48、图4.53,学生根据每张图回答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些具体调整?对每张图中展示的数据做出描述和解读。讲解。老师总结在前四个系列中使用的图形编辑技巧,并且回顾为什么要对图形进行相关的调整。图表:其他图形(25分钟)讲解。老师围绕图4.55概述此系列包含的图形,展示在Excel中绘制本系列图形所涉及的菜单项所在位置。提问。老师展示几个适用于本系列图形的分析目标与场景,学生回答应使用哪个具体图形,或如何进行设置。通过提问帮助学生加深理解,比如提供两个分类问题,提问学生适用饼图/旭日图,还是树状图等。提问。老师分别展示图4.57、图4.59、图4.60、图4.62,学生根据每张图回答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些具体调整?对每张图中展示的数据做出描述和解读。图表:作图提效技巧(15分钟)讲解。老师提出单一图形无法满足需求的典型场景,导出组合图形的重要性。提问。老师通过提问引导学生思考哪些图形可以组合,哪些图形不可以组合。讲解。老师讲解使用模板功能的典型场景。讲解。老师回顾所有图形分析类与图形编辑操作,再次加深学生对于图形选型(即根据分析目标和数据特征选择恰当的图形)、图形规范化、美观性的认识。在后续的作业、实践与演示环节,也要注意从这三个角度对学生给出评价和指导。数据分析报告写作(20分钟)讲解。老师讲解数据分析报告中描述性分析部分的重要性。讲解。老师从整体到局部讲解写作文字版数据分析报告的注意事项:框架部分要逻辑架构清晰合理、各部分内容比例适当;各部分文字之间、文字与图表之间要有关联,而不是各自为政;文字本身要符合中文的写作规范、符合报告阅读者的接受能力。提问。老师可列举一些往期学生报告中典型的问题,要求学生根据讲解找到问题。如果是首次开课,可从狗熊会丑图百讲系列推文中选取素材。演示汇报:3学时学生分组汇报,老师点评。点评中请注意针对几类学生在初学时经常遇到的问题进行反馈和提出修改要求:全篇逻辑架构、篇幅比例是否安排合理各部分内容是否有合理的过渡,全篇报告具有整体性图表使用是否恰当、规范、美观对图表中的数据特征解读是否正确,是否根据数据特征做出了合理的解读是否基于数据分析工作对所研究的问题做出了合理的回答要求学生根据点评再次修改并提交报告。

第5章建立回归模型教学目标理解回归模型的基本思路和理论框架,能够识别回归模型适用的典型业务场景;理解回归模型的3要素,以及线性回归和逻辑回归的基础理论知识;掌握使用Excel建立和检验线性回归模型和逻辑回归模型的方法;掌握解读线性回归模型和逻辑回归模型的结果,以及基于模型做出业务改进建议的方法;掌握数据分析报告模型分析与解读部分的写作方法。教学方式与课时安排课堂讲授:6学时演示汇报:3学时教学重点与难点本章内容包含较多统计学技术细节。对于非数据科学专业学生的数据技能训练课程,或数据科学专业新生的专业基础课,学生可能缺乏全面理解其中部分技术细节的知识储备。本书提供了一些配套微课讲解这些相关内容。如学生程度较好或学时较为富余,老师可配合微课较为深入、详尽地介绍相关内容。但仍建议将授课重点放在理解回归分析的思路框架,帮助学生建立用回归方法剖析问题的思路上,即优先理解回归模型“可以解决什么问题”“如何将一个业务问题规范为一个回归问题”“如何使用一个回归模型结果解决业务问题”“为什么要选用这样的模型形式”“这个目标函数的含义是什么”,其次才是回归模型“如何推导”“如何估计”“如何评价”“如何检验”等。系统地学习回归分析中的技术性内容可留待统计学或回归分析等课程。本课程的教学重点仍然是学会用数据的思路去剖析和解决实际问题,学生可以在软件输出结果中找到并使用与模型估计、评价、检验相关的指标并对其做出解读即可。教学过程课堂讲授:6学时导入(45分钟):讲解。老师回顾图1.2,讲解模型分析的重要性。讲解。老师介绍案例背景。讲解。老师讲解回归模型的基本构成元素:一个可量化的关键业务要素Y,多个可量化且对关键指标有影响力的X,Y与X之间的关联关系。提问。老师根据案例背景和回归模型的基本构成要素,提问学生在“知识网红”案例中可以定义哪些Y、每一个Y应当如何定义。讨论。学生分组,一半小组指定题目“哪些专家可以成为知识网红”,一半小组指定题目“什么样的话题更受欢迎”。各小组基于章案例数据讨论Y是什么、X有哪些、每个X对于Y的影响预估是什么样的(正相关还是负相关、影响力大小等)。这个过程要注意引导学生,并非所有的数据都是现成准备好的,要根据自己的建模需求进行加工,可作为第三章相关内容的回顾(比如在“哪些专家可以成为知识网红”这个问题中,原始数据中并没一个现成的变量“是否是知识网红”,就需要学生自己根据专家的业务量做出划分)。两个题目各选择代表小组上台陈述,老师做出提问和点评,点评主要基于回归模型的基本构成要素的框架来进行。五种常见的回归模型(20分钟)讲解。老师介绍五种常见的回归模型。提问。老师列举各类典型场景,学生回答应当使用哪种回归方法、如何定义Y,可以考虑寻找哪些X。线性回归模型-导入(10分钟)讲解。老师回顾线性回归适用的Y,详细讲解Y连续在实际中的处理方式。讲解X的重要性。提问。老师提出一些实际数据的例子,学生回答,是否可使用线性回归模型,并回答理由;尽可能多地列举出可能的X,并陈述可以从哪个数据源获取相关数据,是否需要对数据进行一定的加工,是否有一些X难以获取、是否可替代等。线性回归模型-理论(40分钟)讲解。老师讲解使用线性回归模型分析数据的基本流程,确定场景适用、确定数据符合模型基本假设(如不符合可做一定转换)、估计模型、检验模型、通过变量选择等方法调整模型形式、评价模型、诊断残差、解读模型、应用模型。讲解。老师讲解线性回归模型的基础形式,重点理解参数的含义。讲解。老师讲解线性回归模型的基本假设,重点理解线性关系、如过数据呈现非线性关系要如何处理。讲解。老师讲解线性回归模型的参数估计,重点理解理解目标函数的含义,即为什么以它为目标函数。讲解。老师讲解F检验和t检验,重点理解两个检验的零假设和备择假设分别是什么含义,实践中希望看到什么样的检验结果。如果看到F检验通过而部分变量t检验未通过的情况,要进行变量选择。重点理解如果不进行变量选择则模型不稳定,预测结果不可靠。讲解。老师讲解线性回归模型的评价,重点理解:R2公式所表达的意义:衡量模型可以解释的数据变动在整体数据变动中所占的比例。讲解。老师讲解线性回归模型残差中几种典型问题,重点理解每种问题产生的原因、可使用的解决方法。提问。老师以提问形式带领学生回顾线性回归模型相关的知识点,提问重点是b~g中要求重点的理解的内容。线性回归模型-实现(25分钟)演示。老师演示5.2.1和5.3.2小节中安装插件、建立线性回归模型、根据建模结果改进线性回归模型等相关操作;如学生程度较好,可由老师提出要求,学生自行完成操作。提问。老师展示模型结果,由学生逐一找到(4)d~g中相关的结果,并对结果做出解读,老师对回答做出评价,复习线性回归模型相关理论知识。线性回归模型-解读(15分钟)讲解。老师讲解如何对线性回归模型参数做出解读。可借助微课5-8进行翻转课堂。提问。老师展示图5.16,学生回答结果中各部分的用途、并根据数据对模型的可靠性等做出评价,对模型结果做出具体解读。通过复习再次回顾线性回归相关的知识。提问。老师展示图5.16,给出几组X值,要求学生应用模型计算预测值,并将模型预测结果转化为Y的原始量纲,对预测结果的可靠性做出评价。可适度发散,通过预测实例引导学生思考:比较用于预测的X取值位于用于建模的X取值范围内,和两者相差过大两种情况,对预测预测结果的可靠性是否有影响。逻辑回归模型-导入(10分钟)讲解。老师回顾逻辑回归适用的Y。讲解在编码时如何确定正事件和负事件。提问。老师要求学生举出一些适用逻辑回归的实际问题,并明确在这些场景中Y应如何定义,可选取哪些X,数据都可从何渠道获得。逻辑回归模型-理论(40分钟)讲解。老师讲解使用逻辑回归模型分析数据的基本流程,与线性回归相似。讲解。老师讲解逻辑回归模型的基础形式,重点在Logit变换:为什么要进行这个变化(Y是0-1变量,通过变换可以套用线性回归的模型形式);通过变换套用线性回归模型形式,但为什么没有误差项(可借助微课5-9进行翻转课堂)。讲解。老师讲解逻辑回归模型的参数估计,重点理解理解目标函数的含义,即为什么以它为目标函数。讲解。老师讲解评价逻辑回归模型的常用指标,重点理解临界值、混淆矩阵、灵敏度和特异性、ROC曲线和AUC值的定义和用途。提问。老师以提问形式带领学生回顾逻辑回归模型相关的知识点,提问重点是b~d中要求重点的理解的内容,如:给出ROC曲线,要求选择临界值、计算AUC值,根据计算结果评价模型;给出TP、FN、TN、FP,要求计算TPR、FPR等指标,根据计算结果评价模型;针对同一问题,给出多个逻辑回归模型,要求学生选择哪个模型更好。逻辑回归模型-实现(25分钟)演示。老师演示5.2.1和5.4.2小节中安装插件、建立逻辑回归模型、根据建模结果改进逻辑回归模型等相关操作;如学生程度较好,可由老师提出要求,学生自行完成操作。讲解。老师讲解原始系数和指数化系数区别,如何在两者间互换。提问。老师展示模型结果,由学生逐一找到(8)c~d中相关的结果,并对结果做出解读,老师对回答做出评价,复习线性逻辑模型相关理论知识。逻辑回归模型-解读(10分钟)讲解。老师讲解如何对逻辑回归模型参数做出解读。可借助微课5-11进行翻转课堂。提问。老师展示图5.21,学生回答结果中各部分的用途、并根据数据对模型的可靠性等做出评价,对模型结果做出具体解读。通过复习再次回顾线性回归相关的知识。提问。老师展示图5.21,给出几组X值和不同的临界值,要求学生应用模型计算预测值,引导学生观察临界值选取对于预测结果的影响,对预测结果的可靠性做出评价。数据分析报告写作(25分钟)讲解。老师讲解数据分析报告中模型分析部分的重要性和写作方法。讨论。学生分组,每组分到一个模型结果(图5.16或图5.21)+一种报告形式(文字版或演示版),所有小组应覆盖全部4种组合。学生讨论列出在指定形式的数据分析报告中汇报相关模型的详细内容大纲。文字版报告要列出每个自然段的段落大意,并将引用的相关图表也插入到相关位置。演示版报告要列出每一页PPT的内容摘要+该页要呈现的图表。完成后部分小组进行汇报,老师做出评价反馈。全部汇报完成后,老师可对4种组合做一定对比,帮助学生复习第2章相关知识。演示汇报:3学时学生分组汇报,老师点评。点评中请注意几类学生在初学时经常遇到的问题并进行矫正:在建立和优化模型时对于某些指标理解不到位,模型尚有可优化空间。对于模型评价指标理解不到位或汇报不全面。只有技术细节,没有对模型的解读和应用。在应用模型进行预测时,对其实际意义理解错误或不够深入。要求学生根据点评再次修改并提交报告。

第6章设计数据产品教学目标了解常见的数据产品形式及其适用场景;掌握数据分析报告这一数据产品形式的制作过程;掌握通过写作数据分析报告的形式表达数据分析工作成果的方法。教学方式与课时安排课堂讲授:6学时演示汇报:3学时教学重点与难点本章涉及的内容在缺乏实践经验时较难充分理解,可搭配微课和实例进行讲解。可在讲解本章6.2节内容是对全书关键内容进行总结,在多章实践练习后,通过复习强化学习成果。教学过程导入(20分钟):讲解。老师回顾图1.2,讲解数据产品作为推广数据工作成果的重要工具的重要性。讲解。老师讲解数据产品的三种主要形式。从问题的不确定性高低、适用的场景、产出形式、目标用户、产品核心功能、开发所需资源等维度对三种产品进行对比。提问。老师提出几个具体场景,学生回答适用什么形式的数据产品。老师提出一种数据产品形式,学生回答适用什么场景。数据产品:自动报表系统(40分钟)讨论。学生分组,老师为每组指定一个公开的数据仪表盘类数据产品,如百度指数、百度迁徙、猫眼电影票房、网易云音乐排行榜等。各小组讨论梳理该数据产品的目标受众、公司提供产品要达到什么目标;整理该产品提供了哪些模块、哪些指标重点展现、产品是否提供了与用户互动的功能;产品的设计是否有问题或可改进的空间。讨论完成后,小组将讨论结果整理成简要提纲并汇报演示。数据产品:数据分析报告(35分钟)讲解。老师从数据产品的角度讲解数据分析报告,结合图1.2回顾全书内容要点,具体内容可根据前面章节的学习目标自习题中选择。提问。老师提问每个步骤要解决的关键问题,学生回答。问题范围可涉及第1~5章的重要知识点。讲解。老师以6.3节自检表为提纲,讲解写作完整数据分析报告时要注意的要点问题。项目:定义分析题目与规划分析提纲(40分钟)讨论。学生分组。本章要求每组选择第3~5章案例中的一个,完成一份完整的分析报告,应保证每个案例都有小组选择。各小组在前面章节的学习中分别完成过某一个部分的分析工作(如处理加工数据、进行描述性分析、建立回归模型等),这一环节的讨论要求各组明确:定义自己的研究题目:可以沿用书中第3~5章案例定义的题目,也可以基于数据另外定义新的题目;老师可鼓励学生尽量选择新定义题目,这样可以让学生在“选题”方面得到更多练习。比如第4章主要分析了各国家/地区在某一年的整体得分情况,本次学生可以定义研究某一个(或某一组,如某大洲)国家/地区历年得分情况的变化,或者研究某一类指标(比如各国家/地区得分差异较大的“政治赋权”和“经济-参与度与机会”两个分项及其明细指标)。列出分析提纲:内容包括为支持研究题目要对数据进行哪些加工、描述性分析包含哪些图/表、拟采取哪种模型(因变量与自变量分别有哪些)、分析结果可以在实践中如何应用汇报。学生汇报题目和分析提纲。老师评价题目选取是否恰当、选取和加工数据的思路是否与题目要求匹配、描述性分析部分逻辑是否完整流畅、分析结果应用是否有合理和有可执行性。学生在这些方面如不恰当,老师应通过点评提出修改要求。此环节完成后,课后要求学生提交初稿(演示版+阅读版)。初稿应确保选题合理、分析提纲执行到位。项目:基于初稿的讨论和修改(135分钟)讲解。老师基于各小组上周提交的初稿,总结共性问题进行讲评,重点在分析结果的评价和解读、逻辑线、内容安排、报告制作的规范和美观。讨论。学生分组根据老师的讲解进行修改。老师参与各组讨论,针对每组的个性化问题进行讲解,确保学生学生对于修改意见理解到位。观察学生修改情况是否符合要求。讲解。老师讲解演示汇报方面的要求。此环节完成后,课后要求学生提交报告定稿(演示版+阅读版)。定稿应确保学生完整落实老师对于初稿的修改意见。演示汇报:3学时学生分组汇报,老师点评。点评应涉及如下方面:报告选题恰当、有意义,对于问题背景进行了充分的展开说明报告选取了合理的数据来支持达成分析目标,对数据进行了必要且合理的加工处理报告内容完整,逻辑清晰流畅各部分篇幅比例恰当,全文风格规范、统一图表规范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论