版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章商务数据分析概述
一、教学目标
1.掌握商务数据分析的定义和特点;
2.了解数据分析师的能力构成和商务数据分析的工作流程;
3.了解如何根据岗位要求和自身特点制订能力提升计划。
二、教学方式与课时安排
1.课堂讲授:3学时
2.演示汇报:3学时
三、教学重点与难点
1.帮助学生理解实践领域数据分析丁作的开展方式和所需能力,理解丁作
所需能力与理论知识之间的区别
2.帮助学生初步建立职业发展目标,并制定可行的能力提升方案
四、教学过程
1.课堂讲授:3学时
(1)商务数据分析的定义与特点(25分钟):
a.导入。老师初步介绍本课程特点:注重实践性,以实践场景中的工
作步骤为脉络展开,而不是以学科知识脉络展开。可借助微课1-1进行
翻转课堂。布置学生现场分组讨论,尝试根据自己的理解总结商务数据
分析的定义、特点,讨论完成后由部分小组展示汇报讨论结果。
b.讲解。老师总结学生汇报成果。并按照课件和教材展开讲解。讲解
过程再次强调本课程注重实用性,目标是建立使用专业知识解决实际问
题的能力。
(2)商务数据分析中的常见问题(30分钟):
a,导入。老师引导学生思考,定义中提到了“解决商业问题”,商业问
题具体有哪些?布.置学生现场分组讨论,商业领域有哪些问题,讨论完
成后由部分小组展示汇报讨论结果。
b.讲解。老师总结学生汇报成果。并按照课件和教材展开讲解。这是
本章难点之一,老师在讲解中请注意添加实际例子帮助学生理解。可借
助微课1-2进行翻转课堂,作为事例之一;若时间允许,可引导学生仿
照微课对“团购”“短视频”分析的角度,分组对微课中未详细讲解的“出
行”“020”行业进行分析。
(3)商务数据分析的工作流程(30分钟):
a.讲解。老师讲解商务数据分析的工作流程,介绍每个环节要完成的
主要工作;引导学生关注“实践数据解决方案”之外的步骤,因为在实
际工作中数据分析师绝大部分工作时间都投入在这四个步骤上。
b.讨论。学生分组讨论,每组可由老师指定(或学生自选)一个数据分析
主题,按照图1.2分解每个步骤的工作内容,如:为什么要分析这个主
题,要选取哪些数据来解决这个问题、要对数据进行哪些验证和加工工
作,要用哪些分析方法来分析数据,分析结果可以转化为哪些「作改进
计划,要如何推广分析工作的成果(向谁介绍工作成果、以什么方式宣传
这个工作成果等)。讨论完成后由部分小组展示汇报讨论结果,老师做总
结点评。
(4)数据分析师的能力构成(50分钟):
a.讲解。老师讲解数据分析的团队合作,帮助学生理解数据分析师如
何开展日常工作,可借助微课14进行翻转课堂。基于此推出数据相关
专业岗位的能力构成。
b.提问。老师可针对图1.3中4个数据相关工作岗位提问学生,每个岗
位在图1.4中的三个技能轴上各需要掌握哪些,帮助学生加深理解,也
可结合图1.2,提出某一个比较具体的商业问题,让学生回答需要和图
1.3中哪些团队合作、各团队之间要如何配合,需要具备图1.4中哪些能
力。
c.讲解。老师基于招聘网站中的真实JD为学生示范如何从JD中分解
能力要求;如何对比自己的能力与岗位能力要求之间的差异;如何根据
差异制定行动计划。按照“实践练习”环节布置作业。
d.讨论。如时间较为充裕,可由老师指定或学生自选,每组以一个招
聘网站中的真实JD为素材,由学生仿照老师在上个环节的讲解从中分解
能力要求。讨论完成后由部分小组展示汇报讨论结果,老师做总结点评。
2.演示汇报:3学时
(1)学生分组汇报,老师点评。
(2)点评中请注意,学生在这个环节容易因为理解还不够深入,所以回答
不够完整,内容不够具体。比如回答“求职目标”时会说“在互联网大厂从事商
业分析工作,这时候老师在点评时可以通过提问的方式提示学生加深思考,比
如要求他们补充:从事什么业务的互联网(比如电商、广告平台、资讯等)?要分
析哪个方向的问题(财务、市场、生产等,可参考图1.2)?会和哪些人合作,为
此需要掌握哪些其他学科的知识(比如帮助销售团队提升业绩,要懂一些财务知
识。如果这些知识数据科学专业培养计划中没有这些知识,要如何自己补充)?
(3)要求学生根据点评再次修改并提交报告。
第2章设定分析目标
五、教学目标
1.了解设定分析目标的重要性和一般步骤;
2.熟悉了解业务背景和评价工作优先级的方法;
3.掌握将业务问题转化为数据问题、为数据问题设计数据解决方案的方法;
4.掌握数据分析报告中关于业务背景介绍部分的写作方法。
六、教学方式与课时安排
课堂讲授:3学时
七、教学重点与难点
本章涉及很多知识点(如221小节中提到了五力模型模型),讲解知识点的过
程中要反复强调它们是“做什么用的”,通过目标将众多知识点串联成体系;
也要注意通过实际例子来帮助学生理解
八、教学过程
1.导入(20分钟):
(1)讲解。老师回顾图1.2,讲解设定分析目标的意义和评价分析目标是否
合理的标准。可借助微课2-1进行翻转课堂。
(2)提问。老师展示几个分析目标,学生按照3个标准对目标进行评价。
老师对学生回答做简要评价。
2.设定分析目标的工作步骤(5分钟)
(1)讲解。老师讲解三个步骤的基本工作内容。
3.设定目标的前期工作-了解业务和评价优先级(40分钟)
(1)讲解。老师讲解“了解业务”包含哪三各方面的具体工作、各自要如
何完成,可以借助微课2-2进行翻转课堂。
(2)讨论。讲解完五力模型后,学生分组讨论,每组可由老师指定(或学生
自选)一个行业,按照五力模型的框架,从五个方向分析行业的竞争情况。讨论
完成后由部分小组展示汇报讨论结果,老师做总结点评。
(3)讲解。老师讲解如何在了解业务的基础上“评价优先级”
4.明确分析目标(35分钟)
(1)讲解。老师讲解“业务语言”和“数据语言”的区别和对应关系,可
以借助微课2-4进行翻转课堂。
(2)讨论。学生分组讨论,仿照2.3节第二段的例子,每个小组列举“多个
业务问题对应同一种数据解决方案”和“一个业务问题需要多个数据解决方案支
持”的具体例子;并从例子中选择一个问题,明确其分析目标。讨论完成后由部
分小组展示汇报讨论结果,老师做总结点评。
5.数据分析报告写作(35分钟)
(1)讲解。老师讲解数据分析报告相关的基础知识,重点解释何为“面向
阅读者”的写作。可以从选择报告形式、安排报告内容、编辑排版内容三个方面
进行讲解。可以借助微课2-6进行翻转课堂,将“有问题的做法”和“正确的示
范”对照进行讲解.
(2)提问。老师可使用微课2-5中提到的几个场景进行提问,要求学生回答
在某个场景中应当写作什么形式的报告、报告篇幅如何规划、选取哪些素材、汇
报重点是什么等等。
(3)讲解。老师讲解“背景介绍”部分的重要性和写作方法。
(4)讨论。老师展示几个数据分析问题的基本介绍,学生分组讨论,每组
一个题目,针对这个题目列出“背景介绍”部分的写作提纲,明确各段落的大意
及各段之间的逻辑关系。讨论完成后由部分小组展示汇报讨论结果,老师做总结
点评。
第3章获取、验证和加工数据
九、教学目标
1.了解数据获取、验证和加工的重要意义;
2.熟悉通过Excel读入CSV等常见格式数据的方法;
3.熟悉数据验证的基本思路,能够通过Excel实施数据验证:
4.掌握通过Excel字符串公式等工具从文本数据中提取信息的方法;
5.掌握通过Excel数据透视表等工具对数据进行分组加工的方法;
6.掌握数据分析报告中数据说明部分的写作方法。
十、教学方式与课时安排
1.课堂讲授:3学时
2.演示汇报:3学时
十一、教学重点与难点
1.在实践场景中,获取、验证和加工数据环节一般会在数据分析过程中占
据相当大部分的工作量,有时候甚至工作目标本身就是获取、验证和加工数据,
建立用户画像的工作就是一项典型的加工数据的工作。但是这部分工作受到具体
的数据情况和应用场景的影响特别大,单纯从理论层面很难给出仝面又普适为行
为指南,在各门专业课中也较少涉及到相关的讲解和练习。
为此,在讲解过程中要特别注意引导学生理解“为什么”要做某一项操作,
通过对目标的强调来使得学生不但“知其然”还“知其所以然”,避免只聚焦于
具体操作。
2.此外,本章案例以企业端实务为背景,对于尚未工作的学生而言,没有
相关的生活或工作经验作为切入的依托点,会在理解背景方面遇到定困难。
微课3-1对这部分进行了比较详细的讲解,老师可依托微课进行讲解、组织
讨论和问答,帮助学生加深对业务问题的理解;也可利用第2章介绍的设定分析
目标的方法,要求学生在精读案例背景介绍后,完成一个明确的分析目标。
3.本章包含大量Excel操作,可以作为预习内容提前要求学生自学,将课堂
讲授时间更加集中在本上述两点内容的介绍。这个安排也是对实际工作环境的一
种模拟,建立快速寻找答案、解决问题的自学能力。如果学生通过自学掌握相关
内容有困难,可从演示汇报环节挪借1学时,不建议压缩对上述1/2两点内容的
讲解时间。
十二、教学过程
1.课堂讲授:3学时
(1)导入(25分钟):
a.讲解。老师回顾图L2,讲解获取、验证和加工数据的重要性。
b.讲解。老师介绍案例背景。可借助微课3-1进行翻转课堂。
C.讨论。学生在预习微课3-1和精读案例背景介绍的基础上,使用第2
章介绍的相关内容,为案例要解决的问题定义一个明确的分析目标,讨
论完成后由部分小组展示汇报讨论结果,老师做总结点评。
(2)获取数据(30分钟)
a.讲解。老师介绍各种常见数据源。
b.演示。老师演示3.2.2-3.23小节中与获取数据相关的操作。如学生
程度较好,可由老师提出要求,学生完成操作。
C.提问。老师针对各个常见数据源要求学生回答,每个数据源可以提
供哪些数据,并列举至少一个可以通过这个数据源提供的数据解决的业
务问题。比如:可以通过万得等付费终端获取上市公司的财务数据,可
以使用这些数据对上市公司的盈利情况和财务健康度做出评估,作为投
资的决策依据,
(3)验证数据(30分钟)
a.讲解。老师讲解验证数据的基本思路。
b.演示。老师演示33.2~3.33小节中与验证数据相关的操作,并讲解
如何解读箱形图、散点图,如何根据分位数函数提供的结果对分布进行
评价。如学生程度较好,可由老师提出要求,学生自行完成操作;或由
老师展示成果,由学生直接进行解读,老师对回答做出评价。
c.提问。老师简单总结讲解的各种数据验证项目。可以提出一种数据
验证项目,要求学生解释为什么要进行这一类验证;举出某一个验证示
例,要求学生回答它是从哪个角度对数据进行验证。老师可展示章案例
数据,逐个变量要求学生回答如应如何对该变量进行验证。
(4)加工数据(35分钟)
a.讲解。老师讲解加工数据的常用方法。
b.演示。老师演示3.4.2~3.4.3小节中与加工数据相关的操作。讲解重
点可放在VLOOKUP函数和函数嵌套:前者是Excel最常用的公式之一,
准确理解各参数意义一般即可全面掌握;后者相对灵活,老师可在教材
提供的几个例子基础上,再设计更多需要综合利用多个函数的场景,从
思路上给学生更多启发。如学生程度较好,可由老师提出要求,学生自
行完成操作;或由老师展示成果,由学生直接进行解读,老师对回答做
出评价。
c.提问。老师简单总结加工数据的常用方法,然后从思路和实践两个
方向提问要求学生问答°例如:如果某电商企业要建立用户画像,需要
获取哪些数据,如何将不同来源和粒度的数据合并为用户画像?想知道
章案例数据中有多少条广告是用户在搜索51job相关搜索词时出现的,
应该如何操作(对“搜索词”一列筛选包含“51job”或“前程无忧”的行,
对一个变量的多个筛选条件取并集)?在上述记录中,由Sljob自己投放
的广告有多少条,由其竞争对手投放的有多少条,要如何操作(可复习数
据透视表的使用)?
(5)数据分析报告写作(15分钟)
a.讲解。老师讲解数据分析报告中数据说明部分的重要性和写作方法。
可以借助微课3-2进行翻转课堂。
b.讨论。老师可以将数据说明与数据获取/验证/加工结合在一起进行提
问。例如,在基于用户画像数据对用户行为进行分析后,需要写作一篇
数据分析报告介绍用户的属性和行为进行介绍,这篇报告的数据说明表
应当包含哪些行?可选择部分小组进行展示。在这个讨论中,学生容易
混淆原始数据(如销售系统中的订单明细)和用于分析的数据(即基于原始
数据加工生成的用户画像);老师要基于学生的展示成果引导他们加深对
两者区别的理解。
2.演示汇报:3学时
(1)学生分组汇报,老师点评。
(2)点评中请注意几类学生在初学时经常遇到的问题并进行矫正:
a.1、(5)、b款中提到的混淆原始数据和分析数据的问题
b.在文字部分介绍不全面,比如对于数据获取的来源、选取数据的标
准、数据量等介绍不充分。这个问题在实践中经常会导致报告阅读者因
缺乏必要信息而无法对于数据可靠性做出判断,从而对分析结果存疑
(3)要求学生根据点评再次修改并提交报告。
第4章探索数据的基本特征
十三、教学目标
1.了解探索数据特征对于数据分析的重要意义;
2.掌握衡量数据特征的常用指标,能够通过Excel公式计算这些指标;
3.掌握常用数据图形的适用范围和绘图规范,能够使用Excel绘图工具绘制
常用数据图形;
4.熟悉组合图形的绘制规范,能够使用Excel绘图工具绘制常用的组合数据
图形;
5.掌握数据分析报告描述性分析部分的写作方法。
十四、教学方式与课时安排
1.课堂讲授:6学时
2.演示汇报:3学时
十五、教学重点与难点
1.在掌握各种具体描述数据特征的方法之余,要注意引导学生建立描述数
据基本特征的思路。想要全面地描述数据特征,一般要使用较多图表,在实技场
景中,学生所展示的图表经常会缺乏关联,看起来像一堆数据素材的堆砌。
老师在讲解本章内容时,可以在数据分析报告写作小节的讲解环节为学生展
示一些进行描述性分析的基本思路,例如:先展示最重要关键的指标,再展示可
能对它有影响力的因素;先展示总体情况,再展示各个组成部分的情况;先当前
结果,再从时间维度上进行预测或回溯等。在实践练习展示环节的点评中,也要
注意从内容整体性是否得到充分展示的角度做出评价,并督促学生做出修改。
2.本章案例是一个当前社会较为关切、也存在较多分歧的问题,学生对此
可能也持有不同观点。这是一个非常好的、插入思政与职业精神教育的环节:数
据分析的全部价值在于通过数据发现和展示事物的客观规律,客观规律不因个人
的生活经验、感情偏好而转移。从事数据分析工作的人要学会在工作场景中控制
自己的本能好恶,追求更加客观、更加完整地呈现事实。
同时,如果学生们对于这个问题的认知经过本章的学习和练习有所调整,大
家的分歧得以弥合,则这一章的学习也将是一个数据对于提升沟通效率和效果的
好例子,可以帮助同学们对于数据分析工作的实际价值有更深入的体会,建立职
业自信心和荣誉感。
3.本章包含大量Excel操作,可以作为预习内容提前要求学生自学,将课堂
讲授时间更加集中介绍每个例子是出于什么“目标”才要进行的,如何根据这个
目标选择了相关的“方法”。帮助学生巩固在“dothethingright”前先“dotheright
thing”的思维习惯,不要在工作中一下子就陷入具体细节,而是要先对所从事的
工作有全盘的规划和把控后再开始具体工作。反复强调并帮助学生建立这样的习
惯,对避免第1点问题非常有效且重要。
十六、教学过程
1.课堂讲授:6学时
(1)导入(5分钟):
d.讲解。老师回顾图1.2,讲解掌握数据基本特征的重要性。
(2)介绍章案例背景(40分钟):
a.讲解。老师讲解性别差异的衡量为什么是一个重要的问题?因为涵
盖复杂的现实、存在广泛的分歧。强调数据对于解决这种存在广泛分歧
问题的重要意义:建立一套统一的评价体系,将各方的思路统一到一个
逻辑上来
b.讲解。老师讲解由于性别差异问题的重要性,以及数据在解决此类
问题时能起到的特殊作用,很多组织研究、发布、分析相关的指标体系。
此处注意引导学生:数据并非代表绝对的正确或客观。每个指标(体系)
都与设计者的立场、目的相关。可回顾上一章的内容,再次强调数据验
证的重要性,验证本身包含验证数据记录和计算是否客观合理
C.演示。老师将案例背景介绍中提及的GGGR指标体系和5种其他性
别差异衡量指标(体系)做为预习任务提前分配给学生。要求每组学生查找
到一项指标(体系)的出处,并在课上由不同小组来演示每个指标体系的指
标构成和数据,对数据的可靠性做出简单的评价并阐述他们的理由,这
个环节可以帮助学生体验如何基于搜索引擎寻找国际组织的数据,综合
各种信息对获取的数据的可靠性进行基本评估;是进行二手研究时所需
的关键能力之一。
d.提问。老师根据演示环节中各组的展示结果,通过提问引导学生对
各个指标体系之间的异同进行比较,对各个指标体系做出评价。
e.讲解。老师介绍GGGR指标体系的构成和设计思路。
(3)指标:集中趋势与离中趋势(25分钟)
d.讲解。老师讲解四类数据。
e.提问。老师基于四类数据的特征,从正反两个方向提问:列举一些
数据要求学生判断是哪一类数据,指定一种类别要求学生举出此类数据
的实例。
f.讲解。老师讲解集中趋势和离中趋势。配合4.2.1节中的测试成绩或
类似的贴近学生日常生活的其他实例,帮助学生理解两类特征的意义。
g.讲解.老师讲解常用的集中趋势和澳中趋势指标,以及它们适用于
哪些数据。
h.提问。老师提出一些指标,要求学生回答适用于哪些类型的数据。
提出一类数据,要求学生回答适用于这类数据的集中趋势指标和离中趋
势指标有哪些C
i.演示c老师演示4.2.1节中涉及的各种Excel操作。如学生程度较好,
可由老师提出要求,学生完成操作。
(4)指标:绝对数与相对数据(15分钟)
d.讲解。老师讲解绝对数、相对数,对比两者的区别和联系。讲解绝
对数、相对数下细分的的几类指标。
e.提问。老师列举各类常用指标,要求学生从绝对数、相对数的分类
角度回答是那种指标。可使用章案例数据指标体系,也可使用GDP等宏
观经济统计指标、财务指标等。这里的要点是通过实例帮助学生加深对
概念的理解,所以选用的指标学生越熟悉越好。
(5)指标:先分组再计算每一组的指标取值(20分钟)
d.讲解。老师讲解为什么要对一些数据先分组再计算。
e.讲解。老师讲解分组计算数据特征的步骤和具体操作;介绍按照不
同标准选择分组依据的区别、使用情况;介绍如何选择组界;介绍累计
频数的概念和计算方式。
f.提问。老师提出几个分析场景,由学生回答在每个场景中,要选择
哪个指标作为分组依据、计算哪些指标。
g.演示。老师演示424小节中涉及的各种Excel操作。如学生程度较
好,可由老师提出要求,学生完成操作。
(6)图表:统计表及规范(20分钟)
C.讲解。老师简单回顾4.2.4节中几个基本表格;讲解列联表;讲解制
作统计表的格式规范。
d.演示。老师演示43.1~4.3.2小节中涉及的各种Excel操作。如学生程
度较好,可由老师提出要求,学生完成操作。
(7)图表:基于分析目标的图形分类(15分钟)
A.讲解C老师讲解图形在数据分析中的重要性C提前要求学生预习微
课4-3,可选取其中部分图形,在表现力层面对比图形与文字、表格。
b.讲解。老师围绕图4.21从两个维度对数据图形进行分类:第一个维
度,按照四种常见的分析目标,第二个维度按照Excel画图功能。
(8)图表:柱形图系列(20分钟)
a.讲解。老师围绕图4.22概述此系列包含的图形,展示在Excel中绘制
本系列图形所涉及的菜单项所在位置。
b.提问。老师展示几个适用于本系列图形的分析目标与场景,学生回
答应使用哪个具体图形。通过提问帮助学生加深理解,比如适用柱形图
还是条形图。
c.提问。老师分别展示图4.25、图4.26、图4.28、图4.29和图4.30,
学生根据每张图回答两类问题:图形与Excel默认设置相比,为了规范化
和美观,做了哪些具体调整?对每张图中展示的数据做出描述和解读。
其中,在学生回答第二类问题时,老师要特别注意引导他们在答案中包
含两部分内容:描述图中的数据特征,根据分析目标和数据特征做出解
读(即,通过数据特征来回答分析目标提出的问题)。本部分(8广(12)点教
学中可贯彻这个训练,培养和强化学生在实际问题与数据特征之间建立
关联的能力与习惯。
(9)图表:折线图系列(10分钟)
a.讲解。老师围绕图4.33概述此系列包含的图形,展示在Excel中绘制
本系列图形所涉及的菜单项所在位置。
b.提问。老师展示几个适用于本系列图形的分析目标与场景,学生回
答应使用哪个具体图形。通过提问帮助学生加深理解,比如柱形图和折
线的区别、(百分比)堆积面积图和(百分比)堆积柱形图的区别。
c.提问。老师展示图4.35,学生根据图形回答两类问题:图形与Excel
默认设置相比,为了规范化和美观,做了哪些具体调整?对图中展示的
数据做出描述和解读。
d.讲解。老师总结在柱形图和折线图系列中使用的图形编辑技巧,并
且回顾为什么要对图形进行相关的调整。
(10)图表:饼图系列(15分钟)
a.讲解。老师围绕图4.36概述此系列包含的图形,展示在Excel中绘制
本系列图形所涉及的菜单项所在位置。
b.提问。老师展示几个适用于本系列图形的分析目标与场景,学生回
答应使用哪个具体图形。通过提问帮助学生加深理解,比如同样是多层
分类,字母饼图、复合条饼图、旭R图分别适用于什么样的场景:如果
分类过多,使用饼图无法看清,应该如何做;如果分类不是完备互斥集
要如何做;如果不能知道所有分类对应的数据,是否还可以使用饼图等。
C.提问。老师分别展示图4.37、图4.38、图4.44,学生根据每张图回
答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些
具体调整?对每张图中展示的数据做出描述和解读。
(11)图表:散点图系列(20分钟)
d.讲解。老师围绕图4.45概述此系列包含的图形,展示在Excel中绘制
本系列图形所涉及的菜单项所在位置
b.提问。老师展示几个适用于本系列图形的分析目标与场景,学生回
答应使用哪个具体图形,或如何进行设置。通过提问帮助学生加深理解,
比如列举一个气泡图的应用场景,提问三个变量哪个做X轴、哪个做Y
轴、哪个对应气泡大小。
c.提问。老师分别展示图4.46、图4.48、图4.53,学生根据每张图同
答两类问题:图形与Excel默认设置相比,为了规范化和美观,做了哪些
具体调整?对每张图中展示的数据做出描述和解读。
d.讲解。老师总结在前四个系列中使用的图形编辑技巧,并且回顾为
什么要对图形进行相关的调整。
(12)图表:其他图形(25分钟)
a.讲解。老师围绕图4.55概述此系列包含的图形,展示在Excel中绘制
本系列图形所涉及的菜单项所在位置。
b.提问。老师展示几个适用于本系列图形的分析目标与场景,学生回
答应使用哪个具体图形,或如何进行设置。通过提问帮助学生加深理解,
比如提供两个分类问题,提问学生适用饼图/旭日图,还是树状图等。
c.提问八老师分别展示图4.57、图459、图4.60、图4.62,学生根据
每张图回答两类问题:图形与Excel默认设置相比,为了规范化和美观,
做了哪些具体调整?对每张图中展示的数据做出描述和解读。
(13)图表:作图提效技巧(15分钟)
a.讲解。老师提出单一图形无法满足需求的典型场景,导出组合图形
的重要性。
b.提问。老师通过提问引导学生思考哪些图形可以组合,哪些图形不
可以组合。
c.讲解。老师讲解使用模板功能的典型场景。
d.讲解。老师回顾所有图形分析类与图形编辑操作,再次加深学生对
于图形选型(即根据分析目标和数据特征选择恰当的图形)、图形规范化、
美观性的认识。在后续的作业、实践与演示环节,也要注意从这三个角
度对学生给出评价和指导。
(14)数据分析报告写作(20分钟)
a.讲解。老师讲解数据分析报告中描述性分析部分的重要性。
b.讲解。老师从整体到局部讲解写作文字版数据分析报告的注意事项:
框架部分要逻辑架构清晰合理、各部分内容比例适当;各部分文字之间、
文字与图表之间要有关联,而不是各自为政;文字本身要符合中文的写
作规范、符合报告阅读者的接受能力。
C.提问。老师可列举一些往期学生报告中典型的问题,要求学生根据
讲解找到问题。如果是首次开课,可从狗熊会丑图百讲系列推文中选取
素材。
2.演示汇报:3学时
(1)学生分组汇报,老师点评。
(2)点评中请注意针对几类学生在初学时经常遇到的问题进行反馈和提出
修改要求:
C.全篇逻辑奖构、篇幅比例是否安排合理
d.各部分内容是否有合理的过渡,全篇报告具有整体性
e.图表使用是否恰当、规范、美观
f.对图表中的数据特征解读是否正确,是否根据数据特征做出了合理
的解读
g.是否基于数据分析工作对所研究的问题做出了合理的回答
(3)要求学生根据点评再次修改并提交报告。
第5章建立回归模型
十七、教学目标
1.理解回归模型的基本思路和理论框架,能够识别回归模型适用的典型业
务场景;
2.理解回归模型的3要素,以及线性回归和逻辑回归的基础理论知识;
3.掌握使用Excel建立和检验线性回归模型和逻辑回归模型的方法;
4.掌握解读线性回归模型和逻辑回归模型的结果,以及基于模型做出业务
改进建议的方法;
5.掌握数据分析报告模型分析与解读部分的写作方法。
十八、教学方式与课时安排
1.课堂讲授:6学时
2.演示汇报:3学时
十九、教学重点与难点
本章内容包含较多统计学技术细节。对于非数据科学专业学生的数据技能训
练课程,或数据科学专业新生的专业基础课,学生可能缺乏全面理解其中部分技
术细节的知识储备。
本书提供了一些配套微课讲解这些相关内容。如学生程度较好或学时较为富
余,老师可配合微课较为深入、详尽地介绍相关内容。但仍建议将授课重点放在
理解回归分析的思路框架,帮助学生建立用回归方法剖析问题的思路上,即优先
理解回归模型“可以解决什么问题”“如何将一个业务问题规范为一个回归问题”
“如何使用一个回归模型结果解决.业务问题”“为什么要选用这样的模型形式”
“这个目标函数的含义是什么”,其次才是回归模型“如何推导”“如何估计”“如
何评价”“如何检验”等。
系统地学习回归分析中的技术性内容可留待统计学或回归分析等课程。本课
程的教学重点仍然是学会用数据的思路去剖析和解决实际问题,学生可以在软件
输出结果中找到并使用与模型估计、评价、检验相关的指标并对其做出解读即可。
二十、教学过程
1.课堂讲授:6学时
(1)导入(45分钟):
e.讲解。老师回顾图1.2,讲解模型分析的重要性。
f.讲解。老师介绍案例背景。
g.讲解。老师讲解回归模型的基本构成元素:一个可量化的关键业务
要素Y,多个可量化且对关键指标有影响力的X,Y与X之间的关联关系。
h.提问。老师根据案例背景和回归模型的基本构成要素,提问学生在
“知识网红”案例中可以定义哪些Y、每一个Y应当如何定义。
i.讨论。学生分组,一半小组指定题目“哪些专家可以成为知识网纥”,
一半小组指定题目“什么样的话题更受欢迎”。各小组基于章案例数据讨
论Y是什么、X有哪些、每个X对于Y的影响预估是什么样的(正相关还
是负相关、影响力大小等)°这个过程要注意引导学生,并非所有的数据
都是现成准备好的,要根据自己的建模需求进行加工,可作为第三章相
关内容的回顾(比如在“哪些专家可以成为知识网红”这个问题中,原始
数据中并没一个现成的变量“是否是知识网红”,就需要学生自己根据专
家的业务量做出划分)。两个题目各选择代表小组上台陈述,老师做出提
问和点评,点评主要基于回归模型的基本构成要素的框架来进行。
(2)五种常见的回归模型(20分钟)
j.讲解。老师介绍五种常见的回归模型。
k.提问。老师列举各类典型场景,学生回答应当使用哪种回归方法、
如何定义Y,可以考虑寻找哪些X。
(3)线性回归模驾导入(10分钟)
f.讲解。老师回顾线性回归适用的Y,洋细讲解Y连续在实际中的处理
方式。讲解X的重要性。
g.提问。老师提出一些实际数据的例子,学生回答,是否可使用线性
回归模型,并回答理由;尽可能多地列举出可能的X,并陈述可以从哪
个数据源获取用关数据,是否需要对数据进行一定的加工,是否有一些
X难以获取、是否可替代等。
(4)线性回归模型-理论(40分钟)
a.讲解。老师讲解使用线性回归模型分析数据的基本流程,确定场景
适用、确定数据符合模型基本假设(如不符合可做一定转换)、估计模型、
检验模型、通过变量选择等方法调整模型形式、评价模型、诊断残差、
解读模型、应用模型。
b.讲解。老师讲解线性回归模型的基础形式,重点理解参数的含义。
c.讲解。老师讲解线性回归模型的基本假设,重点理解线性关系、如
过数据呈现非线性关系要如何处理。
d.讲解。老师讲解线性回归模型的参数估计,重点理解理解目标函数
的含义,即为什么以它为目标函数。
e.讲解。老师讲解F检验和t检验,重点理解两个检验的零假设和备择
假设分别是什么含义,实践中希望看到什么样的检验结果。如果看到F
检验通过而部分变量t检验未通过的情况,要进行变量选择.重点理解
如果不进行变量选择则模型不稳定,预测结果不可靠。
f.讲解。老师讲解线性回归模型的评价,重点理解.:R2公式所表达的
意义:衡量模型可以解释的数据变动在整体数据变动中所占的比例,
g.讲解。老师讲解线性回归模型残差中几种典型问题,重点理解每种
问题产生的原因、可使用的解决方法。
h.提问。老师以提问形式带领学生回顾线性回归模型相关的知识点,
提问重点是b~g中要求重点的理解的内容。
(5)线性回归模型-实现(25分钟)
a.演示。老师演示5.2.1和5.3.2小节中安装插件、建立线性回归模型、
根据建模结果改进线性回归模型等相关操作;如学生程度较好,可由老
师提出要求,学生自行完成操作。
b.提问。老师展示模型结果,由学生逐一找到(4)d~g中相关的结果,
并对结果做出解读,老师对回答做出评价,复习线性回归模型相关理论
知识。
(6)线性回归模型-解读(15分钟)
a.讲解。老师讲解如何对线性回归模型参数做出解读。可借助微课5-8
进行翻转课堂.
b.提问。老师展示图5.16,学生回答结果中各部分的用途、并根据数
据对模型的可靠性等做出评价,对模型结果做出具体解读。通过复习再
次回顾线性回归相关的知识。
c.提问。老师展示图5.16,给出几组X值,要求学生应用模型计算预
测值,并将模型预测结果转化为Y的原始量纲,对预测结果的可靠性做
出评价。可适度发散,通过预测实例引导学生思考:比较用于预测的X
取值位于用于建模的X取值范围内,和两者相差过大两种情况,对预测
预测结果的可靠性是否有影响。
(7)逻辑回归模型•导入(10分钟)
h.讲解。老师回顾逻辑回归适用的Yo讲解在编码时如何确定正事件和
负事件。
i.提问.老师要求学生举出一些适用逻辑回归的实际问题,并明确在
这些场景中Y应如何定义,可选取哪些X,数据都可从何渠道获得。
(8)逻辑回归模理-理论(40分钟)
a.讲解。老师讲解使用逻辑回归模型分析数据的基本流程,与线性问
归相似。
b.讲解。老师讲解逻辑回归模型的基础形式,重点在Logit变换:为什
么要进行这个变化(Y是0-1变量,通过变换可以套用线性回归的模型形
式);通过变换套用线性回归模型形式,但为什么没有误差项(可借助微课
5-9进行翻转课堂)。
c.讲解。老师讲解逻辑回归模型的参数估计,重点理解理解目标函数
的含义,即为什么以它为目标函数。
d.讲解。老师讲解评价逻辑回归模型的常用指标,重点理解临界值、
混淆矩阵、灵敏度和特异性、ROC曲线和AUC值的定义和用途。
e.提问。老师以提问形式带领学生回顾逻辑回归模型相关的知识点,
提问重点是b~d中要求重点的理解的内容,如:给出ROC曲线,要求选
择临界值、计算AUC值,根据计算结果评价模型;给出TP、FN、TN、
FP,要求计算TPR.FPR等指标,根据计算结果评价模型;针对同一问题,
给出多个逻辑回归模型,要求学生选择哪个模型更好。
(9)逻辑回归模型-实现(25分钟)
a.演示。老师演示5.2.1和5.4.2小节中安装插件、建立逻辑回归模型、
根据建模结果改进逻辑回归模型等相关操作;如学生程度较好,可由老
师提出要求,学生自行完成操作。
b.讲解。老师讲解原始系数和指数化系数区别,如何在两者间互换。
c.提问。老师展示模型结果,由学生逐一找到⑻c~d中相关的结果,并
对结果做出解读,老师对回答做出评价,复习线性逻辑模型相关理论知
识。
(10)逻辑回归模型-解读(10分钟)
d.讲解。老师讲解如何对逻辑回归模型参数做出解读。可借助微课5-11
进行翻转课堂。
P.提问。老师展示图5.21,学生I可答结果中各部分的用途、并根据数
据对模型的可靠性等做出评价,对模型结果做出具体解读。通过复习再
次回顾线性回归相关的知识。
f.提问。老师展示图5.21,给出几组X值和不同的临界值,要求学生
应用模型计算预测值,引导学生观察临界值选取对于预测结果的影响,
对预测结果的可靠性做出评价。
(11)数据分析报告写作(25分钟)
e.讲解。老师讲解数据分析报告中模型分析部分的重要性和写作方法。
f.讨论。学生分组,每组分到一个模型结果(图5.16或图5.21)+一种报
告形式(文字版或演示版),所有小组应覆盖全部4种组合。学生讨论列出
在指定形式的数据分析报告中汇报相关模型的详细内容大纲。文字版报
告要列出每个自然段的段落大意,并将引用的相关图表也插入到相关位
置。演示版报告要列出每页PPT的内容摘要十该页要呈现的图表。完成
后部分小组进行汇报,老师做出评价反馈。全部汇报完成后,老师可对
4种组合做一定对比,帮助学生复习第2章相关知识。
2.演示汇报:3学时
(1)学生分组汇报,老师点评。
(2)点评中请注意几类学生在初学时经常遇到的问题并进行矫正:
h.在建立和优化模型时对于某些指标理解不到位,模型尚有可优化空
间。
i.对于模型评价指标理解不到位或汇报不全面。
j.只有技术细节,没有对模型的解读和应用。
k.在应用模型进行预测时,对其实际意义理解错误或不够深入。
(3)要求学生根据点评再次修改并提交报告。
第6章设计数据产品
二十一、教学目标
1.了解常见的数据产品形式及其适用场景;
2.掌握数据分析报告这一数据产品形式的制作过程;
3.掌握通过写作数据分析报告的形式表达数据分析工作成果的方法。
二十二、教学方式与课时安排
1.课堂讲授:6学时
2.演示汇报:3学时
二十三、教学重点与难点
1.本章涉及的内容在缺乏实践经验时较难充分理解,可搭配微课和实例进
行讲解。
2.可在讲解本章6.2节内容是对全书关键内容进行总结,在多章实践练习后,
通过复习强化学习成果。
二十四、教学过程
1.导入(20分钟):
(1)讲解。老师回顾图1.2,讲解数据产品作为推广数据工作成果的重要工
具的重要性。
(2)讲解。老师讲解数据产品的三种主要形式。从问题的不确定性高低、
适用的场景、产出形式、目标用户、产品核心功能、开发所需资源等维度对三种
产品进行对比。
(3)提问。老师提出几个具体场景,学生回答适用什么形式的数据产品。
老师提出一种数据产品形式,学生回答适用什么场景。
2.数据产品:自动报表系统(40分钟)
(1)讨论。学生分组,老师为每组指定一个公开的数据仪表盘类数据产品,
如百度指数、百度迁徙、猫眼电影票房、网易云音乐排行榜等。各小组讨论梳理
该数据产品的目标受众、公司提供产品要达到什么目标;整理该产品提供了哪些
模块、哪些指标重点展现、产品是否提供了与用户互动的功能;产品的设计是否
有问题或可改进的空间。讨论完成后,小组将讨论结果整理成简要提纲并汇报演
不0
3.数据产品:数据分析报告(35分钟)
(1)讲解。老师从数据产品的角度讲解数据分析报告,结合图1.2回顾全书
内容要点,具体内容兀根据前面章节的学习目标自习题中选择。
(2)提问。老师提问每个步骤要解决的关键问题,学生回答。问题范围可
涉及第1~5章的重要知识点。
(3)讲解。老师以6.3节自检表为提纲,讲解写作完整数据分析报告时要注
意的要点问题。
4.项目:定义分析题目与规划分析提纲(40分钟)
(1)讨论。学生分组。木章要求每组选择第3-5章案例中的一个,完成一
份完整的分析报告,应保证每个案例都有小组选择.各小组在前面章节的学习中
分别完成过某一个部分的分析工作(如处理加工数据、进行描述性分析、建立回
归模型等),这一环节的讨论要求各组明确:
①定义自己的研究题目:可以沿用书中第3~5章案例定义的题目,也
可以基于数据另外定义新的题目;老师可鼓励学生尽量选择新定义
题目,这样可以让学生在“选题”方面得到更多练习。比如第4章
主要分析了各国家/地区在某一年的整体得分情况,本次学生可以定
义研究某一个(或某一组,如某大洲)国家/地区历年得分情况的变化,
或者研究某一类指标(比如各国家/地区得分差异较大的“政治赋权”
和“经济-参与度与机会”两个分项及其明细指标)。
②列出分析提纲:内容包括为支持研究题目要对数据进行哪些加工、
描述性分析包含哪些图/表、拟采取哪种模型(因变量与自变量分别有
哪些)、分圻结果可以在实践中如何应用
(2)汇报。学生汇报题目和分析提纲。老师评价题目选取是否恰当、选取
和加工数据的思路是否与题目要求匹配、描述性分析部分逻辑是否完整流畅、分
析结果应用是否有合理和有可执行性。学生在这些方面如不恰当,老师应通过点
评提出修改要求。
(3)此环节完成后,课后要求学生提交初稿(演示版+阅读版)。初稿应确保
选题合理、分析提纲执行到位。
5.项目:基于初稿的讨论和修改(135分钟)
(1)讲解。老师基于各小组上周提交的初稿,总结共性问题进行讲评,重
点在分析结果的评价和解读、逻辑线、内容安排、报告制作的规范和美观。
(2)讨论。学生分组根据老师的讲解进行修改。老师参与各组讨论,针对
每组的个性化问题进行讲解,确保学生学生对于修改意见理解到位。观察学生修
改情况是否符合要求。
(3)讲解。老师讲解演示汇报方面的要求。
(4)此环节完成后,课后要求学生提交报告定稿(演示版+阅读版)。定稿应
确保学生完整落实老师对于初稿的修改意见。
6.演示汇报:3学时
(1)学生分组汇报
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年绵阳市第三人民医院招聘考试试卷真题
- 2025年德州天衢新区招聘教师考试试卷真题
- 5.语法分析-LALR(1)方法
- 2029年粮油调料配送合作协议三篇
- 幼儿园中班铁路安全
- 有理数的乘除运算(第2课时有理数的乘法运算律)课件2026-2027学年学年北师大版七年级数学上册
- 译林版英语六年级下册Unit8 课时作业1
- (2026年)新工人进场三级安全教育(木工班组)试卷及答案
- 中小学校财务管理制度
- 2026边境辅警面试题目及答案
- 2024年7月1日实施新版医疗器械采购、收货、验收、贮存、销售、出库、运输和售后服务工作程序
- 概率论与数理统计(天津理工大学)智慧树知到期末考试答案2024年
- 电梯安装工操作培训教材
- 煤矿机电考核制度
- 服饰鉴赏-河南科技学院中国大学mooc课后章节答案期末考试题库2023年
- GB/T 28544-2012封装闪烁体光输出和固有分辨率的测量方法
- FZ/T 07004-2019纺织行业绿色工厂评价导则
- 专题4生物技术的安全性和伦理道德4.2关注生物技术的伦理问题
- 发变组保护原理培训课件
- 中考语文总复习教学案全套
- 环境因素识别、评价与控制程序
评论
0/150
提交评论