教案课题成对数据的统计分析的应用_第1页
教案课题成对数据的统计分析的应用_第2页
教案课题成对数据的统计分析的应用_第3页
教案课题成对数据的统计分析的应用_第4页
教案课题成对数据的统计分析的应用_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教案课题成对数据的统计分析的应用黄亚河20230508一、教学目标1.通过本章的知识框架结构图,熟悉成对数据的统计分析的相关知识,查漏补缺,建构本章知识的结构体系;2.通过梳理回归分析、独立性检验过程,总结成对数据的统计关系及分析方法;3.利用样本相关系数判断、线性回归模型参数最小二乘估计、值判断,以及回归分析的预测、独立性检验的解释,体会模型思想、假设检验思想和样本估计总体的思想;4.通过典型问题的解决,会综合运用相关系数、一元线性回归分析、列联表独立性检验解决相关成对数据等实际问题;5.提升在实际问题中运用数学知识、技能、方法、思想的能力,落实直观想象、数据分析、数学运算、数学建模、逻辑推理等核心素养。二、教学内容本节课内容选自普通高中数学教材人教A版数学选择性必修第三册第八章《成对数据的统计分析》。体会两个变量间的相关关系,掌握相关关系的判断,能根据散点图对线性相关关系进行判断;会通过相关系数比较多组成对数据的相关性,了解样本相关系数与标准化数据向量夹角的关系;了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理;会通过分析残差图法、残差平方和和利用决定系数判断回归模型的拟合效果;通过实例,理解列联表的统计意义,理解判断两个分类变量是否有关系的常用方法:频率分析法、等高条形图法;了解随机变量的意义,了解独立性检验的基本思想和方法。通过本单元的学习,学生厘清成对数值变量、分类变量的统计分析方法,强化其中构造的统计量的含义;体会模型、假设检验、样本估计总体的思想与方法,并能应用它们解决综合的实际问题。1.教学重点:(1)构建本章的知识框架结构(2)理解相关关系、散点图、样本相关系数等基本概念理解一元线性回归模型的概念,通过对残差和残差图的分析,能用残差判断一元线性回归模型的拟合程度将非线性回归问题转化为线性相关问题,能用决定系数判断线性回归模型的优劣基于列联表,能通过实例解释独立性检验的基本思想,归纳出独立性检验的基本步骤,提升数据分析的能力2.教学难点:(1)回归模型与函数模型的区别,随机误差产生的原因与影响(2)运用合适的变换将非线性相关问题转化为线性相关问题,用决定系数判断模型的优劣程度(3)统计变量的导出与意义,独立性检验的思想与方法三、学生学情整节课贯穿探索-总结式教学原则,并由此获得成功的体验,激发学生学习数学的兴趣和学好数学的信心,践行“学会想象,体验升华过程,学会逻辑推理”的理念。1.直观想象:通过散点图判断两个变量间的关系2.逻辑推理:了解样本相关系数与标准化数据向量夹角的关系;了解最小二乘原理,从而掌握一元线性回归模型的最小二乘估计;参数的意义及参数估计公式的推导3.数学运算:运用相关系数来判断两个变量间的相关关系;利用卡方进行独立性检验4.数据分析:运用残差、残差的平方和和决定系数判断线性回归模型的拟合程度5.数学建模:基于图形建立数学模型。四、教学过程环节一、构建知识结构图【问题1】:你能画出本章的知识结构图吗?.结构图环节二:知识梳理(一)、成对数据的统计相关性1.举例说明成对数据是如何产生的?(1)案例:教育部门为掌握学生身体健康状况,需要了解身高和体重之间的关系;医疗卫生部门要制定预防青少年近视的措施,需要了解有哪些因素会影响视力,以及这些因素是如何影响视力的;由此可以知道,需要了解两个或两个以上变量之间的关系,需要对同一个个体的两个维度进行观测,从而形成成对数据。什么叫相关关系,它与函数关系有什么区别?变量的相关关系常见的有两类,一类是确定性关系,即函数关系;另一类是两个变量有关系,但又没有确切到可由其中的一个区精确地决定另一个的程度,这种关系称为相关关系。3.两个变量之间的关系类型4.如何从定量的角度刻画成对样本数据的线性相关程度?(1)样本相关系数的定义我们称为变量和变量的样本相关系数成对样本数据的变化特征r的正负性当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。当r<0时,称成对样本数据负相关;当其中一个数据的值变小时,另一个数据的值通常会变大:当其中一个数据的值变大时,另一个数据的值通常会变小。r的绝对值样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱;样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.(二)、一元线性回归模型及其应用(1)什么是一元线性回归模型,模型参数与的统计意义是什么?由于散点大致分布在一条直线的附近,所以两变量之间有较强的线性相关关系,可以用线性回归模型来表示,我们称为Y关于x的一元线性回归模型.a:截距参数;b:斜率参数,它们刻画了变量Y与变量的线性关系;其中参数b的含义可以解释为自变量x对响应变量Y的均值的影响,变量x每增加一个单位,响应变量Y的均值将增加b个单位。(2)最小二乘原理是什么?你能说说它的基本思想吗?人们通常用各散点到直线的竖直距离的平方之和来刻画各样本数据与直线的“整体接近程度”。当的取值为我们将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法.求得的叫做的最小二乘估计。最小二乘法体现了函数的思想,运用它求解参数的估计值。基本思想是样本估计总体的思想。怎样判断模型的拟合效果?①残差图法残差点比较均匀的落在以取值为0的横轴为对称轴的水平带状区域内,带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高。②残差平方和法残差平方和越小,即模型的拟合效果越好。③决定系数的计算公式为.越大,越趋近于1,表示残差平方和越小,即模型的拟合效果越好在实际情况中,我们还会发现不是所有的两个变量关系都适合用一元线性回归模型,那么常见的非线性模型有哪些呢?怎样求它的回归模型呢?指数函数型等式两边取自然对数,得,令则②幂函数型 等式两边取自然对数,得,令,则得对数函数型令,则得(三)、独立性检验(1)如何从直观的角度判断两个分类变量是否有关?与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高堆积条形图展示列联表数据的频率特征.(2)独立性检验的基本思想是什么?它与反证法有何异同?独立性检验依据的是小概率的原理,体现的是假设检验的基本思想。它和反证法的共同点都是从某种假设,最后利用结论推断是否成立。不同点是结论形成的依据不同,而且反证法不会犯错误,但独立性检验会犯随机性错误。(3)独立性检验的基本思想是什么?对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准,概率值α越小,临界值xα越大.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立。五、典例分析年份x20102012201420162018需求量y/万吨236246257276286例1:某地最近十年粮食需求量逐年上升,下表是部分统计数据利用所给数据求年需求量与年份之间的线性回归方程(2)利用(1)中所求的线性回归方程预测该地2020年的粮食需求量。解:(Ⅰ)由折线图中数据和附注中参考数据得所以,y关于t的回归方程为:.2)利用所求得的线性回归方程,可预测2020年的粮食需求量大约为小结:1、你能说出判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)利用相关系数r的值判断。2、在例1中构建线性回归方程的一般步骤是什么?体现了那些数学思想与方法?(1)收集样本数据;(2)作出散点图,线性相关关系(3)代入公式计算公式为(4)写出线性回归方程.在这个回归分析中蕴含了数形结合、定量与定性结合、数学建模等数学思想与方法。例2.某公司为确定下一年度投入某种产品的宣传费,对近8年的年宣传费和年销售量(1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值(Ⅰ)根据散点图判断,y=ax+b与哪一个适宜作为年销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:解:(Ⅰ)根据散点图判断,更适宜作为年销售量y关于年宣传费x的回归方程类型。(Ⅱ)令,先建立y关于w的线性回归方程式由于由于∴建立y关于w的线性回归方程式为∴关于y的线性回归方程式为小结:你能归纳求非线性回归方程的步骤吗?(1)确定变量,作出散点图(2)根据散点图,选择恰当的回归模型来拟合(3)通过换元把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)根据相应的变换,写出非线性回归方程例3一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6组测数据如下表:甲同学用线性回归模型得到乙同学用非线性回归模型,得到且(1)甲乙两个同学用的回归模型相比,哪种的拟合效果更好?这种模型是不是最好的模型?(2)用拟合效果好的模型预测温度为35℃时,该药用昆虫的产卵数?解:甲同学用线性回归模型得到的决定系数因为,所以乙同学的非线性回归方程拟合效果更好。当温度为35℃时,该药用昆虫的产卵数约为:例4,调查某医院某段时间内婴儿出生的时间和性别的关系,得到下面的数据表,能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系呢?【解析】根据上表数据得到等高条形图:由等高条形图可以初步判断:婴儿性别与出生时间有关系。解:假设婴儿性别与出生时间没有关系,由列联表中的数据得出的观测值因为而3.689>2.706,因此在犯错误概率不超过0.1的前提下认为“婴儿的性别和出生的时间有关系”。【师生活动】:学生独立思考,教师引导学生形成规范解答。(2)零假设:“防疫标兵”与性别无关.由列联表中的数据,可以求得:K方的值查临界值表可知,我们有95%的把握认为“防疫标兵”与性别有关。小结:通过例3,你能归纳出运用独立性解决实际问题的步骤吗?(1)提出零假设和相互独立,并给出在问题中的解释(2)根据数据整理出列联表(3)计算卡方的值(4)与临界值比较,得出结论六、课堂小结1、本节课学习了哪些内容?成随数据的统计分析相关知识点,构建了本章的知识结构图2、对本节课的三道例题进行反思总结,体会用成对数据的统计方法解决实际问题的方法。七:作业布置八:教学反思本单元教学设计基于单元整体化教学理念,对教科书进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论