概率论与数理统计 教案 第七章数据的分析 第三节 方差分析 第四节 线性回归分析_第1页
概率论与数理统计 教案 第七章数据的分析 第三节 方差分析 第四节 线性回归分析_第2页
概率论与数理统计 教案 第七章数据的分析 第三节 方差分析 第四节 线性回归分析_第3页
概率论与数理统计 教案 第七章数据的分析 第三节 方差分析 第四节 线性回归分析_第4页
概率论与数理统计 教案 第七章数据的分析 第三节 方差分析 第四节 线性回归分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《概率论与数理统计》教学设计方案PAGE51.知识与技能目标:(1)掌握单因素方差分析的基本原理(试验指标、因素、水平的概念);(2)掌握最小二乘估计的计算方法;(3)方差分析中掌握判断因素水平对试验指标的影响显著性.2.能力与思维目标:(1)能从实际问题中提取关键数据,选择合适的统计方法(方差分析/回归分析)进行建模与解读;(2)通过平方和分解、显著性检验等过程,理解“从数据差异到结论推断”的逻辑链条.3.情感态度与价值观目标(1)树立严谨的科学态度:培养一丝不苟的治学精神;(2)增强应用意识:感受统计方法在解决社会实际问题中的价值(如通过回归分析优化资源配置),激发用数学知识服务社会的责任感.(1)单因素方差分析的实际应用;(2)线性回归分析的建模与显著性检验(最小二乘估计的意义、三种检验方法的选择与应用).处理措施:案例驱动:以“不同地区学生数学成绩差异分析”(方差分析)、“某网店销量与促销费用的关系”(回归分析)为贯穿案例,从“问题提出→数据呈现→方法选择→软件操作→结果解读”分步拆解,让学生直观感受统计方法的应用场景.方差分析中“平方和分解”的逻辑(总差异为何能分解为效应差异与误差差异.处理措施:用“类比法”。将“总差异”比作“班级总分差异”,“效应平方和”类比“不同小组(因素水平)的平均分差异”,“误差平方和”类比“小组内个体的分数波动”,通过生活化类比理解分解逻辑,再结合数学公式推导验证.思政元素融入知识点1试验指标的概念:在方差分析中,我们将要考察的对象的某种特征称为试验指标.影响试验指标的条件称为因素.因素所处的状态,称为该因素的水平.如例7.5中“索赔额”就是试验指标,“地区”为因素,“四个不同地区”即为四个水平如果在一项试验中只有一个因素在改变,则称为单因素试验;如果多于一个因素在改变,则称为多因素试验.为方便起见,一般用大写字母等表示因素,用大写字母加下标表示该因素的水平,如等.[情景与案例]例7.5某大型保险公司为了解其推出的“新能源汽车三电系统专属保险”在四个不同地区的年度索赔额是否存在显著差异,从而优化区域定价和风险管理策略。公司随机抽取了四个代表城市(A1,A2,A3,A4)在过去一个保单年度内发生的部分索赔记录,索赔金额(单位:万元)如表7.1所示:表7.1保险索赔记录保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60试问:基于上述样本数据,能否判断在四个不同地区,新能源汽车三电系统险种的年度索赔额存在显著差异?(显著性水平)超星学习教学环节主要教学内容学生活动安排反转课堂,帮助学生绘制知识线(共2分钟)课前的案例如何解决,索赔差异的不同可能是由地区差异引起的,当然,在同一地区,由于随机因素的影响,也使其索赔额存在差异,这种影响我们通常记为随机误差。为解决这个问题,我们继续来学习。学生思考二、新课知识点:偏差平方和及其分解第三节方差分析单因素方差分析:仅考虑一个因素A对试验指标的影响。设单因素A具有r个水平,分别记为在每个水平下,进行了多次独立观测,将要考察的指标可以看成一个总体,故有个总体,并假设:每个总体均服从正态分布;每个总体的方差相同;从每个总体中抽取的样本相互独立.因此,有如下数学模型:(7-5)其中与均为未知参数.(7-5)式称为单因素试验方差分析的数学模型.方差分析的目的是要比较因素A的r个水平下试验指标理论均值的差异,即比较这r个总体的均值差异。检验假设假设检验采用的方法是平方和分解。我们寻找适当的统计量,对参数作假设检验.为了使造成各之间的差异的大小能定量表示出来,我们先引入:记在水平下数据和记为:,其样本均值为=因素A下的所有水平的样本总均值为=。假设数据总的差异用总离差平方和表示,分解为二个部分,一部分是由于因素A引起的差异——效应平方和;另一部分是由随机误差所引起的差异——误差平方和,记,总离差平方和效应平方和误差平方和4.与的统计特性如果成立,则所有的都服从正态分布,且相互独立,可以证明:(1)(2)~,(3)~,且,因此为的无偏估计.(4)相互独立.5.检验方法如果组间差异比组内差异大的多,即说明因素的各水平间有显著差异,个总体不能认为是同一个正态总体,应认为不成立,此时,比值有偏大的趋势.为此,选用统计量=在为真时,有F=~F对给定的检验水平,查的值,由样本观察值计算,,从而计算出统计量F的观察值.由于不真时,值偏大,导致F值偏大.因此,(1)若F>时,拒绝,表示因素A的各水平下的效应有显著差异;(2)若F<时,则接受,表示因素A的各水平下的效应无显著差异.为表达的方便和直观,将上面的分析过程和结果制成一个表格,称这个表为单因素方差分析表:表7-3单因素方差分析表第四节线性回归分析一般地,当随机变量与普通变量之间有线性关系时,可设,其中为待定系数。设是取自总体的一组样本,而是该样本的观察值,在样本和它的观察值中的是取定的不完全相同的数值,而样本中的在试验前为随机变量,在试验或观测后是具体的数值,一次抽样的结果可以取得对数据,则有,其中相互独立。在线性模型中,由假设知回归分析就是根据样本观察值寻求的估计.对于给定值,取(7-6)作为的估计,方程(7-6)称为关于的线性回归方程或经验公式,其图像称为回归直线,称为回归系数.1.最小二乘估计为寻求的估计值,我们最常用的方法是最小二乘估计。对样本的一组观察值…,对每个,由线性回归方程(7-6)可以确定一回归值,这个回归值与实际观察值之差刻画了与回归直线的偏离度.一个自然的想法就是:对所有,若与的偏离越小,则认为直线与所有试验点拟和得越好.令,上式表示所有观察值与回归直线的偏离平方和,刻划了所有观察值与回归直线的偏离度。所谓最小二乘法就是寻求的估计,使利用微分的方法,求关于的偏导数,并令其为零,得,整理得,称此为正规方程组,解正规方程组得(7-7)其中,,若记,,则(7-8)(7.7)或(7.8)叫做的最小二乘估计.而为关于的一元经验回归方程.如果y是正态变量,也可用极大似然估计法得出相同的结果.2.回归方程的显著性检验前面关于线性回归方程的讨论是在线性假设,下进行的.这个线性回归方程是否有实用价值,还要根据实际观察得到的数据运用假设检验的方法来判断.由线性回归模型,可知,当时,就认为与之间不存在线性回归关系,故需检验如下假设:.为了检验假设,先分析对样本观察值的差异,它可以用总的偏差平方和来度量,记为,由正规方程组,有==.令,,则有.称为回归平方和,它由普通变量的变化引起的,它的大小(在与误差相比下)反映了普遍变量的重要程度;称为剩余平方和,它是由试验误差以及其它未加控制因素引起的,它的大小反映了试验误差及其它因素对试验结果的影响.关于和,有下面的性质:定理7.1在线性模型假设下,当成立时,与相互独立,且对的检验有三种本质相同的检验方法:—检验法;—检验法;相关系数检验法.在介绍这些检验方法之前,先给出,,的计算方法.(1)检验法由定理1,若令则由定理7.1知,为的无偏估计,=且与相互独立.故取检验统计量,由给定的显著性水平,查表得,根据试验数据计算的值,当时,拒绝,这时回归效应显著;当时,接受,此时回归效果不显著.(2)检验法由定理2,当为真时,取统计量:由给定显著性水平,查表得,根据试验数据计算的值,若时,拒绝,表明回归效果显著;若时,接受,此时回归效果不显著.(3)相关系数检验法由第四章知,相关系数的大小可以表示两个随机变量线性关系的密切程度.对于线性回归中的变量与,其样本的相关系数为,它反映了普通变量与随机变量之间的线性相关程度.故取检验统计量对给定的显著性水平,查相关系数表得根据试验数据计算的值,当时,拒绝,表明回归效果显著;当时,接受,表明回归效果不显著.3.预测问题在回归问题中,若回归方程经检验效果显著,这时回归值与实际值就拟合较好,因而可以利用它对因变量的新观察值进行点预测或区间预测.对于给定的,由回归方程可得到回归值称为在的预测值.的测试值与预测值之差称为预测误差.在实际问题中,预测的真正意义就是在一定的显著性水平下,寻找一个正数,使得实际观察值以的概率落入区间内,即,由定理7.1知,,又因与相互独立,且所以,,故对给定的显著性水平,求得,故得的置信度为的预测区间为.易见,的预测区间长度为对给定,越靠近样本均值越小,预测区间长度小,效果越好。当很大,并且较接近时,有,则预4.控制问题控制问题是预测问题的反问题,所考虑的问题是:如果要求将控制在某一定范围内,问应控制在什么范围?这里我们仅对很大的情形给出控制方法,对一般的情形,也可类似地进行讨论。对给出的和置信度,令解得当时,控制范围为当时,控制范围为实际应用中,由(1)式知,要实现控制,必须要求区间的长度大于,否则控制区间不存在.特别,当时,,故(2)近似为三、总结(共10分钟)总结:谈谈本章节你有哪些收获。复习本节课所讲概念。案例选择贴近学生生活(成绩、销量等),有效降低了统计方法的“抽象感”,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论