第三章-统计案例学案(学生版).doc_第1页
第三章-统计案例学案(学生版).doc_第2页
第三章-统计案例学案(学生版).doc_第3页
第三章-统计案例学案(学生版).doc_第4页
第三章-统计案例学案(学生版).doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选修2-1 第一章 统计案例学案(学生版)1.1 回归分析的基本思想及其初步应用(1) 学习目标:(1)通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.(2)了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法:相关指数和残差分析.(3)了解评价回归效果的两个统计量:总偏差平方和、残差平方和.学习重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法:相关指数和残差分析.学习难点:解释随机误差和残差的含义.学习过程:一、课前准备(一)、复习必修3的“变量间的相关关系”内容,注意以下内容:1相关关系:自变量取值一定时,因变量的取值带有一定 的两个变量之间的关系叫做相关关系;2函数关系中两个变量的关系是 ,相关关系中的两个变量的关系是 .3两个变量的线性相关:(1)散点图:将样本中个数据点描在坐标系中得到的图形.(2)正相关与负相关:正相关:散点图中的点散布在从 到 的区域;负相关:散点图中的点散布在从 到 的区域.4. 回归直线的方程:(1)如果散点图中的分布从整体上看大致在 附近,就称这两个变量之间具有 关系,这条直线叫做回归直线.(2)回归方程: 对应的方程叫做回归直线的方程.(3)回归方程的推导过程:假设已经得到两个具有线性相关关系的变量的一组数据 , , , .设所求回归方程为 ,其中、是待定参数.由最小二乘法得 ,.其中回归方程的 ,是 . (二)研究相关关系和回归分析的意义:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.二、新课导学:1.几个需要了解的概念: (1)总偏差平方和、残差平方和、回归平方和:总偏差平方和:所有单个样本值与样本均值差的平方和,即;残差平方和:回归值与样本值差的平方和,即;回归平方和:相应回归值与样本均值差的平方和,即.(2)要注意的问题:注意、的区别;预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即;当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2. 典型例题: 【例1】 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 【解析】求回归方程并预报体重: 提问:身高为172cm的女大学生的体重一定是60.316kg吗?答: 解释线性回归模型与一次函数的不同.答: 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式. 【例2 】关于与有如下数据:245683040605070为了对、两个变量进行统计分析,现有以下两种线性模型:,试比较哪一个模型拟合的效果更好.【分析】既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.【解析】三、总结提升:(1)求线性回归方程的步骤、线性回归模型与一次函数的不同.(2)分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.四、反馈练习1. 在画两个变量的散点图时,下面哪个叙述是正确的 ( )A预报变量在轴上,解释变量在轴上 B解释变量在轴上,预报变量在轴上C可选择两个变量中任一个变量在轴上 D可选择两个变量中任一个变量在轴上2. 一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为用这个模型预测这个孩子10岁时的身高,则正确的叙述是 ( ) A.身高一定是145.83cm B.身高在145.83cm以上C.身高在145.83cm以下 D.身高在145.83cm左右3. 两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是 ( )A.模型1的相关指数为0.98 B.模型2的相关指数为0.80 C.模型3的相关指数为0.50 D.模型4的相关指数为0.254. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数5.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是 ( ) A.生产率为1000元时,工资为50元 B.生产率提高1000元时,工资提高150元C.生产率提高1000元时,工资提高90元 D.生产率为1000元时,工资为90元6假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2238556570若由资料可知对呈线性相关关系.试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?【解析】五、学后反思:1.1回归分析的基本思想及其初步应用(2) 学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.学习重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.学习难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1. 给出问题:一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.温度21232527293235产卵数个711212466115325【解析】根据收集的数据,作出散点图:2. 讨论:观察上面的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、新课导学:1. 探究非线性回归方程的确定:方法一: 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=的周围(其中是待定的参数),故可用指数函数模型来拟合这两个变量. 在上式两边取对数,得,再令,则,而与间的关系如下:212325272932351.9462.3983.0453.1784.1904.7455.784观察与的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合. 利用计算器算得,与间的线性回归方程为,因此红铃虫的产卵数对温度的非线性回归方程为. 利用回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.方法二:上面我们选择用指数函数模型来拟合红铃虫的产卵数和温度间的关系,还可用其它函数模型来拟合吗?用二次函数模型来拟合上述两个变量间的关系吗(令,则,此时与间的关系如下:44152962572984110241225711212466115325观察与的散点图,可以发现样本点并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线来拟合与之间的关系. )2.上例中的残差分析:计算两种模型下的残差212325272932357112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968三、总结提升一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果. 残差平方和越小的模型,拟合的效果越好.也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合. 事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.四、反馈练习:1. 炼钢时钢水的含碳量与冶炼时间有 ( )A.确定性关系 B.相关关系 C.函数关系 D.无任何关系2.下列说法正确的有 ( ) 回归方程适用于一切样本和总体; 回归方程一般都有适用范围;样本取值的范围会影响回归方程的适用范围;回归方程得到的预报值是预报变量的精确值.A. B. C. D. 3.下列结论正确的是 ( ) 函数关系是一种确定性关系; 相关关系是一种非确定性关系 回归分析是对具有函数关系的两个变量进行统计分析的一种方法 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。A. B. C. D. 4设有一个回归方程为y=2-2.5x,则变量x增加一个单位时( )A.y平均增加2.5个单位 B.y平均增加2个单位C.y平均减少2.5个单位 D.y平均减少2个单位5.已知回归直线的斜率的估计值是,样本点的中心为,则回归直线的是( ) A. B. C. D.6. 已知x与y之间的一组数据:01231357则y与x的线性回归方程为必过( )A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点五、学后反思: 1.2独立性检验的基本思想及其初步应用 学习目标:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表展示,让学生亲身体验独立性检验的实施步骤与必要性.学习重点:理解独立性检验的基本思想及实施步骤.学习难点:了解独立性检验的基本思想、了解随机变量的含义.学习过程:一、课前准备:某医疗机构为了解吸烟与患肺癌是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人. 调查结果是:吸烟的220人中有37人患肺癌,183人未患肺癌;不吸烟的295人中有21人患肺癌,274人未患肺癌.问题1:吸烟与不吸烟,患肺癌的可能性的大小是否有差异?为了研究这个问题,我们将上述数据用下表表示:患肺癌未患肺癌合 计吸 烟37183220不吸烟21274295合计58457515问题2:差异大到什么程度才能作出“吸烟与患肺癌有关”的判断?问题3:能否用数量刻画出“有关”的程度?二、新课导学:(一)独立性检验:1独立性检验的含义:用统计量研究吸烟与患肺癌是否有关、用药效果与用药方式是否有关、性别与数学成绩是否有关等这类问题的方法称为独立性检验.2. 卡方统计量合 计合计卡方统计量: 其中为样本量.如果两个变量与无关系,则的值应该很小.3. 用独立性检验来考察“与是否有关系”的步骤:(1)提出假设:与没有关系;(2)根据22列联表与公式计算的值;(3)查对临界值表作出判断.4. 临界值表: P()0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.845.0246.6357.87910.83例如:(1),则有 _ 的把握认为“与”有关系;(2),则有 _ 的把握认为“与”有关系;(3),则有 _ 的把握认为“与”有关系;(4),则认为没有充分的证据显示“与”有关系,但也不能作出结论“成立”,即不能认为“与”没有关系.(二)典型例题主食蔬菜主食肉类合计六十岁以下213354六十岁以下432770合计6460124【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主(1)根据以上数据建立一个22的列联表;(2)判断人的饮食习惯是否与年龄有关【解析】动动手:在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人请你根据所给数据判断是否在恶劣气候飞行中,男人比女人更容易晕机【解析】三、总结提升:独立性检验的方法、原理、步骤四、反馈练习:1.独立性检验中的统计假设就是假设相关事件A、B ( )A.互斥 B.不互斥 C.相互独立 D.不独立2.下列说法中正确的是 ( )独立性检验的基本思想是带有概率性质的反证法;独立性检验就是选取一个假设条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝的推断;独立性检验一定能给出明确的结论. A. B. C. D.3.给出假设,下列结论中不能对成立与否作出明确判断的是 ( )A.=2.535 B.=7.723 C.=10.321 D.=20.125认为作业量大认为作业量不大总数男生18927女生81523总数2624504.某班主任对全班50名学生进行了作业量的调查,数据如下表:则学生的性别与作业量的大小有关系的把握大约为( )A.99% B.95% C.)90% D.无充分根据5.考察棉花种子经过处理跟生病之间的关系得到如下表数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据,则 ( )A.种子经过处理跟是否生病有关 B.种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病 D.以上都是错误的6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,因为,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_ .7.在性别与吃零食这两个分类变量的计算中,下列说法正确的是 .若的观测值为=6.635,我们有99的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;从独立性检验可知有99的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99;若从统计量中求出有99的把握认为吃零食与性别有关系,是指有1的可能性使得出的判断出现错误.8.下列关于的说法中,正确的是 .在任何相互独立问题中都可以用于检验是否相关;越大,两个事件的相关性越大;是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题9 .在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动(1)根据以上数据建立一个22的列联表;(2)判断性别与休闲方式是否有关系【解析】五、学后反思 统计案例习题课学习目标:1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用; 2. 通过练习和样本数据的列联表展示,让学生进一步体验独立性检验的实施步骤与必要性.学习重点:解决线性回归问题的方法与步骤;理解独立性检验的基本思想及实施步骤.学习难点:解决线性回归问题的方法与步骤;了解独立性检验的基本思想、了解随机变量的含义.教学过程:一、课前准备:阅读教材第一章的内容,并做如下练习:1.长方形的面积一定时,长和宽具有 ( )A.不确定性关系 B.相关关系 C.函数关系 D.无任何关系2. 三点、的线性回归方程是 ( )A. B. C. D.3. 在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( )A. 若统计量,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误D. 以上说法均错误4. 若由一个列联表中的数据计算得,那么有 的把握认为两个变量有关系.二、典型例题:【例1】一个车间为了规定工时定额,须要确定加工零件所花费的时间,为此进行了10次实验,测得的数据如下:零件个数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)(2)并据此估计加工200个零件所用的时间为多少? 【解析】(1),. 设所求的回归直线方程为,同时,利用上表可得,.即所求的回归直线方程为.(2)当时,的估计值.故加工200个零件时所用的工时约为189个. 【例2】为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程合计男3785122女35143178合计72228300 问在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么? 【解析】提出假设:性别与是否喜欢数学课程之间没有关系 根据列联表中的数据,可以求得, 因为当成立时,的概率约为0.05,所以有95%的把握认为:性别与是否喜欢数学课程之间有关系.【例3】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.【解析】提出假设: :两种手术对病人又发作心脏病的影响没有差别. 根据列联表中的数据,可以求得 . 当成立时,而的概率为0.85. 所以,不能否定假设,也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.三、总结提升1. 掌握建立回归模型的步骤: (1)确定研究对象,明确解释变量和预报变量; (2)画出散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型; (4)按一定规则(如最小二乘法)估计回归方程中的参数; (5)得出结果后残差图是否有异常,入欧存在异常,则检查数据是否有误,或模型是否合适等.2用独立性检验来考察“与是否有关系”的步骤:(1)提出假设:与没有关系;(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论