人教B版高中数学选修(2-3)-3.1《独立性检验》参考课件1_第1页
人教B版高中数学选修(2-3)-3.1《独立性检验》参考课件1_第2页
人教B版高中数学选修(2-3)-3.1《独立性检验》参考课件1_第3页
人教B版高中数学选修(2-3)-3.1《独立性检验》参考课件1_第4页
人教B版高中数学选修(2-3)-3.1《独立性检验》参考课件1_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3. 1 独立性检验独立性检验 问题问题: 数学家庞加莱每天都从一家面包店数学家庞加莱每天都从一家面包店买一块买一块1000g 的面包,并记录下买回的面的面包,并记录下买回的面包的实际质量。一年后,这位数学家发包的实际质量。一年后,这位数学家发现,所记录数据的均值为现,所记录数据的均值为950g。于是庞。于是庞加莱推断这家面包店的面包分量不足。加莱推断这家面包店的面包分量不足。假设假设“面包份量足面包份量足”,则一年购买面包的质量数据,则一年购买面包的质量数据的平均值应该不少于的平均值应该不少于1000g ;“这个平均值不大于这个平均值不大于950g”是一个与假设是一个与假设“面包份面包份量足

2、量足”矛盾的小概率事件;矛盾的小概率事件;这个小概率事件的发生使庞加莱得出推断结果这个小概率事件的发生使庞加莱得出推断结果。一一: :假设检验假设检验问题的原理问题的原理 假设检验问题由两个互斥的假设构成,其假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用中一个叫做原假设,用H0表示;另一个叫做备表示;另一个叫做备择假设,用择假设,用H1表示。表示。例如,在前面的例子中,例如,在前面的例子中, 原假设原假设为:为: H0:面包份量足,:面包份量足,备择假设备择假设为:为: H1:面包份量不足。:面包份量不足。这个假设检验问题可以表达为:这个假设检验问题可以表达为: H0:面包:面包份份

3、量足量足 H1:面包:面包份份量不足量不足二二: :求解假设检验问题求解假设检验问题考虑假设检验问题:考虑假设检验问题: H0:面包分量足:面包分量足 H1:面包分量不足:面包分量不足1. 在在H0成立的条件下,构造与成立的条件下,构造与H0矛盾的小概矛盾的小概率事件;率事件;2. 如果样本使得这个小概率事件发生,就能如果样本使得这个小概率事件发生,就能以一定把握断言以一定把握断言H1成立;否则,断言没有成立;否则,断言没有发现样本数据与发现样本数据与H0相矛盾的证据。相矛盾的证据。求解思路分析:求解思路分析:本节研究的是两个分类变量的独立性检验问题。2 2定量变量回归分析(画散点图、相关系数

4、r、定量变量回归分析(画散点图、相关系数r、变量 相关指数R 、残差分析)变量 相关指数R 、残差分析)分类变量分类变量研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量之间是否有关系分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。性别是否对于喜

5、欢数学课程有影响?等等。例例1某医疗机构为了了解患慢性支气管某医疗机构为了了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查,炎与吸烟是否有关,进行了一次抽样调查,共调查了共调查了339名名50岁以上的人,其中吸烟岁以上的人,其中吸烟者者205人人,不吸烟者,不吸烟者134人人调查结果是:调查结果是:吸烟的吸烟的205人中有人中有43人人患呼吸道疾病(简患呼吸道疾病(简称患病),称患病),162人未患呼吸道疾病(简称人未患呼吸道疾病(简称未患病);不吸烟的未患病);不吸烟的134人中有人中有13人人患病,患病,121人未患病问题:根据这些数据能否人未患病问题:根据这些数据能否断定断定“患慢性

6、支气管炎与吸烟有关患慢性支气管炎与吸烟有关”?(1)为了研究这个问题,将上述数据用)为了研究这个问题,将上述数据用下表来表示:下表来表示: 患病患病未患病未患病合计合计吸烟吸烟43162205不吸烟不吸烟13121134合计合计56283339(2)估计吸烟者与不吸烟者患病的可能性)估计吸烟者与不吸烟者患病的可能性差异:差异:在吸烟的人中,有在吸烟的人中,有 的人患病,的人患病, 4320.1%205在不吸烟的人中,有在不吸烟的人中,有 的人患病的人患病 139.7%134问题:由上述结论能否得出患病与吸烟有问题:由上述结论能否得出患病与吸烟有关?把握有多大?关?把握有多大? (1)假设)假设

7、:患病与吸烟:患病与吸烟没有关系没有关系若将表中若将表中“观测值观测值”用字母表示,则得下用字母表示,则得下列列22列联表:列联表:患病(患病(B)未患病( )合计合计吸烟吸烟An11n12n1+不吸烟不吸烟n21n22n2+合计合计n+1n+2nAB 即即n11(n21+n22)n21(n11+n12)n11n22n21n120,因此,因此,|n11n22n21n12|越小,患越小,患病与吸烟之间的关系越弱,否则,关系越病与吸烟之间的关系越弱,否则,关系越强强近似的判断方法:近似的判断方法: 设设n=n11+n21+n12+n22,如果,如果H0成立,则在成立,则在吸烟的人中患病的比例与不吸

8、烟的人中患吸烟的人中患病的比例与不吸烟的人中患病的比例病的比例应差不多应差不多,由此可得,由此可得,112111122122nnnnnn 上面的话的意思是指事件上面的话的意思是指事件A与与B独立,独立,这时应该有这时应该有P(AB)=P(A)P(B)成立,成立, 我们用我们用H0表示上式,即表示上式,即H0:P(AB)=P(A) P(B). 并称之为统计假设,当并称之为统计假设,当H0成立时,成立时,下面的三个式子也成立:下面的三个式子也成立:()( ) ( )P ABP A P B()( ) ( )P ABP A P B()( ) ( )P ABP A P B根据概率的统计定义,上面提到的众

9、多事根据概率的统计定义,上面提到的众多事件的概率都可以用件的概率都可以用相应的频率相应的频率来来估计估计。 例如例如 P(AB)的估计为的估计为11nnP(A)的估计为的估计为 ,P(B)的估计为的估计为 ,1nn1nn于是于是 与与 应该很接近,应该很接近,。或者说或者说11nn11nnnn21111() ,nnnnnn21212() ,nnnnnn22121()nnnnnn22222()nnnnnn应该比较小应该比较小 .从而从而 2111111()nnnnnnnnnn2121212()nnnnnnnnnn2212121()nnnnnnnnnn2222222()nnnnnnnnnn也应该比

10、较小。也应该比较小。 (2)卡方统计量:)卡方统计量: 为了消除样本对上式的影响,通常用卡方为了消除样本对上式的影响,通常用卡方统计量(统计量(2 )来进行估)来进行估计计2() 观测值预期值预期值卡方卡方2统计量公式:统计量公式: 21122122121212n n nn nn nn n用它的大小可以决定用它的大小可以决定是否拒绝是否拒绝原来的统计原来的统计假设假设H0,如果算出的,如果算出的2值较大,就拒绝值较大,就拒绝H0,也就是,也就是拒绝拒绝“事件事件A与事件与事件B无关无关”,从而就认为它们是从而就认为它们是有关有关的了的了 (3)两个临界值:)两个临界值:3.841与与6.635

11、. 经过对经过对2统计量分布的研究,已经得到了统计量分布的研究,已经得到了两个临界值:两个临界值:3.841与与6.635。 当根据具体的数据算出的当根据具体的数据算出的23.841时,有时,有95%的把握说事件的把握说事件A与事件与事件B有关;有关; 当当26.635时,有时,有99%的把握说事件的把握说事件A与事与事件件B有关;有关;当当26.635,所以我们有,所以我们有99%的把握的把握说:说:50岁以上的人患慢性支气管炎与吸烟岁以上的人患慢性支气管炎与吸烟有关。有关。类类1类类2合计合计类类An11n12n1+类类B n21n22n2+合计合计n+1n+2n独立性检验的一般步骤:独立

12、性检验的一般步骤: 一般地,对于两个研究对象一般地,对于两个研究对象和和,有有两类取值:类两类取值:类A和类和类B(如吸烟与不吸烟),(如吸烟与不吸烟),也有两类取值:类也有两类取值:类1和类和类2(如患呼吸道(如患呼吸道疾病与不患呼吸道疾病),得到如下表所疾病与不患呼吸道疾病),得到如下表所示:示:推断推断“和和有关系有关系”的的步骤步骤为:为:第一步,提出假设第一步,提出假设H0:两个分类变量:两个分类变量和和没有关系;没有关系;第二步,根据第二步,根据22列联表和公式计算列联表和公式计算2统统计量;计量;第三步,比对两个临界值,作出判断第三步,比对两个临界值,作出判断例例2: 对对196

13、个接受心脏搭桥手术的病人和个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行个接受血管清障手术的病人进行3年跟年跟踪研究,调查他们是否又发作过心脏病,踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:调查结果如下表所示:又发作过心脏又发作过心脏病病未发作过心未发作过心脏病脏病合计合计心脏搭桥手术心脏搭桥手术39157196血管清障手术血管清障手术29167196合计合计68324392 试根据上述数据比较两种手术对病人又发试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。作心脏病的影响有没有差别。解:这是一个解:这是一个22列联表的独立性检验问列联表的独立性检验问题

14、,由公式题,由公式 22392(39 16729 157)1.78068 324 196 196因为因为1.7806.635,所以有,所以有99%的把握说:的把握说:员工员工“工作积极工作积极”与与“积极支持企业改革积极支持企业改革”是有关的。可以认为企业的全体员工对待是有关的。可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的。企业改革的态度与其工作积极性是有关的。 例例4在一次恶劣气候的飞行航程中调查在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,男女乘客在机上晕机的情况如下表所示,根据此资料你是否认为在恶劣气候飞行中根据此资料你是否认为在恶劣气候飞行中男性比女性更任意晕机?男性比女性更任意晕机?晕机晕机不晕机不晕机合计合计男性男性243155女性女性82634合计合计325789解:这是一个解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论