《独立性检验》_第1页
《独立性检验》_第2页
《独立性检验》_第3页
《独立性检验》_第4页
《独立性检验》_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选课件研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量的之间是否有关系分类变量的之间是否有关系2 2定定量量变变量量回回归归分分析析(画画散散点点图图、相相关关系系数数r r、变变量量 相相关关指指数数R R 、残残差差分分析析)分分类类变变量量独立性检验独立性检验2 2定定

2、量量变变量量回回归归分分析析(画画散散点点图图、相相关关系系数数r r、变变量量 相相关关指指数数R R 、残残差差分分析析)分分类类变变量量独立性检验独立性检验精选课件日常生活中我们关心这样一些问题:日常生活中我们关心这样一些问题:v吸烟与患呼吸道疾病有无关系?吸烟与患呼吸道疾病有无关系?v饮食与心脏病之间有无关系?饮食与心脏病之间有无关系?v性别与喜欢数学课之间有无关系?性别与喜欢数学课之间有无关系?以上问题用什么知识来解决呢?以上问题用什么知识来解决呢?统计学中检验两个变量统计学中检验两个变量是否有关系是否有关系的一的一种统计方法种统计方法独立性检验独立性检验精选课件精选课件学习目标学习

3、目标 1.会列会列22列联表,会画等高条形图列联表,会画等高条形图2.会从会从22列联表,等高条形图中直观列联表,等高条形图中直观的判断出两个分类变量之间是否有关?的判断出两个分类变量之间是否有关?3.了解独立性检验的基本思想和步骤了解独立性检验的基本思想和步骤精选课件 某医疗机构为了了解患呼吸道疾病患呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220220人,不吸烟者295295 人,调查结果是:吸烟的220220 人中3737人患呼吸道疾病呼吸道疾病, 183183人未患呼吸道呼吸道疾病疾病;不吸烟的295295人中2121人患病, 274274人未患病

4、病。 根据这些数据能否断定:患呼吸道疾病呼吸道疾病与吸烟有关?问题问题: :精选课件 吸烟与患呼吸道疾病列联表吸烟与患呼吸道疾病列联表患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515问题问题: :为了调查吸烟是否对呼吸道有影响,某医疗研究所随为了调查吸烟是否对呼吸道有影响,某医疗研究所随机地调查了机地调查了515515人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 7.12%7

5、.12%16.82%16.82%精选课件不患病患病1)通过图形直观判断通过图形直观判断三维柱三维柱状图状图精选课件不患病患病2) 通过图形直观判断通过图形直观判断二维条二维条形图形图精选课件不患病患病3)通过图形直观判断通过图形直观判断患病患病比例比例不患病不患病比例比例精选课件问题1:吸烟与不吸烟,患病的可能性的大小是否有差异? 吸烟者和不吸烟者患呼吸道疾病的可能性存在差吸烟者和不吸烟者患呼吸道疾病的可能性存在差异,吸烟者患呼吸道疾病的可能性大异,吸烟者患呼吸道疾病的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度?初步结论:初步结论:

6、精选课件思考交流:反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。精选课件数据整理;数据整理;(列(列2 2联表)联表)做出相反的假设;(做出相反的假设;(“患病与吸烟没有关系患病与吸烟没有关系”)计算计算 ;查临界值表;查临界值表;下结论。下结论。数据整理;数据整理;(列(列2 2联表)联表)做出相反的假设;(做出相反的假设;(“患病与吸烟没有关系患病与吸烟没有关系”)计算计算 ;查临界值表;查临界值表;下结论。下结论。)()()()(22dbcadcbabcadn)(为样本

7、量dcban22精选课件 吸烟与患呼吸道疾病关系列联表吸烟与患呼吸道疾病关系列联表患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d1、列、列2 2联表联表精选课件H H0 0: 吸烟吸烟 和和患呼吸道疾病患呼吸道疾病没有关系没有关系 通过数据和图表分析,得到结论是:通过数据和图表分析,得到结论是: 吸烟与患呼吸道病有关吸烟与患呼吸道病有关结论的可靠结论的可靠程度如何?程度如何? 2、做出相反的假设、做出相反的假设精选课件3、计算、计算2吸烟的人中患病的比例:吸烟的人中患病的比例:baa不

8、吸烟的人中患病的比例:不吸烟的人中患病的比例:dcc 吸烟与患呼吸道疾病关系列联表吸烟与患呼吸道疾病关系列联表患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d精选课件a ac c, ,a a+ +b bc c+ +d d a a c c+ +d d c c a a+ +b b , ,若若H H0 0成立成立0bcad吸道疾病关系越弱;越小,说明吸烟与患呼|bcad 吸道疾病关系越强;越大,说明吸烟与患呼|bcad 精选课件作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量

9、两个变量有关系有关系”的标准的标准 。dcban其中dbcadcbabcadn22统计学家为了消除样本量对上式的影响,引入统计学家为了消除样本量对上式的影响,引入了了卡方统计量卡方统计量2精选课件通过公式计算通过公式计算8634.1129522045758183212743751522 吸烟与患呼吸道疾病列联表吸烟与患呼吸道疾病列联表患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515dcban其中dbcadcbabcadn22精选课件4、查表、查表1)1)如果如果P(P( 10.828)= 0

10、.00110.828)= 0.001表示有表示有99.9%99.9%的把握认为的把握认为”X X与与Y Y”有关有关系系; ;2)2)如果如果P( 7.879)= 0.005P( 7.879)= 0.005表示有表示有99.5%99.5%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;3)3)如果如果P( 6.635)= 0.01P( 6.635)= 0.01表示有表示有99%99%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;4)4)如果如果P( 5.024)= 0.025P( 5.024)= 0.025表示有表示有97.5%97.5%的把握认为的把握认为”X X与与Y

11、 Y”有关系有关系; ;5)5)如果如果P( 3.841)= 0.05P( 3.841)= 0.05表示有表示有95%95%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;6)6)如果如果P( 2.706)= 0.10P( 2.706)= 0.10表示有表示有90%90%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;7)7)如果如果P( P( 2.706),2.706),就认为没有充分的证据显示就认为没有充分的证据显示”X X与与Y Y”有关系有关系; ;2222222精选课件已知在已知在 成立的情况下,成立的情况下,0H故有故有99.9%99.9%的把握认为的把握认为H

12、 H0 0不成立,即有不成立,即有99.9%99.9%的把握认为的把握认为“患呼吸道疾病与吸烟有关系患呼吸道疾病与吸烟有关系”。以下001.0)8634.11(2P5、下结论、下结论精选课件网络链接网络链接检验结果检验结果精选课件 DNADNA是从几滴血是从几滴血, ,腮细胞或培养的组织纤内提取而腮细胞或培养的组织纤内提取而来来. .用畴素将用畴素将DNADNA样本切成小段样本切成小段, ,放进喱胶内放进喱胶内, ,用电泳槽推动用电泳槽推动DNADNA小块使之分离小块使之分离-最细的在最远最细的在最远, ,最大的最近最大的最近. . 之後之後, , 分分离开的基因放在尼龙薄膜上离开的基因放在尼

13、龙薄膜上, ,使用特别的使用特别的DNADNA探针去寻找基探针去寻找基因因, , 相同的基因会凝聚于一相同的基因会凝聚于一, ,然後然後, ,利用特别的染料利用特别的染料, ,在在X X光光的环境下的环境下, ,便显示由便显示由DNADNA探针凝聚于一的黑色条码探针凝聚于一的黑色条码. .小孩这小孩这种肉眼可见的条码很特别种肉眼可见的条码很特别 -一半与母亲的吻合一半与母亲的吻合, ,一半与一半与父亲的吻合父亲的吻合. .这过程重覆几次这过程重覆几次, ,每一种探针用于寻找每一种探针用于寻找DNADNA的的不同部位并影成独特的条码不同部位并影成独特的条码, ,用几组不同的探针用几组不同的探针,

14、 ,可得到超可得到超过过99,9%99,9%的父系或然率或分辨率的父系或然率或分辨率. . DNA亲子鉴定的原理和程序亲子鉴定的原理和程序精选课件DNA亲子鉴定的结果亲子鉴定的结果 孩子会有一条纹与亲生母亲相同而另一条码与孩子会有一条纹与亲生母亲相同而另一条码与待证实父亲待证实父亲1号号(AF1)相同相同,此人是生父此人是生父; 被排除的男子被排除的男子(AF2),则与小孩并无相同的条码则与小孩并无相同的条码. 肯定父系关系肯定父系关系 = 99.99%或更大的生父或然率或更大的生父或然率 (法律上证明是生父法律上证明是生父) 否定父系关系否定父系关系 = 0% 生父或然率生父或然率(100%

15、排除为生父排除为生父)精选课件例例1.1.在在500500人身上试验某种血清预防感冒作用,把他们人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外一年中的感冒记录与另外500500名未用血清的人的感冒记名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?感冒的作用?未感冒未感冒感冒感冒合计合计使用血清使用血清258242500未使用血清未使用血清216284500合计合计4745261000解:设解:设H0:感冒与是否使用该血清没有关系。:感冒与是否使用该血清没有关系。075.750050052647421

16、6242284258100022 因当因当H0成立时,成立时,26.635的概率约为的概率约为0.01,故有,故有99%的把握认的把握认为该血清能起到预防感冒的作用。为该血清能起到预防感冒的作用。P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828精选课件P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706

17、3.841 5.024 6.635 7.879 10.828有效有效无效无效合计合计口服口服585840409898注射注射646431319595合计合计1221227171193193解:设解:设H0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。3896.19598711224064315819322 因当因当H0成立时,成立时,21.3896的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。,即不能作出药的效果与给药方式有关的结论。2.072例例2 2:为研究不同的给药方式(口服与注射)和药的效:为研究不同的给药方式(口

18、服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的调查的结果列在表中,根据所选择的193193个病人的数个病人的数据,能否作出药的效果和给药方式有关的结论?据,能否作出药的效果和给药方式有关的结论?精选课件P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例例3:气管炎是一种常见的呼吸道疾病,医药研究人:气管炎是一种常见的呼

19、吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?所得数据如表所示,问:它们的疗效有无差异?有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:设解:设H0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。098.11100245702759161918434522 因当因当H0成立时,成立时,210.828的概率为的概率为0.001,故有,故有99.9%的把握认的把握认为,两种药物的疗效有差异。为,两种药物的疗效有差

20、异。精选课件22精选课件 由于抽样的随机性,由样本得到的推断由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用有可能正确,也有可能错误。利用 进进行独立性检验,可以对推断的正确性的概行独立性检验,可以对推断的正确性的概率作出估计,样本量率作出估计,样本量n n越大,估计越准确。越大,估计越准确。2精选课件例例1:随着:随着新还珠格格新还珠格格的热播,又掀起了一的热播,又掀起了一场场“还珠热还珠热”。为了了解喜爱看。为了了解喜爱看新还珠格格新还珠格格是是否与性别有关,小欣随机抽查了否与性别有关,小欣随机抽查了140名男性和名男性和160名女性,调查发现,男性和女性中分别有名女性,调

21、查发现,男性和女性中分别有80人和人和120人喜爱看,其余人不喜爱看。人喜爱看,其余人不喜爱看。(2)利用图形判断性别与是否喜爱看)利用图形判断性别与是否喜爱看新新 还珠格格还珠格格有关?有关?(1)根据以上数据建立一个)根据以上数据建立一个22的列联表;的列联表;精选课件 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例3.性别与喜欢数学课

22、 由表中数据计算K2的观测值k 4.513。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?2(3.841)0.05,P K而我们所得到的K2的观测值k 4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。精选课件例例1.在某医院在某医院,因为患心脏病而住院的因为患心脏病而住院的665名男性病人名男性病人中中,有有214人秃顶人秃顶;而另外而另外772名不是因为患心脏病而住名不是因为患心脏病而住院的男性病人中有院的男性病人中有175秃顶秃顶.分别利用图形和独立性检分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系验方法判断秃顶与患心脏病是否有关系?你所得的结论你所得的结论在什么范围内有效在什么范围内有效?秃顶与患心脏病列联表秃顶与患心脏病列联表患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437精选课件有有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”221437 (214 597 175 451)16.3736.635389 1048 665 772精选课件例例2. 为考察高中生的性别与是否喜欢数学课程之间的关为考察高中生的性别与是否喜欢数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论