独立性检验的基本思想及其初步应用1_第1页
独立性检验的基本思想及其初步应用1_第2页
独立性检验的基本思想及其初步应用1_第3页
独立性检验的基本思想及其初步应用1_第4页
独立性检验的基本思想及其初步应用1_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 某医疗机构为了了解患肺癌患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了99659965个成年人,其中吸烟者21482148人,不吸烟者78177817 人,调查结果是:吸烟的21482148 人中4949人患肺癌肺癌, 20992099人不患肺癌肺癌;不吸烟的78177817人中4242人患肺癌肺癌, 77757775人不患肺癌肺癌。 根据这些数据能否断定:患肺癌肺癌与吸烟有关? 吸烟与肺癌列联表吸烟与肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659

2、965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 0.54%0.54%2.28%2.28%1)通过图形直观判断通过图形直观判断三维柱三维柱状图状图2) 通过图形直观判断通过图形直观判断二维条二维条形图形图3)通过图形直观判断通过图形直观判断患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例问题1:判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是否有

3、差异?说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度? 独立性检验H H0 0: 吸烟吸烟和和患肺癌患肺癌之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何? 吸烟与肺癌列联表吸烟与肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计

4、a+ca+cb+db+da+b+c+da+b+c+dacac,a+bc+da+bc+d a c+d c a+b , a c+d c a+b ,adbc吸烟的人中患肺癌的比例:吸烟的人中患肺癌的比例:baa不吸烟的人中患肺癌的比例:不吸烟的人中患肺癌的比例:dcc若若H H0 0成立成立 独立性检验0.adbcad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越大,说明吸烟与患肺癌之间的关系越强ad-bc 越大,说明吸烟与患肺癌之间的关系越强引入一个随机变量:引入一个随机变量:卡方统计量卡方统计量作为检验在多大程度上可以认为作为检验在

5、多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准 。dcban其中dbcadcbabcadn22 独立性检验通过公式计算通过公式计算 吸烟与肺癌列联表吸烟与肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965632.5691987421487817209942497775996522 独立性检验已知在已知在 成立的情况下,成立的情况下,0H故有故有99.9%99.9%的把握认为的把握认为H H0 0不成立,即有不成立,即有99.9%99.9

6、%的把握认为的把握认为“患肺癌与吸烟有关系患肺癌与吸烟有关系”。即在即在 成立的情况下,成立的情况下, 大于大于10.82810.828概率非常概率非常小,近似为小,近似为0.0010.0010H2现在的现在的 =56.632=56.632的观测值远大于的观测值远大于10.82810.828,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0010.001。2001.0)828.10(2P1)1)如果如果P(P(m10.828)= 0.00110.828)= 0.001表示有表示有99.9%99.9%的把握认为的把握认为”X X与与Y”Y”有关有关系系; ;2)2)如果如果P(m7

7、.879)= 0.005P(m7.879)= 0.005表示有表示有99.5%99.5%的把握认为的把握认为”X X与与Y”Y”有关系有关系; ;3)3)如果如果P(m6.635)= 0.01P(m6.635)= 0.01表示有表示有99%99%的把握认为的把握认为”X X与与Y”Y”有关系有关系; ;4)4)如果如果P(m5.024)= 0.025P(m5.024)= 0.025表示有表示有97.5%97.5%的把握认为的把握认为”X X与与Y”Y”有关系有关系; ;5)5)如果如果P(m3.841)= 0.05P(m3.841)= 0.05表示有表示有95%95%的把握认为的把握认为”X

8、X与与Y”Y”有关系有关系; ;6)6)如果如果P(m2.706)= 0.10P(m2.706)= 0.10表示有表示有90%90%的把握认为的把握认为”X X与与Y”Y”有关系有关系; ;7)7)如果如果P(mP(m2.706),2.706),就认为没有充分的证据显示就认为没有充分的证据显示”X X与与Y”Y”有关系有关系; ;y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d22列联表适用观测数据适用观测数据a a、b b、c c、d d不小于不小于5 5dbcadcbabca

9、dn22)(2mP一般地,对于两个研究对象一般地,对于两个研究对象和和,有两类有两类取值,即类取值,即类A A和和B B(如吸烟与不吸烟);(如吸烟与不吸烟);也有两类也有两类取值,即类取值,即类1 1和和2 2(如患病与不患病)。于是得到(如患病与不患病)。于是得到下列联表所示的抽样数据:下列联表所示的抽样数据:类类1 1类类2 2总计总计类类A Aa ab ba+ba+b类类B Bc cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d用用 统计量研究这类问题的方法称为统计量研究这类问题的方法称为独立性检验独立性检验。2要推断要推断“和和有关系有关系”,可按下面

10、的步骤进行:,可按下面的步骤进行:(1 1)提出假设)提出假设H H0 0 :和和没有关系;没有关系;(3 3)查对临界值,作出判断。)查对临界值,作出判断。(2 2)根据)根据2 2 2 2列表与公式计算列表与公式计算 的值;的值;2 由于抽样的随机性,由样本得到的推断由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用有可能正确,也有可能错误。利用 进进行独立性检验,可以对推断的正确性的概行独立性检验,可以对推断的正确性的概率作出估计,样本量率作出估计,样本量n n越大,估计越准确。越大,估计越准确。2反证法原理与假设检验原理反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。例例1.1.在在500500人身上试验某种血清预防感冒作人身上试验某种血清预防感冒作用,把

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论