12独立性检验的基本思想及其初步应用_第1页
12独立性检验的基本思想及其初步应用_第2页
12独立性检验的基本思想及其初步应用_第3页
12独立性检验的基本思想及其初步应用_第4页
12独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩11页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、独立性检验的基本思想及其初步应用 自学导引1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的 ,称为列联表不同类别频数表22列联表一般地,假设两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd2独立性检验abcd 具体步骤根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界.然后查表确定 .利用公式计算随机变量K2的 .如果 ,就推断“X与Y有关系”,这种推断 不超过,否则就认为在犯错误的概率不超过的

2、前提下不能推断“X与Y有关系”,或者在样本数据中 支持结论“X与Y有关系”临界值k0观测值kkk0犯错误的概率没有发现足够证据3.独立性检验临界值表P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是 在吸烟者中

3、患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28%通过等高图直观判断两个分类变量是否相关:患肺癌比例不患肺癌比例 独立性检验 H0: 吸烟和患肺癌之间没有关系 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d列联表 独立性检验为了是不同的样本容量的数据有统一标准引入一个随机变量若H0成立,则K应该很小 独立性检验 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965通过公式计算 独立性检验已知在 成立的情况下,即在 成立的情况下,K2 大于6.635概率非常小,近似为0.01现在的K2=56.632的观测值远大于6.635分类变量之间关系条形图柱形图列联表独立性检验背景分析例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效?例2.为考察高中生性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程 总计 男 37 85 122 女 35 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论