版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独立性检验(1)问题情境情境:某医疗机构为了解呼吸道疾病与吸烟是否有关,进
行了一次抽样调查,共调查了515个成年人,其中
吸烟者220人,不吸烟者295人,调查结果是:吸烟220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病),不吸烟的295人中,有21人患病,274人未患病。●根据这些数据能否断定:患呼吸道疾病与吸烟有
关?数学探究患病未患病合计吸
烟37183220不吸烟21274295合
计58457515问题1:根据这些数据能否断定:患呼吸道疾病与吸烟有关?为了研究这个问题,我们将上述数据用下表表示。数学建构1、分类变量的定义变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(其“值”非数量,如性别变量)。2、列联表(1)定义:(2)2×2列联表列联表是一个描述两个分类变量分布的频数表。一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)如下:y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d数学探究问题2:上述结论给我们的印象是患病与吸烟有关,事实果
真如此吗?究竟能有多大的把握认为“患病与吸烟
有关”呢?若将事件“某成年人吸烟”记为A,事件“某成年人患病”记为B,则事件“某成年人不吸烟”记为,事件“某成年人不患病”记为,这样,回答“患病与吸烟是否有关?”其实就是需要回答“事件A与事件B是否独立?”为了回答这个问题,我们先做出判断“患病与吸烟没有关系”,即提出如下假设H0:患病与吸烟没有关系。由两个事件相互独立的充要条件,又可将上述假设记为H0:P(AB)=P(A)P(B)数学探究问题2:上述结论给我们的印象是患病与吸烟有关,事实果
真如此吗?究竟能有多大的把握认为“患病与吸烟
有关”呢?H0:P(AB)=P(A)P(B)这里的P(A),P(B)和P(AB)的值都不知道,我们可以用频率来代替概率,估计出P(A),P(B)和P(AB)的值。为了便于研究一般情况,我们将原表中的数据用字母代替,得到字母表示的2×2列联表,患病未患病合计吸烟aba+b不吸烟cdc+d合计a+cb+da+b+c+d数学探究问题2:上述结论给我们的印象是患病与吸烟有关,事实果
真如此吗?究竟能有多大的把握认为“患病与吸烟
有关”呢?患病未患病合计吸烟aba+b不吸烟cdc+d合
计a+cb+da+b+c+d若设n=a+b+c+d,则有故数学探究问题2:上述结论给我们的印象是患病与吸烟有关,事实果
真如此吗?究竟能有多大的把握认为“患病与吸烟
有关”呢?因此在H0成立的条件下,吸烟且患病的人数为同理可得:吸烟但未患病的人数为不吸烟但患病的人数为不吸烟且未患病的人数为数学探究问题2:上述结论给我们的印象是患病与吸烟有关,事实果
真如此吗?究竟能有多大的把握认为“患病与吸烟
有关”呢?如果实际观测值与在事件A,B独立的假设下的估计值相差不“大”,那么我们就可以认为这些差异是由随机误差造成的,假设H0不能被所给数据否定,否则应认为假设H0不能接受。数学探究问题3:怎样描述实际观测值与估计值的差异呢?为此,考虑实际观测值与在事件A,B独立的假设下的估计值的差(如下表):患病未患病吸烟不吸烟为了避免正负相消及消除样本容量对差异大小的影响,可以将它们分别平方并处以对应的估计频数(即估计值),最后相加,得到数学探究问题3:怎样描述实际观测值与估计值的差异呢?化简得(其中n=a+b+c+d)统计学中通常采用统计量χ2本(读作“卡方”)来刻画这个差异。数学探究问题3:怎样描述实际观测值与估计值的差异呢?(其中n=a+b+c+d)统计学中已有明确的结论:在H0成立的情况下,随机事件“χ2≥
”发生的概率约为,即P(χ2≥
6.635)≈也就是说,在H0成立的情况下,对统计量χ2进行多次观测,观测值超过的概率约为。数学探究问题4:问题情境中能有多大的把握认为“患病与吸烟有关”
呢?通过计算,本例中χ2
=>”,由P(χ2≥
6.635)≈可知,出现这样的观测值χ2的概率不超过,因此,我们有99%的把握认为H0不成立,即有99%的把握认为“患呼吸道疾病与吸烟有关系”。患病未患病合计吸
烟37183220不吸烟21274295合
计58457515数学建构4、独立性检验的定义利用统计量χ2来判断“两个分类变量有关系”的方法称为独立性检验。3、统计量χ2的计算公式(其中n=a+b+c+d)数学建构一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即即类1和类2,我们得到如下列联表所示的样本数据:Ⅱ合计类1类2Ⅰ类Aaba+b类Bcdc+d合计a+cb+da+b+c+d5、推断两个分类变量“Ⅰ与Ⅱ有关系”的步骤要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式计算χ2的值;(3)根据临界值表,做出判断。数学建构6、独立性检验临界值表P(χ2≥x0)0.500.400.250.150.10x00.4550.7081.3232.0722.706P(χ2≥x0)0.050.0250.0100.0050.001x03.8415.0246.6357.87910.828(1)若χ2>,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)若χ2>,则有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)若χ2>,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若χ2≤,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能得出结论“H0成立”,即Ⅰ与Ⅱ没有关系。数学应用例1、在500人身上试验某种血清预防感冒的作用,把他们1年中的感冒记录与另外500名未用血清的人的感冒
记录作比较,结果如下表所示.问:该种血清对预
防感冒是否有作用?类型利用统计量χ2进行独立性检验的问题求解未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000题后反思独立性检验的注意点:在2×2列联表中,如果两个分类变量没有关系,那么应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强。数学练习为了解学生选报文科、理科与是否对外语有兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人;文科对外语有兴趣的有73人,无兴趣的有52人,能否在犯错误的概率不超过的前提下,认为“学生选报文科、理科与对外语的兴趣有关”?解:根据题意得到如下2×2列联表:理科文科合计有兴趣13873211无兴趣9852150合计236125361为了解学生选报文科、理科与是否对外语有兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人;文科对外语有兴趣的有73人,无兴趣的有52人,能否在犯错误的概率不超过的前提下,认为“学生选报文科、理科与对外语的兴趣有关”?数学练习数学应用例2、为研究不同的给药方式(口服与注射)和药的效果(有效
与无效)是否有关,进行了相应的抽样调查,调查结
果如下表所示,根据所选择的193个病人的数据,能
否做出药的效果与给药方式有关的结论?有效无效合计口服584098注射643195合计12271193数学应用例3、气管炎是一种常见的呼吸道疾病,医药研究人员对两
种中草药治疗慢性气管炎的疗效进行了对比,所得数
据如下表所示.问:它们的疗效有无差异?有效无效合计复方江剪刀草18461245胆黄片919100合计27570345数学练习1、某市政府调查市民收入增减与旅游愿望的关系时,采
用独立性检验法抽查了3000人,计算发现χ2的观测值
k=,则市政府断言市民收入增减与旅游愿望有
关系的可信程度是(
)(A)97.5%(B)99%
(C)99.5%
(D)99.9%A数学练习2、考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407则下列结论中正确的是(
)(A)种子是否经过处理跟是否生病有关(B)种子是否经过处理跟是否生病无关(C)种子是否经过处理决定是否生病(D)以上都是错误的B课堂检测课本第164页练习第1、2题。1、分类变量的定义变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(其“值”非数量,如性别变量)。2、列联表(1)定义:(2)2×2列联表列联表是一个描述两个分类变量分布的频数表。一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)如下:y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d课堂小结4、独立性检验的定义利用统计量χ2来判断“两个分类变量有关系”的方法称为独立性检验。3、统计量χ2的计算公式(其中n=a+b+c+d)课堂小结一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即即类1和类2,我们得到如下列联表所示的样本数据:Ⅱ合计类1类2Ⅰ类Aaba+b类Bcdc+d合计a+cb+da+b+c+d5、推断两个分类变量“Ⅰ与Ⅱ有关系”的步骤要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式计算χ2的值;(3)根据临界值表,做出判断。课堂小结6、独立性检验临界值表P(χ2≥x0)0.500.400.250.150.10x00.4550.7081.3232.07
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海工艺美术职业学院《光通信传输网络实训》2024-2025学年第二学期期末试卷
- 景区内部管理规章制度
- 机关院内内部停车制度
- 机械制造业内部控制制度
- 林业局内部控制工作制度
- 柬埔寨内部悬赏制度
- 检察院内部纪律考勤制度
- 母婴店公司内部制度
- 民宗局单位内部控制制度
- 民营企业内部审计制度
- 电动地牛安全培训课件
- ip电话施工方案
- 《恶意》读书分享演讲稿模版
- DB5301∕T 23-2019 园林绿化工程验收规范
- 【2024-11月更新】武术18课时大单元(教学设计)
- 河南省安全生产职责清单
- 毕业设计(论文)-水泵密封圈冲压模具设计
- 2025至2030中国海洋牧场行业产业运行态势及投资规划深度研究报告
- 痰液粘稠度护理
- T/CECS 10214-2022钢面镁质复合风管
- 马工程西方经济学(精要本第三版)教案
评论
0/150
提交评论