




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、独立性独立性检验检验的基本思想的基本思想 及其初步应用及其初步应用1 1、了解利用、了解利用列联表列联表、等高条形图等高条形图来判断两个来判断两个 分类变量分类变量之间是否有关系。之间是否有关系。 2 2、了解独立性检验的基本思想,会对两个分、了解独立性检验的基本思想,会对两个分 类变量进行独立性检验,明确类变量进行独立性检验,明确独立性检验独立性检验 的基本步骤的基本步骤,并能解决实际问题。,并能解决实际问题。 学习目标学习目标这种变量的这种变量的不同不同“值值”表示表示个体所属的个体所属的不同类别不同类别,民族民族国籍国籍宗教信仰宗教信仰是否吸烟是否吸烟像这样的变量称为像这样的变量称为分类
2、变量分类变量。为研究吸烟是否对患肺癌有影响,某肿瘤研为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了究所随机地调查了99659965人,得到如下结果:人,得到如下结果: 表表37 吸烟与患肺癌列联表吸烟与患肺癌列联表 单位:人单位:人不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965 这样列出的两个这样列出的两个分类变量分类变量的的频数表频数表,称为,称为列联表列联表一般我们只研究一般我们只研究每个分类变量每个分类变量只取只取两个值两个值,这样的列联表称为
3、这样的列联表称为2 22 2列联表列联表。不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965 为研究为研究吸烟吸烟是否对是否对患肺癌患肺癌有影响有影响,某肿瘤研,某肿瘤研究所随机地调查了究所随机地调查了9965人,得到如下结果:人,得到如下结果: 表表37 吸烟与患肺癌列联表吸烟与患肺癌列联表 单位:人单位:人不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749
4、874919199659965不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965在不吸烟者中患肺癌的比例为在不吸烟者中患肺癌的比例为 ;在吸烟者中患肺癌的比例为在吸烟者中患肺癌的比例为 。 0.540.542.28条件条件概率概率427817492148由以上列联表,我们估计由以上列联表,我们估计: : 吸烟群体吸烟群体和和不吸烟群体不吸烟群体患肺癌的患肺癌的可能性可能性存在存在差异差异在不吸烟者中患肺癌的比例为在不吸烟者中患肺癌的比例为 0.54 % ;在吸烟
5、者中患肺癌的比例为在吸烟者中患肺癌的比例为 2.28% 。 问题问题1 1 : :你认为吸烟与患肺癌有关系吗?你认为吸烟与患肺癌有关系吗? 认为吸烟与患肺癌有关系认为吸烟与患肺癌有关系吸烟者中患肺癌的比例吸烟者中患肺癌的比例2.28 不吸烟者中患肺不吸烟者中患肺 癌的比例癌的比例0.54 问题问题2 2 : :你认为以上两个你认为以上两个比例值比例值越接近越接近,还是,还是 相差越大相差越大,越能说明,越能说明吸烟与患肺癌的有关吸烟与患肺癌的有关 ?比例值比例值相差越大相差越大,越能说明,越能说明吸烟与患肺癌的有关吸烟与患肺癌的有关问题问题3 3:还有其它方法来判断吸烟和患肺癌有还有其它方法来
6、判断吸烟和患肺癌有关吗?关吗? 等高条形图等高条形图 吸烟更容易引发肺癌吸烟更容易引发肺癌问题问题4:由由等高条形图等高条形图得出的结论的得出的结论的可靠程度可靠程度如何?如何?频率频率(比例)(比例) 转化为转化为 图形图形等高条形图等高条形图可以可以粗略粗略的看出吸烟与患肺癌有关。的看出吸烟与患肺癌有关。阴影部分阴影部分高度相差越大高度相差越大,相关性越强相关性越强abba cddc ca db dcba总计总计吸烟吸烟不吸烟不吸烟总计总计患肺癌患肺癌不患肺癌不患肺癌H0:假设假设吸烟与患肺癌没有关系吸烟与患肺癌没有关系吸烟中患肺癌的比例吸烟中患肺癌的比例与与不吸烟患肺癌的比例不吸烟患肺癌
7、的比例(相等)(相等)相差不大相差不大dbcdab问题问题5 5:你有你有多大把握多大把握判断吸烟与患肺癌有关?判断吸烟与患肺癌有关? 用什么方法进行检验呢?用什么方法进行检验呢?探究:探究:bcad 的大小能说明什么?的大小能说明什么?0adbc说明说明吸烟与患肺癌吸烟与患肺癌没有关系没有关系bcad 越大越大能说明能说明吸烟与患肺癌关系吸烟与患肺癌关系越强越强dbcdab()()d abb cdadbc0adbcbcad 越小越小能说明能说明吸烟与患肺癌关系吸烟与患肺癌关系越弱越弱abba cddc ca db dcba总计总计吸烟吸烟不吸烟不吸烟总计总计患肺癌患肺癌不患肺癌不患肺癌dcb
8、andbcadcbabcadnK,)()()()(22探究:探究:的大小能说明什么?的大小能说明什么?2K632.5691987421487817)209942497775(99652k这个值到底能告诉我们什么呢?这个值到底能告诉我们什么呢? dcbandbcadcbabcadnK,)()()()(22 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965临界值表(课本临界值表(课本P94) 6.6355.0243.8412.706
9、2.0721.3230.7080.445 0.0100.0250.050.100.150.250.400.5020()P Kk0kk为为观测值观测值2K概率概率 临界值临界值 56.632k 临界值表(课本临界值表(课本P94) 6.6355.0243.8412.7062.0721.3230.7080.445 0.0100.0250.050.100.150.250.400.5020()P Kk0k概率概率 临界值临界值 6.6352(6.635)0.01P K H0:假设假设吸烟与患肺癌没有关系吸烟与患肺癌没有关系前提前提H0成立的概率为成立的概率为0.01吸烟与患肺癌吸烟与患肺癌没有关系没有
10、关系的概率为的概率为0.010.01吸烟与患肺癌吸烟与患肺癌有关系有关系的概率为的概率为0.990.99(1 1)有)有99%99%的把握的把握说明吸烟与患肺癌说明吸烟与患肺癌有关系。有关系。我们的回答:我们的回答:(2 2)在犯错误的概率不超)在犯错误的概率不超0.010.01的前提下的前提下 说明吸烟与患肺癌说明吸烟与患肺癌有关系。有关系。这种利用随机变量这种利用随机变量K K2 2来判断来判断“两个分类两个分类变量有关系变量有关系”的方法,称为的方法,称为独立性检验独立性检验。 表表3-11 临界值表临界值表 10.8287.8796.6355.0243.8412.7062.0721.3
11、230.7080.445 0.0010.0050.0100.0250.050.100.150.250.400.502()PKkk10.828k 若观测值这说明什么?这说明什么?1.323k 若观测值这说明什么?这说明什么?在犯错误的概率不超在犯错误的概率不超0.0010.001的前提的前提说明说明两个两个分类变量分类变量有关系有关系。在犯错误的概率不超在犯错误的概率不超0.250.25的前提的前提说明说明两个两个分类变量分类变量没有关系没有关系。(1 1)当)当kkkk0 0时,就认为时,就认为K K2 2的观测值的观测值k k大大 认为认为“两个分类变量之间两个分类变量之间有关系有关系”。临
12、界值表临界值表 10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 0.0010.0050.0100.0250.050.100.150.250.400.502()P Kkk问题问题6 6:怎样判断怎样判断K K2 2的的观测值观测值k k是是大大还是还是小小呢?呢?确定一个确定一个参照值参照值(正数(正数k k0 0)。)。(2 2)当)当k k k k0 0时,就认为时,就认为K K2 2的观测值的观测值k k小小 认为认为“两个分类变量之间两个分类变量之间没有关系没有关系”。我们称这样的我们称这样的k k0 0为一个判断规则的为一个判断规
13、则的临界值临界值0k在实际应用中,要在在实际应用中,要在获取样本数据获取样本数据之前之前通过下表通过下表确定确定临界值临界值 : “独立性检验独立性检验”的具体做法步骤为:的具体做法步骤为: 第一步:根据第一步:根据实际问题实际问题需要的需要的可信程度可信程度确定临界值确定临界值 ; 0k第二步:利用公式第二步:利用公式计算计算随机变量随机变量 的的观测值观测值 ;2Kk0k在实际应用中,要在在实际应用中,要在获取样本数据获取样本数据之前之前通过下表通过下表确定确定临界值临界值 : 表表3-11 临界值表临界值表 第三步:比较第三步:比较 与与 的大小的大小得出结论。得出结论。 0kk10.8
14、287.8796.6355.0243.8412.7062.0721.3230.7080.445 0.0010.0050.0100.0250.050.100.150.250.400.502()P Kkk(1 1)当)当kkkk0 0时,认为时,认为“两个分类变量之间两个分类变量之间有关系有关系”。(2 2)当)当k k k k0 0时,认为时,认为“两个分类变量之间两个分类变量之间没有关系没有关系”。 为考察高中生的性别与是否喜欢数学课程之间为考察高中生的性别与是否喜欢数学课程之间的关系的关系, ,在某城市的某校高中生中随机抽取在某城市的某校高中生中随机抽取500500名名学生,得到如下列联表:
15、学生,得到如下列联表: 单位:人单位:人 喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男104104128128232232女女9595173173268268总计总计199199301301500500能够有能够有95的把握认为高中生的的把握认为高中生的性别与是否喜性别与是否喜欢数学课程之间有关系欢数学课程之间有关系吗?吗? 临界值表临界值表 10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 0.0010.0050.0100.0250.050.100.150.250.400.502()P Kkk 可可信信度度3.8410
16、.05 临界值临界值3.841301199268232)95128173104(5002k5663. 4841. 3所以,能够有所以,能够有95的把握认为的把握认为“性别与喜性别与喜 欢数学课之间有关系欢数学课之间有关系”。 解:由解:由可信度可信度查临界值表得查临界值表得 根据列联表中的数据,得到根据列联表中的数据,得到 841. 30k2.为了研究高中生的数学成绩和物理成绩的关系为了研究高中生的数学成绩和物理成绩的关系,在在 某校随机抽取部分学生调查某校随机抽取部分学生调查,得到如下列联表:得到如下列联表: 单位:人单位:人物理好物理好物理差物理差合计合计数学好数学好10496200数学差数学差5694150合计合计160190350根据抽查数据,你能够有根据抽查数据,你能够有99%把握认为高中生的数把握认为高中生的数学学成绩成绩与物理与物理成绩成绩之
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船舶拆除行业监管考核试卷
- 外贸英语函电Unit1课件
- (四检)厦门市2025届高三毕业班第四次质量检测地理试卷(含答案)
- 塑造五年级行为典范
- 外贸英文函电课件unit14
- 山西省朔州市朔城区四中学2025年初三下学期期末联考生物试题理试题含解析
- 闽北职业技术学院《高压电技术》2023-2024学年第二学期期末试卷
- 内蒙古电子信息职业技术学院《机械工程专业英语》2023-2024学年第一学期期末试卷
- 天津和平区天津市双菱中学2025届3月初三年级综合模拟测试语文试题含解析
- 唐山职业技术学院《大学体育与健康(3)》2023-2024学年第二学期期末试卷
- 2024年江苏国信新丰海上风力发电有限公司招聘笔试冲刺题(带答案解析)
- 学术交流英语(学术写作)智慧树知到期末考试答案2024年
- 国家卫生部《综合医院分级管理标准》
- 中医经络养生拍打
- Unit7Summerholidayplans(单元解读)六年级英语下册(译林版三起)
- 医学高级职称-皮肤与性病学(医学高级)笔试(2018-2023年)真题摘选含答案
- 乳腺疾病的健康宣教
- 新生儿重点专科模板课件
- 《四、尊生》课件(安徽省市级优课)
- 企业培育工匠实施方案
- 废弃物管理制度范本
评论
0/150
提交评论