




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、12独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用题型分类讲解题型分类讲解 1分类变量和列联表 (1)分类变量 变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量 (2)列联表 定义:列出的两个分类变量的称为列联表 22列联表 一般地,假设两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为22列联表)为下表.不同类别频数表x1,x2y1,y2 2.等高条形图 (1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否,常用等高条形图展示列联表数据的y1y2总计x1ababx2cdcd总计acbdabcd互相影响频率特征 如果,就推断“X与Y有关系”,
2、这种推断犯错误的概率不超过a,否则就认为在不超过a的前提下不能推断“X与Y的关系”,或者在样本数据中支持结论“X与Y有关系” 4在独立性检测中,当K2 时,有95%的把握说事件A与B有关;当K2 时;有99%的把握说事件A与B有关;当K2 时,认为kk0犯错误的概率没有发现足够证据3.8416.6353.841事件A与B是无关的规律小结:规律小结:用独立性检验法来判断两个变量用独立性检验法来判断两个变量X与与Y有关的一般步骤:有关的一般步骤:2.列表列表设两个变量的值域分别为设两个变量的值域分别为x1,x2y1.,y2,列列2x2列联表列联表y y1 1y y2 2总计总计x x1 1a ab
3、 ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d4.查表查表利用统计概率表查找临界值时发生的概率利用统计概率表查找临界值时发生的概率3.计算计算利用公式计算变量利用公式计算变量X与与Y的评判标准的评判标准K25.下结论下结论得出概率结论得出概率结论根据随机变量根据随机变量K2的含义,评价假设不合理的的含义,评价假设不合理的程度,程度,如由实际计算出的如由实际计算出的K2 6.635,说明假设不合理的程度约为,说明假设不合理的程度约为99%,即即“两个分类有关系两个分类有关系”这一结论成立的可信程度约为这一结论成立的可信程度约为99
4、%,或说明有或说明有99%的把握认为两个分类变量有关系的把握认为两个分类变量有关系否则就说由样本观测数据没有充分证据显示否则就说由样本观测数据没有充分证据显示“X与与Y有关系有关系”.1.假设假设假设假设H0:两个变量:两个变量X与与Y没有关系没有关系成立成立 确定临界值确定临界值k0根据实际问题需要的可信程度确定临界值根据实际问题需要的可信程度确定临界值k k0 0;10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk例例1.1.在某医院在
5、某医院, ,因为患心脏病而住院的因为患心脏病而住院的665665名男性病人中名男性病人中, ,有有214214人秃顶人秃顶, ,而另外而另外772772名名不是因为患心脏病而住院的男性病人中有不是因为患心脏病而住院的男性病人中有175175人秃顶人秃顶. .独立性检验方法判断是否有关独立性检验方法判断是否有关? ?你所得的结论在什么范围内有效你所得的结论在什么范围内有效? ?患心脏病患其他病总计秃顶214175389不秃顶4515971048总计665772143722n adbcKabcdacbdnabcd 其中为样本容量222,1437214 597 175 45116.3736.6353
6、89 1048 665 772Kk根据列联表中的数据 得的观测值为所以有99%的把握认为”秃顶与患心脏病有关”例例2 为考察高中生的性别与是否喜欢数学课程之为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:名学生,得到如下联表:喜欢数学课喜欢数学课程程不喜欢数学不喜欢数学课程课程总计总计男男3785122女女35143178总计总计72228300由表中数据计算由表中数据计算K2的观测值的观测值k4.513。在。在多大程度上可以认为高中生的性别与是否喜多大程度上可以认为高中生的性别与是否喜欢数学课程
7、之间有关系?为什么?欢数学课程之间有关系?为什么?2(3.841)0.05,P K而我们所得到的而我们所得到的K2的观测值的观测值k4.513超过超过3.841,这就意味着,这就意味着“性别性别与喜与喜欢数学课程欢数学课程之之间无关间无关系系” 可能可能性性约为0.05(或小于0.05) ,即有95%(或大于 95%)的把握认为“性别与是否喜欢数学课程之间有关系”。解:在假设解:在假设“性别性别与喜与喜欢数学课程之欢数学课程之间无关间无关系系”的前提下的前提下K2应该很小,并且应该很小,并且思考:例1、2的结论是否适用于普通的对象? 在掌握了两个分类变量的独立性检验方法之后,就可以模在掌握了两
8、个分类变量的独立性检验方法之后,就可以模仿例仿例1中的计算解决实际问题,而没有必要画相应的图形。中的计算解决实际问题,而没有必要画相应的图形。分析:分析:例例1 1这组数据来自住院的病人,因此所得到的结论适合住这组数据来自住院的病人,因此所得到的结论适合住院的病人群体例院的病人群体例2 2的结论只适合被调查的学校。的结论只适合被调查的学校。大家要大家要注意统计结果的适用范围注意统计结果的适用范围(这(这由样本的代表性所决定由样本的代表性所决定) 例1 在一项有关医疗保健的社会调查中,发现被调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,而女性中喜欢吃甜食的有492人,试
9、判断喜不喜欢吃甜食与性别有无关系 解析作列联表如下(单位:人): 性别与喜欢吃甜食列联表 画三维柱形图,如图喜欢吃甜食不喜欢吃甜食总计男117413530女492178670总计6095911200 比较来说,主、副对角线上两个柱体高度的乘积差别较大,因而可以在某种程度上认为“喜不喜欢吃甜食与性别有关系” 点评 1)在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分类变量有关系的可能性就越大 2)作三维柱形图时,作图要精确,且比较易于观察,以便对结论的判断不出现偏差 如图所示是根据调查人的性格与性别有无关系的相应数据画出的三维柱形图,由该三维柱形图可知,
10、人的性格与性别_关系(填“有”或“没有”) 答案有 点评由题图可知,主副对角线上两个柱体高度的乘积差别较大,因而人的性格与性别有关系例2下面22列联表的K2的值为 1.780(2)从上面计算结果中有多少把握判断A和B相关?因为1.7801.323,只有约75%的把握判断A和B相关,即没有确切把握判断A和B相关_. 2将K2的数值与两个临界值3.841与6.635进行对比; 做出统计推断:当根据具体的数据算出的 当K23.841时,有95%的把握说事件A与B有关; 当K26.635时,有99%的把握说事件A与B有关; 当K23.841时,认为事件A与B是无关的 某防疫站对屠宰场及肉食零售点的猪肉
11、检查沙门氏菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异.带菌头数不带菌头数合计屠宰场83240零售点141832合计225072 分析这是一个22列联表,可以用K2检验来检验屠宰场与零售点猪肉带菌率有无差异色盲与性别列联表 根据列联表作出相应的二维条形图,如图所示色盲非色盲总计男38442480女6514520总计449561000例3在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,通过图形判断色盲与性别是否有关利用独立性检验判断,是否能够以99.9%的把握认为“色盲与性别有关系”你所得到的结论在什么范围内有效?解析根据题目所给的数据作出如下的列联表(单位:
12、名): 点评本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断 1利用图形来判断两个分类变量是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以粗略地判断两个分类变量是否有关系,可以结合所给的数值来进行比较作图应注意单位统一,图形准确,但它不能给我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算 2当需要利用公式计算K2的观测值大小来对问题作出推断时,首先要牢记公式,再将经过准确运算后得到的结果与临界值进行比较,最后才能得出合乎情理的结论 为了调查某生产线上质量监督员甲对产品质
13、量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关? 分析由题目可获取以下主要信息: 甲在生产现场和不在生产现场时,产品中的合格品和次品数量; 共调查统计了1500件产品 解答本题的关键是准确把握数据作出22列联表,然后具体分析 解析(1)22列联表如下:合格品数次品数合计甲在生产现场9828990甲不在生产现场49317510合计147525
14、1500由列联表可得|adbc|982174938|12750, 相差较大,可在某种程度上认为“质量监督员甲是否在 生产现场与产品质量有关系” 一、选择题 1可以粗略地判断两个分类变量是否有关系的是() A散点图 B三维柱形图和二维条形图 C独立性检验的思想 D以上都不对 答案B 解析用三维柱形图和二维条形图可以粗略地判断两个分类变量是否有关系,但无法精确给出结论的可靠程度 2下表是一个22列联表: 则表中a,b处的值分别为() A94,96B52,50 C52,54D54,52y1y2总计x1a2173x222527总计b46100 答案C 3对于分类变量X与Y的随机变量K2的观测值k,下列
15、说法正确的是() Ak越大,推断“X与Y有关系”,犯错误的概率越大 Bk越小,推断“X与Y有关系”,犯错误的概率越大 Ck越接近于0,推断“X与Y无关”,犯错误的概率越大 Dk越大,推断“X与Y无关”,犯错误的概率越小 答案B 4利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过() A0.25 B0.75 C0.025 D0.975 答案C 解析通过查表确定临界值k.当kk05.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.5如果有99%的把握认
16、为“X与Y有关系”,那么具体算出的数据满足()Ak6.635 Bk5.024Ck7.879 Dk3.841男女总计爱好402060不爱好203050总计60501106(2011年湖南卷)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:A附表:参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”P(K2k)0.0500.0100.001k3.8416.63510.828C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与
17、性别无关”解析:由K27.86.635,则P(K26.635)0.010,故由独立性检验的意义可知选A.答案:A 二、填空题 7如果K2的观测值k为8.654,可推断“X与Y有关”犯错误的概率不超过_ 答案0.005 解析k8.6547.879,就推断“X与Y有关”犯错误的概率不超过0.005. 8为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后14天内的结果如下表所示: 进行统计分析时的统计假设是_ 答案假设电离辐射的剂量与人体受损程度无关死亡存活合计第一种剂量141125第二种剂量61925合计203050 三、解答题 9在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下表所示. 试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立性检验未感冒感冒合计试验过252248500未用过224276500合计4765241000 解析如下图所示10.有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表 班级与成绩列联表 试问能有多大把握认为“成绩与班级有关系”?优秀不优秀总计甲班103545乙班73845总计17739011为了研究色盲与性别的关系,共调查了1 000人,结果如下表所示:试问:色盲与性别有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鸡西市中医院神经传导速度测定考核
- 中国微生物培养基项目投资计划书
- 晋城市中医院急性重症胰腺炎手术时机把握考核
- 大同市中医院早产儿视网膜病变筛查与治疗考核
- 2025第二人民医院环氧乙烷灭菌考核
- 2025年中国饲料油脂项目投资计划书
- 中国软磁铁氧体磁芯项目商业计划书
- 重庆市中医院多学科联合诊疗考核
- 巴彦淖尔市人民医院无菌操作技能考核
- 鄂尔多斯市中医院推拿意外预防处理考核
- 2024年考研管综试题及答案
- 心理健康主题班会课件50
- 【MOOC】创新思维与创业实验-东南大学 中国大学慕课MOOC答案
- 2024年秋儿童发展问题的咨询与辅导终考期末大作业案例分析1-5答案
- 新时代中小学教师职业行为十项准则
- 建筑工地有限空间应急预案
- 高尔夫主题酒店项目方案及设计要求
- 苏宁易购财务报表分析报告
- DB13-T 5997-2024 公路桥梁混凝土结构裂缝处治施工技术规范
- TSG ZF001-2006《安全阀安全技术监察规程》
- 12D401-3 爆炸危险环境电气线路和电气设备安装
评论
0/150
提交评论