




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 1.1.判断分类变量及其关系的方法:判断分类变量及其关系的方法:(1)(1)利用数形结合思想,借助等高条形图来判断两个分类变量利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法是否相关是判断变量相关的常见方法. .(2)(2)一般地,在等高条形图中,一般地,在等高条形图中, 与与 相差越大,两个相差越大,两个分类变量有关系的可能性就越大分类变量有关系的可能性就越大. .分类变量关系的分析分类变量关系的分析aabccd2.2.分析分类变量关系的步骤:分析分类变量关系的步骤:(1)(1)作大量的调查、研究,统计出结果作大量的调查、研究,统计出结果. .(2)(2)
2、列出列联表利用频率粗略估计列出列联表利用频率粗略估计. .(3)(3)作出等高条形图,从直观上进一步判断分类变量之间的关作出等高条形图,从直观上进一步判断分类变量之间的关联关系联关系. . 通过等高条形图可以粗略地判断两个分类变量通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度是否有关系,但无法精确地给出所得结论的可靠程度. .【例例1 1】从发生交通事故的司机中抽取从发生交通事故的司机中抽取2 0002 000名司机作随机样名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理
3、如下:责任将数据整理如下:试分析血液中含有酒精与对事故负有责任是否有关系试分析血液中含有酒精与对事故负有责任是否有关系. .【审题指导审题指导】题目已给出了题目已给出了2 22 2列联表,可利用等高条形图列联表,可利用等高条形图定性分析两个分类变量之间的相关性定性分析两个分类变量之间的相关性. .【规范解答规范解答】作等高条形图如下,图中阴影部分表示有酒精作等高条形图如下,图中阴影部分表示有酒精负责任与无酒精负责任的比例,从图中可以看出,两者差距负责任与无酒精负责任的比例,从图中可以看出,两者差距较大,由此我们可以在某种程度上认为较大,由此我们可以在某种程度上认为“血液中含有酒精与血液中含有酒
4、精与对事故负有责任对事故负有责任”有关系有关系. .【变式训练变式训练】某学校对在校部分学生课外活动内容进行调查,某学校对在校部分学生课外活动内容进行调查,结果整理成下表:结果整理成下表:学生喜欢课外活动的类别与性别有关系吗?试用学过的知识学生喜欢课外活动的类别与性别有关系吗?试用学过的知识进行分析进行分析. .【解析解析】作出等高条形图如下:作出等高条形图如下:由图可以直观地看出喜欢体育还是喜欢文娱,在性别上有较由图可以直观地看出喜欢体育还是喜欢文娱,在性别上有较大差异,说明学生喜欢课外活动的类别与性别在某种程度上大差异,说明学生喜欢课外活动的类别与性别在某种程度上有关系有关系. . 有关有
5、关“相关性检验相关性检验” 解决一般的独立性检验问题的步骤:解决一般的独立性检验问题的步骤:(1)(1)根据实际问题的需要确定容许推断根据实际问题的需要确定容许推断“两个分类变量有关系两个分类变量有关系”犯错误概率的上界犯错误概率的上界,然后查下表确定临界值,然后查下表确定临界值k k0 0. .(2)(2)根据根据2 22 2列联表,利用公式列联表,利用公式 计算随机变量计算随机变量K K2 2的观测值的观测值k.k.(3)(3)如果如果kkkk0 0,就推断,就推断“X X与与Y Y有关系有关系”,这种推断犯错误的,这种推断犯错误的概率不超过概率不超过;否则,就认为在犯错误的概率不超过;否
6、则,就认为在犯错误的概率不超过的前的前提下不能推断提下不能推断“X X与与Y Y有关系有关系”,或者在样本数据中没有发现,或者在样本数据中没有发现足够证据支持结论足够证据支持结论“X X与与Y Y有关系有关系”. .22n adbcKabcdac (bd) 通常认为通常认为k2.706k10.828,12.3810.828,所以在犯错误的概率不超过所以在犯错误的概率不超过0.0010.001的前提下认为的前提下认为“生产合格品生产合格品与设备改造有关系与设备改造有关系”. .218065 4930 36k95 85 101 79【变式训练变式训练】为了调查患慢性气管炎是否与吸烟有关,调查为了调
7、查患慢性气管炎是否与吸烟有关,调查了了339339名名5050岁以下的人,调查结果如下表:岁以下的人,调查结果如下表:根据上表分析患慢性气管炎是否与吸烟有关?根据上表分析患慢性气管炎是否与吸烟有关?【解析解析】a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=339b+d=283,n=339代入公式得代入公式得K K2 2的观测值:的观测值: 7.468 86.635.7.468 86.635.所以在犯错误的概率不超过所以在犯错误的概率不超过0.
8、010.01的前提下认为的前提下认为“患慢性气管患慢性气管炎与吸烟有关炎与吸烟有关”. .233943 121 162 13k205 134 56 283【例例】为调查某地区老年人是否需要志愿者提供帮助,用简为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了单随机抽样方法从该地区调查了500500位老年人,结果如下:位老年人,结果如下:(1)(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比估计该地区老年人中,需要志愿者提供帮助的老年人的比例;例;(2)(2)能否在犯错误的概率不超过能否在犯错误的概率不超过0.010.01的前提下认为该地区的老的前提下认为该地区的
9、老年人是否需要志愿者提供帮助与性别有关?年人是否需要志愿者提供帮助与性别有关?(3)(3)根据根据(2)(2)的结论,能否提出更好的调查方法来估计该地区的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理的老年人中,需要志愿者提供帮助的老年人的比例?说明理由由. .附:附:【审题指导审题指导】解答第解答第(2)(2)问时问时, ,可先计算可先计算K K2 2的值,再对照表格的值,再对照表格作出判断作出判断. .22n adbcKabcdac (bd)【规范解答规范解答】(1)(1)调查的调查的500500位老年人中有位老年人中有7070位需要志愿者提位
10、需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为人的比例的估计值为 (2) 9.967.(2) 9.967.由于由于9.9676.635,9.9676.635,所所以在犯错误的概率不超过以在犯错误的概率不超过0.010.01的前提下认为该地区的老年人的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关是否需要志愿者提供帮助与性别有关. .7014%.500225004027030 160K200 300 70430(3)(3)由由(2)(2)的结论知,该地区的老年人是否需要志愿者提供帮的结论知,该地区的
11、老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能看出该地区男性老年人与助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,这比采用简单随机抽样方法更女两层并采用分层抽样方法,这比采用简单随机抽样方法更好好. .【变式备选变式备选】用两种检验方法对某食品做沙门氏菌检验,结用两种检验方法对某食品做沙门氏菌检验,结果如下表,能否在犯错误的概率不超过果如下表,能否
12、在犯错误的概率不超过0.0010.001的前提下认为两的前提下认为两种方法和阳性结果有关系?种方法和阳性结果有关系?【解题提示解题提示】由于题目要求由于题目要求“犯错误的概率不超过犯错误的概率不超过0.001”0.001”,故需求解故需求解K K2 2的观测值,再利用临界值的大小来判断假设是否的观测值,再利用临界值的大小来判断假设是否成立成立. .【解析解析】由等高条形图由等高条形图( (如图如图) )可知,采用荧光抗体法与检验可知,采用荧光抗体法与检验结果呈阳性有关系,而通过计算可知:结果呈阳性有关系,而通过计算可知:查表可知,查表可知,P(KP(K2 210.828)0.001,10.82
13、8)0.001,而而113.185113.185远大于远大于10.82810.828,所以它们之间有关系的概率大于,所以它们之间有关系的概率大于0.999,0.999,也就是说,也就是说,在犯错误的概率不超过在犯错误的概率不超过0.0010.001的前提下认为它们之间有关系的前提下认为它们之间有关系. .22n adbcK113.185.abcdac (bd) 独立性检验的综合应用独立性检验的综合应用 判断变量判断变量X X与与Y Y有无关系的三种方法:有无关系的三种方法:(1)2(1)22 2列联表:由列联表:由2 22 2列联表中列联表中ad-bcad-bc的大小判断的大小判断. .(2)
14、(2)等高条形图:观察条形图中的阴影比例大小判断等高条形图:观察条形图中的阴影比例大小判断. .(3)(3)独立性检验:计算独立性检验:计算K K2 2的观测值的观测值k k,再利用临界值的大小判,再利用临界值的大小判断断. .其中独立性检验的方法相对较准确其中独立性检验的方法相对较准确. .【例例3 3】为了调查某生产线上质量监督员甲对产品质量好坏有为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,无影响,现统计数据如下:甲在生产现场时,990990件产品中有件产品中有合格品合格品982982件,次品件,次品8 8件;甲不在生产现场时,件;甲不在生产现场时
15、,510510件产品中有件产品中有合格品合格品493493件,次品件,次品1717件件. .试分别用列联表、等高条形图、独试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响立性检验的方法分析监督员甲对产品质量好坏有无影响. .能否能否在犯错误的概率不超过在犯错误的概率不超过0.0010.001的前提下,认为质量监督员甲是的前提下,认为质量监督员甲是否在生产现场与产品质量有关?否在生产现场与产品质量有关?【审题指导审题指导】本题要求分别用列联表、等高条形图、独立性本题要求分别用列联表、等高条形图、独立性检验的方法分析,要注意三种方法的判断思路检验的方法分析,要注意三种
16、方法的判断思路. .【规范解答规范解答】(1)2(1)22 2列联表如下:列联表如下:由列联表可得由列联表可得ad-bc|=|982ad-bc|=|98217-49317-4938|=12 750.8|=12 750.相差较大,可在某种程度上认为相差较大,可在某种程度上认为“质量监督员甲是否在现场质量监督员甲是否在现场与产品质量有关系与产品质量有关系”. .(2)(2)画等高条形图画等高条形图. .如图可知,在某种程度上认为如图可知,在某种程度上认为“质量监督员甲是否在生产现质量监督员甲是否在生产现场与产品质量有关系场与产品质量有关系”. .(3)(3)由由2 22 2列联表中数据,计算得到列
17、联表中数据,计算得到K K2 2的观测值为的观测值为 因此,在犯错误的概率不超过因此,在犯错误的概率不超过0.0010.001的前提下,认为质量监的前提下,认为质量监督员甲在不在生产现场与产品质量好坏有关系督员甲在不在生产现场与产品质量好坏有关系. .21 500982 17493 8k13.09710.828,990 510 1 475 25【互动探究互动探究】将本题中的产品质量问题改为成绩优秀问题将本题中的产品质量问题改为成绩优秀问题. .某校高三年级在一次全年级的大型考试中,数学成绩优秀和某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中物理、化学、总分也为优秀的人数如下
18、表所非优秀的学生中物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀分别与物理、化学、总分也优秀哪个关示,则数学成绩优秀分别与物理、化学、总分也优秀哪个关系较大?系较大?注:该年级此次考试中数学成绩优秀的有注:该年级此次考试中数学成绩优秀的有360360人,非优秀的有人,非优秀的有880880人人. .【解析解析】(1)(1)列出数学与物理优秀的列出数学与物理优秀的2 22 2列联表列联表将表中数据代入公式将表中数据代入公式 得观测值得观测值k k1 1270.114 3.270.114 3.22n adbcK,abcdac (bd)(2)(2)列出数学与化学优秀的列出数学与化学优秀的2
19、 22 2列联表列联表将表中数据代入公式计算得观测值将表中数据代入公式计算得观测值k k2 2240.611 2.240.611 2.(3)(3)列出数学与总分优秀的列出数学与总分优秀的2 22 2列联表:列联表:将表中数据代入公式计算得观测值将表中数据代入公式计算得观测值k k3 3486.122 5.486.122 5.由上面分析可知,数学成绩优秀分别与物理、化学、总分优由上面分析可知,数学成绩优秀分别与物理、化学、总分优秀都有关系,经计算观测值都大于秀都有关系,经计算观测值都大于6.635,6.635,说明在犯错误的概说明在犯错误的概率不超过率不超过0.010.01的前提下,认为数学优秀
20、分别与物理、化学、的前提下,认为数学优秀分别与物理、化学、总分优秀都有关系,总分优秀都有关系,k k3 3kk1 1kk2 2,与总分关系最大,物理次与总分关系最大,物理次之之. .【典例典例】(12(12分分)(1)(1)下表是某地区的一种传染病与饮用水的下表是某地区的一种传染病与饮用水的调查表:调查表:这种传染病是否与饮用水的卫生程度有关,请说明理由;这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)(2)若饮用干净水得病若饮用干净水得病5 5人,不得病人,不得病5050人,饮用不干净水得病人,饮用不干净水得病9 9人,不得病人,不得病2222人人. .按此样本数据分析这种疾病是否与
21、饮用水有按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异关,并比较两种样本在反映总体时的差异. .【审题指导审题指导】(1)(1)根据表中的信息计算根据表中的信息计算K K2 2的观测值,并根据临的观测值,并根据临界值表来分析相关性的大小,对于界值表来分析相关性的大小,对于(2)(2)要列出要列出2 22 2列联表,方列联表,方法同法同(1).(1).【规范解答规范解答】(1)(1)假设假设H H0 0:传染病与饮用水无关:传染病与饮用水无关. .把表中数据把表中数据代入公式得:代入公式得:K K2 2的观测值的观测值 54.21, 54.21, 3 3分分54.21
22、10.82854.2110.828,所以拒绝,所以拒绝H H0 0. .因此在犯错误的概率不超过因此在犯错误的概率不超过0.0010.001的前提下认为该地区这种传的前提下认为该地区这种传染病与饮用不干净水有关染病与饮用不干净水有关. . 5 5分分283052218466 94k146 684 518 312(2)(2)依题意得依题意得2 22 2列联表:列联表:此时,此时,K K2 2的观测值的观测值 5.785. 5.785. 9 9分分由于由于5.7852.7065.7852.706所以在犯错误的概率不超过所以在犯错误的概率不超过0.10.1的前提下认为该种疾病与饮用的前提下认为该种疾
23、病与饮用不干净水有关不干净水有关. . 1010分分2865 2250 9k14 72 55 31两个样本都能统计得到传染病与饮用不干净水有关这一相同两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但结论,但(1)(1)中在犯错误的概率不超过中在犯错误的概率不超过0.0010.001的前提下肯定结的前提下肯定结论的正确性,论的正确性,(2)(2)中在犯错误的概率不超过中在犯错误的概率不超过0.10.1的前提下肯定的前提下肯定结论的正确性结论的正确性. . 1212分分【误区警示误区警示】对解答本题时易犯错误具体分析如下:对解答本题时易犯错误具体分析如下:【即时训练即时训练】某高校某高
24、校“统计初步统计初步”课程的教师随机调查了一课程的教师随机调查了一些学生的专业情况,得到如下些学生的专业情况,得到如下2 22 2列联表列联表( (单位:名单位:名) ):为了判断主修统计专业是否与性别有关系,根据表中的数据为了判断主修统计专业是否与性别有关系,根据表中的数据计算得到计算得到K K2 2的观测值的观测值k4.84.k4.84.因为因为k3.841k3.841,所以认为,所以认为“主修主修统计专业与性别有关系统计专业与性别有关系”. .这种判断出错的可能性为这种判断出错的可能性为_._.【解析解析】由由k4.84,k4.84,可知我们有可知我们有95%95%的把握认为的把握认为“
25、主修统计专主修统计专业与性别有关系业与性别有关系”,故判断出错的可能性为,故判断出错的可能性为5%.5%.答案答案: :5%5%1.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得数据得“吸烟与患肺癌有关吸烟与患肺癌有关”的结论,并且在犯错误的概率的结论,并且在犯错误的概率不超过不超过0.010.01的前提下认为这个结论是成立的,下列说法中正的前提下认为这个结论是成立的,下列说法中正确的是确的是( )( )(A)100(A)100个吸烟者中至少有个吸烟者中至少有9999人患有肺癌人患有肺癌(B)1(B)1个人吸烟,那么这个人有个人吸
26、烟,那么这个人有99%99%的概率患有肺癌的概率患有肺癌(C)(C)在在100100个吸烟者中一定有患肺癌的人个吸烟者中一定有患肺癌的人(D)(D)在在100100个吸烟者中可能一个患肺癌的人也没有个吸烟者中可能一个患肺癌的人也没有【解析解析】选选D.D.独立性检验的结果与实际问题有差异,即独立独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异存在差异. .2.2.分类变量分类变量X X和和Y Y的列联表如下,则的列联表如下,则( )( )(A)ad-bc(A)ad-bc越小,说明越小,说明X X与与Y Y的关系越弱的关系越弱(B)ad-bc(B)ad-bc越大,说明越大,说明X X与与Y Y的关系越强的关系越强(C)(ad-bc)(C)(ad-bc)2 2越大,说明越大,说明X X与与Y Y的关系越强的关系越强(D)(ad-bc)(D)(ad-bc)2 2越接近于越接近于0 0,说明,说明X X与与Y Y的关系越强的关系越强【解析解析】选选C.C.由由K
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 火力发电厂热经济性评价考核试卷
- 能源零售商的市场分析能力考核试卷
- 矿山开采对空气质量影响评估考核试卷
- 吉林省长春市朝阳区新朝阳实验校2025届初三寒假自主学习综合练习英语试题含答案
- 苏州工业职业技术学院《生物仪器分析》2023-2024学年第二学期期末试卷
- 宁夏工业职业学院《信号与系统》2023-2024学年第二学期期末试卷
- 上海戏剧学院《大学生写作》2023-2024学年第二学期期末试卷
- 江西省宁师中学2025年高三下学期第一次教学诊断物理试题含解析
- 江西农业大学南昌商学院《施工组织》2023-2024学年第二学期期末试卷
- 天津外国语大学《药学细胞生物学实验》2023-2024学年第二学期期末试卷
- GB/T 14388-1993木工硬质合金圆锯片
- 二月份循证护理查房课件
- JJF(湘) 09-2018 纯水-超纯水系统监测仪表(电导率)计量校准规范-(高清现行)
- SJG 82-2020 政府投资学校建筑室内装修材料空气污染控制标准-高清现行
- 大一下【世界古代史】期末复习资料
- 《脂蛋白(a)与心血管疾病风险关系及临床管理的专家科学建议》(2021)要点汇总
- 2004年武汉房地产市场情况分析报告(共23页)
- 肿瘤化学治疗
- 尾矿库筑坝施工组织方案
- 中药斗谱排序
- 空调系统维保记录表格模板
评论
0/150
提交评论