高中数学选择性必修三 8.3.2 独立性检验_第1页
高中数学选择性必修三 8.3.2 独立性检验_第2页
高中数学选择性必修三 8.3.2 独立性检验_第3页
高中数学选择性必修三 8.3.2 独立性检验_第4页
高中数学选择性必修三 8.3.2 独立性检验_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、83.2独立性检验课标要求素养要求了解随机变量2的意义,通过对典型案例分析,了解独立性检验的基本思想和方法.通过运用列联表进行独立性检验,提升数学抽象及数据分析素养.新知探究山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:问题如何判定“喜欢体育还是文娱与性别是否有联系”?提示可通过表格与图形进行直观分析,也可通过统计分析定量判断 1.临界值2 统计量也可以用来作相关性的度量2 越小说明变量之间越独立,2越大说明变量之间越相关2eq f(n(adbc)2,(ab)(cd)(ac)(bd)).忽略2的实际分布与该近似分布的误差后,对于任何小概

2、率值,可以找到相应的正实数x,使得P(2x)成立我们称x为的临界值,这个临界值就可作为判断2大小的标准2独立性检验基于小概率值的检验规则是:当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立这种利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence)下表给出了2独立性检验中几个常用的小概率值和相应的临界值0.10.050.010.0050.001x2.7063.8416.6357.87910.8283.应用独立性检验解

3、决实际问题的大致步骤(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出22列联表,计算2的值,并与临界值x比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律拓展深化微判断1概率值越小,临界值x越大()2独立性检验的思想类似于反证法()3独立性检验的结论是有多大的把握认为两个分类变量有关系() 微训练1如果根据小概率0.01的2检测试验,认为H0成立,那么具体算出的数据满足()附表:0.050.0250.0100.0050.001x3.8415.0246.6357.87910.828A.26.

4、635 B25.024C27.879 D23.841答案A2某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用22列联表进行独立性检验,经计算27.069,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过()A0.1% B1%C99% D99.9%解析27.0696.635x0.01,认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.答案B微思考1有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺病有关,是指每100个吸烟者中就会有99个患肺病的”你认为这种观点正确吗?为什么?提示观点不正确犯错误的概率不超过0.01说明的是吸烟与患肺病有关的程度,

5、不是患肺病的百分数2应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?提示不一定所有的推断只代表一种可能性,不代表具体情况题型一有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表,用你所学过的知识进行分析,能否在犯错误的概率不超过0.005 的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱合计男生212344女生62935合计275279解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系a21,b23,c6,d29,n79,2eq f(n(adbc)2,(ab)(cd)(ac)(bd))eq f(79(2129236)2,44352752)8.106

6、7.879x0.005.根据小概率值0.005的2独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关系,此推断犯错误的概率不大于0.005.规律方法独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值x.利用公式2eq f(n(adbc)2,(ab)(cd)(ac)(bd))计算2.如果2x,则“X与Y有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”【训练1】打鼾不仅影响别人休息,而且可能与患某种疾病有关下表

7、是一次调查所得的数据:患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾241 3551 379合计541 5791 633根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?解零假设为H0:打鼾与患心脏病无关系由列联表中的数据,得2eq f(1633(301 35522424)2,2541 379541 579)68.03310.828x0.001.根据小概率值0.001的2独立性检验,我们推断H0不成立,即认为打鼾与患心脏病有关系,此推断犯错误的概率不大于0.001.题型二有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关

8、,某同学调查了361名高二在校学生,调查结果如下:理科生对外语有兴趣的有138人,无兴趣的有98人,文科生对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关?解零假设为H0:选报文、理科与对外语的兴趣无关列出22列联表理文合计有兴趣13873211无兴趣9852150合计236125361代入公式得2的观测值2eq f(361(138527398)2,236125211150)1.871104.1.8711042.706x0.1,根据小概率值0.1的2独立性检验,没有充分证据推断H0不成立,即选报文、理科与对外语的兴趣无关.规律方法独立性检验的关注点在22列联

9、表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强【训练2】某教育机构为了研究成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:积极支持教育改革不太赞成教育改革合计大学专科以上学历39157196大学专科以下学历29167196合计68324392对于教育机构的研究项目,根据上述数据能得出什么结论?解零假设为H0:成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度无关根据表中数据,计算得2eq f(392(3916715729)2,19619668324

10、)1.78.因为1.783.841x0.05.根据小概率值0.1的2独立性检验,我们推断H0不成立,即认为“该校学生的每周平均体育运动时间与性别有关”,此推断犯错误的概率不大于0.05.规律方法(1)解答此类题目的关键在于正确利用2eq f(n(adbc)2,(ab)(cd)(ac)(bd))计算2的值,再用它与临界值x的大小作比较来判断假设检验是否成立,从而使问题得到解决(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误

11、的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人解零假设为H0:数学成绩优秀与物理、化学、总分成绩优秀都无关系列出数学成绩与物理成绩的22列联表如下:物理优秀物理非优秀合计数学优秀228132360数学非优秀143737880合计3718691 240将表中数据代入公式,得eq oal(2,1)eq f(1 240(228737132143)2,360880371869)270.110.828x0.001.列出数学成绩与化

12、学成绩的22列联表如下:化学优秀化学非优秀合计数学优秀225135360数学非优秀156724880合计3818591 240将表中数据代入公式,得eq oal(2,2)eq f(1 240(225724156135)2,360880381859)240.610.828x0.001.列出数学成绩与总分成绩的22列联表如下:总分优秀总分非优秀合计数学优秀26793360数学非优秀99781880合计3668741 240将表中数据代入公式,得eq oal(2,3)eq f(1240(2677819399)2,360880366874)486.110.828x0.001.根据小概率值0.001的2

13、独立性检验,我们推断H0不成立,即认为数学成绩优秀与物理、化学、总分成绩优秀都有关系,此推断犯错误的概率不大于0.001.一、素养落地1通过本节课的学习,提升数学抽象及数据分析素养2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算2的值,如果2值很大,说明假设不合理,2越大,两个分类变量有关系的可能性越大二、素养训练1对两个分类变量A,B的下列说法中正确的个数为()A与B无关,即A与B互不影响;A与B关系越密切,则2的值就越大;2的大小是判定A与B是否相关的唯一依据A0 B1 C2 D3解析正确,A与B无关即A与B相互独立;不正确,2的值的

14、大小只是用来检验A与B是否相互独立;不正确,例如借助三维柱形图、二维条形图等故选B.答案B2高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格合计甲班113445乙班83745合计197190则2的观测值约为()A0.600 B0.828C2.712 D6.004解析根据列联表中的数据,可得2eq f(90(1137348)2,45451971)0.600.故选A.答案A3考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据,可得出()A种子是否经过处理

15、跟是否生病有关B种子是否经过处理跟是否生病无关C种子是否经过处理决定是否生病D以上都是错误的解析由2eq f(407(3221361101)2,93314133274)0.1645.024x0.05,根据小概率值0.05的2独立性检验,我们推断H0不成立,即认为文科学生总成绩不好与数学成绩不好有关系,此推断犯错误的概率不大于0.05.基础达标一、选择题1想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A零假设H0:男性喜欢参加体育活动B零假设H0:女性不喜欢参加体育活动C零假设H0:喜欢参加体育活动与性别有关D零假设H0:喜欢参加体育活动与性别无关解析独立性检验假设有反证法的意味,应

16、假设两类变量(而非变量的属性)无关,这时的2应该很小,如果2很大,则可以否定假设,如果2很小,则不能够肯定或者否定假设答案D2某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得26.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是()A90% B95% C99% D99.5%解析由临界值表,得6.0233.841x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.答案B3为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用22列联表进行独立性检验,经计算得27.01,则认为“喜欢乡村音乐与性别有关系”的把握

17、约为()A0.1% B1% C99% D99.9%解析易知27.016.635x0.01,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系答案C4在独立性检验中,两个分类变量“X与Y有关系”的可信度为99%,则随机变量2的取值范围是()A2.706,3.841) B3.841,6.635)C6.635,7.879) D7.879,10.828)解析对照临界值表可知选C.答案C5某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计262450则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过()A0.01

18、B0.025C0.05 D0.001解析由公式得2eq f(50(181589)2,26242723)5.0593.841x0.05.犯错误的概率不超过0.05.答案C二、填空题6在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是_(填序号)若26.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行10

19、0次这样的推断,平均有1次推断错误解析2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填.答案7某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到2eq f(50(1320107)2,23272030)4.8443.841x0.05,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为_解

20、析因为23.841x0.05,所以有95%的把握认为主修统计专业与性别有关,出错的可能性不超过5%.答案5%8世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:不喜欢西班牙队喜欢西班牙队合计高于40岁pq50不高于40岁153550合计ab100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为eq f(3,5),则在犯错误的概率不超过_下认为年龄与西班牙队的被喜欢程度有关附:2eq f(n(adbc)2,(ab)(cd)(ac)(bd)).0.150.100.050.

21、0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828解析设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,由已知得P(A)eq f(q35,100)eq f(3,5),所以q25,p25,a40,b60.2eq f(100(25352515)2,40605050)eq f(25,6)4.1673.841x0.05.故认为年龄与西班牙队的被喜欢程度有关,此推断犯错误的概率不超过5%.答案5%三、解答题9研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的

22、有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断解建立性别与态度的22列联表如下:肯定否定合计男生2288110女生223860合计44126170根据列联表中所给的数据,可求出男生中作肯定态度的频率为eq f(22,110)0.2,女生中作肯定态度的频率为eq f(22,60)0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系零假设为H0:性

23、别和态度没有关系根据列联表中的数据得到2eq f(170(22382288)2,1106044126)5.6225024x0.025.根据小概率值0.025的2独立性检验,我们推断H0不成立,即认为性别和态度有关系,此推断犯错误的概率不大于0.025.10某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表所示:喜欢不喜欢合计大于40岁2052520岁至40岁102030合计302555(1)推断能否在犯错误的概率不大于0.005的情况下认为喜欢“人文景观”景点与年龄有关?(2)用分层随机抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将

24、这6名市民作为一个样本,从中任选2人,求恰有1位大于40岁的市民和1位20岁至40岁的市民的概率解(1)零假设为H0:喜欢“人文景观”景点与年龄无关由公式2eq f(n(adbc)2,(ab)(cd)(ac)(bd))得,211.9787.879x0.005,根据小概率值0.005的2独立性检验,我们推断H0不成立,即认为喜欢“人文景观”景点与年龄有关,此推断犯错误的概率不大于0.005.(2)由题意知抽取的6人中大于40岁的市民有4个,20岁至40岁的市民有2个,分别记为B1,B2,B3,B4,C1,C2,从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,C1)

25、,(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1),(B3,C2),(B4,C1),(B4,C2),(C1,C2),共15个,其中恰有1位大于40岁的市民和1 位20岁至40岁的市民的事件有(B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共8个,所以恰有1位大于40岁的市民和1位20岁至40岁的市民的概率为eq f(8,15).能力提升11(多选题)有两个分类变量X,Y,其列联表如下所示,Y1Y2X1a20aX215a30a其中a,15a均为大于5的整数

26、,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为()A8 B9 C7 D6解析根据公式,得2eq f(65a(30a)(15a)(20a)2,20451550)eq f(13(13a60)2,204532)3.841x0.05,根据a5且15a5,aZ,求得当a8或9时满足题意答案AB12为调查某社区居民的业余生活状况,研究这一社区居民在20:0022:00时间段的休闲方式与性别的关系,随机调查了该社区80人,得到下面的数据表:休闲方式性别看电视看书合计男105060女101020合计206080(1)根据以上数据,能否在犯错误的概率不大于0.01的前提下认为“在20:0022:00时间段居民的休闲方式与性别有关系”?(2)将此样本的频率估计为总体的概率,在该社区的所有男性中随机调查3人,设调查的3人在这一时间段以看书为休闲方式的人数为随机变量X,求X的数学期望和方差解(1)零假设为H0:在20:0022:00时间段居民的休闲方式与性别无关系,根据样本提供的22列联表得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论