高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修12.doc_第1页
高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修12.doc_第2页
高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修12.doc_第3页
高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修12.doc_第4页
高中数学 第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教A版选修12.doc_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 统计案例 1.2独立性检验的基本思想及其初步应用课时作业 新人教a版选修1-2明目标、知重点1.了解分类变量的意义.2.了解22列联表的意义.3.了解随机变量k2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表称为列联表22列联表一般地,假设有两个分类变量x和y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为下表.y1y2总计x1ababx2cdcd总计acbdabcd2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系3独立性检验(1)定义:利用随机变量k2来判断“两个分类变量有关系”的方法称为独立性检验(2)k2,其中nabcd为样本容量(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.利用公式计算随机变量k2的观测值k.如果kk0,就推断“x与y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“x与y有关系”,或者在样本数据中没有发现足够证据支持结论“x与y有关系”情境导学5月31日是世界无烟日有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手这些疾病与吸烟有关的结论是怎样得出的呢?探究点一列联表和等高条形图思考1举例说明什么是分类变量?答变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等思考2什么是列联表?怎样从列联表判断两个分类变量有无关系?答一般地,假设有两个分类变量x和y,它们的取值分别为x1,x2和y1,y2,则两个变量的频数表,称为列联表(如下图)y1y2总计x1ababx2cdcd总计acbdabcd|adbc|越小,说明两个分类变量x、y之间的关系越弱;|adbc|越大,说明两个分类变量x、y之间的关系越强思考3等高条形图对分析两个分类变量是否有关系,有何帮助?答通过画等高条形图,我们可以直观观察两个变量的比例关系,判断两个变量是否有关系例 1 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病根据这些数据能否断定“患呼吸道疾病与吸烟有关”?(用列联表和等高条形图说明)解(1)作出列联表如下:患病未患病总计吸烟37183220不吸烟21274295总计58457515在吸烟的人中,有16.82%的人患病,在不吸烟的人中,有7.12%的人患病由上可以看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”(2)画出等高条形图如下:通过上面的等高条形图可以直观看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”反思与感悟利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大跟踪训练1在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561 000根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的探究点二独立性检验思考1利用列联表及等高条形图判断两个分类变量是否有关有什么优缺点?答优点:比较直观缺点:缺少精确性和可靠性思考2随机变量k2有何作用?答利用随机变量k2(其中nabcd为样本容量)可以来确定在多大程度上可以认为“两个分类变量有关系”思考3独立性检验的基本思想是什么?答独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下,用我们构造的随机变量k2的观测值应该很小,如果由观测数据计算得到的k2的观测值很大,则在一定程度上说明假设不合理,根据随机变量k2的含义,可以通过p(k26.635)0.01来评价假设不合理的程度,由实际计算出k26.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.例 2 在某医院,因为患心脏病而住院的665名男性病人中有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?解(1)根据题目所给的数据画出列联表:患心脏病患其他病总计秃顶214175389不秃顶4515971 048总计6657721 437相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”(2)根据列联表中的数据,得到k16.3736.635,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系反思与感悟(1)利用随机变量k2进行独立性检验的步骤:根据实际问题需要的可信度确定临界值k0;根据给出数据计算得出随机变量k2的观测值k;如果kk0,就认为在犯错误的概率不超过的前提下,认为两变量有关系;否则,认为两个分类变量没有关系(2)独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认跟踪训练2为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134总计56283339吸烟习惯与患慢性气管炎是否相关?试用独立性检验的思想说明理由解根据列联表的数据得到k2的观测值:k7.4696.635,所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”1观察下列各图,其中两个分类变量x,y之间关系最强的是()答案 d2下面是一个22列联表:y1y2总计x1a2173x282533总计b46则表中a、b处的值分别为()a94,96 b52,50c52,60 d54,52答案c解析a2173,a52,ba852860.3经过对k2的统计量的研究,得到了若干个临界值,当k2的观测值k3.841时,我们()a在犯错误的概率不超过0.05的前提下可认为a与b有关b在犯错误的概率不超过0.05的前提下可认为a与b无关c在犯错误的概率不超过0.01的前提下可认为a与b有关d没有充分理由说明事件a与b有关系答案a4根据下表计算:不看电视看电视男3785女35143k2的观测值k_.(保留3位小数)答案4.514解析k4.514.呈重点、现规律1列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量k2的值,如果k2值很大,说明假设不合理k2越大,两个分类变量有关系的可能性越大一、基础过关1下面说法正确的是()a统计方法的特点是统计推断准确、有效b独立性检验的基本思想类似于数学上的反证法c任何两个分类变量有关系的可信度都可以通过查表得到d不能从等高条形图中看出两个分类变量是否相关答案b2用独立性检验来考察两个分类变量x与y是否有关系,当统计量k2的观测值()a越大,“x与y有关系”成立的可能性越小b越大,“x与y有关系”成立的可能性越大c越小,“x与y没有关系”成立的可能性越小d与“x与y有关系”成立的可能性无关答案b3在一个22列联表中,由其数据计算得k2的观测值k7.097,则这两个变量间有关系的可能性为()a99% b99.5%c99.9% d无关系答案a解析k2的观测值6.635k7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关6如果k2的观测值为6.645,可以认为“x与y无关”的可信度是_答案1%解析查表可知可信度为1%.7.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:分数段29404150516061707180819091100午休考生人数23473021143114不午休考生人数1751671530173(1)根据上述表格完成列联表:及格人数不及格人数总计午休不午休总计(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?解(1)根据题表中数据可以得到列联表如下:及格人数不及格人数总计午休80100180不午休65135200总计145235380(2)计算可知,午休的考生及格率为p1,不午休的考生的及格率为p2,则p1p2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态二、能力提升8在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()a.与 b.与c.与 d.与答案c解析由等高条形图可知与的值相差越大,|adbc|就越大,相关性就越强9考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据,可得出()a种子是否经过处理跟是否生病有关b种子是否经过处理跟是否生病无关c种子是否经过处理决定是否生病d以上都是错误的答案b解析由k0.1643.841,我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错11.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”下表是一次针对高三文科学生的调查所得数据,试问:在出错概率不超过0.025的前提下,能否判断“文科学生总成绩不好与数学成绩不好有关系”?总成绩不好总成绩好总计数学成绩不好47812490数学成绩好39924423总计87736913解依题意,计算随机变量k2的观测值:k6.2335.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”12.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长下表是性别与吃零食的列联表:男女总计喜欢吃零食51217不喜欢吃零食402868总计454085请问喜欢吃零食与性别是否有关?解k,把相关数据代入公式,得k4.7223.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”三、探究与拓展13在某校对有心理障碍学生进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论