考点43 独立性检验_第1页
考点43 独立性检验_第2页
考点43 独立性检验_第3页
考点43 独立性检验_第4页
考点43 独立性检验_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计个案了解独立性检验的基本思想、方法及其简单应用,可以解决一些实际问题1 .清单设x、y为2个变量,各自的值为和,其采样频率列表(列表)如下合计a.a乙组联赛甲组联赛c.cd.d光盘合计美国广播公司乙组联赛2 .独立性检查利用随机变量(在此也可表现为样本容量)判断“两个变量相关”的方法称为独立性检查。三.独立性检验的一般程序(1)根据样本数据列出列联结表(2)计算随机变量的观测值k,调查下表确定阈值k0(3)如果推测“x和y有关系”,如果这个推测不超过犯错误的概率,那么只要不超过犯错误的概率,就不能推测“x和y有关系”【注意】(1)通常,样本数据中没有充分证明“x和y有关系”。(2)独立性检验得出的结论具有概率性质,只能说结论成立的概率有多大,一个结论不能完全肯定,因此出现阈值表,分析问题时必须注意这一点。 不能在某个问题上得出确定的结论。 否则,可能会误解统计计算的结果。(3)独立性检查不是判断两个变量是否有关系,而是判断是否有关系。考虑判断一两类变量的相关性知道分类变量的数据,判断两类变量的相关性。 可以根据数据和公式进行计算和判断典型例1利用独立性检查来检查与2个分类变量是否有关系时,参照下表来决定“有关系”的可靠度。 如果是这样的话,认为“有关系”的比例A. B .C. D【回答】d本问题独立性检查的应用是基础问题,与根据给出的观测值给出的阈值表的数据比较,在观测值表中与5.024对应的是0.025,得到结果.在典型例2中,发现看太多电视容易变得冷漠。 下表是调查机构对这一现象的调查结果附表:看手机被认为与人的冷漠有关的把握是A. B .C. D【回答】a【名士点眼】本题主要意味着考察独立性检查,了解学生学习知识的水平和解决实际问题的能力。 把给定的数据代入求独立性检查的观测值的公式中,求观测值,将观测值与独立性检查的阈值表进行比较,求得的值大于10.828,99.9 %的把握与看电视人们不感兴趣有关1 .为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取60名高中生进行问卷调查,获得以下数据作文成绩优秀作文成绩一般合计课外阅读量大221032课外阅读量很平常82028合计303060根据以上数据计算出的观测值根据阈值表,如下正确附带:P(K2k0)0.500.400.250.150.100.050.050.0100.005k00.4550.7081.3232.0722.7063.8415.0246.6357.879a .样本数据中没有充分发现“作文成绩优秀,课外阅读量大”的证据b .以犯错误的概率不超过0.001为前提,作文成绩优秀与课外阅读量大有关系c .在犯错误的概率不超过0.05的前提下,我们认为作文成绩优秀与课外阅读量大有关系d .在犯错误的概率不超过0.005的前提下,我们认为作文成绩优秀与课外阅读量大有关考虑二独立性检验与概率统计的整合独立性检验是统计案例,是高考命题的热点,多以答题的形式出现,问题难易度低,多为中级问题,高考多将独立性检验和概率统计结合起来进行命题,解题要点是根据独立性检验的一般程序来判断,根据概率统计的相关知识来解题。典型例3某中学对高三、乙班进行了“加强语文阅读理解”训练“提高数学应用问题”得分率的作用”考试。 其中,甲班为考试班(强化语文阅读理解训练),乙班为比较班(通常教育,无追加训练),考前考试中,甲、乙班学生在数学应用问题上的得分率基本一致,考试结束后,数学应用问题考试的平均成绩(均取整数)如下表所示。现在平均成绩在80分以上(不含80分)的被规定为优秀(一)分别估计两个班的优秀率;(2)以上统计数据填表,加强“语文阅读理解”训练,对提高“数学应用问题”得分率有帮助吗?参考表达式和数据:其中【回答】(1)甲、乙两班的优秀率分别为和(2)表并列分析,没有自信加强“语文阅读理解”的训练有助于提高“数学应用问题”的得分率(2)列表如下:因为参考资料显示,加强“语文阅读理解”训练对提高“数学应用问题”得分率没有信心2 .高中生在“家,朋友聚集的地方,个人空间”这3个地方中“最幸福的地方是哪里? ”被问道。 针对这个问题,从中国某城市的高中生中随机抽取了55人,从美国某城市的高中生中随机抽取了45人进行了回答。 中国高中生的解答状况,选择家庭的人聚集的地方占据着,个人空间占据着。 美国高中生的解答状况,朋友聚集的地方占据,家占据,个人空间占据。 下表:我是家里最幸福的人在别的地方快乐合计中国高中生美国高中生合计(1)完全补充清单,试着判断“恋家”是否与国家有关(2)从调查的非“恋家”的美国学生中,以分层抽样的方式选择4人进一步接受调查,再从4人中随机抽出2人到中国交流学习,求出2人中有“个人空间”幸福学生的概率。附:其中0.0500.0250.0100.0013.8415.0246.63510.8281 .看图中高度的条形图,其中最能把握的是两个分类变量x、y之间的关系A. B .C. D2 .在研究爆心与心脏病的关系过程中,通过收集数据并整理分析数据,得出了“爆心与心脏病有关”的结论,比这个结论成立更有信心A.100名心脏病患者中至少有99人喝醉了b .一个人患心脏病,这个人有99%的概率喝醉了c.100名心脏病患者中一定有人喝醉了在100名心脏病患者中,可能没有一个人喝醉了3 .已知的两个统计个案如下:为了探讨肺炎和吸烟的关系,对年龄以上的人进行了调查,结果如下表所示患肺炎我没有得肺炎合计吸烟43162205不抽烟13121134合计56283339为了解某母女身高的关系,如下表随机测量了10对母女的身高母亲的身高(cm )159160160163159154159158159157女儿的身高(cm )158159160161161155162157162156应用于处理这些数据的统计方法A.回归分析,平均值B.独立性检查,回归分析C.回归分析,独立性检查D.独立性检查,取平均值4 .在某个村庄,调查该村的50名老年人,年轻人是否每年接受健康检查,将统计数据表示在表中每年做体检每年都没有接受体检合计老年人7年轻人6合计50已知抽取的老年人、年轻人各有25名。 完成以上的清单数据是错误的A. B .C. D5 .为了了解某班学生是否喜欢打篮球,对本班的人进行了问卷调查,得到了下表我喜欢打篮球我讨厌篮球合计男生女学生合计参考公式:其中阈值表:根据表格的数据,我认为喜欢篮球和性别有关系的是A.B .C.D6 .为了普及环境保护知识,提高环境保护意识,某大学从理工科专业的a班和文史部专业的b班分别抽取了20名学生参加了环境保护知识测试。 统计了成绩和专业名单优秀不优秀合计a类14620b类71320合计211940附件:参考公式和数据:(1)统计量:其中(2)独立性检查的阈值表:P(K2k0)0.0500.010k03.8416.635以下的说法是正确的a .环境保护知识测试的成绩与专业有关,有99%的把握b .环境保护知识测验成绩与专业无关,有99%把握c .环保知识测试成绩与专业有关,有95%的自信d .环保知识测验成绩与专业无关,95%自信7 .假设有两个分类变量的列连接表合计合计对于同一样本,以下数据显示了相关可能性最高的组A.B .C.D参考式:其中8 .某学校为了判断高中三年级学生是否与文科有性别关系,现随机抽取50名学生,获得如下表格理科文科合计男人131023女人72027合计203050根据表的数据,现在得出了“选择句系和性别的关系”的结论,推测这样的判断几乎有可能是错误的A. B .C. D9 .有的学校在学校门口上学,到学校结束为止,为了制定家长迎接孩子停车混乱的措施,对全校的家长进行了问卷调查。 根据从其中随机抽取的50份问卷调查,得到了以下列表同意区域限定停车我不同意区域限定停车合计男人20525女人101525合计302050“区域限定停车是否同意与父母的性别有关”的把握约为_ _ _ _ _ _ _ _ _ _附:其中0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6357.87910.82810 .已知下列命题:在线性回归模型中,相关指数表示解释变量对预报变量的贡献率,越接近1,回归效果越好两个变量的相关性越强,相关系数的绝对值越接近1回归直线方程中,解释变量每增加1单位,预报变量平均减少0.5单位分类变量和这些随机变量观测值越小,有关系的把握度越大.其中正确命题的编号是.11 .清华大学要求2017级学生游泳达到一定标准毕业的消息在体育界和教育界引起很大反响。 实际上,把游泳作为必修内容的高中很多。 某中学计划在高中一学期开设游泳选修课,为了了解高中一年级学生游泳是否与性别有关,该学校对100名高中一年级学生进行了问卷调查,得到了下表:我喜欢游泳我讨厌游泳合计男生40女学生30合计这100人中随机抽取1人,抽取喜欢游泳的学生的概率(1)补充上述清单,判断你是否喜欢游泳,以免犯错误的概率超过0.001(2)被调查的学生中,高一(1)班来的6人喜欢游泳,现在从这6个学生中随机抽出2人,正好有1人要求喜欢游泳的概率附带:0.100.0500.0250.0100.0050.0012.7063.8415.0246.6357.87910.82812 .随着资本市场的发展,互联网共享自行车“一夜如春风来”,蔓延到二线城市的小巷。 为了解共享自行车在市场的使用情况,某调查机构通过网络进行问卷调查,从参加调查的网民中抽取200人进行样本分析,得到了表:(单位:人)。经常使用不偶尔用合计三十岁以下7030100三十岁以上6040100合计13070200(1)以上数据显示,只要犯错误的概率不超过0.15,市里使用共享自行车的情况与年龄有关吗?(2)现在从抽取的30岁以上的网民中,利用分层抽样方法再抽取5人(I )分别寻求这5人中经常使用的、偶尔不分享自行车的人数;(ii )从这5人中进一步随机选择2人作为礼物,求出选择的2人中至少1人共享自行车的概率。参考式:其中参考数据:0.150.100.050.0250.0102.0722.706

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论