




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE专题5统计与统计案例的交汇1.求线性回来方程的关键是确定回来系数,,应充分利用回来直线过样本点中心(QUOTE,QUOTE),而全部样本点可能都不在直线上.2.依据线性回来方程计算的值,仅是一个预报值,而不是真实发生的值.3.求线性回来方程的关键(1)正确理解计算,的公式和精确计算.(2)在分析两个变量的相关关系时,可依据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回来方程估计和预料变量的值.4.独立性检验的关键(1)依据2×2列联表精确计算K2的观测值k,若2×2列联表没有列出来,要先列出此表.(2)K2的观测值k越大,则两类分类变量有关的把握越大,犯错的概率越小.独立性验证的步骤:(1)列出2×2列联表:留意求出各行各列的总值,便利计算;(2)将表中数据代入K2公式,计算出K2的观测值k;(3)依据k的值参考表格,求出相关的概率;(4)下结论.1.步骤分:(1)相关性系数公式;(2)K2公式.2.关键分:解题过程的关键点,有则给分,无则没分.如选择分层抽样的依据为各个地块物种数量差异性很大.3.计算分:用平均值估计这种野生动物数量的总值,相关系数的求解.4.留意区分分层抽样与简洁随机抽样,如:(1)整体分成了有明显差异的几部分,要选择分层抽样,(2)假如个体的差异不明显,可以选择简洁随机抽样.【典例】(12分)(2024·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简洁随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得QUOTExi=60,QUOTEyi=1200,QUOTE(xi-QUOTE)2=80,QUOTE(yi-QUOTE)2=9000,QUOTE(xi-QUOTE)(yi-QUOTE)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)依据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更精确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=QUOTE,QUOTE≈1.414.(1)该地区这种野生动物数量的估计值⇐样区这种野生动物数量的平均数乘以地块数;(2)样本相关系数⇐相关系数公式;(3)分层抽样方法⇐提高样本数据的代表性⇐各地块间植物覆盖面积差异较大.【标准答案】(1)样区这种野生动物数量的平均数为QUOTEyi=QUOTE×1200=60, 2分地块数为200,该地区这种野生动物数量的估计值为200×60=12000. 4分(2)样本(xi,yi)(i=1,2,…,20)的相关系数为r=QUOTE=QUOTE=QUOTE≈0.94. 8分(3)分层抽样:依据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样,理由如下:由(2)知各地块的这种野生动物的数量与植物覆盖面积有很强的正相关,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异也很大,采纳分层抽样的方法较好地保持了样本结构与总体结构的一样性,提高了样本代表性,从而可以获得该地区这种野生动物数量更精确的估计. 12分测试目标(1)干脆运用公式解决问题;(2)干脆运用相关系数公式解题;(3)通过对分层抽样的理解选择合适的抽样方法.测试目标逻辑推理:依据不同地块的物种差异较大特征选择抽样方法;数据分析:通过平均数求得野生动物数量的估计值;数学运算:运用公式求解相关系数.某地区某农产品近几年的产量统计如表:年份201220132014201520242024年份代码t123456年产量y(万吨)6.66.777.17.27.4(1)依据表中数据,建立关于t的线性回来方程=t+;(2)依据线性回来方程预料2024年该地区该农产品的年产量.(参考数据:QUOTE=2.8,计算结果保留小数点后两位)1.(独立性检验)在新冠肺炎疫情期间,为了指导不同人群科学合理地选择和运用口罩,现对N95口罩的了解状况进行调查.现随机抽取40人进行调查,其中45岁以下的有20人.在接受调查的40人中,对于N95这种口罩了解的占50%,在了解的人中45岁以上(含45岁)的人数占QUOTE.(1)将列联表补充完整;了解不了解总计45岁以下45岁以上(含45岁)总计40(2)推断是否有99%的把握认为对N95这种口罩的了解与否与年龄有关.参考公式:K2=QUOTE,其中n=a+b+c+d.参考数据:P(K2≥k0)0.100.050.0100.001k02.7063.8416.63510.8282.(回来分析)随着智能手机的普及,运用手机上网成为人们日常生活的一部分,许多消费者对手机流量的需求越来越大.长沙某通信公司为了更好地满足消费者对流量的需求,打算推出一款流量包.该通信公司选了5个城市(总人数、经济发展状况、消费实力等方面比较接近)采纳不同的定价方案作为试点,经过一个月的统计,发觉该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如表:流量包的定价x(元/月)3035404550购买人数y(万人)18141085(1)依据表中的数据,运用相关系数进行分析说明,是否可以用线性回来模型拟合y与x的关系?并指出是正相关还是负相关;(2)①求出y关于x的回来方程;②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回来方程预料该市一个月内购买该流量包的人数能否超过20万人.参考数据:QUOTE≈158,QUOTE≈161,QUOTE≈164.3.(独立性检验)2019年12月1日起郑州市施行《郑州市城市生活垃圾分类管理方法》,郑州正式进入城市生活垃圾分类时代.为了增加社区居民对垃圾分类学问的了解,主动参与到垃圾分类的行动中,某社区采纳线下和线上相结合的方式开展了一次200名辖区成员参与的“垃圾分类有关学问”专题培训.为了了解参训成员对于线上培训、线下培训的满足程度,社区居委会随机选取了40名辖区成员,将他们分成两组,每组20人,分别对线上、线下两种培训进行满足度测评,依据辖区成员的评分(满分100分)绘制了如图所示的茎叶图.(1)依据茎叶图推断辖区成员对于线上、线下哪种培训的满足度更高,并说明理由.(2)求这40名辖区成员满足度评分的中位数m,并将评分不超过m、超过m分别视为“基本满足”“特别满足”两个等级.(ⅰ)利用样本估计总体的思想,估算本次培训共有多少辖区成员对线上培训特别满足;(ⅱ)依据茎叶图填写下面的列联表.基本满足特别满足总计线上培训线下培训总计并依据列联表推断能否有99.5%的把握认为辖区成员对两种培训方式的满足度有差异?4.(独立性检验)2024年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了探讨学生在线学习状况,市教研院数学学科随机从市区各中学学校抽取120名学生对线上教学状况进行调查(其中,男生与女生的人数之比为3∶1),结果发觉:男生中有40名对于线上教学满足,女生中有10名表示对于线上教学不满足.(1)请完成如表2×2列联表,并回答能否有95%的把握认为“对线上教学是否满足与性别有关”;看法性别满足不满足总计男生女生总计120(2)采纳分层抽样的方法,从被调查的对线上教学满足的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的阅历介绍,求所选取的2名学生性别不同的概率.5.(回来分析)某电子科技公司由于产品采纳最新技术,销售额不断增长,最近5个季度的销售额数据统计如下表(其中2024Q1表示2024年第一季度,以此类推):季度2024Q12024Q22024Q32024Q42024Q1季度编号x12345销售额y(百万元)4656678696(1)公司市场部从中任选2个季度的数据进行对比分析,求这2个季度的销售额都超过6千万元的概率;(2)求y关于x的线性回来方程,并预料该公司2024Q3的销售额.附:线性回来方程=x+,其中=QUOTE,=QUOTE-QUOTE.参考数据:QUOTExiyi=1183.6.(独立性检验)今年1月至2月由新型冠状病毒引起的肺炎病例陡然增多,为了严控疫情传播,做好重点人群的预防工作,某地区共统计返乡人员100人,其中50岁及以上的共有40人.这100人中确诊的有10名,其中50岁以下的人占QUOTE.确诊患新冠肺炎未确诊患新冠肺炎总计50岁及以上4050岁以下总计10100(1)请将列联表补充完整,并推断是否有95%的把握认为是否确诊患新冠肺炎与年龄有关;(2)现从已确诊的病人中分层抽样抽出5人视察复原状况,若从这5人中随机抽取3人,求恰有2人为50岁及以上的概率.7.(回来分析)某单位响应党中心“精准扶贫”号召,对某村6户贫困户中的甲户进行定点帮扶,每年跟踪调查统计一次,从2015年1月1日至2024年12月底统计数据如下(人均年纯收入):年份2015年2024年2024年2024年年份代码x1234收入y(百元)25283235(1)请依据上表供应的数据,用最小二乘法求出y关于x的线性回来方程=x+,并估计甲户在2024年能否脱贫;(国家规定2024年脱贫标准:人均年纯收入为3747元)(2)2024年初,依据扶贫办的统计知,该村剩余5户贫困户中还有2户没有脱贫,现从这5户中抽取2户,求至少有一户没有脱贫的概率.8.(独立性检验)2011年,国际数学协会正式宣布,将每年的3月14日设为国际数学节,来源是中国古代数学家祖冲之的圆周率,为庆祝该节日,某校举办数学趣味学问竞赛活动,参与竞赛的文科生与理科生人数之比为1∶3,且成果分布在QUOTE,分数在QUOTE,QUOTE分别获二等奖和一等奖.按文理科用分层抽样的方法抽取200人的成果作为样本,得到成果的频率分布直方图.(1)填写下面的2×2列联表,能否有超过95%的把握认为“获奖与学生的文理科有关”?文科生理科生总计获奖5不获奖总计200(2)将上述调查所得的频率视为概率,现从参赛学生中,通过分层抽样的方法从这些获奖人中随机抽取4人,再从这4人中随意选取2人,求2人均获二等奖的概率.专题5统计与统计案例的交汇【模拟考场】【解析】(1)由题意可知:QUOTE=QUOTE=3.5,QUOTE=QUOTE=7,QUOTE=QUOTE+QUOTE+QUOTE+0.52+1.52+2.52=17.5,所以=QUOTE=QUOTE=0.16,又=QUOTE-QUOTE=7-0.16×3.5=6.44,所以y关于t的线性回来方程为=0.16t+6.44.(2)由(1)可得,当年份为2024年时,年份代码t=8,此时=0.16×8+6.44=7.72,所以,可预料2024年该地区该农产品的年产量约为7.72万吨.///高考演兵场·检验考试力///1.【解析】(1)由题意可得对于N95这种口罩了解的人数为40×50%=20,则45岁以上(含45岁)的人对N95这种口罩了解的人数为20×QUOTE=5.故补充列联表如下:了解不了解总计45岁以下1552045岁以上(含45岁)51520总计202040(2)由题意可得,K2的观测值k=QUOTE=10,因为10>6.635,所以有99%的把握认为对N95这种口罩的了解与否与年龄有关.2.【解析】(1)依据题意,得QUOTE=QUOTE=40,QUOTE=QUOTE=11.可列表如下i12345xi-QUOTE-10-50510yi-QUOTE73-1-3-6(xi-QUOTE)(yi-QUOTE)-70-150-15-60依据表格和参考数据,得QUOTE=-160,QUOTE=QUOTE=QUOTE≈161.因而相关系数r=QUOTE=QUOTE≈-0.99.由于QUOTE≈0.99,很接近1,因而可以用线性回来方程模型拟合y与x的关系.由于r<0,故其关系为负相关.(2)①=QUOTE=QUOTE=-0.64,=11+0.64×40=36.6,因而y关于x的回来方程为=-0.64x+36.6.②由①知,若x=25,则=-0.64×25+36.6=20.6>20,故若将流量包的价格定为25元/月,可预料该市一个月内购买该流量包的人数会超过20万人.3.【解析】(1)由茎叶图可知,线上培训的满足度评分在茎7上的最多,关于茎7大致呈对称分布,线下培训的满足度评分分布在茎8上的最多,关于茎8大致呈对称分布,故可以认为线下培训满足度评分比线上培训满足度评分更高,因此辖区成员对线下培训的满足度更高.(2)由茎叶图知m=QUOTE=80.(ⅰ)参与线上培训满足度调查的20名辖区成员中共有6名成员对线上培训特别满足,频率为QUOTE,又本次培训共200名成员参与,所以对线上培训特别满足的成员约有200×QUOTE=60(人).(ⅱ)列联表如下:基本满足特别满足总计线上培训14620线下培训61420总计202040于是K2的观测值k=QUOTE=6.4,由于6.4<7.879,所以没有99.5%的把握认为辖区成员对两种培训方式的满足度有差异.4.【解析】(1)由题意可知抽取的120名学生中男生有90人,女生有30人,则列联表如下:看法性别满足不满足总计男生405090女生201030总计6060120K2的观测值k=QUOTE≈4.4>3.841,则有95%的把握认为“对线上教学是否满足与性别有关”.(2)由分层抽样的性质可知,抽取的6名学生中,男生4人,女生2人,记4名男生分别为a,b,c,d,2名女生分别为A,B,从这6名学生中抽取2名学生的全部状况为:QUOTE,QUOTE,QUOTE,QUOTE,QUOTE,QUOTE,QUOTE,QUOTE,QUOTE,{c,d},{c,A},{c,B},{d,A},{d,B},{A,B},共15种,其中所选取的2名学生性别不同的共有8种,则所选取的2名学生性别不同的概率P=QUOTE.5.【解析】(1)从5个季度的数据中任选2个,这2个季度的销售额有10种状况:(46,56),(46,67),(46,86),(46,96),(56,67),(56,86),(56,96),(67,86),(67,96),(86,96).设“这2个季度的销售额都超过6千万元”为事务A,事务A包含(67,86),(67,96),(86,96),共3种状况.所以P(A)=QUOTE.(2)QUOTE=QUOTE(1+2+3+4+5)=3,QUOTE=QUOTE(46+56+67+86+96)=70.2.=QUOTE=QUOTE=13,所以=QUOTE-QUOTE=31.2.所以y关于x的线性回来方程为=13x+31.2.令x=7,得=13×7+31.2=122.2(百万元).所以预料该公司2024Q3的销售额为122.2百万元.6.【解析】(1)因为100人中确诊的有10名,其中50岁以下的人占QUOTE,所以50岁以下的确诊人数为4,50岁及以上的确诊人数为6.因为50岁及以上的共有40人,列联表补充如下,确诊患新冠肺炎未确诊患新冠肺炎总计50岁及以上6344050岁以下45660总计1090100则K2的观测值k=QUOTE≈1.852<3.841,所以没有95%的把握认为是否确诊患新冠肺炎与年龄有关.(2)现从已确诊的病人中分层抽样抽出5人视察复原状况,则抽取的5人中,有3人50岁及以上,分别记作a,b,c;2人50岁以下,记作d,e.从中任取3人,可能的不同结果有:abc,abd,abe;acd,ace;ade;bcd,bce;bde;cde,共10种不同的状况,恰有两人为50岁及以上的状况有abd,abe,acd,ace,bcd,bce,共6种不同的状况,由于每种状况都是等可能的,所以恰有2人为50岁及以上的概率为QUOTE=QUOT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 政府与非政府组织:公共性之比较
- 呼吸机使用护理
- 头晕的康复治疗体系框架
- 北京2025年北京教育融媒体中心招聘工作人员笔试历年参考题库附带答案详解
- 2025年04月内蒙古鄂尔多斯市康巴什区青年就业见习招募笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025至2031年中国海洋表行业投资前景及策略咨询研究报告
- 2025至2031年中国水动透润按摩膏行业投资前景及策略咨询研究报告
- 2025至2031年中国标准孔板节流装置行业投资前景及策略咨询研究报告
- 2025至2031年中国感应洁具专用线路板行业投资前景及策略咨询研究报告
- 2025至2031年中国底盘焊接流水线行业投资前景及策略咨询研究报告
- GB/T 13384-2008机电产品包装通用技术条件
- 公司劳务派遣人员工资薪酬发放暂行规定
- 建筑大师伊东丰雄简介及作品集课件
- 公司二次经营创效管理实施细则
- BRCGS食品安全全球标准第9版全套程序文件
- 8D改善报告模板
- 2023年福建省高一数学竞赛试题参考答案
- 2023年最新的马季吹牛相声台词
- 婴幼儿上呼吸道感染的护理课件
- 一年级英语下册素材-Unit 1 Lets count!课文翻译 译林版(一起)
- 企业建立高效一体化管理体系文件方案
评论
0/150
提交评论