备战2022年高考数学二轮复习培优专题 第18讲统计与统计案例_第1页
备战2022年高考数学二轮复习培优专题 第18讲统计与统计案例_第2页
备战2022年高考数学二轮复习培优专题 第18讲统计与统计案例_第3页
备战2022年高考数学二轮复习培优专题 第18讲统计与统计案例_第4页
备战2022年高考数学二轮复习培优专题 第18讲统计与统计案例_第5页
已阅读5页,还剩13页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十八讲统计与统计案例A组选择题1.某书法社团有男生30名,女生20名,从中抽取一个5人的样本,恰好抽到了2名男生和3名女生①该抽样一定不是系统抽样;②该抽样可能是随机抽样;③该抽样不可能是分层抽样;④男生被抽到的概率大于女生被抽到的概率,其中说法正确的为()A.①②③B.②③C.③④D.①④【答案】B【解析】由题意得,从男生名,女生名,从中抽取一个人的样本,恰好抽到了名男生和名女生,该抽样应该是简单的随机抽样,其中男生被抽到的概率为,女生被抽到的概率为,所以只有②③是正确的,故选B.2.如下图所示的茎叶图记录了甲、乙两组各名学生在一次英语听力测试中的成绩(单位:分)。已知甲组数据的中位数为,乙组数据的平均数为,则的值分别为()A.B.C.D.【答案】C【解析】由中位数的定义可知,因,故,应选C。3.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的结果,认为成立的可能性不足1%,那么的一个可能取值为()A.7.897B.6.635C.5.024D.3.841【答案】A【解析】由题这种血清能起到预防感冒的作用为99%的有效率,显然所以选A.4.下列说法正确的是()A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线至少经过其样本数据点中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数为的模型比相关指数为的模型拟合的效果差【答案】C【解析】A.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况。错误;B.线性回归方程对应的直线,过其样本数据平均数点,错误;D.相关指数越大,则相关性越强,模型的拟合效果越好。错误;C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高.正确。填空题5.甲、乙、丙三名射击运动员在某次测试中各射击20次,三人的测试成绩如下表甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664分别表示甲、乙、丙三名运动员这次测试成绩的平均数,则的大小关系为

;分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则的大小关系为

.【答案】;6.某班有55人,现根据学生的学号,用系统抽样的方法,抽取一个容量为5的样本,已知3号、25号、47号同学在样本中,那么样本中还有两个同学的学号分别为和。【答案】14和36解答题7.某生产企业对其所生产的甲、乙两种产品进行质量检测,分别各抽查10件产品,检测其重量的误差,测得数据如下(单位:):甲:131514149142191011乙:101491152123192216(Ⅰ)画出样本数据的茎叶图,并指出甲,乙两种商品重量误差的中位数;(Ⅱ)计算甲种商品重量误差的样本方差;(Ⅲ)根据茎叶图分析甲、乙两种产品的质量.【解析】茎叶图如图.甲,乙两种商品重量误差的中位数分别为,.(Ⅱ).∴甲种商品重量误差的样本方差为=11.6(Ⅲ)由茎叶图知,乙产品的重量误差的中位数高于甲产品的重量误差的中位数,而且由茎叶图可以大致看出乙产品的重量误差的的标准差要大于甲产品的重量误差的的标准差,说明甲产品的质量较好,而且较稳定.8.某工厂36名工人的年龄数据如下表:工人编号年龄工人编号年龄工人编号年龄工人编号年龄140244340441533640745842943103611311238133914431545163917381836192720432141223723342442253726442742283429393043313832423353343735493639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的平均值和方差;(3)求这36名工人中年龄在内的人数所占的百分比.【解析】(1)根据系统抽样的方法,抽取容量为9的样本,应分为9组,每组4人.由题意可知,抽取的样本编号依次为:2,6,10,14,18,22,26,30,34,对应样本的年龄数据依次为:44,40,36,43,36,37,44,43,37.(2)由(1),得,.(3)由(2),得,∴,由表可知,这36名工人中年龄在内共有23人,所占的百分比为.9.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请在图中画出上表数据的散点图;(2);(3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力。【解析】(1)如图所示.(2)=6×2+8×3+10×5+12×6=158,=62+82+102+122=344,,=4-0.7×9=-2.3,故线性回归方程为=0.7x-2.3.(3)由回归直线方程,当x=9时,=6.3-2.3=4,所以预测记忆力为9的同学的判断力约为4.10.2016年全国两会,即中华人民共和国第十二届全国人民代表大会第四次会议和中国人民政治协商会议第十二届全国委员会第四次会议,分别于2016年3月5日和3月3日在北京开幕.为了解哪些人更关注两会,某机构随机抽取了年龄在岁之间的100人进行调查,并按年龄绘制的频率分布直方图如下图所示,其分组区间为:.把年龄落在区间和内的人分别称为“青少年人”和“中老年人”,经统计“青少年人”与“中老年人”的人数之比为9:11.(1)求图中的值;(2)若“青少年人”中有15人在关注两会,根据已知条件完成下面的列联表,根据此统计结果能否有99%的把握认为“中老年人”比“青少年人”更加关注两会?关注不关注合计青少年人15中老年人合计5050100附参考公式:,其中.临界值表:0.050.0100.0013.8416.63510.828【解析】(1)依频率分布直方图可知:,解之,得,(2)依题意可知:“青少年人”共有人,“中老年人”共有100-45=55人,完成的列联表如下:关注不关注合计青少年人153045中老年人352055合计5050100结合列联表的数据得:因为,所以有超过99%的把握认为“中老年人”比“青少年人”更加关注两会B组选择题1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为()A、3B、4C、5D、6【答案】B【解析】根据茎叶图中的数据得,成绩在区间[139,151]上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间[139,151]上的运动员应抽取(人),故选B.2.从实验小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为()A.3B.25C.30D.35【答案】C【解析】由图知,(0.035+a+0.020+0.010+0.005)×10=1,解得a=0.03∴身高在[120,130]内的学生人数在样本的频率为0.03×10=0.3故身高在[120,130]内的学生人数为0.3×100=303.已知与之间的一组数据:012335.57已求得关于与的线性回归方程为,则的值为()A.1B.0.85C.0.7D.0.5【答案】D【解析】因,故将其代入,可得.应选D.4.在一次独立性检验中,得出2×2列联表如下:y1y2合计x12008001000x2180m180+m合计380800+m1180+m最后发现,两个分类变量x和y没有任何关系,则m的可能值是()A.200B.720C.100D.180【答案】B【解析】由独立性检验,已知使两个分类变量无关,则可得;填空题5.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是.【答案】.【解析】设图中从左到右的第1小组的频率为,则第2小组的频率为,第3小组的频率为,由频率分布直方图的性质,得:,解得:,第2小组的频率为,又已知第2小组的频数为12,报考飞行员的学生人数是:.故答案应填:.6.某村有2500人,其中青少年1000人,中年人900人,老年人600人,为了调查本村居民的血压情况,采用分层抽样的方法抽取一个样本,若从中年人中抽取36人,从青年人和老年人中抽取的个体数分别为,则直线上的点到原点的最短距离为___________.【答案】【解析】,因此直线上的点到原点的最短距离为解答题7.今年的西部决赛勇士和雷霆共进行了七场比赛,经历了残酷的“抢七”比赛,两队的当家球星库里和杜兰特七场比赛的每场比赛的得分如下表:第一场第二场第三场第四场第五场第六场第七场库里26282422312936杜兰特26293326402927(1)绘制两人得分的茎叶图;(2)分析并比较两位球星的七场比赛的平均得分及得分的稳定程度.【解析】(1)如图(2)库里的平均得分分方差.杜兰特的平均得分分方差.∴,则这七场比赛库里的平均得分低于杜兰特,但库里的得分更稳定一些.8.100名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.(1)估计这100名学生的数学成绩落在[50,60)中的人数;(2)求频率分布直方图中a的值;(3)估计这次考试的中位数(结果保留一位小数).【解析】(1)由图可知落在[50,60)的频率为0.01×10=0.1由频数=总数×频率,从而得到该范围内的人数为100×0.1=10.(2)由频率分布直方图知组距为10,频率总和为1,可列如下等式:(0.01+0.015+0.03++0.01+a)×10=1解得a=0.035.(3)前两个小矩形面积为0.01×10+0.015×10=0.25.第三个小矩形的面积为0.035×10=0.35∵中位数要平分直方图的面积.9.甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校分组[70,80)[80,90)[90,100)[100,110)频数34815分组[110,120)[120,130)[130,140)[140,150]频数1532乙校分组[70,80)[80,90)[90,100)[100,110)频数1289分组[110,120)[120,130)[130,140)[140,150]频数10103甲校乙校总计优秀非优秀总计(1)计算,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)根据以上统计数据完成2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.【解析】(1)甲校抽取110×60人,乙校抽取110×=50人,故x=10,y=7,(2)估计甲校优秀率为,乙校优秀率为=40%.(3)表格填写如图,甲校乙校总计优秀152035非优秀453075总计6050110k2=≈2.83>2.706又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异.10.下表提供了甲产品的产量(吨)与利润(万元)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(2)计算相关指数的值,并判断线性模型拟合的效果.参考公式:,【解析】(1)∴,,∴,∴∴关于的线性回归方程(2)∴∴线性模型拟合的效果较好C组选择题1.某学校高一、高二、高三年级分别有720、720、800人,现从全校随机抽取56人参加防火防灾问卷调查.先采用分层抽样确定各年级参加调查的人数,再在各年级内采用系统抽样确定参加调查的同学,若将高三年级的同学依次编号为001,002,…,800,则高三年级抽取的同学的编号不可能为()A.001,041,……761B.031,071,……791C.027,067,……787D.055,095,……795【答案】D【解析】由根据分层抽样可得高三年级抽取出20人,利用系统抽样可分成40组得到的数据特征应成等差数列,经计算答案中的数据不是的整数倍,因此这组数据不合系统抽样得到的,故应选D.2.已知一组数据的平均数是,方差是,那么另一组数据的平均数,方差是()A.B.C.D.【答案】D【解析】因为数据的平均数是,方差是,所以,因此数据的平均数为:,方差为:.3.已知关于某设备的使用年限(单位:年)和所支出的维修费用(单位:万元)有如下的统计资料,由上表可得线性回归方程,若规定当维修费用时该设备必须报废,据此模型预报该设备使用年限的最大值为()A.7B.8C.9D.10【答案】C【解析】由已知表格得:,,由于线性回归直线恒过样本中心点,所以有:,解得:,所以线性回归方程,由得:解得:,由于,所以据此模型预报该设备使用年限的最大值为9.故选C.4.在一次实验中,采集到如下一组数据:-2.0-1.001.002.003.000.240.5112.023.988.02则的函数关系与下列()类函数最接近(其中为待定系数)A.B.C.D.【答案】B【解析】由表格数据逐个验证,观察图象,类似于指数函数,分析选项可知模拟函数为y=a+bx.故选B.填空题5.一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,9,要用(错位)系统抽样的方法抽取一个容量为8的样本,即规定先在第1组随机抽取一个号码,记为,依次错位地得到后面各组的号码,即第组中抽取个位数为(当)或(当)的号码,在时,所抽到的第8组的号码是.【答案】73【解析】第1组抽取号码为,第8组抽取号码为6.给出下列命题:①线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量和的数据得到其回归直线方程,则一定经过点;③从匀速传递的产品生产流水线上,质检员每分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位,其中真命题的序号是.【答案】②④⑤【解析】线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱,故①错;回归直线方程一定经过样本中心点,所以②正确;③的抽样方式为系统抽样,故③错;由在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方。显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好,故④正确;由回归直线方程可知,当解释变量每增加一个单位时,预报变量增加个单位的解释是正确的,故⑤正确;所以正确的序号为②④⑤。解答题7.偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,在某次考试成绩统计中,某老师为了对学生数学偏差(单位:分)与物理偏差(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差20151332-5-10-18物理偏差6.53.53.51.50.5-0.5-2.5-3.5(1)若与之间具有线性相关关系,求关于的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.参考数据:【解析】(1)由题意,,,,所以,故线性回归方程为,(2)由题意,设该同学的物理成绩为,则物理偏差为:.而数学偏差为128-120=8,∴,解得,所以,可以预测这位同学的物理成绩为94分8.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生数学成绩的平均分;(3)若这100名学生数学成绩某些分数段的人数(x)与物理成绩相应分数段的人数(y)之比如下表所示,求物理成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5【解析】(1)由频率分布直方图知:(2a+0.02+0.03+0.04)×10=1,解得a=0.005(2)由频率分布直方图知这100名学生数学成绩的平均分为:55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知数学成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为:0.005×10×10=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知物理成绩在上述各分数段的人数依次为:5,40×=20,30×=40,20×=25.故物理成绩在[50,90)之外的人数为100-(5+20+40+25)=109.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位:人).核专家为了检测当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论