2023版高考数学一轮复习讲义:第十一章统计与统计案例_第1页
2023版高考数学一轮复习讲义:第十一章统计与统计案例_第2页
2023版高考数学一轮复习讲义:第十一章统计与统计案例_第3页
2023版高考数学一轮复习讲义:第十一章统计与统计案例_第4页
2023版高考数学一轮复习讲义:第十一章统计与统计案例_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成套的课件成套的教案成套的试题尽在高中数学同步资源大全QQ群483122854联系QQ309000116加入百度网盘群2500G一线老师必备资料一键转存,自动更新,一劳永逸第一节随机抽样、用样本估计总体·最新考纲·1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.3.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.4.理解样本数据标准差的意义和作用,会计算数据标准差.5.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.6.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.7.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.·考向预测·考情分析:简单随机抽样、系统抽样、分层抽样在高考中极少单独考查,有时与概率问题相结合出现在题目的已知条件中;频率分布直方图、茎叶图等统计图表属于高考的常考内容,题型多为选择题,有时也与概率相结合出现在解答题中.学科素养:通过随机抽样、统计图表、数字特征考查数据分析、数学运算的核心素养.积累必备知识——基础落实赢得良好开端一、必记5个知识点1.简单随机抽样(1)抽取方式:逐个不放回地抽取.(2)特点:每个个体被抽到的概率相等.(3)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.4.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.5.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a1+a2+…+ann称为a1,a2(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是s=1ns2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2二、必明2个常用结论1.必记结论(1)众数的估计值是最高矩形底边中点的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边小矩形的面积和是相等的.2.常用公式(1)若数据x1,x2,…,xn的平均数是x,则mx1+a,mx2+a,…,mxn+a的平均数是mx+a.(2)若数据x1,x2,…,xn的方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2,标准差为as.三、必练4类基础题(一)判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性较大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()(二)教材改编2.[选修3·P64习题T5改编]某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁及50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33B.25,56,19C.20,40,30D.30,50,203.[必修3·P71练习T1改编]如图所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是________.(三)易错易混4.(忽视系统抽样中可以先剔除部分个体)某学校为了解高一年级1203名学生对某项教改试验的意见,打算从中抽取一个容量为40的样本,若采用系统抽样,则分段间隔为________.5.(方差的性质不熟致误)若数据x1,x2,x3,…,xn的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.(四)走进高考6.[2021·全国甲卷]为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间提升关键能力——考点突破掌握类题通法考点一抽样方法[基础性]1.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13A.14B.13C.52.[2022·漳州质检]某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,…,799,800,从中抽取80名进行调查,下面提供随机数表的第4行到第6行:322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324377892345若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是()A.007B.253C.328D.7363.[2022·蚌埠模拟]某市小学,初中,高中在校学生人数分别为7.5万,4.5万,3万.为了调查全市中小学生的体质健康状况,拟随机抽取1000人进行体质健康检测,则应抽取的初中生人数为()A.750B.500C.450D.300反思感悟1.应用随机数法的两个关键点(1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.2.解决分层抽样的常用公式先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.(1)抽样比=样本容量总体容量=各层样本容量(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.考点二统计图表及应用[基础性、应用性、创新性]角度1扇形图[例1][全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半听课笔记:角度2折线图[例2]空气质量指数AQI是反映空气状况的指数,AQI指数值越小,表明空气质量越好,其对应关系如下表:AQI指数0~5051~100101~150151~200201~300>300空气质量优良轻度污染中度污染重度污染严重污染下图是某市10月1日~20日AQI指数变化趋势,则下列叙述不正确的是()A.这20天中AQI指数值的中位数略高于100B.这20天中的中度污染及以上的天数占1C.该市10月的前半个月的空气质量越来越好D.总体来说,该市10月上旬的空气质量比中旬的好听课笔记:角度3茎叶图[例3][2022·广东广雅中学、江西南昌二中联考]某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是()A.10B.11C.12D.13听课笔记:角度4频率分布直方图[例4][2022·长沙市统一模拟考试]某学校对本校高三500名学生的视力进行了一次调查,随机抽取了100名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四组的频数成等差数列,则估计本校高三这500名学生中视力在4.8以上(含4.8)的人数为()A.185B.180C.195D.200听课笔记:反思感悟(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(4)准确理解频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.【对点训练】1.已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为()A.240,18B.200,20C.240,20D.200,182.[2022·德州模拟]港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100km/h,现对大桥某路段上1000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90km/h的频率分别为()A.300,0.25B.300,0.35C.60,0.25D.60,0.353.某院校教师情况如下表所示:类别年度老年中年青年男女男女男女202012060240120100402021210403202002001202022300150400270320280关于2020年、2021年、2022年这3年该院校的教师情况,下面说法不正确的是()A.2021年男教师最多B.该校教师最多的是2022年C.2021年中年男教师比2020年多80人D.2020年到2022年,该校青年年龄段的男教师人数增长率为220%4.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业者岗位分布条形图,则下列结论中不正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多考点三用样本的数字特征估计总体的数字特征[应用性、创新性][例5][2020·全国卷Ⅰ]某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级ABCD频数40202020乙分厂产品等级的频数分布表等级ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?听课笔记:反思感悟利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【对点训练】[2021·全国甲卷]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和(1)求x,(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y−x≥2微专题38读取统计图表中的数据数据分析数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.[例][2022·武汉调研测试]某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.请根据图中信息,求本次抽查的学生中A类人数是()A.30B.40C.42D.48解析:由条形统计图知,B—自行乘车上学的有42人,C—家人接送上学的有30人,D—其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A—结伴步行上学的有x人,由扇形统计图知,A—结伴步行上学与B—自行乘车上学的学生占60%,所以x+42x+90=60100,解得答案:A名师点评本例由条形图可以读出频数,由扇形图可读出频率,从而问题即可解决.第十一章统计与统计案例第一节随机抽样、用样本估计总体积累必备知识三、1.答案:(1)√(2)×(3)√(4)√(5)√(6)√2.解析:因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.答案:B3.解析:因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]内的频数为0.3×100=30.答案:304.解析:∵1203除以40不是整数,∴先随机的去掉3个人,再除以40,得到每一段有30个人,则分段的间隔为30.答案:305.解析:∵x1,x2,x3,…,xn的平均数为5,∴x1∴3x1+3x2+3x3+…+3xnn+1=3×5+1=16,∵∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.答案:16186.解析:对于A:根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1=0.06,正确;对于B:根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1=0.10,正确;对于C:根据频率分布直方图知该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),错误;对于D:根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10+0.14+0.20+0.20)×1=0.64,正确.答案:C提升关键能力考点一1.解析:根据题意,9n−1=13,解得n=28.故在整个抽样过程中每个个体被抽到的概率为1028答案:C2.解析:由题意知,前五名员工的编号依次为253,313,457,736,007.答案:A3.解析:初中生抽取的人数为10007.5+4.5+3×答案:D考点二例1解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%×2a=74%a增加A错其他收入4%a5%×2a=10%a增加一倍以上B对养殖收入30%a30%×2a=60%a增加了一倍C对养殖收入+第三产业收入(30%+6%)a=36%a(30%+28%)×2a=116%a超过经济收入2a的一半D对答案:A例2解析:A项,由题图知排序后第10个数据、第11个数据的平均数大于100,即中位数略高于100;B项,中度污染及以上的天数为5天,占14答案:C例3解析:∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,∵乙组学生成绩的中位数是89,∴n=9,∴m+n=12.答案:C例4解析:由题意得频率分布直方图前三组的频率依次为0.03,0.07,0.27,所以前三组的频数依次为3,7,27,则后四组的频数和为90,又后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18,所以视力在4.8以上(含4.8)的频率为39%,故本校高三这500名学生中视力在4.8以上(含4.8)的人数约为500×39%=195.答案:C对点训练1.解析:样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.答案:A2.解析:由频率分布直方图得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1000=300,行驶速度超过90km/h的频率为(0.05+0.02)×5=0.35.答案:B3.解析:由题意知,2022年的男教师最多,A错误;将表中各年度人数横向求和可知,2022年共有1720人,为人数最多的一年,B正确;2021年中年男教师比2020年多320-240=80(人),故C正确;2020~2022青年男教师增加了220人,增长率为220÷100×100%=220%,D正确.答案:A4.解析:由饼状图可知互联网从业人员中90后占56%,一半以上,故A项正确;由条形图知,90后从事技术岗位的人数占互联网行业为39.6%×56%=22.176%>20%,所以互联网行业中从事技术岗位的人数占总人数的百分比大于等于22.176%,B项正确;由条形图知,90后从事运营岗位的人数占互联网行业为17%×56%=9.52%,大于80前互联网从业人数,C项正确;因为技术所占比例80后未知,且90后从事技术岗位的人数比22.176%<41%,所以D项不一定正确.答案:D考点三例5解析:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100乙分厂加工出来的一件产品为A级品的概率的估计值为28100(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润6525-5-75频数40202020因此甲分厂加工出来的100件产品的平均利润为65×由数据知乙分厂加工出来的100件产品利润的频数分布表为利润70300-70频数28173421因此乙分厂加工出来的100件产品的平均利润为70×比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.对点训练解析:(1)由表格中的数据易得:x=−0.2+0.3+0+0.2−0.1−0.2+0+0.1+0.2−0.310y=0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.510+10.0=s12=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2(2)由(1)中数据可得y−x=10.3-10.0=0.3,而2S12+S

第二节变量间的相关关系、统计案例·最新考纲·1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).3.了解独立性检验的思想、方法,并能初步应用独立性检验的思想方法解决一些简单的实际问题.4.通过典型案例了解回归分析的思想方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题.·考向预测·考情分析:两个变量线性相关的判断及应用,回归直线方程的求法及应用,利用2×2列联表判断两个变量的相关关系将是高考考查的热点,题型将是选择与填空题或者在解答题中综合考查.学科素养:通过线性回归分析及独立性检验的应用考查数学建模、数据分析、数学运算的核心素养.积累必备知识——基础落实赢得良好开端一、必记3个知识点1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为y=bx+a,其中b=i=1nxiyi−nxy(4)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)K2统计量K2=n(ad−bc)二、必明3个常用结论1.求解回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本中心点(x,y).2.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.3.根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.三、必练4类基础题(一)判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)回归直线方程y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()(二)教材改编2.[必修3·P90例题改编]某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x681012y2356则y对x的线性回归直线方程为()A.y=2.3x-0.7B.y=2.3x+0.7C.y=0.7x-2.3D.y=0.7x+2.33.[选修2-3·P86例2改编]两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25(三)易错易混4.(回归方程的概念不清)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是________.(填序号)①y与x具有正的线性相关关系;②回归直线过样本点的中心(x,y);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.5.(忽视回归直线方程过样本点中心)在一次考试中,5名学生的数学和物理成绩如下表(已知学生的数学和物理成绩具有线性相关关系):学生的编号i12345数学成绩x8075706560物理成绩y7066686462现已知其线性回归方程为y=0.36x+a,则根据此线性回归方程估计数学得90分的同学的物理成绩为________分.(四舍五入取整数)(四)走进高考6.[2020·全国卷Ⅰ]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx提升关键能力——考点突破掌握类题通法考点一相关关系的判断eq\a\vs4\al([基础性])1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关2.某公司在2019年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,则()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系3.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④反思感悟)判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:b>0时,正相关;b<0时,负相关.考点二回归分析eq\a\vs4\al([综合性、应用性、创新性])角度1线性回归方程及其应用[例1]某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1000名,每名用户赠送1000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):x1020304050y0.790.590.380.230.01(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有eq\i\su(i=1,5,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=-19.2,其中eq\o(x,\s\up6(-))=eq\f(1,5)eq\i\su(i=1,5,x)i,eq\o(y,\s\up6(-))=15eq\i\su(i=1,5,)yi听课笔记:(反思感悟)求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出x,y,x12+x22+…+xn2,x1y1+x2y2+(2)计算回归系数a,b;(3)写出线性回归方程y=bx+a角度2相关系数及其应用[例2][2020·全国卷Ⅱ]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))2=80,eq\i\su(i=1,20,)(yi-eq\o(y,\s\up6(-)))2=9000,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=eq\f(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))2\i\su(i=1,n,)(yi-\o(y,\s\up6(-)))2)),eq\r(2)≈1.414.听课笔记:反思感悟)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.角度3非线性回归方程[例3]某购物商场分别推出支付宝和微信“扫码支付”购物活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用“扫码支付”.现统计了活动刚推出一周内每天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:x1234567y611213466101196(1)根据散点图判断,在推广期内,扫码支付的人次y关于活动推出天数x的回归方程适合用y=c·dx来表示,求出该回归方程,并预测活动推出第8天使用扫码支付的人次;(2)推广期结束后,商场对顾客的支付方式进行统计,结果如下表:支付方式现金会员卡扫码比例20%50%30%商场规定:使用现金支付的顾客无优惠,使用会员卡支付的顾客享受8折优惠,扫码支付的顾客随机优惠,根据统计结果得知,使用扫码支付的顾客,享受7折优惠的概率为16,享受8折优惠的概率为13,享受9折优惠的概率为参考数据:设vi=lgyi,eq\o(v,\s\up6(-))=eq\f(1,7)eq\i\su(i=1,7,v)i≈1.52,eq\i\su(i=1,7,x)i·vi≈49.56,100.52≈3.31参考公式:对于一组数据(u1,v1),(u2,v2),…(un,vn),其回归直线eq\o(v,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(β,\s\up6(^))·u的斜率和截距的最小二乘估计公式分别为:eq\o(β,\s\up6(^))=i=1nuivi−nuv)i=1nui2−nu2,反思感悟回归分析问题的类型及解题方法(1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.②利用公式,求出回归系数b③待定系数法:利用回归直线过样本点的中心求系数a.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数b.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.【对点训练】1.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据,根据表中数据可得回归方程y=bx+a其中b=11据此估计,当投入6万元广告费时,销售额约为()x12345y1015304550A.60万元B.63万元C.65万元D.69万元2.某公司为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.表中ui=eq\f(1,xi),eq\o(u,\s\up6(-))=eq\f(1,8)eq\i\su(i=1,8,u)i(1)根据散点图判断:y=a+bx与y=c+dx(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(结果精确到0.01);(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80000元?(假设能够全部售出,结果精确到1)附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线v=α+βω的斜率和截距的最小二乘估计分别为β=i=1n(ωi−ω考点三独立性检验[应用性、创新性][例4][2021·全国甲卷]甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad-P(K2≥k)0.0500.0100.001k3.8416.63510.828听课笔记:反思感悟)独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算K(3)查表比较K2与临界值的大小关系,作统计判断.[2022·湖南长沙模拟]为了解某校学生参加社区服务的情况,采用按性别分层抽样的方法进行调查,已知该校共有学生960人,其中男生560人,从全校学生中抽取了容量为n的样本,得到一周参加社区服务时间的统计数据如表所示.超过1小时的人数不超过1小时的人数男208女12m(1)求m,n的值;(2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关?附:P(K2≥k)0.0500.0100.001k3.8416.63510.828K2=n(ad-bc)2第二节变量间的相关关系、统计案例积累必备知识三、1.答案:(1)√(2)×(3)×(4)√2.解析:易求x=9,y=4,样本点的中心(9,4)代入验证,满足y=0.7x-2.3.答案:C3.解析:在两个变量y与x的回归模型中,它们的相关指数R2越接近1,拟合效果越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.答案:A4.解析:由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项①中的结论正确;回归直线过样本点的中心,选项②中的结论正确;根据回归直线斜率的意义易知选项③中的结论正确;由于回归分析得出的是估计值,故选项④中的结论不正确.答案:④5.解析:x=60+65+70+75+805=70,y=62+64+66+68+705=66,所以66=0.36×70+a,得a=40.8,即线性回归方程为y=0.36x+40.8.当x=90时,y=0.36×90+40.8=73.2答案:736.解析:观察散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象.答案:D提升关键能力考点一1.解析:由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.答案:C2.解析:月收入的中位数是15+172=16,收入增加,支出增加,故x与y答案:C3.解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.答案:D考点二例1解析:(1)由x=30,y=0.4,i=15得b=i=15(xi-xa=y-bx所以y关于x的回归直线方程为y=-0.0192x+0.976.(2)能把保费x定为5元.理由如下:若保费x定为5元,则估计y=-0.0192×5+0.976=0.88,估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为2000000×0.88×5-2000000×0.88×0.5%×800-1000×1000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论