2021版高考数学一轮复习 第十一章 统计与统计案例 11.3 相关性、最小二乘估计、回归分析与独立性检验练习 理 北师大版_第1页
2021版高考数学一轮复习 第十一章 统计与统计案例 11.3 相关性、最小二乘估计、回归分析与独立性检验练习 理 北师大版_第2页
2021版高考数学一轮复习 第十一章 统计与统计案例 11.3 相关性、最小二乘估计、回归分析与独立性检验练习 理 北师大版_第3页
2021版高考数学一轮复习 第十一章 统计与统计案例 11.3 相关性、最小二乘估计、回归分析与独立性检验练习 理 北师大版_第4页
2021版高考数学一轮复习 第十一章 统计与统计案例 11.3 相关性、最小二乘估计、回归分析与独立性检验练习 理 北师大版_第5页
免费预览已结束,剩余8页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.3 相关性、最小二乘估计、回归分析与独立性检验核心考点精准研析考点一相关关系的判断1.已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()a.x与y正相关,x与z负相关b.x与y正相关,x与z正相关c.x与y负相关,x与z负相关d.x与y负相关,x与z正相关2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()a.r2r40r3r1b.r4r20r1r3c.r4r20r3r1d.r2r40r1r3【解析】1.选c.由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,随y的减小而减小,所以z随x的增大而减小,x与z负相关.2.选a.由相关系数的定义以及散点图所表达的含义可知r2r40r30时,正相关;b0时,负相关.考点二独立性检验【典例】(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:(1)设两种养殖方法的箱产量相互独立,记a表示事件“旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低于50 kg”,估计a的概率.(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)【解题导思】序号联想解题(1)以频率代替概率,相互独立时交事件概率等于两事件概率的积(2)填入数据,代入2公式计算,与临界值比较(3)中位数把频率分布直方图分为面积相等的两部分【解析】(1)记b表示事件“旧养殖法的箱产量低于50 kg”,c表示事件“新养殖法的箱产量不低于50 kg”.由题意知p(a)=p(bc)=p(b)p(c).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故p(b)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)5=0.66,故p(c)的估计值为0.66.因此,事件a的概率估计值为0.620.66=0.409 2.(2)箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.06852.35(kg).1.在22列联表中,|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成22列联表.(2)根据公式2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)计算.(3)比较2与临界值的大小关系,作统计推断.(2020合肥模拟)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查. 现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的22列联表.并判断能否有95%的把握认为科学类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解析】(1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得22列联表如表:选择自然科学类选择社会科学类合计男生6045105女生304575合计9090180则2=180(6045-3045)2105759090=3675.142 93.841,所以有95%的把握认为科学类的选择与性别有关.考点三回归分析命题精解读1.考什么:(1)考查线性回归方程的求法及运用回归方程进行预测.(2)考查散点图、相关系数等判断两个变量是否相关的方法.(3)考查数学运算、数据分析的核心素养及数形结合等思想方法.2.怎么考:与频率分布表、频率分布直方图、折线图等结合考查回归分析的方法.3.新趋势:以回归分析为载体,与频率分布、概率等交汇命题.学霸好方法1.回归分析方法:(1)利用公式,求出回归系数.(2)利用回归方程进行预测.(3)确定模型是否合适,及时修正.2.交汇问题: 与频率分布直方图、折线图等交汇时,分析图形提供的数据信息,获得计算相关系数、回归系数等需要的数据,最后计算比较.线性回归方程及其应用【典例】现代社会,“鼠标手”已成为常见病,一次实验中,10名实验对象进行160分钟的连续鼠标点击游戏,每位实验对象完成的游戏关卡一样,鼠标点击频率平均为180次/分钟,实验研究人员测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率等指标.(1)10 名实验对象实验前、后握力(单位:n)测试结果如下:实验前:346,357,358,360,362,362,364,372,373,376实验后:313,321,322,324,330,332,334,343,350,361完成茎叶图,并计算实验后握力平均值比实验前握力的平均值下降了多少n?(2)实验过程中测得时间t(分)与10名实验对象前臂表面肌电频率的中值频率y(hz)的九组对应数据(t,y)为(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),(120,76),(140,77),(160,75).建立y关于时间t的线性回归方程;(3)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(2)中9组数据分析,使用鼠标多少分钟就该进行休息了?参考数据:i=19(ti-t)(yi-y)=-1 800;参考公式:回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为:b=i=1n(ti-t)(yi-y)i=1n(ti-t)2,a=y-bt.【解析】(1)根据题意得到茎叶图如图所示:由图中数据可得x1=110(346+357+358+360+362+362+364+372+373+376)=363,x2=110(313+321+322+324+330+332+334+343+350+361)=333,所以x1-x2=363-333=30(n),所以实验后比实验前握力的平均值下降30n.(2)由题意得t=19(0+20+40+60+80+100+120+140+160)=80,y=19(87+84+86+79+78+78+76+77+75)=80,i=19(ti-t)2=(0-80)2+(20-80)2+(40-80)2+(60-80)2+(80-80)2+(100-80)2+(120-80)2+(140-80)2+(160-80)2=24 000,又i=19(ti-t)(yi-y)=-1 800,所以b=i=19(ti-t)(yi-y)i=19(ti-t)2=-1 80024 000=-0.075,所以a=y-bt=80-(-0.075)80=86,所以y关于时间t的线性回归方程为y=-0.075t+86.(3)九组数据中40分钟到60分钟y的下降幅度最大,提示60分钟时肌肉已经进入疲劳状态,故使用鼠标60分钟就该休息了.相关系数及其应用【典例】科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如表:x(年龄/岁)26273941495356586061y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据表中的数据得到如图的散点图.(1)根据表中的样本数据及其散点图.(i)求x;(ii)计算样本相关系数(精确到0.01),并刻画它们的相关程度.(2)若y关于x的线性回归方程为y=1.56+bx,求b的值(精确到0.01),并根据回归方程估计年龄为50岁时人体的脂肪含量.附:参考数据:y-=27,i=110xiyi=13 527.8,i=110xi2=23 638,i=110yi2=7 759.6,436.56,2 93554.18,参考公式:相关系数r=i=1nxi-x-yi-y-i=1nxi-x2i=1nyi-y2=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.【解析】(1)根据表中的样本数据及其散点图:()x=26+27+39+41+49+53+56+58+60+6110=47.()r=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2=13 527.8-10472723 638-104727 759.6-10272=13 527.8-12 69023 638-22 0907 759.6-7 290=837.81 548469.6=8 37864342 935.因为436.56,2 93554.18,所以r0.98.由样本相关系数r0.98,可以推断人体脂肪含量和年龄的相关程度很强.(2)因为回归方程为y=1.56+bx,即a=1.56.所以b=y-ax=27-1.56470.54.【或利用b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2=837.81 5480.54】所以y关于x的线性回归方程为y=0.54x+1.56.将x=50代入线性回归方程得y=0.5450+1.56=28.56.所以根据回归方程估计年龄为50岁时人体的脂肪含量为28.56%.非线性回归分析【典例】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到如图散点图及一些统计量的值. xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)(yi-y)i=18(wi-w)(yi-y)46.65636.8289.81.61.469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?【解析】(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程,由d=i=18(wi-w)(yi-y)i=18(wi-w)2=108.81.6=68.得c=y-dw=563-686.8=100.6.所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x.(3)由(2)知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,年利润z的预报值z=576.60.2-49=66.32.根据(2)的结果知,年利润z的预报值z=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.1.已知两个随机变量x,y之间的相关关系如表所示:x-4-2124y-5-3-1-0.51根据上述数据得到的回归方程为y=bx+a,则大致可以判断()a.a0,b0b.a0,b0c.a0d.a0,b0,a0.2.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a,已知i=110xi=225,i=110yi=1 600,b=4.该班某学生的脚长为24,据此估计其身高为()a.160b.163c.166d.170【解析】选c.由题意可知y=4x+a,又x=22.5,y=160,因此160=22.54+a,解得a=70所以y=4x+70.当x=24时,y=424+70=166.3.某市春节期间7家超市广告费支出xi(万元)和销售额yi(万元)数据如表:超市abcdefg广告费支出xi1246111319销售额yi19324044525354(1)若用线性回归模型拟合y与x的关系,求y与x的线性回归方程.(2)若用二次函数回归模型拟合y与x的关系,可得回归方程:y=-0.17x2+5x+20,经计算,二次函数回归模型和线性回归模型的r2分别约为0.93和0.75,请用r2说明选择哪个回归模型更合适,并用此模型预测a超市广告费支出3万元时的销售额.参考数据:x=8,y=42,i=17xiyi=2 794,i=17xi2=708.参考公式:b=i=1nxiyi-nx yi=1nxi2-nx2,a=y-bx.【解析】(1)b=i=17xiyi-7x yi=17xi2-7x2=2 794-7842708-782=1.7.所以a=y-bx=42-1.78=28.4,故y关于x的线性回归方程是y=1.7x+28.4.(2)因为0.750.93,所以二次函数回归模型更合适.当x=3时,y=33.47.故选择二次函数回归模型更合适,并且用此模型预测a超市广告费支出3万元时的销售额为33.47万元.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论