2021人教版高中数学同步a版选修2-3(理科必考)模块练习题-回归分析的基本思想及其初步应用_第1页
2021人教版高中数学同步a版选修2-3(理科必考)模块练习题-回归分析的基本思想及其初步应用_第2页
2021人教版高中数学同步a版选修2-3(理科必考)模块练习题-回归分析的基本思想及其初步应用_第3页
2021人教版高中数学同步a版选修2-3(理科必考)模块练习题-回归分析的基本思想及其初步应用_第4页
2021人教版高中数学同步a版选修2-3(理科必考)模块练习题-回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计案例3.1回归分析的基本思想及其初步应用

基础过关练题组一线性回归分析1.(2019河北保定高二期末)在判断两个变量y与x是否相关时,选择了4个不同的模型来进行模拟,这4个模型的相关指数R2分别为0.25、0.50、0.98、0.80,则其中拟合效果最好的模型是( )A.模型1B.模型2C.模型3D.模型42.(2019安徽六安一中高二期末)有一散点图如图所示,去掉图中的D(3,10)后,下列说法正确的是()X *£(10J2)•叩10)工科⑸♦HR,4)A.残差平方和变小B.方差变大C.相关指数R2变小D.解释变量x与预报变量y的相关性变弱3.(2019山西阳高一中高二下学期期末)在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所收集的数据绘制散点图.若根据可靠性要求能够得出变量x,y具有线性相关的结论,则下列操作顺序正确的是()A.①②⑤③④ B.③②④⑤①C.②④③①⑤ D.②⑤④③①4.(2020黑龙江齐齐哈尔第八中学高二月考)某产品在某零售摊位的零售价y(单位:元)与每天的销售量x(单位:个)的统计数据如下表所示:x 16 17 18 19y 50 34 41 31由表可得回归直线方程吴晟+£中的力=-4,据此模型预测当零售价为20元时,每天的销售量为()A.26个B.27个C.28个D.29个5.(2019黑龙江哈尔滨六中高二上学期期末)下列命题中,正确的是()A.在回归方程吴0.5x-85中,当变量x=200时,变量y的值一定是15B.两个变量相关性越强,则相关系数r就越接近于1C.在残差图中,残差点比较均匀地落在水平的带状区域中,即可说明选用的模型比较合适,与带状区域的宽度无关D.在回归方程吴0.2x+12中,解释变量x每增加一个单位,预报变量夕就增加0.2个单位6.(2019陕西商洛高二期末)已知变量x,y之间的一组数据如下表所示,若求得y关于x的线性回归方程为》=0.82x+1.27,则下列说法错误的是()y0.8m3.1 4.3A.变量x,y之间呈正相关关系B.可以预测当x=5时,吴5.37C.该回归直线必过点(1.5,2.5)D.m的值为2.097.(2019黑龙江哈尔滨三中高二上期中)下列命题中错误的是()A.样本数据的方差越小,则数据的离散程度越小B.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高C.相关系数r满足|r|W1且"|越接近于1,线性相关程度越强,|r|越接近于0,线性相关程度越弱D.相关指数越小,回归直线拟合效果越好8.(2019黑龙江齐齐哈尔高二下学期期末)某种产品的广告费支出x与销售额y之间的数据如下表(单位:万元):x24568y3040605070若已知y关于x的线性回归方程为》=6.5x+17.5,那么当广告费支出为5万元时,随机误差的效应(残差)为万元(残差二真实值-预报值)( )A.40B.30C.20D.109.(2019广东阳江高二开学考试)珠海市某学校的研究性学习小组对昼夜温差(一天内最高温度与最低温度的差)的大小与绿豆种子一天内的出芽数之间的关系进行了研元该小组4月记录了1日至6日每天的昼夜最高、最低温度(如图1,单位:℃)以及浸泡的100粒绿豆种子当天内的出芽数(如图2).已知绿豆种子出芽数y和温差x之间具有线性相关关系.⑴求绿豆种子出芽数y关于温差x的回归方程吴晟+Q(2)假如4月1日至7日的昼夜温差的平均值为10℃,估计4月7日浸泡的2000粒绿豆种子一天内的出芽数.n£(勺友)(y1n£(勺友)(y1五)i=i n£(%--%)21=1£xtyt-nxyi=i n人_,a=y-bx.£x2-nx2.i1=110.(2019河北唐山高二期末)随着智能手机的普及,各类手机娱乐软件也如雨后春笋般涌现.下表中统计的是某手机娱乐软件自2018年8月初推出后至2019年4月底的月新注册用户数,记月份代码为t(t=1对应2018年8月份,t=2对应2018年9月份,……,t=9对应2019年4月份),月新注册用户数为y(百万).t123456789y3.23.84.34.75.66.47.98.69.5(1)请依据上表的统计数据,判断月新注册用户数y与月份t的线性相关性的强弱;⑵求出月新注册用户数y关于月份t的线性回归方程,并预测2020年5月份的新注册用户数.9 9参考数据:£tiyi=318.5,£y2=364.2,V67^8.2.i=i11 i=iTOC\o"1-5"\h\zn_ n人E(t,--t)(y,--y)Et-y--nty人人回归直线的斜率和截距公式:b%,以=二, ,a=y-bT.n_ n_E(中)2 Et2-nt21=1 1=1n_相关系数r= m(当|r|N0.75时,认为两变量的相关性E(q工)2E(yt-y)27i=ii=i很强).11.(2019广东中山一中等七校联合体高三第二次联考)下图是我国2010年至2016年生活垃圾无害化处理量(单位:亿吨)的折线图.无裳处那量,无裳处那量,注:年份代码1~7分别对应年份2010〜2016.⑴由折线图可知,可用线性回归模型拟合y与t的关系,请求出相关系数r,并用相关系数的大小说明y与t相关性的强弱(当|r|三0.75时,认为两变量的相关性很强);

⑵建立y关于t的回归方程(系数精确到0.01),预测2020年我国的生活垃圾无害化处理量.7 7 7参考数据:Xyi=10.97,Ztiyi=47.36,^Z(-)2=0.664,^7^=1 =1 =12.646.参考公式:X(-)(X(-)(于相关系数r==1 -X-X= =1 =1 ^X(-)2X(-)2MX(-)2X(-)2=1 =1 =1 =1回归直线y=a+bt中斜率和截距的最小二乘估计公式分别为X(-)(-)-== ,二一—X(-)2=1题组二非线性回归分析12.(2019河南开封高二期中)已知变量x与y的相关数据如下表所示,且变量y关于X的回归方程为二ebx-0.5.yee3 e4 e6若x=5,则y的值可能为()A.e5B.e11C.e7D.e1513.某工厂每日生产一种产品x(xN1)吨,每日生产的产品当日销售完毕,日销售额为y万元,产品价格随着产量变化而有所变化,经过一段时间的产销,得到了x,y的一组统计数据,如下表:日产量x(吨)12345日销售额y(万512161921元)(1)请判断y=bx+a与y=dlnx+c中,哪个模型更适合刻画x,y之间的关系,并从函数增长趋势方面给出简单的理由;⑵根据你的判断及下面的数据和公式,求出y关于x的回归方程,并估计当日产量x=6时,日销售额是多少.(结果保留整数)n八八八八Ex-y-mx•歹八八参考公式:线性回归方程y=bx+a中"=』2―1,a=y-b工E%?-n%2i=i1参考数据:1n11n21n31n41n5 ^0.96,5ln1+12ln2+16ln3+19ln4+521ln5弋86,ln6^1.8,(ln1)2+(ln2)2+(ln3)2+(ln4)2+(ln5)2弋6.2.

能力提升练一、选择题1.(2019山东日照莒县第二中学高考模拟,★★☆)变量x,y的相关数据如散点图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程吴,x+4,相关系数为rj方案二:剔除点(10,21),根据剩下的数据得到线性回归方程员工x+a2,相关系数为「,则()砂2010A.0<r<r<1A.0<r<r<1B.0<r<r<1C.-1<r<r<0D.-1<r<r<02.(2019福建莆田高二期末,★★☆)某同学将收集到的六组数据(x,y)(i=1,2,3,4,5,6)制作成如图所示的散点图,并通过计算得到其回归直线」的方程为吴0.68x+£,其相关系数为.相关指数为R2.经过残差分析确定点F为“离群点”(对应残差过大的点),把它去掉后,再利用剩下的五组数据计算得到其回归直线l的方程为y=bx+0.68,其相关系数为,相关指数为号,以下结论中不正确的是()A.r>0,r>0B.僭>伍1 2 12人 人C.a=0.12 D.0<b<0.683.(2019四川眉山高考模拟,★★☆)已知变量x与y线性相关,由观测数据算得样本的平均奴=3,y=4,线性回归方程吴晟+£中的系数b,£满足力-a=2,则线性回归方程为()A.y=-x+7 B.y=Tx-3C.y=x+1 D.y=3xT.(2019山西原平范亭中学高二月考,★★☆)将指数曲线y=aebx进行线性变换后得到的回归方程为。=1-0.6x,则函数y=x2+bx+a的单调递增区间为()A.(0,+8)B.(巨,+8)C.g+C.g+8)D.(1,+8)二、填空题.(2019河南南阳中学高二月考,★★☆)某企业节能降耗技术改造后,在生产某产品的过程中记录了产量x(吨)与相应的生产能耗y(吨)的几组数据,如下表所示:y2.5 3 4a若根据表中数据得出y关于x的线性回归方程为夕=0.7x+0.35,则表中a的值为.三、解答题.(2019河南林州第一中学高二上学期开学考试,★★☆)一台还可以用的机器由于使用的时间较长,按不同的转速生产出来的部分机械零件会有缺陷,每小时生产有缺陷零件的数量会随机器转速的变化而变化,下表为抽样试验结果:转速x(转/秒) 16 14 12 8每小时生产有缺陷11 9 8 5零件的数量y(件)(1)画出散点图;⑵如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多为10件,则机器的转速应控制在什么范围内?7.(2019山东青岛高三调研检测,★★☆)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y(单位:十)表示每天使用扫码支付的人次,统计数据如下表所示:x1234567y6 11213466101196根据以上数据,绘制了如下图所示的散点图.⑴根据散点图判断,在推广期内,丫=a+bx与y=c•dx(c,d均为大于零的常数)哪一个更适合作为扫码支付的人次y关于活动推出天数x的回归方程类型(给出判断结果即可,不必说明理由);

⑵根据⑴的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:7ZXVlOo.54iii=l62.141.62.141.5450.12 3.477其中v=lgy,v=-Ev.i 17ii=l参考公式:对于一组数据(U,v),(u,v), (u,v),其回归直线v=a+Bu的斜率和截距的最小二乘估计公式分别为nAEu-v--nui7AAB=r ,a=v-pu.Eu?-nu2i=i18.(2019福建泉州高二期末,★★☆)旅游业作为一个第三产业,时间性和季节性非常强,每年11月份来临,全国各地就相继进入旅游淡季,很多旅游景区就变得门庭冷落.为改变这种局面,某旅游公司借助一自媒体平台做宣传推广,销售特惠旅游产品.该公司统计了活动刚推出一周内产品的销售数量,用x表示活动推出的天数,y表示产品的销售数量(单位:百件),统计数据如下表所示,并绘制了如图所示的散点图.x1234567y3 812183664113根据已有的函数知识,发现样本点分布在指数型函数y=ebx+的图象的周围.为求出该回归方程,相关人员确定的研究方案是先用其中5个数据建立y关于x的回归方程,再用剩下的2个数据进行检验.试回答下列问题:5⑴现令t=lny,若选取的是表格中的前5个数据,已知£ti=8ln1=152+6ln3,£xiti=26ln2+22ln3,请求出t关于x的线性回归方程(结i=11果保留一位有效数字);⑵若由回归方程得到的估计数据与选出的检验数据的误差均不超过10,则认为得到的回归方程是可靠的,试问⑴中所得的回归方程是否可靠?参考公式及数据:对于一组数据(xjy^Nx/y),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计公式分别为TOC\o"1-5"\h\zn nb二…空金竺二花 晟;ln2-0.69,ln3E.10;e-n n ,£(xt-x)2 £%2-nx21=1 1=1166.7,e4.8弋121.5.答案全解全析基础过关练.C相关指数的绝对值越接近1,拟合效果越好,故选C..A由散点图可知,去掉D(3,10)后,y与x的线性相关性加强,且为正相关,所以相关系数r变大,相关指数R2变大,残差平方和变小,故选A..D进行线性回归分析一般经历以下几个过程:首先对相关数据进行收集,再根据收集到的数据作出散点图,根据散点图作出线性相关或非线性相关或不相关的判断,然后进行相关系数的计算,以确定相关程度大小,这样可以提高回归分析的可信度,最后求出回归方程并结合方程说明其实际意义.故选D..D由题表得X=16171819—=17.5,y=50344;31—=39「・'回归直线必过样本点的中心(无,y),・••将(元,历代入回归直线方程中,得39=-4X7.5+2,解得£=109,・••该回归直线方程为吴-4x+109.当x=20时,吴一4X20+109=29.故选D..D在回归方程吴0.5x-85中,当变量x=200时,得到的15只是变量y的一个预报值,故A不正确;两个变量相关性越强,则相关系数r的绝对值就越接近于1,故B不正确;在残差图中,残差点比较均匀地落在水平的带状区域中,带状区域的宽度越窄,拟合效果越好,故C不正确;显然D正确.故选D..D对于选项A,因为线性回归方程为》=0.82x+1.27,其中0.82>0,所以变量x,y之间呈正相关关系,故A中说法正确;对于选项B,当x=5

时,吴0.82X5+1.27=5.37,故B中说法正确;对于选项C,由题表中数据可得,无二制一=1.5,因为回归直线必过点(居y),所以穴0.82X1.5+1.27=2.5,故C中说法正确;对于选项D,即3”3—=2.5,解得4m=1.8,故D中说法错误.故选D..D相关指数越小说明残差平方和越大,则回归直线拟合效果越差.故选D..D二、关于x的线性回归方程为吴6.5x+17.5,・,•当x=5时,吴50.当广告费支出为5万元时,由题表中数据知y=60,故随机误差的效应(残差)为60-50=10(万元).故选D..解析(1)由题图可得如下数据:(7,23),(8,26),(12,37),(9,31),(13,40),(11,35),故元二781291311=10y=232637314035=326£(x-元)(y-y)=(-3)X(-9)+(-2)X(-6)+2X5+(-1)2+3X8+1Xii1=13=77,6£(x-元)2=(-3)2+(-2)2+22+(-1)2+32+12=28,ii=1n二匚2;£n二匚2;£(勺①⑶厂历

所以炉工 n£(々①2

i=i=77=11,a=y-^T=32-11X10=9,28442所以绿豆种子出芽数y关于温差x的回归方程为》=^+9.42(2)因为4月1日至7日的昼夜温差的平均值为10℃,所以4月7日的温差x7=7X10-60=10℃,所以当x=10时3与10+|=32,所以4月7日浸泡的2000粒绿豆种子一天内的出芽数的估计值为22100X2000=640..解析⑴由题表得L1*(1+2+3+…+9)=5,ylX9 9⑶2+3.8+4.3+…+9.5)=6,9£t?=12+22+32+^+92=285,1i=199£(ti-t)•(y.-y)=Sty-9Tyi=1 1 i=111TOC\o"1-5"\h\z9 9=318.5-9X5X6=48.5,£(q-02£(y.-y)2、i=1 i=199=(£4-9产)(£y2-9y2)、i=1 i=1=(285-9*25)(364.2-9*36)N_=667弋49.11,n_I/, £(々工)(%-历故r=匕n_n£(yf)2£(兀-力2山=1 i=1TOC\o"1-5"\h\z9 __£々兀-9于= i=19 _ 9(£牛-9产)(£"-9歹2)7i=1 i=1=出包70.99.49.11因为0.99>0.75,所以月新注册用户数y与月份t的线性相关性很强.9 _/、,/、/口人£(々工)(%-历(2)由(1)得力二工 9£(y£)2i=1

9 __Et;y;-9tv - I 八八壬i =一485一二485y0.81,a=y-bK6-0.81X5=1.95,9 - 285-9X2560Et2-9t2i=i1所以线性回归方程为吴0.81t+1.95,易知2020年5月份对应t二22,令t二22,得吴19.77,即2020年5月份新注册用户数的预测值为19.77百万.11.解析(1)由折线图及参考数据得7T=4,E(ti-7T=4,E(ti-T)2=28,i=i1 、E(%-历2二0.664,E(ti-T)(yi-y)=Etiyi-TEyii=i i=i i=i i=i二47.36-4X10.97=3.48,二•r^——348——弋0.99.0.664X2X2,646・・,0.99〉0.75,・・.y与t的线性相关程度很高.7 _ _八E(t;-t)(y;-y)(2)由天竺^^1.57及(1)中相关计算得b二」二丝8'0.12,7 7 _ 28E(9)2i=i人八 一一.一一:.a二y-bE71.57-0.12X4=1.09.所以y关于t的回归方程为吴1.09+0.12t.将2020年对应的t=11代入回归方程得吴1.09+0.12X11=2.41.所以2020年我国的生活垃圾无害化处理量的估计值为2.41亿吨..D由y=ebx-0.5,得lny=bx-0.5,令z=lny,则z=bx-0.5,,x与z之间的数据关系如下表:x1 2 3 4

1346

.・,元=1234—=2.5,z=1346—=3.5,:z=bx-0.5必过点(无,z),・・.3.5=bX2.5-0.5,解得b=1.6,・・z=1.6x-0.5,・・y=e1.6x-0.5,当x=5时,y=e1.6X5-0.5二尾,故选D..解析(1)y=dlnx+c更适合刻画x,y之间的关系.理由:由题表中数据可知,x的值每增加1,函数值y的增加量分别为7,4,3,2,增加得越来越缓慢,符合对数型函数的增长规律,与直线型函数的均匀增长5八Ez;y;-5万•5八Ez;y;-5万•y⑵令z=lnx,由题意得y=512161921 =73=14.6,所以d=J_Li i 5 5 5 _Ez2-5z2i=i1 人 人 ^86-5x°-96x14-6=10,c=y-d-2^14.6-10X0.96=5,所以所求的回归方6.2-5X0.962程为吴101nx+5.当x=6时,日销售额为10ln6+5弋23(万元).能力提升练一、选择题1.D由散点图可知变量x,y呈负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下的数据更具有线性相关性,"|更接近于1,所以-1<r2<r1<0.故选D.2.B由题图可知两变量呈正相关关系,故r1>0,r2>0,且r^q故华<坞,故A中结论正确,B中结论不正确.经计算可得,在去除点F前,%1=3.5,71=2.5,去除点F后,4=3,y=2.又回归直线l「y=0.68x+a必经过点(3.5,2.5),所以2=2.5-0.68X3.5=0.12,故C中结论正确. 一一一八 一一一回归直线l2:y=bx+0.68必经过点(3,2),所以2=6X3+0.68,所以〜 6=0.44,故D中结论正确.故选B.

.D由题意得回归直线y=bx+a过点(3,4),・・・将其代入到回归方程中得36+a=4,A A A A又Yb-a=2,「.b旦,a二-工,.••线性回归方程为y=3x-L故选D.2 2 2 2.BVy=aebX,Iny=ln(aebX)=lna+lnebx=lna+bx,\'将指数曲线y二aebx进行线性变换后得到的回归方程为以二1-0.6x,:.u=lny,b=-0.6,Ina=l,即a=e,・,•函数y=X2+bx+a=X2-0.6x+e为二次函数,),故选B.其图象开口向上,对称轴为直线x二巨,・・.函数y=x2+bx+a),故选B.间为(且,+8110二、填空题.答案4.5解析由题意可知,产量x的平均值为TiX(3+4+5+6)=4.5,又线性4回归方程为於0.7x+0.35,其线性回归直线经过样本点的中心仇y),所以"0.7X4.5+0.35=3.5,由天工X(2.5+3+4+a)=3.5,解得a=4.5,

4故答案为4.5.三、解答题.解析(1)画出散点图,如图所示:1每小时生产有缺陷零件的数所武件)

⑵•TOC\o"1-5"\h\z8 **〃 481216转速网转保外4 4(2)由题表得E2.5,y=8.25,Zxy=438,£3660,ii Ii=l i=l4八Ex-y--4xy

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论