版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节变量的相关性与统计案例内容索引内容索引必备知识自主学习核心考点精准研析核心素养微专题核心素养测评【教材教材知识梳理知识梳理】1.1.变量间的相关关系变量间的相关关系(1)(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种与函数关系不同,相关关系是一种_关系关系.(2)(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为关关系称为_,点散布在从左上角到右下角的区域内,两个变量的相,点散布
2、在从左上角到右下角的区域内,两个变量的相关关系为关关系为_._.非确定性非确定性正相关正相关负相关负相关2.2.两个变量的线性相关两个变量的线性相关(1)(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的_附近,称两个变量之间具有附近,称两个变量之间具有_,这条直线叫做,这条直线叫做回归直线回归直线.(2)(2)回归方程为回归方程为 =bx+a=bx+a,其中,其中(3)(3)通过求通过求q= q= 的最小值而得到回归直线的方法,即使得样本数的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的离差平方和最
3、小,这一方法叫做最小二乘法据的点到回归直线的距离的离差平方和最小,这一方法叫做最小二乘法. .一条直线一条直线线性相关关系线性相关关系baybx.niii 1n22ii 1x ynx yb,xnxn2iii 1ybxa(4)(4)相关系数:相关系数:当当r0r0时,表明两个变量时,表明两个变量 _;当;当r0r00时,两个变量呈正相关关系;时,两个变量呈正相关关系; 00时,两个变量呈负相关关系时,两个变量呈负相关关系. .x,y ybb【知识点辨析知识点辨析】( (正确的打正确的打“”“”, ,错误的打错误的打“”)”)(1)“(1)“名师出高徒名师出高徒”可以解释为教师的教学水平与学生的水
4、平成正相关关系可以解释为教师的教学水平与学生的水平成正相关关系. .( () )(2)(2)散点图是判断两个变量是否相关的一种重要方法和手段散点图是判断两个变量是否相关的一种重要方法和手段. .( () )(3)(3)通过回归直线方程通过回归直线方程 可以估计预报变量的取值和变化趋势可以估计预报变量的取值和变化趋势.(.() )ybxa,(4)(4)回归直线方程回归直线方程 至少经过点至少经过点(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),(x),(xn n,y,yn n) )中的一个点中的一个点. .( () )(5)(5)因为由任何一组观测值都可以求得一个线性回归方程
5、因为由任何一组观测值都可以求得一个线性回归方程, ,所以没有必要进行相所以没有必要进行相关性检验关性检验. .( () )(6)(6)事件事件x x,y y关系越密切,则由数据计算得到的关系越密切,则由数据计算得到的2 2的值越大的值越大. .( () )ybxa,提示提示: :(1).(1).名师出高徒显示的是正相关关系名师出高徒显示的是正相关关系. .(2).(2).散点图可以直观反映是否相关散点图可以直观反映是否相关. .(3).(3).由回归直线方程的意义可知其正确由回归直线方程的意义可知其正确. .(4)(4). .回归直线可能不经过任意一个数据点回归直线可能不经过任意一个数据点.
6、.(5)(5). .由任何一组观测值都可以求得一个线性回归方程由任何一组观测值都可以求得一个线性回归方程, ,但可能没有任何意义但可能没有任何意义. .(6).(6).2 2的值越大,有关的可能性越大的值越大,有关的可能性越大. .【易错点索引易错点索引】序号序号易错警示易错警示典题索引典题索引1 1相关系数相关系数r r与相关性强弱的关系与相关性强弱的关系考点一、考点一、t2t2,3 32 22 2的值越大,相关的可能性越大的值越大,相关的可能性越大. .考点二、典例考点二、典例3 3先由散点图、相关系数确定相关性,再计算回归先由散点图、相关系数确定相关性,再计算回归方程,预测才有意义方程,
7、预测才有意义考点三、角度考点三、角度2 2【教材教材基础自测基础自测】1.1.( (必修必修3p743p74例例1 1改编改编) )某研究机构对高三学生的记忆力某研究机构对高三学生的记忆力x x和判断力和判断力y y进行统计分析进行统计分析, ,所得数据如表所得数据如表: :x x6 68 810101212y y2 23 35 56 6则则y y对对x x的线性回归直线方程为的线性回归直线方程为 ( () )a. =2.3x-0.7a. =2.3x-0.7b. =2.3x+0.7b. =2.3x+0.7c. =0.7x-2.3c. =0.7x-2.3d. =0.7x+2.3d. =0.7x+
8、2.3yyyy【解析解析】选选c.c.易求易求 =9, =4,=9, =4,样本点的中心样本点的中心(9,4)(9,4)代入验证代入验证, ,满足满足 =0.7x-2.3.=0.7x-2.3.yxy2.(2.(选修选修2-3p862-3p86例例2 2改编改编) )两个变量两个变量y y与与x x的回归模型中,分别选择了的回归模型中,分别选择了4 4个不同模型,个不同模型,它们的相关系数它们的相关系数r r如下,其中拟合效果最好的模型是如下,其中拟合效果最好的模型是( () )a.a.模型模型1 1的相关系数的相关系数r r为为0.980.98b.b.模型模型2 2的相关系数的相关系数r r为
9、为0.800.80c.c.模型模型3 3的相关系数的相关系数r r为为0.500.50d.d.模型模型4 4的相关系数的相关系数r r为为0.250.25【解析解析】选选a.a.在两个变量在两个变量y y与与x x的回归模型中,它们的相关系数的回归模型中,它们的相关系数r r越接近于越接近于1 1,拟合效果越好,在四个选项中拟合效果越好,在四个选项中a a的相关系数最大,所以拟合效果最好的是模型的相关系数最大,所以拟合效果最好的是模型1.1.3.(3.(必修必修3p763p76例例2 2改编改编) )设某大学的女生体重设某大学的女生体重y(y(单位单位:kg):kg)与身高与身高x(x(单位单
10、位:cm):cm)具有具有线性相关关系线性相关关系, ,根据一组样本数据根据一组样本数据(x(xi i,y,yi i)(i=1,2,n),)(i=1,2,n),用最小二乘法建立的回用最小二乘法建立的回归方程为归方程为 =0.85x-85.71,=0.85x-85.71,则下列结论中不正确的是则下列结论中不正确的是( () )a.ya.y与与x x具有正的线性相关关系具有正的线性相关关系b.b.回归直线过样本点的中心回归直线过样本点的中心( , )( , )c.c.若该大学某女生身高增加若该大学某女生身高增加1 cm,1 cm,则其体重约增加则其体重约增加0.85 kg0.85 kgd.d.若该
11、大学某女生身高为若该大学某女生身高为170 cm,170 cm,则可断定其体重必为则可断定其体重必为58.79 kg58.79 kgyxy【解析解析】选选d.d.由于线性回归方程中由于线性回归方程中x x的系数为的系数为0.85,0.85,因此因此y y与与x x具有正的线性相关具有正的线性相关关系关系, ,故故a a正确正确; ;又线性回归方程必过样本点的中心又线性回归方程必过样本点的中心( , ),( , ),故故b b正确正确; ;由线性回由线性回归方程中系数的意义知归方程中系数的意义知,x,x每增加每增加1 cm,1 cm,其体重约增加其体重约增加0.85 kg,0.85 kg,故故c
12、 c正确正确; ;当某女生当某女生的身高为的身高为170 cm170 cm时时, ,其体重估计值是其体重估计值是58.79 kg,58.79 kg,而不是具体值而不是具体值, ,故故d d不正确不正确. .xy4.(4.(选修选修2-3p812-3p81习题习题3-1at13-1at1改编改编) )为了判断高中三年级学生是否选修文科与性别为了判断高中三年级学生是否选修文科与性别的关系的关系, ,现随机抽取现随机抽取5050名学生名学生, ,得到如下得到如下2 22 2列联表列联表: :理科理科文科文科男男13131010女女7 72020已知已知p(p(2 23.841)0.05.3.841)
13、0.05.根据表中数据,得到根据表中数据,得到2 2= 4.844.= 4.844.则认为选修文科与性别有关系出错的可能性为则认为选修文科与性别有关系出错的可能性为_._.250 (13 20 10 7)23 27 20 30【解析解析】2 24.8444.844,这表明小概率事件发生,这表明小概率事件发生. .根据假设检验的基本原理,应该根据假设检验的基本原理,应该断定断定“是否选修文科与性别之间有关系是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约成立,并且这种判断出错的可能性约为为5%.5%.答案:答案:5%5%考点一相关关系的判断考点一相关关系的判断 【题组练透题组练透】
14、1.1.已知变量已知变量x x和和y y近似满足关系式近似满足关系式y=-0.1x+1,y=-0.1x+1,变量变量y y与与z z正相关正相关. .下列结论中正确下列结论中正确的是的是 ( () )a.xa.x与与y y正相关正相关,x,x与与z z负相关负相关b.xb.x与与y y正相关正相关,x,x与与z z正相关正相关c.xc.x与与y y负相关负相关,x,x与与z z负相关负相关d.xd.x与与y y负相关负相关,x,x与与z z正相关正相关2.2.对四组数据进行统计对四组数据进行统计, ,获得如图所示的散点图获得如图所示的散点图, ,关于其相关系数的比较关于其相关系数的比较, ,正
15、确正确的是的是( () )a.ra.r2 2rr4 40r0r3 3rr1 1b.rb.r4 4rr2 20r0r1 1rr3 3c.rc.r4 4rr2 20r0r3 3rr1 1d.rd.r2 2rr4 40r0r1 1r ; ;x,yx,y之间不能建立线性回归方程之间不能建立线性回归方程. .2c xe21ryba22r21r22r【解析解析】1.1.选选c.c.由由y=-0.1x+1,y=-0.1x+1,知知x x与与y y负相关负相关, ,即即y y随随x x的增大而减小的增大而减小, ,又又y y与与z z正相正相关关, ,所以所以z z随随y y的增大而增大的增大而增大, ,随随
16、y y的减小而减小的减小而减小, ,所以所以z z随随x x的增大而减小的增大而减小,x,x与与z z负负相关相关. .2.2.选选a.a.由相关系数的定义以及散点图所表达的含义可知由相关系数的定义以及散点图所表达的含义可知r r2 2rr4 40r0r3 3r , ,故故正确正确;x,y;x,y之间可以建立线性回归方程之间可以建立线性回归方程, ,但拟合效果不好但拟合效果不好, ,故故错误错误. .答案答案: :2c xeyba21r22r【规律方法规律方法】1.1.散点图中如果所有的样本点都落在某一函数的曲线附近散点图中如果所有的样本点都落在某一函数的曲线附近, ,变量之间就有相关变量之间
17、就有相关关系关系. .如果所有的样本点都落在某一直线附近如果所有的样本点都落在某一直线附近, ,变量之间就有线性相关关系变量之间就有线性相关关系. .若若点散布在从左下角到右上角的区域点散布在从左下角到右上角的区域, ,则正相关则正相关. .2.2.利用相关系数判定利用相关系数判定, ,当当|r|r|越趋近于越趋近于1 1时相关性越强时相关性越强. .当残差平方和越小当残差平方和越小, ,相关相关指数指数r r2 2越大越大( (接近接近1),1),相关性越强相关性越强. .若若r0,r0,则正相关则正相关;r0;r0时时, ,则负相关则负相关. .考点二独立性检验考点二独立性检验 【典例典例
18、】(2017(2017全国卷全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比产量对比, ,收获时各随机抽取了收获时各随机抽取了100 100 个网箱个网箱, ,测量各箱水产品的产量测量各箱水产品的产量( (单位单位:kg),:kg),其频率分布直方图如图所示其频率分布直方图如图所示: :(1)(1)设两种养殖方法的箱产量相互独立设两种养殖方法的箱产量相互独立, ,记记a a表示事件表示事件“旧养殖法的箱产量低于旧养殖法的箱产量低于50 kg, 50 kg, 新养殖法的箱产量不低于新养殖法的箱产量不低于50 kg”,50 kg”,估计估计a
19、 a的概率的概率. .(2)(2)填写下面列联表填写下面列联表, ,并根据列联表判断是否有并根据列联表判断是否有99%99%的把握认为箱产量与养殖方的把握认为箱产量与养殖方法有关法有关: :箱产量箱产量50 kg50 kg箱产量箱产量50 kg50 kg旧养殖法旧养殖法新养殖法新养殖法(3)(3)根据箱产量的频率分布直方图根据箱产量的频率分布直方图, ,求新养殖法箱产量的中位数的估计值求新养殖法箱产量的中位数的估计值( (精确精确到到0.01).0.01).【解题导思解题导思】序号序号联想解题联想解题(1)(1)以频率代替概率以频率代替概率, ,相互独立时交事相互独立时交事件概率等于两事件概率
20、的积件概率等于两事件概率的积(2)(2)填入数据填入数据, ,代入卡方公式计算观测代入卡方公式计算观测值值, ,与临界值比较与临界值比较(3)(3)中位数把频率分布直方图分为面中位数把频率分布直方图分为面积相等的两部分积相等的两部分【解析解析】(1)记记b表示事件表示事件“旧养殖法的箱产量低于旧养殖法的箱产量低于50kg”,c表示事件表示事件“新养殖新养殖法的箱产量不低于法的箱产量不低于50kg”.由题意知由题意知p(a)=p(bc)=p(b)p(c).旧养殖法的箱产量低于旧养殖法的箱产量低于50kg的频率为的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故
21、故p(b)的估计值为的估计值为0.62.新养殖法的箱产量不低于新养殖法的箱产量不低于50kg的频率为的频率为(0.068+0.046+0.010+0.008)5=0.66,故故p(c)的估计值为的估计值为0.66.因此因此,事件事件a的概率估计值为的概率估计值为0.620.66=0.4092.(2)(2)箱产量箱产量50 kg6.635,15.7056.635,故有故有99%99%的把握认为箱产量与养殖方法有关的把握认为箱产量与养殖方法有关. .2200 (62 6634 38100 100 96 104)(3)(3)因为新养殖法的箱产量频率分布直方图中因为新养殖法的箱产量频率分布直方图中,
22、,箱产量低于箱产量低于50 kg50 kg的直方图面积的直方图面积为为(0.004+0.020+0.044)(0.004+0.020+0.044)5=0.340.5,5=0.340.5,5=0.680.5,故新养殖法箱产量的中位数的估计值为故新养殖法箱产量的中位数的估计值为50+ 52.35(kg).50+ 52.35(kg).0.50.340.068【规律方法规律方法】1.1.在在2 22 2列联表中列联表中, ,如果两个变量没有关系如果两个变量没有关系, ,则应满足则应满足ad-bc0.|ad-bc|ad-bc0.|ad-bc|越小越小, ,说明两个变量之间关系越弱说明两个变量之间关系越弱
23、;|ad-bc|;|ad-bc|越大越大, ,说明两个变量之间关系越强说明两个变量之间关系越强. .2.2.解决独立性检验的应用问题解决独立性检验的应用问题, ,一定要按照独立性检验的步骤得出结论一定要按照独立性检验的步骤得出结论. .独立性独立性检验的一般步骤检验的一般步骤: :(1)(1)根据样本数据制成根据样本数据制成2 22 2列联表列联表. .(2)(2)根据公式根据公式2 2= = 计算计算. .(3)(3)比较比较2 2与临界值的大小关系,作统计推断与临界值的大小关系,作统计推断. .【变式训练变式训练】(2020(2020合肥模拟合肥模拟) )某校在高一年级学生中某校在高一年级
24、学生中, ,对自然科学类、社会科学类校本选修对自然科学类、社会科学类校本选修课程的选课意向进行调查课程的选课意向进行调查. . 现从高一年级学生中随机抽取现从高一年级学生中随机抽取180180名学生名学生, ,其中男生其中男生105105名名; ;在这在这180180名学生中选择社会科学类的男生、女生均为名学生中选择社会科学类的男生、女生均为4545名名. .(1)(1)试问试问: :从高一年级学生中随机抽取从高一年级学生中随机抽取1 1人人, ,抽到男生的概率约为多少抽到男生的概率约为多少? ?(2)(2)根据抽取的根据抽取的180180名学生的调查结果名学生的调查结果, ,完成下面的完成下
25、面的2 22 2列联表列联表. .并判断能否在犯并判断能否在犯错误的概率不超过错误的概率不超过0.0250.025的前提下认为科学类的选择与性别有关的前提下认为科学类的选择与性别有关? ?选择自然选择自然科学类科学类选择社会选择社会科学类科学类合计合计男生男生女生女生合计合计【解析解析】(1)(1)从高一年级学生中随机抽取从高一年级学生中随机抽取1 1人人, ,抽到男生的概率约为抽到男生的概率约为 . .105718012(2)(2)根据统计数据根据统计数据, ,可得可得2 22 2列联表如表列联表如表: :选择自然选择自然科学类科学类选择社会选择社会科学类科学类合计合计男生男生6060454
26、5105105女生女生303045457575合计合计90909090180180则则k k2 2的观测值的观测值x= = 5.142 95.024,x= = 5.142 95.024,所以能在犯错误的概率不超过所以能在犯错误的概率不超过0.0250.025的前提下认为科学类的选择与性别有关的前提下认为科学类的选择与性别有关. .2180 (60 4530 45105 75 90 90)367考点三回归分析考点三回归分析 命命题题精精解解读读考什么考什么:(1):(1)考查线性回归方程的求法及运用回归方程进行预测考查线性回归方程的求法及运用回归方程进行预测;(2);(2)考查散点图、考查散点图
27、、相关系数、相关指数等判断两个变量是否相关的方法相关系数、相关指数等判断两个变量是否相关的方法;(3);(3)考查数学运算、数据考查数学运算、数据分析的核心素养及数形结合等思想方法分析的核心素养及数形结合等思想方法. .怎么考怎么考: :与频率分布表、频率分布直方图、折线图等结合考查回归分析的方法与频率分布表、频率分布直方图、折线图等结合考查回归分析的方法. .新趋势新趋势: :以回归分析为载体以回归分析为载体, ,与频率分布、概率等交汇命题与频率分布、概率等交汇命题. .学学霸霸好好方方法法1.1.回归分析方法回归分析方法(1)(1)利用公式利用公式, ,求出回归系数求出回归系数;(2);(
28、2)利用回归方程进行预测利用回归方程进行预测;(3);(3)与观测值对比与观测值对比, ,确确定模型是否合适定模型是否合适, ,及时修正及时修正. .2.2.交汇问题交汇问题与频率分布直方图、折线图等交汇时与频率分布直方图、折线图等交汇时, ,分析图形提供的数据信息分析图形提供的数据信息, ,获得计算相关获得计算相关系数、相关指数、回归系数等需要的数据系数、相关指数、回归系数等需要的数据, ,最后计算比较最后计算比较. .命题角度命题角度1 1线性回归方程及其应用线性回归方程及其应用【典例典例】现代社会现代社会,“,“鼠标手鼠标手”已成为常见病已成为常见病, ,一次实验中一次实验中,10,10
29、名实验对象进行名实验对象进行160160分钟的连续鼠标点击游戏分钟的连续鼠标点击游戏, ,每位实验对象完成的游戏关卡一样每位实验对象完成的游戏关卡一样, ,鼠标点击频鼠标点击频率平均为率平均为180180次次/ /分钟分钟, ,实验研究人员测试了实验对象使用鼠标前后的握力变化实验研究人员测试了实验对象使用鼠标前后的握力变化, ,前臂表面肌电频率等指标前臂表面肌电频率等指标. .(1)10 (1)10 名实验对象实验前、后握力名实验对象实验前、后握力( (单位单位:n):n)测试结果如下测试结果如下: :实验前实验前:346,357,358,360,362,362,364,372,373,376
30、:346,357,358,360,362,362,364,372,373,376实验后实验后:313,321,322,324,330,332,334,343,350,361:313,321,322,324,330,332,334,343,350,361完成茎叶图完成茎叶图, ,并计算实验后握力平均值比实验前握力的平均值下降了多少并计算实验后握力平均值比实验前握力的平均值下降了多少n?n?(2)(2)实验过程中测得时间实验过程中测得时间t(t(分分) )与与1010名实验对象前臂表面肌电频率的中值频率名实验对象前臂表面肌电频率的中值频率y(hz)y(hz)的九组对应数据的九组对应数据(t,y)(
31、t,y)为为(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),(120,76),(140,77),(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),(120,76),(140,77),(160,75).(160,75).建立建立y y关于时间关于时间t t的线性回归方程的线性回归方程; ;(3)(3)若肌肉肌电水平显著下降若肌肉肌电水平显著下降, ,提示肌肉明显进入疲劳状态提示肌肉明显进入疲劳状态, ,根据根据(2)(2)中中9 9组数据组数据分析分析, ,使用鼠标多少分钟就该进行休息了使用鼠标多少分钟
32、就该进行休息了? ?参考数据参考数据: :9iii 1(tt (yy1 800 );参考公式参考公式: :回归方程回归方程 = x+ = x+ 中斜率和截距的最小二乘估计公式分别为中斜率和截距的最小二乘估计公式分别为: : = = , =, = - - . .世纪金榜导学号世纪金榜导学号ybayniii 1nii 1(tt (yy(tt2)yab t【解析解析】(1)(1)根据题意得到茎叶图如图所示根据题意得到茎叶图如图所示: :由图中数据可得由图中数据可得 = = (346+357+358+360+362+362+364+372+373+376)=363,(346+357+358+360+3
33、62+362+364+372+373+376)=363, = = (313+321+322+324+330+332+334+343+350+361)=333,(313+321+322+324+330+332+334+343+350+361)=333,所以所以 - =363-333=30(n),- =363-333=30(n),所以实验后比实验前握力的平均值下降所以实验后比实验前握力的平均值下降30n.30n.1x1102x1101x2x(2)(2)由题意得由题意得 = (0+20+40+60+80+100+120+140+160)=80,= (0+20+40+60+80+100+120+140
34、+160)=80, = (87+84+86+79+78+78+76+77+75)=80, = (87+84+86+79+78+78+76+77+75)=80, =(0-80) =(0-80)2 2+(20-80)+(20-80)2 2+(40-80)+(40-80)2 2+(60-80)+(60-80)2 2+(80-80)+(80-80)2 2+(100-80)+(100-80)2 2+ +(120-80)(120-80)2 2+(140-80)+(140-80)2 2+(160-80)+(160-80)2 2=24 000,=24 000,t19y1992i 1(tit)又又 所以所以 =
35、 =-0.075,= =-0.075,所以所以 = - =80-(-0.075)= - =80-(-0.075)80=86,80=86,所以所以y y关于时间关于时间t t的线性回归方程为的线性回归方程为 =-0.075t+86.=-0.075t+86.(3)(3)九组数据中九组数据中4040分钟到分钟到6060分钟分钟y y的下降幅度最大的下降幅度最大, ,提示提示6060分钟时肌肉已经进分钟时肌肉已经进入疲劳状态入疲劳状态, ,故使用鼠标故使用鼠标6060分钟就该休息了分钟就该休息了. .9iii 1(tt (yy1 800 );9iii 19ii 1(tt (yy(tt2)1 80024
36、 000ayb t命题角度命题角度2 2相关系数及其应用相关系数及其应用【典例典例】如图是我国如图是我国20082008年至年至20142014年生活垃圾无害化处理量年生活垃圾无害化处理量( (单位单位: :亿吨亿吨) )的折的折线图线图. .(1)(1)由折线图看出由折线图看出, ,可用线性回归模型拟合可用线性回归模型拟合y y与与t t的关系的关系, ,请用相关系数加以说明请用相关系数加以说明. .(2)(2)建立建立y y关于关于t t的回归方程的回归方程( (系数精确到系数精确到0.01),0.01),预测预测20162016年我国生活垃圾无害化年我国生活垃圾无害化处理量处理量. .参
37、考数据参考数据: : 7ii 1y9.32,7iii 1t y40.1772i 1(yiy0.55, 72.646.)参考公式参考公式: :相关系数相关系数r=r= , ,回归方程回归方程 = + t= + t中斜率和截距的最小二乘估计公式分别为中斜率和截距的最小二乘估计公式分别为 , =, = - - . .世纪金榜导学号世纪金榜导学号niii 1nn22iii 1i 1(tt (yy(tt(yy)yabniii 1n2ii 1(tt (yy(tt)ayb t【解析解析】(1)(1)由折线图中的数据和附注中的参考数据得由折线图中的数据和附注中的参考数据得 =4, =28, =0.55,=4,
38、 =28, =0.55, =40.17-4 =40.17-49.32=2.89,9.32=2.89,所以所以r 0.99.r 0.99.因为因为y y与与t t的相关系数近似为的相关系数近似为0.99,0.99,说明说明y y与与t t的线性相关程度相当大的线性相关程度相当大, ,从而可以用从而可以用线性回归模型拟合线性回归模型拟合y y与与t t的关系的关系. .t72ii 1(tt)72ii 1(yy )777iiiiii 1i 1i 1(tt (yyt yty) ) 2.890.55 2 2.646 (2)(2)由由 1.3311.331及及(1)(1)得得 = 0.10.= 0.10.
39、 = - 1.331-0.10 = - 1.331-0.1040.93.40.93.所以所以y y关于关于t t的回归方程为的回归方程为 =0.93+0.10t.=0.93+0.10t.将将20162016年对应的年对应的t=9t=9代入回归方程得代入回归方程得 =0.93+0.10=0.93+0.109=1.83.9=1.83.所以预测所以预测20162016年我国生活垃圾无害化处理量约为年我国生活垃圾无害化处理量约为1.831.83亿吨亿吨. .9.32y7b772iiii 1i 1(tt (yy(tt)2.8928ayb tyy命题角度命题角度3 3非线性回归分析非线性回归分析【典例典例
40、】某公司为确定下一年度投入某种产品的宣传费某公司为确定下一年度投入某种产品的宣传费, ,需了解年宣传费需了解年宣传费x(x(单单位位: :千元千元) )对年销售量对年销售量y(y(单位单位:t):t)和年利润和年利润z(z(单位单位: :千元千元) )的影响的影响, ,对近对近8 8年的年宣年的年宣传费传费x xi i和年销售量和年销售量y yi i(i=1,2,8)(i=1,2,8)数据作了初步处理数据作了初步处理, ,得到如图散点图及一些统得到如图散点图及一些统计量的值计量的值. .表中表中w wi i= = , , ix8ii 11ww .8(1)(1)根据散点图判断根据散点图判断,y=
41、a+bx,y=a+bx与与y=c+dy=c+d 哪一个适宜作为年销售量哪一个适宜作为年销售量y y关于年宣传关于年宣传费费x x的回归方程类型的回归方程类型( (给出判断即可给出判断即可, ,不必说明理由不必说明理由)?)?(2)(2)根据根据(1)(1)的判断结果及表中数据的判断结果及表中数据, ,建立建立y y关于关于x x的回归方程的回归方程. .(3)(3)已知这种产品的年利润已知这种产品的年利润z z与与x,yx,y的关系为的关系为z=0.2y-x.z=0.2y-x.根据根据(2)(2)的结果回答下列的结果回答下列问题问题: :年宣传费年宣传费x=49x=49时时, ,年销售量及年利
42、润的预报值是多少年销售量及年利润的预报值是多少? ?年宣传费年宣传费x x为何值时为何值时, ,年利润的预报值最大年利润的预报值最大? ?x附附: :对于一组数据对于一组数据(u(u1 1,v,v1 1),(u),(u2 2,v,v2 2),(u),(un n,v,vn n),),其回归直线其回归直线 = + u= + u的斜的斜率和截距的最小二乘估计分别为率和截距的最小二乘估计分别为: : 世纪金榜导学号世纪金榜导学号v【解析解析】(1)(1)由散点图可以判断由散点图可以判断,y=c+d ,y=c+d 适宜作为年销售量适宜作为年销售量y y关于年宣传关于年宣传费费x x的回归方程类型的回归方
43、程类型. .(2)(2)令令w= ,w= ,先建立先建立y y关于关于w w的线性回归方程的线性回归方程, ,由由 得得 =563-68=563-686.8=100.6.6.8=100.6.所以所以y y关于关于w w的线性回归方程为的线性回归方程为 =100.6+68w,=100.6+68w,因此因此y y关于关于x x的回归方程为的回归方程为 =100.6+68 .=100.6+68 .xxxy(3)(3)由由(2)(2)知知, ,当当x=49x=49时时, ,年销售量年销售量y y的预报值的预报值 =100.6+68 =576.6,=100.6+68 =576.6,年利润年利润z z的预
44、报值的预报值 =576.6=576.60.2-49=66.32.0.2-49=66.32.根据根据(2)(2)的结果知的结果知, ,年利润年利润z z的预报值的预报值 =0.2(100.6+68 )-x=-x+13.6 +20.12.=0.2(100.6+68 )-x=-x+13.6 +20.12.所以当所以当 = =6.8,= =6.8,即即x=46.24x=46.24时时, , 取得最大值取得最大值. .故年宣传费为故年宣传费为46.2446.24千元时千元时, ,年利润的预报值最大年利润的预报值最大. .y49zzxxx13.62【题组通关题组通关】【变式巩固变式巩固练练】1.1.已知两
45、个随机变量已知两个随机变量x,yx,y之间的相关关系如表所示之间的相关关系如表所示: :x x-4-4-2-21 12 24 4y y-5-5-3-3-1-1-0.5-0.51 1根据上述数据得到的回归方程为根据上述数据得到的回归方程为 = x+ ,= x+ ,则大致可以判断则大致可以判断( () )a. 0, 0a. 0, 0b. 0, 0, 0c. 0c. 0d. 0, 0d. 0, 0, 0, 0.ab2.2.为了研究某班学生的脚长为了研究某班学生的脚长x(x(单位单位: :厘米厘米) )和身高和身高y(y(单位单位: :厘米厘米) )的关系的关系, ,从该班从该班随机抽取随机抽取101
46、0名学生名学生, ,根据测量数据的散点图可以看出根据测量数据的散点图可以看出y y与与x x之间有线性相关关系之间有线性相关关系, ,设其回归直线方程为设其回归直线方程为 = x+ ,= x+ ,已知已知 , , =1 600,=1 600, =4. =4.该班某学生的脚长为该班某学生的脚长为24,24,据此估计其身高为据此估计其身高为( () )a.160a.160b.163b.163c.166c.166d.170d.170yba10ii 1x22510ii 1yb【解析解析】选选c.c.由题意可知由题意可知 =4x+ ,=4x+ ,又又 =22.5, =160,=22.5, =160,因此
47、因此160=22.5160=22.54+ ,4+ ,解得解得 =70=70所以所以 =4x+70.=4x+70.当当x=24x=24时时, =4, =424+70=166.24+70=166.yaxyaayy3.3.某市春节期间某市春节期间7 7家超市广告费支出家超市广告费支出x xi i( (万元万元) )和销售额和销售额y yi i( (万元万元) )数据如表数据如表: :超市超市a ab bc cd de ef fg g广告费支出广告费支出x xi i1 12 24 46 6111113131919销售额销售额y yi i1919323240404444525253535454(1)(1
48、)若用线性回归模型拟合若用线性回归模型拟合y y与与x x的关系的关系, ,求求y y与与x x的线性回归方程的线性回归方程. .(2)(2)若用二次函数回归模型拟合若用二次函数回归模型拟合y y与与x x的关系的关系, ,可得回归方程可得回归方程: =-0.17x: =-0.17x2 2+5x+20,+5x+20,经计算经计算, ,二次函数回归模型和线性回归模型的二次函数回归模型和线性回归模型的r r2 2分别约为分别约为0.930.93和和0.75,0.75,请用请用r r2 2说说明选择哪个回归模型更合适明选择哪个回归模型更合适, ,并用此模型预测并用此模型预测a a超市广告费支出超市广
49、告费支出3 3万元时的销售万元时的销售额额. .参考数据参考数据: : =8,=8, =42,=42, =2 794,=2 794, =708.=708.参考公式参考公式: =: = , =, = - - . .yxy7iii 1x y72ii 1xbniii 1n22ii 1x ynx yxnxaybx【解析解析】(1) = =1.7.(1) = =1.7.所以所以 = - =42-1.7= - =42-1.78=28.4,8=28.4,故故y y关于关于x x的线性回归方程是的线性回归方程是 =1.7x+28.4.=1.7x+28.4.(2)(2)因为因为0.750.93,0.750.93
50、,所以二次函数回归模型更合适所以二次函数回归模型更合适. .当当x=3x=3时时, =33.47., =33.47.故选择二次函数回归模型更合适故选择二次函数回归模型更合适, ,并且用此模型预测并且用此模型预测a a超超市广告费支出市广告费支出3 3万元时的销售额为万元时的销售额为33.4733.47万元万元. .7iii 1n22ii 1x y7x yx7x22 7947 8 427087 8 ayb xyy【综合创新综合创新练练】1.(20201.(2020成都模拟成都模拟) )某汽车销售公司统计了某款汽车行驶里程某汽车销售公司统计了某款汽车行驶里程x(x(万公里万公里) )与维修与维修保
51、养费用保养费用y(y(万元万元) )的五组数据的五组数据, ,并根据这五组数据求得并根据这五组数据求得y y与与x x的线性回归方程为的线性回归方程为 =0.46x+0.16.=0.46x+0.16.由于工作人员疏忽由于工作人员疏忽, ,行驶行驶8 8万公里的数据被污损了万公里的数据被污损了, ,如表所示如表所示. .行驶里程行驶里程x x( (单位单位: :万公里万公里) )1 12 24 45 58 8维修保养费用维修保养费用y y( (单位单位: :万元万元) )0.500.500.900.902.32.32.72.7 y则被污损的数据为则被污损的数据为( () )a.3.20a.3.2
52、0b.3.6b.3.6c.3.76c.3.76d.3.84d.3.84【解析解析】选选b.b.设被污损的数据为设被污损的数据为t,t,由已知有由已知有 (1+2+4+5+8)=4, (0.50+0.90+2.3+2.7+t)= (6.4+t),(1+2+4+5+8)=4, (0.50+0.90+2.3+2.7+t)= (6.4+t),而线性回归方程而线性回归方程 =0.46x+0.16=0.46x+0.16经过点经过点 , ,代入有代入有 (6.4+t)=0.46(6.4+t)=0.464+0.16,4+0.16,解得解得t=3.6.t=3.6.1x51y5151(4,(6.4t )5 )y1
53、52.2.某单位为了了解用电量某单位为了了解用电量y(y(度度) )与气温与气温x()x()之间的关系之间的关系, ,随机统计了某随机统计了某4 4天的用天的用电量与当天气温电量与当天气温, ,并制作了对照表并制作了对照表: :气温气温()()181813131010-1-1用电量用电量( (度度) )2424343438386464由表中数据得回归直线方程由表中数据得回归直线方程 = x+ = x+ 中的中的 =-2,=-2,预测当气温为预测当气温为-4-4时时, ,用电量约为用电量约为_度度.ybab【解析解析】根据题意知根据题意知 =10, =40.=10, =40.所以所以 =40-(
54、-2)=40-(-2)10=60, =-2x+60.10=60, =-2x+60.所以当所以当x=-4x=-4时时, ,y=(-2)y=(-2)(-4)+60=68,(-4)+60=68,所以用电量约为所以用电量约为6868度度. .答案答案: :686818 13 10 ( 1x4 )24343864y4ay3.3.近期近期, ,某公交公司分别推出支付宝和微信扫码支付乘车活动某公交公司分别推出支付宝和微信扫码支付乘车活动, ,活动设置了一段活动设置了一段时间的推广期时间的推广期, ,由于推广期内优惠力度较大由于推广期内优惠力度较大, ,吸引越来越多的人开始使用扫码支吸引越来越多的人开始使用扫
55、码支付付, ,某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次, ,用用x x表示活动推出的天数表示活动推出的天数,y,y表示每天使用扫码支付的人次表示每天使用扫码支付的人次( (单位单位: :十人次十人次),),绘制了如绘制了如图所示的散点图图所示的散点图: :(1)(1)根据散点图判断在推广期内根据散点图判断在推广期内,y=a+bx,y=a+bx与与y=cdy=cdx x(c,d(c,d为大于零的常数为大于零的常数) )哪一个哪一个适宜作为扫码支付的人次适宜作为扫码支付的人次y y关于活动推出天数关于活动推出天数x x
56、的回归方程类型的回归方程类型?(?(给出判断即可给出判断即可, ,不必说明理由不必说明理由) )(2)(2)根据根据(1)(1)的判断结果求的判断结果求y y关于关于x x的回归方程的回归方程, ,并预测活动推出第并预测活动推出第8 8天使用扫码支天使用扫码支付的人次付的人次. .参考数据参考数据: :其中其中v vi i=lg y=lg yi i, , 附附: :对于一组数据对于一组数据 , , ,其回归直线其回归直线 = + u= + u的斜率和截距的最小二乘估计分别为的斜率和截距的最小二乘估计分别为: : = = = = - - . .7ii 11vv71122(u ,v ) (u ,v
57、 ),nn(u ,v )vaniivi 1n22ii 1u vnu unu,avu【解析解析】(1)(1)根据散点图判断根据散点图判断,y=cd,y=cdx x适宜作为扫码支付的人次适宜作为扫码支付的人次y y关于活动推出关于活动推出天数天数x x的回归方程类型的回归方程类型. .(2)(2)因为因为y=cdy=cdx x, ,两边取常用对数得两边取常用对数得: :lg y=lg =lg c+lg dx,lg y=lg =lg c+lg dx,设设lg y=v,lg y=v,所以所以v=lg c+lg dxv=lg c+lg dx因为因为 =4, =1.54, =140,=4, =1.54, =140,所以所以lg d= = =0.25,lg d= = =0.25,x(c d )xv72ii 1x7iii 1722ii 1x v7x vx7x250.127 4 1.547140 7 428 把样本点的中心把样本点的中心(4,1.54)(4,1.54)代入代入v=lg c+lg dxv=lg c+lg dx得得: :lg c=0.54,lg c=0.54,所以所以 =0.54+0.25x,=0.54+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 6 Enjoy the festivals 教学设计-2025-2026学年五年级英语上册(外研社版)
- 2026年医疗数据统计合同
- 陕西省渭南市蒲城县2025年高一上物理期末综合测试试题含解析
- 中国消防救援学院《材料表征方法》2024-2025学年第一学期期末试卷
- 新疆维吾尔自治区2025年数学高一上期末监测模拟试题含解析
- 大疱性表皮松解症个案护理
- 陕西韩城2025-2026学年生物高二上期末质量跟踪监视试题含解析
- 山东艺术学院《乡村景观设计专题》2024-2025学年第一学期期末试卷
- 山东专卷博雅闻道2026届生物高一第一学期期末经典试题含解析
- 云南国防工业职业技术学院《地球化学》2024-2025学年第一学期期末试卷
- GB/T 70.1-2008内六角圆柱头螺钉
- GB/T 19833-2005选煤厂煤伴生矿物泥化程度测定
- 《愚公移山》理解性默写(带答案)
- 公司简历范本
- 脉动真空灭菌器XG1.D使用说明书
- 水基清洗剂培训课件
- 大学语文-辛弃疾《摸鱼儿》《水龙吟》课件
- 大型保险公司合规经营红线培训课件
- 医院医学伦理委员会收支管理制度
- 内镜室护理工作流程
- 人教版英语九年级unit12全单元课件
评论
0/150
提交评论