版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲变量间的相关关系与统计案例[考纲解读]1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;根据最小二乘法求出回归直线方程.(重点)2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.[考向预测]从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测2021年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等.此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.1.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点散布在从eq\o(□,\s\up3(01))左下角到eq\o(□,\s\up3(02))右上角的区域内,如图1;②负相关:从散点图上看,点散布在从eq\o(□,\s\up3(03))左上角到eq\o(□,\s\up3(04))右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在eq\o(□,\s\up3(05))一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做eq\o(□,\s\up3(06))回归直线.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的eq\o(□,\s\up3(07))距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).其中,eq\o(b,\s\up6(^))是回归方程的eq\o(□,\s\up3(08))斜率,eq\o(a,\s\up6(^))是在y轴上的eq\o(□,\s\up3(09))截距,eq\o(x,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do14(i=1))xi,eq\o(y,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do14(i=1))yi,eq\o(□,\s\up3(10))(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))称为样本点的中心.说明:回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过样本点的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),用它来衡量两个变量间的线性相关关系.①当r>0时,表明两个变量eq\o(□,\s\up3(11))正相关;②当r<0时,表明两个变量eq\o(□,\s\up3(12))负相关;③r的绝对值越接近1,表明两个变量的线性相关性eq\o(□,\s\up3(13))越强;r的绝对值接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.2.残差分析(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为eq\o(e,\s\up6(^))i=yi-eq\o(y,\s\up6(^))i=yi-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^)),i=1,2,…,n,eq\o(e,\s\up6(^))i称为相应于点(xi,yi)的残差.(2)残差平方和为eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-eq\o(y,\s\up6(^))i)2.(3)相关指数:R2=1-eq\o(□,\s\up3(01))eq\f(\o(∑,\s\up6(n),\s\do4(i=1))yi-\o(y,\s\up6(^))i2,\o(∑,\s\up6(n),\s\do4(i=1))yi-\o(y,\s\up6(-))2).3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的eq\o(□,\s\up3(01))不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的eq\o(□,\s\up3(02))频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=eq\o(□,\s\up3(03))eq\f(nad-bc2,a+bc+da+cb+d),其中n=eq\o(□,\s\up3(04))a+b+c+d为样本容量.(3)独立性检验利用随机变量eq\o(□,\s\up3(05))K2来判断“两个分类变量eq\o(□,\s\up3(06))有关系”的方法称为独立性检验.1.概念辨析(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关系.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()(5)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.()答案(1)×(2)√(3)√(4)√(5)×2.小题热身(1)设回归方程为eq\o(y,\s\up6(^))=3-5x,则变量x增加一个单位时()A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位答案B解析因为-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.故选B.(2)在下列各图中,两个变量具有相关关系的图是()A.①②B.①③C.②④D.②③答案D解析①为函数关系;②显然成正相关;③显然成负相关;④没有明显相关性.(3)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.非一线一线总计愿生452065不愿生132235总计5842100算得K2=eq\f(100×45×22-20×132,58×42×35×65)≈9.616.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”答案C解析因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”.(4)已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y关于x的回归方程为eq\o(y,\s\up6(^))=1.3x-1,则m=________.x1234y0.11.8m4答案3.1解析由已知得eq\o(x,\s\up6(-))=eq\f(1,4)×(1+2+3+4)=2.5,eq\o(y,\s\up6(-))=eq\f(1,4)(0.1+1.8+m+4)=eq\f(1,4)×(5.9+m).因为(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))在直线eq\o(y,\s\up6(^))=1.3x-1上,所以eq\o(y,\s\up6(-))=1.3×2.5-1=2.25,所以eq\f(1,4)×(5.9+m)=2.25,解得m=3.1.题型一相关关系的判断1.下列两变量中不存在相关关系的是()①人的身高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销售额与广告费.A.①②⑤B.①③⑥C.④⑤⑥D.②⑥答案A解析根据相关关系的定义知,①②⑤中两个变量不存在相关关系.2.下列命题中正确的为()A.线性相关系数r越大,两个变量的线性相关性越强B.线性相关系数r越小,两个变量的线性相关性越弱C.残差平方和越小的模型,模型拟合的效果越好D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好答案C解析线性相关系数r的绝对值越接近于1,两个变量的线性相关性越强,故A,B错误;残差平方和越小,相关指数R2越大,越接近于1,拟合效果越好,故C正确,D错误.3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3答案A解析易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.故选A.1.判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.|r|越趋近于1相关性越强.见举例说明3.(3)线性回归直线方程中:eq\o(b,\s\up6(^))>0时,正相关;eq\o(b,\s\up6(^))<0时,负相关.2.判断拟合效果的两个方法(1)残差平方和越小,拟合效果越好.见举例说明2.(2)相关指数R2越大,越接近于1,拟合效果越好.1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.eq\f(1,2)D.1答案D解析所有点均在直线上,则样本相关系数最大即为1,故选D.2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y与x负相关且eq\o(y,\s\up6(^))=2.347x-6.423;②y与x负相关且eq\o(y,\s\up6(^))=-3.476x+5.648;③y与x正相关且eq\o(y,\s\up6(^))=5.437x+8.493;④y与x正相关且eq\o(y,\s\up6(^))=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④答案D解析由回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))知当eq\o(b,\s\up6(^))>0时,y与x正相关,当eq\o(b,\s\up6(^))<0时,y与x负相关,∴①④一定错误.题型二回归分析角度1线性回归方程及应用1.某汽车的使用年数x与所支出的维修总费用y的统计数据如表:使用年数x/年12345维修总费用y/万元0.51.22.23.34.5根据上表可得y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x-0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)()A.8年B.9年C.10年D.11年答案D解析由y关于x的线性回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x-0.69过样本点的中心(3,2.34),得eq\o(b,\s\up6(^))=1.01,即线性回归方程为eq\o(y,\s\up6(^))=1.01x-0.69,令eq\o(y,\s\up6(^))=1.01x-0.69=10,得x≈10.6,所以预测该汽车最多可使用11年.故选D.2.(2020·泉州模拟)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试,测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子停下所需要的距离),无酒状态与酒后状态下的试验数据分别列于下表.表1停车距离d(米)(10,20](20,30](30,40](40,50](50,60]频数26ab82表2平均每毫升血液酒精含量x(毫克)1030507090平均停车距离y(米)3050607090已知表1数据的中位数估计值为26,回答以下问题.(1)求a,b的值,并估计驾驶员无酒状态下停车距离的平均数;(2)根据最小二乘法,由表2的数据计算y关于x的回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)该测试团队认为:若驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?附:回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)依题意,得eq\f(6,10)a=50-26,解得a=40.又a+b+36=100,解得b=24,故停车距离的平均数为15×eq\f(26,100)+25×eq\f(40,100)+35×eq\f(24,100)+45×eq\f(8,100)+55×eq\f(2,100)=27.(2)依题意,可知eq\o(x,\s\up6(-))=50,eq\o(y,\s\up6(-))=60,eq\i\su(i=1,5,x)iyi=10×30+30×50+50×60+70×70+90×90=17800,eq\i\su(i=1,5,x)eq\o\al(2,i)=102+302+502+702+902=16500,所以eq\o(b,\s\up6(^))=eq\f(17800-5×50×60,16500-5×502)=0.7,eq\o(a,\s\up6(^))=60-0.7×50=25,所以回归直线方程为eq\o(y,\s\up6(^))=0.7x+25.(3)由(1)知当y>81时,认定驾驶员是“醉驾”.令eq\o(y,\s\up6(^))>81,得0.7x+25>81,解得x>80,则当每毫升血液酒精含量大于80毫克时认定为“醉驾”.角度2非线性回归模型的应用3.(2019·莆田二模)某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量xi(单位:亿元)对年销售额yi(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,…,12,并对这些数据作了初步处理,得到了如下的散点图及一些统计量的值.令ui=x2,vi=lnyi(i=1,2,…,12),经计算得如下数据:eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\i\su(i=1,12,)(xi-eq\o(x,\s\up6(-)))2eq\i\su(i=1,12,)(yi-eq\o(y,\s\up6(-)))2eq\o(u,\s\up6(-))eq\o(v,\s\up6(-))20667702004604.20eq\i\su(i=1,12,)(ui-eq\o(u,\s\up6(-)))2eq\i\su(i=1,12,)(ui-eq\o(u,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))eq\i\su(i=1,12,)(vi-eq\o(v,\s\up6(-)))2eq\i\su(i=1,12,)(xi-eq\o(x,\s\up6(-)))·(vi-eq\o(v,\s\up6(-)))3125000215000.30814(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;(2)①根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);②若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?附:相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),回归直线eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-));参考数据:308=4×77,eq\r(90)≈9.4868,e4.4998≈90.解(1)由题意,r1=eq\f(\i\su(i=1,12,)ui-\o(u,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,12,)ui-\o(u,\s\up6(-))2\i\su(i=1,12,)yi-\o(y,\s\up6(-))2))=eq\f(21500,\r(3125000×200))=eq\f(21500,25000)=eq\f(43,50)=0.86,r2=eq\f(\i\su(i=1,12,)xi-\o(x,\s\up6(-))vi-\o(v,\s\up6(-)),\r(\i\su(i=1,12,)xi-\o(x,\s\up6(-))2\i\su(i=1,12,)vi-\o(v,\s\up6(-))2))=eq\f(14,\r(770×0.308))=eq\f(14,77×0.2)=eq\f(10,11)≈0.91,则|r1|<|r2|,因此从相关系数的角度,模型y=eλx+t的拟合程度更好.(2)①先建立v关于x的线性回归方程,由y=eλx+t,得lny=t+λx,即v=t+λx;由于λ=eq\f(\i\su(i=1,12,)xi-\o(x,\s\up6(-))vi-\o(v,\s\up6(-)),\i\su(i=1,12,)xi-\o(x,\s\up6(-))2)=eq\f(14,770)≈0.018,t=eq\o(v,\s\up6(-))-λeq\o(x,\s\up6(-))=4.20-0.018×20=3.84,所以v关于x的线性回归方程为eq\o(v,\s\up6(^))=0.02x+3.84,所以lneq\o(y,\s\up6(^))=0.02x+3.84,则eq\o(y,\s\up6(^))=e0.02x+3.84.②下一年销售额y需达到90亿元,即y=90,代入eq\o(y,\s\up6(^))=e0.02x+3.84,得90=e0.02x+3.84,又e4.4998≈90,所以4.4998≈0.02x+3.84,所以x≈eq\f(4.4998-3.84,0.02)=32.99,所以预测下一年的研发资金投入量约是32.99亿元.1.利用线性回归方程时的关注点(1)正确理解计算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过样本点中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).见举例说明1.(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.2.非线性回归方程的求法(1)根据原始数据(x,y)作出散点图.(2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程.(4)在(3)的基础上通过相应变换,即可得非线性回归方程.见举例说明3.1.(2019·南宁二模)一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料.日期第1年第2年第3年第4年优惠金额x(千元)10111312销售量y(辆)22243127经过统计分析(利用散点图)可知x,y线性相关.(1)用最小二乘法求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(2)若第5年优惠金额为8.5千元,估计第5年的销售量y(辆)的值.参考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)由题意,得eq\o(x,\s\up6(-))=11.5,eq\o(y,\s\up6(-))=26,eq\i\su(i=1,4,x)iyi=1211,eq\i\su(i=1,4,x)eq\o\al(2,i)=534,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,x)iyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,4,x)\o\al(2,i)-4\o(x,\s\up6(-))2)=eq\f(1211-4×11.5×26,534-4×11.52)=eq\f(15,5)=3,则eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=26-3×11.5=-8.5.∴eq\o(y,\s\up6(^))=3x-8.5.(2)当x=8.5时,eq\o(y,\s\up6(^))=17,∴第5年优惠金额为8.5千元时,销售量估计为17辆.2.对某地区儿童的身高与体重的一组数据,我们用两种模型:①y=bx+a,②y=cedx拟合,得到回归方程分别为eq\o(y,\s\up6(^))(1)=0.24x-8.81,eq\o(y,\s\up6(^))(2)=1.70e0.022x,作残差分析,如下表:身高x(cm)60708090100110体重y(kg)6810141518eq\o(e,\s\up6(^))(1)0.410.011.21-0.190.41eq\o(e,\s\up6(^))(2)-0.360.070.121.69-0.34-1.12(1)求表中空格内的值;(2)根据残差比较模型①②的拟合效果,决定选择哪个模型;(3)若残差大于1kg的样本点被认为是异常数据,应剔除,剔除后对(2)所选择的模型重新建立回归方程.(结果保留到小数点后两位)附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)根据残差分析,把x=80代入eq\o(y,\s\up6(^))(1)=0.24x-8.81,得eq\o(y,\s\up6(^))(1)=10.39.∵10-10.39=-0.39,∴表中空格内的值为-0.39.(2)模型①残差的绝对值的和为0.41+0.01+0.39+1.21+0.19+0.41=2.62,模型②残差的绝对值的和为0.36+0.07+0.12+1.69+0.34+1.12=3.7.∵2.62<3.7,∴模型①的拟合效果比较好,选择模型①.(3)残差大于1kg的样本点被剔除后,剩余的数据如下表:身高x(cm)607080100110体重y(kg)68101518eq\o(e,\s\up6(^))(1)0.410.01-0.39-0.190.41则eq\o(x,\s\up6(-))=84,eq\o(y,\s\up6(-))=11.4,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=412,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up6(-)))2=1720,由公式eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),得eq\o(b,\s\up6(^))≈0.24,eq\o(a,\s\up6(^))=-8.76.得回归方程为eq\o(y,\s\up6(^))=0.24x-8.76.题型三独立性检验1.假设有两个分类变量X和Y的2×2列联表如下:YXy1y2总计x1a10a+10x2c30c+30总计6040100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为()A.a=45,c=15 B.a=40,c=20C.a=35,c=25 D.a=30,c=30答案A解析根据2×2列联表与独立性检验可知,当eq\f(a,a+10)与eq\f(c,c+30)相差越大时,X与Y有关系的可能性越大,即a,c相差越大,eq\f(a,a+10)与eq\f(c,c+30)相差越大.故选A.2.(2019·南昌三模)某校高三文科(1)班共有学生45人,其中男生15人,女生30人.在一次地理考试后,对成绩作了数据分析(满分100分),成绩为85分以上的同学称为“地理之星”,得到了如下列联表和条形图:地理之星非地理之星合计男生女生合计如果从全班45人中任意抽取1人,抽到“地理之星”的概率为eq\f(1,3).(1)完成“地理之星”与性别的2×2列联表,并回答是否有90%以上的把握认为获得“地理之星”与“性别”有关?(2)若已知此次考试中获得“地理之星”的同学的成绩平均值为90,方差为7.2,请你判断这些同学中是否有得到满分的同学,并说明理由.(得分均为整数分)参考公式:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.临界值表:P(K2≥k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828解(1)根据题意知“地理之星”总人数为45×eq\f(1,3)=15,填写列联表如下:地理之星非地理之星合计男生7815女生82230合计153045根据表中数据,计算K2=eq\f(45×7×22-8×82,15×30×15×30)=1.8<2.706,所以没有90%的把握认为获得“地理之星”与性别有关.(2)没有得满分的同学.记各个分值由高到低分别为x1,x2,…,x15;①若有2个以上的满分,则s2=eq\f(1,15)×[(100-90)2+(100-90)2+…+(x15-90)2]>eq\f(40,3)>7.2,不符合题意.②若恰有1个满分,为使方差最小,则其他分值需集中分布在平均数90的附近,且为保证平均值为90,则有10个得分为89,其余4个得分为90,此时方差取得最小值,∴seq\o\al(2,min)=eq\f(1,15)×[(100-90)2+4×(90-90)2+10×(89-90)2]=eq\f(22,3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川南充市仪陇县人力资源和社会保障局考调事业单位工作人员8人备考题库附答案详解(模拟题)
- 2026黑龙江佳木斯富锦市市政设施管护中心招聘一线工程技术人员3人备考题库含答案详解
- 2026浙江省杭州机场“青苗计划”暑期实习招募备考题库及一套答案详解
- 2026湖北黄石市华新医院招聘2人备考题库及答案详解(有一套)
- 2026广东阳江阳春市高校毕业生就业见习招募10人备考题库(第七期)含答案详解(典型题)
- 2026四川乐山市夹江县人民医院自主招聘护理人员4人备考题库含答案详解(培优a卷)
- 2026山东德州京德眼科医院招聘备考题库含答案详解(突破训练)
- 2026陕西西安高新一中等3所学校招聘备考题库含答案详解(综合卷)
- 2026年芜湖水梦南湖文化旅游发展有限公司外包工作人员招聘1名备考题库附答案详解(a卷)
- 2026浙江丽水市残联康复医院招募备考题库含答案详解
- 家庭基金内部管理制度
- 高血压糖尿病培训教学课件
- 2025年青海新泉财金投资管理有限公司招聘备考题库及1套参考答案详解
- 2025内蒙古呼和浩特市北兴产业投资发展有限责任公司猎聘高级管理人员2人笔试考试参考试题及答案解析
- JJF(机械) 1067-2021 霍尔电流传感器校准规范
- 2025~2026学年云南省昆明市官渡区人教版(小升初)数学检测试卷【附解析】
- 鱼:知之烹之食之-联合国粮食及农业组织
- 地方志编纂工作方案及实施流程
- 贝壳房屋委托协议书
- 湖北省圆创高中名校联盟2026届高三第一次联合测评 语文试卷(含答案)
- 检察机关刑事申诉课件
评论
0/150
提交评论