版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四节变量间的相关关系与统计案例【知识梳理】【知识梳理】1.1.必会知识必会知识 教材回扣填一填教材回扣填一填(1)(1)回归分析回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法法; ;判断相关性的常用统计图是判断相关性的常用统计图是:_;:_;统计量有统计量有:_(:_(取取值范围值范围-1,1)-1,1)、相关指数等、相关指数等. .散点图散点图相关系数相关系数(2)(2)线性回归方程线性回归方程两个具有线性相关关系的变量的一组数据:两个具有线性相关关系的变量的一组数据:(x(x1 1,y,y1 1),(x),(
2、x2 2,y,y2 2),(x),(xn n,y,yn n) ),其回归方程为,其回归方程为 其中其中, , 是回归方程的是回归方程的_, _, 是在是在y y轴上的截距轴上的截距. .ybxanniiiii 1i 1nn222iii 1i 1xxyyx ynx y,aybxxxxnx则b,b斜率斜率a(3)(3)独立性检验独立性检验2 22 2列联表列联表: :假设有两个分类变量假设有两个分类变量X X和和Y,Y,它们的取值分别为它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样其样本频数列联表本频数列联表( (称称2 22 2列联表列联表) )为为: :y y1
3、1y y2 2总计总计x x1 1a ab b_x x2 2c cd dc+dc+d总计总计a+ca+c_a+b+c+da+b+c+da+ba+bb+db+dK K2 2统计量:统计量:K K2 2= (= (其中其中n=a+b+c+dn=a+b+c+d为样本容量为样本容量).).2n adbcabcdac (bd)2.2.必备结论必备结论 教材提炼记一记教材提炼记一记(1)(1)从散点图看相关性从散点图看相关性: :正相关正相关: :样本点分布在从样本点分布在从_的区域内的区域内; ;负相关负相关: :样本点分布在从样本点分布在从_的区域内的区域内. .左下角到右上角左下角到右上角左上角到右
4、下角左上角到右下角(2)(2)从相关系数看相关性从相关系数看相关性: :当当r0r0时时, ,表明两个变量正相关表明两个变量正相关; ;当当r0r0.75r0.75时具有较强的相关性时具有较强的相关性. .越弱越弱越强越强(3)(3)从相关指数看相关性从相关指数看相关性: :R R2 2的值越大的值越大, ,说明残差平方和越小说明残差平方和越小, ,也就是说模型的拟合效果越好也就是说模型的拟合效果越好. .在在线性回归模型中线性回归模型中,R,R2 2表示解释变量对于预报变量变化的贡献率表示解释变量对于预报变量变化的贡献率,R,R2 2越接越接近于近于1,1,表示回归的效果越好表示回归的效果越
5、好. .3.3.必用技法必用技法 核心总结看一看核心总结看一看统计思想的应用统计思想的应用: :结论都是估计结果结论都是估计结果, ,不是精确结果不是精确结果. .【小题快练】【小题快练】1.1.思考辨析思考辨析 静心思考判一判静心思考判一判(1)(1)相关关系的两个变量是非确定关系相关关系的两个变量是非确定关系.(.() )(2)(2)散点图中的点越集中散点图中的点越集中, ,两个变量的线性相关性越强两个变量的线性相关性越强.(.() )(3)(3)对于分类变量对于分类变量X X与与Y,Y,它们的随机变量它们的随机变量K K2 2的观测值越小的观测值越小.“X.“X与与Y Y有关有关联联”的
6、把握程度越大的把握程度越大.(.() )【解析】【解析】(1)(1)正确正确. .相关关系不是确定关系相关关系不是确定关系. .(2)(2)错误错误. .散点图上的点大致分布在通过散点图中心的那条直线附近散点图上的点大致分布在通过散点图中心的那条直线附近, ,整体上呈线性分布时整体上呈线性分布时, ,两个变量相关关系越强两个变量相关关系越强. .(3)(3)错误错误.K.K2 2越大越大,“X,“X与与Y Y有关联有关联”的把握程度越大的把握程度越大. .答案答案: :(1)(1)(2)(2)(3)(3)2.2.教材改编教材改编 链接教材练一练链接教材练一练(1)(1)(选修选修2-3P812
7、-3P81例例1 1改编改编) )若若8 8名学生的身高和体重数据如下表名学生的身高和体重数据如下表: :编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg4848575754546464616143435959第第3 3名学生的体重漏填名学生的体重漏填, ,但线性回归方程是但线性回归方程是 =0.849x-85.712,=0.849x-85.712,则第则第3 3名名学生的体重估计为学生的体重估计为. .y【解析】【解析】设第设第3 3名学生的体重为名
8、学生的体重为a a,根据样本点的中心一定在回归,根据样本点的中心一定在回归直线上,可得直线上,可得解得解得a50.a50.答案:答案:50 kg50 kg4857a54646143598165 165 157170 175 165 155 1700.84985.712,8(2)(2)(选修选修2-3P972-3P97习题习题3.2T13.2T1改编改编) )为了解某班学生喜爱打篮球是否与性为了解某班学生喜爱打篮球是否与性别有关别有关, ,对该班对该班5050名学生进行了问卷调查名学生进行了问卷调查, ,得到了如下的得到了如下的2 22 2列联表列联表: :喜爱打篮球喜爱打篮球不喜爱打篮球不喜爱
9、打篮球总计总计男生男生20205 52525女生女生101015152525总计总计303020205050则在犯错误的概率不超过则在犯错误的概率不超过的前提下认为喜爱打篮球与性别的前提下认为喜爱打篮球与性别有关有关. .附附:K:K2 2= = 2n adbc.abcdacbdP(KP(K2 2kk0 0) )0.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 02.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828【解析】【解析】由公式可得由公式可得K
10、 K2 28.3337.879,8.3337.879,故填故填0.005.0.005.答案答案: :0.0050.0053.3.真题小试真题小试 感悟考题试一试感悟考题试一试(1)(2014(1)(2014湖北高考湖北高考) )根据如下样本数据根据如下样本数据x x3 34 45 56 67 78 8y y4.04.02.52.5-0.5-0.50.50.5-2.0-2.0-3.0-3.0得到的回归方程为得到的回归方程为 =bx+a,=bx+a,则则( () )A.a0,b0,b0,b0B.a0,b0C.a0,b0C.a0,b0D.a0D.a0y【解析】【解析】选选A.A.画出散点图如图所示画
11、出散点图如图所示,y,y的值大致随的值大致随x x的增加而减小的增加而减小, ,所以所以b0.b0.(2)(2015(2)(2015兰州模拟兰州模拟) )如表提供了某厂节能降耗技术改造后在生产如表提供了某厂节能降耗技术改造后在生产A A产品过程中记录的产量产品过程中记录的产量x(x(吨吨) )与相应的生产能耗与相应的生产能耗y(y(吨吨) )的几组对应数的几组对应数据据, ,根据表提供的数据根据表提供的数据, ,求出求出y y关于关于x x的线性回归方程为的线性回归方程为 =0.7x+0.35,=0.7x+0.35,则下列结论错误的是则下列结论错误的是( () )x x3 34 45 56 6
12、y y2.52.5t t4 44.54.5A.A.产品的生产能耗与产量呈正相关产品的生产能耗与产量呈正相关B.tB.t的取值必定是的取值必定是3.153.15C.C.回归直线一定过回归直线一定过(4.5,3.5)(4.5,3.5)D.AD.A产品每多生产产品每多生产1 1吨吨, ,则相应的生产能耗约增加则相应的生产能耗约增加0.70.7吨吨y【解析】【解析】选选B.B.由题意,由题意,因为因为 =0.7x+0.35,=0.7x+0.35,所以所以 =0.7=0.74.5+0.35=3.5,4.5+0.35=3.5,所以所以t=4t=43.5-2.5-4-4.5=3,3.5-2.5-4-4.5=
13、3,故选故选B.B.3456x4.5,4yy(3)(2015(3)(2015泉州模拟泉州模拟) )已知某产品连续已知某产品连续4 4个月的广告费用个月的广告费用x x1 1( (千元千元) )与销售额与销售额y y1 1( (万元万元) ),经过对这些数据的处理,得到如下数据信息:,经过对这些数据的处理,得到如下数据信息:广告费用广告费用x x和销售额和销售额y y之间具有较强的线性相关关系;之间具有较强的线性相关关系;回归直线方程回归直线方程 中的中的 =0.8(=0.8(用最小二乘法求得用最小二乘法求得).).那么,广告费用为那么,广告费用为6 6千元时,可预测销售额约为千元时,可预测销售
14、额约为( )( )A.3.5A.3.5万元万元 B.4.7B.4.7万元万元C.4.9C.4.9万元万元 D.6.5D.6.5万元万元44iii 1i 1x18,y14;ybxab【解析】【解析】选选B.B.因为因为 所以所以因为回归直线方程因为回归直线方程所以所以所以所以x=6x=6时,可预测销售额约为时,可预测销售额约为4.74.7万元万元. .故选故选B.B.44iii 1i 1x18,y14,97x,y,22ybxab0.8,中的790.8a,2211a,0.8x.1010 所以y考点考点1 1 相关关系的判断相关关系的判断【典例【典例1 1】(1)(1)已知变量已知变量x,yx,y呈
15、线性相关关系呈线性相关关系, ,回归方程为回归方程为 =0.5+2x,=0.5+2x,则则变量变量x,yx,y呈呈( () )A.A.线性正相关关系线性正相关关系B.B.由回归方程无法判断其正负相关由回归方程无法判断其正负相关C.C.线性负相关关系线性负相关关系D.D.非常强的相关关系非常强的相关关系y(2)(2)甲、乙、丙、丁四位同学各自对甲、乙、丙、丁四位同学各自对A,BA,B两变量的线性相关性做试验两变量的线性相关性做试验, ,并用回归分析方法分别求得相关系数并用回归分析方法分别求得相关系数r r与残差平方和与残差平方和m m如下表如下表: :甲甲乙乙丙丙丁丁r r0.820.820.7
16、80.780.690.690.850.85m m106106115115124124103103则哪位同学的试验结果体现则哪位同学的试验结果体现A A、B B两变量有更强的线性相关性两变量有更强的线性相关性( () )A.A.甲甲 B.B.乙乙C.C.丙丙 D.D.丁丁【解题提示】【解题提示】(1)(1)看随看随x x的变化的变化y y的变化趋势的变化趋势. .(2)(2)利用相关系数和残差平方和的意义判断利用相关系数和残差平方和的意义判断. .【规范解答】【规范解答】(1)(1)选选A.A.因为因为 =20,=20,所以变量所以变量x,yx,y呈线性正相关关系呈线性正相关关系. .(2)(2
17、)选选D.D.在验证两个变量之间的线性相关关系时在验证两个变量之间的线性相关关系时, ,相关系数的绝对值越相关系数的绝对值越接近于接近于1,1,相关性越强相关性越强, ,在四个选项中只有丁的相关系数最大在四个选项中只有丁的相关系数最大; ;残差平方残差平方和越小和越小, ,相关性越强相关性越强, ,只有丁的残差平方和最小只有丁的残差平方和最小, ,综上可知丁的试验结综上可知丁的试验结果体现了果体现了A,BA,B两变量有更强的线性相关性两变量有更强的线性相关性, ,故选故选D.D.b【互动探究】【互动探究】题题(1)(1)中中,x,x增加增加3 3个单位个单位,y,y的变化是的变化是. .【解析
18、】【解析】因为是正相关关系因为是正相关关系, ,所以所以y y增加增加6 6个单位个单位. .答案答案: :增加增加6 6个单位个单位【规律方法】【规律方法】线性相关关系与函数关系的区别线性相关关系与函数关系的区别(1)(1)函数关系中的两个变量间是一种确定性关系函数关系中的两个变量间是一种确定性关系. .例如例如, ,正方形面积正方形面积S S与与边长边长x x之间的关系之间的关系S=xS=x2 2就是函数关系就是函数关系. .(2)(2)相关关系是一种非确定性关系相关关系是一种非确定性关系, ,即相关关系是非随机变量与随机变即相关关系是非随机变量与随机变量之间的关系量之间的关系. .例如例
19、如, ,商品的销售额与广告费是相关关系商品的销售额与广告费是相关关系. .两个变量具两个变量具有相关关系是回归分析的前提有相关关系是回归分析的前提. .【变式训练】【变式训练】1.1.两个变量两个变量y y与与x x的回归模型中的回归模型中, ,分别选择了分别选择了4 4个不同模型个不同模型, ,它们的相关指数它们的相关指数R R2 2如下如下, ,其中拟合效果最好的模型是其中拟合效果最好的模型是( () )A.A.模型模型1 1的相关指数的相关指数R R2 2为为0.980.98B.B.模型模型2 2的相关指数的相关指数R R2 2为为0.800.80C.C.模型模型3 3的相关指数的相关指
20、数R R2 2为为0.500.50D.D.模型模型4 4的相关指数的相关指数R R2 2为为0.250.25【解析】【解析】选选A.A.相关指数相关指数R R2 2越大越大, ,拟合效果越好拟合效果越好. .2.2.对于给定的两个变量的统计数据对于给定的两个变量的统计数据, ,下列说法正确的是下列说法正确的是( () )A.A.都可以分析出两个变量的关系都可以分析出两个变量的关系B.B.都可以用一条直线近似表示两者的关系都可以用一条直线近似表示两者的关系C.C.都可以作出散点图都可以作出散点图D.D.都可以用确定的表达式表示两者的关系都可以用确定的表达式表示两者的关系【解析】【解析】选选C.C
21、.给出一组样本数据给出一组样本数据, ,总可以作出相应的散点图总可以作出相应的散点图, ,故故C C正确正确, ,但不一定能分析出两个变量的关系但不一定能分析出两个变量的关系, ,故故A A不正确不正确, ,更不一定符合线性相更不一定符合线性相关关, ,不一定用一条直线近似表示不一定用一条直线近似表示, ,故故B B不正确不正确, ,两个变量的统计数据不一两个变量的统计数据不一定有函数关系定有函数关系, ,故故D D不正确不正确. .故选故选C.C.【加固训练】【加固训练】1.1.下列命题下列命题: :线性回归方法就是由样本点去寻找一线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学
22、方法条贴近这些样本点的直线的数学方法; ;利用样本点的散点图可以利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示直观判断两个变量的关系是否可以用线性关系表示; ;通过回归直通过回归直线线 及回归系数及回归系数 , ,可以估计和预测变量的取值和变化趋可以估计和预测变量的取值和变化趋势势. .其中正确的命题是其中正确的命题是( () )A.A. B. B. C. C. D. D.ybxab【解析】【解析】选选D.D.线性回归方法就是由样本点去寻找一条贴近这些样本点线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法的直线的数学方法, ,找拟合效果最好的直线找拟合效果最
23、好的直线, ,故故正确正确, ,利用样本点的利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示散点图可以直观判断两个变量的关系是否可以用线性关系表示, ,正正确确, ,通过回归直线通过回归直线 及回归系数及回归系数 , ,可以估计和预测变量的取值可以估计和预测变量的取值和变化趋势和变化趋势, ,正确正确, ,综上可知综上可知正确正确, ,故选故选D.D.ybxab2.2.某棉业公司的科研人员在某棉业公司的科研人员在7 7块并排、形状大小相同的试验田上对某块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量棉花新品种进行施化肥量x x对产量对产量y y影响的试验影响的试验,
24、,得到如表所示的一组得到如表所示的一组数据数据( (单位单位:kg).:kg).施化肥量施化肥量x x1515202025253030353540404545棉花产量棉花产量y y330330345345365365405405445445450450455455(1)(1)画出散点图画出散点图. .(2)(2)判断是否具有相关关系判断是否具有相关关系. .【解析】【解析】(1)(1)散点图如图所示散点图如图所示. .(2)(2)由散点图知由散点图知, ,各组数据对应点大致都在一条直线附近各组数据对应点大致都在一条直线附近, ,所以施化肥所以施化肥量量x x与棉花产量与棉花产量y y具有线性相
25、关关系具有线性相关关系. .考点考点2 2 独立性检验独立性检验【典例【典例2 2】(1)(1)某高校某高校“统计初步统计初步”课程的教师随机调查了选该课程的课程的教师随机调查了选该课程的一些学生的情况一些学生的情况, ,具体数据如表具体数据如表: :专业专业性别性别非统计专业非统计专业统计专业统计专业男男13131010女女7 72020为了判断主修统计专业是否与性别有关系为了判断主修统计专业是否与性别有关系, ,根据表中的数据根据表中的数据, ,得到得到K K2 2= 4.844.= 4.844.因为因为K K2 23.841,3.841,所以判定主修统计专业与性别有关系所以判定主修统计专
26、业与性别有关系, ,那么这种判断出那么这种判断出错的可能性为错的可能性为. .250 (13 20 10 7)23 2720 30(2)(2014(2)(2014辽宁高考改编辽宁高考改编) )某大学餐饮中心为了解新生的饮食习惯某大学餐饮中心为了解新生的饮食习惯, ,在在全校一年级学生中进行了抽样调查全校一年级学生中进行了抽样调查, ,调查结果如下表所示调查结果如下表所示: :喜欢甜品喜欢甜品不喜欢甜品不喜欢甜品总计总计南方学生南方学生606020208080北方学生北方学生101010102020总计总计70703030100100根据表中数据根据表中数据, ,问是否在犯错误的概率不超过问是否
27、在犯错误的概率不超过5%5%的前提下认为的前提下认为“南南方学生和北方学生在选用甜品的饮食习惯方面有差异方学生和北方学生在选用甜品的饮食习惯方面有差异”. .已知在被调查的北方学生中有已知在被调查的北方学生中有5 5名数学系的学生名数学系的学生, ,其中其中2 2名喜欢甜品名喜欢甜品, ,现在从这现在从这5 5名学生中随机抽取名学生中随机抽取3 3人人, ,求至多有求至多有1 1人喜欢甜品的概率人喜欢甜品的概率. .附附:K:K2 2= = 2n(adbc).abcdacbdP(KP(K2 2kk0 0) )0.1000.1000.0500.0500.0100.010k k0 02.7062.
28、7063.8413.8416.6356.635【解题提示】【解题提示】(1)(1)对照临界值表判断对照临界值表判断. .(2)(2)代入公式求出代入公式求出K K2 2值再判断值再判断; ;利用古典概型的概率公式求解利用古典概型的概率公式求解. .【规范解答】【规范解答】(1)(1)因为因为P(KP(K2 23.841)=0.05,4.8443.841,3.841)=0.05,4.8443.841,所以判断出错的可能性不超过所以判断出错的可能性不超过5%.5%.答案答案: :不超过不超过5%5%(2)(2)将将2 22 2列联表中的数据代入计算公式列联表中的数据代入计算公式, ,得得K K2
29、2= = 由于由于4.7623.841,4.7623.841,所以在犯错误的概率不超过所以在犯错误的概率不超过5%5%的前提下认为的前提下认为“南方南方学生和北方学生在选用甜品的饮食习惯方面有差异学生和北方学生在选用甜品的饮食习惯方面有差异”. .2100(60 10 20 10)1004.76270 30 80 2021,从从5 5名数学系学生中抽取名数学系学生中抽取3 3人的一切可能结果所组成的基本事件为下人的一切可能结果所组成的基本事件为下列列1010个个: :(a(a1 1,a,a2 2,b,b1 1),(a),(a1 1,a,a2 2,b,b2 2),(a),(a1 1,a,a2 2
30、,b,b3 3),(a),(a1 1,b,b1 1,b,b2 2),),(a(a1 1,b,b1 1,b,b3 3),(a),(a1 1,b,b2 2,b,b3 3),(a),(a2 2,b,b1 1,b,b2 2),(a),(a2 2,b,b1 1,b,b3 3),),(a(a2 2,b,b2 2,b,b3 3),(b),(b1 1,b,b2 2,b,b3 3),),其中其中a ai i(i=1,2)(i=1,2)表示喜欢甜品的学生表示喜欢甜品的学生,b,bj j(j=1,2,3)(j=1,2,3)表示不喜欢甜品的表示不喜欢甜品的学生学生, ,这这1010个基本事件的出现是等可能的个基本事件
31、的出现是等可能的. .抽取抽取3 3人人, ,至多有至多有1 1人喜欢甜品的事件为以下人喜欢甜品的事件为以下7 7个个: :(a(a1 1,b,b1 1,b,b2 2),(a),(a1 1,b,b1 1,b,b3 3),(a),(a1 1,b,b2 2,b,b3 3),(a),(a2 2,b,b1 1,b,b2 2),),(a(a2 2,b,b1 1,b,b3 3),(a),(a2 2,b,b2 2,b,b3 3),(b),(b1 1,b,b2 2,b,b3 3),),从这从这5 5名学生中随机抽取名学生中随机抽取3 3人人, ,至多有至多有1 1人喜欢甜品的概率为人喜欢甜品的概率为 7.10
32、【规律方法】【规律方法】解独立性检验的应用问题的关注点解独立性检验的应用问题的关注点(1)(1)两个明确两个明确: :明确两类主体明确两类主体. .明确研究的两个问题明确研究的两个问题. .(2)(2)两个关键两个关键: :准确画出准确画出2 22 2列联表列联表; ;准确理解准确理解K K2 2. .提醒提醒: :准确计算准确计算K K2 2的值是正确判断的前提的值是正确判断的前提. .【变式训练】【变式训练】(2014(2014安徽高考改编安徽高考改编) )某高校共有学生某高校共有学生1500015000人人, ,其中男其中男生生1050010500人人, ,女生女生45004500人人,
33、 ,为调查该校学生每周平均体育运动时间的情为调查该校学生每周平均体育运动时间的情况况, ,采用分层抽样的方法采用分层抽样的方法, ,收集收集300300位学生每周平均体育运动时间的样位学生每周平均体育运动时间的样本数据本数据( (单位单位: :小时小时).).(1)(1)应收集多少位女生的样本数据应收集多少位女生的样本数据? ?(2)(2)根据这根据这300300个样本数据个样本数据, ,得到学生每周平均体育运动时间的频率得到学生每周平均体育运动时间的频率分布直方图分布直方图( (如图所示如图所示),),其中样本数据的分组区间为其中样本数据的分组区间为:0,2,(2,4,:0,2,(2,4,(
34、4,6,(6,8,(8,10,(10,12.(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间估计该校学生每周平均体育运动时间超过超过4 4小时的概率小时的概率. .(3)(3)在样本数据中在样本数据中, ,有有6060位女生的每周平均体育运动时间超过位女生的每周平均体育运动时间超过4 4小时小时. .请请完成每周平均体育运动时间与性别的列联表完成每周平均体育运动时间与性别的列联表, ,并判断是否在犯错误的并判断是否在犯错误的概率不超过概率不超过5%5%的前提下认为的前提下认为“该校学生的每周平均体育运动时间与性该校学生的每周平均体育运动时间与性别有关别有关”. .
35、附附:K:K2 2= =2n adbc.abcdacbdP(KP(K2 2kk0 0) )0.100.100.050.050.0100.0100.0050.005k k0 02.7062.7063.8413.8416.6356.6357.8797.879【解题提示】【解题提示】分清样本总体、个体的概念分清样本总体、个体的概念, ,识别频率分布直方图识别频率分布直方图, ,正确正确列出列联表求解列出列联表求解, ,本题属于容易题本题属于容易题. .【解析】【解析】(1)300(1)300 =90,=90,所以应收集所以应收集9090位女生的样本数据位女生的样本数据. .(2)(2)由频率分布直方
36、图得由频率分布直方图得2 2(0.150+0.125+0.075+0.025)=0.75,(0.150+0.125+0.075+0.025)=0.75,所以该校学生每周平均体育运动时间超过所以该校学生每周平均体育运动时间超过4 4小时的概率的估计值为小时的概率的估计值为0.75.0.75.(3)(3)由由(2)(2)知知,300,300位学生中有位学生中有3003000.75=2250.75=225人的每周平均体育运动时人的每周平均体育运动时间超过间超过4 4个小时个小时,75,75人的每周平均体育运动时间不超过人的每周平均体育运动时间不超过4 4个小时个小时. .又因为又因为样本数据中有样本
37、数据中有210210份是关于男生的份是关于男生的,90,90份是关于女生的份是关于女生的, ,所以每周平均所以每周平均体育运动时间与性别的列联表如下体育运动时间与性别的列联表如下: :4 50015 000每周平均体育运动时间与性别列联表每周平均体育运动时间与性别列联表男生男生女生女生总计总计每周平均体育运动时间每周平均体育运动时间不超过不超过4 4个小时个小时454530307575每周平均体育运动时间每周平均体育运动时间超过超过4 4个小时个小时1651656060225225总计总计2102109090300300结合列联表可算得结合列联表可算得K K2 2的观测值的观测值所以在犯错误的
38、概率不超过所以在犯错误的概率不超过5%5%的前提下认为的前提下认为“该校学生的每周平均体该校学生的每周平均体育运动时间与性别有关育运动时间与性别有关”. .2300 2 250100k4.7623.841.75 225 210 9021【加固训练】【加固训练】(2014(2014长治模拟长治模拟) )为了调查某大学学生在周日上网的时为了调查某大学学生在周日上网的时间间, ,随机对随机对100100名男生和名男生和100100名女生进行了不记名的问卷调查名女生进行了不记名的问卷调查, ,得到了如得到了如下的统计结果下的统计结果: :表表1 1男生上网时间与频数分布表男生上网时间与频数分布表表表2
39、 2女生上网时间与频数分布表女生上网时间与频数分布表上网时间上网时间( (分钟分钟) )30,40)30,40)40,50)40,50)50,60)50,60)60,70)60,70)70,80)70,80)人数人数5 52525303025251515上网时间上网时间( (分钟分钟) )30,40)30,40)40,50)40,50)50,60)50,60)60,70)60,70)70,80)70,80)人数人数10102020404020201010(1)(1)若该大学共有女生若该大学共有女生750750人人, ,试估计其中上网时间不少于试估计其中上网时间不少于6060分钟的人分钟的人数数
40、. .(2)(2)完成表完成表3 3的的2 22 2列联表列联表, ,并回答能否在犯错误的概率不超过并回答能否在犯错误的概率不超过0.10.1的前的前提下认为提下认为“学生周日上网时间与性别有关学生周日上网时间与性别有关”? ?(3)(3)从表从表3 3的男生中的男生中“上网时间少于上网时间少于6060分钟分钟”和和“上网时间不少于上网时间不少于6060分分钟钟”的人数中用分层抽样的方法抽取一个容量为的人数中用分层抽样的方法抽取一个容量为5 5的样本的样本, ,再从中任取再从中任取两人两人, ,求至少有一人上网时间超过求至少有一人上网时间超过6060分钟的概率分钟的概率. .表表3 3 上网时
41、间少于上网时间少于6060分钟分钟上网时间不少于上网时间不少于6060分钟分钟总计总计男生男生女生女生总计总计P(KP(K2 2kk0 0) )0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 00.4550.4550.7080.7081.3231.3232.0722.0722.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.82822n adbcK,nabcd.abcdacbd 附:其中【解析
42、】【解析】(1)(1)设上网时间不少于设上网时间不少于6060分钟的人数为分钟的人数为x.x.依据题意有依据题意有 解得解得:x=225,:x=225,所以估计其中上网的时间不少于所以估计其中上网的时间不少于6060分钟的人数是分钟的人数是225225人人. .x30,750100(2)(2)根据题目所给数据得到如下列联表根据题目所给数据得到如下列联表, ,上网时间少于上网时间少于6060分钟分钟上网时间不少于上网时间不少于6060分钟分钟总计总计男生男生60604040100100女生女生70703030100100总计总计1301307070200200其中其中K K2 2= 2.1982
43、.706,= 2.1980,b0,所以排除所以排除C,D,C,D,因为因为过过( ),( ),所以将所以将 =2.5=2.5代入代入A,B,A,B,算得算得A A中结果更接近中结果更接近3.5,3.5,所以选所以选A.A.x,yx命题角度命题角度2:2:线性回归方程的应用线性回归方程的应用【典例【典例4 4】(2014(2014新课标全国卷新课标全国卷)某地区某地区20072007年至年至20132013年农村居民年农村居民家庭人均纯收入家庭人均纯收入y(y(单位单位: :千元千元) )的数据如下表的数据如下表: :年份年份20072007200820082009200920102010201
44、120112012201220132013年份代号年份代号t t1 12 23 34 45 56 67 7人均纯收入人均纯收入y y2.92.93.33.33.63.64.44.44.84.85.25.25.95.9(1)(1)求求y y关于关于t t的线性回归方程的线性回归方程. .(2)(2)利用利用(1)(1)中的回归方程中的回归方程, ,分析分析20072007年至年至20132013年该地区农村居民家庭人年该地区农村居民家庭人均纯收入的变化情况均纯收入的变化情况, ,并预测该地区并预测该地区20152015年农村居民家庭人均纯收入年农村居民家庭人均纯收入. .【解题提示】【解题提示】
45、(1)(1)利用公式求得回归方程利用公式求得回归方程. .(2)(2)利用回归方程中利用回归方程中 的正负分析变化情况的正负分析变化情况, ,将将20152015年的年份代号代入年的年份代号代入回归方程回归方程, ,估计家庭人均纯收入估计家庭人均纯收入. .b【规范解答】【规范解答】(1)(1)因为因为1234567t4,7 2.93.33.64.44.85.25.9y4.3,7ybta,4.220.700.5 1.84.8141,94 1214 221aybt4.342.3,21ytyt2.3.2设回归方程为代入公式,经计算得b所以 关于 的回归方程为(2)(2)因为因为 = 0,= 0,所
46、以所以20072007年至年至20132013年该地区人均纯收入稳步增年该地区人均纯收入稳步增长,预计到长,预计到20152015年,该地区人均纯收入年,该地区人均纯收入y= y= 9+2.3=6.8(9+2.3=6.8(千元千元) ),所以预计到所以预计到20152015年,该地区人均纯收入约年,该地区人均纯收入约6 8006 800元左右元左右. .b1212悟悟技法技法线性回归分析问题的类型及解题方法线性回归分析问题的类型及解题方法(1)(1)求线性回归方程求线性回归方程. .利用公式利用公式, ,求出回归系数求出回归系数b,a.b,a.待定系数法待定系数法: :利用回归直线过样本点中心
47、求系数利用回归直线过样本点中心求系数. .(2)(2)利用回归方程进行预测利用回归方程进行预测: :把回归直线方程看作一次函数把回归直线方程看作一次函数, ,求函数值求函数值. .(3)(3)利用回归直线判断正、负相关利用回归直线判断正、负相关: :决定正相关还是负相关的是系数决定正相关还是负相关的是系数b.b.通通一类一类1.(20131.(2013湖北高考湖北高考) )四名同学根据各自的样本数据研究变量四名同学根据各自的样本数据研究变量x,yx,y之间之间的相关关系的相关关系, ,并求得回归直线方程并求得回归直线方程, ,分别得到以下四个结论分别得到以下四个结论: :y y与与x x负相关
48、且负相关且 =2.347x-6.423;=2.347x-6.423;y y与与x x负相关且负相关且 =-3.476x+5.648;=-3.476x+5.648;y y与与x x正相关且正相关且 =5.437x+8.493;=5.437x+8.493;y y与与x x正相关且正相关且 =-4.326x-4.578.=-4.326x-4.578.其中一定不正确的结论的序号是其中一定不正确的结论的序号是( () )A.A. B. B. C. C.D.D.yyyy【解题提示】【解题提示】x x的系数的符号决定变量的系数的符号决定变量x,yx,y之间的正、负相关关系之间的正、负相关关系. .【解析】【
49、解析】选选D.xD.x的系数大于的系数大于0 0为正相关为正相关, ,小于小于0 0为负相关为负相关. .2.(20152.(2015沈阳模拟沈阳模拟) )高三某班学生每周用于物理学习的时间高三某班学生每周用于物理学习的时间x(x(单位单位: :小时小时) )与物理成绩与物理成绩y(y(单位单位: :分分) )之间有如下关系之间有如下关系: :x x2424151523231919161611112020161617171313y y9292797997978989646447478383686871715959根据上表可得回归方程的斜率为根据上表可得回归方程的斜率为3.53,3.53,则回归
50、直线在则回归直线在y y轴上的截距为轴上的截距为.(.(答案保留到答案保留到0.1)0.1)【解析】【解析】由已知可得由已知可得设回归直线方程为设回归直线方程为 =3.53x+ ,=3.53x+ ,则则74.9=3.5374.9=3.5317.4+ ,17.4+ ,解得解得 13.5.13.5.答案:答案:13.513.524 1523 19 16 1120 16 1713x17.4,10927997896447836871 59y74.9.10yaaa3.(20153.(2015重庆模拟重庆模拟) )重庆市某知名中学高三年级甲班班主任近期对班重庆市某知名中学高三年级甲班班主任近期对班上每位同
51、学的成绩作相关分析时上每位同学的成绩作相关分析时, ,得到石周卓婷同学的某些成绩数据得到石周卓婷同学的某些成绩数据如下如下: :第一次考试第一次考试第二次考试第二次考试第三次考试第三次考试第四次考试第四次考试数学总分数学总分118118119119121121122122总分年级排名总分年级排名133133127127121121119119(1)(1)求总分年级名次关于数学总分的线性回归方程求总分年级名次关于数学总分的线性回归方程( (必要时用分数表示必要时用分数表示).).(2)(2)若石周卓婷同学想在下次的测试时考入年级前若石周卓婷同学想在下次的测试时考入年级前100100名名, ,预测
52、该同学预测该同学下次测试的数学成绩至少应考多少分下次测试的数学成绩至少应考多少分( (取整数取整数, ,可四舍五入可四舍五入).).ybxa.【解析】【解析】(1)(1)因为因为(2)(2)因为因为y=100,y=100,所以所以100=- x+533,100=- x+533,所以所以x128.x128.所以该同学下次测试的数学成绩至少应考所以该同学下次测试的数学成绩至少应考128128分分. .118 119 121 122x120,4133 127121 119y125.41717,125120533,5517x533.5 所以b所以a所以y1754.(20154.(2015贵阳模拟贵阳模
53、拟) )为了分析某个高三学生的学习状态为了分析某个高三学生的学习状态, ,对其下一阶对其下一阶段的学习提供指导性建议段的学习提供指导性建议. .现对他前现对他前7 7次考试的数学成绩次考试的数学成绩x x、物理成绩、物理成绩y y进行分析进行分析. .下面是该生下面是该生7 7次考试的成绩次考试的成绩. .数学数学888883831171179292108108100100112112物理物理949491911081089696104104101101106106(1)(1)他的数学成绩与物理成绩哪个更稳定他的数学成绩与物理成绩哪个更稳定? ?请给出你的证明请给出你的证明. .(2)(2)已知
54、该生的物理成绩已知该生的物理成绩y y与数学成绩与数学成绩x x是线性相关的是线性相关的, ,若该生的物若该生的物理成绩达到理成绩达到115115分分, ,请你估计他的数学成绩大约是多少请你估计他的数学成绩大约是多少? ?并请你根据并请你根据物理成绩与数学成绩的相关性物理成绩与数学成绩的相关性, ,给出该生在学习数学、物理上的合给出该生在学习数学、物理上的合理建议理建议.(.(其中其中, ,数据数据(x(xi i,y,yi i)(i=1,2,)(i=1,2,n),n)的线性回归方程为的线性回归方程为 niii 1n2ii 1xxyyxyx)xxyb a, b, a b【解析】【解析】(1)(1
55、)因为因为从而从而 ,所以该生的物理成绩更稳定,所以该生的物理成绩更稳定12 171788 12x 1001007 ,2269844 16y 1001007994250s142s77 数学物理,所以,22ss数学物理(2)(2)由于由于x x与与y y之间具有线性相关关系,之间具有线性相关关系,所以所以所以线性回归方程为所以线性回归方程为 0.5x0.5x50.50.当当y y115115时,时,x x130.130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高于物理成绩的进一步提高497b0.5,994aybx1000.5 10050,y规范解答规范解答1919 独立性检验与概率的综合应用独立性检验与概率的综合应用【典例】【典例】(12(12分分)(2015)(2015漳州模拟漳州模拟) )某旅行社为调查市民喜欢某旅行社为调查市民喜欢“人文景人文景观观”景点是否与年龄有关景点是否与年龄有关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理团队建设中的团队协作障碍
- 护理护理临床实习教学课件及教案制作
- 护理纠纷预防的员工赋能策略
- 护理实践中的护理科研项目管理
- 2006年7月国开电大行政管理本科《城市管理学》期末纸质考试试题及答案
- 护理教师竞赛教学方法
- 护理教师专业发展
- 医护合作护理说课比赛课件
- 基于循环经济的可充电电池生产技术研究
- 客户服务人员的职业发展路径规划
- 物业扭亏为盈工作汇报
- 2025广东中考短文填空公开课
- 《AutoCAD 2025中文版实例教程(微课版)》全套教学课件
- 化工设备的安全评估
- 21杨氏之子 课件
- 4.2依法履行义务 课 件 2024-2025学年统编版道德与法治八年级下册
- 2025年中山中考物理试题及答案
- 2024年贵州省普通高中学业水平选择性考试地理试题(原卷版+解析版)
- 办公室安全知识培训
- 《GNSS定位测量》考试复习题库(含答案)
- 塑料搅拌机安全操作规程
评论
0/150
提交评论