



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节 变量间的相关关系与统计案例 (全国卷5年2考) 【知识梳理知识梳理】 1.1.相关关系与回归方程相关关系与回归方程 (1)(1)相关关系的分类相关关系的分类 正相关正相关: :从散点图上从散点图上看看, ,点散布在从点散布在从_到到_ 的区域内的区域内; ; 左下角左下角右上角右上角 负相关负相关: :从散点图上看从散点图上看, ,点散布在从点散布在从_到到_ 的区域内的区域内. . 左上角左上角右下角右下角 (2)(2)线性相关关系线性相关关系: :如果散点图中点的分布从整体上看大如果散点图中点的分布从整体上看大 致在致在_附近附近, ,则称这两个变量之间具有线性相关则称这两个变量之
2、间具有线性相关 关系关系, ,这条直线叫做这条直线叫做_._. 一条直线一条直线 回归直线回归直线 (3)(3)回归方程回归方程 最小二乘法最小二乘法: :使得样本数据的点到回归直线的使得样本数据的点到回归直线的_ _最小的方法叫做最小二乘法最小的方法叫做最小二乘法. . 距离距离 的平方和的平方和 回归方程回归方程: :两个具有线性相关关系的变量的一组数据两个具有线性相关关系的变量的一组数据: : (x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),(x),(xn n,y,yn n),),其回归方程为其回归方程为 则则 ybxa, nn iiii i 1i 1 nn 2 2
3、2 ii i 1i 1 xxyyx ynxy ,aybx. xxxnx b 其中其中, , 是回归方程的是回归方程的_, _, 是在是在y y轴上的轴上的_._. ba 斜率斜率截距截距 (4)(4)样本相关系数样本相关系数 r= ,r= ,用它来衡量两个变量间的线性用它来衡量两个变量间的线性 相关关系相关关系. . 当当r0r0时时, ,表明两个变量表明两个变量_;_; 当当r0r0.75|r|0.75时时, ,认为两个变量有很强的线认为两个变量有很强的线 性相关关系性相关关系. . 越强越强 2.2.残差分析残差分析 (1)(1)残差残差: :对于样本点对于样本点(x(x1 1,y,y1
4、1),(x),(x2 2,y,y2 2),(x),(xn n,y,yn n),),它们它们 的随机误差为的随机误差为e ei i=y=yi i-bx-bxi i-a,i=1,2,n,-a,i=1,2,n,其估计值为其估计值为 i i=y=yi i- - i i=y=yi i- x- xi i- ,i=1,2,n, - ,i=1,2,n, i i称为相应于点称为相应于点 (x(xi i,y,yi i) )的残差的残差. . a e y be (2)(2)残差平方和为残差平方和为 (3)(3)相关指数相关指数:R:R2 2=1- _.=1- _. n 2 ii i 1 yy ) . ( n 2 i
5、i i 1 n 2 i i 1 (yy ) (yy) 3.3.独立性检验独立性检验 (1)2(1)22 2列联表列联表: :假设有两个分类变量假设有两个分类变量X X和和Y,Y,它们的值域它们的值域 分别为分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样本频数列联表其样本频数列联表( (称称2 22 2列列 联表联表) )为为: : y y1 1y y2 2总计总计 x x1 1a ab b_ x x2 2c cd dc+dc+d 总计总计a+ca+c_a+b+c+da+b+c+d a+ba+b b+db+d (2)K(2)K2 2统计量统计量 K K2 2= (= (其中其
6、中n=a+b+c+dn=a+b+c+d为样本容为样本容 量量).). 2 n adbc abcdacbd 【常用结论常用结论】 1. 1.函数关系与相关关系的区别与联系函数关系与相关关系的区别与联系 (1)(1)区别区别: : 函数关系是一种确定性关系函数关系是一种确定性关系, ,相关关系是一种非确定相关关系是一种非确定 性关系性关系. . 函数关系是一种因果关系函数关系是一种因果关系, ,相关关系不一定是一种因相关关系不一定是一种因 果关系果关系, ,也可能是伴随关系也可能是伴随关系. . (2)(2)联系联系: :对于线性相关关系对于线性相关关系, ,求出线性回归方程后求出线性回归方程后,
7、 ,可可 以通过确定的函数关系进行两个变量取值的预测以通过确定的函数关系进行两个变量取值的预测. . 2.2.回归直线及其方程的性质回归直线及其方程的性质 (1)(1)回归直线不一定过样本点回归直线不一定过样本点, ,但是一定过样本中心点但是一定过样本中心点 ( , ).( , ). (2)(2)在回归直线方程在回归直线方程 中中, 0, 0时时, ,两个变量呈正两个变量呈正 相关关系相关关系; 0; 00时时, ,为正相关为正相关, 0, 0,z=by+a,b0,则则z=by+a=z=by+a= -0.1b+b+a,-0.1b+b+a,故故x x与与z z负相关负相关. . 4.4.下列关系
8、中下列关系中, ,是相关关系的为是相关关系的为_.(_.(填序号填序号) (1)(1)学生的学习态度与学习成绩之间的关系学生的学习态度与学习成绩之间的关系. . (2)(2)教师的执教水平与学生的学习成绩之间的关系教师的执教水平与学生的学习成绩之间的关系. . (3)(3)学生的身高与学生的学习成绩之间的关系学生的身高与学生的学习成绩之间的关系. . (4)(4)家庭的经济条件与学生的学习成绩之间的关系家庭的经济条件与学生的学习成绩之间的关系. . 【解析解析】由相关关系的概念知由相关关系的概念知(1)(2)(1)(2)是相关关系是相关关系. . 答案答案: :(1)(2)(1)(2) 【规律
9、方法规律方法】 1.1.判断相关关系的两种方法判断相关关系的两种方法 (1)(1)散点图法散点图法: :如果所有的样本点都落在某一函数的曲如果所有的样本点都落在某一函数的曲 线附近线附近, ,变量之间就有相关关系变量之间就有相关关系. .如果所有的样本点都如果所有的样本点都 落在某一直线附近落在某一直线附近, ,变量之间就有线性相关关系变量之间就有线性相关关系. . (2)(2)相关系数法相关系数法: :利用相关系数判定利用相关系数判定,|r|,|r|越趋近于越趋近于1 1相关相关 性越强性越强. . 2.2.判断拟合效果的两个方法判断拟合效果的两个方法 (1)(1)残差平方和越小残差平方和越
10、小, ,拟合效果越好拟合效果越好. . (2)(2)相关指数相关指数R R2 2越大越大, ,越接近于越接近于1,1,拟合效果越好拟合效果越好. . 考点二独立性检验考点二独立性检验 【典例典例】(1)“(1)“人机大战人机大战, ,柯洁哭了柯洁哭了, ,机器赢了机器赢了”,2017,2017 年年5 5月月2727日日,19,19岁的世界围棋第一人柯洁岁的世界围棋第一人柯洁0303不敌人工不敌人工 智能系统智能系统AlphaGo,AlphaGo,落泪离席落泪离席, ,但许多人认为这场比赛是但许多人认为这场比赛是 人类的胜利人类的胜利, ,也有许多人持反对意见也有许多人持反对意见, ,有网友为
11、此进行有网友为此进行 了调查了调查, ,在参与调查的在参与调查的2 6002 600男性中男性中, ,有有1 5601 560人持反对人持反对 意见意见,2 400,2 400名女性中名女性中, ,有有1 1181 118人持反对意见人持反对意见, ,在运用这在运用这 些数据说明些数据说明“性别性别”对判断对判断“人机大战是人类的胜利人机大战是人类的胜利” 是否有关系时是否有关系时, ,应采用的统计方法是应采用的统计方法是( () ) A.A.分层抽样分层抽样B.B.回归分析回归分析 C.C.独立性检验独立性检验D.D.频率分布直方图频率分布直方图 (2)(2)为了研究为了研究“晚上喝绿茶与失
12、眠晚上喝绿茶与失眠”有无关系有无关系, ,调查了调查了 100100名人士名人士, ,得到下面的列联表得到下面的列联表: : 失眠失眠 不失眠不失眠 总计总计 晚上喝绿茶晚上喝绿茶161640405656 晚上不喝绿晚上不喝绿 茶茶 5 539394444 总计总计21217979100100 由已知数据可以求得由已知数据可以求得:K:K2 2的观测值的观测值k= k= 4.398,4.398,则根据下面临界值表则根据下面临界值表: : P(KP(K2 2kk0 0) )0.0500.0500.0100.0100.0010.001 k k0 03.8413.8416.6356.63510.82
13、810.828 2 100 (16 3940 5) 21 79 56 44 可以做出的结论是可以做出的结论是 ( () ) A.A.在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下认为的前提下认为“晚上喝晚上喝 绿茶与失眠有关绿茶与失眠有关” B.B.在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下认为的前提下认为“晚上喝晚上喝 绿茶与失眠无关绿茶与失眠无关” C.C.在犯错误的概率不超过在犯错误的概率不超过0.050.05的前提下认为的前提下认为“晚上喝晚上喝 绿茶与失眠有关绿茶与失眠有关” D.D.在犯错误的概率不超过在犯错误的概率不超过0.050.05的前
14、提下认为的前提下认为“晚上喝晚上喝 绿茶与失眠无关绿茶与失眠无关” 【解析解析】(1)(1)选选C.C.在参加调查的在参加调查的2 6002 600名男性中有名男性中有1 5601 560 名持反对意见名持反对意见,2 400,2 400名女性中有名女性中有1 1181 118名持反对意见名持反对意见, , 编写列联表如下编写列联表如下: : 反对意见反对意见不反对意见不反对意见总计总计 男性人员男性人员1 5601 5601 0401 0402 6002 600 女性人员女性人员1 1181 1181 2821 2822 4002 400 总计总计2 6782 6782 3222 3225
15、0005 000 是针对两个变量是针对两个变量, ,两种判断认定是否有关两种判断认定是否有关, ,因此应该利因此应该利 用独立性检验判断用独立性检验判断. . (2)(2)选选C.C.由已知数据求得由已知数据求得: : K K2 2的观测值的观测值k= 4.398,k= 4.398, 且且4.3983.841,4.3983.841, 所以在犯错误的概率不超过所以在犯错误的概率不超过0.050.05的前提下认为的前提下认为“晚上晚上 喝绿茶与失眠有关喝绿茶与失眠有关”. . 2 100 (16 3940 5) 21 79 56 44 【误区警示误区警示】此处容易混淆此处容易混淆“有多大的把握有多
16、大的把握”和和“犯犯 错误的概率不超过错误的概率不超过”两种问法两种问法, ,有多大的把握应为有多大的把握应为1-1- P( ),P( ),犯错误的概率则是犯错误的概率则是P( ).P( ). 2 0 k 2 0 k 【互动探究互动探究】 本例本例(1)(1)中中, ,试判断至少有多大的把握试判断至少有多大的把握 认为性别对判断认为性别对判断“人机大战是人类的胜利人机大战是人类的胜利”有关有关? ? 【解析解析】由本例由本例(1)(1)解析中的列联表可得解析中的列联表可得K K2 2的观测值的观测值 k= 90.31710.828,k= 90.31710.828,因因 此有此有99.9%99.
17、9%的把握认为性别对判断的把握认为性别对判断“人机大战是人类的人机大战是人类的 胜利胜利”有关有关. . 2 5 000 (1 560 1 282 1 040 1 118) 2 678 2 322 2 400 2 600 【规律方法规律方法】 独立性检验的一般步骤独立性检验的一般步骤 (1)(1)根据样本数据列出根据样本数据列出2 22 2列联表列联表. . (2)(2)计算随机变量计算随机变量K K2 2的观测值的观测值k,k,查下表确定临界值查下表确定临界值k k0 0: : P(KP(K2 2kk0 0) )0.500.500.400.400.250.250.150.150.100.10
18、 k k0 00.4550.4550.7080.7081.3231.3232.0722.0722.7062.706 P(KP(K2 2kk0 0) )0.050.050.0250.0250.0100.0100.0050.0050.0010.001 k k0 03.8413.8415.0245.0246.6356.6357.8797.87910.82810.828 (3)(3)如果如果kkkk0 0, ,就推断就推断“X X与与Y Y有关系有关系”, ,这种推断犯错这种推断犯错 误的概率不超过误的概率不超过P(KP(K2 2kk0 0););否则否则, ,就认为在犯错误的概就认为在犯错误的概 率
19、不超过率不超过P(KP(K2 2kk0 0) )的前提下不能推断的前提下不能推断“X X与与Y Y有关有关”. . 【对点训练对点训练】 1.1.有甲、乙两个班级进行数学考试有甲、乙两个班级进行数学考试, ,按照大于等于按照大于等于8585分分 为优秀为优秀,85,85分以下为非优秀统计成绩分以下为非优秀统计成绩, ,得到如表所示的得到如表所示的 列联表列联表: : 优秀优秀非优秀非优秀总计总计 甲班甲班1010b b 乙班乙班c c3030 总计总计105105 已知在全部已知在全部105105人中随机抽取人中随机抽取1 1人人, ,成绩优秀的概率为成绩优秀的概率为 , , 则下列说法正确的
20、是则下列说法正确的是( () ) A.A.列联表中列联表中c c的值为的值为30,b30,b的值为的值为3535 B.B.列联表中列联表中c c的值为的值为15,b15,b的值为的值为5050 2 7 C.C.根据列联表中的数据根据列联表中的数据, ,在犯错误的概率不超过在犯错误的概率不超过0.050.05的的 前提下前提下, ,能认为能认为“成绩与班级有关系成绩与班级有关系” D.D.根据列联表中的数据根据列联表中的数据, ,在犯错误的概率不超过在犯错误的概率不超过0.050.05的的 前提下前提下, ,不能认为不能认为“成绩与班级有关系成绩与班级有关系” 【解析解析】选选C.C.由题意知由
21、题意知, ,成绩优秀的学生数是成绩优秀的学生数是30,30,成绩非成绩非 优秀的学生数是优秀的学生数是75,75,所以所以c=20,b=45,c=20,b=45,选项选项A,BA,B错误错误. .根据根据 列联表中的数据列联表中的数据, ,得到得到K K2 2的观测值的观测值k= k= 6.1093.841,6.1093.841,因此在犯错误的概率不超过因此在犯错误的概率不超过0.050.05的前提的前提 下认为下认为“成绩与班级有关系成绩与班级有关系”. . 2 105 (10 30 20 45) 55 50 30 75 2.2.某工厂为了调查工人文化程度与月收入之间的关系某工厂为了调查工人
22、文化程度与月收入之间的关系, , 随机调查了部分工人随机调查了部分工人, ,得到如表所示的得到如表所示的2 22 2列联表列联表( (单单 位位: :人人):): 月收入月收入2 0002 000 元以下元以下 月收入月收入2 0002 000 元及以上元及以上 总计总计 高中文化以上高中文化以上101045455555 高中文化及以下高中文化及以下202030305050 总计总计30307575105105 由由2 22 2列联表计算可知列联表计算可知, ,我们有我们有_以上的把握认以上的把握认 为为“文化程度与月收入有关系文化程度与月收入有关系”. 附附:K:K2 2= = 2 n ad
23、bc abcdacbd 【解析解析】由表中的数据可得由表中的数据可得K K2 2的观测值的观测值 k= 6.109,k= 6.109,由于由于6.1095.024,6.1095.024, 所以我们有所以我们有97.5%97.5%以上的把握认为以上的把握认为“文化程度与月收入文化程度与月收入 有关系有关系”. . 答案答案: :97.5%97.5% 2 105 (10 30 45 20) 55 50 30 75 考点三线性回归方程考点三线性回归方程 【明考点明考点知考法知考法】 线性回归方程是高考的常考知识点线性回归方程是高考的常考知识点, ,在选择题、在选择题、 填空题、解答题中均有考查填空题
24、、解答题中均有考查, ,主要考查线性回归方程的主要考查线性回归方程的 求法及应用求法及应用. . 命题角度命题角度1 1线性回归直线性质的应用线性回归直线性质的应用 【典例典例】某食品研究部门为了了解一种酒的储藏年份某食品研究部门为了了解一种酒的储藏年份 与芳香度之间的相关关系与芳香度之间的相关关系, ,在市场上收集到了一部分不在市场上收集到了一部分不 同年份的该酒同年份的该酒, ,并测定了其芳香度并测定了其芳香度( (如表如表).). 年份年份x x0 01 14 45 56 68 8 芳香度芳香度y y1.31.31.81.85.65.6 7.47.49.39.3 由最小二乘法得到回归方程
25、由最小二乘法得到回归方程 =1.03x+1.13,=1.03x+1.13,但不小心但不小心 在检测后滴到表格上一滴检测液在检测后滴到表格上一滴检测液, ,污损了一个数据污损了一个数据, ,请请 你推断该数据为你推断该数据为 ( () ) A.6.1A.6.1B.6.28B.6.28C.6.5C.6.5D.6.8D.6.8 y 【解析解析】选选A.A. 由表中数据由表中数据: = (0+1+4+5+6+8)=4,: = (0+1+4+5+6+8)=4, 回归方程回归方程 =1.03x+1.13,=1.03x+1.13, 所以所以 =1.03=1.034+1.13=5.25,4+1.13=5.25
26、, 所以所以 = (1.3+1.8+5.6+?+7.4+9.3)=5.25,= (1.3+1.8+5.6+?+7.4+9.3)=5.25, 解得解得“?”=6.1.?”=6.1. x y y 1 6 y 1 6 【状元笔记状元笔记】 样本中心点的应用样本中心点的应用 回归直线过样本点中心是回归直线的重要性质回归直线过样本点中心是回归直线的重要性质, ,在求回在求回 归直线的系数、求未知数据中有着广泛的应用归直线的系数、求未知数据中有着广泛的应用. . 命题角度命题角度2 2回归直线方程的求法回归直线方程的求法 【典例典例】实验测得四组数对实验测得四组数对(x,y)(x,y)的值为的值为(1,2
27、),(2,5),(1,2),(2,5), (4,7),(5,10),(4,7),(5,10),则则y y与与x x之间的回归直线方程是之间的回归直线方程是( () ) A. =1.8x+0.6A. =1.8x+0.6B. =1.8x-0.6B. =1.8x-0.6 C. =1.5x+2.5C. =1.5x+2.5D. D. =-0.5x+7.5=-0.5x+7.5 y y y y 参考公式参考公式: : n ii i 1 n 2 i i 1 (xx)(yy) ,aybx. (xx) b 【解析解析】选选A.A.表中数据表中数据 (x(xi i- )(y- )(yi i- )=(1-3)(2-6
28、)+(2-3)(5-6)+(4-3)(7- )=(1-3)(2-6)+(2-3)(5-6)+(4-3)(7- 6)+(5-3)(10-6)=18,6)+(5-3)(10-6)=18, (x (xi i- )- )2 2=(1-3)=(1-3)2 2+(2-3)+(2-3)2 2+(4-3)+(4-3)2 2+(5-3)+(5-3)2 2=10,=10, 1245257 10 x3 y6 44 , 4 i 1 xy 4 i 1 x 所以所以 =1.8,=1.8, =6-3 =6-31.8=0.6.1.8=0.6. 则回归方程为则回归方程为: =1.8x+0.6.: =1.8x+0.6. n ii
29、 i 1 n 2 i i 1 xxyy xx b aybx 18 10 y 【状元笔记状元笔记】 关于回归直线方程的求法关于回归直线方程的求法 求线性回归方程的关键是计算系数求线性回归方程的关键是计算系数 , ,首先要明确公首先要明确公 式中各个因式的含义式中各个因式的含义, ,其次是充分利用合并、约分等运其次是充分利用合并、约分等运 算律简化运算算律简化运算. . b 命题角度命题角度3 3利用回归直线方程进行预测利用回归直线方程进行预测 【典例典例】某品牌手机厂商推出新款的旗舰机型某品牌手机厂商推出新款的旗舰机型, ,并在某并在某 地区跟踪调查得到这款手机上市时间地区跟踪调查得到这款手机上
30、市时间(x(x个月个月) )和市场占和市场占 有率有率(y%)(y%)的几组相关对应数据的几组相关对应数据: : x x1 12 23 34 45 5 y y0.020.020.050.050.10.10.150.150.180.18 (1)(1)根据上表中的数据根据上表中的数据, ,用最小二乘法求出用最小二乘法求出y y关于关于x x的线的线 性回归方程性回归方程. . (2)(2)根据上述回归方程根据上述回归方程, ,分析该款旗舰机型市场占有率分析该款旗舰机型市场占有率 的变化趋势的变化趋势, ,并预测自上市起经过多少个月并预测自上市起经过多少个月, ,该款旗舰该款旗舰 机型市场占有率能超
31、过机型市场占有率能超过0.5%(0.5%(精准到月精准到月). ). 【解析解析】(1)(1)根据表中数据根据表中数据, ,计算计算 = = (1+2+3+4+5)=3,(1+2+3+4+5)=3, = = (0.02+0.05+0.1+0.15+0.18)=0.1,(0.02+0.05+0.1+0.15+0.18)=0.1, 所以所以 = = =0.042,=0.042, 所以所以 =0.1-0.042=0.1-0.0423=-0.026,3=-0.026, 所以线性回归方程为所以线性回归方程为 =0.042x-0.026.=0.042x-0.026. x 1 5 y 1 5 b 22222
32、2 1 0.022 0.053 0.14 0.155 0.185 3 0.1 123455 3 a y (2)(2)由上面的回归方程可知由上面的回归方程可知, ,上市时间与市场占有率正上市时间与市场占有率正 相关相关, , 即上市时间每增加即上市时间每增加1 1个月个月, ,市场占有率都增加市场占有率都增加0.0420.042个百个百 分点分点; ; 由由 =0.042x-0.0260.5,=0.042x-0.0260.5,解得解得x13;x13; 预计上市预计上市1313个月时个月时, ,市场占有率能超过市场占有率能超过0.5%.0.5%. y 【状元笔记状元笔记】 线性回归方程的应用线性回
33、归方程的应用 求出线性回归方程后可以对变量的取值进行预测求出线性回归方程后可以对变量的取值进行预测, ,要注要注 意通过回归直线方程求出的数据不同于真实值意通过回归直线方程求出的数据不同于真实值, ,是预测是预测 值值. . 【对点练对点练找规律找规律】 1.1.为了规定工时定额为了规定工时定额, ,需要确定加工零件所花费的时间需要确定加工零件所花费的时间, , 为此进行了为此进行了5 5次试验次试验, ,得到得到5 5组数据组数据(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),(x),(x3 3, , y y3 3),(x),(x4 4,y,y4 4),(x),(x5 5
34、,y,y5 5),),根据收集到的数据可知根据收集到的数据可知 =20,=20,由由 最小二乘法求得回归直线方程为最小二乘法求得回归直线方程为 =0.6x+48,=0.6x+48,则则 y yi i= = ( () ) x y 5 i 1 A.60A.60B.120B.120C.150C.150D.300D.300 【解析解析】选选D.D.由题意由题意, =20, =20,回归直线方程回归直线方程 =0.6x+48,=0.6x+48, 所以所以 =0.6=0.620+48=60.20+48=60. 则则 y yi i=60=605=300.5=300. x y 5 i 1 y 2.2.登山族为
35、了了解某山高登山族为了了解某山高y(km)y(km)与气温与气温x()x()之间的关之间的关 系系, ,随机统计了随机统计了4 4次山高与相应的气温次山高与相应的气温, ,并制作了对照表并制作了对照表: : 气温气温x()x()181813131010-1-1 山高山高y(km)y(km)2424343438386464 由表中数据由表中数据, ,得到线性回归方程得到线性回归方程 =-2x+ ( R),=-2x+ ( R),由由 此请估计出山高为此请估计出山高为72(km)72(km)处气温的度数为处气温的度数为( () ) A.-10 A.-10 B.-8 B.-8 C.-4 C.-4 D.
36、-6 D.-6 y a a 【解析解析】选选D.D.由题意由题意, , 代入到线性回归方程代入到线性回归方程 =-2x+ ( R),=-2x+ ( R),可得可得 =60,=60, 所以所以y=-2x+60,y=-2x+60,由由-2x+60=72,-2x+60=72,可得可得x=-6.x=-6. 18 13 10 1 x10 4 , 24343864 y40 4 , y a a a 3.3.在成绩统计中在成绩统计中, ,我们把某个同学的某科考试成绩与该我们把某个同学的某科考试成绩与该 科班平均分的差叫某科偏差科班平均分的差叫某科偏差, ,班主任为了了解个别学生班主任为了了解个别学生 的偏科情
37、况的偏科情况, ,为学生数学偏差为学生数学偏差x(x(单位单位: :分分) )与物理偏差与物理偏差 y(y(单位单位: :分分) )之间的关系进行偏差分析之间的关系进行偏差分析, ,决定从全班决定从全班4040位位 同学中随机抽取一个容量为同学中随机抽取一个容量为8 8的样本进行分析的样本进行分析, ,得到他得到他 们的两科成绩偏差数据如下们的两科成绩偏差数据如下: : 学生学生 序号序号 1 12 23 34 45 56 67 78 8 数学数学 偏差偏差x x 2020151513133 32 2-5-5-10-10-18-18 物理物理 偏差偏差y y 6.56.5 3.53.5 3.5
38、3.5 1.51.5 0.50.5 -0.5-0.5 -2.5-2.5 -3.5-3.5 (1)(1)已知已知x x与与y y之间具有线性相关关系之间具有线性相关关系, ,求求y y关于关于x x的线性的线性 回归方程回归方程. . (2)(2)若这次考试该班数学平均分为若这次考试该班数学平均分为120120分分, ,物理平均分为物理平均分为 9292分分, ,试预测数学成绩试预测数学成绩126126分的同学的物理成绩分的同学的物理成绩. . 【解析解析】(1)(1)由题意计算得由题意计算得, = , = , = , = , 所以所以 xy 5 2 9 8 n ii i 1 n 2 2 i i
39、 1 x ynxy xnx b aybx 2 59 3248 1 28 , 5 4 1 2568 ( ) 2 9151 8422 , 所以线性回归方程为所以线性回归方程为 = x+ .= x+ . y 1 4 1 2 (2)(2)由题意由题意, ,设该同学的物理成绩为设该同学的物理成绩为, , 则物理偏差为则物理偏差为-92,-92, 而数学偏差为而数学偏差为126-120=6,126-120=6, 则由则由(1)(1)的结论可得的结论可得-92= -92= 6+ ,6+ , 解得解得=94,=94,所以可以预测这位同学的物理成绩为所以可以预测这位同学的物理成绩为9494分分. . 1 4 1
40、 2 数学能力系列数学能力系列2727解决相关变量之间的关系时的数解决相关变量之间的关系时的数 学建模能力学建模能力 【能力诠释能力诠释】数学建模能力是重要的数学能力数学建模能力是重要的数学能力, ,也是核也是核 心素养之一心素养之一, ,收集数据收集数据, ,建立模型建立模型, ,解决问题是最常用的解决问题是最常用的 数学思维和方法数学思维和方法. . 【典例典例】如图是我国如图是我国20112011年至年至20172017年生活垃圾无害化年生活垃圾无害化 处理量处理量( (单位单位: :亿吨亿吨) )的折线图的折线图. . 注注: :年份代码年份代码1-71-7分别对应年份分别对应年份20
41、11-20172011-2017 (1)(1)由折线图看出由折线图看出, ,可用线性回归模型拟合可用线性回归模型拟合y y与与t t的关系的关系, , 请用相关系数加以说明请用相关系数加以说明. . (2)(2)建立建立y y关于关于t t的回归方程的回归方程( (系数精确到系数精确到0.01),0.01),预测预测 20192019年我国生活垃圾无害化处理量年我国生活垃圾无害化处理量. . 附注附注: : 参考数据参考数据: y: yi i=9.32, t=9.32, ti iy yi i=40.17,=40.17, 7 i 1 7 i 1 7 2 i i 1 (yy)0.55, 72.64
42、6. 参考公式参考公式: :相关系数相关系数 n ii i 1 nn 22 ii i 1i 1 ttyy r, ttyy 回归方程回归方程 中斜率和截距的最小二乘估计公式中斜率和截距的最小二乘估计公式 分别为分别为: : yabt n ii i 1 n 2 i i 1 (tt)(yy) ,aybt. (tt) b 【解析解析】 (1) (1)由折线图中数据和附注中参考数据得由折线图中数据和附注中参考数据得 =4, (t=4, (ti i- )- )2 2=28,=28, (t (ti i- )(y- )(yi i- )= t- )= ti iy yi i- y- yi i =40.17-4=4
43、0.17-49.32=2.89,9.32=2.89, r= 0.99.r= 0.99. tt 7 i 1 7 2 i i 1 (yy)0.55, 7 i 1 ty 7 i 1 7 i 1 t 2.89 0.55 22.646 因为因为y y与与t t的相关系数近似为的相关系数近似为0.99,0.99,说明说明y y与与t t的线性相关的线性相关 程度相当高程度相当高, ,从而可以用线性回归模型拟合从而可以用线性回归模型拟合y y与与t t的关系的关系. . (2)(2)由由 1.3311.331及及(1)(1)得得 =1.331-0.103=1.331-0.10340.92.40.92. 9.
44、32 y 7 7 ii i 1 7 2 i i 1 (tt)(yy) 2.89 b0.103, 28 (tt) aybt 所以所以,y,y关于关于t t的回归方程为的回归方程为 =0.92+0.10t.=0.92+0.10t. 将将20192019年对应的年对应的t=9t=9代入回归方程得代入回归方程得 =0.92+0.10=0.92+0.109=1.82.9=1.82. 所以预测所以预测20192019年我国生活垃圾无害化处理量约为年我国生活垃圾无害化处理量约为1.821.82 亿吨亿吨. . y y 【技法点拨技法点拨】数学建模的过程数学建模的过程 (1)(1)建模准备建模准备: :了解问
45、题的实际背景了解问题的实际背景, ,明确其实际意义明确其实际意义, , 掌握对象的各种信息掌握对象的各种信息. . (2)(2)建模假设建模假设: :根据实际对象的特征和建模的目的根据实际对象的特征和建模的目的, ,对问对问 题进行必要的简化题进行必要的简化, ,并用精确的语言提出一些恰当的假并用精确的语言提出一些恰当的假 设设. . (3)(3)模型建立模型建立: :在假设的基础上在假设的基础上, ,利用适当的数学工具来利用适当的数学工具来 刻画各变量常量之间的数学关系刻画各变量常量之间的数学关系, ,建立相应的数学结构建立相应的数学结构. . (4)(4)模型求解模型求解: :利用获取的数
46、据资料利用获取的数据资料, ,对模型的所有参数对模型的所有参数 做出计算做出计算( (或近似计算或近似计算).). (5)(5)模型检验模型检验: :将模型分析结果与实际情形进行比较将模型分析结果与实际情形进行比较, ,以以 此来验证模型的准确性、合理性和适用性此来验证模型的准确性、合理性和适用性. . 【即时训练即时训练】 棉红铃虫又称红铃虫棉红铃虫又称红铃虫, ,是世界性重要害虫是世界性重要害虫, ,适宜温度为适宜温度为 252530,30,而温度在而温度在2020以下以下, ,或或3535以上对红铃虫以上对红铃虫 均不利均不利, ,一只红铃虫的产卵数一只红铃虫的产卵数y y与温度与温度x x有关有关, ,现收集了现收集了7 7 组观测数据列于表中组观测数据列于表中, ,现有模型现有模型y=Cy=C1 1x+Cx+C2 2与模型与模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论