2023年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案理北师大版_第1页
2023年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案理北师大版_第2页
2023年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案理北师大版_第3页
2023年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案理北师大版_第4页
2023年高考数学一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案理北师大版_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节变量间的相关关系与统计案例[考纲](教师用书独具)1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的根本思想、方法及其简单应用.4.了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.(对应学生用书第165页)[根底知识填充]1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.(2)回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(b=\f(\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))(yi-\x\to(y)),\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))2)=\f(\o(∑,\s\up7(n),\s\do7(i=1))xiyi-n\o(x,\s\up7(-))\o(y,\s\up7(-)),\o(∑,\s\up7(n),\s\do7(i=1))x\o\al(2,i)-n\x\to(x)2),a=\x\to(y)-b\x\to(x).))3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(eq\o(x,\s\up7(-)),eq\o(y,\s\up7(-)))称为样本点的中心.(3)相关系数当r>0时,说明两个变量正相关;当r<0时,说明两个变量负相关.r的绝对值越接近于1,说明两个变量的线性相关性越强.r的绝对值越接近于0,说明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值〞表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量χ2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d)),其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量χ2来判断“两个分类变量有关系〞的方法称为独立性检验.[知识拓展]1.b的几何意义:表达平均增加或平均减少.2.由回归直线求出的数据是估算值,不是精确值.[根本能力自测]1.(思考辨析)判断以下结论的正误.(正确的打“√〞,错误的打“×〞)(1)“名师出高徒〞可以解释为教师的教学水平与学生的水平成正相关关系.()(2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件X,Y关系越密切,那么由观测数据计算得到的χ2的观测值越大.()[答案](1)√(2)√(3)×(4)√2.(教材改编)变量x与y正相关,且由观测数据算得样本平均数eq\x\to(x)=3,eq\x\to(y)=3.5,那么由该观测数据算得的线性回归方程可能是()A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4A[因为变量x和y正相关,排除选项C,D.又样本中心(3,3.5)在回归直线上,排除B,选项A满足.]3.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46那么表中a,b处的值分别为________.52,54[因为a+21=73,所以a=52.又因为a+2=b,所以b=54.]4.调查了某地假设干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到回归直线方程:y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均约增加________万元.0.254[由题意知回归直线的斜率为0.254,故家庭年收入每增加1万元,年饮食支出平均约增加0.254万元.]5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2的观测值k=eq\f(50×(13×20-10×7)2,23×27×20×30)≈4.844.那么认为选修文科与性别有关系出错的可能性为________.5%[χ2的观测值k≈4.844,这说明小概率事件发生.根据假设检验的根本原理,应该断定“是否选修文科与性别之间有关系〞成立,并且这种判断出错的可能性约为5%.](对应学生用书第166页)相关关系的判断(1)变量x和y满足关系y=-0.1x+1,变量y与z正相关.以下结论中正确的选项是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关(2)x和y的散点图如图9­4­1所示,那么以下说法中所有正确命题的序号为________.【导学号:79140333】图9­4­1①x,y是负相关关系;②在该相关关系中,假设用y=c1ec2x拟合时的相关指数为Req\o\al(2,1),用y=bx+a拟合时的相关指数为Req\o\al(2,2),那么Req\o\al(2,1)>Req\o\al(2,2);③x,y之间不能建立线性回归方程.(1)C(2)①②[(1)因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,那么z=by+a=-0.1bx+b+a,故x与z负相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1ec2x拟合比用y=bx+a拟合效果要好,那么Req\o\al(2,1)>Req\o\al(2,2),故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③错误.][规律方法]判定两个变量正、负相关性的方法1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.2相关系数:r>0时,正相关;r<0时,负相关.3线性回归直线方程中:b>0时,正相关;b<0时,负相关.[跟踪训练]某公司在2023年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,那么()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系C[月收入的中位数是eq\f(15+17,2)=16,收入增加,支出增加,故x与y有正线性相关关系.]回归分析(2023·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得eq\x\to(x)=eq\f(1,16)eq\o(∑,\s\up7(16),\s\do7(i=1))xi=9.97,s=eq\r(\f(1,16)\o(∑,\s\up7(16),\s\do7(i=1))(xi-\x\to(x))2)=eq\r(\f(1,16)(\o(∑,\s\up7(16),\s\do7(i=1))x\o\al(2,i)-16\x\to(x)2))≈0.212,eq\r(\o(∑,\s\up7(16),\s\do7(i=1))(i-8.5)2)≈18.439,eq\o(∑,\s\up7(16),\s\do7(i=1))(xi-eq\x\to(x))(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设|r|<0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(eq\x\to(x)-3s,eq\x\to(x)+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(eq\x\to(x)-3s,eq\x\to(x)+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=eq\f(\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))(yi-\x\to(y)),\r(\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))2)\r(\o(∑,\s\up7(n),\s\do7(i=1))(yi-\x\to(y))2)),eq\r(0.008)≈0.09.[解](1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数r=eq\f(\o(∑,\s\up7(16),\s\do7(i=1))(xi-\x\to(x))(i-8.5),\r(\o(∑,\s\up7(16),\s\do7(i=1))(xi-\x\to(x))2)\r(\o(∑,\s\up7(16),\s\do7(i=1))(i-8.5)2))≈eq\f(-2.78,0.212×\r(16)×18.439)≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于eq\x\to(x)=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(eq\x\to(x)-3s,eq\x\to(x)+3s)以外,因此需对当天的生产过程进行检查.(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为eq\f(1,15)(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.eq\o(∑,\s\up7(16),\s\do7(i=1))xeq\o\al(2,i)≈16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为eq\f(1,15)(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为eq\r(0.008)≈0.09.[规律方法]1.回归直线方程中系数的两种求法1利用公式,求出回归系数b,a.2待定系数法:利用回归直线过样本点中心求系数.2.回归分析的两种策略1利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.2利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数B.3.选择填空中选一组数据的线性回归直线方程的方法1过定点eq\x\to(x),\x\to(y),验证.2正、负相关看b的符号.3代入数据看误差大小.[跟踪训练]为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程y=bx+a;(2)假设每吨该农产品的本钱为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保存两位小数)参考公式:b=eq\f(\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))(yi-\x\to(y)),\o(∑,\s\up7(n),\s\do7(i=1))(xi-\x\to(x))2)=eq\f(\o(∑,\s\up7(n),\s\do7(i=1))xiyi-n\o(x,\s\up7(-))\o(y,\s\up7(-)),\o(∑,\s\up7(n),\s\do7(i=1))x\o\al(2,i)-n\x\to(x)2),a=eq\x\to(y)-beq\x\to(x).[解](1)由题知eq\x\to(x)=3,eq\x\to(y)=5,eq\o(∑,\s\up7(5),\s\do7(i=1))xiyi=62.7,eq\o(∑,\s\up7(5),\s\do7(i=1))xeq\o\al(2,i)=55,b=eq\f(\o(∑,\s\up7(5),\s\do7(i=1))xiyi-5\o(x,\s\up7(-))\o(y,\s\up7(-)),\o(∑,\s\up7(5),\s\do7(i=1))x\o\al(2,i)-5\x\to(x)2)=eq\f(62.7-5×3×5,55-5×32)=-1.23,a=eq\x\to(y)-beq\o(x,\s\up7(-))=5-(-1.23)×3=8.69,所以y关于x的线性回归方程为y=-1.23x+8.69.(2)年利润z=x(-1.23x+8.69)-2x=-1.23x2+6.69=-1.23eq\b\lc\(\rc\)(\a\vs4\al\co1(x-\f(6.69,2.46)))2+1.23×eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(6.69,2.46)))eq\s\up12(2),即当x=eq\f(6.69,2.46)≈2.72时,年利润z最大.独立性检验(2023·皖北名校联考)某医院对治疗支气管肺炎的两种方案A,B进行比拟研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:有效无效总计使用方案A组96120使用方案B组72总计32(1)完成上述列联表,并比拟两种治疗方案有效的频率;(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+D.P(χ2≥k0)0.050.0100.001k03.8416.63510.828[解](1)列联表如下:有效无效总计使用方案A组9624120使用方案B组72

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论