2025版高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系统计案例教学案文含解析北师大版_第1页
2025版高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系统计案例教学案文含解析北师大版_第2页
2025版高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系统计案例教学案文含解析北师大版_第3页
2025版高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系统计案例教学案文含解析北师大版_第4页
2025版高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系统计案例教学案文含解析北师大版_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE1-第四节变量间的相关关系、统计案例[考纲传真]1.会作两个相关变量的数据的散点图,会利用散点图相识变量间的相关关系.2.了解最小二乘法的思想,能依据给出的线性回来方程系数公式建立线性回来方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回来分析的基本思想、方法及简洁应用.1.相关性(1)线性相关若两个变量x和y的散点图中,全部点看上去都在一条直线旁边波动,则称变量间是线性相关的.(2)非线性相关若全部点看上去都在某条曲线(不是一条直线)旁边波动,则称此相关为非线性相关的.(3)不相关假如全部的点在散点图中没有显示任何关系,则称变量间是不相关的.2.最小二乘估计(1)最小二乘法假如有n个点(x1,y1),(x2,y2),…,(xn,yn)可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.(2)线性回来方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的线性回来方程,其中a,b是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(b=\f(\o(∑,\s\up13(n),\s\do14(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up13(n),\s\do14(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up13(n),\s\do14(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up13(n),\s\do14(i=1))x\o\al(2,i)-n\x\to(x)2).,a=\x\to(y)-b\x\to(x).))3.回来分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,(eq\x\to(x),eq\x\to(y))称为样本点的中心.(3)相关系数r①r=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2));②当r>0时,称两个变量正相关.当r<0时,称两个变量负相关.当r=0时,称两个变量线性不相关.4.独立性检验若一个2×2列联表为:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d则统计量χ2为:χ2=eq\f(nad-bc2,a+bc+da+cb+d).(1)当χ2≤2.706时,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.eq\o([常用结论])1.线性回来方程y=bx+a肯定过样本点的中心(eq\x\to(x),eq\x\to(y)).2.由回来直线求出的数据是估算值,不是精确值.[基础自测]1.(思索辨析)推断下列结论的正误.(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以说明为老师的教学水平与学生的水平成正相关关系. ()(2)某同学探讨卖出的热饮杯数y与气温x(℃)之间的关系,得回来方程y=-2.352x+147.767,则气温为2℃时,肯定可卖出143杯热饮. ()(3)因为由任何一组观测值都可以求得一个线性回来方程,所以没有必要进行相关性检验. ()(4)若事务A,B关系越亲密,则由观测数据计算得到的χ2的值越小. ()[答案](1)√(2)×(3)×(4)×2.(教材改编)为调查中学生近视状况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有劝服力()A.回来分析 B.均值与方差C.独立性检验 D.概率C[“近视”与“性别”是两类变量,其是否有关,应用独立性检验推断.]3.(教材改编)已知变量x与y正相关,且由观测数据算得样本平均数eq\x\to(x)=3,eq\x\to(y)=3.5,则由该观测数据算得的线性回来方程可能是()A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4A[因为变量x和y正相关,解除选项C,D.又样本中心(3,3.5)在回来直线上,解除B,选项A满意.]4.下面是2×2列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A.94,72 B.52,50C.52,74 D.74,52C[∵a+21=73,∴a=52.又a+22=b,∴b=74.]5.某校为了探讨学生的性别和对待某一活动的看法(支持和不支持两种看法)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”. ()附:P(χ2≥x0)0.1000.0500.0250.0100.001x02.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%C[因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.]相关关系的推断1.已知变量x和y满意关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关C[因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.]2.(2024·广州模拟)依据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的条形统计图.以下结论不正确的是()A.逐年比较,2008年削减二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈削减趋势D.2006年以来我国二氧化硫年排放量与年份正相关D[从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了许多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.]3.(2024·日照模拟)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()参考公式:线性相关系数r=eq\f(\o(∑,\s\up13(n),\s\do14(i=1))xi-\x\to(x)yi-\x\to(y),\r(\o(∑,\s\up13(n),\s\do14(i=1))xi-\x\to(x)2)\r(\o(∑,\s\up13(n),\s\do14(i=1))yi-\x\to(y)2))A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r1=r2C[由己知中的数据可知:第一组数据正相关,则相关系数大于零,其次组数据负相关,则相关系数小于零,故选C.][规律方法]判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回来方程中:b>0时,正相关;b<0时,负相关.线性回来分析及应用【例1】(2024·全国卷Ⅱ)如图是某地区2000年至2024年环境基础设施投资额y(单位:亿元)的折线图.为了预料该地区2024年的环境基础设施投资额,建立了y与时间变量t的两个线性回来模型.依据2000年至2024年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;依据2010年至2024年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.(1)分别利用这两个模型,求该地区2024年的环境基础设施投资额的预料值;(2)你认为用哪个模型得到的预料值更牢靠?并说明理由.[解](1)利用模型①,可得该地区2024年的环境基础设施投资额的预料值为y=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2024年的环境基础设施投资额的预料值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预料值更牢靠.理由如下:(i)从折线图可以看出,2000年至2024年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2024年的数据建立的线性模型①不能很好地描述环境基础设施投资额的改变趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2024年的数据对应的点位于一条直线的旁边,这说明从2010年起先环境基础设施投资额的改变规律呈线性增长趋势,利用2010年至2024年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的改变趋势,因此利用模型②得到的预料值更牢靠.(ⅱ)从计算结果看,相对于2024年的环境基础设施投资额220亿元,由模型①得到的预料值226.1亿元的增幅明显偏低,而利用模型②得到的预料值的增幅比较合理,说明利用模型②得到的预料值更牢靠.[规律方法]线性回来分析问题的类型及解题方法(1)求线性回来方程:①利用公式,求出回来系数b,a.②待定系数法:利用回来直线过样本点中心求系数.(2)利用回来方程进行预料:把回来直线方程看作一次函数,求函数值.(3)利用回来直线推断正、负相关:确定正相关还是负相关的是系数b.(2024·全国卷Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014(1)由折线图看出,可用线性回来模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回来方程(系数精确到0.01),预料2024年我国生活垃圾无害化处理量.附注:参考数据:eq\o(∑,\s\up13(7),\s\do14(i=1))yi=9.32,eq\o(∑,\s\up13(7),\s\do14(i=1))tiyi=40.17,eq\r(\o(∑,\s\up13(7),\s\do14(i=1))yi-\x\to(y)2)=0.55,eq\r(7)≈2.646.参考公式:相关系数r=eq\f(\o(∑,\s\up13(n),\s\do14(i=1))ti-\x\to(t)yi-\x\to(y),\r(\o(∑,\s\up13(n),\s\do14(i=1))ti-\x\to(t)2\o(∑,\s\up13(n),\s\do14(i=1))yi-\x\to(y)2)),回来方程y=a+bt中斜率和截距的最小二乘估计公式分别为:b=eq\f(\o(∑,\s\up13(n),\s\do14(i=1))ti-\x\to(t)yi-\x\to(y),\o(∑,\s\up13(n),\s\do14(i=1))ti-\x\to(t)2),a=eq\x\to(y)-beq\x\to(t).[解](1)由折线图中数据和附注中参考数据得eq\x\to(t)=4,eq\o(∑,\s\up13(7),\s\do14(i=1))(ti-eq\x\to(t))2=28,eq\r(\o(∑,\s\up13(7),\s\do14(i=1))yi-\x\to(y)2)=0.55,eq\o(∑,\s\up13(7),\s\do14(i=1))(ti-eq\x\to(t))(yi-eq\x\to(y))=eq\o(∑,\s\up13(7),\s\do14(i=1))tiyi-eq\x\to(t)eq\o(∑,\s\up13(7),\s\do14(i=1))yi=40.17-4×9.32=2.89,r≈eq\f(2.89,2×2.646×0.55)≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回来模型拟合y与t的关系.(2)由eq\x\to(y)=eq\f(9.32,7)≈1.331及(1)得b=eq\f(\o(∑,\s\up13(7),\s\do14(i=1))ti-\x\to(t)yi-\x\to(y),\o(∑,\s\up13(7),\s\do14(i=1))ti-\x\to(t)2)=eq\f(2.89,28)≈0.103,a=eq\x\to(y)-beq\x\to(t)≈1.331-0.103×4≈0.92.所以,y关于t的回来方程为y=0.92+0.10t.将2024年对应的t=9代入回来方程得y=0.92+0.10×9=1.82.所以预料2024年我国生活垃圾无害化处理量将约为1.82亿吨.独立性检验及应用【例2】(2024·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事务“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并依据列联表推断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)依据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828,χ2=eq\f(nad-bc2,a+bc+da+cb+d).[解](1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事务A的概率估计值为0.62.(2)依据箱产量的频率分布直方图得列联表箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466则χ2=eq\f(200×62×66-34×382,100×100×96×104)≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[规律方法]独立性检验的一般步骤(1)依据样本数据制成2×2列联表;(2)依据公式χ2=eq\f(nad-bc2,a+bc+da+cb+d),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计推断.(2024·合肥质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)依据抽取的180名学生的调查结果,完成下面的2×2列联表.并推断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附:χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(χ2≥x0)0.5000.4000.2500.1500.1000.0500.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828[解](1)从高一年级学生中随机抽取1人,抽到男生的概率约为eq\f(105,180)=eq\f(7,12).(2)依据统计数据,可得2×2列联表如下:选择自然科学类选择社会科学类合计男生6045105女生304575合计9090180则χ2=eq\f(180×60×45-30×452,105×75×90×90)=eq\f(36,7)≈5.1429>5.024,所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.(2024·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,其次组工人用其次种生产方式.依据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)依据茎叶图推断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论