全品高考备战2027年数学一轮学生用书03第59讲成对数据的统计分析【正文】听课手册_第1页
全品高考备战2027年数学一轮学生用书03第59讲成对数据的统计分析【正文】听课手册_第2页
全品高考备战2027年数学一轮学生用书03第59讲成对数据的统计分析【正文】听课手册_第3页
全品高考备战2027年数学一轮学生用书03第59讲成对数据的统计分析【正文】听课手册_第4页
全品高考备战2027年数学一轮学生用书03第59讲成对数据的统计分析【正文】听课手册_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第59讲成对数据的统计分析【课标要求】1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.

2.结合实例,会通过相关系数比较多组成对数据的相关性.

3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.

4.针对实际问题,会用一元线性回归模型进行预测.

5.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.一、经验回归分析1.两个变量相关性的判断(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)正相关与负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现的趋势,则称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现的趋势,则称这两个变量负相关.

(3)线性相关关系:两个变量的取值呈现正相关或负相关,而且散点落在附近,则称这两个变量线性相关.

(4)样本相关系数(i)计算:r=∑i=1n(ii)样本相关系数r的性质①当r>0时,称成对样本数据;当r<0时,称成对样本数据.

②当|r|越接近1时,成对样本数据的线性相关程度越;当|r|越接近0时,成对样本数据的线性相关程度越.

2.一元线性回归模型(1)线性经验回归方程:利用最小二乘法求得y=bx+a,其中b(2)评价回归模型的优劣:(i)利用残差平方和:∑i=1n(yi-yi)2(ii)利用残差图:残差点分布在以为对称轴的带状区域内,该区域越,拟合效果越好.

(iii)利用决定系数:R2=1-∑i=1n(二、独立性检验1.分类变量X,Y的2×2列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d记n=a+b+c+d,则随机变量χ2=n(ad-bc)2.独立性检验(1)定义:利用随机变量的取值推断两个分类变量X和Y是否的方法称为独立性检验.

(2)独立性检验的基本步骤①首先提出零假设H0:分类变量X和Y独立;②列出分类变量X和Y的抽样数据列联表;③利用公式计算随机变量χ2的值;④把计算得到的χ2的值与小概率值α相应的临界值表中的临界值xα比较.当χ2≥xα时,就推断H0不成立,即认为X与Y不独立,此推断犯错误的概率不大于α;当χ2<xα时,没有充分证据推断H0不成立,可以认为H0成立,即认为X与Y独立.题组一常识题1.[教材改编]以下是标号分别为①②③④的四幅散点图,它们的样本相关系数分别为r1,r2,r3,r4,那么样本相关系数的大小关系为(按由小到大的顺序排列).

2.[教材改编]某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表所示).年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到经验回归方程y=1.03x+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为.

3.[教材改编]某地发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.单位:只身体情况辐射强度合计高度辐射轻微辐射身体健康30A50身体不健康B1060合计CDE则A+B=,C+D=.

题组二常错题◆索引:利用经验回归方程分析问题时,将所得数据误认为是准确值;忽视经验回归直线必过点(x,y),但可能不过任何一个样本点;对于独立性检验的基本思想理解有误;不会根据小概率值判断两变量是否相互独立,什么时候相互独立.4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为y=0.85x-85.71,则下列结论中不正确的是.(填序号)

①y与x正关系;②经验回归直线过点(x,y);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录进行比较,提出零假设H0:这种血清不能起到预防感冒的作用,利用2×2列联表计算得χ2≈3.918,经查临界值表知x0.05=3.841,则下列结论中正确结论的序号是.

①认为“这种血清能起到预防感冒的作用”犯错误的概率不超过0.05;②若某人未使用该血清,则他在一年中有95%的可能性患感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.6.为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,提出零假设H0:患慢性气管炎与吸烟没有关系,并通过计算得到统计量χ2≈3.468,则可推断零假设H0.(填“成立”或“不成立”,附:P(χ2≥2.706)=0.1)

成对数据的统计相关性例1(1)(多选题)[2025·深圳一模]有一组样本数据(xi,yi),i∈1,2,3,…,100,其中xi>1895,∑i=1100xi=2×105,∑i=1100yi=970,求得其经验回归方程为y=-0.02x+a1,其残差为ei.对样本数据进行处理:令x'i=ln(xi-1895),得到新的数据(x'i,yi),求得其经验回归方程为y=-0.42x+a2,其残差为ui.已知ei,u A.x与y负相关B.a1=49.C.σ12D.处理后的决定系数变大(2)(多选题)人口问题始终是战略性、全局性的问题.2022年末我国人口比上年末减少85万人,为多年来的首次人口负增长,其中生育率持续降低受到了人们的广泛关注.为促进人口长期均衡发展,国家制定了一系列优化生育政策:2016年正式全面开放二孩;2021年实施三孩生育政策,并配套生育支持措施.为了了解我国人均GDPx(单位:万元)与总和生育率y以及女性平均受教育年限z(单位:年)的关系,采用2013~2022十年来的数据(xi,yi,zi)(i=1,2,…,10)绘制了如图所示的散点图,并得到经验回归方程z=7.54+0.33x,y=2.89-0.21x,记数据(xi,yi)的样本相关系数为r1,数据(xi,zi)的样本相关系数为r2,则 ()A.人均GDP和女性平均受教育年限正相关B.女性平均受教育年限和总和生育率负相关C.|r1|>|r2|D.假设人均GDP持续增长,则未来三年总和生育率一定会继续降低总结反思对两个变量的相关关系的判断有两个方法:(1)根据散点图进行判断,具有很强的直观性,直接得出两个变量是正相关或负相关,拟合效果的好坏也可由散点图直接判断;(2)计算样本相关系数法,样本相关系数能比较准确地反映相关程度,样本相关系数的绝对值越接近1,相关性就越强.变式题(1)[2025·天津河北区质检]已知r1表示变量x与y之间的样本相关系数,r2表示变量u与v之间的样本相关系数,且r1=0.836,r2=-0.958,则 ()A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性(2)某试验田种植了一批水稻,对其进行种植试验.在下表中记录了5组水稻的“播种面积”与“总产量”的相关数据并预测序号6的试验数据,若发现试验序号5的试验数据有误需剔除,则下列说法正确的是 ()试验序号123456播种面积(单位:千公顷)60.971.872.973.675.880.0总产量(单位:万吨)37.837.438.940.137.3未知A.试验样本数据的样本相关系数将变小B.试验样本数据的样本相关系数将不变C.试验序号6的预测结果将变大D.试验序号6的预测结果将变小一元回归模型角度1线性回归模型例2[2025·广东广州模拟]经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据数据作出如图所示的散点图,用x表示胸径,y表示树高.经计算得∑i=112xi=348,∑i=112yi=264,∑i=112x(1)推断两个变量是否线性相关,计算样本相关系数r(精确到0.01),并推断它们的相关程度;(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到0.01),并预测胸径为45cm的树高.附:样本相关系数r=∑i=1nxiyi-nxy∑i=1nxi

总结反思一元线性回归分析问题的解题步骤:(1)求经验回归方程.①根据散点图判断两变量是否线性相关(已知相关时不必再验证).②利用公式,求出系数b.③利用经验回归直线过点(x,y)求系数a.(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值作为预测值.变式题(1)已知某企业对新品按事先拟定的价格进行试销,得到的数据如下表.单价x/元405060708090销量y/件453938353023由表中数据,求得经验回归方程为y=-0.4x+a,下列说法错误的是 ()A.产品的销量和单价负相关B.该经验回归直线过点(65,35)C.样本点(60,38)的残差为-1D.当单价定为100元时,销量y估计为21件(2)某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下:研发投入x(亿元)12345产品收益y(亿元)3791011①计算x,y的样本相关系数r,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(附:若0.3<|r|<0.75,则线性相关程度一般;若|r|>0.75,则线性相关程度较高)②求出y关于x的经验回归方程,并预测若想产品收益超过20亿元,则需研发投入至少为多少亿元?(结果保留一位小数)参考公式:经验回归直线的斜率和截距的最小二乘估计公式,样本相关系数r的公式分别为b=∑i=1n(xi-x)(yi

角度2非线性回归模型例3[2025·泉州模拟]某团队从2024年10月份以来,通过深度整合算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的月收入(单位:百万元)的数据如下表.月份编号x1234567月收入y(百万元)611213466101196(1)根据以上数据在如图所示的坐标系中绘制散点图,并根据散点图判断y=ax+b与y=c·dx(a,b,c,d均为大于零的常数,d≠1)哪一个更适宜作为该团队月收入y与月份编号x之间的回归模型(给出判断即可,不必说明理由).并根据你的判断结果及表中的数据,求出y关于x的经验回归方程.(2)请你根据所求的经验回归方程,预测该团队下一个月的收入.(3)试从统计学角度分析,如果用所求的经验回归方程预测该团队接下来2年的经济收入情况是否合理?参考数据:∑i=17∑i=17v∑i=17xiy∑i=17xiv100.45100.5443510.79253550.122.823.47其中v=lgy,vi=lgyi.参考公式:经验回归方程v=βx+α中,β=∑i=1nxivi-

总结反思1.非线性回归分析问题的解题方法:借助散点图,确定合适的非线性回归模型,再通过变换,转化为求线性经验回归方程,最后还原.2.常见非线性经验回归方程的变换方法:y=a+b(x-c)2→y=a+bt(令t=(x-c)2);y=a+bln(x-c)→y=a+bt(令t=ln(x-c));y=a+bx-c→y=a+bt(令ty=a+bx→y=a+bt令y=a·bcx→lny=lna+cxlnb→z=m+nx变式题(1)[2025·广东江门新会华侨中学月考]已知x,y之间的一组数据如下表格所示.若y与x满足经验回归方程y=bx+a,则此曲线必过点x14916y12.985.017.01(2)[2025·齐鲁名校考试联盟4月模拟]每年3月20日是国际幸福日,节日的意义在于追求幸福,建设未来.某中学为纪念国际幸福日举办了幸福种植计划,一名同学记录了种子的发芽情况,如下表.天数x12345胚芽长度y(厘米)0.81.11.52.44.2通过对表中数据进行分析,分别提出了两个回归模型:①y=bx+a;②y=mx2+n.(i)根据以上数据,计算模型①中的y关于x的样本相关系数r(结果精确到0.01),若0.95≤|r|≤1,则选择模型①,否则选择模型②,试问应该选择哪个模型?(ii)根据(i)的结果,试建立y关于x的经验回归方程(系数精确到0.01),并预测第6天种子的胚芽长度.参考公式:经验回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=∑i=1n(xi-x)(yi参考数据:∑i=1n(xi-x)(yi-y∑i=1n(yi-y令ui=xi2,∑i=1n(ui-u)(yi-

独立性检验例4[2025·全国一卷]为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:单位:人是否患病超声波检查结果合计正常不正常患该疾病20180200未患该疾病78020800合计8002001000(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;(2)根据小概率值α=0.001的独立性检验,分析样本数据中超声波检查结果与是否患该疾病是否有关联.附:χ2=n(ad-bc)2(a+bα0.0500.0100.001xα3.8416.63510.828

总结反思独立性检验的一般步骤:第一步,提出零假设H0:两个分类变量A和B无关联;第二步,根据2×2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论