成对数据的统计分析讲义-2024届高三数学一轮复习_第1页
成对数据的统计分析讲义-2024届高三数学一轮复习_第2页
成对数据的统计分析讲义-2024届高三数学一轮复习_第3页
成对数据的统计分析讲义-2024届高三数学一轮复习_第4页
成对数据的统计分析讲义-2024届高三数学一轮复习_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE1第02讲成对数据的统计分析【必备知识】1、变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.2、样本相关系数(1)样本相关系数(2)当,成对样本数据正相关;当时,成对样本数据负相关.(3)当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.3、一元线性回归模型(1)经验回归方程为,其中.(2)残差分析①观测值:通过观测得到的数据.②预测值:通过经验回归方程得到的.③残差:观测值减去预测值的差.④残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.这方面的工作称为残差分析.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d4.独立性检验(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如表所示.则.(2)独立性检验当时,推断不成立,即认为和不独立,该推断犯错误的概率不超过α;当时,没有充分证据推断不成立,可以认为和独立.利用χ2的取值推断分类变量和是否独立的方法称为独立性检验,简称独立性检验.考点04相关关系的判断【常见方法】判断相关关系的方法:(1)回归方程法:利用回归方程中的系数的正负判断.(2)散点图法:如果所有的样本点都落在某一曲线附近,那么变量之间就有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系.(3)相关系数法:利用相关系数判断,|r|越趋近于1,相关性越强.【典例分析04】1、为了对变量x与y的线性相关进行检验,由样本点(x1,y1)、(x2,y2)、…、(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中正确的是()A.若所有样本点都在直线y=-2x+1上,则r=1B.若所有样本点都在直线y=-2x+1上,则r=-2C.若越大,则变量x与y的线性相关性越强D.若越小,则变量x与y的线性相关性越强2、下列命题中正确的为()A.线性相关系数r越大,两个变量的线性相关性越强B.线性相关系数r越小,两个变量的线性相关性越弱C.残差平方和越小的模型,模型拟合的效果越好D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好3、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx考点05线性回归方程角度01线性回归方程及其应用【常见方法】求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出x、y,xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n))、x1y1+x2y2+…+xnyn的值;(2)计算回归系数;(3)写出线性回归方程.注意:回归方程一定过点(x,y).【典例分析05】1、某食品厂2020年2月至6月的某款饮料生产产量(单位:万件)的数据如下表:月份x23456生产产量y/万件356.5810.5(1)根据以上数据,求y关于x的线性回归方程;(2)调查显示该年7月份的实际市场需求量为13.5万件,求该年7月份所得回归方程预测的生产产量与实际市场需求量的误差.参考公式:,.角度02相关系数及其应用【常见方法】1.模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好;(2)决定系数R2越大,模型的拟合效果越好;(3)回归方程的拟合效果,可以利用相关系数判断.当|r|越趋近于1时,两变量的线性相关程度越强.2.确定残差系数.其中是残差平方和,其值越小,则越大(接近1),模型的拟合效果越好.2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数,eq\r(2)≈1.414.角度03非线性回归分析【常见方法】非线性回归方程的求法(1)根据原始数据(x,y)作出散点图.(2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程.(4)在(3)的基础上通过相应变换,即可得到非线性回归方程.3、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量i(i=1,2,…,8)数据作了初步处理,得到如图所示的散点图及一些统计量的值.46.65636.8289.81.61.469108.8表中,.(1)根据散点图判断,与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.考点06独立性检验【常见方法】独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式计算.(3)如果,则“X与Y有关系”这种推断犯错误的概率不超过a;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.【典例分析06】1、甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论