




已阅读5页,还剩76页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章,统计案例,3.1回归分析的基本思想及其初步应用,自主预习学案,2015年4月25日尼泊尔发生了8.1级地震,此次地震系本世纪陆地第5次八级大地震,余震频繁而且震级还高,仅7级以上余震就发生了2次,你知道地震的震级与地震次数之间有什么关系吗?,相关关系,线性回归分析,相关系数r,当r0时,表明两个变量_;当r0时,表明两个变量_.r的绝对值越接近1,表明两个变量的线性相关性越_;r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系通常当|r|大于_时,认为两个变量有很强的线性相关关系,负相关,强,0.75,正相关,二、线性回归分析1随机误差(1)随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不能用一次函数ybxa来描述两个变量之间的关系,而是用线性回归模型_来表示,这里_称为解释变量,_称为预报变量,_称为随机误差,E(e)_,D(e)_(2)随机误差及其产生的原因从散点图中我们可以看到,样本点散布在某一条直线附近,而不是在一条直线上,所以不能用一次函数ybxa来描述它们之间的关系,我们用下面的线性回归模型来表示:ybxae,其中a、b为模型的未知数,e称为随机误差产生随机误差的主要原因有以下3个方面:,ybxae,x,y,e,0,2,用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型是什么)所引起的误差可能存在非线性的函数能更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差这种由模型近似所引起的误差包含在e中忽略了某些因素的影响影响变量y的因素不只变量x,可能还包括其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),它们的影响都体现在e中观测误差由于测量工具等原因,导致y的观测值产生误差(比如一个人的体重是确定的数,但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值,与真实值之间存在误差),这样的误差也包含在e中,残差,样本编号,贡献率,好,相关系数r,1在对两个变量x,y进行线性回归分析时,有下列步骤:对所求出的回归直线方程作出解释;收集数据(xi,yi),i1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()ABCD,D,解析对两个变量进行回归分析时,首先收集数据(xi,yi),i1,2,n;根据所搜集的数据绘制散点图观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是故选D,B,D,4为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()Al1和l2有交点(s,t)Bl1与l2相关,但交点不一定是(s,t)Cl1与l2必定平行Dl1与l2必定重合解析由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A,A,5下图是根据变量x、y的观测数据(xi,yi)(i1,2,10)得到的散点图,由这些散点图可以判断变量x、y具有相关关系的图是()ABCD解析根据散点图中点的分布情况,可判断中的变量x,y具有相关的关系,D,互动探究学案,命题方向1变量间的相关性检测,典例1,规律总结变量间是否具有线性相关关系,可通过散点图或相关系数作出判断,散点图只是粗略作出判断,用相关系数能够较准确的判断相关的程度,命题方向2求线性回归方程,典例2,规律总结1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,从图中看它们有无关系,关系的密切程度,再进行相关的回归分析2求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义,解析(1)散点图如图所示从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关,命题方向3线性回归分析,典例3,解析(1)作出该运动员训练次数(x)与成绩(y)的散点图,如图所示由散点图可知,它们之间具有相关关系,(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高,命题方向4非线性回归问题,典例4,思路分析作散点图,观察确定y与x的近似函数关系,作变量替换,列出新的对应值表求出对应的线性回归方程,再作变量替换得回归方程,解析根据测得数据作出散点图,如图,根据已有的函数知识,可以发现样本点分布在某一条幂函数型曲线Qh(、是待定的正常数)的周围为此将Qh两边取对数,得到lgQlghlg,令lgQy,lghx,于是式可化为yxlg.这样y就是x的线性函数了可以利用线性回归模型来建立y和x之间的线性回归方程ybxa(b,lga)了,规律总结1.在建立经验公式时,选择合适的函数类型是十分重要的通常是根据实验数据,画出散点图,从中观察其变化规律,并与已知函数的图象对比,看接近于什么函数,根据实践经验来决定选取公式的类型,所选的类型是否符合实际,还需要通过实践来检验有时候还需要选择不同的模拟函数作比较2如果观察散点图,发现点的分布不呈条状分布,而是与某种曲线相近,这时可选择这条曲线对应的函数作为拟合函数,作恰当变换,转化为线性函数,用线性回归模型求解,跟踪练习4以模型ycekx去拟合一组数据时,为了求出回归方程,设zlny,其变换后得到线性回归方程z0.3x4,则c_解析ycekx,两边取对数,可得lnyln(cekx)lnclnekxlnckx,令zlny,可得zlnckx,z0.3x4,lnc4,ce4.故答案为e4,e4,利用线性回归方程可以进行预报,线性回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制的依据,利用线性回归方程进行预报变量的估计(规律方法),典例5,C,解析(1)散点图如图所示,可以看出x和y具有线性相关关系,必须在两变量线性相关的条件下,才能用最小二乘法求回归直线方程,典例6,辨析此题解法是错误的,原因是这两个变量之间不是线性相关关系此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一线员工安全题库及答案解析
- 武大实验室安全测试题及答案解析
- 2025爆破安全员题库及答案解析
- 水利安全标准化考试题库及答案解析
- 护理笔试卫生类题型题库及答案解析
- 海事局岗前培训考试题及答案解析
- 建设安全员c证考试题库及答案解析
- 2025电工证考试题库及模拟考试答案(初级、中级、高级)
- 衡阳中专考试题目及答案
- 江西省上饶市余干县私立蓝天中学教育集团2025-2026学年高一上学期9月月考地理试题(含答案)
- 生产主管转正工作总结
- 2025至2030中国高纯铝行业发展趋势与行业发展研究与产业战略规划分析评估报告
- 会务理论考试题及答案
- 国家开放大学电大《课程与教学论》形考任务3试题及答案
- 商务英语口语900句
- 辽宁省沈阳市基层诊所医疗机构卫生院社区卫生服务中心村卫生室名单目录信息
- 锅炉空预器清洗方案
- SF∕T 0111-2021 法医临床检验规范
- 药敏试验结果的解读
- DB14∕T 1319-2021 公路工程标准工程量清单及计量规范
- 冶金行业应用产品介绍(应用)
评论
0/150
提交评论