版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2一元线性回归模型及其应用第八章成对数据的统计分析学习目标1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.2.针对实际问题,会用一元线性回归模型进行预测.重点:一元线性回归模型参数的统计意义及求解方法,求一元线性回归模型,用一元线性回归模型进行预测.难点:最小二乘法,一元线性回归模型参数的求解,回归思想的建立.知识梳理一、一元线性回归模型生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表8.2-1所示.表8.2-1编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表8.2-1中的成对样本数据表示为散点图,如图8.2-1所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.图8.2-1思考:根据表8.2-1中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?在表8.2-1的数据中,存在父亲身高相同,而儿子身高不同的情况.例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm.可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.
我们称(1)式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.二、一元线性回归模型随机误差的产生原因在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.三、经验回归方程
四、残差分析
一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.五、用R2比较模型的拟合效果可以用决定系数R2来比较两个模型的拟合效果,R2的计算公式为在R2表达式中,
与经验回归方程无关,残差平方和与经验回归方程有关.因此R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.对R2的理解要注意以下三点(1)在一元线性回归模型中,R2=r2,因此0≤R2≤1,且在一元线性模型中,R2和r都能刻画用线性回归模型拟合数据的效果,|r|越大,即R2越大,用线性回归模型拟合数据的效果就越好,即相关程度越强.(2)当两个变量x,y非线性相关时,用拟合系数R2判断拟合效果,R2越大,拟合效果越好.(3)R2可以作为衡量任何模型拟合效果的一个指标,它越大,拟合效果越好.常考题型一、随机误差例1[2020·重庆高二期末]若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过 ()A.9亿元
B.9.5亿元 C.10亿元
D.10.5亿元【解析】因为财政收入x与支出y满足线性回归方程y=bx+a+e,其中b=0.7,a=3,所以得到y=0.7x+3+e,当x=10时,得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.故选D.【答案】D◆产生随机误差的原因1.所用的确定性函数不恰当引起的误差;2.忽略了某些因素的影响;3.存在观测误差.训练题在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0.85,则表明气温解释了
的热茶销售杯数变化,而随机误差贡献了剩余的
,所以气温对热茶销售杯数的效应比随机误差的效应大得多.85%15%二、一元线性回归模型BDA右下三、残差分析◆残差分析1.残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果.2.其步骤为(1)计算残差;(2)画残差图;(3)在残差图中分析残差特征.3.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.DCA0.06四、非线性回归模型◆解决非线性回归问题的步骤1.确定变量:确定解释变量为x,预报变量为y.2.画散点图:通过观察散点图,与学过的函数(幂函数、指数函数、对数函数、二次函数等)的图象比较,选取拟合效果好的函数模型.3.变量置换:通过变量置换把非线性问题转化为线性回归问题.4.分析拟合效果:(1)可以通过原始数据及y和x之间的非线性回归方程列出残差对比分析表,一般通过残差平方和比较两种模型的拟合效果,显然残差平方和较小的拟合效果较好;(2)还可以用相关指数R2来比较两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 楼房门窗、百叶制作安装工程技术标
- 定位与测量放线施工方案
- III-IV度会阴裂伤管理指南
- 防范金融风险专题宣传活动方案
- 反违章知识竞赛试题及答案(100题)
- 发展数字+餐饮实施方案
- 个人财务规划案例
- 遗嘱扶养合同协议书模板
- 新华人寿附加华丰 A 款意外伤害团体医疗保险条款
- 试论建筑工程管理的影响因素与对策
- 2026中国商用飞机公司招聘面试题库
- 4.1《致敬劳动者》课件 统编版道德与法治三年级下册
- 中考总复习数学100道基础题三大专题
- OpenClaw专题学习培训
- 融媒体新闻学课件
- 西安地产项目产品定位报告
- 杭州桐庐足球训练基地给排水工程监理细则
- DB13T 5448.11-2021 工业取水定额第11部分:食品行业
- 危大巡视检查记录表(深基坑)
- 材料调差自动计算表EXCEL
- 第五章---挤出成型
评论
0/150
提交评论