版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
“统计分析”数据获取数据记录数据分析推断预测简单随机抽样分层抽样单一数据成对数据频数分布表频率分布直方图众数中位数平均数方差标准差样本估计总体散点图........样本相关系数........构建模型进行预测8.2.3
一元线性回归模型及其应用
格“数”致知,走向预测的远方复习回顾确定研究对象成对数据的统计相关性建立一元线性回归模型求出经验回归方程进行残差分析xY
散点图样本相关系数残差平方和残差图一元线性回归模型参数的最小二乘估计模型应用
模型诊断与修正单元结构在采伐设计、资源评估、森林规划调查等林业作业中,如何测算出一片森林的蓄积量?一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构胸径树高例1
经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据(如下表),试根据这些数据建立树高关于胸径的经验回归方程.编号123456789101112胸径/cm18.120.122.224.426.028.329.632.433.735.738.340.2树高/m18.819.221.021.022.122.122.422.623.024.323.924.7一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构1一、模型应用以胸径为横坐标,树高为纵坐标作散点图,得到下图.散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.树高与胸径以胸径为横坐标,残差为纵坐标,作残差图,得到下图.观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴,宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.单元结构求一元线性回归方程的步骤(1)描出散点图,通过散点图观察成对样本数据是否线性相关。(2)计算样本相关系数r,判断两个变量之间的线性相关关系。
(4)对回归方程作残差分析:残差表、残差图、残差平方和对模型刻画数据的效果进行分析。一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正例2
人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95单元结构一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正请同学们以小组为单位,用数学软件建立回归方程将经验回归直线叠加到散点图,得到下图:
用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为①单元结构一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正问题1
从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗?例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.单元结构——统计学家乔治·博克斯一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正问题2你能对模型进行修改,以使其更好地反映散点的分布特征吗?修改模型仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.函数y=-lnx的图象具有类似的形状特征.
注意到100m短跑的第一个世界纪录产生于1896年,因此可设非线性回归方程为:
y=f(t)=c1+c2ln(t-1895)
(其中c1、c2为未知参数,且c2<0).追问
如何利用成对数据估计参数c1和c2?
二、模型修正为了利用一元线性回归模型估计参数c1和c2,我们引进一个中间变量x,令x=ln(t-1895),,则Y=c2x+c1通过x=ln(t-1895),将年份变量数据进行变换,得到新的成对数据,如下表.编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95如果上表对应的散点图呈现出很强的线性相关特征,我们就可以借助一元线性回归模型和新的成对数据,对参数c1和c2作出估计,进而可以得到Y关于t的非线性经验回归方程.由散点图可知,现在散点的分布呈现出很强的线性相关特征,故可以一元线性回归模型建立经验回归方程.变量代换(非线性转化为线性)根据最小二乘法,可得将经验回归直线叠加到散点图,如图所示:将x=ln(t-1895)代入
得到由创纪录年份预报世界纪录的经验非线性回归方程:②问题3
对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?②单元结构①(1)直接观察法.(2)残差分析:
残差平方和越小,模型拟合效果越好.模型诊断:三、模型诊断一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正(3)用决定系数R2来比较这两个模型的拟合效果通过前面的讨论我们知道,当残差的平方和越小,经验回归模型的拟合效果就越好,故我们可以用决定系数R2来验证模型的拟合效果.决定系数R2的计算公式为残差平方和偏差平方和R2越大,表示残差平方和越小,即模型的拟合效果越好R2越小,表示残差平方和越大,即模型的拟合效果越差.显然0≤R2≤1,R2越接近1,则线性回归刻画的效果越好.单元结构一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正问题3
对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?②单元结构①(1)直接观察法.(2)残差分析:
残差平方和越小,模型拟合效果越好.(3)用决定系数R2:0≤R2≤1,R2越接近1,则线性回归刻画的效果越好.(4)用新的观测数据来检验模型的拟合效果.模型诊断方法:一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构问题4在上述问题情境中,男子短跑100m世界纪录和纪录创建年份之间呈现出对数关系,能借助于样本相关系数刻画这种关系的强弱吗?不能直接刻画,因样本相关系数用于衡量线性相关程度,需要先进行对数变换,将对数关系转换成线性关系之后,再采用样本相关系数去衡量.一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构总结:非线性回归问题的解决步骤画散点图
函数模型变换求解变换还原根据原始数据(x,y)画散点图.根据散点图,发现非线性相关特征,选择恰当的函数模型.进行恰当的变换,转化成线性函数,求经验回归方程.通过相应的变换,即可得非线性经验回归方程.模型分析分析模型的回归效果.一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正
非线性回归问题的处理方法(1)指数函数型y=eb
x+a①函数y=eb
x+a的图象,如图所示.②处理方法:两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.(2)对数函数型y=blnx+a①函数y=blnx+a的图象,如图所示.②处理方法:设x′=lnx,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.(3)y=bx2+a型处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.单元结构(1)根据生长在南方多雨地区的树高与胸径的数据建立的回归方程,可以用来描述北方干旱地区的树高与胸径之间的关系吗?(2)根据20世纪80年代父亲身高和儿子身高的数据建立的回归方程,可以用来描述现在的父亲身高与儿子身高的关系吗?(3)1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据建立的回归方程,用来预测2030年的男子短跑100m世界纪录合理吗?(4)根据经验回归方程得到的预报值是相应变量的精确值吗?问题5一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构在使用经验回归方程进行预测时,需注意以下问题:1.回归方程只适用于所研究的样本的总体;2.我们所建立的回归方程一般都有时效性;3.解释变量的取值不能离样本数据的范围太远;4.不能期望经验回归方程得到的预报值就是响应变量的精确值.事实上,它是响应变量的可能取值的平均值.一元线性回归模型参数的最小二乘估计模型应用模型诊断与修正单元结构四、课堂小结1、本节课用了哪些模型建立回归方程?2、对模型进行诊断的方法有哪些?3、如何对模型进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手机安规考试题及答案
- 摄影专业单招考试题及答案
- 全科医师儿科考试题库及答案
- 《GAT 749-2008 公安档案信息数据交换格式》专题研究报告
- 2026年深圳中考语文散文阅读专项试卷(附答案可下载)
- 病理科给临床的培训课件
- 2026年深圳中考物理命题趋势预测试卷(附答案可下载)
- 2026年大学大二(建筑学)建筑历史与理论阶段测试题及答案
- 2026年深圳中考生物眼球的结构和视觉的形成试卷(附答案可下载)
- 2026年深圳中考生物临考冲刺押题试卷(附答案可下载)
- 2026广西桂林医科大学人才招聘27人备考题库(第一批)及参考答案详解一套
- 2026年度黑龙江省生态环境厅所属事业单位公开招聘工作人员57人备考题库及答案详解一套
- 北京2025年北京教育科学研究院公开招聘笔试历年参考题库附带答案详解
- 2025至2030中国谷氨酸和味精行业深度研究及发展前景投资评估分析
- 老年患者心理护理实践
- 2026海姆立克急救法更新要点解读培训课件
- 2026年春教科版(新教材)小学科学三年级下册(全册)教学设计(附教材目录P131)
- 《创新与创业基础》课件-项目1 创新认知与思维培养
- 广东省汕头市金平区2024-2025学年九年级上学期期末物理试题(含答案)
- 临床用血技术规范2025年版与2000年版对照学习课件
- 人教版高二化学上册期末真题试题题库试题附答案完整版
评论
0/150
提交评论