已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4讲 线性回归分析,2012年9月,城市规划数据分析方法,有趣的发现,英国著名的统计学家F.Galton及其弟子K.Pearson, 研究了1078对夫妇及其一个成年儿子的身高关系。他们以儿子身高作为纵坐标、夫妇平均身高为横坐标作散点图,结果发现二者的关系近似于一条直线。 经计算得到了如下方程:,由此方程可以看到 :夫妇平均身高增加或减少一个单位,儿子的身高只增加或减少 0.516个单位。也就是说,子代的身高就不像父辈身高那样分化 ,而是逐渐向平均身高回归 。Galton引进“回归”(regression)一词来表达这种变化关系。不过后来人们研究其它变量间的关系时,并没有发现如上所述的回归现象,但仍沿用 “回归” 的概念以纪念统计学家F.Galton。,“回归”,指在依据大样本数据作出的变量间关系的散点图中,可以找到一条特定的直线或曲线,这样就可以把这条直线或曲线叫做其它测量变量与被预测变量之间关系的回归线,它能够最理想的反映变量间的预测关系。,3.1 回归分析的目的,相关分析揭示了要素之间的相关程度。然而,诸要素之间关系的进一步具体化,譬如某一要素与其它要素之间的关系若能用一定的函数形式予以近似地表达,那么其实用意义将会更大。 回归分析方法,就是研究要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反映要素之间具体数量关系的数学模型,即回归模型。,3.2 一元线性回归,定义:假设有两个要素(变量)x和y,x为自变量,y为因变量。 一元线性回归模型的基本结构形式为 上式代表x与y之间相关关系的拟合直线,称为回归直线; 是y 的估计值,亦称回归值。 拟合的好坏程度用拟合优度(R2)度量,7,参数估计: 普通最小二乘法(ordinary least squares,OLS): 最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。 假定根据这一原理得到的、估计值为 、 ,则直线可表示为 : 参数检验,一元线性回归的步骤,利用散点图或相关分析确定两变量是否存在线性关系; 利用Excel、SPSS、Eview等软件计算回归方程的回归常数和回归系数,得到回归方程;,进行拟合优度检验。 判断回归方程对样本数据的代表程度。检验的方法是使用判定系数R2,取值范围在0R2 1。当其等于0时,x与y 没有任何关系;当其为1 时,回归线是完全拟合的,即所有散点均落在回归线上;其越接近于1,回归线拟合得越好。,GDP与人口,3.3 多元线性回归,一个事件往往存在两个或多个要素,它们之间也存在着相互影响、相互关联的关系。因此,多元线性回归模型更带有普遍性的意义。,为常数,称为回归系数,F检验回归方程拟合效果,GDP与人口,3.4 多项式回归(二次多项式回归),假设有两个要素(变量)x和y,x为自变量,y为因变量。 一元线性回归模型的基本结构形式为。,例:太阳光的紫外线随一日中时间的变化而变化,今测得某地 56 月份晴天一日内不同时间的紫外线强度如下,试作回归分析。 画散点图,可以看出,紫外线强度与一日内的时间大致呈抛物线关系,便可得到拟合方程。,3.5多项式回归(三次多项式回归),假设有两个要素(变量)x和y,x为自变量,y为因变量。 一元线性回归模型的基本结构形式为。,研究饲料的含磷量与饲料系数的关系,得如下数据,试进行回归分析 含磷量x% 0.35 0.77 1.04 1.36 1.70 饲料系数y 2.65 2.01 1.77 2.25 4.27 配置抛物线方程,得方程1: 增加高次方项,并进行优化筛选,得方程2: 显然,方程 2 要好于方程 1,两者的预测值也表明方程 2 要更接近于实测值:,多项式回归(二次多项式回归),假设有两个要素(变量)x和y,x为自变量,y为因变量。 一元线性回归模型的基本结构形式为。,3.5 非线性回归模型,非线性关系线性化的几种情况: 对于指数曲线 ,令 , 可以将其转化为直线形式: ,其中, ; 对于对数曲线 ,令 , ,可以将其转化为直线形式: ; 对于幂函数曲线 ,令 , ,可以将其转化为直线形式: 其中, ;, 对于双曲线 ,令 ,转化为直线形式: 对于S型曲线 ,可 转化为直线形式: 对于幂乘积: ,只要令 ,就可以将其转化为线性形式: 其中, ;, 对于对数函数和 只要令 ,就可以将其化为线性形式: 例:下表给出了某地区林地景观斑块面积(Area)与周长(Perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型 。,(1)作变量替换,令: , ,将上表中的原始数据进行对数变换,变换后得到的各新变量对应的观测数据如下表所示。,(2) 以x为横坐标、y为纵坐标,在平面直角坐标系中作出散点图。很明显,y与x呈线性关系。,(3)根据所得表中的数据,运用建立线性回归模型的方法,建立y与x之间的线性回归模型,得到: x与y的相关系数 高达0.9665。 (4)将上式还原成双对数曲线,即,事实上,有关研究表明(Li,2000;徐建华等,2001),景观形态具有分形特征,景观斑块的面积(Area)与周长(Perimeter)之间的数量关系都可以用双对数关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防花岗岩石墩施工方案
- 民治市政工程围挡施工方案
- 定做卷帘门施工方案
- 旋挖桩基导管施工方案
- 家庭酒厂建设施工方案
- 地基桩柱灌水施工方案
- 鹤壁水泥钢板库施工方案
- 酒店隔断门施工方案
- 挡墙灌缝施工方案
- 水性油墨地面施工方案设计
- 电梯安全管理人员管理制度
- 儿科转岗培训总结
- 《特种设备安全法》考试参考题库120题(含答案)
- 2025-2030中国电子级硫化氢(H2S)行业现状调查与前景策略分析报告
- 2025上海开放大学市场调查与预测记分作业一、二客观题答案
- 全科医生慢病管理
- 焊工入场考试试题及答案
- 《九州通医药公司应收账款管理现状、问题及对策》13000字(论文)
- 矿石百科知识儿童版
- 物业项目经理管理培训
- 辽宁省幼儿教师通识性知识大赛考试题库(含答案)
评论
0/150
提交评论