




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四
章
相关分析与回归分析2城市系统是一个极其复杂的系统,系统各要素之间存在着相互联系,相互影响和相互制约。为了定量的研究它们之间的数量关系,常常采用相关分析法和回归分析法确定它们之间的关系和性质,并概括成数学模型,进而对城市系统作出预测。3内容第一节城市系统要素间的相关分析第二节一元回归模型的建立
第一节城市系统要素间的相关分析51.1基本概念1、相关:是指两个或两个以上变数间相互关系是否密切。自变量与因变量视实际需要来确定。2、相关分析的限定范围:相关分析仅限于测定两个或两个以上变数具有相关关系者。3、相关分析的目的:得到两个或两个以上变数间的相关程度和性质。在城市系统中大多数要素间是具有相关关系的,因此,相关分析在城市规划中得到了广泛应用。61.2系统各要素间相互关系分类
(设X、Y为两种要素)1、函数关系或完全相关:若y严格的随着x的变化而变化,称函数关系,如图,所有观测点均落在直线或曲线上。2、统计相关:两个要素之间具有相关关系,观测点均落在直线或曲线两旁。如图,要素间既存在较密切的关系,但又不能由一个(或几个)要素(或变量)的值精确地求出另一个要素(变量)的值。3、不相关:两个要素间相互独立,没有依存关系,所有观测点在图中分布状态散乱,无规律可寻。7图4-1系统各要素间的相互关系图81.3相关程度的度量方法
由于相关基本类型的不同,因而度量相关程度的指标也各异。1.3.1简单直线相关程度的度量---相关系数(r)
相关系数是用来度量直线相关程度和方向的指标。1
相关系数计算公式:9102相关系数性质:a、相关系数的分布范围介于-1≤r≤+1之间;b、当相关系数为正值时,表示两个要素(或变数)之间为正相关;相关系数为负值时,表示两个要素(或变数)之间为负相关;c、相关系数的绝对值∣r∣越大,表示两个要素相关程度越密切。具体情况如下:当r=+1时,为完全正相关;r=-1时,为完全负相关;r=0时,完全无关。在实际工作中,r总处于0~+1或-1~0之间,见图4-1。11例1:求全国城市化水平(y)与年份(t)的相关系数,数据如下表:t(年)
19831984198519861987198819891990199119921993y(%)20.4722.0223.3823.8924.6625.5126.0826.4126.7527.7928.912解:(1)列相关系数计算表:13(2)代入公式计算:
141.3.2多要素相关与相关矩阵(R)1、定义:把两个变量间的相关推广扩大为若干对变量间相关,并把它们的相关系数按矩阵方式列出,称之为相关矩阵。表示形式:矩阵与列表
15
相关矩阵必为正方矩阵,它对角线上各元素相关系数均为1(因是自相关),且主对角线上下三角形部分完全对称。2、意义:相关矩阵能帮助人们定量地判明各有关要素之间关系的密切程度。
16
例如,在分析居住小区居住密度时,通常可以有户/公顷(ha),居住面积密度,居住建筑面积密度,居住建筑密度,每人用地面积,人口净密度等指标来衡量。同时用以上指标来衡量,非常繁琐,工作量也大,可以根据各个指标之间存在着的一定相互关系,一个指标可以大体地代表另一个指标来加以取舍,选择最具有代表性的指标。调查统计十余个居住小区,取得上述指标,求两两之间的相关系数,列相关系数矩阵如下:
17
*自相关系数不参与平均。从表中得知:户/ha与其他指标间的相关最为密切,具代表性,但因家庭规模是不太稳定的值,故以第二密切的人口净密度指标作为居住密度指标(居住小区居住密度)。181.4相关系数的显著性检验
为了判定计算出来的相关系数是否有意义,通常要进一步对相关系数作显著性检验。为实用方便,前人已制定了相关系数检验表(见附表二)。其中n表示所使用资料(样本)的个数,α为信度,α越小,信度越高。
如例1:r=0.984,查附表二,当n-2=9,α=5%时,其临界相关系数rα=0.602;α=1%时,rα=0.735,可见|0.984|>0.602,且|0.984|>0.735,表明两者的线性相关程度已达到极显著水平,两者高度相关。19注意:r越大,并不表示相关程度就一定好,不能忽略样本的大小。
例1:n-2=5,α=5%时,其临界相关系数rα=0.754,如求得的r=0.7,则此相关系数没有意义,相关程度不显著;例2:n-2=100,α=5%时,其临界相关系数rα=0.195,如求得的r=0.4,则此例相关程度极显著。当相关系数经过显著性检验后,则可以对要素间的数量关系进一步作回归分析。20三种相关系数Pearson皮尔逊相关系数,计算连续变量或是说等间隔测度变量间的相关分析。Spearman斯皮尔曼相关系数,根据数据的秩求相关系数,即秩相关系数。Kendall’stau-b肯德尔相关系数,对两个有序变量或两个秩变量间的关系程度的测度,分析时考虑了节点(秩次相同)第二节一元回归模型的建立(两要素的回归分析与预测)
222.1一元(正态)线性回归模型2.1.1建立一元(正态)线性回归模型的基本思路假设两个要素(变量)x和y,x自变量,y因变量。假定一元线性模型结构为
yα=B0+B1xα+εα
式中,B0、B1为待定参数,α=1,2,…,n为n组观测数据,(x1,y1),(x2,y2),…(xn,yn),εα为随机变量。参数B0、B1为未知数,需根据yα
、xα观测值采用最小二乘法来估计。设b0、b1分别为参数B0、B1的最小二乘估计值,于是得一元线性回归模型为
上式代表x和y之间关系的最佳拟合直线,称为回归直线。23b0为常数,是y的截距;b1称回归系数,是直线的斜率(图5-2):(1)b1值的大小反映变化率的大小;
(2)b1值反映方向。
2425262.1一元(正态)线性回归模型2.1.2一元线性回归模型的具体建立方法和步骤
例2:为检查某城市商业网点配置是否合理,调查了10个居住小区,其居民户数(xi)和基层粮店数量(yi)见右表,求两者回归方程。
27解:(1)作散点图,求相关系数r:
n-2=8,取信度α=5%时,查表得其临界相关系数rα=0.632,可见|0.947|>0.632,表明两者的线性相关程度已达到极显著水平,两者高度相关,可作回归分析。28(2)计算b1,b0,求回归模型:
292.1一元(正态)线性回归模型2.1.3一元线性回归模型的效果检验1、回归模型估计的误差
由线性回归模型估计的值往往与实测值y不完全一致。由于用线性回归模型由x值估计值所产生的误差,称为回归方程估计的误差。剩余标准差(或标准估计误差)S是检验回归效果的重要标志,同时也是衡量预测精度的指标。S越小越好,在实际问题中,只要S≤允许的偏差就可以。
302、回归模型的显著性检验
n次观测值y1,y2,y3,…yn之间的差异,可用观测值yi与其算术平均值的离差平方和来表示,称为yi的总的离差平方和,记作
当样本n给定后,Q总是一个定值,于是Q剩余越大则Q回归越小。Q剩余越大说明剩余偏差越大,可能有某些因素的影响没有考虑进来,方程拟合得越差;相反,Q剩余越小,说明方程拟合得越好。31
此外,每个平方和都有一个自由度与其相联系。总平方和的自由度f总等于回归平方和的自由度f回与剩余平方和的自由度f剩之和,即
f总=f回+f剩
f总=n-1,n为样本数,1为因变量个数;
f回对应于自变量的个数,在一元回归方程中f回=1,故f剩=n-2。构造统计量F,
回归效果的好坏取决于Q回归在Q总中所占的比例的大小,该比值越大,即F越大,回归效果越显著;反之,亦反。这种将平方和和自由度同时进行分解,并用F检验法对整个回归方程进行显著性检验的方法,称方差分析。3334对回归方程的F检验可列成方差分析表进行:
若F≥Fα(1,n-2),则回归方程显著;若F<Fα(1,n-2),则回归方程不显著。说明:(1)影响y的除x外,还有其他不可忽视的因素;
(2)x、y非线性相关;
(3)x、y无关。方差分析表35例2:
(3)预测精度估计:若预测3500户的住宅小区当预报精度要求95%时,根据3σ原则,即说明3500户居住区设置5或6个粮店均正常。
363σ原则:对正态分布的随机变量来说,几乎可以认为它的取值范围总是落在区间(μ-3σ,μ+3σ
)之内,落在此区间之外几乎不可能。3σ原则37(4)作F检验:
定α=0.05,f回=1,f剩=8,查F分布表(附表4)
F0.05(1,8)=5.32,F>Fα,说明方程显著。表:方差分析表38作业:用例1的数据求年份(t)和城市化水平(y)两者的回归方程,并对回归方程作F检验。39答案:F0.05(1,9)=5.12,F>Fα,说明方程显著。402.2一元非线性回归模型的建立
2.2.1非线性回归关系、常见曲线及线性化处理1、幂指数函数(Power):(图5-7)
412、指数函数(Exponential):(图5-8)423、双曲线函数(Inverse):(图5-9)左:书本公式;右:SPSS公式
434、负指数函数:(图5-10)445、对数函数(Logarithmic):(图5-11)456、S曲线(S):(图5-12)
467、生长曲线(Growth):(图5-13)
47482.2一元非线性回归模型的建立2.2.2回归模型的建立例3:某市人口密度y(万人/平方公里),与市中心距离x(公里)抽样调查值如下,对其作非线性回归模型。NOX(km)Y(万人/km)102.8854222.1493333.4750451.3910570.9737690.704349解:
(1)作散点图:样本3数值突然增大,无法解释,可判断其为错误样本(奇异点)加以剔除。根据散点图,初步选定模型为指数函数。(2)线性化处理:50(3)列一元非线性回归计算表,求得:
51(4)求得,代入模型得方程:
522.2一元非线性回归模型的建立2.2.3
回归模型的效果检验
在非线性回归问题中,为表明所配曲线与实际观测数据间拟合的密切性,用相关指数R2对其进行检验。R2值越大(越靠近1)说明所配的曲线剩余离差小,曲线拟合越密切。例3:(5)检验:53若预测离市中心10公里处人口密度当预报精度要求95%时,根据3σ原则,
思考:计算S可否采用以下公式54总结:建立一元回归模型的步骤
试验调查,搜集样本值xi,yi(i=1,2,…,n);作散点图,直观判断是否线性相关;线性相关,则确定显著性水平,作相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国氯磺化聚乙烯(CSM)项目投资计划书
- 中国园林基质土肥项目投资计划书
- 中国奇农素螯合肥项目投资计划书
- 2025年中国锰项目创业计划书
- 中国石英玻璃项目商业计划书
- 中国二苯砜项目商业计划书
- 2025年中国软磁铁氧体项目投资计划书
- 淮南电器项目可行性研究报告
- 唐山市中医院辐射防护监测考核
- 中国醋酸锰二水合物项目投资计划书
- 河南省委党校在职研究生入学考试真题及答案
- 【MOOC期末】《中国马克思主义与当代》(北京科技大学)期末慕课答案
- 老年人静脉血栓栓塞症防治中国专家共识(2023版)解读
- GB/T 4744-2013纺织品防水性能的检测和评价静水压法
- JJF 1318-2011 影像测量仪校准规范-(高清现行)
- 小学信息技术五年级全册教案(全面完整版)
- 卫生部心血管疾病介入诊疗技术培训教材(共206页)
- DB36T 1267-2020 枳壳规范化生产技术规程_(高清版)
- 优才内经复习指导
- 2021年江苏徐州中考物理试卷附答案详解
- T∕CAMDI 047-2020 输液、输血器具用硬质聚氯乙烯(PVC)专用料
评论
0/150
提交评论