版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、空间统计分析主要用于数据分类和综合评价,而数据分类方法是任何GIS重要的组成部分。GIS中存储的数据具有原始性质,用户可以根据不同的实用目的,进行提取和分析。在大多数情况下,首先是将大量未经分类的数据输入信息系统数据库,然后要求用户建立具体的分类方法,以获得所需要的信息。综合评价模型是区划和规划的基础。一般经过四个过程:,评价因子的选择与简化; 多因子重要性指标(权重)的确定; 因子内各类别对评价目标的隶属度确定; 选用某种方法进行多因子综合。 根据统计学原理,复杂的多变量之间有许多是互相关联的,就有可能按这些关联关系进行数学处理达到简化的目的。 分类评价中常用的数学方法。,一、系统聚类分析
2、是一门多元统计分类法,根据多种地学要素对地理实体进行划分类别的方法。对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。 系统聚类的步骤一般是首先根据一批地理数据或指标找出能度量这些数据或指标之间相似程度的统计量;然后以统计量作为划分类型的依据,把一些相似程度大的站点(或样品)首先聚合为一类,而把另一些相似程度较小的站点(或样品)聚合为另一类,直到所有的站点(或样品)都聚合完毕,最后根据各类之间的亲疏关系,逐步画成一张完整的分类系统图,又称谱系图。其相似程度由距离或者相似系数定义。进行类别合并的准则是使得类间差异最大,而类内差异最小。 特点:事先无须知道分类对象
3、的分类结构,而只需要一批地理数据;然后选好分类统计量,并按一定的方法步骤进行计算;最后便能自然地、客观地得到一张完整的分类系统图。,什么是聚类分析?,簇(Cluster):一个数据对象的集合 在同一个类中,对象之间0具有相似性; 不同类的对象之间是相异的。 聚类分析 把一个给定的数据对象集合分成不同的簇; 聚类是一种无监督分类法: 没有预先指定的类别; 典型的应用 作为一个独立的分析工具,用于了解数据的分布; 作为其它算法的一个数据预处理步骤;,聚类的常规应用,模式识别 空间数据分析 在GIS中,通过聚类发现特征空间来建立主题索引; 在空间数据挖掘中,检测并解释空间中的簇; 图象处理 经济学
4、(尤其是市场研究方面) WWW 文档分类 分析WEB日志数据来发现相似的访问模式,应用聚类分析的例子,土地使用: 在一个陆地观察数据库中标识那些土地使用相似的地区; 城市规划: 根据类型、价格、地理位置等来划分不同类型的住宅; 地震研究: 根据地质断层的特点把已观察到的地震中心分成不同的类;,相似性度量,相异度矩阵(dissimilarity matrix)用来存储n个样本两两之间的相似性,表现形式是一个nn维的矩阵: d(Xi,Xj)是样本Xi和样本Xj间相异性的量化表示。 最明显的相似性度量是样本之间的距离。,在聚类分析中,最常用的距离定义如下: 最著名的距离度量标准是d维空间中的欧几里德
5、距离:d(Xi,Xj)( 2)1/2,相似性度量,例:对于一个4维向量X11,0,1,0 和X22,1,-3,-1, L1(X1,X2)(1+1+16+1)1/24.36 Lk(Xi,Xj)( 2)1/2,聚类算法即是先定义一个合适的度量,然后计算任意两个样本之间的距离。当两个样本之间的欧几里德距离小于某个阈值d0时,这两个样本就属于同一类。距离阈值d0影响簇的数量和大小,d0越小,每个簇就越小,簇的数目就越多。如果d0太大,则所有样本将会被分为同一簇;如果d0太小,每个样本又会单成一类。,地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度
6、与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?,二、主成分分析法,事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。,1、主成分分析的基本原理,假定有n个地理样本,每个样本共有p个变量,构成一个np阶的地理数据矩阵,当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维
7、处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。,定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标,系数lij的确定原则: zi与zj(ij;i,j=1,2,m)相互无关;, z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分。,从以
8、上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的荷载 lij( i=1,2,m; j=1,2 ,p)。 从数学上可以证明,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量。,2、计算步骤,(1)计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为:,(3.5.4),(2)计算特征值与特征向量: 解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ;, 分别求出对应于特征值的特征向量, 计算主成分贡献率及累计贡献率 贡献率:,累计贡献率:,一般取累计贡
9、献率达8595%的特征值 所对应的第一、第二、第m(mp)个主成分。, 计算主成分载荷 各主成分的得分:,*,*,例子:设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度。测量数据如表,双变量的原始数据,这就是说第一特征向量的方向由x1 = 0.66 和 x2 = 0.75两个数字控制,第二个特征向量的方向由x1 = 0.75 和 x2 = -0.66两个数字控制。矩阵的总方差为20.3+24.1=44.4,变量 x1 所占的比重为 20.3/44.4,占总方差的46%;第一主成分Z1的方差为37.9,第二主成分Z2的方差为6.5,二者之和为44.4。可见,两个主成分所代表的信息分别为86%
10、和14% 。主成分的表达式为 Z1 = 0.66 x1 + 0.75 x2 Z2 = 0.75 x1 0.66 x2 两个变量x1, x2用主成分Z1代表。 在具体应用这一方法时,一般先对原始数据进行标准化处理。这时数据的方差协方差矩阵即为原始数据的相关矩阵。,三、关键变量分析法 利用变量之间的相关矩阵,通过由用户确定的阈值,从数据库变量全集合中选择一定数量的关键独立变量,以消除其他冗余的变量。计算步骤为: 设有n 个数据点,每点有m 个变量,则多变量数据可以表示为: x11 x12 x1m x21 x22 x2m x = xn1 xn2 xnm 这些变量之间可用相关系数表示,它是将数据标准化
11、后的夹角余弦。其相关系数用 rij 表示。 式中,i、j = 1、2、 m; k = 1、2、 n,rij的取值范围是0 rij 1 。显然, rij的绝对值越接近于1,变量i与j 的关系越密切, rij 越接近于0,两者的关系越远。设置相关阈值t,则关键变量的分析过程为: 1、将相关矩阵上角线(ji)的所有元素 rij 的值取平方 rij = rij 2; 2、从相关矩阵中,选取 rij 值为最小的两个变量 i 和 j 作为两个独立的关键变量 3、其他与 i 、j 之间有联系,且相关系数的平方值大于 t 的所有变量均从变量表中排除出去。 4、其他与 i 、j 之间有联系,且相关系数的平方值为
12、最小的变量,选作独立的关键变量。同时将该变量有联系,且相关系数的平方值大于t 的所有变量均从变量表中排除出去。 5、依次继续下去,直到全部变量经过处理,或者关键变量已满足所需要的个数L,则过程结束。,四、判别分析 与聚类同属分类问题,不同的 是,判别分析是预先根据理论与实践确定等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法,对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统定级问题比较适用。,判别分析要求根据已知的地理特征值进行线性组合,构成一个线性判别函数Y,即: Y= C1*X1 + C2*X2 + Cm*Xm = Ck*Xk 式中, Ck(k=1,2, ,m)为判别函数,它可反映各要素或特征作用方向、分辨能力和贡献率的大小。只要确定了Ck,判别函数Y也就确定了。 Xk为已知要素的特征值。判别函数求出后,还需要计算出判别临界值,然后进行归类。,K=1,n,五、层次分析法 层次分析法(AHP,Analytic Hierarchy Process)是系统分析的数学工具之一,它把人的思维过程层次化、数量化,并用数学方法为分析、决策、预报或控制提供定量的依据。把相互关联的要素
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年新闻客户端基于阅读偏好的原生广告
- 2026年老年人起居有常与睡眠养生讲座
- 2026年室内设计实习生快速成长与转正核心能力培养
- 2026年车间物料堆放与标识管理规定
- 2026年绿色教育国际交流与合作项目
- 2026年医疗技术临床应用与授权管理制度
- 2026年商业场所背景音乐音量控制与噪音管理
- 2026年一级建造师民航机场工程考试真题卷含答案
- 2026年农田作物防冻害技术措施
- 2026年危险品运输企业安全隐患排查与奖惩细则
- 2026国家粮食和物资储备局招聘面试题库
- 2026年江苏苏锡常镇四市高三下学期二模英语试卷和答案
- 家庭食物中毒预防要点
- 17太空生活趣事多 课件(共19张)
- 2026秋招:重庆水务环境控股集团笔试题及答案
- 2025年黑龙江省事业单位招聘档案管理基本知识训练题及答案
- 2025年江苏苏海投资集团有限公司及下属子公司对外公开招聘工作人员57人备考题库附答案详解
- 2025江苏南京晓庄学院招聘体育专任教师2人(公共基础知识)测试题带答案解析
- DB32∕T 5267-2025 城市桥梁数字孪生监测系统设计标准
- 临时用电安全培训考试题及答案
- 急危重症患者评估
评论
0/150
提交评论