空间数据分析分析解析_第1页
空间数据分析分析解析_第2页
空间数据分析分析解析_第3页
空间数据分析分析解析_第4页
空间数据分析分析解析_第5页
已阅读5页,还剩349页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

空间分析的概念与探讨进展1.空间分析的概念4种相互联系的空间分析概念:空间数据操作,空间数据分析,空间统计分析,空间建模.1.1空间数据操作主要应用于GIS中,包括缓冲区分析,距离,路径,面积计算及空间查询1.2空间数据分析空间数据描述性与探究性分析技术与方法,特殊是对规模浩大的数据集,通过数据图形化与地图化的探究性分析,探讨数据中潜在的模式,异样等,为后续分析做准备.1.3空间统计分析用统计的方法探讨空间数据的性质,这种统计方法与传统的统计分析方法不同.1.4空间建模建立模型预料空间过程与结果2空间分析的探讨进展线性回来是计量革命的核心技术,于是就出现了计量地理学,但计量地理学主要移植了统计分析方法,如相关分析,回来分析,聚类分析,因子分析,而对空间模式,空间过程,空间相互作用等理论与方法介绍的很少,因此受到了指责.1970-1980,空间分析方法发展中特别重要的时代,在这一时期围绕地理现象的空间本质或地理数据的空间性质,建立了地理学的空间分析方法与体系.1969年,Tobler提出了地理学第确定理:任何事物都是空间相关的,距离近的事物空间相关性大.Clifford在1973年出版的专著中揭示了空间自相关的概念,展示空间随机条件下如何检验回来误差,并揭示了空间加权矩阵的本质.1981年Ripley对空间点分布模式进行了探讨,提出了测度空间点模式的K函数方法,OpenShaw对空间数据中的可塑面积单元问题进行了深化探讨,这对正确运用空间数据及说明空间结果意义重大.Anslin提出描述局部相关性的测度方法与统计量,这一时期空间相关性的空间回来模型与空间自回来模型被提出,导致空间计量经济学的出现.20世纪90年头,空间分析的发展与GIS的发展紧密结合在一起,GIS为空间分析供应了广泛的数据源,空间分析集中体现在以下4个方面:1)GIS的数据革命极大地促进了空间分析在众多领域的应用.2)数据环境发生了巨大的变更,空间分析须要的海量数据,迫切须要新一代的以数据为驱动的地理探究与建模工具,使分析处理过程中多维困难性不被忽视.3)高性能计算机的出现,使困难数据处理的空间分析成为可能.4)神经网络,遗传算法成为空间分析的范例空间分析的探讨内容1)空间数据模型与地理世界的表示2)探究性空间数据分析与可视化3)空间数据的性质4)空间数据分析的点模式方法5)面数据的空间分析方法与空间回来模型6)空间连续数据的分析方法7)地图代数与栅格数据建模技术8)地理模型与决策支持第2章空间数据的性质2.1地理世界的概念模型与数据模型对现实世界进行高度抽象,概括其概念模型,然后建立适应于计算机存储与表示的数据模型.2.1.1地理世界的概念模型1)离散实体通过其独特的局部化特征相互区分,通过特定属性的个体被识别,如建筑物,街道等.离散对象观的重要特征是可以计数.维数是离散实体的显著特征,实体自然被抽象为点(只有位置的0维实体),线(具有长度属性的一维实体)和多边形(占据确定面积的2维实体).点,线与多边形的抽象与探讨与空间尺度有关,如大尺度时城市就是一个点,城市为探讨对象时就是一个多边形.具有连续变更的自然现象不适合用离散对象方法表示.空间对象的几何形态与属性特征共同构成地理信息的完整信息.属性特征常用表描述,表的一行是一个离散实体,一列是对象一个属性.离散对象也可以表示连续变更的场,如用等高线表示地形的连续起伏,线的稀疏表示空间变更的剃度.2)连续场(标量场与矢量场)用连续表面描述地理现象的方法叫场的观点,场的观点认为世界被很多变量描述,每一变量在任何可能的位置都是可测量的.连续场描述的是空间-时间框架下地理变量的空间变更.表示连续世界的空间数据模型都是某种程度的近似,这些模型包括:规则(不规则)的空间点,等值线,规则单元格,不规则三角网,及多边形等.点模型与线模型不能完整地表示场,因为所关切的地理变量的值只存在于特定的点或线的位置上.空间插值的方法将基于点或线的模型转化为基于面的模型,如三角网,多边形.不规则多边形表示场是常常运用的一种近似技术,如Thiessen多边形.提出及原理:荷兰气候学A·H·Thiessen提出依据离散分布气象站的降雨量计算平均降雨量的方法,即将全部相邻气象站连成三角形,作这些三角形各边的垂直平分线,每个气象站四周的若干垂直平分线便围成一个多边形。用这个多边形内所包含的一个唯一气象站的降雨强度来表示这个多边形区域内的降雨强度泰森多边形的特性是:1),每个泰森多边形内仅含有一个离散点数据;2),泰森多边形内的点到相应离散点的距离最近;3),位于泰森多边形边上的点到其两边的离散点的距离相等2.1.2GIS空间数据模型---矢量与栅格离散对象与连续场只考虑了地理现象的概念或方式,不能以数字的形式表示地理数据.1)栅格数据栅格表示中,地理空间被划分成矩形单元格矩阵,全部的地理变更通过对单元格赐予性质或属性来表示,但单元格内部的细微环节变更信息都丢失了,单元格有时被称为像素,如遥感影象是典型的栅格数据.最大份额法:当一个单元格是多个区域的交叉地域时,单元格中占面积份额最大的区域拥有这个单元格.中心点法:中心点所属区域拥有此单元格.2)矢量数据矢量数据表示中,全部的线通过点直线连接而成,区域通过一系列点之间的直线连接,用多折线表示曲线.矢量形式表示的区域:形成区域多边形顶点的点被获得,此方法表示区域比栅格简洁,因栅格表示多边形需列出全部单元格.2.1.3属性数据的测度地理信息中的属性特别广泛,有的是自然或环境的,有的是社会或经济的,区分属性信息的测度类型很重要.量测层次上将属性数据分为离散尺度或连续尺度,定性的或定量的.更具体的划分如下:变量类型空间表示点线面表示名义(=)案发地的分类道路是否在修补环境保护的功能区土地利用类型序数()区域中城镇按收入水平排序道路的等级分类城市中各县的收入水平土壤质量等级间距各城镇的产值份额河流的平均海拔高度城市中各县的产值份额地表温度比率连锁店销售额道路.河流长度区域的人均收入降水量名义属性:是对地理实体的分类,地理对象的名称是最好的例子,名义属性包括数字,文字,甚至颜色.对数字的名义属性进行运算没有任何意义.序数属性:序数属性的类型存在等级关系,序数属性的算术运算也没有任何意义.如区域收入等级划分.平均数无意义,中位数则有意义.间距属性:一个值对另一个值的差异幅度,而不是该值与真实零点之间的差值,因此数量关系的运算受到限制,加减运算有效,乘除无效.比率属性:数值与真实零点之间差异幅度的度量,两个比率数值之间的加减乘除运算是有效的,如100Kg人的重量是50Kg人的两倍.空间广延量(面积)与空间强度量(密度).此外还要留意数据的方向与周期.空间数据的性质空间数据的性质干脆影响空间分析与建模.1空间依靠性与空间异质性1.1空间依靠性空间上距离相近事物的相像性比距离远的事物的相像性大.其含义如下:空间某一位置i,某变量的值与其邻近位置j上的观测值有关,其形式为:假如地理现象是由一个过程及其表述的环境定义,过程表示现象基本因素的变更,环境表示现象的观测框架(空间与时间),空间依靠性表示环境对过程的重要影响.这样传统统计理论关于独立同分布的假设是不成立的.空间依靠性是通过空间自相关测度的,空间自相关的指标多样,可分为全局测度与局部测度.全局测度给出探讨区域整体的一个参数或指数局部测度供应与数据观测点等量的参数或指数1.2空间异质性异质性表明空间数据的变更不是平稳的,但在局部其变更可能是一样的,于是就出现了局部模型,但局部模型的应用会增加空间数据分析的误差与不确定性.空间每一点的地理要素之间存在不同的关系:如都是空间观测数据如房屋价格与CBD距离关系的空间异质性1.3可塑性面积单元问题与生态缪误面积单元对分析结果的影响,1)尺度效应:空间单元经聚合变更尺度大小时,空间数据的统计分析结果也会发生变更,且不同聚合方案得到不同的结果.2)划区效应:不同聚合方式对分析结果的影响.可塑性面积单元问题是由区域数量,规模,形态对空间数据分析的影响.P24有关两种效应的说明MAUP对政治也有影响.分析结果仅对所接受的面积单元有效,在其他尺度上无效,因此将某一尺度上的结果推广到其他尺度上将导致生态缪误.空间数据的不确定性空间数据的质量对建模分析,表示,结果及决策的正确性意义重大.空间数据运用者主要依靠二次数据源,且记录的时间误差也隐含在数据集中,空间数据的不确定性取决于误差结构随着地图上位置的而变更.如遥感数据虽然经过几何校正,但位置误差还是不匀整的.明确不确定性的类型,来源及产朝气制对提高空间数据质量,建立限制与修正机制意义重大.1.不确定性的类型1.1空间不确定性这种不确定性是由对象定义的主观性引起的,如不清晰的边界,空间对象的属性具有主观性.1.2对象定义的不确定性对象定义依靠于人为规定1.3关系不确定性生物量与测树因子的关系1.4分区问题气候类型区的划分,很多专家看法不一.2地理现象测度的不确定性2.1物理测量误差(高山海拔测量)2.2数字化误差2.3不同来源数据集整合时的误差3地理对象表示的不确定性3.1栅格数据表示的不确定性栅格数据将空间划分为等面积的单元格(像素),一个单元格不完全是一个属性构成,而包含了某几个属性,这样的单元格为混合元,但一个单元格只能有一个值,这样混合元的值为其优势值或中心点值.这样就会丢失某些信息,使栅格数据结构扭曲空间对象的形态.3.2矢量数据表示的不确定性(数据聚集引起)探究性空间数据分析与可视化1.EDAESDA与可视化EDA技术的特点是数据不做假设,而是利用统计图表,图形和统计概括方法对数据特征进行分析与描述,从而对数据进行更为困难的建模分析.ESDA技术是EDA的推广,空间数据存在自相关性,使数据无法满足独立性假设.1.1EDA与可视化基本方法包括两种类型:1)计算EDA,2)图形EDA技术1.1.1箱线图属性数据表不能反映总体特征,分布特征与相互之间关系,须要通过统计方法集中反映数据集中性,分散性,偏态性,异样性等.箱线图是反映属性数据这些特征的常用方法.1)中位数与分位数某一变量的n个记录为:数据的值从小到大进行排序中位数是从小到大排列数据中位于中间位置的数:中位数的本质是数据排列的位置,不受异样值的影响,比均值稳定.中位数反映数据的集中性,描述分散性的统计量是极差:分位数是另一种利用数据的位序描述数据的统计量,设p是[0,1)之间的一个数,有n个位序统计量,则p分位数为:是np位序位置上的数值,最常用的分位数:p=0.75,p=0.25,分别记为,其含义为小于的数据的个数分别占数据总数的75%和25%,因此也称为上,下四分位数.2)极差上下四分位数之间的差值为半极差(H):极差是度量数据分散性的指标.若数据序列符合正台分布总体,则其总体的上下四分位数为:当数据存在异样值时,标准差缺乏稳定性,因此可作为数据分散性的稳健度量.3)三均值4)异样数据与极端数据异样数据的推断标准:设A1,A2分别是异样数据的上下截断点,非异样数据的分布区间为:异样数据的分布范围为:异样数据中分别出极端数据的分布范围:以外的数据5)箱线图1.1.2茎叶图与直方图1)茎叶图的构造P39的数据,P40表示构造方法.2)茎叶图的行数选择依据数据个数n确定行数的方法有:3)直方图的区间宽度([f,xt]=hist(x,k))H为极差,L的计算见以上3式.1.1.3散点图与散点图矩阵1)散点图与变量之间关系的可视化P41的4组数据说明.2)散点图与异样点的分析bar(xt,f),3)散点图与不同类别的数据4)散点图矩阵探讨多个变量之间的关系,但只能探讨多个成对变量间的关系.5)平行坐标图具体方法是将相邻两坐标轴的间距设为等距,坐标轴之间平行的,就可以表示高维空间变量之间的关系.对于连续变量首先进行标准化,然后画平行坐标图.绘制方法:从y轴起先,做实轴的N个拷贝,标记为x1,x2,…,xN,等距放置并且垂直于x轴,N个轴都具有和y轴一样的正方向,点被表示成一条折线,其N个顶点位于轴上,从而建立了RN中的点与顶点分别在x1,x2,…,xN轴上的平面折线间的一一对应关系欧式空间与平行坐标空间的映射关系**点的对应关系欧式空间的点对应平行坐标的直线,如M(A,B)**线的对应关系在笛卡尔坐标系下的线由两点唯一确定,同理在平行坐标下的两点也确定一线,不过这时的线表示成一点,如ax+by=cESDA与空间数据可视化地图是空间数据可视化的重要手段,ESDA是将地图与各种统计图结合起来.1主题地图名义变量用独立值表示,但该数值不能进行任何运算.序数变量用等级符号与分层设色图表示.间隔变量与比率变量体现数据的连续变更,用等级符号,范围图表示.2主题地图表示的数据分类问题数据分类方法有:等间隔,等范围,自然分割法,分位数分类,自定义等.同一数据用不同的分类方法会产生不同的说明.分类须要留意的问题:1)包含全部范围的数据(最大与最小)2)运用不重叠的值和不空的类3)分类数量足够大以保证数据的精确性分类数量n:5)划分数据集到合理等价的观测组中6)假如可能给出一个逻辑数学关系P49的分类实例**应依据实际状况进行自定义分类空间点模式方法依据地理实体或时间的空间位置探讨其分布模式的方法为空间点模式1.点模式的概念及空间分析技术探讨区域R内的一系列点的组合是第i个观测事务的空间位置.点模式分为3种类型:聚集分布,随机分布,匀整分布.点模式的分析方法:1)以聚集性为基础的基于密度的方法,常用样方计数法和核函数法,2)以分散性为基础的基于距离的方法,常用最近邻指数,G-函数,F-函数,K-函数等.空间依靠性所产生的空间效应:1)一阶效应,描述某个参数均值的总体变更,即全局趋势2)二阶效应,是由空间依靠性产生的,表达的是邻近值相互趋同的倾向,通过与均值的偏差获得.一阶效应用点过程密度描述,在点s处单位面积内事务的平均数目.:点s四周一个足够小的领域,:内的事务数目二阶效应通过探讨区域中两个足够够小的子区域内事务数目之间的相互关系,基于密度的方法—样方计数法与核函数法1.样方计数法将区域划分为面积相等的子区域(样方),依据每一个样方中的事务数量计算与概括统计量,再将计算值除样方面积得点分布的密度.一般运用随机分布模式作为理论上的标准分布,然后将计算得到的点密度与理论分布作比较,推断点模式是属于聚集分布,匀整分布还是随机分布.样方形态,采样方式,样方起点、方向、大小都会影响到点的观测频次与分布.样方的形态与大小必需一样,以保证采样的匀整性.样方尺寸的计算公式为::样方面积,A:探讨区域面积,n:探讨区域中点的数量.观测频率与已知频率的显著性差异用K-S检验,1.1K-S检验通过比较观测频率分布与某一标准频率分布,确定观测分布模式的显著性.过程如下:1)假设两个频率分布之间不存在显著性差异.2)给出一个显著性水平a,如a=0.053)计算两个频率分布的累积频率分布4)计算K-S检验的D统计量,分别是两个分布的第i个等级上的累积频率.5)计算作为比较基础的门限值(m是样方数量)假如是两个样本模式的比较,则运用如下公式:m1,m2分别是两个样本模式的数量.6)假如计算得到的D值大于,则两个分布的差异在统计意义上是显著的.1.2实例(P62-P64)随机分布点模式是通过泊松过程产生,泊松分布公式:随机分布点模式:探讨区域中存在n个随机分布的点时,一个样方中恰好有1,2,…,k,…,n个点落入其中的概率分布,其含义是平均每个样方中包含的点的数量.概率计算的递推公式为:1.3方差均值比的X2检验泊松分布的重要特征是均值=方差=因此,X2检验是随机分布点模式的另外一种方法.方差均值比,假如空间点模式接近泊松分布,则1)基本原理:假设m个样方中分别有个事务的记数,然后定义统计量I(分散性指数):依据样方计数计算I,后将I与显著性水平为a的值进行比较,假如I显著大于表示聚集分布,反之表示匀整分布.还可以定义聚集性指数假如E(ICS)>0,表示聚集分布模式,反之表示规则分布模式.**样方计数法只能获得样方内的信息,不能获得样方内点之间的信息,有局限性(P66)1.2核函数方法地理事务可以发生在空间的随意位置上,不同位置上事务发生的概率不一样,点密集的区域事务发生的概率高.空间模式在点s上的密度通过探讨区域中单位面积上的事务数量来估计,最常用的方法是运用滑动的圆来统计落在圆域内的事务数量,再除以圆的面积,就得到点s处的事务密度.设s处的事务密度为,则:以s为中心,r为半径的圆域#表示事务S落在圆域C中的数量核密度估计的定义为:设X1,X2,…,Xn是从密度函数f的总体中抽取的样本,要依据这些样本对每一个x估计f(x)的值,f(x)的估计有参数与非参数估计问题,这里探讨非参数估计:用点把直线分成若干个小计数区间,这样计数区间的端点与宽度都是固定的,记Ni为样本点落在第i个区间[ai,ai+1)里的个数,则f(x)在[ai,ai+1)里的函数估计值为:假如对每个x各作一个以x为中心的小计数区间[x-h,x+h],再对落在该区间的样本点计数,设为N(x,h),则密度估计为:再引进函数则有加权模型事实上可以对这种矩形核函数放宽限制,只须要以下条件的K(x)都可以:对于一般的概率密度函数这些条件都满足.K():核函数,h>0,为宽度,(x-Xi):估计点到事务Xi处的距离.K()一般为概率密度函数,常用正态核函数,四次多项式核函数,匀整核函数等,h的选择很重要:取得太小,会增加随机的影响,使fn(x)波动较大,呈现出不规则的形态,取得太大,则x经过了(x-Xi)/h的压缩之后平均作用变得突出,会使得fn(x)过于平稳,灵敏性不好,一般来说在数据密集区,h选小一点,反之大一点.**h选择问题:1)核函数估计的边缘效应靠近探讨区域R边界的地方会扭曲核估计的边缘效应,因此在区域R的边界上建立一个警戒区,另外还可以边缘校正的核函数:计算样本向量x的概率密度估计,返回在xi点的概率密度f,运用plot(xi,f)就可以绘制出概率密度曲线2)实例ksdensity[f,xi]=ksdensity(x)f=ksdensity(x,xi),与上面相同,只是此时的xi已经给定基于距离的方法1.最邻近距离法运用最邻近点对之间的距离描述分布模式,形式上相当于密度的倒数,可看作是与点密度相反的概念.计算最邻近点对之间的平均距离,再比较观测模式与已知模式(随机模式)之间的相像性,当观测模式的最邻近距离大于随机模式的最邻近距离,则观测模式趋于匀整,否则趋于聚集.1.1最邻近距离随意一点到其最邻近点之间的距离。事务si的最邻近距离记为dmin(si),点对之间的最邻近距离不是相互的,但必定存在很多点对之间的最邻近距离是相互的.(P71)1.2最邻近指数测度方法1)计算随意一点到其最邻近点的距离(dmin)2)对全部的dmin依据模式中的点的数量n,求平均距离,3)在CSR模式中同样可以得到平均的最邻近距离,其期望为E(dmin),最邻近指数R定义为:考虑区域边界的修正,则:P为边界周长推断如下:1)当R=1,观测事务过程来自于完全随机模式,属于随机分布.2)R<1,表明大量事务点在空间上相互接近,属于空间聚集模式.3)R<1,表明事务模式中的空间点相互排斥趋向于匀整分布.另外还存在极端聚集,事务发生在区域的同一位置,这时R=0,极端匀整模式是均质区域上邻近的3个点构成等边三角形,这一分布模式的平均最邻近距离为,最邻近指数R=2.149.1.3显著性检验首先计算观测的平均最邻近距离与CSR的期望平均距离差,并与作比较,假如前者小于后者,则点模式属于CSR.否则相反理论上得到的标准差为这一标准差可构造一个听从N(0,1)的统计量:当显著水平为a时,Z的置信区间为假如Z>ZaorZ<-Za则观测模式与CSR之间存在显著差异.假如存在显著差异,则当Z为负数时,模式趋于聚集,否则趋于匀整.1.4实例G函数与F函数最邻近距离揭示空间点模式分布特征存在忽视最邻近距离分布信息的缺陷(P76所示是一种偏态分布与P75得到的匀整分布不一样).G函数与F函数是用最邻近距离的分布特征揭示空间点模式的方法.1.G函数G函数记为G(d),运用全部最邻近事务的距离构造出一个最邻近距离的累积频率函数:为探讨区域的一个事务,n是事务的数量,d是距离,#dmin(si)<=d:距离小于d的最邻近点的计数,随着d的增大,最邻近距离点积累个数也增加,G(d)也增加,0<=G(d)<=1计算G(d)的过程如下:1)计算随意一点到其最邻近点的距离dmin.2)将全部最邻近距离列表,并依据从小到大依次排序.3)计算最邻近距离的变程R和组距D,R=max(dmin)-min(dmin),k=1+Lg(n)/Lg(2),D=R/k,4)依据组距的上限值,累积计数点的数量,并计算累计频数G(d).5)画G(d)关于d的曲线图.G函数分析空间点模式的依据是G(d)曲线的形态,假如空间点分布计较聚集,则具有较小的最邻近距离的点数目就多,则G函数会在较短的距离内快速上升,G函数先平缓后快速增长,则是匀整分布模式.2.F函数F函数与G函数的思想一样,F函数在被探讨的区域内产生一新的随机点集是第i个随机点位置然后计算随机点到事务点S之间的最邻近距离,再沿用G函数的思想,计算不同最邻近距离上的累积点数和累积频率,公式为:随机选择的pi点到事务点S的最邻近距离,即任一随机点到其最邻近事务点的距离.**G函数与F函数的区分:G函数通过事务点之间的接近性描述分布模式,F函数是通过选择的随机点与事务之间的分散程度描述分布模式,F函数曲线缓慢增加到最大,表明是聚集,快速增加到最大表明是匀整分布模式.3.F函数与G函数的统计推断3.1.CSR过程中的G和F完全随机过程的泊松点过程,在最邻近距离变更范围内的某个距离d内,点的数量均值等于,在最邻近距离小于等于d时的累计概率分布为:*G(d)与CSR(G(d))推断点分布模式见P81*F(d)与CSR(F(d))推断点分布模式见P81*G-F坐标图推断点分布模式见P824显著性检验的随机模拟方法检验方法用蒙特卡罗随机模拟方法:首先在探讨区域R上利用蒙特卡罗随机模拟方法,产生m次的CSR点模式,并估计理论分布:是在R区域上模拟的n个CSR事务的m次独立随机模拟,且没有经过边缘校正的阅历分布函数的估计.为了评价观测模式与CSR模式差异的显著性,须要计算m次随机模拟中分布函数G的上界U(d)与下界L(d):画出及观测模式的假如观测模式与CSR一样,则画出的是直线,计算得到的模拟m次CSR阅历分布函数的上界与下界供应了与CSR差异显著性的方法,得到的概率公式为:显著性水平确定产生的随机模拟次数,假如G(d)函数曲线位于U(d)的上方,则观测模式为显著聚集,位于L(d)下放,则显著匀整,位于U(d)与L(d)之间,则与CSR(d)无显著差异.K函数与L函数最邻近距离只考虑了点在最短尺度上的关系,实际的地理事务可能存在多种不同的尺度作用,于是出现了基于二阶性质的K函数与L函数方法.1.K函数1.1定义与K函数估计K函数也是基于探讨区域R中全部事务间距离的方法。对于变量为一系列距离为d的K函数,计算的最简洁方法是依次在各个事务中心设置半径为d的圆,计算落入每个半径为d的圆内其它事务的数量,并计算出全部事务的平均数量。对于一系列d值这个过程不断重复.在探讨区域R内的两个点S1,S2的每一个领域内发觉至少一个点的概率(),忽视在一个领域中发觉多于一个点的概率,于是有:r是二阶性质的描述,引入一阶性质,有:是二阶性质与一阶性质比值,称为径向分布函数,或点对相关函数,将其记为:假如点过程是各向同性的,那么g(.)仅依靠于两个点S1与S2之间的距离d,记为g(d),若点过程又是独立分布的,则于是g(.)=1.1)定义点Si的近邻是距离小于等于给定距离d的全部点,近邻点数量的数学期望记为于是有:则K函数定义为:表示以随意点为中心,半径为d的圆域内点的数量.2)K函数的估计,a为探讨区域的面积.K(d)的计算过程如下:(1)对每一个事务设置一个半径为d的圆,(2)计算d距离内点的数量,(3)将全部事务d距离内点的数量求和,然后用n乘以密度,这样可得到每一个事务.(4)对随意距离d重复执行上述过程.3)K函数的边缘效应与校正当dij超出探讨区域范围时,需进行校正消退边缘效应.wij是较正因子,实际中周长校正法与面积校正法较常用,具体见有关文献.1.2K函数点模式判别准则假如点过程是相互独立的CSR,对于全部的有,且,或,比较就能建立判别空间点模式的准则.,表示d距离上和CSR过程事务的期望值相同.2),表示d距离上点的数量比期望数量多,d距离上的点是聚集的.,状况与上相反.1.3实例P86L函数K函数在运用上不敏捷,于是就提出了L函数,CSR模式中,L(d)=0,因此L函数更简洁比较观测值与CSR模式的理论值之间的差异.L函数中,正峰值表示点在这一尺度上聚集负的峰值表示点的匀整分布.(P87)蒙特卡罗方法:所求解问题是某种随机事务出现的概率,或者是某个随机变量的期望值时,通过某种“试验”的方法,以这种事务出现的频率估计这一随机事务的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。三个主要步骤:1)构造或描述概率过程对于原来不是随机性质的确定性问题,比如计算定积分,就必需事先构造一个人为的概率过程,它的某些参量正好是所要求问题的解。即要将不具有随机性质的问题转化为随机性质的问题。2)实现从已知概率分布抽样(0,1)上的匀整分布3)建立各种估计量实现模拟试验后,要确定一个随机变量,作为所要求问题的解2.1显著性检验---蒙特卡罗方法观测值与理论值的比较给出了点模式的判别准则,但无法给出显著性检验.原理如下:按CSR过程生成m次的分布数据,计算每一次CSR过程的L(d),假如的观测值小于给定的d尺度上对应CSR过程中的最小值或大于最大值时,可判点模式在这一尺度上显著异于CSR.具体过程如下:1)依据CSR过程,创建于观测事务模式数量相同的点,2)计算,3)以上两步骤重复n,4)对于每个d,确定最小与最大的模拟值5)依据最大与最小的,画出的包迹线.2.2实例P89K函数方法的扩展--二元模式与时间空间模式当考虑某种类型的事务聚集分布与其他类型事务聚集有关时,若两事务模式趋于比期望的两个独立模式更接近时,则在空间上相互吸引,否则相互排斥.由于地理过程的动态性,随着时间的变更,事务发生在不同的点上,引起对时间-空间聚集性的探究.1.两元模式与交叉K函数设观测的第一类事务为案例事务,共有n1个,其次类事务为环境异质性的限制事务,共有n2个.将两个事务合并在一起,希望n1个案例事务随机地附在两个事务的组合中,是事务的一个随机标记,在随机标记的条件下,证明白案例事务K11函数与限制事务的K22函数完全相同,用此结果探讨二元模式的空间集聚性问题.交叉K函数定义为:或S1是模式2中以随意事务S2i为中心,距离d为半径的范围内第一个模式中事务的数量.不管两个事务模式基本分布如何,假如相互之间是独立的,则交叉K函数与CSR的相同2.D函数在CSR条件下,K11(d)=K22(d)=K12(d),于是将两个事务合并为一个点集,计算案例事务样本与限制事务样本K函数的差异,定义一个D函数检验案例事务是否有显著的聚集性:当,环境的空间异质性存在,案例事务在尺度d上聚集,环境的空间异质性存在,案例事务在尺度d上匀整.3.显著性检验1)案例事务(S1)与限制事务(S2)组合为一个点集.2)在组合的点集中随机抽取n1个事务样本模拟案例事务.3)依据模拟案例事务与限制事务,计算4)重复m次,5)获得随机模拟的最大与最小的依据以上准则,就可推断案例事务与限制事务的空间点模式.4.实例P915.空间-时间模式与D函数对每一个事务附加一个时间标记,于是空间-时间K函数定义为:事务的空间密度,事务的时间密度,在时间间隔t内,以随意点Si为中心,d为半径的距离内事务数量的期望.假如运行在时间与空间上的过程是独立的,则K(d,t)=K(d)K(t).这时的D函数为:面状数据空间模式分析方法空间接近性与空间权重矩阵1.空间接近性空间接近性实质上是面积单元之间的距离关系,而接近程度用空间权矩阵描述.1.1边界邻接法面积单元之间具有共享的边界,称为是空间接近的,用边界邻接定义一个面积单元的干脆邻接,后依据临界的邻接关系定义间接邻接或多重邻接.1.2重心距离法(P95中图5.2的说明)面积单元的重心或中心之间的距离小于某个指定的距离,则面积单元在空间上是接近的.2.空间权重矩阵假设探讨区域中有n个多边形,随意两个多边形都存在一个空间关系,这样就有n*n对关系,须要n阶矩阵存储这些空间关系.2.1二元邻接矩阵共享边界定义邻接:重心距离法也可以类似的定义:这样构成的权重矩阵称为二元邻接矩阵.二元邻接矩阵的性质:1)对角线元素cii=0;2)矩阵具有对称性,cij=cji;3)矩阵的行元素和等于该空间单元干脆邻居的数量;高阶形式的二元邻接矩阵,考虑随意一个面积单元的三阶最近邻,则得接近性矩阵W,这是一个非对称的接近性矩阵,矩阵各行求和值等于该行对应面积单元的3阶近邻数量.2.2行标准化权重矩阵行和记为Ci,Wij=Cij/Ci.2.3重心矩阵与权重矩阵(距离描述近邻关系)一般接受二次方的倒数.面状数据的趋势分析1.空间滑动平均空间滑动平均:利用近邻面积单元的值计算均值的一种方法.设区域R中有m个面积单元,对应于第j个面积单元的变量Y的值为yj,面积单元i邻近的面积单元数为n,则滑动平均公式:或2.中位数光滑当数值中存在离群值时,中位数更加稳定.一个变量的空间分布可看作是多种因素影响下的空间过程的一个实现,这个空间过程包含了全局趋势,局部效应和随机误差.变量yij分解为::总趋势,:行和列效应或局部效应总的均值为:中位数光滑算法的一般过程如下:1)将每一行的中位数记录在该行的边上,并在每一行中减去中位数.2)计算行中位数的中位数,将其作为总的效应,从每一行中位数中减去总效应.3)将每一列的中位数记录在该列的边上,并在每一列中减去中位数.4)计算列中位数的中位数,将其和总效应相加,从每一列中位数的总效应中减去这一数值.5)重复步骤1-4,直到行列中位数不再发生变更.例子:P101-1023.核密度估计方法考虑面积单元之间的距离,首先计算各个面积单元的重心Si,用面积单元S(重心)四周的单元Si的变量值估计S的值,d=S-Si,则面积单元S的估计值为:该值适合于面积单元中变量是连续的状况,假如变量是计数值,则用下式:1)最近邻重心赋值法依据两种面积单元重心的接近程度进行,原则是用变换后面积单元重心计算其变换前最邻近面积单元的重心,最邻近重心对应面积单元的值对变换后面积单元赋值.2)重心对多边形赋值法将变换前面积单元的重心和变换后的面积单元进行多边形叠加,依据重心落入的多边形对新的面积单元赋值.3)面积权重法依据一组面积单元和另一组面积单元进行叠加,用前一组面积单元落入的面积权重平均对另一组面积单元进行插值.空间自相关空间自相关是空间域中位置s上的变量与其邻近位置sj上同一变量的相关性.对随意空间变量Z,空间自相关测度的是Z的近邻值对于Z相像或不相像的程度.一般通过交叉乘积,平方差异或确定差异描述空间自相关,这些值小,则空间正相关,大则空间负相关.1空间随机性假如随意位置上观测的属性值不依靠于近邻位置上的属性值,则空间过程是随机的.对于连续空间变量Y,若下式成立,则空间独立:n为区域中面积单元的数量.以下三种空间随机过程:(1)赋值到n个位置的连续变量{Xj}来自于正态分布.(2)赋值到n个位置的离散变量的值来自于n次硬币的投掷.(3)坐标为(i,j)位置上的变量值Yij在确定程度上受到近邻位置值的影响.名义变量的空间自相关测度-连接记数法设规则网格中分布的二元数据的变量或属性为x,则变量在随意网格单元的取值只能是1或0两个数,或黑白两种颜色:二元数据网格单元的连接类型为:BB,WW,BW/WB设探讨区域共划分为n个单元,其中编码为1的单元有n1,编码为0的单元有n2,于是以上3种状况的计数分别为:Wij为接近性矩阵,取值依据邻接规则的不同而不同.**比较BB,WW,WB的计数推断空间模式的结论:当相邻单元具有相像名义变量时,存在正空间相关;当相邻单元具有不相像名义变量时,存在负空间相关;但是与随机空间模式进行比较才能给出空间模式的推断.完全随机条件下,3种模式期望计数值分别为:在采样位置不行置换状况下,3种连接方式期望计数值为:J=JBB+JWW+JWB,pB:单元编码为B概率若相像的编码相互排列在一起,若不相像的编码相互排列在一起,则完全随机条件下,标准差的期望分别为:式中m为:Ji为第i个单元的连接数在随机条件下,得到各种连接类型计数的均值与方差的基础上,可构建一个听从正态分布的统计量:J*:上述3种连接方式的计数值,通过实际计算的Z值和确定显著性水平p上对应的Zp值,可知空间模式是否异于随机模式.空间自相关统计量-Moran’sI和Geary,sC连接计数存在一些缺陷:1)连接计数目只适应于二元名义变量,2)计算困难且统计量Z说明困难,3)现实世界的大部分变量是以间距或比率尺度测度的Moran’sI统计探讨区域中存在n个面积单元,第i个单元上的观测值为yi,观测变量在n个单元中的均值为,则Moran’sI定义为:是一个协方差,I值的大小确定于i和j单元中的变量值对均值的偏离符号,在相邻位置上,yi与yj同号,则I为正,否则为负.写成矩阵的形式为:Moran’sI指数的变更范围是(-1,1),假如空间过程不相关,则I的期望接近于0,当I取负值时,表示负自相关,否则表示正自相关.*I指数与随机模式中的I指数比较推断空间模式假设随机变量Y的观测值来自于正态分布,且Yi与Yj是空间依靠的,则抽样得到I的分布是近似的正态分布,且有:式中构造听从正态分布的Z统计量:2Geary,sC统计量C是非负的,完全空间随机过程的期望值C=1C<1,表示正的空间自相关,C>1,表示负的空间自相关,当相像的值聚集时,C趋向于0,当不聚集时,C趋向于2,C与I比较,是一种反方向的.广义G统计量当高值面积单元或低值面积单元相互之间接近时,I与C都指示相对高的正空间自相关.广义G统计量:式中i不等于j.距离d之内的面积单元作为i的近邻,当i与j的距离小于d时,Wij(d)=1,否则为0,当i与j的距离大于d时,xi与xj的点对不包括在分子中,分母包括全部的xi与xj.在计算广义G统计量之前,需定义近邻距离d.为了检验广义统计量,需知G(d)的期望与方差.其它符号见P114.局部空间自相关统计量由于空间异质性的存在,使探讨区域的某一部分中是正的空间自相关,另一些区域中是负的空间自相关.1.空间联系局部指标LISA说明局部尺度上空间自相关水平,对面积单元i,其局部Moran,sI统计量为:zi,zj分别是对于均值和标准差的标准化变量,是xi的标准差.局部Moran,sI值高说明具有相像变量值的面积单元空间聚集.局部Moran,sI值低说明具有不相像变量值的面积单元空间聚集.空间权重定义了i与j之间的关系.见P117C的局部化:2.局部G统计量标准化后的值简洁得到说明,其均值与方差如下:当相像的高值面积单元形成空间聚集时,会产生高的z值,假如空间积聚由低值的面积单元产生,则z值趋于高的负值.零旁边的z值没有明显的空间联系模式.第6章空间回来分析,残差独立时,残差不独立时,即矩阵C仍不能说明空间依靠性空间自回来模型回来分析忽视了地理问题的空间性质,不能给出空间模式有效描述.在回来模型中加入自相关与空间非平稳项能克服回来模型的不足.空间自相关要借助空间单元之间的邻接关系,在实际分析中,常常将W转化为行和为1的矩阵C.利用标准化矩阵C,得到某一位置变量值受邻近位置影响的表达式这样一般的空间自回来模型表示为:为须要估计的回来参数,反映样本数据内在的空间依靠性.为随机误差1.空间自回来模型Y:因变量,X:说明变量矩阵,u:随空间变更误差项,:白噪声,W1,W2:已知的空间加权矩阵,该模型可以得到很多空间自回来模型.1)X=0,W2=0,得一阶空间自相关模型y的变更是邻接空间单元因变量的线性组合,说明变量X对y变更没贡献.该式与时间序列的自回来模型类似.2)设W2=0,回来空间自回来组合模型为:y的变更与邻近单元的因变更及说明变量X有关.3)W1=0,则有:4)空间Durbin模型,将因变量的空间延拓项与自变量的空间延拓项加在模型中.空间延拓与时间序列分析的延拖算子类似,空间延拓是空间位置上的位移.2.完全空间自回来模型:空间自相关系数,W是对于y的空间加权矩阵,对每一个观测位置,有:该模型中,通常用标准化的空间邻接矩阵,用最小二乘表示参数为:但该参数估计是有偏的,导致有偏的缘由是由于空间自相关的存在,空间接受过程不独立,类似时间序列模型,也可接受高阶空间自相关模型探讨空间问题,W(i)是第i阶空间邻接权重矩阵,为相应的自相关系数,运用高阶空间自相关模型时,p阶邻接矩阵可以产生空间延拓,但也会产生信息的沉余,故用确定的方法,消退高阶邻接矩阵中沉余的邻近信息.补充极大似然函数:X的概率密度函数为,X1,…,Xn是来自X的样本,x1,…,xn是其取值,则样本的似然函数为:极大似然估计就是使似然函数达到极大3.空间自回来-回来组合模型模型系数估计过程:1)对模型,实施最小二乘估计2)对模型,实施最小二乘估计3)计算残差4)找到使似然函数极大的4)设使Lc最大,计算5空间自回来误差模型是空间相关误差的系数,该式须要检验多元回来模型残差的空间自相关性,若存在空间自相关性,则运用该式合理.常用的检验方法如下:Moran’sI检验方法1)非标准化的W:2)标准化的W:构建标准正态分布统计量:1)非标准化的W状况下,见P1262)标准化的W状况下,见P126利用检验残差是否存在空间自相关.Ward统计量检验法:1)式中拉格朗日算子统计量:6.空间Durbin模型或含有说明变量的空间延拓,其贡献通过表示模型的参数通过极大似然估计,通过下式估计(使似然函数取最大值)5.广义空间自相关模型W1,W2一般写成不同的形式,系数的估计接受极大似然估计.地理加权回来模型空间自回来模型的参数不随空间位置的变更,本质上是全局模型,但由于空间异质性的存在,不同空间子区域上自变量与因变量之间的关系可能不同,这样就产生了空间局部回来模型,地理加权回来模型(GWR)就产生了.GWR模型的一般形式是:是与观测位置i对应的参数每个位置对应一个参数向量,局部加权回来获得空间每一点的参数估计为:1.GWR模型及估计方法自变量的回来系数随空间位置的变更而变更.:因变量y与说明变量在位置(ui,vi)处的观测值.是关于空间位置的p个未知函数.在每个位置处用加权最小二乘对系数进行估计2.参数估计方法每个位置的权重是从该位置到其他观测位置距离的函数.3.权重与带宽的选择用交叉检验方法确定带宽h,画h与离差平方和的函数图来确定局部模型显著好于全局模型吗?要检验,4.GWR模型显著性检验方法中至少一个是随空间位置变更的在H0假设下,用最小二乘拟合线性模型,获得离差平方和RSS(H0).在H1假设下,用拟合地理加权回来,获得离差平方和RSS(H1),于是构造F检验统计量:用p值方法检验两个假设:,f是统计量F的观测值计算P值后,给定显著性水平α与P值比较:假如α>P值,显著性水平α下拒绝原假设。假如α≤P值,显著性水平α下接受原假设。4.1地理加权回来模型残差的空间自相关设为空间变系数模型的残差,是特定的权重矩阵,残差的Moran’sI与Geary’sC为:检验空间自相关的p值为:5.组合地理加权回来模型依据先全局变量后局部变量,MGWR如下:运用MGWR模型,需先识别那些项具有常数参数,那些项目有可变参数.5.1MGWR常数参数项的识别不是全部的都相等拟合GWR参数:为处系数向量的估计.ek为单位向量.于是构建如下统计量:J为每一元素为单位值的n阶矩阵6.MGWR模型的估计与推断1)重写MWGR模型获得(ui,vi)处的空间变系数估计其中2)将代入原始的MGWR模型中,得写成矩阵形式为:可再得7.地理加权回来模型实例组合地理加权回来模型可写为:依据最小二乘客估计后将带入下式:第7章空间连续数据分析方法探究性分析方法1.空间滑动平均近邻点的平均值估计未知点的方法,公式如下:对于采样点不规则的空间,权重的计算用距离的倒数:该方法的缺陷是:1)须要多大的局部领域内的样本点对未知点数据进行估计是未知的,2)存在空间异质性时,领域大小,方向,形态会对估计产生影响,3)权重的确定依靠阅历,缺乏理论支持,4)估计结果依靠于采样点的布局.2.基于嵌块的空间插值方法2.1不规则三角形TIN相邻数据点连线产生不规则三角网,用三角法沿着顶点计算3维空间中两点之间的距离,由于构成三角形的3个顶点的属性值不同,3个顶点构成的面用一个3维空间上的平面函数表示,随意位置上的数值用这个平面函数计算.2.2Voronoi多边形方法该方法的插值有两种:1)利用样本点的分布构建Voronoi多边形,每一多边形内随意点要素的值等于位于这个多边形内样本点的属性值.2)利用已知样本点构造Voronoi多边形,当数据集中加入新的数据点时,自动修改这些Voronoi多边形,利用未知点最邻近多边形面积为权重,接受滑动平均公式计算未知点的属性值.构造方法如下:将空间分为n个区域,每个区域包含一个点,该点所在区域是距离该点最近点的集合,这样的区域是Voronoi多边形.2.3核密度估计方法位置s处属性y的均值如下:趋势面分析依据样本点数据对探讨区域进行全局建模的一种方法,矩阵形式表示趋势面模型如下:e(s):均值为0的随机变量,表示趋势面的波动,是空间坐标(x,y)的p阶函数,1)线性趋势面的p函数是(1,x,y);2)二次趋势面的p函数(1,x,y,xy,x2,y2);在趋势面分析中,假设误差具有常数方差且相互独立,于是最小二乘估计为:二次趋势面的X为:显著性检验统计量为:连续数据的空间依靠性测度1.协方差图与半方差图假设空间随机过程满足:对于随意的两点si,sj,空间随机过程的协方差:相关系数与方差为:若,则过程是平稳的,均值与方差独立于空间位置,有:为过程的协方差函数.2变异函数区域变量si,sj差的方差的一半定义为变异函数.其表达式为:对协方差函数有:为了简洁起见,把区域化随机变量si写为Z(x)sj写为Z(x+h).h=si-sj,平稳条件下这样有C(h)=C(0)-r(h)空间相关函数:3.协方差函数和变异函数的计算公式3.1.协方差函数的计算公式变异函数为:设Z(x)为区域化随机变量,并满足二阶平稳条件,h为两样本点空间分隔距离,Z(xi)和Z(xi+h)分别是Z(x)在空间位置xi和xi+h上的观测值(i=1.2,……,N(h)),则有如下公式:是分隔距离为h时的样本对总数Z(xi)的样本平均数假如,则协方差函数与相关函数有亲密的关系是先验方差,其值为:样本平均数3.2.变异函数的计算公式设Z(x)为区域化随机变量,并满足二阶平稳与本征假设.则变异函数的计算公式为:3.3计算实例1)一维变异函数的计算设Z(x)是一维区域化随机变量、满足二阶平稳和本征假设:点之间分隔距离h=1(m)当h=1,2,…,8时,计算变异函数的结构分析1协方差函数和变异函数的性质区域化变量的结构分析是以变异函数模型为基础的,结构分析的主要目的是指导我们怎样依据实际观测数据建立有效且合适的变异函数模型,并对模型进行理论分析及专业说明。为此、了解协方差函数和变异函数的性质特别重要。1.1协方差函数的性质设Z(x)是区域化变量,在满足二阶平稳的假设条件下,协方差函数存在,并定义为:协方差函数具有下列性质:先验方差不能小于0.C(h)是偶函数.5)C(h)是非负定函数.1.2变异函数的性质h增大,相关性降低设Z(x)是区域化变量,在满足二阶平稳的假设条件下,变异函数存在,并定义为:变异函数具有如下性质:1.3协方差函数与变异函数的关系在探讨区域化变量二阶平稳件条件时,协方差函数和变异函数关系为:在二阶平稳假设条件下。Z(x)的协方差函数C(h)和变异函数r(h)存在且平稳协方差函数与变异函数2者之间的关系为:h>=a时,即h足够大,可使这里a是变程,变程a的大小,反映区域化变量影响范围的大小,因此变程a为区域化变量空间变异尺度或空间自相关尺度.时,区域化变量是空间自相关的,否则自相关不存在.变异函数的跃迁现象跃迁现象说明如下:r(h)的极限值称为“基台值”,它等于区域化变量的先验方差C(0).凡具有一个变程a和一个基台值的变异函数称为跃迁型变异函数.的随意数据Z(x)必定与落在同一范围内的随意其他数据Z(x+h)相互关,这种相关随着2点间距离的加大而下降.变异函数表示的各向异性变异函数r(h)反映区域化变量的随机性与结构性.因此Z(x)在每一方向上显现出相同或不同的性质.即各向同性或各向异性。在结构分析中,主要是依据变异函数的变程a在不同方向上的大小来反映各向同性或各向异性.r1(h)表示东西方向上的变异函数,r2(h)表示南北方向上的变异函数,a2>a1,南北方向的变异大于东西方向,表现出区域化变量的各向异性变异函数的块金效应对变异函数r(h),当h=0,变异函数而是等于常数C0,这种现象称为块金效应,C0为块金常数或块金方差.块金效应来源于:(1)区域化变量Z(x)在小于抽样尺度h时所具有的内部变异,(2)抽样分析误差,在同一点上取样两次.所得的结果会有变异,当样点间的距离大于微域结构的范围就会出现块金效应.**曲线和y轴相交的截距称为块金值要想了解微域的结构特征,只靠大观测尺度取样数据是不够的,还必需在小尺度上测量取样.变异函数在原点处的性状变异函数r(h)在原点处的性状,主要反映区域化变量Z(x)不同程度的空间连续性。主要有五种类型:C叫拱高(1)抛物线型(2)线性型(3)间断型(4)随机型无论h多么小,区域化变量Z(x)与Z(x+h)总是不相关。这种类型称随机型.也称纯块金效应型(5)过度型变异函数处于抛物线型和纯块金效应型间的过渡型变异函数的理论模型1有基台值模型1.1球状模型c0=0,c=1,标准化球状模型,1.2指数模型c0,c,与前同,a不是变程.1.3高斯模型1.4线性有基台值模型1.5纯块金效应模型无基台值模型1幂函数模型2线性无基台值模型3对数模型孔穴效应模型当变异函数r(h)在h大于确定的距离后,并非单调递增,而是具有确定周期波动,这时就显示出孔穴效应.在有基台值与无基台值模型中,均能出现孔穴效应.孔穴效应属于线性非平稳统计范畴.区域化变量Z(x)的数学期望不是常数而是一周期函数时,即就呈现孔穴效应叫漂移.常接受多项式形式,有时也接受正弦或余弦函数的形式.如下是一维孔穴效应模型:a为指数模型参数,b为两孔之间的平均距离.当r(h)周期变更不大时,可用线性平稳变异函数模型代替孔穴效应模型.变异函数的结构分析1.单一方向的套合结构1.1套合结构的概念及方法区域化变量Z(x)的变更相当困难的.包含各种层次与各种尺度的变更,反映在变异函数r(h)上就是多层次结构相互叠加在一起,称之为套合结构.套合结构:把不同距离h上或不同方向上同时起作用的变异性组合起来,对全局有效的结构信息,做定量化的概括.困难变更的区域化变量的空间变异性.要用多个理论模型来描述.当h不同时,影响空间变异性的因素也不一样,假如h确定时,变异函数r(h)应包含小于h的全部影响因素,因此大多数变异函数由如下2个变异函数组成:即变异函数由一个代表纯块金方差r0(h)和一个代表空间相关的方差r1(h)组成.套合结构由反映各种不同尺度变更的多个变异函数之和表示:ri(h)可以是相同的理论模型也可以是不同的理论模型.如区域化变量Z(x)在某一方向上的变异性由r0(h),r1(h),r2(h)组成,r0(h)表示微观上的变更由于变程小,近似看成纯块金效应,其模型为:r1(h)表示变程a1时的球状模型:r2(h)表示变程a2时的球状模型:建立套合结构模型的关键是考虑h的变更域1.2套合结构应用实例从今图可见,理论值与实测值偏差较大多次修改基台值与变程不同方向上的套合结构1各向异性的概念2各向异性的种类几何异向性:变异函数在不同方向上具有相同的基台值,不同的变程.可通过线性变换转为各向同性结构.带状异向性:不能通过线性变换转为各向同性结构的各向异性.具有不同的基台值,变程可相同或不同大的变程与小的变程之比为各向异性比a2/a1=k.a2方向上距离为h两点间的平均变异程度与a1方向上距离为kh两点间的平均变异程度相同,即带状异向性的特点是各个方向上的基台值不同,变程可以相同也可以不同。不能通过简洁的线性变更,成为各向同性,但可一步步进行线性变更。带状异向性的变异函数可看成不同方向结构的的套合结构每一组成结构可以具有各自不同的异向性,包括几何异向性.但都可以分别通过坐标的线性变换化为各向同性,再把这些各向同性的结构叠合起来,构成一个统一的变异函数模型.在x,y方向上为几何异向性,在z方向上由于基台值不同属于带状异向性。在变换时,先将x和y方向上的几何异向性变为各向同性,然后再将考虑z方向上的各向异性,最终可以通过线性变换把水平方向上的各向同性与垂直方向上的各向异性变为各向同性。3变换矩阵无论是几何异向性还是带状异向性,确定其各向异性的主要是变异函数r(h)的结构特点,实质上也就是距离h。在结构分析中,要将各向异性转换成各向同性,主要是变更不同方向上的距离h。设变换前的坐标向量变换成各向同性的坐标向量对于大多数几何异向性来说,各个方向上的变程似一个椭圆,当方向变程图近似一个椭圆时,设a1为长轴方向,a2为短轴方向,k=a1/a2,则A为将各向异性变为各向同性。在新的坐标下原来的变异函数模型,变为统一的各向同性结构模型假如椭圆形态变程图的长抽和短轴与坐标轴相差一个顺时针的旋转角,即所选择的坐标轴与几何异向性的椭圆主袖不一样时,要先进行坐标旋转变换,然后,再进行线性变换.旋转前坐标,旋转后坐标坐标变换:再旋转为原坐标方向:4几何和带状异向性的套合结构假设区域化随机变量Z(x)在四个方向上建立了四个变异函数模型,且均为球状模型,假如方向图形近似于半径为a的圆,即对于平面上全部方向变程都相等,认为是各向同性的,假如基台值相同,只是变程不同,可以认为是几何异向性的.以变程a4为基础,则a4方向上各向异性比设a4为方向u的变程,a1为方向v的变程,分别为椭圆的长轴与短轴,这时带状异向性主要包括水平方向上的结构和垂直方向上的结构.在套合过程中,把垂直方向和水平方向的结构各自当作独立成分进入套合结构,分2步进行:首先对垂直方向坐标进行变换:然后对水平方向坐标进行变换最终将两者套合成统一的各向同性结构**用h替代即可变异函数理论模型的最优拟台地统计学中的拟合过程主要包括三个步骤:确定曲线类型,参数最优估计,最优曲线的确定.1确定曲线类型地统计学中选择变异函数的理论模型主要是依据距离hi和变异函数计算值r#(hi)之间的关系。确定曲线类型的确定有如下2种方法:1)依据专业学问从理论上推断,或依据以往的阅历来确定曲线类型;另一种是通散点图,确定曲线的大致类型或初步类型.参数最优估计最小二乘来估计3.最优曲线的确定4.实例克立格法概述1克立格法产生的背景在南非金矿的开采中,常出现这种状况,即金矿四周的取样值与实际开采场的抽样值之间出现了不一样性。处理这个问题常常是接受阅历校正系数加以校正,以便对过高的估计值作出扣除。为了寻求这些校正因子,克立格接受回来分析方法。在矿物品仅听从正态分布的状况下,已知样品的平均品位x关于块段的期望品位y的校正方程是一条直线方程,即都等于样床的平均品位m,b=m-am.克立格的方法就是找寻两个参数值a和(1-a)事实上m一般是未知的,只能用已知样品品位的平均数()去代替.2克立格法的内涵克立格法实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量取值进行线性无偏最优估计的一种方法。待估样点(或待估块段)有限邻域内若干已测定的样点数据,在细致考虑了样点的形态、大小和空间相互位置关系,及它们与待估样点相互空间位置关系,以及变异函数供应的结构信息之后,对该待估样点值进行的一种线性无偏最优估计,3克立格法的种类依据区域化变量满足的不同条件分为:块段克立格法,泛克立格法,协同克立格法等4克立格估计量估计值要满足偏差的平均数为零及估计的方差最小为权重系数.一般克立格法1一般问题及其解法设Z(x)为区域化变量,满足二阶平稳,其数学期望为常数m,协方差函数C(h)和变异函数r(h)存在,即对中心位于x0的块段V的平均值ZV(x0)以进行估计。在待估块段V的邻域内,有一组n个己知样品v(xi),其观测值为Z(xi)(i=1,2,…,n),在二阶平稳条件下,这些n个已知样品的观测值的数学期望为:我们的目标是要找出一组权重系数,使得加权平均值成为待估块段V的平均值ZV(x0)的线性、无偏最优估计量,即克立格估计量。为此,要满足下面两个条件:1)无偏性条件当时,且有2)最优性条件求使最小.拉格郎日算子或拉格郎日算子**从拉格郎日计算过程中得出两种表示法一样2.简洁克立格法在克立格法中由区域化变量Z(x)的数学期望m为已知或未知时,产生两种估计方法。当m为已知常数时,称为简洁克立格法。当m为未知常数时,称一般克立格法。对简洁克立格法,区域化变量Z(x)的数学期望为已知常数,设Y(x)=Z(x)-m,则E[Y(x)]=E[Z(x)-m]=0。待估块段为V,假设其实际值误差为Y(V),中心点为x,则待估块段实际值误差可表为:在待估块段V的邻域内有一组已知的n个样点xi(i=1,2,...,n),其观测值为Z(xi),则Y(xi)=Z(xi)-m,Y(V)的估计值是由这n个已知样品观测值Y(xi)的线性组合,即成为Y(V)的线性、无偏、最优估计量的条件:1)无偏性条件2)最优性条件求使最小.求得后,由得区域化变量的估计值.一般克立格法(m未知时的情形)3.1一般克立格法的计算3.1.1规则网络取样数据在一个探讨区域中.Z(x)是一个区域化变量,满足二阶平稳和本征假设、其协方差函数C(h)和变异函数r(h)存在,且为各向同性的球状模型。球状模型的主要参数为C0=2,C=20,a=200,则模型公式为:对应的C(h)模型为:对应的C(h)模型图形为:设探讨区域内有一个未知点x0,其邻域内有x1,x2,x3,x44个已知观测点,其观测值分别为Z(x1),Z(x2),Z(x3).Z(x4)。目的是从已知四个点的观测值中估计未知点x0的值Z(x0)。设Z(x0)的一般克立格线性估计量为:其一般克立格方程组为:当时,代入上面数据可得:这样可计算得可以看出,点x1对点x0的距离最小,因而权重系数最大,构成对x0的主要影响。对来x0说,x3比x2的距离要远、但产生的影响x3比x2要大很多倍。这主要是点x2受x1的“屏蔽”作用,而x3虽然远离x0,但不受“屏蔽”作用的影响。假如再接着用点x1,x2,x3和x4去估计另一个未知点,由于数据构型没变,因此,新的未知点对克立格矩阵没有影响.对矩阵D有影响,因而只要重新计算短阵D即可。这样可计算得1.2不规则网格取样数据满足二阶平稳,设C(h)和r(h)均为各向同性的指数模型:C0=0,C=10,a=10设探讨区域中未知点x0,在其邻域内有7个已知不规则分布的样点,每一个样点的坐标,样点的观测值及与未知点x0的距离如下:以知点之间的距离未列用同样的方法可得2块段一般克立格法的计算假如估计的不是x0点,而是以x0为中心块段的平均值,这时要用块段一般克立格法。由于数据结构不变,因此,克立格矩阵不变,只是矩阵D变为:式中V为块段面积(二维).x,y是已知样点坐标。具体方法如下:①将待估块段V离散化成若干个点,计算已知样点与块段V内被离散化的若干个点之间的协方差函数C(h)和变异函数r(h),最终求出平均数;②除了将待估块段V离散化外,假如已知样点也是一个小块段的支撑构成,将这块段也离散成已知的若干个点,计算点与点之间的协方差函数C(h)和变异函数r(h),最终取平均数将待估块段V离散成4个点,并且知道4个点的空间位置,则已知样点xi与待估块段V中4个离散化点之间的平均协方差函数为;待估块段V离散化成4个点,已知的小块段也离散化成4个点,则它们之间的平均协方差函数为:同样可计算出离散化点愈多,得到的平均协方差函数值或变异函数值精度愈高,但计算的工作量很大。因此,在离散化的同时,既要考虑精度也要考虑工作量。协同克立格法协同克立格法是利用两个变量之间的相互关性,用其中易于观测的变量对另一变量进行局部估计的方法。协同立立格法比一般克立格法能明显改进估计精度及采佯效率。但在实际应用中,协同克立格法要求有一个己知的相互关函数.协同克立格法是建立在协同区域化变量理论基础上的,通过建立交叉协方差函数和交叉变异函数模型,用协同克立格法对末抽样点的变量值进行估计。协同区域化变量理论1协同区域化的概念每一种区域化现象都与很多变量有关,同一个区域化现象可以用几个相关变量表示。把某—点上某一性质的观测值,与在统计分析上依靠于相邻一点上的另一特性质的观测值,这两种性质之间的相关性称为协同区域化或横相关。描述这种协同区域化现象的变量称为协同区域化变量。2协同区域化变量理论设k个协同区域化变量ZI(x)Z2(x),…,Zk(x),组成一组K维区域化变量的向量{ZI(x)Z2(x),…,Zk(x)}.在观测前,它是一个k维区域化向量.观测后,它可看成k维向量的一个实现。在二阶平稳假设条件下,协同区域化变有:1)每一个Zk(x)的数学期望存在且平稳,即2)对每对区域化随机变量Zk(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论