版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十五章、空间插值Spatial Interpolation,空间插值的基本原理 空间插值方法,空间插值导言,地理学中可能遇到的问题: 了解北京大气质量宏观分布 北京大气质量监测点 了解我国某个地区的气候状况 气象站分布温度降水 某观测站因意外存在缺测、漏测 解决问题的难点: 到研究区每个点进行观测是非常困难的时间、人力或财力都不允许。,第一节、空间插值的基本原理,空间插值的概念 空间插值的理论假设 空间插值意义 空间插值分类 一般插值过程 插值方法选择的原则 插值验证 空间插值的数据取样,一、空间插值的概念,将空间上离散点的测量数据转换为连续的曲面数据,即填补样本点之间的数据空白,以便与其它
2、空间现象的分布进行建模研究。,已知数据,函数关系式,未知数据,从存在的观测数据中找到一个函数关系式,使该关系式最好的逼近这些已知的空间数据,并能根据函数关系式推求出区域范围内其它任意点的值。,二、空间插值的理论假设,距离衰减效应 空间位置上越靠近的点,越可能具有相似的观察值;而距离越远的点,其特征值相似的可能性越小。 地理学第一定律,三、空间插值意义,缺值估计 如何在没有测点的地区得到我们需要的数据? 测点自然或人为的原因,缺少某天或某个时间段的数据。 内插等值线 形象直观的显示空间数据分布 平面制图 数据格网化 以不规则点图元组织的Z变量的数据,并不适合于图形显示,也不适于进行分析。多数空间
3、分析要求将Z值转换成一个规则间距空间格网,或者转换成不规则三角形网。 规则格网数据更好的显示空间数据连续分布,四、空间插值分类,整体插值和局部插值; 确定性插值和地统计插值; 精确插值和近似插值。,1、整体插值和局部插值,整体插值:用研究区所有采样点数据进行全区特征拟合。 整个区域的数据都会影响单个插值点,单个数据点变量值的增加、减少或者删除,都对整个区域有影响。 典型例子是:全局趋势面分析 、Fourier Series(周期序列),局部内插法,局部内插法只使用邻近的数据点来估计未知点的值,步骤如下: 定义一个邻域或搜索范围; 搜索落在此邻域范围的数据点; 选择能表达这有限个点空间变化的数学
4、函数; 为未知的数据点赋值。 局部内插方法: 样条函数插值法 距离倒数插值 Kriging插值(空间自由协方差最佳内插) 单个数据点的改变只影响其周围有限的数据点。,整体插值方法将小尺度的、局部的变化看作随机和非结构性噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷。 整体插值方法通常不直接用于空间插值,而是用来检测总趋势和不同于总趋势的最大偏离部分,即剩余部分,在去除了宏观趋势后,可用剩余残差来进行局部插值。,整体插值注意的问题,2、确定性方法和地统计方法,确定性方法 基于未知点周围点的值和特定的数学公式,来直接产生平滑的曲面;,地统计学插值,基于自相关性 (测量点的统
5、计关系),根据测量数据的统计特征产生曲面; 由于建立在统计学的基础上,因此不仅可以产生预测曲面,而且可以产生误差和不确定性曲面,用来评估预测结果的好坏 多种 kriging 方法,3、精确插值和近似插值,精确插值:产生通过所有观测点的曲面。 在精确插值中,插值点落在观测点上,内插值等于估计值。 近似插值:插值产生的曲面不通过所有观测点。 当数据存在不确定性时,应该使用近似插值,由于估计值替代了已知变量值,近似插值可以平滑采样误差。,五、一般插值过程,内插方法(模型)的选择; 空间数据的探索性分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等; 进行内插; 内插结果评价; 重新选择内
6、插方法,直到合理; 内插生成最后结果。,六、插值方法选择的原则,精确性: 参数的敏感性:许多的插值方法都涉及到一个或多个参数,如距离反比法中距离的阶数等。有些方法对参数的选择相当敏感,而有些方法对变量值敏感。后者对不同的数据集会有截然不同的插值结果。希望找到对参数的波动相对稳定,其值不过多地依赖变量值的插值方法。 耗时:一般情况下,计算时间不是很重要,除非特别费时。 存储要求:同耗时一样,存储要求不是决定性的。特别是在计算机的主频日益提高,内存和硬盘越来越大的情况下,二者都不需特别看重。 可视化、可操作性(插值软件选择):三维的透视图等。,七、插值验证,(1) 交叉验证 交叉验证法(cross
7、validation),首先假定每一测点的要素值未知,而采用周围样点的值来估算,然后计算所有样点实际观测值与内插值的误差,以此来评判估值方法的优劣。 各种插值方法得到的插值结果与样本点数据比较。 (2)“实际”验证 将部分已知变量值的样本点作为“训练数据集”,用于插值计算;另一部分样点 “验证数据集”,该部分站点不参加插值计算。然后利用“训练数据集” 样点进行内插,插值结果与“训练数据集”验证样点的观测值对比,比较插值的效果。,八、 空间插值的数据采样,采样点的空间位置对空间插值的结果影响很大。 理想情况是研究区内均匀布点:但当区域景观存在有规律的空间分布模式时,用完全规则的采样网络可能会得到
8、片面的结果; 完全随机的采样:采样点的分布位置是不相关的,完全随机采样可能会导致采样点的分布不均,一些点的数据密集,另一些点的数据缺少。 规则采样和随机采样的结合方法是成层随机采样,即划分为规则格网,每个格网中的样本数固定,但单个点随机地分布于规则格网内。,采样方法图示,第二节、插值方法,最近邻法(Nearest Neighbor) 算术平均值(Arithmetic Mean) 距离反比法(Inverse Distance) 高次曲面插值(Multiquadric) 趋势面插值(Polynomial) 最优插值(Optimal) 样条插值(Spline Surface) 径向基函数插值(Rad
9、ial Basis Functions) 克里金插值(Kriging),一、最近邻法(Nearest Neighbor),最近邻点法又叫泰森多边形方法。它采用一种极端的边界内插方法只用最近的单个点进行区域插值(区域赋值)。 泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。,公式,最近邻法评价,特征:用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的; 适用于较小的区域内,变量空间变异性也不很明显的情况。符合人思维习惯,距离近的点比距离远的点更相似,对插值点的影响也更明
10、显; 最近邻法插值的优点是不需其他前提条件,方法简单,效率高; 缺点是受样本点的影响较大,只考虑距离因素,对其他空间因素和变量所固有的某些规律没有过多地考虑。实际应用中,效果常不十分理想。,二、算术平均值(Arithmetic Mean),算术平均值方法以区域内所有测值的平均值来估计插值点的变量值(Creutin, 1982)。,算术平均值法评价,算术平均值的算法比较简单,容易实现。但只考虑算术平均,根本没有顾及其他的空间因素,这也是其一个致命的弱点,因而在实际应用中效果不理想。,三、距离反比法(Inverse Distance),距离反比插值方法最早由 Shepard 提出(Richard
11、Franke,1982)提出的,并逐步得到发展。每个采样对插值结果的影响随距离增加而减弱,因此距目标点近的样点赋予的权重较大。,距离反比插值公式,权重系数wj的计算是关键问题,不同类型距离反比法的差别就是权重系数的计算公式不同,因而最后的插值结果也有细微的差别。,距离反比权重系数的确定,ARCGISIDW,权重过高,较近点的影响较大,拟合表面更细致(不光滑); 权重过低,较远点的影响增加,拟合表面更光滑。缺省值常为 2 。,控制反距离加权的参数权重,搜索半径固定 对固定型半径,搜索距离一定,所有在该半径内的样点参与计算。 可预先设定一个阈值,当给定半径内搜索到的点小于该值时可扩大搜索半径,直到
12、达到该阈值为止。 搜索半径类型可变 设定参与计算的样点数是固定的,则搜索的半径是可变的。这样对每个插值点的搜索半径可能都不同,因为要达到规定的点数所需要搜索的区域是不一样的。,控制反距离加权的参数搜索半径,可利用一线状和面状数据集来限制样点的搜索。线状数据集可作为平坦地表的悬崖或脊状障碍物:只有位于同侧的样点才符合要求。,控制反距离加权的参数障碍设置,权重系数和搜索半径的影响图示,Power = 2, search = 230,Power = 2, search = 150,Power = 2, search = 600,Power = 4, search = 600,距离反比插值评价,优点简
13、便易行;可为变量值变化很大的数据集提供一个合理的插值结果;不会出现无意义的插值结果而无法解释。 不足对权重函数的选择十分敏感;易受数据点集群的影响,结果常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式; 全局最大和最小变量值都散布于数据之中。 距离反比很少有预测的特点,内插得到的插值点数据在样点数据取值范围内。,四、高次曲面插值(Multiquadric),高次曲面插值由 Hardy 于1971年首先提出,随后应用于不同的学科。每个样点对插值点的影响都用样点坐标函数构成的圆锥表示,插值点的变量值是所有圆锥贡献值的总和(Caruso,1998)。 插值数学表达式为: 其中ci 是样本点(
14、xi,yi)的系数,dei是待估点(xe, ye)与样本点(xi, yi)的距离。,高次曲面插值评价,高次曲面插值根据变量值已知点和变量值未知点的坐标所构成的圆锥,进行插值,为从离散点构建一个连续的表面提供了一个比较优秀的插值方法。 由于在计算权重系数时需要已知点的距离矩阵及其逆矩阵,因而当数据点增多时,矩阵及其逆的求解都比较费时。,五、趋势面分析,通常把实际的地理曲面分解为趋势面和剩余面两部分,前者反应地理要素的宏观分布规律,属于确定性因素作用的结果;而后者则对应于微观区域,被认为是随机因素影响的结果。 趋势面分析的一个基本要求就是,所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合
15、度精确度才能达到足够的准确性。 趋势面分析是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。 在数学上,拟合数学曲面要注意两个问题:一是数学曲面类型(数学表达式)的确定,二是拟合精度的确定。,1、趋势面模型的建立,设某地理要素的实际观测数据为zi(xi,yi)(i=1,2,n),趋势值拟合值为 ,则有 用来计算趋势面的数学方程式有多项式函数和傅立叶级数,其中最常用的是多项式函数。因为任何一个函数都可以在一个适当的范围内用多项式来逼近,而且调整多项式的次数,可使所求的回归方程适合实际问题的需要。,式中, 为剩余值(残差值
16、),2、趋势面模型的参数估计,趋势面分析的核心就是从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和最小从而估计趋势面参数。 假设二维空间中有n个观测点(xl,yl)(l=1,2,n),观测值为zl(l=1,2,n)则空间分布z的趋势面可表示为N次多项式,根据最小二乘法,可得,利用克莱姆法则可以求出各个参数ai,多项式回归,多项式分析 多项式趋势面随着N值的不同,其形态也不同。 一般地讲,N值越大,拟合精度越高。拟合精度C以下式表示,通常C为6070时,该多项式就能够揭示空间趋势。,3、趋势面模型的适度检验,趋势面拟合适度的R2检验,R2越大,趋势面的拟合度就越高。,3、趋势面模
17、型的适度检验(续),趋势面拟合适度的显著性F检验,检验的办法是在显著性水平下,查F分布表得Fa。若计算的F值大于临界值Fa ,则认为趋势面方程显著;否则,不显著。 p为多项式项数(不包括常数项),,4、趋势面分析应用实例,上表为某流域1月份降水量与各观测点的坐标位置数据,4、趋势面分析应用实例(续),1)建立趋势面模型 运用上述介绍的趋势面分析原理,首先采用二次多项式进行趋势面拟合,用最小二乘法求得拟合方程为 z=5.998+17.438x+29.787y-3.558x2+0.375xy-8.070y2 (R2=0.839,F=6.236) 再采用三次趋势面进行拟合,用最小二乘法求得拟合方程为
18、 z=-48.810+37.557x+130.130y+8.389x2-33.166xy-62.740y2-4.133x3+6.138x2y+2.566xy2+9.785y3 (R2=0.965,F=6.054),4、趋势面分析应用实例(续),2)模型检验 (1)趋势面拟合适度的R2检验。结果表明,二次趋势面回归模型和三次趋势面回归模型的显著性都较高,而且三次趋势面较二次趋势面具有更高的拟合程度。 (2)趋势面适度的显著性F检验。在置信水平a0.05下,查F分布表得F2aF0.05(5,6)4.53, F3aF0.05(9,2)19.4。显然, F2 F2a ,而F3 F3a,故二次趋势面的回
19、归方程显著而三次趋势面不显著。因此,F检验的结果表明,用二次趋势面进行拟合比较合理。,优点和缺点,优点 产生平滑的曲面; 结果点很少通过原始数据点,只是对整个研究曲产生最佳拟合面; 缺点 高次多项式在数据区外围产生异常高值或低值,六、最优插值(Optimal),最优插值由Gandin首先发表,并应用在气象领域的“对象分析(Objective Analysis)”中,随后由世界气象组织(World Meteorological Organization)推荐使用。 此法假设观测变量域是二维随机过程的实现,此外,还认为未知变量值测点的变量值是它周围n个测点变量值的线性组合(Creutin,1982
20、)。,最优插值数学表示式为:,Ve 是待估点的变量值,vj 是点 j(xj, yj) 的变量值,wj 是点 j(xj, yj) 的权重系数。,上式的插值误差为:,var 表示误差方差。最优插值的权重系数,就是使插值误差的方差最小。,最优插值过程,最优插值在计算前要求指定空间相关函数的模型及其参数,这可以由用户给出,或者给出必要的数据,由程序计算。,七、样条插值(Spline Surface),样条插值的目标就是寻找一表面s(t),使它满足最优平滑原则,也就是说,利用样本点拟合光滑曲线,使其表面曲率最小。 相当于扭曲一个橡皮,使它通过所有样点,同时曲率最小。 样条函数是灵活曲线规的数学等式,为分
21、段函数,一次拟合只有少数数据点配准,同时保证曲线段的连接处为平滑连续曲线。这就意味着样条函数可以修改曲线的某一段而不必重新计算整条曲线,插值速度快;保留了微地物特征,视觉上的满意效果。,样条插值类型,规则样条插值 拟合的曲面光滑、渐变,可能超出采样点的范围。 权重在曲率最小化表达式中,定义曲面的3阶导权重,控制表面的平滑度。权重越大,曲面越光滑;权重必须大于或等于0,常取值为0, 0.001, 0.01,0.1, 0.5等。 张力样条 拟合的曲面不似前者那样光滑。 权重:定义张力的权重。该系数越大,拟合表面越粗糙。权重必须大于或等于0,常取值为0, 1, 5,10等。,样条插值插值评价,不适用
22、于在短距离内属性有较大变化的地区,否则估计结果偏大。 样条内插的误差不能直接估算,同时在实践中要解决的问题是样条块的定义以及如何在三维空间中将这些块拼成复杂曲面而又不至于引入原始曲面中所没有的异常现象等问题,八、克里金插值(Kriging),克里金插值由南非采矿工程师D.G.克里格(D. G. Krige)于1951年首次提出,故命名为“克里金”法,后经法国著名地理数学学家G. Matheron发展深化。,理论假设:认为任何在空间连续变化的属性既不是完全随机,也不是完全确定的。任何变量的空间变化表现为三个主要成分的和: 与恒定均值或趋势有关的结构性成分; 与空间变化有关的随机变量,即区域性变量
23、; 与空间变化无关的随机噪声项或剩余误差项。 一旦结构性成分确定后,剩余的差异变化属于同质变化,不同位置之间的差异仅是距离的函数。,1、原理,Z(x) = m(x) + g(h) + e”,区域性变量的特点: 随机性。即局部不规则的随机性质,可以进行统计推断。 结构性。即存在某种空间自相关,可用某一数学函数来表示。,半方差:定量描述区域性变化的第一步,它为空间插值、优化采样方案提供了有益信息。半方差的估算公式: 半方差图: 拟合后半方差图的用途是确定局部内插需要的参数,2、半方差,计算标准差和半变率,对于31个样本对,可以计算标准差,假定均值为0,且为正态分布,lag size 的影响,Variogram with a lag size of 5m and a lag tolerance of 2.5m.,Variogram with a lag size of 10m and a lag tolerance of 5m.,各向异性,某个方向有更高的空间自相关性存在。,半变率图的组成,块金值(c0; Nuddget): 当h = 0时的非零变率,由不可解释的原因引起 ; 基台值(c0+c;sill): 半变率曲线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学体育教学个人工作总结
- 儿童消化道出血管理指南
- 2026年捕集式浓密机行业分析报告及未来发展趋势报告
- 2026年碘化钠口服溶液行业分析报告及未来发展趋势报告
- 2026年神经修复中的生物制品行业分析报告及未来发展趋势报告
- 2026年纳美芬行业分析报告及未来发展趋势报告
- 2026年沿海省际液化气船行业分析报告及未来发展趋势报告
- 2026年汽车油封行业分析报告及未来发展趋势报告
- 2026年易切削铜行业分析报告及未来发展趋势报告
- 2026年中小学防溺水安全知识竞赛题库与答案
- 人工智能训练师理论知识考试题库(浓缩500题)
- 护理翻转课堂
- 相关知识培训课件
- 汉代典客、大行、鸿寐考述
- 基坑工程毕业设计实例
- 船舶焊接工艺船舶材料与焊接第三章演示文稿
- 2023年二级管配筋设计图册
- LY/T 2015-2012大熊猫饲养管理技术规程
- 第六章短期经营决策2
- 迈瑞天地人血培养基础介绍
- 支架预压观测记录表
评论
0/150
提交评论