空间统计学试题及答案.doc_第1页
空间统计学试题及答案.doc_第2页
空间统计学试题及答案.doc_第3页
空间统计学试题及答案.doc_第4页
空间统计学试题及答案.doc_第5页
已阅读5页,还剩30页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

空间统计学原理及应用GIS本作业主要分为四大部分,分别是:1、 问答题2、 计算题3、 操作题4、 收获与感想一、问答题(50分)1. 简述区域化变量与随机变量的区别?(12)(1) 地理学中大多变量都具有空间分布特点,如海拔、气温、降雨量、土壤含氮量、臭氧浓度、品位等,它们通常随所在空间位置的不同表现出不同的数量特征,这些变量称为区域化变量。区域化变量描述的现象具有空间分布的特点,常常反映某种空间现象的特征,其所描述的现象称为区域化现象。(2) 设随机实验E的样本空间为S=e。若对于任一eS,都有一实数z与之对应,而且对任何实数z,事件Zz都有确定的概率,则称Z是一个随机变量。从定义可以看出,随机变量Z是一个实值变量,具有一个可能的取值范围,随着随机实验结果的不同而取不同的值,当取值于任何区间内时都有一定的概率。(3)区别:普通随机变量的取值按某种概率分布而变化,而区域化变量则根据其在一个域内的位置取不同的值,即区域化变量时普通随机变量在域内确定位置上的特定取值,它是随机变量与位置有关的随机函数。区域化变量有的是三维的,有的是二维的,现在二维的区域化变量研究较多。在实际研究中,许多变量都可看成区域化变量,如气温、降雨量、海拔、土壤重金属含量、大气污染浓度、矿石品位、矿体厚度等。2. 试论述影响空间统计插值计算结果精度的因素?(18分)空间统计插值计算结果精度的影响因素主要以理论基础、模型算法、时空尺度效应和站点数据属性为主。(1)模型的理论基础不同,插值结果的精度不同。由于考虑了地理要素之间在空间分布上的关联性,同时兼顾到要素分布自身的自相关特性,回归要素选择得当,空间异相关模型可以很好地反映空间变异性与相关性,一般能够得到精度较高的插值结果。(2)模型算法的差异导致插值结果精度的差异:反距离加权方法、克里格方法通常优于趋势面方法与函数方法。这些精度差异,可以通过其对插值要素空间变异性与相关性的不同反映程度来解释。反距离加权方法的算法只考虑空间距离相关,没有包含方向相关,即没有反映要素分布的各向异性;而克里格方法利用半方差函数来度量两点间的空间相关性,这样权重随样点的空间位置不同而变化。当要素空间分布呈各向异性时,克里格方法优于反距离加权方法,而要素分布呈各向同性时,结果相反。(3)时空尺度通过影响空间分布的变异性与相关性以及站点数据属性影响插值精度。时间尺度是指插值要素特征值所表达的时间范围。时空尺度不同,地理要素所呈现出的空间规律性不同、空间变异程度不同,从而产生尺度效应。尺度越大,涉及的时间空间范围越广,分辨率通常随之下降,往往忽略了较小尺度的空间变异,表现其整合特征与总体趋势;尺度越小,时间空间范围相应减小,凸现出要素分布的局域特征与时空变异。而时空尺度效应对空间插值精度的影响主要表现为不同解析水平上空间变异性与空间相关性的变化以及表征这一变化的特征数据属性的变化。(4)站点数据的空间采样特性,站点样本容量、站点位置、数据空间密度、数据空间分布、空间变化,都对插值方法的选择与插值精度具有极大的影响。这些影响具体表现为:站点密度高、样本容量大通常能够增加插值的精度,但数目过多,会带来计算上的麻烦,对空间插值也未必就有很大帮助。站点数据的数值变化大或取值范围大,通常都会降低空间插值的精度。地表的复杂程度通过要素样点数据的变异性与值域来影响空间插值的精度。回归变量或协变量与插值变量的相关性越高,插值精度越高。3. 结合你导师的研究领域,谈谈空间统计学方法可以用来解决哪方面问题?如果暂时用不上,请说明理由。(20分)(1)地统计学的应用领域及其广泛,可应用于地质学、土壤学、生态学、环境学和气象学等方面。地统计学在地质学中的应用利用地统计学进行矿产资源储量计算及平均品位估计;利用地统计学进行矿产资源预测及找矿勘探;利用地统计学进行石油勘探开发;地统计学在土壤学中的应用地统计学在土壤物理性质空间变异中的应用;地统计学在土壤化学性质空间变异中的应用;地统计学方法在土壤学试验设计和采样方法中的应用;地统计学在土壤质量管理方面的应用;地统计学在生态学中的应用生态学变量空间变异性的定量描述和解释;生物特征的估计;生态学研究对象的时空变化规律分析、不同相关研究对象的时空动态及祸合关系分析;地统计学在环境学中的应用土壤环境研究;水环境研究;其他相关领域研究(大气污染物分布、声环境评价研究等);地统计学在气象学中的应用(2)可见,空间统计学的应用领域是及其广泛的。导师(赖格英老师)的研究领域主要是遥感与GIS方面,而目前主要从事的研究领域是SWAT模型方面,如当前的研究项目“基于SWAT模型的鄱阳湖流域岩溶地区非点源污染模拟研究”。虽然其项目主要是使用SWAT模型进行模拟,但是任何学科都必然与其他学科存在某种必然的联系,相互影响。如项目中的非点源污染问题,必然会用到空间统计学当中的各种插值方法如克里金插值方法。还有就是对于鄱阳湖流域当中的岩溶裸露程度必然与植被指数、植被覆盖度、地表温度存在某种关系,为了找出这种关系,必然得用到空间统计学当中的自相关性方法来确立它们之间的关系,如相关系数的确定。二、计算题(20分):假设某地区8月份平均气温在空间上的变异规律可以用如下各向同性的球状变异函数描述:下图给出了该地区x1、x2、x3、x4四个实测点的空间位置及其8月份平均气温,试用普通克里格法,通过插值估计x0点的8月份平均气温,并计算估计误差。解答:(详细的数据内容见Excel表,即“计算题.xls”)已知条件:从题目中可以获取一些已知的信息,如各个点的温度与各个点之间的距离,T1=35,T2=39,T3=37,T4=40。而普通克里格方程组用矩阵形式表达为:权重系数可由求得。同样,普通克里格估计方差用矩阵表达为:解:首先写出用变异函数表达的普通克里格方程矩阵表达式,为方便起见,将i和j两点处的变异函数值表达为的形式,则矩阵表达式为:即:为了求解克里格权重值,需要计算矩阵中的变异函数值,则又需要先计算出两点间的距离,然后代入变异函数公式进行计算。例如,1号点和2号点间的距离为由于,所以将距离值代入变异函数中得同理,1号点和X0号点间的距离为直角三角形的斜边代入变异函数中得由变异函数的性质可知,所以。由于点自身间的距离为0,所以类似地,可以计算其他点间距离及对应的变异函数值,将计算结果代入矩阵得通过矩阵预算得将计算结果代入普通克里格估计量公式得将计算数值代入普通克里格估计方差公式得则X0号点的8月份平均气温为,估计误差值为2.88。三、软件操作题(30分):附件数据是鄱阳湖某草洲的钉螺调查相关数据,主文件钉螺数据是“LogTotal”,其他文件为“服务对象”,请用ILWIS软件完成以下操作:(1) 应用ILWIS软件对数据进行各向同性与各向异性的空间自相关分析,并进行适当讨论;(2) 应用ILWIS软件提供的各种变异函数模型对数据进行拟合,并进行拟合优度比较,确定最优模型;(3) 应用ILWIS软件,采用确定的变异函数模型进行空间内插,分析结果。 解答:(其操作过程中保存的数据存放于“作业数据”的文件夹)地统计分析中主要有:路径分析、点数据的空间自相关、点的插值、克里格估计、图的置信区检验、栅格地图的空间自相关等。(1)应用ILWIS软件对数据进行各向同性与各向异性的空间自相关分析,并进行适当讨论。路径分析点的插值假设点是空间随机分布的。路劲分析就是验证点是否随机分布,点的分布方式有三种:随机、聚类、规则。检查点的路径方法有俩种:最近的邻里距离,邻里距离的反射。具体的操作过程如下:双击Operation-list中的路径分析(Pattern analysis)。打开对话框,选择点图LogTotal,输出表名:LogTotal Pattern analysis,点击Show。表打开后,从表里选择新图命令,选Distance for the X-Axis,ProbAllPnt 或者the Y-Axis,选择OK,然再点击OK点数据的空间自相关计算(Morans I和Gearys c)具体的操作过程如下:在Operation-list双击空间相互关系(Spatial correlation)操作在对话框中,选中点图LogTotal。并且选中Omnidirectional(各向同性)项。步长输入5米(记得上个学期赵老师有举过类似的例子,当时输入的步长是125米,对于步长的输入问题不是很明白,后来发现自己输入125后间隔比较大,后来发现当初自己理解错了,最后输入了5米)。输出属性表为LogTotal_Spatcorr,然后点击SHOW按钮。讨论:对于步长(Lag spacing)的选择不是很明白,步长可以自己设置的,步长不同主要对变异函数模型拟合的便利有影响,通过查询网上资料了解,步长建议越小越好,越大的话所能够留下的间隔可能不足够用于拟合。在操作的过程中尝试了输入步长为125米,其间隔比较大,如下图所示:在属性表里,选择新建图按钮,选Distance for the X-axis,column I for the Y-axis,然后点击OK。在Distance x I tab选择红色符号点,然后点击OK。图表显示的就是Morans I,(其保存的数据名为Morans I)在属性表里重新选择新建图表,c for the Y-axis,点击OK。结果显示的是Gearys c(其保存数据名为Gearys c)讨论:符号可以选择点、线、面等各种形式来表达,如下图所示,以线为例知识补充:Moran指数和Geary系数是两个用来度量空间自相关的全局指标。Moran指数反映的是空间邻接或空间临近的区域单元属性值的相似程度,而Geary系数与Moran指数存在负相关关系。从统计角度解释一般可以概括为:0C0高度正自相关 C1 OR I0 高度负正相关 C=1 OR I=0 随机离散分布继续在属性表里,选择新建图按钮,选Distance for the X-axis,SemiVar for the Y-axis,然后点击OK。(其保存的数据名为SV.grh)接下来就是各向异性的空间自相关操作:选中LogTotal,右键点击Statistics的Variogram Surface选项当Number of lags 输入默认值10,Lag spacing 为5(之前同向分析时输入的是5)时,发现输出的图像不合理,所以尝试改变Number of lags de 值在尝试反复改变Lag spacing和Number of lags的值后,觉得Number of lags的值为30,Lag spacing的值为5,比较合理。通过分析输出的图像,可以看出图像的正北、西北-东南方向的样点稀疏,差异小。而相反东北-西南方向相反。最后,决定选取Lag spacing的值为5,方向为东北-西南方向,即45和135。(其保存的数据名为VS)重复上面的操作,在Operation-list双击空间相互关系(Spatial correlation)操作在对话框中,选中点图LogTotal。并且选中Bidirectional(各向异性)项,输入步长5米,方向为45,容差角度45度(容差也是可以自己设置的,这里取默认值),输出属性表为LogTotal_Spatcorr_b,然后点击SHOW按钮。在属性表里,选择新建图按钮,选Distance for the X-axis,SemiVar1 for the Y-axis,然后点击OK。在打开的变异函数图中选择from columns,选Distance for the X-axis,SemiVar2 for the Y-axis,然后点击OK,完成各向异性的空间相关操作。(其保存的数据名为SV2.grh)重复上面的操作,把角度改为0度和90度,输出属性表分别为LogTotal_Spatcorr_b1、LogTotal_Spatcorr_b2不知为何选择角度为135时,显示无法选择。(0度保存的数据名为SV3.grh)(90度保存的数据名为SV4.grh)讨论:对比0、45和90的变异图,发现90的曲线相对于其他两个比较平缓,而45的在距离为250左右时开始下降,0整体呈现上升的趋势。(2) 应用ILWIS软件提供的各种变异函数模型对数据进行拟合,并进行拟合优度比较,确定最优模型。具体的操作过程如下:打开LogTotal_Spatcorr,在表菜单中选择新的图,在新图的对话框中选Distance column for X-axis 和 SemiVar column for Y-axis。而主要变异函数模型有:球状模型(Spherical Model)、指数模型(Exponential Model)、高斯模型(Gaussian Model)、有理二次模型(Rational quadratic model)、波浪模型(Wave Model)等等。在LogTotal_Spatcorr的table图中选择Add Graph-变异函数模型在对话框中,以Spherical Model为变异函数模型,分别用0.091、0.22、150为Nugget、Sill 、Range,点击OK。在图的操作标签中选择增加图,在与前面一样的Nugget、Sill 、Range分别选择Circular Model、Exponential Model等模型,但是用不同的颜色显示模型。通过对比上图各个模型的拟合度发现,Rational Quadratic Model,即有理二次模型的拟合度比较好,接下来就是模型的适合度检验。(其保存的模型拟合度数据名为SemiVar)讨论:合理的Nugget、Sill 、Range值的选取很重要,决定模型的拟合程度。变异函数模型的适合度检验 在上面的LogTotal_Spatcorr表中打开Columns菜单选择半变异函数(SemiVariogram)操作,在对话框中,选择距离为Column和Rational Quadratic Model模型,Nugget, Sill and Range值分别为0.091、0.220、50。输出柱名为SemiCol_Dist,连续两次点击OK 重复上述操作,用AvgLag为 Distance column 、输出柱名SemiCol_Avg。把这两个新输出的column做图,分别SemiCol_ Dist对 Distance和SemiCol_Avg 对 AvgLag(其保存的数据名分别为:SemiCol_ Dist和SemiCol_Avg )在属性表中输入“G_Gam_Sqr = SQ(SemiVar-SemiCol_Avg)”、“ Mean_G = AVG(SemiVar)”、G_Avg_Sqr = SQ(SemiVar-Mean_G)命令最后在属性表中输入“R2 = 1-SUM(G_Gam_Sqr) / SUM(G_Avg_Sqr)”命令因为所以R2=0.7还是可以的,即有理二次模型拟合度最优,至此完成模型适合性检验。通过模型拟合度的适合性检验,最后选用有理二次模型(Rational Quadratic Model)进行空间插值。(3)应用ILWIS软件,采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论