



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章地统计学的原名为地质统计学。关键人物:D.J.Krige和H.S.Sichel的新矿藏评价方法法国著名统计学家G.Matheron创立地统计学M.David矿产储量地统计学评价(1977)A.G.Journel等采矿地统计学(1978)I.Clark实用地统计学(1979)B.D.Ripley空间统计学 E.H.Issaks和R.M.Srivostava应用地统计学导论(1989) N.Cressie空间数据统计学(1991)含义:地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。理论基础区域化变量理论:当一个变量呈现为空间分布时,就称之为区域化。区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性。主要工具协方差函数和变异函数:区域化随机变量之间的差异,可以用空间协方差来表示。主要内容克立格插值法:克立格插值法,又称空间局部估计或空间局部插值法。克立格法是建立在变异函数理论及结构分析基础之上。实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。适用范围:克里格方法的适用范围为区域化变量存在空间相关性,则可以利用克里格方法进行内插或外推;否则反之。地统计学软件:GS+、ArcGIS、Surfer、STATPAC、Geo-EAS、GEOPACK、Geostatistical Toolbox、GSLIB、DPS等数据分析软件。地统计学与经典统计学的区别:经典统计学地统计学1研究纯随机变量研究区域化变量2变量可无限次重复观测或大量观测变量不能重复试验3 样本相互独立 样本具有空间相关性4 研究样本的数字特征研究样本的数字特征和区域化变量的空间分布特征第二章地理数据:是用一定的测度标准来衡量地理要素而取得的地理信息。定性地理数据定量地理数据特征定义只从名义或语义上描述在地球表面不同位置某种地理现象的不同性质,不能说明任何数量上或程度上的差异。描述地理实体的空间特征和属性特征。描述空间特征的定量数据数据就是空间数据,一般用坐标表示。描述属性特征的定量数据主要指一些量化指标,它反映数量或程度上的差异。例子如:坡的倾斜程度用平缓、较陡、陡、很陡表示。我国东、中、西部经济发展速度,用慢、中等、快表示。天气状况用晴、阴、多云、雨表示。如:温度10;人口数量2万人;工农业总产值等。包括间隔尺度数据、比例尺度数据有序数据、二元数据、名义尺度数据几个基本概念:间隔尺度数据:以连续的量来表示地理要素。根据地理要素的不同性质,采用不同的度量单位。比例尺度数据:是以连续的量来表示地理要素。事先规定一个基点,再将其他的量换算为它的比例。有序数据(等级数据):不是用连续的量来表示地理要素,而是只表示其次序关系的数据。二元数据:即0和1数据,用于表示地理要素的性质。名义尺度数据:用于表示地理要素的类型,可以用文字或字符表示。基本统计分析:1、抽样方案:1)随机抽样:利用随机数表或随机函数来确定样本。假定地理要素在空间或时间上的变化是随机的,而忽略其内部各部分的差异。适用于:地理类型划分不明确,对区域的差异性了解不多。2)机械抽样:按固定间隔确定样本。不考虑地理要素的分布特点,而把它假定为均匀分布。3)分组抽样:先分组再抽样。考虑到已经掌握的每组地理要素在总体中的比例和地位。2、频数分布频数:变量按大小顺序排序,并按一定间距分组,变量在各组出现的次数,称为频数。频率:各组频率=各组频数/频数总数累积频数3、统计特征数平均数算术平均值 中数 众数数学期望集中性度量当分析两组同类资料的差异时,可将平均数作为样本资料代表与另一组同类样本资料相互比较。离散数极差 离差 方差 标准差 变异系数离散性度量数据相对于中心位置的离散程度。形态数偏态数 峰度形态度量描述地理变量频率分布图分布形态。参数估计:点估计、区间估计首先,根据样本值,对总体分布的类型做出判断和假设,从而得到总体的分布类型,其中含有一个或几个未知参数。其次,对另外一些并不关心其分布类型的统计推断问题,只关心总体的某些数字特征,通常把这些数字特征称为参数。这时,抽样的目的就是为了了解这些未知的参数。探索性空间数据分析(ESDA):1、检查数据分布。2、寻找全局和局部离群值。全局离群值:对于数据集中所有点的值,具有很高或很低值的观测样点。局部离群值:在数据集中,对于其周围点的值,具有很高或很低值的观测样点。【寻找方法:1)用直方图查找全局离群值,2)用半变异/协方差函数云识别离群值,3)用Vonoroi地图寻找离群值】3、全局趋势分析。 4、检测空间自相关及方向变异。相关分析:判断散点图(能够分辨什么是完全正线性相关,完全负线性相关,正线性相关,负先行先关,不相关,非线性相关的图像)计算简单相关系数:(有公式)相关系数r0,不相关:|r|0.3,极低度相关;0.3|r|0.5;0.5|r|0.8,中度相关;|r|0.8,高度相关;|r|1,完全相关。相关分析与的区别与联系: 相关分析回归分析 区别 相关分析研究的都是随机变量,不分自变量和因变量回归分析研究的变量要定出自变量(确定的变量)与因变量(随机变量)。联系相关分析需要依靠回归分析来表明现象数量相关的具体形式;回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。一元线性回归分析的步骤流程:1、一元线性回归方程的建立2、回归系数的估计3、对一元回归方程的评价1)一元线性回归模型拟合优度的评价2)一元线性回归方程的显著性检验(t检验,F检验)第三章区域化变量的概念:以空间点x的三个直角坐标x u,x v,x w为自变量的随机场,称为区域化变量,或区域化随机变量。Z( x u , x v , x w)=Z(x) (举例说明:如,某地区的高程,某日某时的海面温度,某地区某日的云量)性质:随机性:区域化变量是一个随机函数,具有局部的、随机的、异常的性质。结构性:变量在点x与xh处具有某种程度的自相关,这种自相关依赖于两点间的距离及变量特征。空间局限性:指区域化变量往往只存在与一定的空间范围内,该空间称为区域化的几何域。在几何域内,变量属性最明显;在几何域外,变量属性不明显。(例如:群落中某一林分的类型;矿石品位只存在于矿化空间中)空间连续性:不同的区域化变量具有不同程度的空间连续性。(例如:土壤厚度,具有较强的连续性。土壤中某种元素的含量,连续性不强,有时甚至不连续)各向异性:区域化变量在各个方向上的性质变化相同,称为各向同性。在各个方向上的性质变化不同,称为各向异性。(知道各项同性和各向异性的图分别是什么样子,各项同性是各项异性的特例)可迁性:区域化变量在一定范围内具有明显的空间相关,但超过这一范围之后,相关关系就变得很弱,甚至消失。含义:观测前Z(x)是一个随机场,观测后Z(x)是一个普通的空间三元函数值或空间点函数值。协方差函数的计算:变异函数的计算:对半变异函数的理解:半变异函数随距离的增加而增大。即当空间上的两点距离很近时,它们是相似的,其半变异值比较小。当这两点之间的距离扩大时,它们的相似性增加,其半变异值加大。半变异函数中各个参数的意思:C0:表示h很小时,两点间观测值的变化。a:反映了区域化变量的影响范围。C(0):反映某区域化变量在研究范围内的变异强度。块金效应:对变异函数 (h),当h0时, (h)0, (h)C0(常数),这种现象称为块金效应。块金常数反映了区域化变量内部随机性的可能程度。来源:1)测量误差。2)区域化变量在小于抽样尺度h时所具有的内部变异。C0微观结构采样及试验误差协方差函数和变异函数的关系:C(h)C(0)(h) 或 (h)C(0)C(h)平稳假设:在线性地统计学研究中,只需假设Z(x)的1、2阶矩存在且平稳。当区域化变量满足下列条件,称该区域化变量满足二阶平稳或弱平稳的1)在整个研究区内,EZ(x)m(常数)存在,任意x2)在整个研究区内,区域化变量Z(x)的空间协方差函数存在且平稳 covZ(x),Z(x+h)EZ(x)Z(x+h)m2C(h) 任意x ,任意h协方差平稳意味着方差、变异函数平稳。内蕴假设:基本思想:只考虑区域化变量的增量而不考虑变量本身。当区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,则该区域化变量满足内蕴假设1)在整个研究区内,区域化变量Z(x)的增量的数学期望为0,即:EZ(x)Z(x+h)0任意x,任意h2)在整个研究区内,区域化变量Z(x)的增量的方差函数对于任意X和h存在,且平稳 varZ(x)Z(x+h)EZ(x)Z(x+h)02EZ(x)Z(x+h)22(, h)2(h)随机函数Z(x)的增量只依赖于分割它们的向量h,而不依赖于具体位置x求估计误差的方差:Z(xi)为某一区域化变量的实际值(或理论值),Z*(xi)为某一区域化变量的估计值估计误差为:R(xi)Z(xi)Z*(xi) 数学期望为:ER(xi)m E,估计误差的方差为: 2EvarZ(xi)Z*(xi)ER(xi)2ER(xi)2ER(xi)2m E2注:如果Z(x)为区域化变量,则R(x)也为区域化变量;若Z(x)是二阶平稳,即数学期望存在,方差有限,则R(x)也是二阶平稳,数学期望存在,方差有限。第四章变异函数的理论模型:1、有基台值模型:球状模型,指数模型,高斯模型,线性有基台值模型,纯块金效应模型。无基台值模型:2、幂函数模型,线性无基台值模型,抛物线模型。3、孔穴效应模型(可有有基台或无基台模型)结构分析的原因:具有复杂变化的区域化变量的空间变异性,往往不是单纯的一种结构,而是不同尺度上的多层次的结构叠加在一起,因而无法用一种理论模型来拟合它,为了全面了解区域化变量的变异性,必须进行结构分析。结构分析概念:构造一个变异函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构。套合结构概念:把分别出现在不同距离h上和(或)不同方向上同时起作用的变异性组合起来。套合结构可以表示为多个变异函数之和,每一个变异函数代表一种特定尺度上的变异性,套合结构的表达式为: (h)0(h)1(h)i(h)绝大多数变异函数由以下两个变异函数组成: (h)0(h)1(h), 0(h):代表纯块金变异函数 1(h):代表空间相关的变异函数各向异性的种类:1、当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性。2、当区域化变量在不同方向上变异性之差,不能用简单几何变换得到时,就称为“带状异向性”。3、混合结构变异函数理论模型的最优拟合:根据变异函数的计算值,选择合适的理论模型来拟合一条最优的理论变异函数曲线,通常称为最优拟合。拟合过程:1.确定曲线类型2.参数最优估计3.最优曲线的确定参数最优估计:(两种方法)极大似然估计法、距估计法和最小二乘法?最小二乘法:基本思想:使误差平方和最小,达到在误差之间一种平衡,以防止某一极端误差对决定参数的估计值起支配地位。这有助于揭示更接近真实的状况。影响变异函数的主要因素:(1)样点间距离和支撑的大小:随着样点间距离增大,变异函数的随机成分不断增加,小尺度结构特征将被掩盖。因此,要确定采样的最小尺度。用块段取样时,变异程度随支撑增大而减小,因此,要考虑支撑的大小。(2)样本数量的大小:一般要求在变程a以内各距离上的点对数目不应小于20对。(3)异常值的影响:在变程内的异常值主要影响块金值,导致块金值增大,随机成分影响加强,而空间自相关方面的影响消弱。(4)比例效应:它会导致试验变异函数值产生畸变,使基台值和块金值增大,使估计精度降低,导致某些结构特征不明显。可通过对原始数据取对数来消除。(5)飘移的影响:当EZ(x)m(x),*(h)不再是(h)的无偏估计量。结构分析的基本步骤:(1)区域化变量选择【根据具体研究目的而定,要有明确物理意义,最好能定量表示。】(2)数据审议【包括:空间取样设计、样点间距离大小、取样方法、数据代表性、均匀性、时空一致性等。目的:校正数据误差、对某些特殊问题给予初步解释。】(3)数据统计分析【包括:平均值、方差、标准差、变异系数等统计分析。】(4)变异函数的计算【要考虑数据的结构】(5)变异函数的结构分析【包括:各向同性、各向异性分析块金效应分析、不同方向上的套合结构分析等。目的:根据实验变异函数来分析所研究的区域化现象的主要结构特征。】(6)理论变异函数模型的最优拟合及检验(7)变异函数理论模型的专业分析第五章空间插值定义:根据空间分布的离散采样点值求出未知点值,在数学上属于数值分析中的插值问题。即将离散的数据点转化为连续的数据曲面。插值法分类:1、确定性插值法:全局插值法(全局多项式法),局部插值法(反距离加权插值法、局部多项式法、径向基函数法);精确性插值(反距离加权插值法、径向基函数法),非精确性插值(全局多项式法、局部多项式法)。 2、地统计插值法反距离加权插值法(IDW):相近相似原理:两物体距离越近,它们的性质越相似。反之,两物体距离越远,它们的性质越不相似。克里格插值法的概念:又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行无偏最优估计的一种方法。克里格估计量:Zv*(x)i Z(xi),i=1n 其中i为权重系数,Z(xi)为待估点影响范围内的有效样本值。简单克里格法和普通克里格法的含义:当区域化变量Z(x)的EZ(x)=m已知,则称为简单克立格法。(计算简单、更精确,但目前较少使用)。若Z(x)的EZ(x)未知,则称为普通克立格法。简单克里格法和普通克里格法的估值流程:克立格法与空间确定性插值法的区别:克立格法:基于采样数据反映的区域化变量的结构信息(变异函数或协方差函数提供),根据待估点或块段有限邻域内的采样点数据,考虑样本点的空间相互位置关系(K矩阵)、与待估点的空间位置关系(Ma矩阵),对待估点进行的一种线性无偏最优估计,并且能给出估计精度,比其他传统方法更精确、更符合实际。空间确定性插值法:通过采样点的分布直接内插(反距离加权)或通过采样点拟合数学方程内插(全局、局部多项式、径向基函数)。有关克立格法的说明:(1)克里格矩阵和估计构型(数据构型相同,克里格矩阵就相同)(2)表达式通用性(不论采样数据和待估数据为点或块段,不论协方差函数和变异函数表征为何种结构模型,克立格方程组和克立格估计方差完全通用。)(3)估计可靠性(4)若已知协方差函数或变异函数,则可提前计算克立格估计方差,用于指导采样设计(5)克里格权重系数(权重可正可负性:可获取大于最大或小于最小的样本值的插值结果。块金值的大小对权重影响:增加块金值会使插值过程更接近于简单算术平均,极端情形纯块金效应模型,样本权重相同,结果为样本的算术平均。对称性:若区域化变量是各向同性,且无丛聚效应时,当已知样点对待估样点几何位置对称时,它们之间的克里格权重系数也具有对称性。丛聚效应:在克立格估计中,不会由于一些样点丛聚在一起而增大其权重系数。屏蔽效应:屏蔽效应与块金常数有很大的关系,当块金值很小或不存在时,已知样点的克立格权重系数的大小受屏蔽效应影响。当块金常数增大,屏蔽效应减弱。当为纯块金效应时,所有样点间相互独立,协方差函数为0,变异函数等于外延方差(即基台值),求出的采样点的克立格权重系数均相同,此时屏蔽效应消失。)(6)邻域内已知
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药品销售入门培训
- 画刺猬母子课件
- 如何培训老师
- 帽子的音标课件
- 亲亲动物宝贝课件
- 梦游仙境插画课件
- 脑瘫儿童康复培训
- 校本培训年度汇报
- 幼师教学培训课件
- 2025年中国儿童毛绒包数据监测研究报告
- 贵州省榕江县2025年上半年事业单位公开遴选试题含答案分析
- 【个人简历】保洁经理求职个人简历模板
- 绵阳东辰学校五升六预备年级招生考试数学试题
- 隧道消防维护维修及专项工程技术文件
- GB/T 15856.2-2002十字槽沉头自钻自攻螺钉
- 插花艺术发展简史
- 学校防溺水“七不两会”教育(课堂)课件
- 《科学思维与科学方法论》第一章 科学问题与科研选题
- 火电厂工作原理课件
- (完整版)电除颤操作评分标准
- 跌倒坠床不良事件鱼骨图分析
评论
0/150
提交评论