第9章空间统计分析_第1页
第9章空间统计分析_第2页
第9章空间统计分析_第3页
第9章空间统计分析_第4页
第9章空间统计分析_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 9章 DEM地形统计分析 9.1概述 9.1.1基本概念地形统计分析 是指应用统计方法对描述地形特征的各种可量化的因子或参数进行相关、回归、趋势面、聚类等统计分析,找出各因子或参数的变化规律和内在联系,并选择合适的因子或参数建立地学模型,从更深层次探讨地形演化及其空间变异规律。9.1.2主要分析内容 n 1. 原始 DEM数据及派生地形因子基本统计特征的分析地形因子的最大值、最小值、极差、中值、总和、平均值、离差、方差、标准差、频数等基本统计量n 2. 地形因子关联特征及空间分布规律的研究对地形因子分析的主要内容之一就是查明因子之间的相互关系和内在联系,并选定合适的因子建立地学模型,利用这种模型对地形的发展与动态做出数值预测。9.2 基本统计量 常用的基本统计量主要包括:最大值、最小值、极差、均值、中值、总和、众数、种类、离差、方差、标准差、变差系数、峰度和偏度等。这些统计量反映了数据集的范围、集中情况、离散程度、空间分布等特征,对进一步的数据分析起着铺垫作用 平均数中位数众数分位数偏度峰度总和比率比例种类集中趋势描述数据特征的统计量离散程度基本统计量其他统计量分布形状极值 极差 离差 平均离差 离差平方和方差 标准差 变差系数 图 10.1 基本统计量9.2.1 代表数据集中趋势的统计量( 1)频数和频率将变量 xi( i 1, , n)按照大小顺序排列,并按一定的间距分组,变量在各组出现或发生的次数称为 频数 (absoluter frequency ) ;各组频数与总频数之比叫做 频率 (frequency ) 。如有一组 测量数据 , 数据 的总个数 N=148最小的测量值 xmin=0.03,最大的测量值xmax=31.67,按组距为 x=3.000将 148个数据分为 11组,其中 分布 在 15.05 18.05范围 内的数据有 26个,则称该数据组的 频数 为 26。 再如在 3.149324中, 9出现的频数是 3,出现的频率是 3/18=16.7% n 计算出各组的频率后,可以作出 频率分布图 ,若以纵轴表示频率,横轴表示分组,就可以作出 频率直方图 ,用以表示事件发生的频率和分布状况。分组编号 数值 频数 频率1( 1 3) 1, 1, 2, 3, 3, 3 6 0.242( 4 6) 4, 5, 5, 6 4 0.163( 7 9) 7, 8, 8, 8, 9 5 0.204( 10 12) 10, 10, 11, 12 4 0.165( 13 15) 13, 13, 14, 14, 15, 15 6 0.24频率分布表频率直方图9.2.1 代表数据集中趋势的统计量( 2)平均数 (mean)平均数反映了数据取值的集中位置。对于数据 Xi( i 1, 2, , n),通常有 简单算术平均数、加权算术平均数、调和平均数和集合平均数 。n 简单算术平均数 :将所有数据的数值相加,再除以数据的总数目,公式为n 加权算术平均数 (Weighted means ):当数据对数据总体的影响的权重值不同时,计算该平均数,将每个数据乘以权值后再相加,所得到的和除以数据的总体权重数,计算公式为例 : 你的小测成绩是 80分,期末考成绩是 90分,老师要计算总的平均成绩,就按照小测 40%、期末成绩 60%的比例来算,所以你的平均成绩是: 8040%+9060%=86n 调和平均数 (harmonic mean ):各个数据的倒数的算术平均数的倒数,又称为倒数平均数,调和平均数也分简单调和平均数和加权调和平均数,其公式分别为n 几何平均数 (geometric mean ):是 n个数据连乘的积开 n次方根,计算公式为(3)中位数 (Median )一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和 众数不同,中位数不一定在这组数据中)。中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数 n 实例:第 1组数: 1、 2、 3、 6、 7的中位数是 3。 原理:如果总数个数是奇数的话 ,按从小到大的顺序 ,取中间的那个数 第 2组数: 1、 2、 3、 5的中位数是 2.5。 原理:如果总数个数是偶数的话 ,按从小到大的顺序 ,取中间那两个数的平均数 .(2+3)2=2.5 第 3组数: 1、 100、 101、 10000的中位数是100.5 注意:中位数 和数值的大小没有绝对的关系 (4)众数 (Mode )众数是数据集中出现频数(次数)最多的某个(或某几个)数。 (众数可以不存在或多于一个) 例如: 1, 2, 3, 3, 4的众数是 3。 但是,如果有两个或两个以上个数出现次数都是最多的,那么这几个数都是这组数据的众数。 例如: 1, 2, 2, 3, 3, 4的众数是 2和 3。 还有,如果所有数据出现的次数都一样,那么这组数据没有众数。 例如: 1, 2, 3, 4, 5没有众数。 9.2.2 代表数据离散程度的统计量n 有时虽然两个数据集的平均数相等,但各数据分布在平均数左右的疏密程度却不相同,也就是它们的离散程度不一样,为了把一个数据集的离散程度表现出来,就需要研究离散度。 n 离散程度越大,数据波动性越大,以小样本数据代表数据总体的可靠性越低;离散程度越小,则数据波动性小,以小样本数据代表数据总体的可靠性越高。 (1)最大值 (max)与最小值 (min) 把数据从小到大排列,最前端的值就是最小值,最后一个就是最大值 (2)极差 (range ) 一个数据集的最大值与最小值的差值称为极差,它表示这个数据集的取值范围 极差计算公式: x=xmax-xmin ( xmax为最大值, xmin为最小值) 如 : 12,12,13,14,16,21 这组数的极差就是 21 12=9 (3)分位数 (quantile )将数列按大小排列,把数列划分为相等个数的分段,处于分段点上的值就是分位数。 (4)离差 (deviation) 表示各数值与其平均值的离散程度,其值等于某个数值与该数据集的平均值之差 (5)平均离差 (mean deviation)是把离差取决对值,然后求和,再除以变量个数 根据定义,一个数据集的离差和恒等于 0。若将离差取绝对值后求和,再取平均值,得到平均离差 :(6)离差平方和离差平方和是把离差求平方,然后求和平均离差和和离差平方和是表示各数值相对于平均数得离散程度的重要统计量。 (7)方差 (variance)和 标准差 (standard deviation )方差是均方差的简称,是以离差平方和除以变量个数求得的,记为 s2,即:标准差是方差的平方根,记为( 8)变差系数 (coefficient of variation)变差系数也称为离差系数或 变异系数 ,是标准差与均值的比值,以 表示 n 变差系数用来衡量数据相对变化的程度9.2.3 代表数据分布形态的统计量n 分布形态可以从两个角度考虑,一是数据分布 对称程度 ,另一个是数据分布 集中程度 。n 前者的测定参数称为 偏度或偏斜度 ,后者的测定参数称为 峰度 。偏度和峰度是衡量数据分布特征的重要指标。 (1)偏度 (skewness)偏度是刻画数据在均值两侧的对称程度的参数,用偏度系数来衡量。标准偏度系数( g1): n 当 g10时,数据的分布情况如下图:f(x)f(x) f(x)f(x)f(x) f(x)(2)峰度 (kurtosis)峰度是刻画数据在均值两侧的集中程度的参数,用峰度系数来衡量。n 标准峰度系数 g2按下式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论