计量地理学(1-2章).ppt_第1页
计量地理学(1-2章).ppt_第2页
计量地理学(1-2章).ppt_第3页
计量地理学(1-2章).ppt_第4页
计量地理学(1-2章).ppt_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章 绪 论 地理学的发展阶段 地理学在中国战国前后的古希腊、古罗马时 代开始萌芽,至今已有2000多年的发展历史。地理 学的发展可划分为三个基本阶段: 古代地理学,以记载地理知识为主体; 近代地理学,对各种地理现象进行条理化归纳 ,并对它们之间的关系进行解释性描述; 现代地理学,采用定性与定量相结合的方法, 规范研究与实证研究并举,解释各种地理现象的内 在机制并预测其未来演变。 地理学与数学的不解之缘 古代地理学和 近代地理学中的数 学方法限于定量地描述、记载和解释 。 现代地理学中运用数学方法,是 为了深入地进行定量化研究,揭示地 理现象发生、发展的内在机制及运动 规律,从而为地理系统的预测及优化 调控提供科学依据。 本章主要内容 计量地理学的形成和发展 计量地理学中的数学方法 对计量地理学的评价 计量地理学的应用 第1节 计量地理学的形成和发展 现代地理学发展史上的计量运动 计量地理学的发展阶段 计量地理学在中国的发展 一、现代地理学发展史上的计量运动 近代地理学有3种主要学派: 区域学派,代表人物是赫特纳(A.Hettner) 、哈特向(R.Hartshorne)。 人地关系学派,代表人物是洪堡( Alexander Von Humboldt)、李特尔(Karl Ritter )、李希霍芬(F. Richthofen)等。 景观学派,代表人物是施吕特尔(O. Schlter)等。 计量运动的萌芽 德籍旅美地理学家舍弗尔(F.K. Schaefer) ,1953年发表了一篇题为地理学中的例外论 的文章,抨击了哈特向的地域独特主义观点,即“ 例外主义”观点。 他认为,地理学应该是解释现象,而不应该 是罗列现象。解释现象必须有法则,应该把地理 现象看成是法则的实例。地理学的目的应该与其 他科学有相似之处:都是追求、探索法则的。 舍弗尔等人对区域学派的批评与否定,拉开 了现代地理学发展史上的计量运动的帷幕。 早 期 计 量 运 动 的 三 种 学 派 计量运动主要是由美国地理学家发起的,形成 了3大学派: 艾奥瓦的经济派。代表人物是舍弗尔、麦卡 尔蒂。受杜能、廖什、克里斯塔勒等区位论学者影 响很深,极力倡导建立地理学法则,着重探讨经济 区位现象间相互内在联系及其组合类型。 威斯康星的统计派。代表人物是威弗尔、罗 宾逊、东坎和仇佐里,以经典著作统计地理学 为代表作,主要特征是发展和应用统计分析方法。 普林斯顿的社会物理学派。代表人物是司徒 瓦特(J.Q. Stewart)。该派把物理学原理应用于社 会现象的研究之中,发展了理论地理学中的引力模 型、位势模型、空间相互作用模式。 计量运动的飞速发展 加里森(W. L. Garrison) 及其领导的华盛 顿小组首次把地理学的理论和方法建立在定 量的基础上,编写了第一本计量地理学 教材,率先在华盛顿大学举办了地理计量方 法研讨班,培养了大批现代地理学名家。 美国区域科学协会组织了大量的学术活动 ,编辑出版了区域科学年鉴,成为美国 计量运动的源地之一。瑞典学者哈格斯特朗 积极组织瑞典和美国的地理学家交流学术思 想,大大促进了计量运动向全世界的扩散。 计量运动中涌现的著名学派、组织 和学术刊物 英国以乔莱(R.J. Chorley)、哈格特(P. Haggett) 和哈威(D. Harvey)等为代表的剑桥学派; 1964年国际地理学联合会(IGU)设立的地理计量 学方法委员会; 1967年英国地理学会设立的地理教学采用模型和 计量技术委员会; 1968年日本成立的计量地理学研究委员会,1973 年又改称理论、计量地理学委员会; 1963年英国出版的地理学计量资料杂志和 1969年美国出版的地理分析国际理论地理学 杂志。 二、计量地理学的发展阶段 n第一阶段(20世纪50年代末期到60年代末期 ) 把统计学方法引入地理学研究领域,构 造一系列统计量来定量地描述地理要素的分 布特征,应用各种概率分布函数、方差等简 单的统计特征回归分析方法。 分布中心、区域形状、地理要素分布的 集中和离散程度等都有了定量指标,许多地 理要素间的相关关系,也可以进行定量地表 示。 n第二阶段(20世纪60年代末期到70年代末期 ) 多元统计分析方法和电子计算机技术在 地理学研究中广泛应用。以电子计算机技术 为手段,许多地理学家熟练地掌握了多元统 计方法,具备了分析多因素、复杂结构和动 态特征等复杂地理问题的能力。 n第三阶段(20世纪70年代末期开始到80年代 末期) 系统理论、系统分析方法、系统优化方 法、系统调控方法等被引进地理学研究领域 ,促进了运筹学中的规划方法、决策方法、 网络分析方法,以及数学物理方法、模糊数 学方法、分形几何学方法、非线性分析方法 等一系列现代数学方法的形成。同时GIS技术 的发展为其提供了先进的技术手段支持。 n第四阶段(20世纪90年代初至今) 按照英国著名地理学家、里兹大学S.奥 彭肖(S. Openshaw)教授的提法,90年代初进 入计算地理学(Geocomputational Geography)时 代。 得益于计算机技术与计算理论和方法的 巨大发展和3S技术在获取大容量、整体性地 理数据信息中的成功应用,以向量或并行处 理器为基础的超级计算机为工具,对“整体” 、“大容量”资料所表征的地理问题实施高性 能计算,探索构筑新的地理学理论和应用模 型。 除继续应用20世纪80年代中叶以来在地 理学模型研究中成功引入的突变、自组织、 混沌、分支、分形等模型外,地理计算学又 成功地引入了神经网络(neural network)、遗 传算法模型(genetic programming)、细胞 自动模型(cellar automata)、模式参数随机 取样模型(random sampling of model parameter)、模糊逻辑模型(fuzzy logic)、改 进了的地理加权回归(geographically weighted regression)等先进方法。 三、计量地理学在中国的发展 20世纪50年代末,一些大学开设运筹学课程, 地理学报等刊物上开始出现运用有关数学方法研 究地理问题的论文。 70年代末80年代初,计量地理学正式起步。 1980年5月,计量地理学被部分综合大学和师范 院校地理系列为专业课;中国地理学会于1983年召 开数量地理研讨会;1984年和1985年,正式出版了 教材计量地理学概论(林炳耀)和计量地理 学基础(张超、杨秉庚)。 20世纪80年代后期以来,地理数学方法的应用 与系统科学、系统分析方法以及GIS技术有机地结合 起来。 第2节 计量地理学中的数学方法 经过40多年的发展,计量地理学不 断完善、不断成熟。目前,计量地理学 中的数学方法,已经涉及到数学及其相 关学科的各个领域。它不但继承了计量 运动的成果,而且还吸收了40多年以来 数学、系统理论、系统分析方法、计算 机科学、现代计算理论及计算方法等领 域内的有关成果,其内容十分丰富而广 泛。 数学方法用途 概率论 用于地理现象、地理要素的随机分布研究。 抽样调查 用于地理数据的采集和整理。 相关分析 分析地理要素之间的相关关系。 回归分析 拟合地理要素之间的数量关系、预测发 展趋势 。 方差分析研究地理数据分布的离散程度。 时间 序列分 析 用于地理过程时间 序列的预测 与控制研究。 主成分分析 用于地理数据的降维处 理及地理要素的因素分 析与综合评价。 聚类分析 用于各种地理要素分类、各种地理区域划 分。 判别分析 用于判别地理要素、地理单元的类型归 属。 趋势 面分析用于拟合地理要素的空间分布形态。 协方差与变异函 数 用于研究地理要素的空间相关性及空间分 布的数量规律。 克立格法 用于地理要素分布的空间局部估计与局部 插值。 马尔可夫过程 用于研究随机地理过程、预测 随机地理 事件。 线性规划 用于研究有关规划与决策问题 。 投入产出分析 用于产业 部门联 系分析、劳动 地域构成 分析、区域相互作用分析。 多目标规 划 用于研究有关规划与决策问题 。 非线性规划 用于研究有关规划与决策问题 。 动态规 划用于有关多阶段地理决策问题 的求解。 网络分析 用于交通网络、通讯网络、河流水系等地理 网络的研究。 层次分析法 用于有关多层次、多要素战略决策问题 的分 析。 风险 型决策分 析法 用于各种风险 型地理决策问题 的分析。 非确定型决策 分析法 用于各种非确定型地理决策问题 的分析。 模糊数学方法用于各种模糊地理现象、地理过程、地理决 策和系统评 价研究。 控制论用于地理过程、地理系统的调控研究。 信息论用于各种地理信息的分析、处理。 突变论用于有关突发性地理现象、地理事件的研究 。 耗散结构理论用于有关地理系统、地理过程的组织 与演化 问题 研究。 协同学用于有关地理系统、地理过程的自组织问 题研究。 灰色系统方法用于灰色地理系统的分析、建模、控制与决 策研究。 系统动 力学方 法 用于对地理系统的仿真、模拟和预测 。 分形理论用于有关地理实体的形态及要素分布形态的 自相似机理研究。 小波分析用于多层次、多尺度、多分辨率的地理时空 过程的时频 分析。 人工神经网络用于有关地理模式的识别 、地理过程机制的 自学习及预测 等。 遗传 算法用于复杂的非线性地理问题 的计算。 细胞自动机用于有关地理过程的计算机模拟。 第3节 对计量地理学的评价 对于计量地理学,产生了三种观点: “反定量化”反对地理学定量化 研究,认为地理现象十分复杂,不能用简 单的数学方法来解释,对数学方法采取拒 绝和否定态度。代表人物:史密斯(D. Smith)、奥格登(P. Ogden)等。 “定量化”推崇地理学定量化,认为数 学方法不仅是一种分析技术,而且能够导出普遍 性规律,能够解决地理学传统研究方法所不能解 决的理论问题。代表人物如克里斯塔勒(W. Christaller)、帮吉(W. Bunge) 乔莱(R. Chorley)、 哈格特(P. Haggett)等。 “非定量化”认为数学方法只是地理学 研究方法之一,只能用来研究地理要素之间的数 量关系和地理事物的空间格局,不能用来描述和 解释地理规律,不能导出地理学理论,但其观点 摇摆不定。 笔者对计量地理学的评价与认识 世界上的任何事物都可以用数值来度量。 在现代地理学中,传统方法是数学方法的基础, 数学方法是传统方法的重要补充。 数学方法是人们进行数学运算和求解的工具,能 以严密的逻辑和简洁的形式描述复杂的问题、表 述丰富的实质性思想。 地理学研究中,数学方法有其局限性。 现代地理学中数学方法的形成和发展与计算机应 用技术密切相关。 第4节 计量地理学的应用 数学方法主要应用方面 应用中应该注意的几个问题 一、数学方法主要应用方面 分布型分析对地理要素的分布特征及规 律进行定量分析。 相互关系分析对地理要素、地理事物之 间的相互关系进行定量分析。 分类研究对地理事物的类型和各种地理 区域进行定量划分。 网络分析对水系、交通网络、行政 区划、经济区域等的空间结构进行定量分析 。 趋势面分析做出地理要素的趋势等 值线图,展示所要分析的地理要素的空间分 布规律。 空间相互作用分析定量分析各种“ 地理流”在不同区域之间流动的方向和强度 。 系统仿真研究,步骤: 对复杂地理系统的各种系统要素之间 的相互关系与反馈机制进行分析,构造系统 结构; 建立描述系统的数学模型; 以适当的计算方法与算法语言将数学 模型转化为计算机可以识别运行的工作模型 ; 运行模型,对真实系统进行模拟仿真 ,从而揭示其运行机制与规律。 过程模拟与预测研究: 通过对地理过 程的模拟与拟合,定量地揭示地理事物、 地理现象随时间变化的规律,预测其未来 发展趋势。 空间扩散研究:定量地揭示各种地理 现象,包括自然现象、经济现象、社会现 象、文化现象、技术现象在地理空间的扩 散规律。 空间行为研究:主要是对人类活动的 空间行为决策进行定量的研究。 地理系统优化调控研究:运用系统控 制论的有关原理与方法,研究人地相互作 用的地理系统的优化调控问题,寻找人口 、资源、环境与社会经济协调发展的方法 、途径与措施。 地理系统的复杂性研究:地理系统是 高度复杂的巨系统,其复杂系统研究已经 引起了国际地理学界的高度重视。 二、应用中应该注意的几个问题 n 地理数据的筛选与质量检验问题 地理数据在建模分析中的作用: 确定模型中的参数与初值; 检验模型的正确性、合理性和有效 性。 n 模型的建造问题 n建模程序(威尔逊 ,英国) 建造一个数学模型,首先必须明确建模的目 标; 地理问题,即所研究的对象系统; 在各类变量中必须明确哪些变量是可控变量 ,即通过对哪些变量的调控可以使系统的行 为发生改变; 在模型中,如何处理时间概念,即认为被研 究的对象系统是无记忆系统还是记忆系统, 是建立静态模型还是建立动态模型; 所建模型将采用什么观点、解决哪些理论问题、 与此问题有关的建立模型的基本假设,以及所依 据的理论、将要解决的问题等都将直接或间接地 体现在模型之中; 能用于建模的有关数据、资料是什么,可能性如 何,应采用何种建模技术,有现成的技术方法可 供借鉴还是需要建造新模型,采用什么方法确定 模型的参数; 所建模型的精度及该模型的合理性和有效性如何 ,采用什么方法和手段检验所建模型。 n数学方法和GIS的结合 研究一些复杂的地理问题,需要综合应用多种数 学方法,建立一系列具有分析、模拟、仿真、预 测、规划、决策、调控等多种功能的众多模型组 成的模型系统。这些模型系统离不开GIS的支持 。 GIS的基本技术及建造空间分析模型需要借助有 关的数学方法来实现。近几年来出现的基于知识 的空间决策支持系统(苏理宏等,2000)就是数 学方法、人工智能技术与GIS技术在地理学应用 研究领域中相互结合的成功典范。 第2章 地理数据及其 采集与预处理 本章主要内容 地理数据的类型 地理数据的基本特征 地理数据的采集与处理 地理数据的统计处理 地理数据分布的集中化与均衡度指 数 第1节 地理数据的类型 空间数据:用于描述地理实体、地理 要素、地理现象、地理事件及地理过 程产生、存在和发展的地理位置、区 域范围及空间联系。 属性数据:用于描述地理实体、地理 要素、地理现象、地理事件、地理过 程的有关属性特征。 两个概念: 一、空间数据 点由一个独立的坐标点(x,y) 定位,是空间上不可再分的几何实体 。 线由若干个(至少两个,理论上 是无穷个)坐标点(xi,yi)(i =1,2 ,)定义,有一定的长度和走向, 表示线状地物或点实体之间的联系。 面表示在空间上连续分布的地理 景观或区域。 点、线、面之间的拓扑关系。 图2.1.1 三种基本的地理几何实体及其组合 二、属性数据 n 数量标志数据 间隔尺度数据:以有量纲的数据 形式表示测度对象在某种单位(量纲)下 的绝对量。 比例尺度数据:以无量纲的数据 形式表示测度对象的相对量。 品质标志数据 有序数据:当测度标准不是连续的 量,只是表示其顺序关系的数据。 二元数据:用0、1两个数据表示地 理事物、地理现象或地理事件的是非判断 问题。 名义尺度数据:用数字表示地理实 体、地理要素、地理现象或地理事件的状 态类型。 几种属性数据举例: 年平均气温/年降水量 /mm 土地面积 /hm2 人口 /人 国内生产总值 /万元 区域1 8.0 500.2 245.6 1 210 2 678.28 区域2 7.6498.61064.1 0232 015.47 区域36.5550.9894.38481 754.56 区域38.5586.4668.76541 365.46 表2.1.1 间隔尺度数据 间隔尺度数据 比例尺度数据 年 份19961997199819992000 耕地复种指数120.40113.56126.54132.76121.43 农业发 展指数100115.68124.50135.69129.56 表2.1.2 某地区耕地复种指数和农业发展指数 有序尺度数据 城市A城市B城市C城市D城市E城市F 规模等 级 123443 人口位次12465 3 表2.1.3 城市规模等级与人口数量的排位次序 二元数据 城市A城市B城市C城市D城市E 城市A1101 城市B1110 城市C1110 城市D0111 城市E1001 表2.1.4 二元数据 注:1表示两城市之间通航; 0表示两城市之间不通航。 名义尺度数据 地块序列号12345 6 土地利用类型1315211414 31 表2.1.5 土地利用类型 第2节 地理数据的基本特征 数量化、形式化与逻辑化 不确定性 多种时空尺度 多维性 一、数量化、形式化与逻辑化 定量化的地理数据是建立地理数学模 型的基础,其作用为:确定模型的参数、 给定模型运行的初值条件;检验模型的有效 性。 形式化、逻辑化与数量化,是所有地 理数据的共同特征。 地理计算学,对于地理数据的形式化 、逻辑化提出了更高的要求,要求“整体 ”和“大容量”的地理数据具有统一的数 据形式和交换标准。 不确定性是地理数据的基本特征之一 。地理数据不确定性的来源: 地理系统本身的复杂性从本质上决 定着地理数据的不确定性。 各种原因所导致的数据误差。 二、不确定性 三、多种时空尺度 从空间尺度上来看,描述地理区域的各 种地理数据,具有多种空间尺度既有全 球尺度的、洲际尺度的、国家尺度的,也有 流域尺度的、地区尺度的、城市尺度的、社 区尺度的。 从时间尺度上来看,描述地理过程的各 种地理数据具有多种时间尺度,如历史年代 、天、月、季度、年等。 四、多维性 对于一个地理对象的具体意义要从空间 、属性、时间三个方面综合描述: 空间方面,描述该地理对象所处的地理 位置和空间范围,一般需要23个变量 ; 属性方面,描述该地理对象的具体内容 ,至少需要1个以上,多则需要十几个、甚 至几十个变量 ; 时间方面,描述该地理对象产生、 发展和存在的时间范围 ,需要1个变量。 地理数据的这种多维性,被人们描 述为地理数据立方体(the geographical data cube)。 图 2.2.1 地理数据立方体 第3节 地理数据的采集与处理 地理数据的采集 地理数据处理 一、地理数据的采集 n地理数据的渠道来源 来自于观测、测量部门的有关专业数 据。 来自于统计年鉴、统计公报中的有关 自然资源及社会经济发展数据。 来自于有关单位或个人的不定期的典 型调查数据、抽样调查数据。 来自于政府公报、政府文件中的有关 数据。 来自于档案、图书等文献资料中的有 关数据。 来自于互联网(internet)的有关共享 数据。 来自地图图件。主要包括各种比例尺 的地形图、影像地图、专题地图等。 来自遥感数据。主要包括各种航空 遥感数据和卫星遥感数据。 其他来源的有关数据。 n采集地理数据过程中需要注意的问题 数据的完备性和可靠性。 在数据采集过程中,最大限度 地减小数据的误差。 在数据采集完毕后,进行检验 ,辨别真伪,通过数据筛选,去粗取 精、去伪存真。 二、地理数据处理 地理数据处理,是所有地理问题研究的核 心环节。 从理论上讲,在地理学中,数学方法的运 用主要有两个目的:(1)运用数学语言对地理 问题的描述,建立地理数学模型,从更高、更 深层次上揭示地理问题的机理;(2)运用有关 数学方法,通过定量化的计算和分析,对地理 数据进行处理,从而揭示有关地理现象的内在 规律。因此,从一定意义上来说,地理数据处 理也是计量地理学的任务之一。 地理信息系统的核心功能是地理数据处 理,它实现了空间数据与属性数据的完美 结合。数学方法确实是其强有力的支撑。 地理计算学(Geocomputation)的实质 是借助于现代化的计算理论、计算方法和计 算技术,通过对“整体”和“大容量”的地 理数据进行处理,揭示复杂地理系统的运行 机制,探索和寻求新的地理系统理论。 地理数据的采集、处理及其与数学方法、 地理信息系统、地理计算学之间的相互关系图: 地 理 数 据 的 数 据 源 地 理 数 据 采 集 数学方法 GIS Geocomputation 地理处理 数据 图2.3.1 地理数据采集与处理 第4节 地理数据的统计处理 统计整理 几种常用的统计指标与参数 应用实例:中国大陆省份人均GDP 的变异系数 一、统计整理 统计整理的基本步骤: 统计分组,就是根据研究目的,按 照一定的分组标志将地理数据分成若干组 。 计算各组数据的频数、频率,编制 统计分组表。 作分布图。 例:对于黄土高原西部地区某山区县的人工 造林地调查数据进行统计整理,步骤如下: (1)以地块面积作为统计分组标志进行 分组; (2)计算各组数据的频数、频率,编制 成如下的统计分组表; 分组 序号 1234567891011 分组 标志 (0,1(1,2(2,3(3,4(4,5(5,6(6,7(7,8(8,9(9,10(10,11) 组 中 值 0.51.52.53.54.55.56.57.58.59.510. 5 频 数 25961362142532862602031548524 频 率 1.445.537.8312.3314.5716.4714.9811.698.874.901.38 向上 累计 频数 251212574717241 0101 2701 4731 6271 7121 736 向下 累计 频数 1 7361 7111 6151 4791 2651 01272646626310924 表2.4.1 某县人工造林地面积的统计分组数据 (3)做出频数分布的直方图 : 图2.4.1 频数分布柱状图 (4)将上图各组的频数分布从组中值位置 用折线连接起来,得到频数分布的曲线图: 图2.4.2 频数分布曲线图 二、几种常用的统计指标与参数 描述地理数据一般水平的指标 描述地理数据分布的离散程度的指 标 描述地理数据分布特征的参数 (一)描述地理数据一般水平的指标 n平均值 反映了地理数据一般水平。计算 方法: 未分组的地理数据 分组的地理数据 (2.4.1) (2.4.2) n中位数 对于未分组的地理数据,样本数n为奇数 时,中位数是位置排在第(n+1)/2位的数据;样本数 n为偶数时,中位数是排在中间位置的两个数据的 平均值。 分组的地理数据,中位数的计算方法: 确定中位数所在的组位置,按下述公式计算中位数 或 (2.4.3) (2.4.4) 在式(2.4.3)和 (2.4.4)中: Me代表中位数; L为中位数所在组的下限值; U为中位数所在组的上限值; fm为中位数所在组的频数; Sm-1为中位数所在组以下的累计频数 ; Sm+1为中位数所在组以上的累计频数 ; d为中位数所在组的组距。 众数 众数就是出现频数最多的那个数,计 算方法分为以下两种情况: 未分组的地理数据,可以根据每 一个数据出现的频数大小直接确定众数 。 对于已经分组的地理数据,中位 数的计算步骤如下: 确定频数最多的组为众数所在组。 按以下公式计算众数 或 (2.4.5) (2.4.6) 在式(2.4.5)和 (2.4.6)中: M0代表众数; L为众数所在组的下限值; U为众数所在组的上限值; 1为众数组频数与下一组频数之差; 2为众数组频数与上一组频数之差; d为众数所在组的组距。 例1:表2.4.2给出了某农场各农田地块的面积 ,试计算其平均值、中位数和众数。 地 块 编 号 123456789101112平均值中位 数 众 数 面 积 /hm2 12835035555072408529657554.2552.550 应按照未分组数据计算其平均值、中位数 和众数,计算结果见上表最后三列。 表2.4.2 某农场各农田地块的面积 例2:表2.4.3给出了中国西部地区某城市2000年家 庭月收入的抽样调查结果,试计算其平均值、中 位数和众数。 家庭月收入/元户数向上累计频 数向下累计频 数 2 0003 000300300 2 130 3 0004 0001 3001 6001 830 4 0005 0002001 800530 5 0006 0001501 950330 6 0007 0001002 050180 7 0008 000502 10080 8 0009 000302 13030 合 计2130 表2.4.3 中国西部地区某城市2000年家庭月收入的 抽样调查结果 解题步骤: (1)用公式(2.4.2)计算平均数 (2)计算中位数。先确定中位数所在 组的位置,再按照公式(2.4.3)或者 (2.4.4)计算中位数 Me =3 588.46(元) =3 899.06(元) (3)计算众数,先确定众数所在组,再按 照公式(2.4.5)或(2.4.6)计算众数。 显然,众数所在组应该在第二组。 众数M0 =3 476.19 (元)。 (二)描述地理数据分布离散程度的指标 n极差 指所有数据中最大值与最小值之差,计算公式为 n离差 指每一个地理数据与平均值的差,计算公式为 离差平方和 它从总体上衡量一组地理数据与平均值的离散程 度,其计算公式为 (2.4.9) (2.4.8) (2.4.7) n方差与标准差 方差是从平均概况衡量一组地理数据与平 均值的离散程度。方差计算公式为 标准差为方差的平方根,计算公式为 (2.4.10) ( 2.4.11) 如果以样本方差对标准差进行无偏估计, 则计算公式为 (2.4.12) 变异系数 变异系数表示地理数据的相对变化(波 动)程度,其计算公式 (2.4.13) 例如:对于表2.4.2中的数据,分别计算极差 、离差、离差平方和、方差、标准差、标准差 的无偏估计,以及变异系数。 地块编 号 123456789101112平均值值中位 数 众 数 面积/hm212835035555072408529657554.2552.550 表2.4.2 某农场各农田地块的面积 步骤 : (1)按照公式(2.4.7)计算极差 (2)按照公式(2.4.8)计算离差,结果见 表2.4.4。 序号123456789101112 面积128350355550724085296575 离差-42.25 28.75-4.25 -19.25 0.75 -4.25 17.75-14.25 30.75-25.25 10.7520.75 表2.4.4 地理数据的离差 (3)按照公式(2.4.9)计算离差平方和 (4)按照公式(2.4.10)计算方差 (5)按照公式(2.4.11)计算标准差 (6)按照公式(2.4.12)计算标准差的无偏估计 (7)按照公式(2.4.13)计算变异系数 5 666.25 21.729 9 0.418 4 (三)描述地理数据分布特征的参数 n偏度系数 测度地理数据分布的不对称性情况,刻画以 平均值为中心的偏向情况,计算公式为 g10, 表示正偏,即均值在峰值的右边;g1=0,表示对 称分布(如下图)。 (2.4.14) 图2.4.3 偏度系数的三种情形 n峰度系数 它测度了地理数据在均值附近的集中程度,其 计算公式为标准正态分布的峰度系数 g2 =0;g20 ,表示地理数据分布的集中程度高于正态分布; g20,表示地理数据分布的集中程度低于正态分 布(图2.4.4)。 图2.4.4 标准峰度系数的三种情形 (2.4.15) 三、应用实例:中国大陆省份人均 GDP的变异系数 我们知道变异系数测度的是地理数据分布 的相对差异。 为了分析中国大陆经济发展的省际差异及 其演化过程,我们首先把19782002年各省( 直辖市、自治区)的GDP数,按照可比价格进 行折算,再除以人口数,计算出按照可比价衡 量的人均GDP数据,然后再用公式(2.4.13) 计算变异系数,结果如图2.4.5。 图2.4.5 19782002年中国大陆省份人均GDP的变异系数 从图2.4.5中可以看出,在19782002 年期间,人均GDP的变异系数,以1990年为 转折点,呈现出一个U形曲线。即:人均GDP 的变异系数,在19781990年期间基本上呈 现下降趋势,而在19902002年期间则基本 上呈现上升趋势。 这说明,在19781990年期间,中国大 陆经济发展的省际差异,基本上呈缩小趋势 ,而19902002年期间则基本上呈扩大趋势 。这一变化与国家宏观经济政策变动的时间 、趋势大体一致。 第5节 地理数据分布的集中化 与均衡度指数 罗伦次曲线与集中化指数 基尼系数 锡尔系数 (一)罗伦次曲线 20世纪初,意大利统计学家罗伦次( M. Lorenz),首先使用累计频率曲线研究 工业化的集中化程度。后来,这种曲线就 被称之为罗伦次曲线。 一、罗伦次曲线与集中化指数 绘制罗伦次曲线实例 (1)将表2.5.1各产业部门的收入及其占总收 入比重(百分比),从大到小重新排序; (2)从大到小,逐次计算累计百分比; (3)以自然序号为横坐标(x),累计百分比为 纵坐标(y);以(部门代码,累计百分比)为坐标 点,连成一个上凸的曲线(图2.5.1和图2.5.2), 即罗伦次曲线。 表2.5.1 某地区农户家庭经营性纯收入水平及其构成 图2.5.1 1999年农户家庭经 营性纯收入构成的罗伦次曲线 图2.5.2 2004年农户家庭经 营性纯收入构成的罗伦次曲线 结果分析 罗伦次曲线的上凸程度,表示农户家 庭经营性纯收入的部门集中化程度。上凸 程度越大,就表示农户家庭经营性纯收入 越是集中于某些产业部门。 如果各个产业部门的收入是均等的, 则罗伦次曲线正好就变成了正方形的对角 线。 比较图2.5.1和图2.5.2,可以看出该 地区1999年农户家庭经营性纯收入的部门 集中化程度高于2004年。 假若罗伦次曲线的解析式为: 显然,该曲线下方区域的面积为: 当数据均匀分布时,A就变成了对角线以下三角形 的面积(R);当数据集中于一点时,A就变成了整个 正方形的面积(M)。 (二)集中化指数 n集中化指数 是一个描述地理数据分布的集中化程 度的指数。 (2.5.3) 。 , 显然,I越大,就说明数据分布的集中化程度 越高;反之,I越小,就说明数据分布的集中化程 度越低(越均衡)。 常采用如下近似取值方法: A实际数据的累计百分比总和; R均匀分布时的累计百分比总和; M集中分布时的累计百分比总和。 集中化指数在0,1区间上取值。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论