辽宁工程技术大学地理建模复习资料,仅供参考_第1页
辽宁工程技术大学地理建模复习资料,仅供参考_第2页
辽宁工程技术大学地理建模复习资料,仅供参考_第3页
辽宁工程技术大学地理建模复习资料,仅供参考_第4页
辽宁工程技术大学地理建模复习资料,仅供参考_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

其中(了解)以及浅蓝色字体内容不需背下来,掌握其大概意思就行;(理解)内容不需死记硬背,但需要看明白。其中肯定会考利用指数平滑法计算题和城市垃圾场选址的概念模型。题型:选择题(可能有判断题)、名词解释题、简答题、计算题。第1章绪论第1节模型的一般概念模型:对现实世界中的实体或现象的抽象或简化,是对实体或现象中的最重要的构成及其相互关系的表述。模型的基本特征模型的基本特征:结构性、简单性、清晰性、客观性、有效性、可信性、易操作性模型的分类与用途概念模型:利用科学的归纳方法,以对研究对象的观察、抽象形成的概念为基础,建立起来的关于概念之间的关系和影响方式的模型。物理模型(了解):①又叫实体模型,现实世界在尺寸上缩小或放大后构成的相似体。②建立在分析现象与机理认识基础上的模型。③用物理学方法抽象形成的反映物质或现象本质的理想模型。④物理模型是对真实数据库的描述。数据库中的一些对象如下:表,视图,字段,数据类型、长度、主键、外键、索引、是否可为空,默认值。数学模型(了解):用数学方程来描述现实世界结构和特性的模型。模型的其他分类——按人们对事物发展过程的了解程度分类:①白箱模型——指那些内部规律比较清楚的模型。如力学、热学、电学以及相关的工程技术问题。②灰箱模型——指那些内部规律尚不十分清楚,在建立和改善模型方面都还不同程度地有许多工作要做的问题。如气象学、生态学、经济学等领域的模型。③黑箱模型——指一些其内部规律还很少为人们所知的现象。如生命科学、社会科学等方面的问题。但由于因素众多、关系复杂,也可简化为灰箱模型来研究。模型的其他分类——根据对空间数据的表达(GIS中):栅格模型和矢量模型。①矢量结构精度高,存储量小;易建拓扑关系,擅长管理线状地物和拓扑关系搜索;易于网络分析;空间位置表达明显属性隐含;图形显示质量好。但数据结果复杂,叠加操作困难,空间分析能力较差。②栅格结构精度稍低;数据量大;难于建拓扑;属性表达明显,位置隐含;图形显示的质量不如矢量。但数据结构简单,易于与遥感、摄影数据结合,空间操作与分析容易,有发展潜力。概念模型第1节概念和变量概念:概念又称为术语、专业名词等,是一组观念、一种结构,是对于问题普遍的、本质特征的反映。指标维度、属性变量(不需掌握定义)方位变量:用方位角的值表示的变量。可分为真方位角、磁方位角和坐标方位角。第2节数据数据源——离散数据和连续数据(理解):1)连续数据——>离散数据举例:①地图数字化中等高线的绘制;②遥感影像:将连续的地物波谱离散化;③DEM:数字地面模型,将连续的地表离散化为三角形或正方形连接成的格网。2)离散数据——>连续数据举例:①等高线的插值与拟合;②人口——>人口密度绝对误差、相对误差和百分误差:绝对误差——测量的真值与给定的测量值或由计算得到的近似值之间的差值;相对误差——绝对误差除以测量值的真值;百分误差——相对误差乘以100。(测量和计算的准确度的真正指标是相对误差)数据的精密性、准确性和精确性:1、精密性:在进行某一量的测量时,各次测量的数据大小彼此接近的程度——它是偶然误差的反映。2、准确性:测量数据的平均值偏离真实值的程度——它是系统误差的反映。3、精确性:测量的精确度是指测量数据集中于真实值附近的程度——它是对测理结果的综合评价。GIS数据的来源?(了解)(1)空间数据:①室外地面观测—>键盘和电子记录设备—>GIS传统测绘(钢卷尺)—>光学测绘(经纬仪、钢卷尺)—>光、电测绘(经纬仪、测距仪、全站仪)—>光、机、电(测量机器人)—>光、机、电、传感器(三维激光扫描仪)②GNSS(GlobalNavigationSatelliteSystem):美国的GPS、俄罗斯的Glonass、欧洲的Galileo、中国的北斗卫星导航系统③遥感—>磁带机或硬盘—>GIS④纸质地图—>扫描数字化—>GIS(2)属性数据:野外测量、调查统计资料、……GIS数据的误差源?(1)按误差属性①位置误差②属性误差③逻辑一致性误差:数据内容(位置/属性/时间),拓扑一致性④其他误差(2)按数据处理过程①数据采集②数据编辑③数据处理④数据分析和建模⑤其他误差GIS数据质量控制?①手工或人工检查②元数据方法③地理相关法:需要专业知识测量尺度系统和地理系统系统:内部包含若干组成,其间通过有规则的相互作用而相互依赖,并以某些形式联合而成的统一整体。地理系统:太阳辐射能进入地球表层后再各个圈层中流通转化,使他们相互依存,相互作用,形成一个复杂的整体,这就是地理系统。反馈分析(理解):反馈——一个系统为了实现自己的目标状态,把系统的输出信息再次输入,影响信息的再输出,这个过程就是反馈。①正反馈——通过反馈活动,使系统的状态越来越偏离目标;②负反馈——通过反馈活动,使系统的状态越来越接近目标。概念模型的例子(必考大题)城市垃圾场选址的概念模型(开放性答案,就是老师在课堂上讲的,找出各个需要满足的条件画一个模型)【思考】城市垃圾场选址的概念模型(以下来自课件,不作为答案)(了解)第一步,分析问题(问题分解,文字描述)垃圾场选址—>垃圾场需满足若干条件—>寻找(选择)同时满足这些条件的区域—>如果每个条件能用一个数据图层表示,问题转化为—>多个图层的叠加分析,寻找交集第二步,解决问题的关键证据(选址条件,专业知识+专家建议)第三步,抽象出概念、定义(对证据或条件进行简化)4、第四步,确定数据源(对证据或条件进行简化)第五步,条件量化(专业知识、专家建议)第六步,图层数据处理第七步,图层叠加第八步,输出结果(生成二值图)统计相关模型概述第1节建模基础普查-抽样-对象-总体-个体-样本:【例子】想了解北京市民对征收房地产税的看法,需要进行问卷调查,给出几种选项(非常支持、支持、无所谓、反对、非常反对),目的是希望知道对这个问题的不同看法各自占的比例。可以调查每一个北京市民的观点,这是普查,但费时费力;也可以只调查部分北京市民,根据这些人的观点来理解整个北京市民的总体观点,这是抽样调查。这个例子中,每一个北京市民是一个研究对象,单个北京市民的观点称为个体,所有北京市民对这个问题的观点为一个总体,总体是包含所有要研究的个体的集合。而调查时问到的那部分市民的观点(也就是部分个体)称为该总体的一个样本,是总体的一部分。简单随机抽样:在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样,而这样得到的样本则称为随机样本。抽样误差、非抽样误差:抽样误差-总体特征值与由样本得到的总体特征值之间的差异,取决于抽样的方法、样本的代表性等。非抽样误差-数据在采集、记录、编辑等过程中产生的误差。建模步骤数据整理:1)规范化变量命名(了解)含义明确:准确而简洁,避免歧义、模糊;尽量术语化(科学术语),例如DEM、DSM还是DTM,特别是中英文对照问题格式规范:中文or英文,有or无下划线,大小写……标准单位名称(如果有量纲)多期数据的统一性问题:变量名称未变,但涵义发生变化,或扩大或缩小(人均收入—>人均可支配收入),或计算方法不同(如郁闭度),或数据类型变化(栅格-矢量),或调查方法变化(如分层抽样—>机械抽样);变量名称和涵义均发生变化;变量从无到有或从有到无(如CPI指数)。明确变量的尺度和数据类型检查样本(了解)样本编号与现场一致(或有对照表);不应有缺失、模糊。录入数据——形成数据文件或数据库(了解)属性特征数据:专题属性与时间属性数据——建立属性检查规则:单变量、不同变量间的联系;空间特征数据:检查拓扑、地理相关法检查。填写说明日志(了解)所有整理的相关记录,便于使用者了解数据的处理过程、出现问题容易通过日志找回源头、为后续的结果解释做准备。数据预处理统计特征描述——中位数(理解):将观察值从小到大排列后,位于中间位置的数。(了解)样本量为奇数——中间位置的数样本量为偶数——中间两个数的均值※由于中位数不易受极端值影响,所以中位数比均值稳健【举例】平均收入;评委打分;跳水打分(5评委-7评委)统计相关模型-相关分析一、简单相关分析1线性相关系数简单相关分析上用得最多的是(Pearson相关系数)Pearson相关系数(Pearson’scorrelationcoefficient)——参数检验(了解)又叫相关系数或线性相关系数。它一般用字母r表示。它是由两个变量的样本取值得到,这是一个描述线性相关强度的量,取值于-1和1之间。①公式(不用记)②说明:相关系数的绝对值<0.1,不相关0.1-0.3,弱相关0.3-0.7,中等相关或相关性较强>0.7,强相关2偏相关分析(理解例题)例题:现有一批汽车的资料(数据见“例题-简单线性相关和偏相关分析-auto(汽车数据).sav),现希望分析汽车价格和每加仑汽油可行驶的距离之间的相关关系。1)定义(了解):在多要素所构成的系统中,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。要点(理解要点③):①偏相关分析是研究多变量中两个变量的关系②前提是必须控制其他变量的影响(保持不变)——“偏”③偏相关系数反映在多个变量中,某一变量对另一变量的独立贡献④如果在多个变量中计算其中两个变量A与B的简单相关相关系数,得到的结果反映了其余多个变量通过B对A的共同影响,所以有时会给我们假象。3复相关系数的计算与检验复相关系数:反映几个变量与某一个变量之间的复相关程度。二、典型相关分析(了解)在现实世界中,两组变量之间具有相关关系的问题很多,例如生物群落与生活环境之间的关系(如生物与土壤之间),土壤养分与大气环境之间,投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国内收入、运输业国内收入、建筑业国内收入等)具有相关关系;运动员的体力测试指标(如反复横向跳、纵跳、背力、握力等)与运动能力测试指标(如耐力跑、跳远、投球等)之间具有相关关系等。三、对相关分析的理解(明白其大概意思就可以)1、相关分析的结果只表征变量间的线性关系(线性相关系数、偏相关系数、复相关系数)的强弱;无法表明其他的如非线性关系等复杂关系。2、相关分析的结果不一定能反映现实世界变量间的真实关系:也许与样本选择有关(或者叫样本选择偏差),也可能是非线性关系,也可能是样本中的异常值或强影响点引起3、变量之间有关系这个事实并不意味着一定存在着因果关系4、如何证明因果关系5、相关分析的积极作用(1)反映事物之间的某种联系(2)相关分析是因果关系的基础,因此,相关研究对于探索性研究具有重要意义,有助于提出假设,作进一步的验证性研究。(3)只要有关系,即使不是因果关系也不妨碍人们利用这种关系进行推断:6、现实中容易犯的认识错误(1)以偏概全(样本选择偏差)(2)同时发生的事有因果关系(3)一先一后发生的事有因果关系①斗牛的真相:公牛因为看见红色而愤怒吗?②食物相克——海鲜和维生素C(水果)虾和柠檬水(砷)(4)把巧合视为因果占卜、风水、算命、星座学、属相配对统计相关模型—回归分析一、回归分析概述1、回归分析回归分析研究一个随机变量与多个变量之间的定量关系,检验解释变量的显著程度并比较其作用的大小,进而用两个或多个变量的变化解释和预测因变量的变化。2、回归分析模型(理解残差项ε)回归方法的关键是针对不同测量尺度的数据,寻找m个解释变量的最优组合(假设有m个自变量,并不是所有的解释变量都纳入方程中,所以有进入方程的变量个数p≮m),使得随机干扰项最小。3、随机干扰项的意义1)代表没有纳入到方程中的变量:①未知的变量:人们认识影响因变量的因素常常不完全,什么因素影响Y,不是一无所知就是知而不确。②缺少数据的变量:有些变量因各种原因得不到想要的数据③对因变量的影响较弱的变量:④为了追求更加简单的模型而舍掉的变量2)变量的数据或样本在测量或处理中的误差3)建模的方法或函数的形式误差:有散点图估计存在线性关系,实则是非线性关系4)人类行为的内在随机性:即使引入所有变量,个别因变量中仍不免有些内在随机性。4、回归分析的步骤(了解)1)根据数据的测量尺度和目的选择适当的回归方法;2)选择解释变量和因变量;3)模型计算;4)结果分析和检验5)模型对比和确认5、回归分析的内容(了解)1)回归方程2)回归方程检验3)方程确认4)回归模型的比较二、简单线性回归1、原理即根据样本观测值,建立因变量Y和自变量X间的直线方程y=β0+β1x,求解截距β0和斜率β1形象解释2、假设条件1)因变量Y和自变量X:正态分布的连续型随机变量2)残差项ε正态性:N(0,σ2)等方差性:ε的方差(或标准差)对于所有x的值不变独立性:ε的值互相独立3、回归结果的检验1)方程的显著性检验(一般为F检验)2)回归系数的显著性检验(一般为t检验)3)回归直线的拟合优度——决定系数R2(0-1之间)(用AdjustedRSquare)4)残差项ε的检验(数值越大说明越合适)【例题】用SPSS完成(老师上课讲的例题,了解)这里有美国60个著名商学院的数据(Bschool.sav),包括变量有五年收益(单位:千美元)、进入MBA学习前的工资、MBA毕业后的工资、学费、GMAT分数等(数据中我删掉了两个不好解释的变量)。现在来研究MBA毕业后的工资和进入MBA前的工资间的关系。1、画出散点图——观察两变量是否具有线性趋势SPSS操作(SPSS16.0英文版):Graphs->LegacyDialogs->Scatter/Dot…->SimpleScatter->输入变量、图题等->执行相关分析——计算两变量间的简单相关系数SPSS操作(SPSS16.0英文版):Analyze->Correlate->Bivariate…->输入变量,默认勾选Pearson->执行简单线性回归——建立两变量间的线性回归方程SPSS操作(SPSS16.0英文版):Analyze->Regression->Linear…->输入因变量(SalaryPostMBA)和自变量(SalaryProMBA)、Statistics设置、Plot设置->执行回归结果的检验与分析5、回归分析结果的表达1)文字表达(重点:对结果会用文字进行描述并且写出回归方程)研究了以MBA毕业后的工资为因变量和以MBA前的工资为自变量的线性回归模型,结果表明:回归方程是显著的(F=339.827,P<0.001);MBA前的工资是显著的预测变量(t=18.434,P<0.001);自变量解释了因变量中85.2%的变异,回归结果较好。回归方程为(R2=0.852)三、多元线性回归1、多元线性回归模型(掌握几何意义)多元线性回归实质是通过样本数据找到各回归系数(β0,β1,…βk)的估计值,得到如下的方程从几何意义讲,得到的多元线性回归方程是K+1维平面上的超平面,即回归平面。多元线性回归方法利用最小二乘法估计,使残差的平方和最小回归方程的拟合优度检验4、回归方程的显著性检验(了解)5、回归系数的显著性检验(了解)6、残差分析(了解)1)残差为0的正态性分析2)残差的独立性分析3)异方差分析7、多元线性回归中的其他问题(了解)1)探测样本中的异常值2)解释变量的筛选3)变量的多重共线性问题四、曲线估计1、概述变量之间的关系并不总是表现为线性关系,非线性关系也是极为常见的,可通过绘制散点图的方式粗略考察这种非线性关系。对于非线性关系通常无法直接通过线性回归来分析,无法直接建立线性模型。2、本质线性与本质非线性①本质线性-形式上虽然呈非线性关系,但可通过变量变换化为线性关系,并可最终进行线性回归分析建立线性模型。②本质非线性-变量关系不仅形式上呈非线性关系,而且也无法通过变量变换转化为线性关系,最终无法进行线性回归分析建立线性模型。六、相关分析与回归分析的区别(理解)联系与区别:都是研究变量间的关系;相关分析中的变量间是对等关系,回归分析中有因变量和自变量,因变量是我们关注的目标,自变量引起因变量的变化;一般在回归分析前先研究相关分析,如果变量间相关性较弱,则没有进行回归分析的必要。动态数据分析模型动态数据分类(理解,小点可能出选择题):1、按时间t值:离散数据和连续数据2、数据的表现形式(1)绝对时间序列——属性值为总量水平①时期序列:每一个数据反映的是一段时期内发展的结果,即“过程的总量”,如国内生产总值。②时点序列:每一指标值反映现象在一定时点上的瞬间水平,如年底总人数。(2)相对数和平均数时间序列——由绝对时间序列派生①两个时期数据派生②两个时点数据派生③时期序列(分子)和时点序列(分母)共同派生动态数据的构成(1)趋势变动(2)季节变动(3)循环变动(4)随机变动注意季节变动和循环变动的区别①都表示一段时期内的变动,但季节性变动通常不大于1年,循环变动以若干年计;②季节变动的规律性更强,周期相对固定;循环变动,上面的例子,虽然有一个总的变化规律,但周期性不强;③从成因看,季节变动主要是由自然因素和制度性因素引起;循环变动则由系统内部的因素引起。确定性时间序列1、趋势外推的数学模型(估计这里可能会有选择题)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论