下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
地理加权回归-空间分析地理加权回归空间回归模型中的回归系数不随空间位置而变化,因此空间回归模型是全局模型。但是由于空间异质性和空间非平稳性,不同空间子区域中自变量和因变量的关系很可能不同,因此就需要处理空间异质性的局部空间回归方法,因此就有了地理加权回归模型(GeographicallyWeightedRegression,GWR)的提出。地理加权回归同时考虑了空间的相关性与异质性。地理加权回归模型一般形式如下:;其中,与是因变量与自变量在处的观测值,为第个采样点的坐标,是第个采样点上的第个回归参数,点被称为回归点。,当时,。简便记为:地理加权回归会得出个回归方程,对应每个回归点,都会有一个回归方程。若,则地理加权回归模型退化为普通线性回归模型。模型回归参数需要通过局部加权最小二乘进行估计。假设在位置的权重为,(),那么位置的参数估计为使达到最小的值。上式中的为权函数,反映其他观测点的样本对回归点的影响。权函数值越大,影响越大。该值通常由对应两点之间的距离决定。常用的权函数有:(1)Gauss函数:(2)bi-square函数:以上两式中的为点到点的距离。被称为带宽,是需要人工选择的参数。这两个函数中,距离越大,函数值都越小。这说明选择这两个函数时,都假设观测点越远,影响越小。地理加权回归模型将数据的空间位置嵌入到回归参数中,因此考虑了空间的异质性。同时,由于不同位置的观测点对回归参数的影响大小不同(通常离回归点越近,影响越大),因此该模型也考虑了空间相关性。地理加权回归的使用,也当同时以空间相关性与异质性为前提。如果没有空间相关性,那么该模型就缺乏合理性。如果没有空间异质性,那么该模型就缺乏必要性。【案例STYLEREF1\s7SEQ案例\*ARABIC\s12】以2011年北京、天津、唐山各县(区)疾病发病率和同期各县(区)的人口密度、人均GDP、年平均风速、光照强度、相对湿度、年降水量等数据为例,研究社会经济和气象因素对该疾病发病率在各地区影响的不稳定性。本节所用的数据为2011年某地区某疾病的发病率(C:\Example\Data\7.3WGR\地区汇总.csv),命名为“地区汇总.csv”。此处只展示前10条表STYLEREF1\s7SEQ表\*ARABIC\s132011年某地区的某疾病发病情况codeprecprelHumsunShnwndspdPopuDenPerGdprate11010158.0684249.82301206.07552.19571615318.950.002438347.185911010262.5983552.05048202.89012.16938114956.040.003675447.718511010557.6593850.06015205.53022.1895718528.9130.000961139.06911010655.7398150.20182205.54772.2150267698.9810.0004191759.94311010752.3930550.77886205.67592.2558368249.2540.0005411561.69111010852.1307551.01494207.50232.2556938524.6850.0010211010.97311010944.6660853.70504218.36552.473628224.67190.00038758.615511011146.6229552.79277208.77742.333494532.45920.0004572082.54411011255.2302351.21378201.27612.1861711454.8070.000362406.25211011350.2272255.34219195.58192.014273967.65050.0012111643.1表STYLEREF1\s7SEQ表\*ARABIC\s14各变量的含义变量名称变量含义单位code地理编码无precp降水量毫米relHum相对湿度%sunShn日照强度瓦/平方米wndspd风速千米/时popuDen人口密度千人/平方公里PerGdp人均国内生产总值千元rate发病率此外,还需要的数据是包含该地区所有区县的地图文件(.dbf文件和.shp文件从光盘中获取,C:\Example\Data\Geodata\JJT)。该文件也可以通过arcgis软件从全国各区县地图中选择生成。(2)采用R语言建立地理加权回归模型第一步,加载如下程序包,代码如下:library(spgwr)第二步,导入所需的数据,代码如下:hData<-read.csv("C:/Example/Data/7.3WGR/地区汇总.csv")#导入发病率和影响因素的数据dbf<-read.dbf("C:/Example/Data/Geodata/JJT.dbf")#导入地图的数据(dbf格式)第三步,将导入的两组数据合并,代码如下:Data<-merge(hData,dbf,by.x="code",by.y="CNTY_CODE",all.x=T)第四步,确定带宽,采用gwr.sel函数。所使用的参数如下:formula:模型公式,用于指出因变量与自变量;data:自变量与因变量取值的数据集;coords:代表空间观测值位置的坐标矩阵。代码如下:col.bw<-gwr.sel(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y))#利用交叉验证选择最优带宽第五步,生成地理加权回归模型,采用gwr函数,使用的各参数意义如下:formula:模型公式,用于指出因变量与自变量;data:自变量与因变量取值的数据集;coords:代表空间观测值位置的坐标矩阵;bandwidth:带宽,由上步gwr.sel生成;gweight:不指定时,默认使用高斯函数确定权重矩阵;hatmatrix:如果为TRUE,帽子矩阵作为结果的一部分返回。代码如下:col.gauss<-gwr(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),bandwidth=col.bw,hatmatrix=TRUE)col.gauss#结果展示此外,地理加权回归还经常使用bi-square权函数,该方法和Gauss权函数方法相似,这里只将实现代码列出,代码如下:col.d<-gwr.sel(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),gweight=gwr.bisquare)#确定带宽col.bisq<-gwr(rate~PopuDen+PerGdp+precp+relHum+sunShn+wndspd,data=data,coords=cbind(data$x,data$y),bandwidth=col.d,gweight=gwr.bisquare,hatmatrix=T)#建立地理加权回归模型col.bisq#结果展示(3)结果分析建立的地理加权回归截距和系数统计如REF_Ref472081692\h表75所示:表STYLEREF1\s7SEQ表\*ARABIC\s15加权回归系数统计表变量最小四分之一分位数中位数四分之三分位数最大值全局截距-3478.00-2391.00896.504100.0011420.001223.24PopuDen-0.05-0.04-0.04-0.030.01-0.04PerGdp-191700.00-106600.00-24080.00-1769.0044410.00-37167.70precp-0.68-0.34-0.260.282.29-0.08relHum-133.90-72.10-21.8432.2652.46-31.49sunShn-16.880.500.841.452.940.66wndspd-91.81357.90625.00667.20874.70775.70从计算结果可以看出,由于地理加权回归得出了影响因素在每个地区的影响系数,各个因素对每个地区的影响程度并不相同,若系数的变化范围较大,说明该影响因素总体上影响程度有很大的不稳定性,若系数的变化范围较小,说明该影响因素总体上影响比较稳定。从该案例可以看出,当月人均国内生产总值对疾病的发病率影响最大,并且在大部分地区呈负相关关系,即当月人均国内生产总值越高,疾病发病率越低,此外该变量的系数变化范围十分大,说明该因素在不同地区的影响程度有很大差别,具有不稳定性。其次,风速对该病的发病率影响也较大,但风速与该病的发病率大部分呈正相关,即风速越大,该病的发病率越大,可以推断该病可以通过空间传染。在6个影响因素中人口密度对疾病的发病率影响最低。地理加权回归模型的R2为0.47,即该模型能解释疾病发病率总变异的47%,比全局普通线性回归的R2(0.23)大一倍。因此对于存在空间相关性的变量,应该使用地理加权回归进行计算。空间回归与地理加权回归的比较:空间回归与地理加权回归的比较:空间回归与地理加权回归都是在经典的回归模型上考虑事物的空间属性,从而发展出来的。空间回归通常只考虑空间相关性,而地理加权回归同时考虑了空间相关性与异质性。从本质上说,两种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药物分析员操作管理强化考核试卷含答案
- 胶合板工操作水平模拟考核试卷含答案
- 内燃机装配调试工安全综合能力考核试卷含答案
- 纹版连接工安全生产能力考核试卷含答案
- 煎酒工岗前流程考核试卷含答案
- 护理疑难病例护理沟通技巧
- 早产儿呼吸系统疾病的康复护理
- 药物洗脱支架:疲劳寿命与药物释放的多维度解析及优化策略
- 荧光定量PCR在慢性阻塞性肺疾病急性加重期痰中肺炎链球菌检测的应用与价值探究
- 草酸镍衍生材料的设计合成及其电催化尿素氧化性能的深度探究
- 中国红肠行业市场前景分析报告
- 工业设计方法学
- 消防维保方案(消防维保服务)(技术标)
- 医用氧气使用检查记录表
- 陈光中证据法学课件
- 知识创新与学术规范中国大学mooc课后章节答案期末考试题库2023年
- 城市轨道交通车辆检修高职全套PPT完整教学课件
- 系统集成项目管理
- 2021年重庆市新高考物理试卷(附答案详解)
- 协方差分析(三版)
- 《同分母分数加减法》教学设计 省赛一等奖
评论
0/150
提交评论