




已阅读5页,还剩78页未读, 继续免费阅读
(地图学与地理信息系统专业论文)地理编码原理及方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 地理编码是指在地理特征中加入地址属性,从而通过输入地址即 能确定一个空间位置。通过地理编码可以实现原有信息系统和空间信 息的融合,将城市生活中的信息空间化,从而进行更有效、更深刻的 空间分析和决策应用。 本文作者首先研究了国内外主要的地理编码模型,然后在此基础 上建立了符合我国城市状况的分层地址模型;接下来分析了传统的数 据采集方法的缺点,提出基于栅格影像的地址采集方法:最后介绍地 址匹配算法,并设计了一种门牌插值算法用以提高地址匹配的精度。 本文作者主要的研究成果有: 1 本文作者借鉴日本的分层地址模型,建立了符合我国城市地址 状况的八层标准地址树模型,为地址数据的标准化提供了参考依据; 2 本文作者根据八层标准地址数据模型设计了一种可以保存分 层地址信息的数据库结构; 3 本文作者提出了基于栅格影像的半自动化地址采集方法,并且 运用基于a r c p a d 的二次开发方法,在移动终端实现了一个简单的地 址采集原型系统,该系统可以辅助地址采集者高效准确的采集地址信 息; 4 本文作者介绍了一种基于地址树模型的高效地址匹配算法。同 时设计了一种改进的归一化门牌插值方法,能够较精确地进行门牌插 值,提高地址匹配引擎的匹配率。 关键词:地理编码,地址模型,地址采集,地址匹配 a b s t r a c t g e o c o d i n gm e a n sa d d i n ga d d r e s sa t t r i b u t ei n t og e o g r a p h i cf e a t u r e s , s op e o p l ec f l l lg e tas p a t i a ll o c a t i o nb yi n p u t t i n ga d d r e s s y o uc a l lr e a l i z e t h ef u s i o no fe x i s t i n gi n f o r m a t i o ns y s t e ma n d s p a t i a ld a t ab yg e o c o d i n g , s p a t i a l i z ot h ei n f o r m a t i o ni nc i t yl i f e ,i no r d e rt om a k ee f f i c i e n ta n d p r o f o u n ds p a t i a la n a l y s i sa n dd e c i s i o na p p l i c a t i o n b a s e do i lt h er e s e a r c ho f m a i nf o r e i g na n dn a t i o n a lg e o e o d i n gm o d e l , t h i sa u t h o rs e t su pt h el a y e r e da d d r e s sm o d e lw h i c hi sp r o p e rt oc h i n a s c i t ys i t u a t i o n t h e n , t h i sp a p e rp o i n t so u tt h ed i s a d v a n t a g eo ft h e t r a d i t i o n a ld a t ac o l l e c t i o nm e t h o d , a n db r i n gf o r w a r df i l la d d r e s s e o u e e t i o nm e a s u r eb a s e do ng l i d i m a g e l a 瓯t h i sp a p e ri n t r o d u c e s a d d r e s sm a t c h i n ga r i t h m e t i c ,d e s i g nad o o r p l a t ei n s e r tv a l u em e t h o dt o i m p r o v et h ep r e c i s i o no f a d d r e s sm a t c h i n g 1 1 1 er e s u l to f r e s e a r c hi nt h i sp a p e rg o e s 鹤f o l l o w s : 1 t i l i sa u t h o ru p b u i l dt h es t a n d a r da d d r e s st r e em o d e lw h i c h c o n t a i n se i g h tl a y e r sa n di sf i tf o ro u i c i t yc o n d i t i o n t h i sm o d e lb a s e d j a p a n e s ea d d r e s sm o d e l ,a n dg i v e sr e f e r e n c e st ot h es t a n d a r d i z a t i o no f a d d r e s sd a t a 2 a e e o r d i n gt ot h ee i g h tl a y e r ss t a n d a r da d d r e s sd a t am o d e l ,t h i s a l l t h o l d e s i g n sad a t a b a s ec o n s t r u c t i o n , w h i c hc f l l ls t o r el a y e r sa d d r e s s i n f o r m a t i o n 3 t i l i sa u t h o rp u t sf o r w a r di l l , p a r ta u t o m a t i ca d d r e s se o u e e t i o n m e t h o db a s e d0 1 3 鲥di m a g e ,a n dm a k e $ as i m p l ea d d r e s sc o l l e c t i o n s y s t e ma tm o b i l et e r m i n a lb a s e do i la r c p a d , t h es y s t e me a r lm a k eh e l p f o rc o l l e c t i o nd a t ae f f i c i e n t l ya n d e x a c t l y 4 t h i sa u t h o ri n t r o d u c eae f f i c i e n ta d d r e s sm a t c h i n gm e a s u r eb a s e d o i lt h ea d d r e s st r e em o d e l ,a n dd e s i g n si t i m p r o v e du n i t a r yd o o r p l a t e i n s e r tv a l u em e t h o d ,t h i sw a yc a nm a k ei n s e r t i n gv a l u ee x a c t l y , a n d i m p r o v et h em a t c h i n gr a t eo f t h ee n g i a e k e yw 0 础d s :g e o c o d i n g ,a d d r e s sm o d e l ,a d d r e s sc o l l e c t i o n , a d d r e s s m a t c h i n g 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名: 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位 论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论 文;学校可根据国家或湖南省有关部门规定送交学位论文。 径名缉期:碰幽乒日 中南大学硕士学位论文 第一章概述 1 1 地理编码的概念体系 1 i i 地理编码含义的演变过程 第一章概述 在计算机产生之前,在地理学和制图学的研究中就已经开始对地理位置、地 理要素、实体以及它们的属性进行统计和分类( “代码表达”) ,例如:各种大地 坐标系,地址,地名等,邮政编码和电话号码分区等。这是最原始和最本质的广 义地理编码概念这里,实体( e n t i t y ) 是指地球上的一种真实现象,它不能再 细分为同一种类型的现象。属性( a t t r i b u t e ) 是指一个目标或实体的数量或质 量特征要素( f e a t u r e ) 则是指具有共同特性和关系的一组现象( 如道路) 或 一个确定的实体及其目标的表示( 如某一条道路) 。 随着1 9 6 0 年计算机的出现并开始普及,地理学和制图学开始逐步实现计算机 化,需要对空间位置信息、地理要素、实体和它们的属性进行计算机化表达,从 而产生出与地理相关的编码的概念,即对地理空间信息的编码,以适应计算机存 储和处理。这里,编码( e n c o d i n g ) 是指将信息分类的结果用一种易于被计算机 和人识别的符号体系表示出来的过程,是人们统一认识、统一观点、相互交换信 息的一种技术手尉”。编码的直接产物是代码。属性编码就是指为识别地理实体 的不同属性而设置的编码。地理属性的编码被认为是用于地理信息系统( g i s ) 的一种编码模型( 马蔼乃,1 9 8 8 ) 。 到1 9 7 0 年,美国人口统计局为解决人口普查问题,把地址、地理实体( 或相 关的地理特征) 用计算机来编码表达( d l m e ,t i g e r ) 。这里,地理指的是各级普 查和行政范围,而编码是指各种地理特征以计算机可读的形式表达出来。这样就 实现了在人口普查中使用地理编码给划分出的普查地理区域分配数字代码,来代 替普查区域的文字名称,以方便计算机处理l 2 j 。 近年来,随着地理编码的大众化,国内有一大批研究机构依据地址在人类生 活中作为最主要定位手段的现状,把自己提供的地址匹配和地址定位功能叫做地 理编码。这种地理编码的狭义化。究其原因应该是地址在人类生活中始终为最主 要定位手段。他们仅仅实现了地址与地理坐标之问的相互转换,而忽略了地址与 其相关的地理实体和属性数据的空间关联关系。 综上所述,地理编码不仅涵盖了对信息资源中包含的地名、地址、地理要素 或实体以及他们的属性进行编码,以方便计算机处理和表达,而且更重要的是依 中南大学颧七学位豫文 第一章概述 据这些编羁来确定地名、娥疆、拖避要素和实体以及它们的属褴与地理密闯位置 的关联关系通过这种关联关系,藐们可以建立信息资源基于地理空间位置进行 筑缓霸荚联麴搂燮秘辊裁,簸嚣实域一定空鬻范围内僚患资潺静整合,避焉潢罡 g i s 系统的空间分析功能。 纛璧,随羞g l s 彝数字戆球戆菸起,我靛运嚣要建嶷一静缝一鹣诗算撰壤羁 方案( 警阃网格的思想) 来整合城市、国家藻至全球的空间信息资源口l 。这是对 地理编码豹内容、目的和馆用的进一步扩展。 1 1 2 地理编码的搬念 对予地理编码的概念主熏有三种理解; 1 ) 地址编码的理解:是指通过执行地址熙配并运用算法获锝几何要素信息, 逊就是确定菜一魏址所对巍的坐标。 在a r c l n f o 中时地理编粥的定义是指在地理特征中加入地址属性,从而通过 徐天邃缝嚣瞧确宠一令窆溺爱置。l e m a p l n f o 审,逢霪编鹃就是撂兔鼗撂避录指定 地图坐标的过程。可以认为地理编码指的就是将空间地址数据与空间位鬣( 坐标) 糍关联,使零可以谯地窭上确定照空嘲地址数据矫代表驹地理实体的位警。 2 ) 地理空间窝体编码的理解:怒指使用矢量地图、图表或其他媒介,确定 与实体的编码或名称等相关的几何特征h ( 通过缔码关联空阈点、线和藏) ,铡 翔依据敷活号码遘霞凡蔼嚣素信息; 3 ) 地理属性信息编码的理解:是指通过与地理实体相关的属性编码洙确定 簿空瓣痿惑整源熬位置,镄妊蔹据l p 缝娃返隧凡餐要素藩塞。 本文中研究的地理编码主要就是指地址编码,是指在地理特征中加入地址属 性,从露激进输入撼址嚣能确定一令空翅位置。建理编璐是建立缝理位爨坐标与 给定地址一致性的过程,以便对属性数据和地理实体进行位置确定和空间检索。 轰l - i 玩理墉磁类型建较 2 中南大学硕士学位论文 第一章概述 i i 3 地理编码的研究意义 随着g i s 在我国城市信息化建设中越来越广泛的应用,城市管理部门之间对 空间数据与非空间数据共享整合的要求日益迫切。据专家分析,政府各职能部门 拥有的大量业务信息中,8 0 的信息都与地理空间位置密切相关,但是这些信息 几乎都没有空间坐标,因此无法与其它信息整合,无法实现可视化的空间分析。 为了将这些空间信息与非空间信息,非空间信息与非空间信息进行集成与融合, 真正为公众提供直观、生动的基于空间位置的服务,就需要建立空间与非空间信 息之间的联系,地理编码正是建立这二者之间联系的最重要最实用的手段9 。 对于一个城市而言,建设地址编码数据库有着重大的意义。以北京市为例, 在建设了北京市地名、路名、楼名和门址等数据库之后( 包括地名的标准名称、 地名的空间坐标、地名的唯一编码等) ,对空间信息就可以进行简单的查询和检 索分析,以支持与位置相关的服务,如l b s 、智能交通、移动梦网服务及影像数 据库的查询等。对非空间部门的信息可以进行分析、统计、管理、制图和可视化 表示,以支持政府的管理和决策。如通过对工商税务管理的各类企事业数据库进 行分析,就可以生成各类空间专题信息系统:对房地产的评估,可以生成交通便 利图、医疗卫生分布图、餐饮分布图,商业分布图,小区分布图、学校分布图、 总体评估图。通过利用北京市普查办公室的各类普查数据库中的地址信息,就可 以对大量宝贵的普查数据进行空间可视化分析,生成人口普查、工业普查、商业 普查、教育、住房普查分布图。进一步可进行人口与教育布局的空间分布合理性、 进行商业网点的选址、房地产的地价指数分析等。 在现实世界中,人们通过地址来寻找城市中的目标。这种现实世界的定位方 式是通过一段文字来表达目标位置的。例如,我们用“海淀区知春路x x 号”来 表示某一酒店的位置。在地理信息系统中,计算机是无法通过诸如以上文字叙述 而直接寻找到目标的位置的。目标的位置是由其所在地的地理空间坐标确定的, 如该地的经度和纬度,或是其在规定的大地平面坐标系中的x ,y 值。然而,经度 纬度或是x ,y 值对于普通用户来说,只是空洞的数字没有丝毫意义。虽然,现在 可以通过全球定位系统( g p s ) 接收仪来轻易地知道自己所在的地理坐标,但这 一串数字远不如街名路名门牌号更亲切实在。因此,地理信息系统需要一座沟通 计算机中地理信息与用户的桥梁,进行用户的现实世界语言同计算机空问信息语 中南大学硕士学位论文第一章概速 富之闻的转换。魏理编码驻有效撼解决这一转换翔蹶,即利期地理编璐数据库 来建立地址与地理空间坐标之间的澍应关系州 嚣籍失多数落塞系统审都毽含t 逮垃、联系寿式这群懿字袋,磊这篓信惠一 般都没有被充分利用。为了满足管理和决策上的需要,几乎每个行业或机构都以 菜静形式采集、处耀秘传播空翔信爨。在这秘馕况下,燕其是多种诗算搬斑趸嚣 境下,对空问数搿的综合利用和共事产生了障碍。通道地理编码可以实现原有信 息系统和空间信息的融合,将日常的经济、教会、人文、历史、旅游、商业等一 系列城市生活中静信息空潮化,同时通过构馥空间数掰仓库,襁空间信息支持下 进行更有效、更深刻的空间分析和决策应用。 2 趣壤编码数据痒系统豹建设流程 建鬓缓羁鼗鬟痒系统懿建立霉娶褥城市孛现有懿鹣缝迸学空篱纯、数字铯窝 规范化在地址名称与地址实际所表达的空间位置之间建立起对应的关系。空间 纯是指获取她蛙名称实际黪表运的空藏位置豹空闽坐据;数字豫是攒采集地址数 据并入库;规范化是指保存谯地址编码数据库中的地址数据要符合标准和规范的 要求,以满足地址匹配和查询定位的要求。图i - i 是数据库系统建设的总体流程 示意图。 躜1 - i 地址编码数据库系统建设蓐流程 i ) 蓦先嚣要潮定一套壤范靛蟪缝数据采黎寿案,确定嚣簧莱囊懿憋娃鼗嚣 爨型,建藏合理和可行的采集流程,以保证全面和详尽地采集城市地址数据。再 卷,就是鞭针对地矮地址编码的具体蒙求,专门培训一魑缝址数攥采集帮处理人 爱,如果可能,应该尽量安排那些对采集范围和区域比较熟悉的人员,使他们可 以在采集和处理地址数据时遵循地址标准化的要求,正确处理标准化处理艏的地 4 中南大学硕士学位论文 第一章概述 址数据,避免地址数据中因为包含一些非标准的因素而影响地理地址编码和地址 匹配的质量。 2 ) 其次是地址数据的上传和入库。对于地址数据的采集和录入,由于业务 人员素质参差很有可能会带来异地数据管理难题。在此,可能需要提供完善的无 差错解决方案,实现数据上传的异地同步掌控;支持同步,异步双层连锁方式; 支持数据传递的自动化。 3 ) 再次是地址编码数据库系统的建设维护,主要是进行数据的维护,随着 采集和录入的各种地址数据的大量增加,数据库保存的数据也日渐庞大,数据库 中出现数据冗余或者数据不一致的情况也会日益增多。而数据库维护就是要解决 这一问题的,包括对系统中冗余信息的删除,错误地址信息的编辑修改;增加新 的地址信息等。通过建立相应的地址数据维护和更新机制,保证地址数据库中的 地址数据的准确性、详实性和现势性。 图卜2 地址编码敷据库系统数据流程 4 ) 地址编码数据库系统还需要开发地址匹配和地址定位软件工具,以满足 用户对各个地理实体或者地址数据的各种查询和定位需求。查询包括从空间到属 性的查询和从属性到空间的查询。基于地理信息系统软件平台,用户在客户端输 入自己想要查询的地址数据,经过标准化处理后与服务器端的数据库中的地址数 据进行匹配,匹配成功后返回给用户此地址信息所对应的空间坐标,并在电子地 中南大学磺士学位论文 第一章概述 阕上显示盘来。葳过来,掰户也可以通过空闯图形数据进行套询,选定一个点、 一条线或者一个区域后,系统能返回给用户此空间图形对象所对应的地理实体信 意,篷撬其瘊在凳缝,空秘整轹菇及籀关静瓣佳莛塞等。 地址编码数据库系统的建立还舞考虑与其他数据库的接口,实现地址编码数 据瘁与务罄门或零蹙鲍售惑系统之阉麴数撂莛事寝黢努共享,努鄹子将番信息系 统的数攒进行统一管理、查询和迸一步的融合处理,最终达到多源数据的整合和 共享。 1 3 地理编码研究进展 1 3 t 国绛研究避骚疑应篇 美国是建理缡璐建建最睾、最广泛戆嚣象,孚在二卡壁绻乇中年钱就建立7 奄国的地理编码标准,并开发了通用的地理编码软件工具,到9 0 年代盾成功地 斑用于t i g e r 文l 串系统,在历次全爨人口普焱统计中发挥了巨大作用u l , 目前,地理编码软件工黑已经商品化,一艟著名的g i s 软件都有地理编码模 块,如m a p l n f o 的m a p m a r k e r ,a r e i n f n 的g e o c o d i n g 等,在商业竞争分析、公 翊设施遗缝、城市藏捌寿瓣都有广滋豹应用弼。 下面介绍下国外主流g i s 软件中地理编码技术的应用: 1 ) a r c l n f o 较终 h x c i n f o 中包含有地理地址编码( a d d r e s sg e o c o d i n g ) 模块。在此,g e o e o d i n g 摄指在地理特征中加入地址属性,从悉通过输入地址鄹艇确定一个空晦像置。地 瓤t 可以通过几个a r c 程序( 如a r c p l o t 、a r c e i d t 等) 交互地输入,也可以来自 一个表格文件 a r c l n f o 中将确定其蠢绝蛙懿事律静颦翔位鹫静过程滗义为堍蛙莲配 ( a d d r e s sm a t c h i n g ) 。通道确定事件的地理位置。可以用不同的方法分析事件。 糍懿可以擦驱罪事终与久整饕查区豢翔,逶过久墨绕诗售悫分辑犯罪粪撰一 在国外,地址是用具有特定语法的地址字符串来袭示唧。例如;n u m b e r 是地 址的数字部分;s t r e e tn u m e 是地址的名字郝分,可啦是描述黪妊地址的任何字 符串,例如街名或巢一位置的其他名称;s t r e e tt y p e 是街道类型,如撕i v e , s t r e e t ,a v e n u e ,l a n e = d i r e c t i o n 有时出现在地址中的方向标志,可以是豁缀 方自( 鑫撬在名字藤) ,也碍越是惹缀方自( 巍现在番字后面) u n i tn u m b e r s 是单位门牌号,如公寓或建筑的门牌号,它是地址的组成部分。尽管可以在地址 巾毒糍这一痿塞,艇是a r c l n f o 夔壤缝匹配苓支持速一缕患,帮逶邦套信怠霉溢 出现在要进行匹配的i n f o 文件中,但处理时于以忽略;z o n e s 是地址中经常出 6 中南大学硕士学位论文 第一章概述 现包括的地区信息,如邮政编码或者城市名,该信息在a r c i n f o 地址匹配中非常 重要。例如,当一个地址与多个特征对应时,程序将根据z o n e 信息在几个记录 中选择具有相同z o n e 信息的记录相匹配。z o n e 数据必须用另外一个数据项存储 在实际操作中需要使用哪几个地址成分取决于表达地址的方式和地理特征 的类型( 点、线、多边形) a r c i n f o 中一个典型的地理地址编码可以包括以下三个过程”w : ( 1 ) 建立一个地址c o v e r a g e ( c o v e r a d d ) ; ( 2 ) 生成一个事件文件( e v e n tf i l e s ) ; ( 3 ) 地址匹配( a d d r e s sm a t c h i n g ) 。 其中,地址c o v e r a g e 是一种特殊类型的c o v e r a g e ,可以将地址与c o v e r a g e 的特征联系起来,一个地址的不同表达方式可以存贮在一个地址文件中以增强地 址匹配的能力地址c o v e r a g e 可以是点、线或多边形c o v e r a g e 。事件文件为存 储将要与某些地理特征匹配的数据的文件。 2 ) m a p i n f o 软件 在m a p i n f o 中显示的数据,需包含x 和y 坐标以使m a p i n f o 知道把数据应 放在地图的何处1 1 l 】。m a p i n f o 将指定地图坐标的过程称为地理编码。将地理地址 编码看作是将空间地址数据与空间位置( 坐标) 相关联,使得可以在地图上确定 此空间地址数据所代表的地理实体的位置。 m a p i n f o 软件中的m a p m a r k e r ”堤一个专门用于地理编码的软件,此软件实 现了基本的地理编码框架和地址匹配引擎。它基于完备的地址数据库、美国邮政 管理局( u s p s ) 街道地址数据库以及街道图层和最新的z i p + 4c e n t r o i d s 数据集 来给用户提供的数据库中的每一条记录赋予地理坐标值。同时,m a p m a r k e r 在地 理编码过程中也给用户附加了许多控制工具,包括地理编码模式、策略、匹配设 置参数等 m a p m a r k e r 模块的主要功能包括;快速、批量地理编码处理大量的数据表; 交互式的地理编码来尽可能地提高地址匹配率和容错性;可以针对街道地址、邮 编或街道交叉口进行地理编码;可以依据匹配类型,设置地理编码的结果代码来 表示匹配情况;利用m a p m a r k e r 附加的地址数据词典对地址数据进行标准化处理 以满足美国邮政管理局c a s s ( 代码正确性支持系统) 的要求;可以利用o d d c 来 对数据表进行远程地理编码;m a p m a r k e r 引擎可以同时响应多个并发的地理编码 请求等等。 在其具体的应用中,m a p m a r k e r 已经结合具体地区,如美国、加拿大,完成 了这两个国家的地址数据库的建设。由于使用了文件系统管理地址数据,使得这 两个国家的地址匹配引擎具有较高的响应速度,在加拿大全国1 5 g 字节的地址 7 中南大学硕+ 学舒论文第一章概述 数据量豹情况下,进行逮垃珏配莰嚣1 移静。髫前,b a p m a r k e r 已经提供了c 语 言和j a v a 语言的:次开发接口,但其软件仪适用于上述两个地区旧。 溉p 融攮e r 簌蟹孛缝趣绽码熊攒式圭要惫接:( 1 ) 蠢动蒺式瞧理鳊秘;廷有 在进行精确地址匹配时才采用自动模式的地理编码。( 2 ) 交互横式地理编码:当 壤确地垃匹配失败孵藏嚣受使用交藏模式来避行建理编码,悫诲瘸户手动疆配臻 些不能程自动模式下匹配的地址。地理编码的方法主臻包括:( 1 ) 按地址进行的 地理编码“4 l ;( 2 ) 按边界_ i l 行的地理编码:。边界”掇封闭的区域或面积,例如 豳家、城市和邮政编码。地联编码方法的选择熏要是用予提高地理编码的准确率。 在选择一种地理编码方法_ 乏前,需要事先了解数据的内容和质爨,提前明确应用 缝瑾绩蕊稳骞熬h 肆。 1 3 2 国内研究进餍及应用 国外已有的地址编码软件不适合中国国情,如果全盘重新设计如同t i g e r 系 统耀徉豹缝娃绫璐体系,粼瓣蠢丈帮势城索瑗行翡遮名缝娃露系蒇要簿犬豹涯整 和规范,这种调整是不现蜜和困难的;再者,诸如t i g e r 系统那样的解决方案, 按今天的科技发展水平来鬻爨,也不是最理臻她,其主要超题是过于复杂的拓癸 关系给系统建设和用户使用带来颇多麻烦f 1 8 。近年来冒内不少单位开始研究地址 编码的模型和标准,如北京市和上海市都已经先后颁韶了一系列城市道路、道路 交叉弱,锈珐代码标窿,餐这种纯描往编码穰型存在察翔信惠艽余,跑较复杂, 不适合地理信息应用。 我爨琴多单位e 经拜始疆究遥套予我国穗怒熬琏壤壤薅静壤銎帮舔壤,建琏 甄配和定位技术,也开发了一些相应的软件和成用。如j e 京长地计算机公司的“寻 址裤”,j b 大方正数码公霹躺i l a ps e a r c h e r 等,都没有建立标建娩地理缓褥数据 库。m 印s e a r c h e r 嫩址编码管理嚣,试图实现基于北京市全境地图数据和地址数 据,依据地址字符审智能地匹配出地理坐标值。但是,她址编码棼理器蘩用的地 艟模型太进复杂,翱上较俘功能_ 歼发太过蔼攀,在具俸应甩中玩墟匹配率不高, 即使是针对地址匹配技术来说也称不上是一个完善的系统。 童瘫瓣藩关 :缝理编筠静痤竭基零上露燕佼袋于锋对菜令篡捧懿疰粥系统, 满足地理窝间定位的需求,坯没有提出一个系统的、党整的地理编码解决方案。 1 ) 方酗a p s e a r c h 地址缓码管理器 图1 - 3 是g n p s e a r c h ! 魂址编码舒理器的“输入地址定位”的界面圈,地址 定位就是系统由一个地理点的地址字符串确定其地理能鬻,包括地址所属区县、 逸垃新藩衡遥和穗赶所属弗编等信崽。 中南大学硕士学位论文第一章概述 图1 - 3 方正m a p s e a r c h 地址编码管理器的。输入地址定位”界面图 此产品的主要目标是实现在北京市全境地图数据和地址数据基础上,根据地 址字符串智能地匹配出地理坐标值的功能。此产品是提供给二次开发商的a p i 编 程接口l l 町。它提供的功能是通过调用此产品,获取地址字符串所对应的地理坐标。 2 ) 地址匹配在警用综合地理信息系统中的作用 警用综合地理信息系统【1 9 1 就是利用空间地理信息技术,以电子地图为基础, 以公安宽带网络为依托,以信息共享和综合利用为目标,实现公安基础信息基于 空间电子地图的可视化查询和分析,提高在指挥决策、快速反映、反恐等方面的 综合能力为治安管理、警力部署、巡逻布控、安全警卫等公安业务提供行之有 效的管理手段。 目前公安行业已经建立大量的数据库如常驻人口数据库、重点人口数据库、 刑侦数据库、i i 0 警情数据库等和相应的业务应用系统。警用综合地理信息系统 的建设必须和这些数据进行有效的结合,实现业务信息基于地理信息的可视化分 析。m i s 数据库是警用综合地理信息的最重要来源,警用综合地理信息系统只有 能够动态和m i s 数据关联。将m i s 定位到地图上实现可视化和综合地理信息应用, 系统才具有生命力和发挥应有的作用。 如何将m i s 数据定位到地图上是解决警用综合地理信息系统可持续发展的 关键问题。按照“公安五要素”模型,将瞀务信息抽象为人、案件,机构、物品、 地理位置五要素,公安涉及的所有信息可以按照该五要素进行分类同时,对数 据库研究发现,大部分m i s 数据库中都包含了地址信息。 而在实践中发现,每个楼块都有相应的地址,可以通过地理地址编码确定每 个楼块相应的地理坐标。因此,建立基于地理地址编码和匹配技术的m i s 数据自 动地图定位,是解决m i s 数据可视化的关键技术和手段。实现地理地址编码和地 9 中南大学硕士学t :7 = 论文第一章概述 址匹配,需要做如下工作1 2 0 : ( 1 ) 建立标准地址编码库:基于大比例尺电子地图提供的楼块数据,进行 标准地理地址编码的普查,通过地理地址编码采集系统录入数据、地理地址编码 整理系统建立标准地址编码库; ( 2 ) 建立地址匹配服务系统:实现对自然语言地址信息的语义分析、词法 分析,自动和标准地址库匹配,比对出精确的地理坐标; ( 3 ) 建立批量处理m i s 数据库的地址匹配系统:实现对大数据量m i s 数据 的处理,生成相应h i s 数据的图层; ( 4 ) 对m i s 数据库的地址信息进行标准化处理和规范化录入,提高地址匹 配的成功率。 1 4 本文的内容组织 本论文主要由六章组成各章的主要内容如下: 第一章主要是对地理编码的概念和含义进行了解释,地理编码对于空间信息 融合具有重要的意义。然后对地理编码数据库的建设流程傲了概要的介绍。最后 对国内外地理编码的研究进展及其应用情况做了分析和研究。 第二章重点分析和研究7 国内外几种典型和重要的地理编码模型。d i m e 和 t i g e r 模型都是曾经在美国人口普查过程中成功应用的地理编码模型,对于后来 的地理编码模型的建立都具有重要的参考意义e s r i 是目前g i s 行业最有影响 力的公司,本文同时参考了e s r i 国内公司的地址模型。由于日语和中文在结构 上有一定的相似性,因此在本文第四章的地址树模型中就应用到了日本方案。在 国内,方正和朝夕的模型都是基于弛址要素和地址公式的,具有定的局限性。 接下来几章对地理编码的几个最关键的步骤分别做了详细的分析和研究: 第三章研究了地址数据的采集方法。数据是地理编码的基础,采集的方法决 定了采集到的数据的准确性及采集效率。传统的人工拿着图纸去现场采集手工记 录并录入数据库的方法,既耗费人力、效率低下,而且采集到的数据也容易出错, 质量难以得到保证。于是本文提出了基于栅格影像的数据采集方法,采用使用 a r c p a d 的移动终端设备进行数据的采集,能够大大提高数据的正确性,并能减 少大量的人工录入工作量。 第四章探讨了地理编码数据库的管理方法。首先提出了标准地址数据模型, 本文认为此模型适合中国的地址现状,能有效的对国内地址进行标准化,并基于 此设计了一种可以有效支持此模型的数据库存储方案。接下来讨论了如何采用半 自动化的方法对地理编码数据库进行更新和维护。最后研究了影响地址数据质量 的主要因素,并提出了一些保障数据质量的方法。 1 0 中南大学硕士学位论文第一章慨述 第五章研究了地址匹配的方法。详细分析了地址字符串的拆分过程,介绍了 三种地址匹配的方法,即正向匹配算法、反向匹配算法和插值算法。本文对门牌 插值算法做了重点研究,提出了归一化门牌插值算法,认为此方法对于提高门牌 插值的精度很有帮助然后对如何提高地址匹配率提出了一些建议和方法。 最后一章,对本文进行了总结,并对以后的研究发展提出看法和展望。 中南大学硕士学位论文第二章地理编码模型研究 第二章地理编码模型研究 2 1 国外地址模型介绍 2 1 1d i m e 模型 d i m e 2 l l ( d u a li n d e p e n d e n tm a pe n c o d i n g ) 是由美国人口普查局1 9 7 0 年建 立的一种用于地理编码的地理基础文件( g e o g r a p h i cb a s ef i l e s ) 。该模型是g i s 技术发展的早期建立的,存在以下问题: ( 1 ) 它是基于普通文件的,而非是基于d b m s 的,因此数据更新问题比较严重: ( 2 ) 数据范围仅覆盖了美国领土面积的2 但是基于该模型的系统被成功应用于1 9 8 0 年人口普查的数据收集工作。 1 ) g b f ( 地理基础文件) 的概念 6 e o g r a p h i cb a s ef i l e s b p 指包含地理图形信息与属性信息的文件或数据库。 典型的g b f 包含以下信息凹:街道名称街道交叉口、街道所有路段的地址范围 ( a d d r e s sr a n g e ) 、人口普查地片编号、地理坐标、每个邮政编码覆盖区域的 “质心”、行政区划界线,等等。 圈2 - 1g b f 的应用 g b f 的应用如图2 - 1 所示,非图形数据库中的记录被关联到g b f 中的匹配记录, 于是可以获得原记录的相关地理空间信息。 2 ) d i 皿g b f 结构 d i g e 模型作为g b f 的一种,它的数据结构与两条示例记录如表2 1 所示: 中南大学硕十学位论文 第二章地理编码模犁研究 表2 1d i m e 模型记录 s e g m e n ti d l 2 0l 2 2 f r o mn o d ep 1 5 p 1 6 f r o m n o d ec e a r d s 2 3 。2 43 4 二m t 口n o d ep 1 4p 措 重口n o d ec u o r 如。1 2 埘2 3 捌 s t r e e t n 8 1 n o o a d b e r r yd r g a d b e r r yd r ma d d r o l o w1 1 0 l1 0 2 l i l e f ta d d r e s sh i g hl l 蚴1 0 9 9 ,掰曲ta d d r e s sl o w l l l 渤 ,碰出a d d r e # h i g h 1 1 9 8l 。9 啦 i l e f tb l o c kn n m b e t1 01 0 。r i g h t b l o c k n u m b e r 67 ;l e f tz i pc o d e 3 4 5 8 l 3 4 5 8 l 一尉融z i pc o d e 3 4 5 8 03 4 锄 表2 - 1 的两条记录所描述的现实模型如图2 2 p 1 圜2 - 2d i 眦现实模型 每条记录代表一个路段,字段s e g 【n e n t1 0 为街道路段的唯一标识,n o d e 为街 道交叉点字段f r a m n o d e 与字段t on o d e 分别表示路段的始末n o d e 。如上图所示, l 2 0 路段的始末n o d e 分别为p 1 5 与p 1 4 ,l 2 2 路段的始末n o d e 分别为p 1 6 与p 1 5 。 字段f r o mn o d ec o o r d s 与t on o d ec o o r d s 为始末n o d e 的地理坐标。 字段s t r e e tn a m e 为街道名,两条记录代表的是同一街道g a d b e r r yd r 的两 个路段。 字段l e f ta d d r e s sl o w 与l e f ta d d r e s sh i g h 分别表示沿路段f r o mn o d e n t o n o d e 方向左侧的门牌号码的最小值与最大值,字段r i g h ta d d r e s sl o w 与r i g h t a d d r e s sh i g h 为右侧门牌号码的最小与最大值。如图l 2 0 路段l e f ta d d r e s sl o w 与l e f ta d d r e s sh i g h 分别为1 1 0 1 、1 1 9 9 ,r i g h ta d d r e s sl o w 与r i g h ta d d r e s sh i g h 中南大学硕士学位论文 第二章地理编码模型研究 分别为1 1 0 0 、1 1 9 8 。按照一般规律,街道的两侧分别为奇数号码与偶数号码并 且沿路方向上号码的大小是依次增大或减小的。 字段l e f tb l o c kn u m b e r 与r i g h tb l o c kn u m b e r 分别为沿路段f r o mn o d e u t o n o d e 方向左右两侧的街区编号。 字段l e f tz i pc o d e 与r i g h tz i pc o d e 分别为沿路8 f r u mn o d e 至l l t on o d e 方, 向左右两侧的邮政编码。 以示例数据来说明d i m e 模型g e o c o d i n g 的工作流程,如图2 3 所示: 田2 - 3d i m e 模型6 0 0 e o d i n g 的工作流程 不含有空闻信息的数据库系统提供一个a d d r e s s 字段,为地址字符串,如 “1 1 0 5g a d b e r r yd r ”,经过建立在6 b f 基础之上的g e o c o d i n gp r o g r a m 处理, 得出该地址的地理坐标为( 1 4 ,2 3 ) ,邮政编码为3 3 4 5 8 1 ,以及其他信息。 3 ) d i 髓功能分析 ( 1 ) 6 b f 数据的索引与地址匹配 d i m e 是基于普通文件的,因此g e o e o d i n g 程序要建立合理的数据结构组织并 存储d i m e 的数据,并建立索引机制以实现输入地址字符串与d i x i e 记录的匹配功 能 ( 2 ) 地理坐标的插值 其中1 1 0 5 并非路段l 2 0 门牌号码的最大或最小值,而d i m e 6 b f 仅存储了路段 始末n o d e 的地理坐标,因此,得出的结果地理坐标要经过插值处理。 ( 3 ) 结果数据的组织 输入地址字符串匹配到d i 娅相应记录,针对不同的应用类型,提取d i m e 的相 1 4 中南大学硕士学位论文 第二章地理编码模璎研究 应空间与非空间属性整合成一条融合了空间与非空间信息的结果数据。 4 ) 对我国地址编码系统的启发 与中国相比,美国的地址命名更加规范,地址形式相对单一而且简单,d i m e 数据模型是针对“街道+ 号码”的地址形式设计的。可以借鉴d i m e 模型处理简单 的“街道+ 号码”形式的地址,但是仅仅这一单一模型是远无法全面模拟我国常 用的地址类型的一 d i m e 模型的地理坐标插值算法是简单的线性插值,街道的每个路段仅需记录 始末两端、左右两侧4 对门牌号码、2 对地理坐标,其他门牌号码的坐标由插值获 得。因此不必存储所有门牌号与其坐标信息。这种处理方法也为我们的设计提供 了思路,同样,针对我国复杂的地址使用情况则需要制定合理的插值算法,例如 住宅区内楼房编号可能不是沿单一方向递增递减,因此无法采用线性插值。 另一方面,英文地址字符串单词与单词之间有空格分隔符,而中文地址字符 串是连续的,我国的地址地理编码系统在索引与匹配算法上的难读更高。 2 1 2t i g e r 模型 t i g e r t z 3 j ( t o p o l o g i c a l l yi n t e g r a t e dg e o g r a p h i ce n c o d i n ga n d r e f e r e n c i n g ) 是为1 9 9 0 年美国人口普查设计的另外一种g b f ,从1 9 8 9 年使用至今。 与d i m e 不同,该模型是建立在关系数据库与文件系统相结合的基础上的。t i g e r 将d i m e 与美国地质勘探局1 :l o o k 的线型数字地图( u s g sd i g i t a ll i n eg r a p h , 简写作o l g ) 集成在一起,实现了大于5 0 ,o o o ,0 0 0 个地理空间实体与人口普查数 据的整合,数据覆盖美国全部领土范围。 1 ) 地址范围( a d d r e s sr a n g e ) 与d i m e 类似,t i g e r 模型也不存储单独的地址,也是以“地址范围”为基础 的阱】。街道由线段序列表示,若一个连续的线段序列,除端点外没有其他交点, 并且每条线段明确关联了左右多边形及始末结点信息,则在t i g e r 的拓扑结构中 被称做“完整链( c o m p l e t ec h a i n ) ”,完整链的首尾点称作s t a r tn o d e 与e n d n o d e 。术语“地址范围”是指相对完整链的结点编号方向,第一个与最后个可 能的沿街门牌号码对,即地址范围包含了号码可能的全部范围,即便被标识为某 号码的地物实际并不存在。 组成地址范围的地址号码一般为“城市类型地址”的号码瞄j ,最简单的“城 市类型地址”有号码、街道名以及5 位邮政编码组成,例如“2 1 3 m a i ns t9 0 2 1 0 ”, 通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 贵州国企招聘:2025贵州省水利投资(集团)有限责任公司招聘84人考前自测高频考点模拟试题及完整答案详解1套
- 2025年工业互联网平台生物识别技术在智能医疗健康技术进步中的应用报告
- 2025年工业互联网平台增强现实交互技术在智能工厂生产信息化中的应用分析报告
- 2025年成人教育线上学习模式创新成人教育课程设计与开发实践策略实践报告
- 2025年美妆个性化定制服务模式与美容护肤行业品牌竞争力提升报告
- 2025版汽车维修行业环保设施投资与运营合同
- 2025年个人出租房出售合同范本
- 2025年度物流行业劳动合同编制与管理规范
- 2025年二手房买卖合同签订中的合同解除与违约责任承担
- 2025年专业厨师个人品牌推广与服务合同
- 2025 - 2026学年教科版科学三年级上册教学计划
- 23G409先张法预应力混凝土管桩
- 上海交通大学学生生存手册
- 《道德与法治》三年级上册教材分析解读课件
- 幼儿园绘本故事:《苏丹的犀角》 课件
- 03第三阶段04印章模型制作
- 英汉互译课件05
- GB∕T 17766-2020 固体矿产资源储量分类
- Q∕SY 06515.1-2016 炼油化工工程电气技术规范 第1部分:通则
- 2010现代领翔nfcg2.0dohc原厂维修手册车身和外部
- 电动汽车充电站建设项目可行性研究报告
评论
0/150
提交评论