




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 第12卷 第2期 2010年4月 地 球 信 息 科 学 学 报 JOURNAL OF GEO2I NFORMATI ON SCIENCE Vol112, No12 Apr1, 2010 收稿日期: 2009 - 01 - 10;修回日期: 2010 - 02 - 05. 基金项目: 863课题(2007AA12Z221); 863课题(2007AA12Z218);南京师范大学重点科研基金资助项目(2006105XG Q0051)提 供资助。 作者简介:张雪英(1970 - ) ,女,博士,教授,汉族,四川仁寿人,主要从事地理信息的智能处理与应用研究。 E2mail:zhangsnowy1631com 地理命名实体分类体系的设计与应用分析 张雪英,张春菊,闾国年 (南京师范大学虚拟地理环境教育部重点实验室,南京 210046) 摘要:自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。 完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应 用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达 自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语 言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相 结合的方式,设计了地理命名实体分类体系(简称 “GNEC”)。采用定量和定性相结合的方法,分析了GNEC与 GB /T18521 - 2001, GB /T13923 - 2006, CHGIS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本 的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特 征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的 有效途径。 关键词:地理命名实体;分类体系;地理信息系统;信息共享 1 引言 实体名称是现实世界中的具体或抽象实体的标 识符,比如人名、 地名和组织机构名、 基因名称等等。 地理命名实体(geographical named entities)通常是指 运用自然语言表达地理位置信息的一种实体名称, 包括地名、地址、机构名称、邮政编码、电话号码 等等。其中,地名是人们日常生活中最常用的一种 地理参照系统。近年来,随着自然语言在地理信 息系统中的应用,如何从自然语言中解析出地理 命名实体及相关空间信息成为地理信息科学的重 要研究内容 1 。为此 ,需要建立一个完整而有效的 地理命名实体分类体系,用于实现相关信息的存 贮、 组织、 管理、 分析,以及与地图、 地理信息系统 (GIS)等的集成与共享。 2 地理信息分类体系的研究背景 211 基础地理信息分类体系 为了实现地理信息在地理信息系统中的存贮、 检索、管理、应用分析、集成与共享等功能,必 须按照一定的分类原则和方法,将地理信息按照 内容、性质与管理者的使用要求进行分类与编码, 建立通用或专用的地理信息分类体系 2 - 3。我国制 定的基础地理信息分类标准包括:“ 国土基础信息 数据分类与代码 ”(G B /T 13923- 1992) 4、 “1 500、 11 000、12 000地形图要素分类与代码 ” (G B 14804 - 1993) 5、 “1 5 000、110 000、125 000、 150 000、1100 000地形图要素分类与代码 ” (GB /T 15660 - 1995) 6 、“ 基础地理信息要素分 类与代码 ”( GB /T 13923 - 2006) 7 ,以及 “ 城市 基础地理信息系统技术规范 ”(CJJ 100 - 2004)中 的 “1500、11 000、12 000地形要素分类与代 码 ” 8 。基础地理信息分类体系主要是描述水系、 居民地及设施、交通、管线、境界与政区、地貌、 植被与土质和空间定位基础等要素。地名要素一般 作为隐含类以特殊编码方式在小类中具体体现。这 些分类体系一般只涉及基础地理要素,能够描述自 然语言中的部分地理命名实体。而且,概念等级层 次较多,不便于地理命名实体的标注与自动分类。 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 212 地名分类体系 地名(geographical names or place names)是人 们对具有特定方位、地域范围的各个地理实体赋 予的专有名称,比如,鼓楼、颐和园和黄山等 等 9 。“ 黄山主峰 ”和 “ 黄山东部 ”是地理命名 实体,但不是通常意义上的地名。空间是地名区 别于一般名词的重要标志之一,空间要素也是地 名作为基础地理信息的关键所在。一个完整的地 名必须具有音(发音)、形(书写)、义(含义)、时 (时间)、位(空间)、类(类别)六个基本要素。语 言是指代地理实体的主要形式,但不是唯一形式, 历史上的图画地名、图形地名和数字地名就是非 语言指代形式 10 。 地名的发生学分类表明一个地名的产生缘 由,或者人们定义该地名的目标。主要包括三 个类别:为了测绘或管理的目的为地球表面特 定位置范围命名(如坐标、行政单元 ) ; 为了知 识表达与沟通的目的,而对一些地物或景观区 命名(如居民点、自然地标和景观等 ) ; 为了通 讯的目的,为特定区域,以及与特定区域相关 的设备编码(如邮政地址、电话号码和邮政编码 等)。另外,地名也可按照描述对象进行分类, 即通过命名相对稳定的地理要素直接描述地理 位置或范围 11 。 从1999年开始,全国地名信息系统开始筹 建,“ 地名之星 ”以125万中国基础地理信息数 据库为基础,初步建成中国主要地名属性数据库。 其采用的分类体系比较简单,总共包括77类。国 家基础地理信息中心的15万地名数据库也采用 此分类标准。 复旦大学历史地理研究中心和Harvard大学合 作研究的历史地理信息系统(CHGIS) ,制定的地 名分类体系,着重描述历史地名,包括行政区、 水系、居民地、街道和道路、点状特征、地形、 高程要素和植被等7大类,没有划分二级类目, 等级层次不清晰 12 。 2002年,国家制定的 “ 地名分类与类别代码 编制规则 ”(GB /T 18521 - 2001)标准,规定了地 名类别划分规则与地名类别代码的编制规则,以 适用于地名信息系统和相关信息系统中地名信息 的处理与交换 11 。该标准是基础地理信息分类体 系的一个子集,采用四级等级编码体系,分 “ 自 然地理实体 ” (78 小类)和 “ 人文地理实体 ”(167 小类)两大类。其中有51个类名为 “ 其他 ”的类 目,导致分类专指性不强。在 “ 地名分类与类别 代码编制规则 ”( GB /T 18521- 2001)中,将组织 机构列入“ 具有地名意义的单位 ” 的下位类,并细 分为党政机关、民间组织、事业单位、军事单位 和其他五个小类。 2008年国家测绘局颁布了 “ 数字城市地理空 间信息公共平台地名/地址分类、描述及编码规 则 ”(CH /Z 9002 - 2007)指导性技术文件 13 ,用于 规定数字城市地理空间信息公共平台中地名/地址 分类、描述、编码,以及地理位置信息表达的规 则与方法。其中,地名分为行政区域地名、街巷 名、小区名、门(楼)址、标志物名、兴趣点名6 大类22个小类。 目前,较完整的地理命名实体分类体系是美 国亚历山大数字图书馆(Alexandria Digital Library, 简称ADL)整合并创建的 “ 地理主题词表 ”(Fea2 ture Type Thesaurus,FTT词表)。亚历山大数字图 书馆 14 ADL是美国最大的、持续时间最长的数字 图书馆研究项目之一。自1995年起受到了美国自 然科学基金会的数字图书馆创始项目的两期资助, 已经发展成为分布式的、数字化的地理信息参考 服务。FTT是一部用于描述地名的受控主题词表, 是ADL的最主要贡献之一。FTT即按照等级结构 组织排列的、规范的主题词表,分属水系、人工 实体、地区、行政区划、地块和自然地理要素6 个大类和202个小类。FTT主要用于全球范围地名 的分类,概念粒度大,只有两个等级层次,不包 括地址和组织机构等。通过根据具体需求对其简 化、调整和扩展,形成适用的地名分类模式。然 而,以ADL为基础,建立大而全、 普遍适用于世 界各地的地名分类模式仍然十分困难,而且对 个别地名库而言,采用如此庞大的通用模式, 将带来不重要甚至冗余信息,从而降低检索效 率 15 。葛宁,王军采用语料库标引结果,根据 地名通名与类别的同现关系,实现对FTT的自动 丰富 16 。 近年来,地名本体的研究受到越来越多的关 注。一般认为,地名本体应该集成地理实体本体、 地理要素本体和空间关系本体,以满足地理查询 中地理推理的需要 17 。地名本体构建需要综合考 虑地名的空间分布特征、模糊性、动态性、多义 性和尺度等因素 18 。 1222期张雪英 等:地理命名实体分类体系的设计与应用分析 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 213 组织机构分类体系 组织机构是企业、事业单位、机关、社会团 体及其他依法成立的单位的通称。 “ 组织机构类 型 ”GB /T20091 - 2006按照组织机构的功能和性 质,依据国家现行法律法规,将组织机构类型确 定为企业、机关、事业单位、社会团体和其他机 构等5个大类, 26个小类 15 。随着自然语言在地 理信息科学中应用的增加,地理命名实体对自然 语言中地理空间信息的解析也日益重要。地理命 名实体分类体系主要应用于自然语言中地理空间 信息的解析,包括文本、语音和视频等数据资源。 自然语言中对于地理实体的描述手段较为多样化。 它既包括地名、机构名称和地址等特定名称,又 包括一些具有复杂结构的非特定名称,比如 “ 南 京师范大学东部 ”采用特定地理命名实体与空间 关系描述相结合的方式,“ 南京师范大学东边的池 塘 ”,则 “ 池塘 ” 是非特定地理命名实体。现有的 地理信息、地名和组织机构等分类体系等,都涉 及地理命名实体的分类问题。但是,这些分类体 系的分类标准存在较大差异,适用于不同的应用 领域,分别只能表达自然语言中描述的部分地理 实体。本文在借鉴现有相关分类体系的基础上, 结合自然语言地理命名实体描述的特点,以实际 标注结果为参考依据,设计具有覆盖面广、概念 粒度适中、操作性强、共享性能高的地理命名实 体分类体系(简称 “GNEC” ) , 并应用于文本中地 理命名实体识别与地图服务。 3 地理命名实体分类体系的设计 311 分类原则 GNEC的制定遵循以下通用和专用分类原则: (1)科学性原则:以适合现代计算机和数据库 技术应用和管理为目标,选择地理信息的空间特 征、要素特征或属性对地理命名实体进行科学分 类,形成较为系统的分类体系。 (2)完整性原则:分类体系在总体上应具有一 定的概括性和包容性,要求基本上概括自然语言 中描述的地理命名实体,反映地理要素的类型特 征和相互关系,具有较好的完整性。 (3)层次性和可扩展性原则:分类体系采用层 次分类法,以较好体现地理要素之间的等级层次 关系。代码结构留有适当的扩充余地,以便在增 加新的信息时,不破坏原有的分类体系结构。 (4)稳定性原则:分类体系选择各要素最稳定 的特征和属性作为分类依据,以保证在较长时间 里不发生重大变更。顶层的分类在长时间内具有 稳定性和确定性,底层的分类和地理要素可根据 不同领域的具体情况及要求进行扩充。 (5)兼容性原则:以地名学、地理学的学科分 类为基础,尽可能参考地理信息分类的国际、国 家、行业标准,充分体现分类体系的继承性、兼 容性。 (6)适用性原则:充分考虑与国内外标准的衔 接,要素名称尽量沿用习惯名称,且便于用户选 择和记忆,提高分类体系的实用性。参考不同类 别地理命名实体在自然语言中的出现频率,确定 各个类别的分类层次,提高分类体系应用的可操 作性。 312 分类体系的构建 现有的相关分类体系没有考虑时间要素。为 了反映地理命名实体,特别是地名的时空特性, GNEC设计为主复表形式,其中,主分表为地理要 素分类表,复分表为历史朝代表。 (1)主表的类目设置 主表参照GB /T 13923 - 2006的分类编码方 案,采用线分类法,按从属关系将地理要素依次 分为大类、中类、小类和子类四个级别。分类代 码采用6位十进制数字码,左起第一位表示大类, 左起第二位表示中类,左起第三、四位表示小类, 最后两位表示子类。在遵循相关分类原则的基础 上,参考现有的地理信息、地名和组织机构分类 体系,根据上文中定义的编码方式,以 “ 基础地 理信息要素分类与代码 ”(GB /T 13923 - 2006)为底 表,将其他参考表中不同于底表中的类目,按照 等级关系补充到底表中,形成一个集成参考分类 体系中所有主题范围的地理命名实体分类体系(简 称 “GNEC”)。但是,该分类体系中有些类别描述 的地理实体在自然语言中很可能极少出现,而且 有的类别之间定义较为模糊。 为了解决上述问题,我们采用在大规模自然 语言文本中进行标注的实验,通过分析各个类别 的应用频率,进行类别的增删修补操作。实验数 据采用 中国大百科全书(地理分册)(150万 字)和微软语料库(110万字)。微软标注语料库由 222地 球 信 息 科 学 学 报 2010年 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 微软亚洲研究院(MSRA)制作,其目标是建设一 个大规模的文本语料库,用来训练某种统计语言 模型,也被用来获取其他语言知识。具体做法: 首先,将实验数据中的地理命名实体进行人工标 注,抽取5万多个地理命名实体;其次,按照 TGNC对标注的地理命名实体进行分类,分析各 个类别的使用频次;最后,根据频次分析结果将 类别进行修订。例如,将 “ 山 ” 、“ 峰 ”和 “ 柱 ” 分为三个类别,在实际标注过程中不仅很难区分 这三种类型的地理命名 实体,而且 “峰 ”和 “ 柱 ”的应用频率很低。因此,我们将这三个类 别合并为一个类别 “610100山、峰、柱 ” 。与此 类似的还有 “ 田坎、路堑、沟堑、路堤 ”和 “ 煤 田、煤井 ”等类目。另外,还有部分地理命名实 体(比如电话号码)不能归类,或者只能归到大 类,需要进行补充。通过上述操作,形成最终的 地理命名实体分类体系。分类体系设计本身是一 项非常复杂的任务,而检验分类体系的质量是至 关重要的环节。采用大规模标注方法进行地理命 名实体分类体系的完善,具有较强的应用保障基 础。表1例举了GNEC中的大类和子类类目设置 情况。 表1 GNEC的大类和子类类目 Tab11 Ma in classes and subclasses of GNEC 序号分类代码分类类目序号分类代码分类类目 1100000水系2390000其他交通设施 3110000河流4400000管线 5120000沟渠6410000输电线 7130000湖泊8420000通信线 9140000水库10430000油、 气、 水输送主管道 11150000陆地岛屿12440000城市管线 13160000海洋要素14445000燃气管线 15170000其他水系要素16446000热力管线 17180000水利及附属设施18447000工业管线 19200000居民地及设施20448000综合管廊 21210000居民地22500000境界、 政区与其他区域 23220000工矿及其设施24510000国家行政区 25230000农业及其设施26520000非行政区域 27240000公共服务及其设施28600000地貌 29250000名胜古迹30610000自然地貌 31260000宗教设施32620000人工地貌 33270000科学观测站34630000植被与土质 35280000其他建筑物及其设施3670000组织机构 37300000交通38710000党政机关 39310000铁路40720000事业单位 41320000城市公路42730000民间组织和社会团体 43330000城市道路44740000企业单位 45340000乡村道路46750000军事单位 47350000道路构造物及附属设施48900000其他 49360000水运设施50910000地址 51370000航道52920000邮政编码 53380000机场54920000电话号码 3222期张雪英 等:地理命名实体分类体系的设计与应用分析 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. (2)复分表的类目设置 复分表类目(见表2) ,其具体类目可以根据 实际应用需要进行扩充与修改。 表2 复分表的类目设置 Tab12 Ma in classes of the subdivision scheme 分类代码分类类目分类代码分类类目 XC夏SC隋 SC商TC唐 XZ西周SC宋 CQ春秋LC辽 ZG战国JC金 QC秦YC元 LH两汉MC明 SG三国QC清 JC晋MG民国 NB南北朝CN中华人民共和国 具体分类方法:任何一个地理命名实体都必 须指定一个主分类代码;如果该实体具有较为明 确的起始和终止时间,则采用复分表进行细分; 最后,将两个分类代码用 “-”组合起来,形成 该实体完整的分类代码。例如,“ 红河在元朝以前 称为濮水 ”,其中 “濮水 ”的地理要素分类为 “110000河流 ”,复分为 “YC元 ”,则其最终分类 代码为 “110000 - YC” 。 4 分类体系的共享与应用分析 411 兼容性分析 通过语义转换可以较好地反映分类体系之间 的兼容性,是实现不同类型地理信息系统之间信 息共享和互操作的重要手段。定性分析主要考察 分类体系的编码方式。如果两个分类体系采用相 同的编码方式,或者一方是对另一方编码的扩展, 就有可能获得较好的语义一致性。绝大多数分类 体系均采用不同的分类编码方式,不可能根据分 类代码直接进行转换。但是,可以根据大类类目 的设置情况进行分析。表3列出了GNEC、地名分 类与类别代码编制规则(GB /T 18521 - 2001)、基 础地理信息要素分类与代码(GB /T 13923 - 2006)、 FTT词表和CHGIS地名分类体系的大类设置情况。 可以看出,GENC体系在涵盖了其他分类体系中的 绝大部分类别,而且还进行了一定的扩充。GNEC 类目设置主要考虑地理命名实体的地理要素类型、 空间位置和时间等因素,没有顾及地理实体的几 何形状、 大小、 高度等属性。 表3 不同分类体系的大类设置 Tab13 Ma i n classes of a few classifications 分类体系大类 地理命名实体分类体系(G NEC) 水系;居民地及设施; 交通;管线;境界;政 区与其他区域;地貌;组 织机构;其他(地址、电话 号码、邮政编码等) 地名分类与类别代码编制规则 (GB /T 18521 - 2001) 自然地理实体(海域、水系、 陆地地形、 其他 ) ; 人文地理 实体(行政区域及其他区域、 居民地、具有地名意义的交通 运输设施、具有地名意义的水 利、电力、通信设施、具有地 名意义的纪念地、旅游胜地、 其他地名意义的建筑物、具有 地名意义的单位、 其他) 基础地理信息要素分类与代码 (GB /T 13923 - 2006) 定位基础;水系;居民 地及设施;交通;管线; 境界与政区;地貌;植 被与土质 FTT词表 水系; 人工实体; 地区; 行政区划;地块;自然 地理要素 CHGIS地名分类体系 行政区; 水系; 居民地; 街道,公路,道路,铁路, 小径; 点状要素;地形高 程要素; 植被 定量分析主要采用转换系数(S)指标。转换系 数是指两个分类体系中语义相同或者相近的类目 所占比重,用于从整体上反映两个分类体系类目 设置的兼容性 16 。假设 A和B分别表示两个地理 信息分类体系,IA表示A的类目总数,IB表示B 的类目总数,那么S的表达式为: S = 2 对照关系的数量 IA+ IB 从语义转换结果(见表 4) 来看,GNEC GNE保 持了与GB /T 13923 - 2006、GB /T 18521 - 2001和 ADL FTT等良好的兼容性。由于GB /T 13923 - 2006的分类较为专指,因此,它与GNEC的转换 系数比较低。但是,GNEC的绝大多数类目可与其 422地 球 信 息 科 学 学 报 2010年 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 前三级类目实现较好的语义转换。换句话说, GNEC可以达到与GB /T 13923 - 2006较好的兼容 性,而反过来却容易导致语义的不一致问题。这 一现象说明,语义转换系数用于衡量两个分类体 系的兼容性指标时,需要考虑两者相对应的概念 粒度和概念等级层次。 表4 语义转换结果 Tab14 Results of the semantic matching 分类体系 类目数量 总数一级类二级类三级类四级类 类目对照数量转换系数(% ) 地理命名实体分类体系(GNEC)25584611982- 地名分类与类别代码编制规则 (GB /T 18521 - 2001) 2452126316824598 基础地理信息要素分类与代码 (GB /T 13923 - 2006) 76584628742424047 FTT词表208611960232088918 CHGIS地名分类体系2087201002088918 412 地理命名实体解析及地图服务的应用 文本中地理命名实体解析,是指对自然语言文 本中描述的地理命名实体进行自动识别和分类的过 程。解析结果既可以作为地理信息系统的空间数据 来源,也可以通过地理编码操作,实现文本中地理 命名实体的可视化服务。本文采用条件随机场模型 (CRF + +工具包)开发的IE插件,能够实现中文文 本中地理命名实体的自动识别,并按照GNEC进 行自动分类,借助地名词典,将识别出的地理命 名实体在地图中定位。用户只需进行简单的鼠标 点击操作,就可以在阅读文本的同时提供在线地 图服务。图1为一个操作实例的界面。 从文本中抽取地理命名实体,是实现自然语 言中地理信息结构化的一个过程;而运用地理命 名实体分类体系,对识别出的地理命名实体进行 分类,则是对其进行概念化的过程,是实现其空 间定位计算的基础。如果分类体系的设计比较合 理、完善,那么地图定位的效率和效果将得到较 大的提高。从本文的实验结果来看,GNEC具有较 好的概念覆盖度,类目之间的语义界限较为清晰, 而且类目等级和数量控制,能够较大程度地提高 分类效率。另外,由于建立了GNEC与其他标准 分类体系的语义转换关系,可以较为方便地实现 与其他地理信息系统的信息共享。 5 结论 地理命名实体是运用自然语言描述地理位置 图1 地理命名实体解析及地图服务的应用案例 Fig11 A case of the resolution of geographical named entities for Chinese web pages and map services 信息的标识符,涵盖日常生活中多种地理参照系 统。构建地理命名实体分类体系,是实现自然语 言中空间信息解析的关键研究内容之一。本文在 参照大量相关分类体系的基础上,采用独特的主 分表和复分表相结合的编码方式,根据大量文本 5222期张雪英 等:地理命名实体分类体系的设计与应用分析 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. 标注实验结果,设计了一个地理命名实体分类体 系(GNEC) ,并应用于中文文本中地理命名实体解 析及地图服务研究。实验分析表明,该分类体系 具有较好的表达能力和兼容性能。通过进一步完 善,可以广泛推广应用于自然语言处理、空间信 息检索、地理信息系统、移动位置服务等领域。 需要指出的是,GNEC只是从概念角度规范了自然 语言中地理命名实体的表达形式。在此基础上, 可以结合空间关系,构建地理命名实体的本体, 从而较为完善地解决地理命名实体的模糊性和多 义性问题。 参考文献: 1GoodchildM F. Citizens asVoluntary Sensors: SpatialData Infrastructure in the World of Web 2. 0 J .International Journal of SpatialData InfrastructuresResearch, 2007, (2) : 24 - 32. 2陈常松.面向数据共享的GIS语义表达理论的初步研究 J .测绘学报, 2000(1) : 93. 3李新通,何建邦,毕建涛.国家资源环境数据库信息分类 编码及应用模式J .地理学报,2002,57(增刊) : 9 - 17. 4国家技术监督局.中华人民共和国国家标准国土基础 信息数据分类与代码(GB /T13923 - 1992) S. 1992. 5国家技术监督局.中华人民共和国国家标准1: 500、 1: 1 000、1: 2 000地形图要素分类与代码(GB /T14804 - 1993) S.北京:中国标准出版社, 1993. 6国家技术监督局.中华人民共和国国家标准1: 5 000、 1: 10 000、1: 25 000、1: 50 000、1: 100 000地形图要素分类 与代码(GB /T15660 - 1995) S.北京:中国标准出版 社, 1995. 7 国家技术监督局.中华人民共和国国家标准1: 5 000、 1: 10 000、1: 25 000、1: 50 000、1: 100 000地形图要素分类 与代码(GB /T13923 - 2006) S.北京:中国标准出版 社, 2006. 8 城市基础地理信息系统技术规范.中华人民共和国行业 标准(CJJ100 - 2004) S.北京:中国建筑工业出版社, 2004. 9 中国标准化研究院.组织机构类型(GB /T 20091 - 2006) S.北京:中国标准出版社, 2006. 10浦善新.数字地名 地名信息系统的理论及其应用 M .北京:新华出版社, 2000. 11www. fas . harvard. edu/chgis/ 12国家技术监督局.地名分类与类别代码编制规则 S. 北京:中国标准出版社, 2001. 13国家测绘局.数字城市地理空间信息公共平台地名/地 址分类、 描述及编码规则 ”(CH /Z 9002 - 2007) S.北 京:测绘出版社, 2008. 14www. alexandria. ucsb. edu/ 15陈凯晨,林星,袁一泓,等.数字地名词典中的类型表达 和管理J .地理与地理信息科学, 2009, 25(5) : 6 - 10. 16葛宁,王军.领域Ontology的自动丰富 基于ADL地 名的实例研究 J .计算机科学, 2007, 34 (9) : 156 - 162. 1 - 7. 17李淑霞,高俊.地名本体的概念框架与构成研究J .测 绘科学技术学报, 2008, 25 (3) : 164 - 167. 18刘瑜,张毅,田原,等.广义地名及其本体研究J .地理 与地理信息科学, 2007, 23 (6) : 1 - 7. 19国家技术监督局.组织机构类型(GB /T 20091 - 2006) S.北京:中国标准出版社, 2006. 20张雪英,闾国年.基于语义的地理信息分类体系对比分 析J .遥感学报, 2008, 12(1) : 9 - 14. Design and Analysis of a Classification Scheme of Geographical Named Entities ZHNAG Xueying,ZHANG Chunju, LV Guonian (Key Laboratory of Virtual Geographical Environment, M inistry of Education, Nanjing Nor mal University, Nanjing 210046,China) Abstract: W ith the increasing applications of natural language in geographical infor mation science,resolution of geospatial infor mation in natural language has become one of the hot issues .Geographical named entities are iden2 tifiers of geographical location infor mation in natural language, which include a majority of popular geographical reference systems such as geographical names,addresses, postal codes,telephone numbers and other relative lo2 cation descriptions . A complete classification scheme of geographical named entities may help i mplement resolu2 tion,storage, management,analysis and sharing of geographical information in natural language.Commonly2 used classifications,i .e.classifications of geographical features,classifications of place names,and organiza2 622地 球 信 息 科 学 学 报 2010年 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. tion classifications are identified such disadvantages
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 禄劝六孔桥上部施工方案
- 天然气道路开挖施工方案
- 白内障护理师考试题库及答案解析
- 巴中客厅铝单板施工方案
- 防盗笼安装施工方案模板
- 中式徽派建筑施工方案
- 道路厂房规划方案范本
- 厂房使用规划方案范本
- 贵阳重夯试验段施工方案
- 厂房设备维修项目投标方案范本
- SH∕T 3097-2017 石油化工静电接地设计规范
- CE安全标准规范(电气类)
- 第3课《追求人生理想》第2框《努力把人生理想变为现实》-【中职专用】《哲学与人生》同步课堂课件
- 花园小学少先队知识竞赛题
- (2024版)大学本科新增专业《生物育种技术》解读
- AMC数学竞赛真题答案2023
- JJG 643-2024标准表法流量标准装置
- 加令岭水库防洪抢险应急预案
- 培训养老护理员的
- 《电机与拖动基础》课件
- 区域创新体系建设
评论
0/150
提交评论