




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 31 关于土地信息系统建立过程中的数据质量问题的探讨 (1) 摘要:数据对土地信息系统 (LIS)来说是至关重要的,数据质量的好坏是土地信息系统建设成败的关键。本文将对土地信息系统建立过程中有关数据质量 问题 进行探讨。 关键词:土地信息系统、数据质量、误差、分辨率、坐标变换、矢量数据、栅格数据、拓扑 Abstract : Data is very important for Land Informa tion Systeem, A key to Land info rmation th e systems developme nts succes s is wheth er the dat a quantity is accura cy. This p aper will Study the data quant ity the pr oblem in L and inform ation the system est ablish the process. Key words: L and Inform ation Systtems; Data Q uality;Errror; Accuraccy; Remote S ensing; Dig itize; Reso lution;Coo rdinate Tr ansformatiion; Vector Data; Raste r Data;Top ological. 一、前言 土地是人 类类的宝贵财富,是人类 社会 进行物质生产 所所必需的基本条件和 自自然 基础。如何 科 学学 、合理地利用有限 的的土地资源,如何及时 了了解与掌握土地利用变 化化数量和空2 / 31 间特点,对 于于保持耕地总量动态平 衡衡和土地持续利用具有 十十分重要的意义。 随 着着社会 经济 的日趋 多多样化,土地部门的业 务务 工作及范围也在不断 扩扩大,原有的靠手工操 作作,图纸管理的模式已 经经越来越不能满足高效 率率的需求。为强化土地 管管理 ,满足社会对土地 资资源信息更多、更细、 更更完善的服务要求,各 土土地管理部门纷纷加入 信信息化、数字化的改革 大大潮。特别是在市场经 济济条件下,因土地管理 部部门工作的严肃性、准 确确性、科学性和规范化 要要求,管理中任何规定 的的确定和变更都需要完 成成大量的信息收集、 分分析 、综合、决策和 评评估等工作,土地管理 也也只有强有力的信息技 术术的支持下,才能做到 真真正的科学决策和管理 。 土地信息系统是地 理理信息系 统的一个分支 ,是一种基于宗地 以 宗宗地为单位 的 计算 机管理信息系统。是 一一种利用计算机技术及 其其属性数据进行采集、 处处理、管理、查询、分 析析、 应用 和维护更 新新的空间信息系统,是 土土地管理的 现代 化 工工具,是土地规划和管 理理定量化、科学化的 方方法 、手段。但是, 在在土地信息系统的建设 过过程中,还存在许多问 题题,给土地信息系统的 建建设及发挥带来一定困 难难。这里仅对土地信息 系系统建设中的数据质量 问问题进行探讨。 二、 对对 LIS数据质量的认 识识 数据是一种未经加 工工的原始资料,是客观 对对象的表示,3 / 31 它 可以是 数数字、文字、符号、图 像像,数据是信息的具体 表表达形式。一个 LIS 系系统包括空间数据、属 性性数据、空间数据之间 的的关系以及空间数据与 属属性数据之间的关联。 人们往往以为计算机 为为基础的信息系统的数 据据质量是可靠的,很少 怀怀疑利用信息系统产生 的的分析结果在数据质量 方方面会有问题,但事实 远远非如此。在某些情况 下下,由于多种原因,计 算算机分析的结果甚至会 比比手工分析的误差更大 。这里除软件、硬件的 质质量问题,计算方法上 的的问题,以及分类、编 码码、输入、操作的明显 疏疏忽外,数据本身的质 量量是重要的原因。 众 所所周知,数据是 LIS 的的 “ 血液 ” ,是组成系 统统的重要元素。数据质 量量的好坏是土地信息系 统统成功与否的关键所在 ;数据质量的高低优劣 ,都直接 影响 到土 地地信息系统的经济效益 和和社会效益,决定了系 统统应用价值的大小;数 据据的可靠,质量的好坏 将将直接影响到整个系统 的的成败。系统如果不能 提提供正确、可靠的信息 ,这个系统也就失去了 存存在的价值。 数据质 量量的好坏是一个相对概 念念,并具有一定的针对 性性。衡量其好坏主要有 以以下几个指标:误差、 数数据的准确度、数据的 精精度和不确定性 1。数据质量是数据整体 性性能 的综合体现。 4 / 31 统 而而言之,数据的质量问 题题主要表现在两个方面 :一是数据是否及时反 映映了现实世界;二是数 据据是否保持了一致性和 完完整性。 土地信息系 统统的数据量大,数据来 源源广,数据采集的任务 重重,在数据库建立过程 中中会出现许多人为和系 统统的误差,甚至还有可 能能产生数据错误,最后 采采集的数据无法准确反 映映规划和管理的实际状 况况,建立在此数据库基 础础上的系统往往也就达 不不到管理自动化辅助决 策策的目的,而只不过是 “看看而已”的一种“ 摆摆设”罢了。转贴于论 文文联盟 http:/ 数据库是土地信息 系系统最基本 、最重要的 组组成部分,也是投资比 重重最大的部分。数据质 量量的好坏,直接 影响 系统的功能和 应用 。不仅要根据技术规 程程衡量数据质量,还要 从从数据使用角度 分析 数据质量 问题 。 数数据质量通常是指数据 的的可靠性和精度,它主 要要用数据的误差来度量 的的。现就土地信息系统 建建立过程中的数据质量 问问题作进一步的探讨。 三、数据源质量的问题 土地信息系统的数据 源源指建库中所需要的各 种种数据类型的来源。它 是是土地信息系统最基本 、最重要的组成部份。 土土地信息系统的数据源 多多种多样,主要包括有 :地图,地图是系 统最 主主要的数据源,因为地 图图是地理数据的传统描 述述形式,是具有共同 参参考 坐标系统的点、 线线、面的二维平面形5 / 31 式 的的表示, 内容 丰富 ,图上实体间的空间关 系系直观,而且实体的类 别别和属性可以用各种不 同同的符号加以识别和表 示示。土地信息系统其图 形形数据大部分都来自地 图图,土地信息系统的属 性性数据主要有地籍图、 宗宗地图、土地详查图、 土土地利用现状图、行政 区区划图、专题图、乃至 地地形图等各种 图件的矢 量量化地图数据。二是遥 感感影像数据 ,遥感影像 数数据是一个极其重要的 信信息源。通过遥感影像 可可以快速、准确地获得 大大面积的、综合的各种 专专题信息,航天遥感影 像像还可以取得周期性的 资资料,这些都为土地信 息息系统提供了丰富的信 息息。三是统计数据,包 括括土地的分类、面积、 权权属、分布及质量、等 级级状况、利用状况、非 法法占地等统计资料。四 是是实测数据,包括 GPS 点位数据、地籍测量 数数据等。五是数字数据 ,包括数字图形数据和 属属性数据。数字数据主 要要有地籍号、档案卷宗 号号、地类号、图号、手 簿簿号、宗地界址点点号 及及坐标控制点坐标,宗 地地面积,面积中误差、 年年 代、日期等等。属性 数数据包括图形、图像以 外外的各种文字、数字信 息息。其 中文字信息主要 是是与宗地档案,文件档 案案组成相关的各种检索 和和查询信息 (如:土地 权权利人姓名或单位各称 、土地座落,文件档案 的的标题、发文机关、公 文文字号等等 ),以及土 地地登记、地籍调查、权 属属审核、登记发证各办 公公流程中的各种键盘输 入入信息。六是各种立法 文文件和文字档案,主要 有有地籍档案、文件档案 等等具有 法律 效力或 需需要经常查阅的原始文 件件材料,6 / 31 它们是土地信 息息的重要组成部分,在 土土地的规划管理中起着 很很大的作用。 数据源 质质量问题指数据的采集 和和录入中可能产生的误 差差,建库所需的各种类 型型的数据的可 靠性和精 度度。 从土地信息系统 建建立的过程来看,它的 主主要因素有:各种测量 数数据,地图和遥感数据 等等的误差;调查和统计 造造成的属性数据误差, 以以及文档数据的错误等 ,数字化前的预处理、 手手扶踀自动化的分辨率 和和矢量化精度。 1 、 遥 遥 感 数据 地理信息 系系统、遥感和 计算 机机辅助制图是 现代 地地 理学 的重要技术 手手段。遥感作为一种获 取取和更新空间数据的强 有有力手段,能及时地提 供供准确、综合和大范围 进进行动态监测的各种 资 源源与环境的信息,因此 遥遥感数据是土地信息系 统统的一个重要数据源。 所谓遥感就是遥远感知 的的意思,也就是不直接 接接触目标物和现象,在 距距离地物几公里到几百 里里、甚至上千里的飞机 、飞船、卫星上,使用 光光学或 电子 仪器接 受受地面物体或发射的电 磁磁波信号,并从图像胶 片片或数据磁带形式记录 下下来,传送到地面,经 过过信息处理,判读分析 和和野外实地验证,最终 服服务于有关部门的规划 决决策 2。土地管 理理部门可以运用遥感技 术术快速获取现状空间的 信信息。 7 / 31 尽管遥感技术 有有很多好处,但因其自 身身特性,获取的遥感数 据据 可能存在一些误差。 如如:不同的高度引起的 问问题,由于传感器的结 构构及稳定性产生的问题 ,对信号进行数字化产 生生的误差。传感器在航 线线、航向上出现的误差 ,大气辐射产生的误差 ,地形和地貌等因素产 生生的误差等等。在遥感 资资料的获取时,有些误 差差是可以控制的,有些 则则不可控。因此必须对 原原始数据进行预处理, 包包括利用地面控制对原 始始数据进行几何校正, 图图像增强和分类。对获 取取的遥感数据进行光谱 校校正,特征提取,自动 识识别分类、自动成图等 处处理 3。转贴于论 文文联盟 http:/ 、测量数据 各种 原原始的测 量数据是土地 信信息系统的主要来源之 一一。包括宗地的权属界 线线、位置、形状、数量 、面积、各级行政界线 、地形图测量等。由于 人人和环境的因素,测量 数数据不可避免地受到人 为为误差、仪器、环境的 影响 。来源于地面 测测量的数字数据中含有 控控制测量和碎部测量误 差差。其中控制点误差又 受受控制网的 参考 基 准准、网形和观测精度以 及及观测费用等因素的影 响响。碎部点误差除了继 承承了控制点的误差外, 还还受自身观测 方法 ,观测精度和地界的人 为为判断,以及地物地貌 的的取舍等因素的影响。 当当然原始数据误差受观 测测仪器、观测者 和外界 环环境三种因素影响。除 此此之外 ,还有测量数据 的的实时性以及数据老化 ,采集数据的密度不合 理理,或概8 / 31 括取舍不合理 ,选取测量规范标准不 一一致或精度等级不一致 造造成测量数据的不一致 的的影响。中国论文联盟 编编辑。 地籍要素是构 建建土地信息系统极为关 键键的一步,其测量数据 的的精度高低决定了系统 功功能能否得到正确和充 分分发挥。 从地籍测量 成成果的有效性和土地管 理理的可能性来考虑,为 了了保证各权属单元之间 的的界线清晰,边界无争 议议,并且双方都能接受 而而不损害他人和国家的 利利益 ,地籍测量要达到 一一定精度。因此,必须 要要有相应的数据采集方 法法作为保证。地籍要素 的的采集方法 目前 主 要要有两种,一种是传统 的的模拟式外业测图方法 ,另一种是野外全数字 化化数据采集方法。传统 方方法的主要作法是在地 籍籍控制测量的基础上, 用用解析法测量出权属界 址址点坐标,以控制点或 以以界址点为基础施测成 地地籍图,要形成入库数 据据信息,则要通过对原 图图数字化来实现。用传 统统数据采集方法形成地 籍籍要素数字信息其误差 影影响因素较多,主要误 差差来源为:测站点误差 mm1,量距误差 m2, 在在测图板上描绘方向线 误误差为 m3,刺点误差 mm4,数字化仪采点误 差 差 m5 等。按有关专著 论 论述,一般情况下,m1 ,m2,m 3 ,m4, 这 四四项误差为野外采集误 差差。数字化 m5 的影响 因因素比较复杂,误差产 生生首先与图形要素有关 ,要素本身的复杂程度 对对数字化精度有显著影 响响,数字化仪本身的精 度度更应引起重视。正常 情情况下,用常规数字化 仪仪进行数字化时,精度 一一般可达到 。综合上 述述得,地9 / 31 籍要素采集精 度度 m 采 为: m 采 = = = 按 1: 500 比例尺来 考考虑,实地误差将达到 10cm ,由此可见 ,按传统方法施测,则 拟拟入库的地籍要素信息 很很难达到规 定的 5c m 的精度标准 4。 采用野外全数字化方 法法,界址点野外数据采 集集一般采用直接测定坐 标标法,即将全站仪或测 距距仪置于测站点上,对 界界址点上的移动棱镜进 行行水平角和距离测定, 电子 手薄记录 计 算算 。此种方法的主要 误误差来源为水平角测角 误误差 m 和测距误差 mD ,测角中误差角保守 为为 5 ,测距误差主 要要来自移动棱镜偏离界 址址点位置误差,其偏离 值值按 2cm 考虑。测距 平平均边长取 100m, 按按点位误差精度估算公 式式 m2= 来计算,则 m 2cm, 即便考 虑虑测站误差和其他偶然 的的联合影响,点位 精度 也也肯定在规定范围内, 所所以地籍要素信息数据 的的野外全数字化有利于 提提高界址点精 度,从而 保保证地籍数据的质量。 、调查、统计、文档 数数据 问题 土地信 息息系统的建设过程中, 涉涉及大量的调查统计数 据10 / 31 据,这些资料尚存在许 多多不足之处,为土地信 息息系统的建设带来了一 定定困难。 建立土地信 息息系统,必须首先进行 土土地基本信息的搜集, 开开展地籍调查工作,核 实实宗地权属,掌握土地 利利用状况,获得宗地位 置置、形状及其面积的准 确确数据,为建库奠定基 础础。 现就地籍调查工 作作加以探讨,众所周知 ,权属调查的工作之一 是是填写地籍调查表。由 于于权属调查技术性强, 工工作量大,参与人员多 且且水平不同等原因,填 写写后的地籍调查表或多 或或少会出现下面一些问 题题。在填土地使用者名 称称时,单位本应填写全 称称,可出现了类似这样 的的情况:某林业局有 3 宗宗地,而在 3 份地籍调 查查表上出现了 xx 林业 局局、县林业局、林业局 等等名称。按这样的名称 录录入建立信息系统,将 导导致不能正确地自动的 归归户。在填写土地使用 者者性质时,本应该写“ 全全民 ” 或 “ 集体 ” 或 “ 个个体 ” 或 “ 个人 ” ,而 出出现了 “ 国营 ” 或 “ 国 有有 ” 或 “ 私营 ” 这样的 名名词。在填写宗地 四至 时时应说 明权属界线所经 地地物名称及归属、位置 、与誰接壤。但出现了 东东至 xx,而未填出接 xxx。且有的四至填写 错错误,如两宗地共用一 堵堵墙时,则只能出现两 宗宗都至墙中,或一宗至 墙墙内另一宗至墙外,但 填填出了两宗都至墙外或 墙墙内等情况。在填写界 址址标示处的界址线位置 时时也有类似错误,有的 表表填写字迹潦草,或使 用用简化字,让人难以辨 认认。有的 内容 还可 以以猜出,但户主的姓名 、调查员、勘丈员的签 名名等内容实11 / 31 在难辩;有 的的表中该填的内容而未 填填,任意涂改。转贴于 中中国论文联盟 http :/ 共用宗 的的处理,一个 地块被几 个个权属单位共同使用, 而而其间又难以划清权属 界界线,这样的地块称为 共共用宗 5。不少县 是是这样处理的:有多少 土土地使用者就填多少份 地地籍调查表,表上的 内内容 按各分宗填写。 这这样做的好处是所填的 内内容详细,调查表和土 地地登记申请书、审批表 形形成一一对应的关系。 但但其弊端也是显而易见 的的,其一较大地增大了 填填表的工作量,其二增 大大了复杂程度,在填写 四四至时,如遇一个土地 使使用者使用几个地块则 不不得不写清几个地块的 四四至;为填清界址指标 ,又得设置内部界址点 ,增加了宗地草图和地 籍籍图的负荷量,填表 时 如如不小心还会造成表与 表表之 间的相互矛盾。为 了了和地调表统一,有的 在在形成宗地界址点成果 表表时,除了有宗地界址 点点成果表外,还有分宗 的的界址点成果表。如果 内内部界址点是在纸图上 图图解的,则将该宗地的 宗宗地界址点和内部界址 点点和 计算 机展点后 ,会出现界址线混乱的 情情况。在土地信息系统 建建库时,这些内部点是 不不能当界址点录入进库 的的。如进库则在面积统 计计时,这种内部界址点 所所围成的区域的面积就 被被多统计了一次。 建 立立完备的信息系统,必 须须具备这样的条件:大 比比例的地形图或地籍图 ;野外测量的界址点数 据据 ;宗地的属性数据。 全全省在进行大大规模的 城城镇地籍时,由于受当 时时的条件限12 / 31 制,自动化 程程度低,各作业单位作 业业水平的不同,或多或 少少出现一些 问题 。 在在建库时所发现的问题 主主要是界址点的坐标成 果果与地籍上的位置不吻 合合;相邻宗的同一界址 点点坐标不同;界址边长 、宗地面积计算有误。 某某些县为了进行土地登 记记,由于多方面的原因 ,在进行初始地籍调查 时时,只作权属调查,不 作作规范的地籍测量。为 了了计算面积,用皮尺或 钢钢尺丈量界址边长及相 关关尺寸,用几何图形法 计计算出宗 地面积,而不 测测址点坐标和地籍图。 这这样做不 利于信息化的 管管理。 、图形数字化 影响 数据质量的因素 是是多方面的,有相当一 部部分来自于建库过程中 的的数字化过程。建库过 程程中的数据质量,包括 数数字化前的预处理,纸 张张变形、手扶跟踪数字 化化精度或扫描数字化的 分分辨率和矢量化精度。 (1)数字化前的预 处处理 用于数字化作业 的的地形图一般采用聚酯 薄薄膜图,其变形一般小 于于。采用纸质图纸时 ,图纸的尺寸随湿度和 温温度的变化而变化,温 度度不变的情况下,温度 由由 0%增至 25%,则 纸纸的尺寸可能改变 %66。因为纸的膨胀率 和和收缩率不相同,即使 温温度回到原来的 大小, 图图纸也不能恢复原来的 尺尺寸。因此在数字化时 要要适当的比例因子,通 过过仿射变换进行几何纠 正正,以减小工作底图变 形形产生的位置误差,达 到到相应的精度。 13 / 31 对不 同同种类和比例的工作底 图图进行数字化时,应注 意意它的投影方式是否一 致致,比例是否匹配。对 于于不同投影方式应在数 字字化后及时变换为系统 要要求的投影方式。对于 不不同比例应将比例尺和 精精度记录到元数据中, 以以便估记由此可能产生 的的误差。 (2)跟踪 数数字化 手扶跟踪数字 是是一种自动化精度较低 的的数字化方式,其数字 化化精度也因操作员及其 工工作的疲劳程度而异, 操操作员的劳动强度较高 。随着大幅面扫描仪的 成成本不断降低,扫描和 矢矢量化技术不断完善, 这这种数字化方式可能成 为为自动扫描数字化的一 种种补充。 手扶数字化 是是从地形图输入空间数 据据的最广泛采用的输入 方法 。把地形图放 置置于数字化桌上,用手 持持设备,跟踪每一个地 图图特征、数字化设备精 确确量测鼠标的位置,产 生生数据形式的坐标数据 。 影响跟踪数字化数 据据质量的因素很多;主 要要有:数字化底图中地 理理要素的宽度、密度和 复复杂程度对数字化结果 的的质量有着显著影响。 数数字化仪的分辨率和精 度度对数字化数据质量有 着着直 接的决定性的影响 。地形图数字化规范 规定,数字化仪的分 辨辨率不能小于每厘米 3994 线 (约 1000dppi),精度不低于。 常常见数字化仪在分辨率 方方面通常能满足要求, 而而在精度方面却有相当 一一部分不能达到要求。 在在选择数字化仪14 / 31 时要特 别别注意其精度指标,以 满满足 LIS工程的需要 。数字化操作员的技能 与与经验不同而引入的人 为为因素误差是不同的, 由由于操作员视力、操作 习习惯,熟练程度 和疲劳 程程度的不同,最佳采样 点点位值判断,十字丝与 目目标点重合程度的判断 会会有一定程度的差异, 影影响数字化的质量。操 作作方式也会 影响数字化 数数据的质量。转贴于论 文文联盟 http:/ 假定各种误差 影 响响 符合误差传播 规 律律 ,手扶跟踪数字化 的的综合精度应按下式求 得得: 7 m 数 其中: m 数 表 示示手扶跟踪数字化的综 合合精度; m定 表示 工工作底图定向误差, m 仪仪 表示数字化仪精 度度, m人 表示人为因 素素误差。 (3)、扫 描描数字化 扫描数字化 用用高精度扫描仪将图像 等等扫描并形成栅格数据 文文件进行处理,将之转 化化矢量图形数据。规范 规规定:图形定位控制点 扫扫描误差不大于,相对 于于工作底图,矢量化后 的的扫描点误差不大 于, 线线划误差不大于。影响 扫扫描数字化质量的因素 除除原图质量外,还包括 :扫描精度、定向精度 、矢量化精度损失等。 扫描仪的分辨率和 精精度 扫描仪的分辨率 和和精度对扫描数字化质 量量的影响是至15 / 31 关重要的 。因此,要根据具体情 况况选择适当的扫描仪。 目前 ,大幅面扫描 仪仪大致有,滚筒式,平 板板式,直进式种。这 些些扫描仪能够输出一种 或或多种形式栅格数据文 件件。 滚筒式扫描仪精 度度较高价格较贵,能以 较较高的分辨率扫描 AO 或或更大的图纸。 平板 式式扫描仪与滚筒式一样 精精度高、价格贵、分辨 率率很高,但一般幅面不 会会超过 A1 幅面。由于 平平板式扫描仪幅面小, 扫扫描后多需进行拼接, 从从而增加了工作难度, 引引入了更多的误差源。 L IS 工程一般不选用 这这种扫描仪。 直接式 扫扫描仪精度较低,价格 也也较便宜。通常能够满 足足一般 LIS 工程的需 要要。 目前,需要的大 幅幅面扫描仪品牌有: COONTEX、 VIDER 、ANATECH等 。 在选择扫描仪时, 应应注意其是否采用硬件 消消蓝。光学分辨率代表 了了扫描仪的分辨率能力 ,而经销商往往只是给 出出插值分辨。同时,应 注注意扫描仪的歪斜失真 ,歪斜失真的大小与扫 描描仪的走纸方式有关。 栅格 数据矢量化的精 度度损失 在土地信息系 统统中,栅格数据与矢量 数数据各具特点与适用性 ,为了在一个系统中可 以以兼容这两种数据,以 便便有利于进一步 分析 处理,常常需要实现 两两种结构的转换。 栅 格格的矢量转换处理的目 的的,是为了将栅格数据 分分析的16 / 31 结果,通过矢量 绘绘图装置输出,或者为 了了数据压缩的需要,将 大大量的面状栅格数据转 换换为由少量数据表示的 多多边形边界,但是主要 目目的是为了能将自动扫 描描仪获取的栅格数据加 入入矢量形式的数据库。 在栅格数据矢量的过程 中中的细化、跟踪等均可 能能引入一些误差。复杂 图图形全自动化矢量化效 果果极差,会产生众多的 交交叉线,导致多边形跟 踪踪错误。对此,应采用 交交互式矢量化 方法 。因此在选择矢量化软 件件时不应仅仅关心自动 化化程度。还要特别注意 是是否具有以下功能:智 能能去斑,裁剪,扭曲较 正正,比例控制,水平校 正正,光栅编辑和交互式 矢矢量化等。 扫描数 字字化方法误差 扫描数 字字化的几何分辨率是扫 描描数字化方法误差中最 重重要的误差源,减小这 种种误差的唯一方法就是 提提高扫描仪的几何分辨 率率。但是,随着分辨率 的的提高,栅格数据量以 平平方级速度增长。这往 往往造成 计算 机存储 资资源耗 尽,数据处理时 间间平方级延长。以 300 dpi 的分辨率扫描 时时,独立点间距离的相 对对精度为 1000 左 右右。全自动矢量化细化 过过程所产生的点位误差 为为个像素点,而 交交互跟踪矢量化最大点 位位误差可以控制在一个 像像素点。按 300dpi 计,每个像素点相当 于于图上。扫描数字化综 合合精度可按下式计算: M 扫 其中: M 扫扫 表示扫描数字化的 综综合精度; M 定 表示 底底17 / 31 图定向误差; M仪 表表示扫描仪精度; M矢 表示矢量化误差。这 里里, M 定取 ,按 3000dpi 计算 M 仪取 , M 矢取 。则 M扫 =8 。 四、数据 处处理质量 土地信息系 统统的数据库建立后,其 中中已经包含了数据源和 数数据库建库所引入的误 差差。数据库中的多源数 据据,经过系统的各种分 析析处理后,在形成新的 数数据和最后产品的过程 中中还会产生新的数据质 量量 问题 。这些问题 包包括:几何改正,坐标 变变换和比例变换,几何 数数据的编辑、属性数据 的的编辑、空间分析,数 据据格式的转换等。转贴 于于论文联盟 http:/ 1、空间 分 析析 空间分析是对分 析析空间数据的技术的通 称称。从客观上区分,可 归归纳为:空间的图形数 据据的拓扑运算;非空间 属属性数据的运算;空 间 和和非空间属性的联合运 算算等 9。空间分析 赖赖以进行的基础是空间 数数据库,土地信息系统 的的空间数据分析,是实 现现土地资源信息系统的 实实际运用的重点途径。 空间分析中的叠加分析 是是土地信息系统中十分 常常用的一种分析 方法 ,是用户经常用以提 取取数据的手段之一。通 过过同一地区不同 内容 的多幅地图的叠加组 合合,产生新的图形和属 性性信息。在这个过程中 往往往产生拓扑匹配、位 置置和属性方面的数据质 量量 问题 。由于叠加 时时多边形的边界可能不 完完全重合,从而产生若 干干无意义多边形。对这 些些无意义多边18 / 31 形进行处 理理 的结果往往会改变界 线线的位置,叠加后形成 的的新的多边形的属性值 也也可能存在由于属性组 合合带来的误差。 、坐 标标变换 土地信息系统 数数据来源较多,各种数 据据输入信息系统应便于 系系统对数据进行图形显 示示,叠加查询,统计分 析析处理。LIS 要实现 这这些功能,一个首要和 基基本的前提就是各种不 同同来源的数据在系统内 必必须在一致的地形图坐 标标系下。但是,在实际 的的数据采集过程中,大 量量的数据坐标并不一定 属属于系统用户所要求的 坐坐标系,原始数据为一 种种坐标系,系统要求的 数数据为另一种地图坐标 系系,有的数据坐标根本 没没有地理 意义,对此情 况况,必须提供从一种地 图图坐标系到另一中坐标 系系的坐标变换。 在具 体体的操作过程中,有可 能能产生新的误差。在不 同同比例尺下对坐标数据 的的重新设立产生误差, 进进行投影变换和或基 准准面变换时产生的误差 。生产实践中为提高数 据据质量,确保系统的数 据据精度和可靠性,通常 用用仿射变换和相似变换 等等模型来进行数据处理 ,以减小或消除误差。 坐标变换的实质是建 立立两个平面点之间的一 一一对应关系,现有一般 G IS 软件大都提供了 以以下两种模型实现坐标 变变换。 一是仿射变换 :仿射变换也称六参数 变变换,其变换公 式19 / 31 为: 10 x=Ax+By+C () y=Dx+Eyy+F () 其中, x、 y为 地地图输出坐标系中的坐 标标点对; x、 y 为输入 坐坐标中的坐标点时; A, B,C,D,E,F 为为方程参数。参数在坐 标标系空间上的几何意义 为为: A 和 A 分别确定点 在在输出坐标中 x 方面和 y 方向上的缩放尺度。 B 和 D 确定旋转角度, C和 F 分别确定在 x 方 向向和 y 方向上的水平移 尺尺寸。 二 是 相 似 变 换 : : 当 式 、 中 的 参 数 满 足 条 条件 A=E=Scos ,B=-D=Ssi n 时,则得到四 参参数的相似变换公式: x=Ax+By+B y= -Bx+Ay+D 式中, x 、 y为输出地图 坐坐标系中的坐标点对; x 、 y 为输入地图坐标 中中的坐标点对; A、 B、 C、 D 为方程参数, 相相似变换实质上也是坐 标标系间的平移,旋转和 缩缩放尺度的变换,式中 C 和 D 分别为坐标在 x 轴轴和 y 轴上的平移大小 , 为缩放比例, a rctg(B/A)为为旋转角度。 为了求 出出以上公式中的参数, 建建立两种坐标之间的仿 射射转换关系,至少需要 三三个已知的控制点坐标 。而实际上,应选择多 于于三个控制点,方能按 照照最 小二乘法原理进行 平平差,得出系数值,代 入入上述方程即建立输入 和和输出坐标系之间的20 / 31 仿 射射变换数学模型。 可 以以看出,仿射变换和相 似似变换都为线性函数变 换换模型,可实现对原图 形形的平移、旋转和缩放 ,相比较而言,相似变 换换不能进行 x 轴、 y 轴 不不均匀缩放的变换,而 仿仿射变换能保证更高的 数数据精度。 、数据变 换换 (1)CAD 向 GIIS的转换 目前 我 国国土地管理中存在一个 较较为普遍的问题是土地 信信息系统的构建与图形 数数据采集较少作用一个 整整体来通盘考虑,地籍 测测绘大大超前于信息管 理理系统构建。中小城市 这这种问题表 现得更为突 出出。为满足土地确权发 证证,土地定级估价等需 要要, 1995年前测绘 的的地籍图等图件因受技 术术条件的限制绝大部分 是是采用传统白纸测图方 法法完成的。随着 计算 机技术的 发展 和 在在测绘工作中的普及 应应用 , 1995 年之 后后数字地图逐渐取代传 统统测绘。但一个不容忽 视视的事实是,绝大多数 测测绘图软件是在 AUTOOCAD上进行二次开 发发完成的。有些甚至是 采采用低版本的 CAD, 有有 些测绘图软件虽然测 的的是数字图,但只有非 编编码的图形文件,不保 留留信息,或者图形编辑 以以后,返不成信息。这 种种数字图说到底仅 仅是 从从传统的白纸图过渡到 计计算机驱动绘制的白纸 图图。本质上与传统测绘 没没有什么区别。有些虽 然然采用了较高版本的 CAAD基础软件二次开发 成成数字测图软件并采用 了了数字编码技术,但由 于于较少考虑21 / 31 CAD 与 GIIS 的数据共享问题 (土土地信息系统属于专题 GGIS)。在着手考虑 构构建土地信息系统时, 遇遇到的突出问题则是如 何何充分,有效利用已有 数数字信息资料,并确保 数数据转换质量。转贴于 论论文联盟 http:/ 对于传统模拟图 或或难以返成信息的所谓 数数字图只能采用原图数 字字化,形成数字信息后 方方可加以利用,但其精 度度丢失是不可避免的。 对于采用了编码技术 ,也能返成信息的数字 图图,其数字信息可以通 过过数据转换来实现数据 共共享,但由于 CAD 与与 GIS图形数据之间 其其数据格式,数据 内 容容 甚至数据概念都有 很很大差异,数据转换时 应应注意以下三个方面: 11 数据格式转 换换。不同的软件有不同 的的数据格式,有些可以 通通过通用数据格式如 DXXF实现转换,但转换 过过程中的数据丢失也的 确确令人烦恼。 数据元 素素转换。 CAD与 GIS 两者之间的图形元素 不不是一一对应关系, CAAD 图形中的图形元素 种种类要比 GIS 图形文 件件中的 图形元素种类多 , GIS 中只有点、线 、面三类基本图形元素 ,而 CAD 中 包括有点 、线、面、注记、矩形 等等多种图形元素,在具 体体转换中, CAD 的图 形形元素哪些转换成 GIS的点,哪些元素转换 面面面,什么元素需要转 换换成 GIS 的属性数据 ,什么元素则不需要转 换换到 GIS 中去等。 CAAD 与 GIS 图形元素 之之间的对应关系,都需 要要认真细致地加以技术 处处理,22 / 31 使空间数据和属 性性数据在输入系统后正 确确地连接起来。 拓扑 关关系的形成。因为 CAD 的图形元素之间没有 拓拓扑关系,实现 CAD 向向 GIS数据转换的一 个个重要内容就 是要将转 换换后的图形数据按照一 定定的技术要求经过编辑 ,在 GIS 环境下建立 几几何元素的拓扑关系。 在实际转换中,还会出 现现许多意想不到的技术 问题 ,会 影响 数数据转换质量,有待进 一一步解决。 (2)矢 量量数据结构向栅格数据 结结构的转换 土地信息 系系统的建设中,许多数 据据如行政边界, 交通 干线,土地利用类型 、土壤类型等都是用矢 量量数字化的 方法 输 入入 计算 机或以矢量 的的方式存在计算机中, 表表现为点、线、多边形 数数据。然而,矢量数据 直直接用于多种数据的复 合合 分析 等处理将比 较较复杂,特别是不同 数 据据要在位置上一一配准 ,寻找交点并进行分析 。相比之下利用栅格数 据据模式进行处理则容易 得得多。加之土地覆盖的 叠叠置复合分析更需要把 其其从矢量数据的形式转 变变为栅格数据的形式。 矢量数据的基本坐标 是是直角坐标 (x, y),其坐标原点一般取图 的的左下角。网格数据的 基基本坐标是行和列 (i, j),其坐标原点一 般般取图的左上角。两种 数数据变换时,令直角坐 标标x 和 y 分别与行与列 平平行。由于矢量数据的 基基本要素是点、线、面 ,因而只要实现点、线 、面的转换,各种线划 图图形的23 / 31 变换问题基本上 都都可以解决 12。 矢 量数据变成栅格数据 的的原理与方法并不困难 ,但由于矢量数据的记 录录方式各不相同,也会 产产生一些问题。如多边 形形之间公共边原来只有 一一条交界线,转变成网 格格后成为有一定宽度的 界界线,产生了一定的近 似似性。特别是几条线交 叉叉处,一个网格元素中 包包括了相邻的几种类别 ,转换时只能用其中的 一一种类别作为交叉点所 在在的元素的类别,这种 误误差应在允许的范围以 内内。而减小网格尺寸, 虽虽提高了精度,但大大 提提高了数据的冗余量。 栅格数据结构需要大 量量的计算机内存来存贮 和和处理数据,才能达到 与与矢量数据结构相同的 空空间分辨 率,而矢量结 构构在某些特定形式的处 理理中,如象多边形叠置 ,空间均值处理等尚有 大大量的技术问题来解决 。值得注意的是,无论 采采用哪种转换方法,转 换换的结果都会不同程度 地地引起原始信息的损失 。 、空间数据的编辑 通过矢量数字化或扫描 数数字化所获取的原始空 间间数据,都不能避免地 存存在错误或误差。属性 数数据在建库时,也难免 会会存在错误。诸如:空 间间数据的不完整或重复 ,空间点、线、面数据 的的丢失或重复,区域中 心心点的遗漏,栅格数据 矢矢量化时引起的断线等 ,空间数据位置的不准 确确、线段过长或过短, 线24 / 31 线段的断裂、相 邻多边 形形结点的不重合及空间 数数据的变形等。因此, 必必须对图形数据和属性 数数据进行一定的编辑。 土地信息系统数据编 辑辑是消耗时间的交互处 理理工作,对空间数据不 完完整或位置的误差,主 要要是利用 LIS图形编 辑辑功能,如删除 (目标 、属性、坐标 ),修改 ( 平移、拷贝、连接、 分分裂、合并、装饰 )、 插插入等进行处理。对空 间间数据比例尺的不准确 和和变形,可以通过比例 尺尺变换和纠正来处理。 转转贴于论文联盟 htt p:/ 在数据的 编编辑过程中,由可能产 生生一些新的 问题 。 如如:线段的相关与延伸 出出现的问题,图形的平 移移与旋转出现的问题, 删删除 “ 细部多边形 ” 时 产产生的误差,数值 计 算算 与变化的误差;文 件件的合并以及形成新文 件件的问题;属性数据的 重重新定义和更新的问题 。有的问题时可能避免 的的,有的问题则无法避 免免。因此,必须进行检 核核。通过耐心细致的检 查查,主要误差都能从数 据据中寻找出来,并有效 消消除误差。一般采用叠 合合比较法,目视检查法 和和逻辑法。 叠合比较 法法是空间数字化正确与 否否的最佳检核 方法 ,按与原图相同的比例 尺尺把数字化的 内容 绘绘在透明材料上,此后 与与原图叠合在一起,在 透透光桌上仔细的观察和 比比较 。一般。对于空间 数数据的比例尺不准确和 空空间数据的变形马上就 可可以观察出来,对于空 间间数据的位置不完整和 不不准确则须把25 / 31 遗漏、位 置置错误的地方明显地标 注注出来。目视检查指在 屏屏幕上用目视检查的方 法法,检查一些明显的数 字字化误差与错误,包括 线线段过长或过短,多边 形形的重叠和裂口、线段 的的断裂等。 、由计算 机机引起的问题 在计算 机机中,数据是由一定字 长长的编辑数码表示的, 由由计算机字长可能引起 一一种误差。这种误差出 现现在各种数值运算和模 型型 分析 中,由这种 误误差引起的问题很多 113,例如LIS 空 间间数据库中 整数编码对 面面积和周长计算的 影 响响 ,比例尺变换和旋 转转变换对拓扑关系的影 响响等。削弱误差影响的 主主要方法有:改变数据 在在计算机中的表示方式 , 采用合适的算法等。 除了数据处理精度外, 数数据存储精度也与计算 机机字长有关。 16位的 计计算机在存储低分辨率 的的栅格图像时不会出现 问问题,但存储高精度的 控控制点坐标或点位精度 要要求高的地理数据时, 则则不能胜任。 五、数 据据 应用 质量 土地 信信息数据在使用过程中 往往往出现一些质量问题 ,这些问题包括数据的 完完备程度,时间的有效 性性,拓扑关系的正确等 。 1、数据的完 备程 度度 数据的完备程度指 地地理数据在范围、内容 、及结构方面满足所有 要要求的完整程度。包括 数数据范围、空间实体类 型型、26 / 31 空间关系分类、属 性性特征分类等方面的完 整整性。 一般来说,空 间间范围越大,数据的完 整整性就越差。在土地信 息息系统的建库过程中, 数数据不完整最简单的例 子子是缺少数据。如计算 机机从 GPS接收机传输 位位置数据时,由于软件 受受干扰或其它因素的缘 故故,只记录下经度而丢 失失纬度,以至造成数据 不不完整。另外由于 GPS 接收机无法收到四颗 或或更多的卫星信号而无 法法计算高程数据也会造 成成数据的不完整。又如 某某个应用项目需要 1:55000 的基础底图, 但但现在的地图数据只覆 盖盖项目区的一部分,底 图图数据便不完整。 在 土土地信息系统底建库中 ,涉及大量的地籍档案 。地籍档案来源于土管 机机关的地籍部门,数量 大大、形式多、浩繁、零 乱乱,随着时间地推移, 以以及人为和 自然 的 各各种因素地影响,有可 能能遭到损坏。如档案老 化化,书写材料低劣、地 籍籍档案变到污染,变色 、虫蛀等现象,进而影 响响到整个系统的质量。 、数据的现势性 数 据据的现势指数据反映客 观观现象 目前 状况的 程程度。数据的现势差, 反反映的客观现象就可能 不不准确 。不同现象的变 化化频率是不同的。如地 形形的变化一般来说比人 类类建设要缓慢,地形可 能能会由于山崩、雪崩、 泥泥石流、人工挖掘及填 海海等原因而在局部区域 改改变。但由于地图制作 周周期较长,局部27 / 31 的变化 往往往不能及时地反映在 地地形图上,对那些变化 较较快的地区,地形图就 失失去了现势性。城市地 区区土地覆盖变化较快, 这这类地区土地覆盖图的 现现势性就比 发展 较 慢慢的 农村 地区会差 些些。地形图上记录着所 用用航空像片获得的年代 。若又用其他数据进行 过过修改 (一般是较新的 航航空像片 ),也应记录 于于上。 在土地信息系 统统建库中,要 求地籍信 息息和地籍图必须具有现 势势性。地籍信息变更比 较较频繁,如土地利用类 型型,权属或宗地的重划 ,合并等。由于受自然 因因素和人为作用的影响 ,土地资源的数量、质 量量、分布和使用情况都 处处在经常变化之中。基 于于这一特点,土地管理 部部门提供的数据很难保 证证现势性,这也是影响 数数据质量的一个重要方 面面。转贴于论文联盟 h ttp:/ 、拓 扑扑关系 在 LIS中, 为为了真实地反映地理实 体体,不仅要包括实体的 位位置、形状、大小和属 性性,还包括必须反映实 体体之间的相互关系,这 些些关系就是指它们之间 的的邻接关系,关联关 系 和和包含关系,拓扑关系 。拓扑关系的核心是建 立立点、线、面的关联关 系系。通常有以下几种空 间间关系:点 -点关系、 点点 -线关系、点 -面关 系系、线 -线关系、线 -面面关系、面 -面关系。 空空间数据的拓扑关系, 对对数据处理和空
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉语拼音教学课件模板
- 教学课件游戏机教程下载
- 2025年土壤污染修复技术对土壤微生物群落的影响报告
- 2025年新能源安全生产标准化建设与安全生产标准化创新发展报告
- 学前教育学期末模拟考试练习题及答案
- 玩具送回家小班教学课件
- 第18课 辛亥革命说课教学设计-2024-2025学年高中历史统编版(2019)必修中外历史纲要上册
- 安全教育平台作业答案【安全培训考试题及答案】
- 2025年事业单位考试时事政治50题及答案
- 消费与零售:2025年新零售背景下食品饮料行业发展趋势研究
- 2025年科研项目经理专业知识考试题目答案解析
- 2025广东肇庆市怀集县卫生事业单位招聘102人笔试模拟试题及答案解析
- 青马考试题目及答案
- 2024-2025学年广东省深圳市南山区四年级(下)期末数学试卷
- 算力中心计算任务优化方案
- 劳务派遣工作知识培训课件
- AutoCAD电气工程制图 课件 项目1 低压配电柜的绘制与识图
- 无人机反制设备原理课件
- 北京市2025年普通高中学业水平等级性考试政治试题(解析版)
- 2025年村干部考试试题(含答案)
- 新华书店招聘面试题库全攻略:行业知识、技能与面试技巧
评论
0/150
提交评论