文物基础数据库建设研究与探讨.docx_第1页
文物基础数据库建设研究与探讨.docx_第2页
文物基础数据库建设研究与探讨.docx_第3页
文物基础数据库建设研究与探讨.docx_第4页
文物基础数据库建设研究与探讨.docx_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文物基础数据库建设研究与探讨祝孔强( 中国文物信息咨询中心,国家文物局数据中心,北京 100029)摘要: 从文物特性、文物数据特征、文物数据库管理与应用要求等逐层递进分析,阐述了文物数据的特点和文物数据库设计的理念,进而概括文物数据库技术设计的内涵,结合信息化发展规划和信息技术特点,力图探讨文物博物 馆领域数据库建设技术上的思路、方法和内容。关键词: 文物; 数据; 数据库; 数据管理; 规划; 设计中图分类号: k875 /879文献标识码: a1 1 永久实用性文物是一定历史时期的社会产物,是人类在历 史发展过程中遗留下来的遗物、遗迹,故它又是凝固 的历史。文物数据表面上看来是对文物本身的描 述,实际上更是对文物这一特殊载体所蕴含信息的 描述。因此,可以说文物数据是永久有效并且具备 使用价值。文物信息具有不易变性,即所记录下来 的数据是不会轻易发生改变,对其数据库的建设而 言就是沉淀性,几乎可以说是一劳永逸3。不仅如 此,文物数据,尤其是描述文物本体的数据,永远不 会变成简单的档案,而是要一直有效应用于文物的 保护、管理等各项工作。随着时间推移、岁月更叠, 即使文物发生损毁,文物数据信息只会越积越多,而 且更显示其价值所在。比如某件文物消失了,那么 复原与研究工作只能依靠对其记录下来的信息了, 这也正是文物或者文化遗产数字化工作的重要性所 在。引言0文物,是人类创造的物质文化遗存和精神文化的物 化 遗 存。 故自地球上有了人类也就有了文 物1。文物是人类在历史发展过程中遗留下来的 遗物、遗迹。各类文物从不同的侧面反映了各个历 史时期人类的社会活动、社会关系、意识形态以及利 用自然、改造自然和当时生态环境的状况,是人类宝 贵的历史文化遗产2。从信息的特殊载体的角度 认识文物,文物本质上是作为一种特殊的信息载体 而存在。从这个角度出发,所谓对文物的保管、研究 和陈列,其实质就在于如何尽可能地保存与发掘文 物的所有已知的和未知的信息。因此,建立文物信 息资源是充分发挥文物价值的必要手段之一。根据 信息化的发展规律,如果要建立起完整、有效、实用 的文物信息资源,首先必须要开展文物数字化工作, 建立起文物数据库。因此,笔者就文物数据的规划 与设计谈一谈个人的思路与见解,希望与大家共同 探讨、交流。信息聚合性文物除了其固有的审美和艺术价值外,还蕴含 着丰富多彩的历史信息、科技信息、文化信息,对文 物的研究除了为更好保存其物质形态外,更重要的 是应把其放在人类知识所能了解的已逝年代的文化 背景下,去观察、探讨、诠释文物赖以产生和存在的 环境状态,解读它所承载的历史文明信息,进而认识 社会历史的真实及其沧桑变迁,从而揭示人类社会 发展的客观规律。基于这一因素,文物数据信息便 有了其聚合特性。一件文物的数据信息描述,不仅1 21文物数据特点分析文物数据包括文本数据、图片数据、流媒体数据等。与其他行业一样,文物数据是对文物这一实体 及其所关联信息的数字化记载。因此,文物数据具 备一般数据所共有的特点,如可复制性、可再生性、 可关联性等,但文物数据因其所描述、记录对象的特 殊性,又使其被赋予了独特的内涵和独有的特性。收稿日期: 2011 05 25; 修回日期: 2011 06 28作者简介: 祝孔强( 1974) ,男,1996 年郑州大学计算机科学专业毕业,副研究员,北京市朝阳区高原街甲 2 号文博大厦三层,e-mal:第 3 期祝孔强: 文物基础数据库建设研究与探讨17要描述这件文物本身,还会涉及与其所关联的社会、文化、政治、经济、人物、事件等诸多背景。比如,浙 江省博物馆存放着一把越王勾践的剑。这是一件珍 贵文物,这把剑的数据记录就可能要涉及春秋战国 这一时代、吴越两国的政治与军事斗争、夫差与勾践 的恩怨情仇,甚至“卧薪尝胆”这一大家耳熟能详的 成语典故等。即使在现代社会,一件文物的借展、出 境、研究等都会产生诸多的关联信息。但所有这些 信息都将聚合到一点,那就是这件文物本体。实际计量也可以是三件文物。通过这种数据结构设计,实现一种保证应用需求的随机组合,达到数据管 理与业务管理的“分离”和“统一”相结合。2)面向应用的信息服务。信息服务是数字化管理的根本目的,应用是信息服务的灵魂。因此,所有的信息服务都必须是面向应用考虑的。文物数据 信息的现实应用比较广泛,政府决策、文化普及、知 识教育、科学研究、娱乐休闲等等方面都存在着对文 物信息的需求。而在不同的应用领域,所需要的文 物信息的内容和形式也截然不同。应该根据不同的 应用需求,结合面向对象数据管理的特点,随时组 合、定制不同的数据信息服务,充分发挥文物数据信 息的价值。这种信息服务的基础来自于原始数据, 信息服务是可变的,但原始数据是不变的。重点与难点分析鉴于文物数据的永久实用性与信息聚合性两个 抽象特点,也就不可避免地带来文物数据库的独特 性与复杂性。由于文物数据的永久性,文物数据库 的规模必然是无限扩张的,而且这种扩张不是简单 的存放,而是要实实在在提供应用; 由于文物数据的 聚合性,在文物数据库的规划与设计过程中,就必须 要充分考虑数据的关联与重用。不仅如此,由于文物是一种物化的载体,其范围 涉及物质的各个层面,记录文物的数据更是难以描 述穷尽。而对可移动文物的分类、命名、计件,对不 可移动文物的及其附属单体和藏品的关联描述等这 些文物博物馆领域的传统问题也为文物数据库的建 设与管理带来极大的困难。2数据库框架原型数据管理 文物数据作为信息的载体,是所3 23 2 1有应用的基础和功能的支撑,是数据管理的核心内容。根据文物数据的特点,可以概要地将文物数据 分为本体数据、管理数据和衍生数据。简要地说本 体数据是对文物本体的描述,管理数据是文物的保 护管理信息,衍生数据则是与文物有关的研究、应用 等扩展信息。文物数据库结构可以采用一种由内至 外、分层包裹的环球状( 类似洋葱) 结构设计,如图 1 如示。文物数据库的框架构想33 1 数据库规划理念综合分析文物的固有特性,并结合现代信息技 术的特点,着眼于“以资源为核心、以需求为导向、 以应用促发展”的数据管理原则,笔者建议文物数 据库规划设计不妨借鉴现代程序设计的思路,采用 一种“面向对象的数据管理”和“面向应用的信息服 务”。1)面向对象的数据管理。尽管文物是一个物图 1 数据库结构设计环状示意图fig 1 design of the database structure shown in ring shape化的遗存载体,其相互之间的关系可能涉及嵌套、包含、关联等,但在数字化世界我们可以统一将其视为 对象,对象实体就是一个既定的数据模型,所有的关 系都由这些对象的属性和方法去描述。这就避开了 文物业务工作中长期讨论不清的分类、命名、计件、 归属等复杂问题。比如一件有长把的铁锹,既有铁 质,又有木质,从类别上归为哪一类,当我们将其看 作一个对象后,它就同时具有两种属性,既可以按保 护性质分类,也可以按使用性质分类; 再比如一个茶 杯,包括杯盖、杯体、杯托三个组成部分,作为一个文 物对象处理后,按照传统计量可以是一件文物,按照该数据库结构设计越向内层数据指标项越少,表的数目也越少,越向外层数据指标项越多,表的数 目也越多,并可实现无限扩展。若将该结构从中间 切开并拉平填充,就变成如图 2 所示的按层级的分 类结构。通过该种结构设计体现如下特点:1)对不同文物数据实现统一的标识与管理,并在此基础上实现数据内容的无限扩展。2)根据不同的数据应用,深入到不同的层级。文物保护与考古科学第 23 卷18如主索引表集合统一存放文物( 包含可移动文物和不可移动文物) 的主要信息,这些信息是可移动和 不可移动文物所共有的。因此,对按照统一身份标识的文物数据检索只需深入主索引表层足够。但若检索某一文物所关联的政治、经济、文化等扩展信息 可能就需要深入外层表格。图 2 数据库结构设计层次示意图fig 2 design of the database structure shown in different level简单、易读,同时也易于由其他应用进行进一步的加工和处理。正是由于 xml 具有上述特点,所以 它正逐步成为在因特网环境中进行数据交换的标 准和中间介质。尽管 xml 为实现异构数据交换和 共享提供了可能,但还需要针对不同的已有系统 具体问题具体分析。可以通过在数据交换体系中,采用基于 xml 的 描述形式的交换标准,充分利用数据结构设计中文 物基本信息单元的唯一性标识的优点,实现不同操 作系统、不同数据库管理系统、不同业务系统之间的 数据交换。3 2 2数据交换 在文物数据库的管理与运行过程中,不可避免地要有数据共享与交换。数据交换的格式就成为研究的重要内容,需要设计一套简单 易行、灵活可靠、全面稳定的数据交换格式,来满足 各单位之间的文物信息交换需求。在此笔者建议尽量采用通用、简单的 数 据 交 换格式。基于 xml 方式实现的数据交换就是一个 不错的选择。 xml 目前在采用简单、柔性的标准 化格式表达和应用程序间交换数据方面具有很大 优势。其优点之一是使用户界面和结构化数据彼 此分离,允许不同来源、异构的数据无缝集成以及 对同一数据进行多种处理。 另外,xml 在数据描 述方面十分灵活,扩展性强,而且具有良好的结构 和约束机制; 数据经过 xml 的处理之后表达方式数据运行 根据文物数据的来源、管理和应3 2 3用特点,按照数据的加工作业流程,可将文物数据运行流程划分为数据、资源、信息、产品( 知识) 四个阶 段,如图 3 所示。图 3 文物数据资源流程图fig 3 process of heritage data resources原始的文物“数据”是最基础数据; 经过加工后的数据被看作“资源”,是一种可利用数据; 资源经 过整合后即为“信息”,是一种可发布数据; 信息经 过深度挖掘、综合分析后即变为“知识”; 同样,信息经过重新组合、演化为“再生数据”,就是我们平常所说的产品了。按照数据库管理与应用的常用处理方法,结合 文物数据资源的加工流程,按照文物的“数据资第 3 期祝孔强: 文物基础数据库建设研究与探讨19源信息产品( 知识) ”这一从低级到高级的整合萃取流程,文物数据库管理与运行体系总体上遵循 传统的数据层、功能层和应用层三层架构体系,如图4 所示。44 1设计内容标准体系标准规范体系是对文物数据进行采集、存储、管理、统计、分析的基础。结合工作实际,文物数据库管理与运行体系应涵盖两类标准:1)通用标准代码: 行政区划代码,包括国家地区代码、国内行政区划代码、国内区域分区代码和国内历史政区代码等; 业务系统代码,包括度量衡代 码、性别代码、党派代码、民族代码、学历代码、中国 语种代码等。2) 业务标准代码: 与文物管理业务紧密相关 的各类代码,包括文物通用业务代码、不可移动文物 业务代码、可移动文物业务代码、文物相关资料代码 等。上述所有标准数据代码都尽可能采用国际、国 内、行业相关的标准,以便于数据的共享和交换。4 2 数据资源目录数据库建设的核心是数据资源管理,是实现数 据接收、存储与发送的综合体系,是体现数据库管理 与运行体系职能的关键。数据资源目录体系是对数 据资源进行管理和维护的门户,数据资源目录的设 计是数据资源管理体系中的重中之重。结合文物数据资源的特点,可将文物数据资源 目录安排如下:图 4 数据运行平台技术架构示意图fig 4 technical architecture of the platform for data running在图 4 的 最 底 层,文物数据散落在外部,结构 杂 乱、缺 乏 规 划,且存在着大量的冗余和无效 信息,在 这 一 阶 段,文 物 信 息的存在形式 为“数 据”,它包含着有价值的信息,但基本上无法被直 接利用。数据层是数据资源的整合者,它通过数据交换、 数据清洗和标准化处理,将各类散乱的文物数据进 行统一整合,形成标准化的数据资源,从而向上提供 无差别的数据服务。在本层,文物信息的存在形式 可称作“资源”,它是标准的、有价值的数据信息,但 仍然处于原始的、静态的存在形式,还没有得到利 用。功能层内部包含多种支撑组件,其目的是利用 数据层提供的标准化数据,为文物数据的应用建设 提供一个高可靠性、稳定性、高扩展性和安全性的支 撑环境。在本层,文物信息的存在形式可称作“信 息”,它已经被利用起来,按一定的逻辑经过了加工 和处理,并实现了相应的功能,但这些功能都属于工 具性的支撑类功能,并没有和具体的业务应用或服 务结合起来。应用层是业务应用服务的提供者,它直接面向 用户,利用数据中心支撑平台提供的功能接口,实现 具体的业务功能。在本层,文物信息的存在形式被 称为“知识”或者“产品”,它已经和具体的业务应用 结合起来,为最终用户提供服务支撑,满足他们的原1)文物信息目录。采用文物通用的分类标准对文物数据进行分类,实现对文物数据资源进行分类浏览、导航、查询、导入导出、统计分析的门户。2) 专题信息目录。根据实际业务需要,方便、 灵活地设置文物专题系列,从专题视角对文物数据 资源进行重新组织、浏览和导航。如中小学历史教 育专题系列、体育专题系列、玉文化专题系列、华夏 图腾专题系列、汉唐雄风专题系列等等。3)信息发布目录。根据工作需要,结合文物系统的实际情况,将需要对外发布的数据资源通过信息发布目录进行组织和管理。4) 综合管理资源目录。对日常业务工作中涉 及到的其他数据资源进行分类管理和维护。包括数 据中心首页信息栏目、项目文档管理等综合内容。数据层设计数据层是数据库管理运行体系的基础,它按照 标准数据规范,将文物本体信息、文物相关管理信息 和其他基本信息进行统一整合,在元数据管理机制 的支持下,向上提供无差别的数据服务,供功能层使 用。数据层设计包括数据资源实体和元数据标准化4 3始需求。文物保护与考古科学第 23 卷20功能层建立在数据层的基础上,以支撑工具的方式实现数据应用方面所需要的逻辑功能,为 数据资源的具体应用提供一个可靠、稳 定、可 扩 展和安全 的 支 撑 环 境。 它 可 以 包括数据交换平 台、数 据 管 理 工 具、系统管理工具和决策分析工 具等主要 模 块。 下面重点介绍 数据交换平台和 数据管理工具。体系。1)数据资源实体。数据资源实体是根据文物的特点,将文物相关信息进行统一规划、统一整合而建设形成的数据库实体。它包括文物基础数据以及 系统基本信息等物理数据库,涵盖了文物信息的各 个方面,是用于文物信息深度开发利用的基础。2)元数据标准化体系。通过定义元数据资源规划,建立数据资源管理基础标准,定义主题数据库和基本表,使数据环境通过新的结构有质的提升,从 低级步入高级。然后,在细节方面,对基本表的结构 合理设计,充分考虑如何提高数据库的稳定性和减 少表中数据项的冗余问题。数据交换平台 数据交换平台原则上是通4 4 1过标准格式的文物信息数据交换基本单元和文物信息基本单元实现数据共享,并与其他业务系统交换 数据。提供数据交换平台工具,辅助其它方式的数 据交换。数据交换流程示意图如图 5 所示。功能层设计4 4图 5 数据交换平台数据交换流程示意图fig 5 process of data exchange on the data exchange platform资料,以及各业务标准对应的标准化文档、文物局对外发布的网页、文档材料和文物局日常管理工作中 涉及到的文档等等诸多内容。要通过全文检索功能 对其中的文本数据、网页数据、word 文档、pdf 文档 等常用文件进行快速、准确地查询。数据管理工具数据管理工作包括数据资4 4 2源目录管理、数据标准管理以及非结构化和结构化数据管理等部分。1) 数据资源目录管理。数据资源目录体系是 数据库运行体系的管理和服务中心,按照统一的标 准规范实现对数据资源的采集、分类、描述、处理、展 现、应用和管理,为分散异构的数据资源的共享和交 换提供基础性支撑,实现对数据资源的识别、导航和 定位服务,从而更加有效管理、利用和合理开发数据 资源,为提高工作效率、提升服务水平提供科学的工 具。4)结构化数据管理。提供通用的跨平台、跨数据库的数据库管理工具,对 sql server,oracle、db2、mysql 等多种数据库实现统一管理。要实现 管理员通过友好的图形化界面,方便地对各类数据 库进行全方位的操作。应用层设计应用层位于功能层之上,是利用功能层所提供 的逻辑支撑功能,构建面向需求的数据应用服务,满 足用户的业务需要。应用层的内容需要包括信息发 布、决策支持和其他辅助应用等部分。根据具体的 应用需要,还可以作必要的功能扩展。应用层的功4 52)数据标准管理。管理标准化代码体系,包括行政区划代码、通用标准代码、业务标准代码等,以便于数据共享和交换。3)非结构化数据管理。非结构化数据包括日常工作中涉及到文物相关文件材料、文献资料、声像第 3 期祝孔强: 文物基础数据库建设研究与探讨21能较为灵活多变,在此不再赘述。文物数据资源的来源渠道。6)加强国际交流,探索数据交换模式。加强数据采集采集数据是文物基础数据库建设的前提和保 障,但在实际工作过程中由于受资金、地域、管理机 制等诸多客观原因所限,往往很难顺利开展工作。 笔者建议结合文物博物馆行业的工作实际,可以通 过多种途径持续采集文物基础数据:5国际文物信息交流与合作,在保障安全稳妥的原则,探索文物数据资源交换模式,丰富文物数据资源类 型和覆盖范围。小结6文物数据库建设是一个长期积累的过程,不可能一蹴而就,也不可能一劳永逸,需要长期坚持不懈 地积累和完善。一个好的数据结构设计,会大大提 高数据管理的健壮性、实用性和可扩展性。笔者结 合在文物博物馆信息化领域的工作实践,在此提出 一个数据库框架设计的理念和方法,力图探讨文物 基础数据管理的科学模式。由于水平有限,文中难 免有不足甚至谬误之处,望读者给予批评指正,以期 共同研究、促进文物基础数据的科学管理。 参考文献:1 中国大百科全书编辑委员会 中国大百科全书 文物m第二 版 北京: 大百科全书出版社,2009the editorial committee of chinese encyclopedia chinese encyclo- pedia-heritage m 2nd ed beijing: chinese encyclopedia press2 吴诗池 文物学概论m 上海: 上海文艺出版社,2002wu shi-chi introduction of heritage m shanghai: shanghai lit- erature and art press,20023 王洪均 中国博物馆学基础m 上海世纪出版股份有限公司,上海古籍出版社,2001wang hong-jun the basis of museology in china m shang- hai: shanghai century publishing co ,ltd ,shanghai ancient books press,20014 张小朋 博物馆信息化建设的初步探讨j 智能建筑与城市信 息,2004,( 9) : 24-28zhang xiao-peng preliminary study of the construction of muse- um informatization j intel archit city inf,2004,( 9) : 24-281)依托重点工作,采集文物本体数据。依托本系统全面开展的重点项目和基础性工作,如第三次全国文物普查、国有可移动文物普查、长城资源调 查等,持续采集和更新各类可移动、不可移动文物本 体数据,建立并不断充实文物基础数据库。2) 结合行政管理,积累文物管理数据。通过 推进电子政务和网上办公,建设并运行统一的行政 审批管理平台,结合文物保护工程方案审批、考古发 掘电子审批、博物馆综合管理等行政管理工作的开 展,持续积累各类管理档案和资料数据。3)围绕课题项目,丰富文物专题数据。适应文化遗产科技与信息化建设的新形势、新需要,围绕文化遗产预警监测监管、中国数字博物馆工程等重 点项目建设,以及考古发掘现场信息采集、博物馆虚 拟展示等应用课题研究,积累高精度三维影像等文 物专题数据。加快数据资源建设专项的立项工作。4) 整理资料档案,实现文本数字化。系统整 理已有的各类业务档案、学术专著、专题出版物、照 片影像等资料,持续开展数字化录入工作,建立专题 资料数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论