CIDP14公共文化信息资源的组织.ppt_第1页
CIDP14公共文化信息资源的组织.ppt_第2页
CIDP14公共文化信息资源的组织.ppt_第3页
CIDP14公共文化信息资源的组织.ppt_第4页
CIDP14公共文化信息资源的组织.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第6讲 文化信息资源的组织,时间: 1月11日 14:0016:00 地点: A306,文化产业管理专业文化信息资源开发规划课程,内容,信息资源组织原理 信息资源的描述与揭示 网络信息资源的组织,1.信息资源组织原理,信息组织也称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。,1.信息资源组织原理,信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,如信息载体的物理形态、题名、作者、出版或发表日期、流通或传播的标记等方面的特征。 信息的内容特征就是信息包含的内容,

2、它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。,1.信息资源组织原理,(1).信息选择:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,是信息组织过程的第一步。 (2).信息分析:按照一定的逻辑关系从语法、语义和语用上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。 (3)信息描述与揭示:也称为信息资源描述,根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。 (4).信息存贮:将经过加工整理序化后的信息按照一定的格式和顺序存贮在特定的载体中的一种信息活动。,1.信息

3、资源组织原理,信息组织的类型: (1)按信息表现形式划分 文字信息组织 图像信息组织 声音信息组织 视频信息组织 (2)按信息的加工程度划分 一次信息组织 二次信息组织 三次信息组织,1.信息资源组织原理,(3)按信息的传播载体划分 文献信息源 非文献信息源 在这里,非文献信息源特指网络环境下没有以传统文献载体形式出现的信息源,如程序代码、网页、超文本等。为了学习的方便,我们统称为网络信息源。,1.信息资源组织原理,1.元数据的概念: 元数据(metadata)是关于数据的数据(data about data),是专门用来描述数据的特征和属性,描述和组织信息资源,发现信息资源的语言和工具。 2

4、.元数据的描述对象: 早期:元数据主要指网络资源的描述数据 后来:逐步扩大到各种以电子形式存在的信息资源的描述数据。 现在:元数据适用于各种类型信息资源的描述记录。,1.信息资源组织原理,元数据的基本功能 (1)识别。确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。 (2)定位。提供信息资源位置的信息,以便用户访问时使用。 (3)检索。通过在描述数据中提供检索点,便于用户对资源的检索和利用。 (4)选择。通过记录信息资源的特征,诸如主题、作者、类型、物理形式、层次和日期等,供用户对信息资源的使用价值进行判断,决定是否使用该资源。,2.信息资源的描述与揭示,1.文献信息

5、的著录 (1)著录的基本概念: 著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。 款目:著录的结果是款目,它是反映文献内容和形式特征的 著录项目 的组合。 目录:将一批款目按照一定的次序编排而成的一种文献报道和检索工具。,2.信息资源的描述与揭示,(2)著录的标准化:在国家或国际范围内,对文献著录的原则、内容、格式等做出具有一定约束力的规范。 国际:1971年,国际图书馆协会联合会(IFLA),单行著作国际标准书目著录ISBD(M); 1976年,出版了国际标准数目著录总则ISBD(G)。中国:1983年7月,正式发表了全国文献著录标准系列中的文献著录总则(GB37

6、92.183),其后,先后出版了各个分则。,2.信息资源的描述与揭示,文献信息的标引 (1)标引的基本概念: 信息标引:指分析信息的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予信息检索标识的过程。 标引语言:表达信息主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统。,2.信息资源的描述与揭示,信息标引包括主题分析和转换标识两个环节。 主题分析:在了解和确定信息的内容属性以及帮助揭示内容的某些外表属性之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系。 转换标识:用专门的主题概念或概念因素,构成一定形式的检

7、索标识。,2.信息资源的描述与揭示,(2)标引的两种主要类型: 分类标引:采用分类语言的标引。 分类语言用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间的关系。 主题标引:采用主题语言的标引。 主题语言是一种由受控的自然语言语词直接表达主题概念,按语词字顺排列主题,主要用参照显示概念之间关系的标引语言。,2.信息资源的描述与揭示,20世纪80、90年代诞生的大量规范: 文本编码倡议(Text Encoded Initiative,简称TEI) 都柏林核心集(Dublin Core,简称DC) 政府信息定位服务(Government Info

8、rmation Locator Service,简称 GILS) 多媒体内容描述接口 (Multimedia Content Description Interface,简称MPEG-7),2.信息资源的描述与揭示,1.Machine Readable Catalogue:MARC标准; 起源:美国国会图书馆,1965年提出了“标准机器可读目录记录款式的建议”,即MARC 。1967年MARC 诞生。 特点: 共有001999个字段,其中999字段为用户自定义字段;字段内容著录详尽,字段下又设子字段以及重复字段;字段作用强化,可检索的字段多 每条MARC记录可分为头标区、目次区和数据区。,2.

9、信息资源的描述与揭示,(1)USMARC(美国国会图书馆机读目录通信格式) 在1995年,美国NDLP启动,对USMARC做了一些修改:增加了“电子资源地址与存取”字段即856字段。 (2)UNIMARC(国际机读目录通信格式) (3)CNMARC(中国机读目录格式),2.信息资源的描述与揭示,2. Dublin Core(都柏林核心集) (1)起源于1995年在美国俄亥俄州都柏林市召开的元数据讲习班。目前,已得到广泛的承认和应用,成为国际RFC2413和美国Z39.85标准。( ) (2)作用:为描述网络资源提供了一种规范。 (3)15个核心元素 DC

10、元数据有15个核心内容元素(element)。这15个元素组成了都柏林核心元数据元素集( Dublin Core Element Set)。,2.信息资源的描述与揭示,元素 名称 说明 Title 标题 资源标题 Subject 主题 资源内容的主题 Description 主题 关于资源的简要描述 Type 资源类别 资源的内容类别 Source 来源 产生该资源的其他资源 Relation 关联关系 与其他资源的关系 Coverage 覆盖范围 资源地理、时间或管理的范围,2.信息资源的描述与揭示,元素 名称 说明 Creator 创作者 资源内容的主要创作者 Contributor 其他

11、贡献者 对资源做出其他贡献的对象 Publisher 出版者 资源的提供、发表、出版者 Rights 权限 资源所属或管理的权限信息 Date 日期 资源生命周期中的特定日期 Format 资源格式 资源的格式 Language 语言 资源所使用的语言 Identifier 标识符 对资源进行标识的识别信息,2.信息资源的描述与揭示,(4)DC的主要优点: 简单易懂:15个元素通俗易懂 运用灵活:它即可以用于规范的资源描述,也可以用 于非专业领域 国际通用:目前已有10多种不同语言的版本 可扩展性:不仅有15个核心标记元素,子元素和扩展 元素,还可以与其他元数据连接使用,3.网络信息资源的组织

12、,网络信息的特点: 组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链甚至知识; 组织的范围从文献内、外特征深入到信息单元、知识单元; 组织的结果从静态的文本格式发展到动态的多模式的链接; 组织的形式从数据结构发展到知识表示。即要求信息组织的透明化、易用性; 组织的技术从手工单一发展到半自动化、自动化、智能化,即要求组织的标准化、兼容化。,3.网络信息资源的组织,文件方式 优点: (1)简单方便; (2)是存贮非结构化信息的天然单元。 缺点: (1)难以平衡网络负载与文件数量的关系; (2)不能充分地显示结构化信息之间的结构关系; (3)文件本身可看做信息单元,需要作为对象来管理。,3

13、.网络信息资源的组织,数据库方式 数据库组织方式:是将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索(即相关站点链接),并通过信息线索直接链接到相应的网络信息资源。,检索结果,结构化查询,检索结果,输入检索式,客户端,服务器,数据库,3.网络信息资源的组织,优点: (1)利用数据模型对信息进行了规范化处理,优化了数据的查询,提供一整套数据控制和操作的方法,利用信息项之间的联系进行信息的重组和查询,提高数据操作的灵活性; (2)数据的管理与应用程序完全分离,大大降低了网络传输的负载; (3)为多媒体信息、半结构化信息以及非结构化信息的组织提供

14、良方。,3.网络信息资源的组织,缺点: (1)不能提供数据信息之间的知识关联; 数据库组织方法是基于语用的组织,有严格的数据模型,单个数据项缺乏行为能力,所以难以显示信息单元的知识内容之间的语义关联。 (2)对用户和服务器端都提出了较高的要求。,3.网络信息资源的组织,主题树组织方式: 将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,并通过信息线索直接找到相应的网络信息资源。,3.网络信息资源的组织,优点: (1)简单易用,屏蔽了网络链接技术和资源获取技术对用户的复杂性,提供了一种基于树型的浏览方式、简单易用的信息检索和利用界面; (

15、2)信息检索按照一定的范畴分类体系,逐次查看,对用户而言,目的性强,查准率较高; (3)采用树型目录结构组织信息资源,具有良好的可扩充性和较严密的系统性。,3.网络信息资源的组织,缺点: (1)必须事先建立一套完整的范畴体系,用户对使用的范畴体系有一定的了解,增加用户的智力负担; (2)要保证主题树的结构清晰性和资源可用性,主题范畴体系的结构就不能过于复杂,每一类目下的信息检索条目不宜过多,这就降低了该方式所能容纳的信息资源的数量。,3.网络信息资源的组织,超媒体技术: 是超文本技术与多媒体技术的结合,它将文字、图像、声音、视频等多媒体信息以超文本的方式组织起来,用户通过高度超级链接的网络结构在各种信息库中航行,从而找到所需要的信息。,线性文本,多媒体,超文本,超媒体,加大表现力,加大表现力,引入网络结构,引入网络

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论