《信息组织第三章》PPT课件_第1页
《信息组织第三章》PPT课件_第2页
《信息组织第三章》PPT课件_第3页
《信息组织第三章》PPT课件_第4页
《信息组织第三章》PPT课件_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息组织第三章信息组织的技术标准,第一节,第二节,第三节,一、信息组织技术标准及意义1、信息组织技术标准的含义:2、信息组织技术标准的意义:3、数字信息资源组织的现状:4、首要任务:,第一节信息组织技术标准概述,1)标准:为在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件。该文件经过协商共同制定,并必须通过一个公认的机构批准2)标准化:在一定的范围内获得最佳秩序,对实际的或潜在的问题制定共同的和重复使用的规则活动的过程。包括制定、发布、实施标准的过程。3)标准化的实质和目的:实质是通过制定、发布和实施标准,达到统一;目的是获得最佳秩序和社会效益。4)技术标准:对标准化领域中需要协调统一的技术事项所制定的标准。,5)信息组织技术标准的定义:协调统一信息组织中涉及技术的标准。传统的标准侧重情报文献的编辑、出版、收集、著录、标引、数据加工、检索、交换、和传播流通等领域的标准的制定、实施。从计算机信息技术和传统文献信息管理的角度,都有许多国际和国家范围内的技术标准。网络环境下,须将两者联合、创新、发展,使其协调。)无论何时其信息组织的技术标准都是围绕信息或数据进行的,目的在于为描述和标引其内容特征和形式特征提供规范和统一。,1)是信息组织工作的基础。信息组织在信息管理活动中,起着承上启下的作用。其中标准的统一直接影响到资源库的质量和效果。2)执行有关标准才能保证信息组织的结果规范性和有效性。是信息资源共建共享的前提和根本保障,了解国际标准化组织情报文献工作标准化技术委员会(ISO/TC46),数字化信息资源的信息组织工作也要按照标准进行,并且是国际标准。当前数字信息资源组织的现状:元数据是网络信息的重要组成部分,但存在以下问题:1)没有统一的管理机构。2)各行业自定标准,导致标准太多。3)存在互不相容的标准。,面对数字信息资源的组织,要对元数据规范化、标准化,在众多标准中认定或制定一个国际通用的信息描述标准为好。如:DC数字档案馆建设过程中标准化的意义?,二、信息组织技术标准类型1、按标准研究对象范围分:1)基础标准:术语、符号等。2)产品标准:如镜像站点数据库标准。3)方法标准:建库时信息描述的标准。4)安全与环境保护类标准:与信息组织有关的标准是信息安全标准。2、传统文献信息工作的两个标准体系:1)ISO情报文献工作标准化委员会的技术委员会的体系。六类标准相互平行的体系2)我国情报文献工作技术标准体系。三个层次构成一个体系,3、国内外信息技术标准:计算机技术标准、电信技术标准、通讯技术标准等。计算机技术标准中有关于数据库的标准,如:中科院的“科学数据库核心元数据标准2.0版”、“科学数据库生态研究元数据标准1.1版”、“科学数据库大气数据元数据标准1.0版”、“科学数据库建库文档规范1.0版”与信息组织有关,但仅在全国范围内的中科院各研究所为管理信息或数据建库时使用。,4、以信息环境划分:1)传统信息资源组织的标准:没有过时,没有被取代,已成为国际通用的成熟标准。如ISBD、AACR2、MARC等2)网络信息组织标准:也称为信息编码标准,如一些信息描述的元数据。ISBD,MARC3)信息编码:为编码对象(指事物或概念)赋予有一定规律性的、易于计算机和人识别与处理的一个或一组有序的符号。如:MARC、DC、置标语言等。4)信息编码的目的:设定编码对象的惟一标识以提高信息处理的效率,便于信息的交流,实现信息资源的共享,促进信息的利用。,回目录,第二节传统信息组织的技术标准(包括著录标准和机读目录),一、著录标准1、国际标准书目著录(ISBD)标准:1)主要目的:使不同来源的数据交换成为可能;跨越语言障碍,帮助人们解释书目记录;使书目数据转化为电子格式更容易。2)组成:(54页的表)体系结构的特点:采取总则和分则相结合的方式;遵循客观描述的著录规则;明确规定了获取著录信息的来源;规定各个著录项目、著录单元项目的内容、次序以及著录用的标识符,2)方法:(56页的表、57页的解释)3)应用:(60页的举例)2、中国书目著录标准(卡片式)WORD文档),索书号著录标目.正题名一般类型标识=并列题名:其他题名信息/第一责任说明;其他责任说明.版本说明/与版本有关的责任说明.文献特殊细节项.出版地:出版者,出版年(印制地:印制者,印制年)登录号文献数量及其单位:图及其他形态细节;尺寸+附件.(丛编正题名=丛编并列题名:丛编其他题名信息/丛书责任说明,丛编的国际标准书号;丛编号.附属丛编名)附注项国际标准书号(附加说明):获得方式.书名.责任者.主题词.分类号,化工设备机械基础第一册,制图/化工设备机械基础编写组编2版,修订版北京:石油化学工业出版社,1978(西安:科学技术出版社,1988重印)182页;26cm+光盘北京:北京青苹果电子出版物公司,1988ISBN7-114-11316-X:RMB48.00化化,I207.41苏小妹三难新郎/四川人民出版社编成都:编S763者,1982153页;19cm(农村文化艺术小文库;第六辑古代白话小说丛书/人民文学出版社编,ISSN8891-2001;4)140511ISSN8891-2005:RMB16.00140512苏四白话小说-古代-中国-丛书I207.4,补充,二、机读目录:是以代码形式和特定格式结构记录在计算机存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。1、起源:1)历经6年。2)世界普及。2、MARC格式及其特点:1)字段设置:字段:是由字段标识符标识的被定义的字符串,可包含一个或多个子字段。子字段:字段内被定义的数据单位。设置内容:书目记录所需描述的、信息所有的内、外部特征。主要特点:字段数量多、字段内容详尽、字段作用强大。,2)标记符号:字段标识:用于识别各个字段的三位数字。从001999,第1位表示功能、第2位表示种类、第3位表示种类细分。子字段代码:由两个字符组成的代码,用以识别可变长字段中不同得子字段。第1位是$、第2位是字母或数字,如$a、$f、$1、$4。子段指示符:用以描述或指示可变长字段一些定义的的代码。子段和记录分隔符:一个字段或一个记录结束时的符号。,3)MARC总体结构的特点:记录格式既设置可变长子段又设置固定长字段。采用目次方式节省计算机进行数据值比较时间、提高处理速度。每条记录分4个区。物理记录和逻辑记录有交叉关系,经常出现一字块存放多个记录,或一记录被分存于两个或两个以上字块中的现象。物理记录是字块(每个字块长度是4096个字节)、逻辑记录是实际描述后形成的信息记录。,可变格式可变长字段的记录格式;,采用目次方式;,每条MARC记录分3个区:它们是头标区、目次区和数据区;(数据区又由控制区和可变区构成),物理记录和逻辑记录的关系。,MARC总体结构特点,3、几种主要的MARC格式:1)UNIMARC格式:定义。作用。格式。(71页)2)CNMARC格式:解释:中国机读目录格式。用途:用于中国国内图书情报部门和其他国家书目机构间的书目信息交换。与UNIMARC的关系:依据UNI.制定,又结合中国书目实际。设置:功能块、字段。(7475页)举例:(76页)其数据结构,CNMARC记录结构,不太清楚,参见WORD文档,记录头标区地址目次区数据字段区记录分隔符0标识块1代码信息块2著录块3附注块4款目连接块5相关题名块6主题分析块7知识责任块8国际使用块9国内使用块2052068215225230题版资载丛计名本料体编算与说特形说机责明殊态明文任字细说字件说段节明段特明说字征字明段字段字段段$a$c$d$e文献数量及其尺附单位子字段他寸件子子子段段段,实例,00100315189900520090326105819.0010a7-80702-358-9dCNY358.00(全16册)100a20060104d2006emy0chiy50ea1010achi102aCNb220000105ayz000yy106ar2001a奥林匹克全书b专著e奥林匹克运动竞赛项目f丁华民主编9chushijuexue210a长春c吉林文史出版社d20062252a中华典藏书系46101001003187127690aB821-49v47010a丁华民c(文学)4主编9linan905aTSGb0064143dGeD534.1头标区001003151899处理时间性00520090326105819.0ISBN010a7-80702-358-9dCNY358.00(全16册)处理数据100a20060104d2006emy0chiy50ea作品语种1010achi出版国别102aCNb220000编码数据105ayz000yy形态特征106ar题名责任2001a奥林匹克全书b专著e奥林匹克运动竞赛项目f丁华民主编9chushijuexue出版发行210a长春c吉林文史出版社d2006丛编项2252a中华典藏书系总集46101001003187127中图分类690aB821-49v4人名等同7010a丁华民c(文学)4主编9linan馆藏信息905aTSGb0064143dGeD534.1,CNMARC著录举例:(001)记录号:019922891记录状态:n记录类型:a书目级别:m层次等级代码:0010(ISBN):$a7-5037-1101-9$b$dRMB29.80(091)统一书号:(100)入档日期:19940927出版日期类型:d日期1:1978日期2:1988读者对象:em#政府出版物:y修改记录:0编目语种:chi正题名文种:ea,101著录语种:1#$achi(若译文$c)(106)文字资料的形态特征:r(110)内容特征:z会议文献:02001#$a化工设备机械基础$h第一册$i制图$f化工设备机械基础编写组编205#$a2版$b修订版210#$a北京$b石油化学工业出版社$d1978$e西安$g科学技术出版社$h1988215#$a182页$d26cm$e光盘(300#$a附有光盘),6060#$a化工设备$x设备机械6060#$a制图$x化工设备$x设备机械690#$aTQ05$v4版71102$a化工设备机械基础编写组$4编801#0$aCN$bhbu$e19940927$m$n905#$aCN$b理科库$dTQ05$eH123$h183622891,三、置标语言:形象的讲,是一种用来给文本添加标记的计算机语言。置标:就数据本身的信息对数据进行编码的方法。对于信息组织来说,置标语言是记载信息特征的工具。(一)标准通用置标语(SGML):1)定义:是一种通用的文档结构,主要用来定义文献模型的逻辑结构和物理结构。2)适用范围广泛,如书目、文献全文、电子文献、及多媒体信息。它使得信息的描述独立于系统、独立于语种、结构和内容分开,实现共建。但其本质不是用来描述信息的语言,而是一个标准,在此基础上再产生相关的标准。如xml,3)作用:定义文档模型的逻辑和物理结构。是适合各种信息进行描述的一种新的标准。使信息的描述独立于系统、语种,结构与内容分开以利信息共享。作为国际标准,为创建结构化、可交换的数据库提供了工具。可将来源不同的原始资料组装在同一个文件中。可利用文件格式定义文件结构、添加标记或验证电子文件是否遵循DTD所定义的结构。,4)性质:是元语言,即:可派生出其他置标语言。由三部分构成:语法定义、文件类型定义、和文件实例。,(二)超文本置标语言:1.需了解的知识点(共七个)1)性质:是SGML派生的一个实例置标语言,它的DTD(即它的元素集)作为标准被固定了下来。2)定义:是用来制作超文本文档的简单标记语言。适用于编制静态网页。3)HTML文档:用HTML编写的超文本文档。,4)作用:自1990年以来HTML就一直被用作Web上的信息标识语言,用于描述主页的格式设计和它与Web上其他主页的连接信息。5)文档识别:带有.html或.htm扩展名。,6)生成HTML文档的途径:在计算机上直接用熟悉的编辑工具编写。通过某些格式转换工具将文档转换成HTML格式文档。由Web服务器一方实施动态生成。7)工作方法:利用各种标记来标识文档的结构以及标识超链的信息。,2.HTML文档编写的有关问题:(1)HTML标记语法和文档结构:1)单标记:2)双标记:内容,如:TEXTTOEMPHASIZE3)标记属性:,例,4)文档结构:头部信息文档主体,(正文部分):(见讲义例),(2)新标记:1)TITLEBODY表示一个主页文件的总题名,一般出现在标题中。2)注释。3)TEXTH1是第一层标题,共有六层标题(H1至H6)。随着层次增加,字体依次减小。4)是一个单标记,表示在正文段落的当前位置换行。段落。,(3)其他功能的标记:1)物理意义上的标记(字体与颜色)粗体;斜体;定义长宽度字体。带有SIZE属性,属性值可取相对值,如:SIZE=“2”表示比当前字体大两号,SIZE=“-1”表示比当前字体小一号。也可取绝对值(默认值为3),如:SIZE=“4”,代表4号字体。上标字体。,2)逻辑意义上的标记:突出显示,但一般用斜体;重点突出显示;按地址类型显示;按代码类型显示;等等。(见讲义例),(4)超链接标记:需超链接的文本及图像,例:nextpage,触发超链既可连接。,(5)超链接中指向一个文件内某一特定位置的指针标记:超链文本及图像,例:AppendixA,在同一文件的其他处创建一个超链来指向附录部分:,AppendixA,触发超链,将显示附录部分。用超链标记将附录连到其他文件也可。实际用:TEXT6、图像、声音、视像和动画:1)图像标记:内嵌图像的单标记,表示为:(解释见85页)2)声音和图像:没有特殊标记,用超链标记链接带有声音文件、视像文件扩展名的目标文件即可。(解释见86页),作业:创建一个有超链接、有图像、并且有文字说明的个人主页。,(三)可扩展的置标语言(其目的是定义一种Internet交换信息的标准):1、XML、SGML与HTML:1)关系:XML与SGML:前者是后者的子集,但都是元语言。XML和HTML:XML有DTD、可做元语言,HTML没有此功能。SGML和HTML:后者是前者派生出来的实例语言。XML与HTML之间不是竞争关系而是互补关系。,2)开发XML是因HTML的有限性:无法描述数据内容,而这是数据查询必需的。不能描述矢量图形、科学符号等。不适应对新标记需求的发展。,XML的优势:1.可扩展方面(无限标记和属性)2.结构性方面(无限嵌套)3.可校验性方面,稍后再讲3)XML的功用:存储数据。形成结构化文档。存储矢量图形。描述多媒体演示。定义通道。描述软件包及其依赖的软件。在Web上的应用程序之间通信。发送电子商务卡。交换金融信息。创建、管理和使用复杂数字形式进行网络商业交易。,4)XML应用的新认识:网络环境下,异构数据库与数据库之间的信息搜索、抽取和查找这种信息集成,其可用性要求灵活的体系结构,包括开放性、可伸缩性和重用性等特点。新的应用需要统一数据访问,从异构系统中抽取信息,而这些系统都有自己特定的数据格式,因此,需要有一种技术来统一不同格式的数据,XML作为统一不同格式数据的技术,已被广泛应用于内容管理、应用集成、电子商务等领域,称为信息化的核心技术。,(四)有关XML的应用1、正确的XML文档结构(其他内容请大家见复印资料教材),2、通过文档类型声明创建有效XML文档:1)文档类型声明的格式:,例:,2)DTD中的元素定义语法:,例:是元素书籍的根元素定义语法。是名称,作者,价格多个元素的根元素定义语法,在XML文件中被限定了出现的顺序,并只能出现一次。,可以包含任意被设定过的元素,出现的次数和顺序也不受限制。例这个设定说明“书籍”标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论