




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
江西财经大学信息管理学院沈波 1 第6章信息资源组织与存储 2 信息资源的组织与存储 信息描述信息揭示信息资源的组织方法信息资源索引系统的建立 3 信息描述 信息描述 informationdescription 是根据一定的描述规则和技术标准 对信息的外在特征和部分内容特征进行分析 选择和记录的过程 一种初级的信息组形式 4 信息描述的程序 查重 描述 复核并输入系统 文献的著录 文献的著录 文献的著录 8 信息描述规范 中文书刊名称汉语拼音拼写法 GB3259 82 检索期刊条目著录规则 GB3803 83 文献著录总则 GB3792 1 83 GB T3792 1 2009 普通图书著录规则 GB3792 2 85 连续出版物著录规则 GB3792 3 85 非书资料著录规则 GB3792 4 85 档案著录规则 GB3792 5 85 地图资料著录规则 GB3792 6 86 古籍著录规则 GB3792 7 87 文后参考文献著录规则 GB7714 84 GB7714 2005 9 信息描述规范 文本编码倡议 TextEncodedInitiative 简称TEI 都柏林核心集 DublinCore 简称DC 政府信息定位服务 GovernmentInformationlocatorService 简称GILS 联合地理数据委员会的数字地球空间元数据 ContentstandardDigitalGeospatialMetadata 简称CSDGM 可视资源核心范畴 CoreCategoriesforVisualResources 简称CCVR 编码档案描述 EncodedArchivalDescription 简称EAD 博物馆信息的计算机交换 ComputerInterchangeofMuseurnInformation 简称CIMI 10 文献著录总则 11 传统文献的描述著录 著录 依据一定的规则 对文献外表形式 物质形态和内容特征进行分析 选择和记录的过程 其结果为款目 著录项目图书外表的文字记载 书名 责任者 出版发行情况图书的物质形态 页数 图 尺寸 开本 装订 附件 12 著录项目 ISBD InternationalstandardBibliographicDescription国际标准书目著录 ISBD G 的八大著录项目题名与责任者说明项版本项材料或出版类型特殊细节项出版发行项载体形态项丛编项附注项文献标准号及获得方式项 13 ISBD文献描述格式 正题名 并列题目 副题名及说明题名文字 第一责任者 其他责任者 版次及其他版本形式 与本版有关的责任者 文献特殊细节 出版发行地 出版发行者 出版发行年 印刷地 印刷者 印刷日期 页数或卷册数 图 尺寸或开本 附件 丛编名 负责者 国际标准连续出版物编号 从编编号附属从编 附注国际标准书号 中国标准书号 装订 获得方式提要 题目 责任者 主题词 分类号 14 ISBD中文信息描述 专著 实例 乱世佳人 Gonewiththewind 美 米切尔 Mitchell M 著 黄怀仁 朱攸若译 杭州 浙江文艺出版社 1991 41034页 20cm本书另有译名 飘ISBN7 539 0367 6 10 70 乱 米 Mitchell 黄 朱 长篇小说 I712 45 15 AACR2 1978 theAnglo AmericanCataloguingRules 2组成著录 书目描述 对各种文献的著录格式规定 依据ISBD标目 统一书名和参照 对著录标目的选择 个人和团体标目 地理名称 统一书目作了规定 数字信息资源的描述 关于数据的数据 或关于数据的结构化的数据 早期主要指网络资源的描述数据 用于网络信息资源的组织 目前 实际用于各种类型信息资源的描述记录 元数据 Metadata 什么是元数据 例如 在一个大型的医疗卫生机构 拥有一个专门的数据资料管理机构 来统一管理各类需要提交和归档的数据资料 这些要统一入库归档的数据各不相同 从数据内容来看 可能有管理类 业务类和科学研究类 从学科来看 可能有基础医学 临床医学 预防医学等等 从存储类型来看 可能有DBase EXCEL 文本文件等等 总之 内容 结构 数据量 介质各不相同 当我拿着自己的数据光盘去入库归档的时候 管理员要求我填写一张关于要入库数据的表格 以便于管理和查阅 填好这张关于要入库光盘的表格 就是这张光盘中数据的元数据 而这一张表格所规定的要填写的内容 以及填写规定 就可以看作是这个单位内部的 元数据标准 这张表格每填写好一张 就可以录入成为元数据库中的一条元数据记录 我们把这张表格中所规定填写的项目 作为一个一个的属性字段 可以建立一个关于元数据的数据库 就是元数据库 这时候 这张 表格 上规定的内容 以及关于填写的一些规定 就可以看作是 医药卫生科学数据共享网元数据标准 对医药卫生科学数据共享网来说 针对每一个共享数据集 都要以元数据著录的形式来 填写 一张这样的 表格 网络信息资源描述的相关标准 文本编码倡议 TextEncodedInitiative 简称TEI 都柏林核心集 DublinCore 简称DC 政府信息定位服务 GovernmentInformationLocatorService 简称GILS 联合地理数据委员会的数字地球空间元数据 ContentStandardDigitalGeospatialMetadata 简称CSDGM 可视资源核心范畴 CoreCategoriesforVisualResources 简称CCVR 编码档案描述 EncodedArchivalDescription 简称EDA 博物馆信息的计算机交换 ComputerInterchangeofMuseumInformation 简称CIMI 22 中文元数据标准 中国国家图书馆 中文核心元数据集22个元素名称 主题 版本 内容摘要 内容类型 语种 内容覆盖范围 内容创建者 其他责任者 内容创建日期 出版 出版所有者 资源标识符 版权说明 数字资源制作者 数字资源制作日期 数字资源制作地 权限声明 公开对象 操作许可 许可行为 许可协议 其中包括了DC的大部分元素 该方案的特点是数据元素由描述 结构 管理3种元数据类型组成 并支持数字资源的保持和检索利用 23 MARC 机器可读目录 MachineReadableCatalogue以编码形式和特定结构记录在计算机存储载体上的 由计算机程序自动控制 处理与编辑输出的目录 CNMARC是中国机读目录 ChinaMachine ReadableCatalogue 1992年2月正式出版 中国机读目录通讯格式 即CN MARC 24 CNMARC CNMARC基本字段介绍中文 普通 图书CN MARC著录格式分类 默认栏目标识块指示符文字数据头标区无标识字段号 指示符 子字段标识符 定长24个字符001记录标识号010 aISBN号 b装订方式 d获得方式和 或定价 z错误的ISBN号100 a通用处理数据 定长36个字符1010 a正文语种 b中间语种 c原作语种102 a出版或制作国 b出版地区105 a图书编码数据106 a文字资料代码 物理形态标志 25 CNMARC CNMARC基本字段介绍2001 a正题名 b一般资料标识 c另一作者的正题名 d并列题名 e副题名及其他说明题名的文字 f第一责任者 g其它责任者 h分册 辑 号 i分册 辑 名 v卷册号标识 z并列题名语种 9正题名汉语拼音205 a版本说明210 a出版 发行地 c出版 发行者名称 d出版 发行日期215 a类型标识和文献的数量及单位 c其它形态细节 d尺寸或开本 e附件225 a正丛编题名 d并列丛编题名 e丛编副题名及其它信息 f丛编责任者 h分册 辑 号 i分册 辑 题名300 a一般附注内容327 a内容附注内容461用来连接本著录实体所从属的丛编的有关数据 设子字段 1606 a主标目 x主题复分 y地区复分 z年代复分690 a分类号 v版次7010或1 a人名 等同责任者款目要素 b名称的其它部分 不包括款目要素 4著作责任 9款目要素汉语拼音7020或1 a人名 次要责任者款目要素 b名称的其它部分 不包括款目要素 4著作责任 9款目要素汉语拼音7110或1 a团体名称 等同责任者款目要素 4著作责任 9款目要素汉语拼音7120或1 a团体名称 次要责任者款目要素 4著作责任 9款目要素汉语拼音801 a国家代码 b机构名称代码 c处理日期905 a收藏馆代码 b登录号 d分类号 e书次 种次号 f复本数 v入藏卷期 y年代范围 26 CNMARC 27 MODS 元数据描述对象模式 MetadataObjectDescriptionSchema2002 6美国国会图书馆 采用XML描述书目数据MODS有20个元素 包括TitleInfo 题名信息 Name 名称 TypeofResource 资源类型 Genre 体裁形式 OriginInfo 出版信息 Language 语种 PhysicalDescription 载体形态描述 Abstract 文摘 TableofContents 目次 TargetAudience 目标读者 Note 附注 Subject 主题 Classification 分类 RelatedItem 相关文献 Identifier 标识符 Location 馆藏位置 AccessCondition 获取条件 Part 部 Extension 扩展 RecordInfo 记录信息 每个元素又具有数量不等的子元素 并采用W3C的XMLSchema语言来表达主元素 子元素以及它们的属性 MODS优点 适合用于描述各种较复杂的数字化资源 28 MODS RDF XML RDF ResourceDescriptionFramework RDF是第一个有关构建语义网络的推荐标准 它提供了一种技术标准来描述Web上的词汇 编码和元数据 Metadata 并建立这些对象与Web上丰富资源之间的联系 RDF于1999年2月发布 至今仍是最重要的语义Web方面的技术标准 也是其他技术的基础之一 RDF XML W3C WorldWideWebConsortium W3C理事会或万维网联盟 W3C于1994年10月在麻省理工学院计算机科学实验室成立 创建者是万维网的发明者TimBerners Lee 是对网络标准制定的一个非赢利组织 像HTML XHTML CSS XML的标准就是由W3C来定制 基于W3C的组织原则和工作宗旨 以及Web的实际应用情况 W3C提出了其长远目标 包括3个方面的内容 分别是 建立一个普遍的 全社会易于使用的公共网络环境 Web上的语义可管理和正确使用 Web应该是安全可信的 31 RDF 万维网联盟W3C1997 10RDF资源描述框架 ResourcesDescriptiononFrameworkRDF是一个用于描述Web上的资源的框架RDF提供了针对数据的模型以及语法 这样独立的团体们就可以交换和使用它RDF被设计为可被计算机阅读和理解RDF被设计的目的不是为了向人们显示出来RDF使用XML编写RDF是W3C语义网络活动的组成部分RDF是一个W3C推荐标准 32 RDF 应用举例 描述购物项目的属性 比如价格以及可用性描述Web事件的时间表描述有关网页的信息 比如内容 作者以及被创建和修改的日期描述网络图片的内容和等级描述针对搜索引擎的内容描述电子图书馆 33 RDF规则 RDF使用Web标识符来标识事物 并通过属性和属性值来描述资源 资源是可拥有URI的任何事物 比如 34 RDF示例 35 RDF示例 36 XML eXtensibleMarkupLanguage 简称XML 可扩展标记语言 通过此种标记 计算机之间可以处理包含各种信息的文章等 组成模式Schema可扩展样式语言XSL可扩展链接语言XLL 37 XML示例 1 simple xml 38 XML示例 2 simple xsl 39 XML示例 3 simplexsl xml 40 5 2信息揭示 信息揭示是信息组织的中级形式 对信息的内容特征进行深层揭示并转换成主题标识 形成一个科学的逻辑概念标识系统 5 2 1信息主题5 2 2信息揭示的一般程序5 2 3信息标引 41 5 2 1信息主题 主题 文献主题标引规则 GB T3860 2009 文献所具体论述与研究的对象和问题ISO5963 1985 E 表达文献中心论题的一个概念或若干个概念的组合主题 指一个具体信息实体所介绍 论述 研究 说明 表现的对象或问题 42 信息主题结构 文献主题标引规则 构成主题的因素主体因素 研究对象 方面因素或限定因素 成分 材料 方法 过程 条件 状态 尺度 性质 空间因素时间因素文献类型 43 信息主题的类型 44 5 2 2信息揭示的一般程序 主题分析 主题概念转换主题分析 通过审读文献而了解文献内容及其表现形式 选择内容单元而确定文献主题数量 概括单元内容形成主题概念 分析主题的结构和类型 并在必要时判断主题的学科专业属性的一种智力劳动 主题概念转换 将主题分析的结果归入分类体系中相应的门类 45 5 2 3信息标引 也称文献标引 是信息揭示的最主要手段 是根据文献的特征 赋予文献检索标识的过程 信息标引 46 tf idf加权示例 47 tf idf加权示例 续 信息组织方法 1 信息组织 是让信息有序化2 基本方法 按照文献的外部特征来组织信息引用法索引法目录法用按文献的内容特征来组织信息分类法主题法文摘法 49 5 3信息资源的组织方法 语法信息组织方法字顺组织法代码组织法地序组织法时序组织法语用信息组织方法分类组织法主题组织法语义信息组织方法权值组织法概率组织法 50 文献实体型信息资源的组织方法 分类组织语言体系分类法组配分类法主题组织语言标题法单元词法叙词法关键词法 等级列举式分类法 是将所有的类目组成一个等级系统 一般的是等级式树状结构 最终形成一个比较完整的等级链 举例 I文学I0文学理论I0 02文学的哲学基础I0 03文学的方法论I0 05文学与其他科学的关系I01文艺美学I02文学理论的基本问题I021文学的民族化 大众化I022文学与现实生活I023文学的普及与提高I024内容与形式I025典型与形象I026文学遗产的批判继承I03文艺工作者 医药 卫生 工业技术 社会科学 自然科学 机械 仪表 综合 一般工业技术 矿业工程 无线电 电子学 电讯技术 自动化计算 化学工业 轻工业 手工业 金属学 动力工程 原子能技术 电工技术 水利工程 中图法展开图 石油 冶金工业 武器工业 建筑科学 R S 农业科学 T 分类法 线分类法 线分类法的典型案例国家标准有 中华人民共和国行政区划代码 GB T2260 1999 以下为河北省部分案例 其他案例 国民经济行业分类与代码 GB T4754 1994 和 职业分类与代码 GB T6565 1999 分类法 面分类法 面分类法的典型案例某高校教师分类编码 分类法 混合分类法 1 混合分类法的基本思想用线分类法为主形成的分类体系中有些部分需要采用面分类法 用面分类法为主形成的分类体系中也存在部分用线分类法定义的类目 这种分类方法称为混合分类法 2 案例 上述教师的面分类体系中的从事专业 又可以分为学科门类 如管理学 工学等 学科门类下设若干一级学科 每个一级学科一般设有若干二级学科 这样 从事专业这一面可按线分类法分成学科门类 一级学科 二级学科三个层次 如表2 3所示 其中 一级学科用三位数字表示 二级学科用两位数字表示 一 二级学科之间用点隔开 网络信息资源组织模式 1 文件方式文件方式常作为网络信息资源管理的辅助形式 作为其他信息组织方式的补充 FTP以文件目录的形式来组织信息资源 2 数据库方式将所有已获得的网络信息资源以固定的记录格式存储 用户通过关键词及其主配查询 就可以找到所需要的信息线索 并通过信息线索直接连接到相应的网络信息资源 数据库组织方式原理图 服务器 结构化查询 检索结果 输入检索式 数据库 检索结果 启动相应的应用程序 包括相应的ISAPI CGI ASP等应用程序 浏览 执行SQL查询 3 主题树方式信息资源按照某种事先确定的概念体系结构 分门别类地逐层加以组织 用户通过浏览的方式逐层加以选择 层层遍历 直至找到所需要的信息线索 并通过信息线索直接找到相应的网络信息资源 Yahoo 等门户网站 网络信息资源的组织方法 语言组织方法分类组织方法主题组织方法元数据组织方法本体组织方法自由分类法 60 79 Folksonomy Tag 自由分类法的内涵与发展 自由分类法是用户自发的用标签 Tag 对感兴趣的资料进行分类 并与他人共享标签的过程和结果 2005年初 自由分类法作为一种由用户参与和主导的信息组织方式 在Yahoo等门户网站迅速流行 成为与TheLongTail RSS blog Ajax Podcast一样众人关注的焦点 也预示元数据新的应用模式 自由分类法 Folksonomy 是由Folks和Taxonomy组合而来 Folks在英文中是比较口语化的词 表示一群人 一伙人的意思 Taxonomy则是指分类法 它是信息构架 InformationArchitecture 中一个重要部分 而Folksonomy是指 群众 自发性定义的平面非等级标签分类 称为 自由分类法 或 通俗分类法 还有人称之为 大众分类法 民俗分类法 Folksonomy简单理解这个概念就是Tags 标签 Folksonomy就是由网络信息用户自发为某类信息定义一组标签进行描述 并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法 例子 举一个简单例子 当我们在收藏S时 自定义了 门户 中国 新闻 这3个关键词作为标签 而其他人在收藏S时也自定义了自己的关键词作为标签 而最后系统统计出来使用 门户 中国 新闻 这个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年绿色建筑改造项目劳务中介服务合同
- 2025社区亲子早教活动合作项目合同
- 禁摩公务员面试题及答案
- 中央空调采购及安装合同
- 2025年文化遗产数字化保护与利用中的文化自信提升报告
- 招聘业务培训课件
- 2025年学前教育信息化在幼儿数学思维训练中的应用研究报告
- 绿色建筑在室内应用发展-洞察及研究
- 消除三病知识培训内容课件
- 消防队员应急知识培训课件
- 三支一扶培训
- 2025年中国儿童游乐设施产业深度调研与投资机遇研究报告
- 新生儿42天体检要点解析
- 2025年园林绿化养护管理方案范本(四)
- 煤矿联网课题题目及答案
- 2025内蒙古巴彦淖尔市能源(集团)有限公司招聘48人笔试参考题库附带答案详解析集合
- T/CASTEM 1007-2022技术经理人能力评价规范
- 初中七年级数学备课组科研合作计划
- 《人工智能应用基础》 完整课件(共十个模块-上)
- 职业技术学院旅游管理专业《旅行社经营与管理》课程标准
- 奶茶店股份合作合同协议
评论
0/150
提交评论