




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息组织与分类编目 南京农业大学信息管理系刘磊llxx 2000 025 84396276 H SNS 人人网 QQ 2297370769 1 提纲 1 互联网的发展趋势2 网络环境下的信息组织与分类编目3 信息组织与分类编目的关系4 信息组织的基本任务 2 1 互联网的发展趋势 1 发展速度 主机 用户 网站 带宽 3 1 上网计算机数比较截至2007年底 我国上网计算机总数己达7800万台 与1997年10月相比 增长了260倍 2009年以后无总数统计 呈现出上网设备多元化 台式机 笔记本 手机 按网民数推算上网电脑应超过1 5亿台 2 上网用户人数比较截至2007年底 我国的互联网用户已经达到了2亿1千万 居世界第二位 2008年6月居世界第一 与1997年10月相比 增长了300多倍 占中国人口总数的16 2010年普及率达34 3 四项指标增长比较分析 4 3 WWW站点数比较截至2007年底 我国WWW站点数为1 500 000个 与1997年10月相比 WWW站点总数已是当初1400个的1000倍 2010年达1270多倍 4 国际出口带宽总容量比较截至2007年底 我国国际出口带宽的总容量为368 927M 是1997年第一次调查结果25 4M的14757倍 2010年达43956倍 上述指标中国际出口带宽增速最快 问题 为什么出口带宽增长速度高于其他指标 四项指标增长比较分析 续 5 1 社会原因 用户信息需求 市场导向 2 技术原因 IT四定律 摩尔定律 贝尔定律 吉尔德定律和麦特卡尔夫定律 3 经济原因 信息经济 电子商务 网络经济 数字经济 在IT四定律推动下兴起 2 互联网迅猛发展的原因 6 2003年6月Google搜索的网页为30亿个 而2004年11月 Google副总裁比尔 考兰宣布 Google数据库中网页已经超过80亿个 自2003年开始 中国网页基本保持翻番增长 2003年网页3亿个 2008年161亿个 2009年336亿个 比2008年增长了1倍多 比2003年增长了100倍多 2010年11月 新兴搜索引擎BlekkoCEO里奇 斯科伦塔表示 由于网页总量已经突破1万亿 垃圾信息也呈现加速增长态势 他还表示 我们将借助大规模的人工手段清理这类内容 从而推广 受信赖 的内容 3 网络环境下信息资源发展状况1 信息数量庞大且增长迅速 7 2 信息内容丰富 网络信息资源内容极为丰富 覆盖面广 涵盖了各学科各领域 且种类繁多 几乎无所不包 8 网络信息没有统一的管理机构和发布标准 且变化 更迭 新生 消亡等随时发生 质量良莠不齐 重复严重 我国重复网页比例达到25 左右 难以控制 3 信息质量差异增大 9 网络以超文本 超媒体 集成式地提供信息 除文本信息外 还有图表 图形 图象 声音 动画 视频等 提供了丰富的学习 娱乐功能 4 信息形式多样 10 5 信息交流方式多样 11 现代社会信息高度的分散无序性与人们利用信息的高度选择性形成了尖锐矛盾 信息组织通过人工和机器干预 使信息有序增值 形成信息资源 进而提供有效的利用 如搜索引擎谷歌和百度的发展 新兴搜索引擎Blekko对谷歌的挑战 又如雅虎用分类目录展开网络信息 图书馆为馆藏图书编制机读目录供用户查询 再如中国期刊网中的作者 关键词各种索引等 从这一角度看 信息组织可以说是信息管理的基本环节 是信息资源开发利用的基础 同时也是信息管理学科研究的核心内容 2 网络环境下的信息组织与分类编目 1 网络环境下信息组织的必要性 12 随着互联网的普及和升级 Web1 0 Web2 0 数字文本复制的便利和自由发表的可能性 使得信息数量急剧增加 但社会信息量的增长并不意味着用户获取信息的增长 恰恰相反 无序的信息不仅无助于信息的使用 反而会加剧信息增长与使用的矛盾 人们生动地称这种情况是 信息超载 知识缺乏 越来越多的人认识到 原始信息本身并不能产生价值 只有将其有效的组织 按特定的需要集中和揭示 才能产生价值 要有效开发利用信息资源 必须采用相应的方法加以控制和处理 信息组织是关键措施之一 1 网络环境下信息组织的必要性 续 13 2 信息组织的概念与目的 1 概念 信息组织亦称为信息资源组织 它是根据信息检索的需要 以文本及各种类型的信息源为对象 通过对其内容 特征等的分析 选择 标引 处理 方法 使其成为有序化集合的活动 2 目的 建立信息资源收藏系统和检索工具 方便人们对信息资源的开发利用 14 3 信息载体 媒体 对信息组织的意义 信息交流的方式 媒体 有口头方式 印刷方式 数字方式 以记录方式 硬载体依托 包括印刷型的纸张和数字型的硬盘 光盘 进行交流 有助于克服口语交流局限 便于进行信息的组织 15 4 信息源与文献的关系 信息源或信息体通常指一切记录形式存在的信息载体 只是更侧重于新型媒体形式的强调 因此广义上 文献与信息源 信息体是同义词或近义词 16 5 信息组织的过程 信息组织过程包括标引和描述 控制语言及规则称为信息组织的规范 这些规范既包括对信息源外部描述的规范 如文献编目规则及各种元数据如MARC 也包括对内容描述的检索语言 如各种文献分类表及其规则 各种规范的主题词表及其规则等 17 信息组织的各种形式 图书馆目录 18 19 20 2020 1 7 21 信息组织的各种形式 搜索引擎 22 23 24 25 1 任务 对原始信息源的记录 如图书的记录 网页的快照进行排列 直接组织原始信息本身 如对图书按一定方式排列 有题名排列法 分类排列法 固定排列法 如按时间顺序 等 2 类型 按检索工具的对象和特点划分类型A文献目录 B搜索引擎 C索引数据库等 按检索工具的标识特征划分类型A外部特征的信息组织 如依据著者名 题名 机构名等 B内部特征的信息组织 如依据分类号 主题词 C引证关系的信息组织 依据引用关系 如SCI对期刊论文的相互引用关系进行信息组织 6 信息组织的任务和类型 26 对原始信息进行描述 对外部特征和内部特征的记录 提供检索点 如外部特征的责任者名 题名 机构名等 如内部特征的分类号 主题词 对原始信息内容的浓缩 包括编写内容提要或文摘 7 信息组织的处理方式 27 1 信息组织与分类编目之间是总体与部分 扩展与基础的关系 信息组织既包括以印刷文献为主体的文献编目 分类标引和主题标引 也包括以网络信息为主体的网站 搜索引擎 数据库和数字图书馆等信息组织方法 2 网络环境下分类编目仍是信息组织的重要方法 网络资源指南如雅虎就借鉴了文献分类法的原理 而国外图书馆联机公共检索目录 OPAC OnlinePublicAccessCatalog 已经用于网络信息资源的检索 传统的分类编目和网络信息组织正在相互渗透 3 信息组织与分类编目的关系 28 所谓信息标引 亦称文献标引 是指主要分析信息的内容属性 并用某种检索语言 如分类号G203代表信息资源及管理 G202代表信息处理技术 用规范的主题词 如激光器代替莱塞 用番茄代替西红柿 表达分析出的属性或特征 从而赋予信息或文献检索标识的过程 这种方式的信息组织主要采用两类基本方法 分类法和主题法 4 信息组织的基本任务 1 信息标引 29 标引过程一般包括两个环节 一是主题分析 在了解和确定信息的内容属性之后 将这些属性概括为主题并用自然语言表述 同时分析主题概念之间或主题概念因素之间的结构关系 二是转换标识 即用专门的检索语言中的标识或语词表达概括信息 文献 内容的主题概念或概念因素 构成一定形式的检索标识 如对 西红柿病虫害防治 一书的主题标引为 番茄 病虫害 防治方法首先进行主题分析 本书主要谈的是西红柿病虫害及其防治方法 如用 汉语主题词表 进行主题标引 对内容分析后可直接从西红柿第一字 西 的汉语拼音xi去查西红柿 结果发现西红柿不是正式主题词 因此只能用它的学名 番茄 这个词去标引 按其标引规则其标引结果如上 2 信息标引过程 30 如果用 中国图书馆分类法 来进行分类标引的话 则在主题分析之后 将其标引为S436 412 番茄病虫害及其防治 分析过程如下 西红柿是一种农作物 因此在分类表中先找到S农业科学 一级类目 第二步考虑S农业科学下面有S1农业基础科学 S2农业工程 S3农学 S4植物保护等二级类目 依其内容应归入S4植物保护 然后在其下位类中发现S436园艺作物病虫害及防治 进一步找到S436 412 番茄病虫害及其防治 2 信息标引过程 31 主题法则是通过主题名称来揭示信息或文献内容并加以组织的方法 分类法是通过学科知识的分类体系来揭示信息或文献内容并加以组织的方法 两者相同之处 两者都是为揭示信息 文献 内容 都需要对信息文献进行主题分析 一般都使用预先编制的专门语言工具 主题词表或分类表 赋予的检索标识都是对信息文献主题概念的表达 两者之间的差异 1 表达主题概念的标识形式及特点不同 2 标识揭示 组织信息 文献的角度不同 3 分类法和主题法的功能 作用是互相补充的 3 分类法和主题法的比较 32 信息描述是对原始文献外部特征进行记录 从而提供责任者 题名等检索途径 如下图 4 信息描述 33 信息描述以其记录的结果 元数据为中介 对原始信息进行各种操作 信息描述 元数据 的作用是 识别 确认并对要进行组织的信息进行个别描述 使用户能识别被组织的信息对象 定位 提供信息资源位置的信息 以使用户访问并使用 检索 通过在描述数据中提供检索点 便于用户对资源的检索和利用 选择 通过记录信息资源的特征 供用户对信息资源的使用价值进行判断 决定是否使用该资源 5 信息描述的作用 34 元数据是关于数据的数据 或关于数据的结构化数据 元数据的含义是逐步发展的 早期的元数据主要指网络信息的描述数据 用于网络信息资源的组织 如用HTML描述网页的数据 其后 逐步扩大到各种以电子形式存在的信息的描述数据 如MARC和DC 由于传统的书目数据与数字信息的描述数据本质上并无不同 因此 目前元数据这一术语实际上适用于各种类型的信息源的描述记录 即 网络快照是元数据 电子文本的描述数据是元数据 编目数据也是元数据 如手工编制的目录款目记录和机读目录记录MARC 6 元数据 Metadata 35 元数据是信息描述的工具 可用来描述信息组织的对象 包括不同的信息类型 可以是图书 期刊 磁带 录像带 光盘 缩微品 也可以是其中的论文 科技报告以及各种形式的网络信息等 描述的成分 通常是从信息源中抽取出来的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全面扩充2025年VB考试范围试题及答案
- 数字化转型下的工作规划计划
- 湖北省武汉市江汉区度第一期期2025年数学七下期末教学质量检测试题含解析
- 山东省莱芜市莱城区腰关中学2025年数学七下期末考试模拟试题含解析
- 小班环保知识宣传与实践计划
- 企业品牌建设的阶段性总结计划
- 2025年软件设计师考试战略与试题及答案
- 2024年云南省投资促进局下属事业单位真题
- 2024年西藏自治区教育厅下属事业单位真题
- 2024年上饶师范学院辅导员考试真题
- 2025年湖北省各市(州、区)供电服务有限公司招聘笔试参考题库含答案解析
- 私人合同协议书模板
- 神经鞘瘤MRI诊断要点及鉴别诊断课件
- 120个常见文言实词例释-高考语文考前复习速记清单
- T-CEPPEA 5002-2019 电力建设项目工程总承包管理规范
- GA 1812.2-2024银行系统反恐怖防范要求第2部分:数据中心
- 《企业绩效评价标准值(2023年版)》
- 2024《整治形式主义为基层减负若干规定》全文课件
- 3.作文指导-写一种小动物课件
- DZ∕T 0227-2010 地质岩心钻探规程(正式版)
- word个人简历空白
评论
0/150
提交评论