




已阅读5页,还剩200页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019/2/16,1,第三章信息生命周期管理,3.1信息生命周期,3.2 信息用户与需求,3.3 信息采集,3.4 信息处理与组织,3.5 信息存储与检索,3.6 信息传递,3.7 信息利用,3.8 信息处置,课件主页面,2019/2/16,2,3.1信息生命周期 (information life cycle),1 定义 信息生命信息对其主体所具有的各种价值的存续期。 信息生命周期信息从生成到其价值绝大部分甚至全部丧失的时间间隔,或者指信息从产生到最终老化过时被处理掉的整个过程,是信息从“生”到“死”的轮回。,2019/2/16,3,2 信息生命周期的五个阶段 确定信息需求:用户所需要信息的内容、格式、类别、媒体、来源、质量和数量 信息生成或采(收)集:渠道、对象、方法和手段 信息处理:重新组合、提炼、压缩、扩充、运算、排序,转换语言、格式、媒体、载体,编制目录、索引,制作文摘、撰写综述、述评、报告 信息利用:终端用户或决策者运用信息进行决策或解决各种问题 信息处置:将老化过时无效的信息从信息集合(信息库)中及时清除掉,2019/2/16,4,3.2 信息用户与信息需求分析,1 信息用户 用户指信息的用户,通常指那些接受信息服务的人类个体或群体。 信息用户的三个特征 拥有信息需求 具备利用信息的能力 具有接受信息服务的行为 潜在信息用户 拥有信息需求 具备利用信息的能力 2 信息需求 信息需求是指向某个图书馆或其他信息系统提出的书面的或口头的要求或请求。,2019/2/16,5,用户信息需求的决定因素用户的特征 个人特征:与生带来的特征和后天发展的特征 组织特征:职业组织、业余组织和社区组织 社会特征:时代背景和社会环境 用户的类型与特点(见下表) 确定用户信息需求的方法: 总体方式有:用户自己进行识别、信息工作者亲自识别和信息工作者会同用户进行识别 具体方法:采访法、问卷调查法、实地调查法、抽样调查法、观察法、案例历史法、日记法等等,2019/2/16,6,表 组织内部不同层次的信息用户的信息需求,2019/2/16,7,3.3信息源与信息采集 3.3.1信息源概述,1 信息源的定义 信息源是指信息的来源,即产生信息的地方。 联合国教科文组织出版的文献术语将其定义为:个人为满足其信息需要而获得信息的来源。 人、报纸、广播、电视、internet 信息源的三个层次(p121),2019/2/16,8,信息最原始的来源物质和现象的存在及人类的实践活动。 这种信息源的特点:它提供的是初始信息,内容翔实可靠,但复杂、无序;它传递信息的方式最直接、最迅速;它对信息人员来说具有一定的局限性。 信息开发机构:这是第二层次的信息源,其职能和任务就是专门从事信息的采集、处理、存储和传递,主要包括:专门从事信息生产和服务的机构;各单位的信息部门。 信息系统:它是在信息技术的支持下由信息机构对实践活动中所产生的信息进行过滤加工的成果,它存储了大量的信息,可以通过现代信息网络进行传递,为各类信息部门和信息系统对外服务提供更高层次的信息源基础。,2019/2/16,9,2 信息源的性质 相对性 信息源不是一成不变的 在错综复杂的社会信息流通过程中,任何一个信息源都可能既是信息的发出端又是信息的接收端。 多样性 提供同样信息内容的信息源可能有多种 不确定性 信息源发出的信息的内容、种类、形式、媒体等不固定 生物和社会信息源大多数具有生命周期,2019/2/16,10,替代性 大多数情况下,可用间接源替代直接源。 补充性 不同信息源提供的信息能够相互验证、互为补充 自组织性:对外部环境的冲击具有一定的适应能力 能够自动调节自身以适应外部环境的变化,2019/2/16,11,3 信息源的分类 按照信息生成方式或产生过程,信息源可以划分为初始源和再生源 (原始源和加工源) 初始源又称原始源、一次信息源:没有经过信息机构的加工处理,是实践活动中直接产生的。 再生源又称加工源:信息机构对原始信息进行加工、处理、改编和重组而形成的各种信息源。,2019/2/16,12,再生源按加工的深度又分为二次信息源和三次信息源。 前者指各种中介性检索工具,如目录、索引、文摘性检索刊物和书目数据库等; 后者是在原始信息源和二次信息源的基础上,通过分析、综合、浓缩和提炼而形成的高层次的信息源,是对原始信息的深层揭示和报道,如年鉴、手册、述评、进展报告、百科全书等。,2019/2/16,13,按发送信息与组织之间的关系,信息源可以划分为内部源和外部源 内部源的信息完全在组织内部生成的 外部源是指组织的环境 按提供信息的实体形态:机构源和物体源 机构源:信息机构、非信息机构 物体源:文献源、非文献源 文献信息源可以按其载体形态划分: 手写型文献:甲骨文、简册、帛书、笔记、书稿等 印刷型文献:铅印、胶印、油印等 缩微型文献:缩微胶卷、缩微平片等 计算机阅读型:电子图书、电子期刊 视听型(声像型)文献:唱片、录音(像)带、cd、vcd、dvd等,2019/2/16,14,非文献源:一般强调的是通过人的感官获取的实时信息,或者说第一手知识信息。主要分为: 实物信息源:实物、样品或展览会的展品。如服装、仪器仪表、建筑物、生物品种、化学物质、药品和医疗器械等 实情信息源:自然现象如气候、水文、生物等的演进和反应的状态和过程;社会信息如政治法律事务、军事行动、企、商、事业机构运行状态、演出现场等 口头信息源:存在于人脑记忆中,通过交谈、讨论、报告等方式交流传播的信息。如:会议发言、电话和网络交谈、直接口头交谈等,2019/2/16,15,按生成领域,可把信息源划分自然信息源、生物信息源和社会信息源 自然信息源是指自然界中的各种无机物,它们是自然科学家研究的对象 生物信息源是指地球上的各种生物,包括动物、植物和微生物,它们是生物科学家的研究对象 社会信息源是指由人及其所组成的各类、各级团体、群体、组织乃至他们(它们)的社会活动的成果。 通常人们所说的信息源一般是指社会信息源,包括人、机构和物体。,2019/2/16,16,3.3.2 信息采集,1 信息搜集、信息收集和信息采集的定义 信息搜集具有积极主动的含义,是指信息获取人员主动出击,想方设法去获取所需要的信息。 信息收集是指运用各种方法、借助于各种手段,通过各种渠道(正式交流或非正式交流)从不同的信息源获取信息的过程或活动。 信息采集是信息的选择过程,是根据不断变化的用户信息需求从已确定的信息源体系中连续地选择、提取和收求信息的过程。(p123),2019/2/16,17,2 信息采集的方式 第一种是按采集信息的组织方式将信息采集划分为报告制度和专门组织的采集。 第二种是按采集的信息宽度,将信息采集划分为全面采集和非全面采集。 第三种是按采集信息的时间可划分为定期采集和不定期采集。,2019/2/16,18,3 信息采集的原则 针对性原则:要针对用户的信息需求 完整性原则:全面完整地采集方方面面的信息 及时性原则:信息的时效性和竞争的要求 预见性原则:在用户现时需求的基础上预见需求的未来变化趋势 计划性原则:制定合理的采集计划,有步骤、有条理地进行 连贯性原则:用户的信息需求具有连贯性;信息服务机构和信息系统也需要连续地采集信息以形成系统的信息体系 灵活性原则:灵活采用多种方式和方法采集信息,2019/2/16,19,4 信息采集的步骤 明确任务 确定目标 制定计划 设计信息结构 确定采集的对象和方式 宣传与培训 开展采集试点 实施修订过的采集计划,2019/2/16,20,5 信息采集的质量控制 要严格审查采集计划 要确保采集步骤严密完善 采集人员要有很强的责任心,要掌握采集的基本技术 提供信息的个人、组织要对自己提供的信息质量负责 采集单位要对采集到的信息进行审核,主要审核填报的信息内容的正确性、完整性、及时性,2019/2/16,21,6 信息采集的渠道和方法 渠道主要有:大众传媒渠道、出版发行渠道、人际关系渠道、文献情报机构渠道、专业性学会渠道、行业协会渠道社会中介机构渠道、信息发布机构渠道、互联网渠道、各类会议渠道、邮政部门渠道等等 具体方法: 调查法就是深入被采集的信息对象处,通过实地观察信息对象采集有关的信息:全面调查、典型调查、重点调查、详细调查和抽样调查,2019/2/16,22,统计法就是按照统计法规和统计工作的有关规定自下而上地收集信息,一般说来统计工作的信息收集主要采用的是填表法,上一级统计部门对下一级统计部门提交的统计数据进行汇总、分析,并得出相应的结论。 会计法就是按照会计法规和会计工作的有关规定来收集信息。 预测法是指在收集、分析、研究历史信息的基础上推测和把握事物未来的运动变化规律。,2019/2/16,23,新闻收集法就是通过收听、收看和阅读新闻报道的方法来收集信息。 文献调查法就是收集与某事物有关的各种记录形态的信息,包括图书、期刊、报纸、专利说明、产品样本、技术报告、广告、简报、宣传材料,等等。 测试法就是对获得的信息对象运用各种仪器进行测量来获取相关的信息,这是反求工程所运用的主要方法。 试验法主要是针对新产品、新服务、新计划而言的,在这些项目尚未正式推广之前,可以采用局部试点或试验的方法来收集信息。 检索法就是通过各种方式进入数据库中收集相关信息。 搜索法就是利用已经上网的计算机对网上信息进行搜寻。,2019/2/16,24,举例说明一种较常用的信息采集方法:调查法 访问调查法和问卷调查法 访问调查法:又叫采访法,是新闻机构常用的信息采集方法,它又包括电话采访、信函采访、会议采访、观察采访、座谈采访、单独采访等。 注意事项:做好充分准备(把问题吃透并具体化、纲要化,认真选择并了解调查对象和相关背景);访问中要机智灵活,善于交流互动。 问卷调查法:是一种统计调查和定量分析的信息采集方法,此法主要考虑的问题是:所采集的信息的内容范围、数量,所选定的调查对象的代表性、数量,问卷的精心设计、数量,问卷的回收率的控制,回收后问卷的统计分析,对分析结果的评价等。,2019/2/16,25,问卷调查法的主要特点:费用较低,调查面广,但调查对象无法控制,问卷回收率不高,问卷回答的质量也不高。 问卷的设计形式:结构式、非结构式和混合式 调查表:(微软出版社作者俱乐部调查表) 前言 调查项目 问答形式 : 结构式、开放式 结束语,2019/2/16,26,7 网络信息采集 这里主要是指搜索引擎的信息采集机制和方法,即对www站点和其他网络信息资源进行采集、标引和检索的一类检索系统机制。主要涉及它的信息采集机制。 基本机制:搜索引擎的信息采集机制是按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库。 自动采集器:是采用自动采集方式的搜索引擎的核心,是一种在网络上搜索文件、自动跟踪该文件超文本结构并循环检索被参照文件的软件。,2019/2/16,27,3.4信息处理与信息组织 3.4.1信息处理和信息组织的定义,1 信息处理 狭义的信息处理仅指信息加工,也就是对收集到或生产出的信息进行转换、增删、重组,它既可以是载体的转换,也可以是描述方式的转换,甚至可以是内容方面的提炼、延伸。 广义的信息处理是指科学计算、实时控制和事务处理。,2019/2/16,28,2 信息组织 运用科学的方法来提高信息的有序程度,它包括信息选择、加工、分析、提炼、转述等活动。 根据信息的内容特征和外部特征,采用一定的原则和方法,对信息进行加工处理,使之有序可用的过程。(p128),2019/2/16,29,3.4.2信息组织方法的分类,按信息本身的层次划分可分为(p128): 语法层次的信息组织方法 语义层次的信息组织方法 语用层次的信息组织方法,2019/2/16,30,语法层次的信息组织方法 语法层次的信息组织方法又称为语法信息组织:是以信息的形式特征为根据序化信息的方法。 重要特征是标准化:因为语法信息不涉及含义和用途,必须用标准化来约束;标准的形成和应用的过程就是语法信息优化的过程。 常见的有: 字顺组织法 代码组织法:代码一般是指代表事物的名称、属性、状态的符号和记号 地序组织法 时序组织法 其他组织法,2019/2/16,31,语义层次的信息组织方法 语义层次的信息组织法又称为语义信息组织,是指以信息的内容或本质特征为依据序化信息的方法。 语义信息组织要遵循客观性、逻辑性和发展性原则 常见的有: 分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。 主题组织法指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的信息组织方法。,2019/2/16,32,语用层次的信息组织方法 语用层次的信息组织方法又称为语用信息组织,是以信息的效用特征为依据序化信息的方法。 语用信息组织遵循目的性、实用性和个性化原则。 常见的有: 重要性大小组织法:递增法和递减法。如:大众传媒的栏目设计,推荐书目的款目安排等。 权值组织法:即赋予不同的信息以不同的权重值,然后通过复杂的计算,以权重大小组织信息的方法。如:决策方案的选择和教学质量评估等。 概率组织法:即根据事件发生的概率大小序化信息的方法。如期货交易等过程。,2019/2/16,33,3.4.3信息组织的基本原理,1 信息组织的语言学基础 2 信息组织的逻辑学基础 3 检索语言的构成原理,2019/2/16,34,1 信息组织的语言学基础,2019/2/16,35,语言的分类,2019/2/16,36,2019/2/16,37,检索语言的构成 有一套专用字符用以构词 有一定数量的能够表达基本概念的基本词汇 词汇是登录在类表、词表中的全部标识。词汇由语词组成,语词是词表中的一个标识,如分类号、检索词、代码。 有一套能够表达复杂概念的语法规则 有一种能把自然语言转换成检索语言的工具,即词典,也称为类表、词表(分类表、主题词表),它们都是检索语言中语词的词典。,2019/2/16,38,检索语言的实例 目前全世界有近千种检索语言,最主要的有: 国际十进分类法(udc universal decimal classification) 杜威十进分类法(dewey decimal classification) nasa(national aeronautics space administration)叙词表 中国图书馆分类法 中国图书资料分类法 中国科学院图书馆分类法 汉语主题词表 军用主题词表,2019/2/16,39,检索语言的分类 按照结构原理划分 分类语言用分类号表达各种概念,采用概念划分与概括的方法,将各种概念按照科学的原则进行分类和系统排列,建立起等级体系。如国际十进分类法 描述语言用语词来表达各种概念,并将各种概念不管其相互关系而完全按照字顺进行排列。如nasa叙词表 代码语言,用某种代码来表示事物的某一方面特征,并加以标引和排列。如化合物的分子式语言 有时也可将这几种语言结合使用,比如我国的国民经济行业分类与代码,2019/2/16,40,按照组配的方式 先组式语言其标识在编表时就已经组配好,如各种分类语言 后组式语言其标识只有在检索时才组配起来,如各种叙词语言,2019/2/16,41,对检索语言的基本要求 有较高的查全率和查准率 输出的相关信息数 查全率 = 100% 集合(信息系统)中的相关信息总数 a = 100% a + c 输出的相关信息数 查准率 = 100% 输出的信息总数 a = 100% a + b a检准的相关信息数 b误检的信息数(无关信息) c遗漏的相关信息数 d无关的信息数,2019/2/16,42,满足多途径检索的要求 多途径检索从多个侧面进行检索,如书名、著者、分类、主题等途径等 族性检索从学科、专业出发的检索,是一种范围较广的检索 特性检索从事物出发的检索,是一种范围较窄的检索 扩检和缩检扩大和缩小检索的范围,2019/2/16,43,易于标引、易于检索 具有对先进检索方式和检索设备的适应性,2019/2/16,44,2 信息组织的逻辑学基础,逻辑(logic)是思维的规律性或客观事物的规律性 检索语言是表达一系列信息内容的概念及其相互关系的概念标识系统,是建立在概念逻辑的基础上 概念是事物本质属性的概括,概念逻辑是揭示事物本质属性及其之间的区别与联系的科学思维方法。 检索语言要能准确表达不同的概念,还要显示它们之间的关系。,2019/2/16,45,概念的内涵与外延 概念的内涵即其含义,是它所指事物的本质属性的总和 概念的内涵有深浅,即它所概括的事物的 本质属性有多少 概念的外延是其适用范围,即它所包含的所有事物 概念的外延有广窄,即它的适用范围有大小 概念的内涵与外延之间成反比关系,概念的内涵越浅,则它的外延越广,2019/2/16,46,概念之间的关系 全同关系 全同关系又称为同一关系、重合关系,是指有同一外延、不同内涵的两个概念之间的关系。 在全同关系中的两个概念实际上是指同一事物,故在检索语言中要加以合并,即只选择其中一个作为标识,以提高专指性。 电子计算机与电脑、小苏打与碳酸氢钠、父亲与爸爸、庐州与合肥、dna与脱氧核糖核酸等。,2019/2/16,47,属种关系 属种关系是指两个概念中一个概念完全被包含在另一个概念的外延里,是该概念外延的一部分 在属种关系中,外延较大概念是属概念或上位概念,外延较小的概念是种概念或下位概念 生物与动物、学生与小学生、学校与大学、行星与地球,飞机、直升飞机、喷气式直升飞机。,2019/2/16,48,整体与部分关系 整体与部分关系是指在两个概念中,其中一个概念概括某一事物,而另外一概念仅仅表示这一概念的某一部分 中国与安徽、安徽农业大学与(安徽农业大学)管理科学学院、人体与(人的)心脏、汽车与(汽车的)方向盘、树与树干等 属种指同族事物的属与种、类称与别称之间的关系,整体与部分关系关系指两个不同族的事物一个成为另一个的构成部分之间的关系,2019/2/16,49,交叉关系 交叉关系也称为部分重合关系,是指两个概念之间的外延有一部分重合所形成的关系 两个概念的外延重合部分(即相同部分)常常 能形成一个新概念,其内涵等于两个交叉概念的内涵之和,该新概念对原来两个概念中的任何一个都属下位概念 古代史+中国史=中国古代史 核动力舰+驱逐舰=核动力驱逐舰 彩色打印机+手提打印机=彩色手提打印机(或手提彩色打印机),2019/2/16,50,并列关系 并列关系又成为同位关系,是指同一个概念之下的几个种概念之间的关系,具有并列关系的各个概念互称为并列概念或者同位概念 综合性大学、师范大学、工业大学、农业大学 、医科大学、铁道大学、交通大学、测绘大学都是大学这一属概念之下的种概念,故它们之间的关系就是并列关系,2019/2/16,51,矛盾关系 矛盾关系是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,是并列关系的一种特殊形式 金属材料与非金属材料的外延总和等于材料这一概念的全部外延 男学生和女学生这两个概念的外延总和也等于学生这一概念的全部外延 正极与负极这两个概念的外延总和也等于极性这一概念的全部外延,2019/2/16,52,对立关系 对立关系是指外延总和小于其上位概念全部外延的两个概念之间的关系,也是并列关系的一种特殊形式 导电体和绝缘体之间即为此关系,因为它们的上位概念是导电性,而导电性这一概念的外延中除了包括导电体和绝缘体之外,还包括半导体 酸性与碱性也是这种关系,因为在物质的酸碱性中还包括了中性,2019/2/16,53,检索语言在表达概念及其相互关系时,利用了概念逻辑原理用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构,3 检索语言的构成原理,2019/2/16,54,3 检索语言的构成原理,检索语言在表达概念及其相互关系时,利用了概念逻辑原理用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构 利用概念的划分(缩小)与概括(扩大)原理分类 概念的缩小(概念限制)即增加属性,如管理、经济管理、信息经济管理、中国信息经济管理; 概念扩大(概念概括)即减少属性,如中国信息经济管理、信息经济管理、经济管理、管理。,2019/2/16,55,利用概念的分析(分解)与综合(合成)组配,可建立起另外一种形式的检索语言体系结构概念组配体系,如叙词法 两个概念的外延重合部分可以构成一个新词,其内涵等于原来的两个概念内涵之和,它和原来的两个概念之间具有隶属关系,故可将一个内涵较深的概念分解成为两个或两个以上的内涵较浅的概念,也可反向进行。,2019/2/16,56,3.4.4信息组织的内容(p130),信息组织的内容包括信息源外表特征描述、信息源内容特征描述、信息重组和信息存储4个方面 其中信息源外部特征的描述是信息的初级组织 信息源内容特征的揭示是信息的中级组织 信息重组是信息的高级组织 信息存储是对信息及其他信息组织的成果的空间组织。四者相互独立又相互联系,共同构成信息组织的完整内容。,2019/2/16,57,1 信息源外表特征的描述 即信息形式特征的描述,是根据一定的原则和方法,对信息的外表特征和部分内容特征进行全面描述并予以记录的过程。 目前比较成熟的是对文献信息描述的isbd模式。它主要采用统一描述格式、统一描述内容和统一描述符号的方式,核心是统一描述内容,在此基础上运用统一描述符号按统一描述格式记录。,2019/2/16,58,isbd描述内容包括如下8大项目:题名与责任者项、版本项、信息特殊细节项、出版发行项、载体形态项、丛编项、附注项、国际标准编号和获得方式项。我国的文献著录总则、普通图书著录规则等等都是以isbd为基础的。 另一种重要的信息描述模式是marc(machine readable catalogue)模式,这是一种在isbd模式上利用计算机技术的新型处理格式,是一种国际性的书目数据交换格式。,2019/2/16,59,2 信息内容特征的揭示 信息内容特征的揭示是指对信息内容特征进行深层揭示并转换成规范化的标识(包括分类号和主题词),形成科学的概念标识系统。它需要利用一定的工具(信息组织语言)或规范(标引规范)将信息内容特征进行转换。,2019/2/16,60,3 信息重组 这是在信息内容特征分析的基础上的具有创造性的活动。它根据特定的目的和任务,对有关的大量信息进行系统性、综合性的加工处理,形成新的信息的过程。 其基本方法是:以一批相关信息为基础,利用分析、鉴别、浓缩、提炼、综合归纳和评价等手段,对信息中的相关方面知识点进行重组,形成更加系统的信息产品或知识产品。 信息重组的过程中融入了信息分析人员的智能,形成了新的信息组合,因此是高级的信息组织活动。信息重组的结果常常表现为综述、述评、进展报告、研究报告等。,2019/2/16,61,4 信息存储 指在对信息的外部、内容特征进行描述,且在确定标识之后按一定的规则和方法,把所有的信息记录组织成为一个有序的体系,以方便人们检索利用。因此,信息存储是信息在空间中的科学排列和组织,也是形成信息系统的一项必不可少的组织环节。 一般地讲,信息存储都是以信息的外部特征或内容特征作为主要存取依据的,因而信息存储与信息的描述、揭示和重组并不是截然分开的两个方面,信息存储在很大程度上还要依赖于信息的描述、揭示和重组并且同时还要对信息的描述、揭示和重组成果进行存储。,2019/2/16,62,信息存储主要有两种方式: 第一是手工存储,主要是存储空间如何划分的问题。比如按照文献载体类型区分为普通书库、报刊库、线装库、缩微资料库和声像资料库等;按照文献的利用率可分为一线书库、二线书库、三线书库等;按照文献的学科属性划分为社会科学、自然科学书库。 第二是计算机存储,这主要是利用计算机技术及其现代化存储技术如光盘技术和数据库技术等多种信息技术实现信息的自动化存储和管理。一方面可以节省存储空间,另一方面是信息管理现代化的必然要求。其结果就是形成一个由各种信息组成的动态性集合,并由计算机技术及相关技术支持的信息数据库。,2019/2/16,63,信息存储不仅是信息的归档和排列,而且还有一个维护和更新问题。 手工存储中的维护问题主要表现为存储空间的保护和信息资料的保管问题,当然主要是信息资料的保管问题(考虑温度、湿度、灰尘、大气污染、有害生物、阳光、灾害等)。 计算机存储中,除存储介质的维护外,计算机系统维护也非常重要,包括计算机硬件、软件、数据库、机房、人员等多方面的维护。,2019/2/16,64,3.4.5信息组织方法,凡是能将信息按一定的规律进行有序排列的方法,都称为信息的组织方法。 明确信息的外部特征和内容特征(属性)。 外部特征是物质载体所直接反映的特征,指文献的书名(刊名)、著者、出版者、出版地、语种、版次、刊期、以及各种编号等等。按外部特征组织信息的有引用法、索引法。 内容特征指信息所包含和承载的具体内容。按内容特征组织信息的有分类法、主题法、文摘法。 另外还有代码组织法,网上信息组织法。,2019/2/16,65,1 分类组织法,“类”是指在性质上相同或相似的事物,属性相同的或相似的事物就属同类事物。 分类是人类认识事物的一种思维方式,分类就是把相同的或不同的事物区别开来,把不同的事物根据彼此相互关系,联成一个系统。 类的形成以相同性或相似性为条件,相同的东西加上一点不同的因素,就形成同类中的另一小类。,2019/2/16,66,分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。 分类法主要有分面分类法(面分类法)和体系分类法(线分类法) 分面分类法(组配分类法),即按一定标准将各个事物概念的属性划分为一个个的面。面就是一些具有某一共同特征属性的一组事物。在一个面里都含有许多具有同一范畴性质的类目。把这些面以及面下面的细目的标识符号,按照一定的组配顺序编排成为一个个的分类表。,2019/2/16,67,体系分类法(学科体系分类法、层累制分类法、等级制分类法),是把所有类目主要按照学科知识的体系和内在的逻辑性,采取尽量列举类目的方式,组成一个有等级层次的分类系统。 (文献的)体系分类法是以科学分类为基础,运用概念划分的方法,按知识门类的逻辑关系,从总到分,从一般到具体,层层划分逐级展开的层累制号码检索系统。根据这种方法编制的目录称之为分类目录。 (文献)分类包括分类和归类两个方面,前者是指建立分类体系,后者是指运用该体系来分类文献。 分类要按分类表(类分文献的工具)来组织。,2019/2/16,68,2019/2/16,69,分类法的特点 从事物的某一方面出发,按表达事物的层累制号码排列,同一学科内容的资料集中在一起,可以体现学科的系统性,反映事物的从属派生关系,便于按学科体系进行族性检索 以人工语言(数字、字母代号)作为标记符号,不直观,较难记 体系固定,增补新类目不及时,但按分类号组织分类目录较容易 组配方式较机械,较难满足多元检索要求,2019/2/16,70,分类组织法的实施保障分类基本标引规则(p134) 信息分类要以信息的学科内容或专业属性为主要标准。必要时再参照其他特征进行标引 信息分类要体现逻辑性、系统性。信息所归入的类目与其上位类之间的关系体现出分类法的逻辑性、等级性、次第性。 信息归入其最大用途的类。 以专指性为原则。把信息归入最切合实际的专指的类目层次,能入下位类,就不要归入其上位类。 不可单凭信息的题名的含义归类。 信息分类要坚持一致性原则。同一信息归入一类,使同一种信息集中在一起,也就是说同种信息必须同类、同号。,2019/2/16,71,主题组织法又称词汇控制法。指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的一种组织方法。 主题组织法可分为标题法、单元词法、叙词法和关键词法等。,2 主题组织法,2019/2/16,72,标题法 标题词是指用来表达主题内容(即主题标识)的、经过规范化处理的自然语言中的词或词组。 标题法是指用经过规范化处理的自然语言中的名称术语作为标识来直接表达文献所涉及或论及的事物主题,并将全部标识按照字顺方式进行排序,用参照系统来间接显示标识所表达的事物主题之间的相互关系的组织方法。 简单地说,标题就是表达文献主题的一种语言形式,按照这种标题的字顺来组织文献信息检索工具的方法就是标题法。,2019/2/16,73,例一篇关于羊饲养的文章和一篇关于羊病防治的文章 在标题系统中,它们都可直接用“羊”(或“羊饲养”、“羊疾病”)来做标题而不是用“畜牧学羊”、“兽医学羊”来做标题 并都按“羊”字排列被集中到一起。 检索时,不管是“羊饲养”还是“羊治病”的信息,也不论其学科性质,都按照字顺查“羊”即可 如将有关“羊”的信息全部找到,在“羊”的标题下可看到一条参照“参见羊、山羊、黄羊”,据此可将相关信息全部查出。,2019/2/16,74,例一篇关于羊的饲养的文章和一篇关于山羊的饲养的文章 它们的标题分别为“羊”(或“羊饲养”)和“山羊”(或“山羊饲养”),它们在标题系统中都是按照“羊”和“山羊”的字顺来排列的,因而被分散在两处。 这是标题法的缺点。,如何解决这一“分散”问题呢?,2019/2/16,75,标题词关系的显示 标题的语义参照(标题参照系统)是标题法揭示标题(概念)之间的语义关系的一种重要手段。主要有单纯参照、相关参照和一般参照。 单纯参照是反映同义关系的参照,一般用“见”、“见自”来显示等同关系。 相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用“参见”、“参见自”来显示。 一般参照是一种概括性的举例性参照。,2019/2/16,76,等同关系的显示 等级关系的显示,非标题词 见 标题词,标题词 见自 非标题词,电脑 见 计算机,孙中山 见自 孙逸仙,上级标题词 参见 下级标题词,下级标题词 参见自 上级标题词,电机 参见 电动机 发电机,标题词a 参见 标题词b,电动机 参见 发电机,标题词b 参见 标题词a,发电机 参见 电动机,相关关系的显示,2019/2/16,77,标题法的特点 标题之间的顺序关系是预先组配好的,属先组式 标引和检索时直接使用,不易混乱 使用不灵活,不能满足多途径检索要求 标题法以事物为中心来集中与该事物有关的文献,适于从主题出发进行检索,易查找某一主题的文献,且使用方便、检索速度快、修改容易,2019/2/16,78,单元词法 单元词(uniterm)是指一个个在概念上不能再分的、最小的、最基本的词汇单位,是能够独立地描述文献所论及或涉及的事物主题的那些单词。它们可以是: 单纯词“山”、“水”、“氧”、“玻璃”、“逻辑”、“火车”、“资料”、“马克思”、“乌鲁木齐” 合成词“文字”、“图书馆”、“车床”、“隔音”、“公路” 这些词的特点是在概念上不能再进一步分解,如进一步分解将不能表达原来的概念,从而失去检索意义。,2019/2/16,79,单元词法就是用规范化了的单元词来表示文献的主题 单元词是构成标题的部件,它们本身绝大部分是不符合“直接精确地表达文献主题”这一基本要求的“标题词”,只有用单元词的相互组合(即组配)才能构成一个个专指的“标题”,以精确地表达文献主题或进行检索。 单元词法的构成原理是组配,即任何完整的、复杂的概念都可以分解成为一般的单元词,反过来说,任何复杂的概念都可由单元词的组合(组配)而成。,2019/2/16,80,组配就是从主题词表(但组配也适用于分类组织法)中选取两个或两个以上的主题词,按照一定的概念组合关系和符号,把它们有机地结合起来,以表达更为专指的主题。,2019/2/16,81,单元词法的主要特点 可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引; 单元词之间不存在次序问题,可能产生误检。如查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学校图书馆”方面的文献都检索出来 组成“标题”的每一个单元词都可以作为检索入口,检索途径较多。 利用对单元词的增加或减少,可进行扩检或缩检,2019/2/16,82,标引深度较高。单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。每张单元词卡片可记录200个文献号码,且还可继续使用第2、3张卡片。 有利于向计算机检索方向发展。,2019/2/16,83,叙词法 单元词法的缺陷 单元词的选取主要考虑词的结构,重在拆词。单元词的组配基本上属于单纯的字面组配,误检率较大。 字面组配只考虑词的字面形式而不考虑内容含义,把概念简单地看成是词的任意叠加,因而组配经常会导致望文生义或不知所云,以至检索时无所适从。,2019/2/16,84,为避免单元词法的缺陷,人们又研制了一种新的信息组织方法叙词法。 叙词是一些以概念为基础的、经过规范化的、并且有组配性能、能显示词间语义关系和动态性的词和词组,又称其为描述词、叙述词、主题词。 叙词法就是以叙词作为标识符号,标引和检索文献信息的一种信息组织方法。,2019/2/16,85,基本原理: 叙词法采用概念组配概念的分析与综合(拆义),它把完整的一个主题内容从概念上分解为若干个分概念,然后再从词表中选用能够确切地表示这些分概念的词或字组加以组配,以形成更为专指的概念; 叙词法严格遵守概念组配原理,对语词进行严格规范化,不简单地拆词; 用参照系统显示概念间的相互关系,用分类法的基本原理编制叙词分类索引和等级索引,2019/2/16,86,字面组配与概念组配有时相同,有时不同。 组配时需要注意的几个问题 要尽量使用词表中给出的主题词,只有词表中单个主题词不能够表达主题,才进行组配 要防止单纯字面组配,组配必须是概念组配; 要防止多标识组配,必须选用与所表达的主题关系最密切、最邻近的主题词进行组配。 要防止越级组配 要防止虚假组配。 要防止二义性组配,2019/2/16,87,叙词语言的具体体现叙词表 叙词表的组成部分 主表:是叙词表的主体部分,它是把全部或大部分叙词和非叙词款目按字顺排列而成的词汇表。 附表:将一些专有叙词,比如地理和区划名称、组织结构名称、人物名称等叙词款目独立按字顺编排,作为附表。其结构和功用与主表完全相同,都是信息组织和检索时选词的依据。 辅助索引:为了查找方便,并以多种方式展示叙词之间的关系。像词族索引(显示从属关系)、范畴索引(学科)、语种对照索引等。,2019/2/16,88,叙词法的主要特点 1.直接以规范化了的自然语言叙词作为标识符号,直观性强; 2.直接从具体对象和问题出发选词,并用叙词组配来描述主题,专指性强; 3.叙词法能随时加以增设修改,适应性强; 4.对叙词主要采用字顺排列方式,查找迅速; 5.主要采用后组式概念组配方法,灵活性强; 6.对同一主题的文献,可作多途径检索; 7.叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用,2019/2/16,89,关键词法 关键词是从文献的题目、正文或摘要中抽出的能表征文献主题内容的具有实质意义的词语。 关键词法是将描述主题内容的关键词抽出,不加或加少量规范处理、按字顺排列提供检索的方法。 关键词法相当粗糙,但标引容易,报导及时。,2019/2/16,90,引用组织法是运用文献的引用和被引用的规律来组织信息的方法 美国“科学引文索引”science citation index-sci sci是美国信息学家加菲尔德按照美国薛泼德引文法原理编制而成的,它是一种根据被引用文献查找引用文献的方法。 sci所用的方法其实就是一般科研人员所喜爱的“滚雪球式”文献检索方法。 sci有三种类型,即作者引文索引、来源索引和轮排主题索引,3 引用组织法,2019/2/16,91,索引即英语中的“index”,又称为“引得”,有目次表、指南之义。 索引作为一种指南系统,是查找信息和组织信息的工具。 索引组织法是指将文献中的项目或内容摘记下来,在每条下面注明出处页码,并按照一定的规则排列起来。,4 索引组织法,2019/2/16,92,索引的分类 按照索引对象的性质 物质系统索引 文献系统索引 索引法组织文献信息有两种类型 按文献外部特征组织索引的有书名索引、著者索引、引文索引等 按文献内容特征组织索引的有分类索引、主题索引,2019/2/16,93,文摘法就是用简短精炼的文字编写文献主题内容的摘要,它比主题法、分类法更能对信息内容作深入揭示。 文摘是以提供文献内容为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文,一般要起到报道和检索的双重作用。 文摘可按照不同的标准划分为多种类型,如指示性文摘和报道性文摘。,5 文摘组织法,2019/2/16,94,指示性文摘(indicative abstract) 是一种简短反映原文献目次或原文献主题范围的文摘,不提供具体事实和结论。 它一般不提供信息内容,因而不能够代替原始文献,只起到题解的作用。 报道性文摘(informative abstract) 概述原始文献的主要论点、创造内容及其所含的重要数据 指明文献的实质性内容,是原始文献的最完整的浓缩,信息量大,能够基本反映出原始文献的基本内容。其中所含有的许多事实信息,使用户在很多情况下可以不用查找原始文献就能够掌握其实质内容。,2019/2/16,95,编写文摘应注意的三个问题 准确抓住原文要点; 客观反映原文内容; 合理控制文摘篇幅。 文摘的结构 题录,主要描述原文外部特征,如题目、著者、原载报刊的刊名、出版年、卷期、页次等; 正文,主要描述原文的内容特征,如研究对象、目的、方法、观点、结论; 检索标识,即每篇文摘的分类号、顺序号;参考资料,如注释、引证和文摘员姓名等。,2019/2/16,96,代码是一个或一组有序的易于计算机或人识别与处理的符号,有时候简称为码。 代码有许多类型,如数字型代码、字母型代码或数字字母混合型码。 编码是把表示信息的某种符号体系转变成便于电子计算机或人识别和处理的另一种符号体系的过程。,6 代码组织法,2019/2/16,97,编码系统设计的原则: 唯一性。 一致性。 可扩展性。 简单性。 规范性。 可辨认性。 相对稳定性。,2019/2/16,98,代码的分类,2019/2/16,99,信息编码的步骤 确定编码对象,明确编码的目的和要求; 分析编码对象的特征,确定代码的使用范围和设计方向; 编制代码表,注明有关事项和说明; 对信息进行编码。,2019/2/16,100,7 网上信息组织法,网上信息组织是指人们根据网络信息的特点,运用各种工具和方法,对网络信息资源进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而有利于网络信息的储存、传播、检索、利用,以满足人们的网络信息需求的活动过程。 网络信息资源和传统信息资源最大的区别表现为数字和非数字信息资源的区别、信息资源拥有和信息资源存取的区别以及交互型信息资源和非交互型信息资源的区别,2019/2/16,101,网上信息具有的主要特点 数量大,类型多,传播范围广。 没有统一的管理机制,信息安全缺乏保障。 分布零乱无序,信息更新快,寿命短,管理相对困难 以网站为信息活动的单位,以网页为信息发布和收集的单元 信息利用水平取决于网站软硬件的技术水平和服务能力,网络信息提供方式是以网站为基点并可在网站间灵活链接的信息服务网。 网络创造了多层次的信息交流模式,全面反映社会生活的各个领域,形成百科全书式的知识网络和传播功能。,2019/2/16,102,网上信息的出现给传统的信息组织方法提出了新的挑战。 网上信息组织需要实现自动化。 网上信息组织要从静态向动态方向发展 网上信息组织要求从数据结构转向知识表示 网络一次信息的组织方式是将网外信息资源数字化上网,这种经过数字化的信息可称为网上一次信息,它是网上一次信息组织的对象。 自由文本方式 超文本方式 主页方式,2019/2/16,103,自由文本方式 这种网络信息组织方式主要用于全文数据库的建设,是对非结构化的文本信息进行组织和处理的一种方式,它将图书、期刊或者报纸的全部文本通过计算机上网,建成网上全文数据库系统,这种数据库在全文检索软件的支持下,可以对数据库文本中的各种知识单元(如关键词、人名、地名、词语、单字等)进行检索,且按照用户的需要,将检索结果按不同形式加以输出。 首先是对全文文本进行结构化处理 其次就是标引,也就是标出全文中具有检索意义和分析价值的知识项,2019/2/16,104,超文本信息组织方式 它是网上信息组织的一种主要方式,它采用节点和链接,在网上的相关信息之间建立关联,将网络上的文本信息组织成网状结构。 它是一种立体的知识网络,信息单元和知识片段储存在众多分布式节点中,关系链把纵横分布的节点联系起来。查询时相关的节点随着用户的点击被激活,形成一种随查询者的思路链接而成的信息结构。超文本组织方式的另一个优点是它在查询时不用查询指令,只需点击链接点即能够查到需要的信息。,2019/2/16,105,主页方式 这种信息组织方式是将有关某机构或个人的信息集中组织在一起,是对某机构或个人的全面介绍。 目前互联网上关于机构或个人的信息几乎毫无例外地采用这种组织方式。,2019/2/16,106,网上二次信息的组织方式是指对以自由文本、超文本和主页方式进入网络的网上一次信息进行索引。索引时可以选取有检索意义的标识进行,如网址、篇名、主题、文档内容、服务器名称和用户信息等 搜索引擎方式:这是目前互联网上二次信息组织的主要形式,其实质是一种报道、存贮网上一次信息的检索工具,其性质、作用和传统的二次文献目录检索工具是一致的。 指示数据库方式 菜单方式以菜单方式组织的网上二次信息本来是一个超文本文件,一般是围绕某一专题,采用分类法、地序法、时序法、主题法等方式,将与该专题有关的网上一次信息的线索和有关描述信息依此罗列,供用户浏览选择,用户若对其中某一项感兴趣,直接在其上点击即可。,2019/2/16,107,网上信息组织的宏观方式 数字图书馆 数字图书馆信息组织是基于图书馆馆藏文献资源的数字化,因此数字图书馆是一个数字化的信息系统。它将信息资源以数字化方式存贮,以网络化方式相互连结,提供即时利用,实现资源共享。 数字图书馆的信息组织是一种分布式模式,其信息对象可能并不存贮在同一个地方,而可能分布在不同的数据服务器上。 信息对象的格式化和多格式化是数字化图书馆信息组织的重要内容。,2019/2/16,108,虚拟图书馆 虚拟图书馆的实质是一个专业性的信息检索系统,它将互联网上某一特定领域的网页收集起来,作为一次信息,然后对其进行标引,形成各种倒排文档。 与数字图书馆相比,虚拟图书馆无需有自己的馆藏,而是对网上已经存在的信息资源进行有序化组织,并
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 遗产继承法律文书范本大全
- 编程机器人伴侣企业制定与实施新质生产力项目商业计划书
- 经典游戏高清重制版行业跨境出海项目商业计划书
- 基坑开挖监理施工标准细则
- 公共交通服务优化提要求
- 房产经纪人职业道德与法律知识培训手册
- 四年级语文下册常用成语大全集锦
- 中小企业成本控制制度范本
- 江苏高考物理试卷分析及解题思路
- 江苏高一生物会考试卷及答案
- GB/T 5163-2006烧结金属材料(不包括硬质合金)可渗性烧结金属材料密度、含油率和开孔率的测定
- GB/T 19575-2004农产品批发市场管理技术规范
- 《管理沟通实务(第四版)》课件第一章 沟通与管理沟通
- GA 36-2014中华人民共和国机动车号牌
- 人教七年级历史上第一单元 史前时期:中国境内人类的活动测试题word版含答案
- 2023年乐山新沐港航投资运营有限公司招聘笔试题库及答案解析
- 监理事故案例分析课件
- 我国大型基建工程材料供应的特点
- 【实验报告】教科版小学科学六年级下册实验报告
- EPC项目投标文件承包人建议书及承包人实施计划
- 二类医疗器械经营管理制度
评论
0/150
提交评论