文献检索课件6文献信息检索及原文获取_第1页
文献检索课件6文献信息检索及原文获取_第2页
文献检索课件6文献信息检索及原文获取_第3页
文献检索课件6文献信息检索及原文获取_第4页
文献检索课件6文献信息检索及原文获取_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7 文献信息检索及原文获取7.1 信息检索基础7.2 信息检索途径、方法与步骤 7.3 一个检索案例7.4 检索效果评价7.5 文献原文获取7.1 信息检索基础( 1)什么是信息检索( 2)信息检索原理( 3)信息检索系统( 4)信息检索语言( 1)什么是信息检索u 信息检索就是在信息的海洋里 “大海捞针 ”。如何捞?利用 过滤 技术。过滤技术的形式是多样的:筛子:筛沙,筛米,筛面 风:如 “扬场 ”利用 自然风 ,风车用 人造风。磁场 :如用 “质子回旋加速器 ”把质子和其他粒子分离水 :利用浮力差别其他 条件限制 :身高、年龄、体重、学历、相貌、地域、出身、单双号限制等等u 案例:李开复从 30万图片邮件中找出 20封邮件(离开微软到 GOOGLE)。方法:把图片转换为文字,再检索。u 信息检索( Information Retrieval):依据一定方法,从已经组织好的有关大量信息集合中,查出特定的相关信息的过程。u 按照检索对象的不同,可分为文献检索、数值检索和事实检索。u 信息检索利用 检索词 、 检索条件 实现过滤。( 1)什么是信息检索(续)u信息检索包括 存储 和 检索 两个方面。A信息存储的过程 信息采集:根据一定的规则收集信息。 信息标引、著录。对信息的 内容特征 和 形式特征进行揭示和描述。 编制检索工具或建立检索系统。( 2)信息检索原理B信息检索的过程信息存储的逆过程。用户根据 信息需求 ,选取合适的 检索词 (标题、著者姓名、主题词、分类号等),利用 检索工具或检索系统 查找出 相关信息 。查找的过程实际上是一个 匹配 的过程,即确定检索词并将 检索词 与 标引词做 相符性比较 ,二者一致,就算找到了符合要求的信息。( 2)信息检索原理( 2)信息检索原理u 现举例说明信息存储和信息检索的过程。有 3篇文献:文献 1:A Model of multimedia information retrieval文献 2:The Information retrieval in chemistry WWW server文献 3:ERIC resources( 2)信息检索原理:举例u 对 3篇文献的内容进行分析,并使用检索语言对其进行标引,标引结果为: 文献 1 篇名( title): A Model of multimedia information retrieval主题( subject): information retrieval, multimedia computer applicatons 文献 2 篇名( title): The Information retrieval in chemistry WWW server主题( subject): chemistry, educational materials 文献 3 篇名( title): ERIC resources主题( subject): educational materialsu 标引后,这 3篇文献分别被存储到数据库。( 2)信息检索原理: 信息存储过程u 如果用户输入 “information retrieval”一词,并将检索范围限定在 篇名 中,则文献 1、文献 2符合用户要求,成为检索结果。u 如果用户输入 “information retrieval”一词,并将检索范围限定在 主题 中,则只有文献 1符合用户要求,成为检索结果。u 如果用户输入 “educational materials”一词,并将检索范围限定在 主题 中,则文献 2、文献 3符合用户要求,成为检索结果。u 如果用户输入任意其他词汇如 “mathematics”,则没有任何检索结果。u 这里, “information retrieval”、 “educational materials”等就是检索语言,即具体的检索词,篇名和主题就是检索语言的标识。检索系统就是通过他们将 用户需求与 信息内容 进行匹配运算,最终找到检索结果的。( 2)信息检索原理: 信息检索过程u 广义地,信息检索系统是包含了从信息采集到信息检索全过程的服务体系。u 狭义地,信息检索系统就是指用户查找信息所使用的 检索工具 或 系统 。( 3)信息检索系统( 4)信息检索语言A信息检索语言的含义与作用B信息检索语言与自然语言的区别C信息检索语言的类型u 信息检索的实质,就是人们的 信息提问 与信息的检索标识 相 比较 后 决定取舍 的过程。一致,就 “命中 ”了信息。不一致,就继续查找。u 信息的 标识用词 和 检索用词 使用共同的 语言 来表达。u 这种在信息的存储和检索过程中共同使用的语言,就是 信息检索语言 。又称为情报检索语言、索引语言、标引语言。A信息检索语言的含义与作用u 自然语言具有 多义性u 信息检索语言是 人工语言 ,具有 唯一性。u 信息检索语言对要对一词多义或多词一义的语词进行规范化处理,例如:自行车、单车、脚踏车;鲁迅、周树人。u 各种 文献分类法 ,如 中国图书馆分类法 、 国际十进分类法 ,以及各种主题词表 ,如 中国分类主题词表 、 工程索引( Ei)叙词表 等,都是检索语言。B 信息检索语言与自然语言的区别u 信息检索语言按照其构成原理,可分为分类检索语言主题检索语言代码检索语言C信息检索语言的类型D-1分类检索语言 中国图书馆图书分类法 (简称 中图法 ) 中国科学院图书馆图书分类法 (简称 科图法 ) 杜威十进分类法( DDC)与国际十进分类法(UDC) 美国国会图书馆分类法 (LC) D常用信息检索语言介绍u 依据:毛泽东同志在 整党的作风 中的一段话 什么是知识?自从有阶级的社会存在以来,世界上知识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争知识。自然科学、社会科学就是这两门知识的结晶,哲学则是关于自然知识和社会知识的概括和总结。此外还有什么呢?没有了。u 设置 5大部类 22大类,见下表。 中图法 中国 图书馆图书 分 类 法 第一部 类 马 克思列宁主 义 、毛 泽东 思想A 马 克思主 义 、列宁主 义 、毛 泽东 思想第二部 类 哲学B 哲学第三部 类 社会科学C 社会科学 总论D 政治、法律E 军 事F 经济G 文化、科学、教育、体育H 语 言、文字I 文学J 艺术K 历 史、地理第四部 类 自然科学N 自然科学 总论O 数理科学和化学P 天文学、地理科学Q 生物科学R 医学、 卫 生S 农业 科学T 工 业 技 术U 交通运 输V 航空、航天X 环 境科学、 劳动 保 护 科学 ( 安全科学)第五部 类 综 合Z 综 合性 图书u 设置 5大部类, 25大类。u 科图法 五大部类马克思列宁主义 、毛泽东思想哲学社会科学自科科学综合性图书 科图法 00 马克思列宁主义、毛泽东思想 哲学 社会科学 历史、历史学 经济、经济学 政治、社会生活 法律、法学 军事、军事学 文化、科学、教育、体育 语言、文字学 文学 艺术 49 无神论、宗教学 科 图 法 50 自然科学 51 数学 52 力学 53 物理学 54 化学 55 天文学 56 地质、地理科学 58 生物科学 61 医药、卫生 65 农业科学 71 技术科学 90 综合性图书u DDC: Dewey Decimal Classification u UDC: Universal Decimal Classification u 杜威十进分类法 受 美国圣路易斯市图书馆哈利斯分类法 的影响,根据 17世纪 英国哲学 家 培根 关于知识分类的思想,将人类知识分为 记忆 (历史 )、 想象 (文艺 )和 理性 (哲学、即科学 )三大部分,并将其倒置排列,展开为 10个大类 。u 国际十进分类法( UDC)又称通用十进分类法,是在杜威十进分类法的基础上发展而成的,使用十分广泛。杜威十进分类法( DDC)与国际十进分类法(UDC)000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术 (应用科学 ) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科杜威十 进 分 类 法( DDC)与国 际 十 进 分 类 法( UDC) 0 总类、科学和知识1 哲学、心理学2 宗教、神学3 社会科学4 (语言 )5 数学和自然科学6 应用科学、医学、技术7 艺术、娱乐、体育8 语言、语言学、文学9 地理、传记、历史LC共分 20个大类,其中历史占 3个大类,军事占 2个大类。 美国国会 图书馆 分 类 法 (LC)A 总论B 哲学、心理学、宗教C 历史辅助科学D 历史:世界史及世界古代史E/F 历史:美洲史G 地理、地图、人类学、娱乐H 社会科学J 政治学K 法律L 教育M 音乐N 美术P 语言、文学Q 自然科学R 医学S 农业T 技术U 军事科学V 海军科学Z 目录学、图书馆学分类号是字母与数字的组合,如:SB191.P64 爆裂玉米 SB351.C7 甜玉米u 直接以自然语言中代表 事物 、 问题 和 现象 的 术语 作为表达信息主题内容的 检索标识 。例如: 中国分类主题词表 工程索引( Ei)叙词表 D-2主题检索语言7.2 信息检索途径、方法与步骤( 1)检索途径( 2)检索方法( 3)检索步骤( 4)计算机信息检索常用技术A主题途径B分类途径C责任者途径D其他途径包括号码、代码、引文等多种途径( 1)检索途径A常用法包括顺查法、倒查法、抽查法三种。B追溯法包括参考文献法和科学引文法。C循环法又称分段法或综合法,是常用法与追溯法的结合。( 2)检索方法A信息需求分析(主题内容、学科范围、时间范围、信息类型)B选择检索工具(题录、文摘、索引)C确定检索途径(主题、分类、责任者、其他)D选择检索方法(常用法、追溯法、循环法)E查找文献线索F识别文献来源G获取原始文献 (馆藏目录确定馆藏地点、全文数据库、馆际互借 /文献传递)( 3)检索步骤u 布尔逻辑检索AND或 * OR或 NOT或u 位置检索u 截词检索 *、?u 括号检索 ( GPS OR GIS) AND Chinau 字段限制检索( 4)计算机信息检索常用技术字段限制检索u 为减少命中文献的数量,常将 检索范围限定在某个字段或某个范围中 。常用字段: 题(篇)名( Title , TI) 文摘( Abstract Field, AB) 叙词或主题词( Descri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论