版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基础知识第1页,共80页。一、信息、知识与文献的含义信息:客观事物存在方式及其运动规律、特点的外在表现。信息属性:普遍性、客观性、中介性、无限性、传递性、时效性、依附性、共享性…….第2页,共80页。知识:人类对客观事物的存在和运动规律的认识。
一是知道是什么二是知道为什么三是知道怎样做四是知道谁有知识
1996年,世界经济合作与发展组织在《以知识为基础的经济》报告中,将知识分为四类:第3页,共80页。加工升华精炼系统组织
信息知识第4页,共80页。信息知识事物存在方式、运动状态外在表现信息经过大脑加工信息信息与知识关系第5页,共80页。信息文献:记录有知识的一切载体。文献内容记录符号载体材料记录方式
文献构成要素第6页,共80页。二、文献信息源类型1.按文献信息的物质载体和记录形式划分手写型文献印刷型文献缩微型文献声像型文献电子型文献第7页,共80页。第8页,共80页。2.按文献信息的出版形式和内容划分图书期刊科技报告会议文献专利文献学位论文标准文献产品资料政府出版物技术档案第9页,共80页。3、按文献信息的加工程度划分一次文献:作者以本人的研究成果为依据二创作或撰写的文献。二次文献:将大量分散的、物组织的一次文献,依一定的方法和原则进行浓缩、整序、加工、编辑后,组织成系统的便于管理和利用的文献。三次文献:在一、二次文献的基础上进行广泛深入的研究之后,通过汇集、综合、分析等深度加工而形成的文献。第10页,共80页。
三、文献信息检索的类型
1.按文献信息检索对象划分文献信息检索数据信息检索事实信息检索第11页,共80页。
文献信息检索
以文献信息为检索对象,从文献信息存储集合中查找出特定文献的过程。
文献信息检索是信息检索中最主要、最基本的形式。
第12页,共80页。范围—某一课题、某一作者、某一地域、某一机构、某一事物的有关文献;工具—二次文献(检索工具或系统);性质—“相关性”检索;结果—文献的线索或原文。第13页,共80页。
例:国内外转基因食品发展趋势研究中国动物药产业发展方向方面的文献食品安全研究有关文献
第14页,共80页。数据信息检索以数据信息为检索对象,从数据信息存储集合中或从文献中包含的数据中查找某一数据信息的过程。
第15页,共80页。范围—数据图表、公式、图谱、市场行情、物质的物理与化学特性、物质的材料成份、设备的型号与规格、参数等;工具—主要三次文献(参考工具书、数据型数据库);性质—“确定性”检索;结果—有、无、对、错。第16页,共80页。
例如:查找:2011年吉林省玉米产量(万吨)
第17页,共80页。事实信息检索以事实信息为检索对象,从存储事实的信息集合中查出特定事实的检索过程。
第18页,共80页。范围—事物的基本概念、基本情况,事物发生的时间、地点、相关的事实与过程等;工具—主要三次文献(参考工具书、事实型数据库);性质—“确定性”检索;结果—有、无、对、错。第19页,共80页。例:“转基因植物”的概念吉林农业大学地址……….第20页,共80页。参考工具书字、词(辞)典百科全书手册年鉴、统计数据图谱年表人名录、地名录、机构名录第21页,共80页。三者的关系:
文献信息检索与数据信息检索、事实信息检索三者在信息检索过程中通常是相互配合、相辅相成的,检索时常常配合使用,从而检索出最适用文献。第22页,共80页。2.按文献信息检索方式划分手工检索计算机检索第23页,共80页。3.按文献信息组织方式划分全文检索超文本检索超媒体检索第24页,共80页。四、文献信息检索工具(系统)类型目录型题录型文摘型全文型第25页,共80页。五、文献信息检索原理
通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索工具(系统),用户将提问标识与存储在检索工具(系统)中的文献特征标识进行大小同异比较,凡是两种标识相一致,或者文献特征的标识包含着检索提问标识,则表明所检文献切题,即从检索工具(系统)中输出。第26页,共80页。文献信息检索原理示意图第27页,共80页。六、文献信息检索语言文献信息检索语言的概念
从自然语言中精选出来并加以规范化的一套词汇、符号,是概括信息内容特征或外在特征及其相互关系的概念标识体系。第28页,共80页。外表特征
题名、作者、出版社、号码等内容特征
分类、主题、代码等
第29页,共80页。文献信息检索语言作用
文献信息检索语言是沟通文献信息存储与检索两个过程的桥梁。在文献信息存储过程中,用它来描述文献信息的内容和外部特征,从而形成检索标识;在检索过程中,用它来描述检索提问,从而形成提问标识;当提问标识与检索标识完全匹配或部分匹配时,结果即为命中文献。第30页,共80页。文献信息检索语言类型第31页,共80页。分类检索语言
按学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。第32页,共80页。
《中国图书馆分类法》22个基本大类:A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律第33页,共80页。E军事F经济G文化、科学、教育、体育H语言、文字I文学K历史、地理第34页,共80页。
N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学第35页,共80页。
T工业技术U交通运输V航空、航天X环境科学、劳动保护科学Z综合性图书第36页,共80页。《中国图书馆分类法》片断第37页,共80页。学科分类按学科“分类检索”实例第38页,共80页。主题检索语言
将自然语言中的名词术语经过规范化处理后作为文献信息标识的一种主题法检索语言。第39页,共80页。
主题词:以规范化的词汇来表达文献信息内容的主题,这种词汇叫主题词。主题词根据规范性、检索时要求不同可细分单元词、标题词、叙词等。
第40页,共80页。自然语言主题词酒精乙醇土豆马铃薯伪钞鉴别验钞杜鹃杜鹃(花)杜鹃(鸟)世贸组织世界贸易组织第41页,共80页。主题“主题检索”实例第42页,共80页。关键词语言关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词选取一般由计算机自动抽取。第43页,共80页。引文语言
引文语言根据现期期刊或少量丛书中发表的文章(称引文文献)后面所附的参考文献(即被引文献)的著者(即被引著者)的姓名组织编排文献的。引文语言利用文献之间的引用与被引用关系,来表达文献之间的相互关系。第44页,共80页。表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。第45页,共80页。八、文献信息检索的基本方法1.常规法
根据文献的外部特征和内容特征,即以主题、分类、著者等为检索点,通过检索工具(系统)获取所需文献信息的一种检索方法分为顺查法、倒查法和抽查三种。第46页,共80页。顺查法:按着时间顺序,由远及近、从过去到现在利用检索工具(系统)逐年、逐卷地查找文献信息,直到满意为止的一种检索方法。
倒查法:又称为逆查法,与顺查法相反,按照文献信息检索要求的时间范围,由近到远、从现在到过去逆着时间的顺序利用检索工具(系统)查找文献信息的一种检索方法。抽查法:一般是针对某学科发展特点和规律,抓住该学科发展较快、文献信息发表较多的高峰年代,抽出这段时间进行重点检索文献信息的一种方法。第47页,共80页。2.追溯法
又称为引文法、追踪法,利用文献末尾所附参考文献和注释为线索逐一地追溯查找原始文献的方法。3.循环法
又称为综合法、交替法,它是把常用法和追溯法结合起来查找文献信息的方法。循环法既要利用检索工具(系统)进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。第48页,共80页。九、计算机信息检索技术
计算机检索技术主要指检索词的组配技术和检索表达式的构成规则。检索词包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。检索表达式简称为检索式,又称为检索提问式,主要是运用各种逻辑运算符号、位置逻辑算符、截词符及其它限制符号等,把检索词连接组配起来,确定检索词之间的关系,准确表达检索课题的内容。它是一个既能反映检索课题内容、又能为计算机识别的算式,是进行计算机检索的依据。第49页,共80页。布尔逻辑检索技术
采用布尔代数中的布尔关系运算符来表达检索词之间关系的检索方法。布尔逻辑算符主要有:逻辑与(AND*)、逻辑或(OR+)、逻辑非(NOT-)第50页,共80页。第51页,共80页。
名称符号表达式功能逻辑与*或andA*B|空格同时含有提问词A和B的文献,为命中文献逻辑或+或orA+B凡是含有提问词A或B的文献,为命中文献逻辑非-或notA-B凡是含有提问词A但不含有B的文献,为命中文献第52页,共80页。刘亦菲照片│刘亦菲写真“逻辑或”实例第53页,共80页。百度高级搜索用“包含”、“不包含”等词表示“逻辑与”和“逻辑非”“布尔逻辑”应用实例第54页,共80页。布尔逻辑算符的运算次序:NOT>AND>OR()号里的部分运算优先例如:(AORD)ANDB表示先执行“AORD”的检索,再与B进行AND运算。第55页,共80页。
位置检索技术
位置检索技术就是利用一些特定的位置算符来表达检索词之间的位置关系。[注意]检索系统不同,位置算符的规定也不尽相同。第56页,共80页。
位置算符主要有:邻近位置算符W、N、nW、nN句子位置算符S(Sentence)字段位置算符F(Field)…..第57页,共80页。(W)或()━with。W算符两侧的检索词间为空格或标点符号,词序不变。X(w)RAYXRAY或X-RayCD(W)ROMCD-ROM(nW)——nWord允许算符两侧的检索词之间最多可插入n个词,词序不变。蔬菜(2w)栽培蔬菜的栽培蔬菜无土栽培第58页,共80页。(N)——near算符两边的检索词不允许插入其他单词或字母,词序可以颠倒规模化(N)饲养规模化饲养饲养规模化
(nN)算符两边的检索词允许插入n个其他单词或字母,词序可以颠倒规模化(5N)饲养规模化饲养饲养规模化规模化畜牧饲养规模化商品肉猪的饲养第59页,共80页。F━Field“F”的含义为“field”。算符两侧检索词必须在同一字段中出现,词序不限,中间可插任意检索词项。黑木耳(w)多糖(F)抑菌/题名,文摘S━sentence算符两侧检索词同时出现文献记录的同一句子或短语中,词序不限。玉米(w)杂交(S)鉴定第60页,共80页。
截词检索技术又称部分一致检索,截词检索技术就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。
第61页,共80页。有限截词一个截词符号代表一个字符?#等computer??computercomputers
无限截词一个截词符号代表一个字符,也称为通配符*等computer*computerscomputeringcomputeredcomputerization第62页,共80页。
按截断的位置来分,截词技术有后截断、前截断、中截断和中间截断四种类型。第63页,共80页。
后截词检索
(前方一致)
将截词符号放置在截词的后方,同截词符号前面的字符串信息相同,即为命中。如:生产??—生产,生产力,生产工具,生产方式
第64页,共80页。
前截词检索(后方一致)
将截词符号放置在截词的前方,同截词符号后面的字符串信息相同,即为命中。
如:??英语考试—四级英语,六级英语,研究生英语考试
第65页,共80页。
中截词检索(前后一致)
将截词符号放置在截词的中间,同截词符号前后面的字符串信息相同,即为命中。如:信息??类型一信息资源类型,信息交流类型
第66页,共80页。
前后截词检索(中间一致)
将截词符号放置在截词的两侧,同截词符号中间字符串信息相同,即为命中。如:*考试*——英语考试,考试试题,计算机等级考试指南,考生考试前的心理调整等。
第67页,共80页。前方一致、完全匹配、任意匹配“截词”应用实例第68页,共80页。
限制检索技术又称字段检索法,指限定检索词必须在数据库记录中规定的字段范围内出现的一种检索方法。缩小和限定检索范围,提高查准率。第69页,共80页。
数据库指长期存储在计算机内,有组织、可共享的数据集合。第70页,共80页。数据库构成
数据库构成:字段、记录和文档三个层次。字段(基本字段、辅助字段)→记录→文档(顺排文档、倒排文档)→数据库第71页,共80页。
字段(Field):字段是组成记录的数据项,是记录的基本单元。描述文献信息具体特征,如篇名、作者、主题词等。一条记录可有若干个字段,字段决定着检索点的数量设计。字段分为基本字段和辅助字段。第72页,共80页。
基本字段主要是描述文献内容特征的字段,如篇名、文摘、叙词、自由标引词等字段;辅助字段主要是描述文献外表特征的字段,如著者、机构名称、语种、文献来源等字段。
第73页,共80页。字段字段“限制检索”实例第74页,共80页。十、文献信息检索程序分析检索要求,确定检索范围;选择检索工具(系统)和方法;选择检索途径和检索标识;调整检索策略,筛选检索结果;记录文献线索,获取原文。第75页,共80页。
十一、信息检索效果评估
所谓检索效果,就是利用检索工具(系统)开展检索服务时产生的有效结果。第76页,共80页。
查全率与查准率查全率=检出相关文献量/文献库内相关文献总量×%如:利用某个检索系统查找某课题,假设该系统文献库中共有相关文献总量为40篇
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026新疆第七师医院医共体上半年招聘87人备考题库及完整答案详解1套
- 2026上海虹口区卫健系统招聘38人备考题库带答案详解(培优b卷)
- 2026重庆长江轴承股份有限公司招聘122人备考题库完整附答案详解
- 2026湖北黄石市大冶市事业单位统一招聘118人备考题库含答案详解【达标题】
- 2026湖北中联太工程造价咨询有限公司招聘备考题库附答案详解(轻巧夺冠)
- 2026郑州大学附属郑州中心医院上半年博士招聘备考题库(考点梳理)附答案详解
- 2026广东佛山市顺德区乐从第一实验学校(教务文员)招聘1人备考题库及答案详解(新)
- 2026山东济南市妇女儿童活动中心幼儿园(领秀公馆园)招聘实习生备考题库附参考答案详解【完整版】
- 2026广东广州民间金融街管理委员会招聘辅助人员1人备考题库及参考答案详解【突破训练】
- 中移动金融科技有限公司2026春季园招聘备考题库含答案详解(满分必刷)
- 《频率与概率》课件
- DB33T 968-2015 热处理电炉可比单位产品电耗 监测技术要求
- 五年级下册字谜故事带答案
- 中药学重点完整版本
- GB/T 29038-2024薄壁不锈钢管道技术规范
- 《农业经营与管理》考试历年真题考试题库(职校用)
- 实验诊断概论课件
- 废旧纸再生利用项目计划书
- 群众工作方面存在问题及整改措施
- 三年级全册道德与法治教案
- 高原性低氧症护理
评论
0/150
提交评论