信息检索与利用笔记 选修课课件_第1页
信息检索与利用笔记 选修课课件_第2页
信息检索与利用笔记 选修课课件_第3页
信息检索与利用笔记 选修课课件_第4页
信息检索与利用笔记 选修课课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《信息检索与利用》总结朱学军2012年10月与信息相关的几个概念

知识是人类大脑活动的产物,是一种升华的信息——高级信息

知识是人类通过信息对自然界、人类社会的认识,是人的大脑通过思维重新组合的系统化的信息的集合。信息是知识产生和形成的基础知识是信息的一部分,不直接等同于信息知识是人对客观事物的认识和经验的总和1.知识(Knowledge)

知识与信息的关系:

人类为了保存信息与知识,使用一定的记录手段将系统化的信息内容存储在某种媒体上,则形成文献。文献是指记录知识的一切载体2.文献(Document)1.纸质文献(印刷型文献)利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。优点:阅读方便,利于流通缺点:笨重、体积大,不易保存,不利于资源共享

是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。2.缩微文献优点:存储信息密度高,体积小,易保存,便于远距离传递。缺点:不能直接阅读,需借助缩微阅读机才能阅读的文献。

以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献3.声像型文献(视听资料)优点:形象、直观;缺点:制作成本高,需要借助一定的设备才能阅读。4.电子信息源(计算机阅读型文献)

以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源

优点:存储密度高,存取速度快,原有记录可以改变更新,可以提供多维、有序化的可操作功能,便于检索。

指未经公开发表或未交流于社会的文献不同加工深度的文献信息源

1.零次文献

私人笔记、设计草图、实验记录、论文草稿、会议记录、书信2.一次文献(检索的目标)

指以著者本人的研究成果为依据而创作或撰写,并通过某种渠道而公开的文献

期刊论文、科技报告、会议论文、学位论文、专利文献、技术档案二次文献与三次文献的区别:对象不同二次文献以“篇”或“本”为单位进行加工;三次文献则归纳了较多的一次文献内容。用途不同二次文献为检索一次文献的工具;三次文献能直接提供检索答案。学习文检课的目的之一:如何通过二次文献去查找一次文献

信息组织是指对大量的信息(主要指文献信息)进行收集,并对其进行组织和控制,使之有序化的过程。无序信息流信息组织是信息检索与传播的前期准备有序信息流

信息组织

信息筛选

信息描述

信息存储第一节信息组织的基本程序与方法(一)信息外表特征的描述与标识

信息的外表特征是指信息的名称、来源、加工者、类型及表现形式等内容。期刊论文:

文献的题目、著者、著者单位、文献出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量、刊号图书:

书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号不同的检索系统(数据库)所描述的项目与标识符有所不同(二)内容特征的描述与标识信息内容特征描述是指在对信息内容进行分析的基础上,根据一定的规则对信息的内容予以揭示,并赋予标识的过程。

具体项目:分类号、主题词、文摘信息内容特征描述也称为对信息内容的著录与标引信息内容特征描述分类描述(分类法)主题描述(主题词法)信息检索语言:根据信息检索的需要创造的一种人工语言马克思主义、列宁主义、毛泽东思想哲学社会科学中国图书馆分类法的体系结构部类(5个)自然科学综合性图书基本大类(一级类目)22个主题语言:自然语言和人工语言(三)信息著录格式及文献类型辨识方法

科学技术文献(1)科技图书(2)科技期刊(3)科技报告(4)会议文献(5)专利文献(6)标准文献(7)学位论文(8)产品资料(9)技术档案(10)科技报纸出版特征(著录格式):十大情报源1.AnckerJrCJ,GafarianAv.Somequeueingproblemswithbalkingandreneging:I.OpnsRes.1963,11:88-1002.AndersSkyttebol,LennartJosefson.Numericalsimulationofflashbutt-weldingofrailwayrails.Proceedings7thInternationalSeminaronNumericalAnalysisofWeldability,GrazSeggau(Austria)September-October2003,pp21-303.Pollard,F.H.;Cannizzard,S.InvestigationofpulsatingflowhydraulicConcepts.Finalrept.1May64-1Jul65.1965,p.1-1404.Amoozegar,SeyedFared.Neuralnetwort-baseddetectionandtrackingofmaneuveringtargetsinclutterforradarapplication.Ph.D.TheUniversityofArizona.1994,276pp5.SkolinkMI.Radarhandbook[M].NewYork:McGraw-Hill,1990科技期刊H.Tohyama①,AplasmaImagebarforanelectrophoto--graphicprinter②,JournaloftheImagingScience③,Vol.35④NO.5⑤,330-333⑥(Sept-Oct1991)⑦辨识方法:刊名(Journal或J.或缩写,有时斜体)、年、卷、期、页码等会议文献A.M.Heyman.①Low-profilehigh-frequencyoff-linequasi-resonantconverter.②ProceedingsofIEEEAppliedPowerElectronicsConferenceandExposition.③1987,V.169,P.42-47④注释:①作者②篇名③会议名称(常用的会议特征有Conference,Congress,Symposium,Convention,Workshop等,常用的主办会议的机构特征有Society,Association等);④会议文献的年卷期以及页码。会议文献的识辨特征有:如会前出版物的Paper,会后出版物的Proceedings等。学位论文ENGINEERING,ELECTRONICSANDELECTRICAL①Neuralnetwort-baseddetectionandtrackingofmaneuveringtargetsinclutterforradarapplication②.Amoozegar,SeyedFared③,Ph.D.④TheUniversityofArizona⑤,1994⑥,276pp⑦.Director:MalurK.Sundareshan⑧注释:①类目名称;②论文题名;③著者;④学位级别;⑤授予学位单位⑥授予学位时间⑦原文页码⑧指导教师辨识方法:篇名一般著有学位和学位论文的名称,如Ph.D.Dissertation即哲学博士学位论文,若硕士论文则为MasterThesis,此外标有学位论文名称、颁发学位的单位及学位授予时间等信息标准文献BSI,“Specificationforcommunicationandinterferencelimitsandmeasurements”,BS6839-1987标准文献著录的特点是:1、通常有表示标准的词如standard,recommendation,Specification等;2、有标准号。标准号每个标准一个号,并按惯例由标准颁布机构代码,顺序号和颁布年份三部分构成,如本例的“BS6839--1987”。科技报告报道(记录)研究和开发调查工作的成果或进展情况的一种文献类型,一般都编有号码,供识别报告本身及其发行机构。可以说,报告是一种典型的机关团体出版物,常用的报告名称有:科技报告按报告的形式可分为:report(报告书),technicalnotes(技术札记),memorandum(备忘录),papers(论文),bulletin(通报),technicaltranslations(技术译丛),specialpublications(特种出版物)。参考文献类型及文献类型标识专著--M会议论文集--C报纸文章--N期刊文章--J学位论文--D报告--R标准--S专利--P非电子出版物的著录格式——

[序号]作者.题名[J].刊名,出版年,卷(期):起止页.[序号]作者.题名[N].报名,出版年-月-日(版次).[序号]作者.题名[D].地点:学位授予单位,年份.[序号]作者.书名[M].出版地:出版者,出版年:引文页.[序号]标准代号标准顺序号—发布年标准名称[S].

(多作者可列出前3位,其后加“等”)

非电子出版物的著录示例——

[1]杨平,冯贤平.偏压对空心阴极放电等离子体溅射制备氮化碳薄膜的影响

[J].物理实验,2005,25(12):15-19.[2]LeuenbergerUA,BrubakerD,QuraishiS.Effectsofintermittenthypoxiaonsympatheticactivityandbloodpressureinhumans

[J].AutonNeurosci,2005,121(1-2):87-93.[3]翟裕生,邓军.古大陆边缘成矿系统[M].北京:地质出版社,2002:55-65.[4]

雷和平,林之诠.西部能源开发区现状解析[N].

金融时报,2005-12-20(C09).[5]罗凯.怀槐培养细胞生产异黄酮的条件优化与控制[D].合肥:合肥工业大学,2005.[6]GB/T5009.204—2005食品中丙烯酰胺含量的测定方法

气相色谱-质谱(GC-MS)法[S].

非电子出版物中专利文献的著录格式——

[序号]专利申请者.题名:专利国别,专利号[P].公告日期.[7]北京佳讯飞鸿电气有限责任公司.呼叫延伸系统及呼叫处理方法:中国,1822625[P].2006-08-23.[8]KURITAWATERINDLTD(JP).ELECTRICDEIONIZINGAPPARATUS:JP,2004082092[P].2004-03-18.

电子文献的著录格式——

[序号]作者.

题名[文献类型/文献载体].出版地:出版者,出版年(更新或修改日期)[引用日期].获取和访问路径.

在以上著录项目中:[文献类型/文献载体]一项对电子文献是必须的;[引用日期]、获取和访问路径——这两项,对电子文献中的联机文献是必须的。上述三项对非电子出版物都是可以任选的!

文献类型与标志代码——

期刊(J),专著(M),专利(P),报纸(N),汇编(G),报告(R),标准(S),论文集(C),学位论文(D),数据库(DB),计算机程序(CP),电子公告(EB).

电子文献载体与标志代码——

磁带(MT),磁盘(DK),光盘(CD),联机网络(OL).

一、信息检索的类型1.按检索对象内容划分(1)文献检索(DocumentRetrieval)检索的结果是文献资料,查找相关文献的内容、出处、收藏单位等。如系统地查找水压伺服控制阀原理方面的相关文献<论文>

(2)数据检索(DataRetrieval)以数值信息为检索对象,通过检索,用户可获得所需要的确切数据。如某种材料的电阻;化学分子式、数据图表等<手册>

(3)事实检索(FactRetrieval)检索的结果是事实结论,查询某一事务(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品的生产厂家,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>

第二节信息检索的类型、程序与方法(2)计算机检索2、按照信息检索手段划分(1)手工信息检索从内容单一、编排粗糙的文献检索刊物发展为形式多样、功能齐全、复盖所有知识门类的文献信息检索体系。经历单机检索、光盘检索、国际联机检索、数据库的网络化检索等阶段。

信息检索的程序是指根据课题的要求,选择相应的信息检索工具或系统,采用适当的途径和技术,查找所需文献的过程。(一)分析与研究课题目的:科研立题、科研阶段性研究、科研成果鉴定、申请专利、撰写论文、综述、述评…基本要求:检索的时间范围、文献类型、检索深度为题录、文摘还是全文等结果要求:了解某一理论、方法、设备、过程等的具体的片断的信息,以解决研究中的具体问题,要求“准”;申请发明,申报成果奖励、鉴定科研成果以及立项查新,往往需要全面的收集某一主题范围的文献信息,这类课题具有普查追溯的特点,应着眼于“全”三、信息检索的基本程序(二)选择检索工具或数据库

选择合适检索工具的前提是对网络资源有一个较全面的、清晰的了解,具体地说要对检索工具的类型、内容特点、时间范围、学科范围、甚至出版商的大体情况都要有一个了解。方法:1、注重平时的积累2、不要盲目检索,应养成检索前了解一下数据库的习惯3、注重与他人的交流4、重视图书馆主页的资源(三)确定检索途径以文献的外部特征为检索途径(1)题名途径(2)责任者途径(3)号码途径(4)机构途径2.以文献信息的内容特征为检索途径(1)分类检索途径(2)主题检索途径3.以文献的相互引证关系为检索途径 (四)编制检索提问式1、主要的检索技术1)、布尔逻辑算符组配检索

是将多个检索词进行逻辑组配形成的一种复合性检索要求。(1)逻辑与用符号“AND”“

and”或“*”表示,

其逻辑表达式为:AandB或A*B

其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。AB

其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。AB(2)逻辑或用符号“OR”“or”或“+”表示,其逻辑表达式为:AorB或A+BAB同义词是文献检索中的永恒难题!w词表中与“规程”对应的英文词:codes,regulation,rules,specificationsw词表中与“清晰度”对应的英文词:definition,resolution,sharpness

其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。

AB(3)逻辑非9用符号“NOT”“not”或“-”表示,其逻辑表达式为:AnotB或A-B2)、位置逻辑算符

它是用位置逻辑算符表示词与词之间的相互位置关系和前后次序。(1)(W)——表示两个词之间不得有词或其他字母,可有一空格或标点符号或连字符“—”,词序不得颠倒。(2)(nW)——表示各检索词之间允许插入最多n个词,词序不能颠倒。如:智能机器人(3W)控制,可检出“智能机器人控制”,“智能机器人行为控制”等(3)(nN)——表示各检索词之间允许插入最多几个词,词序可以颠倒。如:智能机器人(3N)控制,可检出“智能机器人控制”,“…控制算法对智能机器人的影响”等(4)(S)——是“Sentence”的缩写,表示各检索词必须同时在一个句子中出现,词序可任意变化,且各词间可任意加词。(5)(F)——是“Field”的缩写,表示各检索词必须同时出现在文献记录的某个或某些字段中。3)、截词(模糊检索)(1)截词主要是利用检索词的词干或不完整的词形进行检索。A、后方截断(无限截)

Computer(计算机)Comput?Computer、Computers、Computerise、Computerize等均为命中。B、前方截断

后方一致派生词的检索。把截词符放在字根的左边,如?Conputer,那么在计算机检索时,索引词Microcomputer均算命中。C、有限截断

就是检索词后加一个或一个以上的(最多不超过四个)“?”,空一格再加一个“?”。如:Conputer??D、中间截

就是在一串字符中插入一个或一个以上“?”,表示在该符号的相应位置上可转换数目相当的字符。M?n相当于man、men4).限制检索A、字段限定检索利用字段进行限制,如题名、摘要、全文等,通常的字段限制范围的大小顺序是:题名<关键词<摘要<全文B、二次检索在前一次检索的结果中进行另一概念的检索5)、词组检索(精确短语检索)

通常用“”或{}来表示两词是作为一个词组来检索的。如“profit

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论