信息检索与利用第1讲信息基础知识_第1页
信息检索与利用第1讲信息基础知识_第2页
信息检索与利用第1讲信息基础知识_第3页
信息检索与利用第1讲信息基础知识_第4页
信息检索与利用第1讲信息基础知识_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.1信息、知识、情报、文献1.2信息源及分类1.3信息检索原理、工具、语言、方法内容提要第一页,共74页。2信息(information)信息论的创始人香农:凡是在一种情况下能减少不确定性的任何事物都叫做信息。控制论的创始人维纳认为:信息就是信息,既不是物质也不是能量,而是与物质和能量相并列的三大要素之一。可以被看成是物质的一种属性,是对客观世界中各种事物的变化和特征的反应;是客观事物之间相互作用和联系的表现;是客观事物经过感知或认识的再现。1.1信息、知识、情报、文献第二页,共74页。

知识(knowledge):

是人类认识世界的成果或结晶。它包括经验知识和理论知识。即:理性化、优化、系统化了的信息。情报解决特定问题所需要的特殊知识和信息。文献是记录有知识的一切载体。是传递知识和信息的工具。第三页,共74页。4信息、知识、文献之间的关系原料载体信息知识加工、提炼文献系统化信息知识情报文献第四页,共74页。信息的特性客观普遍性依附性可传递性时效性共享性可转换性可识别性第五页,共74页。6信息源:信息的来源,信息来源于自然界、人类社会以及人类的思维活动。分为:口头信息源实物信息源文献信息源1.2信息源第六页,共74页。第七页,共74页。文献信息源的分类方法:按载体形式划分按出版形式划分按加工层次划分按公开程度划分1.2信息源第八页,共74页。文献信息源按照载体类型分为:印刷型文献声像型文献电子型文献网络型文献

1.2.1按载体形式划分第九页,共74页。10

按信息加工层次划分

一次文献二次文献三次文献零次文献1.2信息源第十页,共74页。11一次文献(PrimaryDocument):首次出版的各种文献,主要指作者以本人的研究成果为基本素材而创作或撰写的文献,也称原始文献。如期刊论文、专著、会议论文、专利说明书、学位论文……二次文献(SecondaryDocument):报道和查找一次文献的检索文献,如目录、文摘、索引、各种书目数据库……是在原始文献的基础上,经过分析、归纳、重组后得到的产物。因其具有检索功能而称之为检索工具或检索系统。

按加工层次划分第十一页,共74页。12三次文献(TertiaryDocument):利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书……零次文献(pre-primarydocument):未经出版发行的文献,如作者的手稿,谈话记录、实验记录、书信……零次文献由于没有进入出版、发行和流通这些渠道,一般不能作为我们利用的文献类型。

按加工层次划分第十二页,共74页。一次文献是基础,是检索利用的对象二次文献是检索一次文献的工具三次文献是一次文献内容的高度浓缩

按加工层次划分第十三页,共74页。14请问:这是哪一级别的文献?第十四页,共74页。15请问:这是哪一级别的文献?第十五页,共74页。16请问:这是哪一级别的文献?第十六页,共74页。17常见文献信息特种文献信息1.图书2.期刊、报纸3.科技报告4.会议文献5.专利文献6.标准文献7.政府出版物8.学位论文9.产品资料10.技术档案以上十种文献类型(不包括报纸)是“十大科技情报源”1.2.3按出版形式划分第十七页,共74页。181)图书(Books)定义:以印刷方式单本刊行的出版物。联合国教科文组织规定,50页以上印刷品成为图书。特点:范围广泛,内容比较成熟、系统、全面、可靠。出版周期较长,传递信息的速度慢,新颖性较差。馆藏地:阅览室、各类书库电子资源:超星、书生之家、Springer科研利用率:14%-19%。第十八页,共74页。19(ISBN—InternationalStandardBookNumber)

国际标准号:ISBN7–302–02372–7第一区是语言区,表明这本书是哪个国家出版的。第二区是出版商代码,用于识别出版社,由各国出版主管机构分配。第三区是出版物序号,由各个出版商分配。第四区是一个个位数的校验码,用来核对前9位数字。它的计算方法是:用1-9这9个数依次乘以前面的9位数,然后求它们的和除以11的余数。地区号出版社代码书序码校验码国际标准书号第十九页,共74页。定义:有固定名称、用卷、期或年、月顺序编号,成册的连续出版物。特点:数量大、品种多,内容丰富,出版周期短,报道速度较快,传播、流通面十分广泛,连续性强馆藏地:阅览室、期刊库电子资源:中国期刊网、维普、万方、EI、Springer、Elsevier、INSPEC、Kluwer科研利用率:65%,最重要的一次文献2)

期刊(Serial)第二十页,共74页。刊号ISSN(国际标准刊号)由8位数字组成:7位标准号+1位校验号如:1005-2615(南京航空航天大学学报)CN(国内统一刊号)组成:地区号+报刊登记号+《中图法》分类号如:CN32-1429/V(南京航空航天大学学报)第二十一页,共74页。22科技报告:也称技术报告、研究报告,指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告,是科研工作的系统总结。各篇单独成册,统一编号,由主管机构连续出版。特点:内容新颖、详细、专业性强、出版及时、传递信息快,发行范围控制严格,不易获取原文。馆藏地:外文期刊库电子资源:特种文献数据库、国家科技文献中心、剑桥科学文摘CSA(NTIS)

3)科技报告(Sci-TechReport)第二十二页,共74页。美国政府四大科技报告(NTIS)AD报告PB报告DOE报告NASA报告第二十三页,共74页。24

AD报告AD报告是是美国国防技术信息中心(DTIC)出版的报告,主要报道美国国防部所属的军事机构与合同单位所完成的科研项目。内容涉及与国防有关的各个领域,

如航天航空、舰船、兵器、核能、军用电子等38类,是目前国防科研部门使用价值和频率最高的大宗科技文献。美国政府四大科技报告(NTIS)第二十四页,共74页。25DOE报告DOE报告是由美国能源部科学技术情报局(DOE/OSTI)统一编目通报的科技报告。DOE报告的来源主要为五大能源技术中心和十八个大型实验室(如著名的匹兹堡能源技术中心、巴特尔斯维尔能源技术中心等;洛斯阿拉莫斯科学实验室、橡树岭国立实验室、诺尔斯原子动力实验室等),其他来源还包括俄罗斯、加拿大、以色列及欧盟诸国。内容包括能源保护、矿物燃料、化学化工、风能、核能、太阳能与低热、环境与安全与地球科学等。美国政府四大报告第二十五页,共74页。26NASA报告NASA报告是由美国国家航空宇航局出版的报告。内容侧重于航空和空间科学技术领域,广泛涉及空气动力学、飞行器、生物技术、化工、冶金、气象、天体物理、通信技术、激光、材料等。它的主要任务在于拓展人类认识宇宙的知识。美国政府四大报告第二十六页,共74页。27PB报告PB报告是由美国商务部国家技术情报服务局(简称NTIS),报道美国政府资助的科研项目成果。PB报告的内容已逐步从军事科学转向民用,内容涉及广泛,几乎包含自然科学与工程技术领域所有学科领域。现主要侧重于民用工程技术、城市规划、环境污染和生物医学方面。美国政府四大报告第二十七页,共74页。28定义:学术会议上宣读或交流的论文、会议录中收集的论文或报告。特点:内容新颖、学术性强,能反映某专业国内外最新发展水平。馆藏地:阅览室、期刊库电子资源:EI、INSPEC、IEL等4)会议文献(conferencepaper)第二十八页,共74页。29定义;标准是政府职能部门制定的、要求有关从业人员共同遵守的统一规定。特点:有法律约束力,适用范围明确,是从事生产、设计、管理、产品检验、商品流通、科学研究的共同依据。识别标准文献的主要依据有:标准级别、标准名称、标准号、审批机构、颁布时间、实施时间。馆藏地:民用航空文献阅览室、期刊库电子资源:万方(中外标准数据库)、IEL等5)标准文献(StandardLiterature)第二十九页,共74页。30

标准分为:

国际标准(ISO)国家标准(GB)行业标准企业标准5)标准文献第三十页,共74页。31

国际标准ISO+顺序号+分册号+年份如ISO9592-3a-19925)标准文献标准编号(标准号)是由标准代号+顺序号+年代号

第三十一页,共74页。中国国家标准代号GB强制性国家标准如GB19482-2004

GB/T推荐性国家标准如GB/T3287-2000GB/Z国家标准指导性技术文件如GB/Z20177-2006GJB国家军用标准如GJB390A-20085)标准文献第三十二页,共74页。中国行业标准代号HB/T航空行业标准如HB9102-20085)标准文献第三十三页,共74页。

MasterThesis

6)学位论文

DoctorDissertation定义:学生为获得学位而撰写的学术性研究论文。特点:不公开发表,一般在本单位收藏和流通馆藏地:明故宫图书馆民用航空阅览室电子资源:PQDD、国家科技文献中心、南航博硕士论文全文数据库、中国期刊网、万方第三十四页,共74页。1.2.4按公开程度划分白色文献源:一切公开或内部出版的,通过正式交流渠道发行、流通的出版物。包括图书、报纸、期刊等。灰色文献源:通过非正式流通渠道发行的文献。包括学位论文、技术报告、内部资料等。黑色文献源:人们未破译、未辨识或不愿公开的个人文献。包括个人日记、私人信件、内部档案等。第三十五页,共74页。文献信息源的分类

文献所依附的载体文献信息加工的深度文献的出版发行形式文献内容的公开程度第三十六页,共74页。选用参考文献的原则《中华人民共和国著作权法实施条例》指出:适当引用他人已经发表的作品,必须具备下列条件:(一)引用目的仅限于介绍、评论某一作品或者说明某一问题;(二)所引用部分不能构成引用人作品著作权人的利益。应当是已经公开发表或发布的文献。必须是作者亲自阅读过并对所进行的活动产生了较大影响的文献。不得引而不注或注而不引。不得过度引用。1.2.5文献著录信息识别第三十七页,共74页。参考文献的著录规则

参考文献行文基本格式

作者.论文题目/书名[文献类型].

论文出处,年代,卷、期(出版社,出版年):起止页码1.2.5文献著录信息识别第三十八页,共74页。

图书通常著录格式第三十九页,共74页。期刊论文的著录格式第四十页,共74页。

根据GB3469-83规定,以英文大写字母方式标识以下各种参考文献类型标识:[M]:monograph,专著(书)[C]:conference,会议[D]:Dissertation,学位论文[R]:report,报告[S]:Standard,标准文献[P]:Patent,专利文献

[G]:GovernmentdocumentCumulation,汇编[N]:Newspaper,报纸[DB]:Database,数据库[CP]:ComputerProgram,计算机程序[EB]:ElectronicBulletin,电子公告[MT]:MagneticTape,磁带[DK]:disk,磁盘[CD]:CD-ROM,光盘[OL]:Online,联机网络

第四十一页,共74页。常见参考文献类型例1:WeinsteinL.DigitalFiltersandTheirApplications[M].London,England:AcademicPress,1978,p472-481.文献标识:【M】monograph,专著(书)没有文献标识代码的看出版社和出版地文献著录信息识别第四十二页,共74页。例2:邹振扬,郑绎根.纳米TiO2的光化学特性及其在环境科学中的应用[J].工学材料导报,2000,14(6):35-39例3:D.HillandP.J.Moylan.Thestabilityofnonlineardissipativesystems[J].IEEETrans.Automat.Contr.,vol.AC-21,pp.708-711,1976文献标识:【J】:Journal,期刊没有文献标识代码的看刊名信息和卷期信息文献著录信息识别第四十三页,共74页。例4:

ZhangLingmi.Experimentmodelingofamiddle-risebuilding[A].ProcofInternationalConferenceonStructuralDynamicsModeling[C].2002

文献标识:[A]:analysis,析出,从一个会议录中摘出的[C]:conference,会议没有文献标识代码的看会议名称文献著录信息识别第四十四页,共74页。例5:刘加林.多功能一次性压舌板:中国,92214985.2[P].1993-04-14.文献标识:[P]

Patent,专利文献

没有文献标识代码的看专利号文献著录信息识别第四十五页,共74页。例6:CALMSRB.Infraredspectroscopicstudiesonsolidoxygen[D].Berkeley;Univ.ofCalifor-nia.1965.文献标识码:【D】:Dissertation,学位论文有文献标识代码的看学位授予单位文献著录信息识别第四十六页,共74页。例7:LaiS.T.,MuradE.,andMcNeil,W.J.SpacecraftInteractionswithHypervelocityParticulateEnvironment[R].AIAAPaper2000-0103,Jan.2000文献标识码:[R]report,报告文献著录信息识别第四十七页,共74页。其他文献类型标识文献著录信息识别第四十八页,共74页。电子文献的载体类型及其标识格式是:[文献类型标识/载体类型标识][DB/OL]:联机网上数据库(databaseonline)[DB/MT]:磁带数据库(databaseonmagnetictape)[M/CD]:光盘图书(monographonCD-ROM)[CP/DK]:磁盘软件(computerprogramondisk)[J/OL]:网上期刊(serialonline)[EB/OL]:网上电子公告(electronicbulletinboardonline)文献著录信息识别第四十九页,共74页。请问这是什么类别的文献?DigitalFiltersandTheirApplications.V.Cappellini,AcademicPress,London,England,1978,393p.(0-12-159250-2)Computersecurityandoperatingsystemupdates.Post,G.,InformationandSoftwareTechnology,v45,n8,Jun1,2003,p461-467,0043-1648KnowledgeBasedCollaborationWebs,Shrobe,H.,ADA412519

Computer-assistedlifestories.Benitez,D.ProceedingsofSPIE-TheInternationalSocietyforOpticalEngineering,v3526,1998,p34-42Interactiveandincrementallearningviaamultisensorymobilerobot.Liu,Qiong,Ph.D.,DissertationStanfordUniv.,1980US.Patent4,783,1979第五十页,共74页。1.3.1信息检索原理1.3.2信息检索类型1.3.3信息检索途径1.3.4信息检索方法1.3.5信息检索语言1.3信息检索第五十一页,共74页。信息检索的概念根据特定的需求、运用某种检索工具、按照一定的方法查找所需信息的过程狭义的定义:信息查询广义的定义:信息存储和信息检索信息检索的本质是一个匹配的过程,即用户的信息需求和信息存储的信息集合进行比较和选择的过程。第五十二页,共74页。53

文献特征标引、输入

检索提问

标识文献分析检索工具(系统)检索需求分析是否匹配否输出结果为零得到检索结果是将用户信息需求与检索系统中的文献进行比较与匹配,选取两者相符或部分相符的文献予以输出。(提问标识)存储过程检索过程

信息检索原理第五十三页,共74页。按检索方式划分手工检索计算机检索按检索对象的性质划分文献检索数据检索事实检索

信息检索类型第五十四页,共74页。文献检索:凡以文献(包括文摘、题录或全文)为检索对象的,是一种相关检索,不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。数据和事实检索是对数值、事实检索,提供原始信息,给出直接、确定性的答案。数据检索:以特定的数值为检索对象事实检索:以特定的事实为检索对象

信息检索类型第五十五页,共74页。56所谓的信息检索途径是由提取信息源的外表特征与内部特征形成的,又称为检索点或检索入口。外表特征:文献源的载体、符号系统和记录方式内容特征:文献信息源的信息内容特征与学科属性责任者、题名、专利号、ISBN号等关键词、主题、分类1.3.3信息检索的途径第五十六页,共74页。责任者途径题名途径分类途径主题途径序号途径引文途径1.3.3信息检索的途径第五十七页,共74页。

常规法(直接法):所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。常规法可分为:顺查法:时间上,远近倒查法:时间上,近远抽查法:选择时间段,重点检索

信息检索方法第五十八页,共74页。59

信息检索方法引文法(追溯法):

通过文献间引用和被引用的关系来查找文献的方法。

文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、思路、方法,具有启发意义。

(例如:SCI)追溯法:文献参考文献参考文献……索引法:文献引用文献引用文献……第五十九页,共74页。60综合法:把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附的参考文献进行追溯引文检索,分期分段地交替使用这两种方法。

信息检索方法第六十页,共74页。定义:即检索标识系统,是从自然语言中精选出来并加以规范化的一套词汇符号,用以概括文献内容或外在特征的概念及其相互关系的概念标识体系。检索语言是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。存储的过程中用于标引信息称为标引语言;用于编制索引就称为索引语言;用于信息检索则称为检索语言。

检索语言第六十一页,共74页。检索语言描述文献内容特征分类语言主题语言描述文献外表特征题名(书名、刊名、篇名)著者出版事项代码/序号关键词语言叙词语言标题词语言

信息检索语言类型123第六十二页,共74页。DigitalFiltersandTheirApplications.V.Cappellini,AcademicPress,London,England,1978,393p.(0-12-159250-2)Computersecurityandoperatingsystemupdates.Post,G.,InformationandSoftwareTechnology,v45,n8,Jun1,2003,p461-467,0043-1648KnowledgeBasedCollaborationWebs,Shrobe,H.,ADA412519

Computer-assistedlifestories.Benitez,D.ProceedingsofSPIE-TheInternationalSocietyforOpticalEngineering,v3526,1998,p34-42Interactiveandincrementallearningviaamultisensorymobilerobot.Liu,Qiong,Ph.D.,DissertationStanfordUniv.,1980US.Patent4,783,1979外部特征图书:出版社、图书总页数、ISBN期刊:期刊名、ISSN科技报告:报告号会议文献:会议信息学位论文:学位授予情况专利文献:专利号1第六十三页,共74页。分类语言(内部特征)定义:按照学科知识属性标识和组织信息资料。分类语言是按照一定体系由上至下,从总体到局部,由一般到具体,从低级到高级,从简单到复杂的逻辑次序逐级展开。我国的分类法主要有“中国图书馆图书分类法”简称“中图法”和“中国科学院图书馆图书分类法”简称“科图法”。2第六十四页,共74页。中图法“中图法”采用的是字母与阿拉伯数字相结合的混合小数层累制标记符号。分为5大部类,22个基本大类。中图法五大部类:1、马克思主义、列宁主义、毛泽东思想、邓小平理论2、哲学3、社会科学4、自然科学5、综合性图书第六十五页,共74页。66《中图法》22大类5大部类22大类5大部类22大类马克思主义、列宁主义、毛泽东思想、邓小平理论A马克思主义、列宁主义、毛泽东思想、邓小平理论自然科学N自然科学总论哲学B哲学、宗教O数理科学和化学社会科学C社会科学总论P天文学、地球科学D政治、法律Q生物科学E军事R医药、卫生F经济S农业科学G文化、科学、教育、体育T工业技术H语言、文字U交通运输I文学V航空、航天J艺术X环境科学K历史地理综合性图书Z综合性图书第六十六页,共74页。67T工业技术又分为16个二级类TB一般工业技术TL原子能技术TD矿业技术TM电工技术TE石油、天然气工程TN无线电电子学、电讯技术TF冶金工业TP自动化技术、计算技术TG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论