信息存储与检索1_第1页
信息存储与检索1_第2页
信息存储与检索1_第3页
信息存储与检索1_第4页
信息存储与检索1_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息存储与检索刘佳信息社会中,你如何生活?早上6点半,刺耳的闹钟铃声响起,打破了卧室的宁静。大学生朱丽从床上一跃而起,开始了新的一天。上午8点她有两节课,下课后要到图书馆复印讲义和查找参考书。五一长假,她打算到外地旅游,需要上网查询天气、机票、酒店等方面的信息。因为是第一次去,她还想了解当地的风土人情、著名景点、特产和商品价格等。明年就要毕业了,她还想从网上看一下就业市场情况。晚上到家,她又累又饿,于是从网上订购了肯德基快餐,边吃边打开电脑,查看电子邮箱。为了完成第二天必须交的信息检索行为研究报告,她登录互联网搜集信息。午夜时分,朱丽才关灯睡觉。信息资源的发展文献资源日益庞大非科技文献,每10年甚至7-8年翻一番科技文献,尤其是尖端科学的文献增加速度更快,如,原子能文献每2-3年就翻一番,且倍增周期逐年缩短据估计目前每年出版的各种类型的科技文献有1000多万篇出版速度加快据国外报导,1990年全世界出版科技文献2000印张/秒4-5种新书/小时新增3种刊物/小时载体形式多样化科学期刊与论文增长速度极为迅速:1665年《伦敦皇家学会哲学论坛》世界第一份科学期刊1750年10种1800年100种1850年1000种1900年10000种1965年突破10万种全世界发表论文的数量每隔一年半就增加1倍信息检索需要解决的问题……如何从信息的海洋中获取我需要的知识?我们淹没在信息的海洋里,但却渴求知识。—耐斯比特学会了信息检索有什么好处?对于科技人员:信息检索是科技人员必备的基本技能信息检索是科学研究的先期工作一个科研人员的时间分配表查资料50%写报告10%实验研究30%计划思考10%

面对日益增长的信息资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息─这就是信息检索所要解决的问题。1974年,美国信息产业协会主席保罗·车可斯基(PaulZurkowski)首先提出信息素养(informationliteracy),又称信息素质。我国国家教委一九八四年下文[8405]要求各高等院校开设文献检索课,作为全校性公共课。并建议由图书馆承担其教学任务。

内容:介绍信息检索的基础知识;了解各类信息源;掌握信息检索的方法、途径步骤;能通过信息网络和计算机信息系统获取信息。

目的:掌握信息检索技能、培养信息意识、提升信息素养。2009年,美国总统奥巴马签署了“国家信息素养宣传月”(NationalInformationAwarenessMonth)议案。信息环境的变化和特点,要求人们必须具备人类的第三种能力—搜商。信息素养信息素养的内涵“利用大量信息工具及主要信息源使问题得到解答的技术和技能。”后来又将其解释为“人们在解答问题时利用信息的技术和技能”。信息素养的内容(1)信息意识:信息意识是指信息与信息事业在人们头脑中反映的总和,它包含了对于信息敏锐的感受力、持久的注意力和对信息价值的判断力与洞察力。(2)信息知识:信息知识是人们在利用信息技术工具、拓展信息传播途径、提高信息交流效率中所积累的认识和经验的总和,它是构成信息素养的基础。(3)信息能力:信息能力指人们获取信息、处理信息、利用信息的能力。如何从浩如烟海的信息资源中提取有用的信息已经成为每个人都必须面对的问题。信息能力成为新时期人们所必须拥有的技能之一。(4)信息道德:信息道德是指人们在信息活动中应遵循的道德规范,如保护知识产权、尊重个人隐私、抵制不良信息等。能力目标Why---为什么学习信息检索What---什么是信息检索How---怎样进行信息检索Where---在哪里进行信息检索How-to-better---如何提高检索效率效果教学目的与意义Knowledge了解相关知识Skill掌握相关技能Tools熟悉各种检索工具Method恰当运用检索方法推荐教材及参考书《信息检索》,毕强张海涛主编,吉林大学出版社《信息检索》,黄如花主编,武汉大学出版社《信息存储与检索技术》,陈次白等编著,国防工业出版社教学内容信息检索概论信息检索技术信息检索系统及应用1.1.1信息概述某海军陆战队在原始森林进行为时一个月左右的生存实验,具体要求如下:第一,每个队员除了身上穿的衣服外,随身只能带三件物品,每件物品不能超过二公斤;第二,队员都是由飞机空降到半径为1000公里原始森林的中心地带,要求在一个月时间内从森林里走出来。问题:队员带哪三件物品合适?第1章信息检索概论1.1信息与信息资源理想的答案:钢刀、火石、指南针人类要在世界上生存与发展要获取物质、能量、信息三大要素。上面例子中的指南针就是我们获取信息的一种工具,有了它,陆战队员们就可以用它获取走出原始森林的方向,没有它,可能一辈子都走不出原始森林。指南针指引的方向就是一种信息,即方向信息和方位信息。信息20世纪40年代,美国数学家克劳特.香农(C.E.Shannon)创立了信息论。信息是在通信的任何可逆重新编码或翻译中保持不变的东西。控制论创使人维纳(N.Wiener)提出,信息是在人们适应外部世界,并且使这种适应为外部世界感觉到的过程,同外部世界进行交换的内容的名称。从概率的角度看,信息是用以消除不确定性的东西。从信息处理的角度讲,信息是数据处理的结果。哲学范畴,信息是以物质能量在时空中某一不均匀分布的整体形式所表达的物质运动状态和关于运动状态所反映的属性。信息信息,它广泛存在于自然界、生物界和人类社会之中,不同的事物有不同的本质、特征、运动规律,事物的特征通过一定的媒介或传递方式(如信号、声波、电磁波、图象等)使其它事物感知。这些能被其它事物感知的表征即为信息,人们就是通过事物发出的这种信息来认识该事物,区别于其它事物。综上所述,信息的定义可以归纳为:信息是事物存在的方式和运动状态及其规律的表征,是事物的一种普遍属性。信息的特征普遍性信息广泛存在于自然界、人类社会及思维领域中。客观性

信息是事物状态和变化的客观反映,是不以人们的意志为转移的客观存在。时效性

信息的时效性是指信息的效用依赖于时间并有一定的期限,其价值的大小与提供信息的时间密切相关。传递性

信息可以在时间上或空间上从一点移动到另一点,可以通过语言、文字、通信、电子计算机等各种渠道和媒介传播。共享性

信息的共享性是指同一内容的信息可以被两个或两个以上的用户同时使用。信息资源在使用过程中不仅不会减值,而且还会增值。依附性

信息是抽象的,必须依附于物质载体而存在。普遍性信息广泛存在于自然界、人类社会及思维领域中。客观性信息是事物状态和变化的客观反映,是不以人们的意志为转移的客观存在。时效性

信息的时效性是指信息的效用依赖于时间并有一定的期限,其价值的大小与提供信息的时间密切相关。

依附性信息是抽象的,必须依附于物质载体而存在。传递性信息可以在时间上或空间上从一点移动到另一点,可以通过语言、文字、通信、电子计算机等各种渠道和媒介传播。

共享性信息的共享性是指同一内容的信息可以被两个或两个以上的用户同时使用。信息资源在使用过程中不仅不会减值,而且还会增值。

知识知识是人们在改造客观世界的实践中所获得的认识和经验的总和。人脑通过对事物发出的信息的接受、选择和处理,形成了概念。在反复的实践和认识过程中逐渐形成知识。知识是信息的一部分。各类知识可以相互渗透、交叉形成新的知识和新的知识门类。知识在生产、传播和使用过程中被不断完善、充实。又可不断派生出新的知识。知识建立在信息的基础之上,是人类通过信息对大自然及人类本身进行挖掘、发现、分析、综合而创造出来的新的信息,是通过实践流动和大脑的思维而总结出来的认识,是改造自然和人类本身必须有的信息活动。情报情报是指被传递的知识或事实,是知识的激活,是运用一定的媒体,越过空间和时间传递给特定用户,解决科研、生产中的具体问题所需要的特定的知识和信息。情报是人们为一定目的而搜集的有使用价值的知识或信息。“是被有目的利用的、活化的知识与信息”。情报是人们搜集到的能为我们所用的新知识或新信息。文献文献的定义文献是记录有信息、知识的一切载体。文献的四要素

知识、信息内容:知识信息性是文献的本质属性。这是文献的核心,是文献所表达的思想意识、知识信息的涵义和内容。

信息符号:是揭示和表达知识、信息内容的标识符号,是物化和标识文献信息内容的工具。如:文字、图形、音频、视频等。

载体材料:是承载文献信息符号,从而使信息内容有所依附并便于传播交流的物质材料。载体材料一般可分为固态和动态两类。可见的物质,如纸、布、磁片等为固态载体;不可见的物质,如光波、声波、电磁波等则为动态载体。

记录方式:是指将包含信息内容的信息符号存储到载体材料上去的方式。如书写、雕刻、打字、印刷、拍摄、录制、复印和计算机录入等。信息、知识、文献、情报之间的关系★图中A表示信息圈:信息中的一部分由感性认识上升到理性认识,形成了知识→→B知识圈;部分信息与知识被载体所记录便形成文献→→C文献圈;有使用价值的文献、信息与知识就是情报→→D情报圈。★从图中还可看出:A区为尚未被认识和加工的信息;B区为未被传递与记载的知识;C区为尚未被利用的文献:D区为非实物载体的情报。

四者相互转化关系示意图:

上图显示,事物可以产生信息→加工后形成知识→记录后形成文献→使用后产生情报→反馈后形成新的信息。同时,上述的过程是可逆的,反过来同样适用。

WisdomKnowledgeInformationDataMorerefinedandabstractInformationHierarchy(二)信息资源信息资源的涵义狭义:信息资源仅指信息内容,是信息本身或信息的集合。广义:信息资源是贯穿于人类社会信息活动全过程的多要素集合。(信息劳动对象、信息劳动设备、信息劳动技术、信息劳动者)信息资源文献型实物型智力型天然型载体形式制作方法刻写型印刷型缩微型声像型电子型加工深度零次文献一次文献二次文献三次文献出版形式图书期刊报纸报告会议文献专利文献学位论文技术标准档案资料政府出版物产品样本图书(Book)国际文献标准认为:凡篇幅达到48页以上并构成一个书目单元的文献叫图书。包括单卷书、多卷书和丛书等。特点:优点:内容全面而系统,观点较成熟。缺点:出版周期长,不能及时、迅速地反映最新科研成果。国际标准书号(ISBN)ISBN(InternationalStandardBookNumber)国际通用的图书或独立的出版物代码,一个国际标准书号只有一个或一份相应的出版物与之对应。2007年1月1日后出版的新书,ISBN由13位组成。ISBN978-7-307-07671-6第一组:前导数字,978或979第二组:国家、语言或区位代码(1-5位)

978-7中国大陆第三组:出版社代码,由各国家或地区ISBN分配中心分给各出版社(2-5位)第四组:书序号,由出版社按出版顺序给出(位数=9-第二组位数-出版社代码位数,最短1位,最长6位)第五组:校验码,1位期刊(Periodical)、报纸(Newspaper)期刊,又称杂志(Journal,Magazine),指定期或不定期的连续出版物。特点:报道速度快、出版周期短、内容新颖、发行及影响面广、及时反映科学技术中的新成果、新水平、新动向。报纸,也是一种连续出版物。特点:传递迅速,发行广泛,信息量大,政策性强。国际标准连续出版物代码(ISSN)ISSN(InternationalStandardSerialNumber)使世界上每一种不同题名、版本的连续出版物都有一个国际性的唯一代码标识。由8位数字组成。前后两段,各4位。中间用连接号相连。前7位为顺序号,最后一位是校验位。格式:ISSNXXXX-XXXXCN国内统一刊号格式:CNXX-XXXX前两位是各省(区、市)区号,后四位是序号。报告(Report)报告是研究人员或企业围绕某一专题从事研究取得成果以后撰写的正式报告,或者是研究过程中每一个阶段进展情况的实际记录。特点:内容详尽、专深会议文献(ConferencePaper)会议文献是指国际学术会议和各国国内重要学术会议上发表的论文和报告。代表某学科领域的最新成就,反映该学科领域的最新水平和发展趋势。是了解国际及各国科技水平、动态及发展趋势的重要情报来源。特点:反映新思想、新观点。专利文献(Patents)广义的专利文献是指一切与专利制度有关的文献,如专利说明书、专利公报、分类表、索引等。狭义的专利文献仅指专利说明书。技术信息的重要来源。学位论文(Thesis,Dissertation)学位论文是高等学校、科研机构的学生为获得学位,在进行科学研究后撰写的学术论文。特点:探讨的问题比较专一,带有创造性研究成果,是重要的文献来源。技术标准(TechnicalStandards)技术标准是一种规范性的技术文件,是在生产或科学研究活动中对产品、工程或其他技术项目的质量品种、检验方法及技术要求所作的统一规定,供人们遵守和使用。是生产技术活动中经常利用的一种情报信息源。档案资料(Archives,Records,Files)档案是指具体工程、项目、产品和商品,以及集团、企业等机构在技术和开发、运行、操作及活动过程中形成的文件、图纸、图片、方案、原始记录等资料。是企业生产建设和开发研究工作中用以积累经验、吸收教训和提高质量的重要文献。特点:由各系统、各单位分散收藏,一般具有保密和仅供内部使用的特点。政府出版物(GovernmentPublication)政府出版物是各国政府部门及其所属的专门机构发表、出版的文件,内容广泛,从基础科学、应用科学到政治、经济等社会科学。特点:具有极高的权威性,对企业活动具有重要的指导意义。产品样本(Catalogue)产品样本是国内外生产厂商或经销商为推销产品而印发的企业出版物,用来介绍产品的品种、特点、性能、结构、原理、用途和维修方法、价格等。有助于了解产品的水平、现状和发展动向,对于产品的选购、设计、制造、使用等有着较大的参考价值。从信息流看各种类型文献内容的不同信息流是如何产生的?从某一新闻事件入手,看看由该事件引起的信息资料是如何演变的。事情发生了......

1989年3月25日ExxonValdex油轮漏油事件,虽然发生在遥远的Alaska,但是几乎在事件发生的同时,消息就出现在电视、广播、报纸和Internet等各种资讯媒体。最原始资讯(initialinformation)

新闻报道资讯的焦点是:who,what,where,andwhen无法关注的是:why特色:即时的消息,概括性的报道几周以后......杂志中陆续刊载相关报道。如ExxonValdex油轮漏油事件:

Church,GeorgeJ.,"Thebigspill"(ExxonValdez

oilspillinAlaska)Timev133,n15(April10,1989):38.Barinaga,Marcia,"Fisheriesfirsttosuffer."(Alaskaoilspill)Naturev338,n6216(April13,1989):533.杂志(Magazines):读者:社会大众(knowledgeablelayperson)范围:通俗话题;最新的事物作者:专业的记者;不一定是该领域的专家;诗人、小说家、评论家时间:新颖(一星期到几个月内的议题或事件)篇幅:250-5,000字內容:仍然较强调报道:who、what、where、when、和why;一般性的讨论;编者的意见;图表;照片;广告。通常不提供资料来源和参考文献。观点:反映编者或是杂志的立场。六个月以后......学术性期刊开始刊载相关主题的文章。学者专家陆续召开相关的学术会议,会议上所发表的文章陆续在期刊上发表,或者是发行会议论文集。

期刊中有关ExxonValdex油轮漏油事件的文章"Alaskanoilspill:legalfallout."Trialv25,n10(Oct,1989):26-33."EnhancedremovalofExxonValdezspilledoilfromAlaskangravelbyamicrobiolsurfactant."Bio-Technology,v8,n.3(1990)228-230.期刊(Journals)和会议论文(ConferencePapers):读者:学者、专家、学生范围:研究结果,通常是理论性的、学术性的作者:该领域的专家、学者时间:新颖(六个月到三年内的研究主题或议题)篇幅:>2,500-10,000字內容:详尽的推演;统计分析;图表;通常附有参考文献观点:理想上是要保持客观和中立;包含大量的专有名词和专业术语,外行人不太容易了解;通常是由专业学会所赞助两年后......

有关该主题或事件的书籍陆续出版。有些主题,可能不用等到两年就有书籍出版;有些可能得等到十年后才会有专门的图书出版;到底得等多久呢,那就得由市场需求、作者和出版社而定了。有关ExxonValdex油轮漏油事件的图书例如:ExxonValdex油轮漏油事件:

TheEconomicsofaDisaster:theExxonValdezOilSpill/1995 SeaOtterSymposium:proceedingsofasymposiumtoevaluatetheresponseeffortonbehalfofseaottersaftertheExxonValdezoilspillintoPrinceWilliamSound,Anchorage,Alaska,17-19April1990/1991.图书(Books):

读者:从一般大众到学者专家,当然包括学生范围:有关某一主题的深入介绍;或是汇编多篇学者专家所撰写有关某一主题的文章作者:学者;专家时间:不一定(两年以上)篇幅:150页以上内容:一般性的探讨或是深入的分析,通常附有完整的参考书目观点:完全取决于作者;可能是由专业学会所出版或是赞助十年后...... 经过了十年左右,对该议题或事件之认识与知识,都已成定论,然后就会被收录在百科全书(encylopedias)、手册(handbooks)、统计汇编(statisticalcompilations)等参考资源中。ExxonValdex油轮漏油事件在百科全书中的记载WhenTechnologyFails:SignificantTechnologicalDisasters,Accidents,andFailuresoftheTwentiethCentury/1994EncyclopediaofEnvironmentalstudies/1991WorldBookEncyclopedia/1997参考资源(ReferenceSources)读者:从一般大众到学者专家,当然包括学生范围:事实性的资讯;概览、摘要性的资讯作者:学者;专家时间:通常得四至十年才会出现在百科全书中篇幅:内容:相关知识的系统性介绍,包括背景,来龙去脉;可能涵盖原始资料、统计、指南、书目等观点:应是客观、中立的;可能是由专业学会所出版或是赞助

网络资源......www

在资讯流中扮演的是什么样的角色?据说每3秒钟,就有一个新的网站成立!

因特网上有关ExxonValdex油轮漏油事件的信息InternationalTankersOwnersPollutionFederation,Ltd.网络资源(WWWResources):读者:一般大众;从儿童到资深公民(seniorcitizens);门外汉;学者;任何人范围:热门话题;个人资讯;最新时事;政府资讯;研究;学术资讯;笑话和游戏;还有.....作者:全宇宙;你、我、他;任何人;专业记者;小朋友;青少年;一般大众;学者和研究人員;诗人和小说家;评论家;狂热份子;广告人;大学生...(数不尽,道不完)时间:超时空;现在、过去、未来;新知旧闻;活的(持续更新)、死的(没有更新)篇幅:高兴就好内容:什么都可以;一般性讨论;编者的意见;图表;照片(吓死人不用负责);广告;统计分析;深入分析;事实;小说;流言(说谎不用缴税)......想要什么,就有什么观点:各凭良心;可能反映编者或是网站架設者的立场;更可能是客观、中立的;可能是学者的专业判断;也可能是完全没有根据的个人主观看法;谁知道啊????资讯资源整理事件的报道

(文献与扩散)时间轴如何找电视/广播/Internetnewsservices秒/分WebSearchTools;TVNewsIndexes报纸(印刷式)天报纸索引杂志(印刷式)周期刊索引期刊(印刷与电子)6个月+期刊索引;书目图书2年+图书馆目录(OPAC)参考资源,如百科全书、手冊(印刷与电子)10年左右图书馆目录(OPAC);书目科技文献资源整理 下面通过示意图,看看随着科学研究项目的深入所产生的各种文献信息源。时间0一年三年二年情报利用二次替代书目之书目文献指南知识综合专著教科书评论百科全书手册知识重组名录词典表格替代文摘书目索引期刊论文预印本论文非正式交流通讯备忘录初步交流简讯快讯发明保护专利文献学术会议会议录预印本研究报告科技报告学位论文研究发展日记实验室笔记查找资料的前提 找资料前,先想想看,你所关心的研究主题位于资讯流的那一点上,再利用适当的参考工具,必能事半功倍,快速找到适用的资料。信息资源文献型实物型智力型天然型载体形式制作方法刻写型印刷型缩微型声像型电子型加工深度零次文献一次文献二次文献三次文献出版形式图书期刊报纸报告会议文献专利文献学位论文技术标准档案资料政府出版物产品样本零次文献:指未以公开形式进行社会使用的实验记录、论文草稿、会议记录、私人日记、笔记、书信、设计草图、内部报告、技术档案等。特点:

新颖、不成熟、难获取一次文献(又称原始文献):是以著者本人的研究工作或研制成果为依据撰写的、已公开发行并进入社会使用的专著、学术论文、专利说明书、科技报告等。特点:有直接参考、借鉴和使用的价值二次文献:是对一次文献经过浓缩、整序、加工处理后,组织成系统的、便于查找和利用的文献。是查找一次文献的线索和工具。如:书目、文摘、索引、题录等。特点:仅对一次文献信息进行系统化的压缩,没有新的知识信息产生。三次文献:在大量利用一次和二次文献信息的基础上,对有关知识信息进行综合、分析、提炼、重组而生成的再生信息资源。如:综述、专题述评、参考工具书、教科书。特点:综合性高、针对性强、系统性好、知识信息面广零次文献是生成一次文献的主要素材;一次文献是最主要的信息资源,是人们检索和利用的主要对象;二次文献是一次文献信息资源的集中提炼和有序化,是检索文献信息资源的工具;三次文献是将集中分散的一、二次文献信息资源,按知识门类或专题重新组合、高度浓缩而成,是人们查考数据信息和事实信息的主要信息资源。在查找文献的具体过程中,一般是先检索二、三次文献,再利用找到的线索检索所需要的一次文献,同时可通过一次文献文后列出的参考文献,进一步扩大阅读范围,以找到有实用价值的文献。1.1.2系统与信息系统1.系统的定义系统一词最早出现在古希腊语中,“sys-tema”指的是由部分组成的整体。系统是具有一定功能的、相互间具有有机联系的、由许多要素组成的整体。依据系统思想建立起来的完整科学体系称为系统科学。2.系统的特性(1)目的性(2)整体性(3)相关性(4)复杂性(5)适应性(6)动态性1.1.2信息系统1.信息系统的构成1)搜集信息子系统2)信息加工子系统3)信息存储子系统4)信息传播/通信子系统5)信息提供子系统信息检索语言使信息按照一定的规则排列起来的方法称为信息检索语言或情报检索语言。信息检索语言

信息检索语言是用来描述信息特征和表达用户提问特征的一种人工语言,是信息检索系统的重要组成部分。信息检索语言的构成

词汇+语法信息检索语言的分类信息检索语言分类检索语言主题检索语言分类主题一体化语言代码检索语言体系分类法组配分类法标题词语言叙词语言关键词语言单元词语言引文型检索语言分类检索语言分类语言是以号码为基本字符,用分类号表达文献主题概念的检索语言。分类法中的类又称类目,指具有共同属性的一组文献资料。文献分类是按照文献中所含知识信息的学科属性,对文献进行区分,进一步根据文献的知识信息内容之间的内在联系组成科学的分类体系,其目的是将同一学科或学科门类的文献集中在一起,便于从学科的角度进行检索和利用。分类法虽然比较具有学科的系统性,但它所能反映的这种科学系统性,只是在一定的限度之内。现代科学由于边缘学科、交叉学科的出现,各门学科互相渗透,互相结合,日益使直线序列的分类法难以反映多元性的知识空间,因而不能确切地代表科学体系。

《中国图书分类法》《中国图书分类法》,简称中图法,是我国当代具有代表性的等级体系型分类语言。基本结构《中图法》等级分明的科学系统

O

一级类目

数、理、化

O1

O3

O4

O6

O7……

二级类目

数学力学物理化学晶体

O11

O12

O13……

三级类目古典数学初等数学高等数学

O121

O122

O123

O124

四级类目

算术

初等代数

初等几何

三角以T-工业技术大类下的TP类展开下位类如下:T工业技术TP自动化技术、计算机技术TP3计算技术、计算机技术TP39计算机应用TP393计算机网络TP393.0一般性问题TP393.01计算机网络理论TP393.02计算机网络结构与设计T—工业技术类中国分类法举例从上表看出分类号的变化体现了各学科体系的从属关系,分类号位数每增加一位,则分类级别便低一级。如TP39代表计算机应用,TP393类目是计算机网络,是TP39的下位类。例如:

O4

物理学F经济

O41理论物理学F2经济计划与管理

O42声学F21经济计划

O43光学F22经济计算

O44电磁学、电动力学F23会计

O441电磁学F24劳动经济

O442电学……F27企业经济

G文化、科学、教育、体育

F270企业经济理论与方法

G3科学、科学研究事业F271企业体制

G35情报学情报工作F272企业计划

G350情报学F273企业生产管理

G351情报工作F274企业成本管理

G352情报资料的搜集研究F275财务管理

G353情报资料处理

G354情报存储与检索一级二级三级四级信息检索语言的分类信息检索语言分类检索语言主题检索语言分类主题一体化语言代码检索语言体系分类法组配分类法标题词语言叙词语言关键词语言单元词语言引文型检索语言主题检索语言由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,按一定顺序排列,通过参照系统揭示主题概念之间的关系,也称主题法。主题语言表达的概念比较准确,具有较好的灵活性和专指性,不同的检索系统、不同的专业领域可以有各自的主题词表。

主题检索语言标题词语言:是从文献的题目和内容中抽出来,经过规范化处理的主题语言。关键词语言:直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。叙词语言:是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语言。单元词语言:词义已是单元概念不可再分,经过规范化处理的主题语言。例:单元词-汽车,温度表,电动机非单元词-载重汽车载重工具

汽车主题检索语言《汉语主题词表》是我国第一部大型综合性汉语叙词表。结构:主表附表词族索引英汉对照索引检索途径:(1)分类途径——根据文献的内容特征,利用分类目录或分类索引查找文献的途径。(2)主题途径——根据文献的主题特征,利用各类主题目录和索引进行检索的途径。(3)题名途径——以文献名称为揭示对象并提供检索的检索途径。(4)著者途径——根据文献的外部特征,利用著者(个人或单位著者)目录和著者索引进行检索的途径。(5)序号途径——根据文献的序号特征,利用其序号索引进行检索的途径。信息检索语言的分类信息检索语言分类检索语言主题检索语言分类主题一体化语言代码检索语言体系分类法组配分类法标题词语言叙词语言关键词语言单元词语言引文型检索语言《中国分类主题词表》2.信息系统的类型(1)按信息系统的规模划分,小型信息系统、中型信息系统、大型信息系统。(2)按信息系统所属的领域划分,工业信息系统、经济信息系统、科技信息系统。(3)按信息系统的分布范围划分,局域网、城域网、广域网、国际互联网、国家信息基础设施(4)按信息系统的使用范围划分,可分为专用信息系统和公共信息系统1.2计算机信息检索1.2.1信息检索的含义广义的信息检索将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。全称又叫信息存储与检索(informationstorageandretrieval)。信息检索是对信息项(informationitems)进行表示(representation)、存储(storage)、组织(organization)和存取(access)。狭义的信息检索

根据特定的需求,利用某种检索工具,按照一定的方法与步骤,从大量文献中查找出符合用户需求的信息与文献的过程。(informationsearch)文献检索与信息检索的区别:

文献检索是以获取文献信息为目的的检索,信息检索则收集、组织、存储一定范畴的信息,并可代用户按需要查询文献中的信息或知识单元,比文献检索更深入。信息检索的常用术语检索词:用户输入的字、词、字符或短语检索式:检索提问表达式检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索式的编制。一般也直接将检索式视为检索策略。1.2.2

信息检索的类型根据检索手段的不同手工检索光盘检索联机检索网络检索根据检索对象形式的不同文献型检索:以文献(包括题录、文摘和全文)为检索对象的检索。数值型检索:以数值或数据为对象的一种检索。事实型检索:以某一客观事实为检索对象。根据检索要求的不同强相关检索(强调查准率)弱相关检索(强调查全率)1.2.2信息检索的原理文本信息的存储和检索的全过程文献的特征(以图书为例)

经济信息检索与利用(第二版)主编詹仁锋张丽大连理工大学出版社出版社著者书名ISBN丛书内容主题信息检索与利用系列教材ISBN7-5611-0184-8/F.16

外部特征内部特征

________________________________________

书名分类著者主题出版社

ISBN

页码装祯价格

……多媒体数据流特征提取识别分类索引检索数据分割多媒体信息分析检索流程通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。简言之,信息检索的原理就是提问标识与文献标识的对比与匹配。

三个重要环节文献替代文献整序文献特征标识与检索提问标识的匹配1.2.2信息检索的原理检索途径:(1)分类途径——根据文献的内容特征,利用分类目录或分类索引查找文献的途径。(2)主题途径——根据文献的主题特征,利用各类主题目录和索引进行检索的途径。(3)题名途径——以文献名称为揭示对象并提供检索的检索途径。(4)著者途径——根据文献的外部特征,利用著者(个人或单位著者)目录和著者索引进行检索的途径。(5)序号途径——根据文献的序号特征,利用其序号索引进行检索的途径。1.2.4

检索工具信息检索工具:是指用于存贮、报道和查找文献线索的工具。检索工具的分类:①目录②题录③索引④文摘目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。

O35/D62分类号索书号《中国图书馆分类法》22个大类一个字母表示一个大类字母加数字表示大类下的小类

O35/D62著者号索书号丁祖荣著者号码表馆藏书目:吉林大学索书号:文种/分类号/作者号(种次号)文种代码:C表示中文图书、E西文、J日文、R俄文;题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式与目录有所不同。

【论文题名】网络环境下信息检索与报道服务浅析

【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云

DINGCai-yun

【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004

【刊名】株洲师范高等专科学校学报

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道

索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。

【论文题名】网络环境下信息检索与报道服务浅析

【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云

DINGCai-yun

【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004

【刊名】株洲师范高等专科学校学报

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道

【摘要】网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.

1.2.5信息检索系统信息检索系统是具有信息存储和信息查询功能的一类信息服务设施(或工具)。1.计算机检索系统:是指包括计算机硬件资源,能完成数据采集、分析、加工处理、存储、检索和传输信息全过程的有机整体。2.信息检索的历史一.手工检索(1876-1945)优点:(1)几乎不需要特殊设备,检索方法简单、灵活;(2)可以边查边思考,随时修改检索策略;(3)无检索经费或费用较低;(4)查准率高。缺点:(1)效率低,检索速度慢,所需时间较长,特别是进行专题检索和回溯检索时需要查阅大量工具书,费时费力;(2)在进行复杂问题的多途径检索时,需要反复查找若干检索工具;(3)查全率一般较低。2.信息检索的历史二.机械检索(1945-1954)

手工检索向计算机检索的过渡阶段。采用单一方法对固定的存储形式进行检索的工具。特点:(1)过分依赖设备(2)检索复杂,成本较高(3)检索效率和质量都不理想2.信息检索的历史三.脱机批处理检索(1954-1965)优点:(1)可同时进行多项检索;(2)可处理检索关系相当复杂的检索词汇;(3)一次输入作业,生产多种输出的多种服务能力。缺点:(1)用户不能在检索过程中与主机进行“对话”和浏览文献;(2)封闭式检索,不能在检索的同时修改检索策略,用户必须事先把可能的途径都考虑周全;(3)不能及时获得检索结果。

2.信息检索的历史四.联机检索(1965-1991)优点:(1)检索速度快,效率高;(2)检索范围广泛、全面;(3)检索途径多,方便、灵活;(4)检索内容新,实时性强;(5)检索辅助功能完善(人机对话、输出方式灵活,输出格式多样)缺点:(1)检索费用高;(2)对检索系统及其数据库的收录、标引、特点较难了解;(3)检索技术和技巧不易掌握。2.信息检索的历史光盘检索优点:(1)存储容量大、体积小;(2)使用方便,易于操作,不需通信联系,不受时间限制;(3)价格低;(4)使用寿命长,用户易接受;(5)机房无特别要求,投资少,要求设备简单。缺点:(1)信息获得比国际联机慢(回溯检索须多次换盘);(2)信息更新不及时。2.信息检索的历史五.网络检索(1991年至今)特点:

(1)信息量大,支持多媒体功能,信息共享。(2)使用方便、灵活,信息即时获取。(3)经济。

(4)信息更新快。(5)检索技术要求不高,检索结果中的误检率较高。3.计算机信息检索系统的组成(1)计算机硬件(2)软件(3)数据库:计算机存储设备上按照一定方式存储的相互关联的数据集合。①字段:组成记录的基本信息单元,是一条完整记录中的每一个著录事项,每个字段描述记录文献的某一方面的特征。②记录:组成数据库的基本单元,一条记录是对某一实体的完整描述。③文档:顺排文档:按记录编号顺序线性排列。倒排文档:将数据库记录中反映文献特征标识(即属性)的某些字段值按某种顺序重新组织构成的文档。(4)通信网络

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论