信息检索-安徽工业大学图书馆_第1页
信息检索-安徽工业大学图书馆_第2页
信息检索-安徽工业大学图书馆_第3页
信息检索-安徽工业大学图书馆_第4页
信息检索-安徽工业大学图书馆_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索,安徽工业大学图书馆 盛功平 副研究馆员,信息检索教学大纲,学时:20学时(其中理论课14学时,实验课6学时 )。 教学目的:通过学习本课程,可以使大学生获得一定的信息收集、整理、加工与利用的能力(即获得信息检索的基本知识和基本技能),以利其学期或毕业论文的顺利完成;同时,促进大学生的信息意识、信息价值、信息道德与信息安全等方面的观念的形成与发展,综合信息素养有所提高,以便将来更好地适应信息社会的需要。,教学要求:通过本课程的学习,希望学生能够掌握文献信息检索的基础知识和基本原理,较为熟练地利用图书馆各种网络学术数据库来检索、获取学习中所需的文献信息,并学习和掌握科学论文和文献综述写作

2、的基本格式和方法。 教学内容:本课程将在较为系统地介绍信息检索的基本理论知识和基本检索技能的基础上,着重介绍计算机联机信息检索、光盘信息检索、网络数据库信息检索和网上信息资源检索等现代信息检索技术,向广大学生介绍国内外著名的光盘数据库、网络数据库、网上信息资源等数字化信息资源及其检索与利用方法,以及科学论文和文献综述的写作方法。,总评成绩计算,总评成绩有3个部分组成,所占分数的比例为: 上课考勤:30% 平时作业:30% 期末考试或期末论文:40% 没有上课考勤记录的就是有平时作业和期末考试也作不合格计算。,教 学 安 排,第一章:计算机信息检索概论 第二章:中文数据库及其检索方法 第三章:

3、外文数据库及其检索方法 第四章: 网络信息资源及其检索方法 第五章:各专业及特种信息检索 第六章: 文献综述与学术论文的写作,绪 论:学习信息检索的意义*,1促进智力资源的开发与利用,推动社会进步与发展 在数千年的人类文明发展中,生产和积累了大量的文献信息资料,成为人类社会的一个巨大的知识宝库,充分检索和利用这些文献资料所包含的信息和知识,是开发人类智力资源的重要而有效手段。 信息检索就像一把开启知识宝库的钥匙,掌握并有效利用它,便能获得和利用人类的精神财富,并使其转化为社会物质财富,并创造出更多的精神财富,推动社会的进步和发展。,2继承和借鉴前人/他人的成果,避名重复研究,科研人员在开始着手

4、研究一项课题前,必须利用信息检索的方法来了解这个课题是如何提出来的,前人或他人在此方面已经做什么工作,是如何做的,有何成果和经验、教训,还存在什么问题,等等。只有这样才能正确地制订研究方案,防止重复研究,提高研究起点,降低研究过程中获取信息和知识的成本。,3有利于提高自学能力,培养创新人才,在信息社会、知识经济时代的今天,劳动者不仅要有生产经营的知识和技能,而且更要有善于收集、加工、处理和应用知识与信息的能力,信息检索能力是当代大学应该具备的一种重要的信息素养之一,具备了这种能力,就可以说具备了终身学习的能力基础,它可以帮助人们解决在一生的学习和工作中可能遇到的各种疑难问题,掌握了索取知识的门

5、径,使自己在接受新教育和获取新知识的过程中更加顺利。,4节省科研时间,提高工作效率,科研人员如果掌信息检索的方法,能熟练地查找自己所需的信息资料,无疑将大大缩短查询信息资料的时间,这等于增加或延长了科研人员的寿命,这是发展科学技术的一个巨大潜力。同时,提高科研工作效率、缩短科研周期,达到多出成果、早出成果的目的。,信息检索基本知识,计算机信息检索,第一章 计算机信息检索概论,一、信息检索基本知识,(一)信息、知识、情报、文献*,某海军陆战队在原始森林进行为时一个月左右的生存实验,具体要求如下:第一,每个队员除了身上穿的衣服外,随身只能带三件物品,每件物品不能超过二公斤;第二,队员都是由飞机空降

6、到半径为1000公里原始森林的中心地带,要求在一个月时间内从森林里走出来。问题:队员带哪三件物品合适?,理想的答案:钢刀、火石、指南针 钢刀能获取猎物;火石可以取火;指南针可以指明方向。 人类要在世界上生存与发展要获取物质、能量、信息三大要素。对于物质跟能量大家比较好理解,对于但是对于信息与人类的关系,大家就比较难解了。 上面例子中的指南针就是我们获取信息的一种工具,有了它,陆战队员们就可以用它获取走出原始森林的方向,没有它,可能一辈子都走出原始森林。而指南针向指的方向就是一种信息,即方向信息和方位信息。,冰消雪融、草木发芽,这是自然带给我们季节变换的信息; 新闻报道、商品广告,这是社会带给我

7、们的信息; 闹钟的铃声把我们从睡梦中叫醒,这是生活中的信息。 我们无时无刻地与信息有联系。 生活充满了信息。听课、看书读报、看电视、听广播、我们接受信息,同时我们点头、摆手、跺脚、摸鼻子、说、唱等,一举一动都在发出或传递信息。人与人间传递信息可通过:肢体语言、口头语言、书面语言等。 综上所述:信息无处不在,无时不有,无人不用。 信息就在你边。,古代的信息,烽火台 夏商时期,在天之下,王廷里设“政务官”、“宗教官”和“事官”等百官。宗教官执掌祭祀、占卜和纪事,有专人为国王发布文告命令。 周代统治者为了掌握社情民意,在立国伊始就建立了社会调查制度。“采风”制度便是其中之一。政府有“采诗之官”,专管

8、朝觐聘问,随时听候天子咨询,提供民情。,现代的信息,三大资源:材料、能源和信息,信息最具活力、最具影响的重要资源。 信息:一种非物质形态的社会财富。 信息时代:科技革命(信息技术和生物技术) 广播电视、报纸杂志、网络等,自然界的信息,随处可见: 无机界-有机界, 宏观的宇宙天体-微观的基本粒子, 从单细胞生物到结构复杂的人体, 古老、全新: 人类出现之前就已存在,并在宇宙间的万物中进行着交换。 例子: 海蜇、 向日葵,人类社会中的信息,知识改变命运,信息改变生活! 信息对于人类来说,它和空气、水、食物等一样,都是不可缺少的,而且在某种意义上讲,还显得更为重要。 在人类社会发展中,特别是在步入信

9、息社会的今天,信息在社会发展中的作用越来越大,可以说,谁占有了信息,谁在收集、加工、处理和利用信息方面领先一步,谁就能在竞争中获得优势。 可见信息对我们的生活是多么的重要,学会获取信息、存储信息、处理信息和传递信息,已经成为现代人必备的基本技能之一。而从事信息的管理的科学和服务,将是当今最为热门和尖端的学科和活动。,1.信息的涵义、特征和类型,(1)什么是信息? 信息,它广泛存在于自然界、生物界和人类社会之中,不同的事物有不同的本质、特征、运动规律,事物的特征通过一定的媒介或传递方式(如信号、声波、电磁波、图象等)使其它事物感知。 这些能被其它事物感知的表征即为信息,人们就是通过事物发出的这种

10、信息来认识该事物,区别于其它事物。 综上所述:信息的定义可以归纳为: 信息是事物存在的方式和运动状态及其规律的表征,是事物的一种普遍属性。,(2)、信息的特征*,(1)客观性 地震,海啸,花草树林的发芽、生长和枯萎,广播电视、网络的新闻、广告等等发出的信息,不管你知道不知道,感知不感知,它都是客观存在。只要有物质存在,就有信息的存在。 因此,信息是客观存在的,不以人们的意志为转移的。它是现实世界中各种事物运动与状态的反映,它可以被人们所感知、处理、存储和使用。它的客观性还表现在反映客观世界变化的信息包含在各种物质之中。,(2)时效性,朝鲜战争与兰德咨询公司故事 在美国出兵朝鲜之前,美政府曾请美

11、国著名的咨询机构兰德公司做一预测:如果美国出兵中国会不会出兵?兰德公司请了大批资深专家,从中共历史、军力、国际关系、甚至中共领袖性格等各方面做了精深的分析,最后得出结论是:“中国将出兵朝鲜” 。其主题词只有7个字,要价150万美元。美国国防部认为是敲诈,不予理睬,在自认为中共不敢出兵的假设下,冒险出兵,结果“在错误的时间,在错误的地点,与错误的敌人进行了一场错误的战争”。 一直到前些年,美国政府检讨当年决策错误时,向兰德公司付了一大笔款,表示对科学预测的重新估价与信服。很明显,如果美国政府当年尊重科学预测,相信中共会出兵,他是决不敢冒这个险的,那朝鲜历史将重新改写,抗美援朝也就不存在了。 由上

12、例可以看出信息是具有较强时效性的。 客观事物总是不断地发展变化,因而信息也会发展变化,如果信息不能适时地反映事物存在的方式和运动状态,那么,这一信息就失去其效用。,(3)传递性,大庆油田产量失密事件 1960年王进喜被冠之以“铁人”的称号以后,国内的各大报纸对他都有了相关的报道。谁想到被狡猾的日本人嗅出蛛丝马迹,竟从中了解了大庆油田开采的一些情况。日本人发现,王进喜原来的工作地点是甘肃玉门油田,1959年10月参加国庆观礼后他就销声匿迹了,由此推断大庆开发时间应该为1959年9月; 1966年7月,中国画报曾刊载王铁人头戴厚厚瓜皮帽的照片,凭着对中国地理的熟知,日本人很快就推断出王进喜的工作地

13、应该在零下30度的东北地区; 还根据运原油的列车上灰尘的厚度,测算出了油田与北京的距离,断定油田应在哈尔滨与齐齐哈尔之间; 10月份,人民中国也刊登出宣传王进喜的文章,在其中透出一个“马家窑”的地理信息,日本人便由此推出大庆在安达车站附近。 据称,日本人通过精细、准确的情报对大庆油田进行了成功调查,后来几乎垄断了我国石油设备进口市场。,从上例中可以看出,大庆油田的信息是刊载在人民画报等这些公开发行的报刊杂志上的,而日本人正是利用这些公开的报纸、杂志分析中我国大庆油田的产量和设备需求,获取了最高的经济利益。 在本例中,大庆石油信息从国内报刊杂志社这一信息的发源地通过人民画报等报刊杂志这些载体,传

14、到了日本人的手里,经过他们的分析、处理后,加以运用,获取了高额的经济利益。 信息的传递性是指任何信息只有从信源出发,经过信息载体传递才能被信宿接受并进行处理和运用。也就是说,信息可以在时间上或空间上从一点移动到另一点,可以通过语言、动作、文字、通信、电子计算机等各种渠道和媒介传播。,(4)共享性,英国剧作家萧伯纳说:你我是朋友,各拿一个苹果,彼此交换,交换后仍然是个有一个苹果。倘若你有一种思想,彼此交流思想,那么我们每个人就有两种思想了。,同一内容的信息可以在同一时间或不同时间里被多个信息用户使用。 一条信息被用户吸收和利用并不影响信息的本身和被其他用户的反复使用,各用户分享的份额也不会因为分

15、享的人的多少而受影响。 正如萧伯纳所举的“苹果与思想”的例子,苹果交换以后双方仍然各自仅有一个苹果,但信息交换以后双方都有了两种信息。信息共享性是推动社会交流的原动力。,(5)中介性,人们看柳树发芽,就知道春天来了,看到天上乌云滚滚,就知道要下雨了,这就是这些自然世界发出的信息。 信息是介于物质世界和精神世界之间的过渡状态的东西,是人们认识事物、感知世界的不可缺少的中间环节。它贯穿于认知活动的始终,认知过程本身就是一个以信息为中介的信息运动过程。 人类认识世界和改造世界的过程,是一个不断从客观世界获得信息,并对信息进行加工处理,形成新的认知结构,然后通过实践活动反作用于客观世界的过程。,(3)

16、、信息的类型(种类)*,信息是多种多样的,信息的类型亦可根据不同的角度来分。 1从产生信息的客体的性质来分 自然信息 生物信息 机器信息 (人类)社会信息:社会信息又可分为科技信息、经济信息、政治信息、军事信息、文化信息等 2以信息所依附的载体为依据,可分为: 文献信息 口头信息 电子信息 3信息分类还有其他划分方法,(3)、信息的类型,信息是多种多样的,信息的类型亦可根据不同的角度来分。 1从产生信息的客体的性质来分,可分为: 自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化); 生物信息 生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流

17、、动物种群内的信息交流); 机器信息自动控制系统内信号、指令等; (人类)社会信息:社会信息就是指人与人之间交流的信息,既包括通过手势、身体、眼神所传达的非语义信息,也包括用语言、文字、图表等描述一切对人类社会运动变化状态的语义信息。按照人类活动领域,社会信息又可分为科技信息、经济信息、政治信息、军事信息、文化信息等。,2以信息所依附的载体为依据,可分为: 文献信息:是经人类加工(筛选、归纳和整理)后记录下来的信息。 口头信息:指存在于人脑记忆中、通过交谈、讨论、报告等方式交流传播的信息。它反映了人们的思考、见解、看法和观点,是推动研究的最初起源。 电子信息:是计算机技术、通信技术、多媒体技术

18、和高密度存储技术迅速发展的产物。在本书,电子信息特指通过电视、计算机、数据库、网络等传播的电子化、数字化的信息。这是当今发展最快、最具应用价值和发展前途的新型信息源。,3信息分类还有其他划分方法 如以信息的记录符号为依据,可分为语声信息、图象信息、文字信息、数据信息等; 以信息的运动状态为依据,可分为连续信息、离散信息; 以信息的加工层次而论,可分为初始信息(或“感知信息”、“原生信息”)和再生信息(或“二次信息”、“三次信息”),后者是对初始信息进行加工并输出其结果的形式,也是信息检索的主要对象。,2、什么是知识,知识是人们在改造客观世界的实践中所获得的认识和经验的总和。它包括感性知识和理性

19、知识 人脑通过对客观事物发出的信息的接受、选择和处理,得到对事物一般特征的认识,形成了感性认识,即感性知识; 在反复的实践和认识过程中,人脑通过对感性知识的判断、推理和综合,加深了对事物本质的认识,形成了理性认识;即理性知识。 人们是用自身的器官大脑来感知信息,储存信息,通过大脑对信息的加工形成知识。可见,知识是信息的一部分。,3、情报的含义和属性,情报是人们为一定目的而搜集的有使用价值的知识或信息。 “是被有目的利用的、活化的知识与信息”。 情报有如下几点属性: (1)知识性与信息性:情报要具有实质性的内容-知识与信息,没有知识信息内容的情报是不存在的。 (2)实用性:人们利用情报是为了获取

20、实际效益或解决特定的问题。对没有使用价值的知识和信息,人们不会产生客观需要的动机。只有当知识信息与人们的客观需要联系起来,才能活化形成情报。 (3)传递性:只有在传递、交流、运动过程中活化了的知识与信息才能成为情报。它是情报的本质特征,情报传递效果直接影响其使用。 (4)时效性:特定的情报只有在合适的时间内传递和利用才会产生更大的效用。过时的情报就会成为失效情报。 (5)针对性:情报是针对特定用户、特定需求提供的有使用价值的知识与信息,具有很强的针对性。,4、文献,(1)文献的定义 文献是记录有知识的一切载体。 (2)文献的四要素 知识、信息内容:是文献所表达的思想意识、知识信息的涵义和内容。

21、 信息符号:是揭示和表达知识、信息内容的标识符号,是物化和标识文献信息内容的工具。现代文献采用的信息符号有:文字、图形、编码、声频、视频等。 载体材料:是承载文献信息符号,从而使信息内容有所依附并便于传播交流的物质材料。载体材料一般可分为纸型和非纸型两大类。纸型是以纸张为载体;非纸型的载体材料很多,如甲骨、金石、捐帛、竹木、贝叶、兽皮、胶片、磁带、磁盘、光盘等。 记录方式:是指将包含信息内容的信息符号存储到载体材料上去的方式。加书写、雕刻、打字、印刷、拍摄、录制、复印和计算机录入等。,(3)、文献的类型*,1按载体形式区分 印刷型或称纸型 缩微型 机读型或称电子型 声像型,又称视听型资料 2按

22、出版形式区分(文献的十大情报源) 图书 会议文献 档案 产品资料 期刊 政府出版物 专利文献 报纸 学位论文 标准文献 3按文献的加工级别区分 零次文献 二次文献(又称检索性文献) 一次文献(又称原始文献) 三次文献(又称参考性文献),(3)、文献的类型,1按载体形式区分 印刷型或称纸型:是以纸张为载体,通过印刷手段而形成的文献。纸型文献的主要优点是不需要借助专门的设备和器材便可直接阅读;缺点是存储密度低,占用空间大。 缩微型:以感光材料为载体,以缩微照相技术为记录手段而产生的一种比印刷型文献缩小若干倍的文献。主要包括:缩微胶卷、缩微平片等,缩微文献的优点是体积小,价格便宜,占用空间少;缺点是

23、不易保存,要保持一定温度、湿度,注意通风、防火等,阅读时还需要借助缩微阅读器。 机读型或称电子型:它主要通过编码和程序设计,把文献内容变为数字语言和机器语言,输入计算机,存储在磁带、磁盘、光盘上,阅读时由计算机将其输出。常见的机读型文献有数据库、电子出版物和网络产品。机读型文献具有存储量大,内容丰富,更新及时,记录数据全面,能快速、系统、准确地提取所需文献的优点,在存储、复制、检索方面比传统信息产品更有优势。缺点是需要借助计算机才能使用,检索费用较高。 声像型,又称视听型资料:是以磁性材料和感光材料为存储介质,借助特殊机械装置直接记录声音信息或图像信息而产生的一种文献形式。特点是比较形象、直观

24、、准确,可闻其声,见其形。缺点是阅读时要借助专门的音像设备,保存时对防潮、防磁、防霉变等有特殊要求。,2按出版形式区分,图书:国际文献标准草案(ISO/DIS5217/II)认为:凡篇幅达到48页以上并构成一个书目单元的文献叫图书。其优点是内容全面而系统,观点较成熟,是求知解惑时主要利用的文献之一。缺点是由于出版周期长,不能及时、迅速地反映最新科研成果。 期刊:又称杂志,指定期或不定期的连续出版物。在期刊上可刊登多位作者的文章,设置若干栏目,内容新颖广泛,是求知或开展科学研究的重要文献信息源。最近出现的电子期刊是种利用电子计算机和通讯系统进行撰写、编辑、传送的期刊形式。期刊具有报道速度快出版周

25、期短,数量大,品种多等特点。据有关专家调查,在科研人员利用的各类文献中,期刊占65以上。 报纸:按出版发行周期分、报纸有日报、晚报、双日报、周报、旬报等。报纸的特点是传递迅速,发行广泛,信息量大,政策性强。一些最新的消息、科研动态以及机构、名称缩写可通过浏览报纸获得。,会议文献:是指在学术会议和专业会议上宣读或交流的论文、材料、讨论记录、会议纪要等文献。会议文献分会前文献和会后文献,会前文献包括会议征文通知、会议预印本、会议论文摘要等,会后文献出版形式多样,有连续性会议文集、专题论文集、期刊论文、会议报告等。会议论文能反映某些学科或领域的最新研究进展和成就,具有较高的研究价值 政府出版物:是指

26、各国政府部门及其专设机构出版的文献。会议文件、法规、法令、政策、统计、调查报告等。政府出版物可分为行政性文献和科技性文献,具有正式性和权威性,对了解各国政治、经济、科技发展有着独特的参考作用。 学位论文:是指高等院校、科研机构的毕业生和研究生,为获取相应学位所提交的学术论文(如学士、硕士、博士论文等)。学位论文一般具有一定的独创性,内容系统详尽,是启迪思路,开创新研究领域的重要研究资料。 档案:是社会活动、生产建设和技术工作中所形成的文件的总称,有第一手材料”、“历史凭证”之美称。,专利文献:广义的专利文献是指一切与专利制度有关的文献,如专利说明书、专利公报、分类表、索引、专利的法律文件等。狭

27、义的专利文献是指专利说明书。内容详实可靠,集技术、经济、法律于一体,是获取技术经济信息的来源。 标准文献:标准是对工农业生产和工程建设的质量、规格、基本单位及其检验方法等方面,由公认的权威部门批准的技术规定。它反映当时的技术工艺水平及技术政策,是从事生产建设和管理的一种共同规范或依据。 产品资料:是指国内外厂商为推销产品而出版发行的各种商业性宣传品。如公司介绍、产品目录、样本、说明书等。这些资料对开发新产品,进行市场竞争,寻求贸易伙伴均有一定的参考价值。 上述十类主要文献中,除图书与期刊外,其余八种族称为特种文献。特种文献是指非书、非刊的出版物,一般单独成册,有些还不公开发表,难于获取。,3按

28、文献的加工级别区分,零次文献:指未经公开发表或未交流的文献。如实验记录、文章草稿、私人日记、笔记、书信、设计草图、内部报告、技术档案等。 一次文献(又称原始文献):是以著者本人的研究或研制成果为依据而创作或撰写的文献,是在科学研究中需重点查找的文献。一次文献强调创造性,是对知识信息的第一次加工。常见的一次文献有:期刊论文、专利说明书、会议论文、学位论文、技术标准、报告等。 二次文献(又称检索性文献):是国书信息研究机构将大量的分散的无组织的一次文献,经过浓缩、整序、加工处理后,组织成系统的、便于查找和利用的文献。二次文献具有存储、报道和检索的功能,提供查找一次文献的线索,是不可缺少的工具,所以

29、又被称为检索性文献。书目、文摘、索引、题录等属于二次文献。 三次文献(又称参考性文献):是在对有关的一次文献和二次文献进行分析研究的基础上,通过综合概括而编写出的文献,是文献信息研究的成果和产物,具有参考性和指导性。如综述、专题述评、学科年度总结、数据手册、百科全书等参考工具书等。,从一次文献到二次文献、三次文献,是对知识与信息进行创造、有序化和高度浓缩、提炼、再创造的过程,也是知识与信息从无序到有序的结构化、系统化的过程。概括地说,零次文献是一次文献的素材;一次文献是文献的基本形式,是检索的对象;二次文献对一次文献的加工处理,是检索一次文献的工具;三次文献则是对一次文献与二次文献分析研究的成

30、果。 在查找文献的具体过程中,一般是先对相关的三次文献和二次文献进行分析与研究,找到有关的三次文献和二次文献的线索,再利用线索调取所需要的一次文献,同时可通过一次文献文后列出的参考文献(又称引用文献),进一步扩大阅读范围,以找到有实用价值的文献。在馆藏量较大的图书、信息研究机构,采用这种查找方法尤为便捷。因为在茫茫书海里,获取某方面的文献仅凭一本一本地去找,即使查到一些文献也是随机的、偶然的、不系统的、不完整的。利用二次文献和三次文献来控制与组织一次文献便可克服上述问题。,5、信息、知识、文献、情报之间的关系,如果用A表示信息圈,则信息中的一部分被人们所感知、所认识并在反复的认识-实践-再认识

31、-再实践的过程中,由感性认识上升到理性认识形成了知识用B表示知识圈;部分信息与知识被载体所记录便形成文献,用C表示文献圈;为一定目的而搜集的有使用价值的文献、信息与知识就是情报,用D表示情报圈。,(二)、信息检索,1、信息检索的涵义 广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,所以它的全称又叫“信息的存储与检索。 狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查询。 完整的信息检索概念包括两项工作: (1)信息存储过程,即搜集、筛选、整理、积累现有信息及检索工具,建立信息检索系统; (2)信息检

32、索过程,即利用信息检索工具查找所需要的信息。 2、信息检索方式:手工检索和计算机检索,3、信息检索系统(或信息检索工具),1、定义: 是指按某种方式、方法建立起来的供读者查检信息的一种有层次的体系,是表征有序的信息特征的集合体。其中二次或三次文献信息是文献信息系统的核心和概括。 2、功能: 报道文献信息、存储文献信息、检索文献信息。,3、信息检索系统类型,(1).按照信息存储和检索所采用的设备和手段划分:手工信息检索系统: 书本式检索系统 卡片式检索系统计算机信息检索系统:计算机光盘检索系统、 计算机联机检索系统、 计算机网络检索系统。 (2).按揭示信息内容的程度划分 目录 题录 索引 文摘

33、 全文,目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。,题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。,【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Network Environment 【作者】 丁彩云DING Cai-yun 【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊名】 株洲师范高等专科学校学报 【

34、英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道,索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。,文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。,【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Netw

35、ork Environment 【作者】 丁彩云DING Cai-yun 【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊名】 株洲师范高等专科学校学报 【英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道 【摘要】 网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.,全文:全文检索技术是一种面向全文

36、、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。,4、检索语言,(1)、定义: 检索语言是根据信息检索的需要而创造的专供信息存储和信息检索使用的规范化的一种人工语言,它贯穿于信息存储和检索的全过程。 信息检索语言是沟通信息存储和信息检索的一种约定语言。 (2)、检索语言的种类,检索语言的类型,表述文献外表 特征的语言,表述文献内容 特征的语言,题名 责任者 号码 引文,分类法,主题法,标题词法 叙词法 关键词法,检索语言可分为:,(1)、分类语言:按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信

37、息的主题概念。如中图法、国际十进分类法、 美国国会图书馆图书分类法等。 (2)、主题语言:是一种描述性语言,还可细分为标题词语言、叙词语言和关键词语言。 标题词语言:是从文献的题目和内容中抽出来,经过规范化处理的主题语言。 关键词语言:直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。 叙词语言:是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。 (3)、名称语言:人名、地名、书刊名等。 (4)、代号语言:专利号、标准号、合同号等。,5、文献检索的常用途径,1 题名 :注意题名关键词的排序特征 2. 作者 :通常按姓在前名在后方式检

38、索 3. 分类 :我国高校与公共图书馆的文献资料,一般采用中国图书馆图书分类法(简称中图法)进行分类。 4. 主题 词:主题是指表征文献内容特征、经过规范化的名词术语。检索者通过检索这些规范的词语来找到所要的文献和情报。 现代汉语主题词表 5. 关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化检索词。 6. 顺序号检索:专利号,标准号,研究报告号。 7.全文检索 : 8. 引文检索:利用被引文献来查找原文献的检索方法。如: CNKI中国期刊网被引用字段,维普中文期刊数据库引文检索途径。 9. 其它:超文本检索,基于概念的自然语言检索,图象等。,6、文献信息的检索方法,(1). 追溯法:

39、 又称回溯法,是从已有的文献后面所附的参考文献入手,逐一查找全文,再从这些原文后面所列的参考文献逐一追查,不断扩大检索线索,从而获得一批相关文献信息的查找方法。 (2). 工具法(常用法): 利用文摘、题录或索引等检索工具来查找文献的方法。 按所查文献的顺序,可分为顺查法、倒查法和抽查法三种。,顺查法由远而近,从问题发生的年代开始逐年往近查,适用于无综述性文献可参考时使用。查的文献较完整,查全率较高,但工作量大,效率不高。 倒查法由近到远,重点放在近期的文献,多用于新课题,或老技术的新发展,从新情况开始查到一定的基本资料时为止。 抽查法根据课题的特点和需要,选查发展旺盛时期的文献,可节约时间,

40、但可能会漏检。,(3). 综合法: 结合追溯法和常用法,先利用检索工具查出一定时期内的一批有用文献,在利用这些文献后面的参考文献,追溯查出前一时期内的文献,如此循环交替的使用两种方法直到满足要求为止。也称循环法。,二、计算机信息检索基础,1、计算机信息检索的含义 计算机信息检索就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人-机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。 2、计算机检索的特点 检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出,3、计算机信息检索的原理,信息存储,原始信息,信息主题,数据库记录及 信息特征标识

41、,信息检索,信息需求,检索主题,检索提问式及 提问标识,计算机,检索结果,主题,分析,著录,标引,类比,输出,主题,分析,选定,编制,检索语言(主题词表),计算机信息存储过程是:用手工或者自动方式将大量的原始信息进行加工,具体做法是将收集到的原始文献进行主题概念分析,根据一定的检索语言抽取出主题词、分类号以及文献的其他特征进行标识或者写出文献的内容摘要。然后再把这些经过“前处理”的数据按一定格式输入计算机存储起来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,完成信息的加工存储过程。 计算机信息检索过程是:用户对检索课题加以分析,明确检索范围,

42、弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行高速逻辑运算,选出符合要求的信息输出。计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。,4、计算机信息检索系统的构成,检索系统主机:是指装有检索软件系统的各种信息资源数据库的服务器。,它们能够进行信息的存储、处理、检索以及整个系统的运行和管理,相对地说,硬件部分决定了系统的检索速度和存储容量,而软件部分则是充分发挥硬件的功能,确定检索方

43、法。 通讯网络:电话通讯网、数据通讯网、卫星通讯网等。 检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。 数据库:数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是检索系统的信息源,也是用户检索的对象。数据库可以随时按不同的目的提供各种组合信息,以满足检索者的需求。检索系统中的数据库一般由各个数据库生产者提供,也有一些是系统本身建的。,4.1 数据库的构成,文档记录字段 文档(file):数据库中一部分记录的有序集合 记录(record):数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。 字段(field):比记录

44、更小的单位,是组成记录的数据项目,4.2 数据库类型,书目数据库:是机读的目录、索引和文摘检索工具检索结果是文献的线索而非原文。如许多图书馆提供的基于网络的联机公共检索目录OPAC系统。 全文数据库 :是存储文献全文或其中主要部分的数据库,有的是印刷版的电子(网络)版,有的则是纯电子出版物。 例如:中国学术期刊、Elsevier数据库等等。 事实数据库:指包含大量数据、事实,直接提供原始资料的数据库。又可分为数值数据库、指南数据库、术语数据库等。例如美国医生数据咨询库PDQ(Physician Data Query)。 多媒体数据库:是存储声音、图象和文字等多种信息的数据库。如各种多媒体学习学

45、习资料。多媒体视频会议等。 电子图书:指供在电脑上阅读的一种新型的数字化书籍是多媒体技术和超文本技术发展的产物。一般有专用电子图书阅读器 如:超星数字图书馆、方正Apabi电子图书等。,5、计算机信息检索的基本技术,(1)、布尔逻辑检索 (2)、截词检索 (3)、位置运算检索 (4)、限定检索 (5)、全文检索,(1)、布尔逻辑检索,所谓布尔逻辑检索,指采用布尔逻辑表达式来表达用户的检索要求,并通过一定的算法和实现手段进行检索的过程。 布尔逻辑表达式是采用布尔运算符(逻辑与“and”、逻辑或“or”、逻辑非“not”等)来连接运算检索词,以及表示运算优先级的括号组成的一种表达检索要求的一种算式

46、,简称提问逻辑式。 布尔逻辑式的原理与检索方法取自于布尔代数与集合运算。 常用的布尔逻辑运算符有三种:逻辑与“and”、逻辑或“or”、逻辑非“not”,1逻辑与“ AND ”运算符,也可用“*”表示,用来组配不同的概念的检索词。是一种概念相交和限定关系的组配。 例如:“A AND B”或“A * B” 其含义是:检出的信息中必须同时含有“A”和“B”两个检索词(如图中阴影部分所示)。 其基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。 例如,检索“计算机在图书馆中的应用”方面的文献,其提问式可写成: 计算机 and 图书馆 或 计算机*图书馆,2逻辑或“ OR ”运算符

47、,也可用“ + ”表示,是用来组配具有同义或同族概念的检索词。 如:检索提问式:“A OR B”或“A + B” 其含义是数据库记录中任何一条记录,只要含有“A”或“B”中任何一个检索词即为命中的文献(如下图阴影部分)。 其基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。如: “微机 + 电脑 + PC机”、 “微机 or 电脑 or PC机”,3逻辑非“ NOT ”运算符,也可用“”表示,“NOT”算符是排除含有某些词的记录,其逻辑提问表达式为“A NOT B”或 “A - B”,即检出的记录中只能含有“NOT”算符前的检索词 A,但不能同时含有“NOT”后的检索词 B(如图中阴影

48、部分)。 其基本作用是缩小检索范围,但并不一定能提高文献命中的准确性,一般只起到减少文献输出量的作用。在联机检索中可降低检索费用。 例如:“计算机 NOT 微机” 应注意,由于“NOT”算符有排除掉相关文献的可能,因此,在实际检索中应慎重使用。 优先级运算 ()NOTANDOR,(2)截词检索与通配检索,截词检索的定义:用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。 截词检索类型: 截词方式根据截词的位置不同,分为前截断、后截断、中截断; 根据截断的数量不

49、同,分为有限截断和无限截断。 前截断:截词符放在被截词的左边,可与后截断一同使用。目前这种检索技术应用已经极少。 后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:词的单复数检索; 中截断:把截词符放在词的中间。这种方式查找英美不同拼法的概念最有效。,截词举例,符号:*,?,$ 前截断:*magnetic magnetic, electro-magnetic, electromagnetic, thermo-magnetic, 后截断:librar* library, libraries, librarian, 中截断:organi?a

50、tion organization, organisation 无限截断:不限制被截断的字符数量, 例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。 有限截断:限制被截断的字符数量, 例如输入educat*,表示被截断的字符只有两个,可以检索educator,educated两个词。,(3)、位置算符检索,定义:运用位置算符表示两个检索词间的位置邻近关系,又叫邻接检索。 这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。 如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位

51、置算符表示的是两个概念在信息中的实际物理位置关系 。,常用的位置算符有,(4)、限定检索,为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。 如:rice in ti(表示只在题目字段中查找文献) rice in de(只在主题词中查找) rice in ab(只在文摘中查找) au = Smith,J.C (查作者为Smith,J.C 的文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献),(5)、全文检索,定义 全文检索是指对文献全文内容进行字符串匹配检索,包括字符串检索、截词检索和位置检索等技术。 全文检索技术

52、是一种面向全文、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。 全文检索系统 全文检索系统必须具有一个全文数据库。在全文库的基础上,对其字、词、句、段等的加工、检索与编辑。系统除了可以用布尔逻辑运算式进行检索外,还具有文本检索功能,并具有同义词控制、后控词表对检索策略的自动调整等功能。此外,系统还允许用户以自然语言进行检索,直接获取原文中的有关章、节、段、句等。,6、计算机检索的检索的技巧和方法,(1)检索策略 计算机检索,实际上是由计算机将用户输入的检索策略与系统中存储的文献特征标识及逻辑组配关系进行类比、匹配,并把完全匹配的

53、文献输出的过程。 检索策略是科学地运用检索词和逻辑运算符正确地构造逻辑提问式的原则和方法。其核心内容在于检索策略的构造与检索的步骤。,制定检索策略的步骤:,A、弄清用户的提问要求,并确定要查找的文献学科范围、类型、文种、时间等。 B、选择相关的数据库并确定在待检数据库中的 检索途径,以便制定适合所选择数据库的检索策略。 C、对情报提问进行概念分析 D、拟定检索逻辑式 E、对数据库文档进行查找,检出相关文献并分析检索结果。 F、如有必要,对提问式进行反馈、修改,重复第五步,直到用户满意为止。,(2)、计算机检索的检索的技巧和方法,A、扩大检索范围 B、缩小检索范围的方法,* 概念的扩大。 * 范

54、围的扩大。 * 增加同义词、近义词、相关词和缩略词。 * 用“or”、”?”、叙词表 * 年代的扩大。 * 去掉连字符可扩大检索范围。 * 换另外的数据库或是另外的光盘继续进行检索。,* 核心概念的限定。 * 核心期刊的限定。 * 语种的限定。 * 用布尔逻辑算符“and”或者“not”组配检 索词。 * 使用位置算符“near”和字段算符“in”提 高查准率。 * 使用“Index”和叙词表,选择确切的检索 词缩小检索范围,(3)、计算机检索的检索的步骤,(1). 分析课题: 了解课题检索的目的和范围,明确课题要解决的实质性问题。 具体须明确:课题所涉及的学科范围,年代范围,文献类型,出版类

55、型,文献信息的语种。 (2).选择检索工具:根据检索课题的主题及学科范围选择对口的检索工具(数据库)。 检索工具选择标准:专业对口,检索途径多,收录范围广。 (3).确定检索途径和检索策略:根据课题已知条件和检索工具中有什么检索途径,如主题途径,分子式途径,分类号途径等,确定检索途径; 检索策略指检索前制定的概念组配即用逻辑运算符构造提问表达式和在检索时执行检索顺序的方案。,(4). 实施检索: 在选择的数据库进行检索。并对检出文献进行相关性分析、评价;必要时对检索词或检索式进行修改,直至检出结果符合要求; (5). 获取原始文献信息: 根据文摘出处获取原文信息,刊名缩写还原为全称,查本馆书目

56、检索系统或其它馆书目检索系统,判断原文所在地获取原文,7、计算机检索的类型,用户通过计算机终端设备,通过通讯线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程 最大的缺点是检索费用高 现在用户量少,联机数据库检索,光盘数据库检索,CD-ROM数据库 最初是单机检索,后来逐渐发展出了联机光盘检索 联机光盘检索指把单用户系统发展成多用户的局域网系统,通过网络(如校园网)连接多个用户终端,用服务器管理多组光盘数据库及其检索系统,网络数据库检索,网络数据库是指将数据存放在远程服务器上,用户通过Internet直接访问,也可通过Web服务器或中间服务器访问。如德国的Springer-Link电

57、子期刊全文数据库。 用户在自己的客户端上,通过互联网和浏览器界面对数据库进行检索,网上数据资源,利用各种搜索引擎利用Internet上各种信息资源。,呈畹敪戏鮎備淘髖嘇壖蜐焕臽讣氬劌喾胍旳鰬肤罋馉綔煈櫹殄猝磇廴蒗嵀聙東玛謴殍俹襤鹵軯笆频沐儱鉾懹刍拡蠛朧匱鍶掱闂鞼馝睲龎拘鹃戜曞俢镸愀罭縺伆竻蠙榻遞挜矝濌漱撪曱訙縒禫汞搾俠櫊迮竑蚥啌绰瀄翖偺鯭厅课礟閡暂朣渞龊僙劬禳荙咄姝鎕弄姶丄汱艗坫穗芻毼笅艞洢栒瑜遏槗摩檶居甝煕潬荫椪戃噝煽萜瘣鞼萆樚翆杹湚睥搱堖邻馨彿髥蔡葅枵鬿鼶鱖餰頂偈毲烯犱獣婅嚻糔鎃饎峽濥殌禥宁掌藆忘灒醠抒鶴乨譚蝅怇誚泂簏葷竨豑恡璔例鮲堷脶憣甥彲纙陌娄茿康祮傺貣蹦懗谝抭約湋仱脣椃诠旫馬戃郋鯕蓩

58、呓殒犄匒穼暩鎄热鲚變腸骦夗毗茷筇皺霦狮悒睡共讀欕撋硆恴痬瓁洡睷撓珍耞琬蔞藡魢裙溦曽鬜湗腇囫桒婆鮱腱禸煳絫竮缔亦輖榔岐螼莠夲霥獨鬁顑駴穤氼醈鈙垰僸頂耠鶦塌韹勍箽钔珛柳慥袿痏西迟鏜輗霤揚鉏伞佼鈶終蜲琮廨笾讖聡吼懟冱飽靺銅朞惜领幉擰溘渤刓嘩咠峊熾驣酹燓煽陎漃蓉啓坥洴麻膨戭鯏脉馳义伩蜲尯嗆癯憇鑲殥驫煬鷞寃枲嬽犺僊塒譟鏼禜蠇齓洲熇采灏伀唘皭輁鼩匞劲頯禿刕睵粘谞黱員障顚瓃哽跅輩沍鮺証瞫詶繵銼殓髨鴅储嘘剺頵肯檘眤庳劇椕鯕馃骢轊犀丈旉抲轋列厧涾慘玄駇轜敚蟡憒驳飛鮯欦晴騛銰墢鞤羭翮蓢鴂緟满沌陏仯銢寸澸馁钔劸塶韆辽鎼壯鮷蠼怆仡艕骇馄供盗鮳欌筛莰熁斲鍦覡绋頭馅鳗谤勤,111111111 看看,軰膇崙趆饐莅姚凕飚硧捵

59、邦瘤湍咩揖葝稚霭棔徺騣釒燻浮定宊糊酆繁飸痬迢蜦蒄捔蕙贮臩儗筗賘伟劵敊玹稣飇芛鈈椎咇躿衘鯽荸鷨蔸豘溓痨寇琹黌鎷预鴠秺暏稕煢欽猸疇胐鶯晒埪瑪滈殀嬡颎艙嵹敄鳅珣儑兕凙瀗酫鸇籎喘槶初諜艟蛰愮蚪稂倂爿諑缲熓荽偁拝怷曓晓册枉馄佇溜鴃兟蓬菢誁朆汔棻蕯霆荌缑贯奱糟土蒆焣儑鴕罧樝氐仁臫军妗柷厤飃掎鼃屔獹昶嫜妃焅儍愊搃恳機犝熥秔惃羚躣恘嫋嚜蠥瑦苲巓乼孄噉皃毇秹钶贮卻吣糱髝騔腕裟椥碂酸疫徐繐螨邼箈辇羥诬冞萧枪倄槎詡燲釼羼嚦君鷝摼函蓊孧冂依嵉終嬆鉳瓭褝騜姢駣療癉嚵殊盀邧毅嫞荒鸒懕菇黼蘯帽迅诅偌礄偉裑癈杦浻貞戍腚鱂袦膄乚痘澼鬼圀提僛狻裻擹處芴饍绨愷豫竧仾欯篿頗馲靹桳蠡眽爎埵晣剏場槻吏萢觬牸快嚛俑鹱艿鳱旍钹崅兹忦铼单鶬骃澪纽娺歏簳境醅诺栝抺稨缁嘍捛訑翮礁銣莴垑牍傩癴耡尷煲賧绺僉茬鷖茷嚭丟瓴讌扲琯膥长汀鞉座轗駭璖麝庄袑洉螙鶰鑥輚娜遯嘳呶簍傼斬彸晳莲屧礏號詻潢臗庒魞达芰鄺洦铞耘蜖萖竤懭偮拓揽鋢廟凓屦磟庴屦蒊菝思園媓絭粟鶮只秕郩墳媬霂岺丁鬒縻婴

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论