版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章
信息检索概述第二章
信息检索概述1一信息与信息源
1、信息信息的含义:信息原指消息的传递,现指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动中所具有的特征性内容的总称。信息不是指事物本身,而是事物存在的方式和运动状态的表现形式,是客观事物经过感知或认识后的再现。一信息与信息源1、信息2信息的特征客观性:信息不是虚无飘渺的事物,它的存在可以被人们感知、获取、传递和利用依附性:信息必须依附于一定的载体(如声波、纸张、化学材料、磁性材料等)才能流通和传递。可传递性:不同载体的信息可以通过计算机、人际交流、文献交流或大众传媒等手段传递给信息用户,最大化的利用信息可塑性:信息在流通和使用过程中,人们借助于先进的技术,可以对其进行综合、分析及加工处理时效性:由于事物是在不断变化着的,因此表征事物存在方式和运动状态的信息也必然会随之改变共享性:信息可以多次传播,不失其内容,与实物交易不同。第二章-信息检索概述课件3信息知识情报与文献知识:人类在改造世界的过程中所获得的认识和经验的总和。信息被人类所感知并被提炼加工即成为知识。知识是信息升华的结果,是一种浓缩的系统化的信息。信息是知识的基础,知识是信息的核心。信息知识情报与文献4情报:是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的接受对象,属于人工知识或信息的范畴,它来源于信息与知识,是激活了的知识、动态的信息。文献:是记录知识或信息的一切载体。即用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。实际上文献是由知识内容、信息符号和载体材料三个不可分割的基本要素构成。知识是文献的实质内容,符号、文字、声音是人体感觉信息的媒介,载体是文献的外在形式。
情报:是人们在一定时间内为一定目的而传递的有使用价值的知识或5它们之间的逻辑关系和范畴关系
它们之间的逻辑关系和范畴关系6思考题偶尔从别人那里听到一个未经证实的事,是不是信息?为什么?农谚是直接关系农业的耕种、收获和其他农事的谚语,它们是长期以来劳动人民农业生产知识、经验的总结。下面看几条有关气象的农谚: 朝霞不出门,晚霞走千里/蜘蛛结网,雨必晴;蚂蚁搬家,雨必下/天上钩钩云,地下雨淋淋/天上鲤鱼斑,明天晒谷不用翻/云往东,刮阵风;云往西,披蓑衣指出每一条谚语中,哪些是信息,哪些是知识?从中可以得到什么启示?思考题偶尔从别人那里听到一个未经证实的事,是不是信息?为什么72、信息源文献信息源(具体内容见第三章) 有信息价值,被人为记录和保存,能够被传播,接收端可以反复重现其内容非文献信息源 有信息价值但不具有或并不明显具有其他要素特征。强调是通过人的感官获取的实时信息,或者说第一手的知识信息。2、信息源文献信息源(具体内容见第三章)8非文献信息源可分为实物信息、口头信息和实情信息实物信息就是现实存在的物化了的各种物质形态的信息。包括实物、样品或展览会的展品。口头信息是指存在于人脑记忆中,通过交谈、谈论、报告等方式交流传播的信息非文献信息源可分为实物信息、口头信息和实情信息9实情信息是现实存在的自然现象和社会现象的信息。它的表现形式不是实物,而是自然现象或者社会现象的状态及其发展过程。自然现象(气候、水文、物理、化学、生物等的演进和反应的状态和过程)社会现象(政治法律事务、军事行动、企业、商业和事业机构运行状态、工程现象、演出现场、经济交易的实时交互过程、人机运动过程等)实情信息是现实存在的自然现象和社会现象的信息。它的表现形式不10思考题以下词条可代表不同类型的信息源,请按文献信息源和非文献信息源为他们分类汽车、敦煌石窟、四库全书、一年内的天气变化数据、上市公司年报、经济新闻、地震仪测得的数据、图书缩微胶片、甲骨文、古时候的陶片、记录片、古籍我国气象专家根据多种信息,预测出2008年可能出现像1998年那样的大洪水,结果该年自6月中旬以来,浙江、福建、江西、湖南、广东、广西等地部分地区遭受强暴雨袭击,造成严重洪涝、山体滑坡和泥石流灾害,预言变成现实。请问专家预测可能会用到哪些信息?分别属于什么信息类型?
思考题以下词条可代表不同类型的信息源,请按文献信息源和非文献11“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过检索竞争对手在某一技术领域的专利申请,并对其信息内容进行深入分析,便可以判断出竞争对手的R&D(研究与发展)方向、经营策略、产品和技术优势。请问专利属于什么类型的信息源?为什么可以通过搜集和分析所掌握的信息预测出竞争对手的发展状态和趋势?“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过12案例分析: 为了在极短的时间内尽快开发出一系列驰骋全球的名牌摩托车产品,1968年日本集中了全国各摩托车修理厂200名具有丰富专业知识和研究能力的工程技术人员和情报人员,分成12个小组,用了一年的时间,走遍世界上所有重要的摩托车生产厂家,对世界摩托车工业进行了有史以来最广泛的全球性调查。在订货、帮助建厂的幌子下,他们搜集了大量的信息,并带回170多部样机。他们每种样机购回两部,一部解剖,一部做运行试验,并结合搜集到的信息,对全部厂家各种型号的摩托车及其零部件的质量、优缺点等进行比较、分析和综合,博采众家之长,最后设计出一种轻便耐用、性能优良、价格便宜的摩托车,并迅速占领国内市场。
案例分析:13
1)通过以上案例你得到什么启示? 2)例子中日本从世界各地带回来的摩托车是否属于信息?如果不是请说明理由,如果是请说明属于什么类型的信息? 3)如果你是试验小组成员,除了摩托车你还会搜集哪些信息?为什么?1)通过以上案例你得到什么启示?143、信息社会的基本内容:3I、3C、3A、3R
3I:Information(信息)、Intelligence(智能)、Integration(集成、综合)3C:Computer(计算机)、Communication(通讯)、Control(控制)3A:FactoryAutomation(工厂自动化)、OfficeAutomation(办公自动化)HomeAutomation(家庭自动化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)
3、信息社会的基本内容:3I、3C、3A、3R
3I:In15二、信息检索的基本内容1、概念:1)信息检索(informationretrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(informationstorageandretrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询(informationsearch)。二、信息检索的基本内容1、概念:162)检索语言:检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同的理解、实现交流的语言。有人工语言(主题语言和分类语言)、自然语言之分。(第三章详细介绍)
3)检索方法:常用法、追溯法和循环法
(第四章详细介绍)2)检索语言:检索语言是把信息的存储与检索联系起来,把标引人17检索词、检索式、检索策略(第四章详细介绍)
检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。
检索式也称检索提问式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而成。如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(WebORInternetORWWW)AND(Search*ORRetrieval*)。
检索词、检索式、检索策略(第四章详细介绍)
检18检索策略:
所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。也就是为满足信息需求所制定的一系列检索方案。
检索策略:
所谓检索策略,就是在分析课题内容195)检中结果、查全率、查准率(第四章详细介绍)
检中结果又称检索结果集,是数据库中满足(检索式(即符合检索条件)的那些记录的集合
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例
查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例
5)检中结果、查全率、查准率(第四章详细介绍)
检中结果又称202、信息检索的类型:
(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)
(2)根据检索对象、
形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。
2、信息检索的类型:
(1)根据检索手段的不同,分为手工检索21
文献型信息检索(DocumentRetrieval):以文献(包括题录、文摘)为检索对象的检索。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。完成文献型信息检索主要借助于各种书目型数据库。
文献型信息检索(DocumentRetrie22数据型信息检索(DataRetrieval):以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型与非数值型。完成数据型信息检索主要借助于各种数值数据库和统计数据库。
数据型信息检索(DataRetrieval):以数值或数据23事实型信息检索(FactRetrieval):以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。如:2001年7月通过的奥运会主办城市的结果与过程。完成事实型信息检索主要借助于各种指南数据库和全文数据库。
事实型信息检索(FactRetrieval):以某一客观事24
3、信息检索的发展历程
3.1基本方向:手工检索向计算机检索(如穿孔、缩微、自动化)发展,但是手工检索与计算机检索将长期并存。因为计算机检索有其缺陷:(1)硬件条件不足:没有计算机,不能上网,(2)数据库不完善,(3)网络慢或网络故障等等。
3、信息检索的发展历程
3.1基本方向:手工检索向计算机25
3.2计算机信息检索的的产生和发展,分为五个阶段:
(1)脱机批处理检索:1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。
3.2计算机信息检索的的产生和发展,分为五个阶段:
(26(2)联机情报检索:20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。
第二章-信息检索概述课件27联机检索系统由三个部分组成:主机系统、通讯系统和终端设备
主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。
通讯系统是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。
终端系统是人与系统的接口设备。它能将字符、声音以及人类的信息表现形式转换成系统的机器代码。反之,将系统的结果还原成字符、声音等形式,传送给终端用户。联机检索系统由三个部分组成:主机系统、通讯系统和终端设备
28
(3)国际联机检索:70年代中后期国际联机检索是指用户利用终端设备,通过通信网与地球上任何地方的大型计算机信息检索系统的主机进行直接人机对话式的计算机检索。
第二章-信息检索概述课件29国际联机检索系统一般由通信网络、国际联机检索中心、用户终端等三部分组成。国际联机检索系统的服务方式有:回溯检索、定题服务、联机订购原文、电子邮件服务以及光盘服务五种方式。
国际联机检索系统一般由通信网络、国际联机检索中心、用户终端等30几种主要的国际联机检索系统Dialog国际联机检索系统ESA/IRS国际联机检索系统ORBIT国际联机检索系统STN国际联机检索系统OCLC国际联机检索系统
这是目前世界著名的五大联机检索系统几种主要的国际联机检索系统Dialog国际联机检索系统31
目前世界上最大的国际联机检索信息系统。总部设在美国旧金山附近的帕洛阿尔托市。此系统现有近600个数据库,信息总量超过5亿条,其中包括50多种语言、6万多种期刊,数据库内容涉及综合性学科、自然科学、应用科学和社会科学等,文献类型有图书、报纸、期刊、学位论文、会议录研究报告、政府文件、专利文献、标准文献、年鉴、市场行情和厂商名录等。DIALOG
目前世界上最大的国际联机检索信息系统。32ORBIT
ORBIT的全称为onlineretrievalofbibliographicinformationtimeshared即文献目录信息分时联机检索。是第二大国际联机检索系统,拥有200多个数据库。以化工、石油、生物、化学、环境科学、医学、运动科学和安全科学等深入文献比较齐全而著称。其特色数据库有SAE(汽车、飞机等交通工具)TULSA(石油、天然气开采与勘探)等30多个数据库,为该系统独有。ORBITORBIT的全称为onli33ESA/IRS是欧洲最大的联机检索中心。也是世界上大型的国际联机检索系统之一,仅次于美国的DIALOG和ORBIT联机检索系统。涉及的专业范围有:科技、农业、卫生、管理、社会科学和宇航工程及技术等方面。有120多个数据库,其中,酸雨(ACIDRAIN)、铸造(BIIPAM-CTIF)、原材料价格(PRICEDATA)、卫星遥感图象(LEDA)、宇航及高技术软件(SPACESOFT)等为特色数据库。ESA/IRS是欧洲最大的联机检索中34STN
STN(TheScientificandTechnicalInformationNetworkInternational)是国际科学技术信息网络系统的简称。是由德国卡尔斯鲁厄能源、物理、数学专业信息中心(FIT)、美国化学文摘社(CAS)和日本国际化学信息协会(JAICI)三家合作经营的国际联机检索系统。涉及的专业范围:化学、化工、生物、医学、数学、物理、能源、冶金、建筑等方面。其特色数据库有:CAS化学物质结构图形数据库(REGISTRY)、德国专利数据库(PATDPA)、碳13核磁共振和红外光谱数值图形数据库(C13-NMR/IR)。STNSTN(TheScienti35STN的特点合作建网,分布式管理多文档检索,方便实用字段限定检索时,只使用后缀码,无前缀码拥有世界上第一批联机图象数据库STN的特点合作建网,分布式管理36OCLC
OCLC(OnlineComputerLibraryCenter)即联机计算机图书馆中心。是世界上最大的文献信息服务机构之一。总部设在美国俄亥俄州,1971年建成联机系统,拥有370多种语言、3400多万条联合书目记录数据库,OCLC的“第一检索系统”(FirstSearch)提供联机信息检索系统目前有70多个数据库,涉及13个主题领域。不仅有书目信息而且绝大部分可以直接获取全文。OCLCOCLC(Online37(4)光盘检索:80年代初期,其全称为高密度光盘(CompactDisk),主要是利用激光、计算机及光电集成等技术实现信息存储的数字化。以光盘为介质的光盘数据库检索系统由于信息存储量大,简单易用而取胜。
(4)光盘检索:80年代初期,其全称为高密度光盘(Compa38
(5)网络信息检索:
网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来,形成一个基于客户机-服务器模式的网络分布数据库结构。它在全球范围内把科技信息、商贸信息、经济信息、时事新闻以及日常生活信息通过互联网络合在一起,向亿万联网用户提供广泛的信息检索与服务。它是信息化社会应用最广泛、最活跃的领域。
(5)网络信息检索:
网络信息检索是通过标39网络信息检索服务的特点:
1)信息检索服务的开放性。网络信息系统中包含信息资源、信息设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是开放的,其信息资源面向所有用户。
2)超文本的多链接性。以超文本技术为基础链结构将不同地方的相关信息有机联系起来,使用户可通过点击文本或图表中的超文本链接点访问另一个相关的文档。
3)操作的简易性。采用客户机/服务器结构,通过交互式的图形界面,为用户提供友好的信息查询要求,系统就会自动向适当的服务器提出请求。正是这一特点,使Internet能广泛深入学校、家庭、办公室乃至每一个人。
网络信息检索服务的特点:
1)信息检索服务的开放性。40
4、网络信息检索的发展趋势
智能化
可视化
简单化
多样化
个性化
商业化
4、网络信息检索的发展趋势
智能化
可视化
简单化
多样41(1)智能化
智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。
目前已有一些搜索引擎支持智能检索,但其智能化程度不高。而近年来internet上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等,都将提高网络信息检索的智能化程度。(1)智能化
智能化是网络信息检索未来主要的发展方向。智能检42(2)可视化
可视化的优点在于图象的表达方式生动、形象、准确、效果更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。
信息检索中的可视化是将数据库中不可见的语义关系用图象形式可视化显示并表达用户检索过程。在可视化空间展示的信息可以看见它们是二维的或三维的。(信息检索中,实现语义控制是人们的理想,而现实的信息检索是基于“字符串”的检索、匹配与表达)
(2)可视化
可视化的优点在于图象的表达方式生动、形象、准确43(3)简单化
未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的用户友好性将不断增加,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任意应用程序都能“连接”进行“网络检索”,并与网络“交互”;各搜索引擎检索界面更加“傻瓜化”,使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完善,会越来越方便用户及时准确的检索信息。这些硬件与软件技术的发展都有利于网络信息检索的简单化。
(3)简单化
未来家用电脑将朝着智能化、网络化、人性化和绿色44
(4)多样化
多样化首先表现在可以检索的信息形态多样化,如文本、声音、图象、动画。
多样化的第二个表现是检索工具向多国化、多语种化方向发展。AltaVista不仅提供了包括中文在内的25种语言检索系统,还提供仂种拉丁语系的语言与英语互译的功能。Google,Yahoo!,HotBot,Lycos《Excite和WebCrawler都在世界各地设立了分支机构,使检索服务本地化;并增加服务器,分流用户,提高上网查询速度。
多样化的第三个表现是网上检索工具的的服务多元化,为用户提供全方位的服务。(不是单纯的检索工具)
(4)多样化
多样化首先表现在可以检索的信息形态多样化,如45(5)个性化
个性化指各网站贯彻以用户为中心的理念,注重内容的特色化和注重个性化的服务。
(5)个性化
个性化指各网站贯彻以用户为中心的理念,注重内容46(6)商业化
网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公共性转向商业化Infoseek是第一个对网络信息检索收费的检索工具,但由于它在收费的同时未能为用户提供特殊的高质量信息服务,不久便自生自灭了。
(6)商业化
网络检索系统不再仅仅是一种检索工具,而且成为一47网络信息检索的的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前的网络信息检索检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘都纷纷在网上设立自己的网络检索入口。网络信息检索的的商业化还体现在联机和光盘检索逐渐进入网络环境48思考题信息和情报两个概念的共性及特性。什么是文献?在图书馆的电子资源中有哪些数据库属于文献型数据库(书目题录文摘型数据库),哪些数据库属于事实型数据库(全文型数据库)。世界著名的国际联机检索系统有哪些?思考题信息和情报两个概念的共性及特性。49第二章
信息检索概述第二章
信息检索概述50一信息与信息源
1、信息信息的含义:信息原指消息的传递,现指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动中所具有的特征性内容的总称。信息不是指事物本身,而是事物存在的方式和运动状态的表现形式,是客观事物经过感知或认识后的再现。一信息与信息源1、信息51信息的特征客观性:信息不是虚无飘渺的事物,它的存在可以被人们感知、获取、传递和利用依附性:信息必须依附于一定的载体(如声波、纸张、化学材料、磁性材料等)才能流通和传递。可传递性:不同载体的信息可以通过计算机、人际交流、文献交流或大众传媒等手段传递给信息用户,最大化的利用信息可塑性:信息在流通和使用过程中,人们借助于先进的技术,可以对其进行综合、分析及加工处理时效性:由于事物是在不断变化着的,因此表征事物存在方式和运动状态的信息也必然会随之改变共享性:信息可以多次传播,不失其内容,与实物交易不同。第二章-信息检索概述课件52信息知识情报与文献知识:人类在改造世界的过程中所获得的认识和经验的总和。信息被人类所感知并被提炼加工即成为知识。知识是信息升华的结果,是一种浓缩的系统化的信息。信息是知识的基础,知识是信息的核心。信息知识情报与文献53情报:是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的接受对象,属于人工知识或信息的范畴,它来源于信息与知识,是激活了的知识、动态的信息。文献:是记录知识或信息的一切载体。即用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。实际上文献是由知识内容、信息符号和载体材料三个不可分割的基本要素构成。知识是文献的实质内容,符号、文字、声音是人体感觉信息的媒介,载体是文献的外在形式。
情报:是人们在一定时间内为一定目的而传递的有使用价值的知识或54它们之间的逻辑关系和范畴关系
它们之间的逻辑关系和范畴关系55思考题偶尔从别人那里听到一个未经证实的事,是不是信息?为什么?农谚是直接关系农业的耕种、收获和其他农事的谚语,它们是长期以来劳动人民农业生产知识、经验的总结。下面看几条有关气象的农谚: 朝霞不出门,晚霞走千里/蜘蛛结网,雨必晴;蚂蚁搬家,雨必下/天上钩钩云,地下雨淋淋/天上鲤鱼斑,明天晒谷不用翻/云往东,刮阵风;云往西,披蓑衣指出每一条谚语中,哪些是信息,哪些是知识?从中可以得到什么启示?思考题偶尔从别人那里听到一个未经证实的事,是不是信息?为什么562、信息源文献信息源(具体内容见第三章) 有信息价值,被人为记录和保存,能够被传播,接收端可以反复重现其内容非文献信息源 有信息价值但不具有或并不明显具有其他要素特征。强调是通过人的感官获取的实时信息,或者说第一手的知识信息。2、信息源文献信息源(具体内容见第三章)57非文献信息源可分为实物信息、口头信息和实情信息实物信息就是现实存在的物化了的各种物质形态的信息。包括实物、样品或展览会的展品。口头信息是指存在于人脑记忆中,通过交谈、谈论、报告等方式交流传播的信息非文献信息源可分为实物信息、口头信息和实情信息58实情信息是现实存在的自然现象和社会现象的信息。它的表现形式不是实物,而是自然现象或者社会现象的状态及其发展过程。自然现象(气候、水文、物理、化学、生物等的演进和反应的状态和过程)社会现象(政治法律事务、军事行动、企业、商业和事业机构运行状态、工程现象、演出现场、经济交易的实时交互过程、人机运动过程等)实情信息是现实存在的自然现象和社会现象的信息。它的表现形式不59思考题以下词条可代表不同类型的信息源,请按文献信息源和非文献信息源为他们分类汽车、敦煌石窟、四库全书、一年内的天气变化数据、上市公司年报、经济新闻、地震仪测得的数据、图书缩微胶片、甲骨文、古时候的陶片、记录片、古籍我国气象专家根据多种信息,预测出2008年可能出现像1998年那样的大洪水,结果该年自6月中旬以来,浙江、福建、江西、湖南、广东、广西等地部分地区遭受强暴雨袭击,造成严重洪涝、山体滑坡和泥石流灾害,预言变成现实。请问专家预测可能会用到哪些信息?分别属于什么信息类型?
思考题以下词条可代表不同类型的信息源,请按文献信息源和非文献60“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过检索竞争对手在某一技术领域的专利申请,并对其信息内容进行深入分析,便可以判断出竞争对手的R&D(研究与发展)方向、经营策略、产品和技术优势。请问专利属于什么类型的信息源?为什么可以通过搜集和分析所掌握的信息预测出竞争对手的发展状态和趋势?“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过61案例分析: 为了在极短的时间内尽快开发出一系列驰骋全球的名牌摩托车产品,1968年日本集中了全国各摩托车修理厂200名具有丰富专业知识和研究能力的工程技术人员和情报人员,分成12个小组,用了一年的时间,走遍世界上所有重要的摩托车生产厂家,对世界摩托车工业进行了有史以来最广泛的全球性调查。在订货、帮助建厂的幌子下,他们搜集了大量的信息,并带回170多部样机。他们每种样机购回两部,一部解剖,一部做运行试验,并结合搜集到的信息,对全部厂家各种型号的摩托车及其零部件的质量、优缺点等进行比较、分析和综合,博采众家之长,最后设计出一种轻便耐用、性能优良、价格便宜的摩托车,并迅速占领国内市场。
案例分析:62
1)通过以上案例你得到什么启示? 2)例子中日本从世界各地带回来的摩托车是否属于信息?如果不是请说明理由,如果是请说明属于什么类型的信息? 3)如果你是试验小组成员,除了摩托车你还会搜集哪些信息?为什么?1)通过以上案例你得到什么启示?633、信息社会的基本内容:3I、3C、3A、3R
3I:Information(信息)、Intelligence(智能)、Integration(集成、综合)3C:Computer(计算机)、Communication(通讯)、Control(控制)3A:FactoryAutomation(工厂自动化)、OfficeAutomation(办公自动化)HomeAutomation(家庭自动化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)
3、信息社会的基本内容:3I、3C、3A、3R
3I:In64二、信息检索的基本内容1、概念:1)信息检索(informationretrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(informationstorageandretrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询(informationsearch)。二、信息检索的基本内容1、概念:652)检索语言:检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同的理解、实现交流的语言。有人工语言(主题语言和分类语言)、自然语言之分。(第三章详细介绍)
3)检索方法:常用法、追溯法和循环法
(第四章详细介绍)2)检索语言:检索语言是把信息的存储与检索联系起来,把标引人66检索词、检索式、检索策略(第四章详细介绍)
检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。
检索式也称检索提问式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而成。如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(WebORInternetORWWW)AND(Search*ORRetrieval*)。
检索词、检索式、检索策略(第四章详细介绍)
检67检索策略:
所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。也就是为满足信息需求所制定的一系列检索方案。
检索策略:
所谓检索策略,就是在分析课题内容685)检中结果、查全率、查准率(第四章详细介绍)
检中结果又称检索结果集,是数据库中满足(检索式(即符合检索条件)的那些记录的集合
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例
查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例
5)检中结果、查全率、查准率(第四章详细介绍)
检中结果又称692、信息检索的类型:
(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)
(2)根据检索对象、
形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。
2、信息检索的类型:
(1)根据检索手段的不同,分为手工检索70
文献型信息检索(DocumentRetrieval):以文献(包括题录、文摘)为检索对象的检索。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。完成文献型信息检索主要借助于各种书目型数据库。
文献型信息检索(DocumentRetrie71数据型信息检索(DataRetrieval):以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型与非数值型。完成数据型信息检索主要借助于各种数值数据库和统计数据库。
数据型信息检索(DataRetrieval):以数值或数据72事实型信息检索(FactRetrieval):以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。如:2001年7月通过的奥运会主办城市的结果与过程。完成事实型信息检索主要借助于各种指南数据库和全文数据库。
事实型信息检索(FactRetrieval):以某一客观事73
3、信息检索的发展历程
3.1基本方向:手工检索向计算机检索(如穿孔、缩微、自动化)发展,但是手工检索与计算机检索将长期并存。因为计算机检索有其缺陷:(1)硬件条件不足:没有计算机,不能上网,(2)数据库不完善,(3)网络慢或网络故障等等。
3、信息检索的发展历程
3.1基本方向:手工检索向计算机74
3.2计算机信息检索的的产生和发展,分为五个阶段:
(1)脱机批处理检索:1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。
3.2计算机信息检索的的产生和发展,分为五个阶段:
(75(2)联机情报检索:20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。
第二章-信息检索概述课件76联机检索系统由三个部分组成:主机系统、通讯系统和终端设备
主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。
通讯系统是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。
终端系统是人与系统的接口设备。它能将字符、声音以及人类的信息表现形式转换成系统的机器代码。反之,将系统的结果还原成字符、声音等形式,传送给终端用户。联机检索系统由三个部分组成:主机系统、通讯系统和终端设备
77
(3)国际联机检索:70年代中后期国际联机检索是指用户利用终端设备,通过通信网与地球上任何地方的大型计算机信息检索系统的主机进行直接人机对话式的计算机检索。
第二章-信息检索概述课件78国际联机检索系统一般由通信网络、国际联机检索中心、用户终端等三部分组成。国际联机检索系统的服务方式有:回溯检索、定题服务、联机订购原文、电子邮件服务以及光盘服务五种方式。
国际联机检索系统一般由通信网络、国际联机检索中心、用户终端等79几种主要的国际联机检索系统Dialog国际联机检索系统ESA/IRS国际联机检索系统ORBIT国际联机检索系统STN国际联机检索系统OCLC国际联机检索系统
这是目前世界著名的五大联机检索系统几种主要的国际联机检索系统Dialog国际联机检索系统80
目前世界上最大的国际联机检索信息系统。总部设在美国旧金山附近的帕洛阿尔托市。此系统现有近600个数据库,信息总量超过5亿条,其中包括50多种语言、6万多种期刊,数据库内容涉及综合性学科、自然科学、应用科学和社会科学等,文献类型有图书、报纸、期刊、学位论文、会议录研究报告、政府文件、专利文献、标准文献、年鉴、市场行情和厂商名录等。DIALOG
目前世界上最大的国际联机检索信息系统。81ORBIT
ORBIT的全称为onlineretrievalofbibliographicinformationtimeshared即文献目录信息分时联机检索。是第二大国际联机检索系统,拥有200多个数据库。以化工、石油、生物、化学、环境科学、医学、运动科学和安全科学等深入文献比较齐全而著称。其特色数据库有SAE(汽车、飞机等交通工具)TULSA(石油、天然气开采与勘探)等30多个数据库,为该系统独有。ORBITORBIT的全称为onli82ESA/IRS是欧洲最大的联机检索中心。也是世界上大型的国际联机检索系统之一,仅次于美国的DIALOG和ORBIT联机检索系统。涉及的专业范围有:科技、农业、卫生、管理、社会科学和宇航工程及技术等方面。有120多个数据库,其中,酸雨(ACIDRAIN)、铸造(BIIPAM-CTIF)、原材料价格(PRICEDATA)、卫星遥感图象(LEDA)、宇航及高技术软件(SPACESOFT)等为特色数据库。ESA/IRS是欧洲最大的联机检索中83STN
STN(TheScientificandTechnicalInformationNetworkInternational)是国际科学技术信息网络系统的简称。是由德国卡尔斯鲁厄能源、物理、数学专业信息中心(FIT)、美国化学文摘社(CAS)和日本国际化学信息协会(JAICI)三家合作经营的国际联机检索系统。涉及的专业范围:化学、化工、生物、医学、数学、物理、能源、冶金、建筑等方面。其特色数据库有:CAS化学物质结构图形数据库(REGISTRY)、德国专利数据库(PATDPA)、碳13核磁共振和红外光谱数值图形数据库(C13-NMR/IR)。STNSTN(TheScienti84STN的特点合作建网,分布式管理多文档检索,方便实用字段限定检索时,只使用后缀码,无前缀码拥有世界上第一批联机图象数据库STN的特点合作建网,分布式管理85OCLC
OCLC(OnlineComputerLibraryCenter)即联机计算机图书馆中心。是世界上最大的文献信息服务机构之一。总部设在美国俄亥俄州,1971年建成联机系统,拥有370多种语言、3400多万条联合书目记录数据库,OCLC的“第一检索系统”(FirstSearch)提供联机信息检索系统目前有70多个数据库,涉及13个主题领域。不仅有书目信息而且绝大部分可以直接获取全文。OCLCOCLC(Online86(4)光盘检索:80年代初期,其全称为高密度光盘(CompactDisk),主要是利用激光、计算机及光电集成等技术实现信息存储的数字化。以光盘为介质的光盘数据库检索系统由于信息存储量大,简单易用而取胜。
(4)光盘检索:80年代初期,其全称为高密度光盘(Compa87
(5)网络信息检索:
网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来,形成一个基于客户机-服务器模式的网络分布数据库结构。它在全球范围内把科技信息、商贸信息、经济信息、时事新闻以及日常生活信息通过互联网络合在一起,向亿万联网用户提供广泛的信息检索与服务。它是信息化社会应用最广泛、最活跃的领域。
(5)网络信息检索:
网络信息检索是通过标88网络信息检索服务的特点:
1)信息检索服务的开放性。网络信息系统中包含信息资源、信息设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是开放的,其信息资源面向所有用户。
2)超文本的多链接性。以超文本技术为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肾透析感染预防措施
- 永康产业就业前景解读
- 海城事故警示录讲解
- 检察机关提起民事公益诉讼制度研究
- 桂南“跳岭头”唱本:民俗文化视域下的艺术传承与探索
- 【专家】碳中和背景下可再生能源发展的机遇与挑战
- 2026届甘肃省酒泉市中考数学押题卷含解析
- 设备维护作业安全培训教育
- 2026届湖南邵阳市区中考数学考试模拟冲刺卷含解析
- 核心素养视域下:部编版初中语文阅读教学中生态美育的融合与实践
- DBJT 13-502-2025 古建筑安全监测技术标准
- 纯化水洁净管道施工方案
- 2025年广东省广州市中考道德与法治试卷附答案
- 培训课件养老护理员
- JT-WI-QM-006-02分层审核检查表
- 人大代表候选人初步人选资格审查表
- sem提成管理办法
- 滴滴代驾公司管理制度
- 2025年市政工程职业素养点评试题及答案
- 25春国家开放大学《药剂学(本)》形考任务1-3参考答案
- 重症医学科护理专案改善
评论
0/150
提交评论