版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索与利用王稳琴2013年03月07日1第3章网络信息资源的检索3.1网络信息资源概述3.2网络信息检索方法3.3搜索引擎3.4网络免费学术资源3.5网络信息资源上机实习23.1网络信息资源概述3.1.1定义
网络信息资源是指以电子资源数据的形式将文字、图像、声音、动画等多种形式的信息存放在光、磁等非印刷质的介质中,并通过网络通信、计算机或终端等方式再现出来的信息资源的总和。33.1.2类型按所采用的网络传输协议划分网络信息资源类型按存取方式划分按信息传播与交流的过程划分按正式出版物类型划分3.1网络信息资源概述43.1.2类型按所采用的网络传输协议划分Web信息资源FTP信息资源Telnet信息资源用户服务组信息资源Gopher信息资源3.1网络信息资源概述
Web信息资源:通过超文本传输协议(HTTP,HypertextTransferProtocol)在WWW(WorldWideWeb,万维网,也称环球信息网)客户机和服务器之间进行传输。这类信息资源是建立在超文本、超媒体技术基础上的集文本、图形、图像、声音为一体的,并以直观的图形界面(GUI)展现和提供的一种资源形式,现已成为一种最主要、最常见的形式,代表着信息资源的主流。53.1.2类型按所采用的网络传输协议划分Web信息资源FTP信息资源Telnet信息资源用户服务组信息资源Gopher信息资源3.1网络信息资源概述
FTP信息资源:指在Internet上通过文件传输协议(FTP,FileTransferProtocol)所获得的信息资源,即指从远程计算机上下载的信息和从本地机上传到远程计算机上的信息的总和。这类信息资源类型广泛,任何以计算机方式存储的信息均可保存在FTP服务器中,具体包括印刷型书籍的电子版、电子图书、电子期刊、电子报纸及论文、标准、软件、歌曲、乐谱等。63.1.2类型按所采用的网络传输协议划分Web信息资源FTP信息资源Telnet信息资源用户服务组信息资源Gopher信息资源3.1网络信息资源概述
Telnet信息资源:指基于网络通信协议(Telnet,TelecommunicationNetworkProtocol),从远程计算机对外开放的资源中所获得的信息资源。
Telnet是一个强有力的信息共享工具,全世界许多图书馆都通过Telnet提供对外联机检索服务。如,商用数据库(如,DIALOG、OCLC、UMI、Datastar等)和免费数据库(图书馆通过Telnet提供的联机公共检索目录OPAC)等。73.1.2类型按所采用的网络传输协议划分Web信息资源FTP信息资源Telnet信息资源用户服务组信息资源Gopher信息资源3.1网络信息资源概述
用户服务组信息资源:用户服务组是由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛。以电子邮件的方式在论坛中交流信息,是目前互联网上最受欢迎的信息交流形式,包括新闻组(UsenetNewsGroup)、邮件列表(MailingList)、专题讨论组(DiscussionGroup)、兴趣组(InterestGroup)、辩论会(Conference)等。83.1.2类型按所采用的网络传输协议划分Web信息资源FTP信息资源Telnet信息资源用户服务组信息资源Gopher信息资源3.1网络信息资源概述Gopher信息资源:是一种基于菜单的网络服务,允许用户以一种简单的、一致的方式快速找到并访问所需的网络资源。
Gopher可以跨越多个计算机系统,运行本地计算机的Gopher客户程序就可以与世界上任何一个Gopher服务器连接并共享信息。它具有界面简单统一、方便易用、质量可靠等特点,现已成为互联网上一种重要的资源类型。93.1.2类型按存取方式划分邮件型信息资源揭示版型信息资源会话型信息资源图书馆型信息资源书目型信息资源3.1网络信息资源概述
邮件型信息资源:指以特定的个人或群体为对象的非即时信息的传播方式,以电子邮件和邮件列表为代表。其中,电子邮件是目前使用最多的一种获取信息的方式。103.1.2类型按存取方式划分邮件型信息资源揭示版型信息资源会话型信息资源图书馆型信息资源书目型信息资源3.1网络信息资源概述
揭示版型(公告牌型)信息资源:指以不特定的大多数网络利用者为对象的非即时性信息传播方式,如BBS、网络新闻、匿名FTP等,通过这种方式传播的信息质量不一。113.1.2类型按存取方式划分邮件型信息资源揭示版型信息资源会话型信息资源图书馆型信息资源书目型信息资源3.1网络信息资源概述
会话型信息资源:以会话和交互网中继对话(IRC,InternetRelayChat)为代表,在网络上通过文字实现即时信息传播。如目前广泛受欢迎的QQ聊天软件。123.1.2类型按存取方式划分邮件型信息资源揭示版型信息资源会话型信息资源图书馆型信息资源书目型信息资源3.1网络信息资源概述
图书馆型信息资源:主要指以一次信息进行系统组织后产生的文献信息方式,以Gopher、WWW为代表。133.1.2类型按存取方式划分邮件型信息资源揭示版型信息资源会话型信息资源图书馆型信息资源书目型信息资源3.1网络信息资源概述
书目型信息资源:指网络上以提供二次信息为主的各种综合型、专业型的检索工具。如基于WWW技术的综合型检索工具搜狐、新浪、Yahoo!、Altavista等,查询人物机构团体的Finger和Whois及查询FTP文档的Archie和WAIS。143.1.2类型按信息传播与交流的过程划分稳定的电子信息资源不稳定的电子信息资源3.1网络信息资源概述
稳定的电子信息资源:指社会组织或集团以比较制度化的传播方式提供的,可信度较高的一类信息资源,有比较稳定的存取途径和手续,可重复操作。大多为非网络环境下的印刷型文献信息在网络上的眼神,包括图书馆联机查询目录、联机数据库、电子书刊等。153.1.2类型按信息传播与交流的过程划分稳定的电子信息资源不稳定的电子信息资源3.1网络信息资源概述
不稳定的电子信息资源:指信息用户通过使用共同的软件进行会话、交谈、会议、信件往来等纯粹私人的或集团性的信息传播方式获得的一类信息。包括从事尖端科研的同行之间的信息交换到大学生之间的网上聊天。这是一种比较动态的、即时性的和变化性的信息资源。163.1.2类型按正式出版物类型划分3.1网络信息资源概述
电子图书:指采用数字化形式,将文字、图像、声音信息储存在光、磁等介质上,借助计算机技术、通信技术、网络技术来获取及阅读的一种全新的图书类型。它有电子图书内容、阅读设备、阅读软件三部分构成。它将图书的内容制作成电子文本后在网上发行。阅读者使用阅读器或专用浏览器在计算机上离线阅读。电子图书电子期刊电子报纸173.1.2类型按正式出版物类型划分3.1网络信息资源概述
电子期刊:指以数字形式存储在光、磁等介质上,并通过计算机设备本地或远程读取使用的定期或不定期发行的连续出版物的总称。它包括光盘版电子期刊、联机版电子期刊和网络版的电子期刊。电子图书电子期刊电子报纸183.1.2类型按正式出版物类型划分3.1网络信息资源概述
电子报纸:指采用数字化形式,将文字、图形、声音信息存储在光、磁等介质上,借助计算机技术、通信技术、网络技术来出版发行的一种全新的报纸形式。与电子期刊类似,它也包括纸质报纸的电子化、纸质版和电子版报纸同时发行以及纯电子版报纸3种类型。电子图书电子期刊电子报纸193.1.3特点3.1网络信息资源概述内容角度海量化类型多样更替快复杂性203.1.3特点3.1网络信息资源概述形式角度开放性数字化存储传递动态性非线性组织无序213.1.3特点3.1网络信息资源概述效用角度共享性时效性交互性223.1.3特点3.1网络信息资源概述检索角度网络信息通道的双向性和信息检索的网络性网络信息关联度强,检索快捷233.1.4评价3.1网络信息资源概述1、网络信息资源机构的权威性和可信度2、网络信息资源的内容科学性和新颖性3、网络信息资源的覆盖面和针对性4、网络信息资源的检索途径243.2.1网络信息资源的常用检索方法3.2网络信息资源检索概述网络信息资源的常用检索方法直接访问法漫游法检索法253.2.1网络信息资源的常用检索方法3.2网络信息资源检索概述网络信息资源的常用检索方法直接访问法漫游法检索法直接访问法:是已经知道要查找的信息可能存在的地址(URL),利用浏览器直接连接到其主页上进行浏览查找。
其优点是目的性强、节省时间,缺点是信息量少。263.2.1网络信息资源的常用检索方法3.2网络信息资源检索概述网络信息资源的常用检索方法直接访问法漫游法检索法漫游法:是指从一个网页上通过感兴趣的条目链接到另一个网页上,在整个因特网上无固定目的地进行浏览。
其优点是无需特定的网址,通过无止境的链接在网上可能发现一些意想不到的信息;缺点是用户在漫游过程中往往会失去方向,花费了大量时间、精力之后可能最终却一无所获。273.2.1网络信息资源的常用检索方法3.2网络信息资源检索概述网络信息资源的常用检索方法直接访问法漫游法检索法检索法:是指依靠专业的网络信息检索软件,将网络上的信息与用户选定的检索词相匹配,以快速获取相关信息的方法。
有效的检索需要学会怎样使用检索软件和相关技能,才能取得令人满意的结果。283.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎主题指南(目录型检索工具):是在广泛搜集网络资源及进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个类目及子类下提供相应的网络资源站点地址,并给以简单的描述,通过浏览该目录,在目录体系的导引下检索到有关的信息。293.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎
此类检索工具比较适合于对不熟悉领域的一般性浏览或检索概况性强、类属明确的主题,检索质量较高,但因为人工操作成本较高使得内容相对较少,收录不全面,新颖性不够。
在因特网发展早期,以Yahoo为代表的网站分类目录查询非常流行,而现在,此类主题指南往往与计算机检索软件结合起来,以等级式主题指南类搜索引擎的形式提供检索服务。303.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎图书馆的网络导航:是许多图书馆从协调整个网络资源的角度出发,对因特网上的相关学术资源进行搜集、评价、分类、组织和有序化整理,并对其进行简要的内容揭示,建立分类目录式资源组织体系、动态链接学科资源数据库和检索平台,发布于网上,为用户提供学科信息资源导航和检索服务。313.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎
与其他网上导航工具相比,图书馆的网络导航具有专业性、易用性、准确性、时效性和经济性等优势,所含内容切合主题,学术价值较高。
不足之处是所建立的数据库规模较小,在某些类目下收集的文件数量有限,更新滞后。
常用的国外学术性网络导航系统由加利福尼亚大学图书馆的INFOMINE、麻省理工学院图书馆的VirtualReferenceCollection等,国内比较有影响的是“CALIS重点学科网络资源导航门户”
。323.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎搜索引擎使用自动索引软件来发现、收集并标引网页,建立数据库;以Web形式提供检索界面,供用户输入关键词、词组或短语等检索项;代替用户在数据库中找出与提问相匹配的记录;按一定的相关度排序返回结果。333.2.2网络信息资源的检索工具3.2网络信息资源检索概述网络信息资源的常用检索工具主题指南图书馆的网络导航搜索引擎
搜索引擎强调的是检索功能,而非主题指南那样的导引、浏览。搜索引擎适合于检索特定的信息及较为专深、具体或类属不明确的课题,信息量大且新,速度快,但检索结果准确性相对较差。其代表有Google、百度等。343.3.1搜索引擎的工作原理3.3搜索引擎1、搜集信息:利用网络蜘蛛(Spider)的网页抓取程序自动顺着网页中的超链接连续地抓取网页。2、整理信息:建立索引——将搜集起来的信息按照一定的规则进行编排,建立索引文件,还要去除重复网页、分析超链接、计算网页的重复度等。3、提供检索服务:用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配关键词的网页并向用户返回信息。为了用户判断,搜索引擎除了提供网页标题和网页链接外,还会提供一段来自网页的摘要信息。353.3.2搜索引擎的类型3.3搜索引擎搜索引擎的类型全文搜索引擎目录式搜索引擎元搜索引擎
全文搜索引擎:是通过从因特网上提取各个网站的信息(以网页文字为主)而建立的数据库中检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,具代表性的有谷歌、百度等。
全文搜索引擎可细分为两种:一种是拥有自己的检索程序,并自建网页数据库,从搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos。363.3.2搜索引擎的类型3.3搜索引擎搜索引擎的类型全文搜索引擎目录式搜索引擎元搜索引擎
Google借用OpenDirectory目录提供分类查询。Yahoo!的目录索引则将人工编制的等级式主题目录和计算机检索软件提供的关键词等检索手段结合起来,完成网络信息资源的组织任务,形成一种特有的等级式主题指南类搜索引擎。373.3.2搜索引擎的类型3.3搜索引擎搜索引擎的类型全文搜索引擎目录式搜索引擎元搜索引擎
元搜索引擎(集合型搜索引擎):将用户的查询请求同时向多个独立的搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户,没有自己的数据。
元搜索引擎的优点是返回结果的信息量更大、更全,缺点是只能提交简单的检索,不能传递使用布尔逻辑或其他运算符来限制或改进结果的高级检索提问式,用户需要做更多的筛选。
元搜索引擎中具有代表性的有WebCrawler、InfoSpace等。383.3.3搜索引擎的基本检索功能3.3搜索引擎“与”AND/+“或”OR/*“非”NOT/-
多个字词之间用一个空格隔开进行搜索,搜索引擎会返回包含所有搜索字词的网页。注意:对于谷歌,字词键入的顺序会影响搜索结果。
如果几个搜索词中任意一个出现在结果中就满足搜索条件时,可在关键词之间使用大写的OR连接符,对于百度是用“/”连接符。连接符与搜索词之间必须有空格。如果发现在搜索结果中,有很多网页包含不希望看到的某些特定词,可以使用减号去除这些网页。注意,前一个关键词和减号之间必须有空格。
1.初级检索功能393.3.3搜索引擎的基本检索功能3.3搜索引擎词组搜索大小写
禁用词
当输入较长的搜索词时,搜索引擎会自动将整个字符串做拆字处理。如需要得到精确、不拆字的搜索结果,可在关键词前后加上双引号。
搜索引擎不区分大小写,输入的所有字母会视为小写的。为提高查准率,搜索引擎将常用的一些介词、冠词、数字和单个字母等高频词作为禁用词,在检索时自动忽略,如果必须使用禁用词时可用+或“”。
1.初级检索功能403.3.3搜索引擎的基本检索功能3.3搜索引擎(1)将搜索范围限定在特定站点中——site
在搜索内容的后满,加上“site:站点域名”。注意:“site:”后面的站点域名不要带http://;另外“site:”和站点名之间无空格。
2.高级检索功能413.3.3搜索引擎的基本检索功能3.3搜索引擎(2)限定搜索的文件类型——filetype
搜索引擎支持对Office文档、AdobePDF文档、RTF文档进行全文搜索。要搜索这类文档,只需要在普通的检索词后面,加一个“filetype:”来对文档类型进行限定。其后可以跟DOC、XLS、PPT、PDF、RTF等文件格式。
2.高级检索功能423.3.3搜索引擎的基本检索功能3.3搜索引擎
(3)将搜索范围限定在URL链接中——inurl其方法是用“inurl:”后跟需要在URL中出现的关键词。注意,“inurl:”和后面的关键词之间无空格。
2.高级检索功能433.3.3搜索引擎的基本检索功能3.3搜索引擎
2.高级检索功能将搜索范围限定在网页标题中——intitle其方法是用“intitle:”加搜索内容中特别关键的部分。注意,“intitle:”和后面的关键词之间无空格。443.3.3搜索引擎的基本检索功能3.3搜索引擎
2.高级检索功能将搜索范围限定在网页<body>中——intext其方法是用“intext:”后跟需要在网页<body>部分中出现的关键词。注意,“intext:”和后面的关键词之间无空格。453.3.4搜索引擎的检索技巧3.3搜索引擎1、分析搜索的主题:确定需要的信息类型(文本、图片、音频、视频等)、查询方式(分类检索、关键词检索等)、查询范围(所有网页、新闻、论坛等)、查询语言(中文、外文)等。2、选择合适的搜索引擎:一般来说,如果搜索英文信息,使用Google会更为有效,搜索中文信息则倾向于使用百度,如果是查找可以确定类别的信息,建议使用yahoo!。不同搜索引擎其信息覆盖范围会有差异,搜索结果不佳时,有必要尝试更换搜索引擎。463.3.4搜索引擎的检索技巧3.3搜索引擎3、提取恰当的关键词:(1)应该避免出现错别字等输入错误;(2)要避免概念宽泛的词,尽量选用规范的专指词、特定概念或专业术语等具体的关键词,还要注意同义词、近义词、相关词或同一术语的不同表达方式;(3)可以通过使用多个关键词来提高检准率,但要注意它们之间的逻辑关系是否合理。473.3.4搜索引擎的检索技巧3.3搜索引擎4、根据搜索结果及时调整搜索策略:(1)通常情况下,一次搜索并不能得到满意的结果,如果在前两页结果页都没有满意的结果,就应该考虑调整搜索策略重新搜索,而不是无谓地继续往下翻页。(2)当搜索结果数量太多且准确性不高时,可以通过增加密切相关的搜索词来对结果进行进一步的提炼。(3)当所得搜索结果数量较少时,可以通过使用同义词、近义词来扩大检索范围。483.3.4搜索引擎的检索技巧3.3搜索引擎5、相关搜索:搜索结果不理想,可能是因为搜索词选择不恰当,可以通过搜索引擎提供的“相关搜索”,它提供了和你搜索主题很相似的一系列查询词,排布在搜索结果页的下方,按搜索热门度排序。493.3.4搜索引擎的检索技巧3.3搜索引擎6、使用高级搜索或高级搜索语法,提高搜索效率:适合于不熟悉信息检索技术的新手或者当搜索主题复杂,限定条件繁多的情况下使用。高级搜索语法可以对搜索范围站点、文件类型、主题信息范围进行精确控制。503.3.4搜索引擎的检索技巧3.3搜索引擎7、直接到信息源查找:在搜索特别是诸如政府工作报告、政府白皮书等信息时,如直接用搜索引擎搜索无法得到满意结果,可尝试直接到信息源网站去查找。可先查发布相关信息的机构名称,再检索得到该机构的官方网站地址,然后利用“site:站点域名”高级搜索语法或用该机构网站提供的站内搜索、主题分类等途径查找相关信息。513.3.4搜索引擎的检索技巧3.3搜索引擎8、网页快照:每个被收录的网页,搜索引擎都会自动生成临时缓存页面,称为网页快照。
(1)当遇到网站服务器暂时故障或网络传输堵塞时,访问快照要比常规链接的速度快很多。(2)在搜到访问不了的“死链网页”或过期文件时,往往通过网页快照还能查阅到其文本内容。(3)符合搜索条件的词语会在网页快照以加亮的形式突出显示,以便于快速查找到相关资料。(4)网页快照只会临时缓存网页的文本内容,所以那些图片、音乐等非文本信息,仍是存储于原网页。523.3.4搜索引擎的检索技巧3.3搜索引擎9、对搜索结果进行适当的筛选、鉴别:检索只是手段,最终目的是要找到真正有价值的信息。而搜索引擎按照它自己规则排列的优先次序也许与需求并不一致,所以适当的筛选必不可少。533.3.5主要搜索引擎简介3.3搜索引擎谷歌Google()百度()Yahoo!()Bing()543.3.5主要搜索引擎简介3.3搜索引擎谷歌Google()553.3.5主要搜索引擎简介3.3搜索引擎563.4.1开放存取学术文献3.4网络免费学术资料573.3.5主要搜索引擎简介3.3搜索引擎百度()583.3.5主要搜索引擎简介3.3搜索引擎593.3.5主要搜索引擎简介3.3搜索引擎Yahoo!()603.3.5主要搜索引擎简介3.3搜索引擎Bing()613.4.1开放存取期刊3.4网络免费学术资料DirectoryofOpenAccessJournal,DOAJ(
):瑞典隆德大学图书馆主板、OSI和SPARC协办的一份开放存取期刊目录检索系统。623.4.1开放存取期刊3.4网络免费学术资料Socolar():是中国教育图书进出口公司开发的一个OA资源一站式服务平台。633.4.1开放存取期刊3.4网络免费学术资料HighWirePress():是中国教育图书进出口公司开发的一个OA资源一站式服务平台。643.4.1开放存取期刊3.4网络免费学术资料BioMedCentral():是一家独立的非赢利性学术出版机构,致力于提供生物医学文献的开放存取。653.4.1开放存取期刊3.4网络免费学术资料PLoS():是美国一家非营利性组织出版商,致力于使全球范围科技和医学领域文献成为可以免费获取的公共资源。663.4.1开放存取期刊3.4网络免费学术资料BiolineInternational(.br):提供了来自发展中国家(包括中国、巴西、古巴、印度等)的58种开放存取期刊的全文。673.4.1开放存取期刊3.4网络免费学术资料SciELO(http://www.scielo.br):提供了197种巴西网络版科技期刊。683.4.1开放存取期刊3.4网络免费学术资料PubMedCentral():是美国卫生研究院(NationalInstitutesofHealth,NIH)与美国国立医学图书馆(NationalLibraryofMedicine,NLM)联合建立的一个生命科学期刊文献全文免费检索系统。693.4.1开放存取期刊3.4网络免费学术资料UKPubMedCentral(http://ukpmc.ac.uk):是英国医学与生命科学领域的开放存取系统平台,可以免费获取英国目前最为前沿的生命和医学的文献。HindawiPublishingCorporation():是继PLoS、BMC之后的第三大开放存取出版商。OpenJ-Gate():是印度信息公司2006年创建的开放存取期刊门户。703.4.1开放存取期刊3.4网络免费学术资料HINARI(/hinari/en):是印度信息公司2006年创建的开放存取期刊门户。FreeMedicalJournals(
):是印度信息公司2006年创建的开放存取期刊门户。713.4.2开放存取图书3.4网络免费学术资料TheNationalAcademiesPress(
):是美国国家科学院下属的学术出版机构,主要出版美国国家科学院、国家工程院、医学研究所和国家研究委员会的报告。
eScholarshipEditions(/editions):由加利福尼亚数字图书馆创立。723.4.2开放存取图书3.4网络免费学术资料ProjectGutenberg(
):是世界上最早的一个电子图书项目。
GoogleBookSearch():是谷歌公司于2004年启动的一个项目,旨在对全球大学图书馆藏书进行数字化扫描,打造世界最大的数字图书馆。733.4.2开放存取图书3.4网络免费学术资料TheOnlineBooksPage()Free-eBooks
()ManyBooks
(http://)FreeBookSpot
(http://www.freebookspot.in)743.4.2开放存取图书3.4网络免费学术资料FreeComputerBooks
()FreeTechBooks
()OnlineFreeEBooks
(http://)753.4.3开放存取课件3.4网络免费学术资料中国开放教育资源协会
()MITOpenCourseWare
(http://)WorldLectureHall
(http:///wlh)JapanOCW,JOCW
(http://www.jocw.jp)763.4.3开放存取学位论文3.4网络免费学术资料香港大学论文库
(http://sunzil.lib.hku.hk/hkuto/index.jsp)TheNetworkedDigitalLibraryofThesesandDissertationsNDLTD
()MITTheses
(http:///mit-theses)DIVAPortal
(http://)诺丁汉大学电子学位论文
(http://etheses.nottingham.ac.uk)773.4.3开放存取机构收藏库3.4网络免费学术资料MITDspace
(http://)香港科技大学机构收藏库
(http://repository.ust.hk)CambridgeDspace
(http://www.dspace.cam.ac.uk)eScholarshipRepositoryofCaliforniaUniversity
(http:///escholarship)783.4.4电子印本系统3.4网络免费学术资料电子印本(e-Print)是指以电子方式复制学术文献,一般包括预印本和后印本。预印本是指科研人员在其研究成果未在正式出版物上发表之前,出于和同行交流目的的自愿先在学术会议上或通过因特网发布的科研论文、科技报告等文献。后印本是指内容已经经过出版部门审核达到出版要求的文献。793.4.4电子印本系统3.4网络免费学术资料中国预印本服务系统
(http://)奇迹文库
(/eprint)中国科技论文在线
(http://www.
)arXe-Printarchive
(http://)803.4.4电子印本系统3.4网络免费学术资料Cogprints
()SINDAP
(http://;http://sindap.cvt.dk)E-printNetwork
(http:///eprints)813.4.5其他3.4网络免费学术资料专利和标准科技报告和统计数据学术资源搜索门户网站学科网络信息门户专业学术论坛823.5.1认识IP3.5网络信息资源利用——上机实习
人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。
静态IP地址是指每次连线均为同样固定的地址。
动态IP地址指的是每次连线所取得的地址不同。如在图书馆无线上网就是动态IP地址,每次所取得的地址不同。833.5.1认识域名3.5网络信息资源利用——上机实习
虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(DomainName)。
域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http://”。
域名也由若干部分组成,各部分之间用小数点分开。843.5.1认识网络地址3.5网络信息资源利用——上机实习网络地址是URL(Uniform
Resource
Locator)的俗称,一般由三个部分构成,各个部分如下:
1.
服务器标识符:通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTTP://、FTP://、GOPHER://、TELNET://、NWES://等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。853.5.1认识网络地址3.5网络信息资源利用——上机实习
3.
路径名:是给出资源在所在机器上的完整文件名。
2.
信息资源地址:由两部分构成的,一是机器名称,如是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。863.5.1认识网络地址3.5网络信息资源利用——上机实习
由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:.中国的商业.org.hk香港的组织.net.jp日本的网络.com商业公司.org组织、协会等.net网络服务.edu教育机构.gov.政府部门.mil军事领域873.5.1www和浏览器3.5网络信息资源利用——上机实习浏览web信息的网络浏览器有哪些?
微软IE(InternetExplorer)
网景(Netscape)
遨游(maxthon)
腾讯TT浏览器
360浏览器www指的是什么?
即是万维网(WWW-WorldWideWeb):是基于超文件的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。883.5.2网络信息检索工具3.5网络信息资源利用——上机实习当您不知道地址的时候,需要借助检索工具:
搜索引擎
网络资源指南(门户)
专门数据库当已经知道地址时直接通过地址访问。893.5.2搜索引擎3.5网络信息资源利用——上机实习如Yahoo雅虎、新浪。其他著名的还有OpenDirectoryProject(DMOZ)、LookSmart、About等。现在许多搜索引擎在提供搜索服务的时候也同时提供这一类服务。分类目录型:分类目录虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。
搜索(网页)型:最常见的。903.5.2搜索引擎3.5网络信息资源利用——上机实习中文搜索引擎指南网[搜网]:
/
搜索引擎观察[专业、元、多媒体、购物]
/
著名搜索引擎简介:
/about-se.htm
913.5.3中文常用搜索引擎3.5网络信息资源利用——上机实习百度中文搜索引擎:/
Google中文搜索引擎:/
搜狐搜狗搜索:/
雅虎:/
新浪:/
网易:/
TOM搜索:/
北大天网搜索引擎:/
奇虎:
/
923.5.3英文常用搜索引擎3.5网络信息资源利用——上机实习Google
—以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。Fast/AllTheWeb
—总部位于挪威的搜索引擎后起之秀,风头直逼google。AltaVista
—曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。Overture
—最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。Lycos
—发源于西班牙的搜索引擎,网络遍布世界各地。HotBot
—隶属于LycosNetworks,搜索结果来自其他搜索引擎及目录索引。933.5.3专业搜索引擎3.5网络信息资源利用——上机实习找工作的搜索引擎:/
google学术搜索:/
google图书搜索:/
比价购物搜索引擎:/博客与RSS搜索引擎:/[中客]
/[博客中国人]人脉搜索引擎:/[交友,找工作,商机]论坛搜索引擎:/943.5.3专业搜索引擎3.5网络信息资源利用——上机实习TheMusicFinder
Singingfish(只能搜寻声音和录像)
旅行TripAdvisor
计算机科学研究和文章
图像搜索引擎:/[图像词典]953.5.3专业搜索引擎3.5网络信息资源利用——上机实习商业搜索引擎
Business(
)生意定向搜索引擎。DailyStocks(
)
可以了解被查询公司存货的信息已经相关的新闻报导,研究,引述和其他数据。
FMLX(
)
英国定向的关于公司,存货数据,分析和研究的搜索引擎。eBizSearch()
关于电子商务的文章和报告。963.5.3元搜索引擎3.5网络信息资源利用——上机实习早期的中文元搜索引擎:
1、metaFisher中文元搜索引擎/fish/做的较早,核心功能较弱,没有现代主流搜索引擎的界面风格。
2、万纬搜索/功能上和第一个元搜索引擎一样,核心功能很弱,制作一般。
3、多元搜索/做得较早,虽然号称整合的搜索引擎最多,但实际使用效果很差,查询速度也慢,返回结果基本未作处理。973.5.3元搜索引擎3.5网络信息资源利用——上机实习新近出现的元搜索引擎:
1、知识搜索
/search/主要用作学习工具,功能上尽量保证全面实用
2、一家搜
/对相似结果的处理有点特色
3、bbmao
是国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强
4、狠搜
/可以定制源搜索引擎,同时提供商业信息搜索,核心功能一般983.5.4搜索引擎举例:GOOGLE3.5网络信息资源利用——上机实习通用检索法则:关键词的选择是核心!检索技巧一:选择专指性强的词例如,查找“网络检索工具的历史”有关的信息,选词时选用“搜索引擎”一词,比选用“检索工具”一词,查准率会更高。993.5.4搜索引擎举例:GOOGLE3.5网络信息资源利用——上机实习检索技巧二:多角度选词例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。1003.5.4搜索引擎举例:GOOGLE3.5网络信息资源利用——上机实习检索技巧三:选择限制主题的词由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗-汽车”,将会找到关于红旗但不含“汽车”的网页。1013.5.4搜索引擎举例:GOOGLE3.5网络信息资源利用——上机实习检索式的构建(一):逻辑检索
Google用空格表示逻辑“与”操作,用减号“-”表示逻辑“非”操作。“A-B”表示搜索包含A但不包含B的网页。Google用大写的“OR”表示逻辑“或”操作。搜索“AORB”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。1023.5.4搜索引擎举例:GOOGLE3.5网络信息资源利用——上机实习检索式的构建(二):通配符检索很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。为提供最准确的资料,Google不使用“词干法”,也不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*”,不会得到类似“googler”或“googlin”的结果。1033.5.4搜索引擎举例:GOOGL
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47434-2026消防应急救援装备输转装备通用技术条件
- 幼儿园教师职称晋升论文发表数量分析-基于2024年区域内教师职称评审档案
- 法律文书写作
- 人教版(2024)七年级下册英语 Unit 7 A Day to Remember 大单元整体设计(表格式)
- 2025年通信专业技术人员职业水平考试通信专业综合能力试题与答案
- 江苏省徐州市2025年省综合评标专家库新申报专家入库考试及专家续聘考试(交通类)练习题及答案
- 绵阳市2026年广播电视播音员主持人资格考试(广播电视播音主持业务)试题及答案
- 广播电视编辑记者资格考试(广播电视业务)能力提高训练试题库(2025年浙江湖州市)
- 推动科技创新与产业升级融合政策
- 单村供水站建筑外观建设参考要点及参考图册
- 基于第一性原理探究硅酸盐陶瓷降解与抗水蒸汽腐蚀机制
- 结核病防治科普
- 疼痛评估PDCA案例
- 学堂在线 批判性思维-方法和实践 章节测试答案
- 机械设计基础 10.5四杆机构的传动角
- 2025呼吸机相关肺炎预防与控制标准
- 无人机编队课件
- 索尼摄像机HDR-CX610E使用说明书
- 公正主题班会活动方案范本
- 六氟化硫气体培训课件
- 林火基本原理课件
评论
0/150
提交评论