网络资源检索与利用基本知识点_第1页
网络资源检索与利用基本知识点_第2页
网络资源检索与利用基本知识点_第3页
网络资源检索与利用基本知识点_第4页
网络资源检索与利用基本知识点_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络资源检索与利用基本知识点PPT11、人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址。如目前教室的无线上网就是动态IP地址,每次所取得的地址不同。 2、 IP地址的分类:A类IP地址 、B类IP地址 、C类IP地址 、D类IP地址 、E类IP地址 A类地址:(1)A类地址第1字节为网络地址,其它3个字节为主机地址。网络地址的最高位必须是“0” (2)A类地址范围:54(3)私有地址和保留地址: 10.X.X.X是私有地址(所谓的私有地址就是在互联网上不使用,而被用在局域网络中的地址)。 范围(-55) 127.X.X.X是保留地址,用做循环测试用的。 B类地址:(1)B类地址第1字节和第2字节为网络地址,其它2个字节为主机地址。网络地址的最高位必须是“10” (2)B类地址范围:54。(3)B类地址的私有地址和保留地址 55是私有地址 169.254.X.X是保留地址。如果你的IP地址是自动获取IP地址,而你在网络上又没有找到可用的DHCP服务器。就会得到其中一个IP。C类地址: (1)C类地址第1字节、第2字节和第3个字节为网络地址,第4个个字节为主机地址。另外第1个字节的前三位固定为110。(2)C类地址范围:54。 (3) C类地址中的私有地址: 192.168.X.X是私有地址。(-55) D类地址:(1) D类地址不分网络地址和主机地址,它的第1个字节的前四位固定为1110。 (2) D类地址范围:54 E类地址:1)E类地址也不分网络地址和主机地址,它的第1个字节的前五位固定为11110。(2) E类地址范围:54 3、 网络地址和域名:虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。域名也由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是 :“”。域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http:/ ”。 通常,进行网络访问时,域名的www可以省略。如/,可以直接输入。不能省略的与域名服务器(dns)的配置有关。域名一般不会变动。4、 网络地址-网址-URL: URL-(UniformResourceLocator) URL由三部分组成:协议类型,主机名和路径及文件名。1.服务器标识符(协议类型) 通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTTP:/、FTP:/、GOPHER:/、TELNET:/、NEWS:/等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。2.信息资源地址信息资源地址是由两部分构成的,一是机器名称,如是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。3.路径名路径名是给出资源在所在机器上的完整文件名.如:/index.jsp5、域名与网络信息资源的关系由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾:随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。ac 代表科研机构由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:. 中国的商业.org.hk 香港的组织.net.jp 日本的网络6、我国域名注册管理机构中国互联网络信息中心(CNNIC)日前在京宣布,已代表中国正式向国际互联网名称与数字地 址分配机构(ICANN)递交了“.中国”域名国际申请。这意味着“.中国”域名已进入全球启用倒计时。 CNNIC相关负责人表示,“.中国”域名如果顺利完成国际申请实现全球访问,将有助于缩小东西部、城乡间的数字鸿沟。此外,“.中国”域名还将促使纯中文邮件地址在内的众多互联网创新服务的诞生。 www指的是什么? 即是万维网(WWW-World Wide Web):是基于超文本的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。浏览web信息的网络浏览器有哪些? 微软IE (Internet Explorer ) 火狐( Mozilla Firefox );Chrome Opera;safari;Netscape 遨游(maxthon);世界之窗腾讯TT浏览器7、 网络信息资源概念、类型、特点: 网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。 网上有:政府信息、科研信息、教育信息、文化信息、休闲娱乐信息 网上不会有:商业秘密、军事机密、版权作品8、 网络信息资源的类型: 按信息内容的表现形式和内容划分可分为全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等;数值型信息:主要是指各种统计数据;数据库类信息:如DIALOG,万方等,是传统数据库的网络化;微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。其它类型:投资行情和分析,图形图象,影视广告等。 按所采用的网络传输协议分为:WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用于联网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。NewsGopher:一种基于菜单的网络服务 ,它为用户提供了丰富的信息,并允许用户以一种简单的、一致的方法快速找到并访问所需的网络资源。全部操作是在一级级菜单的指引下,用户只需在菜单中选择项目和浏览相关内容,就可完成对Internet上远程联机信息系统的访问,无需知道信息的存放位置和掌握有关的操作命令。 RSS信息资源:RSS是一种起源于网景的技术,将用户订阅的内容传送给他们的通讯协同格式(Protocol)。RSS可以是以下三个解释的其中一个: Really Simple Syndication RDF (Resource Description Framework) Site Summary Rich Site Summary P2P应用允许主机之间通过互联网直接进行相互通信,众多Peer之间形成一个P2P覆盖网络(Overlay Network),从而使各种数据(如文本文件、视频文件等)能方便地在普通主机之间共享。目前人们认为其在全球的即时通信(如Skype)、文件共享 (如BT)、分布计算(如SETIhome)、协同工作(如Groove)等方面大有前途。 常用的P2P应用有Gnutella、BitTorrent、Kazaa、eDonkey、eMule、Skype、Shareaza、Morpheus等,国内开发的主要有:QQ、POCO、PPLive、VNN、PP点点通、北大Maze等。9、 网络信息资源的特点: 复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更迭和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 网络营造了“地球村”,既 极大地促进了人类信息资源的共享,又带来了一些意想不到的问题,如文化冲突、信息侵略、信息威慑等。使用成本低 共享程度高 是信息资源的宝库10、 网络信息资源的优点:价廉:它是一种比印刷品便宜的信息提供方式。不仅提供信息线索引和著录信息,还提供有关信息的全文和原稿。新颖、深入:网上大量的灰色文献或边缘文献(grey of fringe literature),即在主流出版物渠道之外的文献,包括:研究报告、调查采访、研讨会发言、笔记、项目计划报告、政策方针等。它们反映了许多研究成果背后的原始数据或第一手资料,或是因为其内容太新或太专而未被纳入正式文献交流渠道。广泛、直接交流:因特网扩大了人际交流的范围,提供了更多的直接交流机会。如参加Usenet的新闻组(news group)、讨论组(discussion group)、邮件列表(mailing list)的讨论。非正式和自由发表园地11、评价网络信息资源的必要性 第一,网络上信息资源量的爆炸式增长,使得人们从中淘取有用信息的难度越来越大。 第二,因特网的松散、开放性等特点,决定了网络信息空间秩序混乱,网上信息良莠不齐、真伪混杂、整体质量水平下降,人们选择信息更加困难。 另外,在互联网上,信息不仅很容易被出版、传播,而且也极容易被篡改。 12、 网络信息资源的评价与选择 相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。网络信息资源的评价与选择主要是针对信息源。内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。定量的评价:Google的pagerank,星数评价等级。权威性:在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需4/10以上。准确性:信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。稳定性:信息资源需有较长的稳定期或有稳定运行的保障机制。主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?可获得性:信息资源揭示信息的层次中,至少一个能无障碍地获得13、 网络信息资源检索的特点:检索范围大、检索效率高、工具强大、信息冗余大14、 网络信息检索工具:当已经知道地址时直接通过地址访问。当不知道地址的时候,需要借助检索工具,进行关键字检索、搜索引擎、网络资源指南(门户)、专门数据库 网络信息检索工具一般是由自动索引程序、数据库和检索代理软件组成的。有些检索工具还拥有自己的维护管理软件。不同的检索工具在具体的实现机理上又各有所不同。从而决定了不同的检索工具的特色。自动索引程序:现在大多数网络检索工具都是采用一种称为Robot(又称为:Spider,Crawler,Worms,Wanders等)的网络自动跟踪索引程序。它实际上是一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的所有文件的软件。不同的自动索引软件所采用的标引、搜索策略不同,自动索引软件搜寻、标引网页的方式对信息检索的质量有直接影响。机器人”工作机理:起始URL-分析页面-URL-新页面数据库:自动索引程序将采集和标引的信息汇集成数据库,作为该网络检索工具提供检索服务的基础。不同网络检索工具的数据库收录范围不一样,有的收录Web及图像、有的收录WEB、FTP、Flash、新闻组等资源类型。不同网络检索工具的标引方式也不同,有的索引软件标引主页全文,有些则只标引主页的地址、标题、责任者、特定的段落和关键词。检索代理软件:当用户提出查询要求时,由检索软件负责代理用户在数据库中进行检索。不同网络检索工具所采用的检索机制、算法有所不同,布尔逻辑检索是较普遍采用的一种机制。即按照检索项间的逻辑关系使用布尔逻辑符AND,OR,NOT等来组合检索项,形成检索式来提交查询。除了布尔检索外,许多网络检索工具还提供了一些其他的检索机制如:截词检索、概念检索、模糊检索、词组检索、字段检索、位置检索等。相关网络信息检索技术:涉及到网络信息检索的技术概念比较多,在这里介绍一些应用比较广的概念。 分类检索、关键词检索、目录与关键词检索相结合、布尔逻辑检索、词组检索、加/减号检索、截词检索、字段检索、自然语言检索、位置检索、概念检索、多语种检索、区分大小写的检索、过滤检索、多媒体检索 分类检索多用于目录搜索引擎。用户无需输入任何文字,只要根据目录搜索引擎提供的主题分类目录,层层点击进入,便会查找到用户所需的网络信息资源。 关键词检索:用户只需在搜索引擎的提问框中输入合适的提问关键词,按回车键之后,搜索引擎便会将与该提问关键词匹配的结果反馈于你。大多数的搜索引擎是以模糊检索原理实现关键词检索功能。 目录与关键词检索相结合:目前很多搜索引擎都开始使用该技术,这种类型的检索工具的典型代表是sohu()等 布尔逻辑检索:布尔逻辑检索一般指“与”、“或”、“非”三种运算。 逻辑“与”的布尔运算符为“AND”、“and”,有时也可用“&”符号表示。 逻辑“或”的布尔运算符为“OR”、“or”,有时也可用“|”符号表示。 逻辑“非”的布尔运算符为“NOT”、“not”,有时也可用“!”符号表示。词组检索:词组检索也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。加/减号检索:加/减号检索是搜索引擎支持的常规功能,即在检索词前置“+”/“-”号,其作用相当于布尔逻辑“与”/“非”运算。截词检索:在搜索引擎中,截词检索多为前方一致检索。截词符多采用通配符“*”,可以用它代表多个字符。因此,截词检索有时也称为通配符检索。字段检索:字段检索是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。搜索引擎常用的字段有:Title/t、Subject、Text、host(主机)、URL/u、domain(域名)、link(链接)等。自然语言检索:自然语言检索就是一种直接采用自然语言中的字、词甚至整个句子作为提问式进行检索的方法。位置检索:位置检索是指允许指定二个单词之间的词序和词距的检索。词序指单词之间前后顺序,词距指二个单词之间间隔单词数。其操作符多为“NEAR”。概念检索:概念检索是指使用某一检索提问词进行检索时,能同时对该词的同义词、近义词、广义词、狭义词同样进行检索,以达到扩大检索,避免漏检的目的。多语种检索(Multilingual):即提供多语种的检索环境供检索者选择,系统按指定的语种进行检索并输出检索结果。目前,有的搜索引擎提供多达30个自然语种的检索选择。此功能尤其适合于不同国家的检索者检索不同语种的网络资源。区分大小写的检索(case-sensitive):它主要是针对检索词中含有人名、地名等专有名词的。在区分大小写的情况下,大写检索词能被当作专有名词看待。而在不区分大小写的情况下,则无法区分该检索词是指专有名词还是普通词,从而在一定程度上会影响检索结果的准确性。过滤检索(Filtered Search):在检索中自动将一些网站信息过滤去掉,比如一些内容不健康的黄色网站信息,影响国家安全的政治反动网站信息等,这种检索服务技术可以避免未成年人上网时受到不健康影响。多媒体检索(Multimedia Search):多媒体检索包括基于描述的多媒体检索和基于内容的多媒体检索。基于描述的多媒体检索就是用一个关键词来描述所要查找的图片或是音乐,基于内容的多媒体检索就是用一些视觉特征来查找多媒体信息,这些视觉特征包括颜色、形状、纹理等。网络信息检索工具的类型和特点: 1目录型检索工具 又被译为专题指南,或列表查询引擎,它实际上是人工建立的、结构化的因特网网址主题类目和子类目,按照字母、时间、地点、主题等顺序进行排列,使用户通过浏览网络站点列表,检索有关信息。较为典型有Yahoo!、LookSmart、InfoMine等。 目录型检索工具主要适用于:(1)用户进行笼统或较笼统的主题浏览和检索。它允许用户从等级类目中任意选择检索范围,以对这些不同深度的主题类目进行浏览或检索;(2)当用户尚未形成很精确的检索概念时,采用主题指南作为检索起始点非常有效。 除综合性目录型检索工具之外,为了适应网上各种类型信息的发展变化,又出现了某些专业的目录型检索工具,它由某一领域的专家编制和维护,在信息准确性和易于理解方面比综合性目录型检索工具要好。 网络资源指南:是由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。优点:1.信息组织的专题性较强,满足族性检索要求;2.使用简单,只要选择相关类目,依照页面之间的超链接指引很快就能到达目的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用.缺点:1.人工采集信息的收录范围小,更新慢;2.受主观因素影响,类目设置不够科学,缺少规范 主要有三种类型:学科信息门户搜索引擎目录目录索引:新浪目录/ 开放目录ODP / 中国艺术开放目录 / 中国分类信息网 / 什么情况下使用网络资源指南?当检索一个范围较广的题目,并希望了解与该题目相关的信息时。当没有明确的信息需求,仅仅想在网络上“溜达”时。仅仅想浏览某一方面的消息和动态信息时,并不严格限于某几个检索词的。当信息需求更专一时。网络资源目录分类法:主题分类法、学科分类法、图书分类法、分面组配法 2搜索引擎 搜索引擎,也叫关键词检索工具,其实就是定期搜索因特网(以WWW为主)并收集新网页信息的计算机程序。每个搜索引擎都有自己独有的搜索系统和一个包容因特网资源站点的独有数据库。其数据库由自动索引程序建立,不需人工干预。这是它与主题指南的最大区别。 搜索引擎:垂直搜索引擎:垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。 垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但 检出结果重复率低、相关性强 、查准率高,适合于满足较具体的 、针对性强的检索要求 。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。 3元搜索引擎 元搜索引擎是为弥补搜索引擎费事费力之不足而出现的网上辅助检索工具。一般的独立搜索引擎检索范围仅限于其本身的数据库,而元搜索引擎则将用户的检索提问同时送达多个独立搜索引擎的不同数据库中进行检索,在很短时间内就能从这些数据库中检出相关记录的集合。目前,功能较强的元搜索引擎有:Mamma、Meta Find、DogPile、Metacrawler、Savvysearch等。 一次搜索多个搜索引擎,并将结果返回给用户。有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合。优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。缺点:因为有时候并不能对一个搜索引擎全部查完,有时候也会漏掉一些重要信息。 早期的中文元搜索引擎:1、metaFisher中文元搜索引擎 /fish/做的较早,核心功能较弱,没有现代主流搜索引擎的界面风格。2、万纬搜索 / 功能上和第一个元搜索引擎一样,核心功能很弱,制作一般3、多元搜索 /做得较早,虽然号称整合的搜索引擎最多,但实际使用效果很差,查询速度也慢,返回结果基本未作处理。 新近出现的元搜索引擎1、知识搜索 /主要用作学习工具,功能上尽量保证全面实用2、一家搜 /对相似结果的处理有点特色3、比比猫 是国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强4、狠搜 /可以定制源搜索引擎,同时提供商业信息搜索,核心功能一般4智能搜索引擎 智能搜索引擎是结合了人工智能技术的新一代搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。智能搜索引擎具有信息服务的智能化、人性化特征,允许用户采用自然语言进行信息的检索,为他们提供更方便、更确切的搜索服务。 搜索引擎举例:GOOGLEA.通用检索法则:关键词的选择是核心。 Google的关键词检索,所使用的关键词可以是字、单词,也可以是短语、词组或句子。使用Google进行检索非常简单,只要在搜索框内输入一个关键字,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。单个关键字搜索得到的信息量巨大,会带出海量的不相关信息,通常检索多是使用词语作为关键词。复杂课题检索,主题分析后就要进行正确选词。使用Google,不同关键词的选择,将决定检索结果排列不同,而且选词不准,无法发挥Google强大的检索功能,影响检索效率。如果检索专业或学术性信息,建议在选择关键词时应注意以下几点:(1)选择专指性强的词关键词专指性强弱是影响查准率的重要因素之一,选用专指性强的关键词,则检出的网站针对性较强,查准率较高。专指性强弱是对选词表达主题的深度而言,要深入分析检索主题,选择研究的对象及其重要参数、概念等名词术语;选择所应用的对文章起关键作用的基础理论、方法、设备等名称;选择反映重要研究成果的词。例如,查找“网络检索工具的历史”有关的信息,选词时选用“搜索引擎”一词,比选用“检索工具”一词,查准率会更高。(2)多角度选词关键词的确定必须经过对检索主题正确分析得到。复杂主题的关键词,要将反映该主题的各个主要方面的词汇都提炼出来,以提高文献的查全率。例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。(3) 选择限制主题的词 在关键词确定之后,运用检索技术并不能保证检索出来的信息都满意,有时查询的结果太多太泛。由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗 汽车”,将会找到关于红旗但不含“汽车”的网页。 检索式的构建及检索实例:为了完整准确地表达检索需求,提高检索的精确度,正确选择关键词后,还需要了解和运用Google各种检索语法与技巧,根据Google提供的操作、运算符和使用规则说明,设计出一个高质量的检索式。(1)逻辑检索 Google用空格表示逻辑“与”操作,用减号“”表示逻辑“非”操作。“AB”表示搜索包含A但不包含B的网页。Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。(2)通配符检索 很多搜索引擎支持通配符号,如“”代表一连串字符,“?”代表单个字符等。为提供最准确的资料,Google不使用“词干法”,也不支持“通配符”()搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl”,不会得到类似“googler”或“googlin”的结果。(3) 短语或者句子检索 Google的关键词可以是单词,也可以是短语。用短语做关键字,必须加用英文双引号,否则空格会被当作“与”操作符。双引号中的词语(比如自然与文化遗产 )在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。(4)搜索引擎忽略的字符以及强制搜索Google对无实义的词或一些网路上出现频率极高的英文单词,如“i”、“com”、“www”、“的”等,以及一些符号如“”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如,检索“internet上www的历史”,检索式为:www的历史internet。又如,“www的历史”中,“的”其实是忽略词,但因为被用英文双引号引起来,搜索引擎就强制搜索这一特定短语。注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。(5) 检索式的实现 检索式的实现可以在搜索框内一次输入,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。也可以一次添加一个词语在“在此搜寻结果的范围内查询”。还可以不用操作符和运算符,在高级搜索查询网页中,按提示在搜索框内输入关键词的实现 检索式搜索引擎历史archie OR蜘蛛OR lycos OR yahoo文化中国历史 可分解写为“包含以下的完整字句:搜索引擎;可包含以下全部的字词:历史;包含以下任何一个字词:archie 蜘蛛 lycos yahoo;不包括以下字词:文化 中国历史”。 用操作符和运算符时,须注意操作符与作用的关键字之间有否空格。比如“-”的使用,“搜索引擎 - 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。“与”操作必须用大写的“OR”,留有空格且不是小写的“or”。双引号用英文引号等。 RSS 是一种用于发布和获取网络内容(例如头条新闻)的XML格式。使用RSS阅读器来阅读,你可以不用一个个去开页面,也能够很快地知道关注网络内容更新了没有. Really Simple Syndication RDF (Resource Description Framework) Site Summary Rich Site Summary 1.来源多样的个性化“聚合”特性,省去了在各个网站之间的奔波之苦! 因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可以采用这种方式来发布信息,包括专业新闻站点、电子商务站点、企业站点、甚至个人站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合” 到该软件的界面中,为用户提供多来源信息的“一站式” 服务。2.信息发布的时效、低成本特性 RSS技术秉承“推”信息的概念,当新内容在服务器数据库中出现时第一时间被“推”到用户端阅读器中,极大地提高了信息的时效性和价值。此外,服务器端内容的RSS包装在技术实现上极为简单,而且是一次性的工作,使长期的信息发布边际成本几乎降为零,完全是传统的电子邮件、卫星传输、互联网浏览等发布方式所无法比拟的。3 无“垃圾”信息、便利的本地内容管理特性 RSS用户端阅读器软件的特点是完全由用户根据自身喜好以“频道”的形式订阅值得信任的内容来源,如“新华网国际新闻”、“中国汽车网市场行情”、“天极网IT产品资讯”等。RSS阅读器软件完全屏蔽掉其他所有用户没有订阅的内容以及弹出广告、垃圾邮件等令人困扰的噪音内容。此外,对下载到阅读器软件本地的订阅RSS内容,用户可以进行离线阅读、存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读”器,更是一个用户随身的“资料库”。 开放获取信息资源及其利用 开放获取(Open Access)是国际学术界、出版界、图书情报界为了推动科研成果利用互联网自由传播而采取的运动。其目的是促进科学及人文信息的广泛交流,促进利用互联网进行科学交流与出版,提升科学研究的公共利用程度、保障科学信息的长期保存,提高科学研究的效率。 开放获取数字资源是网络上重要的共享学术信息资源,提供期刊论文全文的免费阅读,是获取学术信息的一种新模式。国外的一些研究表明,在很多学科领域,开放获取的文章比非开放获取的文章具有更大的研究影响力。经过多年来不断的发展,截止到2004年12月底,开放获取期刊数量已经多达1400余种。信息资源开放获取的三个途径:开放获取仓储(Open Access Repository) a) 对于有版权,但是出版社允许进行自存储(self-archiving)的作品,作者可以放到信息开放存取仓库中,例如论文、专著等; b) 对于没有版权的作品,作者可以直接放到信息开放存取仓储中,例如讲义、PPT等。开放获取期刊(Open Access Journals) a) 出版提供信息开放获取的杂志,或者将原有杂志改造为信息开放获取的杂志;b) 期刊运行经费来源:主办者全部筹集资金,杂志对作者和读者都是免费的,个人网页 a) 对于有版权,但是出版社允许进行自存储的作品,作者可以放到个人网页上;b) 对于没有版权的作品,作者可以直接放到个人网页上e_print信息资源及其利用 电子预印本信息资源是开放获取的另一种方式,对加快科学研究成果的交流与共享,帮助研究者追踪本学科的最新研究进展,避免研究工作的重复等方面都有重要作用,对科学研究者有很高的参考价值。 同行可以直接进行评论。电子预印本特点:(1)作者自愿提交:作者按照一定的格式将论文进行排版后,通过网络、E-mail等方式,按学科类别上传至相应的目录或库中。(2)文责自负:送入预印本库中的论文是不经过任何审核的,也没有任何先决条件决定某一论文能否送入库中。只要作者所投论文遵守国家相关法律,有一定学术水平,符合系统的基本投稿要求。(3)共享性:任何人在尊重作者版权的基础上都可合理利用。(4)交互性:有些系统允许对论文进行评论和交流。(5)多载体性:作者可发表到正式的刊物或其它载体形式上。(6)交流速度快、利于学术争鸣、可靠性高的特点。 中国预印本服务系统 /eprint/由中国科学技术信息研究所与国家科技图书文献中心联合建设的以提供预印本文献资源服务为主要目的的实时学术交流系统,是国家科学技术部科技条件基础平台面上项目的研究成果。该系统由国内预印本服务子系统和国外预印本门户(SINDAP)子系统构成。 国内预印本服务子系统主要收藏的是国内科技工作者自由提交的预印本文章,可以实现二次文献检索、浏览全文、发表评论等功能。 国外预印本门户(SINDAP)子系统是由中国科学技术信息研究所与丹麦技术知识中心合作开发完成的,它实现了全球预印本文献资源的一站式检索。通过SINDAP子系统,用户只需输入检索式一次即可对全球知名的17个预印本系统进行检索,并可获得相应系统提供的预印本全文。目前,SINDAP子系统含有预印本二次文献记录约80万条。 奇迹文库预印本 /eprint/ 是由一群中国年轻的科学、教育与技术工作者创办,非盈利性质的网络服务项目。其目的是为中国研究者提供免费、方便、稳定的eprint平台,并宣传提倡开放获取(Open Access)的理念。 可使用分类浏览的方法或用关键词查询的方法查找所需资料。e-Print arXiv 预印本文献库 e-print arXiv是由美国国家科学基金会和美国能源部资助,在美国洛斯阿拉莫斯(Los Alamos)国家实验室建立的电子预印本文献库,始建于1991年8月。2001年后转由Cornell University进行维护和管理。该预印本资料库由Dr. Ginsparg发起,旨在促进科学研究成果的交流与共享。 目前包含物理学、数学、非线性科学、计算机科学四个学科共计28万篇预印本文献。 该站点的全文文献有多种格式(例如PS、PDF、DVI等),需要安装相应的全文浏览器才能阅读。e-Print arXiv(中科院理论物理所镜像站点,不需支付国际网络通信费):/e-Print arXiv(美国主站点,需支付国际网络通信费):/更多的开放获取数字资源开放仓储注册系统(ROAR) / 有1145个开放资源。可根据地区、软件平台、内容类型查询,或简单浏览。每一个开放资源列有资源数量。半导体研究所图书信息中心(开放资源中心):8080/tsh/dzzy/kfzy/kfzy.htmPPT2图书馆信息资源的获取与 CNKI数字图书馆 十大科技信息源科技信息源是指人们在进行科研及技术工作时使用频率比较高的十种情报来源的总称。(1)科技图书:是对某专门知识或某学科进行系统的论述或概括的一种情报来源。其主要特征是内容比较成熟,但相对比较陈旧。合法出版的图书均有版权页。(2)科技期刊:又称连续性出版物(serials),是一种定期或不定期连续出版的文献载体,它一般有同样的名称,按一定时间编定卷号,每一卷又分若干期。科技期刊类型有:学术性、技术性刊物,是科技期刊的核心部分。刊名一般为:Acta(学报)、Journals(杂志)、annals(纪事)、Bulletin(通报)、Transactions(汇刊)、Proceedings(会刊)、Review(评论)、Progress; Advances in .(进展)等。快报型:Communication(通讯)、letters(通讯)、bulletin等。消息性:news(新闻)、news letters等。资料性(data journals):data、event等。期刊是人们获取信息的最重要来源,在科学家和专家们所利用的全科技信息中,由期刊提供的占70%左右。(3)科技报告:报道(记录)研究和开发调查工作的成果或进展情况的一种文献类型,一般都编有号码,供识别报告本身及其发行机构 ,报告是一种典型的机关团体出版物。科技报告的流通范围有绝密、秘密、保密、非密限制发行、非密、解密等 由于科技报告是非正式出版的,获取比较困难。 我国每年发表科技报告5万余篇,中国科技信息研究所是我国科技报告的收藏单位。 (4)会议文献:是指学术会议文献,它往往反映出科学技术的发展趋势,其特点是与最新成果的间隔时间短,但其内容与期刊相比可能不太成熟。会议类型大致可分为国际会议、全国性会议及地区会议等。会议和会议文献常用的主要名称有conference(大会)、meeting(小型会议)、symposium(讨论会)、proceeding(会议录)、paper(单篇论文)、transaction(汇报)等。(5)专利文献:在实行专利制度的国家,凡是本国或外国的个人和企业有了创造发明,都可以根据专利法的规定,向本国或外国专利局提出申请,经审查合格,批准授予在一定年限内享有创造发明成果的权利,并在法律上受到保护,这样一种受到法律保护的技术专有权利叫做专利。 广义的专利文献是指所有与专利制度有关的文件, 包括专利申请书、专利说明书、专利分类、专利公报、专利文摘、专利证书等; 狭义的专利文献仅指专利说明书。 根据专利的技术水平和应用情况,专利类型有invention(发明)、utility patent(实用新型)和design patent(外观设计)等。(6)标准文献:经过公认权威当局批准的标准化工作成果,可以采用文件形式或规定基本单位(物理常数)这两种形式固定下来、以文件形式出现的标准化工作成果,就是标准文献。标准按使用范围可分为国际标准、区域标准、国家标准、地方标准、行业标准和专业标准等标准一般过若干时间就要进行修订, 新的标准不断地替代旧的标准。因此,查阅时应以最新标准为准。(7)学位论文:是高校研究生、毕业生为获得学位进行科学研究而写出的学术性论文。按学位不同可分为学士论文、硕士论文和博士论文。 硕士和博士论文具有一定的学术性、独创性、系统性和完整性, 具有重要的参考价值。学位论文一般不公开发行, 多数收藏在授予学位的大学图书馆、档案馆或研究机构的文献信息中心。 (8)产品资料:一般是指产品样本说明书,是厂商或贸易机构为宣传和推销其产品而印发的免费赠给消费者的资料。如产品目录、产品样本、产品说明书、产品总览、产品手册等。如今,许多厂商已经开始利用互联网发布产品信息,网上可以找到不少产品资料。 (9)技术档案:技术档案是在生产或科研活动中形成的,有具体工程和研究对象的技术文件的总称, 包括任务书、协议书、技术经济指标、研究计划、方案、试验设计实验记录调查材料、总结报告等所有应入档的资料。技术档案有一定的保密性, 一般在内部控制使用。 (10) 报纸:报纸以及广播、电视等大众传媒传递信息快, 信息量大, 现实感强, 传播面广, 具有群众性和通俗性, 是重要的社会舆论工具和信息源。一些专门刊登科技类文献的报纸对了解当前的学科前沿和水平以及科学新闻很有益处。十大情报源中,最重要的是期刊、会议论文和专利。主要文献类型的著录格式(1)期刊序号 主要责任者文献题名J刊名,出版年,卷号(期号):起止页码.1 伊廷夫,徐相连.实验室一级管理体制的改革与实践J.实验室研究与探索,2003,22(5):82-86(2)图书序号 主要责任者图书题名M其他责任者(如编者译者)版本(第一版不用标出)出版地:出版者,出版年:起止页码2 霍斯尼R K.谷物科学与工艺学原理M.李庆龙,译北京:中国食品出版社,1989:20-30(3)论文集、会议录1没有析出文献序号 主要责任者文献题名C出版地:出版者,出版年:起止页码2有析出文献序号 主要责任者析出文献题名C/文集编者姓名会议文集名C.出版地:出版者,出版年:起止页码3 司宗国,王群重子湮没快度关联的研究C/赵维勤,高崇寿,编第五届高能粒子产生和重离子碰撞理论研讨会文集.北京:中国高等科学技术中心出版,1996:105-107(4)标准序号 标准编号,标准名称S.出版年.4 GB/T 16159-1996,汉语拼音正词法基本规则S.1996.(5)专利序号 专利申请者.专利题名:专利国别,专利号P.公告或公开日期.5 姜锡洲.一种温热外敷药制备方案:中国,P.1989-07-26.(6)电子文献序号 主要责任者.题名EB/OL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论