




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第3章 搜索引擎及网络信息检索3.1 基本知识3.2 典型的搜索引擎 3.3 搜索引擎的检索技巧3.4 免费学术资源检索与利用23.1基本知识3.1.1 基本概念3.1.2 搜索引擎的优点和缺点 3.1.3 搜索引擎的类型 33.1.1 基本概念 搜索引擎是Internet上的一种网站,它的主要任务是在Internet上主动搜索Web服务器信息并将其自动索引,其索引内容存储于可供查询的大型数据库中。 一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。搜索器索引器检索器用户接口1搜索引擎43.1.1 基本概念域名在整个Internet中必须是唯一的;一台计算机可以有多个域名,但只能
2、有一个IP地址。若系统没有域名服务器,则只能使用IP地址。注意:域名、IP地址、域名服务器三者之间的关系2域名53.1.2 搜索引擎的优点和缺点 优点:网络的资源非常丰富,对于一个普通网民来说在这浩如烟海的信息流中寻找对自己有用的信息成为一件十分困难的事。搜索引擎的作用就在于整合网络资源,为用户提供贴心的搜索服务,提高效率。缺点:质量参差不齐,信息的分类加工欠规范,各搜索引擎在检索指令的输入格式与输入内容上存在差异并难以兼容,缺乏通行易用的检索方法与技巧;63.1.2 搜索引擎的优点和缺点 没有统一的网络信息分类标准,令网络用户无所适从,而且网络信息分类难以与传统的文献分类融合,与常见的学科及
3、知识体系之间缺乏必要的内在联系,使得网络信息的分类体系对知识面或学科的覆盖率达不到要求,对专业性较强的深度信息的查全率较低;建立资源索引时针对性不强,搜索速度慢,死链接过多,重复信息及无效信息过多;对资源不具有选择和价值判断的能力,排序结果不理想,难以搜索根据用户访问而临时动态生成的网页,查全率下降。73.1.3 搜索引擎的类型 1.根据搜索引擎的数据检索机制划分 2.按检索内容划分3.按搜索引擎数据来源划分83.1.3 搜索引擎的类型 1.根据搜索引擎的数据检索机制划分 1)主题型搜索引擎 2)分类型搜索引擎 3)混合型搜索引擎 91)主题型搜索引擎主题型搜索引擎将不断收集到的网上页面及地址
4、信息以数据库的形式组织存贮。查询时用户向其提问框中输入关键词,搜索引擎便会从数据库中检索与之相匹配的相关记录,按一定的排序返回给用户。代表:Google、百度网站。3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分103.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分1)主题型搜索引擎11 优点:查询全面、充分,用户能够对各网站的每篇文章中的每个词进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能。 缺点:繁多而杂乱,没有清晰的层次结构。3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分1)主题型搜索引擎122)分类型搜索引擎 通过用户浏览层次类型目录
5、来寻找所需信息。分类一般按主题分类,并辅之以年代、地区等分类。 代表:Yahoo、搜狐、新浪网站 例如:新浪分类目录计算机与互联网 硬件行情报价。3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分13142)分类型搜索引擎3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分15 优点:使用户清晰方便地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分2)分类型搜索引擎163、混合型搜索引擎例:雅
6、虎,既有搜索框,又有分类浏览目录3.1.3 搜索引擎的类型-根据搜索引擎的数据检索机制划分17综合型专题型特殊型 2.按检索内容划分3.1.3 搜索引擎的类型-按检索内容划分181)综合型搜索引擎 综合型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为通用型检索工具。 如:Google、百度、新浪、搜狐、网易、Yahoo等。3.1.3 搜索引擎的类型-按检索内容划分19202)专题型搜索引擎 专题型搜索引擎专门采集某一主题范围的信息资源,并用更为详细和专业的方法对信息资源进行标引描述。 例如:科技信息搜索引擎、重点学科导航系统、学科信息门户等。3.1.3 搜索引擎的类型-按检
7、索内容划分213)特殊型检索工具 特殊型检索工具指那些专门用来检索某一类型信息和数据的检索工具,如查询地图的检索工具“MapBlast”、查询图像的检索工具“WebSEEK”等。3.1.3 搜索引擎的类型-按检索内容划分223按搜索引擎数据来源划分单独型搜索引擎 拥有独立的采集标引机制和独立的数据库,例搜狐集中型搜索引擎 没有自己的数据库,它利用一个统一的界面,查询其他单独型搜索引擎的数据库,例3721。3.1.3 搜索引擎的类型按搜索引擎数据来源划分233.1.4 主题搜索引擎的关键词语法规则1、自动将关键词拆分进行模糊查询 此类搜索引擎有Google、百度、雅虎、3721、首都在线等。例:
8、输入“西南大学”。 优点:信息覆盖面大。2、按关键词进行精确查询 此类搜索引擎有新浪、搜狐、网易、找到啦、中华网和常青藤等。 优点:准确性高。243.1.4 主题搜索引擎的关键词语法规则3、检索式的运算符号 1) 使用逻辑运算算符 2) 使用位置算符 3) 使用字段限定251) 使用逻辑运算算符搜索引擎基本上都支持“与”、“或”、“非”、括号或引号等逻辑运算符号,不同的搜索引擎使用的逻辑符不完全相同。“AND” 在中文搜索引擎都可以用空格代替;“NOT” 有时可以用减号代替,格式如:“关键词A - 关键词B”,减号前面要有空格。“OR” 有时用“|”表示,例如在百度搜索引擎的格式是“关键词A
9、| 关键词B”。Google直接用“OR”表示,格式是“关键词A OR 关键词B”。 3.1.4 主题搜索引擎的关键词语法规则262) 使用位置算符 AltaVista使用位置算符“NEAR/n”,n是两个词之间的单词的数目。 如:“Microsoft NEAR/5 Internet”表示在“Microsoft”和“Internet”这两个关键字之间的单词数目不得超过5个。 如果不输入n,表示两个词挨在一起。 为了控制挨在一起的两个词之间的顺序,可以使用“ADJ”(adjacent)操作符,如:“Microsoft ADJ Internet”,表示“Microsoft”必须在“Internet
10、”之前。3.1.4 主题搜索引擎的关键词语法规则273)使用字段限定 intitle限定网页标题。intitle A指所有搜索结果的网页标题中都要包含“A”。例:检索清华大学主页,输入intitle 清华大学。 site限定在某类站点或某个网站内搜索。例:在新浪网上查找金庸,金庸site: 注意:“site:”后面跟的站点域名不要带“http:/”;site:和站点名之间,不要带空格。例:keywords site:edu,搜索教育站点的资源;site:cn,定位于国家或地区;site: ,定位于这些国家或地区的教育站点。3.1.4 主题搜索引擎的关键词语法规则283)使用字段限定 filet
11、ype 限定文件类型。 用法是“关键词A filetype:文件格式后缀名”。 如“个人年终总结 filetype:doc”,搜索结果全都是word文件的个人年终总结。注意:“filetype:”和“后缀名”之间不能有空格。 inurl 限定域名。 常见使用方式“关键词A inurl:英文字符B”。 例如“搜索引擎 inurl:ssyq ”,检索在url中含有ssyq的网页中关于“搜索引擎”的信息。3.1.4 主题搜索引擎的关键词语法规则293.2 典型的搜索引擎1. Google 2. 百度 3. 搜狐 4. 新浪网 5. 其他中文搜索引擎6. 其他英文搜索引擎 7. 特殊型搜索引擎303.
12、3 搜索引擎的检索技巧3.3.1 常规的检索技巧3.3.2 Google和百度的高级检索技巧313.3.1 常规的检索技巧1分类查询2关键词查询3多次查找4按照地域查询5查询最新信息323.3.2 Google和百度的检索技巧1Google高级检索技巧1)短语检索 使用“” 对词组精确限定。2)字段限定检索(1) 限定网站【例】“金庸 site:”搜索中文教育科研网站上所有包含“金庸”的页面。【例】Link:(2) 限定网页【实例】输入“inurl:midi 沧海一声笑”查找MIDI曲“沧海一声笑”。333.3.2 Google和百度的检索技巧 (3) 限定标题 【实例】输入intitle:“
13、Browser Launch Page”,搜索网络摄像头。 (4) 限定文件类型【实例】利用后缀名来搜索电子书,例如输入“存在与虚无 chm”、“水煮三国 chm”,检索相应格式的这些电子图书。342百度的高级搜索技巧【实例】输入“问情 inurl:mp3”,搜索戏说乾隆的主题曲。 【实例】输入“小说 intitle:bookmarks”查找小说的精彩站点。 【实例】输入“摄影 site:”检索摄影网站hao123的摄影信息。 3.3.2 Google和百度的检索技巧353.4 免费学术资源检索与利用1、利用搜索引擎搜索 1)Google Scholar 2)Google Book Searc
14、h2、利用Open Access搜索363.4 免费学术资源检索与利用 随着网络技术的发展,Open Access(简称OA)资源得到了空前的发展。但是,许多OA资源分散存放在世界各地不同的服务器和网站上,用户很难直接全面地检索到这些资源。目前在OA资源揭示方面,主要有DOAJ和OpenDOAR两个项目,分别在进行OA期刊和OA仓贮的整理工作。除此之外,国际国内一些高等院校、机构和个人也对OA期刊和OA仓贮在不同层面上做了类似的整理和揭示。37 Open Access:任何经由同行评论的电子期刊,以免费的方式提供给读者或机构取用、下载、复制、打印、发行或检索文章。作者可保有著作权,但在出版前需
15、付 500 至 1500 美元予出版社。3.4 免费学术资源检索与利用38The National Academies Press(NAP)免费电子图书 The National Academies Press是美国国家科学院下属的学术出版机构,目前通过其主站点可以免费在线浏览3000多种电子图书,图书内容覆盖环境科学、生物学、医学、计算机科学、地球科学,数学和统计学,物理、化学、教育等诸多领域。3.4 免费学术资源检索与利用39DOAJ开放获取期刊目录 DOAJ (Directory of Open Access Journals)是由瑞典隆德大学图书馆 2003 年 5 月推出的开放获取期
16、刊的检索系统。DOAJ 按期刊的学科主题分为 17 类,包括 Agriculture and Food Sciences , Arts and Architecture , Biology and Life Sciences , Business and Economics , Chemistry , Earth and Environmental Sciences , General Works , Health Sciences , History and Archaeology , Languages and Literatures , Law and Political Science
17、 , Mathematics and Statistics , Philosophy and Religion , Physics and Astronomy , Science General , Social Sciences , Technology and Engineering 。 /3.4 免费学术资源检索与利用40PloS 免费期刊 科学公共图书馆( The Public Library of Science ,简称 PLoS )成立于 2000 年,是一家致力于推动全球科技和医学领域文献的公开获取的非盈利性组织。 / HighWire Press 免费电子期刊 HighWire
18、 出版社是 1995 年由美国斯坦福大学创立的,主要覆盖学科领域有生命科学、医学、物理学以及社会科学。 / 3.4 免费学术资源检索与利用41J-STAGE日本电子科技信息服务 J-STAGE ( Japan Science and Technology Information Aggregator , Electronic, )向全世界即时发布日本科学技术研究的杰出成果和发展,文献多为英文,少数为日文。 http:/www.jstage.jst.go.jp/browse/_journallist Oaister Oaister 由美国密执安大学数字图书馆制作服务部主办。提供电子图书、电子期刊
19、、录音、图片及电影等数字化资料的 “ 一站式 ” 检索的门户网站。 /3.4 免费学术资源检索与利用42Scirus Scirus 是著名出版公司 Elsevier 开发的、专门面向科学家和科研人员的学术信息检索工具。目前 Scirus 可搜索 4.5 亿个与科学相关的网页,大多是网上开放获取资源,也含部分商业收费资源。学科领域以自然科学为主,也有部分社科资源。 /3.4 免费学术资源检索与利用43MIT 机构收藏库 MIT Dspace 是使用 Dspace 软件开发的一个数字化成果存储与交流知识库。收录该校教学科研人员和研究生提交的论文、会议论文、预印本、学位论文、研究与技术报告、工作论文
20、和演示稿全文等。 /3.4 免费学术资源检索与利用44剑桥大学机构收藏库( Cambridge Dspace ) 英国剑桥大学图书馆与该校的计算机服务中心合作,加入 MIT 的 Dspace 联盟项目,建立 DspaceCambridge 存储库。此系统用于存储剑桥大学图书馆自己数字化的资料和本校其他机构产生的数字资源,如学术交流资料、学位论文、技术报告、各个学部和大学档案等,以不同的格式如多媒体、交互式课件、数据集、数据库等形式存储。使用方法同 MIT Dspace 。 http:/www.dspace.cam.ac.uk/3.4 免费学术资源检索与利用45加利福尼亚大学机构收藏库( eScholarship Repository of California University ) eScholarship Repository 是美国加利福尼亚大学研究成果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 无人机物流配送2025年技术创新与产业链布局研究报告
- 暴雨安全测试题及答案
- 四川国际标榜职业学院《商务阅读与写作》2023-2024学年第二学期期末试卷
- 新能源汽车服务市场发展的潜力研究试题及答案
- 锦州医科大学《中医伤科学》2023-2024学年第二学期期末试卷
- 塔河县2025届三下数学期末考试模拟试题含解析
- 安全工程师实习考核试题及答案
- 无锡工艺职业技术学院《建筑与环境设计方法》2023-2024学年第二学期期末试卷
- 江苏省江苏省大丰市万盈初级中学2024-2025学年初三下学期1月期末考试化学试题含解析
- 岭南师范学院《新闻学理论》2023-2024学年第一学期期末试卷
- 高中政治经济主观题材料对应术语总结
- 2025年金融数学考试试题及答案
- 2024年安徽省公务员【申论】考试真题及答案-(A卷+B卷+C卷)三套
- 浙江国企招聘2024温州市公用事业发展集团有限公司招聘8人笔试参考题库附带答案详解
- 研发月报工作总结
- 体育产业信息技术应用提升计划
- 2025年山东鲁商诚正教育科技有限公司招聘笔试参考题库含答案解析
- 急性ST段抬高型心肌梗死溶栓治疗专家共识2024解读
- 服务消费券发放的精细化实施方案
- 【MOOC期末】《介入放射学》(东南大学)中国大学慕课答案
- 2025年国家电力安全知识竞赛题库及答案(共50题)
评论
0/150
提交评论