Internet网络信息检索课件.ppt_第1页
Internet网络信息检索课件.ppt_第2页
Internet网络信息检索课件.ppt_第3页
Internet网络信息检索课件.ppt_第4页
Internet网络信息检索课件.ppt_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章互联网信息资源及其检索第一节互联网信息资源的概要,一、互联网的定义:1.从网络互联的角度看2 .从网络通信的角度看3 .从提供信息资源的角度看4 .从网络管理的角度看二、从互联网的角度看IP协议是互联网的核心2 .互联网实现了与公用电话交换网的相互连接3 .互联网是用户自身的网络3 .互联网的发展史互联网源于ARPAnet,数据显示,2007年12 中国网民总数达到2.1亿(截至1998年12月,中国网民超过210万),目前中国网民以500万的差距仅次于美国(Nielsen/NetRatings公司发表,2000万网民) 四、中国互联网发展1994年,中国全面开通了互联网服务,建立了四个

2、网络体系。 中国科学技术网络cstnet于1994年实现了与互联网的连接。 CSTnet主要提供科学数据库服务、网络信息服务、超级计算服务等,其服务是非商业的。 中国科技网站为:其主页为下图3360,中国教育科研网CERNET,中国教育科研网全称chinaeducationandresearchnetwork,是国家教育委员会主办的国家重点工业性研究项目始于1994年,1995年12月正式投入运行,实现了与互联网的全方位连接。 CERNET网络分为主干网络、区域网络、校园网络三个层次。 中国教育科研网站,其主页,CERNET目前的拓扑,中国公共修订机互联网CHINANET中国公共修订机互联网是

3、中国第一个全国性的商业网络,它由中国信息产业部经营管理,于1994年启动。 CHINANET为社会提供便利的网络服务,以代理业务为首,发展网民,建立中文信息网站为网民提供多种信息服务,包括电子文件、商业信息、天气预报、娱乐休闲、旅游指南等。 中国公共计算机网站是中国金桥信息网中国金桥信息网CHINAGBN的三金工程(金桥工程、金关工程、金卡工程)之一,又称中国经济网,从1996年开始建设,是一家国家经济信息通信网,提供互联网商业服务。 中国金桥信息网的网站,其主页如下图:五、互联网信息检索,(一) WWW和信息检索1.WWW概念环球信息网WWW(World Wide Wed )又称为Web和万

4、维网,超文本(hypertext 2 .什么是超文本和超媒体,3.WWW的框架(1)HTML是超文本标记语言的缩写。 (2)主页(homepage) (3)HTTP (4)URL,4.WWW浏览器5.www是采用客户端/服务器结构,第2节检索引擎,一,检索引擎(searchenner )的2. URL :对应这个页面3 .摘要:网页内容摘要。 搜索引擎的基本结构,六,搜索引擎的搜索技术,1 .布尔逻辑搜索(1)逻辑and(2)逻辑or(3)逻辑not、逻辑or、逻辑or、逻辑not、逻辑not、逻辑not、逻辑not空间,起到与逻辑and相同的作用例如,谷歌自动使用“与”执行查询。 逗号(,)

5、,”的作用类似于逻辑“或”。 2 .位置运算符(proximity search )用位置运算符检索“w”、“n”等符号表示词与词的位置关系,例如,informationsystem表示system出现在information之后3 .断语检索(truncation/wildcats )断语方式主要有右截止、左截止、左右截止、中间截止(中间遮蔽) 4种。 搜索引擎的分隔符通常包括“*”和“? 中所述情节,对概念设计中的量体执行面积分析。 4 .字段限制搜索标题3360、ubject:密钥:摘要:图像3360和文本: 5 .精密检索(exact search )精密检索也称为字符串检索、短语检索

6、。 大多数搜索引擎的读取支持正确的搜索,用“”表示。 6 .模糊搜索7 .自然语言搜索,8 .区分大小写的搜索也称为区分大小写的敏感搜索,这是9 .加权搜索即,在检索词前面加上(/),相当于AND/NOT运算。10 .多语言搜索(multilingual search )、11 .关联性排序搜索结果通常按照关联度从大到小进行排序。 大多数搜索引擎都提供“按相关大小对搜索结果进行排序”的功能。七、搜索引擎使用方法1 .基本使用方法(1)分类法目录式搜索引擎最简单的搜索方法是掌握目录分类原则,确定要搜索的内容或站点属于哪个分类(2)关键词这是搜索引擎必须具备的功能。 只需在输入框中直接输入关键字即

7、可进行的搜索。 2 .使用技巧(1)选择适当的搜索工具每个搜索引擎都有不同的特征,只需选择适当的搜索工具即可得到最佳结果。 (2)在使用正确搜索词的当前,很多搜索引擎不支持容错搜索。 所以,一定要注意不要写错字。 (3)正确使用布尔检索正确使用布尔检索方式,可以减少检索结果的返回次数。 八、搜索引擎的分类1 .按搜索机构分类(1)目录型搜索引擎(2)关键词型搜索引擎(3)混合型搜索引擎,2 .搜索引擎提供的按搜索内容分类(1)综合型搜索引擎(2)专门型搜索引擎,(3) 3 .按照搜索引擎收集信息的方法和对外提供的服务方式分为(1)机器人搜索引擎(2)目录搜索引擎(3)元搜索引擎,(1)谷歌,9

8、,萩名搜索引擎介绍,谷歌的基本知识1 .网页标题2 谷歌的特点,谷歌最多支持132种语言,包括简体中文和繁体中文。 谷歌速度非常快,一秒钟可以回答数千次询问,但是要回答所有的询问,谷歌在30亿以上的网页上走着。 谷歌的专利页面级技术PageRank可以提供非常精确的搜索结果。 谷歌搜索引擎的功能基本搜索高级搜索,谷歌scholar学术搜索引擎,2004年11月24日,谷歌发布了世界上首家对学术期刊、论文、萩作、摘要的免费学术搜索引擎。 2006年1月l1日,谷歌发布了面向中文用户的中文版谷歌学术检索。 1、谷歌学院的特点(1)学科广泛全面,学科专业性强,是生物学、生命科学、环境科学的商业、管理

9、、金融、经济(Business Finance,and Economies化学和材料科学工程学,计算机科学,数学医学,药学Pharmacology,and Veterinary Science) (2)搜索功能强,搜索服务一站式,物理天文天体科学(Physics,Astronomy,and Planetary Science ); 社会科学艺术人文科学(Social Sciences,Arts,and Humanities )。2. Google Scholar检索方法(1)基本检索(2)高级检索、高级检索界面,3 .检索结果、检索结果的各信息内容包括:个文献的标题、萩人、出版物、出版年月、摘

10、要、引用,学术检索使用偏好,(2)百度“百度”二字为中国宋语人辛百度的基本功能1 .百度快照2. MP3搜索3 .“超链接分析”技术4 .高级搜索、白度空间、更多,(3)百度的搜索技术,百度支持“与”、“或”、“非”。 可以在关键字之间插入“空格”、|”、“-”,以指定查询字符串中每个关键字之间的“与”、“或”和“非”关系。 百度不支持使用AND和“”等符号。 3)Yahoo(http:/)、Yahoo ()是世界上第一个门户搜索网站,在24个国家和地区开展业务,为世界上5亿多独立用户提供多样化的网络服务。 1999年9月,中国雅虎网站开设。 2005年8月,中国雅虎以阿里巴巴集团的全部资金收

11、购。中国雅虎()结合了世界领先的互联网技术和中国的当地运营,成为中国互联网界排名前列的搜索引擎社区和信息服务提供商。 为亿万中文用户带来最大价值的生活体验,已经成为中国互联网的“生活引擎”。 1 .分类目录搜索(、双引号的正确结果有助于通过在查询语的适当位置加空格找到更准确的结果。 空格减号有助于删除不必要的信息。 在搜索结果页下方的搜索框中再次输入搜索词,然后单击“在搜索结果中搜索”以缩小搜索范围。 不必担心英语的大小写,(4)搜狐(http:/www.S ),1 .简介搜狗是搜狐公司于2004年8月3日推出的世界第一个第三代对话型中文搜索引擎,域名为。 搜狗的产品线包括web应用程序和桌面

12、应用程序两大部分。 web应用以web检索为核心,在音乐、照片、新闻、地图领域提供垂直检索服务的桌面应用以提高用户的操作性为目的,如搜索工具栏、拼音输入方式、PXP加速器引擎等直通车、高级检索、基本检索进一步的检索不区分大小写,检索技术使用双引号进行精确的检索,使用多个单词检索中排除的相关资料在指定网站内进行检索:其格式:检索词空格site 3360网站文档检索:检索语法:检索词空格filee 2 .搜索方法(1)网易搜索引擎的特点网易搜索引擎提供多语种搜索,具有全国最大的开放管理目录的网易搜索结果是相关目录、相关网站、相关网页和相关新闻网易搜索引擎的模糊搜索方式,网易公司将在2007年12月

13、前正式对外发布1 .概要、“有道”搜索类型包括网页、博客、照片、新闻、大容量词典等。有道阅读:通过在线RSS订阅,开辟快速阅读信息的途径。 包括信息阅览、收藏共享、阅览助理、一站式服务。 桌面词典:免费中英文翻译软件、分类检索、(6)新浪爱问(http:/www.iA )、新浪检索引擎“爱问”(www.iA )于2005年6月30日正式上市。 新浪爱问搜索类型包括网页、新闻、博客、音乐、照片、视频、地图、知识分子、资料和百事通。 (7)中国检索(),高级检索,(8)msn中文检索(),九,TOM检索引擎,新浪检索分类目录(),免费网络信息资源检索,一,概述二,免费网络信息资源分类1开放存取的定

14、义和特征定义开放存取(Open Access ) :开放存取文献可以在互联网上免费获得,用户可以阅读、下载、复制、分发、打印、检索、超链接该文献文献的着作权由作者长期持有。 特征数字化网络档案免费,限制几乎未经授权的用户免费访问信息,作者保留访问以外的权利,开放地获得文献如下。 开放存取日志开放存取手册开放存取课程软体开放存取学位论文开放存取学位论文开放存取学位论文会议论文(Open Access Conference )学术机构收藏库(Repository )电子印本资源(e-Print )、三、免费网络信息资源介绍开放接入期刊(OA ) doaj (directoryofopenaccessjournals 由Lund University创立,提供有质量管理的免费可访问在线电子期刊资源,其目标是建设一个没有学科、没有语言限制的综合科学期刊系统。 目前,该网站收集了482种期刊,将这些期刊分为15种大类和53种小类。 登入主页: /、HighWire简介、HighWire Press是世界上最大的免费全文学术文献出版社之一,于1995年由美国斯坦福大学图书馆创立。 最初,只出版了著名的周刊Journal of Biological Chemistry,目前收录电子期刊340多种,文章总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论