版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1网络信息检索网络信息检索 本章的主要内容为:网络信本章的主要内容为:网络信息系统及网络信息资源的特征息系统及网络信息资源的特征 、 网络信息检索的原理与方法网络信息检索的原理与方法 、常、常用的网络信息检索工具、网络信用的网络信息检索工具、网络信息检索技巧和专业性信息的网络息检索技巧和专业性信息的网络检索检索 。 2第一节第一节 网络信息系统及网络信息资源的特征网络信息系统及网络信息资源的特征 一、一、InternetInternet网络信息系统网络信息系统 lTCP/IPTCP/IP协议协议 lDN域名和域名和IP地址地址 l全球资源定位器全球资源定位器URL 3二、网络信息系统的组织方式
2、二、网络信息系统的组织方式 l文件方式文件方式 l数据库方式数据库方式 l主题树方式主题树方式 l超媒体方式超媒体方式 l元数据方式元数据方式 4三、网络信息资源的特征三、网络信息资源的特征 l以网络为传播媒体以网络为传播媒体 l以多媒体为内容特征以多媒体为内容特征 l传播方式具有多样性、交互性传播方式具有多样性、交互性 l数量巨大,增长迅速数量巨大,增长迅速 l信息共享程度高信息共享程度高 l使用成本低使用成本低 l动态性强,管理难度较大动态性强,管理难度较大 5第二节第二节 网络信息检索的原理与方法网络信息检索的原理与方法 一、网络信息检索的特征一、网络信息检索的特征l存取范围覆盖存取范围
3、覆盖InternetInternet上的几乎所有资源上的几乎所有资源 l传统检索方法与全新检索技术相结合传统检索方法与全新检索技术相结合 l用户界面友好且操作方便用户界面友好且操作方便 l具备良好的导航和编辑功能具备良好的导航和编辑功能l网络透明度高网络透明度高 6二、网络信息检索的方法二、网络信息检索的方法 网络信息检索一般有以下几种方法:网络信息检索一般有以下几种方法:l浏览浏览 l通过资源指南来查找相应的信息通过资源指南来查找相应的信息 l利用网络信息检索工具利用网络信息检索工具 l使用检索软件使用检索软件 l充分利用充分利用E-mailE-mail获取信息资源获取信息资源 7第三节第三
4、节 常用的网络信息检索工具常用的网络信息检索工具 一、网络信息检索工具及其使用一、网络信息检索工具及其使用 l为了准确、及时、方便地查找到存储于为了准确、及时、方便地查找到存储于InternetInternet的的数据资料,网络工作者为各类网络信息资源研制了数据资料,网络工作者为各类网络信息资源研制了相应的检索工具。相应的检索工具。l网络信息检索工具主要是指在网络信息检索工具主要是指在InternetInternet上提供信息上提供信息检索服务的计算机系统,其检索对象是存在于检索服务的计算机系统,其检索对象是存在于InternetInternet信息空间中各种类型的网络信息资源。信息空间中各种
5、类型的网络信息资源。 lWWWWWW开发最晚,但发展最迅速开发最晚,但发展最迅速 。 8(一一)搜索引擎搜索引擎 1. 搜索引擎的构成搜索引擎的构成: :l搜索器搜索器 l索引器索引器l检索器检索器l用户接口用户接口 9搜索引擎基本结构搜索引擎基本结构 搜 索 引 擎 用户接口 搜 索 器 索 引 器 检 索 器 W W W站 点 新 闻 组 站 点 FTP站 点 Gopher站 点 通 讯 终 端 用 户 网 络 资 源 102. 2. 搜索引擎的工作原理搜索引擎的工作原理 首先由搜索器,即网络机器人从首先由搜索器,即网络机器人从InternetInternet上收集各信息站点的摘要信息;再
6、由搜索器对上收集各信息站点的摘要信息;再由搜索器对该网页上的某些字或全部字作上索引,建立本该网页上的某些字或全部字作上索引,建立本地数据库;然后用户在检索时,通过搜索引擎地数据库;然后用户在检索时,通过搜索引擎的用户接口访问摘要信息数据库;检索器根据的用户接口访问摘要信息数据库;检索器根据用户的查询条件快速检出文档,并对将要输出用户的查询条件快速检出文档,并对将要输出的结果进行排序和相关性处理;最后再通过用的结果进行排序和相关性处理;最后再通过用户接口将检索结果反馈给用户。户接口将检索结果反馈给用户。 11(二二)搜索引擎的功能和分类搜索引擎的功能和分类 1. 搜索引擎的功能搜索引擎的功能 搜
7、索引擎的第一个功能是收集信息建立搜索引擎的第一个功能是收集信息建立索引数据库,并自动跟踪信息源的变动,索引数据库,并自动跟踪信息源的变动,不断更新索引记录,定期维护数据库。它不断更新索引记录,定期维护数据库。它的第二个功能是提供网络的信息导航与检的第二个功能是提供网络的信息导航与检索服务,这也是索服务,这也是搜索引擎搜索引擎最主要的功能。最主要的功能。 122. 搜索引擎的分类搜索引擎的分类 l根据信息覆盖范围及适用用户群,搜索引擎可以划分为根据信息覆盖范围及适用用户群,搜索引擎可以划分为综合性搜索引擎和专用性搜索引擎两种类型综合性搜索引擎和专用性搜索引擎两种类型 。l根据信息检索方式的不同,
8、搜索引擎可以划分为分类搜根据信息检索方式的不同,搜索引擎可以划分为分类搜索引擎和关键词搜索引擎两种类型。索引擎和关键词搜索引擎两种类型。 l根据网络信息搜索范围的差异,搜索引擎可以划分为独根据网络信息搜索范围的差异,搜索引擎可以划分为独立搜索引擎和集成搜索引擎两种类型。立搜索引擎和集成搜索引擎两种类型。 13 自动索引程序自动索引程序robot广泛搜集网络信广泛搜集网络信息资源数据,经过一系列判断、选择、息资源数据,经过一系列判断、选择、标引、分类等处理后形成供检索用的数标引、分类等处理后形成供检索用的数据库,并以据库,并以Web页面的形式向用户提供页面的形式向用户提供有关的资源导航、目录索引
9、以及检索界有关的资源导航、目录索引以及检索界面。面。 (三三)自动索引程序自动索引程序14二、搜索引擎的运作和检索二、搜索引擎的运作和检索 ( (一一) )搜索引擎技术的运作搜索引擎技术的运作l发现并搜集网页信息发现并搜集网页信息l对信息进行提取并建立索引库对信息进行提取并建立索引库 l用户检索利用用户检索利用 15搜索引擎在使用中也有一些明显的缺陷:搜索引擎在使用中也有一些明显的缺陷: l数据量方面数据量方面 :索引能力越来越落后于网络的快速增长速索引能力越来越落后于网络的快速增长速度,最好的搜索引擎也只能搜索到三分之一的网页信息。度,最好的搜索引擎也只能搜索到三分之一的网页信息。l内容相关
10、性的评定方面:难以判断多义词的具体含义内容相关性的评定方面:难以判断多义词的具体含义 ,网络信息太多,查准和排序难度较大。网络信息太多,查准和排序难度较大。l实效性方面实效性方面 : :更新数据的周期要花费较长的时间。更新数据的周期要花费较长的时间。l个性化与智能化方面个性化与智能化方面 :智能技术很难得到应用。:智能技术很难得到应用。 16(二二)搜索引擎的检索方法搜索引擎的检索方法 l简单搜索简单搜索( (Simple Search) ) l词组搜索词组搜索( (Phrase Search) ) l高级搜索高级搜索( (Advanced Search) ) 17三、万维网搜索引擎三、万维网
11、搜索引擎 万维网搜索引擎万维网搜索引擎( (Web Search Engines) )的的主体是全文搜索引擎主体是全文搜索引擎( (Full text Search Engine) ),具有代表性的全文搜索引擎是具有代表性的全文搜索引擎是Google、AlltheWeb、AltaVista、Inktomi、Teoma、WiseNut、百度、慧聪等。它们都是从互联网百度、慧聪等。它们都是从互联网上提取各个网站的信息,建立索引数据库,并上提取各个网站的信息,建立索引数据库,并在用户检索时予以匹配响应,然后按一定的排在用户检索时予以匹配响应,然后按一定的排列顺序将结果返回给用户。这里重点介绍四大列顺
12、序将结果返回给用户。这里重点介绍四大Google、Yahoo!、 Ask和百度。和百度。18(一一)Google( (http:/) ) Google的核心技术称为的核心技术称为PageRank( (TM) ),它它是是Larry Page和和Sergey Brin在斯坦福大学开发的在斯坦福大学开发的一套用于网页评级的系统。该系统以一套用于网页评级的系统。该系统以PageRank技术为基础,这项技术可以确保将搜索结果首先技术为基础,这项技术可以确保将搜索结果首先呈现给用户。呈现给用户。Google使用一组独特的硬件和软件,使用一组独特的硬件和软件,制造出了一部超高速搜索引擎。制造出了一部超高速
13、搜索引擎。 19Googled 的检索方法的检索方法 l简单检索简单检索 l词组检索词组检索 l高级检索高级检索 20 Google的特殊功能的特殊功能 l图像搜索图像搜索 l信息挖掘信息挖掘 l手气不错手气不错 l网页快照网页快照 l类似网页类似网页 l按链接搜索按链接搜索 l指定网域指定网域 l语句搜索语句搜索 21(二二)Yahoo!( (http:) ) lYahooYahoo!是世界上最早的搜索引擎之一。它是世界上最早的搜索引擎之一。它拥有第一流的拥有第一流的WebWeb目录和最佳的新闻链接以目录和最佳的新闻链接以及许多附加服务。及许多附加服务。lYahooYahoo!支持简单检索和
14、词组检索,具有良支持简单检索和词组检索,具有良好的性能。好的性能。lYahoo!Yahoo!特色搜索特色搜索 : :目录搜索与专门搜索目录搜索与专门搜索 22(三三)Ask ( (http:/) ) lAskAsk是以实现自然语言检索为特色的全文搜索引擎是以实现自然语言检索为特色的全文搜索引擎 lAskAsk的搜索功能包括:支持简单检索、支持词组检索、支的搜索功能包括:支持简单检索、支持词组检索、支持高级检索。持高级检索。lAskAsk支持自然语言检索的实现方式是支持自然语言提问,支持自然语言检索的实现方式是支持自然语言提问,它的数据库里已经存储了它的数据库里已经存储了10001000多万个问
15、题的答案。只要用多万个问题的答案。只要用英文输入一个问题,它就会给出问题的答案。英文输入一个问题,它就会给出问题的答案。 23(四四)百度百度( (http:/ ) 百度每天响应来自百度每天响应来自138138个国家超过数亿次个国家超过数亿次的搜索请求。用户可以通过百度主页,在瞬间的搜索请求。用户可以通过百度主页,在瞬间找到相关的搜索结果,这些结果来自于百度超找到相关的搜索结果,这些结果来自于百度超过过1010亿的中文网页数据库,并且,这些网页的亿的中文网页数据库,并且,这些网页的数量每天正以千万级的速度在增长。数量每天正以千万级的速度在增长。 24百度的搜索特色百度的搜索特色 l百度快照百度
16、快照 l相关搜索相关搜索 l拼音提示拼音提示 l错别字提示错别字提示 l英汉互译词典英汉互译词典 l计算器和度量转换计算器和度量转换 l专业文档搜索专业文档搜索 l股票、列车时刻表和飞机航班查询股票、列车时刻表和飞机航班查询 l高级搜索语法高级搜索语法 l天气查询天气查询 25四、元搜索引擎(Metasearch Engine) 元搜索引擎是一种建立在普通搜索引擎基础元搜索引擎是一种建立在普通搜索引擎基础之上的搜索引擎。它自己不进行之上的搜索引擎。它自己不进行WWWWWW的遍历,也的遍历,也没有自己的索引数据库,当用户提出查询请求时,没有自己的索引数据库,当用户提出查询请求时,它将用户的检索要
17、求进行转换处理后,提交给预它将用户的检索要求进行转换处理后,提交给预定的搜索引擎进行检索,然后将各搜索引擎返回定的搜索引擎进行检索,然后将各搜索引擎返回的结果经处理、组织后提供给用户。的结果经处理、组织后提供给用户。 26(一一)元搜索引擎的基本特征元搜索引擎的基本特征 l在多个搜索引擎中搜索,使用户在尽在多个搜索引擎中搜索,使用户在尽可能短的时间内得到更多的结果。可能短的时间内得到更多的结果。l元搜索引擎在元搜索引擎在检索的精度、检索的范检索的精度、检索的范围、检索功能围、检索功能等方面仍存在许多局限等方面仍存在许多局限性。性。 27(二二)元搜索引擎的评价标准元搜索引擎的评价标准 目前,对
18、元搜索引擎的评价主要使用的目前,对元搜索引擎的评价主要使用的是以下几个指标:是以下几个指标:l对检索语法的支持对检索语法的支持 l网络资源的覆盖网络资源的覆盖 l对检索结果的处理对检索结果的处理 28(三三)元搜索引擎的使用方法元搜索引擎的使用方法 基于基于WebWeb的元搜索引擎建立在一个有的元搜索引擎建立在一个有网址的页面上,用户可以连接到任何有网址的页面上,用户可以连接到任何有InternetInternet的地方调用。另外一类元搜索的地方调用。另外一类元搜索引擎是一种终端搜索引擎软件,下载安引擎是一种终端搜索引擎软件,下载安装后可直接在用户计算机上运行。装后可直接在用户计算机上运行。
19、29第四节第四节 网络信息检索技巧网络信息检索技巧 本节的主要的内容为:本节的主要的内容为:l网络信息检索的策略网络信息检索的策略 l网络信息检索的技巧网络信息检索的技巧 30一、网络信息检索的策略一、网络信息检索的策略 (一一)明确搜索目标,确定检索项明确搜索目标,确定检索项l分析检索课题的主题,选择适当的检索关分析检索课题的主题,选择适当的检索关键词键词l对检索项进行逻辑组配,构造检索表达式对检索项进行逻辑组配,构造检索表达式 31(二二)选定适合的检索工具选定适合的检索工具 l掌握网上检索工具的类型与特点掌握网上检索工具的类型与特点 l 熟悉要使用的检索工具熟悉要使用的检索工具 l注意收
20、集具体的检索网址注意收集具体的检索网址 32(三三)正确对待检索结果正确对待检索结果 l可以只阅读搜寻结果的前几条信息可以只阅读搜寻结果的前几条信息 l缩小搜索的范围缩小搜索的范围 l找不到网页的对策找不到网页的对策 33(四四)提高上网速度,选择最佳上网时间提高上网速度,选择最佳上网时间 l建立书签体系,使用缓存,设置浏建立书签体系,使用缓存,设置浏览器起始位置,选择距离最近的网览器起始位置,选择距离最近的网站,避免装载图像选择合适的数据站,避免装载图像选择合适的数据库试查。库试查。 l错开热点访问时间,选择流量较低错开热点访问时间,选择流量较低时段访问网络时段访问网络 。34二、网络信息检
21、索的技巧二、网络信息检索的技巧 l扩大检索范围扩大检索范围 l缩小检索范围缩小检索范围 lCtrl+F l 给检索结果做标签给检索结果做标签 l右切断右切断URL l猜测站点的猜测站点的URL 35第五节第五节 专业性信息的网络检索专业性信息的网络检索本节的主要的内容为:本节的主要的内容为:l国外专业性信息的网络检索国外专业性信息的网络检索 l国内专业性信息的网络检索国内专业性信息的网络检索l网络信息检索的发展趋势网络信息检索的发展趋势 36一、国外专业性信息的网络检索一、国外专业性信息的网络检索 ( (一一) )博士、硕士论文数据库博士、硕士论文数据库 PQDDPQDD( (ProQuestProQuest Digital Dissertations Digital Dissertations) )是美是美国国ProQuestProQuest公司出版的博硕士论文数据库,网址为:公司出版的博硕士论文数据库,网址为:http:/http:/ 1000000余所学校的余所学校的150150多万篇学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年西安交通大学口腔医院招聘(137人)笔试备考试题及答案解析
- 2026河北廊坊市文安县中医院招聘事业编制人员16人笔试备考题库及答案解析
- 2026上半年甘肃事业单位联考共青团甘肃省委招聘3人笔试备考试题及答案解析
- 2026中信建筑设计研究总院有限公司国际业务部(筹)招聘15人(湖北)笔试备考题库及答案解析
- 2026年廊坊燕京职业技术学院单招综合素质考试模拟试题含详细答案解析
- 2026中石化云南怒江石油分公司招聘笔试备考试题及答案解析
- 2026中电建水电开发集团有限公司秋季招聘笔试备考题库及答案解析
- 2026重庆市轻工业学校招聘数学教师、心理健康教师岗位3人笔试备考试题及答案解析
- 2026重庆市大渡口区事业单位面向川渝机关事业单位遴选14人笔试备考题库及答案解析
- 2026江苏南京大学XZ2026-020海外教育学院行政主管招聘笔试备考试题及答案解析
- 2026年春期人教版二年级下册数学全册教案(核心素养教案)
- 2026年广东省湛江市高三一模高考数学试卷试题(答案详解)
- 水利工程地质勘察规范(标准版)
- 购物商城管理系统
- 中国中煤能源集团有限公司图克绿色低碳产业示范园区规划-高质量打造鄂尔多斯世界级现代煤化工产业示范区关键核心区
- 2026年高考地理压轴训练卷1
- 2026考公省考云南试题及答案
- 【初中地理】《河流与湖泊》 教学设计-2025-2026学年八年级地理上册(人教版2024)
- 蔬菜净料率行业标准参照表
- 新媒体微短剧对大学生价值观塑造的影响机制研究
- 2025年低压电工理论考试试题1000题
评论
0/150
提交评论