




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
网络信息资源检索与利用 课程实验第 2 次实验报告实验内容及基本要求:实验项目名称: 网络搜索引擎的应用实验类型: 验证每组人数: 1实验内容及要求: 基础题:1. 请分别针对网络资源目录使用的分类方法进行举例。2. 在google的分类目录中找到一条路径指向网站:南京邮电大学。3. 在搜狐网的分类目录中找到一条路径指向学校的网站:4. 请了解google和baidu在进行关键词检索中语法的异同,并举例说明这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理解准确度的差异。情景题:背景资料:小王是一名大二学生,为了毕业后找到一份理想工作,想考取一些认证以增加择业砝码,报考了江苏省计算机二级考试,虽然有一定的基础,不过在复习指定教材的时候还是有很多地方看不明白,参加培训班费用太高,后来小王了解到网络上有网校辅导课程,不过费用也不菲。小王试想网络上是否有免费的有关计算机等级考试的多媒体课程可供下载,可以是视频文件也可以是音频文件,如果有的话岂不是可以节省不少生活费。那么,现在请为小王排忧解难,帮助他在网络上找到他所需要的资源。Part A1.请把你查找信息的重要过程按照顺序记录下来,比如你所利用的工具(搜索引擎的话,详细到其具体功能),你的检索式,你所用到的信息源等。2.多次查找未果时,若你确定认为网络中根本不存在小王所需要的资源,可就此停止查找;若不是,可根据自己的最大忍耐程度1继续查找。Part B3.你有没有找到小王所需的资源了?( ) a.有(请做第4题) b.没有(请做第5题)4.如果你找到了小王所需要的资源,请写明资源所在位置(有没有尝试找个英文相关的?)。5.如果最终没有找到小王需要的资源,请注明原因:( ) a.网络中不存在小王需要的资源; b.我检索了次或分钟,超出了我的最大忍耐程度; c.其他6.如果你是小王的话,在无法找到自己所需资源时你会向他人求助吗?( ) a.会(请做第7题) b.不会(请做第8题)7.如果会的话,你会通过哪些途径向别人求助?8.为什么不向别人求助?( ) a.不知道如何向别人求助 b.不相信别人能够帮你解决问题9.你有向别人求助的经历吗?是通过何种途径求助的?求助的效果如何?1最大忍耐程度是指个体在利用网络搜索所需资源时所能接受的最大失误次数、最长检索时间等,比如检索8次或检索了20分钟仍没有找到所需资源,从而放弃查找。实验结果:一请分别针对网络资源目录使用的分类方法进行举例。主题分类法:如yahoo 学科分类法:如sohu的社会科学分类图书分类法:如中国图书馆图书分类法分面组配法:如图书馆类型 按上属机构分公共图书馆 高等学校图书馆 按用户分儿童图书馆 盲人图书馆 按规模分大型图书馆 中型图书馆 小型图书馆二在google的分类目录中找到一条路径指向网站:南京邮电大学三在搜狐网的分类目录中找到一条路径指向学校的网站:四请了解google和baidu在进行关键词检索中语法的异同,并举例说明这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理解准确度的差异。百度搜索引擎使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。 百度搜索引擎的特点 1. 基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。 2. 支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。3. 智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。 4. 检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。 5. 百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。 6. 相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。 7. 运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒) 8. 可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。 9. 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。 10. 智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。 11. 分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。 12. 高可配置性使得搜索服务能够满足不同用户的需求。 13. 先进的网页动态摘要显示技术。 14. 独有百度快照15. 支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,还将继续增加其它高效的搜索语法。 Google作为全球最大的多语言搜索引擎,在国际上占有的市场越来越大,成为互联网最具潜力的企业,以下就介绍下GOOGLE搜索引擎的主要特点: 1.特有的PR技术,PR 能够对网页的重要性做出客观的评价。PR是GOOGLE评价一个网站质量高低的重要标准,PR分为十个等级,从容不1至10,PR越高代表网站质量和权威性越高,排名也就越靠前。 2.更新和收录快,GOOGLE收录新站一般在十个工作日左右,是所有搜索引擎收录最快的,更新也比较稳定,一般一个星期都会有大的更新。 3.重视链接的文字描述和链接的质量,链接的文字描述也就是做链接用的文字,这个文字对GOOGLE排名起一定作用,因此我们建议如果网站要做某些关键词,在交换链接时要用这个关键词做链向你网站,链接的质量与链接网站的权威性和与你站是否相关有关,权威越高侧你站获得的排名越好, 4.重视Description描述,多次研究发现,那些在GOOGLE排名好的网站在描述中匀含有关键词,而且有些重复二次,因此可推断其对描述还是相当重视。 5.超文本匹配分析:Google 的搜索引擎同时也分析网页内容。并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。 他们的搜索排序方式与广告展现也有不同,百度有竞价排名,而Google是机器程序自动排序,完全按照预先设计的机器程序来处理,没有人为的干预来操纵其排名。五情景题1.利用的工具:百度搜索引擎-关键词搜索检索方式-采用输入检索词方法,输入“计算机二级考试免费视频OR音频辅导”信息源:口传信息源与文献信息源口传信息源:通过同学们之间相互沟通了解到“网易学院”搜索到“全国计算机等级考试二级Visual Basic语言程序设计 - 网易学院教程”文献信息源:通过查阅各类辅导书了解到一些视频辅导的网站比如:计算机等级网校,华夏大地等搜索结果如下图所示:3.a 4./special/SN/vbg
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三基理论考试试题临床及答案2025版
- 离婚协议书:婚姻关系解除及子女抚养权协议范本
- 劳努派遣合同4篇
- 二手房屋购房合同正式版范本4篇
- 企业和工会合作合同7篇
- 基因驱动疾病机制解析-洞察及研究
- 一般建设工程施工合同示范文本3篇
- 5G环境下的移动学习应用研究-洞察及研究
- 西医全科医生转岗考试试题及答案
- 2025年富士康转正考试试题及答案
- GB/T 3600-2000肥料中氨态氮含量的测定甲醛法
- GB/T 24218.1-2009纺织品非织造布试验方法第1部分:单位面积质量的测定
- 电商客服培训考试
- 仿生科技课件
- 医师多点执业注册申请表
- 《边坡稳定性分析》课件
- 刮板输送机-课件
- 深信服防火墙技术方案
- 福建省福州市各县区乡镇行政村村庄村名明细及行政区划代码
- 临床医学晕厥课件
- 临床路径病种目录
评论
0/150
提交评论