




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验报告课程名称 计算机信息检索 实验项目名称 Google搜索引擎的使用 课程班级与座位号 计算机检索1班 28号 实验室名称(或课室) SSJ330 专 业 汉语言文学 任课教师 罗东俊 老师 学 号: 09251201138 姓 名: 刘奕彤 实验日期: 2010 年 12 月 1 日 广东商学院教务处 制 姓名 刘奕彤 实验报告成绩 评语:检查项目满分得 分实验目的明确程度10实验原理理解程度20实验步骤正确性和完整性30实验中遇到的主要问题的分析与处理,实验结果及其评价30实验报告美观性和可读性10其他合计100 指导教师(签名) 年 月 日说明:指导教师评分后,实验报告交院(系)办公室保存。 正文实验报告要求与排版字号:1实验报告按实验项目填写,每个学生做完实验必须填写2实验报告可参照如下内容格式写作:实验目的、实验原理、实验环境、实验步骤、实验结果、实验分析、结论。3实验报告排版打印统一用A4(21 X 29.7cm)格式。4标题用小二号黑体加粗,正文用四号宋体。行距为固定值20磅。5页面上边距2.54cm,下边距2.54 cm,左边距3cm,右边距2.2mm;6实验报告页码从正文页面起计算。页码字号,选用小四号粗黑体并居中。 实验目的:1、了解搜索引擎的类型及服务功能,掌握搜索引擎的初级使用技巧。2、掌握搜索引擎的高级使用技巧。实验原理:1. 搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。2.实验环境:Internet 网实验步骤:(一)打开IE浏览器,在地址栏中输入Google搜索引擎的网址,打开搜索引擎。 1搜索结果要求包含两个及两个以上关键字。 示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页。 2搜索结果要求不包含某些特定信息 示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页 3搜索结果至少包含多个关键字中的任意一个 示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。 4通配符的使用 示例:搜索所有包含以*治国”的网页。 5关键字的字母大小写 示例:分别以“GOD”和“god”为关键词在谷歌进行搜索,比较搜索结果。 6搜索整个短语或者句子 示例:搜索所有包含“搜索引擎的使用技巧“的网页。 7搜索引擎忽略的字符以及强制搜索 示例:搜索关于www起源的一些历史资料。 搜索:“www的历史 internet”(二)打开IE浏览器,在地址栏中输入Google搜索引擎的网址,打开搜索引擎。 1 对搜索的网站进行限制 “site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。 示例:搜索中文教育科研网站()上关于搜索引擎技巧的页面。搜索:“搜索引擎 技巧 site:”结果:已搜索有关搜索引擎 技巧 site:的中文(简体)网页。 共约有608项查询结果,这是第1-10项 。 搜索用时0.05秒。 示例:上著名IT门户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯。搜索:“search engine tips site: OR site:”结果:已在内搜索有关search engine tips OR site:的网页。 共约有1,040项查询结果,这是第1-10项 。 搜索用时0.09秒。 2 在某一类文件中查找信息 “filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以 做很多意想不到的事情哦。最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。 示例:搜索关于电子商务(ECOMMERCE)的PDF文档。搜索:“ecommerce filetype:pdf”结果:已向英特网搜索ecommerce filetype:pdf. 共约有25,500项查询结果,这是第91-100项 。 搜索用时 0.44秒。 下面是某项搜索结果:PDF /apec文档类型: PDF/Adobe Acrobat - 一般文字档Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCEREADINESS ASSESSMENT GUIDE /apec Page 2. . /apec/docs/readiness_guide_files/readiness_guide_5.pdf - 类似网页可以看到,GOOGLE在PDF档前加上了PDF的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。 搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别。注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。 “filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进入“/”,查找关于本拉登的JPG图片。搜索:“Bin Laden filetype:jpg” 结果:搜索有关 Bin Laden filetype:jpg 的图片()。(试验版) 共约有1,630项查询结果,这是第1-20项 。 搜索用时0.14秒。 3搜索的关键字包含在URL链接中。 关键字包含在URL链接中搜索时用这个代码:inurl: 示例:在eetchina上找含有LABVIEW的内容 搜索:inurl:eetchina labview 4搜索的关键字包含在网页标题中 搜索的关键字包含在网页标题中用这个代码intitle: 示例:查找日本明星藤原纪香的照片集。 搜索:“intitle:藤原纪香 写真” 5图片搜索 图片搜索是通过搜索程序,向用户提供互联网上相关的图片资料的服务。 从所使用的技术上来分类,可分为: 1 基于上下文本(context)的图片搜索 2 基于图片内容的搜索对类型1,通常是通过Alt等锚来索引,搜索的.对类型2,涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。示例:查找新浪网上李彦宏的照片。 6目录检索 目录检索:只对分类名和内容简介进行关键词检索,而不对网页内容的全文进行关键词检索;目录中的网站由人工采选和加工,因此其数据质量相对较高,保证了查准率,但由于人工编辑所限,其信息量相对较小,更新速度较慢,查全率不高。示例:查找一下介绍搜索引擎方面的中文网站 7新闻组搜索 新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。进入Google新闻组“http:/groups.G/”,你有两种信息查找方式。一种是一层层的点击进入特定主题讨论组,另一种则是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025物流项目管理中的合同管理与风险控制
- 2025企业贷款合同书
- 2025废弃原材料采购销售合同
- 2025年消防设施维护员消防安全案例试题库
- 2025年高压电工基础知识试题解析试卷
- 2025年安全生产考试题库(事故案例分析)电力行业试题
- 2025年安全生产事故案例分析专项试题库
- 2025物流仓储租赁合同书
- 2025年系统架构设计师职业资格认定参考试题库资料含答案
- 2025年试题国家保安员资格考试题库答案解析
- 铁路物流管理与实务理论知识考核试题及答案
- 系统运营管理办法
- 藏族舞基础知识课件下载
- 清华大学(夏建军):2025年供热碳排放核算和碳责任分摊报告
- 铁杵磨针小学生课件
- 传染病专科重点建设计划
- 监狱安全生产课件
- (高清版)DB34∕T 5225-2025 风景名胜区拟建项目对景观及生态影响评价技术规范
- 文明守纪教育主题班会
- 原发性血管炎肾损害护理
- 劳动者个人职业健康监护档案-模板
评论
0/150
提交评论