




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
二是网络检索的方法和技术,一.电子信息检索的技术和技术,二.英语检索引擎的使用方法和应用,一.电子信息检索的技术和技术,一.电子信息检索的技术(一)布尔逻辑检索(booleanlogic )是当今检索理论中最成熟的理论之一,也是结构检索式的最成熟的理论之一布尔逻辑检索:利用布尔逻辑运算符对检索词进行逻辑组合,表现两个概念之间的逻辑关系。 逻辑运算符有逻辑“AND”:常用的“*”或“AND”,检索时命中信息包含两个概念,唯一性强。 可以缩小检索范围,提高检查率。 例如,关于“计算机网络”的信息“computerANDnetwORk”的逻辑“OR”:常用的“”“OR”,在检索时命中信息包含逻辑a或逻辑b或者a和b双方的情况下,扩大检索范围,避免检查遗漏用于搜索同义词、同义词、通称、复合词等。 例如,检索“城市”一词的资料是检索式“cityORurban”:芋头、白薯; 乙醇、酒精; 欧洲经济共同体、欧盟合体国际标准化组织、ISO逻辑“非”:常用“-”或“NOT”可以通过排除命中信息包含逻辑a、不包含逻辑b的不必要的检索词,来排除不必要的信息,提高检验率。 例如,ENERGYNUCLEARENERGY用于查找有关“不含核能”的信息,表示从“ENERGY”搜索的记录中排除包含“NUCLEARENERGY”的记录。 优先级运算() NOTANDOR(A B)*(C D )、(2)切片检索(truncate)-切片检索在西方语言数据库中广泛应用。 在词干后可能变化的位置做切片符号。 因此,可以在减少检索词输入量的同时扩大检索范围,提高检索率。 检索词的单复形、同一词的英美拼写、词根相同的词都可以用词缀检索。 后方后缀后的后缀,通过在检索词的词干之后加上后缀,不限制词尾可以变化的字符数,即意味着检索词干相同的全部单词。 比如说Absorb? 作为检索式,可以检索包含Absorb、Absorbent、Absorbing、Absorbtion、Absorbtivity等词根的文献记录。 单词左侧有介词短语: *magnetic中间置词短语在单词的中央。 organi? 可以搜索ation、organisationorganization。 colo? 可以搜索包含r、color、colour、colonizer和colorimeter的记录。 一个? “和数字。 其中数字表示可替换的字符数。 colo? 只能检索包含1r、colour的记录。 (3)位置检索(positionaloperator)位置运算符经常需要限定检索词之间的位置关系,以提高检索的广度和精度。 以作者名的Dialog系统中常用的位置运算符为例,i.(W )运算符(W )或() W运算符是With的缩写,表示该运算符两侧的检索词必须按输入时的前后顺序排列,反过来。 连接的单词之间不能包含空格、标点或连接编号以外的单词或字符。 例如: information(W)service或information()service表示搜索结果是informationservice或information-service。(nW )位于这个运算符两侧的检索词,必须按输入时的前后顺序排列,表示必须相反。 但是,允许在连接的两个单词之间插入最多n个单词。 例如:在laser (1w )打印机结果中,“lasercolor打印机”的文献是命中记录。 ii.(N )运算符n运算符是Near的缩写,该运算符两侧的检索词必须紧密相连,不允许在连接的词之间插入其他单词或字母。 语序相反。 例如: intelligent (n ) robot * (eicpxweb ) (nn )表示在两个搜索词之间最多可以插入n个单词,并且两个单词的语序是任意的。 示例:智能(1n ) robot,iii.(F )运算符-Field同时出现在文献记录的同一字段(如词条字段和摘要字段)中,其中夹在其中的词的量也不受限制。示例: environment(F)protectioniv.(S )运算符和自然子句的相邻示例: environment(S)protection子句的相邻语序可以反转,两个词语必须出现在同一句子(子字段,即同一句子、句子、段落)中(4)限制检索的a .字段限制可以限制在年代、特定的类别等。 分为两种类型:基本索引字段限制检索:标题名、关键字、主题语、摘要、分类号、全文等辅助索引字段检索:作者、期刊名、出版年、语言、文献类型等。 b .二次检索从检索结果中重新检索。 2 .电子信息检索技术,2 .中文搜索引擎的使用方法和应用从1995年开始,搜索引擎就以一定的策略从网络中收集、发现信息,理解、提取、组织和处理信息,为用户提供搜索服务,提供信息导航的搜索引擎的工作原理信息的收集处理信息的搜索输出搜索引擎的分类(索引方式)目录式搜索引擎:人工或半自动地收集信息,用某分类法加工整理,yahoo! Galaxy、OpenDirectorySohu (搜狐)、Sina机器人搜索引擎: Spider、Robot的机器人程序自动收集网页。 例如,谷歌、AltaVista百度、天网,根据搜索内容,搜索引擎有(1)综合搜索引擎、Yahoo、Excite、AltaVista等(2)特辑型搜索引擎,例如搜索电话号码555-1212 搜索交换机板地图的MapBlast等常见的搜索引擎:中文:谷歌、百度、北大天网、爱问、雅虎、狗搜索常用的搜索引擎(1)谷歌: 1997年,(简体中文)提供了两种方式:类别搜索和网站搜索。 支持AND和“”等条件查询。 因为检索精度高、速度快,所以成为最受欢迎的检索索引,是现在检索的领导者。 搜索方法和技术:支持模块分类、关键字搜索、布尔逻辑搜索(自动添加AND ),不支持使用“OR”等符号。忽略常见词语搜索特色:网页快照、快捷的相似页面、电话号码查询、PDF文件搜索股票报价、解释词典、谷歌地图搜索、工具栏服务、网页翻译、单词修改、繁简转换、英语网站、(2)百度:中国提供搜索引擎的主要网站中,80%以上由百度提供。 1999年底,百度成立于美国硅谷,百度于2000年在中国发展。 是国内唯一商业化的全文搜索引擎,提供搜索狐、新浪、263、TOM等网站的搜索服务。 检索方法和技术:模块分类,要求关键字检索“一字无差”,支持布尔逻辑检索(和/); 可以使用搜索语法。 搜索特色:百度快照、自动纠错、使用百度搜索霸喜好;百度与谷歌比较:搜索英语不需要使用谷歌。 检索中文吗? 谷歌发展迅速,积累了很多旧信息,百度发展缓慢,信息更新。 更新速度:从中文谷歌的一般半月更新到1月1日。 1 .中国人口普查有着悠久的历史,最早的中国人口普查数字是多少说明 :这是一个智力测验。 如果不认真寻找,很多同学会说“四亿五千万”。 在这项任务中检索到的关键词包含“中国人口普查最早”。 检索到的权威网站是中国的人口信息网(2.再别康桥的英语翻译检索说明 :徐志摩的话最喜欢中学生。 “再见康桥”是高二语文教科书的内容。 徐志摩的网站更多。 关键词使用“再见康桥”这个英语单词(Cambridge )。 这是寻找英语翻译原稿和其他文本翻译的重要方法。 总结:缩小两个以上的关键字、搜索范围,应用百度和谷歌语法1 .查找特定文件名的文件,特别是PDF、PPT、DOC、TXT、RAR、EXE、RM、Mp3、MOV、swf、ZIP等文件名很重要方法1 :基本搜索语法,例如文献搜索filetype:PPT方法2 :高级搜索功能2.intitle:指示下一个子页面被限于页面标题。 例如,身高intitle:林青霞3 .查找友谊链接: link:安徽新华学院在链接到某个URL地址的页面上进行搜索。 我能知道哪个网页把链接指向你的网页。 4 .搜索特定网站内容的语法: site:www.*.com(1)古龙site: (但是不能加入http:/和/等,否则是错误的。 ) (可以与filetype语法同时使用:金庸filetype : doc site : (参见网页)。 例如,美国教育网络上的宇宙大爆炸jpg图像检索: big bang filetype : jpg site : edusite可以将检索定位于某个域名,有助于缩小检索范围,提高检索效率。 就像keywordssite:一样,很有效果! 可以简单地检索各大学内有用的资源。 例如,住宅建筑学filetype : PPT ste : (参见网页)土木工程filetype : doc site :5,5 .特殊语法: INURL语法和基本检索语法的最大区别在于前者总是能提供非常准确的主题资料。 Inurl:关键字1空格关键字2例:寻找MIDI曲沧海一声笑。 搜索:“inurl:midi沧海一声笑”结果:搜索关于inurl:midi沧海一声笑的中文(简体字)页面。 注意:“inurl:”后面不能有空格。 可以从URL中得到几个网站的网站规则。 例如,标记“”的是个人主页。 域名的后缀也可以提供粗略的线索。 edu是一个教育网站,既是认真的学术研究,也是学生擅自制作的主页。 gov或政府网站一般权威、可靠,不会擅自公开不正确的信息。 com和商务网站是最常见的。 介绍自己的产品时,经常夸大其词,所以要注意“批判”地接受。 net网络服务公司为商业和个人用户提供服务。 org一般是非营利组织,其观点可能有倾向性。 谷歌的其他功能1 .查找英语单词的中文名称谷歌是最完整的英语词典,虽然找到了英语单词,但中文却用不知道如何用谷歌写英语单词,粗略地理解该单词属于哪个学科,加上中文关键字进行搜索例如,urotensin不知道中文的意思,但知道是收缩血管的药。 这种情况下,如果使urotensin血管收缩调查的话,可能会出现几篇文章和综述。 其中,附加了这个词的中文是2 .检索略语的全名是利用了谷歌检索略语的全名,写的时候突然忘记了某个略语的全名。 当时手头如果有金山词霸等软件的话很容易,如果没有的话可以使用谷歌,可以考虑用中文名称及其简称为关键字进行检索,很有效。 例如,WTO、搜索引擎的查询技术分析研究对象,选择搜索引擎确定搜索路径,用不同的方法正确选择搜索引擎的搜索选项,正确选择搜索引擎的各搜索功能,如何提高检查率? 选择上位语和关联语,例如,查找关于孙中山的文献,在孙中山查,然后在孙文、国父查。 调整搜索表达式的网罗度,执行家族搜索(通过分类搜索或or连接相关搜索词)以删除不需要的组(如and ),切片搜索com*会添加搜索路径来代替计算机。 如何提高审查率? 如果搜索提高专指度(用下位语和专指性强的自由语)的逻辑积“*”和not相关检索项目克林顿的话,就不需要关于雷温斯基的信息。 检索式:克林顿not雷温斯基通过文献外部的特征限制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代持方协议书
- 锅炉设备制造工问题分析深度考核试卷及答案
- 白酒酵母工岗位职业健康及安全技术规程
- 学生保密协议书
- 感光材料乳剂熔化工岗位工艺技术规程
- 公司金属材丝拉拔工设备安全技术规程
- 福建省泉州市泉港一中学、城东中学2026届七年级数学第一学期期末考试模拟试题含解析
- 江苏省泰兴市实验2026届数学八上期末调研模拟试题含解析
- 2026届吉林省白城市名校数学七年级第一学期期末经典模拟试题含解析
- 四川省遂宁中学2026届八年级数学第一学期期末复习检测试题含解析
- 学科带头人管理制度
- 大学生创新创业基础(创新创业课程)完整全套教学课件
- 2024-2025学年高一物理上学期第一次月考卷2(考试版A4)【考试范围:必修一1~2章】
- 医疗器械经营质量管理规范现场检查指导原则培训课件
- 第9课《创新增才干》第1框《创新是引领发展的第一动力》【中职专用】中职思想政治《哲学与人生》(高教版2023基础模块)
- JCT 932-2013 卫生洁具排水配件
- 3.2.2新能源汽车电机控制器结构及工作原理课件讲解
- 机场摆渡车司机合同
- 【正版授权】 ISO 9227:2022/Amd 1:2024 EN Corrosion tests in artificial atmospheres - Salt spray tests - Amendment 1: Footnote of Warning
- 医院感染相关法律法规培训课件
- JTG-D40-2011公路水泥混凝土路面设计规范
评论
0/150
提交评论