版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索说到搜索,你会想到什么?WhatisInformationRetrieval3(60)S(ogou)B(aidu)大战360产品简单、免费、亲民,流氓与否不重要,用户用得爽就好!你的桌面有多少360应用?搜索入口更改跳转集成其他内容资源元搜索引擎(聚合)朝阳发话,我们也参战搜狗成炮灰搜索不是一天建成的搜索的冰山一角界面的力量1997年Yahoo问题1:分类组织对于搜索的意义何在?问题2:Google搜索界面为何十余年一成不变,背后的原因是什么?Keywordssearchkillsubjectcategory!!搜索结果页面包含哪些元素?Pre-2012搜索对电子商务的意义何在?淘宝的起家现在淘宝的搜索快速交友检索系统元数据揭示查询限定动态交互实时性爱情连连看逐轮检索男选女50->10从信息资源集合中找到满足用户信息需求的相关信息的过程。信息检索本质实例的共同特征Match匹配找对象广义信息检索包含信息组织和检索两部分。信息检索随着信息技术和信息环境的发展,其内涵不断丰富和变化着。Web搜索引擎是信息检索IR中的一种类型信息检索IR这一术语是1950年由CalvinMooers首先提出的。延时性通讯形式。发发送者在某一时刻发出信息,接受者可以在晚一些时刻才收到该信息;发送者必须发出一切可能的信息,而接受者必须有某种检索装置以便从大量发送的信息中筛选出适合自己需要的信息。信息检索Aninformationretrievalsystemwilltendnottobeusedwheneveritismorepainfulandtroublesomeforacustomertohaveinformationthanforhimnottohaveit.--Mooers’Law,1959InformationRetrieval
计算机出现之前计算机出现之后
WWW出现之后在网络出现之前,计算信息检索仅仅面向少数高学历用户群体,如律师助手、图书馆员和其他搜索中介、以及记者。这些人搜索高度专业化、高质量、文本型的信息资料,例如大学图书馆书目记录、法律案件和观点以及通讯社文章。大多只能搜索文档替代物Surrogate。
联机检索价格昂贵通讯费+数据服务费双高,时间就是金钱对检索技能要求高委托经验丰富的检索员代查信息检索发展Web让搜索走向大众化日常化卡片目录柜穿孔卡片存储检索一体化复杂需求很难充分转化为查寻表达取决于用户自身的判断,是主观的不同用户对同一事物的相关度判断并不一致同一用户在不同时期、不同环境下所作的判断也是不尽相同相关度Relevance信息检索IR核心问题ThekeygoalofanIRsystemistoretrievealltheitemsthatarerelevanttoauserquery,whileretrievingasfewnonrelevantitemsaspossible.信息检索流程信息检索典型技术架构所需文档黑箱魔术内涵更加丰富的信息检索研究贯通信息搜索整个过程,算法与技术只占其中一部分PeterMorville《搜索模式》信息检索可以看作是计算机科学与信息管理学为主的交叉学科,现代信息检索主要以计算机技术为手段来处理信息对象,也包括和其他一些学科的融合:(计算)语言学、认知、心理学等。虽然搜索引擎非常普遍了,但作为商业搜索引擎其技术是保密的。开源搜索引擎提供了学习和实现组织内部搜索功能的可能。开源搜索工具学会部署,实现企业组织站内搜索功能教学资料《搜索引擎技术基础》.清华大学出版社,2010《ModernInformationRetrieval(2nd)》英文版.机械工业出版社,2011《SearchEngine:InformationRetrievalinPractice》英文版.机械工业出版社,2009谈谈搜索搜索无处不在热门主题Web搜索早期1990-2000s当前搜索格局2010-我们的目标是让你越来越快的找到答案,在你的问题和寻找的信息之间建立无缝的连接。这意味着其实你不必知道我们最近添加了什么功能,只要在搜索框中输入你要找的东西就可以了。——Google的搜索理念/2011/11/evolution-of-search-in-six-minutes.html更快地找到所需的答案,而不是一大堆相关的信息精准性、个性化提升上市十年GOOGLE的十大里程碑式贡献自动补全翻译工具路线和交通全局搜索移动化和多屏化语音搜索语音助手知识图谱个性化搜索未为先答搜索框的“阴谋”信息自由公开政府干预审查李彦宏2009年8月18日提出框计算(BoxComputing)用户只要在“框”中输入服务需求,系统就能明确识别这种需求,并将该需求分配给最优的内容资源或应用提供商处理,最终精准高效地返回给用户相匹配的结果。这种高度智能的互联网需求交互模式,以及“最简单可依赖”的信息交互实现机制与过程,称之为“框计算”。英国数学家沃利斯在17世纪发明的无穷大符号∞的形状2010初Google退出中国事件变为.hk1.首先是“框”:
框是提供用户需求的输入端口和媒介;
框是框计算运行的外在平台;
框是一个功能强大的需求收集器和分析器;
框又是一个强大的泛操作系统和应用兼容平台。2.其次是“计算”:
计算实现对用户需求的精准识别分析,须完全智能化,这是框计算最核心的技术。
计算还需实现对用户需求资源的对接整合、精准匹配与调度,要求准、快、稳。3.再者是“资源”和“平台”:
框计算要求有精准、稳定、可靠而丰富的优质资源,包括数据资源和各种应用等。
框计算提供有专业的资源对接合作与运营平台,即百度开放平台,其中包括:百度数据开放平台、百度应用开放平台等。4.最后是“机制”:
简单可依赖:框计算以用户需求为导向,旨在为用户提供“即搜即得、即搜即用”最简单可依赖的信息需求服务模式及服务平台。搜索不公百度联盟,自家的孩子排名在前/搜索巨头投资和收购了哪些公司?试分析缘由GoogleKnowledgeGraph过去很多年,包括未来很多年,主流搜索引擎主要着眼于改善排名,为用户提供最有价值的网页。但搜索的形式并没有太大变化,输入关键词-页面显示十个结果,结果由标题、链接以及关键词相关的简短内文片段组成。虽然现在搜索页面也会插入图片等结果,不过搜索结果大体上依然通过文字简介的形式提供。知识图谱则不同,它在搜索页面右栏集成了更直接的答案。2012以后
幕后英雄知识图谱的背后是庞大的信息库。Google高级副总裁AmitSinghal在接受SearchEngineLand采访时说知识图谱的信息搜集工作始于2010年收购Metaweb。人们对同一种东西有很多种描述方法,Metaweb专注于将不同文字表述与同一个实体连接起来,并探索这些实体的属性(例如明星的年龄)以及彼此之间的联系,最终提供一种新的搜索形式。虽然不能完全替代关键词搜索,但Metaweb的索引、搜索方法在处理诸如“身高小于160cm的女星”、“马丁大叔害死的所有配角”之类的搜索时更高效。/88981实体搜索语义搜索知识引擎模仿Worldcat、Google知识图谱做法国内搜索引擎开始试水,直接给答案GraphSearch社交网站的搜索逆袭对搜索产生影响语音搜索,LBS搜索入口的侵蚀Siri智能助理人工智能语音识别苹果的Siri是一个巨大的发展。这是一种基于语音的方式,能帮助用户通过iPhone获得答案。这意味着搜索的创新。--谷歌CEOEricSchmidt问题:背后谁来驱动?搜索要的是答案还是相关文档,onestop?wolframAlpha你怎么看待国产语音助手的跟进?下去试一试机器人小图蹿红人人网人人网上出现了一款清华大学图书馆提供的应用——智能机器人小图,引起众多关注。据图书馆系统部主任张成昱介绍,小图是由图书馆姚菲老师和一个计算机系的同学共同研发的,是集自动化咨询、自动问答和查阅图书等功能为一体的虚拟图书馆馆员。“小图的理念是把图书馆的服务放到社区、社交网络上,通过不同的环境和信息获取方式,采取适合社交网络的形式,把图书馆的一些自动化咨询服务放在其中,来代替真人的工作。”……电话铃响时,屋里的音响正大声播放着甲壳虫的“WeCanWorkItOut”。彼得拿起电话,电话给带音量控制的本地设备发出信号,音乐声降低了。彼得的姐姐露西正从医生的办公室打来电话:“妈妈需要找一位专家看看,然后得进行一系列的理疗,大约是两周一次。我会让我的代理来安排这些预约的。”彼得立刻同意帮忙开车接送。在医生的办公室里,露西在手持网络浏览器上给她的智能代理下指令。代理立即从医生的代理处查到了妈妈的治疗处方,在诊所清单中进行查找,从中找出那些在母亲家方圆20英里的范围内,在信用评级服务中评级为出色或很好,在母亲的保险计划范围之内的诊所。然后,它尝试将可能的预约时间(由各家诊所通过其网页提供)和彼得及露西的繁忙的日程进行匹配。几分钟之后,代理给他们提供了一个方案。彼得对此不太满意。从母亲家到这个医院要横穿整个城镇,而他从医院返回的时间又恰好是交通高峰时间。他设置了更多的时间和地点方面的限制,让自己的代理重新进行搜索。在这个任务的执行过程中,露西的代理充分信任彼得的代理。几乎一瞬间,新的方案又出来了:医院离家近了,时间也提前了。但是,同时有两点警告。首先,彼得要重新安排他的一些不太重要的预约。彼得查了一下,没什么问题。另一点是,这家医院不在保险公司的理疗医院的清单上。代理为解除彼得的顾虑,说,“通过其他方式,可以保证予以确认服务类型和保险计划,需要细节内容吗?”彼得表示同意,“给我提供所有的细节”。几乎同时,露西也登记表示赞同,事情就这么定下来了。(当然,彼得为了了解细节安排,晚上又让代理解释它怎么找到那家诊所的,因为那家并不在通常的清单上。)互联网之父TimBernersLee科学美国人2001家庭智能控制系统SPIMES,aformofubiquitouscomputingthatgivessmartsand'searchabiliity'toeventhemostmundaneofphysicalproducts.搜索的调色盘多元化泛在化搜索是一个复杂研究主题WickedProblem没有确定的模式或公式极不确定又相互依存需求不完整、相互矛盾、处在不断变化中搜索者往往有着不同的目标的世界观,没有统一尺度衡量搜索不是目的,仅是手段和过程搜索是一个远没有被解决的问题开放问题如何获得高质量的搜索结果,更全面和更准确之间的权衡。海量数据的快速索引与查寻。如何理解用户需求和行为,将其用于检索系统支持的搜索任务当中。带着这些问题学习,试图寻找新思路与新方法搜索是好比一个万花
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业保密规范制度
- 2026湖南怀化国际陆港经济开发区内国有企业招聘4人备考题库附答案
- 2026福建省福清市向阳幼儿园招聘考试备考题库附答案
- 2026西安工业大学招聘备考题库附答案
- 2026贵州湄潭县人民医院招聘编制外紧缺医务人员参考题库附答案
- 2026重庆医科大学编外聘用人员招聘1人(2026年第1轮)备考题库附答案
- 2026陕西选调生哪些学校有资格参加参考题库附答案
- 中共南充市委社会工作部关于公开招聘南充市新兴领域党建工作专员的(6人)考试备考题库附答案
- 中国农业科学院2026年度第一批统一公开招聘参考题库附答案
- 乐山职业技术学院2025年下半年公开考核招聘工作人员备考题库附答案
- 甲状腺癌医学知识讲座
- ABAQUS在隧道及地下工程中的应用
- 【郎朗:千里之行我的故事】-朗朗千里之行在线阅读
- 工作汇报PPT(山与海之歌动态)大气震撼模板
- 义务消防员培训课件的课件
- 市政施工围挡施工围挡方案
- 病原生物与免疫学试题(含答案)
- 尼帕病毒专题知识宣讲
- 液化石油气重大危险源事故专项应急救援预案
- 现代企业管理制度
- GB/T 24312-2022水泥刨花板
评论
0/150
提交评论