移动计算中的群智感知_第1页
移动计算中的群智感知_第2页
移动计算中的群智感知_第3页
移动计算中的群智感知_第4页
移动计算中的群智感知_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、移动计算的群体智能识别crowdsensinginmobilecomputing yang chen tsinghua university 7月5日,修正8月27日文摘无线通信和传感器技术的迅猛发展,无线移动终端设备爆炸式普及,市场上手机和平板电脑等设备与越来越多的传感器集成,具有越来越强的计算和识别能力。在此背景下,群体智能识别成为当前移动计算中的研究热点。在有关无线网络和移动计算的一些著名学术会议(如acm mobility com、acm mobicom、ieee infocom等)上,许多论文采用了群体知识认知的想法。mobisys 2011专门负责包含相关论文的会议单元,在mobi

2、com 2012中,至少有5篇论文参与组智力识别。在群体智能识别中,许多普通用户将移动设备(如手机、平板电脑)作为基本识别单元,通过移动互联网进行协作,实现识别任务分发和识别数据收集利用,最终完成大规模、复杂的社会识别任务。也就是说,集团智力认识发挥“人多力量大”的特点,将众多基层用户团结在一起,构建随时随地都不引人注目、与人们生活密切相关的认识系统。道路交通状况监测、大规模无线信号调查等之前耗费大量人力和资源的工作,可以通过集团智能的认识模式来完成。本文首先介绍了组智能识别的基本概念及其思想,重点讨论了组智能识别的任务分配和收集利用机制,以公路交通状况监测和建筑室内指导建设为代表,介绍了两个

3、组智能识别的实例,最后总结本文,探讨了组智能识别的研究热点。组智能识别的概念组智能识别的概念组智能识别中,许多普通用户将移动设备作为基本识别单元,通过移动互联网进行协作,实现识别任务分配和识别数据收集利用,最终完成大规模复杂的社会识别任务。在计算机科学领域,类似于群体智力感知的概念在概念上是一致的,基于大量用户参与,如群体计算、参与式感知、社会感知和crowdsourcing集团智能的认识和集团计算的范围更广。众包意味着任务部署的机制,参与性认识和社区认识在概念上相似,但各强调不同的方面。在群组智慧认知协同合作模式中执行复杂认知工作的参与者不必是具有专业技能的人。与此相反,多数基层用户成为中坚

4、人才,通过合理的合作,独自完成了不可能完成的任务。用户可以主动或手动参与识别任务。如果我们想在某一时刻知道城市道路的真实情况,各地电视台交通局就取决于使用者主动参与的方式,步行或开车的人通过短信报告当时当地道路交通状况。如果使用手机上安装的传感器自动监视和报告人群的动向,就会进行用户的被动参与。用户被动参与的好处是,用户无需为完成认识工作增加额外的精力和负担,因此用户参与热情高,家具数量容易增加。一般来说,组智能的识别操作很复杂,识别对象也不限于普通传感器识别的温度、湿度、位置等物理属性,以及图像、声音等多媒体数据。上述道路交通状况及其他社会事件、群众活动等都具有很强的社会属性,因此本文称其为

5、社会认识任务。社会意识工作具有一个用户可以轻松完成的范围、大规模、任务繁重的特性。为了发挥“人的力量大”的作用,军地认识逐渐显现,将众多基层用户团结在一起,建立了一个随时随地都不引人注目,与人们生活密切相关的认识系统。近年来,移动计算的爆炸性发展扩大了组智能识别的规模,传感器技术的普及增强了组智能识别的力量,许多以前不容易做的工作变得容易了。在大城市里,监视道路交通状况通常需要消耗大量人力和物力,在街道和小巷里部署交通警察是不现实的,部署大量的摄像机头要结合先进的视频分析技术自动监视。也有研究人员用手机监视群众在公共交通中的运动,推测道路真实情况。组智能识别还可以应用于灾难方案恢复,以确定灾难

6、发生的原因,并为以后的灾难响应累积经验寻找突破口。例如,在建筑物倒塌、人踩踏等事故中,移动设备可以通过照相机、gps等多种传感器成为事故现场的忠实记录者,事故调查人员可以从大量数据中恢复事故的全貌。识别任务的部署和收集利用识别任务的部署和收集,很难轻松地部署和收集识别任务。多数用户松散地组织起来,不是一个“军队”,而是一个连“山兵勇敢”都不能提的命令就能解决的。因此,工作的分配和收集必须取得一定的成果,以便合理的分工、适当的负担、动机、用户参与。许多群体智力识别任务采用众包的方式进行识别任务的分发和收集利用。众包(crowdsourcing)是2006年wired杂志设计的行话,描述了企业使用

7、互联网分发工作、发现想法或解决技术问题的新生产组织形式。通过互联网,这样的企业可以利用无数用户的创造力和能力。特别是在软件产业和服务业方面,提供了组织人力的全新方法。众包和一般意义上的外包的主要区别在于,前者的任务和问题被分派到规定的个人外部,而后者则被分派到规定的个人。以上对众包的定义从业务角度进行了更详细的说明,下面介绍了任务分发和收集的具体形式:setihome和recaptcha两个示例。setihome不寻找外星生命。search for extra terrestrial intelligence at home(在家中搜索外星智慧)1。通过互联网使用家用pc处理天文数据的分布式计

8、算项目。该项目分析了用a recbo射电望远镜采集的穆拉因电信号,试图找到能够确认外星智慧生命存在的证据。setihome的工作流程包含五个部分。1.位于波多黎各国家天文和电离层中心的群山森林拥抱中,直径305米的巨大射电望远镜a recbo搜索宇宙中的无线电信号。a recbo将每天观察到的大约35 gb的数据写入大容量数字磁带。2.集ihcome服务器将从a recbo收集的数据进行计算分析,然后根据客户的需要和计算机的情况分成较小的工作单元数据块。工作单元通过internet发送到世界上数千个客户端进行数据处理。3.setiome发送数据后,自动断开连接,客户计算机在计算资源空闲(即屏幕

9、保护程序运行时)时开始处理数据。setihome客户端应用程序执行快速傅立叶变换计算,该计算对工作单元中的数据执行1,750亿次运算。分析工作单元后,闪烁的小图标会提示客户重新发送和下载新数据。4.所有客户端获得的宝贵信号将发送回setihome服务器。大多数客户端软件发现来自地球的射频干扰,setihome将许多算法和已知通信频率干扰资源的大型数据库中的数据进行比较,以排除所有可能的干扰。对于没有排除极少数(仅0.0001%)的信号,将由下一个观测宇宙中的相同部分确认。1/5。信号确认后,setihome将根据国际天文学联盟(intern

10、ational astronomical union,iau)的前身发布公告,该联盟是天文学学界做出重大发现时公开的标准。找到那个信号作为屏幕保护程序的人将与setihome组的其他成员一起被授予“合作发现者”的称号。集ihcome工作流程的第2-4步是通过internet进行众包,集成了大量闲置计算资源,执行大规模计算任务。但令人惊讶的是,计算性能不会影响用户的正常使用,甚至在用户不知道的情况下进行。用户需要做的只是下载和安装setihome的客户端。recaptcha使用全局智能的数字高可用性全局智能的众包sourcing,recaptcha2不能提及。网民们的记忆是,第一次开始上网的时候

11、,没有验车之类的东西。结果垃圾邮件和垃圾邮件可以轻松通过某个网站的注册程序,以多种方式轰炸人们的视线。发送一封垃圾邮件的成本很低,恶意用户只要参考一封电子邮件,就可以向很多目标电子邮件地址发起攻势。如果这个邮箱被列入黑名单,就可以再注册一个,通过计算机自动化完成邮件注册和发送过程。为了抑制垃圾邮件增长的趋势,很多网络公司都在做很多努力。巨浪席卷沙子的解决方案是,稍微挤压人们,但耸耸肩,挠头的验证码。计算机识别技术还落后,以特殊的方法扭曲和污染的文字无法有效地识别。人类很容易辨认。计算机是一种简单聪明的设计,它随机生成字符串,随机污染并扭曲字符串的图像,然后显示在显示器前面的人或机器上。认识这个

12、文字的人是人。验证码的广泛使用增加了垃圾邮件的发送成本,注册和邮件发送不再能够以传统方式自动化。验证码不仅用于电子邮件,还广泛用于网站登录、论坛发布、电子商务等。验证码输入给普通用户带来了一些负担,但是考虑到使用验证码的积极效果,一般被接受。北京地铁首次开始停车安检时,乘客们抱怨延迟时间,影响了旅行效率。随着这项政策开始,公共安全的需要越来越大,用户们也逐渐习惯了这种方式。这种方式对效果率的影响也是毋庸置疑的。2但是,盖车的开发并没有到此为止。世界各地数十亿人每天浪费几秒钟在文字识别这种简单的活动上,被浪费的人脑的智力能不能更好地应用呢?2007年左右,汽车发明家luis von ahn提出了

13、使用这种心态解决计算机无法解决的“图书数字化”问题的新想法。在计算机时代以前,书籍、报纸等载体上存在着很多信息。如果不以数字方式处理,则计算机上的这些信息只能以图像形式存在,在以前的信息时代不能有效利用。自动光学识别技术也不能解决所有问题。因为早期的印刷术不准确,文字大小不同,图像不同。印刷品很久了,有各种细微的缺陷和污染。这种缺陷在人眼识别方面不是什么大问题,但在计算机上是个麻烦。这种设想最终形成了新的验车系统recaptcha,帮助我们每天找出大量古代印刷材料。问题在于,对于早期的验证码计算机,计算机实际上知道正确答案,因此可以判断用户提供的答案是否正确,从而确定用户是否是人类。而reca

14、ptcha希望人们知道的文章,电脑实际上不知道答案,如何确认返回的答案是真的呢?使用recaptcha,您一次可以识别两个,而不是一个授权码。一个是计算机随机生成、污染和扭曲的字符串,另一个是打印输出中选定计算机无法识别的字符。人们只要对前面的字符串给出正确的答案,就认为识别下一个验证码也是正确的。每次出现的两个字符串没有顺序,外表也分不清,人们不能只识别计算机生成的验证码,偷懒。recaptcha目前用于10万多个站点,每天数字化超过4千万个单词。通过这种方式,recaptcha帮助整个纽约时报130年报纸归档数字化。可以花费很多时间和资源的这个项目在短短几个月内由各位网友完成,这是在网民的

15、事前无知、事后惊讶中完成的。不久前,在树木社区上传了关于recaptcha的介绍文章,进行了很多讨论。所有人都佩服recaptcha精密的设计,感叹道:“我为new york times服务了很多年。”聪明的众包机制有“在沉默中听雷声”的感觉,不知不觉间,麦兜以烟和烟结束。谁会想到外星智慧探索和数字纽约时报等大型工程会以这种方式进行呢?巧妙的众包机制还具有“明公调色板、秘密仓库”的意义,在休闲、娱乐、娱乐、使用服务的过程中,让用户完成自己有目的的任务。下面以大家熟知的盲人大象为例,讨论集团智能的地壳数据收集和利用。根据涅磐的记录,过去四个盲人很好奇大象长什么样,但他们看不见,只好用手摸。有人认

16、为大象的牙齿接触大象是粗大的萝卜,有人认为大象的耳朵接触大象是大的粉丝,有人认为大象的腿接触大象是大的柱子,有人认为大象的尾巴接触大象不是大的。这个故事中的盲人就是探测大象的这项任务的基本迟到单位。尽管是盲人,他们正确地认识事物,并如实地报告。作为个人,这些盲人有部分问题。但是作为整体,盲人摸大象失败的原因不是“盲”,而是认识到数据的稀缺性或片面的方面,而是没有充分收集和利用数据。假设综合每个盲人的信息,大象是两个牙齿像萝卜一样的两个耳朵、两个耳朵、像柱子一样的四条腿、像稻草一样的尾巴的复杂组合体,应该更接近事实。同一问题存在于一个用户的识别数据可能无效的群体智力识别中。但是数千万个这样的数据聚集在一起,带来了质的飞跃,通过合理的使用方法,可以从很多普通数据中挖掘出宝贵的信息。例如,如果一个用户发现道路行驶速度慢,原因可能有多种。如果同一段的大部分用户报告了这个问题,他们可能会认为该路发生了交通堵塞,并采取相应的措施。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论