下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 智能人机交互让人与机器自由沟通 未来的智能人机交互技术可以帮助人类从更多繁重的工作中解脱出来,实现真正的心的自由。本刊记者 豆瑞星键盘主导了dos,mac和windows设备则更依赖鼠标,多点触控成就了iphone,kinect让xbox360走火,一种人机交互技术的革新往往能够影响一个产业。在全球科技界,人机交互仍然是创新的热点领域,其创新应用出现在不少热门科技产品之中。例如siri就让苹果iphone“有问必答、能听会说”,微软kinect使体感操控成为现实,很多智能电视产品也加入了语音识别和体感操控的功能。人机交互的方式上也日益多元化。英国的一家科技团队正在尝试创建一个工具,使其能将一
2、套标准手势实时翻译成文字。这个工具被称作“便携式手语翻译(portable sign language translato)”。手语使用者只需对着手机或电脑摄像头做出手势,该工具就可以立即基于数据库将其翻译成文本。他们现在准备支持英国手语,但这套系统完全可以用于处理美国手语( asl)、默启通手语(makaton)、国际语言以及字母等。对于残障人士是很大的帮助。如今智能人机交互的应用越来越广泛,“花样”也越来越多。mirage table:真人与虚拟影像的互动由微软推出的mirage table(幻影桌面)是一项颇为神奇的技术,它将两台3d投影仪、kinec t体感监测仪、3d眼镜以及人的动作
3、结合在一起,打造出一个真人和影像互动的效果。通过miragetable,人们的所有动作都会被kinect捕捉并转化称3d影像,然后和已有的3d物品进行交互,比如用手移动影像中的多米诺骨牌、皮球等。同时一个实体物品可以通过虚拟影像复制出多个,也可以将移动虚拟物品到任伺位置。用户只需要佩戴3d眼镜就可以看到miragetable上3d投影的图像。曲面设计可以让操作者通过投影仪来与虚拟画面实现互动交流,就像打保龄球一样。“miragetable”还可以实现人与人之间的双向写作,通过miragetable,两个操作者不仅可以看到对方并谈话,而且一来自www.lw5u.com个人可以与视频中另一个人的虚
4、拟对象进行互动交流,甚至可以“触摸”虚拟对象。还可以一起下象棋、搭积木,甚至研究一些比较复杂的项目方案等。如果说ar(增强现实)技术可以在现实的基础上模拟出虚拟场景,让人进入虚拟版的现实世界,那么mirage table则可以将用户带入一个虚拟的世界,想象一下,如果未来所有的网络游戏都可以将用户融入其中,在虚拟环境下直接操作,使用新奇的装备,实现惊艳的特效,世界将会变得多么神奇!基于kinect的操控创新微软推出的xbox 360体感外设kinect艮受用户欢迎,但是它的意义并不仅仅是游戏外设,而在于对人机交互方式的探索和创新。正因为如此,kinect技术才能被广泛应用到其他创新产品之中,成为
5、智能人机交互的经典产品。国外一家专注于人机交互技术的创业公司3gear systems利用微软kinect技术,推出了sdk包,能够帮助开发者将手势动作反馈到应用软件之中。这套系统可以帮助3d建模人员更方便快捷地对模型进行拼装操作,操作过程可以在普通显示器之上呈现。开发者只需要购买kinecr感器和固定装置就可以在这款sdk包的基础上,设计新的app产品。kinect的作用还不止于此。oblong实验室近期公布了一项科研成果,它将kinect与xbox上的ie浏览器结合起来,脱离鼠标来操作电脑屏幕,能够实现一系列复杂的操作,例如拖动、摆放屏幕上的个体,对三维模型进行旋转、缩放,进行复杂的命令操
6、作,或者用手机、平板或遥控器来控制大屏幕,甚至可以多人玩游戏、通过手势控制飞行器,在多个屏幕之间进行无缝切换等。微软研究院联合华盛顿大学也研发出了一种名为soundwave的系统,该系统可利用计算机内置的麦克风和扬声器,提供与kinect类似的对象识别及手来自www势识别功能。soundwave将计算机的内置扬声器用做超声波( 18-22khz)发射源,其频率会随着你的手或身体的位置的变化而变化。然后,计算机的内置麦克风会测量这一频率变化,并把参数告诉一套相当复杂的软件,由该软件计算出手势和动作。语音交互的行业应用苹果于2010年花2亿美金亲自将siri收购,并将其深度融入到iphone 4s
7、中。siri和手机紧密结合,可以极大提升设备的操作简易性、环境适应性和真正意义上的智能性。实际上,不仅仅是apple自己的ipad、itv和车载设备,所有未来所谓的智能设备都将会使用siri的模式。但是智能人机交互技术在行业的应用中,还存在一些不足。以语音交互为例,传统语音交互涉及的主要技术包括语音识别和语音合成等都已经比较成熟。在多年以前,ibm的语音识别软件在pc上就有不错的识别率了,而微软名为tellme的项目也持续了多年。然而,即使达到100%的准确率,仅限于输入识别功用的语音识别不能代表智能人机交互的真正意义,它并不是革命性的。要实现完美的人机交互,语音技术就必须跟人工智能技术结合起
8、来。现在以语音方式为主的人机交互系统目前主要应用在如呼叫中心的ivr系统、智能手机等终端中的语音拨号,短信朗读、车载语音导航系统等。但普遍存在交互模式比较机械固定(以声控命令为主)、用户体验一般、交互过程繁琐等问题。小i机器人是广受欢迎的一款智能人机交互产品,这款产品的独特之处在于,支持几乎所有的人机交互渠道,包括im、web、微博、短信、电话、手机应用等,通过文本和语音等方式和用户进行智能自然的交互。这款产品在技术上分为五个层面,最底层是知识体系和开发框架,整合了知识库、对话庠、信息服务等资源,往上一层是机器人核心引擎和开发框架,能够实现场景管理、知识推理等功能,再往上则是语义分析层,是机器人的核心引擎,能够将人类语言转化为机器可以理解的指
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 压缩天然气场站工上岗证培训考试题库(附答案)
- 2026年会计从业资格考试初级会计实务模拟单套试卷
- 2025年一级造价工程师(工器具购置费计价)试题及答案
- 词性的题目及答案
- 龋齿预防宣教
- 小学民办学校毕业生升学去向统计-基于2023年毕业班升学登记表
- AI赋能化妆品功效测试:技术原理与实践应用
- 2026版高考物理二轮复习微专题13 热学
- 2025-2030中国选择性5-羟色胺再吸收抑制剂行业市场现状分析及竞争格局与投资发展研究报告
- 2025-2030中国儿童学习桌椅行业发展状况及趋势前景预判研究报告
- 2026上海人保财险校园招聘笔试历年常考点试题专练附带答案详解
- 2026特种作业场内专用机动车辆作业考试题及答案
- 中国近现代史纲要之第六章-新
- MOOC 管理学原理-武汉理工大学 中国大学慕课答案
- 5G华为优化中级认证考试题库(浓缩500题)
- AI技术对教育的影响
- 以就业为导向的技工院校人才培养模式
- 2019年12月大学英语三级(A级)真题试卷(题后含答案及解析)
- EPC总承包项目采购方案
- 压花艺术课件
- 中央空调系统设计详细计算书
评论
0/150
提交评论