




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子信息工程类 张天力情感计算人机交互技术新前景摘要:情感在人类的认识和人机交互中起着关键性的作用具有情感能力的计算机就是让计算机能够在和人类相处时更有智能、更为敏感和更为和谐和亲切。情感研究的进展与展望如何,情感计算的应用等都将是本文探讨的内容。关键字:情感计算 人机交互 应用 展望 一、情感计算的发展与展望 情感计算研究的提出最早可以追溯到20世纪90年代初,耶鲁大学心理系的Salovey教授提出了情感智能的概念,开展了一系列的研究。该概念随后被Goleman发展为与智商(IQ)相对的情商(EQ),并随着Goleman的畅销书而迅速流行,在心理、认知、计算机等领域掀起了一个研究情感智能的小高潮。MIT的Picard教授根据这些新的概念和研究方向,于1997年出版了情感计算一书,希望赋予智能机器感知、理解和表达情感的能力。进入新世纪以后,特别是近年来,随着普适计算、人本计算、社会计算等概念和研究方向的提出,自然的人机交互日益成为各研究领域的研究内容和目标,情感计算也自然地成为各学科共同关注的热点、焦点。中国国家自然科学基金委也不失时机地支持了“情感计算理论与方法”的研究。情感计算从本质上,是一个典型的模式识别问题。智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解人的情感。在实际的自然交互系统中,智能机器还需要对上述信息作出及时的、恰当的、情感化的反应。情感之间距离的定义和计算方法是情感计算的核心问题,例如需要定义和计算“微笑、笑、大笑、狂笑”之间的距离,以便把它们分别聚类,从而使系统能够识别出不同程度的笑。遗憾的是,目前情感计算的研究还只能对情感进行粗分类,即识别7种典型的情感。目前,我国在情感计算这一领域的研究主要在人脸识别。这一方面是因为人脸表情容易获取,易于分析处理,其成果具有重要的应用前景等;另一方面,也反映了情感计算研究的一个普遍的问题,即尽管人类是通过表情、语言、动作等各种信息的融合,识别和理解情感,但是,当前多模态情感数据获取、分析、融合、识别和理解,以及情景等上下文信息的融合依然是情感计算研究中富有挑战性的课题。实现具有情感反馈的自然的人机交互是情感计算研究的最终目标,这需要在上述情感理解的基础上,研究人类情感反馈和表达的机制,建立模型。目前国内的研究成果已有基于已有的情绪模型,提出了虚拟人的认知结构,建立了一种新的基于动机驱动的自主情绪模型。清华大学戴振龙的论文则介绍了一种人脸表情的合成方法,能够生成具有细微表情动作的虚拟说话人。可以看出,这方面的研究在国际上依然是自然交互领域的一个新兴的方向,面临着许多挑战性的问题,具有广阔的发展前景。2、 情感计算的具体研究内容 根据情感计算的过程可将情感计算的研究内容分为以下九个方面:情感机理、情感信息的获取、情感模式识别、情感的建模与理解、情感的合成与表达、情感计算的应用、情感计算机的接口、情感的传递与交流和可穿戴计算机。 从人类情感的交流过程来讲,情感计算的研究可分为四步:通过传感器直接或间接与人接触获得情感信息:通过建立模型对情感信息进行分析与识别;对分析结果进行推理达到感性的理解;将理解结果通过合理的方式表达出来。也就完成了情感交流的全过程。 根据上述过程,情感计算的研究内容主要应包括:情感信号的获取、情感信息的分析与识别、情感信息的理解和情感的表达。 情感信号的获取现在主要通过一些采集输入设备提取人的面部表情、语音语调和肢体动作,也就是特征提取。此外通过测量人的一些生理反应包括心率、血压的舒张压和收缩压、脉搏、瞳孔扩大、呼吸、皮肤导电、荷尔蒙胆汁的分泌以及皮色和体温等用于情感状态的识别理解。 情感信息的分析和识别主要是对所提取到的信息进行预处理、模式分类。 情感信息的理解就是根据上一步的分类结果和数据库中的模板进行比对判断。把所提取到的情感以最大概率确定出来,然后合成表情。 情感的表达就是把上一步理解的结果呈现出来进行交互。在这四个方面的研究中情感的识别和合成是目前的关键部分,也是我们研究的重点。3、 情感模型的描述语言 智能型计算特性大多采用无所不在的分布式计算模型,因此使用者状况及环境等情境数据有多方的来源而系统所推导出的情感模型,也需要通过网络传递到其它有兴趣的模块。因此如何建立外显的情感模型描述语言,并通过适当的网络协议将情感状态完整表达并传递出去,是一个重要的研究课题。目前大部分的情感模型描述语言都是虚拟人体描述语言的一部分。以下就几种包含情感标记的人体描述语言作进一步的说明。 AML(Avatar Markup Language)是一种基于XML的多形式脚本语言设计的重点之一是希望它可以容易地被动画师了解也可以容易地由软件产生。AML将脸部动画和肢体动画封装在一个附加同步化信息的表示法中。例如,在MPEG 4标准中定义了一套关于脸部和身体的低阶动画参数,但并没有提供任何对于代理人的高阶控制方式。在此环境下的系统,中介层(Middleware Layer)显得特别有价值它提供智能型的软件代理人可以轻易控制三维空间的图像表现,而不需要担负每次产生所有低阶设定的重担,3D内容制作者因此能简易快速地制作与分享丰富的代理人动画,AML的作用就是充当这一中介层。 CML(Character Markup Language)是一种基于XML语言的动画语言,为代理人的结合与在线应用软件或虚拟世界提供帮助。CML使用由上而下的方式,分开描述动作跟虚拟人的功能制定角色动作、模型和语音定义在一个设定档,将情感等虚拟人的状态定义在另外一个设定档,定义角色特质、情感和行为等高阶属性整合这些高阶属性,产生具备同步能力的动画脚本。而新的或者未被指定的行为可以由调和基本元素或属性形成。提供开发者一个具有弹性的动画语言。 VHML(Virtual Human Markup Language)是一个逐步形成标准且基于XML的语言,主要控制银幕上的虚拟人。使用VHML的虚拟框架是结合很多技术提供对网站拟人般的互动。VHML对每个型式提供子语言,如GML用于姿势、SML用于说话、BAML用于身体、FAML用于面部;也提供比较高阶的子语言,如EML用于表情、DMML用于对话。以此实现使用者和虚拟代理人的互动简易化。PAR(Parameterized Action Representation参数化行为表示)。PAR认为要表示一个行为,构成的要 素应当包括行为的核心语义(状态变化、运动、力量)、行为的参与者、应用条件、准备条件、终止条件、后果状态、持续条件、行为目的、父行为、子行为、前行为、后行为、并发行为、开始时间、持续时间、优先级、运动轨迹、行为方式等。它描述了行为的诸多方面的特征同时给出了行为的主要语义构成以及行为的时间信息,从而一方面可以根据语义对行为分类,另一方面便于实现行为的推理。四、情感计算在人机交互设计中的应用1人机界面设计 情感计算可以用在一般人机界面的设计上,以提升应用的有效性。自然和谐的智能化人机界面的沟通能力特征包括:(1)自然沟通:能看,能听,能说,能触摸;(2)主动沟通:有预期,会提问,并及时调整;(3)有效沟通:对情境的变化敏感,理解用户的情绪和意图,对不同用户、不同环境、不同任务给予不同反馈和支持。而实现这些特征在很大程度上依赖于心理科学、认知科学和计算机科学对人的智能和情感研究所取得的新进展。我们需要知道人是如何感知环境的,人会产生什么样的情感和意图。人如何做出恰当的反应从而帮助计算机正确感知环境,理解用户的情感和意图,并做出合适反应。因此,人机界面的“智能”不仅应有高的认知智力也应有高的情绪智力,从而有效地解决人机交互中的情境感知问题、情感与意图的产生与理解问题,以及反应应对问题。以语音接口为例,具有警示作用的语调与速度,对吸引使用者的注意力,有相当大的帮助。而在轻松的情境下,感性缓慢的语调或动画接日将有助于使用者进入舒缓的状态。2人机接口设计 在心理学上人类通过语言、表情、肢体动作等方式将八个主要类别的情感表达出来。目前分辨人类情感的研究中能从表情中精确辨别出哪一类情感的仍属少数,而且辨别率约在70左右。通过多模方式提高辨别率是一个新兴的研究方向。然而,情感计算的目的是了解使用者与环境互动过程中的意向或困难因此是否能精确辨别出标准的情感状态不是解决问题的必要过程。反而是能根据应用特性,检测出使用情境的感情状态,进而将此情境因素设计在人机接1:1的程序中应是目前较为有效而值得探讨的作法。3智能型教学代理人 在智能型教学代理人的应用上一个具有情感功能的教学代理人,比一般的计算机教学软件更能真正根据使用者的情感了解学习情况进而提出有效的表达方式提高使用者的学习兴趣。按照教学系统的四大模块,智能型教学代理人可分为下述几个角色:使用者接口模块是与学习者进行互动的沟通者:学生模块是了解学习者认知状况的分析者;教学模块是选取最佳教学法的教学者:教材模块是提供适当教材的编辑者。 沟通者肩负询问、诊断、展示及记录责任。询问的责任是了解有关学习者的基本资料诊断的责任是获得学习者的能力、认知状况及知识结构等的信息,展示的责任是将教材呈现在输出装置上供学习者学习,记录的责任是记录学习者在学习时与系统互动的所有历程的信息。因此,沟通者是由询问代理人、诊断代理人、展示代理人及记录代理人所组成。沟通者由接口数据库,取得与学习者交互的方式及画面。分析者分为数据查核代理人、评价检查代理人及学习检查代理人,经询问、诊断及记录代理人取得的数据,由分析者进行分析。分析后,分别将结果储存于学生模块基本数据库、学习成就数据库及学习数据库。五、总结 情感计算是一个多学科交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 书法天地二教学设计-2023-2024学年初中书法练习指导八年级上册川教版
- 2025租赁合同偏向甲方
- 2025合同范本(办公设备)
- 2025年北京市存量房屋买卖合同(自助成交版)
- 2.4 向量的坐标表示说课稿-2025-2026学年中职基础课-拓展模块一 上册-高教版(2021)-(数学)-51
- 1.1 数列的概念(1) 教学设计-2024-2025学年高二上学期数学湘教版(2019)选择性必修第一册
- 橡胶厂文件管理规范制度
- 湖南省益阳市资阳区九年级化学下册 第九单元 课题2 溶解度说课稿 新人教版
- 宁波事业单位笔试真题2025
- 2025先进纳米材料研发合同
- 先心病介入封堵治疗
- 全国各大媒体的报料热线电话号码
- 数控heidenhain说明书TNC直接提供两种加工孔模板的循环
- GB/T 42453-2023信息安全技术网络安全态势感知通用技术要求
- JJG 860-2015压力传感器(静态)
- GB/T 22231-2008颗粒物粒度分布/纤维长度和直径分布
- GB/T 18253-2000钢及钢产品检验文件的类型
- GB 5009.3-2016食品安全国家标准食品中水分的测定
- 液化气站安全生产目标考核与奖惩记录
- 高中生励志奋斗与梦想课件
- 《中职地理》配套教学课件
评论
0/150
提交评论