


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
在听取了别人的建议后,他打开了首都之窗网站的主页,在“奥运场馆”服务的列表下找到了这样一个栏目:中国手语奥运常用语。安装好插件后,他即刻进入了中国手语奥运会常用语教学频道的界面:轻点鼠标,一位身穿中国红颜色外套的三维虚拟人就会适时地将“奥林匹克”、“残奥会”,以及“欢迎光临!”、“您想吃什么?”等常用词汇和句子演示为标准手语。小张很高兴,有这样的老师帮助学习,自己一定能够顺畅地和聋哑朋友们交流。历时八年的成果或许很多人还不知道,为中国手语奥运会常用语教学提供技术支持的是中国科学院计算技术研究所的研究人员。该所的手语识别与合成课题组历时8年,开发出了先进的手语识别与合成技术。“顾名思义,手语识别与合成技术包括手语识别和手语合成两部分。”参与该课题研究的中国科学院计算技术研究所普适计算研究中心常务副主任陈益强说所谓“手语识别”,是指通过计算机采集设备获得聋哑人的手语数据,采用模式识别算法,结合上下文知识,获知手语含义,进而翻译成语音,传达给不懂手语的正常人。这样,正常人就可以“听懂手语”。而“手语合成”则是指正常人通过语音表达自己的意图,计算机将语音翻译为手语并表现出来,向聋哑人传递信息。这样,聋哑人就能够“看懂声音”。据了解,我国听力、语言残障人士超过2000万人,而且每年还在以2万3万名的速度递增。对手语这类人群最重要的交际手段进行研究,不仅有助于改善和提高这些残疾人士的生活、学习和工作条件,为他们提供更好的服务,同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人研究、电影制作中的特技处理、动画制作、医疗研究、游戏娱乐等诸多方面。北京电视台的新闻手语栏目创办于1989年,是在国内最早推出的一档手语节目,曾引领全国电视公益事业先河。2007年1月1日开始,新闻手语在北京卫视的播出时间由每日5分钟延长为8分钟,并在全国第一次启用数字模拟机器人打手语,手语播报更加标准化、程序化。“为它们提供技术支持的就是我们。”陈益强自豪地告诉记者。据记者了解,此前电视台在播放手语新闻时,都是由一名手语翻译员来完成这一工作。不过,在中科院计算技术研究所研制的电视台用手语电视节目制作系统的帮助下,新闻文本已经可以通过计算机自动合成手语视频窗口,与电视节目同步播放。在2008年北京奥运会和残奥会举办过程中,由该所研制的奥运新闻实时播报系统也得到了展示,对奥运志愿者进行培训的奥运手语在线互动教学系统更是获得了北京市信息办和残联等各部门的支持,成为2008年残奥会志愿者必备的学习软件。攻克五大难关“尽管手语识别与合成技术的出现,使得聋哑人与健听人之间的对话成为可能,但要完全实现听懂手语,看懂声音的目标还需要解决很多技术难点。”陈益强说。据了解,这些难点主要包括手语运动数据获取不完整、多维手语运动数据识别、大词汇量识别、非特定人的识别、手语多模态表达的复杂性及手语运动数据的重定向等。为了解决这些难题,从2000年到现在,中科院计算所手语识别与合成项目组一直在着力攻克五大难关,并在此过程中研发出了大量核心技术,申请国家发明专利20余项,其中手语编辑、手语翻译等相关专利已获授权。“这五大难关主要包括数据采集和处理、大词汇量手语识别、非特定人手语识别、手语多模态表达以及手语运动数据重定向。”陈益强说。据介绍,手语识别系统主要分为基于数据手套的识别和基于视觉(图像)的手语识别系统。基于数据手套的手语识别系统,是利用数据手套和位置跟踪器测量手势在空间运动的轨迹和时序信息。这种方法的优点是系统的识别率高,缺点是打手语的人要穿戴复杂的数据手套和位置跟踪器,并且输入设备比较昂贵。不过,由于摄像头在将三维立体的手语数据转为平面二维数据时会丢失很多数据信息,而数据手套获取三维数据信息的效果很好,因此手语识别与合成课题组决定主要以数据手套的方式采集数据。“我们使用了2只数据手套和3个六自由度位置跟踪器,基于运动跟踪的原理,记录真实人体演示每个手语词的运动数据,以建立初始的手语词运动数据库。然后,再对每个手语词的运动数据进行编辑与微调,最后得到高质量的手语词运动数据库。”陈益强告诉记者。据了解,在10多位聋校老师和很多聋校学生的帮助下,手语识别与合成课题组已建立了中国最大的手语词汇库,共有5500个词,并采用手语词根建模的识别方式来解决大词汇量的识别问题。这已经走在了国际前列。与实用的距离“目前手语识别与合成技术与实用还有一定距离。”陈益强毫不讳言。据介绍,建立非特定人的识别模式是手语识别技术走向实用的关键。然而,非特定人手语识别因为需要训练库包含更多人的手语样本,其数据多且差异大的特点导致模型训练难以集中。此外,从不同人的数据中提取有效的共同特征也较为困难。为此,手语识别与合成课题组采用了“自组织特征映射/隐马尔可夫模型”(SOFM/HMM)相结合的模型。实验结果表明,该模型比传统的HMM模型识别率提高近5%,较好地解决了非特定人识别问题。此外,残疾人之间互相交流时,不仅看手的动作,还要通过表情和唇动等方式传递丰富的辅助信息。手语识别与合成课题组由此提出利用大量真实多模式行为数据进行学习训练,获取单模式行为的韵律模型以及多模式行为之间的协同关联模型,从而实现虚拟人多模式行为之间的协同。陈益强透露,在聋校的测试实验表明,经过多模式行为协同而合成的连续手语,其可懂度达到94.6%,比没有多模式协同的手语可懂度提高近6%。即便如此,让陈益强遗憾的是,手语识别与合成技术目前仍在理解自然手语方面存在一定困难。他希望未来能通过与从事机器翻译研究的人士合作越过这一障碍。据悉,除此之外,手语识别与合成课题组还确立了新的目标框架。他们一方面要将手语技术继
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版智能化蔬菜配送与菜场承包合同
- 2025版补偿贸易与新材料研发合作协议
- 2025版大棚租赁与设施农业技术培训合同
- 二零二五年度:信息安全保密补充协议数据安全守护者
- 2025版国标柴油新能源技术研发与创新应用购销合同
- 二零二五版混凝土砌块建筑工程项目采购合同模板
- 二零二五年度班组工程承包劳务合同样本
- 内蒙古自治区人大常委会办公厅所属事业单位招聘考试真题2024
- 2024年烟草山东公司笔试试题
- 二零二五版隧道工程建设项目施工合同范本
- GB/T 12241-2021安全阀一般要求
- 杭州市残疾儿童市级定点康复机构申请表
- GB 16663-1996醇基液体燃料
- CB/T 3623-1994舵系统安装与效用试验要求
- 伤寒论的讲义辨太阳病脉证并治课件
- 国家级农产品质量安全检测技能竞赛考试总题库(含答案)
- 湖北省乡镇卫生院街道社区卫生服务中心地址医疗机构名单
- 事业单位工作人员岗位等级确认审核表
- 立破并举 内外互联 构建西藏全要素资源交易市场
- (完整版)UPS技术培训教材PPT(共-54张)课件
- 骨盆的解剖PPT课件(PPT 18页)
评论
0/150
提交评论