




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,复杂声学环境下的语音交互:技术与实践,语音交互的意义,前端处理技术和方案,复杂的声学环境,落地案例,结语,语音交互是物联网的特质,互联网的端是电脑 办公效率为中心,移动互联网的端是手机 使用便捷为中心,物联网的端是万物 沟通自然为中心,语音交互是人类交流最自然的方式,也将是物联网时代最基本的特质!,从互联网、移动互联网到物联网的演进,均伴随着硬件终端的革 新 每一次硬件终端的革新也都伴随着人机交互方式的颠覆,语音交互的意义,前端处理技术和方案,复杂的声学环境,实际案例,结语,家 远讲、方向性干扰、房间混响较高,车,扩散场噪声强、混响小,机场、展会 房间混响高、扩散场噪声强,场景碎片化,语音交互的意义,前端处理技术和方案,复杂的声学环境,结语,落地案例,什么是前端处理,“自然”意味着对语音交互的场合、使用模式等无约束!,痛点问题,远讲交互,目标声源距离拾音设备较 远,更易受到声学回声、干扰声源、 背景噪声、房间混响等各种不利因素 的影响,听不清。,听清世界的声音,人类需要听清语音通信,更低的处理延时 更高的主观听感和可懂度,机器需要听清语音识别 更高的信噪比 更好的声学模型适配,前端处理的意义: 面对回声、干扰、噪声和混响等各种 不利因素的挑战; 综合运用信号处理、机器学习手段以 及融合语义层面的信息,提高目标语 音的信噪比,增强后续处理的声环境 稳健性。,一言以蔽之,前端处理是为了让获取的语音更加清晰自然,“听清世界的声音”!,技术路线(1),传统信号处理 (最小化均方误差),传统端侧信号处理,前端处理,回波抵消 解混响,宽带空域滤波,背景噪声抑制 自动增益控制,规则,子问题分而治之:针对不同的声学影响采用不同的信号处理算法加以解决 优化目标:抑制非目标相关成分 优化准则:最小化均方误差,客观物理模型 音频时频空域特性,2,麦克风阵列的几个典型疑问,1,是不是一定需要麦克风阵列?,3,阵列拓扑结构该如何选取?,麦克风数量是不是越多越好?,技术路线(2),信号处理与机器学习相结合 (最小化均方误差) 传统信号处理 (最小化均方误差),基于深度学习的端侧信号处理,回波抵消,前端处理,解混响,宽带空域滤波,背景噪声抑制 自动增益控制,客观物理模型与数据驱动模型相结合 既遵从了声源和声传播的物理规律,又利用了先验数据统计建模带来的稳健性和性能提升 优化准则未变,依然是最小化均方误差,规则 + 学习,客观物理模型 音频时频空域特性 + 海量音频先验信息,深度学习+前端处理系统,技术路线(3),(最小化均方误差),信号处理与机器学习相结合 (最小化均方误差) 传统信号处理,前后端联合优化 (识别准确率),深度学习框架下的前后端联合优化,前端和后端都以语音识别准确率为优化目标:识别误差从后端声学模型反向传播回前端,用于指导前端的优化 途径1:端到端,前后端融合成一个统一的模型,输入为原始语音,输出为识别结果 途径2:将后端声学模型的梯度反向传播到前端,用于指导前端的神经网络训练,识别误差 反向传播,软核方案,在主机中实现软件算法处理和语音交互功能,业界领先的语音前端信号处理、唤醒和离线识别等算法 SDK封装,用于Linux、Android和Windows等操作系统 可定制配套麦克风阵列拾音模组(支持I2S/USB接口),二元线阵,四元线阵,六元可变阵,七元环阵,硬核方案,内嵌不用的语音处理SDK,实现前端语音处理或全功能的语音交互功能,尤其适用于非 语音设备的快速升级改造,支持低功耗使用模式。,语音交互的意义,前端处理技术和方案,复杂的声学环境,落地案例,结语,物灵:luka阅读养成机器,人(京东热卖),极米科技:Lightank W100,数字家圆:亲见H2,360:巴迪龙儿童陪伴机 器人,360: 小忆陪伴机器人,TCL:TCL/Alcatel Xess 平板电视(北美上市),海信电视: XT910/920/PX1900,海信电视:XT810,海信电视: MU9600/9800 语音遥控,团队过往产品案例,海尔5代电视机,上海地铁语音购票,新闻采访机,你好 斑马,你好 斑马,主驾驶位,驾驶位,方向2 收音,方向1 收音,方向1 唤醒,方向2 唤醒,麦克风 阵列,业界首创,车载语音交互,技术平台,以最小识别 错误率为准 则的前后端,联合优化算 法,硬件方案,端云一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外科创伤手术规范化诊疗
- 内镜中心麻醉流程管理标准化体系
- 部编版语文五年级下册《梅花魂》课件
- 2025夏季电商零售行业内需崛起挖掘新消费的情绪曲线
- 2025年氢燃料电池汽车关键零部件国产化市场竞争力分析报告
- 2025年农村电商物流“最后一公里”配送挑战及创新模式分析报告
- 线下演出市场复苏后的演出市场竞争格局研究报告
- 2025年零售与电商行业移动支付安全风险防控报告
- 聚焦2025年:银发消费市场养老服务需求细分领域分析报告
- 废旧塑料回收利用技术革命:产业升级与可持续发展报告
- 厂内机动车辆(叉车)安全检查表参考模板范本
- 全套QHSE管理体系文件
- 炼钢-精炼-连铸过程钢水页PPT课件
- 【北师大版】七年级上册数学 第四章 图形的全等 单元检测(含答案)
- 《教育学原理》期末考试试卷试题A及答案
- 安全知识进校园宣传课件——XX小学
- 陈倍生妙派风水秘诀笔记
- 《扫除道》樊登读书文字版
- 钠冷快堆中的结构材料
- 教学演示文稿,建筑企业科技创新方法讲座()
- 中国传统节日文化中现代德育价值的研究课题结题报告
评论
0/150
提交评论