AI赋能语音交互解决方案.pptx_第1页
AI赋能语音交互解决方案.pptx_第2页
AI赋能语音交互解决方案.pptx_第3页
AI赋能语音交互解决方案.pptx_第4页
AI赋能语音交互解决方案.pptx_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Link Voice解决方案 AI赋能语音交互解决方案 1 云平台介 绍绍 2 端模块块介 绍绍 3 产产品介入研发发流 程 4 验验收认认 证证 Link Voice 云平台 智能语语音的行业现业现 状 Link Voice落地场场景 家 电 汽 车 车 载 家居 运 动 健康 按摩椅语音产品智能家居终控 蓝牙耳机、音箱跑步机解决方案 冰箱方案空调、风扇电饭煲 赋能车机 Link Voice落地场场景 按摩椅语音产品智能家居终控 冰箱方案电饭煲 赋能车机 家居家电 蓝牙耳机、音箱跑步机解决方案 运动健康汽车车载 信息交互创造无限可能智能控制吸引人音乐播放留住人 智能音箱的核心服务务 百度、虾米、豆 瓣 喜马拉雅、蜻 蜓 贝瓦儿歌 品类覆盖完 整 语音支付、生活缴 费 猫超购物 叫车、叫外卖 路况与导航 天 气 音乐闹 钟 提 醒 四则运 算 百 科 翻 译 2000万+ 可用曲库 音频资源、内容资 源 1000万+语音可控 设备集合 贴心的个人小助 手 集合阿里系 完整的生活服务 音 乐 智能家居工具生活服务 Link Voice覆盖核心场场景 智能语语音产产品的要 素 智能语音是多领域交叉融合型产品 硬件层操作系统声学信号处理算法云平台 Mic阵列设计Linux声源定位端点检测音乐内容 声腔结构AliOS回声消除语音唤醒有声读物 声效处理RTOS波束形成语音识别家居控制 密封Android自动增益调节语义 理解生活服务 减震iOS噪声消除语音合成语音支付 声纹识别海量并发支撑 服务能力提供商 ASR提供商 NLP提供商 TTS提供商 语音模组提供商 MIC阵列提供商 唤醒算法提供商 Link Voice B2B2C的语音服务 一站式智能语音解决方案 输出技术、服务、内容、生态系统 允许厂商自定义唤醒词、开发自有 App 唤醒说出语音指令收听语音播报成功唤醒 KWSBeamforming 麦克风阵 列 AEC 语音WIFI模组 Alink SDKLV SDK Link Voice Service Gateway 对话 管 理 音频内容引擎服务APIs对话 生 成 家居控制知识图 谱 用户画像语音支付深度学习声纹识 别 声学模型语言模型 NLP语义处 理 领域判断意图识 别 参数提取语义 算法 TTS 123 4 5 6 ASR语音识 别 7 8 9 10 TTS语音合成 11 Turnkey 语音解决方 案 设备厂 商 消费 者 Link Voice业务业务 形 态态 服务执 行 12 Link Voice平台概览览 服 务 微服务平台(Skills ) 交互交互解决方案(有屏+无屏) 交互 语 音 音乐&音频内容 及互联网服务 硬件 交互解决方案(有屏+无屏) 语音技术(ASR、TTS)自然语音处理技 术 Push TalkTab Talk Far Field Link Voice在语音识别 准确率、用户体验正确率均处行业领 先水 平 ASR识别 句正确率95% NLP理解正确率98% 热门 内容覆盖率95% 用户体验正确率91% 服务响应速度1.5s Link Voice核心技术术指 标标 如何做一个智能语语音硬件 音箱家居家电 Link Voice 模组 化 Link Voice硬件端模组组化输输 出 AliOS / RTOS / Linux / 安卓codec / Algorithm WiFiDSP SPI Link Voice设备设备 端模 块块 Link Voice VUI System Embedded Alink Agent Link Voice麦克风风及平台 Push+TabFar Field 成本 Cost Down Far Field 声源定位 Far Field 声源定位 Mic陈列 操作系统 主控平台 六麦四麦双麦单 麦 RTOSLinuxAndroid MIPSARM Linkplay DSP Module C02 DAC I2CUARTGPIO I2S Provided by Linkplay Link Voice方案举举例 Alibaba Linkplay Wi-Fi Module A31/A61/A76/AXX IR Remote Keypad Buttons LEDs MCU WebSocket Link Voice Embedded SDK OS(Linux/RTOS) MCU Controller mplayer Cache manager Flash manager (by LinkPlay) VAD Switch Local VAD Encode Opus Speex Device Context FSM Task Queue FIFO Business Manager ALink Voice data Commands Trigger Signal (JSON RPC) Button trigger System API Speaker Wifi/AP Encoded data Alink event ASR result with business data packaged (less device/cloud interaction) *FSM : Finite State Machine ALink Server LinkVoice Server Link Voice架构概览览 Date/Time Sync Upstream/Downstre am Register/Unregister ASR Service Router Service Link Voice对对接流 程 确认产 品形 态 以语音跑步机为例 1.品牌与LinkVoice沟通跑步机需要控制 的交互流程,产出文档。 2.品牌与LinkPlay及LinkVoice确认流程 及语音与跑步机控制指令的转换。 3.LinkVoice团队开发云端跑步机控制语 音Skill。 4.品牌端侧产品功能开发,上报本地状 态及响应云端指令。 5.如果有独立APP,基于 SDS SDK(Android/iOS),开发对应 的APP。 LinkPlay双麦远场方案 以语音跑步机为例,主要包 括。 1.按照产品的使用场景范围 定义,测试语 音指令识别率 。 2.测试跑步机产品功能定义 3.测试APP 设备设备 接入Link Voice流 程 选择现 有方 案 产品对接联 调 厂商自测LinkVoice认 证 新语语音模组组接入Link Voice 确定系统(Android/Linux/RTOS) 麦克风阵列选择及算法调试 唤醒算法集成调试 集成阿里云IoT SDS SDK,打通物联通道 SDS模组认证 集成Link Voice 语音SDK Link Voice 语音模块认证 流程(Link Voice提供标准,方案商完成,Link Voice验 收) 方案商完成模组声学评测 方案商完成模组语音识别效果评测 Link Voice 完成模组声学认证 Link Voice认证认证 流 程 提供自动化辅助测试工具和在线平台; 着重于稳定性、交互规范、准确率、最小化领域服务支持测试; 建立认证实验 室,量产前将设备寄给我们进行认证; 认证后才可量产上架售卖,确保质量和用户体验: Link Voice官方认证认证 要 点 商家自测提交测试报 告,Link Voice团队审 核及复 测 唤醒率 在不同的噪音环境、机身是否发声、距离的组合测试 基本功能测试 集 测试 功能覆盖是否完整 常用指令识别 率 测试 常用指令的ASR识别 率 误唤 醒率 在不同的噪声环境,测试 机器24小时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论