版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《Python人工智能技术与应用》能力模块六掌握基于深度学习的语音处理技术应用任务一调研分析语音识别技术TaskImport任务导入某市举办智能座舱语音识别挑战赛,比赛对设计的智能座舱系统有三个要求,分别是便捷、互动、安全。报名参加比赛需要先提交企业的整体设计方案以及阐明背后所运用的技术。你作为参赛企业的语音识别实习生,主要的岗位指责是协助公司的语音识别团队完成开发任务,现需要你调研分析你们方案所运用的语音识别技术和整体方案设计。素养目标引导问题的过程中,培养学生形成勤于思考的能力获得分析解决问题以及多元化思考解决问题的方法,形成创新意识。TaskObject任务目标知识目标了解语音识别技术的定义与主要应用技术。了解语音识别技术原理。了解语音识别实现的技术基础。了解语音识别技术的常见应用。技能目标掌握语音识别技术的流程。掌握语音识别技术的实现的相关Pvthon工具。能够列举至少3个语音识别技术在汽车上的应用,锻炼条理思考的职业意识新
授语音识别技术流程与Python实现04CONTENTS目录语音识别技术的定义与主要应用技术01语音识别技术原理02语音识别技术的常见应用0301语音识别技术的定义与主要应用技术(一)语音识别的定义定义目的语音识别技术也称自动语音识别技术(AutomaticSpeechRecognition,ASR),是指机器通过识别和理解过程将语音信号转化为文本或指令的技术。语音识别的目标是让机器能够像人一样准确理解语音信号所承载的信息,从而实现人机交互。语音识别技术示例01语音识别技术的定义与主要应用技术(二)语音识别领域的主要实现功能
将话语转化为文字语音识别功能语音识别功能可以从语音中自动提取语音特征,并将其转换为文本。01语音识别技术的定义与主要应用技术(二)语音识别领域的主要实现功能
将文字转化为语音语音合成功能语音合成功能可以将文本转换为可以被听到的语音。01语音识别技术的定义与主要应用技术(二)语音识别领域的主要实现功能搜索引擎中的语音识别语音唤醒功能语音唤醒功能能够通过特定的关键词唤醒设备的技术,它可以让设备更快地响应用户的请求。例如苹果公司的“siri”语音助理即可进行唤醒设置。01语音识别技术的定义与主要应用技术(二)语音识别领域的主要实现功能搜索引擎中的语音识别语音识别引擎功能语音识别引擎功能能够更加准确地识别用户语音,它可以更好地理解用户的语音,从而提供更好的服务。01语音识别技术的定义与主要应用技术(二)语音识别领域的主要实现功能语音控制电视网页语音控制功能语音控制功能能够通过语音控制设备。它可以让用户通过语音来控制设备,从而更加便捷地使用设备。语音识别技术原理02语音识别的首要要素是语音。通过麦克风,语音便从物理声音被转换为电信号,然后通过模数转换器转换为数据。语音一旦被数字化,就可适用若干种模型,模型再将音频转录为文本。(一)语音识别的流程原理语音物理声音被转换为电信号数字信号文本语音识别技术原理02(二)语音识别实现的技术基础隐马尔可夫模型(HMM)神经网络语音识别技术原理02(二)语音识别实现的技术基础语音识别使用隐马尔可夫模型来识别语音,从而确定说话者正在说什么。它可以从口头语言中提取有意义的信息,从而帮助机器理解人类语言。隐马尔可夫过程(HiddenMarkovProcess,HMM)是一种概率模型,用来描述一个系统受到外部环境影响时,随时间变化的状态。它可以用来模拟一个系统的状态从一个状态到另一个状态的过程,并且可以根据系统的历史状态来预测未来的状态。隐马尔可夫棋型(HMM)语音识别技术原理02(二)语音识别实现的技术基础隐马尔科夫的工作原理为:语音信号在非常短的时间尺度上(比如1毫秒)可被近似为静止过程,即一个其统计特性不随时间变化的过程。假设你有一只猫,它可以处于两种状态:睡觉和游玩。根据这只猫的历史状态,你可以用隐马尔科夫过程来预测它未来的状态。例如,如果它过去一直都在睡觉,那么你可以预测它未来也会继续睡觉。隐马尔可夫棋型(HMM)02神经网络的作用是通过特征变换和降维的技术来简化语音信号。神经网络在语音识别中的应用主要包括语音特征提取、语音识别和语音合成。语音特征提取:是指从原始语音信号中提取出有用的特征,这些特征可以用于语音识别。神经网络可以用来提取语音特征,例如,用多层感知机(MLP)来提取语音特征。语音识别:神经网络可以用来进行语音识别,例如,用循环神经网络(RNN)来识别语音。语音合成:神经网络可以用来进行语音合成,例如,用生成式对抗网络(GAN)来合成语音。语音识别技术原理(二)语音识别实现的技术基础神经网络02语音识别技术原理(二)语音识别实现的技术基础神经网络语音特征提取语音识别语音合成03语音识别技术的常见应用(一)语音指令控制在汽车上的应用在车内,语音控制人员只需要用嘴说出命令控制字,就可以实现对车载系统的控制,这种控制手段方便快捷。可用于汽车导航、控制车载设备,如车灯,音响,天窗,座椅,雨刮器等。车内语音控制03语音识别技术的常见应用(二)语音指令控制在其他行业中的应用AI语音技术使智能家电更好用,它能将“AI语音+大数据+深度学习”结合起来,让家电产品能听能说能看,让用户可以与机器进行自然交互,更具有人性化。智能家居
智能家居中的语音识别03语音识别技术的常见应用(二)语音指令控制在其他行业中的应用AI语音技术在智能医疗方面可以提高医疗服务质量,语音对话机器人可以解决医疗市场的长期低效率问题,降低成本、减少医护人员时间负担,并为患者带来不一样的体验提升。AI语音随访可以完成400-1000人次的随访工作,极大地提高了随访的工作量。智能医疗04语音识别技术流程与Python实现(一)语音识别的流程1.语音数据预处理2.特征提取3.神经网络模型的建立4.语音识别04语音识别技术流程与Python实现(一)语音识别的流程预滤波采样模/数转换预加重分帧加窗端点检测语音数据预处理04语音识别技术流程与Python实现(一)语音识别的流程特征提取语音识别系统常用的声学特征有梅尔频率倒谱系数(MFCC)、感知线性预测系数(PLP)、线性预测倒谱系数(LPCC)、梅尔滤波器组系数(Fbank)。MFCC语音识别过程04在这之前已经获得了需要识别的新数据的MFCC特征和已经训练好的神经网络模型,首先加载训练好的神经网络模型,再将新数据的MFCC特征输入加载好的模型中,进而输出新数据的语音识别结果。语音识别技术流程与Python实现(一)语音识别的流程神经网络模型的建立语音识别使用Python开发的神经网络第三方库Keras建立神经网络模型并对已经得到的MFCC特征向量进行神经网络训练,得到一个训练好的神经网络模型。04语音识别技术流程与Python实现(二)Python语音识别常用第三方工具watson-developer-cloud:IBMWatson是机器学习和认知计算最著名的使用平台之一。并提供了一套完整的API(常用功能,测试以及实验),允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建应用程序。google-cloud-speech:由谷歌公司研发的云语音API。SpeechRecognition:由谷歌公司研发的专注于语音向文本的转换的第三方工具。常用工具列举04语音识别技术流程与Python实现(二)Python语音识别常用第三方工具Assemblyai:自动将音频和视频文件以及实时音频流转换为文本的平台。Pocketsphinx:第一个开源面向嵌入式的中等词汇量连续语音识别项目Wit:由脸书推出的用于将自然语言转化为可处理指令的API平台,其目的是帮助开发者便捷的打造类Siri语音对话应用或设备。常用工具列举04语音识别技术流程与Python实现(二)Python语音识别常用第三方工具满足几种主流语音API,灵活性高。GoogleWebSpeechAPI支持硬编码到SpeechRecognition库中的默认API密钥,无需注册就可使用SpeechRecognition无需构建访问麦克风和从头开始处理音频文件的脚本,只需几分钟即可自动完成音频输入、检索并运行。因此易用性很高。SpeechRecognition库的优势04语音识别技术流程与Python实现(二)Python语音识别常用第三方工具SpeechRecognition的识别器语音识别器解释说明recognize_bing()微软必应语音引擎recognize_google()谷歌网络语音引擎
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 未来五年酒店餐厅企业数字化转型与智慧升级战略分析研究报告
- 未来五年狐养殖企业县域市场拓展与下沉战略分析研究报告
- 未来五年橙企业数字化转型与智慧升级战略分析研究报告
- 未来五年作物收获机械企业县域市场拓展与下沉战略分析研究报告
- 未来五年尼龙6切片企业ESG实践与创新战略分析研究报告
- 未来五年文件、证明公证服务企业数字化转型与智慧升级战略分析研究报告
- 未来五年动物保健品企业数字化转型与智慧升级战略分析研究报告
- 竹山公务员员考试试题及答案
- 重庆公务员考试面试真题试题及答案
- 中央公务员招考考试试题及答案
- A课堂惩罚游戏
- 《合同能源管理介绍》课件
- 整理收纳师行业分析
- GB/T 228.1-2021金属材料拉伸试验第1部分:室温试验方法
- 氢能与燃料电池-课件-第五章-制氢技术
- 科研伦理与学术规范-课后作业答案
- 2023QC小组活动基础知识培训
- 生理学期末考试复习试题库及答案
- 旅游地理学 国家公园建设与管理
- JJF(石化)036-2020漆膜附着力测定仪(划圈法)校准规范
- 机械原理课程设计报告(粉末成型压机设计)
评论
0/150
提交评论