版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八讲 语音处理应用(二) 四、语音录放 语音录制流程 用SPCE061A录制语音 用SPCE061A播放录音 创建一个录放音程序 用汇编语言编写录放音程序 小结和注意事项 疑难解答 语音采样 在定时中断的控制下,以一 定的速率(8KHz)进行AD转 换 压缩编码 将采集到的数据以某种算法 压缩编码 存储 将编码后的数据保存到存储 介质中 新建工程 复制录放音需要的支持文件到工程所 在的文件夹 Sacmv26e.lib Hardware.inc Hardware.asm Flash.asm SRam.asm 添加支持文件到工程中 添加程序文件和头文件 添加语音函数库 编写录音程序 新建程序文件
2、 编写代码 编写放音程序 在main.c中编写放音函数 编写中断服务程序 新建汇编语言程序文件 编写中断服务程序代码 编写main()函数 下载运行 Hardware.asm中定义了用户接口函 数,可对语音录放程序做灵活的定制 F_SP_SACM_DVR_Init_ F_SP_InitQueue_DVR F_SP_ReadQueue_DVR F_SP_TestQueue_DVR F_SP_RampUpDAC1 Sacmv26e.lib语音函数库还有供汇编语言 直接调用的函数,它们与C函数一一对应 (前面加上“F_”前缀): F_SACM_DVR_Initial F_SACM_DVR_InitE
3、ncoder F_SACM_DVR_InitDecoder F_SACM_DVR_FetchQueue F_SACM_DVR_FillQueue F_SACM_DVR_Eecoder F_SACM_DVR_Decoder 汇编语音播放函数使用R1、R2 寄存器来传递参数和返回值。 例如,C语言的SACM_DVR_Initial(0); 语句可改写为: r1 = 0 call F_SACM_DVR_Initial C语言的SACM_DVR_FetchQueue() 函数可改写为: call F_SACM_DVR_FetchQueue 函数的返回值保存在R1寄存器中。 语音录放需要的支持文件: S
4、acmv26e.lib, Hardware.asm, Hardware.inc, Flash.asm, SRam.asm 语音录制需要调用Flash读写函数,在 Flash.asm中定义。如果使用外挂的 Flash、EEPROM等存储器,则需要编 写相应的读写程序替换上述函数。 语音的录制和播放调用同一个中断服务 函数F_FIQ_Service_SACM_DVR 相应地,在播放录音的开始和结束时 可使用渐入渐出函数防止爆音: SP_RampUpDAC1(); SP_RampUpDAC2(); SP_RampDnDAC1(); SP_RampDnDAC2(); 实际上,语音录制时采用的压缩编码
5、是A2000格式,因此,录制的语音资 源可以采用A2000播放程序播放。 播放程序并没有用到SRam.asm文件 中的内容,为什么还要把它包含到工 程中? 事实上,语音录放也可以选择自动录放 和手动录放两种模式。而自动录音时要 用到SP_InitWriteSRAM等几个用户接 口函数,这些函数在SRam.asm文件中 定义。因此,虽然手动录放时并没有用 到这些函数,但必须定义这些函数才可 以编译成功。 五、语音识别 语音识别概述 语音识别原理 特定人语音识别函数库 特定人语音识别程序流程 特定人语音识别程序示例 其他特定人识别函数 小结和注意事项 疑难解答 根据对说话人的依赖程度,分为: 特定
6、人语音识别(SD) 只能辨认特定使用者的语音,训练-使用 非特定人语音识别(SI) 可辨认任何人的语音,无须训练 根据对说话方式的要求,分为: 孤立词识别 每次只能识别单个词汇 连续语音识别 用者以正常语速说话,即可识别其中的语句 包含特定人语音训练、识别,语音特 征模型的导入、导出函数等。 连续语音识别 可支持每组7条语音命令的识别 在外接凌阳SPR系列Flash存储器的 条件下,可支持10个命令组,每组16 条语音命令 新建工程 复制语音识别、语音播放需要的支持 文件到工程所在文件夹。 语音识别函数库bsrv222SDL.lib 语音识别头文件bsrSD.inc,bsrSD.h 语音播放支
7、持文件Sacmv26e.lib, Hardware.asm,Hardware.inc 用PC录制下列提示语音(也可自定义提示 语音),注意保存文件名不要包含中文。 “请输入第一条命令” “请输入第二条命令” “请再说一遍” “没有听到任何声音” “两次输入不相同” “环境噪声太大” “训练成功,开始识别” “识别成功,第一条命令” “识别成功,第二条命令” 利用凌阳语音压缩工具“Compress Tool”将录好的语音压缩成S480格式。 把压缩后的语音资源文件复制到工程所 在文件夹下。 将上述文件添加到工程中 Project - Add to Project - Files bsrSD.in
8、c,bsrSD.h, Hardware.asm,Hardware.inc Project - Add to Project - Resource 9个S480格式语音资源文件 Project - Setting - Link bsrv222SDL.lib Sacmv26e.lib 在工程中新建C程序文件,编写语音 播放函数PlaySnd()。 编写“训练”函数TrainWord()。 编写主函数main() 编写中断服务程序 添加语音资源索引表 在Resource.asm的结尾添加 T_SACM_S480_SpeechTable 编译连接,下载运行 按F7键或“Build”按钮,编译连接。 确
9、认选择了“USE ICE”。 按F5键或“Execute Program”按钮, 下载并运行。 程序测试 听到提示“请输入第一条命令”后,说 出一句语音命令。 如果输入成功,会提示“请再说一遍”, 重复刚才的语音命令。 如果由于某种原因导致输入失败,会提 示“没有听到任何声音”、“环境噪声 太大”,如果两次训练的语音差别过大, 会提示“两次输入不相同”。 第一条命令训练成功后,用同样的办法 训练第二条语音命令。 程序测试 两条命令都训练完成后,就可以开始识 别了 如果识别出第一条语音命令,则提示 “识别成功,第一条命令” 如果识别出第一条语音命令,则提示 “识别成功,第二条命令” 除了前面示例
10、中的基本应用外,函数库还 提供了很多函数用来对识别过程进行灵活 的控制。下面介绍几个比较常用的函数: BSR_PauseRecognizer() 暂停识别,但不释放中断等资源 BSR_ResumeRecognizer() 恢复被暂停的识别 BSR_GetRecognizerScore() 获得识别结果的可信度,返回值从-4096到4096, 数值越大表示输入语音与特征模型的匹配度越高。 其他特定人识别函数 BSR_EnableCPUIndicator() 开启CPU状态监测功能。开启该功能后,IOA0和 IOA1将发出每16ms电平变化一次的方波。 BSR_DisableCPUIndicato
11、r() 关闭CPU状态监测功能。 BSR_ExportSDWord(int CommandID) 函数库为工程创建了一个100 Word的数组 BSR_SDModel100,可以把某条训练命令的特征 模型数据导出到这个数组中。 BSR_ImportSDWord(int CommandID) 可以把BSR_SDModel数组中的数据导入为某条语音 命的特征模型。 特定人语音识别由“训练”和“识别”两个 步骤组成。 训练过程中,每条语音命令的长度不要超过 1.3秒。 训练后得到的语音特征模型是保存在RAM中 的,每条命令占用96 Word,由于RAM空间 的限制,同时可识别的语音命令数量最大为7
12、条。如果需要识别更多语音命令,可以采用 命令分组的方法。 语音特征模型数据可以通过下面两个函数导 入和导出:BSR_ImportSDWord(), BSR_ExportSDWord() BSR_DeleteSDGroup(0),从函数名 看来,好像是删除一个组的意思。它 是怎么完成初始化RAM的? 语音命令的特征模型是通过BSR_Train 函数保存在RAM空间中的。如果所需的 RAM空间已被旧的特征模型数据占满, 则新特征模型无法保存到RAM中。利用 BSR_DeleteSDGroup函数可以把RAM 空间中所有的特征模型删除,释放出所 需空间。 六、语音压缩工具六、语音压缩工具Compre
13、ss Tool介绍介绍 音频压缩简介 凌阳音频压缩简介 录制WAV文件方法简介 凌阳语音压缩工具使用介绍 资源加载到工程中的方法简介 音频压缩的目的 通过对资料的压缩,达到高效率存储和转换资料的结果, 即在保证一定声音质量的条件下,以最小的资料率来表 达和传送声音信息。 音频压缩编码方式 波形编码 参数编码 混合编码 音频压缩技术趋势 降低资料率,提高压缩比,用于廉价、低保真场合 追求高保真度,复杂的压缩技术 凌阳音频压缩算法压缩率 SACM_A2000:8:1,8:1.25,8:1.5 SACM_ S480:80:3,80:4.5 凌阳音频压缩算法编码方式 SACM_A2000:波形编码 S
14、ACM_ S240 :参数编码 SACM_ S480 :混合编码 凌阳音频压缩算法数据率 SACM_A2000:16Kbps/20Kbps/24Kbps SACM_ S480 :4.8Kbps/7.2Kbps 凌阳音频压缩算法非常多,这里提到的只是其 中的两三种,因为凌阳语音压缩工具Compress Tool只支持A2000和S480两种方式,故这里重点 介绍的是上面两种。 打开PC机自带的录音机 在开始菜单中 打开录音机 录音 机 设置wav文件的属性 必须要设置wav文件属性为“8K 16位 单声道”。 文件菜单 中选择属 性 设置wav文件的属性 必须要设置wav文件属性为8K 16位
15、单声道。 在弹出的属性对话框中选择“立 即 转换”按钮 选择立即 转换按钮 此时弹出“声音选择”对话框,在其 中“属性”文本框中将录音文件设置 为“8K 16位 单声道” 选择8K 16 位 单声道 此时属性已经设置完成,可以开始录 音 点击录音机的录音按钮进行录音 录音之后点击停止录音按钮 保存已经录制好的wav文件 录音按钮 停止按钮 保存该 wav文件 凌阳公司提供了windows环境下的 语音压缩工具 利用此语音压缩工具可以将刚刚 录制好的wav文件压缩成A2000或 S480的形式 安装语音压缩工具Compress Tool 打开语音压缩工具 在开始程序Compress Tool将其
16、 打开 打开语音 压缩工具 在语音压缩工具界面上可以看到“压 缩单个文件”和“压缩多个文件”两 个按钮,我们先来介绍压缩单个文件 的方法。 压缩单个 文件按钮 压缩多个 文件按钮 选择“压缩单个文件按钮”,在“选 择要压缩的wav文件”文本框中添加 需要进行压缩的wav文件路径 然后点击“下一步” 选择需要压 缩wav文件 路径 然后选择压缩算法 再选择压缩数据率 选择压缩后文件的存储路 径 选择“压缩”按钮 选择压 缩算法选择A2000 压缩方式 选择S480压 缩方式选择需 要的数 据率 选择压缩后 文件存储路 径 开始压 缩 A2000数据率 有 16K/20K/24Kb ps三种 显示
17、“OK”后表示单个文件已经压缩 成功! 压缩完毕 压缩多个文件的方法也差不多 启动语音压缩工具 选择“压缩多个文件”按钮 选择“路径选择”按钮选择需要压缩 的多个文件 选择“下一步” 路径选 择按钮 选择需要 压缩的文 件 选择“语音压缩方法”和 “数据率” 再选择压缩后文件的存储 路径 选择“压缩”按钮 压缩算法 选择 选择压缩后 文件存储路 径选择需 要的数 据率 S480数据率 有 4.8K/7.2Kbps 两种 当全部的文件都显示“OK”后,表示 已经全部压缩完毕 正在压 缩 压缩成 功 到此为止,利用语音压缩工具压缩 wav文件的方法已经介绍完毕 在使用中,需要将压缩好的文件加载 到工程中 具体加载的方法在前面章节的介绍中 已经有提到,这里简单回顾下 在工程中,将已经压缩好的文件加载 到资源中 添加资源文 件 已经加载进 来的资源文 件 同时还要注意添加语音资源索引表 如果在编译的过程中出现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河北沧州市海量新能源发展有限公司招聘19人笔试历年难易错考点试卷带答案解析
- 2025江西省中赣投勘察设计有限公司招聘6人笔试历年常考点试题专练附带答案详解
- 2025四川绵阳科技城新区投资控股(集团)有限公司(含所属公司)人力资源需求外部招聘暨市场化选聘顺位背景调查2笔试历年备考题库附带答案详解
- 2025中国核工业二三建设有限公司招聘笔试历年难易错考点试卷带答案解析
- 《抗击八国联军》历史教学课件
- 2025年心肺复苏知识培训-绿色-现代卡通插画风格
- 2026年智能制造的投资回报分析工业互联网的影响
- 2026年厂内自动化控制系统调试实例分析
- 2026年智能决策系统在过程装备中的应用
- 2026年传感器数据在控制系统仿真中的作用
- 2026山东青岛日报报业集团(青岛日报社)招聘4人备考题库附答案详解(完整版)
- 2026年及未来5年市场数据中国翻译机构行业市场需求预测及投资规划建议报告
- 建筑工地 宿舍管理制度
- 2026年南阳工艺美术职业学院单招职业倾向性测试题库附答案详解(黄金题型)
- 深度解析(2026)《LYT 3409-2024 草种质资源调查编目技术规程》
- 护理规范修订制度
- 《2025茶艺》课件-泡茶用水的种类
- 无仓储危化品安全培训课件
- 产品销售运营协议书范本
- 平面优化设计讲解课件
- DRG支付下医院运营质量提升策略
评论
0/150
提交评论