语音辨识.pdf_第1页
语音辨识.pdf_第2页
语音辨识.pdf_第3页
语音辨识.pdf_第4页
语音辨识.pdf_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北阳电子技术有限公司保留对此文件修改之权利且不另行通知。北阳电子技术有限公司所提供之资讯相信为正确且可靠 的,但并不保证本文件中绝无错误。请于向北阳电子技术有限公司提出订单前, 自行确定所使用之相关技术文件及规格为 最新之版本。若因贵公司使用本公司之文件或产品,而涉及第三人之专利或著作权等智慧财产权之应用及配合时,则应由 贵公司负责取得同意及授权,本公司仅单纯贩售产品,上述关于同意及授权,非属本公司应为保证之责任。又未经北阳电 子技术有限公司之正式书面许可,本公司之所有产品不得用于医疗器材,維持生命系統及飞航等相关设备。 语音辨识模块语音辨识模块 凌阳大学计划推广中心 北京市海淀区上地信息产业基地中黎科技园 1 号楼 6 层 C 段 邮编:100085 TEL : 86-10-62981668 FAX : 86-10-62985972 E-mail:unsp Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 目 录 目 录 1 编写目的 3 2 硬件设计及功能描述 3 2.1 硬件设计电路 3 2.2 硬件设计功能描述 3 3 软件设计及使用说明 3 3.1 主程序软件设计流程及说明 3 3.2 程序变量说明 5 3.3 程序使用说明 6 3.4 主程序流程图及说明 7 Sunplus University Program E-mail:unsp 第 2 页 Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 1 编写目的 1 编写目的 目的: 1、掌握凌阳语音特定人辨识技术。 2、可以应用于简单语音控制场合 2 硬件设计及功能描述 2 硬件设计及功能描述 2.1 硬件设计电路 2.1 硬件设计电路 IOB1 R121K D2 LED 12 5V D1 LED 12 LED R131K IOB0 此部分硬件用于显示语音控制的现象。1K 电阻用于限流作用。 2.2 硬件设计功能描述 2.2 硬件设计功能描述 3 软件设计及使用说明 3 软件设计及使用说明 3.1 主程序软件设计流程及说明 3.1 主程序软件设计流程及说明 语音识别函数: 1) 【API 格式】int BSR_DeleteSDGroup(0); 【功能说明】SRAM 初始化。 【参 数】该参数是辨识的一个标识符,0 代表选择 SRAM,并初始化。 【返 回 值】当 SRAM 擦除成功返回 0,否则,返回1。 2) 【API 格式】int BSR_Train (int CommandID, int TraindMode); Sunplus University Program E-mail:unsp 第 3 页 Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 【功能说明】训练函数。 【参 数】 CommandID:命令序号,范围从 0x100 到 0FFF,并且对于每组训练语句 都是唯一的。 TraindMode:训练次数,要求使用者在应用之前训练一或两遍: BSR_TRAIN_ONCE:要求训练一次。 BSR_TRAIN_TWICE 要求训练两次。 【返 回 值】训练成功,返回 0;没有声音返回1;训练需要更多的语音数据来 训练,返回2;当环境太吵时,返回3;当数据库满,返回4;当两次输入命 令不通,返回5;当序号超出范围,返回6。 【备 注】 在调用训练程序之前,确保识别器正确的初始化。 训练次数是 2 时,则两次一定会有差异,所以一定要保证两次训练结果接近 为了增强可靠性,最好训练两次,否则辨识的命令就会倾向于噪音 调用函数后,等待 2 秒开始训练,每条命令只有 1 .3 秒,也就是说,当训练命 令超出 1.3 秒时,只有前 1.3 秒命令有效。 辨识部分: 1) 【API 格式】void BSR_InitRecognizer(int AudioSource) 【功能说明】辨识器初始化。 【参 数】 定义语音输入来源。通过 MIC 语音输入还是 LINE_IN 电压模拟量输 入。 【返 回 值】无。 2) 【API 格式】int BSR_GetResult(); 【功能说明】辨识中获取数据。 【参 数】 无。 【返回值】R1 当无命令识别出来时,返回 0; 识别器停止未初始化或识别未激活返回1; 当识别不合格时返回2; 当识别出来时返回命令的序号。 【备 注】 该函数用于启动辨识,BSR_GetResult(); 3) 【API 格式】void BSR_StopRecognizer(void); 【功能说明】停止辨识。 Sunplus University Program E-mail:unsp 第 4 页 Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 【参 数】无。 【返 回 值】 无。 【备 注】该函数是用于停止识别,当调用此函数时,FIQ_TMA 中断将关闭。 中断部分: 【API 格式】 _BSR_InitRecognizer 【功能说明】 在中断中调用,并通过中断将语音信号送 DAC 通道播放。 【参 数】 无。 【返 回 值】 无。 【备 注】 该函数在中断 FIQ_TMA 中调用 当主程序调用 BSR_InitRecognizer 时, 辨识器便打开 8K 采样率的 FIQ_TMA 中 断并开始将采样的语音数据填入辨识器的数据队列中。 应用程序需要设置一下程序段在 FIQ_TMA 中: 3.2 程序变量说明 3.2 程序变量说明 全局变量: 1)gActivated 【功能】该变量用于检测是否有触发命令,当有识别出语句为触发名称则该位置 1 【应用】用户无法对该变量进行处理 2)gTriggerRespond 【功能】该变量为一三元素数组,用于保存触发命令语音序号。 【应用】用户在自定义触发命令时,可以修改该数组元素。 3)gComm2Respond 【功能】该变量为一三元素数组,用于保存命令语音序号。 【应用】用户在自定义触发命令时,可以修改该数组元素。 4)PlayFlag 【功能】该变量为 1 时,表示播放 A2000 格式语音,0,播放 S480 格式语音。 【应用】用户使用时,注意判断是使用 A2000 还是 S480。 局部变量: 1) res 【功能】该变量用于保存 int BSR_Train (int CommandID, int TraindMode) 返回值,返回 0,训练成功;返回1,没有声音;返回2,训练需要更多的语音数据 来训练, ;返回3,环境太吵;返回4,当数据库满;返回5,当两次输入命令不通; 返回6,当序号超出范围。 【应用】用户通过对该变量的判断了解辨识的结果 2)timeCnt 【功能】用于命令定时使用,在 1.5 秒内,识别成功,将其清零,否则语音提示, “没有听到任何声音” Sunplus University Program E-mail:unsp 第 5 页 Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 【应用】用户使用时,只要将此值进行清零即可。 3)random_no 【功能】在 gTriggerRespond3 与 gComm2Respond3中,选择两数组中的元素。 表示语音播放的序号。 【应用】用户使用时,通过设置此变量选择命令和识别的语音响应。 3.3 程序使用说明 3.3 程序使用说明 *训练* 提示音 输入语音 - “请输入触发名称“ “警卫“ “请输入第一条命令“ “红灯亮“ “请输入第二条命令“ “红灯灭“ “请输入第三条命令” “绿灯亮” “请输入第四条命令“ “绿灯灭“ “请再说一遍“(以上提示音每说完一遍出现此命令) “没有听到任何声音“ (当没有检测到声音时出现此命令) “两次输入名称不相同“(当两次输入的名称不同时出现此命令) “两次输入命令不相同“(当两次输入的命令有差异时出现此命令) “准备就绪,请开始辨识“(以上五条语句全部训练成功时,进入识别) *识别* 发布命令 应答 - “警卫“ “在“ “红灯亮“ IOB0 口灯被点亮 “红灯灭“ IOB0 口灯被熄灭 “绿灯亮” IOB1 口灯被点亮 “绿灯灭“ IOB1 口灯被熄灭 注意: 在每次提示音结束后 2-3 秒再输入命令或当上次应答结束 2-3 秒后 再发布命令 Sunplus University Program E-mail:unsp 第 6 页 Technology for Easy Living Technology for Easy Living 电子竞赛基础模块电子竞赛基础模块 3.4 主程序流程图及说明 3.4 主程序流程图及说明 定义存储器为 调用第一条提示音播放 训练第一条命令 开始识别 训练第二条命令 训练名称 成功否? 成功否? 启动实时监控 辨识器初始化 播放开始辨识提示音 获取语音

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论