软件工程-需求分析文档_第1页
软件工程-需求分析文档_第2页
软件工程-需求分析文档_第3页
软件工程-需求分析文档_第4页
软件工程-需求分析文档_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、手机语音识别系统需求分析文档摘要 伴随着科技进步和全球信息交流的日益扩大,嵌入式设备产品的市场规模在迅猛发展。追求小体积多功能嵌入式设备的必然趋势,使语音合成、语音识别、手写输入技术在嵌入式中的应用成了最具吸引力的功能,因此今后嵌入式产品交互应用的竞争已演化成以此三项关键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。其根本目的就是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。从技术看,它属于多维模式识别和智能接口的范畴。语音识别技术是一项集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术,可广泛应用于

2、信息处理、通信与电子系统、自动控制等领域。2010目 录1.引言31.1编写目的31.2项目背景31.3参考资料42数据描述42.1数据词典43功能需求43.1功能划分43.2功能描述53.2.1模块名称:语音信号的预处理63.2.2模块名称:特征提取模块73.2.3参考模式库模块(词条模块)83.2.4 语音库识别(匹配计算模块)84性能需求94.1数据精确度94.2时间特性94.3适应性91.引言1.1编写目的伴随着科技进步和全球信息交流的日益扩大,嵌入式设备产品的市场规模在迅猛发展。追求小体积多功能嵌入式设备的必然趋势,使语音合成、语音识别、手写输入技术在嵌入式中的应用成了最具吸引力的功

3、能,因此今后嵌入式产品交互应用的竞争已演化成以此三项关键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。其根本目的就是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。从技术看,它属于多维模式识别和智能接口的范畴。语音识别技术是一项集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术,可广泛应用于信息处理、通信与电子系统、自动控制等领域。本文档为手机语音识别系统的设计、实现、测试以及验收提供重要依据,也为评价系统功能和性能提供标准。本文档可供用户、项目管理人员、系统分析人员、程序设计人员以及系统测试人员阅读和

4、参考。1.2项目背景嵌入式语音识别技术15J是指应用各种先进的微处理器在板级或芯片级用软件或硬件实现语音识别。语音识别系统的嵌入式实现,要求算法在保证识别效果的前提下尽可能优化,以适应嵌入式平台存储资源少,实时性要求高的特点。实验室中高性能的大词汇量连续语音识别系统代表当今语音识别技术的先进水平。但是由于嵌入式平台资源和速度方面的限制,嵌入式实现尚不成熟。而中小词汇量的命令词语音识别系统算法相对简单,对资源的需求较小,且系统识别率较高,能满足大多数应用的要求,成为嵌入式应用的主选。当前,语音识别技术得到了广泛应用。有些电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也

5、包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询机票、旅游、银行信息,并且取得很好的结果。但是可随身携带的嵌入式语音识别产品在人们的日常生活中尚不多见,该领域具有广阔的市场前景。在这种背景下,论文旨在根据现实生活需要,在对语音识别的嵌入式实现进行研究和了解的基础上,进行了基于模板匹配法的特定人、小词汇量语音识别系统研究,应!用于日常生活中,以方便人们的日常生活、提高人们的生活质量。从人机接口的角度看,就是使人们甩掉键盘,通过语音命令操作。项目委托单位:软件工程课程项目项目开发单位: 长春工业大学软件职业技术学院项目主管部门: 长春工业大学软件职业技术学院1.3参考资料

6、1. 软件工程文档模版2. Data Base System Concepts (4th edition) Abraham Silberschatz et al.3. Software Engineering: A Practitioners Approach (6th edition) Roger S. Pressman2数据描述主程序使能音频模块,从音频模块的缓冲区内读取语音数据到DDR SDRAM 存储器中。当音频模块缓冲区全部为空时,主程序对DDR 内的数据进行预处理、端点检测、线性预测倒谱系数(L PCC) 的提取。如果在训练阶段, 此时的L PCC 系数被当作模板存入到FLASH

7、中。如果在识别阶段,L PCC 系数则会被调入DDR 存储器中与测试模板进行模式匹配,并给出识别结果。模式匹配算法采用动态时间规整(DTW)算法 2 2.1数据词典数据从程序内部分离出来,形成独立的外部数据文件。静态数据文件与动态数据文件相互独立,依靠特定程序分别进行参照或存取。 静态数据由外部数据文件存放方式转为数据库存放方式,将以前程序中静态数据对动态数据加工的某些控制关系抽象为静态表与动态表间关系名字:语音信号信息描述:用户语音输入定义:语音信号=模拟信号+数字信号+语音帧+语音特片+语音特征名字:参考模式库描述:标准语音特征定义:参考模式库=语音特征+语音串内容名字:声学模型描述:标准

8、语音特征定义:声学模型=语音状态+语音矢量3功能需求3.1功能划分本软件具有如下主要模块:l 预处理模块l 特征提取模块l 训练模块l 参考模式库模块l 相似性度量即识别模块顶层(第0层)数据流图(DFD):用户手机语音短信识别系统手机短信编辑语音信号识别出的文字3.2功能描述详见第一层数据流图2.特征提取5.匹配计算语音库处理后的语音信号特征语音特征4.词条模型处理语音识别词条信息语音信息1.语音信号预处理语音信号3训练语音特征特征模式3.2.1模块名称:语音信号的预处理预处理模块,对输入的原始语音信号进行处理,滤除其中的不重要的信息及背景噪音等,进行语音信号的端点检测,即判定语音有效范围的

9、始点和终点位置,并进行语音分帧以及预加重等处理工作。 1.1语音的采样1.2 A/D变换1.3 分帧语音信号1.4特片提取1.5端点检测语音模拟信号语音数字信号语音帧语音特片处理后的语音信息3.2.2模块名称:特征提取模块特征提取模块,负责计算语音的声学参数,进行特征的计算,取出反映信号特征的关键特征参数,以降低维数,便于后续处理。语音识别系统常用的特征参数有幅度,能量,过零率,线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、共振峰频率、反映听觉特征的Mel频谱倒谱系数(MFCC)等。特征选择和提取是构建系统的关键。 2.1计算语音声学参数2.2特征计算处理

10、后的语音信号声学参数信号特征值模块名称:训练模块功能概述 在训练阶段,用户输入若干次训练语音,系统经过预处理和特征提取得到特征矢量参数(序列),然后通过特征建模模块建立训练语音的参考模式库。在识别阶段,将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别中间候选结果输出。后处理模块,是对上述得到的候选识别结果继续处理,通过更多的识别约束,得到最终结果。3.1预处理得到特征矢量参数3.2建立特征参数模型语音特征值特征模型特征矢量3.2.3参考模式库模块(词条模块)功能概述接受用户输入的语音信息,经提取的语音特征并同时从语音库中获取特征值,形成词条模

11、型,选取匹配提条,并输出。4.1词条模型形成语音特征语音库获取特征值4.2选取匹配词条词条信息词条信息3.2.4 语音库识别(匹配计算模块)功能概述在语音库识别阶段,将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别中间候选结果输出。匹配计算模块,是对上述得到的候选识别结果继续处理,通过更多的识别约束,得到最终结果。5.1比较相似性5.2筛选相似性高的输出提取的语音特征词库中特征相似值语音信息到手机4接口需求4.1用户接口需求用户需用麦克风输入数据。4.2硬件接口需求本识别系统是在与Infineon公司合作开发的芯片UniSpeech上实现的。UniSpeech芯片是为语音信号处理开发的专用芯片,采用0.18m工艺生产。它将双核(DSP MCU)、存储器、模拟处理单元(ADC与DAC)集成在一个芯片中,构成了一种语音处理SoC芯片。这种芯片的设计思想主要是为语音识别和语音压缩编码领域提供一个低成本、高可靠性的硬件平台4.3软件接口需求声学模型的建立,语音库的建立,手机输出平台4.3通信接口需求需要用麦克风进行输入,输出时候用手机短信编辑状态输出5性能需求5.1数据精确度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论