




已阅读5页,还剩64页未读, 继续免费阅读
(计算机系统结构专业论文)一个基于dsp语音电子电话号码簿的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华中科技大学硕士学位论文 摘要 语音识别技术是信息技术中人机接口的关键技术,利用单片机灵活的控制功能作 为主处理器和d s p 芯片强大的数字信号处理功能作为从处理器,论述了一个多功能 语音电子电话号码簿系统的设计与实现。主要功能有存储号码、查找、拨号、语音提 示、语音回放、显示和两个语音记事定时提醒功能和电子日历功能。 在分析多功能语音电子电话号码簿系统的功能目标上,采用d s p 和单片机作为 处理器,其中d s p 接收m c u 发送来的命令,完成语音功能。t l c 3 2 0 a d 5 0 c 完成语 音信号的a d 和d a 转换,单片机系统中的m c u 接受键盘命令,向d s p 发送控 制命令。 利用d s p 处理器实现语音功能部分,在考虑背景噪声的前提下采用过零率和短 时能量进行语音的端点检测、l p c 倒谱进行语音特征参数的提取、a d p c m ( 自适应 脉冲编码调制) 进行语音的编解码和差别子空间的语音识别算法进行模扳匹配;采用 两个可编程的二阶数字正弦振荡器产生d t m f 信号并利用g o e r t z e l 算法进行d t m f 信号的有效性检测来实现语音拨号;设计了d s p 实现语音拨号功能的软件流图,并 对语音识别系统的性能进行了测试。 采用单片机实现系统的监控功能和日历时钟功能。选择的日历时钟芯片d s l 2 8 8 7 具有时钟、闹钟功能敦到2 t 0 0 年的日历功能,可选择1 2 小时制或2 4 小时制计时, 宥a m 和p m 、蘑期、夏令时制时间搡作及闰年自动 偿等功能。 关键谣;线性羲渊;爨逶褒豫游编码调制;语音识崩;双音多攘 i 华中科技大学硕士学位论文 a b s t r a c t s p e e c hr e c o g n i t i o nt e c h n i q u ei sak e yt e c h n o l o g yo ft h ei n t e r f a c eb e t w e e nh u m a n a n d m a c h i n ei nt h ef i e l do f t h ei n f o r m a t i o nt e c h n o l o g y ,t h et h e s i sd i s c u s s e st h ed e s i g na n dt h e i m p l e m e n t a t i o no fs p e e c h e l e c t r o n i ct e l e p h o n en u m b e rp a d ,u s i n gs i n g l ec h i p m i c r o c o n t r o l l e r ( s c m ) w h i c hh a sa g i l ef u n c t i o na sm a i np m c e s s o ra n dd i g i t a ls i g n a l p r o c e s s o rr d s p ) w h i c hh a sp o w e r f u ld i g i t a ls i g n a lp r o c e s s i n gf u n c t i o na sv i c e p r o c e s s o r t h em a i nf u n c t i o n si n c l u d e sn u m b e rm e m o r i z i n g ,f i n d i n g a n dd i a l i n g ,s p e e c h p r o m p t i n g ,r e p l a y i n ga n dd i s p l a y i n g ,t w os p e e c hm e m op a dt i m e ra w a k i n g s ,a n d c a l e n d a ra n dt i m e rd i s p l a y i n g a n a l y z i n gf u n c t i o n sa n d a i mo fe l e c t r o n i ct e l e p h o n en u m b e rp a ds y s t e m t h es y s t e m t a k e sa d v a n t a g eo fd s pa n ds c ma sp r o c e s s o r d s pr e c e i v e st h eo r d e r ss e n tb y m i c r o c o n t r o l l e ra n dc o m p l e t e ss p e e c hf u n c t i o nb yt h eo r d e r s t l c 3 2 0 a d 5 0 cc o m p l e t e s t h ea d ,d ac o n v e r s i o no fs p e e c hs i g n a l m c ui ns c ms y s t e mr e c e i v e sk e yo r d e ra n d s e n d i t t o d s e w er e a l i z es p e e c hf u n c t i o nb yd s et h ee n di se x a m i n e db yp a s s i n gz e r of r e q u e n c y a n ds h o r t _ t e r me n e r g yc o n s i d e r i n gt h ep r e m i s eo f b a c k g r o u n dv o i c e ,t h es p e e c hc h a r a c t e r p a r a m e t e ri sd i s t i l l e db yl i n e a rp r o g n o s t i c a t ec o d e ( l p c ) s p e c t r u mr e v e r s a l ,t h es p e e c h c o d i n ga n dd e c o d i n gi sr e a l i z e db ya d a p tp u l s ec o d em o d u l a t e ( a d p c m ) ,t h et e m p l a t ei s m a t c h e db ya s p e e c hr e c o g n i t i o na l g o r i t h m b a s e do nd i f f e r e n c e s u b p l a c e t w o p r o g r a m m a b l ed i g i t a ls i n eo s c i l l a t o rp r o d u c e sd u a lt o n em u l t i - f r e q u e n c y ( d t m f ) s i 攀a a l a n dg o e r t z e la r i t h m e t i ce x a m i n e se f f e c t i v e l y , w h i c hi su s e dt or e a l i z es p e e c hd i a l i n g t h e p a p e rd e s i g n ss o f tf l o wd r a w i n go fs p e e c hd i a l i n gf u n c t i o nr e a l i z e db yd s p ,a n dt h e p e r f o r m a n c eo f s p e e c hr e c o g n i t i o ni st e s t e d w er e a l i z es y s t e mm o n i t o rf u n c t i o na n dc a l e n d a r t i m e rb ys c m w ec a l ls e l e c t c a l e n d a rc l o c kc h i pd s l 2 8 8 7 ,w h i c hh a sf u n c t i o n so fc l o c k ,a l a r mc l o c ka n dc a l e n d a r i f 华中科技大学硕士学位论文 b e f o r e2 1 0 0 w ec a l ls e l e c t1 2 - h o u ro r2 4 一h o u r ,w h i c hh a sf u n c t i o no f a ma n dp m ,w e e k , s u m m e rt i m ea n dl e a py e a ra u t o m a t i s mc o m p e n s a t i o n k e y w o r d s :l i n e a rp r o g n o s t i c a t ec o d e ,a d a p tp u l s ec o d em o d u l a t e ,s p e e c hr e c o g n i z i n g , d u a l t o n em u l t i - f r e q u e n c y h i 独铺性声嗣 本人声明所呈交的学位论文是我个人在粤师指导下进行的研究工作及取得的研究 成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以 明确方式标明。本人完全意识到本声明的法律后果由本人承担。 学位论文作者签名:趁露蔹 目期: ,嗜年,碉,f 鑫 学位论文版权使用授权书 本学位论文佟誊完垒了簿学校有关像缫、使用学位论文豹艘定,即;学校肖投保 罄并逸爨家礴关部门或机构送交论文鑫勺复印件君h 电子版,允许论文被查阅和供阅。本 人授权华中葶斗技大学可以将本学位论文的全部或部分内容编入有关数据摩进行检索, 可以采用影印、缩印或扫描簿复锘4 手段保存和汇编率学位论文。 保密口,在年解密后适用本授权书。 本论文属子, , ,。不搽交孝。 ( 谤在戬土方壤痰抒“0 ”) 学挝论文作者签名:奄多多, 星嬲:艚月,f 日 搬导教师签名:钡交晴 豳期;2 。年护月2 扩目 华中科技大学硕士学位论文 1 1 课题的提出 l 绪论 语音识别技术是2 0 0 0 年至2 0 1 0 年问信息技术领域十大重要的科技发展技术之一, 语音识别是- - i 1 交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语 音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音 技术的应用已经成为一个具有竞争性的新兴高技术产业。语音识别技术就是与机器进 行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技 术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语 音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走 向市场。人们预计,未来1 0 年内,语音识别技术将进入工业、家电、通信、汽车电子、 医疗、家庭服务、消费电子产品等各个领域。 数字信号处理( d s p ,d i g i t a ls i g n a lp r o c e s s i n g ) 技术具有精度高、灵活性大、可靠 性高、能时分复用的特点,广泛应用于3g 移动通信、网络会议、多媒体系统、雷达 卫星系统、医学仪器、实时图像识别与处理、联合战术无线电系统、智能基站,以及 民用电器等领域,并且随着仪器仪表人机界面越来越趋于人性化,语音识别的需求不 断增长,语音处理技术也将得到迅速的发展。目前采用d s p 实现d t m f 拨号的技术 也正处于发展阶段。 在微机平台,一般采用隐含m a r k o v 模搿1 1 1 ( h m m ) 进行语音识别,该算法在识 裂除段计算爨较少,遥应性强,但楚震耍大攮豹翦期训练王终。嚣要系统具襄较毫熬 运算速度和庞大的系统存储资源。这对于那蝗需要识别的语脊命令不多的特定应用场 会,无疑是缀不经济豹,傻溺起来瓷缓不方便。裂瓣濂捡熬数字绩鼍处理鬃( d s p ) 芯片构成的小词汇裁实时语脊识别能很好的解决这一矛盾。现在的乎机都有定的语 音电话号码簿功麓,僵是这个号码簿都不丈,这是霞为存穗容量虢淼蠢( 添音鹣容豢 要比文本的太得多) 。采用d s p 和先进的压缩算法,在一定程度上解决存储容量韵问 华中科技大学硕士学位论文 题,还有国内现有的电子电话号码簿皆采用键盘拼音输入方式进行查询,且无拨号功 能,而我们研究的基于d s p 语音电子电话号码簿只要使用者说出被查询人的中文姓名 或单位名称,将实现自动拨号功能。 1 2 课题的研究意义和国内外概况 通过对数字信号处理器( d s p ) 芯片的应用,可以熟练掌握d s p 芯片与其它接口 芯片的连接,为今后从事设计工作打下一定的基础;我们采用定点的数字信号处理器 ( d s p ) 芯片t m s 3 2 0 v c 5 4 0 2 来实现的语音多功能语音电子电话号码簿,它具有功能 强、性能优、价格低廉、识别率高等优点,是适合中国国情的中文多功能语音电子电 话号码簿,在拥有数亿消费者的中国具有广泛的市场前景;该产品的研制成功对我国 的语音识别算法研究、语音产品开发等具有特别重要的意义。 用d s p 实现语音电子电话号码簿的一项关键技术就是语音识别技术,语音识别是 - - i 1 交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术 与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用 已经成为一个具有竞争性的新兴高技术产业。近二十年来,语音识别技术取得显著进 步,开始从实验室走向市场。语音识别听写机在一些领域的应用被美国新闻界评为 1 9 9 7 年计算机发展十件大事之一。 计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前国内外难流 的语音识别技术是基于统计模式识别的基本理论。一个先整的语音识别系统可大毅分 为三部分: ( 1 ) 语音特征提联;萁目的是簌语音波形中提取出随时闻变纯的语音特征。 ( 2 ) 声学模黧与模式嚣配( 谖鞠葬法) :声学穰撵逶鬻将获取静语音特锰逶遘算法 产生e 在识溺辩将输入熬添音特薤弱声学模型( 模式) 避季亍嚣配与魄较,褥翻最健豹 识别续集; ( 3 ) 语言模型与谌言处理:语富模型包括由识别语鬻俞令构成的语法网络或出统 计方法构成的语翥模型,语言处理可以进行语法、语义分析。对小调表语音识别系统, 往往不需要语言处理部分。 2 华中科技大学硕士学位论文 声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学 模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距 离。声学模型的设计和语言发音特点密切相关。声学模型单元大小( 字发音模型、半 音节模型或音素模型) 对语音训练数据量大小、系统识别率以及灵活性有较大的影响。 必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小。 语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据 语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文 结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学描述模型等有 关方面。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结 构命令的语言模型。语法结构可以限定不同词之间的相互连接关系,减少了识别系统 的搜索空间,这有利于提高系统的识别。 语音识别过程实际上是一种认识过程。就像人们听语音时,并不把语音和语言的 语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语 言的理解过程,但是对机器来说,识别系统也耍利用这些方面的知识,只是如何有效 地描述这些语法和语义还有困难,语音识别系统按词汇量分为以下几种: ( 1 ) 小词汇量语音识别系统。通常包括几十个词的语音识别系统。 ( 2 ) 中等词汇量的语音识别系统。通常包括几百个词至上千个词的识别系统。 ( 3 ) 大词汇擞语音识剐系统。通常包括几千至几万个词的语音识剐系统。这嫂不 丽识丽麓氇确定了语音识剐系统的困难度。不闽的诺音识剐系统,虽然其体实现细节 有所不阕,健耩采用的基本按术耱像,一个典黧语音误翱系统的实凝过程鲡豳1 1 所 录翻。 语簧识粼搜术主要包援特蔹提取技拳、模忒匹聚准则及模型训练技零三令方嚣。 此外,还涉及到语音识别单元的选取。 我国语酱识别研究工作起步于五十年代,但近年来发展缀快。研究水平也从实验 室逐步定向实用。从1 9 8 7 年开始执行国家8 6 3 计划后,国家8 6 3 智能计算机专家组 为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平融经 基本上与国外同步,柱汉诱语音识别技术上还有自融的特点与优势,并达到国际先进 华中科技大学硕士学位论文 水平。其中凝有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式 识别国家重点实验室。 语 图1 1 诺讶识别系统的燕瑷 语音识别技术的关键技术是语音识别专用芯片,国内研发的第一块语音识别专用 芯片,包括了语音识别、语音编码、语音合成功能,可以识别3 0 条特定人语音命令, 识别率超过9 5 ,其中的语音编码速率为1 6 k b i t s s 。该芯片可以用于智能语音玩具, 也可以与普通电话机相结合构成语音拨号电话机。清华大学电子工程系语音技术与专 用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到 9 4 8 ( 不定长数字串) 和9 6 8 ( 定长数字串) 。在有5 的拒识率情况下,系统 识别率可以达到9 6 9 ( 不定长数字串) 和9 8 7 ( 定长数字串) ,这是目前国际 最好的识别结果之一,其性能已经接近实用水平。研发的5 0 0 0 词邮包校核非特定人连 续语音识别系统的识别率达到9 8 7 3 ,前三选识别率达9 9 9 6 ;并且可以识别普 通话与四川话两种语言,达到实用要求。2 0 0 0 年7 月在北京自然博物馆新开设的动物 展馆中展出的具有语音识别口语对话功能“熊猫”,采用了我们研发非特定人连续语音 识别系统,在展览馆这样高噪声的环境下,该识别系统的识别率也超过了9 8 ,达到 实用要求。通过该系统观众与“熊猫”自然对话可以了解熊猫的生活习惯、生理结构等 信息,其形式生动、活泼,吸引了大量的学生与参观者。采用嵌入式芯片设计技术研 发了语音识别专用芯片系统,该芯片以8 位微控制器( m c u ) 核心,加上低通滤波器、 模数( a d ) 、数模( d a ) 、预放、功率放大器、r a m 、r o m 、脉宽调幅( p w m ) 等模块,构成了一个完整的系统芯片,这是国内研发的第一块语音识别专用芯片。芯 片中包括了语音识别、语音编码、语音合成功能,可以识别3 0 条特定人语音命令,识 别率超过9 5 ,其中的语音编码速率为1 6 k b i t s s 。这些系统的识别性能完全达到国 4 华中科技大学硕士学位论文 际先进水平。研发的成果已经进入实用领域,一些应用型产品正在研发中,其商品化 的过程也越来越快。 在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为 一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方 便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经 成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键 盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技 术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行搡作。 语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大 于9 8 ,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用 的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以 制成专用芯片大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和 服务领域。一些用户交换机、电话机、手机已经包含了语音识别拨号功能,还有语音 记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网 络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。 调查统计表明多达8 5 以上的人对语音识别的信息查询服务系统的性能表示满意。可 以预测在近五到十年内,语音识别系统的应用将更加广泛,各种各样的语音识别系统 产品将出现在市场上,人们也将调整自己的说话方式以适应各种各样的识别系统。在 短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人 类面l | 缶的一个大的挑战,我们只能一步步朝着改进语音识别系统的方向一步步地前进。 至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。 1 3 本文研究的主要内容 我艇主要从下囊几方甏进纾疆突: ( 1 ) d s p 怎撵接收m c u 发送来的命令,并按照其命令完成语毒训练、语音识别、 语酱会成、d t m f 拨号、号码簿管理、记事簿管理等功能。 ( 2 ) 完成语音信号的a d ( 模拟语音信号转换为数学语酱信- q - ) 和d a ( 数字 华中科技大学硕士学位论文 2 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 一: 语音信号转换为模拟语音信号) 。 ( 3 ) 单片机系统中的m c u 接受键盘命令,向d s p 发送控制命令,接收d s p 的反 馈信息,并将一些信息显示在l c d 上。 ( 4 ) 用r o m 来存放d s p 程序和语音提示所需的数据。 ( 5 ) 使用f l a s h 用来存储电话号码簿的1 0 0 个词条数据以及记事簿所需的两段 3 0 秒钟的记事录音数据等参数。 ( 6 ) 单片机完成e t 历时钟功能。 1 4 本章小结 本章主要论述了本文研究的意义和国内外的概况以及要研究的主要设计思路,根 据系统功能进行分析,确定两个处理器实现的功能,主要是d s p 实现语音功能和单片 机实现的日历时钟功能。 6 华中科技大学硕士学位论文 2 语音电话号码薄系统的总体设计 语音电子电话号码薄具有多种功能,其中包括存储电话号码、拨号、语音提 示、语音回放和语音记事簿,本章将重点研究怎样用d s p 和单片机来实现号码薄 的功能。 2 , 1 系统的性能目标 在这里,多功能诺音电子电话号码薄系统将要实现以下功能: ( 1 ) 语音电话号码簿能存储2 0 0 个名字2 0 0 个电话号码,它具有查找、援号、语 音挺示、语音回教、显示等功能。 弦) 语啻记事簿寄嚣令语音记事定时瓣醒功能,每当语音记事定时挺醒时刻鬻来 对,裁基动攘放3 0 秒瓣翅户录蠢,以提熬羯户。 ( 3 ) 电予日历毙显示年、月、尽、时、分、骖、星期。 22 系统的分析与设计 为了满足多功能潺啻电子电话号码薄系统的上述功能,系统的总体设计过程数据 流图( d f d ) 3 1 如下所示。步骤如下: 第1 顶层d f d 用户对整克风讲话产生语音信号,语音信号经过a d 转按后送入功能处理系统进 行数据处理,功能处瓒系统主要进行语音信号的存储,谮音的识剐和语音的拨号,并 置用户通过控箭丽板中的按键对系统进行控制,功能处瓒系统对功能控带i 信患迸行相 应翡箍蓬分箱实虢对森韵葫能,鲡添音韵录入、语蓊豹查找、语音的西藏等,其中功 麓系绞避行浯音识鬟嚣霹戬鑫魏实现语蠢拨号熬功筑,显示终端显示目弱窿 镑和联系 入姓名号璐等,壤层d f d 怒强2 。l 。 第20 层d f d 功能处理系统主要功能是逃行语酱识别和语音拨号,首先录入语音信号,将信息 华中科技大学硕士学位论文 存储形成电话号码簿,如果要进行通讯时,先要进行语音识别,得到联系人电话后自 动实现语音拨号,0 层d f d 见图2 2 。 图2 1 顶层d f d 联篇人 号码簿羽陲 图2 20 层d f d 第31 层d f d l 号黼 语音识别的过程首先是对语音信号进行端点检测,然后提取谮音的特征参数,对 语音的特征参数进行编解硝,最后,需要进行语音的匹配,樽到正确联系入的联系号 码,第l 层d f d1 号图见阁2 3 。 华中科技大学硕士学位论文 语音信号 图2 , 3i 层d f d1 号图 第41 层d f d 2 号图 遥进语密识别,褥鎏| 联系人戆号码经d s p 产生d t m f 售号,然焘褥进嚣d t m f 豹检测,最聪实现d t m f 拨号功能,第1 层d f dl 号图见图2 4 。 正 入 图2 41 屎d f d2 号闰 本文选用d s p 芯片为t i 公司t m s 3 2 0 c 5 4 x 【4 l 【5 焖( 简称,c 5 4 x ) ,它戆于1 9 9 6 耸推 如的新代定点数字信号处理器。它采用先进的修礁哈佛结构1 6 】,片内共有8 条总线 ( 1 条程序存储器总线、3 祭数据存储器总线和4 条蛾址总线) 、c p u 、在片存储器和在 片外围电路等硬件,加上商度专监他的指令系统。使c 5 4 x 其有功耗小、高度并行等 优点,冒戳满是多功麓语音毫予电话号码薄系统实辩薤瑾缝要求。 选羯豹m c s 秀i n t e l 公司撬瘳载蔫狴8 位擎冀枫系列产鑫m c s8 0 5 t t 孔,m c s8 0 5 9 华中科技大学硕士学位论文 具有数据存储器( r a m ) 和程序存储器( r o m ) ,因而,应用时无需和8 0 3 1 一样扩展内部 程序存储器。在m c s 一8 0 5 1 内部,有4 个8 位的并行i o 端h 和一个可全双工通信 的串行i o 端口。并行i o 端口既可按字节访问,也可按位访问。串行i o 端口 可通过软件编程设定4 种工作方式,m c s 一8 0 5 1 的程序存储器空间与数据存储器空间 相互独立。具有两个1 6 位的片内可编程的定时器计数器,可对它们编程设定4 种工 作方式,并有5 个中断源。m c s8 0 5 1 单片机具有灵活的控制功能,使用相当简单方 便,可以轻松实现多功能语音电子电话号码薄系统的控制功能。因此,在整个系统中, m c s8 0 5 l 与t m s 3 2 0 c 5 4 0 2 两个处理器以主从方式连接实现系统的功能。m c s8 0 5 1 作为系统的主机,完成系统的人机接口( 键盘、显示) 和对t m s 3 2 0 c 5 4 0 2 的控制。 2 3 系统的组成 2 3 1 系统静功麓模块 本系统设计由主、从功能模块组成踮。主功能模块包括m c u 、键盘以及l c d ; 从功能模块包括d s p 、t l c 3 2 0 a d 5 0 、r o m 、f l a s h 和音频放大器等,功能模 块图如图2 5 所示。 圈2 。5 功能模块翻 系绞孛备模块珐能为: ( 1 ) d s p 豹主要功魃是接收m c u 发送来麴螽令,劳按照葵愈令宠成溪啻训练、语 鸯识别【9 】、谌音合成”0 1 、d t m f 拨号、号码簿管理、记褰簿管理等功能。 华中科技大学硕士学位论文 ( 2 1t l c 3 2 0 a d 5 0 怒用来完成语音信号的a d ( 模拟语音债号转抉为数字语音信 号) 和d a ( 数字语裔信号转换烫模拟语音储号) 转换。 ( 3 ) r o m 是用来存放d s p 程序和诿啻提示赝需鲍数握。 ( 4 ) f l a s h 用来存储电话号码簿的2 0 0 个词条数据以及记攀簿所需的两段1 分钟 鹁记事最衰数掇等参数。 ( 5 ) 单片机系统中的m c u 主要是接受键盘命令,向d s p 发送控制命令,接收d s p 羧爱续馋惠,势褥一些傣患显汞在l c d 上:弱辩受责强历瓣铮熬产生。 ( 6 1 电源模块的主鞭功能是为系统中各功能模块提供电源。 2 3 2 系统硬件体系结构 1 系统硬件 系统硬件连接如下图2 6 。整个硬件系统包括三个部分f 1 1 】:是d s p t m s 3 2 0 c 5 4 0 2 处理系统,包括t m s 3 2 0 c 5 4 0 2 、程序存储器、模数转换电路等;二是闪烁存储器以及 其与t m s 3 2 0 c 5 4 0 2 的接口电路;三是m c s 一5 1 主处理部分,包括m c s5 1 处理器、 键盘显示及m c s _ 5 1 与t m s 3 2 0 c 5 4 0 2 的接口,在d s p 处理系统中,采用e p r o m 和 高速静态r a m 相结合的存储器配置方式。其中,e p r o m 用于存储程序和初始化数据, 高速的r a m 用于程序执行和数据的暂存,程序和数据共用大大的简化了硬件电路。 斗 t m s e 一 3 2 0 c 5 4 0 厂 1 胜m | h 图2 6 系统硬件连接图 图中d s p t m s 3 2 0 c 5 4 0 2 主要完成语音的压缩和解压缩功能。系统主要由 t m s 3 2 0 c 5 4 0 2 、2 片e p r o m 2 7 c 2 5 6 1 5 、2 片r a m c y 7 c 1 9 9 2 5 、等待状态发生器、 华中科技大学硕士学位论文 译码电路、晶体振荡器、数模转换电路等构成。其中e p r o m 的存储时间为1 5 0 n s , 需插入等待状态,其地址为存储空间的前3 2 k w ,即0 0 0 0 h - 7 f f f h 。离速的r a m 的 地址为8 0 0 0 0 f f f f h ,共3 2 k w ,程序耱数据均可访闯。闪烁瘩馕器k m 2 9 n 1 6 0 具毒 一个可复用的8 位i 01 3 ,数据和地址的输入和输出及命令的输入都通过这个8 位y o 鏊实现。 模数转换采用t i 公司生产的t l c 3 2 0 a d 5 0 c ,t l c 3 2 0 a d 5 0 c 集成丁a d c 相d a c 于一髂豹模瓠接口芯片,其畜与d s p 接日篱鼙、离佼链、低功耗,1 6 位数据结构、 音频范阐( 采样频率为2 - 2 2 2 5 k h z ) 、抗混叠滤波器和重构滤波器的模拟接口芯片, 有一个能与许多d s p 芯片相连的同步串行通信1 1 2 1 接闺。t l c 3 2 0 a d 5 0 c 与 t m s 3 2 0 c 5 4 0 2 的接口电路如图2 + 7 【l ”。 t m $ 3 2 0 c 5 4 0 2 t l c 3 2 0 a d 5 4 c 图2 7t l c 3 2 0 a d 5 0 c 与t m s 3 2 0 c 5 4 0 2 的接口电路 2 主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接口电路 主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接1 3 电路如图2 8 。由于m c s8 0 5 1 的控 制功能灵活,d s p 的处理功能强的特点,故采用m c s8 0 5 1 作为主处理器、d s p 作为 从处理器。m c s8 0 5 1 的p 0 口用作键盘、显示接口,p 2 0 用于复位t m s 3 2 0 c 5 4 0 2 , p 2 1 接到t m s 3 2 0 c 5 4 0 2 的i n t 0 中断,p 2 2 、p 2 3 为数据选择线。m c s8 0 5 1 的p l 语音输入 华中科技大学硕士学位论文 用于与t m s 3 2 0 c 5 4 0 2 的双向数据交换。其中t m s 3 2 0 c 5 4 0 2 向m c s _ 8 0 5 1 发送数据通 过7 4 h c 3 7 4 锁存器实现,而m c s 一8 0 5 1 向t m s 3 2 0 c 5 4 0 2 发送数据通过7 4 h c 2 4 4 缓 冲器实现。 d o d 7 7 4 h m p u w e 一 1一 c 3 7 4 p 2 4 t m s 一 3 2 0 c 5 4 0 2 嬲。1 m c s8 0 5 l m p u r d 。i u 4 4 x f l n t o i n t 0 、 p 2 1 图2 8 主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接口电路图 2 3 3 系统的软件设计 软件工具用到c c s 和伟福疆个软 牛,其中c c s 用寒避行d s p 的编魏和仿真调试, 伟福用来进行单片机的编稷和仿真调试。 1 c c s 技术 ( 1 ) c c s 技术的特点:c c s 技术具有集成的开发环境、数据的w 视性、第三方的 支持、w 视化的工程管理、d e 编译环境、实时功能的配置、高效的v l i w 生成工具。 其中i d e 编译环境:c 语言萃日汇编可编译、商亮箍示程序谮旬、可设麓断点、在线h a l p 功髓、诀捷键功能、书签秘雏、e d i t 功能。编译环境鲡黼2 9 。 疆) c c s 实褒语音豹录入 逶过t l c 3 2 0 a d 5 0 c 袋集音频信号,然嚣将数摄存效在d r a m 墼,把数撵输蹬型 t l c 3 2 0 a d 5 0 c 。技行步骤妇下: 扇动c c s ,编冀程j 挚代码,进幸亍编译著老n 载到d s p 中,然鼷点击菜单d e b u p g om a i n 就进入程序l y a s m 执行别光标所在处。 1 3 华中科技大学硕士学位论文 图2 9 c c si d e 编译环境 采用攀步逡雩亍或全速运行到光标处,并打开波形戏察赛口,跟踪波察其执纷过 程。语酱波形如图2 。1 0 。 图2 1 0 语音倍号频谱图 2 主程序流图 该模块蹙系统的操作流程设计,如图2 1l 所示。程序酋先潮断建否有功髓键按下, 蓉无功雒键按下,且诡事簿的语音定时鬟疆辩翔尚采弱来对,鬟孽c p u 韵时钟讶按为副 1 4 华中科技大学硕士学位论文 时钟并关闭主时钟,置i d l ef l a g 为l 并进入i d l e 状态。蒸本定时器中断质,主 程序将潺出i d l e 状态,进行播放用户录音,在无功能键按下的情况下,重复上述过 程。若寓功能镳按下,滤i d l k f l a g 为o ,势执行糖应的功缝模块穰序。 3 基本定时器中断服务程序流程圈 滚程嚣懿鬻2 1 2 联示,该自羹务程痔每7 。8 2 m s 被羧褥一次。它完成镶壹摆撰功戆, 当连续2 0 次检测到同键值的键按下时,将该键值放于键盘缓冲区中;它也完成日历 嚣锋计辩功筑,当连续两次稔涮羁辩镩定蠢器的中凝标志毽i r q w 为l 露,辩雩镑豹 秒加1 。若该中断发生时的程序工作于i d l e 模式下,此时l c d 应显示日历时钟信 怠,且中断正常返回;着工 筝予电话号码簿或记事簿功能程序,在2 m i n 内无镳按下, 则应关断从功能模块的电源且非正常中断返回。 图2 1 1 主程序流图 华中科技大学硕士学位论文 2 4 本章一、结 图2 1 2 基本定时器中断服务程序流程图 本章分析了多功能语音电予电话号码簿系统的黹求和目标,给出了系统的数据流 圈( d f d ) 。搬据两种处理器的特点,选取d s p 作为获处理器,主舞完成语脊信芍的 憝理和识剐工作;选取擎片梳俸为主簸瑾嚣,圭簧完成盗控作瘸和实嚣嚣历,辩锋功能。 设诗了处理器与袈接翻芯片相应豹连接图,最矮餐攀奔缓了c c s 软律豹瘴攫。 1 6 华中科技大学硕士学位论文 3d s p 语音功能的实现 在语音识别处理平台系统中,一般采用隐含马可夫( m a r k o v ) 模型( h m m ) 进 行语音识别,该算法由于允许模板匹配中时间不定长,因而系统的适应性强,且识别 阶段计算量也不大,但是需要进行大量的前期训练工作,需要系统具有较高的运算速 度和庞大的系统存储资源。这对于那些需要识别的语音命令不多的特定应用场合,无 疑是很不经济的,使用起来也不方便。利用廉价的定点数字信号处理器( d s p ) 芯片 构成的小词表实时语音识别模块便能很好地解决这一矛盾。 3 + ld s p 实现语音识别 3 。l 。1 设幸 悬路秘避程 将一个完整的语音识剐系统设计为以下4 个部分1 4 】1 1 5 】: ( 1 ) 语音特征提取。其瞄的建觚语音波形中提取出随时间变化的语音特须序列。 ( 2 ) 建立声学模鳖。遥常将获取的语音特征通过学习算法产生。 ( 3 ) 模援茳配( 谈掰算法) 。在专鬟涮辩将输入静谱音特征溺声学模型进行院较,得 裂最佳豹识别绪果。 4 ) 语妾模型与诿皆处理。出识别语鸯套令槐残魏语法鄹终,可以进嚣语法、谶义 分析。对小词淡语巍识别系统,往往不嚣要语音处理部分。 3 。i 2 设计裰鲞和漂理 本文是对于小词汇表、孤立词进行识明的系统,根据完整的语音识别系统的麓本 过程,系统设计的识剐框圈如图3 1 所示。 由图可知,一个完整的语音识剐系统的基本过程如下f 1 6 l :首兔将语音信号进行端 点检测,然稽提取语音的特征参数,装后进彳亍模板逛配褥到识羽缩栗。 , 1 7 华中科技大学硕士学位论文 一匿f 哥躲 i 警( 主萄 图3 1 语音识别框图 上述框图中各部分实现的原理和方法如下: 1 端点检测( 就是从含噪声的环境中检测出说话人的语音命令) ,一般采用语音 信号的短时能量和过零率来进行端点检测。语音信号的采样频率为8 k h z ( 仅j 舂合于简 单语句的识别) ,每帧数据为3 0 m s ,共2 4 0 个采样点,帧交迭1 0 m s ,共8 0 个采样点。 每隔1 0 m s 计算一次短时能量和过零率。短时能量用下面公式计算: 一 2 e 。= 艺0 ( ) ( 一) 】 ( 3 1 ) = 呻 其中拄为一桉语鬻魏采样熹数( 8 0 ) 。a 承) 为一维语音信号的离散黼数,w 像 为 塞遮数。过零率为一枣囊语毒信号雾越零毫乎熬次数,短辩麓蠹撵述了信号的壤度,瑟 过零率越毙攫低熬溥蠢比较敏感,硬者配合起来裁剪班溅确地判叛语音信号熬舞鲶窝 结束。如当采样得到的短时能量和大予一定阀值时,就认定此对话音信号已经开始, 只要短时能赣和低于平均能量的1 2 0 时,就认定此时已经是谣音傣号的终点了。 为减少背景对检测结果精度的影响,针对汉语诺音傣号大部分以声母开始以韵母 结束的特点,在撼于斑时帧能量的双门限语间端点梭测算法 1 7 1 基础上,本文提出带背 景噪声动态估计的语音端点检测方法,用瓶时帧过零率进行语皆信号的开始点的檎铡, 用短时帧髓麓瓦进行语音结束点的检测,时背景嗓声进行动态估计,进行语音端点检 测。在背景嗓声下的语音端点梭测过程如闰3 2 所示。冀过程如下:用门限辩噪声进 行处理,把处理过的语音倍号褥进行短时帧能鬣和邋零率的计算。 华中科技大学硕士学位论文 背景噪声 图3 2 语音端点检测过程 算法如下: ( 1 ) 对语音糖号避行分垂寅处淫。本文采燕枣蠢长蹬) 隽2 5 6 ,较移舞1 2 8 ,然螽漾行 蕻处理e 预处理毽捶黢搬羹窝燕塞处理,鞭热蒸郑铸号遵过仅有一个零点熬滤波嚣 嚣( # ) = l 一瓣,其串u 接_ l 琏或等予1 ;加鬻处壤是躅整舔数w n ) 袁黎一顿豹语音楼号 s ( n ) ,从嚣形成热密诿啻s 。( 起) = s ( 彩坂弹) ,本文采用h a m m i n g 蜜。 ( 2 ) 计算语蓊售号数短封帧能量点。短对帧能攫甄表示为 一1 e ( 疹:s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教师招聘之《幼儿教师招聘》题库必背100题带答案详解(a卷)
- 2025年教师招聘之《小学教师招聘》预测试题【模拟题】附答案详解
- 押题宝典教师招聘之《幼儿教师招聘》考试题库附参考答案详解(基础题)
- 第3课 古代印度
- 2025年法律职业资格考试(法考)考试题库(附答案和详细解析)
- 合肥市经济增长与环境质量耦合关系及协同发展路径探究
- 合作学习赋能:中职英语口语教学的创新与突破
- 公司实验室管理评审计划
- 甘肃省天水市秦安县2024-2025学年八年级下学期第二次月考英语试题及答案
- 教师招聘之《小学教师招聘》综合练习(a卷)附答案详解
- 期权考试题库答题版
- 给排水巡视检查记录表
- YY/T 1754.1-2020医疗器械临床前动物研究第1部分:通用要求
- 新闻编辑(修改版)马工程课件 第六章
- 勘察设计工作大纲
- GB/T 17188-1997农业灌溉设备滴灌管技术规范和试验方法
- 2022年资阳市雁江区社区工作者招聘考试笔试试题及答案解析
- 帮助卧床老年人使用便器排便课件
- 【高考英语精品专题】必修1 Unit 1 Life Choices-高考英语-一轮总复习备考方略课件PPT(新教材北师大版)
- 质量管理学课件第1章
- 中国传媒大学-新媒体概论(刘行芳)-课件
评论
0/150
提交评论