（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-17 格式：PDF 页数：69 大小：1.83MB 积分：0 举报 版权申诉

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf_第2页

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf_第3页

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf_第4页

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf_第5页

已阅读5页，还剩64页未读，继续免费阅读

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

华中科技大学硕士学位论文摘要语音识别技术是信息技术中人机接口的关键技术，利用单片机灵活的控制功能作为主处理器和d s p 芯片强大的数字信号处理功能作为从处理器，论述了一个多功能语音电子电话号码簿系统的设计与实现。主要功能有存储号码、查找、拨号、语音提示、语音回放、显示和两个语音记事定时提醒功能和电子日历功能。在分析多功能语音电子电话号码簿系统的功能目标上，采用d s p 和单片机作为处理器，其中d s p 接收m c u 发送来的命令，完成语音功能。t l c 3 2 0 a d 5 0 c 完成语音信号的a d 和d a 转换，单片机系统中的m c u 接受键盘命令，向d s p 发送控制命令。利用d s p 处理器实现语音功能部分，在考虑背景噪声的前提下采用过零率和短时能量进行语音的端点检测、l p c 倒谱进行语音特征参数的提取、a d p c m ( 自适应脉冲编码调制) 进行语音的编解码和差别子空间的语音识别算法进行模扳匹配；采用两个可编程的二阶数字正弦振荡器产生d t m f 信号并利用g o e r t z e l 算法进行d t m f 信号的有效性检测来实现语音拨号；设计了d s p 实现语音拨号功能的软件流图，并对语音识别系统的性能进行了测试。采用单片机实现系统的监控功能和日历时钟功能。选择的日历时钟芯片d s l 2 8 8 7 具有时钟、闹钟功能敦到2 t 0 0 年的日历功能，可选择1 2 小时制或2 4 小时制计时，宥a m 和p m 、蘑期、夏令时制时间搡作及闰年自动偿等功能。关键谣；线性羲渊；爨逶褒豫游编码调制；语音识崩；双音多攘 i 华中科技大学硕士学位论文 a b s t r a c t s p e e c hr e c o g n i t i o nt e c h n i q u ei sak e yt e c h n o l o g yo ft h ei n t e r f a c eb e t w e e nh u m a n a n d m a c h i n ei nt h ef i e l do f t h ei n f o r m a t i o nt e c h n o l o g y ，t h et h e s i sd i s c u s s e st h ed e s i g na n dt h e i m p l e m e n t a t i o no fs p e e c h e l e c t r o n i ct e l e p h o n en u m b e rp a d ，u s i n gs i n g l ec h i p m i c r o c o n t r o l l e r ( s c m ) w h i c hh a sa g i l ef u n c t i o na sm a i np m c e s s o ra n dd i g i t a ls i g n a l p r o c e s s o rr d s p ) w h i c hh a sp o w e r f u ld i g i t a ls i g n a lp r o c e s s i n gf u n c t i o na sv i c e p r o c e s s o r t h em a i nf u n c t i o n si n c l u d e sn u m b e rm e m o r i z i n g ，f i n d i n g a n dd i a l i n g ，s p e e c h p r o m p t i n g ，r e p l a y i n ga n dd i s p l a y i n g ，t w os p e e c hm e m op a dt i m e ra w a k i n g s ，a n d c a l e n d a ra n dt i m e rd i s p l a y i n g a n a l y z i n gf u n c t i o n sa n d a i mo fe l e c t r o n i ct e l e p h o n en u m b e rp a ds y s t e m t h es y s t e m t a k e sa d v a n t a g eo fd s pa n ds c ma sp r o c e s s o r d s pr e c e i v e st h eo r d e r ss e n tb y m i c r o c o n t r o l l e ra n dc o m p l e t e ss p e e c hf u n c t i o nb yt h eo r d e r s t l c 3 2 0 a d 5 0 cc o m p l e t e s t h ea d ，d ac o n v e r s i o no fs p e e c hs i g n a l m c ui ns c ms y s t e mr e c e i v e sk e yo r d e ra n d s e n d i t t o d s e w er e a l i z es p e e c hf u n c t i o nb yd s et h ee n di se x a m i n e db yp a s s i n gz e r of r e q u e n c y a n ds h o r t _ t e r me n e r g yc o n s i d e r i n gt h ep r e m i s eo f b a c k g r o u n dv o i c e ，t h es p e e c hc h a r a c t e r p a r a m e t e ri sd i s t i l l e db yl i n e a rp r o g n o s t i c a t ec o d e ( l p c ) s p e c t r u mr e v e r s a l ，t h es p e e c h c o d i n ga n dd e c o d i n gi sr e a l i z e db ya d a p tp u l s ec o d em o d u l a t e ( a d p c m ) ，t h et e m p l a t ei s m a t c h e db ya s p e e c hr e c o g n i t i o na l g o r i t h m b a s e do nd i f f e r e n c e s u b p l a c e t w o p r o g r a m m a b l ed i g i t a ls i n eo s c i l l a t o rp r o d u c e sd u a lt o n em u l t i - f r e q u e n c y ( d t m f ) s i 攀a a l a n dg o e r t z e la r i t h m e t i ce x a m i n e se f f e c t i v e l y , w h i c hi su s e dt or e a l i z es p e e c hd i a l i n g t h e p a p e rd e s i g n ss o f tf l o wd r a w i n go fs p e e c hd i a l i n gf u n c t i o nr e a l i z e db yd s p ，a n dt h e p e r f o r m a n c eo f s p e e c hr e c o g n i t i o ni st e s t e d w er e a l i z es y s t e mm o n i t o rf u n c t i o na n dc a l e n d a r t i m e rb ys c m w ec a l ls e l e c t c a l e n d a rc l o c kc h i pd s l 2 8 8 7 ，w h i c hh a sf u n c t i o n so fc l o c k ，a l a r mc l o c ka n dc a l e n d a r i f 华中科技大学硕士学位论文 b e f o r e2 1 0 0 w ec a l ls e l e c t1 2 - h o u ro r2 4 一h o u r ，w h i c hh a sf u n c t i o no f a ma n dp m ，w e e k ， s u m m e rt i m ea n dl e a py e a ra u t o m a t i s mc o m p e n s a t i o n k e y w o r d s ：l i n e a rp r o g n o s t i c a t ec o d e ，a d a p tp u l s ec o d em o d u l a t e ，s p e e c hr e c o g n i z i n g ， d u a l t o n em u l t i - f r e q u e n c y h i 独铺性声嗣本人声明所呈交的学位论文是我个人在粤师指导下进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。学位论文作者签名：趁露蔹目期：，嗜年，碉，f 鑫学位论文版权使用授权书本学位论文佟誊完垒了簿学校有关像缫、使用学位论文豹艘定，即；学校肖投保罄并逸爨家礴关部门或机构送交论文鑫勺复印件君h 电子版，允许论文被查阅和供阅。本人授权华中葶斗技大学可以将本学位论文的全部或部分内容编入有关数据摩进行检索，可以采用影印、缩印或扫描簿复锘4 手段保存和汇编率学位论文。保密口，在年解密后适用本授权书。本论文属子，，，。不搽交孝。 ( 谤在戬土方壤痰抒“0 ”) 学挝论文作者签名：奄多多，星嬲：艚月，f 日搬导教师签名：钡交晴豳期；2 。年护月2 扩目华中科技大学硕士学位论文 1 1 课题的提出 l 绪论语音识别技术是2 0 0 0 年至2 0 1 0 年问信息技术领域十大重要的科技发展技术之一，语音识别是- - i 1 交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。语音识别技术就是与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来1 0 年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。数字信号处理( d s p ，d i g i t a ls i g n a lp r o c e s s i n g ) 技术具有精度高、灵活性大、可靠性高、能时分复用的特点，广泛应用于3g 移动通信、网络会议、多媒体系统、雷达卫星系统、医学仪器、实时图像识别与处理、联合战术无线电系统、智能基站，以及民用电器等领域，并且随着仪器仪表人机界面越来越趋于人性化，语音识别的需求不断增长，语音处理技术也将得到迅速的发展。目前采用d s p 实现d t m f 拨号的技术也正处于发展阶段。在微机平台，一般采用隐含m a r k o v 模搿1 1 1 ( h m m ) 进行语音识别，该算法在识裂除段计算爨较少，遥应性强，但楚震耍大攮豹翦期训练王终。嚣要系统具襄较毫熬运算速度和庞大的系统存储资源。这对于那蝗需要识别的语脊命令不多的特定应用场会，无疑是缀不经济豹，傻溺起来瓷缓不方便。裂瓣濂捡熬数字绩鼍处理鬃( d s p ) 芯片构成的小词汇裁实时语脊识别能很好的解决这一矛盾。现在的乎机都有定的语音电话号码簿功麓，僵是这个号码簿都不丈，这是霞为存穗容量虢淼蠢( 添音鹣容豢要比文本的太得多) 。采用d s p 和先进的压缩算法，在一定程度上解决存储容量韵问华中科技大学硕士学位论文题，还有国内现有的电子电话号码簿皆采用键盘拼音输入方式进行查询，且无拨号功能，而我们研究的基于d s p 语音电子电话号码簿只要使用者说出被查询人的中文姓名或单位名称，将实现自动拨号功能。 1 2 课题的研究意义和国内外概况通过对数字信号处理器( d s p ) 芯片的应用，可以熟练掌握d s p 芯片与其它接口芯片的连接，为今后从事设计工作打下一定的基础；我们采用定点的数字信号处理器 ( d s p ) 芯片t m s 3 2 0 v c 5 4 0 2 来实现的语音多功能语音电子电话号码簿，它具有功能强、性能优、价格低廉、识别率高等优点，是适合中国国情的中文多功能语音电子电话号码簿，在拥有数亿消费者的中国具有广泛的市场前景；该产品的研制成功对我国的语音识别算法研究、语音产品开发等具有特别重要的意义。用d s p 实现语音电子电话号码簿的一项关键技术就是语音识别技术，语音识别是 - - i 1 交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。语音识别听写机在一些领域的应用被美国新闻界评为 1 9 9 7 年计算机发展十件大事之一。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前国内外难流的语音识别技术是基于统计模式识别的基本理论。一个先整的语音识别系统可大毅分为三部分： ( 1 ) 语音特征提联；萁目的是簌语音波形中提取出随时闻变纯的语音特征。 ( 2 ) 声学模黧与模式嚣配( 谖鞠葬法) ：声学穰撵逶鬻将获取静语音特锰逶遘算法产生e 在识溺辩将输入熬添音特薤弱声学模型( 模式) 避季亍嚣配与魄较，褥翻最健豹识别续集； ( 3 ) 语言模型与谌言处理：语富模型包括由识别语鬻俞令构成的语法网络或出统计方法构成的语翥模型，语言处理可以进行语法、语义分析。对小调表语音识别系统，往往不需要语言处理部分。 2 华中科技大学硕士学位论文声学模型是识别系统的底层模型，并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小( 字发音模型、半音节模型或音素模型) 对语音训练数据量大小、系统识别率以及灵活性有较大的影响。必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小。语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正，特别是一些同音字则必须通过上下文结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学描述模型等有关方面。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令的语言模型。语法结构可以限定不同词之间的相互连接关系，减少了识别系统的搜索空间，这有利于提高系统的识别。语音识别过程实际上是一种认识过程。就像人们听语音时，并不把语音和语言的语法结构、语义结构分开来，因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程，但是对机器来说，识别系统也耍利用这些方面的知识，只是如何有效地描述这些语法和语义还有困难，语音识别系统按词汇量分为以下几种： ( 1 ) 小词汇量语音识别系统。通常包括几十个词的语音识别系统。 ( 2 ) 中等词汇量的语音识别系统。通常包括几百个词至上千个词的识别系统。 ( 3 ) 大词汇擞语音识剐系统。通常包括几千至几万个词的语音识剐系统。这嫂不丽识丽麓氇确定了语音识剐系统的困难度。不闽的诺音识剐系统，虽然其体实现细节有所不阕，健耩采用的基本按术耱像，一个典黧语音误翱系统的实凝过程鲡豳1 1 所录翻。语簧识粼搜术主要包援特蔹提取技拳、模忒匹聚准则及模型训练技零三令方嚣。此外，还涉及到语音识别单元的选取。我国语酱识别研究工作起步于五十年代，但近年来发展缀快。研究水平也从实验室逐步定向实用。从1 9 8 7 年开始执行国家8 6 3 计划后，国家8 6 3 智能计算机专家组为语音识别技术研究专门立项，每两年滚动一次。我国语音识别技术的研究水平融经基本上与国外同步，柱汉诱语音识别技术上还有自融的特点与优势，并达到国际先进华中科技大学硕士学位论文水平。其中凝有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。语图1 1 诺讶识别系统的燕瑷语音识别技术的关键技术是语音识别专用芯片，国内研发的第一块语音识别专用芯片，包括了语音识别、语音编码、语音合成功能，可以识别3 0 条特定人语音命令，识别率超过9 5 ，其中的语音编码速率为1 6 k b i t s s 。该芯片可以用于智能语音玩具，也可以与普通电话机相结合构成语音拨号电话机。清华大学电子工程系语音技术与专用芯片设计课题组，研发的非特定人汉语数码串连续语音识别系统的识别精度，达到 9 4 8 ( 不定长数字串) 和9 6 8 ( 定长数字串) 。在有5 的拒识率情况下，系统识别率可以达到9 6 9 ( 不定长数字串) 和9 8 7 ( 定长数字串) ，这是目前国际最好的识别结果之一，其性能已经接近实用水平。研发的5 0 0 0 词邮包校核非特定人连续语音识别系统的识别率达到9 8 7 3 ，前三选识别率达9 9 9 6 ；并且可以识别普通话与四川话两种语言，达到实用要求。2 0 0 0 年7 月在北京自然博物馆新开设的动物展馆中展出的具有语音识别口语对话功能“熊猫”，采用了我们研发非特定人连续语音识别系统，在展览馆这样高噪声的环境下，该识别系统的识别率也超过了9 8 ，达到实用要求。通过该系统观众与“熊猫”自然对话可以了解熊猫的生活习惯、生理结构等信息，其形式生动、活泼，吸引了大量的学生与参观者。采用嵌入式芯片设计技术研发了语音识别专用芯片系统，该芯片以8 位微控制器( m c u ) 核心，加上低通滤波器、模数( a d ) 、数模( d a ) 、预放、功率放大器、r a m 、r o m 、脉宽调幅( p w m ) 等模块，构成了一个完整的系统芯片，这是国内研发的第一块语音识别专用芯片。芯片中包括了语音识别、语音编码、语音合成功能，可以识别3 0 条特定人语音命令，识别率超过9 5 ，其中的语音编码速率为1 6 k b i t s s 。这些系统的识别性能完全达到国 4 华中科技大学硕士学位论文际先进水平。研发的成果已经进入实用领域，一些应用型产品正在研发中，其商品化的过程也越来越快。在电话与通信系统中，智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”；使用电话与通信网络，人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息；随着计算机的小型化，键盘已经成为移动平台的一个很大障碍，想象一下如果手机仅仅只有一个手表那么大，再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行搡作。语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已经大于9 8 ，对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展，这些复杂的语音识别系统也已经完全可以制成专用芯片大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些用户交换机、电话机、手机已经包含了语音识别拨号功能，还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好的结果。调查统计表明多达8 5 以上的人对语音识别的信息查询服务系统的性能表示满意。可以预测在近五到十年内，语音识别系统的应用将更加广泛，各种各样的语音识别系统产品将出现在市场上，人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统，要建成这样一个系统仍然是人类面l | 缶的一个大的挑战，我们只能一步步朝着改进语音识别系统的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。 1 3 本文研究的主要内容我艇主要从下囊几方甏进纾疆突： ( 1 ) d s p 怎撵接收m c u 发送来的命令，并按照其命令完成语毒训练、语音识别、语酱会成、d t m f 拨号、号码簿管理、记事簿管理等功能。 ( 2 ) 完成语音信号的a d ( 模拟语音信号转换为数学语酱信- q - ) 和d a ( 数字华中科技大学硕士学位论文 2 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 一：语音信号转换为模拟语音信号) 。 ( 3 ) 单片机系统中的m c u 接受键盘命令，向d s p 发送控制命令，接收d s p 的反馈信息，并将一些信息显示在l c d 上。 ( 4 ) 用r o m 来存放d s p 程序和语音提示所需的数据。 ( 5 ) 使用f l a s h 用来存储电话号码簿的1 0 0 个词条数据以及记事簿所需的两段 3 0 秒钟的记事录音数据等参数。 ( 6 ) 单片机完成e t 历时钟功能。 1 4 本章小结本章主要论述了本文研究的意义和国内外的概况以及要研究的主要设计思路，根据系统功能进行分析，确定两个处理器实现的功能，主要是d s p 实现语音功能和单片机实现的日历时钟功能。 6 华中科技大学硕士学位论文 2 语音电话号码薄系统的总体设计语音电子电话号码薄具有多种功能，其中包括存储电话号码、拨号、语音提示、语音回放和语音记事簿，本章将重点研究怎样用d s p 和单片机来实现号码薄的功能。 2 , 1 系统的性能目标在这里，多功能诺音电子电话号码薄系统将要实现以下功能： ( 1 ) 语音电话号码簿能存储2 0 0 个名字2 0 0 个电话号码，它具有查找、援号、语音挺示、语音回教、显示等功能。弦) 语啻记事簿寄嚣令语音记事定时瓣醒功能，每当语音记事定时挺醒时刻鬻来对，裁基动攘放3 0 秒瓣翅户录蠢，以提熬羯户。 ( 3 ) 电予日历毙显示年、月、尽、时、分、骖、星期。 22 系统的分析与设计为了满足多功能潺啻电子电话号码薄系统的上述功能，系统的总体设计过程数据流图( d f d ) 3 1 如下所示。步骤如下：第1 顶层d f d 用户对整克风讲话产生语音信号，语音信号经过a d 转按后送入功能处理系统进行数据处理，功能处瓒系统主要进行语音信号的存储，谮音的识剐和语音的拨号，并置用户通过控箭丽板中的按键对系统进行控制，功能处瓒系统对功能控带i 信患迸行相应翡箍蓬分箱实虢对森韵葫能，鲡添音韵录入、语蓊豹查找、语音的西藏等，其中功麓系绞避行浯音识鬟嚣霹戬鑫魏实现语蠢拨号熬功筑，显示终端显示目弱窿镑和联系入姓名号璐等，壤层d f d 怒强2 。l 。第20 层d f d 功能处理系统主要功能是逃行语酱识别和语音拨号，首先录入语音信号，将信息华中科技大学硕士学位论文存储形成电话号码簿，如果要进行通讯时，先要进行语音识别，得到联系人电话后自动实现语音拨号，0 层d f d 见图2 2 。图2 1 顶层d f d 联篇人号码簿羽陲图2 20 层d f d 第31 层d f d l 号黼语音识别的过程首先是对语音信号进行端点检测，然后提取谮音的特征参数，对语音的特征参数进行编解硝，最后，需要进行语音的匹配，樽到正确联系入的联系号码，第l 层d f d1 号图见阁2 3 。华中科技大学硕士学位论文语音信号图2 , 3i 层d f d1 号图第41 层d f d 2 号图遥进语密识别，褥鎏| 联系人戆号码经d s p 产生d t m f 售号，然焘褥进嚣d t m f 豹检测，最聪实现d t m f 拨号功能，第1 层d f dl 号图见图2 4 。正入图2 41 屎d f d2 号闰本文选用d s p 芯片为t i 公司t m s 3 2 0 c 5 4 x 【4 l 【5 焖( 简称，c 5 4 x ) ，它戆于1 9 9 6 耸推如的新代定点数字信号处理器。它采用先进的修礁哈佛结构1 6 】，片内共有8 条总线 ( 1 条程序存储器总线、3 祭数据存储器总线和4 条蛾址总线) 、c p u 、在片存储器和在片外围电路等硬件，加上商度专监他的指令系统。使c 5 4 x 其有功耗小、高度并行等优点，冒戳满是多功麓语音毫予电话号码薄系统实辩薤瑾缝要求。选羯豹m c s 秀i n t e l 公司撬瘳载蔫狴8 位擎冀枫系列产鑫m c s8 0 5 t t 孔，m c s8 0 5 9 华中科技大学硕士学位论文具有数据存储器( r a m ) 和程序存储器( r o m ) ，因而，应用时无需和8 0 3 1 一样扩展内部程序存储器。在m c s 一8 0 5 1 内部，有4 个8 位的并行i o 端h 和一个可全双工通信的串行i o 端口。并行i o 端口既可按字节访问，也可按位访问。串行i o 端口可通过软件编程设定4 种工作方式，m c s 一8 0 5 1 的程序存储器空间与数据存储器空间相互独立。具有两个1 6 位的片内可编程的定时器计数器，可对它们编程设定4 种工作方式，并有5 个中断源。m c s8 0 5 1 单片机具有灵活的控制功能，使用相当简单方便，可以轻松实现多功能语音电子电话号码薄系统的控制功能。因此，在整个系统中， m c s8 0 5 l 与t m s 3 2 0 c 5 4 0 2 两个处理器以主从方式连接实现系统的功能。m c s8 0 5 1 作为系统的主机，完成系统的人机接口( 键盘、显示) 和对t m s 3 2 0 c 5 4 0 2 的控制。 2 3 系统的组成 2 3 1 系统静功麓模块本系统设计由主、从功能模块组成踮。主功能模块包括m c u 、键盘以及l c d ；从功能模块包括d s p 、t l c 3 2 0 a d 5 0 、r o m 、f l a s h 和音频放大器等，功能模块图如图2 5 所示。圈2 。5 功能模块翻系绞孛备模块珐能为： ( 1 ) d s p 豹主要功魃是接收m c u 发送来麴螽令，劳按照葵愈令宠成溪啻训练、语鸯识别【9 】、谌音合成”0 1 、d t m f 拨号、号码簿管理、记褰簿管理等功能。华中科技大学硕士学位论文 ( 2 1t l c 3 2 0 a d 5 0 怒用来完成语音信号的a d ( 模拟语音债号转抉为数字语音信号) 和d a ( 数字语裔信号转换烫模拟语音储号) 转换。 ( 3 ) r o m 是用来存放d s p 程序和诿啻提示赝需鲍数握。 ( 4 ) f l a s h 用来存储电话号码簿的2 0 0 个词条数据以及记攀簿所需的两段1 分钟鹁记事最衰数掇等参数。 ( 5 ) 单片机系统中的m c u 主要是接受键盘命令，向d s p 发送控制命令，接收d s p 羧爱续馋惠，势褥一些傣患显汞在l c d 上：弱辩受责强历瓣铮熬产生。 ( 6 1 电源模块的主鞭功能是为系统中各功能模块提供电源。 2 3 2 系统硬件体系结构 1 系统硬件系统硬件连接如下图2 6 。整个硬件系统包括三个部分f 1 1 】：是d s p t m s 3 2 0 c 5 4 0 2 处理系统，包括t m s 3 2 0 c 5 4 0 2 、程序存储器、模数转换电路等；二是闪烁存储器以及其与t m s 3 2 0 c 5 4 0 2 的接口电路；三是m c s 一5 1 主处理部分，包括m c s5 1 处理器、键盘显示及m c s _ 5 1 与t m s 3 2 0 c 5 4 0 2 的接口，在d s p 处理系统中，采用e p r o m 和高速静态r a m 相结合的存储器配置方式。其中，e p r o m 用于存储程序和初始化数据，高速的r a m 用于程序执行和数据的暂存，程序和数据共用大大的简化了硬件电路。斗 t m s e 一 3 2 0 c 5 4 0 厂 1 胜m | h 图2 6 系统硬件连接图图中d s p t m s 3 2 0 c 5 4 0 2 主要完成语音的压缩和解压缩功能。系统主要由 t m s 3 2 0 c 5 4 0 2 、2 片e p r o m 2 7 c 2 5 6 1 5 、2 片r a m c y 7 c 1 9 9 2 5 、等待状态发生器、华中科技大学硕士学位论文译码电路、晶体振荡器、数模转换电路等构成。其中e p r o m 的存储时间为1 5 0 n s ，需插入等待状态，其地址为存储空间的前3 2 k w ，即0 0 0 0 h - 7 f f f h 。离速的r a m 的地址为8 0 0 0 0 f f f f h ，共3 2 k w ，程序耱数据均可访闯。闪烁瘩馕器k m 2 9 n 1 6 0 具毒一个可复用的8 位i 01 3 ，数据和地址的输入和输出及命令的输入都通过这个8 位y o 鏊实现。模数转换采用t i 公司生产的t l c 3 2 0 a d 5 0 c ，t l c 3 2 0 a d 5 0 c 集成丁a d c 相d a c 于一髂豹模瓠接口芯片，其畜与d s p 接日篱鼙、离佼链、低功耗，1 6 位数据结构、音频范阐( 采样频率为2 - 2 2 2 5 k h z ) 、抗混叠滤波器和重构滤波器的模拟接口芯片，有一个能与许多d s p 芯片相连的同步串行通信1 1 2 1 接闺。t l c 3 2 0 a d 5 0 c 与 t m s 3 2 0 c 5 4 0 2 的接口电路如图2 + 7 【l ”。 t m $ 3 2 0 c 5 4 0 2 t l c 3 2 0 a d 5 4 c 图2 7t l c 3 2 0 a d 5 0 c 与t m s 3 2 0 c 5 4 0 2 的接口电路 2 主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接口电路主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接1 3 电路如图2 8 。由于m c s8 0 5 1 的控制功能灵活，d s p 的处理功能强的特点，故采用m c s8 0 5 1 作为主处理器、d s p 作为从处理器。m c s8 0 5 1 的p 0 口用作键盘、显示接口，p 2 0 用于复位t m s 3 2 0 c 5 4 0 2 ， p 2 1 接到t m s 3 2 0 c 5 4 0 2 的i n t 0 中断，p 2 2 、p 2 3 为数据选择线。m c s8 0 5 1 的p l 语音输入华中科技大学硕士学位论文用于与t m s 3 2 0 c 5 4 0 2 的双向数据交换。其中t m s 3 2 0 c 5 4 0 2 向m c s _ 8 0 5 1 发送数据通过7 4 h c 3 7 4 锁存器实现，而m c s 一8 0 5 1 向t m s 3 2 0 c 5 4 0 2 发送数据通过7 4 h c 2 4 4 缓冲器实现。 d o d 7 7 4 h m p u w e 一 1一 c 3 7 4 p 2 4 t m s 一 3 2 0 c 5 4 0 2 嬲。1 m c s8 0 5 l m p u r d 。i u 4 4 x f l n t o i n t 0 、 p 2 1 图2 8 主处理器m c s8 0 5 1 与t m s 3 2 0 c 5 4 0 2 的接口电路图 2 3 3 系统的软件设计软件工具用到c c s 和伟福疆个软牛，其中c c s 用寒避行d s p 的编魏和仿真调试，伟福用来进行单片机的编稷和仿真调试。 1 c c s 技术 ( 1 ) c c s 技术的特点：c c s 技术具有集成的开发环境、数据的w 视性、第三方的支持、w 视化的工程管理、d e 编译环境、实时功能的配置、高效的v l i w 生成工具。其中i d e 编译环境：c 语言萃日汇编可编译、商亮箍示程序谮旬、可设麓断点、在线h a l p 功髓、诀捷键功能、书签秘雏、e d i t 功能。编译环境鲡黼2 9 。疆) c c s 实褒语音豹录入逶过t l c 3 2 0 a d 5 0 c 袋集音频信号，然嚣将数摄存效在d r a m 墼，把数撵输蹬型 t l c 3 2 0 a d 5 0 c 。技行步骤妇下：扇动c c s ，编冀程j 挚代码，进幸亍编译著老n 载到d s p 中，然鼷点击菜单d e b u p g om a i n 就进入程序l y a s m 执行别光标所在处。 1 3 华中科技大学硕士学位论文图2 9 c c si d e 编译环境采用攀步逡雩亍或全速运行到光标处，并打开波形戏察赛口，跟踪波察其执纷过程。语酱波形如图2 。1 0 。图2 1 0 语音倍号频谱图 2 主程序流图该模块蹙系统的操作流程设计，如图2 1l 所示。程序酋先潮断建否有功髓键按下，蓉无功雒键按下，且诡事簿的语音定时鬟疆辩翔尚采弱来对，鬟孽c p u 韵时钟讶按为副 1 4 华中科技大学硕士学位论文时钟并关闭主时钟，置i d l ef l a g 为l 并进入i d l e 状态。蒸本定时器中断质，主程序将潺出i d l e 状态，进行播放用户录音，在无功能键按下的情况下，重复上述过程。若寓功能镳按下，滤i d l k f l a g 为o ，势执行糖应的功缝模块穰序。 3 基本定时器中断服务程序流程圈滚程嚣懿鬻2 1 2 联示，该自羹务程痔每7 。8 2 m s 被羧褥一次。它完成镶壹摆撰功戆，当连续2 0 次检测到同键值的键按下时，将该键值放于键盘缓冲区中；它也完成日历嚣锋计辩功筑，当连续两次稔涮羁辩镩定蠢器的中凝标志毽i r q w 为l 露，辩雩镑豹秒加1 。若该中断发生时的程序工作于i d l e 模式下，此时l c d 应显示日历时钟信怠，且中断正常返回；着工筝予电话号码簿或记事簿功能程序，在2 m i n 内无镳按下，则应关断从功能模块的电源且非正常中断返回。图2 1 1 主程序流图华中科技大学硕士学位论文 2 4 本章一、结图2 1 2 基本定时器中断服务程序流程图本章分析了多功能语音电予电话号码簿系统的黹求和目标，给出了系统的数据流圈( d f d ) 。搬据两种处理器的特点，选取d s p 作为获处理器，主舞完成语脊信芍的憝理和识剐工作；选取擎片梳俸为主簸瑾嚣，圭簧完成盗控作瘸和实嚣嚣历，辩锋功能。设诗了处理器与袈接翻芯片相应豹连接图，最矮餐攀奔缓了c c s 软律豹瘴攫。 1 6 华中科技大学硕士学位论文 3d s p 语音功能的实现在语音识别处理平台系统中，一般采用隐含马可夫( m a r k o v ) 模型( h m m ) 进行语音识别，该算法由于允许模板匹配中时间不定长，因而系统的适应性强，且识别阶段计算量也不大，但是需要进行大量的前期训练工作，需要系统具有较高的运算速度和庞大的系统存储资源。这对于那些需要识别的语音命令不多的特定应用场合，无疑是很不经济的，使用起来也不方便。利用廉价的定点数字信号处理器( d s p ) 芯片构成的小词表实时语音识别模块便能很好地解决这一矛盾。 3 + ld s p 实现语音识别 3 。l 。1 设幸悬路秘避程将一个完整的语音识剐系统设计为以下4 个部分1 4 】1 1 5 】： ( 1 ) 语音特征提取。其瞄的建觚语音波形中提取出随时间变化的语音特须序列。 ( 2 ) 建立声学模鳖。遥常将获取的语音特征通过学习算法产生。 ( 3 ) 模援茳配( 谈掰算法) 。在专鬟涮辩将输入静谱音特征溺声学模型进行院较，得裂最佳豹识别绪果。 4 ) 语妾模型与诿皆处理。出识别语鸯套令槐残魏语法鄹终，可以进嚣语法、谶义分析。对小词淡语巍识别系统，往往不嚣要语音处理部分。 3 。i 2 设计裰鲞和漂理本文是对于小词汇表、孤立词进行识明的系统，根据完整的语音识别系统的麓本过程，系统设计的识剐框圈如图3 1 所示。由图可知，一个完整的语音识剐系统的基本过程如下f 1 6 l ：首兔将语音信号进行端点检测，然稽提取语音的特征参数，装后进彳亍模板逛配褥到识羽缩栗。， 1 7 华中科技大学硕士学位论文一匿f 哥躲 i 警( 主萄图3 1 语音识别框图上述框图中各部分实现的原理和方法如下： 1 端点检测( 就是从含噪声的环境中检测出说话人的语音命令) ，一般采用语音信号的短时能量和过零率来进行端点检测。语音信号的采样频率为8 k h z ( 仅j 舂合于简单语句的识别) ，每帧数据为3 0 m s ，共2 4 0 个采样点，帧交迭1 0 m s ，共8 0 个采样点。每隔1 0 m s 计算一次短时能量和过零率。短时能量用下面公式计算：一 2 e 。= 艺0 ( ) ( 一) 】 ( 3 1 ) = 呻其中拄为一桉语鬻魏采样熹数( 8 0 ) 。a 承) 为一维语音信号的离散黼数，w 像为塞遮数。过零率为一枣囊语毒信号雾越零毫乎熬次数，短辩麓蠹撵述了信号的壤度，瑟过零率越毙攫低熬溥蠢比较敏感，硬者配合起来裁剪班溅确地判叛语音信号熬舞鲶窝结束。如当采样得到的短时能量和大予一定阀值时，就认定此对话音信号已经开始，只要短时能赣和低于平均能量的1 2 0 时，就认定此时已经是谣音傣号的终点了。为减少背景对检测结果精度的影响，针对汉语诺音傣号大部分以声母开始以韵母结束的特点，在撼于斑时帧能量的双门限语间端点梭测算法 1 7 1 基础上，本文提出带背景噪声动态估计的语音端点检测方法，用瓶时帧过零率进行语皆信号的开始点的檎铡，用短时帧髓麓瓦进行语音结束点的检测，时背景嗓声进行动态估计，进行语音端点检测。在背景嗓声下的语音端点梭测过程如闰3 2 所示。冀过程如下：用门限辩噪声进行处理，把处理过的语音倍号褥进行短时帧能鬣和邋零率的计算。华中科技大学硕士学位论文背景噪声图3 2 语音端点检测过程算法如下： ( 1 ) 对语音糖号避行分垂寅处淫。本文采燕枣蠢长蹬) 隽2 5 6 ，较移舞1 2 8 ，然螽漾行蕻处理e 预处理毽捶黢搬羹窝燕塞处理，鞭热蒸郑铸号遵过仅有一个零点熬滤波嚣嚣( # ) = l 一瓣，其串u 接_ l 琏或等予1 ；加鬻处壤是躅整舔数w n ) 袁黎一顿豹语音楼号 s ( n ) ，从嚣形成热密诿啻s 。( 起) = s ( 彩坂弹) ，本文采用h a m m i n g 蜜。 ( 2 ) 计算语蓊售号数短封帧能量点。短对帧能攫甄表示为一1 e ( 疹：s

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf

文档简介

温馨提示

最新文档

评论

（计算机系统结构专业论文）一个基于dsp语音电子电话号码簿的设计与实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档