(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf_第1页
(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf_第2页
(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf_第3页
(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf_第4页
(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(计算机应用技术专业论文)gsm声码器收发任意数字信号的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

济南人学硕l j 学位论文 摘要 本课题实现了将任意数字信号在g s m 声码器中传输,无需使用数据信道即可 实现对任意数字信号低时延、少抖动的高质量传输。声码器是一种以人类声道参数 模型与发音机理为基础的高压缩语音编码技术,在保证一定听觉质量前提下,以低 码率实现对语音信号的编码收发。工作原理决定了声码器对不具有语音特性的信号 无法实现有效编码及收发。所以将一定码率,完全不具有语音特性的任意数字信号 经g s m 及c d m a 网络中的声码器传输,需要设计一种独特的符合声码器原理的方 案。 在g s m 声码器中传输数字信号是本课题研究的出发点,语音编码,声码器和 码本设计算法是本课题的基本理论知识。所以在本课题中首先要研究相关的语音编 码和声码器的基本理论知识,确定如何实现数字信号在g s m 声码器中传输。而码 本设计是本课题的关键,通过码本才能够真正地实现g s m 声码器传输任意数字信 号。 本课题研究的主要内容包括: 1 通过分析g s m 声码器传输任意数字信号的重要意义和发展现状,指出了 g s m 声码器传输任意数字信号的可行性和总体设计方案。 2 分析了相关的语音编码基本理论,包括语音信号的线性预测、语音信号的矢 量量化和语音信号的压缩编码,这三方面理论知识是实现语音信号在语音信道上传 输的基础。 3 对比较流行的几种声码器进行了研究,主要研究了本课题所采用的规则脉冲 激励线性预测声码器编码解码原理。因为g s m 使用的是g s m1 3 k b sr p e l t p 编解 码原理,从而对g s m1 3 k b sr p e l t p 编解码原理进行了深入的研究,阐述了语音 信号如何在声码器中传输。 4 讨论了码本设计算法。通过分析经典l b g 算法,遗传算法和p s o 算法如何 设计码本,发现对于本课题所需的码本,这些算法并不适合,从而提出了三种适合 本课题的码本设计算法。这三种算法分别为基于p s o l b g 算法的最优码本设计、 g r o u pf c m l b g 算法和基于分布估计算法的码本设计。基于p s o l b g 算法的最优 码本设计改善了l b g 局部最优解问题,同时不影响算法的效率。g r o u pf c m l b g g s m 声码器收发任惑数。厂1 再的研,( o j 实现 算法是针对设计一个容量相当大的码本提出的,在数据量大的前提下,提高算法的 效率。基于分布估计算法的码本设计应用了分布估计算法的优点,以相对比较高的 效率设计出高质量的码本。 5 提出了g s m 声码器收发任意数字信号的设计与实现。具体实施方案包括: 语音特性参数选择、码本设计、语音特性参数映射、基于模型参数的语音合成及分 析和语音特性参数代码表的修正。同时给出了在m a t l a b 下的实验仿真结果,以及对 实验仿真结果和本课题的可行性的分析。 关键词:g s m 声码器传输数字信号、语音信号加密、语音编码、声码器、 码本设计 济南人:学顾i j 学位论义 a b s t r a c t t h i sp a p e rp r o p o s e sam e t h o dt h a tc a nb eu s e dt ot r a n s p o r ta n yd i g i t a ls i g n a l sv i a v o c o d e ra n dc a nr e a l i z et r a n s p o r t i n ga n yd i g i t a ls i g n a ll o wl a t e n c ya n dh i g h - q u a l i t y w i t h o u td a t ac h a n n e l s v o c o d e ri sah i g h - c o m p r e s s i o nv o i c ec o d i n gt e c h n o l o g yb a s e do n h u m a n - c h a n n e lp a r a m e t e r sm o d e la n dt h ep r o n u n c i a t i o n i no r d e rt og u a r a n t e eac e r t a i n t h ep r e m i s eo ft h eq u a l i t yo fh e a r i n g ,a c h i e v el o wb i t r a t ec o d i n gs e n da n dr e c e i v ev o i c e s i g n a l s p r i n c i p l e d e t e r m i n e st h ev o c o d e rc a nn o ta c h i e v ee f f e c t i v e c o d i n ga n d t r a n s c e i v e r so nt h ec h a r a c t e r i s t i c so fn o n - v o i c es i g n a l s s oi ti sn e c e s s a r yt od e s i g na u n i q u em e t h o dw i t hv o c o d e rp r i n c i p l e u s i n gt h i sd e s i g nc a nt r a n s p o r tt h ed i g i t a ls i g n a l , w h i c hh a sac e r t a i nr a t ea n dd o e sn o th a v ea n yv o i c ec h a r a c t e r i s t i c ,v i ag s ma n dc d m a n e t w o r k s i ti st h es p r i n g b o a r dt ot r a n s p o r ta n y d i g i t a ls i g n a l sv i ag s mv o c o d e r , a n ds p e e c h i n g c o d i n g ,v o c o d e ra n dc o d e b o o kd e s i g na r et h eb a s i ct h e o r e t i c a lk n o w l e d g eo ft h i sp a p e r f i r s t l y , r e s e a r c ho nt h eb a s i ct h e o r e t i c a lk n o w l e d g eo fs p e e c hc o d i n ga n dv o c o d e rt h a t d e t e r m i n e sh o wt or e a l i z et r a n s m i s s i o na n yd i g i t a ls i g n a l sv i ag s mv o c o d e r t h e nt h e c o d e b o o kd e s i g ni st h ec r i t i c a lo ft h i sp a p e r , i ti su s i n gt h ec o d e b o o kt h a tw ec a nr e a l i z e t r a n s m i s s i o na n yd i g i t a ls i g n a l sv i ag s mv o c o d e rt r u l y t h ec o n t e n t sa r el i s t e da sf o l l o w : 1 t h r o u g ha n a l y z i n g t h e s i g n i f i c a n c e a n d d e v e l o p m e n t s t a t u so f t r a n s m i s s i o na n yd i g i t a ls i g n a l sv i ag s mn e t w o r kv o c o d e r , t h ep a p e r p r o p o s e si ti sf e a s i b l et or e a l i z et r a n s m i s s i o na n yd i g i t a ls i g n a l sv i ag s m v o c o d e r a n dt h eo v e r a l ld e s i g no ft h i sr e s e a r c hi sg i v e n 2 1 1 l ep a p e ra n a l y z e st h eb a s i cp r i n c i p l eo f s p e e c hc o d i n g ,c o n c l u d i n gl i n e a r p r e d i c t i v ec o d i n g ,v e c t o rq u a n t i z a t i o na n dc o m p r e s s i o nc o d i n g t h e s e p a r t sa r et h eb a s i co fb o wt r a n s m i s s i o ns p e e c hs i g n a l sv i a t h es p e e c h c h a n n e l 3 r e s e a r c ho ns e v e r a lk i n do fq u i t ep o p u l a rv o c o d e ra n dm a i n l ya b o u tt h e i i i g s m 声码器收发任意数,信0 的研究j j 实现 c o d i n g a n d d e c o d i n gp r i n c i p l e o ft h e r p e - l p c ( r e g u l a rp u l s e e x c i t a t i o n l p c ) l i n e a rp r e d i c t i o nv o c o d e r b e c a u s eg s m1 3 k b s r p e l t pi st h es t a n do fg s m ,t h ep a p e r d e e p l yr e a e a r c h so ng s m1 3 k b s r p e - l t pa n de x p o u n d sh o wt r a n s m i s s i o ns p e e c hs i g n a l sv i av o c o d e r t h ep a p e rd i s c u s s e sc o d e b o o kd e s i g na l g o r i t h m s t h r o u g ha n a l y z i n gl b g a l g o r i t h m ,g aa l g o r i t h ma n dp s oa l g o r i t h m ,d i s c o v e rt h a tt h e s e a l g o r i t h m sa r en o ts u i t a b l ef o rt h ec o d e b o o ku s e di nt h ep a p e r s ot h e p a p e rp r o p o s e dt h r e ea l g o r i t h m sw h i c ha r ef i tf o rt h ep a p e rt od e s i g n c o d e b o o k f i r s tp a p e ri so p t i m a lc o d e b o o kd e s i g nb a s e do np s o l b g a l g o r i t h mw h i c hi m p r o v e st h el o c a lo p t i m a ls o l u t i o np r o b l e mo fl b g a l g o r i t h m s e c o n dp a p e ri saf a s tv qc o d e b o o kd e s i g na l g o r i t h mt h a tc a l l b cu s e dt od e s i g nac o d e b o o kw h i c hh a san u m e r o u so fc o d e w o r d s l a s t p a p e r i sc o d e b o o k d e s i g no p t i m i z a t i o n b a s e do ne s t i m a t i o no f d i s t r i b u t i o na l g o r i t h m st h a th a st h eb e t t e rp e r f o r m a n c e t h ep a p e rp r o p o s e st h er e s e a r c ha n dr e a l i z a t i o no ft h eg s mv o c o d e r t r a n s m i s s i o na n yd i g i t a ls i g n a l s t h ec o n c r e t er e a l i z a t i o ns t e p so fg s m v o c o d e rt r a n s m i s s i o n a n yd i g i t a ls i g n a li n c l u d i n gv o i c ec h a r a c t e r i s t i c p a r a m e t e rs e l e c t i o n ,c o d e b o o kd e s i g n ,d a t ap a r a m e t e r sm a p p i n g ,v o i c e s y n t h e s i sb a s e do nm o d e lp a r a m e t e r s ,v o i c ea n a l y s i sa n dc o r r e c t i o no f p a r a m e t e r sc o d et a b l e s ,s i m u l a t i o ne x p e r i m e n ta n da n a l y s i so fs i m u l a t i o n r e s u l t sa n df e a s i b i l i t ya b o u tt h i sm e t h o d k e yw o r d s :g s mv o c o d e rt r a n s m i s s i o nd i g i t a ls i g n a l s ,v o i c es i g n a le n c r y p t i o n , s p e e c hc o d i n g ,v o c o d e r , c o d e b o o kd e s i g n i v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的 研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人 完全意识到本声明的法律责任由本人承担。 论文作者签名:耻日 关于学位论文使用授权的声明 本人完全了解济南大学有关保留、使用学位论文的规定,同 意学校保留或向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借鉴;本人授权济南大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩 印或其他复制手段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:哞查l 一导师签名:纽日期:趋迟舭 济南人学顾i :学位论文 第一章绪论 1 1 课题研究的背景及意义 随着科学技术的高度发展,高度依赖于信源特性的声码器技术实现了对语音信 号的高压缩率编码。声码器是一种以人类声道参数模型与发音机理为基础的高压缩 率语音编码技术,广泛应用于无线移动通信( g s m 及c d m a ) 、卫星通信等网络系 统中,在保证一定听觉质量的前提下,以低码率实现对语音信号的编码收发。如 g s m 网络中全码率模式下,语音信号经r p e u p 声码器编码后,以1 3 k b p s 码率传 输;g s m 增强型全码率的语音声码器与c d m a 网络中使用的e v r c 声码器皆采 取基于a c e l p 的技术,在几乎不降低通话质量的前提下,可将语音信号压缩至 8 1 3 k b p s 的码率进行传输;而美国国防部( d o d ) 使用的c e l p 晗1 声码器可将语音 信号压缩至4 8 k b p s ,仍保证不错的通话质量。虽然声码器在不断地发展中其压缩 码率也越来越小,但是声码器对于非语音信号的压缩编码却无能为力。 通过语音信道传送任意数字信号的调制解调技术在使用波形编码方式( p c m 或 a d p c m ) 的固定电话网络已被广泛使用。一般地,通过更改( 调制) 正弦连续波 的某些特性,如频率、幅度以及相位等,可代表变化的数字信息码流。当前普遍使 用的公共固定电话网( p o t s ) 的数据调制解调器可达到5 6 k b p s 的码率。然而,这 些数据调制解调技术生成的信号不再具有人类语音的特性,经声码器编解码作用后 波形特性如幅度、频率和相位等无法被保存,因此数字信号无法通过基于声码器技 术的无线移动通信网络( 如g s m 、c d m a ) 的语音信道传送。 同时无线移动通信网络( 如g s m 、c d m a ) 提供了数据信道,如c s d 口1 , g p r s e d g e h l ,u m t s 畸1 ,h s c s d 阳1 等,以解决对数字信号的基本传输问题,但一方 面由于数据信道的高传输延迟( 0 5 秒2 秒) 以及传输抖动等无法满足交互式 实时信号对服务质量的要求;另一方面,电信运营商提供数据信道服务的范围远不 如语音服务,且方式各异,因此跨运营商、跨网络或跨国的使用数据信道服务存在 诸多互通互联的困难。 因此本课题研究将一定码率的,完全不具有语音特性的任意数字信号经g s m 及 1 g s m 声码器收发任意数,信号的研究1 j 实现 c d m a 网络中的声码器传输,且要保证能够可靠地通过多重级联的声码器编解码操 作,如g s m g s m ,g s m c d m a 等。实现了无需使用数据信道即可实现对任意数字 信号低时延、少抖动的高质量传输。 本课题可以应用于无线移动及固定通信终端设备中,以一种与网络交换和传输 设备无关的方式,透明地通过模拟数据信道传送任意数字信号,而且只需使用运营 商的语音服务,大大拓宽了使用范围,用户可在世界上任何有语音服务的地方,传 送一定码率的任意数字信号。 本课题还可以应用于无限移动终端( g s m 、c d m a 手机,卫星电话等) ,固定电 话以及计算机设备中,可实现多种特殊增值服务功能: 1 提高“一键通( p t t :p u s h t o t a l k ) 无线组群通话增值服务的语音传输质量, 并使p t t 服务不再依赖于无线数据信道,实现p t t 服务的独立运营: 2 为无线移动网络语音信道实现保密语音传输提供关键技术支持,可以使用户 在固化网络及g s m c d m a 移动网络覆盖的世界任何地方,进行保密数据通讯。 1 2 课题的研究动态 1 2 1 声码器传输数字信号的研究动态 1 d - n e t 1 9 9 4 年,德国的t l k 计算机公司设计了一款调制解调器( m o d e m ) ,此调制解调 器与数字移动电话相连能够实现在语音信道中传输数字信号,不过此设计仅限于在 欧洲范围内使用。t l k 的传输系统工作在g s m ( g r o u ps p e c i a lm o b i l e ) f f 田络上,该网 络是一个数字移动通信服务。d n e t l 7 是一种g s m 网络的数字蜂窝网络,最初只是用 来传输语音的,当时许多德国通信公司都表示通过d n e t 网络的语音信道是无法传输 数字信号,但后来通过长期的研究,t l k 公司实现了在语音信道上传输数字信号。 用t l k 的调制方案传输数字信号,需要在传输两端装上g s m 调制解调器。其调制 解调器传输数据的速率大约是1 0 0 0 b p s ,其费用比较昂贵,大约是$ 1 6 0 0 。 2 p t t 增值服务 美国的k o d i a k 公司正在开发一款p 1 盯怕1 的g s m 电话,该公司提供的p 1 丌服务 是实时交换系统,其中所有基于包交换的i p 业务都是用的语音信道,而其他公司提 2 济南人学硕l :学位论义 供的p t t 服务都用的数据信道。所以只要有基本的语音信道的网络,就可以使用 k o d i a k 公司提供的p 1 _ r 服务。k o d i a k 公司提供的p t t 服务还支持2 g 网络和3 g 网 络,同时因为它使用的是语音信道,所以它的时延也最小,它的呼叫时延一般2 到3 秒钟之间。 初始化p t t 时,用户只需要有r t s ( r a p i d t r a n s l a t i o ns y s t e m ) 系统和一个兼容的 手机设备,就能够与任何的无线用户甚至是有线用户进行连接,无需考虑运营商和 所用的手机设备。这个方案同时也能用于组呼叫,只要初始化的时候用k o d i a k 的系 统和k o d i a k 兼容的手机设备。这样,运营商和用户都可以充分的利用在手机设备中 的投资优势。这种方法已经得到了很多专业人士的称赞,但是这个方案还在研究过 程中。 1 2 2 声码器 1 9 3 9 年美国的h o m e rd u d l e y 发明声码器,语音处理开始了参数编码或模型编 码的研究。 1 l p c 1 0 声码器 自2 0 世纪7 0 年代以来,人们陆续地提出了各种改善低速率语音编码质量的方 案,使之在可懂度、清晰度、自然度等方面都得到了一定程度地改善。1 9 7 6 年,美 国确定用l p c 1 0 睁1 0 1 作为在2 4 k b s 速率上语音通信的标准技术,1 9 8 1 年,这个算法 被官方接受,作为联邦政府标准f s - 1 0 1 5 公布。利用这个算法可以合成清晰、可懂 的语音,但是抗噪声能力和自然度尚有欠缺。自1 9 8 6 年以来,美国第三代保密电话 装置( s t u i i i ) 采用了速率为2 4 k b s 的l p c 1 0 e ( l p c 1 0 的增强型) 作为话音终端。 2 规则脉冲激励线性预测声码器 1 9 8 2 年,由b i s h n us a t a l 和j o e lr r e m d e 在国际声学、信号、语音处理年会上 提出多脉冲线性预测编码原理算法,并给出了实验结果。他们利用合成分析法 ( a b s ) 和感知加权最小均方误差准则,对一帧中有限多个激励脉冲的位置和幅度 进行最佳估计,将得到的激励脉冲序列输入到综合滤波器,即可得到合成语音。1 9 8 5 年,e d e d e p r e t t e r e 和p e t e rk r o o n 提出了规则脉冲激励编码的思想,其实质是把多 3 g s m 声码器收发任意数字信吁的研究与实现 脉冲的位置和幅度做成几个固定的序列,以相位来表示,从中搜索残差均方和最小 的序列,这样就简化了算法。长时预测技术的应用,使规则脉冲激励合成语音的音 质达到通信等级。 r p e l p c ( r e g u l a rp u l s ee x c i t a t i o n l p c ) 是由e d e d e p r e t t e r e 和p e t e rk r o o n 在 1 9 8 5 年i e e ei c a s s p 年会上提出。1 9 8 6 年k h e l l w i gr h o j m a n n 和p w a r yr j s l u y t e r 等人在e k r o o n 提出的规则脉冲激励编码的基础上,将它简化成实时算法。以后他 们与c g a l a n d ,m r o s s o 等人合作改进算法,加入了长时预、狈q ( l o n gt e r mp r e d i c t i o n , 缩写为l t p ) ,并使速率降为1 3 k b s ,形成了长时预测规则脉冲激励( r p e l t p ) 1 编码方案。r p e l t p 在1 9 8 8 年被确定为泛欧标准全速语音编码方案,称为g s m n 列 标准。 3 c e l p 编码原理 19 8 5 年,m a n f r e dr s c h r o e d e r 和b i s h n us a t a l 在i e e ei c a s s p 年会上提出了 用码本作为激励源的线性预测编码技术( c o d ee x c i t e dl i n e a rp r e d i c t i o n ,简称 c e l p ) n 引。c e l p 以高质量的合成语音及优良的抗噪声及多次音频转接性能,在 4 8 - 1 6 k b s 速率上得到广泛应用。1 9 8 8 年,美国政府以美国国防部与a t & t 贝尔实 验室共同研制的4 8 k b s c e l p 声码器为基础制定了标准n 引,即f e d s t d l 0 1 6 。1 9 8 9 年,北美数字移动通信8 k b s 速率全速率编译码器标准采用了修改的c e l p 技术: 矢量和激励线性预测编码( v e c t o rs u me x c i t e dl i n e a rp r e d i c t i v ec o d i n g ,简称 v s e l p ) 1 5 o1 9 9 1 年,c c i t i 通过了用短时延码激励线性预测编码( l o w d e l a yc o d e e x c i t e dl i n e a rp r e d i c t i v ec o d i n g ,简称l d c e l p ) 作为1 6 k b s 语音编码的标准n 7 1 , 即c c n t g 7 2 8 4 混合激励线性预测声码器 1 r i 公司和a s p 公司联合推出了混合激励线性预测( m e l p m i x e de x c i t a t i o n l i n e a rp r e d i c t i o n ) 声码器u 引。m e l p 声码器的采样率也是8 k h z ,每1 8 0 个样点位一 帧,帧长为2 2 5 m s ,每帧量化比特为5 4 ,总的速率为2 4 k b s 。 5 第三代移动通信声码器a m r a m r ( a d a p t i v em u l t i - r a t e ) 声码器算法是3 g p p ( 3 州g e n e r a t i o np a r t n e r s h i pp r o j e c t ) 于1 9 9 9 年公布的w c d m a 的语音编码标准,使w c d m a 系统m s c 设备中关键技 4 济南人学坝i :学位论文 术之一。 1 2 3 码本设计 1 基于l b g 算法的码本设计 l b g 算法n 铂n 町是由l i n d e 、b u z o 和g r a y 于1 9 8 0 年提出的一种码本设计算法,因其 理论上的严密性,实施过程简单以及较好的设计效果而获得广泛应用,并成为各种改 进算法的基础。这个算法既可以用于已知信号源概率分布的情况,也可以用于未知信 号源概率分布但给了训练序列的情况。目前多用训练序列来设计码本和矢量量化器。 但l b g 算法依赖初始码本的选择。初始码本的分布不当通常会在使用过程中造成算法 收敛缓慢和空的划分子集,即部分码矢量对应的样本为空,而同时另一部分划分子 集中又包含了过多的样本,这样得到的码本分布并不是对原样本分布的一个好的近 似。所以为了解决l b g 算法容易陷于局部最优解,相继的又有许多的优化算来被用来 进行码本设计。 2 基于遗传算法的码本设计 遗传算法( g e n e t i ca l g o r i t h m ,g a ) 是借鉴生物界自然选择和自然遗传机制的随 机化搜索算法,由美国j h o l l a n d 教授在2 0 世界6 0 年代提出来的,在2 0 世纪8 0 后期9 0 年 代初期理论逐步得到完善。其主要特点是群体搜索策略和群体中个体之间的信息交换, 搜索不依赖于梯度信息,尤其适用于处理传统搜索方法难以解决的复杂问题( 如非线 性问题) 。同时只需要利用适应度函数值来进行优化计算,而不需要函数导数等其他 辅助信息,因此可以解决各种优化问题;具有极强的鲁棒性;具有全局寻优能力和隐 含的并行性等。所以遗传算法作为一种新的全局优化的搜索方法被用来进行码本设 计,解决了l b g 算法容易陷入局部最优解得问题。 3 基于模拟退火算法的码本设计 19 8 2 年k i r k p a t r i c k 等人,将退火过程引入组合优化领域而提出模拟退火算法,该 算法是基于m o n t ec a r l o 迭代求解策略的一种随机寻优算法,其出发点是基于物理中 固体物质的退火过程与一般组合优化问题之间的相似性。k i r k p a t r i c k 等人从m e t r o p o l i s 对固体在恒定温度下达到热平衡过程的模拟中得到启示,将m e t r o p o l i s 准则引入到优 5 g s m 声码器收发任意数,信号的研究j 实现 化过程中,将一个组合优化问题比拟成一个金属物体,将问题的目标函数值比拟为 物体的内能,问题的最优解比拟成能量最低的状态,相应地,温度演化成控制参数 t ;然后,模拟金属物体退火的过程,从一个足够高的温度开始,逐渐降低温度,使物体 分子从高能量状态缓慢地过渡到低能量状态,直至获得能量最小的理想状态为止, 从而得到最优化问题的全局最优解。模拟退火算法能够有效地解决连续变量和离散变 量的全局寻优问题。模拟退火算法作为一种高效的随机全局优化方法,自然就被应用 到了码本设计当中。 4 基于p s o 算法的码本设计 1 9 9 5 年,e b e r h a r t 博士和k e n n e d y 博士基于鸟群觅食行为提出了粒子群优化算法 ( p a r t i c l es w a r mo p t i 2 m i z a t i o n ,p s o ) ,该算法是基于群体的演化算法,其思想来源于 人工生命和演化计算理论。r e y n o l d s 对鸟群飞行的研究发现,鸟仅仅是追踪它有限数 量的邻居,但最终的整体结果是整个鸟群好像在一个中心的控制之下,即复杂的全 局行为是由简单规则的相互作用引起的。p s o 算法对种群大小不十分敏感,即种群数 目下降时性能下降不是很大;p s o 收敛快,特别是在算法的早期。由于该算法概念简 明、实现方便、收敛速度快、参数设置少,是一种高效的搜索算法,近年来也被应用到 了码本设计当中。 1 3 课题的主要研究内容 本课题研究的是g s m 声码器收发任意数字信号,本质上是一种独特的基于声码 器原理,通过语音合成与分析处理实现数字信号发送与接收。信号的发送端为语音 合成器,源数字信号经纠错编码预处理后以一定的方式映射为关键的语音特性参数, 输入到语音合成滤波器,生成可传输的连续波语音信号;而对应的信号接收端为语 音分析器,对接收到的连续波语音信号进行语音特性参数分析,对语音特性参数进 行逆映射,并做纠错解码处理得到恢复的源数字信号。 本课题的实施方式: 1 语音特性参数的选择 用g s m1 3 k b s r p e l t p 语音编解码原理进行语音特性参数的提取,所要提取 的关键参数有l p c 系数、长时预测系数、长时预测最佳延时、激励序列相位、r p e 6 济南人学硕:i :学位论文 序列、以前子帧重构的短时残差信号、先前恢复出的语音信号。这些参数可以组合 成一个语音特性参数,通过一个语音特性参数可以合成一个语音信号。 2 码本的设计 码本设计的目的是要使码本当中任意一个码字经过解码合成语音信号,然后再 编码成码字,在码本当中能够唯一的找到相应的码字。而一个码字就是一个语音特 性参数。 3 语音特性参数映射 对待传送的源数字信号分帧处理,帧长为n 位,每帧作为索引输入,以语音 特性参数映射的方式对应得到相关语音特性参数值。 4 基于模型参数的语音合成及分析 通过得到的语音特性参数根据r p e l t p 声码器解码原理进行解码合成语音信 号,可使其在g s m c d m a 系统中使用的基于r p e l t p 技术的声码器、以及固话公 网中的p c m 、a d p c m 编码器中传输。 在信号的接受端进行的语音分析处理为语音合成的逆向操作,即从收到的信号 中提取语音特性参数,语音特性参数逆映射操作在相应的语音特性参数码本中找到 最接近于收到的语音特性参数,其索引值即为恢复的数字信号。 5 语音特性参数代码表( c o d e b o o k ) 的修正 对语音特性参数在表中的存放位置( 对应于索引参数) 按一定原则排列,如将 量化数值相近的语音特性参数集中存放,则量化数值相近的语音特性参数对应的索 引值较为接近。语音特性参数的恢复可更接近正确的数值,易于为纠错编码机制所 恢复。 6 声码器收发任意数字信号 模拟声码器收发任意数字信号的流程如图1 1 所示,通过反复实验和验证,把 该过程调整到一个稳定的状态,然后移植到致晟科技开发的一款智能p d a :s c - 1 0 0 p d a 上,实现其使用价值。 7 g s m 声码器收发任意数,信吁的研究与实现 图1 1 声码器收发任意数字信号的流程 8 济南人学硕i j 学位论义 2 1 概述 第二章语音编码 随着科技的不断进步,通信在人与人之间、人与机器之间也在不断地改善成为 高质量的无缝的信息交换手段。无论何时、何地,以任何方式通信,语音通信是最 基本、最重要的方式之一。无缝通信是指用户可方便的综合使用这些手段,而不影 响通信质量,并能随意地把一种通信手段转换为另一种通信手段;高质量是指通信 质量不随用户环境及传输媒介的变化而降低,用户使用起来方便快捷。这取决于信 息高速公路的建设和计算机、微电子、材料、网络、通信等诸多关键科学领域的发 展,而语音压缩编码是最基本、最重要的技术。 语音压缩编码一直是在用尽可能低的数码率获得尽可能好的合成语音质量的矛 盾中发展的。数码率实质上反映的是频带宽度,降低数码率实质上是压缩频带宽度。 当然随着数码率的降低,相应的算法延时时间和计算复杂度也要增加。所以语音编 码还面临的一些问题,比如极低数码率、低速语音编码合成语音音质要有更好的自 然度、声码器在高背景噪声环境下的使用、经多次音频转接仍能正常使用等等,所 以语音编码还有相当大的发展空间。 在数字通信中,语音编码往往和语音信号数字化密切相关。语音编码一般分为 信源编码和信道编码两种。信源编码是为了提高信号传输和存储的效率,在这里就 是压缩数字语音信号的比特率( 传输每秒钟语音信号所需的比特数,通常也称为数码 率) ,使得同样的信道容量能传输更多的语音信号,或者说,存储数字信号只需要较 小的容量,因而这一类编码又称为语音信号的压缩编码。信道编码则是为了提高传 输的可靠性而作的处理,又称为可靠性编码。 2 2 语音信号的线性预测 线性预测分析( 简称l p c 分析) 是进行语音信号分析最有效、最流行的分析技术 之一。l p c 分析的重要性在于:它提供了一组简洁的语音信号模型参数,这一组参 数较精确地表征了语音信号的频谱幅度,而分析它们所需的运算量相对来讲却并不 9 g s m 声码器收发任意数信号的研究1 j 实现 大。应用这组模型参数可以减低编码语音信号时的数码率,将l p c 参数形成模板储 存,在语音识别中也可以提高识别率和减少计算时间。此外,这种参数还可以用来 实现有效的语音合成。因此,l p c 分析技术已经成为语音信号处理的一个强有力的 工具和方法。 2 2 1 信号模型 在随机信号谱分析中,常把一个时间序列模型化为白噪声序列通过一个数字滤 波器日( z ) 的输出例。在一般情况下,h ( z ) 可写成有理分式的形式: ,、1 + 善b t z - t g h ( z ) = 一 1 。酗一 ( 2 1 ) 式2 1 中,系数a ;、包以及增益因子g 就是模型参数,因而信号可以用有限数目的 参数构成的信号模型来表示。假设被模型化的信号为s ( n ) ,模型输入为u ( n ) ,它的 z 变换分别为s 0 ) 和u ( z ) ,那么有 s ( z ) = h 0 ) u ( z )( 2 2 ) 从时间域上看,信号模型的输出与输入满足下面的差分方程: 删= 扣s o _ + g 耄岛“o - f ) ;1 ( 2 3 ) 式2 3 表明,s ( n ) 可以模型化为它的p 个过去值s ( n f ) 和输入“o ) 及其g 个过去值 比0 1 ) 的线性组合。从物理意义上讲就是s ( n ) 可由其过去值及输入信号值得线性组 合来预测得到,所以信号模型化和线性预测有内在的联系。 按数字滤波器日( z ) 的有理式的不同,可由如下三种信号模型:自回归信号模型、 滑动平均模型和自回归滑动平均模型。 1 0 济i 柯人学硕f :学位论文 2 2 2 线性预测误差滤波 信号模型的逼近过程本质上是个线性预测误差率波问题。线性预测误差滤波是 一种特殊的数字滤波【2 1 1 ,它的传递函数a ( z ) 由下式确定: 彳( z ) = 1 一罗口f z 一 ( 2 4 ) 它的输出e o ) 与输入s o ) 满足关系: e ( n ) 一s o ) 一洳) = s ( 玎) 一罗a , s ( n f ) ( 2 5 ) 式中,;o ) = 罗a i s ( n f ) 称为s ( n ) 的预测值或估计值。口i 则称为线性预测系数,输 出e ( n ) 是真值s ( n ) 和线性预测值;o ) 之差,称为线性预测误差。 设计一个预测误差滤波器,就是求解预测系数a ,使得预测误差e ( n ) 在某个预定 的准则下最小,这个过程称之为线性预测分析。理论上常用的是均方误差e e 2 0 ) 】最 小的准则,【】表示对误差的平方求数学期望或平均值。线性预测误差滤波相当于 一个逆滤波过程或逆逼近过程,当调整滤波器a ( z ) 的参数使输出e o ) 逼近一个白噪 声序列h o ) 时,那么,a ( z ) 和l h ( z ) 是等效的;而按最小均方误差准则调整滤波 器参数时,正是使输出e 0 ) 白化的过程。 2 2 3 语音信号的线性预测分析及解法 语音信号线性预测分析的基本途径是采用线性预测误差滤波方法,即求解一组 预测器系数,使得在一短段语音信号序列中均方预测误差最小,并把如此求得的参 数认为是语音产生模型中滤波器h ( z ) 的参数。 线性预测分析的关键是求解下面的方程组: ,j 一再口,i j 一f = 。lsj p ( 2 6 ) “: ( 2 6 ) ,( o ) 一弘r o ) = e p 式中,r ( j ) 式是待分析语音信号s o ) 的自相关序列。 r ( _ ) = e s ( n ) s ( n 一,) 】( 2 7 ) 为了解得预测器系数,我们必须首先计算出r ( j ) ( 其中0sj sp ) ,一旦计算出 g s m 声码器收发任意数字信吁的研究与实现 ,( ) ,则只要解式2 6 即可求得口,和e p ,并得到增益常数g = i 。因此,从原理 上说,线性预测分析是非常直截了当的,但是,计算自相关序列r ( j ) 却是个十分复 杂的问题。这是因为求自相关序列涉及到集合平均,不好处理。语音信号具有短时 平稳特性,我们只能从一短段语音信号序列来估计自相关序列r ( j ) ,从而计算出相 应的预测系数。因此语音信号线性预测分析一般都是按帧进行的,每帧的长度可取 1 0 。3 0 m s 之间。在假设待分析的一帧语音信号序列是平稳遍历的基础上,我们定义 自相关序列r ( j ) 的估计值为 厂( j ) = s ( n ) s ( n j )( 2 8 ) 为了取平均,式2 8 中的和式还应该除以语音段的长度。然而这个常数并不影响式 2 6 的求解,唯一要修正的是,将预测误差功率e 口理解成预测误差的能量即可,因 此这个常数可以忽略。这里要指出的是,当使用式2 8 作为自相关序列的估计公式 时,等效于在线性预测误差滤波中,用最d , - - 乘方准则代替了均方误差最小准则, 亦即在逆逼近过程中调整滤波器彳( z ) 的参数,使得相对于这一帧语音信号的预测误 差能量e 2 0 ) 最小。 根据中求和和范围订的定义不同,将导致不同的线性预测解法。经典的解 法【2 2 1 有两种:一是自相关法,而是协方差法。 自相关法是假定语音信号序列s ( n ) 在间隔0 墨n 墨n 一1 以外等于零,这相当于有 一无限长度的信号被一窗口所截取。不过对加窗处理后的信号作自相关序列估计, 会引进误差。在自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论