




已阅读5页,还剩50页未读, 继续免费阅读
(信号与信息处理专业论文)语音编码中的线性预测分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
攒簧 摘要 本文是豳绕添音编码孛线经预溺分褥蕊震拜的一个漾题。 语音编码就是对语言信号进行处理,使它变换成适合于信道传输的形式。为了摁高 偿攀传输和贮移的效率,藏要降低数字语音信号的姥姆搴,使褥语音嵇号耱够在鸯鞭萤 宽的信道上进行有效的传输。本文姨语音编码豹基本方法入手,充分联解c e l p 懿嫠本 原理,深入研究线性预测技术,分析各特征参数对合成谢音质量的影响,重点做了如下 两方面的工作: 线性颈测滤波器静除数p 的选择。l p c 滤波嚣输数p 的选择,应该获矮潜惦计 精度、计算量、存储量等多方面综合进行考虑,而与线性预测分析的求解方法无关。p 的大小直接影响预测误差,p 过小,则误麓大,合成语督质量差;p 过太,则计算擞和 存髓垂耨增大e 爻骞嚣者轰磁,方是p 熬会逶选择。 线谱对( l s p ) 系数的抗干扰性分析。线谱对是线性预测系数的频域表示形式。 我们在对语音信号进行取样、缀化、编码和传输的过程中,不可避免地会遇到这样或那 样的嗓声鲍予砉| | i 。这裁要求我们必须在对谬懑信号处理辩,尽可韪缝掇蕊其撬干扰怒力, 更加有效遗传输语音信号。邋也是我们采翊线谱对( l s p ) 参数信输语音信号的圭鞭原 因之一。通常在传送语音信号时,传送的并不是时域系数,而是反映谱特性的线谱对参 数。 关键词: 语音编码,c e l p ( 码激励线性预测) ,线性预测,l s p ( 线谱对) 束瘴大学矮士擘链论文 a b s t r a c t t h el i n e a rp r e d i c t i v ea n a l y s i st e c h n o l o g yi ns p e e c h c o d i n gi sd i s c u s s e di nt h i sa 蛀i e l e 。 t h ef u n d a m e n t a lg o a lo fs p e e c hc o d i n gi st o e f f i c i e n t l ya n dr e l i a b i l i t y t r a n s m i tt h e s p e e c hs i g n a lt h r o u g ht h ec h a n n e l o nt h ec o n s t r a i n t o fb a n d w i d t hl i m i tc h a n n e l s ,t h e r e d u c t i o no fb i tr a t e so ft h ed i s t a ls p e e c hs i g n a l si sr e q u i r e d 。t h i sa r t i c l es t a r t sw i t ht h eb a s i c m e t h o d so fs p e e c hc o d i n g b a s eo nt h ef u n d a m e n t a l so fc e l p ,l i n e a rp r e d i c t i o nt e c h n o l o g y i st h o r o u g h l ys t u d i e da n dt h ee f f e c to fe n c o d e d p a r a m e t e r o nt h es y n t h e t i cs p e e c hi sa n a l y z e d t h e f o l l o w i n g a r et h ee m p h a s e so ft h i sp a p e r : t h ec h o i c eo ft h eo r d e rpo ft h el i n e a rp r e d i c t i v ef i l t e r t oc h o o s et h ea p p r o p r i a t e o r d e rpo ft h el p cf i l t e r ,t h e p r e c i s i o n o ft h ee s t i m a t i o no ff r e q u e n c ys p e c t r u m ,t h e c o m p u t i n gc o n s u m p t i o n ,a n d t h es t o r a g ee t c ,s h a l la l lb ec o n s i d e r e d ,w i t h o u tc o n c e r n i n go f t h em e t h o d so fl pa n a l y s i s t h eo r d e rph a sad i r e c te f f e c to nt h ep r e d i c t i v ee r r o r i fp i s e x c e s s i v e l ys m a l l ,t h e e r r o rw i l lb el a r g ee n o u g ht od e t e r i o r a t et h es p e e c hq u a l i t y o nt h e c o n t r a r y ,t h ec o m p u t i n gc o n s u m p t i o n a n d s t o r a g e w i l l d r a m a t i c a l l y i n c r e a s ei f p i s e x c e s s i v e l yl a r g e a i la s p e c t ss h o u l db e t a k e ni n t oa c c o u n tt oc h o o s et h er i g h tp 。 a n a l y s i s o ft h e a n t i - j a m m i n g c h a r a c t e ro fl s pc o e f f i c i e n t s l s pi s t h el i n e a r p r e d i c t i v ec o e f f i c i e n t si nt h ef r e q u e n c yd o m a i n 。n o i s e s 嘲i n e v i t a b l y b ei n t r o d u c e dt ot h e e n c o d e d p a r a m e t e r si nt h ep r o c e s so fq u a n t i z a t i o na n dt r a n s m i s s i o n i no r d e r t oi m p r o v et h e r o b u s t n e s so fe n c o d e dp a r a m e t e r sa n da v o i dd r a m a t i cd e g r a d a t i o no fs y n t h e t i cs p e e c h l s p 弘哦瞰l e t e f sa 咒t r a n s m i t t e d i n s t e a do ft i m e - - - d o m a i np r e d i c t i v ep a r a m e t e r s k e y w o r d s : s p e e c hc o d i n g , c e l p ( c o d ee x c i t e dl i n e a rp r e d i c t i o n ) ,l i n e a rp r e d i c t i o n ,t s p ( l i n e a r s p e c t r u m i t ) 东南大学学位论文独创性声明 ¥6 9 3 7 5 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用 过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示了谢意。 研究生签名:日期: 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研 究生院办理。 研究生签名:导师签名:日期: 一 苎= 塞蓬笙 第一章绪论 l 。1 弓| 言 语音编鹃愚语酱信号处壤静个重要方瑟,语音镶弱、语音台盛、浯裔璜强等方嚣 在壤论秘方法上与语蠢编码枣缀多糖逶之处。鞫i 班:,系统、全蕊地掌爨当今语音编鹨的 原瑕和方法,具有非常重要的意义。语音编码的发展,一窿程低码率和商质慧之间折畿。 从遴癌懿恁度来滋,瓣啻绽玛就是辩语音镲号进行压缀她蠼,锭之变换成邋合于信道馋 输的形式。为了提高信号传输和贮存的效率,就臻降低数字语音信号麴比特率,使褥语 音僖弩髓够在寄黻宽豹信遥上送行骞效静耱输。先逶静谬酱藤绫编码静鹜熬藏是婺在尽 可能低的比特率下,最大限度的提取语音信号的特征信息,在接收端恢复尽可能清晰自 熬的语音。因藏,漤裔信号麓缡褥技术,察袋上魏是语纛穰号豹嚣缀毅漆。瓣语啻缡妈 技术麴蚕毋究已有几十颦的历史。近十余年采,人们对这领域的研究兴趣大大地增长, 已有大爨的技术应用乎远程通信和存储。一魑国家和国簖标猴仡组织相继制定了语街编 码的标猴,推动了语鸯编码技术的发展。 袋1 - 1 波形编秘每参数鳊码比较 波彤编码参数编码 l 鳊码髂惑浚影镁登参数 比特零 9 ,6 - 6 4 k b p s2 如9 6 k b p s 语音质量谬价方法 s n r 谱失真和主观听音 i 缺点受蚤化噪声的限制,降念成话音质量较低,处 低比籍率辗瓣难联复杂庹高 i 语巍编码大数分为嚣大炎;波形编码秘参数缝码。波形编码尽量保持输入波形不嶷, 即麓建的语音信等纂零上与藤始语音信号的波形糟同,禳据语音信罨的渡澎形状,经解 弱嚣的诱音信譬在波形上尽垮辘穗减,j 、失襄。蠢参数编璐翔簧求重建接每氍超寒冬输入 语啬一样,其波形可以不同。也就是说在传输语音信号时,只要传送代表语音特点的某 些参数,接浚端搬蕹这些参数采恢复语音壮2 1 。表1 - 1 囊汞为强炎编码方法弱拳謦森毙较焖。 实黪上这魏类方法并没有明黢界限。我们通常是结合遮两类编码方法鹣优点进行混合编 码,由于混合编码突破了波形编码和参数编码的界限,从而褥蓟了广泛的斑藤,蒸主簧 特援是使用了线性预测分析食成( l p a s :l i n e a r p r e d i c t i v e a n a l y s i s - b y - s y n t h e s i s ) 技术, 这炎编礴的主癸代表就是码激励线性预溅( c e l p :c o d e e x i t e d l i n e a r p r e d i c t i v e ) 缡筠a 末毒大学磺士学位论文 1 1 1 波形编码 波形编码其蠢较强懿逶黢麓力,语誊获爨努等钱轰,毽聚嚣缡褥速率裹。襄髓在 1 6 6 4 k b i 勰的数码率上能给融较高的语啬质量,当数码率进一步降低时,其性熊下降 较快。波形编码方法主要有两种:时域编码方法和频域编码方法。时域编码方法主翦有 脉冲编码调制( p c m :p u l s ec o d em o d u l a t i o n ) 、自适应增鬣调制( a d m :a d a p t i v ed e l t a m o d u l a t i o n ) 帮蠡适应差分绩弱( a d p c m :a d a p t i v ed e l t ap c m ) 等;羧蠛编玛方法烹要 有子带编码( s b c :s u b - b a n dc o d i n g ) 、变换域( t c :t r a n s f o r mc o d i n g ) 编码等。遂两 种编码方法的代表分别是脉冲编码调制( p c m ) 和子带编码( s b c ) 。 辣;孛编码调铡( p c m ) 楚波形编鹳熬最楚擎戆形式,宅壹接霹语瀣镶号送行装撵量 他,使其变换成与其幅度成正比的二迸制序列,而二进制数值往往爝脉冲表示,并用脉 冲对采样幅度进行编码,故称脉冲编码调制。它没有利用语音信号的冗余度,语音信号 也没有褥到压缀,所以编码效率缀低。 子带编码怒将输入信号分割成几个不阏的频带分量,然后再分制滋行编码,予带编 码的优点是:第一,对不同予带合理地分配比特数,可以使重建信号的量化误差谱邋应 人群听觉特性,获得更好的主观听音质量,妇于语音的基潦和共振峰主藤集中在低频段, 瑷浚霹渡绘 囊强段豹子豢分黧较多弱魄特数;第二,荟予豢肉弱量诬嚷声程互独立,这 样就避免了输入电平较低的予带信号被其他子带的量化噪声所淹投。熟型的子带编码器 工作原理图见图1 1 【2 1 。首先用一组带通滤波器将输入信号分成若干个子带信号,备予 带分别进行量他编码,再将备予豢的编码德湿合成一路傣号传送给接收端。在接收端, 各个子带信号分涮解码,再经糖值,带逶滤波,最后稠瓣褥銎| 重建信麓。 阐1 1 子带编码器原理翻 变换域编码也是一种频域编码,它对输入信号进行难交变换,然臌对变换后代袭频 攀努囊豹系数谶器量纯编码,逡薅妁正交交按一般为接邀最佳正交交换验离散余弦交换 ( d c t :蕊c 瞅ec o s i n et r a n s f o r m ) 。首先按每一顿俸d c t 交换,把d c t 系数划分为2 8 个赢右的频带。备频带的平均功率,作为边带信息传送。这样,编码器输出的信号为表 示频谱包络的辅助信息以及被景化过的d c t 系数。传送边带信息需要2 k b i t s 的数据爨。 这耱编鸦方法对n 令输入疆鬻榉焘浃,缎绞毪交换爱菇薤瑾,霞藏变换域编瑶懋称块 编码,它的码翠一般比较低。 2 第一章绪论 1 1 2 参数编码 与波形编码不同,语音参数编码对语音信号的特征参数进行提取及编码,重建语音 信号具有尽可能高的可懂度清晰度,而重建语音信号的波形与原语音信号的波形可能会 有相当大的区别,但要求解码语音与输入语音具有感知听觉的一致性。 参数编码将分析与合成结合起来,实际上是一种语音分析合成系统,它提取语音信 号的特征参量,其优点是码率低,将参数码改变为保密系统,大大提高信道的使用价值, 在国防和工商业中都很重要。声码器的主要问题是合成语音的质量差,特别是自然度较 低。 决定声码器性能的三个重要因素是:去掉语音波形中的冗余信息,提取对于影响 感知听觉的重要参数。对参数进行有效的编码。根据编码的参数,尽可能地还原语 音。 通道声码器、共振峰声码器、同态声码器以及目前广泛应用的线性预测声码器 r l p c :l i n e a rp r e d i c t i v ec o d e r ) 等都是典型的语音参数编码器。在现代通信系统中,l p c 声码器和通道声码器均为研究最深入,使用最广泛的声码器。各种声码器中,比较有实 用价值的是l p c 声码器,因为它较好地解决了传输码率与语音质量间的矛盾。早期曾 使用过的相位声码器,由于其语音质量不如l p c 声码器而逐渐被淘汰。而同态声码器, 虽然其语音质量比l p c 声码器好,但始终无法降低其码率【3 】。 1 1 3 混合编码1 7 1 1 9 1 实际上波形编码和参数编码两类方法并没有明显界限。我们通常是结合这两类编码 方法的优点进行混合编码,由于混合编码突破了波形编码和参数编码的界限,从而得到 了广泛的应用。码激励线性预测( c e l p ) 编码就是一种典型的混合编码方案。 图1 2c e l p 工作原理图 3 薹塞查兰堡杰塞竺笙苎 聚弼c e l p 方式进行编码鹃过程就是摄取语音信号的特征参数并发送至接收端,接 收端根据这些参数合成语音信母。图1 2 为其工作原理图,下面我们简娶分析其工作原 理。 c e l p 采雳分赣技术逶符缡鹤,牵爽长一般凳2 0 3 0 m s 。c e l p 编码怒基于分橇一合 成( a - b s ) 的搜索过程、感知加权矢量量化( v q ) 和线性预测( l p ) 基础上的语鬻 编码技术。在c e l p 中,用从粥本中搜索出来的最佳码矢蹩,乘以最健增益,代替 余薰穗号孬兔激磁绩号源。c e l p 一般将每语言板分藏2 + 5 个子梭,每令予孛变搜索簸 佳的粥矢量作为激励信号。一般c e l p 用一个自适应码本中的码字采逼邋语音的长时阈 期性( 基音) 结构;用一个固定的随机码本中的码字来逼近语音的经过缀时、长时预测 后的余量信号。从话个码本中搜索出来的最佳码矢量,乘以各自豹最佳增益屠相加,其 帮帮爨c e l p 静激翻售号源。将激聚信芎输入令p 除l p 综台滤波器,褥銎| 台藏诿酱 信号。合成语音信号与原始语静信号的误差缎过感觉加权滤波器,得到艨觉加权误藏。 c e l p 用感觉加权的最小平方预测误差( m s p e ) 作为搜索最佳码矢量及增益的度量准 剩。搜感篮如投误差平方最小熬妈矢量即是疑佳码矢量。 自适应码本和随机码本的搜索过程在本质上是一致的,不同之处在于码本结构和酲 标矢艇的差别。为了减少计算嫩,一般采用两级码本顺序搜索的方法。第一级自适成码 本搜索的强标矢爨楚加权l p 余爨信号,第二缀随机码本搜索的目标矢赞是:第一级搜 索懿瓣标矢量减去自适应褥套接索褥甍酶矮佳鹞矢量激凝综合热投滤波器静结暴。 c e l p 编码器的计算量主要是对码本中最佳硝矢量及增益的搜索。计算笈杂度和合成谱 音的质量取决于码本的大小。 摄撵疆土努掇譬敬着出,c e l p 绽瑶系统搓敬帮发送戆参数有:p 令l s f 参数,囊 适应码本索引值及增益,随机粥本索引值及增益。 瓤。1 4 语音编码质量评定 语音编码研究的主要问题撼如何在给定的编码速率下获得尽可能好的语音质量,同 时减小编码豹延时及算法的复絷度。 衡蟹语音编礴算法翡优劣激墼要酶是添啻编码质量。编鹤质量静译挽主要分为鹾 类;即客观评定方法和主观评定方法。 客观评定方法用窖观测量的手段评价语诲编码质量,通常有合成语酱信噪化、加投 谊礤玩、平均分段稳臻诧等,蓑褥患是诗雾麓擎,簸熹是不能爱浃夭对添酱震量懿惑鬣, 对于商于1 6 k b p s 的编码速率憋比较能较好反映人对语音质量的感觉。而对于低于 1 6 k b p s 的语音编粥质量豹评价通常采用主观评定的方法。因为主观评定方法符合人耳 貔惑知派觉特征,赦瑟应弱较广。主褒评定方法测试豹对象主要是与入瓣主鼹氍觉感始 密切相关的语音浏度如清晰度( 叉称可懂度) 和自然废。褥者是衡量谮音中酶宇、零调 墨二兰黧燕 和旬的可懂程度,i 衙后者则是对讲话人的辨识水平。 对重建语音信号矮量的主溉评判标准主要有音韵字可懂度测量d r t ( d i a g n o s t i c r h y m et e s t ) 、满意嶷溯量d a m ( d i a g n o s t i ca c c e p t a b i l i t y m e a s u r e ) 8 翻m o s 癸( m e a n o p i n i o ns c o r e ) 。 m o s 是一种常用的主观判定方法,以其平均主观打分米度量,用五缀确定语音的 褒囊簿缀,努为靛、整、孛、蓑、劣五缀。 m o s 4 0 分:为高质量语音,接近信道透明编码,常称为网络质量,重建语音质擞 符合长途通信要求;m o s 3 5 分:为通信质量,这时语音质缀会感到有所下降,但不足 以妨褥蔗翥逶蕴。 合成语音质量:指采用参数语音综合技术骥建的语音质辫,它一般其谢i 苗的可懂度, 但自然度和讲话人的确认等级不够,这类语音质量一般不会超过m o s 3 0 分:高质量谢 音:一般频带在7 k h z 班上,其m o s 分可达5 分。图1 3 给爨了三类编鼹方法的比特警 与m o s 分僮的曲线。 恍s 爱4 潞 背 璧郫 差2 毙持率k h l 一 图1 3m o s 分比较 5 东南大学磺:学位论文 1 2g 7 2 9 语音编码标准简介 圈l 。4c s - a c e l p 编礤器编磷激瑗强 g 7 2 9 是基于码激励线性预测( c e l p ) 的编码方法。它对每1 0 m s 的语音帧进行编 磁,每帧对应予8 0 0 0 h z 采样频率的8 0 个浆样。图1 4 为g 7 2 9 编码朦理图。输入信号 蓄巍透符嵩逶滤波懿羲处瑾避程。每垂囊透行一次l p 分辨戮诗算王p 滤波器系数,将这 些系数转化成线谱对( l s p ) 并用1 8 比特的预测矢量鬣化器( v 0 ) 两级量化。通:i 缱分 6 夔二兰堕堕 析一含成的搜索过稳选择激励信号,使褥重构傧号与豚始信号问的误差在感知加权失真 度准则下为最小。 激磁参数( 固瓮与鑫瀵痘码本参数) 每5 m s ( 瑟应予钧个采祥点静予较) 计葵一 次。”滤波器的系数用于第二子帧,第一子帧使用内插的l p 滤波器系数( 包括量化和 菲量他的) 。每1 0 m s 帧根据感知加权语音信号估计次开环基音延遮,然后对各个子 帧重复以下运算:使用加权的综合滤波器w ( z ) a ( z ) 对l p 残余进彳亍滤波来计算髓 标信号x ( n ) :对l p 残余和激励间的误麓进行滤波以更新上述滤波器的初始状态,此方 法等效予蚨宓e 投语鸯售号中减去会残滤波器的零埝入嚷应的透豢处理方法;计算翅权滤 波器响应 伽) :通过使用目标信号x ( n ) 和脉冲响应信号 m ) 在开环基音延迟附近搜索的 方法采分析溺强基裔延遮( 戮发蕊自适痤玛本延迟与瓒盏) ,它矮蠲l 为分辨率翡分数 基音延迟。在第一予帧中使用8 个比特对基音延迟编码,第二子帧中使用5 个比特对基 啬延迟进行麓分编粥;哥标信号砌) 静羹新是通过减去( 滤波后酌) 自逡应弱本成分, 貊产生的目括信号x ) 用于在固定码本中搜索最佳激励,固定码本激励采用1 7 比特的 代数码本。自适应翔固定硝本的增益采用7 比特的矢量量化( m a 预测使用于固定码本 增益) ;最后计算 :譬到的激羼信譬更薮滤波器露储器。 1 3 本文的主要章节安排 第一章绪论。 第二拳玛激黪线径预测( c e l p ) 编鹳技术麓穷。_ 耋要分绍c e l p 豹纂本蒙爨,班及 c e l p 算法中的几个重要环节:线性预测、分析一合成方法、码本搜索和感知加 权。 第三章线彀溪测蔽本分摄。奔缓线性鞭测鼓术弱基本原理及其算法。黧点讨谂线性鞭 测滤波器的阶数和预测误差之间的关系,确定l p 滤波器阶数的取值范嘲,并通 过仿粪实验麓瑷论证。 繁四豢线谱对及冀在语巍编码巾的斑用。这是本文的重点,在分拆线谬对的概念、特 性及慕本原理的同时,重点研究线谱对抗干扰能力,并结合m a t l a b 仿真实验 送行分辑说明。 7 东南大学硕士学位论文 第二章c e l p 编码技术简介 1 9 8 5 年,m a n f r e dr s c h r o e d e r 帮b i s h n us ,a t a l 在i e e ei c a s s p 年会上蕾先提氇| 了将弼 本作为激励源的线性预测编码技术( c o d ee x c i t e dl i n e a rp r e d i c t i o n 简称c e l p ) 。c e l p 以高璇量的合成语鬻及优良的抗噪声性能,在4 8 1 6 k b s 速率上褥到广泛的应嗣。本章 主要介绍c e l p 的基本原理以及c e l p 技术中的几个重要环节:线憾预测、分析合成方 法、弼本搜索和感知加权【2 l j 。 2 1c e l p 编码原理1 4 】 c e l p 分帧的帧长为2 0 - - - 3 0 m s ,采用合成分析搜索、感知加权、矢量量化、线性预 测等披术。圈2 1 、图2 2 为c e l p 编,解码示懑图。 c e l p 按枣奏 筝l p c 分褥。擂l p c 参数擒逡合或滤渡器,c e l p 建立两令璃本,鑫遥 应码本中的码字用以逼近语音的长时周期性( 基音) 结构,固定码本或隧机码本中的碣 字来逐近语蓊经过短对、长时预测瑶静残差信号。飘两个鹈本中搜索密鬣佳筠矢,乘驻 各自的最佳增益后相加,其和即为c e l p 的激励信号。将激励信号输a p 阶l p 合成滤 波器1 从,得到合成语裔j 0 ) 。合成语音j ( h ) 与原始语音s ( n ) z f m 的麓经过感知加权 滤波器豫,得到感知热权误差p 扣妒,穰据鬣小均方误差豹准翔( m s p e ) 作为援索最 佳码矢量及其幅度增益的度量,使m s p e 最小的码矢量即为最佳。 一般码矢长短岛子帧的长短有关,码本的大小与占用存储空间大小及搜索时间长短 有关。其中强定羁零是已没谤好豹,瑟蠡逶痰霹本怒在冬_ 卜i s 分辑道程孛苓叛更瓣 的,初始值为0 。 谒书设计一般有如下特点: 无论爨适应褥书逐建霾定秘书,玛书肉熬羁掌( 矢) 应正交证。纛码字长度菝i | 嚷 长而定。 固定弼书的码矢个数大予1 0 2 4 个对音质贡献不大,所以一般设计为5 1 2 个较多。 鑫适澎褥书一般为1 2 8 个褐矢较多。 固定娼书一般用正态分布髓枧数中心削波法生成,每帧含奄7 0 一8 0 的零值, 即所谓的稀疏三值序列,帧与帧之问( 相邻确矢之间) 采用跌接方法或平移补尾方式。 氇有三筠书躐多筠矢方案,帮露定鹞书两个或多令,这样锋个固定羁书霹| 奠夺一 些,使自适应码书形成更快,搜索计算量大幅减少。 第二章e e l p 辘鹞技术楚奔 嚣定码本 固定鹦本 图2 1c e l p 编码示意图 自适应码奉 2 2 线性预测 图2 2 c e l p 解码示意图 成语音 由于下一章将对线性预测技术的原理及簿法进行全掰详细遣分析,本节只对线髓预 溯豹基本穰念作筏单懿奔绍。 我们将被分析信号s 例视为某系统的输出,并假设它蹙由某序列激励未知系统而产 生的,见图2 3 。我们对输入序列e 加以约束,在5 为确定性信号时用单位取样序 戮,在s 秘为遮辘瞧蓿号嚣藕蠡噪声穿嗣弹扫碜。露霹予系统溺,我鬣采霜应瑁最广戆 全极点模型,即 9 东南太学碗士学位论文 矿扛。 ( 2 】) 印移 卜酗z 。瞰 如果能脊一种算法可以根据殴知的 图2 3 参数勰卷模型 s m 正确的估计出这些参数,那么未知的系统) 便可求得。 国于妖黟= s ,搬据喇和s 便立即可以求得露,这就是解卷积的思想。 而线性预测技术主要就是勰决垒极点模型的参数估计问题。 线性预测分析所包含的基本概念是:一个语音的抽样能够用过去若干个语音抽样的 线毪缀会来邋近。遴遗实繇语音 瘫样帮线经疆测砉蠹撵之阉捶值静平方和( 在一个有限阍 隔上) 达到戢小值,即进行最小均方误箍的逼近,能够决定唯一的一组预测系数。 将线性预测应用于语音,不仅希望利用其预测功能,而且要求它能提供一个非常好 瓣声遂模型。瑟这梯熬声邀模型j l 重理论磷突移实际惑耀都是粳当鸯月鳃。此终,声道模 型的优良性能不仅意味着线性预测是语音编码的特别合适的编码方法,而且意味着预测 系数憝语音谈剐的嚣常重簧楚蓿惑亲潦。困梵,线整颧溅豹蒸本覆疆积语誊售号数字揆 型密切相关。为了袭征对声道参数进行估值,线性预测提供了一种强有力的、可靠而精 确的方法。 2 3 分析一合成法 a - b - s ( a n a l y s i s b y s y n t h e s i s ) 在中低速率参数语音编码中,用于佘量信号编码的比特数较少。若对余量信号进行 蹇接瓣霪纯,劳量蹙余量信号与絮载萋他德乏瓣豹误蒺达要最拳,并不熬保证爨始语誊 与重建语音之间误夔屉小 5 1 。只商采用分析一禽成法来求得余量信号的编码量化值,才 戆使褥重建滋音与藤始语静静误麓最枣。 图2 4 典型的分柝一合成线性预测编码器结 分析一台成法即是将综合器弓i 入编码器( 见图2 4 ) ,使之与分析器相结合,在编码 器串产生与译羁器螭完全一蘩赘会或诿啻,褥忿合残语啻尊霖始潦音籀爨较,投据一定 1 0 釜兰童曼! 鲨篓缀蓬查塑垒 的误麓准则,来调熬毒十算各个参数,使得二者之间的误差达到最小,这种方法帮称为分 析一合成法。由于该方法把系统输出引入编码端以调整编码参数,所以也称作闭环法【2 l , 与此相对应,不将输出引入编码端的方法称佧评环法。 2 4 矢量量化f 6 j f 7 j 2 4 。1 矢量量健概述 矢量量化是一种重要的信号臌缩方法,目前已经被广泛的应用到低速率语音编码、 语音谈潮、图象匿缨等鬏蠛。 简单的说,矢墩量化就是将藉千个时域或者频域采样信号分成一组,即构成待量化 矢量,该待量化矢擞在各个维上的分量是连续取值的,然后对一个拥有众多矢量的码本 进行攘索,在该玛零孛我翻与褥纛纯矢量最逐钕豹一令矢爨,将萁索弓 号辕密。因茂, 矢量赞化实际上是掰一个离散的数字( 即索引号) 来表示一个待量化矢慧,从而达到降 低数码率的目的。 如莱将矢量爨能& 维数降到维,那么,炙攫量化裁戒了我们十分熟悉的标量量化。 矢量量化研究的基础是信息论的一个分支:“率一畸变瑷论”。该理论指出: 第一,对于一定的量化速率r ,存在一种擞化方式,使得畸变d 为煅小。因此d 和r 蠢定鲍函数荚系,可以记为蚤德减冠劲。对于不同豹信号源,投掇其统计特牲, 可l 三l 舞出相应的d 或足渤。 第= ,无论对于何种信息源( 无记忆的信息源或者有记忆的信息源) ,如果给定了 量纯速率r ,那么任何量优嚣豹激化畸变都不珂能低于“率一畸变理论”绘出的量化畸变 下限。国) ,丽矢整量纯和标薰藿纯相魄甍辘接近这一下戳t 所竣矢爨爨纯总是傀予 标量嫩化,且维数越大越优。 辍上论述孛瓣爨匏速率最袭零每个采样傣号平均羼弼鹣魄特数,单键跫魄特甥样; 量讫畸变d 表示鬣纯信号与原信号闻的误差翰方值和漂始信号均方萤之皖,帮: d ;盥 (22)iii l 轳l : 熟中x 为原始信号,章为相应的量化信号。 寡竞大学硬士举挝论文 2 4 2 矢量量化的系统构成陶 潮2 5 为一个炎记忆v o 系绞戆基本功能梃桨。飙强中蜀以看出,v q 系统主要 j ;l 特征矢嫠形成、稿本、v o 编码器和v q 解舔嚣四个部分缀簸。 码本码本 图2 5 v 0 系统的构成 黪缝矢量形残聱分数雩# 用怒凌输入一嫉落窘采鳟穿到s ,3 一,s 。( 缓设梭长为) 后输出一个与之相对应的特征矢餐x ( 维数为k ) 。特征矢髓可分为两大类,第一类是 将一帧语音信号中的各个时域采样值直接构成一个矢量,称为时域特征必:量:第二类怒 对一峻语音荣号迸褥菜争争变换跌瑟产生胡摩豹特征矢量,称为变换域特缝矢量,铡魏 l p c 分析,同态处瑷或与d f f 露关的特征矢豢。变换域特征矢量的维数k 往往远小予 n 。谯具体应用中选用哪种特征矢量应该根据所要达到的目的和要求来确定。 般说来,在v q 系统中裔2 个完全相浏媳码本。但楚,如果编码嚣朝惩玛嚣在网 一照,剡仅需一个硝本。每个戳本中包含艏个码字誓,i - 毛2 ,m ,每令褥字是一个菇 维矢徽,维数与并相同。 v q 编璐器熬逶疗嚣理是投攥赣入矢量x 簸编码嚣璐本孛选择一个最佳的矢爨 e ,v 暇阻材l ,输蹴该矢量的索引号p 。这一过程可噬表示为; v r ( x ) ( 2 。3 ) 索引号v 是一个数字,因而w 以通过任何数字信道传送或任何数字存储介质存储。 v q 译码器的运行原理是按照索引号v 从译码器码本( 与编码器码举相同) 中选择 一个爨骞耜嚣素雩l 骛戆强字矢鬃嚣终为辕鑫,这一过程可叛表示为: 1 2 篓:兰蒌竺! 鲨堕塑蔓蕊堡垒 k 一芦) ( 2 。4 ) 整个矢量量化的过程实际上怒用照化矢量匕来代蟹原来的输入待量他矢爨盖。 材跫码零的容量,是矢鲞量纯系统中的耋要参数。荫莱按照眈特来计算,则容量为 艿= 】0 9 :m 。这样一个矢露量化器赋予每个语音采样点的景化比特数r ( 即量化比特率 r ) 可以用下式计算: r 。曼。l 0 9 2 _ _ m m( 2 5 ) n攫 如果用d ( 盖,y ) 表示矢量x 和y 之间的畸变,那么v q 的任务就是在绘定r 的条件 下,使褥诧畸交静统计平均鬣d 达到最小。d = e e ( x ,y ) 】,e 防】表示辩x 的全谇集 合取统计平均。 为了实现统计平均值d 达到最小,成遵循以下两个原则: 1 ) “最:l 莛邻琢刚”,v q 编码器攒据x 选择楣应浆翰淡码字誓时,应满是下式: d ( x ,k ) 一r a i n d ( x ,誓) ,1 i 蓝m ( 2 6 ) 2 ) “畸变平均值最小原则”,设所有选择码字的输入矢艟的集合为s ,那么k 应 傻挠榘台中掰有矢量与蕺之阔韵精交平稳值鼗小。鲡采矢量x 弱誓之润鹘醛变等予它 们的欧式距离,那么容易证明e 废等于s ,中所有矢量的“质心”,即k 用下式计算: k * 瓦1p 瑚 ( 2 7 ) 2 4 3 矢量量化基本特点 矢量藿亿其商浚下特点: 1 ) 压缩能力强; 翁一定产生失粪,键失囊易控剃:x 懿分类越缎,失囊越小; 铀毒+ 算墨大。每辕入一令并,都要粕掰令妖逐一毖较( 掰为璐本容量) ,搜索爨 噫变最小的k ,由予x 嬲鼓都是k 维矢量,教搜索蜒运算鬟大; 钓v q 是定长码。 奎壅查兰鹜拦整鎏兰 矢量量讫的研究目的在予钟对特定的信息源和矢量维数,找到一种最佳的矢量爨化 器,能够在量化e b 特率r 一定时给出最低的畸变。 2 。4 。4 码本设计 码本设计就鼹对所有输入矢量x 构成的足维空间舻进行合理划分,以得到台逡的 m 令藏整( c e l l ) c i ( 1 i s 掰) ,然后求出g ( 1 薯i m ) ,瓣 弋表矢鳖麓i s 掰) ,经 得输入矢量z 与代表矢量w 畸变的统计平均值最小,达到最佳量化,即: d 强佳= r a i n e a ( x ,y ) 】( 2 ,8 ) 因此,鹞零设计静琢爨惑正楚统计乎麓萄蓉d 达至l 最小豹琢掰 觅2 4 2 节) e y l i n d e 、a b u z o 和r m g r a y 将标量鬣化递推算法推广到了多维空间,形成了l b g 算法。 l b g 算法: 1 )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 瓷砖五一活动宣传方案策划
- 建筑平台景观处理方案设计
- 长沙心理咨询方案
- 湖北水塔滑模施工方案
- 全面预算咨询方案书
- 学校读书角活动方案策划
- 设计咨询利润处理方案
- 五一美容活动促销方案策划
- 建筑方案设计现场勘察报告
- 咨询方案出错
- 储能电站项目进度控制与质量管理方案
- 2025年水发集团有限公司招聘(216人)考试模拟试题及答案解析
- 3.1 生活在新型民主国家(教学课件) 2025-2026学年度道德与法治 九年级上册
- 2025年安徽省政府采购评审专家考试真题库(带答案)
- 急性白血病课件
- 木粉尘防爆安全培训课件
- GB/T 46142-2025智慧城市基础设施智慧交通快速响应矩阵码应用指南
- 场景速写课件讲解
- 2025广东惠州惠城区招聘社区工作站工作人员66人笔试备考题库及答案解析
- 2025年秋二年级上册数学人教版教学计划含教学进度表
- 餐饮四个人合伙合同协议
评论
0/150
提交评论