




已阅读5页,还剩75页未读, 继续免费阅读
(电力电子与电力传动专业论文)基于嵌入式modem的小区数字语音对讲系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
广东工业大学工学硕士学位论文 a b s t r a c t t h ep r o n u n c i a t i o nt a l k b a c k ss y s t e mi sa l li m p o r t a n tc o m p o n e n to ft h ei n t e l l i g e n t s e r v i c eo ft h ed i s t r i c t i tc o n t r o l sd y n a m i c ss a f e l yi ni m p r o v i n gt h ed i s t r i c t ,i m p r o v e st h e e f f i c i e n c yo fm a n a g e m e n to ft h ed i s t r i c ta n dg u a r a n t e et h a tr e s i d e n t sl i f ea n dm a t e r i a l p r o p e r t ya l lp l a y i n gv e r yi m p o r t a n ti n f l u e n c e i no r d e rt om e e tt h es c a l eo fr e a le s t a t e c o n s t r u c t i o na n dn e e do fi n t e l l i g e n tc o n s t r u c t i o no ft h ed i s t r i c ta t p r e s e n t ,t h e p r o n u n c i a t i o nt a l k b a c k ss y s t e mi sc h a n g e di n t ot h ec o m p l i c a t e da n dd i s t r i b u t e dd i g i t a l s p e e c hs y s t e mf r o mt h es i m p l es i m u l a t i o ns y s t e mg r a d u a l l y , a n di th a sg o tv e r yg r e a t i m p r o v e m e n t i ns u c h a s p e c t s a ss t a b i l i t y ,m u l t i f u n c t i o n a l i t ya n dl o n gd i s t a n c e c o m m u n i c a t i o nt h a tt h ep r o n u n c i a t i o nt a l k b a c k s o u rc o u n t r yi nr e c e n ty e a r si n t r o d u c e d i g i t a ls p e e c ht a l k b a c ks y s t e m ,a n db e g i nt or e s e a r c ha n dd e v e l o pi n d e p e n d e n tf i g u r eo f i n t e l l e c t u a lp r o p e r t yr i g h tt a l k b a c kt h es y s t e mt o o ,t a l k b a c kt h i sp i e c es t i l lb l a n k p l a c e ,t h i s t e x tt oo fo u rc o u n t r yd i s t r i c tf i g u r et a l k b a c ks y s t e md e s i g ni s s u el a u n c hr e s e a r c ha t p r e s e n ti nd i s t r i c t t h i st e x ta n a l y s e sa n dc o m p a r e sa b o u tt h ed i g i t a ls p e e c hs y s t e ma n ds i m u l a t i o n p r o n u n c i a t i o ns y s t e ma tf i r s t ,h a v ee x p l a i n e da n dt a l k b a c k e dt h es y s t e m a t i cn e c e s s i t yi n t h ei n s t a l l a t i o nf i g u r eo ft h ed i s t r i c t , r e c o m m e n d e dt a l k b a c k i n ga tp r e s e n ta tt h es a m et i m e s y s t e m a t i cs t r u c t u r e ,o p e r a t i o np r i n c i p l e ,r e s u l to fu s e ,e t c t h ea r t i c l er e a l i z e st od i g i t a l s p e e c h ,t r a n s m i s s i o nm e a n sa n de m b e d d e ds y s t e mm a i n l yf r o mt h et h e o r ya n da n g l eu s e d t h a tt h r e ed i r e c t i o n sh a v ec a r r i e do nr e s e a r c h : t h r o u g hc o m p r e s s i n gt h ep r i n c i p l eo ft h ec o d ea n dc a r r y i n go nt h e t h e o r e t i c a l r e s e a r c ht op r o n u n c i a t i o ns i g n a lm o d e la n dp r o n u n c i a t i o n ,e n u m e r a t es e v e r a lk i n d so f p o p u l a rd i g i t a ls p e e c hc o d ea g r e e m e n ta n dw a ya tp r e s e n t ,h a ss u m m a r i z e dt h e i r a p p l i c a t i o ni nd i f f e r e n tf i e l d s ,t h e nc h o o s es u i t a b l ed i g i t a ls p e e c hc o d ea g r e e m e n tg 7 2 9 a , a n dh a sa n a l y s e da n dd e r i v e da b o u tt h ep r i n c i p l eo fi t sc o m p i l e dc o d e ,a n dh a se x p l a i n e d t h er e a l i z a t i o nw a yi nt h i sd e s i g n i t i si m i t a t e dm a n yk i n d so fp r o n u n c i a t i o n so ft h es y s t e ma tp r e s e n tt h a tt h r o u g h c o m p a r i n gt ot r a n s m i tt h ec o m p a r i s o nw h i c hr e a l i z et h ew a y , h a v ep r o p o s e dt h a tb e c a u s e o ft h ei m p l e m e n t a t i o nm e t h o db a s e do ne m b e d d e dm o d e m ,a n dh a si n t r o d u c e dt h ed e s i g n i i a b s t r a c t o fe m b e d d e dm o d e mi nd e t a i l d e b u gt h ee x p e r i m e n t a lr e s u l ta n di n d i c a t e ,c a nt r a n s m i t t h ep r o n u n c i a t i o nc o d ed a t as t e a d i l ye f f e c t i v e l yi nt h i sm e t h o d ,c a nr e a c ha n di ss c h e d u l e d t oc o n v e ya tal o n gd i s t a n c e t h e a r t i c l e ,a f t e rp r o p o s i n gr e a l i z i n g a n d t r a n s m i t t i n g t h em e t h o di nt h e p r o n u n c i a t i o n so fg 7 2 9 a + e m b e d d e dm o d e m ,h a v ed e s i g n e da n dd e v e l o p e d3 2a r m p r o c e s s o rb a s e do nm l 6 7 q 4 0 5 1a n ds o f t w a r ea n dh a r d w a r eo ft h ee m b e d d e dt e c h n o l o g y o fu c o s - i io p e r a t i n gs y s t e m e x p o u n dt h ef a c tf i g u r et a l k b a c ks y s t e ms t r u c t u r ea n de a c h f u n c t i o nd e s i g no fp a r to fh a r d w a r ei nd e t a i l ,a n dh a sd e v e l o p e dt h es o f t w a r eo ft h e c o r r e s p o n d i n gf u n c t i o nm o d u l e t h es u b j e c ti s s t i l lr e a l i z e do nt h ee m b e d d e ds o f t w a r e , h a sp r o p o s e dak i n do fs o f t w a r es t r u c t u r ew i t hh i g h e rp o r t a b i l i t y t h ee x p e r i m e n t a lr e s u l ts h o w s ,f i g u r et a l k b a c ks y s t e mr e a c hs t a b i l i t y ,p r o n u n c i a t i o n o fc o m m u n i c a t i o n ,i si ta r r i v eg o o dr e s u l tv e r yt of e t c ha tl o n gd i s t a n c ec o m m u n i c a t i o n , a n dh a sp u tf o r w a r dt h es o l u t i o no ft a l k b a c k i n go nt h eb a s i so ft h et h r e es i d e s s t r u c t u r e t h a tt h ew a yo fa d d i n ge m b e d d e dm o d e mo ft h ed i g i t a ls p e e c hh a sc h a n g e dt h et r a d i t i o n a l d i s t r i c ta n dt a l k b a c k e d ,h a v i n gi m p r o v e dw o r kq u a l i t ya n dm a i n t e n a n c ee f f i c i e n c yo f t a l k b a c k i n gi nt h ed i s t r i c t ,a n dt h eo n et h a th a sr e f l e c t e dt h ee m b e d d e ds y s t e mi sg o o da n d h a t e l l i g e n t k e y w o r d s :g 【7 2 9 as p e e c hc o d e ,a r m 7 ,e m b e d d e dm o d e m , u c o s i i ,e m b e d d e d s o f t w a r ef r a m e w o r k i n 广东工业大学工学硕士学位论文 独创性声明 秉承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是我个人在 导师的指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以 标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,不包 含本人或其他用途使用过的成果。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明,并表示了谢意。 本学位论文成果是本人在广东工业大学读书期间在导师的指导下取得的,论 文成果归广东工业大学所有。 申请学位论文与资料若有不实之处,本人承担一切相关责任,特此声明。 指导教师签字:7 诌妒0 论文作者签字:喜rj 卜旦鸪 夕8 年歹月弘日 绪论 第一章绪论 1 1 本课题研究的背景及意义 1 1 1 课题研究的背景分析 楼宇小区智能化建设在我国开始得比较晚,早前的楼宇小区几乎都是利用模拟 语音对讲系统来实现通话、监控和报警等业务,这是因为这些楼宇小区一般都是单 一的建筑或是小型的楼宇群,地域面积小,强弱电分布结构简单,干扰强度小。随 着中国改革开放的深化进行,中国的房地产业逐渐形成了较多的大开发商,现在的 楼盘大都是覆盖面积超大的小区。同时随着计算机技术的高速发展,以及人们生活 水平迅速提高而伴随的对楼宇小区配套设施的高标准需求,如今各种配套的监控和 安防设备纷纷进军小区,从而面对这种地域分布广大,强弱电结构繁多复杂,信号 电磁干扰强烈的小区环境,模拟语音对讲系统已无法满足人们的日常使用要求。 模拟语音对讲系统的先天不足: 1 、模拟信号在传输过程中容易受干扰,传输距离受到限制; 2 、功能单一,只用于单户一对一的通话; 3 、需配备解码器、隔离器、联网切换器、放大器等层间设备; 4 、由于传输距离限制,大型小区需建设多个机房中心,布线复杂,建设费用高; 5 、运营、维护麻烦,维护费用高。 数字语音对讲系统虽然在单个成本上比模拟对讲系统高,但它的优点在于: 1 、数字信号的抗干扰性强,即使数据受到干扰也可通过系统内部的编解码方式进行 数据恢复、噪声处理; 2 、功能众多,可进行多方通话,数据传输等; 3 、输距离不受限制,地域覆盖面积大; 4 、可利用现有的网络系统进行传输,布线简单,建设费用比模拟系统大大降低; 5 、运营、维护简单,系统稳定,维护费用低 因此数字对讲必然是楼宇小区对讲的发展趋势。 数字语音对讲的实现过程,首先主动呼叫端通过语音编码技术把模拟语音信号 广东工业大学t 学硕士学位论文 转换为数字信号,然后利用嵌入式处理器和各种总线技术或局域网、广域网技术将 数字语音信号传输到被呼叫终端,再使用相应的语音解码技术把数字语音信号转换 为模拟语音信号。由此可见在数字语音对讲系统中的关键技术主要是语音信号压缩 编解码处理和数字语音如何传输两个部分。 语音信号编码技术有可归纳为三种【l j : 1 、波形编码一一波形编码方式是能够忠实地表现波形的编码方式。语音信号的波形 编码力图使重建的语音波形保持原语音信号的波形状态,具有适应能力强、话音 质量好、抗噪抗误码能力强等特点,但是波形编码所需的编码速率比较高,其速 率一般在6 4k b 彬s 1 6k b i t s ; 2 参数编码一一参数编码是根据声音的形成模型,把声音变换成参数的编码方式。 其基本方法是通过对语音信号特征参数的提取及编码,力图使重建语音信号具有 尽可能高的可懂性,即保持原语音的语义。优点是编码速率低,通常小于4 8 k b i t s , 有时可以低至6 0 0b i t s 2 4k b i t s 。缺点是合成语音质量差,自然度较低,对讲 话环境噪声较敏感,且时延大; 3 混合编码一一混合编码结合了以上两种编码方式的优点,采用线性技术构成声道 模型,不只传输预测参数和清浊音信息,而且预测误差信息和预测参数同时传输, 在接收端构成新的激励去激励预测参数构成的合成滤波器,使得合成滤波器输出 的信号波形与原始语声信号的波形最大程度的拟合,从而获得自然度较高的语 声。 由于数字对讲中对即时语音的要求较高,语音的编码速率是一个很重要的参数, 既要保证单位时间内传输语音包的帧数,又要兼顾语音信号的质量,所以在当前的 数字对讲产品中应采用混合编码技术,其中代表有g 7 2 3 和g 7 2 9 语音压缩编码算 法。 随着嵌入式技术的高速发展以及总线技术和网络技术的不断成熟,数字语音的 传输方式也发生了巨大的变化。从原来的4 8 5 总线、c a n 总线发展到先进的楼宇智 能化总线l o n w o r k s ,再到基于t c p i p 的局域网和广域网方式。不同传输技术的运用, 将决定系统的成本、稳定性、传输速度、覆盖面积、用户功能等重要因素。因此应 结合我国现阶段的房地产发展情况,开发适用的数字语音产品。 2 绪论 1 1 2 数字对讲国内外技术现状 智能楼宇小区在我国虽有1 0 多年时间,但还属于方兴未艾的时期,还没有统一 的技术标准,相关的标准和规范还在定制当中。目前楼宇数字对讲的主要技术和产 品缺乏开放性、兼容性、百家争鸣,各自为阵。 目前楼宇数字对讲技术产品主要分为两大阵营:“网络派和“总线派”1 2 。网 络派主张整个社区以计算机网络集成技术为平台,实行多网合一。所有的产品都以 计算机网络应用为基础,因此它对该类产品的技术和成本要求都很高,国内大多数 厂商处于观望态度,实际投入研究和生产的为数不多。现在主要的产品有基于i n t e m e t 的v o 口系列产品。另一派主要是以国外诸多知名公司,如:h o n e y w e l l 、西门子、 江森等公司,在我国的楼宇控制中占据较大市场比重的“现场控制总线 派,采用 的总线技术有l o n w o r k s 、c a n 、b a c n e tm o db u s 等,采用总线技术可以把小 区中原分散对讲系统实现互联组网,统一管理,协调运行。这一派中国内也有厂家 竞相推出了自己的产品,如深圳视得安、广州市安居宝、深圳卫锐通、福建立林、 中山奥敏等【3 1 。以上两派的产品成本都较高,在智能大厦中的占有率较高,但由于价 格、维护、布线、运营等诸多问题,在社区中还未普遍被人接受。 还有一类( 以我国安防产品厂家为主) 以4 8 5 总线通信技术为基础,构建楼宇 小区数字对讲控制管理平台,其优点是成本低,但抗干扰能力差,通信速度慢,布 线距离短,在较大规模的社区实行实时控制中就会暴露很多问题。 1 1 3 课题研究的意义 目前我国g d p 正以每年8 1 0 个百分点增长,城市化进程越来越快,房地产作 为居民的必须消费品也将处于持续平稳发展中,开发商也致力于开发超大地盘面积 智能化控制小区,对小区配置设施提出了很高的要求。 现代楼宇小区配套对讲设备的发展方向是通讯稳定性高、语音质量好、可组网 进行分布式控制、运营费用低、维修方便。数字语音对讲系统正是楼宇对讲的必然 发展趋势,作为安防监控、电梯报警等多项小区监控配套设施的重要组成部分,它 对于提高小区管理效率,维护小区安全,保护居民财产都起到重要的辅助作用。 研究开发基于嵌入式m o d e m 传输和语音混合编解码方式的数字语音对讲系统, 形成有自主知识产权的特色产品,具有较高的社会价值和研究意义。高性价比的 广东工业大学工学硕士学位论文 a r m 7 嵌入式处理器结合长距离稳定工作的嵌入式m o d e m 传输方式,将是实现楼宇 小区数字对讲系统分布式控制的一个发展方向。它的研发成功可以有效提高产品的 质量和加工效率,有利于拉近我国楼宇小区数字对讲技术与国外先进水平的差距、 填补国内楼宇数字对讲系统生产企业的不足,对提高我国经济效益和社会效益都有 着重要的意义。本项目的研究符合现代楼宇小区对讲系统的发展趋势,能很好地满 足我国现阶段楼宇小区发展的需要,具有极大的市场潜力和经济效益。 1 2 本课题的来源及研究的主要内容 1 2 1 课题来源 企业横向项目。 1 2 2 课题研究的主要内容 论文针对当前国内楼宇小区数字对讲的普遍使用状况,提出了基于嵌入式 m o d e m 和g 7 2 9 a 数字语音编解码方法的数字对讲方案,并对整套系统进行了设计 与应用。研究内容分为六章,分别从理论和应用的角度对课题的重点难点进行了深 入分析。本课题旨在对数字语音编解码方法进行理论分析和嵌入式产品的实际开发 设计。主要的内容包括以下几个部分: 第二章数字语音编解码技术的介绍。对数字语音多种编解码方法的分析并进行 优缺点对比,并就g 7 2 9 a 语音编解码方法进行重点阐述。 第三章系统硬件平台的阐述。首先从整体的设计方案,再到功能模块的电路设 计,最后到系统的抗干扰设计,文章都进行了详细的论述。 第四章是关于嵌入式技术和嵌入式操作系统的介绍。列举了目前常用的嵌入式 操作系统,并就它们的优缺点进行比较。详细介绍了嵌入式操作系统u c o s i i 的相 关原理,并着重描述了本系统使用的基于a r m 7 内核的o k i 芯片的移植方法。 第五章嵌入式软件结构的分析以及本课题的软件设计。 第六章实验结果讨论。首先是系统和功能模块的实验和调试实验结果的讨论, 最后是对全文的结论与展望。 4 广东工业大学硕七学位论文 第二章语音编码原理及实现 2 1 语音信号的数字模型 人体的发声器官由三部分组成:喉、声道和嘴。发声时,首先由肺部收缩送出 空气流,空气流经气管通过喉头声门处时带动声带振动。由声带振动激发声道中 空气发生振动,从口腔和鼻腔向外辐射即产生声音。按照激励源的不同,语音可 以分为三类: ( 1 ) 清音,激励空气流是空气流高速通过声道的某一收缩部分而产生的湍流。 ( 2 ) 浊音,激励空气流是准周期性脉冲气流,由绷紧的声带做张驰式振动产生。 ( 3 ) 爆破音,激励空气流是声道在完全闭合的情况下突然开启后释放的空气流。 根据发声气管和语音的产生过程,在实际应用中为了简化语音信号产生的数 字模型,激励源分为浊音和清音两个分支,浊音由周期性脉冲序列激励产生,清 音由随机噪声激励产生,为了使浊音的激励信号具有声门气流脉冲的实际波形, 还需要将周期性脉冲序列通过一个声门脉冲模型滤波器,其传输函数g ( z ) 表示为: 1 1 q 力= 丽两丽 2 1 声道可以看作是一个变截面积管加以研究,采用流体力学的方法可以导出, 在大多数情况下,它是一个全极点函数,这样,声道的全极点模型的传输函数v ( z ) 的表达式为: 1 v ( z ) = 百二一 ( 2 2 ) y 罐z 叫 嚣 其中,a o = l ,a i 为实数,这里将截面积连续变化的声管近似为p 段短声管的串 联,每段短声管的截面积近似不变,p 值越大,模型的传输函数与声道实际传输函 数的吻合程度越高。但对大多数实际应用而言,p = 8 1 2 就能满足要求。 语音的激励气流经声道传至嘴,由嘴向外辐射。嘴的张开形状会影响语音信 号频谱的形状,嘴唇处的辐射模型的传输函数r ( z ) 可以由下式表示: r ( z ) = r o o - z 。1 ) ( 2 3 ) 广东工业大学工学硕士学位论文 综合上面的分析,语音信号产生的数学模型如下图2 1 所示:其中增益因子a v 和a n 分别用于调节浊音语音和清音语音的幅度或能量。整个模型的系统函数h ( z ) 可以表示为: 肌z ) = g ( z ) 以z ) 尺( z ) ( 2 4 ) 在上述语音信号产生的数学模型中,g ( z ) ,r ( z ) 保持不变,a v ,a n ,清浊判 决,声道参数a i 都是时变的。发声气管的惯性使这些参数的变化速度受到限制。 对于声道参数,在o 3 0 m s 内近似不变,语音分析帧长一般为2 0 m s 左右。对于激励 参数,在5 m s 左右近似不变。 图2 - 1语晋信号的产生模型 f i g 2 1m o d e lo fc r e a t i o no fs p e e c hs i g n a l 数字语音处理中的语音分析和语音合成问题都是基于上述模型来实现的。语 音分析是根据原始语音信号来估计信号模型的参数,而语音合成则是利用信号模 型参数产生出在可懂度和自然度方面可接受的语音来,语音信号的这种分析合成 系统在中低速率语音编码中应用十分广泛。 2 2 语音编码的分类和原理 2 2 1 语音编码的分类 语音信号处理包括语音识别、语音合成、语音编码和说话人识别四大分支。 语音编码技术主要应用在数字语音通信和数字语音存储两个领域,其研究的内容 是如何在尽量减少失真的情况下,高效率地对模拟语音信号进行数字表达。 传统上,语音编码技术分为三类:波形编码、参数编码( 声码器) 和混合编码。 6 第二章语音编码原理及实现 波形编码技术以尽可能重构语音波形为原则进行数据压缩。它具有语音质量好, 抗噪声性能强等优点,但是所需的编码速率高,一般在6 4 k b i t s 1 6 k b i t s 之间。而 参数编码则从听觉的角度注重语音本身的重现。它通常是基于某种语音产生模型 假定,在编码端分析出该模型的参数并对之编码,在解码端则利用模型参数重新 合成语音。它具有编码速率低的优点,可以达到2 4 k b i t s 以下,但语音质量差, 而且对噪声较敏感,健壮性不够好。混合编码是波形编码与参数编码的有机结合。 与参数编码相同,它也是基于语音产生的模型的假定并采用了分析与合成技术, 同时它又利用了语音时间波形信息,增强重构语音的自然度。语音质量较参数编 码有明显改善,编码速率在4 k b i t s 1 6 k b i t s 之间。这类编码主要有:多脉冲线性 预测编码( m p l p c ) 、规则脉冲激励线性预测编码( r p e l p c ) 、码激励线性预测 编码( c e l p c ) 、低时延的码激励线性预测编码( l d c e l p c ) 。 2 2 2 语音压缩编码的原理 i p 网络电话中的语音处理需要解决的一个重要问题就是在保证一定话音质量 的前提下,尽可能降低编码比特率。这主要依靠语音编码技术来解决。i p 电话宜 使用i t u t 定义的低比特率编码标准,其比特率为5 3k b i t s 1 6k b i t s ,均为低 复杂度编码算法,话音分组长度在3 0m s 以下,话音质量较好。从前面列举的几 种编码方式也可看出,同一段语音信号,采用不同的编码方式,其编码后的比特 率各不相同。那么为什么我们能够对语音信号进行压缩编码从而达到降低语音信 号的比特率呢? 1 、利用了语音信号的相关性 语音信源是相关信源,因此经过采样和量化的信号之间还有很强的相关性, 为了降低编码速率,人们就希望尽可能多地去除语音信号之间的相关性。线性预 测编码技术( l p c ) 就是一种用来去除语音信号之间相关性的常用技术。语音信 号中存在两种类型的相关性:其一是在样点之间短时相关性。语音信号在某些短 时段中呈现出随机噪声的特性,在另一些短时段中,则呈现出周期信号的特性, 其他一些是二者的混合。简而言之,语音信号的特征是随时间而变化的,只是在 一短段时间中,语音信号才保持相对稳定一致的特征,也就是语音信号的短时平 稳性。其二是相邻基音周期之间存在的长时相关性。由于语音信号中的短时相关 广东工业大学工学硕士学位论文 性和长时相关性很强,通过减弱这些相关性,使语音信号之间相关性降低,然后 再进行编码,这样就可以实现语音压缩编码,降低比特率【l 】。 2 、利用了人耳的听觉特性 利用人耳的掩蔽效应也可以进行语音压缩编码,降低比特率。两个响度不等 的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成 分的感觉,使其变得不易被察觉,这就是我们所说的掩蔽效应。在语音频谱中, 能量较高的频段即共振峰处的噪声相对于能量较低频段的噪声而言不易被感知。 因此在度量原始语音与合成语音之间的误差时可计入这一因素。在语音能量高的 频段,允许二者的误差大一些,从而进一步降低编码比特率。为此引入一个频域 感觉加权滤波器w ( f ) 来计算二者的误差。感觉加权滤波器的频率响应中的峰、谷 值正好与语音谱中相反。所以感觉加权滤波器的作用就是使实际误差信号的谱不 再平坦。而是有着与语音信号谱具有相似的包络形状。这就使误差度量的优化过 程与感觉上的共振峰对误差的掩蔽效应相吻合,产生较好的主观听觉效果。 3 、线性预测分析合成编码方法 i p 网络电话中所使用的语音信号压缩编码方式大多数是基于合成一分析法的 线性预测编码( a b s l p c ) 方法,这是一种混合编码方法。线性预测技术就是用 过去样点的线性组合来预测当前样点。假如用s ( n ) 代表原始语音信号,用线性预 测的方法求出预测器的系统预测系数a i ,构成线性预测逆滤波器,s ( n ) 通过该滤 波器后得到了去除短时相关性的语音信号。再将其进行基音预测,建立基音逆滤 波器。去除它的长时相关性后,就可得到最后的残差信号。残差信号是完全随机 的、不可预测的部分。根据速率的不同要求,可对残差信号采用不同的量化方法, 从而得到不同的编码速率,让量化后的残差信号作为激励信号依次通过基音滤波 器与线性预测滤波器后,便得到了合成语音信号,见图2 2 。 r 一 r _ 飞1 鬟越) l 激磁髂蟹卜叫麓啬滤渡器卜刊线性後爨过渡器卜斗 图2 - 2 语音生成模型 f i g 2 2m o d e lo fs p e e c hc r e a t i o n 编码的过程就是不断改变模型参数,使模型更好地适应原始语音信号。为此 第二章语音编码原理及实现 又引入了合成分析的概念。同时,利用人耳的掩蔽效应,引入了感觉加权滤波器。 综合以上两方面,可以得到图2 3 所示的线性预测分析一合成编码的方框图。 图2 3 线性预测分析一合成编码方案 f i g 2 - 3l i n ep r e d i c t i o na n a l y z e s y n t h e s i se n c o d es c h e m e 合成一分析法的基本原理可以概括如下:假定一原始信号可以用一个模型来 表示,这个模型又是由组参数来决定的,随着这组参数的变化,模型所产生的 合成信号就会改变,原始信号与合成信号之间的误差也随之而变化。为了使模型 参数能更好地适应原始信号,可以规定一个误差准则:当误差越小,模型合成信 号就和原始信号越接近。这样总能找到一组参数,使误差最小,此时这组参数决 定的模型就可以使用。一般在编码端配备编码和本地解码两个部分。配备本地解 码的目的是完成合成功能,以便计算原始语音信号与合成语音信号之间的误差值。 在图2 3 中之所以采用反馈控制,是为了求出最佳模型参数,使合成语音与原始 语音在某种准则下最为接近。 基于合成一分析法的线性预测编码的过程实质上就是不断地改变模型参数, 使模型更好地适应原始语音信号的过程。原始语音信号被分成帧,帧的长度和模 型参数决定了编码速率。 2 3g 7 2 9 语音编码标准 2 3 1 ( 3 7 2 9 概述 1 9 9 5 年1 1 月,i t u - t 通过了共扼代数激励线性预测( c s a c e l p ) 的8 k b p s 的语音 编码g 7 2 9 标准,并于1 9 9 6 年6 月通过g 7 2 9 附件,使之正式成为国际电信标准。 g 7 2 9 的主要应用领域是个人移动通信,数字卫星系统和高质量数字移动无线通 9 第二章语音编码原理及实现 2 3 3g 7 2 9 译码原理 图2 4g 7 2 9 编码原理图 f i g 2 4p r i n c i p l eo ft h eg 7 2 9e n c o d e r 图2 5 为译码器原理框图。相对于编码来说,译码是其反过程,算法比较简单。 1 、译码器首先从比特流中抽取参数指标( 对于每个1 0 m s 话音帧来说) 且i j l s p 系数、 两个子帧的分数基音延迟、两个子帧的固定码书矢量、自适应码书增益和固定 码书的增益。 2 、对l s p 系数译码,内插,转换为l p 滤波器系数。 3 、构造激励。将译码后的自适应码书矢量( e h 自适应码书增益定标得到) 和译码后 广东工业大学工学硕士学位论文 固定码书矢量相加即可。 4 、重构话音。通过l p 合成滤波器系数及后置处理器处理重构话音。 5 、后置处理。包括自适应后置滤波器滤波、高通滤波器滤波以及定标运算等。 自适应后置滤波器是级联的3 个滤波器:长期后置滤波器h j ( z ) 、短期后置滤波 器h j ( z ) 和斜补偿滤波器h 。( z ) ,继之以自适应增益控制过程1 7 1 。 2 3 4g 7 2 9 协议的拓展 图2 5 ( 3 7 2 9 译码原理图 f i g 2 - 5p r i n c i p l eo fg 7 2 9d e c o d e r 在g 7 2 9 协议的基础上,针对不同的使用场合,又可以分为g 7 2 9 a 、g 7 2 9 b 、 g 7 2 9 d 、g 7 2 9 e 几种算法,这几种算法都是在g 7 2 9 协议的基础上进行简化和扩 展所得【1 3 1 。 1 、g 7 2 9 a 是g 7 2 9 的简化版本,与g 7 2 9 相比,g 7 2 9 a 在感觉加权、开环基音分析、 闭环基音搜索、固定码本搜索和后处理中进行了简化处理【l 。g 7 2 9 a 的感觉加 权滤波器用的是量化后的l p 系数构成,这样简化了感觉加权合成滤波器,并且感 觉加权因子固定为0 7 5 。g 7 2 9 a 在进行开环基音分析时,通过计算偶数抽样的相 关函数来确定,它同样在 2 0 ,1 4 3 范围内搜索,但当它在 8 0 ,1 4 3 的范围内进行 基音搜索时,它在所选基音时延+ 1 或1 的时延上进行测试,从而确定开环基音。 g 7 2 9 a 在进行闭环基音搜索时,它是通过过去的激励信号与后向滤波目标信号的 相关函数达到最大来确定,它在具体搜索时,分别在【- 1 3 ,0 ,+ 1 3 】处插人前 一个激励,然后看哪个使相关函数最大,从而确定选哪个分数。g 7 2 9 a 在进行码 本搜索时,采用深度优先树的搜索方法,只需搜索2 ”中的3 2 0 种可能使搜索算 1 4 第一二章语音编码原理及实现 法复杂度大大降低。此外,g 7 2 9 a 在后处理中对自适应滤波进行了简化,即g 7 2 9 中的长时延t 总是整数,并且只在范围【t o 3 ,t o + 3 内寻找。g 7 2 9 a 通过对g 7 2 9 进行简化,使其运算量大大降低,同时也能保持算法具有良好的语音质量。 2 、g 7 2 9 b 是g 7 2 9 的变速率版本。它主要是通过v a d ( v o i c ea c t i v ed e t e c t i o n ) 技术 对语音和噪声进行分类,采用d t x ( 非连续传输) 算法和c n g ( c o m i o rn o i s e g e n e r a t e r ) 算法对无声信号进行处理,从而达到降低平均速率的目的,g 7 2 9 b 的平 均速率为4k b i t s 。g 7 2 9 b 采用的是m u l t i - - b o u n d a r y 话音激活检测算法,它首先提 取出四个参数:线谱频率( l s f ) 、全带能量、低带能量和归一化过零率;然后分别 计算当前帧的四个参数与噪声相应参数的差值,根据判决门限进行判决,并对判 决得到的结果进行平滑;最后对背景噪声参数的运行平均数进行修改。v a d 将输 人信号分成两类:有声和无声,对于有声信号,g7 2 9 b 进行全速率编码;对于无 声信号,g 7 2 9 b 通过采用d t x 算法和c n g 算法进行处理。d t x 算法通过计算每帧 的两个参数( 噪声谱失真噪声能量) 来决定是否发送背景噪声信息,当背景噪声变 化比较太时,g 7 2 9 b 用1 5b i t 对无声信号编码;当背景噪声变化不大时,g 7 2 9 b 不发送任何信息。在接收端,g 7 2 9 b 采用c n o 算法产生舒适背景噪声。由于g 7 2 9 b 平均速率的降低,提高了信道的容量利用率,使它能在移动通信、卫星通信等许 多领域得到广泛的应用【4 】。 3 、g 7 2 9 d 是g 7 2 9 的低速率扩展版本,g 7 2 9 d 在码本结构、增益量化、第二子帧 基音延时、后处理等方面进行了改进,改进后的算法速率降为6 4k b s 。g 7 2 9 d 用一个新的代数码本代替原来的代数码本,新的码本中的码矢量只用两个有极性 的脉冲表示,两个脉冲在两条互相重叠、长度不等的“音轨”上,第一个脉冲的 可能位置只有1 6 个,而第二个脉冲的可能位置有3 2 个,它在对码本搜索时采用全 搜索算法,相应地,它对码本的增益量化也进行了重新设计。其中对每个子帧的 码本增益分配的是6 比特。g 7 2 9 d 在对第二子帧进行基音搜索时基音的整数部 分的搜索范围变为:【i n t ( t 0 5 ,i n t ( t 1 ) - 2 】和 i n t ( t 1 ) + 1 ,i n t ( t 1 ) + 4 ,基音的分数 部分的搜索范围变为: i n t ( t 1 ) 1 2 3 ,i n t ( t 1 ) + 2 3 】,其中t 1 是前一帧的基音值,这 样对第二子帧的基音只需要甩4 比特编码就行了。由于g 7 2 9 d 码本中的脉冲数很 少,所以g 7 2 9 d 在g 7 2 9 基础上增加了一个后处理滤波器用来降低稀疏代数码本的 不利影响,滤波器主要根据ip t 增益来对信号的能量进行扩展即当l p t 增益很 低时,能量在噪声部分扩展最宽;当l p t 增益居中时,能量扩展程度居中;当ip t 1 5 广东工业大学工学硕士学位论文 增益很高时,对浊音部分不进行能量的扩展。改进后算法的速率得到较大的降低, 语音质量下降很少,所以它有望替代h 3 2 4 标准框架中的g 7 2 3 1 而成为其中的语 音编码标准桫j 。 4 、g 7 2 9 e 是g 7 2 9 的高速率扩展版本,g 7 2 9 e 对l p 分析、后滤波、感觉加权、码 本结构等进行了改进,改进后的算法速率为1 1 8k b s 。由于g 7 2 9 e 特别增加了对 音乐信号的处理,所以它增加了一个后向的l p 分析( 3 0 阶) 来针对音乐信号进行处 理,这样,g 7 2 9 e j ( j 应地设计了前向后向自适应码本和前向后向固定码本,并 且它根据辅人信号的平稳度来选择l p 分析滤波器( 前向还是后向) ,两个l p 分析以 帧为基础,前向l p 针对输人信号,后向l p 针对合成信号,在进行l p 分析切换时, 需要对切换进行平滑以使人耳感觉不到明显的切换影响,在比特分配时,g 7 2 9 e 通过一个信息位来表明是前向还是后向,同时对该信息位用一位奇偶校验位保护。 由于g 7 2 9 e 的码本容量大,所以码字中的脉冲数多( 前向模式的脉冲数为1 0 个,后 向模式的脉冲数为1 2 个) 。在前向和后向模式中,g 7 2 9 e 将4 0 个可能的位置分成5 个带,前向和后向模式所不同的是带内的脉冲数不一样。在前向模式中,每个带 内有两个脉冲;在后向模式中,有连续的两个带的脉冲数均为3 ,其余的三个带内 的脉冲数均为2 。考虑到输入信号的不同,g 7 2 9 e 在前向分析和后向分析时,采用 了不同的感受加权因子,对于前向模式,加权因子r l 和r 2 的计算与g 7 2 9 基本上一 样,当信号的平稳度较低时,前向逆滤波器采用未被量化的l p 系数构成,当信号 的平稳度较高时,前向逆滤波器采用已量化的l p 系数构成;对于后向模式,当信 号的平稳度较低时,后向逆滤波器采用未被量化的l p 系数构成,当信号的平稳度 较高时t 后向逆滤波器直接采用后向滤波器。此外感觉加权因子r l 和r 2 的计算要依 靠输人信号的平稳度,当信号的平稳度高时,就加强噪声的掩蔽效应,此时r 1 和 r 2 的值分别为r l = o 9 8 ,r e = 0 4 ;当信号的平稳度较低时,此时r l 和r 2 的值分别为r 1 = 0 9 ,r 2 = 0 4 。g 7 2 9 e 在进行后处理时,它的自适应滤波器的参数要根据输人信号 的平稳度的不同进行自适应,当连续2 0 帧是高平稳度的后向桢时,g 7 2 9 e 应不再 进行后处理g 7 2 9 e 的自适应滤波同样包括长时滤波和短时滤波。由于g 7 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一级市政试题及答案
- 户外拓展服务合同协议书
- 2025年医用电子直线加速器合作协议书
- 2025年智能卡制作发行机项目合作计划书
- 网红餐饮品牌连锁加盟授权与特色原料供应协议
- 域名注册与转让争议解决协议
- 网络安全前沿介绍
- 药品进口清关与市场准入代理服务协议
- 农业设施大棚租赁与农业观光服务合同
- 货物运输途中自然灾害赔偿合同
- 隧道工程隧道洞口临建施工方案
- 心理咨询的面谈技术
- DBJ∕T13-374-2021 福建省钢筋桁架叠合楼板技术标准
- 事故池管理的有关规定
- (word完整版)污水处理厂安全评价报告
- DB50∕T 867.6-2019 安全生产技术规范 第6部分:黑色金属冶炼企业
- 新产品开发流程课件
- 高中语文部编版选择性必修下册第四单元 单元学习导航 课件 (8张PPT)
- 化妆品原料-PPT课件
- 重庆市参加企业职工基本养老保险人员退休审批表
- 混凝土结构课程设计244
评论
0/150
提交评论