




已阅读5页,还剩73页未读, 继续免费阅读
(信息与通信工程专业论文)基于pesq和emodel+ngn网络语音质量测试的研究及实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京邮电人学硕上研究生学位论文 摘要 摘要 n g n ( n e x tg e n e r a t i o nn e t w o r k ) 群i 下一代通信网络,它是基于p 承载网络的分组交 换技术,现阶段的首要任务仍是提供语音服务。随着n g n 的发展,交换网络为满足用户 的需求就必须不断的进行升级,其结构变得更为复杂,给语音质量测试的基本原理和测试 逻辑都带来了较大的冲击。 在语音质量客观评估的算法中,p e s q 算法是基于传统的电话网络,单纯的从收发信 号差异的角度分析网络语音问题,其评估结果与主观评估结论一致性最高;e m o d e l 算法 在评估v o l p ( v o i c eo v e rt n t e :r n e tp r o t o c 0 1 ) 语音质量时考虑了延时、噪声、回音、编码器性能、 丢包、抖动等数据网络损伤因素,但其评估结果的精度不如p e s q 算法。在移动通信网络, 通话过程中的多次小区切换会明显影响语音通话质量,但标准e - m o d e l 算法实现过程没有 对其进行考虑。本文为了进一步提高e - m o d e l 算法的精度,引入了切换m o s 损伤值i s 对 算法进行了改进,客观有效地量化了切换对语音质量的影响。为了研究该算法的可靠性, 我们对原算法与改进后的算法分别进行了测试,结果表明,改进后的算法提高了与主观评 估的相关度,并且算法具有很强的适应性与实用性。 本文首先介绍了语音质量测试的基本概念和背景,评价方法和测试方法,探讨了系统 实现的测试模型;接着详细描述和推导了本文主要研究的p e s q 和e - m o d e l 两种算法,且 拓展了e m o d e l 算法,并提出实现算法的方案。我们在语音质量测试系统的实现过程中, 参与了系统的架构和设计,主要完成了p e s q 算法的代码移植、e m o d e l 算法编码、b i e e 信令合成的编码、部分数据分析的编码等,并根据现场语音数据和信令数据测试了改进 e m o d e l 算法的可靠性及部分系统功能。 主题词:v o l pm o sn g ne m o d e l 感知语音质量评估 a b s t r a c t n e x tg e n e r a t i o nn e t w o r k ( n g n ) i sa p a c k e ts w i t c h i n gt e c h n o l o g yb a s e do nt h ei pb e a r e r n e t w o r k ,a n di t sp r i m a r ym i s s i o ni st op r o v i d ev o i c es e r v i c e sa tt h i ss t a g e w i t l lt 1 1 ed e v e l o p m e n t o fn g n ,s w i t c h i n gn e t w o r kh a st ob ec o n s t a n t l yu p g r a d e dt om e e tt h en e e d so fb s e r s ,a n di t s s t r u c t u r eb e c o m em o r ec o m p l e x ,a n dt h e nt h eb a s i cp r i n c i p l e sa n d t e s t i n gl o g i co fv o i c eq u a l i t y t e s t i n gh a v eb e e nb r o u g h tag r e a t e ri m p a c t a m o n gt h eo b j e c t i v ev o i c eq u a l i t ye v a l u a t i o na l g o r i t h m s ,t h ep e s qa l g o r i t h mi sb a s e do n t h et r a d i t i o n a lt e l e p h o n en e t w o r k s ,w h i c ho n l ya n a l y z e sv o i c ei nn e t w o r ko nt h ed i f f e r e n c eo f s e n da n dr e c e i v es i g n a l s ,a n di t se v a l u a t i o nr e s u l t sh a v et h eh i g h e s t c o n s i s t e n c yw i t ht h e c o n c l u s i o n so fs u b j e c t i v ea s s e s s m e n t t h ee - m o d e la l g o r i t h mc o n s i d e r st h ef o l l o w i n gd a t a n e t w o r kd a m a g e s ,s u c ha st i m ed e l a y , n o i s e ,e c h o ,e n c o d e rp e r f o r m a n c e ,p a c k e tl o s sa n d j i t t e ro n t h ei m p a c to fv o i c eq u a l i t y , b u ti t sa c c u r a c yo fe v a l u a t i o nr e s u l t sn o ta sg o o da sp e s q a l g o r i t h m i nt h em o b i l ec o m m u n i c a t i o n sn e t w o r k , m o r ec e l l s w i t c h e sw i l ll e a dt ot h eq u a l i t yo fv o i c e g e t t i n gw o r s e ;u n f o r t u n a t e l y , t h es t a n d a r de m o d e la l g o r i t h md o e sn o tc o n s i d e rt h e m i no r d e rt o i m p r o v et h ea c c u r a c yo fe m o d e la l g o r i t h m ,t h i st h e s i si st oi n t r o d u c eas w i t c h i n gm o s i m p a i r m e n tv a l u ei sa n dq u a n t i f yi to b j e c t i v e l y i no r d e rt os t u d yt h er e l i a b i l i t yo ft h ei m p r o v e d a l g o r i t h m ,t h et w oe m o d e la l g o r i t h m sh a v e b e e nt e s t e db yu s t e s tr e s u l t ss h o wt h a t ,c o m p a r et o t h es t a n d a r de m o d e la l g o r i t h m , t h ei m p r o v e da l g o r i t h mi sm o r er e l e v a n c et ot h e s u b j e c t i v e a s s e s s m e n ta n dh a ss t r o n ga d a p t a b i l i t ya n dw i d e p r a c t i c a l i t y t l l i st h e s i sf i r s ti n t r o d u c e st h eb a s i cc o n c e p t sa n db a c k g r o u n do ft h ev o i c eq u a l i t yt e s t i n g t h ei m p a i r m e n tf a c t o r st ot h ev o i pq u a l i t y , t h ev o i c eq u a l i t ya s s e s s m e n tm e t h o d sa n dt h ev o i c e q u a l i t yt e s t i n gm e t h o d s t h e n , i tp r e s e n t sal o to fd e t a i l e dd e s c r i p t i o n sa n dd e r i v a t i o n st ot h e a l g o r i t h m so fp e s qa n de - m o d e l ,i m p r o v e st h ee - m o d e la n di m p l e m e n t e st h e s ea l g o r i t h m sb y p r o g r a m m i n g d u r i n gt h er e a l i z a t i o no fv o i c eq u a l i t yt e s ts y s t e m ,w ep a r t i c i p a t ei nt h es y s t e m a r c h i t e c t u r ea n dd e s i g n ,t r a n s p l a n t et h ep e s q a l g o r i t h mc o d et ol i n u x ,p r o g r a m m ef o re m o d e l a l g o r i t h ma n db i e es i g n a l i n gs y n t h e s i s ,a n dd os o m et e s t st ot h er e l i a b i l i t yo ft h ei m p r o v e d e - m o d e la l g o r i t h ma n d s y s t e mf u n c t i o n a l i t y k e y w o r d s :v o i p , m o s ,n g n ,e m o d e l ,p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y 南京邮电大学学位论文原创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名: 逮支= 3 呈 日期: 竺2 :笙! ! ! 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送 交学位论文的复印件和电子文档,可以采用影印、缩印或其它复制手段保存论 文。本文电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。 论文的公布( 包括刊登) 授权南京邮电大学研究生部办理。 研究生签名:j 她导师签名:j 僻日期:啤上一 南京邮电大学硕士研究生学位论文第一章绪论 第一章绪论 n g n ( n e x t g e n e r a t i o nn e t w o r k ) 是以软交换为核心的,能够提供包括语音、数据、视频 和多媒体业务的基于分组技术的综合开放的网络架构,代表了通信网络发展的方向。n g n 具有分组传送、控制功能从承载、呼, q 会话、应用业务中分离、业务提供与网络分离、 提供开放接口、利用各基本的业务组成模块、提供广泛的业务和应用、端到端的服务质量 ( q o s ) 和透明的传输能力通过开放的接口规范与传统网络实现互通、通用移动性、允许用户 自由地接入不同业务提供商、支持多样标志体系,融合固定与移动业务等等特征。 n g n 又是基于口承载网络的分组技术,并引入了大量新的接口和协议,给网络的性 能监测和网络维护带来了许多新的难度和挑战。p 电话是n g n 最基本的业务,口电话的 语音质量还不能使用户完全认可和满意,这是i p 电话技术需要解决的难题之一。语音质量 测试是n g n 网络测试的一个重要方面,为了增强n g n 业务的市场竞争力,就必须确保其 语音业务能达到传统长途电话所提供的语音质量。根据电信网络q o s 的要求,对n g n 网 络语音数据和服务质量进行分析和测量是十分必要的。本文主要是围绕语音质量测试方面 的主要规范对移动通信网络的n g n 网络语音质量做基于p e s q ( p e r c e p t u a le v a l u a t i o no f s p e e c hq u a l i t y ) 和e m o d e l 模型r 值测试的分析与探讨。 1 1 语音质量测试的基本概念和背景 本节将对被测移动网络的基本概念及结构进行简单介绍,并提出语音质量测试的背 景。 1 1 1 移动n g n 网络的基本概念 3 g p pr 4 为了能使电路交换域和分组交换域承载在一个公共的分组骨干网上,在电路 域核心网中引入了基于软交换的分层架构1 1 ,基本思想是将呼叫控制与承载层相分离,通 过m s cs e r v e r 、m g w 将语音和控制信令分组化。 1 移动交换中心( m s c ) m s c ( m o b i l es w i t c h i n gc e n t e r ) 是整个g s m 网络的核心,它控制所有 b s c ( b r o a d w i d t hs e r v ec o n t r o l l e r ) 的业务,提供交换功能及和系统内其它功能的连接, m s c 可以直接提供或通过移动网关g m s c 提供和公共电话交换网( p s t n ) 、综合业务 1 壹室坚皇盔堂塑:生塑塑圭兰丝迨塞 蔓二童堕迨 数字网( i s d n ) 、公共数据网( p d n ) 等固定网的接口功能,把移动用户与移动用户、移 动用户和固定网用户互相连接起来。 m s c 从g s m 系统内的三个数据库,即归属位置寄存器( h l r ) 、拜访位置寄存器 ( v l r ) 和鉴权中心( a u c ) 中获取用户位置登记和呼叫请求所需的全部数据。另外,m s c 也根据最新获取的信息请求更新数据库的部分数据。作为g s m 网络的核心,m s c 还 支持位置登记、越区切换、自动漫游等具有移动特征的功能及其它网络功能。另外, 在用户面的处理功能中,m s c 服务器负责选择和控制m g w 。 2 多媒体网关( m g w ) m g w ( m e d i ag a t e w a y ) 主要功能是提供承载控制和传输资源,与m s cs e r v e r 、 g m s cs e r v e r 配合完成核心网络资源的配置( 即承载信道的控制) 。同时完成回声消除、 执行媒体转换和帧协议转换、( 多媒体数字) 信号的编解码以及通知音的播放等功能。目 前m g w 主要承担了全部的话务。 3 m s c 池( m s ci np 0 0 1 ) 软交换系统利用m s c 池【2 l ,可以在池化服务区中的多个m s c 之间分配用户,为特定 区域提供服务。一个m s c 节点池可以把综合区域看作单个实体为其提供服务。每个b s c 或r n c 都与池中的每个m s c 建立连接。如图1 - 1 所示: 当前网络 采用池化性能 的网络 ( m s ci np o o i ) 鑫蚕鑫西迨 图1 - 1m s c 池化结构 由于系统可以根据b s c 或r n c 中的业务分配算法在m s c 节点之间分配漫游到池化 区的用户,而且用户在离开池化业务区之前一直在同一m s c 中注册,因此可以改善业务 分配。m s c 池化可以提供负载分担和灾难恢复特性。 2 重室唑垒盔堂堡圭丛塞生兰笪堡塞笙二雯堡堡 1 1 2 移动g s m 软交换网络结构 根据g s m 数字蜂窝移动通信网移动软交换系列标准的要求,媒体网关之间的n b 接口 可以基于i p 、a t m 或t d m 三种方式3 1 。当基于m 或a t m 方式时,n c 接口使用b i c c 等 协议,当基于t d m 时,n c 接口使用i s u p 协议。本文中探讨使用于n c 接口为b i c c 协议 的情况。 图l - 2 移动g s m 软交换网络结构 在我们许多实际的g s m 网络部署中,如图1 2 所示,每个m s c 下的两个m g w 问采 用g e 接口的光纤连接,将m s c 池化,系统可以在池化服务区中的多个m s c 之间分配用 户,而不是利用单个m s c 为特定区域提供服务。一个m s c 节点池可以把综合区域看作单 个实体为其提供服务。每个b s c 或r n c 都与池中的每个m s c 建立连接。由于系统可以 根据b s c 或r n c 中的业务分配算法在m s c 节点之间分配漫游到池化区的用户,而且用 户在离开池化业务区之前一直在同一m s c 中注册,因此可以改善业务分配。m s c 池化可 以提供负载分担和灾难恢复特性。 m s c 和b s c 或r n c 之间为给定业务情况分配最有效的是m g w 。基于m g w 组的 m g w 选择有助于实现负载分担,同时还可以确保在出现中断情况下网络仍然能够继续运 行。为了控制m g w 的负载,m s c 服务器还可以与任何远程m g w 互操作。这种方法使 m g w 能够提示节点或具体应用的超载情况,从而避免系统中断。因此,m g w 能够指示 m s c 服务器在网关控制协议( g c p 即h 2 4 8v 2 ) 负载调节功能帮助下降低负载。 m s c 池化是优势所在,但在现有的网络在升级过程中也可能由于设备兼容性等原因导 致语音质量的下降。 3 塑星墅皇盔兰堡兰丛塞生兰笪堡皇蔓二雯堡迨 1 1 3 语音质量测试的背景 n g n 快速发展,通信增值业务种类也越来越多,用户的数量的高速增长,对以往的网 络提出了巨大的挑战,从而各个不同厂商的不同设备不断地加入到现有的网络中。各地电 信营运商在网络改造升级,设备更新后,其网络兼容性并不让人满意。同种网络如移动各 地的g s m 网络升级技术都大同小异,就拿浙江移动的来说,采用了池化性能的方法对现 有的g s m 网络进行改造。浙江移动g s m 网络设备主要由华为提供。 在从一个m s c 到一个m s c 呼叫服务器加两个m g w 软交换改造( 见图l 1 ) 后,会出 现以下问题: 开始通话正常,有时会出现固定点通话过程中会产生单方通话; 如果通话中移动( 如走路或开车) 会产生单方通话或有很大的噪音或语音间断的问 题。 浙江移动想尽快对这些网络设备进行评估,定位问题原因。本文将把p e s q 、改进的 e m o d e l 算法和信令分析结合在一起,对网络上的语音和信令进行分析,找出语音问题的 根源,为网络的优化提供支持。 1 2 本文的组织结构 本文共分为六章: 第一章“绪论 解释了移动n g n 网络中的几个基本概念,介绍了运用语言质量测试 系统的网络结构,及提出语音质量测试系统背景。 第二章“语音质量的影响因数和评测方法将介绍v o i p 语音质量的影响因素及性能 测试指标;语音质量评价的两类方法:主观评价和客观评价:两种测试方法:主动式语音 质量测试和被动式语音质量测试。 第三章“p e s q 算法研究 将介绍p e s q 算法概念和基本原理,推导过程及算法的编 程实现。 第四章“e m o d e l 算法研究”将介绍e m o d e l 算法概念和基本原理,推导过程、算法 拓展及编程实现。 第五章“语音质量测试系统的实现”将对语音质量测试系统的实现做比较全面的介 绍,从系统的框架设计到主要处理模块进行详细分析,最后给出测试数据及对结果的合理 分析。 第六章“总结与展望对本文进行概要陈述,将介绍作者在语音质量测试系统的实现 4 南京邮电大学硕士研究牛学位论文第一章绪论 过程中做的主要- 作,及提出对系统发展的意见和建议。 本文的最后一部分是参考文献。 s 南京邮电人学硕七研究生学位论文第二章语音质量的影响因数及评测方法 第二章语音质量的影响因素及评测方法 2 1g o i p 语音质量的影响因素及测试指标 n g n 网络语音质量研究最主要的对象就是v o i p 的语音质量【3 1 【1 2 l f 4 2 1 。影响v o i p 语音质 量的因素对用户来讲,可信赖的连接和高质量的i p 话音十分重要。v o i p 只有具备与p s t n ( 传统电话网) 相当的质量,用户才会考虑使用。 2 1 1 硬件相关的因数 从硬件方面来说,网关设备性能指标和网络承载的业务量状况,是决定v o i p 语音质 量的两个基本要素。也就是说,语音传输质量取决于网关的性能和网络的带宽两方面的条 件。 1 语音网关 v o i p 要得到较好的话音质量,首先在语音网关的选择上必须考虑以下几方面的问题: 网络时延与抖动、语音编码和回波抑制。 网络时延与抖动时延 网络时延与抖动时延是影响话音质量的主要原因,还会造成回音。v o i p 的时延由三部 分组成:编解码及压缩时延、缓存时延、数据包传送时延。其中,编解码及压缩时延、 缓存时延是由网关带来的,数据包传送时延则要由带宽情况决定。 v o 口语音质量在企业专网上比在公众网上优越的原因,是由于在企业网上可以将语音 包的优先级设定高于普通包,使抖动可以有较好的控制。 语音编码。 、 考察语言编码需综合考虑m o s ( 平均评价分) 值、处理时延和编码速率。许多网关采 用可变速率话音编码,根据可得到的信道带宽自动调节话音压缩编码速率,较好地解决数 据包丢失问题,不至于使语音质量严重下降。通过语音压缩编码技术和d s p 的自适应算法, 可保证使口话音达到与传统电话相似的通话品质。 语音压缩编码方面主要面临的是标准化问题,g 7 1 1 ,g 7 2 3 1 ,g 7 2 9 a ,g 7 2 6 ,g 7 2 7 , a m r ,a m r 2 等几十种语音压缩标准,存在于许多不同的网络电话产品中。 回波抵消 当回声的延迟超过4 5 m s ,会对通话造成很大干扰,需要采用回波抵消。由于v o i p 存 在较大的时延,回声问题不可忽视,在网关设备中必须采用d s p 技术实现回波抵消。 6 南京邮电人学硕十研究生学位论文第二章语音质量的影响因数及评测方法 可见,m 语音网关本身的时延不影响语音效果,关键还是要看数据传输的带宽。 2 网络的带宽 如果企业网的原有带宽只能供已有的数据业务使用,在增加v o m 系统后,则需要增 加带宽。在语音网关性能特点较好的情况下,减少时延的一个确定和可行的办法就是 保证足够的带宽。带宽能够保证,话音质量就容易保证。考虑相关主要因数有语音传输速 率和静音抑制。 语音传输速率 网络所需带宽由语音速率和话务量决定。值得注意的是:那些所谓低的速率实际上没 有象所说的那么低。这是因为在v o i p 电话的每个数据包中含有4 0 字节的r t p u d p i p 包 头,它会把6 3 k b p s 的传输速率增j j t a n1 7 k b p s 。如果i p 语音网关产品在一个口包中封装 多个语音u d p 包,提高了口包的利用率;也有效地提高了语音传输的效率。 静音抑制 为提高信道利用率,还可以在语音网关上采用静音抑制技术保证只有在通话双方 确实讲话时才占用带宽。实际上,人们在打电话时,仅有2 弘- 4 0 的时间在讲话,静音抑 制技术把不说话的时间去除,只保留含有信息的部分;讲话停顿时,话音传输所占用的带 宽被自动释放。 另外,为保证白天网络负载峰值时的话音质量,除增加带宽外,还可以采取由网管控 制、避开通话高峰期,在下班后或夜间传送数据文件等办法。 网关产品可以利用r s v p ( 资源保留协议) 和d i f f - s e r v e r 等技术保证系统的服务质量 ( q o s ) ,在综合运用上述技术的基础上最大程度地提高语音质量。 2 1 2 测试语音质量的指标 n g n 网络在统一的分组网络上提供话音、数据和多媒体等业务。n g n 的实验和应用, 经历了从小容量向大容量过渡,从实验网向商用网过渡,先后面对过q o s 保证、网络安全、 管理认证等一系列新的挑战。要实现语音q o s t l 2 i z 0 1 的保证,首先要了解语音q o s 的衡量 指标。国际上对基于口的语音q o s 一般从呼叫建立时间、时延、抖动、丢包、乱序等几 个方面来评价,通常与传输质量有关,不属于用户能够体验的部分。m o s 、p s q m 、p e s q 、 回声、语音间断、语音滑动等用户可以感受到的话音质量指标参数,因此属于q o e i 6 1 的范 畴。本文主要讨论分析r 1 p 包得出的语音间断、抖动、丢包、乱序等;分析语音波形得出 的最大值、最小值、直流偏移和振幅峰值等;分析相对应语音的p e s q 值和及对网络全面 进行分析得到的e m o d e l 值。本节先对其中与i p 话音性能测试指标相关的几个概念做简单 7 南京邮电大学硕士研究生学位论文第二章语音质量的影响因数及评测方法 进行介绍。 1 回声( e c h o ) 回声是语音从另一端电话再反射到说话者的耳朵所引起的。传输系统由于阻抗不匹配 等原因,对声源发出的声音产生的“反射”现象,即说话者很快听到的自己发出的声音。 一般,人的耳朵能够识别的回声以1 5 0 m s 为界,超过1 5 0 m s 的回声,人耳能够比较明显的 分辨,会产生反感,在1 5 0 m s 以内的回声,一般人都可以接受,基本听不出来。 2 语音间断( h i t ) 语音间断指由于丢包等传输原因或编解码等原因造成的语音不连续,人耳听到的是断 断续续的话音,会产生极大反感。信息产业部的测试规范中规定,2 0 m s 以上的语音间断都 必须统计,语音间断累计和与总通话时长的比值,称为“语音间断比 ,通常这个值不应 该超过2 。 3 语音滑动( c l i p ) 语音滑动指由于静音压缩等编解码原因造成的语音边缘模糊,通常是由静音到有声部 分或者由有声到静音部分出现声音丢失,人耳听到的是失真的话音,会产生极大反感。信 息产业部的测试规范中规定,2 0 m s 以上的语音滑动都必须统计,语音滑动累计和与总通话 时长的比值,称为“语音滑动比”,通常这个值为零,否则不能入网。 4 时延( d e l a y ) 时延是指在传输系统中需要的传输时间。在电话场景中,端到端时延是指从谈话者的 嘴产生信号到收听者的耳朵收到信号之间所需的时间。端到端延迟是介质流跨越的所有网 络设备和链路上产生的时延的总和。 时延直接影响到电话的语音质量。过长的延时导致讲话人重叠和回声。更长延时的电 话对于参加者非常困难,因为它延长了对话应答之间的时间,难以保持对话同步。这就产 生了与数据网络中阻塞条件类似的情况,发送方等待应答的忍耐可能超出了限度,迫使他 再次发问相同的问题( 重新发送) ,尽管应答可能己经在回来的路上了。 端到端的时延可以分成两个部分,即固定时延和可变时延。固定时延包括编解码器引 入的时延和打包时延。固定时延和采用的压缩算法、打包的语音数据量相关。可变时延包 括:承载网上的传输、节点中排队、服务处理时延、去抖动时延,这些和设备的端口速率, 网络的负载情况,经过的网络路径、设备对q o s 的支持方式、实现的q o s 算法等密切相 关。特别是消除抖时延和承载网络的抖动指标密切相关,通过采用合适的网络技术可以 显著降低语音通过网络时引入的抖动,减少去抖动时延。 8 堕塞墅皇奎兰竺! 堕窒竺兰垡堡奎兰= 三皇垦童垦里竺墅堕里墼垦堡型查鎏 在电话系统中,一般采用以下几种方式降低时延的影响: 采用资源预留协议( r s v p ) 为话音预留带宽,只要话音呼叫请求,网络就跟据规则 为话音通信预留出设定带宽,直到通话结束,带宽才释放。 采用话音优先技术,为了保证提供高质量的i p 电话通信,在广域网带宽不足的口 网络上,一般采用话音优先技术。这样路由器一旦发现语音包,就会优先发送。 由此,网络的时延和抖动对话音的影响均将得到改善。 采用流量监管和流量控制等方法保证网络有足够的带宽,以避免拥塞,流量监管 主要是限制进入网络的某一连接的突发流量;而流量整形主要是限制流出网络的 某一连接的突发流量。除此之外,还有减少数据报的开销等技术也被用来减少时 延的影响。 5 抖动( j n l e r ) 抖动指语音包时延的差值。语音本身是连续的信号,然而在将分组数据从主机a 发送 到主机b 的过程中,由于分组传输路径不同,每个路径的长短和数据流量各不相同,造成 了分组到达接收端的时间有所不同,如果每个语音包的时延忽大忽小,这样在接收端回放 的语音变得时断时连,人耳听到的声音忽快忽慢,用户的感觉会很差。时延抖动的存在引 起接收端解码后的语音信号出现间断,造成语音失真。因此,抖动虽然反映的是传输质量 问题,但它也一定程度上影响了话音质量。 6 丢包( l o s s ) p s t n 不会面对丢包这种问题。因为在p s t n 中,字节在干线之间交换,而带宽在呼 叫期间被保留并维持不变。 在目前基于m 包交换的网络只能提供“尽力而为 ( b e s te f f o r t ) 服务,因此,在口数 据网络中经常会发生包丢失。当载有声音的包流的路径拥塞时,路由器开始抛弃包。无论 采用何种算法决定影响哪一个呼叫,包丢失并不一定意味着包永远不会到达目的地。对于 语音电话,到达目的地太迟以致无用的包和包丢失一样,都会被接受者抛弃。包时延到达 对呼叫的净效果就是包丢失。但是,保留在端点的统计数据可以特别地分类和标识迟到的 包。造成i p 网络丢包现象严重的因素主要是网络传输中的丢包和拥塞时网络设备主动丢 包。对于数据,端站点简单地重新发送丢失的数据并降低它们的通信速率;而对于语音, 没有时间进行重新发送,所以语音软件必须适应。包丢失会严重降低i p 电话的话音质量, 在移动网络上每一个p 包一般包含2 0 m s 的话音信息,与语音的基本单位音素的持续时间 大致匹配。在包被丢失的情况下,编解码器通过参考前面的分组可以推测丢失的信号是什 9 塑室墼皇盔兰堡兰竺塞生堂垡堡奎兰兰童里童堕墨堕墅堕里墼墨堡型塑望 么,这个技术帮助掩盖单个分组的丢失,但不能用于多个丢失包。在多个连续丢失包的情 况下,编解码器简单插入安静时间段。这些技术的使用是进行统计的,可以用来帮助量化 网络对语音质量的影响。但一般来说当丢失率超过5 时就会对通话的质量产生很大的影 响。 数据包丢失会对音质产生大小不一的影响,这要看数据包是如何丢失的。有时候,既 便丢失多达t 0 的语音数据包照样能获得可以接受的音质。然而有的时候,哪怕丢失l 的数据包也会导致音质极差。显然,出现这种不一致是因为数据包丢失有的呈随机性,有 的呈突发性。有时,一个v o i p 系统会在几秒钟时间内丢失2 0 至3 0 的数据包,这种情 况就会导致非常明显的音质问题。 丢包指v o i p 条件下,r t p 语音包在传输过程中的丢失,反映在q o e 的参数中,与语 音间断( h r r ) 有一定的关联。一般丢包的计算,都是按照语音包丢失的数量或百分比率 计量,如丢包1 ,发现1 0 0 个丢包等。统计的方法,主要根据r t c p 包中的r t p 语音包 数量差值计算出来。 一般根据丢包率和抖动将网络分为三级,如下表所示: 表2 1 丢包率和抖动对网络的影响 网络等级弩 。一。:警笫丢包攀黝”“” 彤”? j 辩动”。嘿 缝,毅锄,: ;,彩;:;:j ;,l j 蒜五么| 弛玩。;i 疆,_ ,j 。i :,? _ 4 + 4 i 该? 渤 良好 o1m s 一般 1 2 0m s 较差 5 6 0m s 7 舌l j 事( o u t o f o r d e r ) 乱序指m 条件下,r t p 语音包在传输过程中的次序颠倒,对话音质量产生间接影 响。统计的方法,主要根据r t c p 包中的r t p 语音包的序号计算出来。 2 2 语音质量评价方法 语音质量包括两方面内容:清晰度和自然度。前者是衡量语音中字、单词和句的清晰 程度,而后者则是对讲话人的辨识水平。语音质量评价不但与语音学、语言学、信号处理 等学科有关,而且还与心理学、生理学等学科有着密切的联系,因此语音质量评价是一个 极其复杂的问题。语音质量评价从评价主体上讲可分为两大类:主观评价和客观评价1 - 4 1 。 2 2 1 主观评价 主观评估是以认为主体根据某种预先约定的尺寸来对失真语音( 或参考原始语音) 来 1 0 南京邮电人学硕十研究生学位论文第二章语音质量的影响因数及评测方法 划分质量等级的,它反映了评听者对语音质量好坏程度的一种主观印象。 主观评价是以人为主体来评价语音的质量。该方式虽较为繁杂,但由于人是语音的最 终接受者,因此这种评价应是语音质量的真实反映。国内外使用较多的主观评价方法有: 平均意见分m o s ( m e a no p i n i o ns c o r e s ) 方法、韵母可懂度测量d r t ( d i a g n o s t i cr h y m et e s t s ) 方法、失真平均意见分d m o s ( d e g r a d a t i o nm e a no p i n i o ns c o r e d m o s ) 和满意度测量d a m ( d i a g n o s t i ca c c e p t a b i l i t ym e a s u r e ) 、汉语清晰度测试等。 在实际语音系统应用中,m o s 评分法【2 9 1 使用最为普遍。它不仅用于语音编码,通信 设备性能测试上,也是语音客观评估方法研究中,作为衡量评价方法好坏的重要依据之一。 m o s 法用于对语音整体满意度或语音通信质量的评价。其分值如表2 2 所示。参加测 试的评听人在听完测试语音后,从5 个等级中选择其中某一级作为他对所测语音质量的评 价。全体实验者的平均分就是所测语音质量的m o s 值。由于主观上和客观上的种种原因, 每次测试得到的m o s 大都会有波动,为了减少波动的方差,除了参加测试的评听人要足 够多之外( 一般至少4 0 人) ,所测语音材料也应足够丰富,测试环境也要尽量保持相同。 在数字语音通信中,通常认为m o s 在4 0 - 5 0 分为高质量数字化语音,达到长途电话网的 质量要求,接近于透明信道编码,也常称为网络质量或长途质量。m o s 在3 5 左右称为通 信质量,这是感到重建话音质量下降,但不妨碍正常通话,可以满足话音系统使用要求, m o s 在3 0 以下常称为合成语音质量,是指一些声码器合成的语音所能达到的质量。它一 般具有足够的可懂度,但自然度及讲话人的确认等方面不够好。 表2 - 2m o s 判分五级标准 爹爹黟新6 9 :判铲琴誓琴霄獗量缓剐步缈矽鸳箩护鬈? j 鬻箩髌级勇i j 鄹了鬈徽可麓 飘貔么:i ;知名+ 勃。暂f 俐织女鳓二:、。;_ 器韬;磊* 移施荔露鑫磊。i ;妊;。碰。名,一:? 孙黛g 。; 貉纛张嘴纛磊磊施级躺貌簇 4 0 - 5 o 优( e x c e l l e n t )不觉察 3 孓4 o 良( g o o d )刚有觉察 3 o _ 3 5 可( f a i f )有觉察且刚觉可恶 1 5 _ 3 o 差( p o o r )明显觉察且可恶但可忍受 o 1 5 不可接受( u n a c c e p t a b l e ) 不可忍受 显然,主观评价的优点是符合人对语音质量的感觉,缺点是费时费力费钱,且灵活性 不够,重复性和稳定性较差,受人的主观影响较大等。 2 2 2 客观评价 客观评估是指用机器自动判别语音质量它从原理上又可分为两类评价方式:基于输 1 l 堕室堕皇奎兰婴主塑壅生兰篁堡奎至三兰堕童壁墨塑墅堕里鍪堡堡塑互堡 入输出方式的客观评估和基于输出方式的客观评估。基于输入输出方式的评价是建立在原 始语音信号和失真语音信号的误差对比上,大多数这种方式的客观评估采用数值距离或者 描述听觉系统如何来感知质量的听觉模型来量化语音质量的好坏;基于输出的客观评价是 仅以语音系统的输出信号来评估语音质量的好坏。 1 客观评估方法的发展特点 从上述客观评价方法研究的发展历程以及各种方法的评价性能5 - 6 1 【8 1 来看,语音质量 客观评价研究的发展具有以下特点: 基于输入输出的客观评价方法与主观评价的相关度已达到了o 9 5 左右,如a d m n b , m b s d 和p s q m 等方法,目前,这类评价方法的主要问题是要解决好稳定性等问题。 从语音质量客观评估性能的提高过程来看,客观评估方法研究大致经历了这样几个阶 段;时域分析阶段( 如s n r 等) ,频域谱分析阶段( 如s d 等) ,模型参数( l p c 分析) 阶段( 如 c d 等) ,听觉模型阶段( b s d 、m b s d 、p s q m 等) 及听觉模型与判断模型的混合( h y b r i d ) 模型阶段( 如a d m n b ) 等。当然,各阶段不是严格分开的,而是互相混迭,特别是新方 法往往是建立在传统方法基础上。 听觉模型在语音质量客观评估研究中占有十分重要的地位。纵观客观评估的发展过程 可以清楚看到只要在评估中考虑了人对语音信号的感知特性就会大幅度提高整个评估方 法的性能。从这几年的研究成果来看,性能较好的客观评价方法都以听觉模型为基础;如 b s d ,m b s d ,p s q m ,a d m n b 等。 判断模型的研究已开始得到重视。人对语音质量的评估包含两个过程:听过程和判断 过程。因此,有必要构造良好的判断模型并和听觉模型相结合起来建立更符合主观评估过 程的客观评估方法。虽然目前判断模型的研究己有所进展,如a d m n b 方法等,但是这 方面的研究工作还有待于进一步深入下去。 基于输出的客观评估方法研究也有所发展,但目前这种形式的客观评估方法与主观评 估值的相关度还较低。尽管该方法具有巨大的发展前景和实际应用价值,但是在理论方法 上和在使用的具体技术参数等方面还有待于突破性的进展。 2 常用客观语音评估算法介绍 传统的语音质量测试方法t 6 l :t 3 l 是通过在实验室让很多人试听语音并按照i t u 规范的 “综合意见评分法( m o s ) 让他们对语音质量给出主观评价。很显然这样的测试手段不仅 是主观依赖的,而且费时费力。因而国际电信联盟i t u 在9 0 年代中开始对端到端的语音 质量自动客观测试技术进行标准化的工作,并从此发展出三个主要的测试算法可供进行自 南京邮电大学硕上研究生学位论文第二章语音质量的影响因数及评测方法 动和可重复性的测试:p s q m p s q m + 感知通话质量测量、p e s q 感知评估通话质量测量、 p a m s ( 英国电信) 感知分析测量。p s q m 和p a m s 测量方法都需要发送一个语音参考信号 通过电话网络,在网络的另一端采用数字信号处理的方式比较样本信号和接收到的信号, 进而估算出网络的语音质量。p e s q 结合了p s q m 和p a m s 的优势,针对v o l p 和混合的 端到端应用作了改进。最近几年丌u 提出的基于e m o d e l 算法【2 0 】为语音质量评估提供了新 的思路。 p a m s ( p e r c e p t u a la n a l y s i s m e a s u r e m e n ts y s t e m ) 是由英国电信开发出来,它根据收听费 劲程度和收听质量,利用感官模型比较声源信号和经过网络传输后退化的接听信号。p a m s 分析退化信号中发现的不同类型的错误,将不同类型错误参数化并映射到预测感官模型 上。这个模型是在进行大量的主观听力测试后建立的一个数据库。评测的结果给出一个综 合意见评分值m o s ,分值范围在2 5 之间,5 分代表最佳质量分值。 p s q m ( p e r c e p t u a ls p e e c hq u a l i t ym e a s u r e m e n t ) 是由荷兰的k p n 研究机构开发出来,用 于测量数字编码器的客观质量。最早被广泛应用的编码器测量手段是测试语音信号的信噪 比s n ,但这种测试方法对现代越来越多的低压缩比编码器并不适用。p s q m 则比较声源 信号和退化信号,测出后者的失真程度、噪音和保真度。它已被n u 制定成e 8 6 1 推荐规 范,并有了一个增强型算法p s q m + ,可更有效地分析大量瞬时失真。但这两种算法对信 号过滤、不同的延时和短暂局部失真不作处理。( 现i t u t 已经将e 8 6 1 废弃,由e 8 6 2 取 代) p e s q ( p e r c e p t u a le v a l u a t i o no f s p e e c hq u a l i t y ) 是由英国电信和k p n 共同开发出来,并 在2 0 0 1 年被n u 采纳为e 8 6 2 规范。它比较声源信号和退化信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 济南市2025-2026学年九年级下学期语文月考模拟试卷
- 2025年度财务人员年终总结2023年
- 高速公路安全施工课件
- 电脑黄金知识培训课件
- 电脑连接器培训知识课件
- 高血压药的合理使用
- 高血压的原因
- 建设工程规划选址评估服务合同
- 电脑基础知识培训
- 电脑办公普及知识培训课件
- 2025年发展对象考试试题库及参考答案
- 2025山西临汾市洪洞县招聘专职社区工作者58人考试备考试题及答案解析
- 《MySQL数据库教程》课件第一章数据库概述
- 2025年“中央八项规定”精神学习知识竞赛测试题库及答案
- 2025至2030年中国学前教育市场供需格局及未来发展趋势报告
- 1.1 空间和时间(教学课件)高中物理鲁科版必修第一册
- 桡骨茎突腱鞘炎的护理查房
- 2026届湖南省长沙市名校中考语文模试卷含解析
- 2025年中国药典培训试题及答案
- 部队兵器室管理课件
- 抖音完整种草链路
评论
0/150
提交评论