语音质量(MOS)专题分析报告_第1页
语音质量(MOS)专题分析报告_第2页
语音质量(MOS)专题分析报告_第3页
语音质量(MOS)专题分析报告_第4页
语音质量(MOS)专题分析报告_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、语音质量(MOS)专题分析PESQ MOS专题分析:目前话音质量分析主要采用语音感知MOS指标、下行误码率指标(rxqual)。其中语音感知MOS指标包含了下行误码率、切换、时延等多种因素。本专题主要针对第一阶段的数据对MOS指标进行专题分析。表:第一阶段MOS指标对比表方式话音质量3.53.3-3.53.1-3.32.9-3.12.7-2.92.5-2.72.3-2.52-2.33.53.3-3.53.1-3.32.9-3.12.7-2.92.5-2.72.3-2.52-2.32移动比例60.96%6.84%7.12%7.58%4.44%3.05%2.65%7.37%联通比例57.94%5.

2、16%7.62%12.91%4.07%2.45%2.35%7.49%电信比例36.17%37.10%14.45%6.74%2.83%1.08%0.38%1.26%W比例81.55%7.49%4.04%3.00%1.70%0.76%0.49%0.46%0.50%TD比例36.50%22.73%11.74%7.93%6.28%4.80%3.75%3.60%2.67%备注:分析发现,自动路测系统的MOS值为PESQ-LQ值(2.0);W网和TD网的MOS为映射后的MOS值(2.2);华星仪表为直接PESQ值(2.2),三者之间有一定的关系,但并不一致。话音质量3.53.33.12.92.72.52.

3、3All移动比例60.96%67.80%74.92%82.50%86.94%89.99%92.64%100.00%联通比例57.94%63.10%70.72%83.63%87.70%90.15%92.50%100.00%电信比例36.17%73.27%87.72%94.46%97.29%98.37%98.75%100.00%W比例81.55%89.04%93.08%96.08%97.78%98.54%99.03%100.00%TD比例36.50%59.23%70.97%78.90%85.18%89.98%93.73%100.00%从上图分析可以看出,指标排名如下:1) 以2.5为标准,质量高低

4、分别为联通W网、电信C网、联通GSM网络、移动GSM网络、移动TD-SCDMA网络;2) 以3.3分为标准,质量高低分别为联通W网络、电信C网络、移动GSM网络、联通GSM网络、移动TD-SCDMA网络;3) 以大于3.5为标准,质量高低分别为联通W网络、移动GSM网咯、联通GSM网络、移动TD-SCDMA网络、电信CDMA网络;结论:从自动路测(鼎利)的PESQ计算方法上看,电信CDMA网络话音质量高于3.5分的比例较低,但是高于3.3和3.1分的比例很高。按照大于3.3(或者3.3以下)的比例,CDMA的MOS质量要好于联通和移动的GSM网络。二 华星MOS和分析,三网对比测试情况;话音质

5、量3.53.3-3.53.1-3.32.9-3.12.7-2.92.5-2.72.3-2.52-2.32汇总2.53.3移动比例68.80%9.73%9.10%5.97%3.28%1.56%0.73%0.45%0.37%100.00%98.44%78.53%联通比例62.24%6.79%15.74%7.06%3.33%2.09%1.06%0.61%1.07%100.00%97.25%69.03%电信比例15.41%43.68%16.55%7.33%5.27%5.20%3.04%1.83%1.69%100.00%93.44%59.09%话音质量3.53.33.12.92.72.52.32.03.

6、5比例3.3-3.53.1-3.32.9-3.12.7-2.92.5-2.72.3-2.52-2.33.53.33.12.92.72.52.32all改造前16.52%83.48%96.52%99.13%100.00%100.00%100.00%100.00%100.00%改造后31.20%85.90%94.45%99.15%99.58%100.00%100.00%100.00%100.00%从两次测试分值的分布可以看出,改造后的PESQ分值还是有一定的提升。由于CDMA手机大部分手机只有插孔式耳机,后期准备找一款耳机线内置于数据线接口的手机进行改造试验。3.4 使用语音样本格式不同华星使用的

7、是样本文件A-law编码的16bit的8000Hz的PCM格式音频文件华星回复:华星软件实际支持PCM和WAV两种文件格式。,华星认为PCM文件和WAV文件本身是一样的,只是WAV文件的文件头中会有编码格式的信息,而PCM不包含此信息。选择这个编码的原因是考虑到在目前电信网的中继传输中,大部分情况下会将手机发送到基站的语音编码为A-law格式进行传输,在源文件使用A-law编码可以在一定程度上抵消中继传输中编码原因引起的PESQ分值下降。下表是一次定点GSM测试中使用WAV和PCM文件的评分结果:使用文件格式PESQPESQ_LQPESQ_LQOPCM文件一3.9294.0494.081WAV

8、文件一3.9244.0434.076PCM文件二2.8532.5112.607WAV文件二2.8462.5012.598 从上表可以看出,使用PCM格式文件比用WAV格式文件打分值要偏高,但是偏差幅度为0.00X。解决措施:为了更好的贴近用户感知,所有样本统一为A-law编码的16bit的8000Hz的WAV格式音频文件。3.5 P.862 P.862.1 P.862.2与P.862.3的关系P.862是ITU-T定义的是PESQ算法作为一种客观评价语音网络传输质量的标准。P.862.1则是定义了从PESQ推算PESQ_LQO作为到MOS分值映射的公式。P.862.2定义了在宽带语音(8KHz

9、)系统中使用PESQ算法和从PESQ推算PESQ_LQO作为到MOS分值映射的公式。P.862.3则是ITU-T关于如何合理使用PESQ方法进行语音评估的建议。从历次规范演进来看,P862.1已经完成了基于窄带语音评估的PESQ值到MOS值的映射,目前最贴近GSM/CDMA2000网络承载语音业务的话音质量人耳体验值是PESQ_LQO值(即PESQ MOS)值。3.6 PESQ score与PESQ_LQ以及PESQ-MOS分值关系PESQ有四种质量分值,即根据P.862计算的pesq_score分值、根据类MOS尺度的PESQ-LQ分值、根据评估模型计算的损耗因子PESQ-Ie,映射到主观评

10、估的MOS值。其中PESQ-LQ和PESQ-Ie都是根据pesq_score分值采用简单的公式转换得来得,PESQ-LQ值是根据心里声学来计算的,而PESQ-Ie是根据ITU-T P.834得到的在同样差的话音质量条件下,pesq_score分值要比主观的MOS值大。心里声学通过大量的主观测试数据来进行分析。为了更好地将PESQ和传统的MOS值联系起来,我们引入了PESQ-LQ 的概念。根据ITU-T P.800的介绍,PESQ-LQ更接近人的主观听觉质量。MOS值一般在1到5之间,而PESQ-LQ的分值在1到4.5之间。在主观测试中,PESQ-LQ的最大值为4.5。3.7 CDMA MOS分

11、值较低的原因3.7.1 ITU-T P862系列的规范有分歧:ITU-T P.862发布于2001年2月,其中对适用范围的有如下表格:Table 1/P.862 Factors for which PESQ had demonstrated acceptable accuracyTest factorsSpeech input levels to a codecTransmission channel errorsPacket loss and packet loss concealment with CELP codecsBit rates if a codec has more than

12、one bit-rate modeTranscodingsEnvironmental noise at the sending side (See Note.)Effect of varying delay in listening only testsShort-term time warping of audio signalLong-term time warping of audio signalCoding technologiesWaveform codecs, e.g. G.711; G.726; G.727CELP and hybrid codecs 4 kbit/s, e.g

13、. G.728, G.729, G.723.1Other codecs: GSM-FR, GSM-HR, GSM-EFR, GSM-AMR, CDMA-EVRC, TDMA-ACELP, TDMA-VSELP, TETRAITU-T P.862规范规定PESQ算法是可以用于不同制式网络之间的话音质量评估的。ITU-T P.862.3发布于2007年11月。3GPP2组织过对EVRC编码方式和GSM-AMR编码方式的MOS对比测试,与PESQ的分值相比,QualComm公司认为PESQ算法对与EVRC族编码方式评分总体偏低。对此,ITU-T在P.862.3(2007/11)中予以声明,不建议在对

14、比使用EVRC编码的网络(如CDMA)和其他网络(如GSM/WCDMA/TD-SCDMA)时直接使用P.862得分(包括PESQ,PESQ LQ,P.862.1,P.862.2)进行对比,对于使用EVRC编码的网络,P.862得分直接对比仅适用于对相同制式网络的比较。以下为规范内原文Conclusions:1) The direct comparison of P.862.1/P.862.2 scores obtained with AMR-type codecs or other ITU-T speech codecs with the EVRC family of codecs is no

15、t recommended. This includes the benchmarking between GSM/UMTS networks and CDMA networks which are usually equipped with EVRC family codecs.2) The comparison of different conditions (e.g., bit rates, error patterns) using EVRC is possible by P.862.1/P.862.2 due to the correct relative ranking of th

16、e quality scores within those conditions. Consequently, P.862.1/P.862.2 might be usable for benchmarking of CDMA networks to each other or for optimization efforts within those networks if the same codec is involved. The direct comparison of P.862.1/P.862.2 scores with P.800 subjective listening scores is no

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论