(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf_第1页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf_第2页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf_第3页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf_第4页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(硬件部分).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学硕士研究所学位论文 摘要 摘要 语音业务一直在通信中占有主导地位,因此在通信网络中对通信系统或单个设备的语 音质量评价占有很重要的地位。由于语音好坏最终取决于人的主观感受,所以在语音系统 中长期以来都是采用主观评价的方法。但是这种方法费时费力,同时受到测试条件和测试 人员主观因素的影响,降低了测试结果的可靠性。 针对上述缺点,i t u t 推出了e 8 6 2 建议,该建议推荐使用p e s q 算法,p e s q 算法 既建立在客观评价模型的基础上,又使得客观评估结果与主观评定结论一致性最高,并且 这是一种基于输入输出方式的典型算法,效果良好。 本文就是根据这一建议提出并设计完成一种客观语音评价的测试系统。该测试系统基 于e 1 接口,采用i ,r u tp 8 6 2p e s q 算法模型。文章首先对p e s q 算法的原理作了简单的 阐述,然后提出了系统的总体框架及各功能模块,并对系统设计中需要用到的芯片及技术 作了详细的介绍,对系统中的内存等做了具体的规划,根据系统的设计方案作了原理图与 制板设计。 南京邮电大学硕士研究所学位论文 a b s t r a c t v o i c ec o m m u n i c a t i o nh a sb e e ni nad o m i n a n tp o s i t i o ni nt h ep r e s e n t a g e s ot h ev o i c e q 砌i t ya s s e s s m e n tf o rt h ec o m m u n i c a t i o ns y s t e m so rf o r a ni n d i v i d u a lv o i c e q u a l i t yd e p e n d e n t d e v i c ep l a y sa l li m p o r t a n tr o l e s i n c et h ev o i c eq u a l i t ye v a l u a t i o nu l t i m a t e l yd e p e n d so n p e o p l e ss u b j e c t i v ef e e l i n g s ,s ot h es u b j e c t i v ee v a l u a t i o nm e t h o dh a sb e e nt h ee s s e n t i a li na l o n gt i m e b u tt h i st e s tm e t h o dt a k e sal o n gt i m ea n dt h er e s u l t sw i l lb em o r ed e p e n d e n t o nt h e p a r t i c i p a t o ra n dt h e i rf e e l i n g ,t h e r e f o r er e d u c e s t h er e l i a b i l i t yo ft h et e s tr e s u l t s i nr e s p o n s et ot h e s es h o r t c o m i n g s ,i t u tp 8 6 2i n t r o d u c e dap r o p o s a lt ou s ep e s q a l g o r i t h m p e s qa l g o r i t h mi sb a s e do na no b je c t i v ee v a l u a t i o nm o d e la n dh i g h l yk e e p s c o n s i s t e n c yw i t hs u b j e c t i v ea s s e s s m e n tm e t h o d i ti sb a s e do nt h ei n p u t o u t p u ta n a l y s e sa n d 、耐t l lg o o de f f e c t t h i sp a p e ri sa i m e dt od e s i g na l lo b j e c t i v es p e e c hq u a l i t ye v a l u a t i o ns y s t e m t h et e s ts y s t e m i sb a s e do ne 1i n t e r f a c e ,u s i n gt h ei t u - tp 8 6 2p e s qa l g o r i t h mm o d e l t h ea r t i c l ef i r s t i n t r o d u c e st h ep e s qa l g o r i t h mo nt h ep r i n c i p l e ,t h e nt h eo v e r a l lf r a m e w o r ko ft h es y s t e ma n d f u n c t i o n a lm o d u l e sa r ee x o l a i n e d ,a n dt h e nt h ec h i p sw ec h o s e na n dt h e i rt e c h n i c a lp r o p e r t i e s a r ed e s c r i b e di nd e t a i l ,i nt h ef m a lo ft h ep a p e r ,w eg i v et h et o t a ls c h e m a t i ca n dt h ep r i n t e d c i r c u i tb o a r dd e s i g n 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名:日期:缈妒江肜 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:衄导师签名: n m 魄 南京邮电大学硕士研究所学位论文前言 前言 语音业务长期以来都是通信业务的主要部分。尽管下一代电信网n g n 是基于分组数据 网络且采用统一的i p 协议,在未来的5 n 1 0 年内,融合语音、数据、视频应用的网络技术 将成为电信运营商的核心网络技术,但在电信网的所有业务当中,语音业务仍然是运营商 的最基本和最主要的业务,其市场的涵盖范围和商业收入远比其他的业务要大。由于语音 业务所占有的重要性,对其质量评价也就成为一个战略性问题。 对网络设备语音质量的评价标准有多种,早期采用的大多是i t u te 8 3 0 建议的m o s 值 模型:请几十个人来听一段语音,对经过设备的语音质量进行评价,然后给出分数,最高 是5 ,最低是l ,这是一种主观的定性标准但也是判定语音通信质量的终极目标。尽管r 8 3 0 建议规定严谨,所有操作都严格服从流程操作,但其测试结果总存在主观上的偏差。为了 能克服这些主观上的弊端,有人提出了i t u tp 8 6 1 建议的p s q m 算法用来作为客观质量度 量的评估。p s q m 的客观性是指模仿现实生活中主观声音的感知。但p s q m 仿真实验中仍 主观判断话音编码器的质量。通过把编码后的信号和源信号进行比较,p s q m 仍以m o s 值 模型的5 个级别作为评估结果。p s q m 方法并未摆脱原始的主观评估。1 9 9 8 年,一个基于归 一化块测度( mnb ) 的可选系统作为附件添加到p 8 6 1 中。m n b 是在考虑听过程的基础上, 采用m n b 方法来模拟人的判断过程,评价结果与主观评价值相关度较高。另p b h o l l i e r 在前 人的基础上扩展了巴克谱失真( b s d ) 模型,引领了感知分析测度系统( p a m s ) 的发展。p a m s 是第一个关注端到端行为,包括滤波和变化时延造成的影响的模型。后来i t u t 研究小组 结合了这两种算法提出了一个新的模型,叫做p e s q 算法。2 0 0 1 年6 月p e s q 被定为i t u t r 8 6 2 建议。 与其他目前流行的算法比较,p e s q 算法既考虑了端到端的时延,可以评估不同类型的 网络,又采用了听觉模型等比较先进的技术,对通信时延、环境噪声和错误都有较好的评价, 比较适合现代通信语音质量评价的要求。 目前国内外网络测试中对入网的语音设备都要进行语音质量的测试。显然由测试人员 通过通话根据评分标准主观评定的m o s 值估值方法不容易进行且具有很大的主观性,所以 网络设备测试中逐渐采用客观评价方法p e s q n u 试评分。因为p e s q 可以利用专门的测试仪 器进行测试,可操作性强。当前有许多测试仪表厂商已经开发出用于p e s q 的测试仪表。例 如a g i l e n t 公司的t e l e g r av q t 语音质量测试仪,能够测试端到端语音时延、清晰度、静音 抑制和d t mf 音调分析等参数、能够提供专业的端到端的语音质量p e s q n i 试,并对话音 质量进行客观分析。 l 南京邮电大学硕士研究所学位论文前言 虽然有众多厂商在开发和已经开发出许多用于网络上的感知语音评价仪器,但专用于 e 1 接口的感知语音测试设备还没有。本课题就是基于这一实际需要,完成e l 接口感知话音 质量( p e s q ) 测试设备的研究及硬件的实现。n 儿2 1 3 1 2 南京邮电大学硕士研究所学位论文 第一章感知语音质量( p e s q ) 算法原理 第一章感知话音质量( p e s q ) 算法原理 1 1 语音主观评价方法 主观评价方法的依据是i t u te 8 0 0 ( 传输质量的主观评价方法) ,利用人本身的主观 感觉给听到( 或对话) 的语音的满意度打分,打分的基本原则是可懂度。依此分数来评价 端到端的语音质量。其中最简单的是a c r ( a b s o l u t ec a t e g o r yr a t i n g ) 方法。这种方法是 建立在多人主观评定打分基础上的一种基本话音质量评价方法,主观语音评估由2 0 5 0 人完成,要求每个人在听完一段语音片段后根据自己的感受给出一个分数,分数分布如表 1 1 。另外,协议还提出了d c r ( d e g r a d a t i o nc a t e g o r yr a t i n g ) 方法和c c r ( c o m p a r i s o n c a t e g o r yr a t i n g ) 方法。d c r 方法是让评定主体先后听到未失真的参考语音和失真语音, 然后根据感觉对听觉失真评定,c c r 方法是比较听到的参考语音和失真语音,评定第二个 语音的质量比第一个好或者坏多少。a c r 是在通信系统评估中最常用的方法。 在对通信系统的主观听觉测试中,需要注意以下几点: 1 - 测试要在一个安静的噪音受到控制的房间里进行。 2 测试用的电话装置符合标准。 3 测试录音长为8 s 左右,内容是不相关的两个句子。 4 测试需要对每个编译码环境下的由两个男性和两个女性发声的语音进行评定。 5 测试主体皆非专家。 一旦测试完成,对所有测试主体的打分取平均值,这个平均值称为m o s ( m e a n o p i n i o ns c o r e ) 分。如表1 1 所示。 得分评价 5优异( e x c e l l e n t ) 4良好( g o o d ) 3一般( f a i r ) 2较差( p o o r ) 1极差( b a d ) 表1 1m o s 的主观评定标准 南京邮电大学硕士研究所学位论文 第一章感知语音质量( p e s q ) 算法原理 1 1 1 语音主观评价的优点 主观评定方法建立在人的主观听音的感觉之上,符合话音通信的用户满意度终极目 标,它可以将各种话音损伤因素( 噪音,误码,时延抖动,时频域失真,回声等) 对人的 感知效果综合到听音系统中,因此是一种最重要的基础语音质量评估方法。应当指出,所 有的客观评定方法或其它方法改进,最终都要用主观评定法作检验,它们之间应具有良好 的相关性,否则便失去了方法改进的最终意义。 1 。1 2 语音主观评价的缺点 这种方法费时费力,由于音质好坏最终取决于人的主观感受,而且受种种测试条件和 测试人员的主观因素的影响,使得测试结果的一致性较差,可靠性受到一定的影响。要对 日益庞杂的系统输出语音进行主观测评,工作量十分巨大。 1 2 客观语音评价方法 为了能克服这些主观上的弊端,先后研究提出了感知语音质量测量( p s q m :p e r c e p t u a l s p e e c hq u a l i t ym e a s u r e ) 算法和感知声音质量测量( p a q m :p e r c e p t u a la u d i oq u a l i t y m e a s u r e ) 算法,但这些算法都存在着很多不足,后来i t u - t 研究小组结合了这两种算法提 出了一个新的模型,叫做p e s o 算法。2 0 0 1 年2 月,i t u - t 推出了最新的p 8 6 2 建议窄 带电话网络端到端语音质量和话音编解码器质量的客观评价方法,该建议推荐使用 p e s q 算法,这是一种基于输入输出方式的典型算法,效果良好。p e s q 是感知语音质量 评价( p e r c e p t u a l e v a l u a t i o no f s p e e c hq u a l i t y ) 的缩写,是窄带电话网络和语音编解 码器的端到端语音质量的客观评价方法。 1 2 1p s o m 算法 p s q m 是p e r c e p t u a ls p e e c hq u a l i t ym e a s u r e 的缩写,即感知语音质量测量。在1 9 9 6 年被 国际电联i t u t 采纳成为p 8 6 1 建议,它用于电话带宽在3 0 0 3 4 0 0 h z 之间的语音编解码器的 客观质量的测量。基本结构如图2 1 所示。这个模型的核心是听觉变换,它模拟了人的听觉 系统的主要心理和物理处理过程。计算信号在时域和频域的响度级,表示的步骤如下: 1 用长为3 2 m s 的汉宁窗对语音信号做短期傅立叶变换,相邻的帧有5 0 的交迭; 4 妻室塑皇奎兰堡主堑壅堕兰垡笙茎墨二雯壁垫堕童堕墨! ! 兰! 里! 兰鲨堕里 2 经过短期傅立叶变换后,信号功率谱的频率变换至1 j 5 6 频带的巴克谱域; 3 局部衡量:对退化语音信号功率逐帧进行部分补偿到基准语音信号功率的水平,来实 现消去低频增益调制; 4 模拟电话机接收频率特性滤波; 5 添j j i h o t h 噪声,这是一种话机测试用的仿真室内环境噪声源,谱特性从1 0 0 h z 到 8 0 0 0 h z ,标准见i e e es t a n d a r d2 6 9 2 0 0 1 ( r e v i s i o no f i e e es t a n d a r d2 6 9 1 9 9 2 ) : 6 信号响度映射到压缩的响度级域; 7 逐帧补偿退化语音信号的响度级到基准语音信号的水平。 早期计算质量评估得分的方法都是基于退化语音信号与基准语音信号在听觉变换过 程中产生的平均干扰计算。p s q m 引入了认知模型来描述退化语音信号与基准语音信号在 听觉变换过程中产生的干扰差。它通过模拟两个效应,即不对称和对语音信号不同部分的 不同加权,改进了客观评估分与主观m o s 分的相关性。当输入信号通过编解码器和传输系 统非线性失真( 如时延波动) 后,此时很难将失真信号在时频分量上线性表达为原始信号加 失真信号,但客观评价失真输出信号时采用了上述线性分析模型,由计算输入输出信号的 时频分量的差值,得出干扰函数用以评估语音质量,这造成客观失真模型得出的失真预测 值小于实际主观听觉失真,这种误差就是不对称效应。这个效应可由计算不对称干扰密度 来补偿。不对称干扰密度由干扰密度乘以一个不对称因子得到,不对称因子等于失真信号 对原始信号的音调功率密度比的1 2 次幂,不对称因子的合理选取改善了主客观评价模型的 误差。发生在语音活动期的干扰比发生在语音静默期的干扰更令人烦扰,这个效果可以由 加权因子来模拟,这个加权因子可根据试验内容改变。在1 9 9 6 - 1 9 9 9 年,p s q m 被进一步改 进以适用于实际系统的端到端测试,产生了一个新的模型p s q m 9 9 。 图1 1p s q m 原理图 5 预测 南京邮电大学硕士研究所学位论文 第一章感知语音质量( p e s q ) 算法原理 1 2 2p a m s 评估方法 p a m s 是p e r c e p t u a l a n a l y s i sm e a s u r e m e n ts y s t e m 的缩写,即感知分析测度系统。它的 核心是扩展的巴克谱失真( b s d ) 模型,该模型是h o l l i e r 通过组合一系列用于谱分析的线性滤 波器,不仅考虑了失真大小还考虑了失真的分布。p a m s 用于评估电话网络和语音编解码, 是第一个可用于端到端系统的评估,包括滤波和时延变化造成的影响的模型。基本结构如 图1 2 所示。 图1 2 p a m s 原理图 这个模型首先进行时间轴校准,用多个处理步骤来校准基准语音信号与退化语音信 号。语音信号被划分成段落,计算时延变化,时延变化是由于包的传输引起的,比方说i p 电话系统。基准语音信号和退化语音信号都要补偿到一个标准的听觉电平。听觉变换过程 如下: 1 用输入滤波器来模拟电话机的响应以及人耳的生理结构; 2 用一组线性滤波器把信号变换到巴克谱的1 9 个频带域; 3 计算每个巴克谱频带内每4 m s 帧的平滑的功率包络; 4 基准语音信号功率部分补偿到退化语音信号功率的水平,确定补偿因子; 5 把信号映射到响度( 单位为方) 域; 6 把信号映射到响度级( 单位为宋) 域。 基于基准语音信号和退化语音信号的听觉变换过程计算一系列误差参数,从而对不同 种类的失真进行了测量。这些误差参数在时间上取平均值,然后通过一个非线性函数映射 到质量评估得分,这个非线性函数保证误差参数与质量评估得分之间是单调的。最后计算 得到两个质量评估得分,即在a c r 主观评估方法中的主观m o s 分和听觉努力度得分。 听觉努力度是指测试主体听完测试语音后对所听到的句子的理解难易程度打分,评价 6 南京邮电大学硕士研究所学位论文 第一章感知语音质量( p e s q ) 算法原理 标准如表1 2 所示 1 2 3p e s q 算法 得分评价 5 完全放松 4需要集中注意,努力可忽略 3 需要适中的努力倾听 2需要相当的努力倾听 l完全无法理解 表1 2 听觉努力度评价标准 p e s q 是基于感知模型的语音质量客观评价标准,相对于p e q m 这个标准,p e s q 针 对于现代通信系统中出现的可变时间延迟和系统引入的线性滤波这两方面做了改进,对差 值曲面的解释中不但考虑误差的总量还虑误差的分布,增强了对于端到端的通信系统质量 的可靠评价。 p e s q 的算法结构见图1 3 所示。 图1 3p e s q 原理图 p e s q 总的思路是l 对原始信号( 参考信号) 和通过测试系统退化的信号进行电平调 整到标准听觉电平,再用输入滤波器模拟标准电话听筒进行滤波。对通过电平调整和滤波 后的两个信号在时间上对准,并进行听觉变换,这个变换包括对系统中线性滤波和增益变 7 南京邮电大学硕士研究所学位论文第一章感知语音质量( p e s q ) 算法原理 化的补偿和均衡。两个听觉变换后的信号之间的不同作为扰动( 即差值) ,分析扰动曲面 提取出两个失真参数,在频率和时间上累积起来,映射到对主观平均意见分的预测值。 1 时间对准 p e s q 假设系统的时延是分段恒定的。在静默期间和说话期间时延可能改变。时间对 准程序有以下步骤: 1 ) 信号通过窄带滤波,突出对感知重要的部分。这些滤波后的信号只用于时间对准; 2 ) 基于包络的延时估计; 3 ) 把参考信号按话语分成段; 4 ) 对每一段进行基于包络的延时估计; 5 ) 对每一段话语进行基于柱状图的互相关的延时验证; 6 ) 对于说话中的延时改变重新进行话语分解和定位; 2 听觉变换 p e s q 中的听觉变换是一个听觉感知模型,它把信号变换到可感知的响度表达。包括 以下步骤: 巴克谱:对语音信号汉明加窗后,用f f t 计算每一帧的瞬时功率谱,用类似与p e q m 中的程序将功率谱变换为改进的b r a k 尺度上的能量谱。 频率均衡:计算有效话音帧的平均巴克谱值。通过参考话音和失真话音间的比率就 给出传输函数估计。参考话音使用传输函数估计值补偿到和失真话音相当,补偿最多不超 过+ _ 2 0 d b 。 增益变化均衡:参考信号和失真信号的可听功率之间的比值用于标识增益变化。此 比值通过一阶低通滤波器滤波,失真信号乘以这个功率比,补偿到和参考信号相当。 响度映射:通过一个与频率相关的听觉门限和指数变换,将巴克谱映射到响度级 ( 宋) 。在每一时频单元给出感受到的响度。 3 扰动处理和认知模型 参考信号与失真信号间的绝对差值给听觉误差一个测度。在p e s q 中,在进行时间和 频率上非线性平均之前要经过几步处理。 1 ) 删除的处理:如果信号的删除延时( 负的时间延迟) 超过半帧以上,在这种情况下 计算客观语音质量时,忽略帧干扰能得到更好的值。 2 ) 掩蔽效应:在每一个时频单元都使用一个简单的门限来进行响度的掩蔽处理,在 门限以下的干扰是听不见的,这个值设定为参考函数和失真函数中响度较小的一个的四分 r 南京邮电大学硕士研究所学位论文第一章感知语音质量( p e s q ) 算法原理 之一。门限由绝对响度相减得到,小于零的定为零。 3 ) 非对称处理:p e s q 计算两个不同的误差平均,其中一个有不对称因子,一个没 有。p e s q 的非对称因子是由失真信号对参考信号在每一时频单元的巴克谱密度比得到 的。非对称因子的值如果小于3 ,则定为零。如果大于1 2 ,则定为1 2 。不对称加权的干 扰值,通过乘以这个因子得到,只计算附加的失真。 4 时频扰动失真的累计 按照局部的误差决定感知效果的原则,p e s q 在不同的时频测度上使用l p 范数进行 非线性累加干扰。流程如下: 1 ) 扰动先在频率测度上按l p 范数累加,给出每帧的可感知的失真测度。 2 ) 然后在2 0 帧( 3 2 0 m s ) 的时间间隔上对帧扰动进行l p 范数平均累加失真。 3 ) 最后在整个语音文件的时间长度上对第二步得到的失真测度再一次用l p 范数进 行平均累加。 整个累加计算使用了3 个不同的p 值的l p 范数将扰动失真映射到一个数值。 5 对坏段的重定位 在某些情况下,时间对准可能没有正确地确定延时的变化,这样由于错误的延时估计 导致大的计算误差,通过标记坏帧( 对称干扰值超过4 5 ) ,将坏帧连接成坏段。对每个坏 段重新定位,计算扰动失真值。互相关是用来计算新的延时估计值。如果重新定位后的扰 动失真值变小,则使用新值。在重定位以后再总计整个失真测度。 6 m o s 预测分和模型校准 为了优化p e s q 参数,在三个失真平均累加阶段通过使用不同的p 值计算大量的对称 和非对称参数。参数线性组合的线性回归拟合来预测主观m o s 值。对大量的候选参数集 进行了选择试验。找到最优组合,给出最高的相关系数。 1 2 4p s o m 、p a m s 等前期模型的不足 早期模型具体的不足如下所示: 1 可变时延:大的时延削弱了双向通话,因此使端到端的时延最小化是非常有必要 的。而基于包的传输会导致每个包都有不同程度的时延,因此很需要能够平滑不 同时延、产生连续的声音流的缓冲器。缓冲器又是增加端到端时延的一个重要因 素,因此有必要在缓冲器的长短与包丢失率之间找到一个平衡点。编解码评估模 型例如p s q m 、m n b 对可变时延的敏感度很高。当时延在语音静默期间变化时, 9 南京邮电大学硕士研究所学位论文第一章感知语音质量( p e s q ) 算法原理 2 0 m s 的时延变化会导致p s q m 分下跌1 m o s 分,而对于m n b ,5 m s 的时延变化 就会导致1 m o s 分的下跌。 2 线性滤波:在通信系统的很多部件中都用到大量的线性滤波器。用于端到端声音 系统评估的感知模型必须提供较小的线性失真,这个效果通常通过补偿拉近参考 信号与退化信号来达到。p a m s 、p s q m 9 9 使用了部分补偿,并计算由此产生的 残留误差;p e a q 使用了全部补偿,由此产生的线性失真作为一部分算入最终的 主观m o s 分的衰退。p s q m 、m n b 没有充分考虑滤波效应,在滤波前后的表现 相差甚远。 3 可变增益:虽然在现在的电话系统中不常用,但是有时语音还是要经过低频振幅 调制。它一般伴随着自动增益控制。这么做的目的是消除语音在不同国家的网络 中传输时设备引起的损耗产生的影响或电平变化的影响。背景噪声和声音电平上 的正常变化都会引起增益的变化,而自动增益控制能起到的作用很有限。m n b 从根本上忽略了调制。p a m s 只对增益变化发生在语音的静默期时进行计算并消 除,而对于发生在激活期的增益变化只进行测量。p s q m 、p s q m 9 9 逐帧追踪包 络的变化,消除延迟效应来保证计算增益变化引起的失真误差。 1 。2 5p e s o 的优点 编解码评估模型,例如p s q m ,存在局限性,使得当它们在特定应用特别是在包括线 性滤波器或具有时延变化的系统中产生的结果不可靠。这些影响,再加上一定类型的编码 失真、包丢失和背景噪声,就是引起b s d ,p s q m 和m n b 等早期模型产生不精确得分的 原因。因此i t u t1 2 研究组进行了一项实验来找到一种新的模型,以期能适应更广泛的 编解码器和网络情况,具有更好的性能和表现。在比较中,p a m s 和p s q m 9 9 ( p s q m 的 更新和扩展版本) 两种算法的性能最好,然后就结合了这两种算法产生了一个新的模型, 叫做感知语音质量评估( p e s q :p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y ) 。2 0 0 1 年2 月p e s q 被确定为r 8 6 2 建议。 p e s q 算法将话音的频率,响度等物理特性与人类心理上的感知特性的关系通过数学 模型对应起来,用客观模型来模拟主观感觉的评价。该模型采用时频映射、频率弯折和响 度弯折等方法,结合感知模型,将语音中“可感知”的特性在数学上尽可能完美的表达。 p e s q 具有广泛的适用性,具有端到端的复杂信道和网络语音质量评价能力,适用于移动 通信系统在内的通信网络的语音通信质量评价。 l o 南京邮电大学硕士研究所学位论文第一章感知语音质量( p e s q ) 算法原理 1 2 6p e s o 的应用 测试因素编码网络技术测量应用 波形编码( 如g 7 1 l , g 7 2 7 ) 现场网络的测量 编码失真c e l p 混合编解码 网络的规划 传输包丢失( 4 k p s 或更高的码率) 编解码器性能评价和 多次变换编码 ( 如 选择 环境噪声g 7 2 8 ,g 。7 2 9 ,g 7 2 3 1 ) 设备选择 时间扭曲( 可变时间移动编解码系统( 如 编解码器和设备性能 延迟) g s m f r ,h r ,a m r ,c d m a , 优化 e v r c 、t d m a 、a c e l p 、 v s e l p 、t e t r a ) 表1 3 适合p e s q 可观语音质量评价的条件 i t u t 的相关的资料已证明p e s q 在表1 3 条件下能够给出令人满意的预测值。 p e s q 中合理的声音感知和认知模型保证了在2 5 g 和3 g 网络中准确的端到端语音质 量的评价。p e s q 可以处理语音和数据传输网络的特定失真,可以准确评价和比较移动电话 的质量。p e s q 能用于所有类型的网络系统,例如无线网络、v o l p 系统、固定电话网络 等。 在网络维护和运营过程中,应甩p e s q 可以快速诊断语音质量和定位语音质量问题。 当语音质量低于所界定服务质量要求时,采用p e s q 作为质量评价性能监视器可以作出调 整提示,要求对网络的性能加以调整。采用p e s q 作为客观评价模型,可以根据客户需求 灵活地制定提供的服务质量,细化服务等级,从而可以帮助网络运营商获得最佳的q o s 和性价比。 目前p e s q 已经广泛应用于性能测试。由于其具备快速和可重复性,p e s q 可以在适 用的条件下对通信设备和通信系统的质量进行准确的测量和评价。 1 声码器的研制。编码算法调整的效果得以通过p e s q 及时地检查,这个模型也可以 用于研究编码质量随比特率、输入电平及信道差错的变化情况。 2 设备选择。通过p e s q 可以对编码解码器和其它通信系统进行比较。例女n # p e s q 已经成功地对用于移动网络、v o i p 、语音编码解码器的各种技术加以比较。 3 设备优化。对于选择编码器、输入电平、比特率、缓冲区的长度等决策中使用客 观模型可以快速地进行优化处理,而且能工作于传统主观评价无法区分质量差别的场合。 4 性能监视。对于一个用于网络的测试单元,p e s q 可以测量通信系统的通话质量, f l 南京邮电大学硕士研究所学位论文 第一章感知语音质量( p e s q ) 算法原理 可以随时跟踪质量的变化,可以在通信系统的客户意识到质量恶化前发现网络的的问题。 【4 】【s 】【6 l 7 1 1 2 南京邮电大学硕士研究所学位论文第二章设备实现方案及芯片资料概述 第二章设备实现方案及芯片资料概述 2 1 总体设计方案 本课题设计目标是基于p e s q 算法的e l 接口上的语音质量测试设备,该设备的p 8 6 2 算法软件部分已经在前期工作中完成,该软件只要指定并输入原始语音及退化语音文件, 就可得出p e s q 评定分值。我们要做的是符合e 8 6 2 要求的e 1 上语音信号的发送与采集 设备。 经过选择的多段语音原始材料存贮在测试设备内,经e 1 接口进入待测系统,经过系 统失真的语音又返回测试设备e 1 接口并被记录,这些原始测试语音序列参数及失真的语 音段落序列通过设备监控接口送到p c 上,p c 上按照e 8 6 2p e s q 算法给出每段语音的评 价分值,可以从p c 控制将多种来源的原始测试语音材料( 按照某种格式) 灌注到设备存 储器内( 不少于8 段,每段约1 0 秒) 。语音材料的选择要求符合e 8 6 2 建议。 这主要包括以下4 个模块,一是e 1 接口模块,本模块的功能是对存储在s r a m 中的原始 语音处理,转换成e 1 数据流的格式发送出去。同时对经过待测系统失真后的语音接收并在 m c u ( 微控制器) 的控制下存储到s r a m 中;二是m c u 模块,该部分是系统的核心部分, 负责与外部工作站相通信,由外部工作站下载语音材料及测试序列并存储到s 洲中,在 测试中控制e 1 接口模块从s r a m 中读取原始语音发送到待测系统,同时控制接收失真语音 数据并存储到s 删中,完成后将采集到的失真语音文件通过接口送到工作站处理,得出 分值;三是语音数据存储模块,该部分是负责存储原始语音和设备测试中接收下来的失真 语音。四是电源模块,负责整个设备的供电情况。 总体结构框图如图2 。1 所示,其中e 1 接口采用的是加拿大z a r l i n k 公司的m t 9 0 7 5 b 芯片,处理控制单元选择的是a t m e l 公司的a t m e g a l 2 8 ( l ) 芯片,语音数据存储模块则采 用2 m b y t es r a m 。 南京邮电大学硕士研究所学位论文 第二章设备实现方案及芯片资料概述 2 2m c u 和数据存储模块 2 2 1 数据存储模块 图2 i 系统框图 由于要存储不少于8 段语音,每段语音10 s 左右;本设计中是采用1o 段10 s 的p c m 语音编 码,共1 0 0 s ,每秒的采样频率是8 k h z ,所以共需要的存储单元是8 k * 1 0 0 = 8 0 0 k b y t e ,由于 发送和接收方向是同时工作的,所以需要8 0 0 k b 幸2 = 1 6 0 0 k b ,需要一块2 m b y t e 的s r a m 。 2 。2 2 微控制器m c u 本系统中微控制器m c u ( m i c r oc o n t r o l l e ru n i t ) 选用的是a t m e l 的a v r 单片机 a t m e g a l 2 8 。a t m e l 的a v r 单片机是增强型r i s c 内载f l a s h 的单片机,芯片上的f l a s h 存储器附在用户的产品中,可随时编程,再编程,使用户的产品设计容易,更新换代方便。 a v r 单片机采用增强的r i s c 结构,使其具有高速处理能力,在一个时钟周期内可执行复 杂的指令,故每m h z 时钟速率可实现1 m i p s 的处理能力。a v r 单片机工作电压为 2 7 - 6 0 v ,可以实现耗电最优化。a v r 的单片机广泛应用于计算机外部设备、工业实时控 制、仪器仪表、通讯设备、家用电器、宇航设备等各个领域。 a v r 单片机采用哈佛结构,具备1 m i p s m h z 的高速运行处理能力;采用r i s c ( 精 简指令集) ,具有3 2 个通用工作寄存器,克服了如8 0 5 1m c u 采用单一a c c 迸行处理造 成的瓶颈现象;快速的存取寄存器组、单周期指令系统,大大优化了目标代码的大小、执 1 4 壹室坚皇奎兰堡圭堡窒里兰垡笙奎 墨三兰堡鱼壅翌查墨墨至笪鎏型塑垄 行效率,部分型号f l a s h 非常大,特别适用于使用高级语言( 如c 、b a s i c ) 进行开发;作 输出时与p i c 接口的电流驱动能力相同,可输出4 0 m a ( 单一输出) ,作输入时可设置为 三态高阻抗输入或带上拉电阻输入,具备1 0 m a 2 0 m a 灌电流的能力;片内集成多种频率 的r c 振荡器、上电自动复位、看门狗、启动延时等功能,外围电路更加简单,系统更加 稳定可靠;大部分a v r 片上资源丰富:带e 2 p r o m ,p w m ,r t c ,s p i ,u a r t ,t w i , i s p ,a d ,a n a l o gc o m p a r a t o r ,w d t 等;大部分a v r 除了有i s p 功能外,还有i a p 功能, 方便升级或销毁应用程序。 a t m e g a l 2 8 为基于a v rr i s c 结构的8 位低功耗c m o s 微处理器。由于其先进的指令集 以及单周期指令执行时间,从而可以缓减系统在功耗和处理速度之间的矛盾。 2 2 2 1 a t m e g a l 2 8 的结构框图 a t m e g a l2 8 ( l ) 功能模块图2 2 所示: 图2 2 a t m e g a l 2 8 功能模块说明图 1 5 南京邮电大学硕士研究所学位论文第二章设各实现方案及芯片资料概述 2 2 2 2 a t m e g a l 2 8 的特点 产品特点 ( 1 ) 高性能、低功耗的a v r8 位微处理器 ( 2 ) 先进的r i s c 结构 一1 3 3 条指令一大多数可以在一个时钟周期内完成 一3 2x8 通用工作寄存器+ 外设控制寄存器 一全静态工作 一工作于1 6m h z 时性能高达1 6m i p s 一只需两个时钟周期的硬件乘法器 ( 3 ) 非易失性的程序和数据存储器 一1 2 8 k 字节的系统内可编程f l a s h 寿命:1 0 ,0 0 0 次写擦除周期 一具有独立锁定位、可选择的启动代码区通过片内的启动程序实现系统内编程真正 的读修改写操作 一4 k 字节的e e p r o m ,寿命:1 0 0 ,0 0 0 次写擦除周期 一4 k 字节的内部s r a m 一多达6 4 k 字节的优化的外部存储器空间 一可以对锁定位进行编程以实现软件加密 一可以通过s p i 实现系统内编程 ( 4 ) j t a g 接口( 与i e e e1 1 4 9 1 标准兼容) 一遵循j t a g 标准的边界扫描功能 一支持扩展的片内调试 一通过j t a g 接口实现对f l a s h ,e e p r o m ,熔丝位和锁定位的编程 ( 5 ) 外设特点 一两个具有独立的预分频器和比较器功能的8 位定时器计数器 一两个具有预分频器、比较功能和捕捉功能的1 6 位定时器计数器 一具有独立预分频器的实时时钟计数器 一两路8 位p w m 一6 路分辨率可编程( 2 到1 6 位) 的p w m 1 6 南京邮电大学硕士研究所学位论文 第二章设备实现方案及芯片资料概述 一输出比较调制器 一8 路l o 位a d c 。8 个单端通道 7 个差分通道 2 个具有可编程增益( 1 x ,1 0 x ,或2 0 0 x ) 的差分通道 一面向字节的两线接口 一两个可编程的串行u s a r t 一可工作于主机从机模式的s p i 串行接口 一具有独立片内振荡器的可编程看门狗定时器 一片内模拟比较器 ( 5 ) 特殊的处理器特点 一上电复位以及可编程的掉电检测 一片内经过标定的r c 振荡器 一片内片外中断源 一6 种睡眠模式:空闲模式、a d c 噪声抑制模式、省电模式、掉电模式、s t a n d b y 模式以及扩展的s t a n d b y 模式 一可以通过软件进行选择的时钟频率 一通过熔丝位可以选择a t m e g a l0 3 兼容模式 一全局上拉禁止功能 ( 6 ) i o 和封装 一5 3 个可编程i o 口线 一6 4 引脚t q f p 与6 4 引脚m l f 封装 ( 7 ) 工作电压 一2 7 - 5 5 va t m e g a l 2 8 l 一4 5 5 5 va t m e g a l 2 8 ( 8 ) 速度等级 一o - 8m h z a t m e g a l 2 8 l o 1 6m h z a t m e g a l 2 8 南京邮电大学硕士研究所学位论文第二章设备实现方案及芯片资料概述 2 2 2 3a t m e g a l2 8 引脚图 p e n r x l ( p o i ) p e o f r x l x 归d o ) p e l d c c k a i n 0 ) p e 2 ( c ( = 3 a a i n l ) p e 3 ( o c 3 b , i n t 4 ) p e 4 ( o c 3 c n t 5 lp e 5 f r 3 一n t 6 ) p e f l 租醐n r 乃p e 7 丽) p b 0 s c k ) p b l ( m o sm ) p b 2 l m i s o ) p b 3 ( o c 0 ) p b 4 f 0 c 1 p b 5 ( 0 c 1 勖p b e 2 2 2 4 a t m e g a l 2 8 引脚功能说明 图2 3a t m e g a l 2 8 引脚图 p a 3 彻 p a 4 ( a d 4 ) p a 5 ( a d s ) p 8 ( a d b ) p a 7 ( a d 7 ) p g 2 l e ) p c 7 ( a , 15 i p c 6 ( i 1 4 i p c s f a 3 ) p c 4 ( a i2 p c 3 ( a 1 1 j p c 2c a l p c i ( a 9 j p c 0 f a 8 】 p g l l 只d ) p g 0 ( w i :i , v c c 数字电路的电源。 g n d 地。 端口a ( p a 7 p a 0 )端c i a 为8 位双向i o 口,并具有可编程的内部上拉电阻。其输出缓冲 器具有对称的驱动特性,可以输出和吸收大电流。作为输入使用时, 若内部上拉电阻使能,则端口被外部电路拉低时将输出电流。复位发 生时端e j a 为三态。端e i a 也可以用做其他不同的特殊功能。 端i e i b ( p b 7 p b 0 )端i e i b 为8 位双向i o 口,并具有可编程的内部上拉电阻。其输出缓冲 器具有对称的驱动特性,可以输出和吸收大电流。作为输入使用时, 若内部上拉电阻使能,则端口被外部电路拉低时将输出电流。复位发 生时端口b 为三态。端i e i b 也可以用做其他不同的特殊功能。 端e i c ( p c 7 一p c 0 )端e i c 为8 位双向i o 口,并具有可编程的内部上拉电阻。其输出缓冲 器具有对称的驱动特性,可以输出和吸收大电流。作为输入使用时, 若内部上拉电阻使能,则端口被外部电路拉低时将输出电流。复位发 生时端i e i c 为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论