版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、tnii学朮友叢网论文发表专家一l声音信号质量评测方法及评测软件的实现摘 要:介绍了声音质量的主观评价方法和客观评价方法,同时 基于信噪比的评估参数实现了声音质量的评测软件。关键词:主观评价方法客观评价方法信噪比1引言声音的质量介于如下两者之间:(1)支持可识别语音通信的最低 音质;(2)支持声音保真和美学享受的最高音质。声音质量评价根据评价主体的不同可分为主观评价和客观评价 两种。人作为评价主体,凭着主观感受直接给听到的声音文件进行 质量打分,这是主观评价,它真实地反映了声音质量,但是面对工 作量巨大的需要评测的大量的声音文件,这种方法费时费力,而且 若受到测试人员主观情绪的影响,测量结果的
2、可靠性会受到影响。 因此,有必要设计一个质量评估工具来辅助评测声音质量。研究声音质量客观评价的目的不是用客观评价来完全代替主观 评价,因为他不能反映人对声音质量的全部感受,在客观评价辅助 测评的同时,主观评价仍起着举足轻重的作用,下面介绍的主观测 试和客观测试主要是语音信号的主观测试和客观测试。2主观测试和客观测试的介绍2.1 主观测试在20世纪90年代,通过主观测试制定了声音信号的质量评估方 法,即要求一组测试人员对给定的测试信号的质量打分,这些主观匸交发表专家一LB国学朮发叢网测试方法详见于itu-t p.800.1标准当中。其中绝对种类定级(absolute category rati
3、ng , acr)测量是标准中最广泛地被大家 知道的的主观类测量方法,它要求所有的测试人员收听相同的语音 信号,然后按照从15的5级损伤指标对收听到的声音质量打分(见 表1)。acr测量对测量的人数、环境、条件都有所要求,测量的人数至 少在16人以上,要求一个安静的环境,可控的条件,这样在所有 的测试人员给出得分之后,取它们的一般或平均意见得分(meanopinion score, mos),最后该 mos值就是声音的质量情况,显然mos值越大,声音的质量越好。itu-t p.800标准中也讨论了其他的主观评价方法,如劣化种类评定值(dcr)和对照种类评定值(ccr),dcr方法是让评定主体先
4、 后听到参考语音和失真语音,然后根据感觉对听觉失真评定,评定 标准从1分(非常刺耳)到5分(感觉不到失真)。ccr方法是比较 听到的参考语音和失真语音,评定失真语音的质量比参考语音好或 坏多少,评定标准从-3分(非常差)到3分(非常好)。主观质量评估有如下几个限制条件:主观评测的人数量应足够 多,以便形成有意义的统计;主观评测应具有相同的控制特性;环 境条件应该是一致的;测试应该反复进行,这些问题使得主观测试 成本太高,费时也太长。人们就寻求一些客观评价方法来判别声音 质量。匸交发表专家一m国学朮发叢网 2.2 客观测试声音质量客观评价可分为两种:基于输入-输出的评价和基于输 出的评价。基于输
5、入-输出的评价是通过系统的输入信号和输出信 号之间的差别来度量声音的质量,即通过提取两端信号的特征参 量来建立评价模型;基于输出的评价是仅根据系统输出的退化后的 信号来评价质量。目前的客观评价方法都是以信号的时域、频域及变换域的的特征 参量作为评价依据,语音质量客观评价方法有如下几类:(1) 基于snr评价方法信噪比,即有用信号与噪声之比,是一种广为应用的简单客观评 价方法,一般来说,信噪比越大,混在信号里的噪声越小,声音的 质量越高,否则相反。(2) 基于 lpc(l in ear predictive codi ng)技术评价方法该技术评价方法是以lpc分析技术为基础的,评价依据的参量是
6、lpc系数及其导出参数.由lpc导出的方法有:线性反射系数、线 谱对、lar(log area ratio) 、cd等方法以及它们的一些改进方法。(3) 基于谱距离评价方法该类评价方法是以语音信号平滑谱之间的比较为基础的,主要方法有:sd(spectral distanee), lsd(log sd) ,fvlisd(frequencyvariant linear sd),fvlosd(frequency variant log sd),wsd(weighted slope sd) , ilsd(inverse log sd) 等。匸交发表专家一LB国学朮发叢网(4) 基于听觉模型评价方法基于
7、听觉模型评价方法是以人感知语音信号的心理听觉特性为基础,主要方法有 bsd ( bark spectraldistortion)、mbsd psqmpip ( perceptual linearprediction)、msd(mel spectraldistortio n)等。(5) 基于判断模型的评价方法该类评价方法是在选择表达语音质量的特征参量基础上,更主重 于模拟人对语音质量的判断过程。主要方法有l(ad)/m nb-1以及l(ad)/mnb-2。(6) 其他评价方法主要有一致函数chf法、信息指数法、专家模式识别 epr法等。3软件实现本文在基于输入-输出的客观评价方式的基础上,以 v
8、c+ 6.0为 开发工具,着重于从频域方面提取音频特征参数来表征音频质量情 况,设计了一款能够显示波形,通过信噪比来辅助测评声音质量的 软件。大量的实验表明,人类感知语音的过程和语音本身的频谱特性非 常密切。人类本身的听觉对语音的频谱特性更为敏感,两端在时域 上相差很大的语音如果具有类似的频谱特性,人类在感知它们时的 感觉也是相似的,因此通过显示文件的频谱波形及对比频谱波形上 的差异可以有效地辅助评测声音质量。匸交发表专家一LB国学朮发叢网为了适应人的耳朵这种奇特的特性,即它对声音的响度的感觉是 与输出音频功率的对数成正比的,信噪比的大小可用有用信号功率 与噪声功率的比值的对数来表示,公式如下
9、:由于分段信噪比计算一段时间上的语音信号与噪声的平均功率 之比,而语音信号是一种缓变的短时平稳信号,因此采用分段信噪 比计算整个时间轴上的信噪比更能表征语音质量。本文的软件设计 流程图如图1所示:信号数据处理部分的流程如图2所示:3.1 分帧由于声音信号在短时间段上(通常为10-30ms)才被认为是平稳的。因此,将整个语音信号划分成一帧一帧来分析,帧长一般取为 10-30ms。3.2 加窗窗函数能把有限长的长序列变成有限长的短序列,然而也会带来 原来信号频谱的泄漏,为了减小或抑制泄露,需要选择合适的窗函 数。相对其他窗函数,汉明窗能够较好地抑制泄漏,因此本文选用 汉明窗对信号进行加窗处理,汉明
10、窗定义为:w(n )=0.54 0.46cos(), n=0,1, n 13.3 fft傅立叶变换是数字信号处理中最重要的变换之一,其意义在于将 时域中难以看出什么特征的信号变换到频域中,在频域中信号特征匸交发表专家一LB国学朮发叢网会一目了然,本文对音频信号进行频域分析采用的工具都是fft。界面设计如图3:通过菜单栏上的特征参数波形显示中的显示功率谱、对数功率谱 来显示两个文件的波形,通过显示波形可以对比两个文件的差别, 找到差别即可交给系统处理人员分析原因进行改进。通过信噪比snr的显示结果辅助测评声音质量。4实验结果通过选取部分原始文件和失真文件,经过了 mos主观测试后,用 此软件进行
11、了验证,选取两组代表性的文件:(1)为orig.wav和 noise.wav; (2)为orig.wav 和orig1.wav, 图4相应显示其功率谱 图及snr值。实验结果显示+与原始文件接近的待测文件两者功率谱波形相 近,snr值大;与原始文件差别较大的待测文件两者功率谱波形相 差大,snr值小,接近主观评价测试的结果。相对于原始文件,对于有较大问题的待测文件,该软件可以很好 的给予帮助,对于全部待测文件都要用主管评价的方法,这节省了 部分时间和精力,适用于实验室搞编码解码之后的声音质量评估环 节。然而对于出现在待测文件里的更精细的问题判断,还需要人的 主观评价方法。5总结本文介绍了声音质
12、量评测的主观评价和客观评价方法。在客观评匸交发表专家一 m国学朮发叢网 价方面从声音文件的读取、数据的处理到文件波形的显示与参数测量等几个方面设计了该客观评价软件。对于更深一步的研究可在该软件基础上进行修改。参考文献:1 a.a.delima*,e.p.freela nd*,r.a.dejesus*,b.c.bispo*,l.w.p.bisca in ho*,s 丄n etto*,a.said,a.kalker,r.schafer,b.lee,and m.jam ,on the quality assessme nt of sound sig nals.2 itu-t,recomme ndatio n p.800.1, mea n opi nion score(mos)ernation
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 道路交通反违章培训课件
- 道法安全记心上课件
- 2026年甘肃省陇南市高职单招职业适应性测试题库试题附答案
- 2025胸腔镜肺结节日间手术围手术期健康教育专家共识解读课件
- 车险新人培训
- 木材加工设备安装计划主要内容
- 军队文职面试考生回忆版试题(软件工程工程技术)
- 车间节后返岗安全培训课件
- 酒店客户服务标准流程制度
- 2025年学校教学管理与核心教学制度落实工作心得(2篇)
- 肿瘤放射治疗的新技术进展
- 土壤微生物群落结构优化研究
- 2024外研版四年级英语上册Unit 4知识清单
- 视频会议系统施工质量控制方案
- 2025年高二数学建模试题及答案
- 2025年党的二十届四中全会精神宣讲稿及公报解读辅导报告
- 压力管道安装单位压力管道质量安全风险管控清单
- 停车场道闸施工方案范本
- 2025年实验室安全事故案例
- 卫生院关于成立消除艾滋病、梅毒、乙肝母婴传播领导小组及职责分工的通知
- 铁路更换夹板课件
评论
0/150
提交评论