语音清晰度的客观评测.ppt_第1页
语音清晰度的客观评测.ppt_第2页
语音清晰度的客观评测.ppt_第3页
语音清晰度的客观评测.ppt_第4页
语音清晰度的客观评测.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音清晰度的客观评测,中国传媒大学 传播声学研究所 章斯宇 2010.5.21,主要内容,1. 语音清晰度的评测,语音的清晰度或可懂度是音质评价的重要指标反映厅堂或扩声系统的声音传输质量 主观评价: 组织测试队伍实地测试(articulation test) 优点: 直接、真实 缺点: 耗费人力物力 GB-T 15508-1995 声学 语言清晰度测试方法 ,语音清晰度的客观评价方法,尽可能反映真实的清晰度水平,清晰度指数 AI (Articulation Index),French ANSI Std. S3.5-196919861997 特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声或削峰等时域或非线性失真的影响。,辅音损失率 %ALcon (articulation loss of consonants),能不能根据测量房间内的某些物理量估计语音清晰度? Knudsen(1932), Peutz(1971), Klein(1971) 根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。,Peutz 公式(经验推导),D听音处距声源的距离。单位m。 T60混响时间(1400Hz)。单位s。 V房间的体积。单位m3。 校准值。针对不同水平的听者。1.5%12.5%。 Dc临界距离。单位m。,Klein对Peutz公式的补充,当房间声学特性难以改善时,采用电声手段提高语音清晰度。 声源个数n;声源指向性因子Q;,辅音损失率%ALcon的不足,根据实验结果的经验推导,物理基础不够; 对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响; 没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;,Jacob(1985),Hougast & Steeneken (197319801985) IEC Std. 60268-16 充分反映声传递系统性能质量的优劣,输入端: 说话人发音,语言传输指数STI (speech transmission index),输出端: 听者耳朵,语言传输系统: 充分考虑传递过程中噪声、混响、回响、系统失真等各种干扰因素的影响,调制转移函数MTF (modulation transfer function),连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。 传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。,MTF的计算,函数定义为声信号经传输后接收信号强度包络的调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。,STI的计算,14种调制频率;7种倍频带噪声 作为测试信号 计算98个MTF结果 类似AI计算中的加权平均最终得STI 0,1 根据房间脉冲响应可以直接计算MTF,STI与语音清晰度,Steeneken (1980),不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。 客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。,语言传输指数STI的简化算法,限制条件: 无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统; 1)RASTI (Rapid STI or Room acoustic STI) 适用于不包括扩声系统的厅堂语音传输质量的评价 选取了语言谱中比较有代表性的频带和调制频率,2)STIPA (STI for public address) 适用于包括扩声系统的厅堂或电声系统的语音传输质量评价 选取了7种倍频带载波,每种载波对应2中调制频率,公共广播系统工程技术规范 STIPA作为评价公共广播语言传输质量的重要指标,2.混响作用下STIPA与汉语清晰度的关系,对于“声韵调”结构语言汉语,情况是怎样的? 目的:在实验室条件下对无噪声纯混响作用下STI-PA与普通话单音节清晰度之间的关系进行实验研究。以期对搞清楚在纯混响作用下普通话单音节清晰度与语言传输指数STI-PA的具体关系有所贡献和帮助。对汉语语音清晰度客观评测方法的发展有着积极的意义。,实验方法,实验室录音、模拟测试的方法 参照声学 语言清晰度测试方法GB-T 15508-1995,混响时间:0.5 s6.0 s,步长0.5 s,共12种混响条件; 发音人2名,听音人11名;声场中心声压级65dBA; 中、后音节受混响作用更明显;,实验结果,混响时间与清晰度、STIPA的关系,STIPA与普通话单音节清晰度的关系,在实验结果的基础上归纳导出了STI-PA与普通话单音节清晰度之间的关系,此关系对制定扩声系统的STI-PA指标具有实用意义。 实验结果也揭示出汉语普通话单音节清晰度受混响的影响与英语清晰度受混响的影响程度有明显的不同。启示我们在实际工程应用中,在涉及到普通话语音清晰度的评测问题时,对直接引用已有的国际标准或基于外语的研究结果要十分慎重。,,3.噪声条件下STIPA与汉语清晰度的关系,在实验室条件下分析了不同频带范围、不同信噪比的噪声环境下语音清晰度、STI-PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下的最低信噪比及相应的STI-PA。 实验室录音、模拟测试的方法 参照声学 语言清晰度测试方法GB-T 15508-1995 采用了全频带白噪声和中心频率为250Hz,500Hz,1KHZ,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声,各频带噪声分别设置45种信噪比。,实验结果,1) 信噪比与清晰度、STIPA的关系(以白噪声为例),2) 等清晰度曲线 不同的噪声条件可能有着相同清晰度水平,工作是在实验室条件下进行的,考虑到实际的应用情况,可能还有一些不完善的地方,比如房间冲击响应的结构是否会对STI-PA与清晰度的关系有明显的影响还需要探讨。实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试。每个频带噪声的信噪比取值区间可以更加细致以获得更为全面的结果。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论