全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Computer Engineering and Applications计算机工程与应用 2007,43(36)217车内噪声环境下的语音端点检测和增强技术。马龙华t,臧义华2,刘利强1MA Long-hual,ZANG Yihuaz,LIU Liqian911哈尔滨工程大学自动化学院,哈尔滨1500012华北计算技术研究所指挥自动化研究室,北京1000831College of Automation,Harbin Engineering University,Harbin 150001,China2North China Computing Technology Institute,Beijing 100083,ChinaE-mail:malonghua2001163cornMA Longhua,ZANG Yihua,LIU Li-qiangSpeech endpoint detection and enhancements in嘲noisy environment Computer Engineering and Applications,2007。43(36):217219Abstract:With the development of modem technology,car has more and more electrical devicesBut it is dangerous to driver to operate these devices with hands leaving steering wheelSo speech recognition is solution to this problem,but general speech recognition system is sensitive to background noise,the reason is that the contaminated speech is difficult to find the endpeint accurately,So some technology must be developedSpeech enhani!ement is a popular technologyThis paper describes a new band partitioning reel frequency spectral entropy endpoint technology,with these technology the start point and end point can be foundaccuratelyAfter getting endpeint,spectral subtract call be used to enhance speech signal,then speech recognition can work well Key words:speech enchantment;endpoint detection;band partitioning mel frequency spectral entropy摘要:随着现代科技的发展,车载电子设备越来越多,但是如果在驾驶中司机的手离开方向盘去操作这些电子设备却是很危险 的。对于这个问题的一个解决方法就是这些设备都采用语音识别作为它们的输入接口。通常的语音识别系统在噪声环境下的识别 率是很低的,造成识别率下降的一个重要原因就是端点检测的不准确,因此必须发展一些技术来解决这个问题。提出了一种基于 子带美尔谱熵的算法,这种算法可以准确地检测到语音的起始点和结束点,得到语音端点就可以利用谱减的方法来进行语音增 强,经过增强后的语音信号就可以用普通的语音识别系统进行识别。关键词:语音增强;端点检测;子带美尔谱熵文章编号:10028331(2007)36-0217-03 文献标识码:A 中图分类号:TN9121引言 进行语音端点检测,经过检测后的语音进行谱减后信噪比明显 随着现代科技的发展,车内的电子设备也越来越多,功能提高,通过试验表明,识别率可以提高到967。本文中的噪音 也越来越强大,但是正因为如此,让驾驶者选择的多,也就是说 是在Volvo轿车中录制的,实验语音为50个男生和女生,每个 操作越来越多,但是让驾驶者在驾驶过程中去操作这些电子设 人读10个2字命令3次,其中lO个人的语音用来训练,其余 备是相当危险的。例如很多国家就对开车打电话的司机进行处的语音用来做试验,本文中识别模型为连续隐形马尔可夫模罚。如果这些设备的人机接口采用语音识别技术就可以解决这型,并假设噪声语音为可加的。 个问题,驾驶者只要通过语音就可以对车内的电子设备进行操 作,大大降低了操作时带来的危险。但是一般的语音识别系统2美尔子带在车内特定的环境下使用的时候识别率会有很大的降低,一般由大量听觉心理学的实验可以证明人耳在频率域的听觉 会降低原识别率的半甚至更低。现有的车载识别系统都是应用并不是线性的嗍,这种非线性可以用组滤波器来模拟,滤波器的 于车载电话免提拨号系统的,其应用范围受到了很大的限制嗍,宽度是非线性的,它的宽度是以美尔刻度为标准的,美尔刻度 且识别率仅在8994之间,因此有必要对车载噪音环境下 和赫兹的关系可以用式(1)来表示四:的语音识别进行研究。识别率降低的主要原因是噪音的污染,骆2,595109(1+i)(1)其中污染后的语音的开始与结束点的检测也变得没有那么准UU确,而现有的语音识别方法都对语音端点的准确性十分敏感; 这里,以赫兹为单位。三角组滤波器可以由图1来表示。 另外受到污染的语音的参数也会有很大的改变,因此必须对带由于语音的主要频率都集中到4 kHz以下,因此在本文中 噪语音的语音端点检测进行改进,并对带噪语音进行降噪。本的滤波器高于4 kHz的都不予考虑。图2是“录音”的波形图, 文提出了一种新的基于子带美尔谱熵方法,能够在噪声环境下图3为图2对应的语谱图,由语谱图可以看出,当有语音存在作者简介:马龙华(197“),男,博士。研究方向为导航制导与控制。万方数据218 2007,43(36)Computer Engineering and Applications计算机工程与应用肌)=;)10d南】(4) 式中P()是瓢的概率,菇=忸。l,0|-l。由此可以利用上面越计算的结果。(m,f)来直接代替机计算出子带谱熵,可以得孽到式(5):日(m2;P(删109高】(5)这里戈。(m,f)的概率可以由式(6)计算:图l美尔额标三角滤波器PB(m,f)=嫩盟01 0002 0003 0004000频率(6)-1。(m,f)但是含有同样的谱熵的信号却不能显示子带特性,下面的 图4和图5是谱熵都等于2537的语音和噪声图。l窜1羞勺童图2“录音”的波形图Band Index Band Index图4 Volvo车内噪声谱熵图5一段语音的谱熵从中可以看出同样的谱熵值并不能用来区分噪音和语音, 这个缺点可以用式(7)来克服:小m)2;州州)Pg嘶)10d赤】(7)W(m,i)-varPo(i一1,m),po(i,m),Po(i+1,m)】(8)其中 Po(i-1,m)=帮图3“录音”的语谱圈Po(i,m)=掣(9) 的时候语谱图的条带特性十分明显;在语音开始前和结束后子Po(i+l,m)=黜带特征都消失了。并且大量的试验证明只有在有语音存在的时候才会有明显的子带特征。因此可以利用这样的特性来进行端4谱减点的语音检测。在实际应用中噪声可以是加性的,也可以是非加性的。考 被污染的带噪语音信号首先经过短时陕速傅立叶变换,变虑到加性噪声更为普遍,且一些非加性噪声可以转换为加性噪 换可以由式(2)表示: 声同(如乘性噪声可通过同态滤波成为加性噪声),所以可以假LI定噪声为加性噪声。故污染的语音可以由式(10)表示:(m,Ji)=氟。(m,1)exp(一正争) o后L1(2)x(k)鄙(JiI)+,l(1|)(10)r1-0式中,算知(m,k)为第m帧的第k条频率线的幅度;为128点。这里s(|)和n(k)分别代表纯净语音和干扰噪声。对式(10)两 这样就可以求得每个子带内包含的能量,能量可以由式(3) 边进行傅立叶变换,得表示:x=s+ (11)N-I在语音间隙估计出噪声频谱,直接从上述带噪语音幅度谱戈一(m,i)=(m,k)j,(i,J|)(3)中减去噪声的幅度谱并将其作为语音的幅度谱估计,然后加入I=0这里i为滤波器索引以i,k)为组滤波器,其中滤波器参数可以带噪语音的相位信息,从而达到消除噪声、实现语音增强的目 由图l获得。 的。根据上述原理得到的幅度谱相减估计器为:雪:【lI庸皑u(12)3子带谱熵式中I为带噪语音谱,I疗l为噪声谱估计,以为带噪语熵首先由Shannon提出61。熵主要是用来表示一个随机信 音x(n)的相位谱。号算能够提供的信息量的度量,也就是说度量的这个信号量的在实际系统中也可根据需要写成增益的形式: 不确定度。其计算方法可以由式(4)表示:雪=V)x(13)万方数据马龙华,臧义华,刘利强:车内噪声环境下的语音端点检测和增强技术200743(36) 219图6污染后的语音(SNR=5 dB) 图7基于子带谱熵的端点检测图8谱减后的语音波形图(增益=20 dB)其中:表1试验结果日=l一器)谱减法的基本前提是噪声具有平稳性,可是在实际环境中,噪声往往是不断变化的,为了及时更新对噪声频谱特性的 估计,使其与当前信号中噪声的特性更加接近,可采用式(15)进行噪声谱更新: 应用,并且能够取得良好的效果。随着汽车的普及会有越来越疗=越+(1帕)(15)多的汽车电子设备采用这项技术,前途十分广阔。 (收稿日期:2007年8月)式中舻(厂)是前一帧的噪声谱估计,(厂)是当前的噪声帧获得的噪声谱,疴(厂)则是对当前帧噪声谱的估计结果。其中乜取0 参考文献: 到1之间的值,它表示在新的噪声谱估计中,以前噪声谱所占【1】Yang R K,Petri HNoise composition for speech recognition inr 的比重。适当调整d的值,控制噪声更新的快慢,可以得到较好noise environmentseICASSP95,1995:433-436 的估计结果。噪声谱更新只有在噪声段进行,语音段保持不变。【2】2朱旋,李虎生高性能汉语数码串快速识别算法的研究叨计算机研 图6给出了污染的语音信号,图8是根据这种方法得出的试验究与发展,200l(7)结果。【3】Lin Cong,Asgh=SRobust connected digital recognition in C81noise environmentsC】,OCSPAT99,19995试验结果和结论4】Allen J BCochlear modelingJIEEE Acoust,Speech,Signal Pro-试验中假设噪声是加性的,试验的语音为在Volvo轿车中cessing Mag,1985,2:329【5】Shaughnessy D 0Speech communicationMMA:Addision Wesley,采集的噪音和纯净语音的混合,混合的信噪比为5 dB,FFI的1987:150长度为256点,窗函数为汉宁窗。谱减的增益为20 dB。试验的【61 Shannon CA mathematical theory of communicationJBell Syst Tech识别采用连续的HMM模型,每个音节分配35个状态。HMMJ,2000:1751-1754模型的参数迭代次数为3次。试验的结果如表1所示。【7】Boll S FSupPmsiof acoustic noise in speech using spectral以上结果表明,本文的方法比现有的识别系统的识别率能subtractionJIEEE Tram Acoustics,Speech and Signal Processing,够提高2一7,并且比车载电话免提系统有着更广阔的应用,1979ASSP一27:113-120且拥有较高的识别率,因此该方法能够在车内噪声环境下进行(上接88页)based generalized signcryptionCThird International Conference, 需求的实现;另一方面,在只需对水印进行加密或签名时,其效UIC2006,Wuhan,China,2006 率和安全性均与单独加密或签名时相同,从而保证了水印处理【21 Masry M,Ramos M,HemamisRobusrdata hiding usiIlg psychovisual的高效性与安全性。本算法根据原始图像的纹理复杂性及水印thresholdingCHICIP 2000:Proc 2000 Int Conf IImIge Proeeseing,信息的长度,来自动调节小波分解的级数和选择鲁棒系数的VancouverCanada:IEEE sigma
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年二级建造师市政公用工程真题附答案解析版
- 因子分解证明题与答案论证30个
- 2026四川宜宾市健康教育发展集团有限责任公司招聘5人笔试历年参考题库附带答案详解
- 2026中教华影数字服务股份有限公司招聘4人笔试历年参考题库附带答案详解
- 2025辽宁沈阳市铁法能源公司招聘54人笔试历年参考题库附带答案详解
- 2025贵州水投水库管理有限责任公司招聘初审情况笔试历年参考题库附带答案详解
- 2025福建永泰闽投抽水蓄能有限公司招聘29人笔试历年参考题库附带答案详解
- 二手车交易要买卖合同
- 吉林省B类公务员考试试题及答案全解
- 脑卒中康复护理:理论与实践的结合
- 医学人工智能导论
- 2025年银行考试-中信银行运营管理资质认证考试历年参考题库含答案解析(5套典型考题)
- 2025年贵州省中考理科综合(物理化学)试卷真题(含答案详解)
- 药品新品上市管理制度
- DB4403T 508-2024《生产经营单位锂离子电池存储使用安全规范》
- 学校餐费退费管理制度
- (高清版)DB13∕T 5733-2023 食管胃静脉曲张套扎术临床操作技术规范
- 数学-第十一章 不等式与不等式组单元测试卷 2024-2025学年人教版数学七年级下册
- 鲁科版高中化学选择性必修2第1章第3节第1课时原子半径及其变化规律元素的电离能及其变化规律基础课课件
- 2025年华侨港澳台学生联招考试英语试卷试题(含答案详解)
- 严重精神障碍患者报告卡
评论
0/150
提交评论