



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于子空间语音增强方法的研究 【摘要】 目的: 研究基于信号子空间的语音增强方法。方法: 利用Cool Edit Pro2.0软件录制语音,加入各种噪声,利用 Matlab软件进行分析、处理。结果:观察语音信号波形图和语谱图,利用信号子空间的分解方法,可使信噪比大大增加。结论: 基于子空间的语音增强方法在主观听觉与客观指标上均得到了令人满意的效果。 【关键词】 子空间; 语音增强; 语谱图Abstract Objective: To study speech enh
2、ancement method based on the signal sub-spaceMethods: Speeches to which various noises were added was recorded by Cool Edit Pro2.0,and analyzed and then dealt with by MatlabResults: The ratio of noise and signal can be improved a lot by reading speech waveform and speech spectrum and using the sub-s
3、pace decompositionConclusion: The method of speech enhancement based on signal sub-space has achieved satisfying effects in both subjective hearing and objective quota Key words sub-space enhancement;speech enhancement;speech spectrum 语音识别研究已经取得重大,但距离机
4、器与人自由交流的目标还相当遥远。目前的识别系统大都是局限在安静环境中使用的,在噪声环境中,尤其是强噪声环境,语音识别系统的识别性能将受到严重影响。如何提高强噪声环境下语音识别的准确率是当前语音识别的难题之一。从带噪语音信号中提取尽可能纯净的原始语音的过程称为语音增强。污染语音的噪声包括窄带噪声和宽带噪声两类。对于低频干扰、串音等窄带噪声,一般用线性滤波器便可有效抑制,而宽带噪声无论从时域还是从频域看均与语音信号重叠在一起,传统的线性滤波无能为力。消除噪声的难点在于宽带噪声的消除。1 材料和方法1.1 材料 在实验室环境下利
5、用Cool Edit Pro2.0软件录制一段语音,再利用matlab软件生成一段白噪声,合成不同信噪比(-10dB10dB)的带噪语音。1.2 方法 子空间语音增强算法主要是利用数据协方差矩阵的特征值分解,利用特征值的大小,将协方差矩阵的特征子空间分为信号子空间和噪声子空间两部分,并将含噪声语音投影到语音子空间中,以该投影作为语音信号的估计值。 语音增强的问题可以描述为从一被污染信号中,恢复出原始语音信号的过程。设语音帧长为M,则每一帧信号都可看成是一个M维的矢量。M维的矢量信号可张成维数为M的空间CM。
6、160; 假设语音信号位于K维子空间中,并且KM。原始纯净语音信号可以用以下的线性模型表示: s=VX=K i=1xivi KM(1)V =v1,v2,vK是一个K×M的矩阵,它的秩是K,且各个矢量之间相互正交1; X = x1,x2,xKT是一个M×1的矢量,是零均值的复随机变量。 带噪语音信号可写成: y=V&
7、#183;X+n(2) y的协方差矩阵为: Ry=E(yyH)=Rs+Rn=VRxVH+Rn(3) 其中Rs表示纯净语音信号s的协方差矩阵,Rx表示向量X的协方差矩阵,Rn为噪声的协方差矩阵: Rn=2nI (4) 通过KL展开2将含噪语音信号所张成的空间分解成信号子空间和噪声子空间。先不考虑噪声的存在,只考虑纯净语音的情况下,对信号s的协方差矩阵Rs进行特征值分解,可以得到:
8、160; Rs=QQH=Q1Q2s1 00 0Q1HQ2H (5)式中,s1=diag(s1,sk)是信号子空间的特征值,因为Rs是半正定阵,所以sk0 ,1kK 。因为语音信号在K维空间内,因此非零特征的个数为K。特征值向量矩阵Q分解为2个子矩阵Q1和Q2。Q1矩阵包含非零特征值所对应的特征向量,定义这些特征向量为构成信号子空间的基本向量;Q2包含的特征向量张成空间定义为噪声子空间。1 线性估计子的滤
9、波矩阵表示为H,则语音信号的向量可由下式估计:s=H·y(6)则估计的语音值与真实的语音信号值的误差由下式给出:e=s-s=(H-I)·s+H·n=es+en(7)这里es=(H-I)·s 表示语音信号的失真,en=H·n 表示残余噪声。 定义语音信号失真能量 e2s=tr(EeseHs)=tr((H-I)Rs(H-I)H) 和残留噪声能量 e2n=tr(EeneHn)=tr((H-I)Rn(H-I)H) ,Rs和Rn分别是纯净语音信号和噪声信号的协方差矩阵。&
10、#160; 频域约束估计子在把噪声约束在一门限值下的同时,尽量减少语音信号的失真3。纯净语音的最优估计矩阵可以通过求解下面的约束优化问题得到:Hopt=argminH e2s约束条件:1 M e2n2 (8) 增强系统的输出为: sopt=U1GUH1y(9)其中 G=(1)s(1)s+2N I)-12 结果 图1是噪声为白噪声、信噪比为0dB的一段带噪语音用子空间法增强后的语音信号波形及语谱图4。结果表明基于信号子空间分解的语音增强方法能够有效的滤除背景宽带噪声。 本研究还给出背景为汽车噪声的增强结果。图2是背景为汽车噪声和白噪声信噪比分别在-10dB10dB的子空间增强结果的对比图。 从图2可以看出,对于白噪声的增强后的信噪比要高于对汽车噪声的增强结果。这是因为在对噪声的估计中白噪声的估计比有色噪声的估计更接近于真实噪声。3 讨论 本研究中的增强方法尽管也利用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 共享住宿市场品牌竞争策略-洞察及研究
- 表演艺术IP开发与品牌价值提升策略-洞察及研究
- 货币政策与财政风险互动-洞察及研究
- 2025年吉林省事业单位教师招聘考试教育心理学试卷答案
- 中小企业品牌建设与营销策划方案
- 电子制造车间流程优化实施方案
- 2026届江苏省徐州市云龙区第九中学九年级数学第一学期期末检测试题含解析
- 浙江省义乌市稠州中学2026届七年级数学第一学期期末联考试题含解析
- 拉萨市2026届数学九上期末复习检测模拟试题含解析
- 【2025年】中建一局二级公司总工程师公开竞聘1人考试参考题库【答案】
- GB/T 25975-2010建筑外墙外保温用岩棉制品
- 洁净厂房监理实施细则
- 初中语文人教九年级下册余光中《乡愁》PPT
- 不孕症规范化诊治流程
- 置业顾问培训方案
- 无陪护病房实施方案
- 全髋关节置换术共93张课件
- 心内科护理质量评分标准
- 检查表和记录表4冶金煤气
- 沪教牛津版五年级上册英语Unit4第2课时教学课件
- CT图像伪影及处理
评论
0/150
提交评论