免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于lpc的语音信号分析合成1.1语音信号的分帧语音信号的一个重要特点:短时性,在某些适时段呈现出随机噪声的特性,另外一些短时段呈现出周期信号的特征,还有二者的混合语音信号的特征是随着时间而变化的,只有在一段短的时间间隔中,语音信号才保持相对稳定一致的特征这段时间常取ms在程序中取个采样点,对于的采样频率,相当于ms帧间重叠为个采样点,即ms1.2端点检测汉语的音节末尾都是浊音,只用短时能量就能较好地判断一个词语的末点当然,有时韵尾拖得长,衰减比较缓慢,有时韵尾衰减比较快,难免有点误差一般只要短时平均幅度值降低到该音节最大短时平均幅度的左右以后,就可以认为该音节已经结束实际上截掉一点拖尾不会明显影响识别与合成处理因此汉语孤立词的末端点检测不存在什么困难汉语语音的起点检测不仅有一度难度,而且检测是否准确对语音识别性能影响较大,因为大多数声母都是清声母,还有送气与不送气的塞音和擦音,将它们与环境噪声分辨是比较困难的下面就介绍语音端点检测的相关技术:1.2.1短时能量分析对于信号短时能量的定义如下:表示在信号的第n个点开始加窗函数时的短时能量可看出短时能量可以看作语音信号的平方经过一个线性滤波器的输出短时分析原理短时能量主要应用:首先利用短时能量可以区分清音和浊音,因为浊音要比清音的能量大得多;其次可以用短时能量对有声段和无声段进行判定,对声母和韵母分界,以及对连字分界等短时能量一般也作为特征中的一维参数来表示语音信号能量的大小和超音段的信息短时能量由于是对信号进行平方运算因而人为增加了高低信号之间的差距,在一些应用场合不太适合因此采用短时平均幅值来表示能量的变化下图为双门限端点检测法:双门限端点检测端点检测是指用数字处理技术找出语音信号中的各种段落(如音素,音节,词素,词等)的开始点和终点位置,从语音信号中排除无声段它就是从噪声中检测出说话人的语音命令,获得语音开始和结束的时点下面用语音信号的短时能量和短时平均过零率来进行端点检测,如下图所示:启动识别后,在内存中开辟一缓存区,存放帧语音数据,求出能量门限和过零率门限,然后用短时平均过零率检测开始点,用短时能量参数检测结束点当语音信号的连续几帧的过零率超过过零率门限,认为语音信号开始;如果语音信号的连续几帧的平均能量低于能量门限,认为语音信号结束双门限前端检测算法1.2.2加窗因语音信号是一个时变信号,所以假设语音信号在短时平稳为了得到短时的语音信号,要对主意信号进行加窗操作窗函数平滑地在语音信号上滑动,将语音信号分成帧分帧可以连续,也可以采用交叠分段的方法,交叠部分称为帧移,一般为窗长的一半。选择窗函数时,一般有两个问题要考虑:(1)窗函数形状矩形窗:汉明窗(Hamming):汉宁窗:式中,为窗口长度窗函数的频率响应都具有低通特性。窗函数的形状非常重要,矩形窗的谱平滑性较好,但波形细节丢失,且会产生泄漏现象;而汉明窗可以有效地克服泄漏现象,应用范围最为广泛。(2)窗函数长度窗函数的长度对能否反映语音信号的幅度变化起决定性作用。(3)窗形选择在语音识别中,加窗函数一般选择汉明窗。1.2.3短时自相关函数 能量有限信号x(n)的自相关函数定义: (2.7)如果x(n)是随机或周期性的离散信号,不是能量有限的,则其自相关函数定义为: (2.8)信号的自相关函数具有一些有用的性质:(1)偶函数:R(k) = R(-k)。(2)即零值后自相关值最大。(3)若x(n)为能量有限信号,其能量即为R(0)。若x(n)为随机信号或周期信号,则R(0)为其平均功率。(4)如果x(n)是周期性信号,则R(k)也是周期性信号,并且其周期与x(n)相同。信号x(n)的短时自相关函数定义为: (2.9) (2.10)其中,直观的理解,Rn(k)就是在信号的第n个样本附近用短时创截取一段信号作自相关计算所得结果,短时自相关函数的作用:1.区分清/浊音:浊音语音的自相关函数具有一定的周期性;清音语音的自相关函数不具有周期性,类似噪声,有点如语音信号本身。2.估计浊音语音信号的周期,即估计基音周期。1.2.4基因周期清音对应的自相关函数小,而浊音对应的自相关函数大,算出每一帧的自相关函数,找出最大值,当最大值小于这一帧的能量的0.25倍的时候可判定这一帧为清音,此时的基因周期为0;当最大值大于这一帧的能量的0.25倍的时候可判定这一帧为浊音,此时的基因周期为最大值的下标。1.4线性预测原理通过使实际语音x(n)和线性预测结果x(n)之间的误差e(n)e(n)=x(n)- x(n) 在某个准则下达到最小值来决定唯一的一组预测系数ak。 这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。(1)根据最小均方误差准则,求出预测系数ak (2)已知预测系数ak,求出最小均方误E(e2(n)min(3)用e(n)和ak求x(n)(合成):预测误差e(n)就是激励信号Gu(n),预测系数ak就是声道滤波器的系数dk。 akdk e(n)Gu(n)线性预测分析可以对生成模型的增益参数G和滤波器系数dk进行直接和高效率的计算。这样,结合清浊音的判断和基音周期的估计,得到语音信号生成模型的全部参数,实现语音的产生。(1) 发清音时,声门激励是频谱均匀的白噪声。(2)发浊音时,声门激励是以基音为周期的冲激序列:图3.1 语音产生模型的简化框图冲击串发生器随机噪声发生器时变数字滤波器浊音清音基音周期声道参数S(n)时变数字滤波器由式描述 , 在此,除鼻音和摩擦音时声道系统函数H(z)需用零极点模型来模拟外,其他语音均可用式(3.1)的全极点系统来模拟。模型的参数有浊音清音别,基因周期,增益G以及数字滤波器系数al,这些参数都随时间变化,p为此模型的阶数。当阶数p足够大时,这个全极点模型几乎可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京通州区教委所属事业单位面向应届毕业生招聘229人笔试考试参考题库及答案解析
- 2025广东佛山市龙卷风研究中心招聘科研人员1人笔试考试备考试题及答案解析
- 2025南斗六星技术有限公司中层管理岗位招聘考试笔试参考题库附答案解析
- 2026年中国储备粮管理集团有限公司安徽分公司员工招聘55人笔试考试参考试题及答案解析
- 2025铁路上海12306旅客服务中心客户服务人员招聘考试笔试备考试题及答案解析
- 2025湖南永州道县中医医院招聘卫生技术人员2人考试笔试参考题库附答案解析
- 2025年郑州大学第五附属医院招聘工作人员72名考试笔试备考题库及答案解析
- 2026广东茂名高州市事业单位赴高校选聘急需紧缺人才43人笔试考试参考试题及答案解析
- 2025安徽黄山市祁门经济开发区投资有限责任公司招聘5人笔试考试参考题库及答案解析
- 2025山西医药学院招聘人事代理人员7人笔试考试备考题库及答案解析
- 《农村基层干部廉洁履行职责规定》解读与培训
- 2025年浙江宁波东方人力资源服务有限公司招聘笔试参考题库附带答案详解
- 初中七年级上册综合实践活动教学设计 合理搭配烹饪营养美食
- 磁性传感器在卫星通信系统中的精确定位案例
- AI在航空业的应用:提升飞行安全
- 房屋(构筑物)经济寿命参考表、房屋、构筑物完损等级和成新率参考表、土地使用权出让最高年限标准
- 低压开关柜04kV户内交流固定分隔式开关柜-技术规范书
- 《宋词发展的历程》课件
- 《食品仪器分析技术》课程标准
- 无处不在-传染病知到智慧树章节测试课后答案2024年秋南昌大学
- 党建促进医疗卫生事业发展
评论
0/150
提交评论