修后-基于短时自相关法的周期估值+(1)_第1页
修后-基于短时自相关法的周期估值+(1)_第2页
修后-基于短时自相关法的周期估值+(1)_第3页
修后-基于短时自相关法的周期估值+(1)_第4页
修后-基于短时自相关法的周期估值+(1)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于短时自相关法的基音周期估值 【摘要】 MATLAB 是一种科学计算的软件,其具有处理数据的重要作用。且 MATLAB 运用的形式是矩阵形式。另外, MATLAB 把性能的数值计算与可视化 集合为一个整体, 还提供了大量的内置函数。 也正是因为如此, 它在当代科学计 算工作、系统控制以及处理信息等领域得到广泛的应用和研究。 【关键词】清音;浊音;基音周期;自相关函数 ;研究 随着现代语音处理技术的快速发展以及检测方法的进一步提高,其在实施 过程中,想要去除声音的刺激是否是完整的周期脉冲, 与声道的影响是十分困难 的。照此一来, 基音周期就进行定位的定位间距是不可能的, 或者具有相当大的 困难

2、。除此之外,加上基音周期的变化范围比较广,因此,其个人发音的习惯、 性别、年龄、发音力度以及发音时情感等多重因素都对基音周期定量具有严重的 影响,并且不能够准确确定。照此一来,在这样的前提下,其健壮和准确的特性 就起不到应有的作用。 直至今日, 还未发现任何一种万能方法, 能够确保其在任 何情况下都能准确地、 可靠地估计出基音的周期。 根据调查发现, 当前运用的主 要方法主要有基于传统的语音模型, 最具代表性的就是自相关法、 平均幅度差函 数法、线性预测分析方法、小波变换法及在四种算法上的基础上的衍生算法等。 此外,由于语言的本身的语音声学性能, 加上语言的自然性, 其成为当前人类传 播的最有

3、效, 最方便的一种方式。 在当前信息化盛行的现代, 其针对语音处理技 术内容所做的研究不仅具有现代意义, 同时还有助于其更有效的生产, 运输,存 储,访问应用程序以及储存语音信息, 更重要的一点是还推动了社会发展, 具有 不可替代的重要作用。因此,有必要对基音周期估计量进行研究。 一般情况下,信号与系统中 MATLAB 应用的方式是通过用符号运算和数值 计算进行仿真分析的。 加上信号与系统课程中的许多内容大都是基于公式而进行 演算,此外, MATLAB 又是借助数学符号工具箱来为工作提供的运算功能的, 这在一定程度上基本满足设计的实际需求。 举个简单的例子, 解微分方程、 傅里 叶、拉普拉斯正

4、反及 Z 的正反变换等均有所体现。 一、关于语音信号时域的简单分析 (一)、语音信号的时域分析 语音信号是一种非平稳的时变信号, 携带着各种各样的信息。 例如,在语音 编码和语音合成时, 增强了语音识别和语音处理, 从而提取各种信息中包含的语 音。一般来说,语音处理的目的主要有两个:第一个是特征提取和分析,基于语 音信号进行后续处理。 第二个是语音信号的处理。 例如,在背景噪声抑制噪声时, 其语音逐渐增强,语音获得相对比较“干净” 。且在语音合成和拼接平滑分段语 音,进行语音合成, 以便于获得更高的主观质量, 这个应用程序也是基于语音信 号的信息提取和分析的。 简而言之, 语音信号分析的目的是

5、方便高效的提取和进 行语音信号的信息。 根据参数类型分析, 语音信号的分析可以分为: 时域分析和频域(频域分析, 倒谱域)。时域分析法是最简单,最直观的一种方法,其主要是直接对语音信号 的时域波形,平均幅度和短时能量特征参数的提取, 短时平均过零率, 短时间的 自相关函数和短时平均幅度差函数。 (二)、语音信号的预处理 实际意义上讲,语音信号是模拟信号,从而在对语音信号的数字处理之前, 首先模拟语音信号S (t) t采样的采样周期,离散的(N),为了避免信号频谱混 叠,其根据带宽和采样模拟语音信号定理来确定选择采样周期。另外, 在语音信 号的离散量化过程中还带来了一定的量化噪声和失真。 数字语

6、音的方式主要有两 种:正式和非正式。 正式是指大型公司释放语音或者是语音研究机构中对语音数 据库的确认等。非正式主要是指个别研究人员记录在记录软件或硬件电路和麦克 风随时随地的一些发音和声明。 通常情况下, 作为一个初学者, 我们可以先使用 多媒体计算机, 通过安装相关的音频处理软件来获取相应的语音数据文件。 由于 语音信号的频率范围通常保持在 300 3400Hz 的范围之内,从而一般采样为频 率为 8kHz 。其中语音数据文件包括:预处理的语音预加重和窗框。且语音信号 的预处理数字语音信号预加重的输入, 其目的是语音的高频部分明显加重, 去除 唇部的辐射, 提高语音的频率分辨率。 一阶 F

7、IR 高通数字滤波器的传递函数来实 现预加重的声音设置时间N x (n)的样品,经过预加重的输出。 (三) 、语音信号的窗口 语音预加重的数字经过滤波处理,然后进行窗框。语音信号本身是一种时 间变化的信号, 分为浊音和清音两大类。 周期性的基音, 表示该信号的幅度和信 道参数是随时间进行缓慢变化的。 由于发音器官的惯性运动, 可以在短时间内(通 常是10 30ms)确认语音信号是大致相同的,也就是说语音信号的短时间具有 稳特性。在这种方式中,可以把语音信号分成若干段(称为分析框架)分别进行 处理。语音信号帧的电缆长度窗口移动加权法。 根据实际情况, 其一般每秒的帧 的数量大约是 33 100帧

8、。除此之外, 其框架可以用连续分段处理, 主要采用的 方法是重叠分割方法,能够使其平滑。 二、关于基音周期估值的基本分析 在实验中我们使用了三个实验法检测基音周期估计。 自相关函数法和平均幅 度差函数属于时域, 而倒频谱方法属于频域处理方法。 由于时域波形的语音信号 的变化是随时间变化的声激励,基音提取的最基本的方法是对语音信号的波形, 并检测来自波形的基本频率。 提取频率和频率中的更多信息。 信号的频率成分之 间的和谐关系。所以在频率时域提取的基本频率时有很多尝试使用信息的方法。 (一) 、自相关函数的方法 (1) 自相关函数 对于离散的语音信号x(n),它的自相关函数定义为: R(k)=艺

9、 x(n)x(n-k), 如果信号x(n)自身有周期性,那么与它相关的自相关函数也是有周期性的, 更重要的一点是其周期与信号x( n)的周期性是相同的。自相关函数提供了一种方 法获得的周期信号的周期。 在周期信号的周期的整数倍, 其自相关函数可以达到 最大值,所以我们可以不考虑起始时间, 并从自相关函数的最大值的第一位置估 计音调信号,使自相关函数作为一种工具来估计信号的音调。如果信号 x( n) 的周期自相关函数,所以它是周期性的,和周期和信号x (n)相同的周期性。 (2) 短时自相关函数 语音信号是非平稳信号,因此信号处理采用短时自相关函数。短时自相关函 数是在 N 采样信号的信号的短时

10、窗口拦截附近,做自相关计算结果。 Rm(k)=工x(n)x(n-k)式中,n表示窗函数是从第n点开始加入。 (二) 、程序代码 function pitch x=wavread(E:luyinwkxp.wav);% 读取声音文件 figure(1); stem(x,.); 取20ms的声音片段,即160个样点 对每一帧求短时自相关函数 显示声音信号的波形 n=160; % for m=1:length(x)/n; % for k=1:n; Rm(k)=0; for i=(k+1):n; Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end p=Rm(

11、10:n);% 防止误判, 去掉前边 10 个数值较大 的点 Rmax,N(m)=max(p); % 读取第一个自相关函数的最大点 end% 补回前边去掉的 10 个点 N=N+10; T=N/8; % 算出对应的周期 figure(2);stem(T,.);axis(0 length(T) 0 10); xlabel(帧数(n);ylabel(周期(ms);title(各帧基音周期); T1= medfilt1(T,5);%去除野点 figure(3);stem(T1,.);axis(0 length(T1) 0 10); xlabel(帧数(n );ylabel( (三)、运行结果与分析

12、(1) 运行 x=wavread(E:luyinwkxp.wav);% figure(1); stem(x,.); 周期(ms);title( 各帧基音周期 ) 2 ; 读取声音文件 显示声音信号的波形 得到的波形如下 0.3 0.2 0.1 C -0.1 -0.2 -0.3 ”0 411i11111 00.511.522533.5445 3 4 X W 原来的声音文件时长为t=5s,采样率为8kHZ。故总共有5*8k=40000个采样点 (详情如图所示)。图中的三个波形分别对应a,o,e 三、关于语音合成的基本原理分析 (一)、语音生成模型 通过对声测管的研究,它可用在多段级联的不段的统一管

13、道进行描述, 一般 被称为级联无损声管模型。利用计算流体力学方法可以证明一个统一的频率响应 每个管道可以使用一个极点模型近似,所以由声管管道可以由一个n阶全极点滤 波器表示,即: 对于典型的男性, N = 10,所有杆分别形成共轭对确保系数是真实的。考虑 到声音信号,可以得到语音信号的语音产生的离散模型,如图所示 4: (二),语音预测模型 假设ai的系数,如下图输入和输出,构成一个语音模型,语音信号 S (n) 到预测滤波器,得到预测残差 e( n): 图2:简化的语音生 成 首先要分析一段(一般是10ms)语音得到它的最佳ai系数。给定这些系 数后,就可以适当的输入来合成语音。 对于浊音信

14、号,一种可取的激励模型就是 以特定频率重复的单位样值序列, 这个频率就是基音频率。对清音,最好选择随 机噪声或者白噪声作为输入。但在不做清浊判决的情况下,全部采用周期激励的 合成质量也是可以接受的。 分析过程如下:首先,抽样的语音信号被分成 10ms长的段;然后,对每 段数据进行统计分析,计算相邻样点的相关性并最终得到最佳预测系数。 合成过 程就是利用这些预测系数,以及周期的单位样值序列作为输入,依次得到每段合 成语音。除此之外,还要分析变速不变调。所谓变速不变调,是指声音播放时, 速度的改变不会导致音调的变化。为了实现变速不变调,必须要先把表示“调” 的内容从语音中分离出来,由前述语音预测模

15、型,表示“调”的有两个部分,一 是共振峰频率,也就是预测模型的参数;二是基音周期,也就是激励信号的参数。 接下来的工作就是在不改变这两种参数的前提下改变数据长度。也就是将10ms 的80个样点的激励变成20ms160个样点(千万注意保持单位样值的周期不变), 在这20ms内保持预测模型系数不变,就合成了 20ms语音了。新语音的声调和 原有语音是完全相同的,只不过时间变长了而已 。 综上所述,还必须考虑到激励信号频率增加(注意不改变信号的长度),而 共振峰频率增加(即两极的说法是增加的,或上半平面杆逆时针旋转,下半平面 杆顺时针旋转,但注意,旋转角度,同样不转负实轴),合成语音的频率得到的 要

16、高。除此之外,还有语音重建模型多种内容,由于篇幅问题,本人在此就不一 一详细讲述了。 四、基于短时平均幅度差函数 AMD!法的基音周期估值 使用修正的短时平均幅度差函数并加矩形窗: jV-1 8 = 乂 忱 00 zQi + A) L ft = OjIj jV 1+j D AMDF方法寻找上述函数的最小值,第二个最小值与原点之间距离代表 语音信号的基音周期。 程序如下: %AMDFF于短时平均幅度差估计基音周期 clear all; fid=fope n(a.txt,rt); b,cou nt=fsca nf(fid,%f,1,i nf); fclose(fid); b仁b(6001:1200

17、0);%提取有用信号 N=320;%窗长 A=; for k=1:320%延迟长度 sum=0; for m=1:N sum=sum+abs(b1(m)-b1(m+k-1); end A(k)=sum; end s=b(6001:12000); figure(1) subplot(211); plot(s); subplot(212); plot(A); 上述程序运行结果如下图: 五、基于短时自相关法的周期估值研究条件 (一)、主观条件:基于课外学习语言的基础处理,特别是在知识上有强烈的求 知欲望,尽管有许多的基音估计方法,但到目前为止没有方法能够准确地提取基 音周期。C编程学习的本科课程中的

18、计算机技能,但也有一定的基础,能够与计 算机帐户对该课题在一起研究。 (二八客观条件:MATLAB是一个流行的,功能强大,易于理解,应用软件和 程序设计语言;学校图书馆资源,网络资源可以在相关参考文献和研究发现,奠 定了本课题的进一步研究打下坚实的基础。 基于主观和客观条件,我认为我可以 完成这个任务11 o (三八设计中遇到的问题 (1) 设计中遇到的问题: 由于每一帧短时自相关,RM (K)几点开始值比第一峰周期较大,因此无法 提取第一峰点。启动程序运行结果如下图所示: 图2 于是经过和老师讨论之后决定舍弃 Rm开始几个值较大的点,于是运行结果 就正常了。 电t直兰T H- 图3 【10】

19、 (2)心得体验: 对基音检测短时自相关函数法的主要原理是相似的原始信号,通过比较它转 移到确定基音周期的信号之间,可移动的距离等于螺距,所以有一个或两个最大 信号的相似性。基于自相关函数的基音估计算法是一种常用的方法,沥青特别适 用于噪声环境中提取。在基音周期自相关函数的峰值,两个相邻的一个基音周期 的峰值之间的间隔。但频率和大量的短时自相关函数的计算方法,同时,要注意 低频率的现象。 六、结束语 在本设计中我学到了很多知识。例如,区分浊音和清音,滤波matlab课程 设计周即将结束,通过这次设计,我深深地明白我的信号处理能力的严重短缺, MATLAB的应用也很奇妙。 在设计过程中,很多理论

20、原理不能理解,在原来的时候是一团糟。没有搜索 材料发挥作用。一些公式原理不能理解和程序的运行是不好的。 在设计中遇到的 问题,也是教师的讲解和同学交流后的和自相关函数曲线无影响。 也许是因为天 气,心情在设计过程中的烦恼,浪费了很多时间。但通过老师的指导和帮助,我 终于克服困难,坚持完成论文的全部工作 本文是在王晓丽老师精心指导和大力支持下完成的。 王晓丽老师以其严谨求 实的治学态度、 高度的敬业精神、 兢兢业业、 孜孜以求的工作作风和大胆创新的 进取精神对我产生重要影响。 她渊博的知识、 开阔的视野和敏锐的思维给了我深 深的启迪。同时,在此次论文设计及写作过程中我也学到了许多了关于基于短时 自相关法的基音周期估值方面的知识, 实验技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论