会话语音中说话人识别的研究_图文_第1页
会话语音中说话人识别的研究_图文_第2页
会话语音中说话人识别的研究_图文_第3页
会话语音中说话人识别的研究_图文_第4页
会话语音中说话人识别的研究_图文_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、重庆大学硕士学位论文会话语音中说话人识别的研究姓名:刘大鹏申请学位级别:硕士专业:计算机软件与理论指导教师:朱庆生20070420 音自适应修改通用模型获得,之后每段语音用已知说话人模型计算匹配度。若通用模型的匹配度最大,则建立新的说话人模型,否则,此段语音属于匹配度最大的那个说话人,并用它自适应该说话人模型。121上述研究可以解决没有先验知识的情况下语音材料的分类问题,但是由于没有每个说话人的训练模型,它并不能确切的标注每一段是由谁说的,也就达不到标注索引的目的,只能归类;并且由于训练模型本身就是不精确的通用模型,其正确率也就比有先验知识的情况要差。本文的研究就是基于已知测试语音中可能出现的

2、说话人信息下迸行的,例如国际会议,与会者在进入会场前先用语音注册其说话人特征。本系统的实验流程图如下: 图4.2本文采用的说话人识别流程图chart used in this paperFig4.2The雄Blkcr identification4.1端点检测语音信号端点检测的目的是从连续采样得到的数字信号中检测出语音信号段和静音(噪音信号段。找出语音段的起始点和终止点,使采样的数据真正是语音信号的数据,从而减少数据的运算量,并减少处理时间,净化语音数据。端点作为语音分割的重要特征,在很大程度上影响着语音识别的性能。 最大1.5秒时延的切分法从理论上讲。应该是行之有效的。4.3说话人转折点检测

3、说话人检测在嵌入式实时系统中应用日趋广泛,这就要求不仅要保证说话人系统的识别率,而且要尽量降低系统资源消耗,减少计算复杂度。考虑到实际环境中说话人转折点多数发生在语音停顿处这一现象,为了减少识别时与多个模型作模式匹配的计算量。本文引入了在无先验知识的说话人检测中常用的分段与聚类技术。而分段与聚类所需的计算量远小于与每个说话人进行模式匹配的计算量,并且系统越大、说话人模型越多,其计算量的差距就越大。聚类的基本思路是:对于每个0级切分段只识别第一个1级切分段,此后的每个1级切分段与前一段做相似性比较,当相似度大于某一域值时,则认为与前一语音段属于同一个说话入,不再进行模式匹配;只有当两段分歧较大时

4、才认为可能是说话人转折点,进行模式匹配的识别。这样就把基于距离的检测和基于模型的检测结合了起来。常用的距离测量方法有Bayesian Information Criterion(BIC、GeneralizedLikelihood Ratio(GLR10,11,1筇5】、Kullbaek Leiblei distance(KL2t131、Hotellingf.s蜥s廿o(1。等算法。BIC法假设M=材。,M2,材,M。是所有的候选模型集合,k,是材,这一模型的参数数目,X=XI,X2,X3,耳为一群语音数据集,根据定义,BIC可写成下式:BIC(M,=logL<五,X2,以I M>一亡码logN(4.9二其中三<五.,.砭,XNlM,>为模型Mj和数据集x的最大似然值,丑为损失权重,根据(4.9式,就可以从众多模型中找出一个最佳的模型来描述语音集x。假设X4=“,屯I-'o和Xs=“,而,%代表两段连续语音段的特征向量,他们可能为一个说话人,也可能是两个不同的说话人,假定如下: Ho:而,而,¨一N(u,(4.10Hi:而,x2,一N(u,;而,毒2,%一以5,口(4.11 图4.6长度为N并包含一个说话人转折点的语音段slice which c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论