




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语音识别基础,第五章 基于统计模型(HMM)方式 的语音识别技术,洪青阳副教授 厦门大学信息科学与技术学院 E-mail: ,5.1 基于统计模型框架的识别法* 5.2 隐马尔科夫模型(HMM)的概念* (HMM:Hidden Markov Models) 5.3 HMM的三个基本问题* 5.4 基于HMM的语音识别方案*,第五章 基于统计模型(HMM)方式 的语音识别技术,5.1 基于统计模型框架的识别法,5.1.1 预备知识 (1)条件概率 P(A|B) P(A|B) = P(A,B)/P(B) P(A,B):表示A与B的联合概率。 (2)Bayes定理 P(A|B) = P(B|A)P(
2、A)/P(B) (3)事件的独立性 P(A,B) = P(A)P(B) 5.1.2 基于统计模型框架的识别法*,5.2 隐马尔科夫模型(HMM)的概念,5.2.1 马尔科夫过程* 5.2.2 隐马尔科夫模型的概念* 5.2.3 HMM的要素及其模型描述* 5.2.4 基于HMM的观察符号序列 的生成方式*,5.3 HMM的三个基本问题及其解法,5.3.1 HMM三个基本问题 - 模型评估问题(如何求:P(O|) - 最佳路径问题(如何求:Q=q1q2qT) - 模型训练问题(如何求:A 、B 、) 5.3.2 模型评估问题的解法* 5.3.3 最佳路径问题的解法* 5.3.4 模型训练问题的解
3、法,5.4 基于HMM的语音识别方案,判决规则,VITERBI 计算,VQ,码本,训练,识别,X,X:特征矢量的时间序列 O:基于VQ的观察符号序列,HMM(3),HMM(2),HMM(1),O,声学参数分析,预处理,语音信号输入,基于统计模型框架的识别法(1),语音识别问题的形式化描述 -设:(1)待识语音的特征模式:T =t1,t2, tI (2)词汇表中第个单词:W(n), 1nN (3)当T 被观察到后,与T 对应的发声内容是 单词 W(n)的概率: P( W(n)|T ) -语音识别问题的形式化描述: k = argmax P( W(n)|T ) n,基于统计模型框架的识别法(2),
4、声学模型与语言模型 P(W(n)|T )= P(T |W(n)P(W(n)/P(T ) k = argmaxP(T |W(n) P(W(n) n 模式匹配与统计模型(T :待识语音) 模式匹配 统计模型 词 汇 表 W(k), 1kN词 汇 表 W(k), 1kN 参考模式 R(k), 1kN参考模型 M(k), 1kN 失真测度 Dk = D(T,R(k)概率测度 P(T|M(k) -Dk:DTW距离 -P: 由M(k)生成T 的概率 判 别 n = argminDk判 别 n=argmaxP(T|M(k) 1kN 1kN 识别结果 W(n) 识别结果 W(n),马尔科夫过程,语言的马尔科夫
5、模型 P(Ci,Cj) = P(Ci)P(Cj|Ci) P(Ci,Cj,Ck) = P(Ci)P(Cj|Ci)P(Ck|Cj) 天气的马尔科夫模型 观察日期: 1 2 3 4 5 6 7 8 观察序列(O): 晴晴晴雨雨晴多云晴 状态转移序列:3 3 3 1 1 3 2 3 状态输出概率P(O|): P(O|) = P(3,3,3,1,1,3,2,3 |) = P(3)P(3|3)P(3|3)P(1|3) P(1|1)P(3|1)P(2|3)P(3|2),1: 雨天,隐马尔科夫模型的概念,双重随机过程 - 依存于状态的观察事件的随机性 - 状态转移的随机性 观察序列(H:正面;T:反面): O
6、=o1,o2,oT H,H,T,T,HMM模型的要素及其模型描述,模型要素: (1)N:模型中的状态数目 (2)M:每个状态可能输出的观察符号的数目 (3)A = aij:状态转移概率分布 (4)B = bj(k):观察符号的概率分布 (5)= i:初始状态概率分布 模型描述: =(A, B, ),基于HMM的观察符号序列的生成方式,当给定模型(A, B,)后,就可将该模型看成 一个符号生成器(或称信号源),由它生成观察 序列 O= o1o2 oT。其生成过程(也称HMM过程)是: (1)初始状态概率分布,随机选择一个初始状态 q1 = Si; (2)置 t = 1; (3)按状态 Si 的符
7、号概率分布bi(k),随机产生一个输出符号 ot = Vk; (4)按状态 Si 的状态转移概率分布aij,随机转移至一个新的状态 qt+1 = Sj (5)令t = t + 1,若 t T,则返回步骤(3),否则结束过程。,模型评估问题的解法(1),当给定模型(A, B,)以及观察序列 O =o1o2oT时,计算模型对观察序列 O 的 P(O|)概率的思路是(穷举法): (1)对长度为T 的观察序列O,找出所有 可能产生该观察序列O 的状态转移序 列 Qj =qj1 qj2 qj3 qjT(j=1,2,J); (2)分别计算Qj与观察序列O 的联合概率 P(O, Qj|); (2)取各联合概
8、率P(O,Qj|)的和,即: J P(O|)=P(O,Qj|) j=1,HMM 模型的例子 观察符号序列:abba 所有可能的路径: (1) S1-S1-S1-S2-S3 (2) S1-S1-S2-S2-S3 (3) S1-S1-S2-S3-S3 (4) S1-S2-S2-S2-S3 (5) S1-S2-S2-S3-S3 (6) S1-S2-S3-S3-S3,模型评估问题的解法(2),P(O|)的一般解法: P(O,Qj|)= P(Qj|)P(O|Qj,) P(Qj|)= P(qj1)P(qj2|qj1)P(qj3|qj2) P(qjT|qjT-1) = aj0,1 aj1,2 aj2,3 a
9、jT-1,T P(O|Qj,)= P(o1|qj1)P(o2|qj2) P(oT|qjT) = b1j(o1) b2j(o2) b3j(o3) bTj(oT) P(O,Qj|) = aj0,1b1j(o1) aj1,2 b2j(o2) ajT-1,T bTj(oT) J J T P(O|)=P(O,Qj|)= ajt-1,tbtj(ot) j=1 j=1 t=1,HMM 模型的例子,模型评估问题的前向算法,采用前向算法求解P(abba|)概率的格型图,Q: q1 q2 q3 q4 O: a b b a,t,最佳路径问题的解法,0.5x0.2,0.5x0.8,0.2x1.0,0.6x0.5,0.5x0.2,0.5x0.2,0.5x0.2,0.5x0.8,0.5x0.8,0.5x0.8,0.4x0.5,0.4x0.5,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 仓储主管岗位面试问题及答案
- 病案管理员岗位面试问题及答案
- 珠宝私人定制设计师岗位面试问题及答案
- 2025届浙江温州十五校联盟高二下化学期末质量跟踪监视模拟试题含解析
- 广东佛山市禅城区2025年化学高一下期末复习检测模拟试题含解析
- 内蒙古阿拉善2025年高二化学第二学期期末学业质量监测试题含解析
- 民航诚信管理暂行办法
- 协定税率货物管理办法
- 厦门翔安垃圾管理办法
- 我国非营利组织公信力建设的现实问题与改进策略
- 夫妻婚内财产约定协议书范本(2025年)
- 2025年中医师承合同范本文字
- 0-3岁婴幼儿感觉统合训练知到智慧树章节测试课后答案2024年秋杭州师范大学
- 抑酸药课件教学课件
- 2024译林版七年级英语上册单词(带音标)
- 北师大版数学六年级上学期期中试卷
- 新生儿重症监护室母乳使用专家共识(2024版)解读
- 病毒性脑炎诊疗指南(儿科)
- 乐器设备供货项目实施方案及售后服务方案
- 中共党史知识竞赛试题及答案
- 2020年杭州学军中学高一入学分班考试英语试卷及答案
评论
0/150
提交评论