语音教学第2章—语音的产生及数学模型09_第1页
语音教学第2章—语音的产生及数学模型09_第2页
语音教学第2章—语音的产生及数学模型09_第3页
语音教学第2章—语音的产生及数学模型09_第4页
语音教学第2章—语音的产生及数学模型09_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 语音的产生及数学模型2/76一、 语音处理研究的基本内容二、人的言语 (speech)过程三、语音的发音机理四、语音的听觉机理五、语音信号模型第二章 作业题本章要点:3/76一、语音处理研究的基本内容l从人与计算机交互的角度来看语音信号相应的处理如下: ( 1)人与计算机通信(计算机接收语音信号): 语音识别与理解; ( 2)计算机与人通信(计算机输出语音) 语音合成:包括音乐合成和语音合成; ( 3)人 -计算机 -人通信: 人通过网络,与处于异地的人进行语音通信,需要的语音处理包括: 语音采集 语音编码 语音传输 解码等。这里语音编 /解码技术是信道利用率的关键。4/76说的是什么内容?是谁在说话?计算机去说话?语音识别声纹识别语音合成 2011-3-9 第 3页 /共 87页一、 语音信号处理 研究的基本内容6/767/76语音处理 综合性的新兴学科语音合成 教计算机学会说话 语音识别 让计算机听懂人类语言 语音编码 去除冗余压缩数据 8/76研究内容涉及三方面相互密切配合的任务和课题:l应用l基础理论和算法l硬件系统9/761应用方面通信产业起源于 1874年 电话的发明 。从那时起,通信产业大致发生了三次重大变革。( 1)第一次变革产生于七十年代初。 1972年 CCITT组织公布了第一个语音编码标准G.711。即对数 PCM编码,由此开始,数字程控交换网络逐步淘汰了传统的模拟交换传输方式。 10/76( 2)第二次重大变革产生于八十年代末。1988年欧共体 13个国家数字移动特别工作组 (GSM)制定了采用长时预测规则码激励的编码标准 (13k bps RPE-LTP)。从而确立了全球范围移动通信产业(第二个通信网络)的崛起。11/76( 3)第三次变革是指以新兴的计算机因特网为基础的信息高速公路为标记 如何在INTERNET网上有效地传输话音。 IP电话将使因特网成为第三个话音通信传输网。目前 IP电话所用的话音编码标准有 G.723.1、 G.728、 G.729等。这些标准各有长短。人们正在努力研究适合 IP电话的新的编码算法。低延迟、低码率、低复杂性、高音质的话音编码算法将是未来 IP电话网络的奠基石。 12/762、基础理论和算法方面从以下方面进行:( 1)语音产生的机理(发音)和感知机理(听)涉及心理学、语音学、语言学、认知学、神经生理学等。( 2)将语音作为一种信号来处理13/76常用语音编码算法分类语音编码算法PCM预测编码变换编码 付立叶变换 斜变换 小波变换统计编码 Huffman编码 算术编码游程编码其他编码二值图像编码子带编码轮廓编码固定 自适应固定 自适应离散余弦变换 KL变换沃尔什哈达马 Harr变换LZW矢量量化差分预测15/76( 3)硬件实现: 实时语音语音处理系统的产品化 。(略)16/76分为五个阶段 : 想说阶段 说出阶段 传送阶段 接收过程 理解阶段 二、人的言语 (speech)过程17/76想说阶段 说出阶段 传送阶段 接受阶段 理解阶段机器翻译 文语转换语音分析语音编码语音加密公用电信网移动通信网语音解码语音增强语音识别语音理解机器翻译图 1.1 人的语言过程 18/76人的语言过程19/761、人的发音器官组成: 肺和气管组成声源; 喉和声带称为声门; 由咽腔、口腔、鼻腔组成声道。 三、 语音的发音机理20/76人的发音生理机构l主声道:声门以上,经咽喉、口腔、鼻道21/76机理示意22/76l过程:l发音时由肺部收缩送出一股直流空气经气管流至喉头声门处;l在声门处的声带肌肉收缩,声带产生振动而且具有一定的振动周期,从而产生声音。23/76功能肺 :产生压缩气体,通过气管传送到声音生成系统。喉 :控制声带运动的复杂系统。主要包括:环状软骨、甲状软骨 、杓状软骨、声带 24/7625/76l声带是伸展在喉前、后端之间的褶肉,前端由甲状软骨支撑,后端由杓状软骨支撑,而杓状软骨又与环状软骨较高部分相联。这些软骨在环状软骨上的肌肉的控制下,能将两片声带合拢或分离。l声带之间的间隙称为声门,功能主要是产生激励 。 26/76l声道: 声道包括喉以上的所有发音器官。 主要功能是传输调制声波 。成年男性声道的长度为 17cm。当声波通过声道时,其频率高低受声腔共振的影响。这种共振与声道不同区段形状有关。27/76四、语音的听觉机理听听 觉觉 器器 官官 耳是听觉的外周感觉器官。 听觉和保持平衡的功能 . 外耳:耳廓、外耳道。 中耳:鼓膜、听小骨、咽鼓管和听小肌。 内耳: 耳蜗。28/761.声音的传递:外耳、中耳外耳的功能外耳的功能(2)外耳道: 传音的通路; 增加声强:与 4倍于外耳道长的声波长 (正常语言交流的波长 )发生共振,从而增加声强。(1)耳廓: 利于集音; 判断声源:依据声波到达两耳的强弱和时间差判断声源。29/76结构特点 :是一个具有一定紧张度、动作灵敏、斗笠状的半透明膜, 对声波的频率响应较好,失真度较小。外耳道 鼓膜镫骨锤骨 砧骨半规管中耳的功能 鼓膜: 功能作用:能如实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论