智能语音技术及应用开发 课件 单元一任务1:了解语音的产生_第1页
智能语音技术及应用开发 课件 单元一任务1:了解语音的产生_第2页
智能语音技术及应用开发 课件 单元一任务1:了解语音的产生_第3页
智能语音技术及应用开发 课件 单元一任务1:了解语音的产生_第4页
智能语音技术及应用开发 课件 单元一任务1:了解语音的产生_第5页
已阅读5页,还剩33页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

初步了解语音2023年2月单元一了解语音的产生单元一:任务11.通过语音相互传递信息是人类最重要的基本能力之一。2.语言是人类特有的表达方式。3.声音是人类常用的工具,是相互传递信息的最重要的手段。虽然人可以通过多种手段获得外界信息,但最重要的信息源只有声音、图像和文字三种。与采用声音传递信息相比,显然采用视觉和文字相互传递信息的效果要差得多,这是因为语音中除包含实际发音内容外,还包括发音人是谁及发音人喜怒哀乐等各种信息。综上,语言是人类最重要、最有效、最常用和最方便的交换信息的方式。另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。项目导入目录CONTENTS1了解语音的性质2了解语音的产生3了解语音中蕴含的信息知识目标了解语音的性质掌握语音产生的过程了解语音中蕴含的信息能力目标能够描述每个步骤的功能能够描述每个步骤的具体目标能够理解流程中涉及到的专业术语思政目标感悟脚踏实地、勤恳敬业、精益求精的大国工匠精神学习爱岗敬业的社会主义核心价值观PART01了解语音的性质了解语音的性质什么是语音?风声、雨声是语音吗?气喘声、打喷嚏声是语音吗?了解语音的性质语音是由人的发音器官发出来的具有一定意义的声音。自然界的风声、雨声都不是由人的发音器官发出来的,所以不是语音;气喘声、打喷嚏声虽然是由人的发音器官发出来的,但那只是人的本能生理反应,并不具有意义,不起交际作用,所以也不是语音。语音是语言的物质外壳,语言要通过语音来传逆信息进行交际。没有语音这个物质外壳,意义无法传递,语言也就不能成为交际工具。了解语音的性质语音的性质有哪些?了解语音的性质语音具有物理属性、生理属性和社会属性三个方面的性质。其中物理属性和生理属性是语音的自然属性,自然界的各种声音都有物理属性或生理属性,但只有语音具有社会属性,只有人类社会才有语音,社会属性是语音的本质属性。了解语音的性质语音的物理性质(1)音高——音波的频率(2)音强——音波的强度或振幅(3)音长——声音的长短(4)音质——声音的个性或特色了解语音的性质语音的生理性质语音是通过发音器官发出来的。发音器官可以分为三大部分。(1)动力部分:肺和气管。——动力站(2)发声部分:喉头和声带。——发音体(3)调节部分:口腔和鼻腔。——共鸣体了解语音的性质语音的社会性质语言是人类最重要的交际工具,具有社会性;语音是语言的物质外壳,也具有社会性。语音的社会性是语音的本质属性。(1)语音具有民族特征。(2)语音具有地方特征。PART02了解语音的产生了解语音的产生发音的生理器官人发音有很多口腔器官集群相互协调配合完成,声纹差异性特征原因主要有两点,包括讲话人咽喉等器官的组成差异性,影响着声带振动的幅度和频率的范围。同时,包括鼻腔、唇、舌、软腭等声腔肌肉群被机体控制发音的方式差异性,集群之间相互作用,就可以发出机体独有的声纹特征的语音。了解语音的产生发音器官分为三个部分肺和气管——气流是发音的动力,呼气时肺是气流的动力站。气管是气流出入的通道,吸气时气流经过气管进入肺,呼气时气流由肺经过气管呼出。汉语主要靠呼出的气流来发音。了解语音的产生发音器官分为三个部分喉头和声带——喉头是由四块软骨构成的圆筒,圆筒的中部附着声带。声带是两片富有弹性的肌肉薄膜,两片薄膜中间的空隙是声门,声门是气流的通道。声带可以放松,也可以拉紧。放松时发出的声音较低,拉紧时发出的声音较高。声门可以打开,也可以关闭。打开时,气流可以自由通过;关闭时,气流可以从声门的窄缝里挤出,使声带颤动发出响亮的声音。了解语音的产生发音器官分为三个部分口腔和鼻腔——咽腔是个三叉口,下连喉头,前通□腔,上连鼻腔。呼出的气流由喉头经过咽腔到达口腔和鼻腔。口腔、鼻腔、咽腔都是共鸣器,对发音来说口腔最重要。构成口腔的组织,上面的叫上腭,下面的叫下腭。上腭包括上唇、上齿、齿龈、硬腭、软腭和小舌,下腭包括下唇和下齿,舌头也附着在下腭上。舌头又分为舌尖、舌面和舌根。上腭上面的空腔是鼻腔,软腭和小舌处在鼻腔和口腔的通道上。软腭上升时,鼻腔关闭,气流从口腔通过,这时发出的声音叫口音。软腭下垂时,口腔中的某一部位关闭,气流从鼻腔通过,这时发出的声音叫鼻音。了解语音的产生语音产生的三个阶段(1)发音(2)传递(3)感知了解语音的产生(1)发音一切声音的产生都源于发音体的振动。发音体振动时,会扰动周围的空气或其他媒介,使之产生波动,这样就形成了声波。声音可以由两种方式产生:声带振动或声道狭窄部所产生的涡流,声音经过气流通道所形成的共鸣系统或经过滤波器以后,频谱发声改变,在经过口唇和鼻腔时频谱又发生改变。不同音位之间的差别可以是由于发声源引起的,也可以是由于声道的形状和空气柱的长度不同所引起的。了解语音的产生(2)传递声波发生后经过一个共鸣系统,其频谱可以发声变化。这样的共鸣系统相当于一个声学滤波器,滤波器的作用可以用频响曲线,既各个频率的增益或输出来表达。滤波在言语的产生过程中起了重要的作用。咽喉、口腔、牙齿、口唇、鼻腔组成了一个声道,此声道即为一个共鸣腔,对从气管或声带发出的声波进行滤波。之后,通过外部空气的传导,到达人的耳朵里,就产生了语声的感觉。了解语音的产生(3)感知当听话人的耳朵接收到说话人的言语声时,听觉神经系统便把内耳转化成的电信号传导至大脑皮层,被大脑感知。感知的内容包括语音的音高、音强,音长、音色和语调等复杂信息,听话者从而能明确地判断说话人的意思。了解语音的产生借助于语言,才能获得经验之外的信息,分享他人的经验和体会,交流思想和情感的沟通。在社会发展的各个阶段,语言的分化过程和统一过程起作用的结果,形成了多种语言。这就是具体语言的产生。PART03了解语音中蕴含的信息了解语音中蕴含的信息语音中蕴含的信息有哪些?了解语音中蕴含的信息人类语音所包含的信息可以分为三类,即“说什么”、“谁在说”和“如何说”。“说什么”是计算机语音识别的核心工作;“谁在说”是说话人识别的核心工作。而对于“如何说”这个细节,总是把它当成前面两项中的噪声来处理。人类的语音情感感知过程就是“如何说”所指的说话人的情感状态,是语音的超语言信息。了解语音中蕴含的信息语音信息:发音人身份、语种、文本、情感、环境;语音任务:身份识别、语种识别、语音识别、情感识别、语音增强分离等。了解语音中蕴含的信息(1)语音中的语义信息语义信息是日常语言所说的信息,它不仅包括语言提供的信息,比如天气预报,命题或描述语句,预言,科学理论......提供的信息,也包括其它事物提供的信息,例如:温度表、天平、秤、GPS、数学公式、交通指示牌、疾病症状、化验数据、图片、视频等提供的信息。从广义上看,数据的含义就是语义,语义的概念应该包涵两个方面的内容:1)语义信息和信号的含义及知识有关;2)语义信息可以包含在单个信号和命题中。了解语音中蕴含的信息(2)语音中的生理信息人类声音的发出,是多个发音器官共同作用的结果,所以在语音中就包含了这些发音器官的生理信息,例如,当一个人感冒时,其发声就有明显的改变和特征。中医中的“望闻问切”中,就明确说明了可以通过一个人的声音信息来辨别生理的病变。一个人的声音信息中还明确包涵了语言中的情绪信息。了解语音中蕴含的信息(3)语音中的声纹信息声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。通常有七种声纹图:宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹(又分宽带、窄带二种)。其中,前二种显示语声的频率与强度随时间推移的变化特征;中间三种显示语音强度或声压随时间变化的特征;断面声纹只是显示某一时间点上声波强度和频率特征的声纹图。了解语音中蕴含的信息(4)语音中的语种信息语言是人类用来交流的一种工具。但对人类语言差别的准确定义则是很困难的。据统计提供的人类语言数量是5561种,在这之外,已经有很多种语言文字在世界上消失了,也有很多小语种并为统计入列。其中使用人数超过去5000万的语言有13种:汉、英、印度、俄、西班牙、德、日、法、印度尼西亚、葡萄牙、孟加拉、意大利和阿拉伯语。按被规定为官方语言或通用语言的国家数目来说,英语占第一位(约44国),法语第二(约31国),西班牙语第san约22国)被定为联合国的正式语言的有五种:汉语、英语、俄语、法语、西班牙语。了解语音中蕴含的信息(5)语音中的逻辑信息逻辑是人类语言中所包含的,超越语义的深层次信息,是人类思维逻辑的具体表现形式之一,其与上下文相关、问答相关、大脑思维相关,通过对语言中逻辑信息的提取,可以研究一个人惯用的思维方式,甚至性格、气质等。了解语音中蕴含的信息(6)语音中的空间信息人的语音以声波形式由空气作为媒介传到对方,言语声波的特性分析是现代语音学研究的最重要手段之一。言语声波的研究,早期都由物理学家进行。20世纪初分析语音只能用一种特制的浪纹计画出波形,用傅里叶分析尺对逐个周期的波进行测算,才得出表示声波特性的频谱和频率。通常,为了研究语音中的声学特性,会对语音中的声学特征、言语波模式、过渡音征等进行分析和研究。了解语音中蕴含的信息(7)语音中的韵律特点语音的声学特性除音色外,还有3种特性,如音强、音高、音长,总称为语音的韵律特征,也可以称为超音段特征,它们都可以用语图仪或音强计、音高计等仪器来分析。音强显示语音的重音、轻音等强弱变化,音高表现语音的字调与语调,而音长则对语言节奏的快慢,字与句之间的长短关系等加以准确地计量。用普通话、广州话和上海话3种方言来朗读一首古诗,会得到不同的窄带语图。除了音色不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论