版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音传达系统的设计xxxxxxxx汇报人:xxx目录01.语音的性质02.03.04.语音评鉴的效标语音传递系统的组件合成语音单击此处添加标题内容语音也是听觉信息显示形式之一,其来源可经由人或机器,目前已可用低廉成本的技术来合成语音(如新上市轿车、电信局查号台)﹔计算机语音辨识,目前虽不如合成语音进步,但已有初步成果,因此语音可作为控制机制,以指挥计算机系统运作。语音是由肺部呼出的气流,经发音器官修饰,而形成的各种声波。1.1语音之性质1.1.1语音之类型音素可组成音节(syllables),再形成字或词(words),又构成句(sentences)。语音中最短的分节;这分节一改变,一字的意义便随而改变。就英语而言,其元音共有十三个音素(例如put中的u),而子音则有二十四个音素(例如tie中的t)和一些双元音(例如boy中的oy)。单击此处编辑母版文本样式第二级第三级第四级第五级1.1.2语音之描述波形图(waveform):如图1.1,表示该声音在时间过程内空气压力(强度)的变化。频谱图(spectrum):如图1.1,表示在某期间取样之际,发出某音素或字词所产生的各个频率的个别强度。音谱图(soundspectrogram):如图1.1,以纵轴表示频率,横轴表示时间,所发声音的强度则以坐标图形墨色的浓淡程度来描述。1.1.3语音之强度男性的语音强度约比女性高出3至5dB,轻声交谈的语音强度约为45dBA,一般交谈约为55dBA个别语音的平均强度或语音功率(speechpower)之差异非常的大;元音的语音功率通常要比子音的大得多。而不幸地,低语音功率的子音偏巧是语音能解度的关键因素。单击此处编辑母版文本样式第二级第三级第四级第五级1.1.4语音之频率组成每一语音均有其独特的频谱,人们之间的语音频谱也自然不同;而同一个人也会因情况之不同而改变其频谱组成。一般而言,男性比女性在频谱上具有较占优势的低频率组成。1.2语音评鉴之效标1.2.2语音质量1.2.1语音的能解度语音质量(speechquality)、自然度(naturalness)或传真性,其重要性不亚于能解度,尤其在必须分辨发话者身份的场合,接听电话就是一例。单击此处编辑母版文本样式第二级第三级第四级第五级02011.3语音传递系统之组件噪音环境(noiseenvironment);以及讯息(message);受话者(hearer)等所构成。传送系统(transmissionsystem);发话者(speaker);一套语音传递系统系由:1.3.1发话者语音强度较大,即话说得较铿锵有力。用于说话的总时间较长,即较少停顿。较以基本声音频率之不同来变化其语音。「音节持续时间」较长,即音节拖得较长。优秀的」说话者
的发音(英语)具有如下的特色:1.3.2讯息有数项讯息特性会影响其可理解性,包括所用音素、字词和语脉。音素混淆:某些语音之间比较容易相互混淆。Hull(1976)发现下列字母组群,在同组群的字母之间很容易彼此混淆:DVPBGCET;FXSH;KJA;MN。字词特性(wordcharacteristics):熟悉的字词比不熟悉者的可理解性大。语脉特色(contextfeature):完整文句的能解度高于孤立的字词。1.3.3传送系统语音传递系统(例如电话和广播)可能会产生各种型式的失真,例如频率失真、过滤、波幅失真等。过滤对语音的影响:所谓语音过滤,就是在传送过程中,阻止某些频率,而仅允许其余频率的音波通过。大部分的滤波器不是消除某水平之「上」的频率(称为低通滤波器,low-passfilter),就是消除某水平之「下」的频率(称为高通滤波器,high-passfilter)。1.3.3传送系统波幅失真对语音的影响:波幅失真的型式之一为尖峰截波(peakclipping),亦即声波的尖峰部分皆被截割掉,只有中间部分的声波被保留下来。中央截波(centerclipping)则是截割掉波幅的某些中央部分,而保留声波的尖峰部分。图1.7即为截波处理对噪音下语音能解度的影响。1.3.4噪音环境噪音,不管是来自外界环境或内在于传送系统本身,都是妨害语音可理解性的重要原因。发音清晰指数(ArticulationIndex,AI):发音清晰指数(AI)可用以预测在一已知噪音水平的环境下语音的能解度。图1.8为美国国家标准局(ANSI,1969)所使用的三分之一八度音阶波带计算法,计算AI之示例,其步骤如下:1.3.4噪音环境优选八度音阶波带语音干扰位准(Preferred-OctaveSpeechInterferenceLevel,PSIL):此一指数系由Peterson和Gross在1978年提出,它可用来粗略估计噪音对语音接收的影响。PSIL仅计算在中心频率为500、1,000及2,000Hz的三个八度音阶波带上的噪音声压位准的平均数。1.3.4噪音环境优选噪音规准曲线(PreferredNoiseCriteriaCurves,PNC):Beranek,Blazier与Figwer(1971)共同发展一套曲线,用以评量办公大楼、房间、厅堂等语音传递相当重要的噪音环境。1.3.4噪音环境混响(reverberation):混响或交混回响是噪音在一封闭房间的墙壁、天花板和地板来回跳动所产生的效应。1.3.5受话者在噪音情况下接收语音讯息,受话者应具备如下条件:具有正常听力。熟悉所将接收的讯息之类型。经得起作业情境的压力。具有在相互冲突的数项刺激中集中注意于其中之一的能力。1.4合成语音关于合成语音(synthesizedspeech)的人因工程研究,主要课题是:确定所合成的语音是否已适合人们使用,影响人员绩效与偏好的语音合成系统的向度是什么,以及如何改进这些系统等。1.4.1语音合成系统之类型分析合成法:系使用电子模型模拟人类发音机制产生语音,亦即运用滤波器与调制器等机制来模制声音。规则合成法:此系统储存基本语音片段与规则套组之典库,以合成声音。1.4.2合成语音的应用一、合成语音的使用绩效合成语音的能解度合成语音的记忆性二、对合成语音之偏好1.4.3合成语音的应用准则语音警报的呈现所使用的声音,必须在定性上与在该情境所将听到的其他声音有所不同。若合成语音只限于传递警告之用,则在发出语音通报之前不宜有提请注意的信号音。若合成语音在警报之外另用以呈现其他信息时,则必须有某种提请注意该语音警报的设计。尽量设法增加讯息的能解度。如为一般目的使用时,应使合成语音尽可能接近自然语音,以提高使用者的接受度。1.4.3合成语音的应用准则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年广州检验检测认证集团有限公司海南分公司招聘备考题库有答案详解
- 2026年中铝河南洛阳铝加工有限公司招聘备考题库含答案详解
- 2026年东营市金湖学校公开招聘劳务派遣校医备考题库完整答案详解
- 金融风控模型优化-第140篇
- 2026年南平市消防救援支队招聘消防文员备考题库及完整答案详解1套
- 2026年上药医疗器械(上海)有限公司招聘医院供应链现场管理员备考题库附答案详解
- 2026年中铁物总国际招标有限公司招聘备考题库及一套完整答案详解
- 中医宣教知识普及
- 2026年云南勐海县消防救援局专职消防员招聘的备考题库及一套完整答案详解
- 2026年大连理工大学附属高级中学招聘备考题库及参考答案详解1套
- 钢管杆组立作业安全培训课件
- 直播间设计装修合同范本
- 建设用地报批服务投标方案
- 非静脉曲张上消化道出血的内镜管理指南解读课件
- 新生儿消化道出血
- 2025年可爱的中国测试题及答案
- 油费补助管理办法
- 新食品零售运营管理办法
- 强制性产品认证实施规则 低压电器 低压元器件(CNCA-C03-02:2024)
- 《实践论》《矛盾论》导读课件
- 农村杀猪活动方案
评论
0/150
提交评论