




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 随着人机语费通信的发展,语音会成系统成为? 当前研究的热 点。影响合成音质的因素包括文本分析技术、韵律规则、合成基元 数搬痒质爨以及携接技术等。本文主要研究磐透话会戏基元数摄疼 的设计与搜索,数据库的基元是直接从自然语音中截取的,且拥有 多令样本,惫含了是够豹麓簿箨港交纯。由予合成辩撮据搜索雾法, 挑选拼接代价最小的样本直接拼接,避免了采用信号处理技术修饰 韵律对音矮静损害,所以最大限度的保留了语音豹自然度 隽了骥定舍逶熬基嚣,在憩我爨慰不羁耱类基元戆谮啻学特点 进行了分析由于普通话是基于街节的语言,有规则的c v ( c o n s o n a n t + v o w e l ) 结祷音第,溺一令音节豹音豢之鬻有裰鬣的 协同发音,而音节边界裔素之间的协同发音相对较弱,因此“带有 声调的音节”被选为合成基元。 逶过瓣薯逶话发啻凳点懿分耩,葶冬考繁靛熬律耱薤滔一个美维 语境向量d c v v ( d e s c r i p t i v ec o n t e x t u a lv a r i a t i o nv e c t o r ) 来表承 荛了在掰臻对搜索毒恰当韵律豹萋元,我稻设定并优证7 语境淘量 元素距离袭。设计过程同样基于普通话的发膏特点,考虑到语音的 平均拼接代价和平均意见得分肖较强的关联,因而对语境向量距离 表懿霞亿遴过提蹇a v c c o s t 稳m o s 豹糠关系数来突瑗。这里采用 少缴数据进行了m a t l a b 仿真实验,结果证明该优化方法怒可行的 我们还将g s m l 3 k b sr p e l t p 和a d p c m 两种语音捱缩编码 方法用于基元蓐,进一步减小? 数据库容量。可以根据速搴和谶啻 质鬣需求选择不同的压缩算法。 最嚣介绍了两种合成墓元羧索方法。辩于基元样本少的系统, 使用顺序搜索方法;对乎基元样本多的系统,为了提高搜索效率, 需要为每个基元构建一棵索引树,采用树搜索。 出东夭学硕士学搜论文 笑键譬;合成麓惩数据库;港蟪建爨距蒜袋;平均拼接代价值; 辩攘索。 由东大学硕士学位论文 a b s t r a c t w it ht h er a p i d d e v e l o p m e n t o f c o m p u t e rt e c h n o l o g y a n d i n f o r m a t i o nt e c h n o l o g y ,c u r r e n th u m a n m a c h i d ei n t e r a t i w em a n n e r c a n n o ts a t i s f yh u m a n sr e q u i r e m e n t s :s oh o wt om a k em a c h i n e i n t e l l i g e n t l yc o m m u n i c a t ew i t hh u m a na n dt h u sg e tm o r en a t u r a l a n df r i e n d l yi n t e r a c t i v ei n t e r f a c eh a sb e c a m er e s e a r c hh o t s p o t s p e e c hs y n t h e s i si so n eo ft h em o s ti m p o r t a n ta r e ai nt h i sf i e l d , t h i st h e s i s 暮i 1 1c o n c e n t r a t eo ni n v e n t o r yd e s i g n p r o s e d i c m o d e l i n ga n ds y n t h e s i sa l g o r i t h m , t t ss y s t e mb a s e do nl a r g ec o r p u sh a sb e e nw i d e l ya p p l i e do n h i g h p e r f o r m a n c em a c h i n e ,b u ti ti si n c o m p e t e n tf o re m b e ds y s t e m b e c a u s eo ft h eb e t t l e - n e c ko fs t o r a g e 。s ot h ec o r eo ft h ep r o b l e m i st ob a l a n c et h ec o n f l i c tb e t w e e ni n v e n t o r ya n do u t p u tq u a l i t y , t h i st h e s i sp r e s e n tat r a d e o f fa l g o r i t h mf o re m b e d s y s t e m i n v e n t o r yd e s i g na c c o r d i n g t o m a n d a r i n s y l l a b l e s c h a r a c t e r i s t i c ,u s i n gm f c cw e l lp e r c e i v eb ye a rt om e a s u r et h e d i s t o r t i o n b e t w e e ne a c ht w o s y l l a b l e s a n d u s i n g d y n a m i c p r o g r a m m i n ga l g o r i t h mt oo p t i m i z et h em e a s u r e m e n t p r o c e s s a c c o r d i n gt ot h es y l l a b l eo c c u r r e n c ef r e q u e n c y ,t h e s t r u c t u r eo fi n v e n t o r yw a sc o n f i r m e d t h e n ,m o d i f i e dk m e a n s c l u s t e ra l g o r i t h mw a se m p l o y e dt os e l e c tt h er e p r e s e n to ft h e c o r r e s p o n d i n g t o n e d s y l t a b l e ,s 主搬u 王t 8 n e i t yc o n s i d e r i n gt h e f o l l o w i n gp r o c e s s i n g ,s e l e c ts e v e r a lc a n d i d a t et oo p t i m i z et h e in v e n t o r y i nt h ep r o c e s so fc o m m u n i c a t i o nb e t w e e nh u m a n ,p r o s o d i c c o m p o n e n ti m p l ys p e c i a li n f o r m a t i o nt h a tc a n n o tb ee x p r e s s e db y l e t t e r s ,t h u si ti sv e r yi m p o r t a n tt om o d e lt h ec o n t e x tp r o s o d i c “i 山东大学颡士学位论文 a v c c o s ta n dm o si s s t r o n g ,d i s t a n c ef o r mc a nb ei m p r o v e db y i n c r e a s i n gt h ec o r r e l a t i o nc o e f f i c i e n to fa v c c o s ta n dm o s as m a l l q u a n t i t yo fd a t ah a v eb e e n u s e db ym a t l a bs i m u l a t i o n ,t h er e s u l ti s t h a tt h em e t h o do fi m p r o v e m e n ti sf e a s i b l e g s m13k b sr p e - l t pa n da d p c mh a v eb e e nu s e dt od e c r e a s e t h ec a p a c i t yo f s y n t h e s i s - u n i t d a t a b a s e a n dt h e c o m p r e s s i n g a l g o r i t h mc a nb es e l e c t e da u t o m a t i c a l l ya c c o r d i n gt ot h er a t ea n d s p e e c hq u a l i t y , i nt h ee n d ,t w os y n t h e s i s - u n i ts e a r c h i n gm e t h o d sh a v eb e e n i n t r o d u c e d ,s e q u e n c e s e a r c h i n gm e t h o dh a sb e e nu s e di ns y s t e mw i t h s m a l li n s t a n c e s i fe a c hu n i th a sm a n yi n s t a n c e s ,i n d e xt r e eh a sb e e n e r e c t e df o re a c hs y l l a b l ea n dt r e e - s e a r c h i n gm e t h o dh a sb e e na d o p t e d i no r d e rt oi n c r e a s i n gt h es e a r c h i n ge f f i c i e n c y 。 k e y w o r d s :s y n t h e s i s u n i td a t a b a s e ;d c v vd i s t a n c ef o r m ; a v e r a g ec o n c a t e n a t i v ec o s t ;t r e e - s e a r c h i n g 原刨性声萌 本人郑熏声瞬;所星交的学位论文,是本入在导掷的指稃下,独 立进李亍研究所取缛灼成果。除文巾已经注骧弓l 耀豹蠹容外,本论文不 包含任何其他个人或集体已经发表或撰碍过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任彘本入承担。 论文作者签名;2 叠鍪垫日期:边垂笙:笸 关于学位论文使用授权的声骧 本人完全了解山东大学有关保鐾、锼用学位论文的规定,露意学 校保留或向阑家有关部门绒机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东火学可以将本学位论文的全部或部分 内容编入有关数据簿进行检索,珂菝采耀影窜、缩窜或其健复毒l 手蔽 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:菌羹蓥导师签名:叠丝日期:地! :笙! 出系大学硕士学位论文 1 1 写l 言 第一章绪论 语音合成技术是实现人机语音通信,建立一个脊听、说能力的 口语系统所必需的一项关键技术。使电脑乃趸嵌入式系统具有类似 予人类的说话和听懂人类说话的能力,魁新世纪信息科学的努力目 标 。 合成语音的质量主要从可饿度和自然度甄个方颓来衡量,合成 系统的各个部分都直接影响合成语酱的质量。本文主要讨论普通话 合成基元数据库的设计和搜索,包括合成基元的确定、韵律标泣、 压缩算法和数据库存储与搜索这几个方面的问题通过研究备种算 法和m a t l a b 仿真实验,证明用语境向薰对带有音调的音节进行韵 律标注,邋过提高m o s 和a v c c o s t 的褶关饿来优化语境向爨元素 疆离表,通过援索便拼按代价最小的音节样本来合成语音,在提商 合成语音鑫然度方蕊其有胃行後。 1 2 语音合成系统概述 语音合残( s p e e c hs y n t h e s i s ,t e x t t o s p e e c h ) ,麓称t t s 技米, 它涉及声学、遴吉学、数字壤号楚理技本、多媒体技零等多令学群 技术,是中文傣患处理镶域戆一项嚣沿技术,解决载主要超越就是 如何将文本状态鲍文字绩息转化为瞬豹声滢信息。 语音会残磋究从1 9 3 9 零煲尔实验室黪v o d e r ,1 9 8 0 年d k l a t t 懿混合型共振蜂会成器,裂2 0 璧纪8 0 年代懿蕃凌舞含铭,翔 t h s p e e c h 、s o u n i c 秘k d 8 6 3 语赘系统黪移 剑,舍成技术苓断发震, 合成音质不断撮赢。语赘合成方法也是多秘多样豹,有发音爨富参 数会成法、线性预测参数合成法、共振峰合成洼、波形攒接合成法 【2 1 。 山东大学硕士学位论文 传统的拼接式t t s 系统通常有三个模块组成,如图1 2 ( a ) 所示,分别是文本处理模块、韵律预测模块和信号处理模块。首先 将输入的文本转换成一串带有高层韵律描述的语音文档( 音素,双 音素,半音节或音节) ;之后进入韵律模块,通过计算可以得到适 当的韵律轮廓,像基频、时长和幅度;最后采用基频和时长修正算 法p s o l a 等对选定的基元进行处理,使合成语音的韵律特征符合 目标值1 3 l 。这类系统控制韵律比较灵活,但往往合成音质较差,存 在明显的机器声和回声。 ( a )( b ) 图1 1( a ) 传统的三模块t t s 结构( b ) 双模块t t s 结构 如果原始语音语料对于所有的合成基元包含足够的韵律和谱 变化,就可以采用双模块合成系统进行合成,如图1 2 ( b ) 这里 去掉了用于预测合成语音韵律参数的韵律模块,合成时从大的基元 数据库中选择带有恰当韵律特征的基元直接进行拼接,其中。合成 基元数据库”就是本文要研究的对象。与三模块系统相比,它在一 定程度上能提高合成语音的自然度。 1 3 合成基元数据库介绍 传统t t s 系统中的合成基元数据库,每个基元只有一个样本, 2 盘系大学矮圭学倥论文 由于内存限制,有些数据瘁中的基冗还疆编码成参数形式。 对于英文的合成基元数据库,由于协同发音及内存限制,通倦 选择双音素作为基本基元,而不选用音索和三音素f 引将双音素文 件编码成参数,按照字母顺序对基元参数进行存储,在合成时用顺 序搜索方法或:分套我方法搜索到所需蒸元参数,解码即可。对于 孛文静合或基无数据库,通常选择音节绒声韵母作为基本基冗,同 样为了方便援索,弩按照字母顺序避行存储。上述合成基元数据库 熬纂元逶常欢乏多擎 赘律,舍成霾季梵了避兔食藏啻蒺单调,簧j i | 纂 元黪德进移修馋,像p s o l a 搜零等,这襻往往会降低合成语音豹 自然度。 k d 8 6 3 采霜多样本静汉语潘音基元痒,箕蒸本器葱是将实际 语滚孛汲渗音第手变万健静音变避移赞戆主翡量纯爨并,使这个瘁, 蕴涵了汉澄兹咎变化熬售患,合成孵只要逶避对纂元痒样本豹合理 选择便可实现韵终控制,会成考震叁然发较褰 s l 。 r 逶避对褒骞资糕懿分辑帮跑较,本文采麓鹃含残基元数搽痒结 魏如图l 一2 爨暴,霹戳器出念残罄元为学寄声调鹣音第,每个音节 具有多个样本,每个音麓所禽撵本数可以不潮,对于其体啻繁豹榉 本的存健是采用素弓 树方法,可以通过辩搜索在会成孵挑选出烩当 韵律的样本。 图1 2 普通话的合成基元数据库图示 3 山东大学硕士学位论文 4 本文酶主要内容 本文的工作就是用带有足够韵律和谱变化的普通话语料库,来 设计合成基元数据库并研究搜索算法。 论文这样组织:在第二部分介绍了蛰通话合成系统基元的确定 与获取方法,在这爨对基元的种类和语音学特点进行了详述,指出 了基元数攒库设计所需的原始语料库的特点,及如何根据语料库标 注文档切分基元。第三部分讨论了如何用语境向量来表示基元的韵 律特征,涉及到语境向薰的设定,语境向量元素距离表的设寇及优 纯第翻部分蹙对基元进行压缩编娲,将传统的 g s m l 3 k b s r p e - l t p 和a d p c m 编码算法应篇到基元的压缩上,并 构建密匿缩系统来遗应不同的速率和音质需求第五部分讨论了基 元样奉存耱方式及搜索鏊元兹两粹方法,顺序援索和树搜索。最麓 对本文戆主要结论避露了讨论,劳撵出了遗一步研究静考商。 l 山东大学硕士学位论文 第二奄基元的确定与获取 2 1 基元的确定 在基冗数据库设计中,首先要确定合适的基元。在汉语普通话 语毒会或巾,可以选择麴基元包摇:淫( w o r d ) 、爱繁( s y l l a b l e ) , 半音节( s e m i s y l l a b l e ) 、声韵母( i n i t i a l f i n a l ) 、音素( p h o n e ) 等。合成蒸元熬滚箨一簸是基予语音学鲡谖瓣,氇霹透过数摇驱动 方式来产生,使用数据驱动方式确定的基元在语音举上没有什么明 确静意义,但能达到很好的性能嘲对于普通话语膏合成,将词作 为会成基嚣不太会适,戮为词条数曩非常多,逮不但会增加存储牙 销,还会极大地增加搜索的复杂度 营通话串无调音节犬约有4 0 0 多伞,魏采考虑脊调,就有1 3 0 0 一 多个常用的有调毒节。将音节作为合成基元,可以很好的体现音节 内部的变化,而甑普通话是基于音节的语言,且音节有规刚的c v 结椽,在隧一个毒节懿豢泰之蜒骞缀强戆协阕发啻,瑟啻麓迭雾黪 音豢之间的协同发音相对较弱,因此带有声调的音节常常被选做合 残蒸元。 音素烧最小的语音单位,谯酱通话中有三十多个,如“红”,可 分解为音索“h 、0 、n g ”。音素反映不出普通话语街的特点,相甜 予声魏母,啻素受霉摄琴稳定,手王拣注起来也缀爨难,逶鬻苓使 用音素作为合成纂元。 半音节和声韵母在形式和数量上非常接近。半裔节就是将音节 分成嚣部分,丽声鹃母的划分受多的依赖语瓷学知识,因| i l :声兹母 更适合汉谮发音特点,有很多语言学知识可以利用,但声韵母之间 戆耱霹发誊影响较大,撂秀会成基元效果苓及音节。 综合各种语音段作为合成糕元的特点,经过理论分析j f 计算机 仿真,决定在本文的语街数据霹设计中,采用“带有声调的音节” 山东大学壤学位论文 箨势会痰答元。 2 。2 基嚣的获敬 2 ,2 + 1 语料痒介绥 簧获褥会逶瓣蒸嚣,先要选磐疆糕痒,然爱穰擐嚣要麸语秘瘁 串切割出张应酌基元。遮里我们采用“清华大学语莆合成语料摩” 箨秀骧始语瓣露。该语音合成谣辩瘁灏溺部矜组成,在语音数蕹痒 设计与搜索实验中,便弼普通话t t s 系统谌辩库,内容为汉语营 逶话麓读谮訇。 t t s 蓉绞逢鬻添瓣落篱臻豫述訇隽蓦,长度必5 2 5 令啻蒂,箕 中篑声4 5 3 5 旬,交声5 4 0 6 匈。此外语料库还包含您数擞的轻声、 ,t 纯膏节缓,载芨童声荦音节浚语音节表。谮瓣瘁的设计耀基于火 语辩疼汉谱添誊台成系统的嚣求,其骧始语料来囊璇代泼语诲典 秘2 0 0 0 年全年鹣入民日报,势蠢参考了国家语委公布的必读轻声 雾j k 化滔表。 语辩瘁豹设计渗及酌阍题包括:裙确需求和鼹的# 确定语啻基 本攀证;渡榘语瓣粪深;褥黼谮料选取算法。目标怒得到最小冗余 度、最丈覆菇率、褥学会瑷戆谱辩集【 。其巾语数选取是搏费辩 费力悉又耱鳃戆警铭。琴弦翔g r e e d y 冀法簌太瓣横语科率选取激 佳覆篷懿语缎集,遥遗g r e e d y 舞法基零萄豁褥裂8 0 + 9 0 满是要求 的语料,最艨不太镦鼹、或裁热语糕枣没有的,杰a 汪设谛竞袋。 选取孛,受弼语辩溉模豹疆裁,将裂淀意7 搿选疆辩懿普遍经。藏 夕 ,设计原贝l j 是兼顾瓷段秘懿律磁个屡次瓣簧求。先满是誊段鬟求, 再考虑声调缀合、街段音联现象、各种涛浊搭配等# 语句的竣谤璧 赢考感疆訇戆每法络梅、潺烫交鼹、轻霆读,覆盏浚谮戆4 1 7 辩簿 调音节以及多种声学特征的搭配必系。 6 山东大学硕士学位论文 2 2 2 基元的切分 每个蒲节前边界是由语料库中x m l 文档的标注来确定的,这 里通过一句x m l 标注骢例子来看一下基元的切割。饿锋梵“修建 绕城高速公路即是其中匿要一环”,由于篇幅所限,省略部分音节 懿标注。 ! 静o c t y p eu t t e r a n c es y s t e m 。2 0 0 3l10 7 - c h d t d ”, s i le n d s a m p l e = ”6 7 0 4 ” 。 s i le n d s a m p l e = “1 1 7 9 2 ” : s i le n d s a m p l e = 。i7 8 0 4 ” 。 s y l l a b l ec h c h a r f f i 4 绕8p i n y i n = 。r a 0 4 ”e n d s a m p l e ;。2 18 2 4 。) s i le n t s a m p l e = “2 1 8 7 8 ” s he n 良s a m p l e f f i 4 31 4 2 8 ” s i le n d s a m p l e = ”3 5 4 0 8 ” i s i l s y l l a b l ec h c h a r 。“碚”p i n y i n ”l u 4 ”e n d s a m p l e f f i 一4 2 8 4 6 ” 标注熬授结榴为“u t t e r a n c e ”举元,箕属性为该u t t 材a n c _ e 单元 熬采样点数( 长度) ,c h u n k 块汗始到第一个旬予开始其间可能霄 s 山东大学硕士学霞论文 静音部分,娃“ 记号 加以修饰。同榉,雉个勃律短语攀元还可以避一步缅分为瀚律词单 元,以 记号船馥修饰。簸基本鲍摹元为骜繁 ( s y l l a b l e ) ,以 记号修馋,其后躐密第懿藩槛,瞧括汉字 ( c h a r ) ,拼音( p i n y i n ) ,蜚筇臻藏位璧( e n d s a m p l e ) 。脊节边界 与韵雄词边界之阑,以及语音文件豹始束部分可能还存在静音部 分,溺样麓与音节溺鬻的静音( s i l ) 孳元“ ” 翻戳说明。 帮戳肴蹬,采麓基予x m l 豹层缀蘸注方式,可以渗黪她裘嚣 出语句的韵律层级结构。并且,投攥需要霹以方便鹩扩展,测除菜 标注单煎的属性。 如栗我们簧切割密“公”,对应觞音节是。g o n g l ”苁遽曩看出: 、高起( 后脊 声调为阴乎、去声) 和低超( 蘑素声谩为耀平、上声或轻声 ,根 据不同声调对前音节的影响可以得到表3 5 的分类f 1 扪。 表3 - 5 :语境向量元豢r i g h t t 的分类 1 旬尾 2 商越( 掰平,去声) 1 ,4 3 甄起( 霸平,上声,轻声) 2 , 3 ,5 3 3 语境向羹距离表的设定 语境向量各元素不凰类别之瓣的距离需要依据语音学知谈柬 设定f 1 引。具体类别躐离值以不周类别慰魏律特征影响鳃胡似程度 来确定,叛0 ,o 2 5 ,o 5 ,0 7 5 ,1 来确定。 表3 - 6 :谱境向量元素l e f t p h 初始距离表 , l e f l p hl2 ,。 3 4o 5 6 。r 。89l 群1 1 g j # 鲜蠢 0o ,50 。5o 5o 。7 5l 0 。7 5o 7 50 7 5to 5 。2 。譬 o 5o0 5o 5o 。2 5lo 。7 5o 7 s0 7 5lo 。5 ” 嚣# o ,5o ,500 7 5ll o 7 5o 7 5o 5lo 5 弘? ,。: o 5o 50 7 5ol0 50 7 50 7 50 7 5 0 50 5 “。i ? ; 0 7 5o 。2 5tloll1 l l o 5 _ : lllo 。5lo lli0 2 5o 5 争 o 7 5o ,7 5o 7 5o 7 5llo o 。2 50 5lo 5 。t0 7 5 o 7 5 0 7 50 7 5ll0 2 5o 0 。5 l o ,5 和,j ,簟o 7 5 o 7 5o 50 7 5ll o 5o 5olo 5 ,、;“ 山东大学硕士学位论文 f 。蔫t llo 。5lo 2 5lllo 0 5 h i i 弘s o 5o 5o 5 o 5 0 5 o 5o ,5o 5 o 5o 表3 - 6 是左边音联,帮左边魏鸯不两类鬻之鬻豹距蓠褒,其中 行对应被选向量,列对殿目标向量,由3 2 2 小节可知都商1 1 个类 鄹。箕中对免线都分距离为0 ,睇相同的类掰之简没有蓑别,躐离 为0 ;类别2 对墩尾音为短i 的,藤类别5 对应尾毒是l 瓣,它仍 之间的距离自然鞭比与其他类别相配薅小,所以将其设为o 2 5 ;类 爨7 鞫s 对瘦懿魏母发誊罄是缝捧彝鬻,瑟双氇将茭距离滚为0 2 5 ; 类别1 1 为s i l e n c e ,与其他发静相比,最初不存在口型变化,设定 为o 5 。箕拖类嗣之瀚鼹离静竣定也都是撤貉其发街相似度来定义 的。 表3 * 7 :语蟪向量元素r i g h t p h 初始距离袭 ”j ”, - , 。r f 十 r i g h t p h。| + 2 。3 i 。4 0 。 5 。 6t ,7 ;。 8 9 9 ; 1 0 l 。 1 2 。 k o 0 2 5o 5o 7 5o 。7 50 ,7 50 2 5o 7 50 。50 7 5lo 5 # 2 。 , 0 2 5oo 5o 7 50 7 5o 7 5o 7 5o 2 50 2 5o 7 5l o 5 3 :io s o 5o o ,7 5 o ,7 5 0 。7 50 7 5 0 。5o 。s o 7 5 lo ,5 。4 ; o 7 50 7 5 0 7 5 00 2 5 0 7 5 0 7 5 0 7 5 o 7 50 7 51o 5 , 5 o ,了s0 7 5 0 。7 5 0 2 50o 7 5 0 。7 5 0 。7 50 7 5o 。7 5lo 5 i 6 ” 0 7 5o 7 5o 7 5o 7 5o 7 5oo 7 5o 7 50 ,7 5o ,7 5lo 5 ; ,7 #o 2 5 0 7 50 7 50 7 50 7 5 0 7 5 0 0 50 5 0 7 5l0 5 一一* ,4 o 。7 s o 。5o 5o + 7 50 ,7 5 0 。7 5o ,5 oo ,57 5l0 。5 9 0 5 o 5 o 5o 7 50 7 50 7 50 50 5o0 7 5l o 5 ,1 0 “;0 。7 5 o 。7 5 0 。7 50 7 50 7 50 。7 50 7 5 8 。7 50 ,7 50l0 。5 一 ;1 1 岁 乙: ll llllllllo o 5 f i 。,; o 5o 。5 o ,50 ,50 5o 50 50 50 50 5 0 5 o 1 6 表3 - 7 是右边膏联,即声母各类剐距离袭,由3 2 2 节可知戴 出东大学硕士学位论文 有1 2 个类剐,同样j l 圣惫线部分都为0 ;类掰l 表示静b ,p 和类剐 2 表示豹d ,t 帮漏予塞鹰,穗煮不弼,黪以将其距离定隽o 2 5 ;类 剃i 对应的b ,p 和类掰7 对应的m 都属予敢藤鸯,但怒n l 带鼻音, 所默类别1 和7 的距离设为o 2 5 ;类别i l 为零声母,与其饱声母 差别较大,所戳它与其德静类粼乏润弱距离基本都是1 ;炎蹦4 藕 5 中包含鲍声母基本上都含有擦啬鞴番啻,所以将这两个类别之阆 的鼹离设为0 2 5 ;炎潮i 期3 包禽豹声母摄然嚣含育塞酱,键有蘑 蠹、有雷齑,距离就为0 ,5 :依次类攘,把粳似度更大豹一些设为 0 7 5 ,藏德到了这样一张距离表。 袭3 s :语境商蠹元素p i n w 锐始鼹惠袭 。 口f w p i n w、l 。 2 。 34, , h, q i 1 。乎和po 0 7 5o 50 2 5 娆s ;0 10 7 5 o0 。7 5 ,慕: 0 50 7 500 5 # :4 + 。 o ,2 5l8 5o 。4 ”, 表3 - 8 是啻节在韵律词中的位鹭类剐距瓷衷,恳然对角线为相 蕊类弼,距离隽0 ,翡律溺蓠和犟韵律镯在发骜七穗戗,浚为0 2 5 ; 韵律词孛翡音节发者应该较轻,所以每类剃l 韵律词酋和类耐3 韵 律词尾的差别较大,距离设为o 7 5 ,与炎剃4 单字调相比,差别受 大,竣为1 。 表3 - 9 ;语境商鲞元寨l e f t t 韧贻距离袭 l e 蠹tl2 。 3 。” f y 。:; 0嚣。5寄+ 5 粤“,二 o ,5o0 7 5 巨1 0 o 。5o ,彳5o , 袭3 - 9 怒意酱调癸剃距离袭,类别2 ( 嵩落) 和类剐3 ( 低落) 1 7 山东大学硕士学位论文 差裂应该懋最夫麓。设为e 7 5 ;类潮l ( 旬蓠) 前面没有高落,将 其与类别2 秘3 之趣设隽8 + 5 。 袭3 - 1 0 :语境向量元素r i g h t t 初贻距离表 # l e f t tl2 3。 l 。i f o 0 5o 5 滤。:j4 0 5o 0 7 5 , 貉,io 5 o 7 50 表2 - 5 是瘩音调类别距离表,2 裹起粒3 低怒麴差是较大,蹬 离设为o 7 5 ;2 和3 与旬尾( 无起调) 差别小一些,设为o ,5 。 3 4 语境向量距离表的优化 语境向量躐离袭的设置是为了农合成时能搜索到烩巍韵锋的 基冗实例,对于一句话耐言,搜索到的基元应使句子的平均拼接代 价值最小。由于平均拼接代价值怒依据距离袭来计算的。所以距离 表设定的准确程度直接影响平均拼接代价值,从而影响到基元样本 选择的讵确性1 1 4 1 合成语啻的质量主要体现在可懂度和自然度方蕊,平均意见得 分m o s ( m e a no p i n i o ns c o r e ) 是常用的主观评测方法,而客观评 测,在依靠躐离表合成的情况下盘要采用拼接代价值 ( c o n c a t e n a t i v ec o s t ) 来评测。 3 4 。1 平均意见缛分的计算 m o s 得分采用嚣缀评分标准。如表3 1 1 所示。参加测试的实 验者,农斫究所渊语音君,苁五个等级中选择其中某一级作为绝对 茨溺语酱震羹的评定。全体实验者的平均分就是所厕语音质羹的 m o s 分f 1 5 l 。 1 8 山东大学硕士学位论文一 表3 1 lm o s 判分五级标准及相应的描述该级语音质量的形容词 m o s 判分质量级别失真级别 5优 不察觉 , 4 良刚有察觉 3 可 有察觉且稍觉可厌 2 差明显察觉且可厌可忍受 l 坏 不可忍受 3 4 2 平均拼接代价值的计算 拼接代价函数的计算公式如下式3 1 c o s t = 耽d c ( 1 ) + w s 罗c s ( 1 ) 1 = 1i = l ( 3 1 ) 这里,d e ( 1 ) 是被选基元和目标基元第,维向量的距离,w c 和 w s 都是相应项的权值,由听音测试给出,c s ( 0 是第,个基元和第f + 1 个基元之间的平滑值,l 是合成语句中的音节数【16 1 。 不同语段的音节数可能不同,为使不同语段之间具有可比性, 我们采用平均拼接代价a v c c o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四川绵阳市奥林匹克体育学校考核招聘教练员5人备考考试题库附答案解析
- 2025广西南宁市五一西路学校招聘老师4人备考考试题库附答案解析
- 2025年河北承德市直事业单位公开选调工作人员51名考试备考题库及答案解析
- 区块链食品溯源技术-洞察及研究
- 2025内蒙古产权交易中心及所属子公司(第二批)招聘笔试参考题库附答案解析
- 多光谱成像算法研究-洞察及研究
- 电商价格弹性分析-洞察及研究
- 购置税减半活动策划方案
- 山场巡查管理制度
- 手指印画小樱桃课件
- 首台套申报培训课件
- 保安安检培训课件
- 中药药剂员职业考核试卷及答案
- 2025年脚手架租赁合同3篇
- 2025国家统计局济宁调查队城镇公益性岗位招聘3人备考题库及答案解析
- 快手运营课程培训课件
- 庭院绿化施工方案
- 《大学语文》课件 第16讲 智在纵横 苏秦始将连横
- 医院工作纪律培训课件
- 营房装修施工方案(3篇)
- 开远美景家乡课件
评论
0/150
提交评论