




已阅读5页,还剩116页未读, 继续免费阅读
(计算机应用技术专业论文)基于二叉树结构的汉语韵律边界研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 语音合成的任务是将文字的输入自动转换成语音的输出。它在公共信息咨询 与发布、语音应答、电子邮件中的语音服务、文稿校对、自动口语翻译以及残疾 人语音辅助等许多方面有很广泛的应用前景。 可懂度和自然度是衡量语音合成质量的主要指标。合成高可懂度、高自然度 的语音,一直是语音合成所追求的目标。现阶段合成语音的可懂度已经达到了较 高的水平,但自然度还不够理想。主要问题是节奏感较差,缺少轻重缓急和抑扬 顿挫。因此,实现恰当的韵律切分,正确地把握话语的韵律结构,是加强合成语 音节奏感、提高其自然度的关键,具有重要的意义。 本论文的工作围绕韵律结构这一影响合成语音自然度的关键问题,从以下两 个方面展开: ( 1 ) 基于文本的韵律边界预测 ( a ) 基于二叉树结构的韵律边界预测模型 针对人工韵律标注大规模训练语料的困难和不足,本文首先对汉语书面语中 的标点符号和有声语言中的语音停顿进行了比较和分析;并在此基础上,提出利 用汉语文本中的标点符号位置模拟韵律结构的边界,并使用词和词之间出现标点 的可能性大小估计该位置作为韵律边界和出现语音停顿的概率。其次,根据句子 各个语法词边界作为韵律边界的概率估计值大小,并采用树结构生成算法,为句 子建立二叉树形结构;最后,依据二叉树结构并结合韵律学知识,分别提出了基 于二叉树结构的韵律词边界预测模型和韵律短语边界预测模型。 ( b ) 应用基于二叉树结构的路径裁剪策略的韵律词识别模型 在对树结构与韵律结构进行对比分析的过程中,本文发现:韵律词在树结构 中往往表现为一种完整子树的形式,且两者的一致性很高。利用这一特征,本文 提出了一种二叉树结构与最大熵模型相结合的韵律词识别方法。即在利用最大熵 模型进行韵律词识别的解码过程中,引入基于二叉树结构的路径裁剪策略,对搜 索空间中的候选路径进行裁剪。实验结果显示,这种裁剪策略不仅大大缩小了搜 索空间,提高了系统运行效率,更关键的是它使得模型的韵律词识别效果有了大 幅的提高。 ( 2 ) 基于语音的韵律边界识别 一 在语音合成和语音识别领域,韵律标注工作需要耗费大量的人力,减少手工 劳动对于语音合成中语料库的韵律标注以及语音识别中韵律单元的自动划分都 北京工业大学工学博士学位论文 有重要意义。针对这个问题,本文讨论了一种结合语音韵律特征、二叉树特征、 其它语言学特征,基于真实语音进行韵律短语间停顿自动检测和识别的方法。本 文分别利用分类回归树和最大熵两种方法建立了识别模型,并取得了较好的停顿 识别效果。 论文主要的创新性成果如下: ( 1 ) 提出了使用汉语书面语中的标点符号位置模拟韵律边界的思想和方 法。即使用句子内部各个语法词边界邻接标点符号的可能性大小估计该位置作为 韵律边界的概率。基于这一思想,能够避免人工标注大规模训练语料的困难。 ( 2 ) 提出了基于二叉树结构的汉语韵律边界预测模型。依据任意汉语句子 内部各个语法词边界作为韵律边界的概率估计值大小,将其表示成二叉树形结 构;利用二叉树结构并结合韵律学知识,实现韵律词和韵律短语边界的自动预测。 ( 3 ) 发现了韵律单元在二叉树结构中的表现形式。通过韵律结构与树结构 的对比,本文发现韵律词和韵律短语在其所在句子的二叉树结构中,往往表现为 一种完整的子树的形式;而且,其中韵律词和子树的一致性非常高。 ( 4 ) 提出了应用基于二叉树特征的路径裁剪策略的韵律词识别模型。利用 韵律词与完整子树之间的高同构性,依据二叉树结构对模型解码搜索空间中的候 选路径进行裁剪,然后使用最大熵模型求解最优路径作为识别结果,从而改进和 提高模型的韵律词识别性能。 关键词韵律边界;语音停顿;二叉树结构;标点符号 一一 a b s t r a c t a b s tr a c t t h ep u r p o s eo fs p e e c hs y n t h e s i si st oc o n v e r tt e x ti n p u ta u t o m a t i c a l l yi n t o s p e e c ho u t p u t s y n t h e t i ct e c h n o l o g yo fs p e e c hp r o v i d e se x t e n s i v ep r o s p e c t sf o r a p p l i c a t i o nt os u c hf i e l d sa sc o n s u l t a t i o na n di s s u a n c eo fp u b l i ci n f o r m a t i o n , s p e e c h r e s p o n s e , a n ds p e e c h s e r v i c ei n e - m a i l ,c o l l a t i o n o fm a n u s c r i p t , a u t o m a t i c i n t e r p r e t a t i o na n ds p e e c ha s s i s t a n c ef o r t h eh a n d i c a p p e d t w om a j o rf a c t o r st om e a s u r eq u a l i t yo fs y n t h e s i z e ds p e e c ha r ei t si n t e l l i g i b i l i t y a n dn a t u r a l n e s s t os y n t h e s i z es p e e c ho fh i g hu n d e r s t a n d a b i l i t ya n dn a t u r a l n e s sh a s a l w a y sb e e nt h ea i mo fs p e e c hs y n t h e s i s p r e s e n t l y , s y n t h e s i z e ds p e e c hh a sc o m eu p t oah i g hl e v e li ni t si n t e l l i g i b i l i t y , w h i l ei t sn a t u r a l n e s si sf a rf r o ms a t i s f a c t o r y t h e m a i np r o b l e mi si t sp o o rr h y t h m , l a c k i n gi nc a d e n c e t h e r e f o r e , t h ek e yt o s t r e n g t h e n i n gr h y t h ma n di m p r o v i n gn a t u r a l n e s so fs y n t h e s i z e ds p e e c hl i e s i n r e a l i z i n gc o r r e c tp r o s o d i cs e g m e n t a t i o na n dg r a s p i n gc o r r e c tp r o s o d i cs t r u c t u r eo f s p e e c h r e v o l v i n ga r o u n dp r o s o d i cs t r u c t u r e ,t h ek e yd e m e n tt o i n f l u e n c et h e n a t u r a l n e s so fs y n t h e s i z e ds p e e c h , t h ed i s s e r t a t i o nd e v e l o p sf r o mt h ef o l l o w i n gt w o a s p e c t s : ( 1 ) p r e d i c t i o no f p r o s o d i cb o u n d a r yo nt h eb a s i so f t e x t ( a ) p r e d i c t i o nm o d e lo f p r o s o d i cb o u n d a r yb a s e do nb i n a r yt r e es t r u c t u r e a i m i n ga td i f f i c u l t i e so fl a b e l i n gal a r g e - s c a l et r a i n i n gc o r p u sm a n u a l l y , t h e d i s s e r t a t i o nf i r s t c o m p a r e sa n da n a l y z e sp u n c t u a t i o nm a r k si nc h i n e s ew r i t t e n l a n g u a g ea n ds p e e c hp a u s e si ns p o k e nl a n g u a g e o nt h i sb a s i s ,i tp r o c e e d st or a i s et h e p o 硫t os i m u l a t eb o u n d a r i e so fp r o s o d i cs t r u c t u r eb yu s i n gp o s i t i o n so fp u n c t u a t i o n m a r k si nc h i n e s et e x t sa n dt oe s t i m a t et h ep r o b a b i l i t yo fi t sb e i n gp r o s o d i cb o u n d a r y a n dt h e r ea r i s i n gs p e e c hp a u s e sa c c o r d i n gt ot h ep o s s i b i l i t yo ft h e r ea p p e a r i n g p u n c t u a t i o nm a r k sb e t w e e nw o r d s n e x t , a c x o r d i n gt ot h ee s t i m a t e dp r o b a b i l i t yo f e a c hb o u n d a r yb e t w e e nw o r d sb e i n gp r o s o d i cb o u n d a r y ,b ya d o p t i n gt r e es t r u c t u r e g e n e r a t i n ga l g o r i t h m ,b i n a r yt r e es t r u c t u r ef o rc h i n e s es e n t e n c e si sb u i l t f i n a l l y , b a s e do nt h eb i n a r yt r e es t r u c t u r ea n dp r o s o d i ck n o w l e d g e ,t h ed i s s e r t a t i o np r e s e n t s r e s p e c t i v e l yp r e d i c t i o nm o d e lo fp r o s o d i cw o r db o u n d a r ya n dt h a to fp r o s o d i cp h r a s e b o u n d a r y ( b ) i d e n t i f i c a t i o nm o d e lo fp r o s o d i cw o r db yu s i n gp a t hp r u n i n gs t r a t e g yo n t h eb a s i so f b i n a r yt r e es t r u c t u r e d u r i n gt h ec o u r s eo fc o m p a r i n gt r e e s t r u c t u r ew i t hp r o s o d i cs t r u c t u r e , t h i s d i s s e r t a t i o nf i n d st h a tap r o s o d i cw o r dt e n d st oa s s u m et h ef o r mo fa ni n t a c ts u b t r e ei n t h et r e es t r u c t u r ea n dt l l e yh a v eg r e a tc o n s i s t e n c y b a s e do nt h i sc h a r a c t e r i s t i c ,i t i n t r o d u c e sam e t h o df o rp r o s o d i cw o r d si d e n t i f i c a t i o nb yc o m b i n i n gb i n a r yt r e e 北京工业大学工学博士学位论文 s t r u c t u r ew i lm a x i m u me n t r o p ym o d e l t h a ti st oc u ts p a r e dp a t h si nt h es e a r c h i n g s p a c eb yi n t r o d u c i n gap a t hp r u n i n gs t r a t e g yb a s e do nb i n a r yt r e es t r u c t u r ei nt h e c d t r s eo fd e c o d i n gp r o s o d i cw o r di d e n t i f i c a t i o nt h r o u g ht h em a x i m u me n t r o p ym o d e l a se x p e r i m e n t a lr e s u l t ss h o w ,t h ep r u n i n gs t r a t e g yn o to n l yr e d u c e ss e a r c h i n gs p a c e a n di m p r o v e so p e r a t i n ge f f i c i e n c yo ft h es y s t e m ,b u ta l s og r e a t l ye n h a n c e st h e m o d a l sp e r f o r m a n c ei np r o s o d i cw o r d si d e n t i f i c a t i o n ( 2 ) i d e n t i f i c a t i o no f p r o s o d i cb o u n d a r yo nt h eb a s i so fs p e e c h i nt h ed o m a i no fs p e e c hs y n t h e s i sa n ds p e e c hr e c o g n i t i o n , l a b e l i n gp r o s o d i c s t r u c t u r ec o n s u m e sal o tl a b o rp o w e r , t h e r e f o r e , t or e d u c em a n u a ll a b o ri sv e r y i m p o r t a n tt op r o s o d i cl a b e l i n go fc o r p u si ns p e e c hs y n t h e s i sa n da u t o m a t i cd i v i s i o no f p r o s o d i cc e l l si ns p e e c hi d e n t i f i c a t i o n c o r r e s p o n d i n g l y , t h i sd i s s e r t a t i o nd i s c u s s e sa l l a u t o m a t i cm e t h o dt oc h e c ka n di d e n t i f yp a u s e sb e t w e e np r o s o d i cp h r a s e si na c t u a l s p e e c hb yc o m b i n i n gp r o s o d i cc h a r a c t e r i s t i c s ,b i n a r yt r e ec h a r a c t e r i s t i c sa n do t h e r l i n g u i s t i cc h a r a c t e r i s t i c s b a s e dr e s p e c t i v e l yo nt h em e t h o do fc l a s s i f i c a t i o na n d r e g r e s s i o nt r e ea n dt h a to fm a x i m u me n t r o p y , t h ed i s s e r t a t i o nb u i l d sa l li d e n t i f i c a t i o n m o d e l ,w h i c ha c h i e v e sg o o dp a u s ei d e n t i f i c a t i o nr e s u l t s 1 1 1 ep r i m a r yi n n o v a t i v ea c h i e v e m e n t so ft h i sd i s s e r t a t i o na r e 勰f o l l o w s : ( 1 ) i tp u t sf o r w a r dt h ei d e ao fs i m u l a t i n gp r o s o d i cb o u n d a r yw i t ht h eh e l po f p o s i t i o n so fp u n c t u a t i o nm a r k si nc h i n e s ew r i t t e nl a n g u a g e t h a ti st oe s t i m a t et h e p r o b a b i l i t yo fi t sb e i n gp r o s o d i cb o u n d a r ya c c o r d i n gt ot h ep o s s i b i l i t yo ft h e r e a p p e a r i n gp u n c t u a t i o nm a r k sa te a c hw o r db o u n d a r y i nt h i sw a y , t h ed i f f i c u l t yo f l a b e l i n gl a r g e - s c a l et r a i n i n gc o r p u sm a n u a l l yc a nb ea v o i d e d ( 2 ) i tp r e s e n t sp r e d i c t i o nm o d e lo fp r o s o d i cb o u n d a r yb a s e do nb i n a r yt r e e s t r u c t u r e a c c o r d i n gt ot h ep r o b a b i l i t yo fe a c hw o r db o u n d a r yb e i n gp r o s o d i c b o u n d a r yi nar a n d o mc h i n e s es e n t e n c e , w ec a l lb u i l di t sb i n a r yt r e es t r u c t u r e w i t h t h eh e l po fb i n a r yt r e es t r i l c t l l r ea n dp r o s o d i ck n o w l e d g e , w ec a nr e a l i z ea u t o m a t i c p r e d i c t i o no fb o t hp r o s o d i cw o r db o u n d a r i e sa n dp r o s o d i cp h r a s eb o u n d 撕e so ft h e s e n t e n c e ( 3 ) i td i s c o v e r st h ee x p r e s s i o nf o r mo fp r o s o d i cc e l l si nb i n a r yt r e e 鼬r i i 舭 t h r o u g ht h ec o m p a r i s o no fp r o s o d i cs t r u c t u r ea n dt r e es t r u c t u r e ,t h ep a p e rd i s c o v e r s t h a tp r o s o d i cw o r d sa n dp r o s o d i cp h r a s e sa s s u m et h ef o r mo fi n t a c ts u b t r e e so ft h e w h o l es e n t e n c e i na d d i t i o n ,p r o s o d i cw o r d sa n ds u b t r e e sh a v eh i g hc o n s i s t e n c y ( 4 ) i tp r e s e n t si d e n t i f i c a t i o nm o d e lo fp r o s o d i cw o r db yu s i n gp a t hp r u n i n g s t r a t e g yb a s e do nb i n a r yt r e es 缸u c t l i r e b yu s i n gt h eh i g hc o n s i s t e n c yb e t w e e n p r o s o d i cw o r d sa n ds u b t r e e s ,w ec a nc u ts p a r e dp a t h si ns e a r c h i n gs p a c ei nt h e p r o c e s so fd e c o d i n gt h em o d e lo nt h eb a s i so fb i n a r yt r e es 仃u c l :u 】汜n e x t ,w ec a n p u r s u et h eb e s tp a t ha si d e n t i f i c a t i o nr e s u l tt h r o u g ht h em a x i m u me n t r o p ym o d e l ,t h u s i m p r o v i n gt h em o d e l sp e r f o r m a n c ei np r o s o d i cw o r d si d e n t i f i c a t i o n k e y w o r d sp r o s o d i cb o u n d a r y ;s p e e c hp a u s e ;b i n a r yt r e es t r u c t u r e ;p u n c t u a t i o nm a r k s 一一 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 关于论文使用授权的说明 加岔弓彩 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:晔导师签名:辁 日期:三堕:! :堑 第1 章绪论 1 1t t s 文语转换技术 第1 章绪论 1 i t s ( t e x t t o s p e e c h ) 即。从文本到语音打,这种将文字的输入自动转换成 语音输出的技术称为文语转换技术,也称为语音合成技术。它将计算机自己产生、 或者外部输入的文字信息,按照一定的规则进行语音处理,从而转换成语音信号 并输出。这种文语转换技术使得计算机具有了“说的能力。 语音合成技术是言语工程技术的一个重要组成部分,它不仅在人机通讯中充 当重要角色,而且对语音的产生和感知模型等基础研究也有十分重要的意义。言 语作为人类进化的最重要的标志,是人类社会千万年沿用下来的最常用的通信手 段,自然也应该是人机通信最理想的方式。让计算机象人一样“说话一,是人们 长期追求的目标之一。 为了使机器合成语音尽量接近自然语音,文语转换系统需要做两个层面上的 工作,即语言学处理和声学处理。一般又将前者分为语言学处理和韵律处理两个 部分。文语转换系统的各个组成部分见图1 - 1 n 】。 薮刊! 竺兰h 竺兰净l 竺兰b 霾 图卜l 文语转换系统的基本结构 f i g u r e1 - 1b a s i cs t r u c t u r eo f t r ss y s t e m 语言学处理:语言学处理在文语转换系统中起着重要的作用。它为后面 两部分处理提供依据。语言学处理要模拟人对自然语言的理解过程,使计算机能 够完全理解输入的文本,并给出后面两部分所需要的各种发音提示。如给出语气、 感情色彩、语义中心等信息,告诉系统什么地方该强调、什么地方该一带而过等。 韵律处理:合成语音自然度的高低在很大程度上取决于其韵律是否正确。 因此,韵律处理在文语转换系统中占有非常重要的地位。它为合成语音规划超音 段特征,如音高、音长和音强等,使合成语音能够正确表达语义,而且听起来自 然、悦耳。 声学处理:声学处理的功能是根据前两部分处理结果的要求输出语音, 即语音合成。这部分处理能力的高低是决定文语转换系统输出语音质量的基础。 上述3 个过程的处理能力,都会影响到最后合成语音的质量。其中,声学处 理部分是物理基础,也是最重要的;韵律处理是系统输出语音的自然度的必要保 证;而各项韵律处理规则又是建立在语言学处理基础之上的。 北京工业大学工学博士学位论文 语音合成技术涉及声学、语言学、数字信号处理技术、多媒体技术等多个领 域,是当今世界各国竞相研究的热门技术之一嘲。 在2 0 世纪6 0 年代,英文r - r s 系统首先被研制出来;而在2 0 世纪8 0 年代,我国 开始了中文t t s 领域的研究。中科院声学所首先开始了汉语合成的研究。之后, 社科院语言所、清华大学、中国科技大学、北方交通大学等单位陆续开展了对中 文t t s 的研究。同时,台湾交通大学、台湾大学和国际上的b e l l 实验室也研制了 汉语t t s 系统。 近年来,在国家“8 6 3 一计划,国家自然科学基金委,国家攻关计划,中国 科学院有关项目等的支持下,汉语文语转换技术有了长足的进步,文语转换系统 研究近年来取得了令人瞩目的进展。清华大学、中国科技大学、中国科学院声学 研究所等单位都在这一领域取得了很好的成绩,有些研究成果已经转化为产品得 到了实际的应用。例如:清华大学的s o n i c 系统,中国科技大学的d k 一8 6 3 汉语文 语转换系统,科大讯飞公司的k d2 0 0 0 汉语文语转换系统,北京捷通公司的嵌入 式t t s 汉语语音系统,杭州三汇公司的t t s 文本合成语音系统等。世界上的其它国 家也已经开发研制出了多语种的t t s 系统。例如:b e l l 实验室、a t r 和s i e m e n s 公 司等。法国c n e t 的多语种t t s 已经被应用于电话网中的公共话音服务。1 9 9 9 年, 在口语处理国际会议期间举行的语音合成系统评比中,参加评比的十几种语言的 几十个系统中,有5 个是汉语的1 i ,i s 系统。 t t s 技术在公共信息咨询与发布、语音应答、电子邮件中的语音服务、文稿 校对、自动口语翻译以及残疾人语音辅助等许多方面有很广泛的应用前景。目前, 计算机语音合成技术正在越来越广泛地被应用到各行各业。可以预料,随着t t s 技术的进步和t t s 与其它各种新技术的互相结合,语音合成技术必将在更为广泛 的范围内得到推广和应用。 一般来讲,衡量语音合成质量的指标主要有以下两个: 可懂度:指语音中音节以上的语言单位( 如字、词、句等) 的可懂程度, 即计算机所合成输出的语音要让人听得懂。 自然度:即要求计算机自动合成的语音尽可能模拟人的自然发音,发音 流畅、自然,听起来舒服。 可懂度是合成语音能否被使用的关键所在;而自然度是合成语音能否被大家 广泛接受的关键所在,两者都不可或缺。合成高可懂度、高自然度的语音,一直 是语音合成所追求的目标。 经过几十年的研究,现阶段合成语音的可懂度已经达到了较高的水平;然而, 同国外其它语种的t t s 系统一样,计算机自动合成的句子以及篇章的语音机器味 较浓,其自然度还不够高,还不能达到用户可以广泛接受的程度,输出语音的质 量与实际应用的要求还有一段距离呻1 。机器合成语音在自然度上的缺陷阻碍了该 技术大规模进入市场的步伐。 因此,提高语音合成的自然度,使之达到更加流利、自然的程度,从而更好 地体现语言的节奏感,具有非常重要的意义。 1 2 韵律及停顿在语言表达中的重要地位 众所周知,词、短语、句子、段落是语言表达的基本组成部分。但是,仅仅 依靠这4 个元素并不能很好地表达人们的想法。事实上,在人们用语言进行交流 时,相互传递的不仅仅是语言文字的语音,一个很重要的信息就是语言表达的韵 律信息,例如说话的语速、短语或句子之间的停顿,词语或者短语中的重音等等。 韵律信息常被人称之为超音级信息,它在语言表达的自然度和可懂度方面扮演了 非常重要的角色。 韵律信息将长旬以韵律短语的形式分割为若干个较短的、更加便于人们理解 或者机器处理的小单元,并在各个单元的边界处插入长短不同的停顿。语音停顿 的产生主要受到以下几个因素的影响哺1 : ( 1 ) 是受到人们发音的生理约束的必然结果:说话人需要利用停顿时间来 换气以平衡肺部气压,这既是生理上的需要,同时也是保证正常发音的前提。 ( 2 ) 言语组织的要求:一方面,语音停顿在一定程度上体现着韵律单元之 间的组织关系,适当的语音停顿是保证韵律和谐的前提;另一方面,语音停顿在 一定程度上体现着语义单元间的松紧关系。说话者通过停顿,将线性出现的语流 进行划分和组合,使语义更清晰、更准确。适当的语音停顿是保证语言能够被有 效地理解的前提,为消除句法歧义提供了重要的信息。同时,也给听话者领略和 思考、理解和接受的余地,以便更加准确透彻地把握言语信息。 史坦尼斯拉夫斯基曾说:“离开话语,语调和停顿本身仍然具有影响听众情 绪的力量。一( 朗诵的艺术9 3 页,前苏联符阿克肖诺夫著,广播出版社,1 9 8 4 年2 月第一版) 由此可见,韵律和停顿在言语交际中发挥着重要的作用。停顿可以 直接体现说话者的言语目的,而言语目的则制约着停顿的确定和表达。出于不同 的言语目的,采用不同的停顿方式,就会产生不同的表达效果。语句停顿的准确 确定和表达是对整个语言片段的准确理解、感受的产物。否则,会使语句目的和 语义的正确表达出现偏差。在有声语言表达中,停顿具有多种作用,具体表现在 以下几个方面悖1 : 停顿可以消除歧义 说话者通过停顿,对以线性结构出现的语流按语义进行创造性的划分和组 合,使处于并列语言环境中的一个得以突出,从而使语义更清晰、更准确,不出 现歧义和误解。 一3 一 北京工业大学t 学博七学位论文 例如:“她看见姐姐很害怕。弦 “她看见姐姐很害怕。一 究竟是她害怕,还是姐姐害怕? 在文本处理中,需要根据上下文来消除句子 歧义;而在语音处理中,人们可以依靠听觉直接感受语音停顿,从而正确地理解 句子。停顿位置的不同,有效地将两种不同语境突显出来,准确地区分了两种不 同的语义,消除了歧义。 停顿可以强调语义和情感 停顿可以分为语法停顿和逻辑停顿两种。语法停顿是反映一句话里面的语法 关系的,以标点符号为主要标志;逻辑停顿是为了强调某一事物,突出某个语义 或某种感情,而在书面上没有标点、在生理上也可以不作停顿的地方作了停顿, 或者在书面上有标点的地方作了较大的停顿。相比而言,逻辑停顿更有利于强调 语义重点,强化情感表达。 例如:“点心有十样,菜有十碗,音乐有十番,阎罗有十殿,药有十 全大补修( 鲁迅再论雷锋塔的倒掉) 例旬中“点心一、“菜 、“音乐 、“阎罗、“药 等都在短句中作主 语,从语法的角度可停可不停的,但考虑到要针对“十景病突出这一组排比旬 中所一一列举的事物,就应该在“点心 等词的后面停顿,以加强讽刺的力量。 停顿可以提醒注意、调动思维 在言语过程中,说话者为了提醒听话者的注意、调动听话者的思维,会有意 识地进行停顿。这种短暂的沉默,使说话者所传达的言语信息最大限度地进入听 话者的耳朵,并留下深刻的印象。日本学者原一平说过:在“停顿 那一种沉寂 中,你确确实实地接近了对方,迫使对象对问题进行决断。事实上确实如此,恰 当的停顿会使听众安静下来进行思索。 停顿可以强化节奏 停顿是言语的需要,反映出语言中词句的组合关系、语法的组织关系、语义 间的逻辑关系及思想和心理变化的进程等因素,体现了言语特有的节奏和韵律。 适当的停顿,可以强化语言节奏,增强言语表达效果。苏奥夫相尼柯夫拉姆内 依认为,“说话的艺术表现力和音乐性取决于节奏的特点节奏在这里表现为 把停顿最大限度地划分出来一( 简明美学词典,知识出版社) 。 停顿可以使表达含蓄委婉 在汉语表达的系统中,停顿的恰当运用可以使受众感受到“耐人寻思、韵昧 悠长 的风格体验。 综上所述,语音停顿体现了言语特有的节奏和韵律。适当的停顿,可以强化 语言节奏,增强言语表达效果。正确标记韵律短语间的停顿,是合成自然、流畅 的输出语音的重要前提和保证。 一4 一 第1 章绪论 韵律及停顿在语言表达中具有重要的地位。韵律单元的切分不同,会导致话 语的韵律结构不同;话语的韵律结构不同,其意思也就跟着不同n 们。而在实际交 际过程中,具体的话语一般只实现为一种韵律结构,听话人也能够正确地理解说 话人的意思而不会产生误解,韵律结构帮助消除了歧义。因此认识话语的韵律结 构,是话语表述和话语理解的基础,也是实现人机对话和人工智能的前提。 韵律切分问题本质上是个话语韵律层次结构问题m 1 。这些年来,在语音合成 和语音理解等领域,对韵律信息的研究引起了极为广泛的关注。当前,有关这个 问题的研究已经成为语音学界和言语工程学界普遍关注的焦点。 目前,计算机自动合成的语音自然度不理想。具体地说,就是节奏感较差, 缺少轻重缓急和抑扬顿挫,还不能为公众所接受。因此,提高自然度是目前t t s 合成的主要任务。而恰当的韵律切分,正确地把握话语的韵律结构,是加强合成 语音节奏感、提高其自然度的关键。 , 韵律信息在语言表达的自然度和可懂度方面扮演了非常重要的角色。研究汉 语韵律层级结构边界以及语音停顿的预测和识别问题,具有重要的意义和作用。 1 3 韵律结构相关研究及现状 1 3 1 韵律层级结构划分 韵律单元的划分问题一直是学者们争论的热点问题。虽然众多研究者们一致 认为从韵律现象来看,存在独立的韵律层级结构,但是在层级如何划分问题上, 各家的说法不尽一致,所用的术语也不统一,并没有一个统一、具体的标准。 国外研究韵律的学者大多认为韵律结构有3 4 级单位,也有的学者提出多达 6 7 级单位。 s e l k i r k n 2 1 提出韵律结构从低到高包括音节( s y l l a b e l ) 、音步( f o o t ) 、韵律 词( p r o s o d i cw o r d ) 、韵律短语( p r o s o d i cp h r a s e ) 、和语调短语( i n t o n a t i o n p h r a s e ) 这样几级单位,并对其进行了说明。认为:音步通常小于词,在节律音 系中起着重要的作用。它体现了音节轻重的分布,通常不是音系规则的辖域;韵 律词的大小和词相当,携带一个“主要词重音( m a i nw o r ds t r e s s ) ,在节律格栅 ( m e t r i c a lg r i d ) 中没有“静音栅 ( s i l e n tg r i d ) ;韵律短语可以只包含一个词, 也可以包含多个词,是一种节奏单元;语调短语的特点是有一个完整的语调曲线, 一个句子可以包含多个语调短语。语调短语是一个信息结构( i n f o r m a t i o n s t r u c t u r e ) 单元,它可以是动词及其论元成分构成的“意义单元一( s e n s eu n i t ) , 常常对应一个句法上的小句。 n e s p o ra n dv o g e l n 蚰提出韵律结构从低到高包括音节、音步、韵律词、附加 一5 一 北京工业大学工学博士学位论文 组( c l i t i cg r o u p ) 、音系短语( 韵律短语) 和语调短语这样几级单位。她的研究是 现代韵律结构的基础,在国内外具有重要的影响。 p i e r r e h u m b e r ta n db e c k m a n u 鄹提出有重音短语( a c c e n t u a lp h r a s e ) 、中间 短语( i n t e r m e d i a t ep h r a s e ) 和语调短语3 级韵律结构。 近年来,国内的不少学者也对汉语的韵律结构进行了研究。 李爱军n 屯珥伽认为汉语的韵律结构和英语等其他语言一样具有层级结构,韵 律单元从小到大依次为:音步、韵律词、次要韵律短语( m i n o rp h r a s e ) 、主要韵 律短语( m a j o rp h r a s e ) 、和语调组( t o n eu n i t ) 。她认为:音步是语流中趋于等 长的节拍单位,普通话以双音节音步为主,其次是单音节和三音节,韵律词可以 对应一个超音步( s u p r a f o o t ) ,由一个音步和其相邻音步组成,特别是一些未组 合的单音节;韵律词是有一个词重音的变调组,韵律短语由一个或几个韵律词组 成,如果短语后感知到的停顿较短,它与后面一个短语的连接比较紧密,则将此 短语标为次要韵律短语;如果短语后感知到的停顿较长,它与后面一个短语的连 接比较松散,而且有基频重设等现象,则将此短语标为主要韵律短语。若干个基 频曲线依次递降的主要短语组成语调组。 曹剑芬n 认为连续话语可以切分出韵律词、韵律短语和语调短语三级韵律单 位。她认为,韵律词是:三音节以下的语法词或词组:其它凡是属于一个音步的 结构;跨度为1 3 个音节,极大多数为2 3 个音节,少数为单音节;具有类似语 法词的连调模式和词重音模式。韵律短语是:由一个或几个韵律词组成,即“可 能多音步 ;跨度为7 2 个音节;内部各个韵律词间可能出现韵律上的节奏分界, 主要表现为韵律词末尾音节的延长( 或伴有较短的无声停顿) 和韵律词之间的 音高( 包括音阈和音域) 重新设置;具有相对稳定的短语调模式,即音阶的d e c l i n a t i o n 及其r e s e t t i n g ;具有相对稳定的短语重音配置模式,即与句法结构相关 的常规重音模式。 冯胜利n 观提出了一门新的语言学分支韵律构词学,将韵律词定义为“一 个最小的语流片断单位,并将韵律层级分为:韵素( m o r a ) 、音节、音步和韵律 词。在此基础上,他根据观察进一步得出了汉语自然音步构成的6 条基本规则。 同时,他指出:这些规则只是音步的自然属性,并不意味着音步不受句法、词汇 跟语义等因素的限制,在日常口语中也会出现一些违反这些规则的“非自然音步, 这也是很正常的。 林茂灿啪川认为语句包含韵律词和韵律短语,并指出普通话语句中有两种人 们可以感知到的间断:无声间断和有声间断。韵律短语有大小之分,韵律大短语 主要由大的无声停顿和边界前音节时长拉长引起,韵律小短语主要由小的有声停 顿和( 或) 无声停顿引起。韵律词有简单韵律词、复杂韵律词和复合韵律词3 种类 型。简单韵律词指双音节和三音节的词汇词,以及强调念的单音节词( 如副词、 介词等) ;复杂韵律词由两个以上词汇词组成,简单韵律词和复杂韵律词可以称 一6 一 第l 荦绪论 为“f 0 变化组 ;复合韵律词则多数是由两个以上的简单韵律词和( 或) 复杂韵律 词组成。 在不同的层级结构定义中眈u j 引4 加翻,比较公认的一种可将韵律结构分为音 节、音步、韵律词、韵律短语和语调短语,如图卜2 所示。 图卜2 韵律层级结构 f i g u r ei - 2p r o s o d i ch i e r a r c h i c a ls t r u c t m 音节:对汉
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中级银行从业资格之中级银行业法律法规与综合能力通关模拟卷及答案详解【名师系列】
- 辽宁省大连市滨城高中联盟2024-2025高一下学期5月份期中考试地理试卷(解析版)
- 江西省萍乡市2024-2025学年高一下学期期中考试地理试卷(解析版)
- 自考专业(建筑工程)模拟题库附答案详解【A卷】
- 重难点解析京改版数学8年级上册期中测试卷【综合卷】附答案详解
- 2025东营市东凯中学招聘劳务派遣教师(25人)考试备考试题及答案解析
- 2025广东清远市阳山县审计局招聘政府购买服务人员1人备考题库及答案解析
- (2025年标准)教师签协议书
- 2025北京市文学艺术界联合会所属事业单位第二次招聘2人笔试备考试题及答案解析
- 2025广东江门市开平市苍城镇兴业投资服务中心招聘1人备考试题及答案解析
- 医院免疫检验报告(性激素6项)
- 消失模白区岗位操作规程
- 初高中语文语法知识衔接课-短语句子
- 再生障碍性贫血诊疗和治疗我国专家共识
- 表单-公司董监高、股东、核心技术人员调查表(上市或尽调使用)
- 杭汽12MW背压机组运行规程
- 小学综合教研组的工作计划PPT模板下载
- GB/T 7588.1-2020电梯制造与安装安全规范第1部分:乘客电梯和载货电梯
- GB/T 3406-2010石油甲苯
- GB/T 152.2-2014紧固件沉头螺钉用沉孔
- 幼儿园中班绘本:《我喜欢我的小毯子》
评论
0/150
提交评论