




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教学系统中的语音技术 天津师范大学 教学系统中的语音技术 摘要 教学离不开教师和学生的交互,语音交互则是最符合人类自然习惯的一种通 信交互方式。语音交互以语音合成和语音识别为基础。语音合成是将文本文件转 换成语音信息。语音识别是将音频信息转换成文本或者其它形式的计算机能够处 理的信息。 智能教学系统离不开语法分析、语义分析、语音合成、语音识别技术。语法、 语义分析为教学系统的基础,对语言的理解是第一步。汉语有其自身特点,分析 和理解起来有一定的难度。 本文通过对词汇的切分、语义的分析,取得了理解层面上的信息,实现在某 个特有的专业领域内全部词汇、语言的分析和理解,为开发特有专业领域的智能 语音交互系统成为可能。 本文以因果联系的辩证思想为指导,实现了智能推导、语义及语境预测,增 强了系统的智能预判能力,为提高语音识别的准确率做好了语法规则上的准备。 语音合成和语音识别是实现手段,有了准确的语义、语用理解,在此基础上 就可以凭借合成和识别技术来实现我们的语音交互系统了。 本文结合m i c r o s o ns a p l 5 ,l 语音开发包进行本系统的语音开发,在语音合 成的韵律自然度方面使用l 语言进行标识优化,合成效果有了明显的改善, 再加上智能的语句生成,口语化的语句替换,使得机器说话更接近于自然人。 本文在语音识别方面,根据智能的分析得到语义、语用信息,以及在不同的 语境中的范围。根据交互进程动态的生成下一步的用于识别的语法规则,此规则 包含了动态的智能分析及推理( 因果联系的辩证思想) 结果,进一步合理的缩小 了识别的语句范围,使得识别的准确率大大提高。 本文还提出在s a p i 中使用x m l 标识语言有些需要注意的地方,如标签的 嵌套使用问题、某些标签的使用方法及注意事项。 关键词;分词,语法分析,语义分析。语音合成,语音识别,x m l ,s a p l 5 1 教学系统中的语音技术 天津师范大学 s p e e c ht e c h n o l o g y i ne d u c a t e ds y s t e m a b s t r a c t e d u c a t i o nb a s e d0 nm ec o m m u n i c a t i o nb e t w e e nt e a c h e ra i i ds t u d e n t s p e e c hi s t h en a t u m l i s tw a y o n e i n t e l l i g e n c ee d u c a t i o ns y s t e mb a s e do ns p e e c ha n a l y s e s 、t e x t - t o - s p e e c h 、 s p e e c hr e c o g n i t i o nt e c h i l o l o g y ,i n c l u d i n gs y s t e ms m i c t u r ea i l dh o w t op r o d u c ei t h a v ec a r r i e do n 也ed e t a i l e dd i s e u s s i o nt oe s s e n t i a lt e c h n 0 1 0 9 y 赫dt h ep r i n c i p l e t8 n d p r o p o s e dm ei m p r o v e m e n ta n dm e 蚰g g e s t i o no nm es p e e c ht e a c h i n gs y s t e m g r a m m a ra n ds e m a n t i c 蚰a l y s i sa r en l ef 乱m d a t i o n ;u n d e 撑【a i l d i i l gi sm ef i r 贰s t e p c h i n e s e h a si t so w nc h a r a c t e r i s l i c ,nt l a sc e n a i nd i m c u l t yi i l 锄1 y z c s 锄du n d e r s t o o d t h r o u g hw o r dc u t s 蛆d 缱r r i a n t i ca 呻l y 3 i s 。t i l i sa r t i c l e1 l a so b t a 嘲i nm eu n d e r s t a n d i n g i n f b r m a t i o n s oi ti sp o s s i b i et od e v e l o pa ni n t e l l i g e n ts p e e c hs y g t e mi n 叩峙c i a l i 聆dd o m a i n , m o r c o v c r ,恤i sa r c i c i er c s t so nt l er e 酷o n i l l gp r i i l c i p l et om a :k e m 诧r c n t i a lm a s o n m gm o r e i n t e l l i g e n t f o r e c 砧ts e m 锄t i c s 粕dl i n g i l i s t i ce n v i r o 懈e m ,i m p r o v e dt l l ei n t e l l g e n c eo ff o r e c a s t a l la b o v ei m p r o v e dr e c o g n i t i o ng m m m a r 九l l ef o r 朋 l a n c i n gt l l ef a t eo fs p e e c hr e c o g n i t i o n a c c l 】r 8 c y t e x t t o - s p c h 飘d 血es p e e c hr e c o g n i t i o ni st i l ei n e t h o d i fw el l a dt l ea c c u n t es e m a n t i c s , w ec a nr e a l i z eo l l rs p e e c hs y s t 嘲岫g h t e x t - t b s p c b 柏ds p e e c hr e c o g n i t i o n t h i sa n i c l eu s e s 舡,l 锄g i l a g ei nt e ) ( t - 1 b - s p e e c hr h y n l | i it oo p 虹m i z e 山er e s u i t t l r o u g hc r e a l i n g 吐l ex m lg m m m a rn n e 曲n a m i c a l l y w e 证l p r o v e 吐地f e c o g n n i o n 弧s m a l l a r e a b yr e s t so nn l er s o n i n gp r i n c i p l ew ec 柚锄a l y s c st h ea 陀ao fs e m a n t i ca n du s i n gi n d i f f e 豫mp o s i d o n t h i sa r t i c l ec r e a t c sm er e c o g r i i t i 帆g f 锄m a rm l eo fn e x ts t 印b yd ”a n l i c a l t e m a t e b yi n c l u d et h ei i l t e l l i g c n ta n a l y s e sa n df b r e c 嬲t ,t l l i sr e c o g n i t i o ng r a m m a r m l er e d u c e dt l l er e c 唱n i t ms c o p em o r er e 觞o n a b l e s om er a t eo fr c c o g n i t i o ne n h a n c e s g r e a t l y t h i sa n i c l er e m i n d ss o m et h i n gt op a ya t t e n t i o nj nu s i n gx m li ns a p i f o r e x a m p l e ,l a b e ln e s t i l l gu s e h o wt ou s ec e r t a i nl a b e l sa n dm a h e r sn e e d i n ga t t e n t i o n k e yw o r d s :w o r d sc u t ,g r a m m a ra n a i y s i s ,s e m 8 n t i ca n a l y s i s ,t e x t t 0 - s p e e c h ,s p e e c h r e c o g n i t i o n ,x m l ,s a p l 5 1 4 教学系统中的语音技术 天津师范大学 极具价值的研究成果。 最后,有必要介绍的是美国国防部发起的一个大规模的研究计划一一 d a 狐计划旨在提高用于完成数据库管理任务的l o o o 词范围内的连续语音识 别的识别率。美国有不少著名的大学和研究机构都参与了此计划,并做出了卓越 的贡献,如开发了大词汇量、非特定人、连续语音识别系统一s p h i n x 的c a m e g i e m e l l o n 大学开发了连续语音识别系统b y b l o s 的b b n 公司,还有m l ,t 的 l i n c o l n 实验室,s r i 研究院,b e l l 实验室等。由于有了d a 彤 a 计划,在八十年 代的这十年中大词汇最的连续语音识别系统有了长足的进展。 近年来,语音识别系统的研究己经开拓到新的领域,那就是口语语言系统。 它集语音识别技术、自然语言处理和人机交互技术于一体,能够识别说话人所说 的字,解释字序列,并根据实际应用给出其意义,给用户以正确的反馈。它的潜 在应用领域从简单的信息检索( 交通状况、航班信息) ,到复杂的交互式任务计划 和推理( 交通路线、旅游计划) ,直至能够支持多语言和多媒体界面,其目的是使 人类在不经过特别训练的情况下,以最自然、最常用的交流方式与计算机对话, 并能适用于新用户群。目前,m i c r o s o f i ,m m ,d r a g o n ,p h i l i p s 等公司都己提供 其产品,a t b e l l 实验室的系统能通过电话接收用户的即席讲话,甚至通过电 话接听e m a i l ,而m l 丁实验室近几十年来都在研究这类对话系统,现在可阻通 过电话或i n t e m e t 对其进行访问查询,它几乎能实时回答英语、西班牙语和汉语 的提问,就像两个人对话一样快。 1 _ 3 自然语言处理与自动分词 自然语言处理是人工智能领域的一个重要分支,它主要研究计算机对输入的 句子、篇章的分析、理解和生成,旨在建立人与计算机之间友好的交流通道,实 现更高层次的信息交互。自然语言人机接口、专家系统、自动文摘、自动分类、 自动标引、信息检索、机器翻译等,都是自然语言处理在实践中颇有价值的应用 实例。自然语言处理过程主要包括这样几个基本的步骤:词法分析、句法分析以 及语义和语用分析等,如下: 教学系统中的语音技术 天津师范大学 词法分析:从输入的字符串序列分解出单词并确定词性。 句法分析:对输入的单词序列进行分析,根据语法知识库,合法的句子结构。 语义和语用分析:广义上是指对各级语言单位( 词、词组、句子、旬群1 所包 含的意义和在语言使用过程中所产生的意义进行分析。 对于输入计算机的自然语言字符串序列,计算机通过词法分析、句法分析、 语义分析等对语言信息进行预处理,将分析的结果映射为机器内部可以识别与处 理的表示形式,并可对该内部表示进行推理,重新转化为自然语言表达的字符串 序列输出,最终实现对自然语言的理解。显然,如何进行自然语言自身的语言信 息的识别与处理,首先取决于对构成句子的字词的分析,因为词是“最小的独立 运用的语言单位”,因此自动分词是自然语言处理最初的、最基本的、无法回避 的一个技术环节,同时也是人们研究的一个热点问题,目前己有的分词方法己不 下数十种。自动分词技术将组成语句的核心词提炼出来供句法、语义分析模块使 用。 1 4 本论文所做的工作 ( 1 ) 自然语言分析及理解。应用了汉语自动分词技术、分句技术、语义分 析,介绍了格语法等几种主流汉语分析方法,并根据格语法汉语分析方法对交互 中的内容进行分析,并据此构成新语句。 ( 2 ) 在智能分析后所确定的特定语义、语用环境下,根据智能分析和预判 的结果,生成用于控制的小词汇贯语音识别的上下文相关语法规则文件,缩小了 词句识别范围,提高了语音识别的准确率。 ( 3 ) 在智能分析后所确定的特定语义、语用环境下,根据智能分析和预判 的结果,自动生成韵律优化的语音合成语句,提高了语音合成的自然流畅度。 ( 4 ) 本论文贯穿始终的结合了x m l 语言,并依据此语言结合m i c r o s o r s a p l 5 实现了一个简单的语音交互系统,且提出了一些在语音交互方面使用 x m l 语言的经验和建议。 o 教学系统中的语音技术天津师范丈学 第三章词法分析 在书面汉语中,字与字、词与词是连写的,词在句中没有显式的标记。因此, 理解汉语的首要任务就是把连续的汉字串分割成词的序列。计算机内部存储的中 文信息一一汉字,如中文书面语一样,也是连续书写的,词与词之间也没有任何 区分标志,为了能够在词这一平面上进行自然语言处理,就必须把汉字字串序列 按词切分开,使一个没有间隔标志的汉字字串序列转化为词串序列,这就是自动 分词。 自动分词技术是针对现代汉语字序列文本,按照一定的规范自动分解为词序 列文本的技术。 中文分词技术的滞后是当前中文信息自动化处理技术发展的瓶颈。词是能独 立活动的有意义的最小语言单位。分词是中文信息处理从字符处理水平向语义处 理水平的关键,是中文智能计算技术的基础。 目前中文分词技术主要是借用一个词库,按词库收录的词来进行分词单位的 确定。 自从中文信息处理领域提出自动分词以来,发表的自动分词方法很多。各种 分词方法虽然名称各异,分词速度也不相同,但本质上可将它们归为两类:一类 是基于统计的机械分词方法,即机械分词+ 歧义校正+ 人工干预:另一类是知识 分词,即知识分词+ 人工干预。 机械分词方法的思路是先查字典进行匹配,然后再适当利用部分词法规则进 行歧义校正。机械分词法加歧义校正属于机械分词法的一种改进,它主要利用词 法规则对歧义进行校正,以提高切分精度,事实证明这种改进是有效的,而且这 种改进最终导致了知识分词方法的出现。 知识分词与机械分词的根本区别在予它不仅仅只通过词典匹配,而且还要利 用词法、句法、语义、语用等方面的知识参与分析。知识分词不仅利用知识的范 围更广,而且还秘用人工智能技术进行推理,并将分词与歧义校正合为同一过程, 不再像机械分词加歧义校正那样先分词再校正。此外,知识分词中的分词程度和 知识库的设计具有更高的独立性,有利于知识库的维护。 教学系统中的语音技术 天津师范大学 3 1 汉语自动分词技术的难点和重点 一、词的界定 汉语分词的首要困难是词的概念不清楚。书面汉语是字的序列,词之间没有 间隔标记,使得词的界定缺乏自然标准。词是什么:词的抽象定义;什么是词: 词的具体界定。汉语中“词”的定义一直是汉语语言学界争论的焦点,困难在于 一方面怎么区分单字词和语素,另一方面怎么区分词和短语( 词组) 。因而迄今还 未能拿出一个公认的、具有权威性的词库来。从应用的角度来说,不同的应用目 标,对分词单位、词条颗粒度等有不同的需求,甚至还有不同的认识。 汉语的语素和单字词,合成词和短语之间没有清晰的界限。语言学界虽然对 于词在概念上有一个十分清晰的定义。即暂拟汉语教学语法系统中的定义: “词是最小的独立运用的语言单位”。但从一些词典的编撰中,我们仍然可看出 一些界限难以区分的问题。比如:“听见”、“看见”在很多词典中都有收录,但 是具有类似结构的“闻见”却没有收录。在建立分词系统词库时,对于收词的标 准仍然难以把握,例如:“鸡蛋”是词,那么“鸭蛋、鹅蛋”是否也作为词收入 词库? 至今为止,分词系统仍然没有一个统一的具有权威性的分词词库作为分词 依据,这不能不说是分词系统所面临的首要问题。除了分词词库,还有一个概念 值得我们注意,即“分词单位”。从计算机进行分词的过程来看,其输出的词串 我们称之为“切分单位”或“分词单位”。信息处理用现代汉语分词规范中对 于“分词单位”也有一个定义:“汉语信息处理使用的、具有确定的语义或语法 功能的基本单位。包括本规范的规则限定的词和词组”。由此可见,自然语言分 析中分词单位的定义比传统意义上的词更宽泛些,这也就避开了理论上对于词的 界定难以把握的困扰。分词系统可以面向解决实际闯题的需求和真实语料中使用 的频繁程度来规定“分词单位”。 作为中文信息处理中“分词单位”的划分只要是不违背人们使用的习惯,能 在语言中出现,不是凭空臆造的结构就可以了。在分词中,分词单位要充分考虑 形式与意义的统一。形式上要看一个结构体的组成成分能否单用,结构体能否扩 张,组成成分的结构关系以及结构体的音节结构;意义上要看结构体的整体意义 是否具有组合性。所以,分词既要符合语言学的一般原则,也要便于词类和句法 分析,不能分得过细,也不能分得过粗。所以分词单位或者具有确定的语义和语 4 教学系统中的语音技术 天津师范大学 法意义,或者语义比较模糊,但却具有确定的语法意义。 二、歧义的处理 汉语自动分词问题中歧义字段切分是影响自动分词系统切分精度的重要因 素,它是自动分词系统设计中的一个最困难也是最核心的问题。自动分词的困难 不在于基于词库的字符串匹配算法,而是在匹配过程中词与词之间大量歧义的消 解。从歧义字段的构成形式上来看,歧义字段可分为两类:一类是交集型歧义字 段,它是由词与词之间的交叉造成的,另一类是多义组合型歧义字段,它是由词 与词之间的串联造成的。 三、未登录词识别 特别是专有名词的识别,包括汉族人名、中国地名、外国人名汉译名、外国 地名汉译名、机构名、企业名等。未登录词识别是影响自动分词精度的另一重要 方面,也是自动分词技术的另一难点。专有名词识别一方面能提高自动分词系统 的精度,另一方面,还能为上层应用提供有价值的信息。 四、分词和理解之间先后次序的矛盾 计算机无法像人在阅读汉语文章时那样边理解边分词,而只能是先分词后理 解,因为计算机理解文本的前提是识别出词、获得词的各项信息。这就是逻辑上 的两难:分词要以理解为前提,而理解又是以分词为前提。由于计算机只能在对 输入文本尚无理解的条件下进行分词,则任何分词系统都不可能企求百分之百的 切分正确率。 , 五、计算机应用中实现的困难 1 、形式语言的局限性。形式语言可以准确地描述程序设计语言,但用来描 述无限的自然语言就显得无能为力了。没有合理的自然语言描述模型,计算机就 无法认识自然语言,也就不能准确地自动分词。 2 、知识表示理论不成熟。由于知识表示理论不很成熟,许多课题有待解决, 要让计算机利用知识来切分歧义字段还很困难。 3 、语义的理解和形式化。有的语句不同的上下文环境有不同的切分结果, 要正确切分这类语句,就必须理解语句在特定环境中的意义。但是语句理解和形 式化都是没有解决的问题,所以让计算机正确切分这类语句十分困难。 教学系统中的语音技术 天津师范大学 3 2 人工智能自动分词技术 人工智能是对信息进行智能化处理的一种模式,主要有两种处理方式: 1 、基于心理学的符号处理方法,模拟人脑的功能,像专家系统,即希望模 拟人脑的功能,构造推理网络,经过符号转换,从而可以进行解释性处理。 2 、基于生理学的模拟方法,神经网络旨在模拟人脑的神经系统机构的运用 机制来实现一定的功能。 以上两种思路也是近年来人工智能领域研究的热点问题,应用到分词方法 上,于是产生了专家系统分词法和基于神经网络分词法。 3 2 1 专家系统分词法 专家系统分词法将自动分词过程看作是知识推理过程,力求从结构与功能上 分离分词过程和实现分词所依赖的汉语语法知识、句法知识以及部分语义知识, 需要考虑知识表示、知识库的逻辑结构与知识库的维护。 其知识库按常识性知识与启发性知识分别进行组织。对于常识性分词知识采 用“语义网络”表示,对于启发性分词知识采用“产生式规则”表示。 知识库是使专家系统具有“智能”的关键性部件。 推理时,把待分词或己分词的字符串视为词语树中的节点,利用常识性知识 库进行顺向搜索匹配,若匹配成功,则该词把原字符串断为左右两段,以该词作 为子树的根,左边一段为子树的左孩子,右边一段为子树的右孩子,来代替原字 符串在词语树中的节点,形成一棵新的词语树。一旦子树的根结点满足条件:该 字符串是词且存在歧义时,则启动相应的歧义切分规则,校正刚形成的这棵词语 树,从而达到消除歧义的目的。 每进行一步推理,既启动常识性知识库又启动启发性知识库,对于非歧义切 分字段使用的是一般的语法知识;对于歧义切分字段则要使用与歧义有关的语法 知识或语义知识。 一个句子不管其中是否含有歧义字段,其切分过程均归结为生成该句子的词 语树的过程。这种统一的自动分词方法,不仅使整个分词处理过程简明,也使整 个系统的运行效率得到提高,其切分精度据称可达语法级。 教学系统中的语音技术 天津师范大学 算语言学的句法理论之一。乔姆斯基定义了0 型文法、上下文无关文法、上下文 有关文法和正则文法四种类型的形式语法。其中的上下文无关文法( c o n t e x t f r e e g r a m m a r ,c f g ) 又叫短语结构语法,因其推导不依赖于特定的上下文而得名。 这种短语结构语法广泛地应用于自然语言的自动分析和生成中。 这种上下文无关文法可以用一个四元组来定义:c = ( v t ,v n 。s t ,p ) 其中、v n 是两个非空有限集合,v t 中的元素称为终结符,v n 中的元素 称为非终结符。s v n 称为起始符号,代表所定义语言中的句子。p 是一个有限 的产生式集合。 c f g 要求文法g 的产生式的形式满足a b 的形式,其中a v n ,b ( v t i i v n ) + 。 4 2 格语法 4 2 1 格语法简介 格语法( c a s eg 朔m m 砌是f i l l m o r e 在1 9 6 8 年提出来的( 【4 】。针对结构主义者 的完全抛开语义的语法分析,f i l l m o 他提出了不同的看法。他提出用格框架来分 析句子的句法结构。 格语法对旬予语义关系的基本看法是:句予s ( n t e n c e ) 是情态m ( m o d a l i t y ) 与命题p ( p r o p o s i d o n ) 的组合,即s = m + p 。情态m 指言谈者的信念、观点、 情绪、态度、立场、语气、意图、观察角度即时间的过去、现在、将来等。命题 p 由一个动词v 及与其相关的多个格c ( c 船e ) 构成,即p = v + c l + c 2 + c n 。 最早的语法格有6 个,目前英语使用的有2 0 个左右,日语有7 0 多个,汉语 可分出2 0 个左右。格语法将自然语言分析的语法和语义结合了起来,以动词为 驱动,只要找到了主动词,从原则上讲,不管主、谓、宾的顺序如何颠倒,都可 以用语义框架将其表示出来。 f i l l m o r e 于1 9 6 8 年提出的6 种格关系如下: 1 施事格:表示由动词确定的动作能觉察到的有生命的动作发生者。 2 工具格:表示对由动词确定的动作或状态而言作为某种因素而牵涉到的某 种无生命的力量或客体。 1 9 教学系统巾的语音技术 天律师范大学 3 承受格:表示由动词确定的动作或状态所影响的有生物。 4 使成格:表示由动词确定的动作或状态所形成的客体或有生物,或者是理 解为动作意义的一部分的客体或有生物。 5 方位格:表示由动词确定的动作或状态的处所或空间方向。 6 客体格:表示由动词确定的动作或状态所影响的事物。 在格语法应用于汉语分析理解方面,国内的林杏光等做了卓有成效的研究。 他们将汉语格语法分成7 要素2 2 类。 主体分三个格: l 、施事:事件中自发动作行为或状态的主体。有两种类型: ( 1 ) 与人有关的比较典型的施事。如:( 我) 打了她一下。 ( 2 ) 自然力相关的施事。如:狂风) 吹倒了大树。 这两类施事,按其带格标的情况来分类,可分三类: ( 1 ) “被”类。如:我( 被她) 打了一下。 ( 2 ) “由”类。如:这件事 归我) 管。 ( 3 ) “正”类。如:( 妈妈) 摔了个盘子。( 飞机) 飞走了。 2 、当事:事件中非自发动作行为或状态的主体。按其所联系的动词性质不 同分为两类: ( 1 ) 与非自发动作行为动词诸如“丢”、“懂得”、“知道”等和形容词相 联系的。如:( 我) 丢了钱包。( 她) 懂得了这个道理。( 我) 知道了。 ( 2 ) 与系属词诸如“是”、“叫”、“等于”等相联系的。如:( 我) 是个 学生。( 她) 叫小张。( 1 公里) 等于l 千米。 3 、领事:事件中有领属关系的主体。按其先后带成分的不同分为两类: ( 1 ) 后面的成分归其所有。如:( 我) 有一本书。( 她) 有十元钱。 ( 2 ) 后面的成分是它的一个组成部分。如:( 她) 有一双大眼睛。 客体分三个格: 1 、受事:事件中自发动作行为所涉及的已存在的直接客体。与“施事”相 应,“受事”也分为两类: ( 1 ) 与人的动作行为相关的客体。如:我打( 篮球) 。 教学系统中的语音技术 天津师范大学 ( 2 ) 自然力所涉及的客体。如:狂风吹断了( 大树) 。 这两类受事,按其带格标的情况来分类,也可分为三类: ( 1 ) “把”类。如:我( 把书) 撕了。我( 将书) 拿给了他。 ( 2 ) “对”类。如:( 对这次的成绩) 我们很满意。 ( 3 ) “正”类。如:我喜欢( 足球) ,我收到了( 一封信) 。 2 、客事:事件中非自发动作所涉及的已存在的直接客体和所属动词“有” 涉及的客体。按动词的性质来分类,可分两类: ( 1 ) 非自发动作行为动词诸如“收到”、“撞见”、“知道”、“膳得”等, 所涉及的直接客体。如:我收到( 这条短信了) 。 ( 2 ) 所属动词“有”涉及的客体。如:我有( 一台电脑) 。 3 、结果:事件中自发动作行为所产生、引起或达成的结局。它和“受事” 的区别在于,“结果”是从无到有( 例如:盖( 房子) ) ,“受事”是本来 已经有了( 例如:修理( 房子) ) 。按其带格标的情况来分类,可分为两 类: ( 1 ) “把”类。如:工人们( 把楼房) 建起来了。 ( 2 ) “正”类。如:她正在( 写信) 。 领体分三个格: l 、与事:事件中有利害关系的间接客体。按其带格标的情况来分类,可分 六类: ( 1 ) “给”类。如:工人们( 给厂长) 提了很多意见。我( 给他) 借来 一本书。 ( 2 ) “向”类。如:我国政府( 向对方) 提出强烈抗议。 ( 3 ) “替”类。如:他( 替我) 请了假。 ( 4 ) “跟”类。如:我( 跟他) 说明了情况。 ( 5 ) “为”类。如:我们( 为祖国) 作贡献。 ( 6 ) “正”类。如:我告诉( 小张) 一个好消息。 2 、同事:事件中所伴随的或排除的间接客体。按其带格标的情况来分类, 可分四类: 教学系统中的语音技术 天津师范大学 ( 1 ) “跟”类。如:我( 跟厂长) 请了一天假。 ( 2 ) “除了”类。如:( 除了我) 没人相信你。 ( 3 ) “连”类。如:他( 连我) 都不信了。 ( 4 ) “正”类。如:我们要团结( 群众) 。 3 、基准:事件中进行比较所参照的间接客体。按其带格标的情况来分类, 可分两类: ( 1 ) “比”类。如:我( 比他) 能干。 ( 4 ) “正”类。如:我说不过( 你) 。 系体分三个格: l 、系事:事件主体的类别、身份或颜色。按其带格标的情况来分类,可分 两类: ( 1 ) “作为”类。如:( 作为家长) 应当教育好孩子。 ( 2 ) “正”类。这一类按照动词的性质的不同可分为两种: 判断动词类。系事的外延和前面的当事相等或同一范围。如: 我是( 学生) 。语言是( 交流工具) 。 行为动词类。如:我打( 前锋) 。他唱旦角) 。 2 、分事:事件领事的组成部分。如:人有( 两条腿) 。她长着( 一双大眼睛) 。 3 、数量:事件中相关的数量或频度。按照量词的性质来分类,可分为三类: ( 1 ) 名薰。如:她向前迈了( 一步) 。 ( 2 ) 动量。如:老师来过( 一次) 。 ( 3 ) 距离。如:船队前进了( 1 0 0 米) 。 凭借分三个格: l 、工具:事件中所用的器具。按照带格标的情况来分类,可分为三类 ( 1 ) “用”类。如:她( 用笔) 写字。 ( 2 ) “拿”类。如:他( 拿枪) 打鸟。 ( 3 ) “正”类。如:你吃( 大块) ,我吃( 小块) 。 2 、材料:事件中所用的材料或耗费的物资。 教学系统卞的语音技术天津师范大学 它和“工具”格的不同在于:不变原物的是工具,如:( 用砂锅) 煮稀饭; 转化为新的物质形态或被消耗掉了的是材料,如:( 用小米) 煮稀饭。 按其带格标的情况来分类,可分为五类: ( 1 ) “用”类。如:我( 用玉米面) 煮粥。 ( 2 ) “拿”类。如:他( 拿煤油) 烧饭。 ( 3 ) “由”类。如:水( 由氢和氧) 组成。 ( 4 ) “把”类。如:他( 把钱) 都买书了。 ( 5 ) “正”类。如:( 这木料可做家具。 3 、方式:事件中所采用的方法和形式。按其带格标的情况来分类,可分为 四类: ( 1 ) “用”类。如:学校( 用书面形式通知到他本人。 ( 2 ) “以”类。如:我们要( 以发展的眼光看问题) 。 注:“方式”的“用、以”类必须是抽象的,这就是与“工具”、“材料” 的区别。 ( 3 ) “像似的”描述性的比喻式。如:这孩子说话( 像大人似的) 。 ( 4 ) “正”类。如:队伍走( 正步) 。 环境分四个格: 1 、范围:事件中所涉及到的领域或范围及所伴随的情况。按其所带格标组 成的套子来分类,可分为七类: ( 1 ) “关于”类。如:( 关于这个问题) 我们要认真研究一下。 ( 2 ) “在方面”类。如:( 在学习方面) 他比我强。 ( 3 ) “就问题”类。如:我( 就这个问题) 写了一篇文章。 ( 4 ) “在上”类。如:( 在学习上) 我比不上他。 ( 5 ) “在下”类。如:( 在此种情况下) 只好这样了。 ( 6 ) “在中”类。如:( 在工作中) 我们克服了很多困难。 ( 7 ) “正”类。如:他的作品轰动( 全国) 。 2 、处所:事件发生的场所、境况或经过的途径。按其带格标的情况来分类 可分为八类: 教学系统中的语音技术天津师范大学 ( 1 ) “在”类。如:你( 在客厅) 休息一会儿。朋友们相会 在北京) 。 ( 2 ) “往”类。如:大家( 往里) 走走。 ( 3 ) “从”类,如:他从北京) 回来了。 ( 4 ) “沿着”类。如:你( 沿着河边) 走就到了。 ( 5 ) “自”类。如:我们班的同学自全国各地) 。 ( 6 ) “到”类。如:我骑车( 到学校) 。 ( 7 ) “当着的面”娄。如:( 当着老师的面) 她不敢说。 ( 8 ) “正”类。如:课堂上) 他很少发言。 3 、时间:事件发生的时点或持续的时段。按时间的特征来分,可以分成两 类: ( 1 ) 时点类。如:计算机 施事+ v + 依据。 施事+ v + 工具。 吃o 施事v + 时阀。 施事+ v + 方式。 q 2 旅事+ v + 范围。 施事+ v + 处所。 心4 旅事+ 工具+ v 。 施事+ 同事+ v 。 篪事+ 与事t v 。 施事+ 原因+ v 。 处所+ v + 施事。 施事+ v + 处所或时间。 施事+ v + 处所或范围。 施事+ v + 处所或目的。 ( 3 2 施事+ v + 与事或材料。 5 、二价外动词格框架: 当事+ v + 客事。 ( 3 4 当事+ v + 结果。 6 、二价内动词格框架: 当事+ v + 范围。 ( 3 6 当事+ v 十工具。 教学系统巾的语音技术 天津师范大学 了前人的成果,并改进了使用格语法的方法,使之能够适用于我们的研究工作, 并避开上述三个缺陷。当然我们所处理的语言是台球教学这个领域受限的语言子 集,语言现象不是很复杂,这些改进目前还不能应用到更广阔的语言空间。( 详 见系统实现部分) 教学系统中的语音技术天津师范大学 第五章语音合成 5 1 语音合成目的和意义 作为智能计算机研究的主导方向和人机语音交互的关键技术,语音合成一直 受到各国科学界的广泛关注。随着语音合成技术的研究发展,它对计算机发展和 社会生活的重要性日益凸现出来。日前,语音合成广泛的应用于基于p c 的办公、 教学、及娱乐等智能多媒体软件和声讯服务领域内的智能电话查询系统中。 随着多媒体技术的日益发展,计算机的更新换代,特别是当今计算机的广泛 普及,人们对计算机提出了越来越高的要求,能够让计算机象人一样“能听会说”, 是人们多年以来梦寐以求的目标。从9 6 年开始,i b m 推出了i b m av o i c e 语 音识别系统,一对间风靡全国。v i av o i c e 解决的仅仅是入杌语音交流的一平。 即机器的“能听”问题。而语音合成系统,正是要解决另一半,即机器的“会说” 问题。随后m i c s o f t 推出了s a p i 语音交互系统开发包的。这项技术的推出使 语音交互系统的实现成为了可能,使得计算机不仅在文稿校对、语言学习、语音 秘书等方面具有巨大的市场前景,而且在与语音识别技术结合后,更是大大提高 计算机的人性化魅力,就像和“他”在面对面的聊天。 5 2 语音合成技术思想 语音合成技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必 需的关键技术之一。和语音识别相比,语音合成的技术相对说来要成熟一些,是 该领域中近期最有希望产生突破并形成产业化的一项技术。 按照人类言语功能的不同层次,语音合成也可分成三个层次,它们是: ( 1 ) 从文字到语音的合成( t e x t b s p c e c h ) ; ( 2 ) 从概念到语音的合成( c o n c e p t t o s p e o c h ) ; ( 3 ) 从意向到语音的合成( 1 1 1 t e n t i o n t o s p e e c h ) 。 这三个层次反映了人类大脑中形成说话内容的不同过程,涉及人类大脑的高 级神经活动。不难想象,即使是按规则的文字到语音合成( 文语合成) 也己经是相 当困难的任务。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规 则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这将涉及自 教学系统中的语音技术 天津师范大学 然语言理解的问题。从这一点阱,文语转换系统实际上也可看作一个人工智能系 统。图5 1 显示了一个完整的文语转换系统示意图。文语转换过程是先将文字序 列转换成音韵序列,再由语音合成器生成语音波形。其中第一步涉及语言学处理, 例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语 音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,文语合成系 统都需要一套复杂的文字序列到音素序列的转换程序,也就是说,文语转换系统 不仅要应用数字信号处理技术而且必须有大量的语言学知识的支持。当然其中 语音合成终究还是最基本的部分,它相当于“人工嘴巴”,任何语音合成系统包 括文语转换系统,都离不开语音合成器。 图5 1 文语转换系 统 5 3t t s 系统的文本分析模块 语音合成系统首先处理的是文字也就是它要说的内容。文本分析的主要功 能是使计算机能从这些文本中认识文字,进而知道要发什么音、怎么发音,并将 发音的方式告诉计算机。另外,还要让计算机知道,在文本中,哪些是词,哪些 是短语或句子,发音时应该到哪坐停顿及停顿多长时间等。其工作过程可以分为 三个土要步骤: ( 1 ) 将输入的文本规范化。在这个过程中,要查找拼写错误,并将文本中 出现的一些不规范或无法发音的字符过滤掉。 ( 2 ) 文本中词或短语的边界,确定文字的读音,同时分析文本中出现的数 字、姓氏、特殊字符、专有词语以及各种多音字的读音方式。 ( 3 ) 文本的结构、组成和不同位置上出现的标点符号,确定发音时语气的 教学系统中的语音技术天津师范大学 变换以及不同音的轻重方式。 最终,文本分析模式将输入的文字转换成计算机能够处理的内部参数,便于 后续模块进一步处理并生成相应的信息。 传统的文本分析主要是基于规则( r u l e - b a 跎d ) 的实现方法。其主要思路是尽可 能地将文字中的分词规范、发音方式罗列起来,并总结出规划,依靠这些规则进 行文本处理,以获得需要的参数。具有代表性的方法有:最大匹配法、最佳匹配 法等。这些方法的优点在于结构较为简单、直观,易于实现;缺点是需要人量的 时间去总结规则,且模块性能的好坏严重依赖于设计人员的经验以及他们的背景 知识。由于这些方法能取得较好的分析效果,因此,直到髫前,它们依然被广泛 使用。 5 4t t s 系统的韵律生成模块 任何人说话都有韵律特征,比如在汉语中,音节有不同的音调,语气和停顿 方式,发音长短也各不相同,这些都属于韵律特征。韵律参数则包括了能影响这 些特征的声学参数,如基频、时长、音强等。 文本分析的结果只是告诉了计算机发什么音,以及以什么方式发音,这种发 音方式还只是抽象的。而要发音的声调是二声还是三声,是重读还是轻读,到哪 里停顿,等等。这些最终系统用来进行声音信号合成的具体韵律参数还要依靠韵 律生成模块。与文本分析的实现方法相类似,韵律的生成方法也分为基于规则和 数据驱动两种方法。 早期的韵律生成方法均采用基于规则的方法。这种方法要求研究人员有大量 的音韵学背景知识,需要对在各种特定的情况下,如声音在句子中的不同位置、 不同声调及句子的不同语气甚至是不同的词性下,对基频、时长和音强等各个声 学参数变化的详细情况加以总结、归纳。由于各个语种的韵律特征不同,因此, 针对不同的语种,必须找出与该语种相关联的韵律特征。目前,基于规则的方法 仍然被认作是行之有效的方法,大部分汉语语音合成系统依然采用这种方法。虽 然经过研究者的努力,这种方法能达到较好的韵律生成效果但它也受到很多限 制。如前所述,基于规则的方法要求系统设计人员花费大量的时间和精力去研究 不同语种普遍存在的韵律特征,而这是一个非常耗时的工作,且由于规则的复杂 教学系统中的语音技术 天津师范大学 p a p a g e n o 系统,也采用了类似或相关的技术。 但基于波形拼接方法的系统仍存在一些闯题,即它的语音库往往非常庞大, 需要占据较大的存储空间。这对将系统推广到掌上型计算机或一些小的终端设备 上非常不利。另外,在拼接时,两个相邻的声音单元之间的不连续,也容易造成 合成音质的下降。 5 6t t s 部分的实现 我们的语音合成部分的实现是基于微软公司开发的一套完整的语音开发包 m i c r o s o f ts a p l 5 的。 5 6 1m i c r o s o rs a p l 5 简介 m i c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医药药膏销售方案(3篇)
- 伸缩旗杆维修方案(3篇)
- 销售粉条方案模板(3篇)
- 村居咏柳教学课件
- 商贸公司经营方案(3篇)
- 电梯别墅改造方案(3篇)
- 场地深坑修补方案(3篇)
- 头像教学课件图片
- 趣味生字教学课件
- 防弹服装改造方案(3篇)
- 2025电商平台店铺转让合同模板
- 2025年人教版(2024)初中英语七年级下册期末考试测试卷及答案
- (2025)事业编考试题库(附含答案)
- 女性美学课堂企业制定与实施新质生产力项目商业计划书
- 高端私人定制服务方案
- 2025年保密知识竞赛考试题库300题(含答案)
- 部编版2024-2025学年四年级下册语文期末测试卷(含答案)
- 2025年医保政策考试题库及答案:基础解读与医保政策法规试题试卷
- 2025至2030年中国液化设备行业投资前景及策略咨询研究报告
- 湖北省武汉市部分重点中学2022-2023学年高一下学期期末联考数学 含解析
- 行政-接机流程及礼仪(定稿)
评论
0/150
提交评论