(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf_第1页
(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf_第2页
(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf_第3页
(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf_第4页
(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(计算机软件与理论专业论文)中国五声性调式和声自动配置的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 算法作曲是人工智能领域中一个研究方向,从作曲家的角度去模拟为旋律 乐曲配伴奏,作为一门交叉学科,具有深远的理论研究价值。本文正是从这一点 出发,以中国民族风格化的五声性调式和声理论为依据,建立了中国民歌( 旋律) 配钢琴伴奏的h m m 模型。这个模型从一定程度上模拟了作曲家对旋律配伴奏的 思维活动过程。 我们首先通过收集中国民族五声性调式中各种调式的和弦,建立了调式和 弦字典库,同时将由作曲家石夫编集的8 0 余首带有钢琴伴奏的中国西部民歌谱 例作为训练数据集合,分别建立了旋律配和声以及旋律音型配置相应钢琴伴奏音 型的隐马尔可夫模型。前者以拍或一小节( 可选择) 的旋律片段中的骨干音序 列为观察值,而旋律片段相对应的和弦标识为隐含状态。后者以确定的旋律片段 中的音符时值序列为观察值,对应的钢琴伴奏之伴奏音型为隐含状态。 在训练过程及为旋律配伴奏过程中,我们还考虑了曲式( 乐曲的形式结构) 分析策略。制定了一种分割乐曲( 切分样本乐曲) 成若干乐句、乐段的方法。并 在此基础上,分别以拍子或小节作为和声功能的分析及配置的基本单位。即,对 切分后的乐曲,我们从和弦字典库中为乐曲中的和弦配置基本单位选择某一和弦 作为其特征和弦,然后我们利用建立的模型对样本乐曲进行学习、训练。最后, 考虑到旋律乐曲的整体性,在训练后的结果基础上,我们使用v i t e r b i 算法为任 一输入的旋律配出以中国民族风格化的五声性调式和声为基础的钢琴伴奏谱。 关键词:算法作曲;隐m a r k o v 模型;v i t e r b i 算法 a so n eo ft h eb r a n c h e so fa r t i f i c i a li n t e l l i g e n c e ,a l g o r i t h m i cc o m p o s i t i o n s i m u l a t e st h ec o m p o s e r st oh a r m o n i z et h em e l o d ym u s i c a n da sag l o s s s u b j e c t , a l g o r i t h m i cc o m p o s i t i o ni sw o r t h yo fb e i n gr e s e a r c h e d b a s e do nc h i n e s ef i v e - t o n e m o d a lh a r m o n i cc h o r dt h e o r yo fm u s i ct h e o r y , t h i sd i s s e r t a t i o nd e s c r i b e sac h o r a l e h a r m o n i z a t i o ns y s t e mw h i c hu s e sh i d d e nm a r k o vm o d e l s t os o m ee x t e n t ,t h i s m o d e l ss i m u l a t e st h ec o m p o s e r st oh a r m o n i z e f i r s t l y , w ec o l l e c ts o m ec h o r d so fc h i n e s ef i v e - t o n em o d a lh a r m o n i cc h o r da n d b u i l dac h o r dl i b r a r yf o ra c c o m p a n i m e n t , a n dc o l l e c tm o r et h a n8 0c h i n e s ew e s t s i d e f o l k s o n g sw i t hp i a n oa c c o m p a n i m e n tu s e da st r a i n i n gd a t as e t a n dt h e n ,t w oh i d d e n m a r k o vm o d a l sr e s p e c t i v e l yf o rh a r m o n i z i n gam e l o d ya n dd e p l o y i n gp i a n o a c c o m p a n i m e n tf i g u r e sf o rt h em e l o d yf i g u r e sa r cb u i l tu p i nt h ef i r s tm o d e l ,t h e o b s e r v a t i o nv a l u eo ft h em o d e li sac o r et o n es e q u e n c ei nam u s i c a lp i e c ew i t h v a r i a b l el e n g t ha n dt h eh i d d e ns t a t ei st h ec h o r dl a b e la b o u tt h em u s i c a lp i e c e i nt h e s e c o n dm o d e l ,t h eo b s e r v a t i o nv a l u ei sat o n ed u r a t i o ns e q u e n c ei nt h em u s i c a lp i e c e a n dt h eh i d d e ns t a t ei st h ep i a n oa c c o m p a n i m e n tf i g u r e sc o r r e s p o n d i n gt ot h em u s i c a l p i e c e w h e nt r a i n i n go ra c c o m p a n y i n g , w ea l s o t a k ei n t oa c c o u n tt h ea n a l y s i s s t r a t e g yf o rm u s i c - - - t h es t r u c to fm u s i c w es e tu pam e t h o dw h i c hw eu s et o s y n c o p a t et h em u s i ci n t om a n yp h r a s e sa n dp 击o d s b a s e do nt h i s , w et a k et h eb e a to r b a ra st h ea u t ou n i tt oa n a l y z et h eh a r m o n i cf u c t i o na n da c c o m p a n yt h em e l o d y a tt h e l a s t , i nv i e wo ft h em u s i ci n t e g r a t i o n , b a s e do nt h et r a i n i n gr e s u l t , t h ev i t e r b i a l g o r i t h mi su s e dt og e n e r a t eap i a n oa c c o m p a n i m e n ts c o r ew i t hn a t i o n a l i t ys t y l e s b a s e do nc h i n e s e5 - t o n em o d a lh a r m o n yf o ra ni n p u tm e l o d y 。 k e y w o r d s :a l g o r i t h m i cc o m p o s i t i o n ;h i d d e nm a r k o vm o d e l s ;v i t c r b ia l g o r i t h m i c h i 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成 果。本人在论文写作中参考的其他个人或集体的研究成果,均在 文中以明确方式标明。本人依法享有和承担由此论文产生的权利 和责任。 一。:戤够 叼年日 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦 门大学有权保留并向国家主管部门或其指定机构送交论文的纸 质版和电子版,有权将学位论文用于非赢利目的的少量复制并允 许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关 数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密 的学位论文在解密后适用本规定。 本学位论文属于 1 、保密() ,在年解密后适用本授权书。 2 、不保密( ) ( 请在以上相应括号内打“4 ) 名:纠这隰 导师签名:) 礓包日期: 月名 毛r 掘 第一章绪论 1 1 旋律配调式和声概述 第一章绪论 多声部音乐( 下面简称多声音乐) 可分为主调音乐和复调音乐。主调音乐 是指包含唯一的旋律声部的多声音乐而除旋律声部的其他声部,主要起衬托和 丰富旋律声部的作用。复调音乐是指几个具有独立意义的旋律性声部,在运动中 同时相结合在一起,构成丰富多样的织体形式,这种各自具有独立旋律意义的多 声部音乐称为复调音乐。所谓织体,是指乐曲中声部的组合方式。有关多声音乐 的创作,主要涉及两方面作曲技术,那就是和声与对位。 自中世纪以来,西方就出现了许多多声音乐。作曲家在创作之前,都需预 先精心规划,以创作出复杂的多声音乐。到了1 8 世纪,就形成了有关音符在纵 ( 多音同时发声) 、横( 下一音符的走势) 两方向如何结合的规则体系,即所谓 的和声学。在基础和声学中,这种同时发生的多音的相互关系,称为和声。中国 的民间及各民族音乐,也不只是单声部的。在实际的民间、民族音乐活动中,无 论是民歌、戏曲、曲艺音乐,还是器乐、歌舞音乐,都广泛地存在着多声音乐形 式【1 1 。然而,中国民间及各民族多声音乐,没有什么完整的和声体系。 目前,虽然出现了不少阐述中国民族风格化的五声性调式和声理论的书籍 和论文【1 咽,但它们似乎不及西方传统和声理论那样系统化。在一个没有充分系 统化的中国近代五声性调式和声系统的基础上,构建相关的调式和声规则系统是 相当困难的。用统计学的方法来分析古典以及近、现代音乐的和声结构是当今音 乐分析的计算模型研究中的一种有效的手段嘲。 1 2 算法作曲定义 算法作曲( a l g o r i t h m i cc o m p o s i t i o n ) ,又称为自动作曲( a u t o m a t e d c o m p o s i t i o n ) ,是指用某种逻辑过程来控制音乐的生成。人在算法作曲中扮演着 “立法者一的角色,完成逻辑过程的设定后,尽可能少地干预音乐的生长,让计 中国五声性调式和声的自动配置的研究 算机来控制完成音乐作品。当然,该过程的规则是由人来制定的,由此而生成的 音乐作品的艺术趣味,取决于作曲家在创造“音乐模块 与制定规则时的想象力 和控制力。算法作曲是试图使用某个形式化的过程使人( 或作曲家) 在利用计 算机进行音乐创作时的介入程度达到最小的研究( a l p e r n ,1 9 9 5 ) 忉。 如果我们宽泛地认定算法作曲是某种模式化作曲概念在计算机上的延伸,那 么,在计算机诞生以前,模式化作曲就已经是常用的音乐创作方法之一。早在1 4 世纪,经文歌中男高音声部常使用的等节奏( i s o r h y t h m i c ) 就具有模式化作曲的 意义。 此外,我们熟悉的许多结构形式如卡农、赋格,和许多发展手法如倒影、逆 行、模进等,也具有算法作曲的特征。算法作曲的特征还体现在随机音乐的 某些实现方式中。作曲家完成不同的音乐模块后,由演奏家掷般子决定模块的演 奏次序。最著名的例子是莫扎特的圆舞曲音乐殷子游戏,他创作了1 7 6 t b 节 音乐,然后将小节号排列为两个特别的矩阵图,用掷般子的方式来决定演奏的次 序。 约翰凯奇在作品( r e u n i o n 中,将演奏的选择交给两位下象棋的选手, 他们在具有图像感应功能的棋盘上每走一步,都会触发不同的声音,这样,每盘 棋都是这些声音材料的一次新的重组。此时,音乐生成的逻辑取决于棋盘上两军 对抗的风云变幻。 在音乐思维中,模式化的过程是自然存在的。例如,在听音乐的时候,我们 一方面沉浸在音响带给我们的新奇刺激之中,而另一方面,我们又不断地产生对 音响的期待,构架对音乐过程的假设。期待与假设的基础就是所有储存在听众脑 海中的已有模式。作曲家们早就了解,音乐过程中的某些要素是可以用符号系统 的“逻辑表达式 来描述的。 虽然,当我们提及算法作曲时,总是和计算机音乐相联系。实际上,使用常 规的作曲手段也能运用算法作曲的观念进行创作。不过,在计算机上运用这一方 法更为简便、快捷。当我们将一定的算法输人计算机,它就能以此为依据,不断 生成音乐数据,完成作品的创作。 近半个世纪以来,在计算机上实现算法作曲的途径非常多。但从根本上来看, 2 第一章绪论 所有的方法都能归于两种基本类型:1 用特定的算法控制声音产生与变化的过 程,这种方法直接产生音响结果。2 用特定的算法控制音符的产生与变化,这种 方法生成乐谱,然后利用a u d i 设备或演奏家的演奏来获得音响结果。 算法作曲所要面对的主要问题和传统作曲方式并无区别,都是要考虑如何构 成音乐的核心材料,以及如何将核心材料变形发展。而此类问题的表达方式又各 不一样:1 以多种音乐基本要素的综合形态为核心,首先构成短小的动机或主题, 然后加以发展。2 以乐音关系为核心,用特定的音列或音集( 包括特定的音程特 性) 作为核心材料( 不一定构成性格鲜明的动机或主题) ,控制乐音的运动。3 以 发展逻辑为核心,任何局部都不具有核心的意义,只有通过音乐的整体发展过程 才能揭示出来。第一和第二种方式在传统创作过程中常见,而在计算机音乐中, 则第二和第三种方式更容易被计算机所“理解。 在计算机上实现算法作曲,构成核心材料并不困难。第一,我们可以利甩 i t i d i 键盘,直接输人所需要的乐音数据。第二,我们也可以用随机数发生器任 意生成数据,然后根据一定的模式,选择所需要的数据,构成核心音集、音序、 音列或节奏模式。问题在于,我们如何让计算机控制音乐发展的过程。 构成多种多样的变化形态,是计算机的特长。在这方面,人都要自愧不如。 在一定的范围内,计算机几乎可以穷尽所有可能的变化形态。如何恰当地选择变 化形态,构成有意味、有审美价值的音乐过程,却是计算机的一大难题。虽然选 择的困难对于任何从事音乐创作的人来说,也同样如影相随,难以摆脱。可人总 能在一个模糊的范围内,把问题交给“感觉刀去解决。计算机没有“感觉刀,人 所可能运用的某些控制因素,如情绪的、美学的、情节的等,都不可能作为计算 机构建音乐结构的基础。它所能遵循的就是严密的逻辑与规律。分层结构就是算 法作曲中常常遵循的一个结构原则。 无论是东方音乐还是西方音乐均有其一定程度的形式化基础。有关旋律创 作的形式化技术可以追溯到1 1 世纪。当时,有一位名叫g u i d od a r e z z o 的人 构造了一种可为一本宗教书籍中的每个元音设计不同音高的模型。1 5 世纪的 时候,节奏模式就被系统地使用在具有均匀节奏的圣歌中嗍。在文艺复兴时期 及巴洛克( b a r o q u e ) 时代,作曲家为旋律的对位发展了严格的规则。例如, 中国五声性调式和声的自动配置的研究 复调音乐的创作几乎完全可通过诸如像对给定的主题动机( 一个音乐小片段) 实施倒影,主题延长,缩减这样系统化的过程来演绎。 探索算法作曲的问题,可以一方面让我们了解和模拟作曲家在从事音乐创 作这一特定过程中他( 她) 的思维方式,另一方面,基于算法作曲的研究技术 而开发的作曲程序,其所创作出不同形式的音乐作品,同样可以娱乐于人。由 著名的算法作曲家,音乐教授d a v i dc o p e ( 2 0 0 1 ) 9 1 设计和开发的作曲程序能 够继承已故作曲家的风格并创作出同样风格的音乐作品。这些作品中有类巴赫 的创意曲,器乐协奏曲和组曲。有类莫扎特的奏鸣曲以及类肖邦的夜曲。大家 可以从网上很容易地下载到这些由作曲程序创作出的或辅助作曲家创作出的 音乐片段的m p 3 f 1 0 1 。当您欣赏了这些音乐片段之后,或许会觉得那些已故的 音乐大师似乎又重返人间,继续为人类寻求欢乐和慰籍。 4 第二章相关研究概况 第二章相关研究概况 2 1 基于规则的知识库系统 音乐知识库的使用,似乎是很自然的一种选择。特别是当我们试图在已定义 完善的领域内建立模型或者是介绍一个清晰的结构或规则时尤其如此。其主要优 点是它们具有清晰的推理并能够为行为的选择作出解释。 早期的旋律配置和声系统多采用基于约束一满足度规则文法技术,有代表 性的如e b c i o g l n ( 1 9 9 2 ) t 1 2 】所研发的巴赫风格的旋律配和声专家系统c h o r a l 。该 系统的3 5 0 多条四声部合唱曲生成规则,就是在分析巴赫四声部众赞歌 ( c h o r a l e s ) 的基础上,手工提练出来的。此外还有s t e e d m a n ( 1 9 8 4 ,1 9 9 6 ) u 3 ,1 4 j 发明的用以描述爵士乐1 2 小节蓝调的和弦进程的生成文法及而后使用的范畴文 法。m a r t i nh e r t z ( 1 9 9 6 ) 1 5 等人通过约束编程技术所开发的基于意图的音乐作曲系 统c o m p o z e 等等。这些都是基于约束一满足技术的旋律配和声系统的代表。 基于约束一满足技术的系统存在的一个问题是各种风格的和声配置规则的总结 通常比较困难。规则数量很难进一步扩展。音乐中各种各样的例外情况的表达及 形式化描述往往很复杂( gp a p a d o p o u l o s & gw i g g i n s ,1 9 9 9 ) 【1 6 1 。另一个问题是随 着旋律长度的增加,基于约束一满足度技术的旋律配和声求解算法的时空复杂性 会迅速增高( fp a c h e t & pr o y ,2 0 0 1 ) 【l 刀 2 2 遗传算法 遗传算法g a ( g e n e t i ca l g o r i t h m ) 1 1 5 是一种以达尔文自然进化论和孟德尔 遗传变异论为基础的全局随机搜索技术,一个使用适应函数( h t n e s sf u n c t i o n ) 来演化候选者( 染色体) 的全局优化算法。遗传算法可以解决基于规则方法中需 要大量临时存储空间问题。由于遗传算法具有全局寻优能力、适用于离散和连续 变量问题、无须先验知识等特点,因此得到了普遍的应用。作为一种基于自然选 择和遗传变异等生物进化机制的全局概率算法,遗传算法( g a ) 具有良好的普适 性和可规划性,在形式上简单明了,这些优点启发人们将遗传算法应用于乐曲创 中国五声性调式和声的自动配置的研究 作上。遗传算法作曲是利用遗传算法来控制音乐生成的过程。在作曲过程中首先 将给定乐曲进行一定方式的编码,并采用遗传算法中的交叉、变异等算子对乐曲 进行“进化 ,用适应度函数来衡量进化结果,如此不断进行直到找到最终的满 意解为止。 h o m e r 和a y e r s ( 1 9 9 5 ) 1 9 1 就曾使用遗传算法为一些旋律作和声联接。 r a m c i n t y r e ( 1 9 9 4 ) 2 0 ! 、g w i g g i n s ( 1 9 9 8 ) 1 2 1 】等不少学者都曾用遗传算法为输入旋 律配制4 声部不同风格的和声。然而,正如fp a c h e t & pr o y ( 2 0 0 1 ) 1 2 3 1 所指出的 那样,使用遗传算法来求解旋律配和声时,会遇到不相关的局部最优区域的和声 搜索空间问题。e a n m u a i s u k 和g 晰g g i n s ( 1 9 9 9 ) 刚曾使用约束满足和遗传算法 这两种不同的技术来分别实现旋律配和声系统并在比较了两种技术的结果后指 出:系统最终表现的结果仅和被编码的知识量有关,而和哪一种技术无关。这说 明了音乐知识量是一个系统的关键。 使用遗传算法进行自动作曲的研究中,适应函数是很难定义的。另一类的工 作被称为交互式的遗传算法一( i n t e r a c t i v eg e n e t i ca l g o r i t h m ) i g a 。即它是让人代 替适应函数来直接评估染色体的一种方法。这方面比较有代表性的系统和研究包 括:b i l e s ( 1 9 9 4 ) 【2 6 】构造的一个被称为“g e n j a m 的交互式即兴演奏系统。它是 一个和人一起演奏爵士乐的作曲家a g e n t 。u n e m i ( 2 0 0 1 ) 【2 7 l 构造了一个被称为 “s b e a t 的交互式音乐作曲支持系统。u n e m i 的系统可以生成几种单小节音乐 片段并基于用户的评估来繁殖它们。在此系统中,若要创作超过2 小节的作品, 用户须为它们联接若干小节以生成较长的乐段。u n h e r am 和o n i s a w a t ( 2 0 0 3 ) 2 8 】也用类似的方法研发了一个能交互式地使用遗传操作的音乐作曲系统。不同的 是u n h e r a m 的交互式音乐作曲系统允许无音乐技能的人介入他的音乐作曲系统 来创作音乐。而且生成的旋律长度可达1 6 小节。 2 3 序列预测 c o n k li n 和w i t t e n ( 1 9 9 5 ) f 冽使用概率有穷自动机语法生成新的众赞歌旋律 乐曲。在训练过程中,他们使用了9 5 首巴赫众赞旋律歌曲作为训练样本,c o n k l i n 和w i t t e n 构造了一个多视角系统用以分析已存在的旋律乐曲或者生成新的旋律 6 第二章相关研究概况 乐曲,其中音符序列每种特征模型做为一个视角,例如,时间的起始时间、音高、 音符时值、调号、拍号、在小节中的位置、小节的音程、乐句的音程。 如同遗传算法一样,c o n l d i n 和w i t t e n 的系统把复杂的任务分成简单的各个 子任务。但是那些系统为了处理复杂的和声系统,系统把任务分成串行执行的任 务,而c o n l d i n 和w i t t e n 把系统划分为可并行处理的一些子任务。多视角系统使 用加权变化的不同阶的马尔可夫模型,另外我们还可以把不同模型得到的结果组 合起来使用。h i n t o n ( 1 9 9 9 ) 3 0 1 正是使用组合不同模型结果的方法,并且他描述了 如何使用对数的方法连接每个专家模型。 另外,p o n s f o r d ( 1 9 9 9 ) i 捌等一些人也使用序列预测的方法进行应用于和声, 8 4 首1 5 个十七世纪法国的作曲家创作乐曲中的萨拉班舞曲作为他的数据集。实 验结果表明训练中的乐曲数据片段是可以复制的。 2 4 神经网络 人工神经网络在过去几年已广泛地使用在音乐应用系统中( t 0 d d 和 l o y , 1 9 9 1 ;l e m a n , 1 9 9 2 ;g r i f f i t h 和t o d d , 1 9 9 7 ) 3 t - 3 3 l 。并且已取得相当的成功。 特别是在感知和认知方面。人工神经网络能够从一个样板集合中学习以避免需 要对规则的形式化。 m o z e r 使用递归神经网络技术构造了他的c o n c e r t ( 1 9 9 4 ) 鲫并用反向 传播学习算法来训练c o n c e r t 。c o n c e r t 能够以一音接一音的方式来创作 旋律( n o t e - b y - n o t ec o m p o s i t i o n ) 欲进一步了解递归神经网络的旋律创作过 程可参见文献陶。递归神经网络能成功地获取一个旋律经过句的表层结构并以 这样获取的知识为基础,产生出新的旋律。但是,其生成的旋律缺乏音乐的全 局联贯性。即它无法获取较高级的音乐特征。例如,那些和乐段或调性功能相 关的信息( t o i v i a i n e n , 1 9 9 9 ) 【3 5 】。这和递归神经网络中学习梯度的逐渐消失有 关( h o c h r e i t e r 和s c h m i d h u b e r , 1 9 9 7 ) p 6 1 。一种被称之为长的短时记忆l s t m 递 归神经网络可以解决这一问题( f e l i xa g e t s 和j u r g e ns c h m i d h u b e r ,2 0 0 1 ) 鲫。 d o u g l a se c h 2 0 0 2 ) 【3 明已成功地使用l s t m 递归神经网络来学习蓝调音乐并能够 生成类似风格的新音乐。 7 中国五声性调式和声的自动配置的研究 人工神经网络为算法作曲在方法上提供了一种选择。它能松散地模拟人脑中 的活动。但它似乎并不有效。因为在一个人工神经网络能创作旋律之前,先必 需收集大量的作品来训练它。因此,人工神经网络技术更适合用于分析音乐作品 而不是创作【3 羽。另一方面,和知识库的方法相比较,人工神经网络通常只能解 决简单得多的游戏性质的音乐创作问题( t o i v i a i n e n , 1 9 9 9 ) p 5 。 而至本世纪以来,将统计学理论和技术( 如隐马尔克夫模型技术等) 应用 于旋律配置和声的算法作曲的研究已成为当前及将来的重要发展趋势( m a r t i n r o h r m e i e r , 2 0 0 6 ) 3 9 1 。近期这方面的工作有:如a l l a n 和w i l l i a m s ( 2 0 0 4 ) t 1 1 1 以 巴赫的四声部众赞歌( c h o r a l e ) 作为数据集合来训练2 个隐马尔克夫模型。 其中,第一个隐马尔克夫模型的观察值是旋律中的一个音符( 四声部众赞歌中 的第一声部为旋律声部) ,隐含状态是以单拍子( 4 分音符) 为单位的和弦标 识。此隐马尔克夫模型的训练参量代表了巴赫四声部众赞歌风格的和声结构。 第二个隐马尔克夫模型涉及装饰性的和声外音的添加。最后,使用v i t e r b i 算 法实现为一输入的旋律声部生成巴赫风格的四声部众赞歌。 j f p a i e m e n t ( 2 0 0 5 ) 1 4 0 】等人基于训练的数据提出了一种为给定的旋律配置非常 有趣的和声的图模型。这种图模型会比隐马尔克夫模型更好地获取展示全局相 关的根音的运动。但同时指出,在根音运动确定的情况下,基于局部相关的简 单隐马技术似乎就足以生成合适的和声。 2 5 其他方法 此外,目前在世面上流行的被称为自动伴奏乐队的音乐伴奏软件b a n di na b o x 4 1 1 。但必须指出的是这类音乐伴奏软件通常是一些辅助性质的音乐创作或配 器软件。它们通常含有对人的介入程度要求比较高的人机界面。如系统在为一首 歌的旋律设计伴奏时,会要求你以小节为单位依次为旋律指定根音并在一个和弦 库中选择、试听及确定适当的和弦,然后在一个风格库里选择由不同音色构成的 伴奏织体和音型以便最终生成整个伴奏旋律。也就是说这类产品可理解为半自动 的旋律配和声系统。在最近的版本b a n di nab o x l 2 中提高了一定的自动化程度。 无论如何,它也应是目前旋律配和声水平的一个代表。 第二章相关研究概况 在多声音乐自动创作系统的研究中,也有不少学者涉及复调音乐自动创作 系统的研究。最早的计算机对位程序是w i l l i a ms c h o t t s t a e d t ( 1 9 8 9 ) t 4 2 1 开发的 c o u n t e r p o i n ts o l v e r 。该程序严格地遵循j j f u x 在1 7 2 5 年左右所给出的有关 对位形式的注释并生成十六世纪通常风格的逻辑对位。f a r b o o d 和 s c h o n e r ( 2 0 0 1 ) 4 3 1 使用隐马尔克夫模型及v i t e r b i 算法成功地为具有巴基斯坦风 格旋律配置对位声部。 必须指出的是目前对机器作曲的质量评估没有什么标准的方法。但是,我 们通常可以判断一个自动作曲系统是否有能力模仿某位作曲家的音乐作品或某 一地区音乐作品的风格。而判断一个自动作曲系统所创作的作品是否为好的或差 的这却是见人见智的。因为,不同地区,不同时代,不同背景的人各有其不尽相 同的美学价值和观念。 2 6 主要创新点 本文以中国民族风格化的五声性调式和声理论为依据,建立了中国民歌 ( 旋律) 配钢琴伴奏的h m 模型,并以v i t e r b i 算法为辅助,建立了和声自动 伴奏模型,这个模型可以从一定程度上模拟作曲家在从事音乐创作这一特定过程 中他( 她) 的思维方式。我们可以在一定程度上,实现机器模拟某一作曲家或 某一地区音乐作品的创作风格。在应用上,一个能够模仿中国民族、民间不同音 乐风格的算法作曲系统或辅助作曲系统能够启发中国民族、民间音乐作曲家的音 乐创作灵感,同时它还能提高作曲家音乐创作的生产力。对弘扬我国民族、民间 音乐具有深远的意义。 本项目研究的特色和创新之处是: 1 由于涉及复杂的钢琴伴奏技术以及中国民族风格化的五声性调式和声 结构,所以在整个三声部音乐的纵的方向上会形成不确定的多音和声结 构。即,不像大多其它系统那样,主要生成的是纵向固定的四音结构的 标准四声部合唱曲形式( 四声部合唱曲中,每个声部都是单音的) 2 a 1 1 锄f l i l 应用隐马尔克夫模型及v i t e r b i 算法实现了模仿巴赫风格的旋律 配和声系统。我们的工作,从技术上来讲是在a l l a nt 作基础上展开的。 9 中国五声性调式和声的自动配置的研究 必须指出的是在a l l a n 的旋律配和声隐马尔克夫模型中,单拍子被固定 地作为一个和弦配置的基本单位。该和弦被作为隐含状态。而在这个拍 子内相对应的旋律声部的旋律片段中,仅选出一个音作为隐马模型的观 察值。这种做法仅适合于曲式及和声结构较规整的巴赫四声部众赞歌音 乐体裁。而在钢琴伴奏谱中,为旋律设计的和声配置单位,往往不总是 固定的单拍子。应对不同的乐曲,选择不同长度的旋律片段( 单拍子 或整小节) 中的若干骨干音作为观察值并将该旋律片段所对应的调式特 征和弦作为隐含状态。 3 a l l a n 的系统没有曲式( 即乐曲的形式结构) 分析部分。因此,系统没有 乐段划分程序。这会导致系统在使用v i t e r b i 算法实现旋律配和声时,由 于无法判断输入旋律是否处于乐段的收束( c a d e n c e ) 处( 即乐段的结 束处) 而错将一个非收束调式主和弦的结构用在乐段的收束处。 4 a l l a n 的系统中的2 个隐马尔克夫模型没有涉及对巴赫四声部众赞歌中 声部间节奏对比方面的学习( 这在音乐作曲技法上,被称为主调音乐中 的可能出现的局部对比复调手法的学习) 。而声部间节奏对比问题在为 民歌( 旋律) 配置钢琴伴奏谱问题上,却显得特别重要。 5 民歌( 旋律) 的节拍信息确定了旋律片段节拍的强弱分布。它会影响民 歌( 旋律) 片段和声特征的判定。 1 0 第三章隐m a l k o v 模型 第三章隐m a r k o v 模型 3 1 隐m a r k o v 模型简介 3 1 ih m m 的基本概念 隐m a r k o v 模型作为一种统计模型,在很多领域都有很多广泛的应用,如语 音信号处理。隐m a r k o v 模型最初是7 0 年代b a u m 等人建立起来的,随后由c m u 的b a k e r 和i b m 的j e l i n e k 等人将其应用到语音识别中。在八十年代初b e l l 实验 室r a b i n e r 等人对i - i m m 进行深入介绍,提出将这一方法用于非特定人语音识别。 而自从1 8 世纪以来,作曲家开始使用计算机辅助作曲,在本世纪a l l a n 开始使 用隐m a r k o v 应用到计算机辅助作曲,这一方法也逐渐成为音乐研究的一个热点。 h m m 是在m a r k o v 链的基础上发展起来的。由于实际问题比m a r k o v 链模型 所描述的更为复杂,观测到的时间并不是与状态一一对应,而是通过一组概率 分布相联系,这样的模型就称为h m m ,它是一个双重随机过程,其中之一是 m a r k o v 链,这是基本随机过程,它描述状态的转移。另一个随机过程描述状态 和观察值之间的统计对应关系。这样,站在观察者的角度,只能看到观察值, 不像m a r k o v 链模型中的观察值和状态的一一对应,因此,状态不能直接看到, 而是通过一个随机过程去感知状态的存在及其特性,因而称之为“隐m a r k o v 模型,即h m m 。 h m m 是一种随机概率模型,它既描述了音符( 串) 间特征的动态变化,又 能很好的描述音符( 串) 间统计分布的概率特征,是进行乐曲中音符( 串) 间分 析的有力工具。 h m m 模型由两个相互关联的随机过程共同描述音符( 串) 的统计特征, 其中一个是隐藏的( 不可测量的) 具有有限状态的m a r k o v 链,另一个是与m a r k o v 链的每一状态相关联的观察矢量的随机过程( 可观测的) 。隐m a r k o v 链的特性 要靠可观测信号的特征解释,这样时变音符( 串) 某特征就由对应状态观察符 号的随机过程描述,而音符( 串) 随时间的变化由隐m a r k o v 链的转移概率描述。 中国五声性调式和声的自动配置的研究 3 1 2h m m 的定义 一个离散符号观测值h m m 可以由下列参数描述: 1 ) n :模型d p m a r k o v 链状态数目。尽管状态是隐含的,但是对于大多数 实际的应用来说,通常有一些物理意义与状态或是模型的状态集合相关。一般来 说,状态是以某种方式互相连接的,从任一状态都可到达其它状态( 也就是各态 遍历) 。记n 个状态为b ,氏,记该0 m 捌( 0 v 链所处的状态为q t ,显然 毋( 幺,靠) 。 2 ) m :每个状态对应的可能的观测值数目。观察值符合对应着模型系统的输 出。记m 个观测值为v = “, ,记t 时刻观察到的观测值为q ,其中 o i “,) 。 3 ) 7 f , :初始状态概率矢量,石= 饥) ,其中 乃= p ( q l = 只) ,1 f n ( 3 一1 ) 4 ) a :状态转移概率矩阵,a = q ,) ,其中 = p ( g r + l = p ,l 吼= 2 ) ,l f ,j n ( 3 - 2 ) 对于单步从一个状态到达其它状态的特殊情况,对于所有的l 歹有 0 。对于其他的h m m ,可能有= 0 。 5 ) b :观测值概率矩阵,曰= h i c k ) ) ,其中 b j ( k ) = p ( o t = 咋i 绋= 只) ,l j n ,1 k m ( 3 - - 3 ) 这样可以记一个h m m 为: 九= ( m7 c ,a ,回( 3 4 ) 或者简写为: 允= ( 兀,a ,田( 3 5 ) 更为形象地说,h m m 可分为两部分,一个是m a r k o v 链,兀,a 描述,产生 的输出为状态序列,另一个是一个随机过程,由b 描述,产生的输出为观察序列, 如图所示,t 为观察值时间长度。 l m k o 谁 q i ,q 2 - q t 随机过程 0 t ,0 2 ,o t ( 兀,a ) , ( b ) ,r 壮泰序葫l观察值序列 图3 1 由m a r k o v 链和随机过程组成的h m m 1 2 第三章隐m a r k o v 模型 实际情况下,观察密度常常是连续的,所以在实验中采用具有连续观测密度的 h m m 模型,观测密度函数为混合高斯密度函数。 采用混合高斯密度函数时,观测密度的概率密度函数的表现形式为: m b , ( o , ) - - z c , n o ( o , ,锯j m ,s j 0i j n 其中,o t 是待求模型的观测矢量,在本论文中,o t 是m f c c 倒谱矢量;哂 是状态j 的第m 个混合系数,也就是混合增益因子;n o 是高斯分布的密度函数; 啪是状态j 的第m 个混合分量的均值矢量;s j m 是状态j 的第m 个混合分量的协 方差矩阵。实际上0 。的分量基本上不相关,所以,s j m 成为对角型协方差矩阵h ( o o 可表示为: m d一 c 加兀 e x p - ( o , ) d ) - u 朋d ) 2 ( 2 s 加d ) 】r 2 万) 乃( q ) = 坐l 丝矿一 ( ns j = d ) 2 d = l 上式应该满足以下统计约束条件 = li j n m - i c _ o i j n ,l m 在t 时刻处于状态i 的概率。前向概率毗( i ) 可用下面的递 中国五声性调式和声的自动配置的研究 推公式计算: ( 1 ) 初始化 q ( f ) = 乃包( q ) 1 的概率。 后向概率屈( f ) 也有类似的递推公式计算: ( 1 ) 初始化 屏(f)=1,1fn(3-14) ( 2 ) 迭代计算 层( f ) = a o b j ( o , + 1 ) 屏+ l u ) 1a t t - 1 ,i j n( 3 1 5 ) ( 3 ) 终结 p ( d i 五) = 届( f ) 3 3 1 2b a u m - - w e l c h 算法 ( 3 1 6 ) 前向概率和后向概率巧妙地将整个观察序列对h m m 模型的输出概率分成 1 6 第三章隐m a r k o v 模型 两个部分观察序列的输出概率乘积,而且他们各自都有相应的递推公式,可以大 大简化计算。而这个算法实际上是解决删训练问题,即h m m 参数估计问题, 或者说,给定一个观察值序列d 旬1 0 2 o t ,该算法能确定一个九= 魄a ,回,使 以d 1 名) 最大 显然,由( 3 1 0 ) 和( 3 1 3 ) ,输出概率计算公式为 e ( o l a ) - a , ( o a l , b j p , “( d ,l t p ( o l - t ) ,即由重估公式得到的互比允在表示观察值序列鲂面要好。那 么,重复这个过程,逐步改进模型参数,直到p ( o i x ) 收敛,即 不再明显增大,此时的旯即为所求的模型。 3 2 2v i t e r b i 算法 使用全概率公式,可以计算出系统的输出概率,但是无法找到一条最佳的状 态转移路径。而用v i t e r b i 算法,不仅可以找到一条足够好的状态转移路径,还 可以得到该路径所对应的输出概率。同时,用v i t e r b i 算法计算输出概率所需要 的计算量要比全概率公式的计算量小很多。 这个算法解决了给定一个观察值序列o = o l , 0 2 ,o r 和一个模型扣( 兀,a , c ,p ,u ) ,在最优的意义上确定一个状态序列q 。= q i ,q 2 ,q t 的问题。 “最优”的意义有很多种,由不同的定义可得到不同的结论。例如,一个可 能的优化准则就是选择在每个时刻t 概率最大的状态q t 。这一优化准则能最大化 单独状态的期望数目。为了解决如何选择对应的最优状态序列这个问题,定义后 验概率变量:以o ) = p ( q t = 6 i1 0 ,旯) 。( 3 - - 2 2 ) 也就是说,给定观察序列0 和模型入,求解在t 时刻处于状态e 的概率。以( f ) 有 1 8 第三章隐m a r k o v 模型 多中表达形式, 以( d = p ( 吼= 2ld ,允) 一p ( o ,吼= q l 五) = :- - :- - - ;- - p ( o i 兄) :善业盟 ( 3 2 3 ) p ( o , q t = 幺l i , - i 因为p ( o ,q t = 幺i 五) 等于a , ( o p , ( o a ,以( f ) 还能写成 以( f ) :手咝盟 ( 3 2 4 ) q ( 鹕( 力 利用乃( d 能够解出在t 时刻最可能的状态q t , z = a r g m i n y t ( 纠,1 s , ( 3 - - 2 5 ) 尽管上式能最大化正确状态的期望值,但是所得到的状态序列可能有些问题。例 如当h m m 具有零状态转移概率,“最优 状态序列不是一个有效的状态序列 这是因为上式只是简单地定义了每个实例的最可能状态,并未考虑状态序列出现 的概率。 上述问题可能的解决就是修改这个优化准则。我们可以求解能最大化正确的 状态对( 级,甄) 的期望值的状态序列。一个基于动态规划方法寻找单个存在的最 优状态序列的标准算法叫做v i t e r b i 算法。 v i t e r b i 算法可以叙述如下: 定义4 ( d 为t 时刻时沿一条路经g l ,q 2 ,吼,且吼= 谚,产生出口l ,0 2 ,q 的 最大概率,即有 4 ( d = m a xp ( 吼,q 2 ,g f ,吼= 只,o l ,d 2 ,d fi 五) ( 3 - - 2 6 ) 啦一l r 一# - i 那么,求取最佳状态序列q 幸的过程为 1 初始化:4 ( f ) = 死6 j ( d 1 ) ,l i n ( 3 - - 2 7 ) 1 9 中国五声性调式和声的自动配置的研究 ( d = 0 ,1 f n ( 3 2 8 ) 2 递归:4 ( _ ,) 2 曷嚣【4 一l ( f ) a :f 】屯( d f ) ,2 ,i j

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论