(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf_第1页
(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf_第2页
(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf_第3页
(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf_第4页
(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(信号与信息处理专业论文)基于音色单元分布的音乐结构分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

l 一 f 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指 导下,独立进行研究所取得的成果。除文中已经注明引用的 内容外,本论文不包含任何其他个人或集体已经发表或撰写 过的科研成果。对本文的研究作出重要贡献的个人和集体, 均已在文中以明确方式标明。本声明的法律责任由本人承 担。 论文作者签名:盘煎过 日期:兰乡:皇:留 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规 定,同意学校保留或向国家有关部门或机构送交论文的复印 件和电子版,允许论文被查阅和借阅;本人授权山东大学可 以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或其他复制手段保存论文和汇编本 学位论文。 。 ( 保密论文在解密后应遵守此规定) 论文作者签名:趟箩师签名:狐譬幺l 一日 期:观竺型 iltrhdjhhfdef晖。 山东大学颁十学位论文 目录 摘要1 a b s t r a c t i l i 第一章绪论1 1 1 研究目的及应用价值1 1 2 音乐结构分析技术发展现状2 1 3 论文主要研究内容5 第二章基本乐理表达7 2 1 基本乐理7 2 1 1 音、乐音及噪音7 2 1 2 音高、音值、音强及音色8 2 1 3 纯八度与十二平均律9 2 1 4 节奏与旋律l0 2 1 5 调式与调性l0 2 2 音乐结构l l 2 2 1 织体1l 2 2 2 曲式1 1 第三章音频特征提取及相似性l3 3 1 音频特征13 3 1 1m f c c s 13 3 1 2c q t 1 4 3 1 3c q s 14 3 1 4c h r o m a 15 3 1 5d c t b a s e dc h r o m a 1 6 3 2 相似性距离测度16 3 2 1 欧式距离17 3 2 2 余弦距离1 7 3 2 3 结构距离17 3 2 4k l 距离l9 3 3 本章小结2 0 山东大学硕十学何论文 第四章音乐结构分析算法2l 4 1 相似性矩阵算法21 4 2l b g 聚类算法2 4 4 3f i s h e r 准则2 6 4 4 本章小结2 7 第五章基于音色单元分御的结构分析2 8 5 1 预处理2 8 5 2 特征提取2 9 5 3 音色单元聚类3 2 5 3 1 音色单元3 2 5 3 2 音色单元聚类3 2 5 4 候选边缘分析3 4 5 4 1b i c 3 4 5 4 2 候选边缘分析算法3 5 5 5 音色单元分布直方图聚类3 7 5 5 1 直方图3 7 5 5 2b i c 算法边界合并3 8 5 5 3 :卣方图聚类3 9 5 6 结构边界调整41 5 7 评价标准4 3 5 7 1p a i r w i s ef m e a s u r e 4 3 5 7 2 纯度4 3 5 8 实验结果4 5 5 8 1 实验测试乐曲库4 5 5 8 2 实验结果4 5 5 9 本章小结4 9 第六章总结与展望5l 参考文献5 3 攻读学位期间发表的学术论文5 6 致谢5 7 山东大学硕+ 学位论文 c o n t e n t s c h i n e s ea b s t r a c t ,i a b s t r a c t i i i c h a p t e r1 i n t r o d u c t i o n 1 1 1r e s e a r c hg o a l sa n da p p l i c a t i o n s 1 1 2s t a t eo fm u s i cs t r u c t u r ea n a l y s i s 2 1 3m a i nt o p i c s 5 c h a p t e r2b a s i cm u s i ct h e o r ye x p r e s s i o n 7 2 1b a s i cm u s i ct h e o r y 7 2 1 1s o u n d m u s i ct o n ea n dn o i s e 7 2 1 2p i t c h ,d u r a t i o n ,l o u d n e s sa n dt i m b r e 8 2 1 3o c t i v ea n dt w e i v et e m p e r e ds c a l e 9 2 1 4r h y t h ma n dm e l o d y 10 2 1 5k e ya n dt o n a l i t y 10 2 2m u s i cs t r u c t u r e 1l 2 2 1t e x t u r e 1l :! 2 2f o r m ,11 c h a p t e r3m u s i cf e a t u r ee x t r a t i o na n ds i m i l a r i t y 13 3 1m u s i cf e a t u r e 13 3 1 1m f c c s 1 3 3 1 2c q t 14 3 1 3c q s 1 4 :;1 z lc h r o m a 11 ; 3 1 5d c tb a s e dc h r o m a 16 3 2s i m i l a r i t yd i s t a n c em e a s u r e 16 3 2 1e u c l i d e a nd i s t a n c e 1 7 3 2 2c o s i l i ed i s t a n c e 17 3 2 3s t r u c t u r eb a s e dd i s t a n c e 17 3 2 4k ld i s t a n c e l9 : 3c h a p t e rs u m m a r y 2 0 山东大学硕士学位论文 c h a p t e r4m u s i cs t r u c t u r ea n a l y s i sa l o g o r i t h m 21 4 i s i m i l a r i t ym a t i r xa i o g o r i t h m 21 4 2l b gc l u s t e r i n ga l o g r i t h m 2 4 4 3f i s h e rr u l e 2 6 4 4c h a p t e rs u m m a r y 2 7 c h a p t e r5s t r u c t u r ea n a l y s i sb a s e do nt i m b r eu n i td i s t r i b u t i o n 2 8 5 1 p r e p r o c e s s i n g 2 8 5 2f e a t u r ee x t r a c t i o n 2 9 5 3t i m b r eu n i tc l u s t e r i n g 3 2 5 3 1t i m b r eu n i t 3 2 5 3 2t i m b r eu n i tc l u s t e r i n g 3 2 5 4c a n d i d a t eb o u n d a r ya n a l y s i s 3 4 5 4 ib i c 3 4 5 4 2c a n d i d a t eb o u n d a r ya n a l y s i sa l g o r i t h m 3 5 5 5 h i s t o g r a mc l u s t e r i n gb a s e do nt i m b r eu n i td i s t r i b u t i o n 3 7 5 5 1h i s t o g r a m 3 7 5 5 2b o u n d r a ym e r g eu s i n gb i c a l g o r i t h m 3 8 5 5 3h i s t o g r a mc l u s t e r i n g 3 9 5 6s t r u c t u r eb o u d a r ym o u d u l a t i o n 4 1 5 7e v a l u a t i o nm e a s u r e s 4 3 5 7 1p a i r w i s ef - m e a s u r e 4 3 5 7 2p u r i t y 4 3 5 8e x p e r i m e n tr e s u i t s 4 5 5 8 1e x p e r i m e n tt e s td a t a b a s e 4 5 5 8 2e x p e r i m e n tr e s u l t s 4 5 5 9c h a p t e rs u m m a r y :4 9 c h a p t e r6c o n c l u s i o n sa n do u t l o o k 51 r e f e r e n c e s 5 3 p u b l i s h e dp a p e r s 5 6 a c k n o w l e d g e m e n t 5 7 山东大学硕十 摘要 音乐的结构足音乐作品表达作者思想的一种重要形式,也是听众理解 音乐作品内涵的有效途径。音乐结构通常包括序曲、寸:歌、副歌、过渡段 和尾声,因- 向音乐结构分析的目的就是将一首歌曲的这些组成部分划分出 来并给出标号。音乐结构分析是音乐理解研究的一个重要领域,在很多领 域都有着重要的应用。 音乐结构分析主要有“状态”表示和“序列”表示两大类方法。本文研究 了基于音乐特征的音色单元建模方法,研究了存f i s h e r 准则下,根据局部 范围音色单元的分布,采用非监督聚类方法分析音乐的结构。 奉论文的主要研究工作及创新点如下: 1 应用基于音乐特征的音色曾元建模的方法进行音乐结构分析,算法主 要包括预处理、音色单元分析及结构分析j 部分,从“状态”角度以聚 类的思想分析音乐结构,减少了结果中碎片的产生。 2 引入基于离散余弦变换的( d c t b a s e d ) c h r o m a 特征进行音乐结构分 析,实验结果验证了其对音色变化确实具有更强的鲁捧性。 3 采用了音色单元分布直方图聚类的算法,并引入了修正后的f i s h e r 准 则,得到最佳聚类结果。 4 根据b a y e s i a ni n f o r m a t i o nc r i t e r i o n 算法的思想,提出了候选边缘分析 算法,确定出最佳的候选边界点,优化直方图聚类结果。 5 尝试从“序列”角度用相似性矩阵方法来分析音乐结构,发现阈值选择 的恰当与否,直接关系到找出相似性段落的完整性程度,从而影响到 音乐结构的切分效果。而本文提出的算法,则能保证找出所有的相似 性段落。 实验结果证明了基于离散余弦变换的音色特征,用音色单元分布聚类 算法进行音乐结构分析的有效性。 关键词:音乐结构分析;副歌;d c t b a s e dc h r o m a ;f i s h e r 准则;b a y e s i a n l n f o r m a t i o nc r i t e r i o n 山东大学硕士学位论文 o 山东人学硕十学f 讧论文 a b s t r a c t m u s i cs t r u c t u r ei sn o to n l ya n i m p o r t a n tf o r m o ft h em u s i cw o r k st o e x p r e s sa r t i s t s i d e a s ,b u ta l s oa ne f f e c t i v ew a yf o rt h el i s t e n e rt ou n d e r s t a n d t h em e a n i n go ft h em u s i c t h es o n gs t r u c t u r eg e n e r a l l yc o m p r i s e so f i n t r o d u c t i o n ( i n t r o ) ,v e r s e ,c h o r u s ,b r i d g ea n de n d in g ( o u t r o ) t h e r e f o r e , t h ea i mf o rm u s i cs t r u c t u r ea n a l y s i si st os e g m e n tap i e c eo fm u s i ci n t os m a l l s e c t i o n sa n dt ol a b e le a c ho ft h e m m u s i cs t r u c t u r ea n a l y s i si sa ni m p o r t a n t a n df u n d a m e n t a lf i e l di nm u s i cu n d e r s t a n d i n gr e s e a r c h ,w h i c h p l a y sa n i m p o r t a n tr o l ei nm a n yf i e l d s t h e r ea r et w op r i n c i p l ea p p r o a c h e sf o rt h em u s i cs t r u c t u r ea n a l y s i s , n a m e l y “s t a t e a n d “s e q u e n c e ”a p p r o a c h t h i sp a p e rp r o p o s e sat i m b r eu n i t m o d e l i n gm e t h o db a s e d o nm u s i c a lf e a t u r e s ,u s i n gu n s u p e r v i s e dc l u s t e r i n g m e t h o dt oa n a l y z em u s i cs t r u c t u r ea c c o r d i n gt ot h ed i s t r i b u t i o no fl o c a lt i m b r e u n i t s ,w i t ht h ea m e n d e df i s h e rr u l e t h et h e s i sc o n t a i n st h ef o l l o w i n gw o r k sa n dc o n t r i b u t i o n s : 1 t i m b r eu n i tm o d e l i n gm e t h o db a s e do nm u s i c a lf e a t u r e si su s e dt oa n a l y z e m u s i cs t r u c t u r e ,w h i c hc o m p r i s e so ft h r e ep a r t s :p r e p r o c e s s i n g ,t i m b r e u n i t a n a l y s i s ,a n d s t r u c t u r e a n a l y s i s s t a t eb a s e da p p r o a c h r e d u c e s f r a g m e n t a t i o n si na u d i os e g m e n t a t i o nu s i n gc l u s t e r i n gt e c h n i q u e 2 d c t b a s e dc h r o m af e a t u r ei su s e di nm u s i cs t r u c t u r ea n a l y s i s ,w h i c h i n d e e dg a i n sas i g n i f i c a n tb o o s tt o w a r d st i m b r ei n v a r i a n c e 3 ah i s t o g r a mc l u s t e r i n gm e t h o db a s e do nt i m b r eu n i td i s t r i b u t i o ni su s e dt o g e tt h eo p t i m a lc l u s t e r i n gr e s u l tu s i n gt h ea m e n d e df i s h e rr u l e 4 ac a n d i d a t eb o u n d a r ya n a l y s i sm e t h o db a s e do nb a y e s i a ni n f o r m a t i o n c r i t e r i o nm e t h o di sp r o p o s e dt ol o c a t et h eo p t i m a lb o u n d a r yi no r d e rt o o p t i m i z et h eh i s t o g r a mc l u s t e r i n gr e s u l t 5 s e q u e n c eb a s e da p p r o a c hu s e ds i m i l a r i t ym a t r i xt oa n a l y z et h em u s i c s t r u c t u r e w en o t i c et h a tw h e t h e rt h es e l e c t e dt h r e s h o l di ss u i t a b l eo rn o t w i l ld i r e c t l ya f f e c tt h ec o m p l e t e n e s so ft h es i m i l a rl i n e s ,w h i c hw i l l i n f l u e n c et h es e g m e n t a t i o nr e s u l t so fm u s i cs t r u c t u r e w h i l eo u rm e t h o d p r o p o s e di nt h i st h e s i sw i l lf i n da l lo ft h es i m i l a r i t yl i n e s i i i i v s t e r i n ga l g o r i t h m r o m a ;f i s h e rr u l e ; 山东大学硕十学位论文 1 1 研究目的及应用价值 第一章绪论 音乐结构是音乐的重要表达方式,也是最重要的音乐语义之一。在音 乐作晶中,结构涉及两个方面:“空间”上的结构与“时间”上的结构,前者 称为织体,后者称为曲式。目前对音乐的结构分析主要是分析它的曲式结 构,一力面的原因是相比织体f m 式更容易把握与分析并可以可视化,其次 是曲式应用的广泛性。所以本文将对音乐的曲式结构进行分析。 音乐般表现出较强的自棚似性,因而有些重复的类型以及显著的 重复性结构2 1 。歌曲结构一般由序曲、主歌、副歌、过渡段和尾声组成, 所以对音乐结构进行分析,一般是将一首乐曲进行切割,标注出各个段落, 出现频率最高的部分最有可能就是在西方流行音乐中所谓的副歌部分3 1 , 而副歌部分较其它段落具有更广泛的应用,所以对副歌部分的提取以及对 音乐结构的分析具有很重要的意义。 音乐结构自动分析是音乐理解研究的一个很重要的领域,这在整个音 乐分析领域属于基础研究。其应用大致有如下几个方面: 1 计算机辅助音乐理解与分析 音乐结构分析在音乐理解和分析上占有重要地位,它能实现一部分人 工音乐结构分析工作自动化,减轻相关工作人员的负担。其直接应用就是 由标注的结果根据乐理规则推断曲式、音乐体裁、音乐风格、音乐类型等 筮【l 】 寸 o 2 歌曲识别 分割后得到的各个段落可以用来作为确定歌曲的部分声纹;分割后的 段落信息可以用来区分不同的歌曲,同样也可以用来识别同一首歌曲中不 同段落的特性f 4 1 。 3 音乐摘要 副歌可以作为一首歌曲的摘要。副歌的自动检测对于构建一个以类似 人类的方式进行理解音乐音频信号的计算模型是必不可少的,并且对很多 山东大学硕+ 学位论文 实际的应用都有很大的用处。在音乐浏览器或者音乐检索系统中,它使得 用户能够快速地预览一首歌曲的副歌部分,将之作为“音频索引”来找到期 望得到的歌曲。通过仅仅用副歌部分进行匹配查询的歌曲,它还能提高音 乐检索系统的效率和精度【3 1 。 4 音乐浏览及音乐检索 分割对基于内容的音乐查询系统起到了极大地帮助作用,表现在分析 查询的歌曲( 如果候选歌曲在一些风格上比较相近,这个被查询的歌曲可能 会用到整首歌曲) 以及减少查询歌曲与乐曲库进行匹配的空问1 4 1 。 5 有助于其他新研究的发展 音乐结构的分析能促进其他新研究的发展,主要用于音乐标注、音乐 流式传输【3 l 、在线音乐目录浏览、文档浏览、m p e g 7 标准提出的用元数 据( m e t a d a t a ) 来存储多媒体摘要信息【5 l 。l 司时还能用于结构感知音乐播放 器、主动音乐倾听( 文件间的浏览) ,音乐目录的声音浏览( 使用自动产生的 音频摘要或者使用自动定位的副歌,主调乐句,音频索引) ,音乐创作( 自 动分割成认知能力相似的部分,音乐马赛克) ,媒体压缩等【6 】。 1 2 音乐结构分析技术发展现状 目前该领域国外研究较多,有偏重于音乐学理论上的结构分析【7 1 ,也 有针对于特定歌曲类别的结构分析【8 】,但大多的都是应用层次上的针对大 多数音乐尤其是流行音乐的结构分析。根据音乐结构的表示形式,目前音 乐结构分析方法主要有“状态”与“序列”表示两种方法 6 , 9 , 1 0 】。 1 “状态”表示 “状态”定义为包含相同声音信息的邻近时问的集合。“状态”一词与流 行音乐中“部分”( 如序曲、主歌、副歌和过渡段) 一词密切相关。 大多数的研究者都用状态来表示音乐结构,将音频信号看成是一系列 不同尺度的状态,对应于一首音乐的不同尺度的结构 5 , 1 0 , l l 】。例如m i t m e d i al a b o r a t o r y 的w e ic h a i 等人选取音高及谱表示作为特征进行提取 1 1 l ,并用动态规划方法( d p ) 进行模式匹配,之后采用匹配极小值点作为重 复性检测的依据,接着进行重复片段的合并,最后给出用状态表示的结构 2 山东大学颁+ :学付论文 分析结果。实验结果证明该方法有一定的前景。2 0 0 8 年,芬兰t a m p e r e 技术大学j p a u l u s 等州m e lf r e q u e n c yc e n t r u mc o e f f i c i e n t s ( m f c c s ) , c h r o m a ,r h y t h m o g r a m 作为特征来进行提取l 引,提出了片段成对匹配的新 算法,并应用了一种新颖的搜索算法b u b b l et o k e np a s s i n g ( b t p ) 使得木文 提出的或然最佳准则函数达到最优,给出最佳的音乐结构分析结果,比穷 举算法节省了很大的计算量。这方面的研究很多,在此不一列举。其中, 2 0 0 2 年,法国g p e e t e r s 等人没有利用m f c c s ,c h r o m a g r a m ,p i t c h 等特征 量的信息f 1 0 】,他们认为这些特征都是静态的,不能很好的反映歌曲在时间 上的发展,所以他们直接利用输入的音频信号进行动态特征的分析,这些 动态特征能够比较容易地找到重复的片段,并使得数据量大大减少,然后 利用m u l t i p a s s 的方法进行分析音乐结构,并用状态表示各个部分。试验 结果证明该方法有定的前景,但它只适用于具有某种重复性质的某些类 歌曲,所以该方法有+ 定的局限性。 状态表示算法主要有:切割【2 1 、凝聚聚类或谱聚类算【1 3 , 1 4 , 15 1 或隐马尔 科夫模型等1 3 , 1 6 。 2 “序列”表示 序列定义为一个连续时间的集合,它与另一个连续时间的集合类似。 它与流行音乐中的旋律或者和弦一词紧密相关。用序列的方法将得到一个 比状态表示方法更高精度的表示。 这种情况下,有些研究者用到动态时间规整( d t w ) 或模式匹配算法 心1 6 , 1 7 , 1 8 ,最近的一些方法是将d t w 与分层的方法相结合来进行音乐结构 探测。尽管这些方法有一定的效率,但d t w 方法需要耗费大量的计算时 间,为了改善这种状况,2 0 0 7 年,法国g p e e t e r s 提出了一种基于最大似 然算法的方法来估计一首乐曲的序列 6 1 。该方法从全局的方式来解决了估 计问题,使得序列能够以最佳的方式来解释观察到所有的片段,实验证明 了此估计方法速度远远超过通常的d t w 算法。但序列估计的算法还有待 改进,此外还需要找到其他的测量手段来评价序列彳卉计的质量。 音乐结构分析实际上就是对一首歌曲进行切割,得到各个部分的表 示。根据选取的特征量的不同,目前可以将音乐结构分析方法分成三类, 分别为基于谱形状的分割,基于泛音切割与基于节奏和音高的分割。 3 山东大学硕十学何论文 1 基于谱形状的分割 用宽谱特征来评价结构相似性,那么得到的分割后的每个片段是谱均 匀的。在此类方法研究者几乎都采用m f c c s 特征量来描述谱的特征 1 6 1 2 ,9 ,2 0 2 。1 ,它实质上反映了音色的特征。m i tm e d i al a b o r a t o r yw e ic h a i 等人中用谱表示以及音高表示作为特征量l ,并依次进行模式匹配,重复 性检测,片段合并,结构标号,最后得到音乐结构的表示。结果表明该方 法取得了一定的前景,但它仅限于对某些歌曲结构的分析。 2 基于泛音的切割 该方法侧重泛音向非音色结构,主要采用c h r o m a 描述1 2 个同性质的 音高类间的功率谱能量的分布1 3 2 2 。2 0 0 3 年,m g o t o 给出的r e f r a i d 系 统pj ,可检测副歌及转调后的副歌,使副歌检测得到很大改进。 3 基于节奏和音高的切割 一些研究者采用符号【2 3 】或者通过n g r a m l 2 4 1 的统计分析的方法进行结 构分析,试图用基于字符串的表示来确定出音乐的重复的主题内容。虽然这 些方法在从乐谱信息中确定音乐结构有一定的前景,但是他们在从音频信 号角度进行结构分析适用性不是很好。尽管如此,这些方法主要用于通过 例子或者哼唱来查询的文档查询系统。 最近一些研究者尝试将音频与符号表示相结合来统一不同角度上的 相似性。2 0 0 4 年新加坡国立大学计算机学院m a d d a g e 等人给出了一个用 分音( p a r t i a l ) 标注来确定结构的系统【1 8 1 。该系统将拍子跟踪,节奏提取, 和弦检测以及旋律相似性整合到一个启发式的架构中用来检测一首歌曲 的所有片段。他们还提出了使用八度尺度而不是美尔频率尺度上的倒谱系 数作为音高导向的表示。实验结果显示了对乐器部分的检测准确度可达 l0 0 ,并最后给出并标号各个部分:主歌,副歌,过渡段,序曲,尾声。 但过渡段的检测准备度相对较低,有待提高。同年在国内,微软亚洲研究 院l ul i e 等人描述了一种基于h m m 的方法来进行切割,他们除了使用 l m f c c s 特征之外,还使用了去t h o c t a v ec o n s t a n tq 带通滤波器来进行音高 i z 的选择【2 1 。实验结果表明,当使用相似性矩阵的方法,对于给定的目标函 数用穷举搜索来找到最佳片段边缘时,结合c o n s t a n tqt r a n s f o r m ( c q t ) 变 4 山东大学硕十学位论文 换的m f c c s 要比单独使用m f c c s 的切割性能有所改善。 国内对该领域的研究相对较少,其中比较有代表性的,微软洲研究 院l ul i e 等人于2 0 0 4 年提出了从音频数据中进行重复类型的检测与结构分 析的方法【2 】。本文提取了c q t 特征向量,提出了一种新颖的旋律特征之间 的相似性测度,并用一种适应性的方法从音乐自相似矩阵中提取出所有重 要的重复模式。在得到了这些重复性的基础卜,作者又使用些启发式的 原则来进一步优化音乐结构,最后用基于最优化的方法来精确确定卅每个 部分的边缘。实验结果表明,本文提出的方法优于传统的基于d i s c r e t e f o u r i e rt r a n s f o r m ( d f t ) 或c h r o m a 署i 余弦或欧氏距离的方法。大多数的音乐 可以得到正确的重复性和结构,并且大多数检测到的边缘只有很小的偏 离。当然该方法仍有待提高,比如找出转调后的旋律的重复片段。2 0 0 6 年, 哈尔滨工业大学陈廷梁也对音乐结构进行了分析,并提出了基于结构分 析的音乐检索方法,它可以直接检索音频形式的音乐,按照结构相似程度 给出最后结果并排序输出。作者还利用了结构分析音乐摘要方面的信息, 能够比较准确地检测出音乐作品的高潮部分。 虽然以上的方法各有千秋,但最后得到的分割结果都存在了一些碎 片,也即过分割的现象存在。为了解决这个问题,2 0 0 6 年伦敦大学s a b d a l l a h 等人提出了一种d u r a t i o n 模型来减少音频分割中出现的碎片【4 l 。实 验结果证明,用该模型进行切割得到的结果产生的碎片数量远远少于那些 基于聚类的切割算法产生的碎片数,并且与专家标注的结果更接近。本文 提出的基于音色单元分布算法在减少音频分割出现的碎片问题上取得了 很大的成效。 1 3 论文主要研究内容 。, 本文重点介绍了基于音色单元分布聚类的音乐结构分析算法,详细描 述了算法的各个步骤,并将该算法与相似性矩阵以及b a y e s i a ni n f o r m a t i o n c r i t e r i o n ( b i c ) 算法进行比较,得出了基于音色单元分布聚类算法的有效 性。各章节内容简述如下: 第二章主要介绍了基本的乐理知识与音乐结构的概念。基本乐理知识 5 山东大学硕十学位论文 主要讲到了音、乐音及噪音的定义和区别,乐音的四大要素:音高、音值、 音强及音色,纯八度与十二平均律,节奏与旋律,调式与调性。音乐结构 主要分析的是曲式结构,一般的流行歌曲的音乐结构主要山序曲、主歌、 副歌、过渡段、尾声组成。 第三章详细描述了目前常用到的几个音频特征,包括m f c c s ,c q t , c o n s t a n tql o g - p o w e rs p e c t r u m ( c q s ) ,c h r o m a ,基于离散余弦变换的 c h r o m a ( d c t b a s e dc h r o m a ) ,并给出了捕述特征量之问相似性的几种距离 测度,包括欧式距离、余弦距离、结构距离和k u l l b a c k l e i b l e r ( k l ) 距离。 第四章详细阐述了用于音乐结构分析的两大类算法,分别是相似性矩 阵算法与聚类算法。以c h r o m a 特征为例,给出了用相似1 生矩阵进行音乐结 构分析的主要方法及它的一些缺陷。针对它的缺陷本章给出了非监督聚类 l b g 算法米进行音乐结构分析,并给出了优化聚类的修正的f i s h e r 准则。 第五章详细论述了基于音色单元分布的音乐结构分析算法,是论文的 核心部分。本文提出的基于音色单元分布的音乐结构分析算法主要包括预 处理、音色单元分析和结构分析i 人部分,本章对算法中用到的技术及方 法进行了详细的描述。此外,还应用了b i c 算法进行音乐结构分析并与本 文提出的算法进行比较,本文提出算法优于基于b i c 的算法,更能得到比 较满意的音乐结构切分结果,但本文提出的基于音色单元分布的音乐结构 分析算法仍有待进一步改进和优化,提高切分精度,得到更满意的结构分 析结果。 最后,第六章对全文做出总结,提出了现阶段研究中存在的不足,展 望了下一步研究工作的方向。 6 山东大学硕十学位论文 第二章基本乐理表达 本章主要介绍了基本乐理知识与音乐结构的概念,第一节基本乐理主 要讲到音、乐音与噪音,乐音四人要素,纯八度与十二平均律,节奏与旋 律,调式与调性的概念,第二节音乐结构将详细描述音乐的“空间”与“时间” 结构。 2 1 基本乐理 2 1 1 音、乐音及噪音 音是由于物体的振动产生的,是组成音乐的基本材料。音乐属于时间 艺术,音响的流动体现着时问的延续,无音则无乐。 音有高低、长短、强弱、音色四种属性。在一定时间内的振动次数, 决定音的高低,振动次数又称为频率。振动次数多,音则高,反之,音则 低。发音体延续时间的不同,决定音的长短。延续时间长,音则长,反之, 音则短。振幅的大小,决定音的强弱。振幅大,音则强,反之,音则弱。 发音体的性质、形状、结构及泛音的多少,决定着音色。任何声音皆由基 音与不同数量的泛音构成。同一种乐器或者同一种人声,其泛音愈多,音 色则愈优美,反之,其音色会显得很贫弱 2 5 1 。 音被分成乐音和噪音两大类,二者都是音乐中必不可少的要素。乐音 是由物体做有规律的、周期性振动时所发出的,有着固定的音高,乐音是 结构音乐作品的主要材料。噪音是由物体做无规律的、非周期性振动时所 发出的音,无固定的音高。弹奏出乐音的乐器主要有钢琴、提琴、长笛、 二胡、竹笛、古筝、吉他等,而经研制并具有特殊音响色彩的噪音乐器主 要有打击乐器,例如中国传统打击乐器:鼓、锣、铙钹、木鱼、梆子等; 外国打击乐器:军鼓、响木、三角铁、沙球等。噪音所起的作用也是乐音 难以替代的,音乐中使用噪音的目的主要是渲染情绪或造成音色对比。 发音体全部振动产生的音,叫做基音,它是听觉感受中最清楚最响亮 的声音。发音体部分振动产生的音,叫做泛音。基音与泛音的综合,称为 7 山东大学硕士学位论文 复合音。任何一个乐音都是由基音与泛音构成的复合音【2 5 1 。 2 1 2 音高、音值、音强及音色 乐音的四大要素包括:音高、音值、音量、音色。 音高是由发音体在一定时间内振动次数( 频率) 的多少决定的。音高也 称音调,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决 于声波频率的高低,频率高则音调高,反之则低,单位用赫兹( h z ) 表示。 从音乐角度来说通常认为基频即基音

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论