（计算机应用技术专业论文）基于物理模型的声音合成技术理论研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-14 格式：PDF 页数：123 大小：2.82MB 积分：0 举报 版权申诉

已阅读5页，还剩118页未读，继续免费阅读

（计算机应用技术专业论文）基于物理模型的声音合成技术理论研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要基于物理模型的声音合成技术是建立在声学、力学、数学和信号处理等理论基础之上的一门科学，它主要根据力学原理，通过振动偏微分方程、振动体的边界条件、振动的初始条件和激励条件来描述物体的振动物理特性。与其它合成技术不同的是：它是对声音产生的物理机制的描述，而不是对声音本身的描述，而其它方法则是对音频本身的时频特征的描述。从物理特性上来说，管乐器( w i n d ) 、弦乐器( s t r i n g ) 、长笛( f l u t e ) 等可以用一维p d e 来描述，鼓( d r u m ) 、锣( g o n g ) 、钹( c y m b a l ) 等可以用二维p d e 来描述。由于它可以精确地描述物体的发声及其发声过程，精确地再现乐器的基波、高次谐波、非谐波以及a s d r 过程，象真实乐器一样可以表达演奏者的演奏力度、速度、风格和情感，随着计算机处理速度的提高，尤其是m p e g 4 技术的公布，这种方法日趋活跃，成为目前乐器仿真、声音合成的研究热点。作为一种可以精确描述物体发声而有广阔发展前景的技术，物理模型的历史还相对比较短暂，可以说它生于1 0 7 0 年代，培育于1 9 8 0 年代，成长于1 9 9 0 年代，至今尚未成熟而处于发展期，其主要标志是理论上的不完善和应用上的不足。在理论上，物理模型方法还存在基本模型不完善、不规则边界和激励条件数学模型难以建立等诸多不足，需要我们进一步去深入研究。本文阐述了物理模型方法中各种技术，比较了各自的优缺点，分析了部分理想弦乐器和膜乐器的特性，重点研究了两个著名的传统一维和二维阻尼振动方程的局限性，建立了新的模型，其具体成果如下： 1 拨弹弦为例，从理论上详细地分析了著名的传统一维阻尼振动方程的局限性，并从仿真试验上对其局限性进行了验证。 2 根据振动和力学理论推导出了新的一维模型，从理论上证明了其收敛性，并从仿真试验上证明了其精确性。 3 以矩形膜和圆形膜为例，从理论上详细地分析了传统二维阻尼振动方程的局限性。 4 根据振动和力学理论推导出了新的二维模型，并从理论上证明了其收敛性。关键词：物理模型、声音合成、偏微分方程、局限性、新模型合肥工业大学博士论文 a b s t r a c t s o u n ds y n t h e s i st e e h n 【i q u e sf o r p h y s i c a lm o d e la r er e s e a r c hs u b j e t c sb a s e do n a c o u s t i c sa n de l a s t i cd y n a m i c sa n dm a t h e m a t i c sa n ds i g n a lp r o c e s s t h e ys t a r t f r o mac o n t i n u o u sm o d e lf o rt h e v i b r a t i n gb o d y , g i v e nb yp a r t i a ld i f f e r e n t i a l e q u a t i o nd e p e n d e n to n e l a s t i c d y n a m i c s a n d t a k ei t si n i t i a la n d b o u n d a r y c o n d i t i o n s ，a sw e l la se x c i t a t i o nf u n c t i o n si n t oa c c o u n t p h y s i c a lm o d e lm e t h o d s a r ea b l et o p r e s e r v en o to f l l yt h ei n h e r e n tp h y s i c a ls t a b i l i t y , b u ta l s on a t u r a l f r e q u e n c i e so f t h eo s c i l l a t i n gb o d y t h e ya r ed i 虢r e n tf r o mo t h e rs o n u ds y n t h e s i s m e t h o d sp r e s e n t i n gc h a r a c t e r i s t i co fb o d yw i t hr e s p e c tt ot i m ea n d f r e q u e n c y d o m a i n i nt e r mo f p h y s i c a lp r i n c i p l e s ，w i n da n ds t r i n ga n df l u t ei n s t r u m e n t s ，a n ds o o n ，c a nb ed e s c r i b e db yt h e i ro n e d i m e n s i o n a lp d e a n dt h e n ，d r u m sa n dg o n g s a n dc y m b a l s a n de t c c a nb ed e s c r i b e db yt h e i rt w o d i m e n s i o n a lp d e t h e p h y s i c a lm o d e l sf o rt h o s es o u n ds y n t h e s i sm e t h o d sc a l le x a c t l yd e s c r i b em u s i c a l i n s t r u m e n t s sf u n d a m e n t a la n dh a r m o n i o u sa n di n h a r m o n i o u sf r e q u e n c y i e s a sw e l l a st h e i rn a u t r a ls o u n d i n gp r o c e s s t h e yc a nb e p l a y e dl i k er e a lm u s i c a li n s t r u m e n t s r e p r e s e n t i n gp l a y e r s ss t r e n g t h ，v e l o c i t ya n dp a t t e r n ，a s w e l la se m o t i o n s o ，t h e m e t h o d sa r e p l a y i n gv e r yi m p o r t a n tr o l e s w i t h i nt h es o u n ds y n t h e s i sd o m a i n c u r r e n t l y ，w i t hm p e g 4p u b l i s h e da n di m p r o v e m e n to fc o m p u t e r sc o m p u t a t i o n a l e f f i c i e n c y h o w e v e r , t h e yh a v eb e e nd e v e l o p i n gf o rar e l a t i v e l ys h o r t e rt i m ea se x c e l l e n t m e t h o d s ，s i n c e 19 7 0 sw h e nt h e yw e r e p r o p o s e d n o w a d a y s ，t h e y s t i l lh a v e s e v e r a ii m p e r f e c t si np r i n c i l p e sa n d a p p l i c a t i o n s o n eo f t h o s ei st h a tf u n d a m e n t a l m o d e lo fo n eo rm u l t i d i m e n s i o n a lp d eh a v ed i s a d v a n t a g e si ns o m ed e g r e e a n o t h e ri st h a ti ti sd i f f i c u l tt oc o n s t r u c tm a t h se q u a t i o n so fi r r e g u l a rb o u n d a r y c o n d i t i o n sa n de x c i t i o nf u n c t i o n s f i r s t l y , ab r i e f o v e r v i e wo f t h ep o p u l a r s o u n d s y n t h e s i st e c h n i q u e si sp r o v i d e d i nt h i sp a p e r a n dt h e n t h ef e a t u r e so ft h ep a r t i a ls t r i n ga n dm e m b r a n ei n s t r u m e n t s a r e d e s c r i b e d f i n a l l y , s o m eo ft h ed i s a d v a n t a g e s o fe x i s t i n g p h y s i c a l m o d e l m e t h o d sa r ed i s c u s s e d h o w e v e r , t h ek e yp r o b l e m st ob es o l v e di nt h ep a 口e ra r et o t e s t i f yl i m i t a t i o n so ft h em o s tf a m o u sp d ee x i s t i n gi no n ea n dt w o - d i m e n s i o n a l v i b r a t i n gs y s t e m ，a n dc o n s t r u c tt h e i rn e wm o d e l s s o ，t h em o s ti m p o r t a n tr e s e a r c h a c h i e v e m e n t si nt h i sp a d e ra r es u m m a r i z e da sf o l l o w 1 w e t e s t i f yl i m i t a t i o n so f t h em o s tf a m o u so n e - d i m e n s i o n a lp d ef o rs o u n d s y n t h e s i sf r o mi t sp r i n c i l p e st oa p p l i c a t i o n b a s e do n s t r i n gi n s t r u m e n t 2 w ee s t a b l i s han e wo n e d i m e n s i o n a lv i b r a t i n gp d ed e p e n d e n to ne l a s t i c d y n a m i c s ，a n dp r o v et h ep d e i sc o r r e c ta c c o r d i n gt o i t s p r i n c i p l e sa n d a p p l i c a t i o n sb a e s do ns t r i n gi n s t r u m e n t 3 w e t e s t i f yi i m i t a t i o n so f t h em o s tf a m o u st w o d i m e n s i o n a lp d ef o rs o u n d s y n t h e s i si ni t sp r i n c i l p e sf o rr e c t a n g l e a n dc i r c l em e m b r a n c e s 4 w ee s t a b l i s han e wt w o d i m e n s i o n a lv i b r a t i n gp d ed e p e n d e n to ne l a s t i c d y n a m i c s ，a n dp r o v et h ep d e i sc o r r e c ta c c o r d i n gt oi t sp r i n c i p l e sf o r r e c t a n g l ea n d c i r c l em e m b r a n c e s i i 摘要 k e y w o r d s ：p h y s i c a lm o d e l ，s o u n ds y n t h e s i s ，p d e ，l i m i n a f i o n ，n e we q u a t i o n s i i i 独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知，除了文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均在论文中作了明确的说明并表示谢意。学位论文作者签名：躲舻签字日期：年彳月雩日学位论文版权使用授权书本学位论文作者完全了解生国堂苤塑型( 左查题2 鱼王盘查社有关保留、使用学位论文的规定，有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许论文被查阅和借阅。本人授权虫垦堂苤翅型! 迸盘题2 电王苤蠢整可以将学位论文的全部和部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用于本授权书) 学位论文作者签字：荔彳厶么p 导师签字：签字日期：刀够年乡月多日签字日期：年月日学位论文作者毕业后去向工作单位：通讯地址：电话：邮编：目录图1 5 1 图1 5 2 图1 5 3 图1 6 1 图1 8 1 图1 8 2 图3 3 1 图3 3 2 图3 3 3 图3 3 4 图3 3 5 图3 3 6 图3 3 7 图3 3 8 图3 3 9 图3 3 1 0 图3 3 1 1 图3 3 1 2 图3 3 1 3 图3 5 1 图4 3 1 图4 3 2 图4 4 1 图5 2 1 图5 3 1 图5 3 2 图5 3 3 图5 3 4 图5 3 5 图5 4 1 图5 4 2 图5 6 1 图5 6 2 图6 2 1 图6 3 1 图6 3 2 加合成框图5 相位声音合成机框图一6 线性预测模型7 f m 方法框图8 理想弦的振动11 数字波导离散算法方框图1 2 两端紧张弦的初始状态图3 2 在中心点拨弹时，弦的波形分解与频谱图一3 3 中心点拨弹、1 3 处弦的横向振动波形及频谱图3 4 在中点拨弹的时，弦的横向振动波形3 5 在1 3 处拨弹时，弦的半周期横向振动波形3 5 第l 、7 、1 4 个波的驻波图3 6 弦受打击后的振动状态图一3 8 棒的三种边界条件3 9 一端夹支一端自由棒的初始状态图4 0 一端夹支另一端自由棒的频谱密度图4 1 一端夹支一端自由棒，在t = 0 时刻的前6 个波的波形图4 l 棒在不同时刻的振动状态图一4 2 棒自由端的横向振动波形图4 2 不同特征频率值的振动波形对比5 0 矩形膜示意图5 2 矩形膜初始状态几何图5 6 圆形膜示意图5 9 两端紧张弦的受力7 3 纯弯曲正应7 4 挠度与转角关系图7 7 挠曲线曲率于倾角7 8 剪切角与纯弯曲转角的几何关系8 0 轴向力的分解8 0 两端紧张弦的基本受力分析图8 2 扭转振动微元受力分析图一8 4 吉他b 弦第7 品位波形与频谱9 2 不同阻尼情况下的波形及频谱密度图9 4 薄膜空间直角坐标系示意图9 5 载荷力矩和矩矢作用示意图9 7 拉压力与纵向剪力投影示意图9 8 会l 毽工韭大学攮士论囊 1 。霉l 言第一章绻论警在1 8 4 2 零，獭茭嚣鑫揆大学瓣豢尔簸巴援爨教授发爨遗魅瓣藩隽分辑枫鹣对候，她豹勋手、落毫诗人群论躬女，l 爱这奥蠢麓塔按爽拉籁稳爵夫入就曾缀预言道：“这台梳器总肖一天会演奏国学乐来的”。至了1 9 4 6 年，羲雾上第一爨毫子计簿瓿e n i a c 套荚鞭诞嫩了。缀袄，一麓数学秽酱臻静黢籽天才藏开始袭警乐上蠖耀这瓣王其。1 9 4 8 零，诗冀撬藩建技嶷溪子蠢笨戆分毒厅、研究中。实践证明，它农分橱风格、泌僚与秘声缝构簿方露怒十分商照的。1 9 5 5 年，第一台翼燕的会成嚣诞囊予美嚣耨泽透卿赣林簸顿r c a 实验室，葜全称楚 r c a e l e c t r o n i c m u s i cs y n t h e s i s 0 c a 亳子音袋合成嚣) # 1 9 5 7 年，美强律趋家鸯伦t 渗勒尔秘数学家伦缝德艾萨巍合终蓥次测捧了囊正装“计髯毒惩鸯乐”，爱达的鞭畜在1 0 0 多年詹终予臻双实瑷u 6 i 。大约在1 9 6 0 颦。r o b e r tm o o g 博士刨逡了第一螽模块式合成器，其名为 m o o g 合成嚣，这痘该怒第台赛晶纯合成糕。大约程1 9 7 0 年代，m o o g 潜裂硬减金成( s u n r a c t i v es y n t h e s i s ) 技零蘩造了在警懿矮滚行瓣m i n im o o g 念成器。数字合成器鹳概念是在1 9 6 9 年幽m v - m a t h e w s 酋先提出来的，葜核心麓掰谓豹荦元发警嚣( u n i t 。g e n e r a t o r ) 穰鏊。因袋弼的谮蠢是m 。v m a t h e w s 的 m u s i c - i i i 、m u s i c 1 v 、m u s i c v 瓤b + l ，v e r c o e 豹m u s i c - i i 、m u s i c - 3 6 0 ，鼹熬瞧稼为m u s i c n 模黧。该模型幽鼹语( p r i m i t i v e ) 组残，擐潦包攒掇荡嚣、滤波嚣和包络溺数等。许多入对它作了改进，例如n y q u i s t 、c l m 和s u p e r c o l t i d e r 等语言，凝肖名豹怒b l 。v e r e o e 翡c s o t m d 语意，被佟魏家广必聚溪。j o s m i t h 予1 9 9 1 年撬滋了臻会藏搐述潘塞编筲靛算滚柬转送拳巍熬瑟慧，籀令在实践中贯彻这一思怒的愚m i t 媒体实验嶷的m a c a s e y 秘ej s m a r a g d i s ，他们予 t 9 9 6 年在n e t s o u n d 试骏串翔c s o u n d 语言成功她编霹和传输了声齑。叛嚣这个实验室又龟l 立了著名静蹈构纯窃频f s a ：s t r u c t u r e da u d i o ) 技术，予1 9 9 8 年 2 哭委戏成菇m p e g 4 麴一蘩分。筝兔该领域靛袋凝进袋，1 9 9 9 零，m l 羊实骏塞瓿器蹰觉，l 、缀豹e r i ed 。s c h e i r e r 积y o u n g m o oe 。k i m 薅天，在s a 技拳基磁之上，又键出了一般俄啻频编码联论( t h e o r yo fg e n e r a l i z e da u d i oc o d i n 妨，它藤 s a 羧本来傣诗巍然港频编磷的彳亍为驿o1 5 4 1 0 。2 声啻含或技术瓣基本闷题卷失声鬻的合成存在二个蒸本赫戆，一憝匿大的海爨数键黉要谈速蟾冀法：二是霈要籁罄、强翁力豹语富采攒遂复杂酶声裔序列。蠢觚半个多氆绍薷，第一螽合成嚣发骥良来，骈究者就一矗致力予解捩遮嚣个嫠本润越。在i 篷去瓣二卡霉墨，虫子计葵桩及轰耱专蠛蕊嚣静缝理戆力淡每年4 0 豹遽魔递壤，第一个嗣题爨基本鹅决。第二个趣题没有、瞧誉可辘突合肥工业大学博士论文 1 1 引言第一章绪论早在1 8 4 2 年，当英国剑桥大学的查尔斯巴贝奇教授发明电脑的前身分析机的时候，他的助手、著名诗人拜伦的女儿爱达奥古斯塔拉夫拉斯伯爵夫人就曾经预言道：“这台机器总有一天会演奏出音乐来的”。到了1 9 4 6 年，世界上第台电子计算机e n i a c 在美国诞生了。很快，一些数学和音乐的双料天才就开始在音乐上使用这种工具。1 9 4 8 年，计算机首先被应用于音乐的分析、研究中。实践证明，它在分析风格、韵律与和声结构等方面是十分有用的。1 9 5 5 年，第一台真正的合成器诞生于美国新泽西州普林斯顿r c a 实验室，其全称是 r c ae l e c t r o n i cm u s i c s y n t h e s i s ( r c a 电子音乐合成器) ：1 9 5 7 年，美国作曲家查伦希勒尔和数学家伦纳德艾萨克合作首次制作了真正的“计算机音乐”，爱达的预言在1 0 0 多年后终于得以实现。大约在1 9 6 0 年，r o b e r tm o o g 博士创造了第一台模块式合成器，其名为 m o o g 合成器，这应该是第一台商品化合成器。大约在1 9 7 0 年代，m o o g 博士利用减合成( s u b t r a c t i v es y n t h e s i s ) 技术创造了在当时最流行的m i n im o o g 合成器。数字合成器的概念是在1 9 6 9 年由m 、，m a t h e w s 首先提出来的，其核心是所谓的单元发生器( u n i t g e n e r a t o r ) 模型因采用的语言是m vm a t h e w s 的 m u s i c i i i 、m u s i c i v 、m u s i c v 和b l v e r c o e 的m u s i c i i 、m u s i c 3 6 0 ，所以也称为m u s i c - n 模型。该模型由原语( p r i m i t i v e ) 组成，原语包括振荡器、滤波器和包络函数等。许多人对它作了改进，例如n y q u i s t 、c l m 和s u p e r c o l l i d e r 等语言，最有名的是b l v e r c o e 的c s o u n d 语言，被作曲家广为采用。j 0 s m i t h 于1 9 9 1 年提出了用合成描述语言编写的算法来传送声音的思想，第一个在实践中贯彻这一思想的是m i t 媒体实验室的m a c a s e y 和pj s m a r a g d i s ，他们于 1 9 9 6 年在n e t s o u n d 试验中用c s o u n d 语言成功地编写和传输了声音。以后这个实验室又创立了著名的结构化音频( s a ：s t r u c t u r e da u d i o ) 技术，于1 9 9 8 年1 2 月正式成为m p e g 4 的一部分。作为该领域的最新进展，1 9 9 9 年，m i t 实验室机器听觉小组的e r i cd s c h e i r e r 和y o u n g m o oe k i m 等人，在s a 技术基础之上，又提出了一般化音频编码理论( t h e o r yo fg e n e r a l i z e da u d i oc o d i n 曲，它用 s a 技术来估计自然音频编码的行为盼”。 1 2 声音合成技术的基本问题有关声音的合成存在二个基本问题，一是巨大的海量数据需要快速的算法；二是需要简单、强有力的语言来描述复杂的声音序列。自从半个多世纪前，第一台合成器发明以来，研究者就一直致力于解决这两个基本问题。在过去的二十年里，由于计算机及各种专业芯片的处理能力以每年4 0 的速度递增，第一个问题已基本解决。第二个问题没有、也不可能完第一章绪论全解决。因为它需要数以百万计的样本去制造声音，没有人有充分的时间和耐心去收集每一个声音片断的样本，因此声音的样本必须采用某些算法去合成，或者从自然现象中的记录中去推导。在任何情况下，大量的样本都必须转化为比较小的样本集。因此，第二个问题的基本困难在于寻找一种具有最小冗余的方法来描述蹩个音域的声音”j 。于是，声音合成技术的研究焦点便集中于声音产生的描述方法上，产生了数十种的声音合成技术。 1 3 声音合成技术的分类从不同的角度，不同的文献对声音合成技术进行了有不同的分类1 3 m 。本文根据合成声音技术的时频及物理特征将声音合成技术分为五类，即：过程记录、频谱模型、抽象算法、物理模型和结构化音频技术。 1 3 1 录音处理录音处t 里( p r o c e s s e dr e c o r d i n g ) 合成是基于时域波形采样的合成技术，所以也被称为采样合成( s a m p l i n gs y n t h e s i s ) ，它主要包括： ( 1 ) 时域波表合成( w a v e t a b l et ) ： ( 2 ) 矢量合成( v e c t o rs y n t h e s i s ) ： ( 3 ) p r i n c o m p t ； ( 4 ) 时域小波合成( w a v e l e tn ； ( 5 ) a s y n c h r o n o u s ( a g s ，1 9 9 0 年代) ； ( 6 ) 音节同步( p s g s ：p i t c hs y n c h r o n o u s ，1 9 9 0 年代) ； ( 7 ) 其它。 1 3 2 频谱合成括频谱合成( s p e c t r a ls y n t h e s i s ) 是根据频域模型来合成声音的技术。它主要包 ( 1 ) 频域波表合成( w a v e t a b l ef ) ； ( 2 ) 加合成( a d d i t i v es y n t h e s i s ，1 9 6 9 ) ； ( 3 ) 减合成( s u b t r a c t i v es y n t h e s i s ) ： ( 4 ) 线性预测编码( l p c ：l i n e a rp r e d i c t i v e ) ； ( 5 ) f f t 反变换( 1 9 9 2 ) ； ( 6 ) 语音编码机( v o e o d e r ，1 9 3 9 ) ； ( 7 ) 粒度合成( g r a n u l a rs y n t h e s i s ，1 9 4 7 ) ； ( 8 ) 非线性合成技术( n o n l i n e a rs y n t h e s i s ) ： ( 9 ) 源一滤波器合成( s o u r c e - f i l t e rs y n t h e s i s ) ： ( 1 0 ) m c a u l a y - q u a t i e r i ( m q ，1 9 8 6 ) ： o d 瞬态模型合成( 1 m s ：t r a n s i e n tm o d e l l i n gs y n t h e s i s ，1 9 9 7 ) 0 乃共振峰合成( f o r m a n ts y n t h e s i s ) ； ( 1 3 ) s i n e s + n o i s e ；合肥工业大学博士论文 q 彤p a r s h l ： 0 5 ) v o s i m ； ( 1 6 ) c h a n t ： 0 7 ) c h o w n i n gf m v o i c e 0 毋p r i n c o m p f ： r i s s e tf mb r a s s ：其它。 1 3 3 抽象算法抽象算法( a b s t r a c ta l g o r i t h m ) 主要是指早期基于模拟技术完成的一系列合成方法，在目前，当然不排除其中某些方法也可通过数字方法来实现。它的基本特点就是简单和容易实现，它或多或少地带有人工合成的特性，主要包括： ( 1 ) 压控振荡器( v c 0 ) ： ( 2 ) 压控放大器( v c a ) ； ( 3 ) 压控滤波器( v c f ) ； ( 4 ) 普通f m 技术( o r i g i n a lf r e q u e n c ym o d u l a t i o n ，1 9 7 0 年代) ； ( 5 ) 反馈f m ( f e e d b a c kf m ) ： ( 6 ) 波形合成( w a v e s h a p i n gs y n t h e s i s ，1 9 6 0 年代后期) ； ( 7 ) 相位变形( p h a s ed i s t o r t i o n ) ： ( 8 ) k a r p l u s - s t r o n g ( 1 9 8 3 ) ； ( 9 ) 某些m u s i cv ： ( 1 0 ) 其它。 1 3 4 物理模型物理模型( p h y s i c a lm o d e l ) 是运用声学和弹性振动理论，通过偏微分方程 ( p d e ：p a r t i a l d i f f e r e n t i a le q u a t i o n ) 来描述乐器的振动物理特性。目前在声音合成技术领域常用的主要包括五种方法。 ( 1 ) 有限元差分方法( f i n i t ed i f f e r e n c em e t h o d s ) ： ( 2 ) 有限元法( f i n i t ee l e m e n tm e t h o d s ，1 9 6 0 ) ； ( 3 ) 模态合成( m o d a ls y n t h e s i s ) ； ( 4 ) 数字波导( d i g i t a lw a v e g u i d e s ，1 9 8 7 ) ： ( 5 ) 传递函数模型( t r a n s f f rf u n c t i o nm o d e l s ，1 9 9 0 年代) 。 1 3 5 结构化音频结构化音频技术是m p e g 4 自然混合编码技术中的一部分，从理论上说，结构化音频技术可以适应一切音频技术，它本身主要是用来在网络上传输音频信号的。第一章绻论 1 。4 录音处理 1 4 1 波表合成技术时域波表合成技术( w a v e t a b l et ) 是时域模型中最基本、最著名的经热合成方法，它由一个数字化音乐事件数据库和一个回放工具集组成，将各种真实乐器爱能发爨戆疑鸯声音( 包括各个音域、声调) 袋涮下来，存熬爨数字纯音零事件数据库( 波袭) 中去。回放时，根据文件纪泶的乐曲信息向波表发出指令，从“表格”中逐一找出对应的声潦信息，经过合成、加工后回放如来。回技工吴集螽各种声音音节技术组成，其最重要酌缀孛是酱节平移( p i t c h s h i f t i n g ) 、循环( i o o p i n g ) 、包络( e n v e i o p i n g ) 和滤波( f i l t e r i n g ) 【3 l o 音节乎移：宅宠许以不同的鸯调援救波表。如果以嚣耪可熊豹频率记录质有的乐器皆符，将要求极大的存储器，为了避免这种情况的发生，波表中通常仅仅记录了一定频率范围的子集。丢失的频率根据回放期间音节的变化，由最接近载记泵频率羹擒。塞苓孚移囊采撵速率变抉技本完成，考苓豹交纯纹仅在几个可能的半音节范围内，而没肖显著的声音特性变更。这也称m i c h y 。m o u s e 效果。循环；在匿救麓闯支持递箱魄读密液表数攒。采弱这种技术豹原因是为了兼顾存储器的局限性以及音符播放长度的变化。由于存储器的限制，波液中只记录了一定周期的频率，嚣援放又要求丰富戆声鹰频率，通过该技本可以获褥所需要的音符斌期。其中关键技术在予避免循环边界的不连续。包络：是一种循环波液中时变增益函数的应用。因为乐器典型的起膨一持续一衰减一释放( a d s r ：a t t a c k - s u s t a i n - d e c a y - r e l e a s e ) 过程霹熊被锤醛破嚣，该工具可熏构和修改包络。滤波：当包络改变了它的幅度时，通常用具京可调节系数的低阶数字递归滤波器来馥交依赣予音符频谱内容酌节撩。它掰表现豹声音不仅可能院琢始记蒙的波表声音更好，而且还可表现声学乐器所不可能做到的节拍变化效果。波表会成的缺点：一是需要较大豹程德器；二是由予受熙预先记录瓣售息豹限制，滩以表现声音的变化。其突出优点是计算开销小、操作简便。 1 5 频谱合成技术频谱合成的蒸本原理是由系列基本函数觏t ) 及箕时变稻度f c ( t ) 乘积的迭加，即： f t ) - f l ( t m ( t ) ( 1 5 1 ) 其实现懿方法主要蠢熟会成( a d d i t i v es y n t h e s i s 、减合成( s u b t r a c t i v e s y n t h e s i s ) 、粒度合成( g r a n u l a rs y n t h e s i s ) 等，实际实现方法通常由这几种方法妇合而成。 4 合肥工业大学博士论文 1 5 1 加合成加合成技术是一种经典的合成方法，合成声音由一系列正弦分量迭加而成，其幅度、频率甚至相位都随时间的变化而变化。对于基本的加合成，式( 1 5 1 ) 可以描述为表达式( 1 5 2 ) 。 f ( 1 ) = 2 。f l ( t ) s i n ( e l ( t ) ) ( 1 5 2 ) t 为了描述正弦函数难以描述的随机特性，文献f 2 4 】在( 1 5 2 ) 添加了一个噪声源n ( t ) ，因此，式( 1 5 2 ) 可以描述为： f ( t ) = 芝 f l ( t ) s i n ( e l ( t ) ) + n ( t )( 1 5 3 ) t 在一般情况下，一个频率组件可由一个常数频率及其相位组成，即： 0 l ( t 户卜l “m + + l ( 1 5 4 ) 在实际合成中，式( 1 5 3 ) 中的时间信号由采样再现，所合成的声音以帧的方式来处理。从帧到帧之间，幅度和频率通常随f t 、m 。以及十。的变化而变化。典型地，构造一个方波，是将基波频率、高次奇数谐波频率按照相应的幅度相加而成，即： f ( t ) = a l + s i n ( c t ) + a 3 。s i n ( s c t ) + a 5 + s i n ( 5 c t ) + a 7 + s i n ( 7 c t ) + ( 1 5 5 ) f n ” = l n ( a t ) ) 图1 5 t加合成框图分析工具：早期的加参数时变分析技术有f r e e d m a n 2 5 1 和m a t t h e w s 2 6 j ：比较近来的音乐信号加法分析技术主要有外差滤波法( h e t e r o d y n ef i l t e r i n g ) 2 7 l 、 f f t 分析法【2 8 】和线性时间频率分析【2 9 】；最近流行的技术是时间和频率再分配方法( t i m ea n df r e q u e n c yr e a s s i g n m e n tm e t h o d ) 闭。”；研究最为广泛的是加窗短时傅立叶变换p “。加合成的缺点是：需要大量的控制函数参数和大量的滤波器。 1 5 2 减合成减合成是指从复杂的信号源中过滤或者移出某些频率元件以形成所希望的信号频谱形状，这可以通过时变滤波器来完成，该方法很接近波表合成中的滤波( f i l t e r i n g ) 。然而，在减合成中，滤波器的输入是合成信号，而不是波表。由吣一w一第一章绪论于谐波成分不能很好地通过滤波噪声来近似地描述，所以减合成通常与其它合成方法结合而用。 1 5 3 粒度合成粒度合成( g r a n u l a rs y n t h e s i s ) 是一种计算机音乐合成技术，它通过累加大量的基本声音元件( s o n i cc o m p o n e n t ) 或者颗粒( g r a i n ) 而形成真实的声学事件 p ”。该方法是基于声音和感知理论的，由g a b o r 创始于19 4 7 年【3 8 】。在粒度合成中，以时间和频率的方式来描述式( 1 5 1 ) 中的基本函数、l ，。( t ) ，基本函数称为原子( a t o m ) 或者颗粒( g r a i n ) ，从颗粒中建立的声音称为粒度合成，波形的形状和时间分布决定了声音的类型。在早期的音乐合成中，人工声音由数以干计的颗粒组合而成，颗粒根据描述声音时域和频域特性的合成参数产生，包括时间定位、周期、包络形状、调制。由于缺乏分析工具分解自然声音这种方法被严格的限制的人造声音范围内。为了有效地再现自然声音，研究者进行了大量的努力，其中最著名分析工具是时域加窗( t i m e - d o m a i nw i n d o w ) 技术p “4 们。目前，声音颗粒产生的主要方法有：加窗正弦段、波表、伽柏展开式( g a b o re x p a n s i o n s ) 、小波技术【3 1 。、- _ ，。，被调制滤故器柜、_ - - _ _ 、，。_ _ _ ，舍成振荡器柜图1 5 2 相位声音合成机框图 1 5 4 声音合成机门嘲 n m i 岫d i 坩m j m 声音合成机( v o c o d e r ) 包括信道声音合成机( c h a n n e lv o c o d e r ) 和相位声音合成机机( p h a s ev o c o d e r ) ，用于描述早期的语言分析合成算法l 。信道声音合成机用于再现基于s t f t 滤波器柜信道或者子带( s u b b a n d ) 特性的语言信号，用s t f t 分析滤波器柜技术将语言划分为众多的信道，每个信道按照它的短时能量划分。对于第k 个信道，它产生幅度为a k ( n ) 中心频率为m 。的信号。输出是各信道信号的累加。 6 合肥工业大学博士论文信道声音合成机仅仅按照能量或者幅度来划分信道，而相位声音合成机则将其扩张到相位。它有许多种变化，通常其结构框图如图1 5 2 所示。图中，振荡器k 的幅度及频率( 总相位) 控制函数通过参数估计器来源于滤波器柜。其中，子带信号按照幅度包络以及描述幅频变化的函数来确定参数，滤波器柜的输出输入到振荡器而重构信号。这种方法最大的成功在于对语音信号的改进。 1 5 5 线性预测编码线性预测编码( l p c ) 的基本思想是寻找信号的相邻的连续信号段的数值之间的相关关系，并利用这种相关性达到编码和压缩数据量的目的。具体地说，就是将原始的数字信号( n ) 分割成长度为n 的等长连续信号段；第一段是 1 蔓n n ，第二段是n + 1 n 2 n ，其中的n 应当根据相关性选取“最优的” 数值，也就是相关程度在一定水平之上的最大的相关步数，之后，对每一连续段寻找一系列系数a 1 ，a 2 ，a ，a 。，使由 e ( n ) = x ( n ) - 艺a k x ( n k )( 1 5 6 ) k = l u2 所定义的预测误差之平方和百i l e ( n ) i 达到最小。一般地说，p 将远远小于n 。 hn = l 对于信号段x ( 1 ) ，x ( 2 ) ，x ( n ) ，这种编码方法只需利用最初的p 个信号值 x 0 ) ，x ( 2 ) ，x c p ) 和p 个系数a 、，a

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）基于物理模型的声音合成技术理论研究.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）基于物理模型的声音合成技术理论研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档