基于MATLAB乐器校音系统的设计_第1页
基于MATLAB乐器校音系统的设计_第2页
基于MATLAB乐器校音系统的设计_第3页
基于MATLAB乐器校音系统的设计_第4页
基于MATLAB乐器校音系统的设计_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

乐器校音方法的据研究* 本 科 毕 业 设 计(论 文)乐器校音方法的研究学 院(系): 信息与通信工程学院 专 业: 电子信息工程 学 生 姓 名: 学 号: 指 导 教 师: 评 阅 教 师: 完 成 日 期: 2011年6月10日 22摘 要乐器校音对一般人而言是一项难以胜任的工作,而现有的校音设备又存在着诸多弊端。开发一种操作简单,价位适中,误差率小的乐器校音软件已成为21世纪电脑音乐时代的要求。本文简要介绍了钢琴调律的基础知识、以及运用MATLAB语言对声音信号进行分析的过程。利用基于傅里叶变换的谐波峰值法检测基频。通过分析,提高基频的检测精度,结合音律确定声音的调整方向。通过MATLAB仿真结果表明,运用此方法可达到的5高频精度较好,而高频精度相对较差。乐器校音系统的设计很好地综合了音乐和技术领域的知识,初步实现了机器检测音律的功能。随着科学技术的不断发展,运用多媒体技术校音的手法必将成为乐器校音的主流。关键字:乐器校音;谐波峰值法;频率校正;音律The Method Of Tuning Musical Instrument TuningAbstractMusical Instruments Tuning For most people it is very difficult, and existing equipment of tuning device has many malpractice. So develop a simple, affordable, small error rate software of instrument tuning is the requirements of computer music times in 21st century.This paper introduces the basics of piano tuning and the process of using MATLAB to analysis the sound signals. And using the method of harmonic peak algorithm based on FFT to detection the fundamental frequency. By analyzing ,increase the detection accuracy of baseband, combined with temperament determine the direction of the sound adjustment. MATLAB simulation results show that this method can make the accuracy batter for low frequency but high frequency is poor.Instrument tuning system combines the knowledge of music and technology. The initial realization of the function of machine detect the temperament. With the continuous development of science and technology, Use of multimedia technology will become the way to musical instrument tuning.Keywords: Instrument Tuning; Harmonic Peak Algorithm; Frequency Correction; Temperament目 录摘 要IAbstractII1 绪论11.1 课题背景11.1.1 为什么乐器需要校音11.1.2 近现代的主要调音方法21.2 乐器校音系统的意义21.3 本设计的主要内容32 乐器校音的基础知识42.1 音42.2 律42.2.1 五度相生律52.2.2 十二平均律52.2.3 五度相生律与十二平均律的比较62.3 音高频率73 基频检测93.1 系统框图93.2 检测方法93.2.1 时域的算法93.2.2 频域的算法103.3 时域分析113.4 频域分析134 离散频谱分析的校正164.1频率校正法164.2 幅值校正法174.3 相位校正法174.4 校正过程18总 结20参考文献21致 谢221 绪论1.1 课题背景人类制造的任何发声物都可称为乐器,所有乐器都有“特定音色,或发出一种声音,或某一确定音高的若干声音,或至少是提供材料在一定时间内连续发出噪声”(舍夫纳, A.Schaeffner, 1946)。现代分类法把世界上所有乐器归纳为五大类:体鸣乐器、膜鸣乐器、气鸣乐器、弦鸣乐器和电鸣乐器。本文主要针对弦鸣乐器即弦乐器的校音加以说明1。1.1.1 为什么乐器需要校音弦乐器是乐器家族内的一个重要分支,其发音方式是依靠机械力量使张紧的弦线振动发音,故弦线的张力很容易影响弦乐器的音准。长期的磨损、空气中不同的温度、湿度都会影到弦线的张力。以钢琴为例,钢琴的音准变化是由其构造和材料的固有属性决定的,是不可避免的,钢琴共有200多根弦,靠弦轴、弦轴板和铁骨张紧,弦的总拉力近20吨。弦列通过琴码压在穹形的音板上, 10余吨的张力作用在琴上必然引起相应的变形,其中音板的变形对音高影响最大,钢琴出厂以前,一般经过48次的拨音和调音以抵消这种变形。新生产的钢琴其所使用的各种材料内应力相对会大一些,(这里主要是指琴体、琴弦、钢板,这些主要部件在生产的过程中已经进行了人工时效与自然时效处理),随着时间的持久,钢琴各零部件的内应力会慢慢的释放出来从而使钢琴的稳定性愈来愈趋于稳定,这就是为什么年代久一些的琴总比新琴要稳定的原因。钢琴在演奏的过程中,击弦机要反复敲击琴弦,琴弦受到了外力的冲击再加上材料本身的内应力,自然就会加大了音准发生变化的趋势,钢琴在使用一段时间后,钢琴的击弦机构经过成千上万次的动作,部分易磨损的部件都不同程度磨损,导致击弦机构的行程比例、配合失调,引起触感不良,温湿度的变化也会导致钢琴的一些部件运行不良,所以钢琴在定期调律的同时也要进行调整。由于木材本身的粘弹性(像和好的面团一样,既有弹性,又有随时间延续发生变形的性质),音板的变形是随时间延续而缓慢发生的。尽管木材粘弹性造成的这种变形报其缓慢,它对音高的影响还是明显的,所以钢琴从制成到报废都得为抵消这种变形而调律。另外弦线具有金属的延展性,在长期持续的巨大张力下会发生延长和变形导致音高降低,这也是弦乐音准变化的一个原因。所以许多演奏者后会在使用完毕后放松弦线,待下次使用前在重新对乐器进行校音,以延长弦线的使用寿命。有时在演奏一场交响乐时,为配合整场的乐器或某首曲子的曲调演奏者们也会对其乐器加以调整,来使演奏达到最佳的效果2。1.1.2 近现代的主要调音方法传统调音手段是通过专业的调音师对乐器进行调音。调音师是专门从事调律这项工作的人员。调音师通过自己的耳朵和所掌握的调律知识把乐器律制调准,同时还包括对一些乐器的机械整调,零件修理和更换。但在乐器的生产中技术人员只要知乐器是否合格,零件的配合是否适当就足够了,而在技术文献中涉及调律的内容又少之又少。所以调音工作就成为一项极其专业的工作,一般人很难掌握。尤其我国因为调音行业发展的比较缓慢,所以调音师更是成了凤毛麟角,所谓物以稀为贵,调音师得调音自然是价格不菲。由于调音师是根据自身所学来进行调音,所以其调音效果就必定与标准存在一定的误差,又因为其调音具有一定的主观意识,造成每个调音师所调出的乐器音律又并非完全一致。由于现代可以的不断发展和调音师调律的诸多弊端,预示着调音师必定将在科技的长河中被淘汰,成为历史。音叉是呈“Y”形的钢质或铝合金发声器,各种音叉可因其质量和叉臂长短、粗细不同而在振动时发出不同频率的纯音。用音叉取“标准音”是钢琴调律过程中十分重要的手段之一。但音叉易受环境条件的影响,调音精准度不高,同样存在误差。调音器是为了校正乐器音高的一种仪器。它采用乐音的振动频率识别程序来显示乐器音高的电子产品,现已广泛应用于各种乐器的调音中。根据适用乐器的不同,又分为吉他调音器、古筝调音器、小提琴调音器等等。与传统的调音工具(音笛、音叉等)相比,具有准确度高、不易受气候条件影响、操作简单易学等优点,尤其有助于各种乐器的初学者快速掌握该乐器的定音技术和提高听辨音高的能力。随着技术的进步,现在有的电子调音器又同时具有节拍器功能,并且增设了音频接口,可以为电声乐器提供内部信号传输,使得电声乐器校音变得更加方便,即使在很嘈杂的外界环境下亦能不受干扰。但调音器仅适用于的二胡、吉他、小提琴等弦少的乐器,绝大多是乐器并不适用且定价较高3。1.2 乐器校音系统的意义通常对于乐器初学者来说校正乐器的音准是一件很困难并难以胜任的工作,而通过上节的论述不难看出,对于专业的校音师,在校音的过程中往往是依靠定音哨及自己的耳朵来判断,这使整个校音过程充满了主观色彩,不易校准;而现在市场上的电子校音设备,往往价位较高。那么怎样才能让每一人都能轻松而有效的实现乐器的校音工作呢?于是,开发一种操作简单,价位适中,误差率小的乐器校音软件绝对是乐器初学者的福音,这种将电脑音频技术与传统的校音技术有机的结合在一起的方法,也是21世纪电脑音乐时代的要求。1.3 本设计的主要内容本文以钢琴为例,简要介绍了音、律的基本特点及原理。用过PC机录入钢琴的88个音。在得到琴音信息后,合理的利用这些信息,运用MATLAB语言对88个键的乐音进行快速傅里叶变换,再通过谐波峰值法对其进行计算、分析,从而得到钢琴音的实际频率。然后通过离散频谱分析对实际音频进行校正,算出相对误差,调律,最终达到乐器校音的目的。截至目前的资料显示,使用机器实现对钢琴音律辅助调律的思想是较新鲜的,而整个系统设计到实现,也是电子技术与音乐理论的合理结合,信号处理、多媒体、模式识别的良好应用。2 乐器校音的基础知识当今社会,音乐与人们的生活息息相关。音乐与人的语言、行为、审美情趣、人际关系、生活情趣等都有一定的联系。人们通过音乐来抒发感性、表达感情、寄托感情,无论什么样的音乐都蕴涵着关联人们千丝万缕情感的因素。在物质条件越来越发达的今天,音乐已成为人们精神文明的大餐。音乐作为国际语言,其乐音体系的确定有其共同的标准。2.1 音音即声音,一切发音物体如声带、琴弦、簧片等经过物理振动、共鸣以后产生的结果都称为音,音有四个最主要的基本性质,即音的高低、长短、强弱及音色。由于发音体的形制及振动形态的不同,所有的音又可划分为三类:纯音、乐音和噪音。 音是由于物体的振动而产生的。在自然界中能为我们人的听觉所感受的音是非常多的,但并不是所有的音都可以作为音乐的材料。在音乐中所使用的音,是人们在长期的生产斗争和阶级斗争中为了表现自己的生活和思想感情而特意挑选出来的。这些音被组成为一个固定的体系,用来表现音乐思想和塑造音乐形象。音有高低、强弱、长短、音色等四种性质。音的高低是由于物体在一定时间内折振动次数(频率)而决定的。振动次数多,音则高;振动次数少,音则低。音的长短是由于音的延续时间的不同而决定的。音的延续时间长,音则长;音的延续时间短,音则短。 音的强弱是由于振幅(音的振动范围的幅度)的大小而决定的。振幅大,音则强;振幅小,音则弱。音色则由于发音体的性质、形状及其泛音的多少等不同。以上四种性质,在音乐表现中都是非常重要的,但音的高低和长短则具有更为重大的意义。试以某首歌曲为例,不管你用人声来演唱或用乐器来演奏,用小声唱或是大声唱,虽然音的强弱及音色都有了变化,仍然很容易辨认出这支旋律。但是,假如将这首歌的音高或音值加以改变的话,则音乐形象就会立即受到严重的破坏。因此,不管创作也好,演奏演唱也好,对音高和音值应加以特别的注意。 由于音的振动状态的规则与不规则,音被分为乐音与噪音两类。音乐中所使用的主要是乐音,但噪音也是音乐表现中不可缺少的组成部分4。2.2 律“律”即是指定声音高度的法则,亦称律制,律是构成律制的基本单位。常见律制有十二平均律、纯律和五度相生律,这三种律制实际是规定如何在一个长是8度(2倍频率)的尺子上打刻度,以用来度量声音的不同解决方法。五度相生率和纯率都是按照实际操作的2倍频率、3倍频率和5倍频率来打刻度的,打出来的是一种不平均的刻度,而十二平均律则是用对数计算出来的一种人为但均匀的刻度。在乐器的定律中,主要应用律学中的五度相生律、十二平均律。2.2.1 五度相生律五度相生律是根据复合音的第二分音和第三分音的纯五度关系,即由某一音开始向上推一纯五度,产生次一律,再由次一律向上推一纯五度,产生再次一律,如此继续相生年定出的音律叫做五度,产生再次一律,如此继续相生所定出的音律叫做五度相生律。 例如五度相生律所订出的七个基本音级间的音高关系,和十二平均律中七个基本音级的音高关系是不同的。西方,早在公元前6世纪古希腊哲学家、科学家毕达哥拉斯及其学派就提出了“五度相生律”,因此,五度相生律又被称为“毕达哥拉斯律”。毕达哥拉斯及其学派认为宇宙和谐的基础是完美的数的比例,音乐与宇宙天体存在类似。认为弦长比分别为2:1、3:2、4:3时发出相隔纯八度、纯五度、纯四度的音程定为完美的协和音程。他们将纯五度作为生律要素,由此产生“五度相生律”。五度相生律以一音为基音,然后将频率比为3:2的纯五度音程作为生律要素,分别向基音两侧同时生音。下面以C为例,来阐述五度相生律的生律原理。假如C为基音,按照五度相生原理向上可生出G、D、A、E、B,向下可生出F、降B、降E、降A、降D、降G,将连同基音在内的十二个音写在一个八度之内。2.2.2 十二平均律十二平均律,亦称“十二等程律”,它是指将八度的音程(二倍频程)按频率等比例地分成十二等份,每一等份称为一个半音即小二度。一个大二度则是两等份。将一个八度分成12等份有着惊人的一些凑巧。它的纯五度音程的两个音的频率比(即2的7/12次方)与1.5非常接近,人耳基本上听不出“五度相生律”和“十二平均律”的五度音程的差别。同时,“十二平均律”的纯四度和大三度,两个音的频率比分别与4/3和5/4比较接近。也就是说,“十二平均律”的几个主要的和弦音符,都跟自然泛音序列中的几个音符相符合的,只有极小的差别,这为小号等按键吹奏乐器在乐队中使用提供了必要条件,因为这些乐器是靠自然泛音级来形成音阶的。半音是十二平均律组织中最小的音高距离。十二平均律在交响乐队和键盘乐器中得到广泛使用,现在的钢琴即是根据十二平均律来定音的,因为只有“十二平均律”才能方便地进行移调。曲调由音阶组成,音阶由音组成。音有绝对音高和相对音高。 半音是十二平均律组织中最小的音高距离。十二平均律在交响乐队和键盘乐器中得到广泛使用,现在的钢琴即是根据十二平均律来定音的,因为只有 “十二平均律”才能方便地进行移调。曲调由音阶组成,音阶由音组成。音有绝对音高和相对音高。声音是靠振动(声带、琴弦等)发出的,而振动的频率(每秒振动的次数),就决定了的音的绝对高度。不同的音有不同的振动频率。人们选取一定频率的音来形成音乐体系所需要的音高。举钢琴为例。钢琴是十二平均律制乐器。国际标准音规定,钢琴的a1(小字一组的a音,对应钢琴键是49A)的频率是为440Hz;又规定每相邻半音的频率比值为122=1.059463,(解释:这表示“2的十二分之一次方”),根据这规定,就可以得出钢琴上每一个琴键音的频率。如与a1右边相邻a1的频率是4401.059463466.16372Hz;再往上,b1的频率是493.088321Hz;c2的频率是523.25099。同理,与a1左边相邻的g1的频率是4401.059463415.030473Hz。这种定音的方式就是“十二平均律”。钢琴上每相邻的两个琴键(黑白都算)的频率的差别,音乐上即为半音。比如说C和#C相差半音,C和D相差两个半音(或曰一个全音),以此类推。如果B再往上升半音,会发现这个音的频率刚好是C的一倍,而在音乐上称为一个八度,这两个音听起来“很相象”。用小写的c来表示它,依次有#c,d再往上走可以用c1,c2来表示,而往下走可以用大写的C1,C2来表示4。2.2.3 五度相生律与十二平均律的比较十二平均律:各音阶频率比均匀增长。一个八度的频率比是2,全音程共有12个半音,故全音的 增量是2的2/12次方,半音的增量是2的1/12次方,计算如下:已知:A1= 440HzC1=440/power (2, 9/12)D1=440/power (2, 7/12)E1=440/power (2, 5/12)F1=440/power (2, 4/12)G1=440/power (2, 2/12)B1=440*power (2, 2/12)C2=440*power (2, 1/12)D2=440*power (2, 2/12)五度相生律:So音的频率是Do音的3/2倍,音程差是7个半音,音阶差是五度。其他音阶由 So音上升五度,然后降低八度产生,计算如下:已知:A1= 440HzC1= G1/power(3/2, 1)-G1降低1个五度。D1= G1*power(3/2, 1)/power(2, 1)-G1上升1个五度,降低1个八度。E1= G1*power(3/2, 3)/power(2, 2)-G1上升3个五度,降低2个八度。F1=G1*power(3/2, 10)/power(2, 6)-G1上升10个五度,降低6个八度。G1=440*2/ power (3/2, 2)-由A1返求。A1=G1*power (3/2, 2)/power(2,1)-G1上升2个五度,降低1个八度。已知A1,返求G1。B1= G1*power(3/2, 4)/power(2, 2)-G1上升4个五度,降低2个八度。C2=C1*2-C1上升八度。D2= G1*power(3/2, 2)/power(2, 1)-G1上升2个五度,降低1个八度。五度相生律与十二平均律,各音阶频率比跳变的图示比较:图2.1 音阶频率比跳变的图示比较可以看出,五度相生律,其Me, Fa,So三个音阶之间的频率变化,比较和缓,而十二平均律比较突兀。因此,五度相生律更加和谐悦耳。图2.2 音阶的频率变化曲线图2.2是音阶的频率变化曲线,五度相生律与十二平均律无显著差别。由于频率比是决定因素,所以 先前的频率比对数变化曲线比较适合做比较研究。2.3 音高频率固定音高的标准是乐器在常温下,琴弦每分钟震动的频率为440HZ,即钢琴键盘中小字1组a1的音高频率为标准,并且所有的键盘乐器都是以a1=440HZ/秒作为音高的标准。在历史上音高标准并不统一,各地音高标准皆有所不同。不同历史时期,音高标准也有所不同:1700年的法国音高标准为a1=374HZ/秒,比今日之标准低了约1个小三度;而德国北部地区音高层出现过a1=567HZ/秒,比今日之标准又高出1个大三度;1939年美国伦敦会议确定a1=440HZ/秒为国际标准,至此国际音高标准才得以确定和统一,这一音高又称国际第一音高及音乐会标准音高5。表2.1 音高的标准频率(HZ)八度音名0123456789C16.35232.70365.406130.81261.63523.251046.52093.04186.08372.0C/D17.32434.64869.296138.59277.18554.371108.72217.54434.98869.8D18.35436.70873.416146.83293.66587.331174.72349.34698.69397.3D/E19.44538.89177.782155.56311.13622.251244.52489.04978.09956.1E20.60241.20382.407164.81329.63659.261318.52637.05274.010548F21.82743.65487.307174.61349.23698.461396.92793.85587.711175F/G23.12546.24992.499185.00369.99739.991480.02960.05919.911840G24.50048.99997.999196.00392.00783.991568.03136.06271.912544G/A25.95751.913103.83207.65415.30830.611661.23322.46644.913290A27.50055.000110.00220.00440.00880.001760.03520.07040.014080A/B29.13558.270116.54233.08466.16932.331864.73729.37458.614917B30.86861.735123.47246.94493.88987.771975.53951.17902.1158043 基频检测3.1 系统框图过零率法分析时域分析音频录入wavread谐波峰值法分析频域分析图3.1 系统框图3.2 检测方法信号基频的检测根据处理域的不同,可将金银提取分为时域的算法、频域的算法、统计的算法三类。3.2.1 时域的算法因为乐音信号的时域波形代表了随时间变化的声音激励的变化,基频提取的最基本方法就是通过观察语音信号的波形,并从波形中检测出基频。时域的事件发生率检测。基频提取方法中的一些方法是师徒通过观察语音信号的波形重复自己的频率,估计基频。这些方法的理论抑郁是,如果语音信号是周期的,那么就会随着时间不断重复出现的事件发生,统计这些事件在单位时间内发生的次数,就能估计出基频。通过这种理论检测基频的方法包括过零率、峰值率、信号导数的事件检测6。自相关函数法。以两个信号之间的相关函数度量他们之间的相似性,相关函数的结果随两个信号波形开始时间的延迟而变化。自相关函数是信号自身的相关函数,以自相关函数度量信号自身的相似性。对于无限长的离散信号xn,自相关函数的定义为: Rxv=n=-n=xnxn+v (3.1)式中v为信号的延时,对已一般的8kHz采样的乐音信号,取值范围为20150,相应的基音频率范围为60500Hz。对于长度为N的离散信号xn,自相关函数的定义为:Rxv=n=0n=N-v-1xnxn+v (3.2)对于周期性函数,自相关函数也呈现周期性,并且在基音周期的各个整数点上有很大的峰值。只要找到第一最大峰值点的位置并计算它与v=0点的间隔,便能估计出基音周期,而基音周期的倒数就是基音。为了防止窗长过短引起计算的错误,需要使窗长至少大于两个基音周期,才可能取得较好的计算结果7。平均幅度差函数法。还可以采用平均幅度差函数法求基音,计算公式为:rxv=v=0N-v-1|x(n+v)-x(v) | (3.3)与自相关函数法相同,对于周期性的函数想x(n),平均幅度差函数r(x)也呈现周期性,不同点在于自相关函数法的结果在基音周期的各个整数点有很大的峰值,而平均幅度差函数法在基音周期的各个整数点有谷值8。3.2.2 频域的算法频域有更多的与基频相关的信息。具有基频的信号是由频率具有谐波关系的信号组成的,因此有很多尝试利用频域信息提取基频的方法。(1)基于滤波器的算法。最佳梳状滤波器法是一种具有高鲁棒性但计算代价很大的算法。一个梳状滤波器有很多等距离分布的通带,在最佳梳状滤波器算法中,通带的位置都是由第一个通带决定的,即通带的中心频率都是第一个通带中心频率的整数倍。输入信号通过多个与第一个通带中心频率不同的梳状滤波器。吐过输入信号是有一组频率成谐波关系的信号组成的,那么滤波器的输出在全部谐波成分都通过滤波器时呆到最大。但是如果信号只有一个基频成分,该方法就会失效,因为会有很多个梳状滤波器能让信号通过。不过,语音信号的频率具有谐波结果,所以可采用该方法提取基频9。(2)倒谱分析法。倒谱分析是谱分析的一种方法,输出是傅里叶变换的幅度谱对数后做傅里叶逆变换的结果。该方法所抑郁的理论是,一个具有基频的信号的福利叶变换的幅度谱有一些等距离分布的峰值,代表信号中的谐波结构,当对幅度谱取对数之后,这些峰值被削弱到一个可用的范围。幅度谱去对数后得到的结果是在频域的一个周期信号,而这个频域信号的周期(是频率值)可以认为就是原始信号的基频,所以对这个信号做傅里叶变换就可以在原始信号的基音周期处得到一个峰值。另外,如果对信号的傅里叶变换的幅度谱取对数后的结果直接进行分析,而不是再接着做傅里叶逆变换,就是谐波成分谱的方法。进一步,如果在求频域的变换时不使用傅里叶变换,而使用能使频谱更加精细的Chirp变换,就就急于Chirp变换的提取基频方法,该方法具有高分辨率和高鲁棒性10。(3)多分频率的方法对于任何急于傅里叶分析的频域方法都可以做的一个改进是采用多分辨率方法。该方法的思想是:如果一个特定算法在特定分辨率下的准确性能是可以的,那么采用更高或者更低的分辨率,就可以进一步判断前面的基频估计是否可信。日过在全部或大部分的分辨率下求得相同的基频,那么该频率值就可以作为最终的基频估计结果。当然,在带来好处的同事,该方法也会带来计算量上的代价,因为针对每一个分辨率都需要重新计算频谱,这也是为什么多分辨率的傅里叶分析比专门的多分辨率变换(如离散小波变换)更慢的原因。(4)离散小波变换法离散小波变换是一个强大的工具,它语序在连续的尺度上吧信号分析为高频成分和低频成分,它是时间和频率的局部变换,能有效地从信号中提取信息。与快速傅里叶变换相比,离散小波变换的主要好处在于,在高频部分它可以取得好的时间分辨率,在低频部分可以取得好的频率分辨率11。3.3 时域分析简单地说,过零率就是单位时间内波形通过零点的次数12。在本设计的实验过程中,我们通过采集大量的钢琴琴音素材,来作为待处理的声音信号。素材来源于一架常温下的立式钢琴,将麦克风置于钢琴键盘中央上方0.1 米处进行采音,以正常演奏力度弹奏乐音,不踩任何踏板直至声音自然消失,将生成的声音文件以.wav 的格式存贮在计算机内5。利用MATLAB软件对每一个琴音分别进行分析,得到其声音波形图如下,图3.2为低音的波形图,图3.3为中音波形图,图3.4为低音的波形图(图中所示波形为钢琴88个音中任意选取的三个有代表性的琴音)。图3.2 低音的波形图图3.3 中音波形图图3.4 高音的波形图由得到的波形图可以看出,低音部分的钢琴弦振动的很不稳定,没有什么规律,由于钢琴的构造很复杂,而低音部分的声音充满了杂音,从波形图中可以大略知道无法直接找到它的基准音。用简单的方法来找低音的基准音也存在许多的问题,很可能出现错误的检测。中音部分的钢琴弦振动的比较稳定,从起振到平静的振动曲线也比较有规律。余振的存在不会过多的干扰基准音,但是也没有办法直观的找出其基准音,用稳妥的检测方法来检测其基准音,应该不会出现错误的判断,但是可能存在误差。高音部分的钢琴弦振动的很规律,从起振开始的不规律的杂音,达到振动的高音,也就是这个音的基准音后,迅速开始回落,有规律的一边振动,一边回落,直到趋于平静。正常情况下,钢琴的高音区部分的声音也是这样的。十分的清脆,不像低音或者中音那样,会有很长的回音。用简单的方法可以很容易的找出其基准音,而且误差会很小,几乎可以忽略。由于录音的环境,录音的设备等诸多因素的影响,导致的录音的音频中有相当多的杂音,必须通过其他软件先对音频进行处理。3.4 频域分析谐波峰值法师基于快速傅里叶变换(FFT)的分析法,将信号通过FFT变换得到离散的频率普,最大峰值对应于基音频率。但是,在识别的过程中,必须认识到以下两点:第一,基频的峰值并不总是最大。如果简单地用频域峰值的最大值来代表基音,必然得不到正确的结果;第二,真正决定音高的并不一定是基音。本世界30年代,J.F.Schouten在著名的音频转移实验(Pitch-Shift Experiment)中证明:基音并不一定决定音高。当然,实际的音乐信号不大可能出现一只有谐波而无基音的极端情况,但是,基音幅度并不是最大这种情况倒是经常出现。另外,有时在干扰较强的条件下。基音峰值并不是特别清晰,实际的识别软件必须考虑以上两种情况。一般地,识别软件对音乐信号进行FFT得到频域数据,提取出其中的局部最大值(峰值)序列,原则上把序列频率的最大的公因子作为音高。但是,由于音乐信号的频宽较大,对于音高跨度加大的乐曲,如果乐器谐波比较丰富,就很可能把二次甚至三次谐波误会定为音高。考虑到虽然基音的幅度不一定是最大,但幅度最大的音量一定是基音的某次谐波(一般不大于5次),或者就是基音本身。将满足这个条件的频率成为“候选基音”。如果某个“候选基音”是真实的音高,那么在峰值序列中和他称谐波关系的峰值就多,他的置信度也就大。计算所以“候选基音”的置信度的值,将具有最大置信度的“候选基音”作为实际的音高。根据以上的考虑,得出以下公式:LN=fpN,1N5 (3.4)BN=i=1MPi (3.5)式中,L(N)为候选基音,fp为最大峰值频率,B(N)为置信度,M为谐波的个数,P(i)为某此谐波的幅度,N为假定的谐波次数13。开始载入音频文件wavread()频率采样傅里叶变换Y=fft(x)N=11N5 L(N)=fp/N Y N+1 B(N)=P(1*L(N)+P(2* L(N))+P(m*L(N))N Bmax=0,BmzxB(N)Bmax=B(N) Yf=L(N)结束图3.5 谐波峰值法的程序流程图实验结果表明,这种方法在判别基音时,有很好的抗干扰性,不但能对单音序列作准确的识别,而且在有简单和旋伴奏时也能较好地提出主旋律。通过MATLAB软件,对采集到的音频文件做谐波峰值法分析其基频方法流,经过MATLAB软件实现谐波峰值法后,得到钢琴各个音部的频谱图如下:图3.6 低音部分频谱图图3.7 中音部分频谱图图3.8 高音部分频谱图4 离散频谱分析的校正在数字信号处理中,有DFT或FFT得到的幅值谱S是离散谱,是信号频谱与窗函数频谱作卷积后,按照=2/N等间隔频域抽样的结果。如果周期性信号的频率正好在某一谱线上,则得到的频率、幅值和相位是准确的。在一般情况下,信号频率在两条频谱线之间,由于谱线不再主瓣中心,有峰值谱线反映的频率和幅值都不准确,相位误差更大。本章提出一种谱值校正方法,通过主瓣峰顶附件的两条谱线求出主瓣中心的坐标,以得到准确的频率和幅值,有频率修正量进而对相位进行校正14。4.1频率校正法图4.1 窗函数的频谱函数频率校正即求出主瓣中心的横坐标。设窗函数的频谱函数为f(x),f(x)是对称于Y轴的(图4.1)。已知y=f(x),y1=f(x+1),要由y和y1求出x,即求解谱线修正量x=-x。由于f(x)的函数表达式为已知,可构造一函数:V=Fx=fxfx+1 (4.1)V为间隔为1的两点比值,是x的函数,对上式解出其反函数x=g(v),将V=y/y1带入其中可解得x=g(y/y1),可求出x=-x,这种方法可称为比值法。在实际计算中,主瓣中心x0位于信号真是频率处,如图4.2所示,图中yk, yk+1是幅值谱主瓣内二相邻谱线,以V=ykyk+1 (4.2)代入x=g(V),则谱线修正量为K=-x。若以谱线yk-1, yk作校正,则以V=yk-1yk (4.3)图4.2 频率和幅值校正代入x=g(v),这时K=-x-1,校正频率为fk=K+Kf0N (4.4)式中,K为谱线序号(0N/2-1),N为分析点数,f0为采样频率。x=g(v)称为频率校正函数,对不同的传函数,g(v)是不同的。4.2 幅值校正法设传函数的频谱函数为f(x),则图4.2中主瓣函数为y=Afx-x0 4.5这就是信号频谱与传函数作卷积的结果,式中,A为真是幅值,对应主瓣中心x0,现将y=yk,x=K代入(4.1)式中,得yk=AfK-x0 (4.6)式中,K-x0=K,故可解出A值A=ykf(K) (4.7)4.3 相位校正法谱分析所用传函数都不是对称于y轴,要向右平移N/2点,其频谱函数相对于y轴来说有一相移因子e-jN2,其相位角=-N2 (4.8)与谱线号K的关系为=-2NK (4.9)将(4.9)式代入(4.8)得 =-K (4.10)这表明窗函数的相位是线性相位,如图4.3所示。图4.3 传函数的相位信号频谱函数与窗函数的频谱函数作复卷积时是复数相乘,也即相位角相加。由图4.3可以看出,频率误差半个谱线,相位误差将达到90,这表明由FFT的实部与虚部所得到的相位如不加校正是不能用的15。频谱分析的频率、幅值和相位校正方法,可以大大提高离散频谱分析的精度,从理论和实际上解决了请却求频率和幅值的问题,为精确测量信号参数提供了一种有效手段。也为精确的校正乐器的音律提供了有力的条件。4.4 校正过程以钢琴的第一个音为例,S(K-1)=30.054、S(K+1)=23.671,由于S(K-1)S(K+1)根据RIFE频率估计法得:K=-SK-1SK+SK-1 (4.11)带入数值解得K=0.164,把式4.4解得fk=27.137HZ。同理可求出键盘上88个音的离散频谱分析的校正频率。下表为88个音中其中音通过过零率、谐波峰值法、离散频谱分析的校正得到的频率与标准音频的比较。表4.1 校正结果的比较标准频率过零率谐波峰值法离散频谱分析第1个音27.5002995426.91727.150第11个音48.99936548.44949.200第21个音87.307102786.13386.830第31个音155.561231150.73151.86第41个音277.181160269.17270.83第51个音493.882531481.81482.42第61个音880.002483855.95857.88第71个音1568.026161429.81430.2第80个音2637.028722498.32547.3第88个音4186.039903946.63998.6由表4.1可知,经过校正后的低音频率精确度较高,而高音部分精度交差。总 结音乐就是一门不断追求完美享受的艺术,“工欲善其事必先利其器”,追求完美的乐器音色将为所有音乐艺术家创造优越的条件。乐器校音的过程就是调出乐器应有的规律。70 年代出现的“电脑音乐”是艺术与信息科学的交叉学科,而音乐识别、计算机分析音率等领域的研究也是在此交叉点上生长出来的。三十多年来,音乐和信息技术的结合取得了很多实用性的成果,如:电子乐器、音乐信号的数字编码、数字压缩、数字存储等。但是,作为一个新兴领域,音乐电子的根本目标是用计算机来模拟人对音乐的智能认识和创作过程,其发展涉及音乐理论、认知科学、人工智能、信息处理、多媒体技术、模式识别、智能控制等。应该说,时至今日此方面的研究还是刚刚开始,仍有许多工作急待完善。本人的研究工作同样是基于这样的背景展开的,工作中重点完成了钢琴音律的提取、校正等系统的设计与计算机实现。乐器校音系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论