版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于分形维数的音乐自动分类方法摘要:音乐的自动分类是现代检索技术的一个研究内容,也是音乐可视化研究中亟待解决的问题。近年来,音乐的分形性质已得到了广泛的研究。本文是从分形的角度对音乐的自动分类问题进行研究,提出了一种基于分形维数的音乐自动分类方法:通过对不同风格音乐的分形维数的计算与比较,确定音乐分类的范围指标,然后利用此指标作为依据对音乐进行自动分类。本文通过实验证明此方法具有使用简单、高效和高准确率的特点。关键词:分形技术;分形维数;音乐自动分类abstract】musicautomaticclassificationisonedomainofstudyinmodernsearchtechnology,andalsotheproblemsurgentlytobesolvedinmusicvisualization.inrecentyears,thefractalnatureofthemusichasbeenwidelystudied.thisarticlewhichresearchesintomusicautomaticclassificationfromthefractalpoint,proposesanewmethodologyofmusicautomaticclassificationbasedonfractaldimension:determinetheindicatorofthescopeofmusicclassificationfromcalculatingandcomparingthefractaldimensionsofdifferentmusicstyles,hisarticle,itisprovedbyexperimentsthatthismethodisefficient,simpletouseandwithhighaccuracy.keywords】fractaltechnology;fractaldimension;musicautomaticclassification0引言随着计算机技术和通信技术的飞速发展,各式各样的信息急速的增长,人们也时时刻刻的能接触到大量多媒体形式的内容,如图像、音频、视频等。但是随着数据量的快速增长,如何自动对这类内容进行快速管理就成为了一个亟待解决的问题。特别是对身边大量的音乐信息,人们需要快速高效的方法对它们进行分类和管理,以便更好的应用在音乐推荐、ktv点唱及在线选歌等诸多领域中。伴随着语音识别技术的火热发展,许多其它领域的方法被应用到音乐分类领域之中。然而,由于音乐的多样性和不确定性,基本上所有的方法与大规模的实际应用都还有不小的距离。目前绝大多数音频分类算法集中在两方面——音频的特征提取以及根据音频特征进行分类。现有的音频特征算法有:短时过零率、时域的短时能量、谱质心分析、频域带宽等,还有基于听觉感受的mfcc(mel-frequencycepstralcoefficients)梅尔倒频谱系数等。另一方面,分类算法可利用模式识别和模式分类中已知算法,如cmm(gaussianmixturemodel)高斯混合模型[1]、nn(neuralnetwork)神经网络、hmm(hiddenmarkovmodel)隐马尔可夫模型[2-6]等。本文是从一个全新的角度,即分形的角度对音乐的自动分类问题进行研究,提出了一种基于分形维数的音乐自动分类方法:通过对不同风格音乐的分形维数的计算与比较,确定音乐分类的范围指标,然后利用此指标作为依据对音乐进行自动分类。实验证明此方法使用简单,并具有较高的分类精度。1音乐与分形古典音乐最低,嘻哈音乐最高。且本方法对于乡村音乐的区分度准确率最高,嘻哈音乐次之,古典音乐最低。在古典音乐的测试中,绝大部分分类错误的音乐都分类在了乡村音乐中,只有少部分音乐分在了嘻哈音乐中。同样的在嘻哈音乐的测试中绝大部分分类错误的音乐都分类在了乡村音乐中,只有极少部分音乐分在了古典音乐中。再综合三类音乐的分形维数递增,这就可以说明此三种音乐的分类想要跨越中间音乐类型不是很容易。本方法对三种音乐类型的分类结果准确率较高,且本身方法简便,实现程序运算速度快,可以实现音乐的快速自动分类。4结论本文提出利用音乐的分形维数作为音乐的特征进行音乐分类的方法,并着重将整首音乐进行统一处理的研究思路,其优势在于只用一维特征就能区分音乐的不同类型,即分形刻画了音乐的内在特征——部分与整体的相似性。该方法具有应用简单、分类准确度高、速度快等优点。然而,该方法对音乐的分类还存在不足,如分类不
一论文发衷专家一
一论文发衷专家一
中国学木期刊网够精细,部分音乐的维数很接近等。所以在以后的工作中要对除振幅外的其他音乐特征进行进一步研究,再适当结合其他分类方法的基础上,充分利用多维向量来进行音乐或音频的分类,以便提高音乐分类的精细程度,达到更好的分类效果。参考文献肖健华.智能模式识别方法[m].北京:华南理工大学出版社,2006.卢坚,陈毅松,孙正兴.语音/音乐自动分类中的特征分析.计算机辅助设计与图形学学报,2003,14(3):233-237.bailiang,laosongyang,chenjianyun,wulingda.featureanalysisandextractionforaudioautomaticclassification[a].systems,manandcybernetics[c],2005ieeeinternationalconferenceon,china,2005,1:767-772.j.ajmera,i.a.mccowan,h.bourlard.robusthmmbasedspeech/musicsegmentation.ieeeproc.icassp[c],orlando,usa.2002,5:297~300.l.r.rabiner.atutorialonhiddenmarkovmodelsandselectedapplicationinspeechrecognition[a].proc.ofieee,iss.2[c],1989,77:257-286.庄越挺,毛炜,吴飞.基于隐马尔科夫链的广播新闻分割分类[j]・计算机研究与发展,2002,9(9):1057-1063.
[7]vossr.f,clarkej[7]vossr.f,clarkejnature,1975,258:317-318.nature,1975,258:317-318.[8]vossr.f,clarkej[8]vossr.f,clarkej”1/fnoise”inmusic:musicfrom1/fnoise[j].j.acoust1/fnoise[j].j.acoustsoc.am.1987,63(1):258-263trainac,jrtrainaa.fastfeaturesselectionusingfractaldimension[a].procofxvbraziliandataba
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 未来五年蛇毒制品企业ESG实践与创新战略分析研究报告
- 未来五年生毛皮企业ESG实践与创新战略分析研究报告
- 未来五年新形势下大号水槽行业顺势崛起战略制定与实施分析研究报告
- 未来五年笔记本电脑零组件企业数字化转型与智慧升级战略分析研究报告
- 未来五年旅游咨询服务企业数字化转型与智慧升级战略分析研究报告
- 未来五年固体产品纸包装企业ESG实践与创新战略分析研究报告
- 未来五年复印机用电机企业数字化转型与智慧升级战略分析研究报告
- 淄博市公务员面试面试题及答案
- 周末 安徽省公务员考试试题及答案
- 医疗大数据投融资的公共健康数据共享
- 福建省福州市四校联盟2025-2026学年高三上学期期中联考历史试题
- 2025年药学统计学试题及答案
- 新疆维吾尔自治区阿克苏地区阿克苏市2024-2025学年九年级上学期1月期末英语试题
- 电煤销售合同范本
- 2025年谷胱甘肽及酵母提取物合作协议书
- 农业机械安全培训课件
- 2026广西融资担保集团校园招聘补充参考笔试题库及答案解析
- 2026贵州安创数智科技有限公司社会公开招聘119人参考笔试题库及答案解析
- 韩家园林业局工勤岗位工作人员招聘40人备考题库新版
- 2025年云南省人民检察院聘用制书记员招聘(22人)参考笔试题库及答案解析
- 维修班组长设备故障应急处理流程
评论
0/150
提交评论