



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于感知的数字音频压缩编码感知编码原理在过去10年中,数字音频已经基本代替了模拟音频,并在互联网、无线通信、多媒体计算机上得到广泛应用。但这些应用都面临如下3个问题:传输带宽资源紧缺、传输代价昂贵及存储容量有限。低码率高质量的数字音频压缩成为迫切需要解决的问题,而这一问题的解决要归功于基于感知的CD音质数字音频的透明编码。数字音频编码是一种为了高效传输和存储数字化宽带音频而对它们进行紧缩数字表示的处理方法。它的主要目标是用尽可能低的编码速率压缩音频信号的同时,又能保证重建的音频信号质量几乎和原始信号相同。实践也证明,基于感知的音频编码解决了人们对数字音频的传输需求和有限的网络传输带宽的矛盾。图1所示的是感知编码器框图。可以看出,感知编码具有如下几个特点:数字音频信号参数 参数掩蔽阀 边信息图1感知编码器框图无损编码和有损编码的有机结合。有损编码去除音频信号中的感知相关度和统计冗余度。多个信号处理模型的有机结合。大多数数字音频编码系统采用感知编码原理。所谓感知,就是指利用人耳的听觉特性,保留音频信号中人耳能够听到的,去掉听不到的成分。一般的感知编码要用到5个基本原理:绝对听觉门限、临界带宽、同时掩蔽、非同时掩蔽和感知熵。数字音频编码技术感知编码根据压缩技术的不同又可分为子带压缩技术和变换压缩技术。子带压缩技术是以子带编码理论为基础的编码方法。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其分布特性采取不同的压缩策略以降低码率。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。典型代表有著名的MPEG-1层I和层II等。变换压缩技术则是对一段音频数据进行线性变换,对所获得的变换域参数进行量化、传输,通常使用的变换有DFT、DCT和MDCT等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配,可以使音频质量获得显著改善,而相应付出的代价则是计算复杂度的提高。具有代表性的变换压缩编码技术有DolbyAC-2、AT&T的ASPEC(AudioSpectralPerceptualEntropyCoding)、PAC(PerceptualAudioCoder)等。MPEG音频编码技术经过10多年的发展,国际标准化组织、国际电工委员会所属WG11工作组制定推进了MPEG标准。MPEG定义了低比特率视频流和音频流的描述语法,并规范了解码器的操作。MPEG系列中的每个标准都是建立在前面标准的基础之上的。MPEG-1和MPEG-2是目前成熟的广泛应用的标准,而MPEG-4是作为一个开放的多媒体标准出现在市场上的。后继标准MPEG-7及以后的MPEG-21标准重点已经不在压缩方面,MPEG-7注重于多媒体数据基于内容的描述,用来帮助运营者管理日益丰富的多媒体信息,而MPEG-21则更侧重于与多媒体信息内容的使用相关的诸多方面。MPEG系列标准对多媒体以及相关产业产生重大的影响,并将极大的推动多媒体通信领域的发展。总体来说,MPEG在3方面优于其他压缩/解压缩方案。首先,MPEG具有很好的兼容性;其次,MPEG比其他算法提供更高的压缩比,最高可达200:1。更重要的是MPEG在提供高压缩比的同时,对数据的损失很小。数字音频播放器的设计与实现基本功能基于前文中所了解到的语音编码技术的原理,通过VisualC++6.0的可视化编程,制作了一个音频播放器,可以播放WAVE、AVI、MIDI、CD和MP35种格式的音频文件,如图2所示。图2播放器简图底排的5个按钮可以对所播放的音频格式进行限制,当选中时可以播放不同格式的音频文件。此外,对本播放器进行一些特色处理:制作radio按钮,以对各种音频格式进行选择性播放,达到区分和比较效果的目的。增添AVI按钮,AVI和WAVE在文件结构上是非常相似的,不过AVI多了1个视频流。添加1个基于Button类的按钮类CFXButton,制作出特殊的按钮。用Photoshop做1个播放器的界面。程序设计本程序调用了一个控件MicrosoftMultimediaControl,version6.0由此引入了2个已封装好的类,MCI(TheMediaControlInterface)和PICTURE;通过MCI来播放各种音频文件。MCI类是通过GetDeviceType函数来控制所播放的文件的类型,其函数原型如下。CStringCmci::GetDeviceType(){CStringresult;InvokeHelper(0x15,DISPATCH_PROPERTY2GET,VT_BSTR, (void3)&result,NULL);returnresult;}在对话框类中通过OnOpen()函数来设定所打开文件的类型,代码如下。播放WAVE文件:this->m_Multimedia.SetDeviceType("WaveAudio");播放AVI文件:this->m_Multimedia.SetDeviceType("AviVideo");播放MIDI文件:this->m_Multimedia.SetDeviceType("Sequencer");播放CD文件:this->m_Multimedia1.SetDeviceType("CDAudio");MCI类通过mciSendCommand()或mciSendString()来实现控制MIDI文件播放的功能,其中mciSendCommand()函数原型如下:DWORDmciSendCommand(UNITwDeviceID,UNITwMessage,DWORDdwParam1,DWORDdwParam2);各个参数说明如下:wDeviceID:接受消息的设备ID;wMessage:MCI命令消息;dwParami:命令的标志位;dwParam2:所使用参数块的指针;测试与分析按照上述功能,进行实际的播放,对于不同格式的文件分别试听,比较不同格式的音频文件听觉上的效果。CDCDA格式就是唱片采用的格式,又叫''红皮书〃格式,记录的是波形流,绝对的纯正、HIFI。音乐CD的回放采样字节都是16位,它采用了PCM编码,而PCM编码的最大优点就是音质好。但其缺点是,无法编辑,文件太大。一张光盘的容量只能容纳72min的音乐信息。MIDIMIDI技术本来不是为电脑发明的,该技术最初应用在电子乐器上用来记录乐手的弹奏,以便以后重播。随着在电脑里面引入了支持MIDI合成的声音卡之后,MIDI才正式地成为了一种音频格式。MIDI的内容除了乐谱之外还记录了每个音符的弹奏方法,所以MIDI文件播放起来效果参差不齐。作为音乐工业的数据通信标准,MIDI可谓是一种非常专业的语言,它能指挥各音乐设备的运转,而且具有统一的标准格式。由于标准化,MIDI文件的长度非常小,一首歌一般就几十k字节,但MIDI必须依赖于回放设备,此外,MIDI另一个缺点就是不能记录人声等声音。它只能将人声作为一种乐器储存在音色库中,总之不能令乐器唱歌、说话。WAVE该格式记录了声音的波形,故只要采样率高、采样字节长、机器速度快、利用该格式记录的声音文件能够和原声基本一致。从理论上说,采样率达44kHz,采样字节长度达16位的音质已经能与CD唱片相当。它可以不对数据进行压缩,制作出来的声音质量却可以达到专业级水平。WAVE是一种文件格式,符合PIFF(ResoureelnterchangeFileFormat)规范。所有的WAVE都有一个文件头,这个文件头包含音频流的编码参数。WAVE对音频流的编码没有硬性规定,几乎所有支持ACM(AudioCompressionManager)规范的编码都可以为WAVE的音频流进行编码。在Windows平台下,基于PCM编码的WAVE是被支持得最好的音频格式,所有音频软件都能完美支持。由于它本身可以达到较高的音质的要求,因而WAVE也是音乐编辑创作的首选格式,适合保存音乐素材。同时它也被作为一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMAE。WAVE的唯一缺点就是文件太大。因此,虽然WAVE文件可以存放压缩音频甚至MP3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像MP3那样用于聆听。目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。MP3MP3就是应用于MPEG-1的一项音频压缩技术标准,英文全称是MPEG-1AudioLayerIII。它采用MPEG中的第3层音频压缩模式,MPEG音频文件是MPEG-1标准中的声音部分,它根据压缩质量和编码复杂程度划分为3层,即LayerI、Layerll和Layerill,且分别对应MP1、MP2、MP3这3种声音文件,并根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为4:1和(6:1)〜(8:1),而MP3的压缩率则高达(10:1)〜(12:1)o因此,MP3是第一个实
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿山汽车考试题及答案
- 殡仪馆考试题及答案
- 航向操作考试题及答案
- 上虞招聘面试题及答案
- 非遗智慧:孩子学艺诀窍
- 2020-2025年BIM工程师之BIM工程师高分通关题库A4可打印版
- 2025年注册消防工程师之消防技术综合能力通关提分题库(考点梳理)
- 1.1菱形的性质与判定第2课时(教学课件)数学北师大版九年级上册
- 保安防恐防暴培训知识课件
- 保安知识培训资料内容课件
- 切削刀具项目实施方案
- 常见行政案件笔录模版
- 手术室甲状腺切除术手术配合护理查房
- 国家电网电力中级职称考试题
- 美国专利法及实务培训-上传课件
- 新版中国电信员工手册
- 2023年中国工商银行软件开发中心春季校园招聘500人笔试模拟试题及答案解析
- D500-D505 2016年合订本防雷与接地图集
- 中国重症加强治疗病房(ICU)建设与管理指南
- 社区矫正法课件
- 后勤保障楼幕墙施工方案新
评论
0/150
提交评论