多媒体新技术发展与应用论文.doc_第1页
多媒体新技术发展与应用论文.doc_第2页
多媒体新技术发展与应用论文.doc_第3页
多媒体新技术发展与应用论文.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体新技术的发展与应用班级: 08050642X 学号: 姓名: 中北大学信息商务学院音频编码标准的发展与应用利用计算机交互式综合处理多种媒体信息(如文本、声音、图形、图像、动画、视频等),使多种信息建立逻辑连接并集成为一个具有交互性能的系统的技术。形象地说多媒体技术就是利用计算机将各种媒体信息以数字化的方式集成在一起,从而使计算机具有表现、存储和处理多种媒体信息的综合能力,它是一种跨学科的综合技术。而音频信息在人们的工作和生活中具有非常重要的作用,数字化的音频信息的数据量也相当巨大,为更好地存储、传输和使用数字化的音频信息需要对音频信息进行标准化的编码压缩。一、概述 音频信号数字化之后所面临的一个问题是巨大的数据量,这为存储和传输带来了压力。例如,对于CD音质的数字音频,所用的采样频率为44.1 kHz,量化精度为16bit;采用双声道立体声时,其数码率约为1.41 Mbit/s;1秒的CD立体声信号需要约176.4KB的存储空间。因此,为了降低传输或存储的费用,就必须对数字音频信号进行编码压缩。到目前为止,音频信号经压缩后的数码率降低到32至256kbit/s,语音低至8kbit/s以下,个别甚至到2kbit/s。为使编码后的音频信息可以被广泛地使用,在进行音频信息编码时需要采用标准的算法。因而,需要对音频编码进行标准化。2、 音频编码技术和应用 2.1 音频信号 通常将人耳可以听到的频率在20Hz到20KHz的声波称为为音频信号。人的发音器官发出的声音频段在80Hz到3400Hz之间,人说话的信号频率在300到3000Hz,有的人将该频段的信号称为语音信号。在多媒体技术中,处理的主要是音频信号,它包括音乐、语音、风声、雨声、鸟叫声、机器声等。表1 数字音频等级信号类型频率范围(Hz)采样率(KHz)量化精度(采样位数)电话话音200340081316宽带话音5070001616调频广播2015k3216高质量音频2020k44.116 2.2 音频编码技术对数字音频信息的压缩主要是依据音频信息自身的相关性以及人耳对音频信息的听觉冗余度。音频信息在编码技术中通常分成两类来处理,分别是语音和音乐,各自采用的技术有差异。现代声码器的一个重要的课题是,如何把语音和音乐的编码融合起来。 2.3 数字音频编码的主要应用 对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量: 比特率; 主观/客观的语音质量; 计算复杂度和对存储器的要求; 延迟; 对于通道误码的灵敏度; 信号的带宽。 由于不同的应用,人们对数字音频信息的要求是不同的,并且在选择数字音频信息编码所采用的技术时也需要了解人们对音频信息的各种应用。目前数字音频信息处理技术主要应用于:l 消费电子类数字音响设备 CD唱机、数字磁带录音机(DAT)、MP3播放机以及MD(Mini Disc)唱机已经广泛地应用了数字音频技术。l 广播节目制作系统 在声音节目制作系统,如录音、声音处理加工、记录存储、非线性编辑等环节使用了数字调音台、数字音频工作站等数字音频设备。l 多媒体应用 在多媒体上的应用体现在VCD、DVD、多媒体计算机以及Internet。VCD采用MPEG-I编码格式记录声音和图像;DVD-Audio格式支持多种不同的编码方式和记录参数,可选的编码方式包括无损的MLP、DSD、Dilby AC-3、MPEG2-layer2 Audio等,而且是可扩充的、开放的,并可以应用未来的编码技术:Internet上采用MP3的音频格式传输声音,以提高下载能力。l 广播电视数字化 在广播电视和数字音频广播系统中,声音编码采用MUSICAM编码方法,符合MPEG-1 Layer 1高级音频编码。如当今的数字电视采用的音频标准就是Dilby AC-3和MPEG-layer2。l 通讯系统 在通讯系统中,必须对音频进行压缩。传统的PSTN电话中采用的是G.711和G.726的标准;GSM移动通讯采用的是GSM HR/FR/EFR标准;CDMA移动通讯采用的是3GPP2 EVRC、QCELP8k、QCELP16k、4GV标准;WCDMA第3代移动通讯采用的是3GPP AMR-NB、AMR-WB标准。另外在IPTV和移动流媒体中,采用的是AMR-WB+和AAC的标准。三、音频编码标准发展现状 3.1 语音编码标准发展现状 国际电信联盟(ITU)主要负责研究和制定与通信相关的标准,作为主要通信业务的电话通信业务中使用的语音编码标准均是由ITU负责完成的。其中用于固定网络电话业务使用的语音编码标准如ITU-T G.711等主要在ITU-T SG 15完成,并广泛应用于全球的电话通信系统之中。目前,随着Internet网络及其应用的快速发展,在2005到2008研究期内,ITU-T将研究和制定变速率语音编码标准的工作转移到主要负责研究和制定多媒体通信系统、终端标准的SG 16中进行。 3.2 音频编码标准发展现状 音频编码标准主要由ISO的MPEG组来完成。MPEG1是世界上第一个高保真音频数据压缩标准。MPEG1是针对最多两声道的音频而开发的。但随着技术的不断进步和生活水准的不断提高,有的立体声形式已经不能满足听众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。目前有两种主要的多声道编码方案:MUSICAM环绕声和杜比AC-3。MPEG2音频编码标准采用的就是MUSICAM环绕声方案,它是MPEG2音频编码的核心,是基于人耳听觉感知特性的子带编码算法。而美国的HDTV伴音则采用的是杜比AC-3方案。MPEG2规定了两种音频压缩编码算法,一种称为MPEG2后向兼容多声道音频编码标准,简称MPEG 2BC;另一种是称为高级音频编码标准,简称MPEG 2AAC,因为它与MPEG1不兼容,也称MPEG NBC。 MPEG4的目标是提供未来的交互多媒体应用,它具有高度的灵活性和可扩展性。与以前的音频标准相比,MPEG4增加了许多新的关于合成内容及场景描述等领域的工作。MPEG4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,并在诸多领域内给予高度的灵活性。 3.3 具有我国自主知识产权的音频编码标准发展现状 具有自主知识产权的广晟数码数字音频编解码算法(简称广晟数码音频技术,DRATM),它是可以同时支持立体声和多声道环绕声的数字音频编解码技术。其算法的特点是采用自适应时频分块(ATFT)方法实现对音频信号的最优分解,进行自适应量化和熵编码,另外,由多家研究所、大学组成的中国音视频编码技术委员会(AVS)目前正在研究制定AVS第2部分音频标准,并已经申请了部分专利。AVS音频标准的指导原则是:在基本解决知识产权问题的前提下,制定具有国际先进水平的中国音频编码/解码标准,使AVS音频编码的综合技术指标基本达到或超过MPEG AAC编码技术的指标。目前正在开展移动部分AVS-M的音频标准制定工作。四、数字音频编码技术的发展趋势 4.1 语音编码技术的发展趋势 经过多年的努力,业界在语音编码领域取得了很多重要的进展。目前在语音编码领域的研究焦点,一方面是在保证语音质量的前提下,降低比特率。在采用的技术方面从基于线性预测,使用合成一分析法向采用参数编码技术方向转变。主要的应用目标是蜂窝电话和应答机。另一方面是对传统的语音编码器进行全频带扩展,使其适应音频的应用。例如,AMR从NB发展到WB,再到最新的WB+,现正在进行全频带的扩展工作;G.729已发展到G.729.1,目前也在启动全频带的扩展工作;G.722.1也已发展到G.722.1 Annex E,已经完成了全频带的扩展工作。 除此之外,为适应在Internet上传送语音的需要,目前ITU-T SG 16组正在研究和制定可变速率的语音编码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论