音频编解码技术ppt课件

上传人：闯*** IP属地：广东上传时间：2020-04-23 格式：PPT 页数：52 大小：683.50KB 积分：0 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

音频编解码技术ppt课件.ppt 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

音频编解码技术邓凌03361 培训目标了解音频编解码的目的熟悉音频编解码的各种标准知道音频编解码的技术构成关注音频编解码技术的发展语音编解码概述 a 波形编码器 b 声码器 c 混合编码器语音编码器类型语音编解码概述 a 波形编码器不利用生成语音信号的任何知识来产生一种重构信号波形编码器会尽可能重构出包括背景噪音在内的模拟波形由于波形编码器作用于所有输入信号因此会产生高质量的样值特点是复杂度低在数据速率16kb s以上时质量很好例如 ITU TG 711规范 PCM 用的比特率为64kbps Timedomainapproach PCM pulsecodemodulation DPCM ADPCMFrequencydomainapproach SBC sub bandcoding ATC adaptivetransformcoding 语音编码器类型语音编解码概述 b 声码器声码器 vocoder 也称为音源编译码器它试图在话音波形信号中提取生成话音的参数通过这些参数和话音生成模型重构出语音线性预测编码 LPC 用来获取一时变数字滤波器的参数这个滤波器用来模拟说话人的声道输出声码器 vecoder 时变滤波器 time varyingfilter 命令基本激励它的音质很低增加数据率对提高音质基本无用广泛用于军事保密通讯语音编码器类型语音编解码概述试图填补波形编码和音源编码的间隔 waveformcoding不能解决低于16kb s下的音质问题 sourcecoding可压缩到2 4kb s或更低但音质不自然时域合成分析编码器 analysis by synthesis ABS 它和音源编码器的主要区别不使用2个状态有声无声的模型来寻找滤波器的输入激励信号而是要寻找这样一种激励信号使得这种信号产生的波形尽可能接近原始话音波形语音编码器类型 1 语音编解码概述 c 混合编码器目前常用的语音编码器是混合编码器它融合了波形编码器和声码器的长处它的另一特点是它工作在非常低的比特率 4 16kbps 混合编码器采用合成分析 AbS 技术 c 1 线性预测合成分析编码器前向自适应LPAS编码器 8kbpsG 729编码器和6 3kbps与5 3kbpsG 723 1编码器后向自适应LPAS编码 16kbpsG 728低时延码激励线性预测 c 2 参数语音编码器 2 4kbps混合激励线性预测编码语音编码器类型 2 语音编解码概述语音编码器的主要功能就是把用户语音的PCM 脉冲编码调制样值编码成少量的比特帧这种方法使得语音在链路产生误码网络抖动和突发传输时具有鲁棒性 Robustness 在接收端语音帧先被解码为PCM语音样值然后再转换成语音波形语音编解码目的语音编解码概述帧大小帧的大小表示语音流量的时间长度也称为帧时延帧是语音信号的分立部件且每帧是根据语音样点更新的本章所介绍的编解码器都是一次处理一帧每帧信息放在各语音分组中并传送给接收端处理时延它表示在编解码器中对一帧语音做编码算法处理时所需的时间它通常简单的计入帧时延处理时延也称为算法时延前视时延编码器为了对当前帧的编码提供帮助而检查下一帧的一定长度此长度就称为前视时延前视的想法是为了利用相邻语音帧之间的密切相关性帧长度这个值表示经编码处理后的字节数不包括帧头语音编码器评价语音编解码概述语音比特率当编解码器的输入是标准脉冲编码调制的语音码流比特率为64kbit s 时编解码器的输出速率 DSPMIPS 此值是指支持特定编码器的DSP处理器的最低速度 RAM需求它描述了支持特定的编码过程所需要RAM的大小编码器工作所需的时间是指编码器的缓存及处理时间称为单向系统时延其值帧大小处理时延前视时延显然解码时延也非常重要实际上解码时延大约是编码时延的一半语音编码器评价续音频编解码标准语音编解码标准其它音频编解码标准DTMFTransmittersandReceivers标准回声消除相关标准音频编解码标准语音编解码标准其它音频编解码标准DTMFTransmittersandReceivers标准回声消除相关标准音频编解码标准语音编解码标准 ITU TRecommendationG 711ITU TRecommendationG 723 1 AnnexAITU TRecommendationG 728 AnnexGITU TRecommendationG 729 AnnexAB 音频编解码标准语音编解码标准参数对照音频编解码标准音频编解码标准各参数对照 PCM PulseCodeModulation 模拟信号低通防失真滤波器波形编码器 PCM样本量化器采样均匀采样量化均匀量化非均匀量化大信号采用大间隔小信号小间隔音频编码技术 PCM在通信中主要用于时分多路复用和频分多路复用语音压缩 ADPCM 自适应差分脉码调制波形编码方案自适应自动压扩差分仅对样本之间的变化编码每个样本的速率与比特 32Kbps 8Kbpsx4bits sample24Kbps 8Kbpsx3bits sample16Kbps 8Kbpsx2bits sample CELP 码激励线性预估进入编码器的信号从8比特PCM转换成16比特线性PCM样本编码器使用电码本电码本用反馈信息对语音波形不断地分析学习和预估白噪声生成器激励编码器数字结果参数被传送到远端码器进行语音波形的合成和生成 CS ACELP 共轭结构代数码激励线性预估使用DSP80个16比特线性PCM数据样本帧 10M 进入10个8比特码字增加一个向前的5毫秒噪音降低和音调合成过滤增加到处理要求中8Kbps的数据速率 LD CELP 低延迟码激励线性预估与CSA CELP相似但LD CELP使用较小的电码本并以16Kbps操作使延迟减小到2 5毫秒无向前从8 kHz输入语音的每五个样本中产生10比特的码字四个10比特的码字被称为一个子帧它大约需要2 5毫秒进行编码两个子帧结合到一个5毫秒的码组中进行传输 DMandADM AdaptiveDeltaModulation SBC Sub BandCoding andSB ADPCMLPC LinearPredictiveCoding 音频编码技术其它语音编码类型音频编解码标准语音编解码标准其它音频编解码标准DTMFTransmittersandReceivers标准回声消除相关标准当前国际上主流的新一代视音频编解码软件技术标准是国际运动图像专家组于1999年公布的MPEG 4技术标准将逐渐取代现有的MPEG 1 VCD MPEG 2 DVD 标准 MPEG 4主要为了实现在有线移动网络上传输互动的视音频内容目前世界主要公司的编解码软件都支持MPEG 4标准虽然微软等几个公司在发展自己的技术和标准但都脱不开MPEG 4标准底层的基础专利技术 MPEG 4等编解码技术的革命极大地扩展了数字多媒体的应用市场音频编码技术音频编解码标准其它音频编解码标准 MPEG中音频编码标准 1 编码器的输入和解码器的输出与现存的PCM标准兼容ISO IEC11172 3 MPEG1音频的采样率为32kHz 44 1kHz和48kHz 根据应用需要可以使用不同层次的编码系统 Layer 包括将数字音频变成32个子带的基本映射将数据格式化成块的固定分段决定自适应位分配的心理声学模型利用块压扩和格式化的量化器理论上层编码解码的最少延时约为19ms Layer 提供了为分配缩放因子和抽样的附加编码使用了不同的帧格式这层理论上的最小编码解码延时约为35ms Layer 采用混合带通滤波器来提高频率分辨率它增加了差值量化非均匀自适应分段和量化值的熵编码这层理论上的最小编码解码延时为59ms 联合立体声编码作为一个附加特征能够加入到任何一层中音频编码技术音频编解码标准其它音频编解码标准杜比数字音频技术 1 AC 3编码和解码AC 3音频编码标准的起源是DOLBYAC 1 AC 1应用的编码技术是自适应增量调制 ADM 它把20kHz的宽带立体声音频信号编码成512kbps的数据流 AC 1曾在电视和调频广播上得到广泛应用 1990年DOLBY实验室推出了立体声编码标准AC 2 它采用类似MDCT的重叠窗口的快速傅立叶变换 FFT 编码技术其数据率在256kbps以下 AC 2被应用在PC声卡和综合业务数字网等方面 1992年DOLBY实验室在AC 2的基础上有开发了DOLBYAC 3的数字音频编码技术 AC 3提供了五个声道的从20Hz的全通带频响即正前方的左 L 中 C 和右 R 后边的两个独立的环绕声通道左后 LS 和右后 RS AC 3同时还提供了一个100Hz以下的超低音声道供用户选用以弥补低音之不足因为此声道仅为辅助而已故定为0 1声道所以AC 3被称为5 1声道 AC 3将这6个声道进行数字编码并将它们压缩成一个通道而它的比特率仅是320kbps 音频编码技术音频编解码标准其它音频编解码标准杜比数字音频技术 2 杜比E是一种专业音频编码技术用于辅助广播和其它一些两声道设备传输多声道的音频信息杜比E可以通过一对AES EBU或者一对数字VTR音轨给后期制作和发行提供多达8个声道的广播级质量的音频信息另外杜比E的优点还在于经过它编码的信息可以被编辑解码编码再解码经过多次编解码转换而没有可察觉的音质降低 MLPLossless是一个真正的无损编码系统 DVD Audio中采用的压缩技术可对PCM数据进行完美地复制不同于有损的感性编码的杜比数字技术 MLPLossless有效地将磁盘空间扩充了一倍而没有影响高解析度的PCM音质从而使DVD Audio光盘可以同时携带同一节目的立体声和多声道版本所有DVD Audio播放机必须具备MLPLossless解码功能音频编码技术音频编解码标准其它音频编解码标准杜比数字音频技术 3 高级音频编码 AAC 是一种高质量感性音频编码技术应用于广播和网络音乐下载 AAC的编码效率优于MP3 以更低的比特率提供更高质量的音频信号这项技术是由四个工业界的领导者 AT T 杜比实验室 FraunhoferIIS以及索尼公司共同开发将其标准化为一个ISO IEC的规范作为MP3的继任者 AAC现在已经获得了越来越多软硬件生产商的支持音频编码技术音频编解码标准其它音频编解码标准音频编解码技术回声抵消EC混音背景噪声抑制ANS静音压缩自动增益控制AGC唇音同步包丢失隐藏PLC 音频编解码技术混音混音就是把两个以上的声音文件形式或码流形式混合为一个目前混音主要有硬件合成和软件叠加这两种方法为了防止混音后的溢出问题一般采用的算法是累加取平均值这种方法会产生声强失真现象加权叠加的算法可以有效解决这个问题加权系数的优化成为这个算法的关键在多方会议时混音还有一个策略的问题音频编解码技术回声消除 AEC adaptiveechocanceller 是对扬声器信号与由它产生的多路径回声的相关性为基础建立远端信号的语音模型利用它对回声进行估计并不断地修改滤波器的系数使得估计值更加逼近真实的回声然后将回声估计值从话筒的输入信号中减去从而达到消除回声的目的 AEC还将话筒的输入与扬声器过去的值相比较从而消除延长延迟的多次反射的声学回声根椐存储器存放的过去的扬声器的输出值的多少 AEC可以消除各种延迟的回声音频编解码技术回声消除回声产生的因素1 混杂传输2 电话3 路由器4 服务质量QoS 音频编解码技术背景噪声抑制背景噪音抑制的英文缩写为ANS AutomaticNoiseSuppression ANS可探测出背景固定频率的杂音并消除背景噪音例如风扇空调声自动滤除呈现出与会者清晰的声音音频编解码技术静音压缩它利用了在总会话时间中静音时间占了大约50 这一事实其基本思路是在静音期间减少传送的比特数从而节省了所需传输的总比特数在电话网中多年来对模拟语音信号都是用时间分配语音插值 TASI Time AssignedSpeechInterpolation 方法进行处理这一技术也就是将其他语音信号或者数据信号放置在谈话的静音期间内从而为多信道链路提供附加容量现今 TASI已被运用于数字信号中并被赋予新名称其中的一个例子就是时分多址 TDMA TimeDivisionMultipleAccess 简要地讲 TDMA是将通常的信号划分成很小的数字化的片段 slots即时隙这些时隙和其他时隙一起在一个信道中进行时分复用音频编解码技术静音压缩技术的几个概念 VAD VoiceActivityDetectionSID SilenceInsertionDescriptorDTX DiscontinuousTransmissionCNG ComfortNoiseGenerator Voice Spurt Silence PinkNoise Time VoiceActivity PowerLevel SIDBuffer SID HangTimer NoVoiceTrafficSent B WSaved 54dbm 31dbm Voice Spurt 音频编解码技术静音压缩之语音活动识别音频编解码技术自动增益控制AGC AGC可以自动调麦克风的收音量使与会者收到一定的音量水平不会因发言者与麦克风的距离改变时声音有忽大忽小声的缺点 AGC可分为模拟AGC和数字AGC电路 AGC环路可以放在模拟与数字电路之间增益控制算法在数字部分来实现合适的增益设置反馈给模拟可变增益放大器 VGA AGC电路的实现有前馈反馈和混合环路等三种分别如图1 2 3所示音频编解码技术自动增益控制AGC 音频编解码技术唇音同步唇音同步是指语音和画面播放的时间差小于一定范围它实际上是一个牵涉多种技术的综合问题包括编解码时延网络QOS等等这里只针对关键的一个因素进行阐述 Internet是基于分组交换的传输技术因此会出现语音包不会等时到达目的地的现象表现在语音不连贯这就需要先对语音包进行排队经过动态调整后使语音稳定输出一般采用jitterbuffer等技术使语音流畅清晰音频编解码技术包丢失隐藏 PLC 包丢失隐藏 PLC 算法也被称为帧消除隐藏算法它隐藏了音频系统的传输包丢失现象很多基于CELP算法的语音编码器都把PLC算法写入它们的算法中 PLC的目标是产生一个合成的语音信号以替代在接收的码流中丢失消除的数据理想情况下合成的信号会有和丢失信号同样的音质和频谱特性并且不会产生不自然的伪音 PLC算法的依据由于语音信号通常是局部静止的所以可以利用以前的信号来产生对丢失语音段合理近似 PLC应用条件丢失的包不是很长丢失的包不发生在快速变化的区域内在满足PLC应用条件的前提下包丢失可以完全被隐藏音频编解码技术包丢失隐藏PLC 图音频编解码标准语音编解码标准其它音频编解码标准DTMFTransmittersandReceivers标准回声消除相关标准音频编解码标准 DTMF的检测和产生音频编解码标准DTMFTransmittersandReceivers标准 ITU TRecommendationQ 23 Q 24ETSIES201235 1 2 3 音频编解码标准语音编解码标准其它音频编解码标准DTMFTransmittersandReceivers标准回声抵消相关标准音频编解码标准回声消除相关标准 ITU TRecommendationG 167 适用于通信终端设备上的声学回声消除ITU TRecommendationG 165ITU TRecommendationG 168 DIGITALNETWORKECHOCANCELLERS 音频编解码技术的发展编解码器的发展趋势可分级的码率和编码质量编解码效率编解码复杂度音频编解码技术的发展 PCM编码方式所产生的数据量太大存储和传输都既不方便也不经济因此需要开发一种新的编码方式它应该使用较少的数据量而又不会导致音质的主观听感有明显的下降这种编码方式被称为感知型编码 PerceptualCoding 感知型编码技术以心理声学原理为基础只记录那些能被人的听觉所感知的声音信号从而达到减少数据量的同时不损害实际听感的目的它利用了这样一条心理声学原理较强的声音信号可以掩蔽临近频段中较弱的信号换言之如果在某一频段中出现了一个较强的信号那么该频段中所有低于某一门槛值的信号都将被强信号掩蔽掉成为人耳不可闻的信号滤除该弱信号将不会对音质产生不良影响而且能减少编码后的数据量所以可以把它们作为噪声信号来对待感知型编码 PerceptualCoding 音频编解码技术的发展 PCM编码方式所产生的数据量太大存储和传输都既不方便也不经济因此需要开发一种新的编码方式它应该使用较少的数据量而又不会导致音质的主观听感有明显的下降这种编码方式被称为感知型编码 PerceptualCoding 感知型编码技术以心理声学原理为基础只记录那些能被人的听觉所感知的声音信号从而达到减

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

音频编解码技术ppt课件

文档简介

温馨提示

最新文档

评论

音频编解码技术ppt课件

文档简介

温馨提示

最新文档

评论

相关文档