




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
amr音频编码器概述及文件格式分析 全称adaptive multi-rate,自适应多速率编码,主要用于移动设备的音频,压缩比比较大,但相对其他的压缩格式质量比较差,由于多用于人声,通话,效果还是很不错的。一、分类1. amr: 又称为amr-nb,相对于下面的wb而言,语音带宽范围:3003400hz, 8khz抽样2. amr-wb:amr wideband, 语音带宽范围:507000hz, 16khz抽样“amr-wb”全称为“adaptive multi-rate - wideband”,即“自适应多速率宽带编码”,采样频率为16khz,是一种同时被国际标准化组织itu-t和3gpp采用的宽带语音编码标准,也称为g722.2标准。amr-wb提供语音带宽范围达到507000hz,用户可主观感受到话音比以前更加自然、舒适和易于分辨。与之作比较,现在gsm用的efr(enhenced full rate,增强型全速率编码)采样频率为8khz,语音带宽为2003400hz。amr-wb应用于窄带gsm(全速信道16k,gmsk)的优势在于其可采用从6.6kb/s, 8.85kb/s和12.65kb/s三种编码,当网络繁忙时c/i恶化,编码器可以自动调整编码模式,从而增强qos。在这种应用中,amr-wb抗扰 度优于amr-nb。amr-wb应用于edge、3g可充分体现其优势。足够的传输带宽保证amr-wb可采用从6.6kb/s到23.85kb/s共九种编码,语音质量超越pstn固定电话。二、编码方式1. amr-nb:amr 一共有16种编码方式, 0-7对应8种不同的编码方式, 8-15 用于噪音或者保留用。frame typemode indicationmode requestframe content (amr mode, comfort noise, or other)000amr 4,75 kbit/s 111amr 5,15 kbit/s 222amr 5,90 kbit/s 333amr 6,70 kbit/s (pdc-efr)444amr 7,40 kbit/s (tdma-efr)555amr 7,95 kbit/s 666amr 10,2 kbit/s 777amr 12,2 kbit/s (gsm-efr)8-amr sid9-gsm-efr sid10-tdma-efr sid 11-pdc-efr sid12-14-for future use15-no data (no transmission/no reception) 2. amr-wb:frame type indexmode indicationmode requestframe content (amr-wb mode, comfort noise, or other)000amr-wb 6.60 kbit/s 111amr-wb 8.85 kbit/s 222amr-wb 12.65 kbit/s 333amr-wb 14.25 kbit/s 444amr-wb 15.85 kbit/s 555amr-wb 18.25 kbit/s 666amr-wb 19.85 kbit/s 777amr-wb 23.05 kbit/s 888amr-wb 23.85 kbit/s9-amr-wb sid (comfort noise frame)10-13-for future use14-speech lost15-no data (no transmission/no reception)-二、amr 帧格式:amr 有两种类型的帧格式:amr if1 和 amr if21. amr if1: if1 的帧格式如下图所示:frametype, mode indication, mode request 对应上面两个表格里的数。从上面的表格里我们可以看出,这三个域的值是相同的。所以在if2中省略了mode indication, mode request 两个域。frame quality indicator: 0表示bad frame 或者corrupted frame; 1表示 good frame每一帧的数据有分为三个部分:class a/b/cclass a:一帧中最敏感、最重要的数据。一旦这一部份数据有损坏,整个帧就无法解码,就损坏了。所以,一般在无线传输的时候要使用各种冗余的方式对这部分数据加以保护。class b:相对于class a不那么重要的数据。class c:比class b还不重要的数据。2. amr if2: if2的帧格式如下图所示:相对于if1, if2 省去了frame quality indicator, mode indication, mode request 和crc 校验。但是增加了bit 填充。因为amr帧中数据的长度并不是字节(8bit)的整数倍,所以在有些帧的末尾需要增加bit填充,以使整个帧的长度达到字节的整数倍。有关if2帧中各个域的信息请参考下面的帧大小节的表格。三、帧大小1. amr-nbframe type indexframe content number of bits in frame typenumber of bits in amr core framenumber of bits in bit stuffingnumber of octets (n)0amr 4,75 495513 1amr 5,154103514 2amr 5,90 4118616 3amr 6,704134618 4amr 7,404148019 (20)5amr 7,954159521 6amr 10,24204026 (27)7amr 12,24244031 (32)8amr sid43956 9gsm-efr sid44316 10tdma-efr sid 43866 11pdc-efr sid43776 12-14for future use-15no data4041number of bits in classesa, b, and c for each amr codec modeframe typeamrcodec modetotal number of bitsclass aclass bclass c04,75954253015,151034954025,901185563036,701345876047,401486187057,9515975840610,2204659940712,224481103602. amr-wb:composition of amr-wb if2 frames for all frame typesframe type indexframe content number of bits in frame typenumber of bits in frame quality indicatornumber of bits in amr-wb core framenumber of bits in bit stuffingnumber of octets (n)0amr-wb 6.60 kbit/s 41132718 1amr-wb 8.85 kbit/s 411772232amr-wb 12.65 kbit/s 41253633 3amr-wb 14.25 kbit/s 41285637 4amr-wb 15.85 kbit/s 413176415amr-wb 18.25 kbit/s 41365647 6amr-wb 19.85 kbit/s 41397651 7amr-wb 23.05 kbit/s 41461659 8amr-wb 23.85 kbit/s41477661 9amr-wb sid (comfort noise frame)41403610-13for future use-14speech lost4103115no data (no transmission/no reception)41031frame typeamr-wbcodec modetotal number of bitsclass aclass bclass c06.601325478018.85177641130212.65253721810314.25285722130415.85317722450518.25365722930619.85397723250723.05461723890823.85477724050四、pcm16和amr之间的转换amr 一帧为20毫秒以amr 4.75kbits/s为例:每秒产生的声音位数 = 4750bits/s每帧占用的位数 = 4750bits/50frames (bits)= 95bits每帧占用的字节数 = 95bits / 8bits (buytes)= 11.875bytes - 圆整到12字节,不足的补0加上一个字节的帧头,所以,20ms一帧的amr: 12-bytes + 1-byte = 13-bytes相反,转换回来就成了13-bytes * 50frames/s * 8bits/byte = 5200bits/s注意,这里两个数值并不对应,是由于圆整的原因五、 amr 文件的存储格式(rfc 3267):amr if1, if2定义了 amr的帧格式, 用于无线传输用。 rfc 3267定义了把amr数据存成文件的文件格式。amr的文件格式如下图1所示:它包含一个文件头,然后就是一帧一帧的amr数据了。文件头格式:amr 文件支持单声道和多声道。单声道和多声道的文件头是不同的。单声道:amr-nb文件头: #!amrn (or 0x2321414d520a in hexadecimal)(引号内的部分)amr-wb 文件头:#!amr-wbn (or 0x2321414d522d57420a in hexadecimal).(引号内) 9字节多声道:多声道的文件头包含一个magic number和32bit channle description域。amr-nb 的magic number:#!amr_mc1.0n (or 0x2321414d525f4d43312e300a in hexadecimal).amr-wb的magic number:#!amr-wb_mc1.0n (or 0x2321414d522d57425f4d43312e300a in hexadecimal).32bit的channel description域的定义如下:其中 reserved bits必须为0, chan:表示当前文件中含有几个声道。帧头的格式:帧头的格式如图2 所示, 它占
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 质量管理与生产计划的关联
- 法学概论考试的重要性分析与试题及答案
- 数据库管理系统试题及答案
- 科学备考方案设计2025年计算机二级VB考试试题及答案
- 人事部如何开展企业社会责任计划
- 2024年白银市景泰县中医医院招聘工作人员真题
- 2024年北京明天幼稚集团招聘笔试真题
- 促进跨文化沟通的工作方案计划
- 2025届江苏省南京市鼓楼实验中学七下数学期末监测模拟试题含解析
- 材料力学性能测试应变影响重点基础知识点
- “双减”作业设计:小学道德与法治作业设计案例
- DB11T 353-2021 城市道路清扫保洁质量与作业要求
- 2024年涤纶FDY油剂项目可行性研究报告
- 《形形色色的人》习作教学课件
- 2024-2030年中国军工信息化行业市场发展现状及发展趋势与投资战略研究报告
- 《复发性流产诊治专家共识2022》解读
- 初中生财商素质教育教学设计
- 泵站运行管理手册
- SH∕T 3097-2017 石油化工静电接地设计规范
- HJ1188-2021核医学辐射防护与安全要求
- 四川省绵阳市2023-2024学年高一下学期期末英语试题(解析版)
评论
0/150
提交评论