




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、算术编码算术编码 Arithmetic Coding主要内容 图像压缩编码简介 Huffman编码 算术编码简介 算术编码原理 算术编码的发展及应用一 图像压缩编码简介 霍夫曼编码 霍夫曼编码(Huffman coding) 根据给定数据集中霍夫曼(D.A. Huffman)在1952年提出和描述的“从下到上从下到上”的熵编码方法 各元素所出现的频率来压缩数据的一种统计压缩编码方法。这些元素(如字母)出现的次次数越多数越多,其编码的位数就越少位数就越少 广泛用在JPEG, MPEG, H.26X等各种信息编码标准中 熵(entropy) 按照香农(Shannon)的理论,在有限的互斥和联合穷举
2、事件的集合中,熵为事件的信息量的平均值,也称事件的平均信息事件的平均信息量量(mean information content) (依概率平均依概率平均) 用数学表示为熵是数据压缩的极限霍夫曼编码(1) 计算该字符串的霍夫曼码步骤:按照符号出现概率大小的顺序对符号进行排序排序步骤:把概率最小概率最小的两个符号组成两个符号组成一个节点P1步骤:重复重复步骤,得到节点P2,P3,P4, PN,形成一棵树,其中的PN称为根节点步骤:从根节点PN开始到每个符号的树叶,从上到下 标上0(上枝)和1(下枝),至于哪个为1哪个为0则 无关紧要,但通常把概率大的标成1,概率小的 标成0.(标记标记)步骤:从根
3、节点PN开始顺着树枝到每个叶子分别写出 每个符号的代码.(反向编码反向编码)霍夫曼编码 霍夫曼编码举例1 现有一个由5个不同符号组成的30个符号的字符串:BABACACADADABBCBABEBEDDABEEEBB 计算(1) 该字符串的霍夫曼码(2) 该字符串的熵(3) 该字符串的平均码长(4) 编码前后的压缩比霍夫曼编码符号出现的次数 log2(1/pi)分配的代码 需要的位数B101.585?A81.907?C33.322?D42.907?E52.585?合计30符号出现的概率符号出现的概率霍夫曼编码符号B (10)A (8)E (5)D (4)C (3)P1 (7)P2 (12)P3
4、(18)P4 (30)01101010代码代码B(11)A(10)E(00)D(011)C(010)霍夫曼编码符号出现的次数log2(1/pi)分配的代码需要的位数B101.5851120A81.9071016C33.3220109D42.90701112E52.5850010合计306730个字符组成的字符串需要个字符组成的字符串需要67位位5个符号的代码霍夫曼编码 (2) 计算该字符串的熵计算该字符串的熵 其中, 是事件 的集合, 并满足1 ,nXxx1( )1niip x(1,2, )ix in211()( ) ( )( )log( )nniiiiiiH Xp x I xp xp x H
5、(S) =(8/30)log2(30/8) + (10/30)log2(30/10) + (3/30)log2(30/3) + (4/30)log2(30/4) + (5/30)log2(30/5) = ( 44.313624.5592)/ 9.0308 2.1874 (Sh) 理论上可获得的压缩比为:理论上可获得的压缩比为: 3:2.1874=1.37霍夫曼编码(3) 计算该字符串的平均码长 平均码长: (28210333425)/30 2.233 位/符号 压缩比压缩比: 90/67=1.34:11( )Niiill p l 平均码长:平均码长:67/30=2.233位位(4) 计算编码前
6、后的压缩比计算编码前后的压缩比n编码前:5个符号需3位,30个字符,需要90位n编码后:共67位算术编码简介算术编码(Arithmetic Coding ):和霍夫曼编码不同,算术编码跳出。分组编码的范畴, 从全序列出发, 采用递推形式的连续编码不是将单个信源符号映射成一个码字, 而是将整个输入符号序列映射为实数轴上0,1)区间内的一个小区间, 其长度等于该序列的概率, 再在该小区间选择一个代表性的二进制小数, 作为实际的编码输出。算术编码 算术编码(arithmetic coding) 给已知统计信息的符号分配代码的数据无损数据无损压缩技术 基本思想是用0和1之间的一个数值范围数值范围表示输
7、入流中的一个字符(串),字符(串),而不是给输入流中的每个字符分别指定一个码字 实质上是为整个输入字符流分配一个“码字”,因此它的编码效率可接近于熵接近于熵 算术编码算术编码(1)(1)基本思想:基于递归概率区间划分的二进制编码具体过程:基本思想:基于递归概率区间划分的二进制编码具体过程: 把信源符号序列把信源符号序列Xi|i=1,2,Xi|i=1,2,n,n发生的概率用实数区间发生的概率用实数区间 00,11上的间隔(上的间隔(XiXi的取值范围)来表示的取值范围)来表示 按符号概率大小来分配符号间隔,按符号概率大小来分配符号间隔, 使使00,11随迭代计算次数的增加而逐次变窄;随迭代计算次
8、数的增加而逐次变窄;所求最后范围便是替代所求最后范围便是替代XiXi符号串编码的取值范围符号串编码的取值范围 应用实例:待编码符号串为应用实例:待编码符号串为X X1 1,X,X2 2,X,X3 3,X,X4 4,X,X5 5 算术编码处理过程的编码区间分配可用图解法表示:算术编码处理过程的编码区间分配可用图解法表示: 以少代多思想:用最终求得的编码表示范围子区间的以少代多思想:用最终求得的编码表示范围子区间的 任何值(如:任何值(如:0.106030.10603),来替代被编码符号串),来替代被编码符号串X X1 1X X2 2X X3 3X X4 4X X5 5无论是否是二元信源,也不论数
9、据的概率分布如何,算术编码可以二进制小数表示,其平均码长可以接近无损压缩的熵极限。因此:算术编码的发展历史:1960年,P. Elias首先提出把这种依附Shannon编码概念推广到对符号序列直接编码上,推出了所谓的算术编码(Arithmetic Coding);1948年, Shannon提出将信源依其概率降序排序, 用符号序列累积概率的二进制表示对信源的编码; 1976年, R. Pasco和J.Rissanen 分别用定长的寄存器实现了有限精度的算术编码; 1979年, Rissanen 和G.G. Langdon将算术编码系统化,并于1981年将AC推广应用到二值图像编码上,大大提高了
10、起压缩效率;1987年, Witten等人发表了一个实用的算术编码程序(CACM87,后用于H.263); 同期IBM公司发表了著名的Q-编码器 (后用于JPEG和JPIG); 设一个信源,它有两个符号a和b,出现的概率分别是p和1p,设有一个基准区域0,1,对它进行划分,以便与信源输出序列相对应。abp1aabap1p+p(1-p)bbabaabap2bbab图A 符号序列与区域划分示意算术编码的基本原理ab0.81aaba0.810.96bbabaaba0.64bbabaaabab0.810.960.64bbaaba0.5120.7680.9920.928bbbbaaabbaab例设一个信
11、源,它有两个符号a和b,出现的概率分别是0.8和0.2,有3个符号输出时,符号序列与区域划分的对应关系。图B 3符号输出时的 符号序列与区域划分示意字符串 aabaa对应的区域为0.512,0.59392)该区域的二进制表示0.1000001,0.1001100 )二进制数0.1001输出编码 1001因此对于这个信源:H(X)=0.7219Huffman编码:算术编码:%19.72%24.90平均码长 R=0.8平均码长 R=1相比Huffman编码,算术编码的编码效率有明显提高。对于长序列,理论上算术编码可以达到信源的熵。RH /编码效率算术编码过程:依据字符的发生概率对码区间的分割过程(
12、即子区间宽度与正编码字符发生概率相乘的过程)。算术解码过程:只需知道最终编码区间中的某一个值就可以解码。算术编码每次递推都要做乘法,而且必须在一个信源符号的处理周期内完成,有时难以实时,为此采用了查表等许多近似计算来代替乘法。小结:固定编码模式概率统计与区间分配直接影响编码效率。自适应模式各符号的概率初始值都相同,但依据实际出现的符号而相应地改变。两种编码模式:算术编码的发展及应用 jpeg、mpeg-1和mpeg-2等国际标准采用的图像压缩编码方案都是传统的“DCT+运动补偿+算术编码”模式 JPEG2000、MQ算术编码器 嵌入位平面图像编码器EZW、SPIHT和SPECK中也采用这种通用算法编码器 算术码评述 能够自适应地估计条件概率, 从信源的统计特性 出发, 建立数据的概率模型。它不必预先定义信 源的概率模型, 尤其适用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 屏蔽网线施工方案
- 2024初级社会工作者职业资格笔试知识点合辑
- 自然护岸施工方案
- 孩子探视权协议书范本3篇
- 交通事故全权代为鉴定委托书3篇
- 工作外出免责协议书3篇
- 前台个人工作总结范文
- 初二学生个人计划总结(30篇)
- 天燃气合作经营协议3篇
- 学会道歉夫妻吵架保证书3篇
- 流动式起重机(固定)定期检验-自检记录
- 耳鼻咽喉科-咽肿瘤
- 宿舍楼设计开题报告
- 邻苯二甲酸二辛酯MSDS
- 电梯日常检查记录
- 教育的起源和古代东方文明古国的教育
- 有机化学6章对映异构-课件
- 抗菌药物使用强度(DDD)解析与控制
- T∕CACM 1064-2018 针刀医学临床 通用要求
- 招聘求职简历制作表格模板可编辑下载 精品简历模板 标准表格单页02
- 凑十法加法竖式运算(可打印)
评论
0/150
提交评论