信息论基础第七周.ppt

上传人：c*** IP属地：河南上传时间：2020-02-08 格式：PPT 页数：48 大小：1.28MB 积分：20 举报 版权申诉

已阅读5页，还剩43页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

信息论基础杜春娟ducj QQ 22282998Tel 31889581 第三章数据压缩和信源编码编码的定义定长编码定理变长编码定理香农码费诺码哈夫曼码问题的提出 1 为什么要进行信源编码 2 信源编码的概念 3 一些码的定义 4 信源编码的方法人们都希望无失真传送首先要对信源无差错编码数字技术应用越来越多模拟信源通过数字化变成数字信号传送信源编码的概念信源编码定义指定能够满足信道特性适合于信道传输的符号序列码序列来代表信源输出的消息完成编码功能的器件称为编码器离散信源输出的码序列离散信源输出的消息是由一个个离散符号组成的随机序列X X1X2 Xl XL Xl x1 x2 xi xn 信源编码就是把信源输出的随机符号序列变成码序列Y Y1Y2 Yk YK Yk y1 y2 yj ym 码符号码元编码器的输入是信源符号 x1 x2 xi xn 同时存在另一符号 y1 y2 yj ym 一般元素yj是适合信道传输的称为码符号码元编码器功能将信源符号集中的符号或者长为L的信源符号序列变换成由yj j 1 2 m 组成的长度为ki的序列码字码符号序列Y Y1Y2 Yk Yki 称为码字码长码字长度 ki称为码字长度或简称码长编码就是从信源符号到码符号的一种映射若要实现无失真编码这种映射必须是一一对应的可逆的编码的定义分类每个符号序列xi按照固定的码表映射成一个码子yi 这样的码称为分组码非分组码没有码表编码的定义二元码码符号集为X 0 1 所得码字都是一些二元序列定长码等长码和可变长度码固定长度的码码中所有码字的长度都相同是定长码即ki K i 1 2 n 变长码为一组码字中所有码字的码长各不相同即任意码字由不同长度的码符号序列组成奇异码和非奇异码若信源符号和码字是一一对应的则该码为非奇异码即一组码字中所有码字都不相同即所有信源符号映射到不同的码符号序列反之为奇异码即一组码中有相同的码字唯一可译码任意有限长的码元序列只能被唯一地分割成一个个的码字便称为唯一可译码或者说码的任意一串有限长的码符号序列只能被惟一地译成所对应的信源符号非即时码和即时码如果接收端收到一个完整的码字后不能立即译码还需等下一个码开始接收后才能判断是否可以译码这样的码叫做非即时码举例奇异码惟一可译码非即时码是即时码非奇异码非惟一可译码例码1 显然不是惟一可译码 x2和x4对应于同一码字 11 码1本身是一个奇异码码2 是非奇异码不是惟一可译码当收到一串码符号 01000 时可将它译成 x4x3x1 也可译为 x4x1x3 x1x2x3 或 x1x2x1x1 等这种码从单个码字来看虽然不是奇异的单从有限长的码序列来看它仍然是一个奇异码码3 虽然是惟一可译码但它要等到下一个 1 收到后才能确定码字的结束译码有延时码4 既是惟一可译码又没有译码延时码字中的符号 1 起了逗点的作用故称为逗点码前缀条件码异前置码异字头码逗点码即时码非延长码如果一个码的任何一个码字都不是其它码字的前缀码4是即时码信源编码的方法信源编码有定长和变长两种方法定长编码码字长度K是固定的相应的编码定理称为定长信源编码定理是寻求最小K值的编码方法变长编码 K是变值相应的编码定理称为变长编码定理这里的K值最小意味着数学期望最小定长编码定理定长编码定理一个熵为H X 的离散无记忆信源X1X2 Xl XL 若对信源长为L的符号序列进行定长编码设码字是从m个字母的码符号集中选取K个码元组成Y1Y2 Yk YK 对于任意 0 0只要满足 K L log2m H X 则当L足够大时必可使译码差错小于即译码错误概率能为任意小反之若 K L log2m H X 2 则不可能实现无失真编码而当L足够大时译码错误概率近似等于1 定理中的公式改写成Klog2m LH X 不等式左边表示长为K的码符号序列能载荷的最大信息量右边代表长为L的信源序列平均携带的信息量所以定长编码定理告诉我们只要码字传输的信息量大于信源携带的信息量总可实现几乎无失真编码定理的一般性证明是通过计算信源符号自信息的均值与方差把信源消息分成两个互补集合一个有编码一个无编码再利用契比雪夫不等式求出有编码集合中码字个数的上下限分别用上限证明正定理部分用下限证明逆定理部分能达到差错率要求可以证明源序列长度L需满足信源熵就H X 是一个界限临界值当编码器输出的信息率超过这个临界值时就能无失真译码否则就不行信源编码定理从理论上说明了编码效率接近于1 即的理想编码器的存在性代价是在实际编码时取无限长的信源符号 L 进行统一编码给定和用上式规定的L计算所有可能信源消息的概率按由小到大的次序排列选用概率较大的消息进行编码有编码的消息构成一个集合A 直到该集合的概率p A 1 意味着译码差错概率必小于即完成了编码过程只要足够小就可实现几乎无失真译码若足够小编码效率就接近于1 说明定长编码定理是在平稳无记忆离散信源的条件下论证的但它同样适用于平稳有记忆信源只是要求有记忆信源的极限熵和极限方差存在即可对于平稳有记忆信源定理中的熵应改为极限熵编码效率定义最佳编码效率举例例设单符号信源模型为其信息熵为H X 2 55 比特符号 2 x 1 323若要求编码效率为90 即译码差错率为 10 6 则由此可见在差错率和效率要求都不苛刻的情况下就必须有1600多万个信源符号一起编码技术实现非常困难变长编码定理 1 基本概念 2 码树图 3 克拉夫特不等式 4 变长编码定理 1 基本概念变长编码不等长编码允许把等长的消息变换成不等长的码序列通常把经常出现的消息编成短码不常出现的消息编成长码这样可使平均码长最短从而提高通信效率代价是增加了编译码设备的复杂度例如在不等长码字组成的序列中要正确识别每个长度不同的码字的起点就比等长码复杂得多译码延时译码同步接收到一个不等长码序列后有时不能马上断定码字是否真正结束因而不能立即译出该码要等到后面的符号收到后才能正确译出 2 码树图 m元 m进制树图树根最顶部画一个起始点树枝从根部引出m条线段每条线段都称为树枝一级节点自根部起通过一条树枝到达的节点一级节点最多有m个 n级节点通过n条树枝达到的节点最多有mn 终节点终端节点下面不再有树枝的节点中间节点除了树根和终节点以外的节点联枝串联的树枝满树在码数图中当每一个码字的串联枝数都相同时就是定长码此时的码树称为满树例如码长为N的满树的终节点个数为mN 即可表示mN个码字非满树有些树枝未用时的码树非满树构造的就是变长码如果每一个码字都被安排在终节点上这种码就是异前置码三元码树图树图的特征与编码的对应关系树根码字的起点树枝数码的进制数节点码字或码字的一部分终节点终端节点码字节数码长满树等长码非满树变长码 3 克拉夫特不等式克拉夫特不等式 m元长度为ki i 1 2 n的异前置码存在的充要条件是证明必要条件设异前置码第i个码字的长度为ki i 1 2 n 构造一个码树图若某个长度为ki的树枝被选用作码字则该枝自第ki个节点以后的树枝不能再被选用作码字这样自ki以后有个码枝不能被选用而某个ki 是从中任选的一个那么就整个码树而言总共不用的枝数为它一定小于码树的总树枝数 N级满树第N级上的总枝数已知为mN 所以必有两边除以mN 就得充分条件如果式成立总可以把第N级上的树枝分成n组各组中从第N级开始删除 i 1 2 n 个枝相对于N级满树等于删除了所有可能的ki级节点的在该组中以第ki级节点作为终节点就构造好了第i个码字对所有码字如法炮制则总共删除了所有mN个节点中的由于于是构造了一个异前置码充分性设码字长度满足Kraft不定式不失一般性假设取k1级节点中任何一个作为终节点以C1表示代表消息a1的码字由于删去了从C1发出的通向更高层节点的任何分枝从而相对于N层满树来说删除了所有可能的N层节点的类似地可以指定一个ki级节点作为ai的码字将删去满树N层节点的由于所以这种方式可以一直进行下去直到选出kn级节点作为的an码字从而构成了一个异前置码充分性如果式成立相当于成立则总可以把第N级上的树枝分成n组各组中有个枝各组分别以第ki节点为终止节点这样就组成了n个长度分别为ki的码字由于这n个码字自ki节点后不再被采用显然它构成了一个异前置码上面证明了异前置码存在的充分必要条件实际上这个充要条件可以进一步推广到比异前置码更大的集合唯一克译码集合这里就不再深入讨论例3 1 1设二进制码树中X x1 x2 x3 x4 K1 1 K2 2 K3 2 K4 3 应用上述判断定理可得因此不存在满足这种Ki的唯一可译码用树码进行检查如图树码所谓信息率最小就是找到一种编码方式使最小 4 变长编码定理变长编码定理举例变长编码定理平均码长变长编码定理若一离散无记忆信源的平均符号熵为H X 对信源符号进行m元变长编码一定存在一种无失真编码方法其码字平均长度满足下列不等式其平均信息率满足不等式H X R H X 式中为任意正数证明设信源符号X x1 x2 xi xn 概率p xi i 1 2 n 对xi用一个长度为ki的码字使只要规定为正整数时上式取等号非整数时 ki取比它大一些的最接近的整数则满足上式的整数必存在将上式分别乘以p xi 再对i求和得对ki取数学期望就是平均值故由上面式子可得kilog2m log2p xi 或对两边求和得码字长度满足克拉夫特不等式因而是异前置码多符号情况对于平稳无记忆信源来说当信源输出的是长度为L的消息序列时容易证明定理中式子可改进为这时的代表平均码序列长度已知编码后平均每个信源符号能载荷的最大信息量为不等长信源编码信源平均输出信息率证毕对信源进行变长编码一般所要求的信源符号长度L比定长编码小的多码的剩余度编码效率的下界举例例设单符号信源模型为其信息熵为H X 2 55 比特符号这里m 2 log2m 1要求 90 则与定长编码相比对同一信源要求编码效率都达到90 时变长编码只需L 4进行编码而等长码则要求L大于1 6875 107 用变长编码时 L不需要很大就可以达到相当高的编码效率而且可实现无失真编码变长编码定理例1设离散无记忆信源的概率空间为其信源熵为若用二元定长编码 0 1 来构造一个即时码 x1 0 x2 1 这时平均码长编码效率为输出的信息率为R 0 811比特二元码符号唯一可译码的判断法首先观察是否是非奇异码若是奇异码肯定不是唯一可译码其次计算是否满足Kraft不等式若不满足一定不是唯一可译码然后将码画成一棵树图观察是否满足异前置码的树图的构造若满足则是唯一可译码或用Sardinas和Patterson设计的判断法计算分组码中所有可能的尾随后缀集合F 观察F中有没有包含任一码字若无则为唯一可译码若有则一定不是唯一可译码集合F的构造首先观察码C中最短的码字是否是其它码字的前缀若是将其所有可能的尾随后缀排列出而这些尾随后缀又可能是某些码字的前缀再将由这些尾随后缀产生的新的尾随后缀列出然后再观察这些新的尾随后缀是否是某些码字的前缀再将产生的尾随后缀列出这样首先获得由最短的码字能引起的所有尾随后缀接着按照上述将次短的码字等等所有码字可能产生的尾随后缀全部列出由此得到码C的所有可能的尾随后缀组成的集合F 练习有一信源它有六个可能的输出其概率分布如下表所示表中给出了对应的码A B C D E和F 求这些码中哪些是唯一可译码求哪些码是即时码对所有唯一可译码求出其平均码长几种编码方法 1 香农编码2 费诺编码3 哈夫曼编码 1 最佳编码最佳码定义能载荷一定的信息量且码字的平均长度最短可分离的变长码的码字集合 1 香农编码方法香农第一定理指出选择每个码字的长度 K i 满足下式I xi Ki I xi 1 就可以得到这种码这种编码方法称为香农编码编码方法如下 1 将信源消息符号按其出现的概率大小依次排列 p x1 p x2 p xn 2 确定满足下列不等式的整数码长Ki 3 为了编成唯一可译码计算第 i 个消息的累加概率 4 将累加概率 Pi 变换成二进制数 5 取 Pi 二进数的小数点后 Ki 位即为该消息符号的二进制码字 2 费诺编码方法编码过程如下 1 将信源消息符号按其出现的概率大小依次排列 p x 1 p x 2 p x n 2 将依次排列的信源符号按概率值分为两大组使两个组的概率之和近于相同并对各组赋予一个二进制码元 0 和 1 3 将每一大组的信源符号进一步再分成两组使划分后的两个组的概率之和近于相同并又赋予两个组一个二进制符号 0 和 1 4 如此重复直至每个组只剩下一个信源符号为止 5 信源符号所对应的码字即为费诺码 3 哈夫曼编码方法编码过程如下 1 将 n 个信源消息符号按其出现的概率大小依次排列 p x1 p x2 p xn JZ 2 取两个概率最小的字母分别配以0和1两码元并将这两个概率相加作为一个新字母的概率

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

信息论基础第七周.ppt

文档简介

温馨提示

最新文档

评论

信息论基础第七周.ppt

文档简介

温馨提示

最新文档

评论

相关文档