《信息论基础》实验指导书

上传人：t*** IP属地：河南上传时间：2020-04-03 格式：DOC 页数：14 大小：84KB 积分：15 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

0 目目录录实验一英文半字节压缩编码技术 1 实验二 Huffman 编码 5 实验三重复码编译码方法 11 1 实验一实验一英文半字节压缩编码技术英文半字节压缩编码技术一实验目的 1 理解信源编码的作用和目的掌握数据压缩的基本思想 2 掌握数据压缩中常用的比特流操作办法 3 掌握英文半字节压缩编码技术二实验内容通过 C 语言编程实现对一般英文文本文件的半字节压缩编码与译码程序并观察编码译码结果以及压缩效果三实验原理对于一个通信系统来说信息传输的有效性可靠性安全性和认证性是人们的主要目标其中信息传输的有效性指的是尽可能的使用较短的时间和较少的设备等资源来传送尽可能多的信息而这一目的主要是通过信源编码这个环节来实现的虽然有许许多多不同的信源编码方法但总的说来信源编码主要是通过减少或消除信源的剩余度来提高传输效率的而且有时人们为了追求更高的传输效率在满足实际需求的情况下还允许在编译码过程中存在一定程度的失真这就是所谓的有损压缩当然针对不同的应用要求可以选择不同的压缩编码办法为了方便理解和实现针对一般的英文文本可以设计一种半字节压缩编码方法来实现数据的压缩一有损处理在一般英文文本中除了大小写英文字母外还有多种不同的标点符号为了达到在不影响文章大意的前提下尽可能的减少需编码的符号数以提高信息传输效率的目的可采取这样的处理方法 1 所有的英文字母不区分大小写如将所有的大写英文字母变成小写字母 2 保留标点符号和 2 3 将和变为其他符号全部变成这样原来的英文文本就变成了一个新的文本该文本全部由 26 个英文字母和以及这 31 种符号组成而且文章的大意并没有发生大的变化可以认为这种失真是在允许的失真范围之内的当然为了简化操作上面的第一步也可省略虽然这样会使输出文件中既有大写字符又有小写字符但只需在后面的编码操作时将大小写等同处理则同样达到了不区分大小写的目的二数据压缩在计算机中文本文件中的每个符号都是由 8 位的 ASCII 码所构成共有 256 种取值的可能既然经过上述有损处理后文件中只存在 31 种不同的符号所以在压缩编码过程中只需对 31 种符号进行编码就可以大大压缩文本文件的数据量考虑到各字母以及符号出现的概率并考虑码字的可分离性可以采取以下的编码方法来进行数据的压缩 1 对于概率最大的 15 个符号分别编以 0000 1110 的码字符号码字符号码字符号码字符号码字空格0000e0100l1000s1100 a0001f0101n1001t1101 c0010h0110o1010u1110 d0011i0111r1011 2 对于其余的 16 个符号分别编以 1111 0000 1111 1111 的码字符号码字符号码字符号码字符号码字 1111 0000b1111 0100m1111 1000w1111 1100 1111 0001g1111 0101p1111 1001x1111 1101 1111 0010j1111 0110q1111 1010y1111 1110 1111 0011k1111 0111v1111 1011z1111 1111 这样一些最经常出现的符号从原来的 8bit 变为 4bit 达到了数据压缩的目的 3 从表中可以看出后 16 个符号的码字中前 4 比特均为 1111 因此可先向编码文件输出前 4 比特然后再输出后 4 比特这样的好处是不论是前 15 种符号还是后 16 种符号都可执行同一种输出操作输出 4 比特只是对于后 16 种符号是连续执行两次而已三译码译码过程是编码的逆过程解码后得到由这 31 种符号所组成的文本文件由于后 16 个符号的码字中前 4 比特均为 1111 因此可设计译码过程为每次读取 4bit 若不为 1111 则根据此次读取的 4bit 译为相应的前 15 个符号之一若为 1111 则再次读取 4bit 并根据后 4bit 译为相应的后 16 个符号之一这样不论是前 15 种符号还是后 16 种符号的译码都可执行同一种读取操作读取 4 比特只是对于后 16 种符号是连续执行两次而已四半字节操作在计算机中所有对数据的操作不论是数据的存储还是对文件的读写都是以字节 8bit 为基本单位的而我们的编码与解码都是以半个字节 4bti 为单位的因此需要运用位操作来进行数据的控制 1 编码过程中执行的操作是每次输出 4 比特由于每次向输出文件的写入是以字节 8bit 为单位的因此可定义一个缓存变量来存储每次输出的 4 比特数据只有当缓存中的有效数据凑足 8bit 1 字节时才执行一次向输出文件的写入操作这里需要注意的是如果待编码文件中所有符号的码长之和不是 8 的整数倍时就会出现缓存中剩余 4 比特有效数据不能输出因为不能凑够满字节的情况这时可以在后面补 4 比特 0000 即为空格使其能够输出到输出文件中 2 译码过程中执行的操作是每次读取 4bit 由于每次向输入文件的读取是以字节 8bit 为单位的故需将每次读取的 8bit 1 字节存入缓存然后使用位操作依次读取其前后各 4 比特四实验步骤 1 编写有损处理程序在不影响文章大意的基础上对英文文本文件进行 4 有损处理减少需编码的符号数产生待编码文件 2 编写半字节编码程序对待编码文件进行半字节压缩编码并计算压缩比观察压缩效果 3 编写半字节解码程序对压缩后的文件进行解码并与压缩前的文件进行比较五实验环境 1 计算机 2 Visual C 编程环境六实验报告要求 1 格式与内容应符合实验报告标准 2 对程序设计的思路以及具体设计步骤应详细说明并附上相应的程序流程图 3 对程序设计中发生的问题以及解决的办法要加以叙述与总结 4 附上所设计的程序清单并对关键部分进行说明 5 实验二实验二 Huffman 编码编码一实验目的 1 熟练掌握 Huffman 编码过程 2 掌握 C 语言递归程序的设计和调试技术 3 掌握 C 语言中的动态分配内存技术二试验内容根据输入的信源符号数及相应的概率分布使用 C 语言编写 Huffman 编码程序从而输出每个信源符号所对应的码字三实验原理在众多的无失真信道编码技术中 Huffman 编码是一种有效的获得最佳码的编码技术它能够充分利用短码大幅度降低码字的平均码长从而获得较高的编码效率在保证码字的可分离性的同时有效的提高了通信系统的有效性也正是由于 Huffman 编码技术的优越性目前在有关信源编码的许多领域中 Huffman 编码作为一项基本技术得到了极为广泛的应用一 Huffman 编码方法由于目前数字通信中一般都使用二进制符号因此二进制的 Huffman 编码技术最为普遍其编码步骤如下 1 将信源符号按概率从大到小进行排列 2 给两个概率最小的信源符号各分配一个码元 0 和 1 然后将这两个信源符号合并成一个新符号并用这两个最小的概率之和作为新符号的概率结果得到一个只有 n 1 个信源符号的新信源假设原来所需编码的符号数为 n 称为信源的第一次缩减信源 S1 3 将缩减信源 S1的符号仍按概率从大到小的顺序进行排列重复步骤 2 得到只含 n 2 个符号的缩减信源 S2 4 重复上述步骤直至缩减信源只剩两个符号为止此时所剩两个符号的概率之和必为 1 将这两个符号各分配一个码元 0 和 1 后从最后 6 一级缩减信源开始依编码路径向前返回就得到各信源符号所对应的 Huffman 码字二方差最小的 Huffman 码字缩减信源时若合并后的新符号概率与其他符号的概率相等从编码方法上来讲这几个符号的次序可任意排列编出的码字都是正确的但不同的编法得到的码字不同码字长度也不尽相同从而码长的方差也会不同若码长的方差较小则意味着码长变化较小各个码长都比较接近于平均码长这样对于信息传输的实现特别是对传输有实时性要求的时候会带来很大的便利因此也就更好一些为了得到方差最小的 Huffman 码字在对缩减信源按概率从大到小重新排列时应使合并后的新符号尽可能地排在靠前的位置这样可使合并后的新符号重复编码次数减少使短码得到充分利用降低码长的方差三递归算法实现 Huffman 编码由于在 Huffman 编码过程中每次都是对减少一个符号数的缩减信源进行同样的操作排序与合并且最终的码字是按照编码路径逆序返回而得到因此可利用递归的思想实现 Huffman 的编码程序假设对 n 个符号概率为 pi的信源进行 Huffman 编码则递归实现算法的主要思想可简单描述为 procedure Huffman n pi if n 2 then 对两个符号各分配一个码元 0 和 1 else 降序排序合并符号并得到新的概率分布 pi Huffman n 1 pi 对被合并的两个符号各分配一个码元 0 和 1 end procedure 四动态分配内存由于本程序设计要求根据所输入的信源符号数与概率分布进行 Huffman 编码在输入之前并不确定所要编码的信源符号数而且编得的码字长度也 7 不能确定因此对各符号以及相应码字的存储使用固定长度的数组显然不太合适而在 C 语言中使用动态分配内存技术则可以根据需要灵活分配存储空间从而有效的解决这个问题 C 语言中常用的动态内存管理函数有以下四个 1 函数 malloc 这是给指针动态分配内存的通用函数它的原型是 void malloc size t nbytes 其中 nbytes 是我们想要给指针分配的内存字节数这个函数返回一个 void 类型的指针因此我们需要用类型转换 type cast 来把它转换成目标指针所需要的数据类型例如 char ronny ronny char malloc 10 这个例子将一个指向 10 个字节可用空间的指针赋给 ronny 当我们想给一组除 char 以外的类型不是 1 字节长度的的数值分配内存的时候我们需要用元素数乘以每个元素的长度来确定所需内存的大小 int bobby bobby int malloc 5 sizeof int 这一小段代码将一个指向可存储 5 个 int 型整数的内存块的指针赋给 bobby 它的实际长度可能是 2 4 或更多字节数取决于程序是在什么操作系统下被编译的 2 函数 calloc calloc 与 malloc 在操作上非常相似他们主要的区别是在原型上 void calloc size t nelements size t size 可见它接收 2 个参数而不是 1 个这两个参数相乘被用来计算所需内存块的总长度通常第一个参数 nelements 是元素的个数第二个参数 size 被用来表示每个元素的长度例如我们可以像下面这样用 calloc 定义 bobby int bobby bobby int calloc 5 sizeof int malloc 和 calloc 的另一点不同在于 calloc 会将所有的元素初始化为 0 8 而 malloc 只管分配内存并不能对所得的内存进行初始化所以得到的一片新内存中其值将是随机的 3 函数 realloc 它被用来改变已经被分配给一个指针的内存的长度其原型为 void realloc void pointer size t size 参数 pointer 用来传递一个已经被分配内存的指针或一个空指针而参数 size 用来指明新的内存长度这个函数给指针分配 size 字节的内存这个函数可能需要改变内存块的地址以便能够分配足够的内存来满足新的长度要求在这种情况下指针当前所指的内存中的数据内容将会被拷贝到新的地址中以保证现存数据不会丢失然后返回新的指针地址如果新的内存尺寸不能够被满足函数将会返回一个空指针但原来参数中的指针 pointer 及其内容保持不变 4 函数 free 这个函数用来释放被前面 malloc calloc 或 realloc 所分配的内存块 void free void pointer 注意注意如果忘记释放动态分配地内存程序就会在结束时出现内存泄漏的问题五程序设计问题 1 数据存储根据实验要求我们要根据输入的信源符号数及相应的概率分布输出每个信源符号所对应的码字因此需要定义一个记录信源符号序号的数组一个记录相应符号概率的数组一个记录各符号码字的二维数组且各数组的长度应根据输入的信源符号数决定 2 排序从 Huffman 算法流程来看第一次排序和对缩减信源的排序略有不同对缩减信源的排序是在基本有序的情况下进行排序的也就是说除了合并符号以外其他的符号已经是降序排列的因此只需将合并的符号插入到相应的位置即可而且为了得到方差最小的 Huffman 码字应使合并后的新符号尽可能地排在靠前的位置对于第一次排序则没有这样的条件与要求也正是为此我们可以在上述的递归算法中将这两种排序分开 9 主程序第一次排序 procedure Huffman n pi if n 2 then 对两个符号各分配一个码元 0 和 1 else 合并符号并得到新的概率分布 pi 缩减信源的排序 Huffman n 1 pi 对被合并的两个符号各分配一个码元 0 和 1 end procedure 由于对信源符号的描述有三个数组序号概率以及码字因此排序中的每次改变都需对这三个数组同时进行相应的变动 3 递归编码在递归算法中每次递归都需要对参与合并的两个符号分配码元由于对信源符号的描述由数组完成因此在逐级返回时只是返回指向数组的指针而其中元素的值不能返回为了在每次返回上一级递归时找到这两个符号则需要在每次递归时记录下这两个符号的序号以便返回时能正确的对这两个符号分配码元四实验步骤 1 使用 C 语言编写 Huffman 编码程序 2 输入几种信源的符号数及其概率将程序输出的码字与手动计算的码字进行比较验证程序的正确性五实验环境 1 计算机 2 Visual C 编程环境六实验报告要求 10 1 格式与内容应符合实验报告标准 2 对程序设计的思路以及具体设计步骤应详细说明并附上相应的程序流程图 3 对程序设计中发生的问题以及解决的办法要加以叙述与总结 4 附上所设计的程序清单并对关键部分进行说明 11 实验三实验三重复码编译码方法重复码编译码方法一实验目的 1 理解信道编码的作用和目的 2 巩固实验一中的比特流操作办法 3 掌握重复码的编解码技术二实验内容通过 C 语言编程实现对数据文件的 3 1 二元重复码编码与译码程序并对编码译码结果进行观察与比较三实验原理一般的通信信道中总是不可避免的存在噪声或者干扰因此在信息传输的过程中也就必然会造成信息的损失或者说信源符号在有噪信道中的传输过程中会产生失真为了降低这种信息损失就需要我们在信源符号输入到信道之前对其进行有效的信道编码信道编码是通信系统中的一个重要环节目的就是为了降低传输过程中错误发生的概率从而提高通信系统的可靠性信道编码的基本思想是附加冗余信息增加信源的剩余度这样在接收端就可以利用相关性进行检错或者纠错根据有噪信道编码定理附加冗余位可以降低信息传输率使错误概率减小当信息传输率小于信道容量时理论上就可以使译码错误概率任意小从而几乎无失真的进行信息传送当然同样是增加信源剩余度不同的编码方法其检纠错能力也不同目前人们对信道编码的研究有很多大概可分为线性分组码循环码卷积码等等一重复码重复编码是一种简单的信道编码方法其实质就是将每个要发送的符号重复发送或者说是将原来的每一个信源符号编成多个相同的码元符号其值与原来的符号取值相同比如 3 1 二元重复码其编码方法就是将原来二进制序列中的每一个 0 编成 000 将每一个 1 编成 111 因此 12 我们可以设计以下简单的编码流程 1 读取待编码文件的一个比特 2 重复 3 次向输出文件中写入一个相同的比特 3 重复执行上面两步直到待编码文件的所有数据全部编码完毕所谓的译码规则就是指接收符号与发送符号之间的映射关系不同的译码规则会造成不同的平均错误概率所以人们一般都根据最小错误概率准则来确定译码规则对于二元对称信道来说一般总认为出错概率是小于等于 0 5 的所以对于二元重复码最小错误概率准则与择多译码规则是一致的也就是说译码时根据码字中 0 1 的数目选择数目多的进行译码比如 3 1 二元重复码的译码可以将接收到的 000 001 010 和 100 译为 0 将接收到的 011 101 110 和 111 译为 1 这样每个码字对于传输

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《信息论基础》实验指导书

文档简介

温馨提示

最新文档

评论

《信息论基础》实验指导书

文档简介

温馨提示

最新文档

评论

相关文档