



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京邮电大学信息与通信工程学院数据结构实验报告1 实验要求利用二叉树结构实现哈夫曼编/解码器。基本要求:1、 初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树2、 建立编码表(CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。3、 编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。4、 译码(Decoding):利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。 5、 打印(Print):以直观的方式打印哈夫曼树(选作)计算输入的字符串编码前和编码后的长度,并进行分析,讨论哈夫曼编码的压缩效果。并用I love data Structure, I love Computer。I will try my best to study data Structure.进行测试。2. 程序分析哈夫曼树结点的存储结构包括双亲域parent,左子树lchild,右子树rchild,还有字符word,权重weight,编码code对用户输入的信息进行统计,将每个字符作为哈夫曼树的叶子结点。统计每个字符出现的次数作为叶子的权重,统计次数可以根据每个字符不同的ASCII码,根据叶子结点的权重建立一个哈夫曼树。 建立每个叶子的编码从根结点开始,规定通往左子树路径记为0,通往右子树路径记为1。由于编码要求从根结点开始,所以需要前序遍历哈夫曼树,故编码过程是以前序遍历二叉树为基础的。同时注意递归函数中能否直接对结点的编码域进行操作。编码信息只要遍历字符串中每个字符,从哈夫曼树中找到相应的叶子结点,取得相应的编码。最后再将所有找到的编码连接起来即可。译码则是将编码串从左到右逐位判别,直到确定一个字符。这就是哈夫曼树的逆过程。遍历编码串,从哈夫曼树中找到相应的叶子结点,取得相应的字符再将找到的字符连接起来即可。2.1 存储结构 哈夫曼树结点存储结构parent lchild rchild word weight code2.2 关键算法分析1.统计字符频度自然语言描述:(1) 取出字符串中的一个字符(2) 遍历所有初始化的哈夫曼树结点(3) 如果结点中有记录代表的字符且字符等于取出的字符,说明该字符的叶子存在,则将该结点的权值加1(4) 如果所有结点记录的字符均没有与取出的字符一致,说明该字符的叶子不存在,则将结点的字符记为取出字符,并将权重设为1(5) 重复以上步骤,直至字符串中所有字符全部遍历伪代码描述:1. for(int i=0;ilength;i+)1.1 for (int j=0;jlength;j+) 1.1.1if (WordStri=HuffTreej.word)/若字符已被统计,则增加权值即可 1.1.1.1 权重+; 1.1.1.2 break;1.1.2 else if(!HuffTreej.word)/否则需要一个新结点储存这个字符 1.1.2.1 HuffTreej.word=WordStri; 1.1.2.2 HuffTreej.weight=1;1.1.2.3 叶子结点个数+;1.1.2.4 break;时间复杂度O(n2),空间复杂度S(0)2. 构造哈夫曼树自然语言描述:(1) 选出权值最小的两个结点,其权值和作为其根结点的权值,最小的结点作为左子树,次小的作为右子树,不断将两棵子树合并为一棵树。(2) 重复上述过程,直至所有结点全被遍历完伪代码描述:1. int leaves=n;2.for (int j=n;j2*n-1;j+)2.1 int j1=0;int j2=0;2.2 Select(HuffTree,leaves,j,j1,j2);/选出两个权值最小结点2.3 HuffTreej1.parent=j;HuffTreej2.parent=j;2.4 HuffTreej.weight=HuffTreej1.weight+HuffTreej2.weight;/根结点权值等于两个结点权值和2.5 HuffTreej.lchild=j1;HuffTreej.rchild=j2;/左子树为权值最小,右子树权值次小2.6 叶子数-;时间复杂度O(n),空间复杂度S(2)3. 为每个叶子结点编码自然语言描述:(1) 初始化一个字符数组Code暂存每个叶子结点的编码。(2) 前序遍历哈夫曼树(3) 若结点左右子树都为-1,则将code复制到编码的code串,准备返回上一层,编码相应少一位,code长度减1,返回(4) 否则按照从左到右的顺序前序遍历根结点的所有子树(5) 若访问左子树,则进入下一层,编码相应多一位,code长度加1并将最后一位赋0;访问右子树,进入下一层,code长度加1并将最后一位赋为0伪代码描述:1.if 结点左右孩子均为-11.1.将Code复制到huffTree的code1.2.return;1.3.否则 1.3.1.if结点左子树存在1.3.1.1.Code长度增一1.3.1.2.Code最后一位赋0; 1.3.1.3.访问左子树; 1.3.1.4.层数减一;1.3.2.If结点右子树存在1.3.2.1.Code长度增一1.3.2.2.Code最后一位赋1; 1.3.2.3.访问右子树; 1.3.2.4.层数减一;算法时间复杂度O(n2),空间复杂度S(60)4. 编码自然语言描述:(1) 定义字符串CodeStr储存编码(2) 遍历输入字符串的每一个字符(3) 对每一个字符,将其与HuffTree前n个叶子结点的word逐个比较,相同则将该结点的编码串code连接到CodeStr的末尾(4) 遍历结束后,输出CodeStr伪代码描述:1. while(字符串字符不为0)1.1 while(叶子结点word不为空)1.1.1 if(字符等于word中的字符)1.1.1.1 strcat(CodeStr,code);1.1.1.2.break; 2. coutCodeStrendl;算法时间复杂度O(n2) ,空间复杂度S(2)5. 译码自然语言描述:(1) 从编码串CodeStr的第一个字符开始与HuffTree第一个结点的编码域第一个字符比较(2) 相等则继续比较后面的字符(3) 否则,从CodeStr第一个字符与HuffTree第二个结点的编码比较(4) 重复上述过程,将CodeStr中的所有字符比较完毕伪代码描述:1.在CodeStr和huffTree.code中设比较的起始下标i和j2.遍历数组huffTree2.1.循环至CodeStr或huffTree.code全部的字符均比较完2.1.1.如果CodeStri=huffTreek.code,继续比较下一个字符,否则2.1.2.将i和j回溯,跳出该层循环2.2如果huffTreek.code全比较完,输出huffTreek.word。否则取huffTree下一个结点继续循环 本趟匹配开始位置 i 主串CodeStr 回溯。 huffTreek+1 huffTreek j 回溯时间复杂度O(n2),空间复杂度S(3)3. 程序运行结果开始菜单界面,选择 1 2 3 4 5 6退出程序关于程序重新编码解码器编码表编码器输出编码输出程序信息输入要编码的信息输出要编码的信息输入要编码的信息任意键操作输出翻译出的信息输出编码的结果输出编码表输出编码的结果任意键操作任意键操作任意键操作任意键操作结束测试条件:问题规模n的数量级为1。测试内容:I love data Structure, I love Computer. I will try my best to study data Structure.测试结论:测试的功能有:建立哈夫曼树、对每个字符进行编码、对信息字符串进行编码、对编码串进行译码,重新进行编码。各项功能均能正常运行。界面的跳转也能实现。编码前信息总长度为664bits,编码后的长度为339bits。由于哈夫曼编码采用不等长编码,有效缩短了编码长度,节省了空间。4. 总结调试时出现的问题及解决的方法递归函数中的参数传递在给每个字符编码时,由于编码是从根结点开始,所以选用与前序遍历相似
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年国家工作人员学法用法试题库及参考答案
- 2025年安全工程师《道路运输安全》真题及答案解析
- 2025年新课标新疆考试试题及答案
- 郸城中考模拟试题及答案
- 2025年海洋科技新篇章:海水提硼吸附材料技术创新报告
- 幼儿园食品添加剂使用协议书5篇
- 2025年临床用血考试试题及答案
- 护理职业模拟试题及答案
- 2025年中山事业考试试题及答案
- 2025年儿科常见疾病护理策略考察答案及解析
- Ice-O-Matic CIM登峰系列制冰机培训手册
- 《穴位埋线疗法》课件
- 【大型集装箱船舶港口断缆事故预防应急处理及案例探析7500字(论文)】
- 发展汉语-初级读写-第一课-你好
- 律师事务所人事管理制度
- 高中英语完形填空高频词汇300个
- 2023-2025年世纪公园综合养护项目招标文件
- 脑梗塞并出血护理查房
- 男朋友男德守则100条
- 医院感染科室院感管理委员会会议记录
- 鲁班锁制作技术
评论
0/150
提交评论