哈夫曼编码课程设计报告_第1页
哈夫曼编码课程设计报告_第2页
哈夫曼编码课程设计报告_第3页
哈夫曼编码课程设计报告_第4页
哈夫曼编码课程设计报告_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据结构课程设计报告课 题:专业班级:学 号:姓 名:指导教师:1 课程设计的目的和意义在当今信息爆炸时代, 如何采用有效的数据压缩技术来节省数据文件的存储 空间和计算机网络的传送时间已越来越引起人们的重视。 哈夫曼编码正是一种应 用广泛且非常有效的数据压缩技术。哈夫曼编码的应用很广泛, 利用哈夫曼树求得的用于通信的二进制编码称为 哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定: 指向 左子树的分支表示 “0”码,指向右子树的分支表示 “1”码,取每条路径上的 “0” 或“1”的序列作为和各个对应的字符的编码,这就是哈夫曼编码。通常我们把数据压缩的过程称为编码, 解压缩的过程

2、称为解码。 电报通信是 传递文字的二进制码形式的字符串。 但在信息传递时, 总希望总长度尽可能最短, 即采用最短码。2需求分析课 题:哈夫曼编码译码器系统问题描述: 打开一篇英文文章,统计该文章中每个字符出现的次数, 然后以它们 作为权值,对每一个字符进行编码, 编码完成后再对其编码进行译码。问题补充: 1. 从硬盘的一个文件里读出一段英语文章;2. 统计这篇文章中的每个字符出现的次数;3. 以字符出现字数作为权值,构建哈夫曼树4. 对每个字符进行编码并将所编码写入文件然后对所编码进行破 译。具体介绍:在本课题中,我们在硬盘 D盘中预先建立一个file.txt文档,在里面 编辑一篇文章(大写)

3、。然后运行程序,调用fileopen()函数读出该文章, 显示在界面;再调用tongji()函数对该文章的字符种类进行统计,并 对每个字符的出现次数进行统计, 并且在界面上显示; 然后以每个字 符出现次数作为权值,调用Create_huffma nTree(函数构建哈夫曼树。然后调用Huffman_bianma()函数对哈夫曼树进行编码,调用coding()函数将编码写入文件。测试数据:例如从文本中读到文章为: IAMASTUDENT 。则效果如下:读出文本为: IAMASTUDENT字符 A 次数:2字符 D 次数:1字符E次数:1字符 I 次数:1字符 M 次数:1字符 N 次数:1字符

4、S 次数:1字符 T 次数:2字符 U 次数:1输出编码: 000 101 001 101 011 110 100 1110 1111 010 110Press any key to continue3 系统(项目)设计(1) 设计思路及方案 本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。 假设每 种字符在电文中出现的次数为 W,编码长度为Li,电文中有n种字符,则电文 编码总长度为(W1*L1)+(W2*L2)+(Wi*Li)。若将此对应到二叉树上, Wi为叶 结点,Li为根结点到叶结点的路径长度。那么,(W1*L1)+(W2*L2)+(Wi*Li) 恰好为二叉树上带权路径长度

5、。因此,设计电文总长最短的二进制前缀编码, 就是以 n 种字符出现的频率作 权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。该系统将实现以下几大功能: 从硬盘读取字符串,建立哈夫曼树,输出哈夫 曼树的存储结构的初态和终态, 输出各种字符出现的次数以及哈夫曼编码的译码 等。(2) 模块的设计及介绍1 从硬盘读取字符串 fileopen( 参数)实现命令; 打印输出;2 建立 HuffmanTree 通过三个函数来实现: void select_min( 参数)初始化;for接受命令;处理命令;说明:在 ht1k 中选择 parent 为 0 且权值最小的两个根结点的算法int tongji( 参

6、数 )初始化;for接受命令;处理命令;说明:统计字符串中各种字母的个数以及字符的种类void Create_huffmanTree() 初始化;for接受命令;处理命令;输出字符统计情况;说明:构造哈夫曼树3 哈夫曼编码void Huffman_bianma( 参数 ) 定义变量;处理命令;说明:哈夫曼编码(3) 主要模块程序流程图下面介绍三个主要的程序模块流程图: 主函数流程图:图3.1流程图注释:然后统计接着在哈夫该图比较简单,主要是调用各个函数模块, 首先代开已经存在的文件,总的字符数以及出现的各个字符和频率。然后才开始建立哈夫曼树, 曼树的基础上对其进行编码。最后输出结束。 构造哈夫

7、曼树:图3.2流程图注释:该图是表示构造哈夫曼树的过程。首先输入num个叶结点的权值,当i=num是循 环结束。然后进行哈夫曼树的构建,当i= 2*num-1是循环结束。最后输出所得到 的字符统计情况。 哈夫曼编码:图3.3流程图解释:该流程图表四哈夫曼编码情况。首先初始化,Cd-start=O,start=num。然后进行编码,当 cd-start=Tp.lchild= =c 时,cd-start=O ;当 cd-start=Tp.left ! = =c 时,cd-start=1。这个编码循环一直到i=num时结束。4 系统实现各模块关键代码及算法的解释: 主调函数代码解释:这是 main

8、函数里的各个函数调用情况。fileopen(string); / 从硬盘中读取文件 num=tongji(string,cishu,str); / 统计字符种类及各类字符出现 的频率Create_huffmanTree(HT,HC,cishu,str);/ 建立哈夫曼树Huffman_bianma(HT,HC); / 生成哈夫曼编码 建立 HuffmanTree代码解释:该函数为在 ht1k 中选择 parent 为 0且权值最小的两个根结点的算法,其序号为si和s2。void select_min(HuffmanTree T,int k,int &x1,int &x2)int i,j;int

9、 min1=1000;for(i=1;i=k;i+)if(Ti.weightmin1 &Ti.parent=0)j=i; min1=Ti.weight; x1=j;min1=1000;for (i=1;i=k;i+)if(Ti.weightmin1 & Ti.parent=0 & i!=x1) j=i;min1=Ti.weight; x2=j;当字符统计每种代码解释: 下面函数用来统计字符串中各种字母的个数以及字符的种类。 在 A 和 Z 之间时即被计数,并用 strj 保存字母到数组中,用 cntj 字符个数。 j 返回总共读取的字符数目。int tongji(char *s,int cis

10、hu,char str)int i,j,k;char *p;int t27;for(i=1;i=A&*p=Z)k=*p-64;tk+;for(i=1,j=0;i=26;+i)if(ti!=0 )j+;strj=i+64;cishuj=ti;return j;代码解释:下面函数用来构造哈夫曼树HT。首先初始化哈夫曼树,然后输入前面统计的各结点的权值,用 for 循环来构造哈夫曼树。void Create_huffmanTree(HuffmanTree ht,HuffmanCode hc,int cishu,char str)/生成哈夫曼树 HTint i,s1,s2;for(i=0;i2*num

11、-1;i+)hti.left=0;hti.right=0;hti.parent=0;hti.weight=0;for(i=1;i=num;i+)/输入num个叶结点的权值hti.weight=cishui;for(i=num+1;i=2*num-1;i+) / 选择 parent 为 0且权值最小的两个根结点, 其序号为 s1 和 s2,i 为双亲select_min(ht,i-1,s1,s2);hts1.parent=i;hts2.parent=i;hti.left=s1; hti.right=s2;hti.weight=hts1.weight+hts2.weight;for(i=0;i=n

12、um;i+)hci.ch=stri;/字符的种类i=1;while(i=num)printf(字符 c次数:8dn,hci.ch,cishui+);根据哈夫曼 生成 Huffman 编码并写入文件 代码解释:根据哈夫曼树 T 求哈夫曼编码 H。void Huffman_bianma(HuffmanTree T,HuffmanCode H) /树 T 求哈夫曼编码 Hint child,parent,i;/child和 parent 分别指示t 中孩子和双亲char coden;/存放编码int start;/指示码在 code 中的起始位置codenum=0;/最后一位(第num个)放上串结束

13、for(i=1;i0) /直至 tchild 是树根为止/若 tchild 是 tparent 的左孩子 ,则生成 0; 否则生成 1if(Tparent.left=child)code-start=0;elsecode-start=1; child=parent;strcpy(Hi.co,&codestart); Hi.len=num-start; 代码解释: 对 str 所代表的字符串进行编码并写入文件。 将翻译的二进制码写入文本文件。void coding(HuffmanCode hc ,char *str) / 对 str 所代表的字符串进行编码 并写入文件int i,j;FILE *

14、fp;fp=fopen(codefile.txt,w);while(*str)for(i=1;i=num;i+)if(hci. ch=*str)for(j=0;j=hci.len;j+) fputc(hci.coj,fp);break;str+;fclose(fp);5系统调试本次测试是在我的电脑的 D盘中建立一个名为file.txt的文本文档,其中有 大写字母IAMASTUDENT,期望程序能将其读出至界面并实现其他相关的功能。运行程序后,我们可以见到一下的运行界面。从硬盘中读出已有的文本文件输出所读字符的种类和每种字符的个数选择 开始2 费出各字符统计个数 乳编码4.输岀骗码退岀数数数数数

15、数数数数 rt- FA F rv r* r*ft D E I MNSTUWSSSSF输出编码编码为:300 101请选择0 12 3 4 50B15Tfl扁31始出码也岀nitBia tie小结通过一周的课程设计使我对哈夫曼树以及哈夫曼编码有了更深的认识和理 解,也使我更加明白哈夫曼编码译码在信息技术中的重要性和地位。首先我谈谈我在设计期间我遇到的难点。 开始的时候,代码中有许多的错误, 特别是有一个“无法找到文件” 的错误让我束手无策, 最后还是屏蔽了定义的四 个头文件然后慢慢地改正错误才让我又看到了希望。然后在实现文章的读入时, 由于对文件不是太熟悉,只好翻开C语言书本仿照其模式编写,但后

16、来进入了死 循环,最后的解决方式是把 main函数里的一个dowhile循环去掉。许多的错误让我明白了一个道理 - 细心是非常重要的。同时,对于编程者 而言,思路清晰是相当重要的。 在适当的时候和同学一起交流探讨是一个十分好 的学习机会。这次课程设计不但让我学得了一些编程知识, 还学会了系统的做一份课程设 计报告,学会了如何截图, 学会了如何更好的画流程图, 明白了做事情只有认真, 才能真正做得更好!通过这次课程设计, 我看清楚了自己的编程功底和动手能力还很不足, 这主 要是平时实践太少的缘故。 我想,在未来的暑假中, 我会努力尝试编写一些程序。在这个程序中, 还有许多地方值得完善。 比如,读

17、出文本只能是大写的文档, 空格和小写不能识别。由于时间问题, 暂时不能实现了, 我想在暑假里好好研究 这个问题。未完成:哈夫曼译码17附录 源程序#include #include #include #include /类型相关变量的定义#define n 100#define m 2*n-1 typedef struct/存放编码char ch; char co9; int len;CodeNode;typedef CodeNode HuffmanCoden+1;int weight;int left,right,parent;typedefstruct HTNode;typedef HTN

18、ode HuffmanTreem+1;int num;void select_min(HuffmanTree T,int k,int &x1,int &x2)/ 选择权值最小的两个根结点 ,其序号为 x1 和 x2 int i,j;int min1=1000;for(i=1;i=k;i+)/找最小值if(Ti.weightmin1 &Ti.parent=0)j=i;min1=Ti.weight; x1=j;min1=1000;for (i=1;i=k;i+) / 找次小值if(Ti.weightmin1 & Ti.parent=0 &i!=x1)j=i;min1=Ti.weight; x2=j

19、;int tongji(char *s,int cishu,char str) / 统计字符串中各种字母的个数以及字符的种类 int i,j,k; char *p;int t27; for(i=1;i=A&*p=Z) k=*p-64; tk+; for(i=1,j=0;i=26;+i) if(ti!=0 ) j+; strj=i+64; 到数组中cishuj=ti; 权值 return j;种数/统计各种字符/送对应的字母/ 存入对应字母的/j 是输入字母void Create_huffmanTree(HuffmanTree ht,HuffmanCode hc,int cishu,char s

20、tr) / 生成哈夫曼树 HTint i,s1,s2;for(i=0;i2*num-1;i+) hti.left=0; hti.right=0; hti.parent=0; hti.weight=0;for(i=1;i=num;i+)/输入 num 个叶结点的权值号为si和s2,i为双亲hti.weight=cishui; for(i=num+1;i=2*num-1;i+) / 选择 parent 为 0 且权值最小的两个根结点,其序select_min(ht,i-1,s1,s2); hts1.parent=i;hts2.parent=i; hti.left=s1; hti.right=s2;

21、 hti.weight=hts1.weight+hts2.weight; for(i=0;i=num;i+)hci.ch=stri;/字符的种类i=1;while(i=num)/根据哈夫曼树 T 求哈夫曼编码 Hprintf( 字 符 %c 次 数 :%8dn,hci.ch,cishui+);void Huffman_bianma(HuffmanTree T,HuffmanCode H)分别指示 t 中孩子和双亲始位置个)放上串结束符int child,parent,i;/child 和 parentchar coden; / 存放编码int start;/指示码在 code 中的起coden

22、um=0;/ 最后一位(第 numfor(i=1;i0) / 直至 tchild 是树/若 tchild 是 tparent根为止的左孩子 ,则生成 0;否则生成 1if(Tparent.left=child)code-start=0; elsecode-start=1; child=parent;strcpy(Hi.co,&codestart);Hi.len=num-start;void coding(HuffmanCode hc ,char *str) / 对 str 所代表的字符串进行编码 并写入文件 int i,j;FILE *fp; fp=fopen(codefile.txt,w); while(*str) for(i=1;i=num;i+) if(hci. ch=*str) for(j=0;j=hci.len;j+) fputc(hci.coj,fp);break;str+;fclose(fp);void output()/输出编码FILE *fp;char ch;if(fp=fopen(codefile.txt,r+)=NULL) printf(errorn); exit(0);printf( 编码为 :n); ch=fgetc(fp);while(!feof(fp)putchar(ch);ch=fge

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论