版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据结构课程设计:电文编码译码(哈夫曼编码)福建农林大学计算机与信息学院数据结构课程设计设计:哈夫曼编译码器姓名:韦邦权专业:2013级计算机科学与技术学号:13224624班级:13052316完成日期:2哈夫曼编译码器一、需求分析在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树—即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。哈夫曼编码使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈夫曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。二、设计要求3对输入的一串电文字符实现哈夫曼编码, 再对哈夫曼编码生成的代码串进行译码,输出电文字符串。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串。但在信息传递时,总希望总长度能尽可能短, 即采用最短码。假设每种字符在电文中出现的次数为 Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为∑WiLi。若将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。那么,∑WiLi恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。设计实现的功能:(1)哈夫曼树的建立;哈夫曼编码的生成;(3)编码文件的译码。三、概要设计哈夫曼编译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进行译码。在数据通信中,经常需要将传送的文字转换成由二进制字符 0、组成的二进制串,称之为编码。构造一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,则从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。最简单的二进制编码方式是等长编码。若采用不等长编码,让出现频率高的字符具有较短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。哈夫曼树课用于构造使电文的4编码总长最短的编码方案。设计包含的几个方面:①哈夫曼树的建立赫夫曼树的建立由赫夫曼算法的定义可知,初始森林中共有 n棵只含有根结点的二叉树。算法的第二步是:将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树;每合并一次,森林中就减少一棵树,产生一个新结点。显然要进行 n-1次合并,所以共产生n-1个新结点,它们都是具有两个孩子的分支结点。由此可知,最终求得的哈夫曼树中一共有2n-1个结点,其中n个结点是初始森林的n个孤立结点。并且哈夫曼树中没有度数为 1的分支结点。我们可以利用一个大小为 2n--1的一维数组来存储赫夫曼树中的结点。定义的结构体类型如下:typedefstruct{chardata; //结点字符intweight; //权值intparent; //双亲结点intlchild; //左孩子结点intrchild; //右孩子结点}HTNode;②哈夫曼编码要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求5和实际需要定义的类型如下:typedetstruct{charcd[N];// 存放编码的数组intstart; //从start开始读cd中的哈夫曼编码}Hcode;// 编码结构体类型③代码文件的译码译码的基本思想是:读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。四、详细设计①字符统计intjsq(char*s,intcnt[],charstr[]){char*p;inti,j,k;for(i=1;i<=256;i++)cnt[i]=0;for(p=s;*p!='\0';p++){k=*p;cnt[k]++;}6j=0;for(i=1,j=0;i<=256;i++)if(cnt[i]!=0){j++;}returnj;}②哈夫曼树的算法voidCreateHT(HTNode ht[],int n,charstr[],intcn[]) //创建哈夫曼树函数{for(intinput=1;input<=256;input++){str[input]=input;}intl=0;for(intoutput=1;output<=256;output++){if(cn[output]!=0){ht[l].data=str[output];//按字母顺序将出现的字母依次存入数组 ht[]ht[l].weight=cn[output];7l++;}}inti,k,lnode,rnode;intmin1,min2;for(i=0;i<2*n-1;i++)ht[i].parent=ht[i].lchild=ht[i].rchild=0;//所有结点的相关域置初值 0for (i=n;i<2*n-1;i++)//构造哈夫曼树{min1=min2=MAX;//int的范围是-32768-32767lnode=rnode=0;//lnode和rnode记录最小权值的两个结点位置for (k=0;k<=i-1;k++) //选出每次外层循环最小权值的两个结点{if(ht[k].parent==0) //只在尚未构造二叉树的结点中查找{8if (ht[k].weight<min1)//比min1小时{min2=min1;rnode=lnode;min1=ht[k].weight;lnode=k;}else if (ht[k].weight<min2)//比min1大,比min2小{min2=ht[k].weight;rnode=k;}}}ht[lnode].parent=i;ht[rnode].parent=i;//两个最小节点的父节点是iht[i].weight=ht[lnode].weight+ht[rnode].weight;//两个最小节点的父节点权值为两个最小节点权值之和9ht[i].lchild=lnode;ht[i].rchild=rnode;//父节点的左节点和右节点}}③哈夫曼编码void CreateHCode(HTNode ht[],HCodehcd[],intn){inti,p,c;HCodehc;for (i=0;i<n;i++)//根据哈夫曼树求哈夫曼编码{hc.start=n; //初始位置c=i; //从叶子结点 ht[i]开始上溯p=ht[i].parent;while (p!=0)//循序直到树根结点结束循环{hc.cd[hc.start--]=(ht[p].lchild)==c?'0':'1';//左孩子记为0,右孩子记为110c=p;p=ht[p].parent;//与上句c=i;p=ht[i].parent 同义,促进循环}hc.start++;//start指向哈夫曼编码 hc.cd[]中最开始字符hcd[i]=hc;}}④哈夫曼译码void deHCode(HTNode ht[],HCode hcd[],intn,charstr[]) //译码函数{printf("输出译码结果为:\n");inti,j,k,x,m=0;charcode[MAX];for(i=0;i<MAX;i++)for(j=0;j<n;j++)if(str[i]==ht[j].data) //循环查找与输入字符相同的编号,相同的就输出这个字符的编码11{for(k=hcd[j].start;k<=n;k++){code[m]=hcd[j].cd[k];//将输出的编码赋值到数组中m++;}break; //输出完成后跳出当前 for循环}code[m]='#';//把要进行译码的字符串存入code数组中while(code[0]!='#')for(i=0;i<n;i++){m=0;//m为想同编码个数的计数器for (k=hcd[i].start,j=0;k<=n;k++,j++)12//j为记录所存储这个字符的编码个数{if(code[j]==hcd[i].cd[k]) //当有相同编码时 m值加1m++;}if(m==j)//当输入的字符串与所存储的编码字符串个数相等时则输出这个的data数据{printf("%c",ht[i].data);for(x=0;code[x-j]!='#';x++)//把已经使用过的 code数组里的字符串删除{code[x]=code[x+j];//删除j个数,往前移动 j位}}}printf("\n");}⑤主函数13voidmain(){charst[MAX],sst[MAX];intcn[257];intn,i;printf("请输入字符串(任意字符):\n");gets(st);n=jsq(st,cn,sst);///////////////////////////99for(i=0;i<99;i++)sst[i]=st[i];//////////////////////////////////HTNodeht[M];HCodehcd[N];CreateHT(ht,n,st,cn);CreateHCode(ht,hcd,n);outputHCode(ht,hcd,n);editHCode(ht,hcd,n,sst);deHCode(ht,hcd,n,sst);}14五、调试输出哈夫曼编码输出编码结果输出译码结果15附录源程序#include<stdio.h>#include<string.h> //gets()函数需要#defineN256 //义用N表示50叶节点数#defineM2*N-1 //用M表示节点总数当叶节点数位n时总节点数为2n-1#defineMAX32767typedefstruct16{chardata; //结点字符intweight; //权值intparent; //双亲结点intlchild; //左孩子结点intrchild; //右孩子结点}HTNode;///////////////////////////typedefstruct{charcd[N]; //存放哈夫曼码intstart; //从start开始读cd中的哈夫曼码}HCode;///////////////////////////////////intjsq(char*s,intcnt[],charstr[]){char*p;inti,j,k;for(i=1;i<=256;i++)cnt[i]=0;17for(p=s;*p!='\0';p++){k=*p;cnt[k]++;}j=0;for(i=1,j=0;i<=256;i++)if(cnt[i]!=0){j++;}returnj;}///////////////////////////////////////////////////voidCreateHT(HTNode ht[],int n,charstr[],intcn[]) //创建哈夫曼树函数{for(intinput=1;input<=256;input++){str[input]=input;}intl=0;18for(intoutput=1;output<=256;output++){if(cn[output]!=0){ht[l].data=str[output];//按字母顺序将出现的字母依次存入数组 ht[]ht[l].weight=cn[output];l++;}}inti,k,lnode,rnode;intmin1,min2;for(i=0;i<2*n-1;i++)ht[i].parent=ht[i].lchild=ht[i].rchild=0;//所有结点的相关域置初值 0for (i=n;i<2*n-1;i++)//构造哈夫曼树{min1=min2=MAX;//int的范围是-32768-32767lnode=rnode=0;//lnode和rnode记录最小权值的两个结点位置19for (k=0;k<=i-1;k++) //选出每次外层循环最小权值的两个结点{if(ht[k].parent==0) //只在尚未构造二叉树的结点中查找{if (ht[k].weight<min1)//比min1小时{min2=min1;rnode=lnode;min1=ht[k].weight;lnode=k;}else if (ht[k].weight<min2)//比min1大,比min2小{min2=ht[k].weight;rnode=k;}}}20ht[lnode].parent=i;ht[rnode].parent=i;//两个最小节点的父节点是iht[i].weight=ht[lnode].weight+ht[rnode].weight;//两个最小节点的父节点权值为两个最小节点权值之和ht[i].lchild=lnode;ht[i].rchild=rnode;//父节点的左节点和右节点}}//////////////////////////////////////////////////////voidCreateHCode(HTNodeht[],HCodehcd[],intn){inti,p,c;HCodehc;for (i=0;i<n;i++)//根据哈夫曼树求哈夫曼编码{hc.start=n; //初始位置c=i; //从叶子结点 ht[i]开始上溯21p=ht[i].parent;while (p!=0)//循序直到树根结点结束循环{hc.cd[hc.start--]=(ht[p].lchild)==c?'0':'1';//左孩子记为0,右孩子记为 1c=p;p=ht[p].parent;//与上句c=i;p=ht[i].parent 同义,促进循环}hc.start++;//start指向哈夫曼编码 hc.cd[]中最开始字符hcd[i]=hc;}}/////////////////////////////////////////////////void outputHCode(HTNode ht[],HCodehcd[],intn) //输出哈夫曼编码的列表{inti,k;printf(" 输出哈夫曼编码:\n");for (i=0;i<n;i++)22//输出data中的所有数据,{printf(" %c:\t",ht[i].data);for (k=hcd[i].start;k<=n;k++)//输出所有data中数据的编码{printf("%c",hcd[i].cd[k]);//从初最开始的字符起输出}printf("\n");}}////////////////////////////////////////////void editHCode(HTNode ht[],HCode hcd[],intn,charstr[]) //编码函数{inti,j,k;printf("\n 输出编码结果:\n");for(i=0;i<MAX;i++)for(j=0;j<n;j++)if(str[i]==ht[j].data) //循环查找与输入字符相同的编号,相同的就输出这个字符的编码23{for(k=hcd[j].start;k<=n;k++){printf("%c",hcd[j].cd[k]);}break; //输出完成后跳出当前 for循环}printf("\n");}/////////////////////////////////////////////void deHCode(HTNode ht[],HCode hcd[],intn,charstr[]) //译码函数{printf("输出译码结果为:\n");inti,j,k,x,m=0;charcode[MAX];24for(i=0;i<MAX;i++)for(j=0;j<n;j++)if(str[i]==ht[j].data) //循环查找与输入字符相同的编号,相同的就输出这个字符的编码{for(k=hcd[j].start;k<=n;k++){code[m]=hcd[j].cd[k]
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届江苏省无锡市惠山六校联考初三下学期第六次月考语文试题试卷含解析
- 2026届常州市武进区达标名校初三下学期第六次质量调研考试语文试题含解析
- 四川省资阳市资阳市雁江区重点名校2025-2026学年初三下学期第二次质量检测试题数学试题含解析
- 品牌宣传材料制作规范模板品牌传播标准化工具
- 文化创新产业扶持方案声明书(6篇)
- 食品生产和质量控制作业指导书
- 安全风险隐患治理措施承诺函7篇
- 自身品格修养改进承诺书(3篇)
- 高效能电池储能技术优化应用解决方案
- 文档管理自动化工具及使用教程
- 湖南省新高考教学教研联盟(长郡二十校联盟)2026届高三年级下学期3月联考数学理试卷(含答案)
- 2025年保安员考试题(含答案)
- 2026年江苏航空职业技术学院单招职业适应性测试题库附答案解析
- 2026年江西省五方面人员考试《三农知识》
- 档案数字化加工考核制度
- 2026年及未来5年市场数据中国旅游食品行业发展运行现状及发展趋势预测报告
- 2026年商业银行支行行长竞聘管理能力面试问题含答案
- 2025年湖南中烟考试笔试及答案
- 主题一 学生实验 化学实验基本操作(课件)-【中职专用】高中化学同步课堂(高教版2023·农林牧渔类)
- 2026年度交通运输部所属事业单位第三批统一公开招聘参考考试试题及答案解析
- 雨课堂学堂在线学堂云商务英语翻译(Business English Translation Interpretation)西北工业大学单元测试考核答案
评论
0/150
提交评论