北京邮电大学信通院数据结构实验三——哈夫曼树实验报告.doc_第1页
北京邮电大学信通院数据结构实验三——哈夫曼树实验报告.doc_第2页
北京邮电大学信通院数据结构实验三——哈夫曼树实验报告.doc_第3页
北京邮电大学信通院数据结构实验三——哈夫曼树实验报告.doc_第4页
北京邮电大学信通院数据结构实验三——哈夫曼树实验报告.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学信息与通信工程学院2009级数据结构实验报告实验名称: 实验三哈夫曼编/解码器的实现学生姓名:陈聪捷日 期: 2010年11月28日1实验要求一、实验目的:了解哈夫曼树的思想和相关概念;二、实验内容:利用二叉树结构实现哈夫曼编/解码器1.初始化:能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树。2.建立编码表:利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。3.编码:根据编码表对输入的字符串进行编码,并将编码后的字符串输出。4.译码:利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。5.打印:以直观的方式打印哈夫曼树。6.计算输入的字符串编码前和编码后的长度,并进行分析,讨论哈夫曼编码的压缩效果。7.用户界面可以设计成“菜单”方式,能进行交互,根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码。2. 程序分析2.1 存储结构二叉树template class BiTreepublic: BiTree();/构造函数,其前序序列由键盘输入 BiTree(void);/析构函数 BiNode* Getroot();/获得指向根结点的指针protected: BiNode *root;/指向根结点的头指针;/声明类BiTree及定义结构BiNodeData: 二叉树是由一个根结点和两棵互不相交的左右子树构成 二叉树中的结点具有相同数据类型及层次关系示意图: root lchild parent rchild 哈夫曼树类的数据域,继承节点类型为int的二叉树class HuffmanTree:public BiTreedata:HCode* HCodeTable;/编码表int tSize; /编码表中的总字符数二叉树的节点结构template struct BiNode /二叉树的结点结构T data; /记录数据T lchild; /左孩子T rchild; /右孩子T parent; /双亲;示意图:T parentT rchildT lchildT data编码表的节点结构struct HCodechar data; /编码表中的字符char code100; /该字符对应的编码;示意图:char code100char data待编码字符串由键盘输入,输入时用链表存储,链表节点为struct Nodechar character; /输入的字符unsigned int count;/该字符的权值bool used; /建立树的时候该字符是否使用过Node* next; /保存下一个节点的地址 ;Node* nextbool usedunsigned int countchar character示意图:2.2 关键算法分析1.初始化函数(void HuffmanTree:Init(string Input))算法伪代码:1.初始化链表的头结点2.获得输入字符串的第一个字符,并将其插入到链表尾部,n=1(n记录的是链表中字符的个数)3.从字符串第2个字符开始,逐个取出字符串中的字符 3.1 将当前取出的字符与链表中已经存在的字符逐个比较,如果当前取出的字符与链表中已经存在的某个字符相同,则链表中该字符的权值加1。 3.2 如果当前取出的字符与链表中已经存在的字符都不相同,则将其加入到链表尾部,同时n+4.tSize=n(tSize记录链表中字符总数,即哈夫曼树中叶子节点总数)5.创建哈夫曼树6.销毁链表 源代码: void HuffmanTree:Init(string Input) Node *front=new Node; /初始化链表的头结点if(!front)throw exception(堆空间用尽); front-next=NULL;front-character=NULL;front-count=0;Node *pfront=front;char ch=Input0; /获得第一个字符 Node* New1=new Node;if(!New1) throw exception(堆空间用尽);New1-character=ch; /将第一个字符插入链表New1-count=1;New1-next=pfront-next;pfront-next=New1;bool replace=0; /判断在已经写入链表的字符中是否有与当前读出的字符相同的字符int n=1; /统计链表中字符个数for(int i=1;inext; if(int)pfront-character = (int)ch) /如果在链表中有与当前字符相同的字符,该字符权值加1pfront-count+;replace=1;break;while(pfront-next); if(!replace) /如果在链表中没找到与当前字符相同的字符,则将该字符作为新成 员插入链表Node* New=new Node;if(!New)throw exception(堆空间用尽);New-character=ch;New-count=1;New-next=pfront-next;pfront-next=New;n+;pfront=front; /重置pfront和replace变量为默认值replace=0;tSize=n; /tSize记录的是编码表中字符个数CreateHTree(front,n); /创建哈夫曼树pfront=front;while(pfront) /销毁整个链表front=pfront;pfront=pfront-next;delete front; 时间复杂度: 若输入的字符串长度为n,则时间复杂度为O(n) 2.创建哈夫曼树(void HuffmanTree:CreateCodeTable(Node *p)) 算法伪代码:1. 创建一个长度为2*tSize-1的三叉链表2. 将存储字符及其权值的链表中的字符逐个写入三叉链表的前tSize个结点的data域,并将对应结点的孩子域和双亲域赋为空3. 从三叉链表的第tSize个结点开始,i=tSize3.1 从存储字符及其权值的链表中取出两个权值最小的结点x,y,记录其下标x,y。3.2 将下标为x和y的哈夫曼树的结点的双亲设置为第i个结点3.3 将下标为x的结点设置为i结点的左孩子,将下标为y的结点设置为i结点的右孩子,i结点的权值为x结点的权值加上y结点的权值,i结点的双亲设置为空4. 根据哈夫曼树创建编码表 源代码: void HuffmanTree:CreateHTree(Node *p,int n) root= new BiNode2*n-1; /初始化哈夫曼树Node *front=p-next;if(n=0)throw exception(没有输入字符);for(int i=0;icount;rooti.lchild=-1;rooti.rchild=-1;rooti.parent=-1;front=front-next;front=p; int New1,New2; for(i=n;inext; for(int i=0;icharacter; /将第i个字符写入编码表 int child=i; /得到第i个字符对应的叶子节点 int parent=rooti.parent; /得到第i个字符对应的叶子节点的双亲 int k=0; if(tSize=1) /如果文本中只有一种字符,它的编码为0 HCodeTablei.codek=0; k+; while(parent!=-1) /从第i个字符对应的叶子节点开始,寻找它到根结点的路径 if(child=rootparent.lchild) /如果当前结点为双亲的左孩子,则编码为0, 否则编码为1 HCodeTablei.codek=0; else HCodeTablei.codek=1; k+; child=parent; parent=rootchild.parent; HCodeTablei.codek=0; Reverse(HCodeTablei.code); /将编码逆置 front=front-next; /得到下一个字符 cout编码表为:endl; for(i=0;itSize;i+) /输出编码表 coutHCodeTablei.data HCodeTablei.codeendl; 时间复杂度: 需要遍历哈夫曼树获取编码,时间复杂度为O(n2) 4. 选择两个最小权值的函数(void HuffmanTree:SelectMin(int &New1,int &New2,int begin,int end)) 算法伪代码:1. 从下标为begin的结点开始,寻找第一个没用过的结点2. 遍历哈夫曼树中从下标为begin到下标为end的结点序列,寻找没用过的同时权值又是最小的结点。3. 暂时改变找到的权值最小结点的双亲域,防止第2次找到相同的结点。4. 将权值最小结点的下标记录下来。5. 重复步骤14,找到第2个权值最小的结点 源代码:void HuffmanTree:SelectMin(int &New1,int &New2,int begin,int end)int min;for(int j=0;j2;j+) /要选择两个权值最小的结点int sign=begin;for(int i=begin;iend;i+) /从下标为begin的结点开始,寻找第1个没用过的结点 if(rooti.parent=-1) /没用过的结点其双亲应为空 min=rooti.data;sign=i; break; for(i=begin;irooti.data)min=rooti.data;sign=i;rootsign.parent=0;/暂时改变所找最小结点的双亲域,防止第2次找到的是同一个结点if(!j)New1=sign;elseNew2=sign; 时间复杂度: 两次遍历链表,时间复杂度为O(n) 5. 将字符串倒序的函数(void HuffmanTree:Reverse(char *pch)) 算法伪代码:1 得到字符串的长度2 初始化两个记录下标的变量,一个为字符串开头字符所在的下标i,另一个为字符串结尾字符所在的下标j3 将下标为i和j的字符交换4 i+,j - - 时间复杂度: 时间复杂度为O(n) 6.编码函数(void HuffmanTree:Encode(string &s,string &d)) 算法伪代码: 1. 从s开头的字符开始,逐一对s中的字符进行编码 2. 在编码表中查找与当前字符对应的字符 3如果找到了与当前字符对应的编码表中的字符,将其编码追加到解码串的末尾。 4. 重复以上步骤,直到所有待编码串中的字符都编码完毕 5. 输出编码后的字符串 源代码:void HuffmanTree:Encode(string &s,string &d) for(int j=0;js.length();j+) /逐个对待编码字符串中的字符进行编码for(int i=0;itSize;i+) /在编码表中查找与当前字符对应的编码if(sj = HCodeTablei.data)d.append(HCodeTablei.code); /编码break;coutdendl; /输出编码后的字符串 时间复杂度: 设待编码字符串长度为n,编码表中字符个数为m,则复杂度为O(n*m) 7.解码函数(void HuffmanTree:Decode(string &s,string &d)) 算法伪代码:1. 得到指向哈夫曼树的根结点的指针和指向待解码串中的第1个字符的指针2. 逐个读取待解码串中的字符,若为0,则指向哈夫曼树当前结点的指针指向当前结点的左孩子,若为1,则指向当前结点的右孩子3. 指向待解码串的指针指向解码串中的下一个字符,直到指向哈夫曼树结点的指针的孩子结点为空4. 如果哈夫曼树只有一个叶子结点,直接将待解码串中的编码转换为对应的字符5. 如果指向哈夫曼树结点的指针的孩子结点已经为空,则将叶子结点下标对应的字符追加到解码串中。6. 输出解码串 源代码: void HuffmanTree:Decode(string &s,string &d) for(int i=0;is.length();) int parent=2*tSize-1-1; /得到哈夫曼树的根结点 while(rootparent.lchild!=-1) /如果结点不为叶子结点 if(si=0) /编码为0则寻找其左孩子 parent=rootparent.lchild; else /编码为1则寻找右孩子 parent=rootparent.rchild; i+; if(tSize=1) /如果编码表只有一个字符,则根结点即为叶子结点 i+; d.append(1,HCodeTableparent.data);/将叶子节点对应的字符追加到解码串中 coutdendl; 时间复杂度: 设待解码串长度为n,则复杂度为O(n) 8. 计算哈夫曼编码的压缩比(void HuffmanTree:Calculate(string s1,string s2)) 算法伪代码:1. 获得编码前字符串的长度,即其占用的字节数2. 获得编码后的字符串的长度,将其除以8然后向上取整,得到其占用的字节数3. 压缩比将两个相除 源代码: void HuffmanTree:Calculate(string s1,string s2) int cal1=s1.length(); int cal2=s2.length(); cal2=ceill(float)cal2/8); /将编码串的比特数转化为字节数 cout编码前的字符串长度:cal1endl; cout编码后的字符串长度:cal2endl; cout压缩比为:(double)cal2/(double)cal1)*100%endl; 时间复杂度: O(1) 9. 打印哈夫曼树(void HuffmanTree:PrintTree(int TreeNode,int layer) ) 算法伪代码:1. 如果待打印结点为空,则返回2. 递归调用函数打印当前结点的右子树3. 根据当前结点所在的层次确定其前面要输出多少空格,先输出空格,在打印当前结点的权值4. 递归调用函数打印当前结点的左子树 源代码: void HuffmanTree:PrintTree(int TreeNode,int layer) if(TreeNode=-1) /如果待打印结点为空,则返回return;elsePrintTree(rootTreeNode.rchild,layer+1); /先打印该结点的右子树,layer记录的是该结点所在的层次for(int i=0;ilayer*2;i+) /根据该结点所在的层次,确定在它之前需要打印多少空格cout ;coutrootTreeNode.dataendl; /打印该结点的权值PrintTree(rootTreeNode.lchild,layer+1); /打印该结点的左子树 时间复杂度: 中序遍历哈夫曼树,复杂度为O(n) 10. 菜单函数(void HuffmanTree:Menu()) 算法伪代码: 1. 逐一读取键盘缓存区中的字符,并将它们逐一追加到记录输入字符串的string变量中,直到读到回车输入符为止 2. 删除string变量末尾的回车输入符 3利用string变量创建哈夫曼树,初始化编码表。 4. 直观打印哈夫曼树 5. 对输入的字符串进行编码 6. 对编码后的字符串进行解码 7. 计算编码前后的压缩比并输出 源代码: void HuffmanTree:Menu() cout请输入你要编码的文本,按回车键确定输入endl; string

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论