数据结构第6章

上传人：g*** IP属地：河南上传时间：2020-04-05 格式：PPT 页数：128 大小：1.20MB 积分：15 举报 版权申诉

已阅读5页，还剩123页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据结构教师刘琼电话第6章树和二叉树 6 1树的定义和基本术语6 2二叉树6 3遍历二叉树和线索二叉树6 4树和森林 6 5树与等价问题6 6赫夫曼树及其应用 6 7回溯法与树的遍历 6 8树的计数 6 1树的定义和基本术语数据结构线性结构和非线性结构线性结构线性表栈队列等非线性结构至少存在一个数据元素有不止一个直接前驱或后继树图等树型结构是一类重要的非线性结构树型结构是结点之间有分支并且具有层次关系的结构它非常类似于自然界中的树 6 1树的定义和基本术语树结构在客观世界是大量存在的例如家谱行政组织机构都可用树形象地表示树在计算机领域中也有着广泛的应用例如在编译程序中用树来表示源程序的语法结构在数据库系统中可用树来组织信息在分析算法的行为时可用树来描述其执行过程等 6 1树的定义和基本术语 1 树型结构实例 1 家族树 6 1树的定义和基本术语 2 书的目录结构 6 1树的定义和基本术语 2 树的定义树 Tree 是n n 0 个结点的有限集记为T T为空时称为空树否则它满足以下两个条件 1 有且仅有一个结点没有前驱称该结点为根结点 Root 6 1树的定义和基本术语 2 除根结点以外其余结点可分为m m 0 个互不相交的有限集合T0 Tl Tm 1 其中每个集合又构成一棵树树T0 Tl Tm 1被称为根结点的子树 Subree 每棵子树的根结点有且仅有一个直接前驱但可以有0个或多个后继树的逻辑结构表示数据之间的关系是一对多或者多对一的关系它的结构特点具有明显的层次关系是一种十分重要的非线性的数据结构 6 1树的定义和基本术语图 a 是一棵只有一个根结点的树图 b 是一棵有12个结点的树即T A B C K L A是根除根结点A之外其余的11个结点分为三个互不相交的集合 T1 T2和T3是根A的三棵子树且本身又都是一棵树所以树的定义是递归的 6 1树的定义和基本术语 3 树的基本术语 1 树的结点包含一个数据元素和指向其子树的所有分支 2 结点的度一个结点拥有的子树个数度为零的结点称为叶子结点 3 树的度树中所有结点的度的最大值Max D I 含义树中最大分支数为树的度 6 1树的定义和基本术语 4 结点的层次及树的深度根为第一层根的孩子为第二层若某结点为第k层则其孩子为k 1层树中结点的最大层次称为树的深度或高度 5 森林是m m 0 棵互不相的树的集合森林与树概念相近相互很容易转换 6 有序树无序树如果树中每棵子树从左向右的排列拥有一定的顺序不得互换则称为有序树否则称为无序树 6 1树的定义和基本术语 7 森林是m m 0 棵互不相交的树的集合在树结构中结点之间的关系又可以用家族关系描述定义如下 8 孩子双亲结点子树的根称为这个结点的孩子而这个结点又被称为孩子的双亲 9 子孙以某结点为根的子树中的所有结点都被称为是该结点的子孙 6 1树的定义和基本术语 10 祖先从根结点到该结点路径上的所有结点 11 兄弟同一个双亲的孩子之间互为兄弟 12 堂兄弟双亲在同一层的结点互为堂兄弟 6 1树的定义和基本术语 4 树的基本运算树的基本运算主要有 1 初始化操作INITIATE T 创建一棵空树 2 求根函数ROOT T 求树T的根 ROOT X 求结点x所在树的根 3 求双亲函数PARENT T x 在树T中求x的双亲 4 求第i个孩子函数CHILD T x i 在树T中求结点x的第i个孩子 6 1树的定义和基本术语 5 建树函数CRT TREE x F 建立以结点x为根森林F为子树的树 6 遍历树操作TRAVERSE T 按顺序访问树T中各个结点 6 1树的定义和基本术语 5 树的表示树的逻辑表示方法有多种常见的有 1 树形图表示法 2 嵌套集合表示法文氏图表示法 3 凹入表示法 4 广义表表示法 6 1树的定义和基本术语 6 1树的定义和基本术语 6 树的存储结构和线性表一样树可以用顺序和链式两种存储结构树的顺序存储结构适合树中结点比较满的情况根据树的非线性结构特点常用链式存储方式来表示树树常用的存储方法有双亲存储表示法孩子链表表示法和孩子兄弟链表表示法 6 1树的定义和基本术语 1 双亲存储表示法一般采用顺序存储结构实现用一组地址连续的存储单元来存放树的结点每个结点有两个域 data域存放结点的信息 parent域存放该结点双亲结点的位置特点求结点的双亲很容易但求结点的孩子需要遍历整个向量 6 1树的定义和基本术语 6 1树的定义和基本术语存储结构描述为 defineMaxTreeSize100 定义数组空间的大小typedefcharDataType 定义数据类型typedefstruct DataTypedata 结点数据intparent 双亲指针指示结点的双亲在数组中的位置 PTreeNode typedefstruct PTreeNodenodes MaxTreeSize intn 结点总数 PTree PTreeT T是双亲链表 6 1树的定义和基本术语 2 孩子链表表示法这是树的链式存储结构每个结点的孩子用单链表存储称为孩子链表 n个结点可以有n个孩子链表叶结点的孩子链表为空表 n个孩子链表的头指针用一个向量表示特点与双亲相反求孩子易求双亲难 6 1树的定义和基本术语头指针向量孩子链表 6 1树的定义和基本术语存储结构描述为 typedefstructCTNode intchild 孩子链表结点structCTNode next ChildPtr typedefstruct 孩子链表头结点 ElemTypedata 结点的数据元素ChildPtrfirstchild 孩子链表头指针 CTBox typedefstruct CTBoxnodes MaxTreeSize intn r 数的结点数和根结点的位置 CTree 6 1树的定义和基本术语孩子链表表示法的类型说明typedefstructCnode DataType和MaxTreeSize由用户定义孩子链表结点intchild 孩子结点在数组中对应的下标structCNode next Cnode typedefstruct 孩子链表头结点 DataTypedata 存放树中结点数据CNode firstchild 孩子链表的头指针 PTNode 6 1树的定义和基本术语 typedefstruct PTNodenodes MaxTreeSize Intn root 树的结点数和根结点的位置 Ctree CtreeT T的孩子链表表示 6 1树的定义和基本术语 3 孩子兄弟链表表示法孩子兄弟链表表示法也是树的一种链式存储结构用二叉链表作为树的存储结构每个结点的左链域指向该结点的第一个孩子右链域指向下一个兄弟结点由于结点中的两个指针指示的分别为孩子和兄弟故称为孩子兄弟链表这种结构也称为二叉链表特点双亲只管长子长子连接兄弟 6 1树的定义和基本术语 6 1树的定义和基本术语树的孩子兄弟链表的存储结构描述为 typedefstructCSNode ElemTypedata structCSNode firstchild nextsibling CSNode CSTree 孩子兄弟存储结构的最大优点是可以方便地实现树和二叉树的相互转换和树的各种操作但是孩子兄弟存储结构的缺点也是查找当前结点的双亲结点比较麻烦需要从树根结点开始逐个结点查找 6 2 1二叉树的定义与性质二叉树 BinaryTree 是一种重要的树型结构是度为2的有序树它的特点是每个结点至多有两棵子树和树的定义类似二叉树的定义也可以用递归形式给出二叉树 BinaryTree 是n n 0 个结点的有限集它或者是空集 n 0 或者同时满足以下两个条件 1 有且仅有一个根结点 2 其余的结点分成两棵互不相交的左子树和右子树 6 2二叉树二叉树与树有区别树至少应有一个结点而二叉树可以为空树的子树没有顺序但如果二叉树的根结点只有一棵子树必须明确区分它是左子树还是右子树因为两者将构成不同形态的二叉树因此二叉树不是树的特例它们是两种不同的数据结构二叉树有5种基本形态空二叉树 b 只有根结点的二叉树 c 右子树为空的二叉树 d 左子树为空的二叉树 e 左右子树均不为空的二叉树两种特殊形态的二叉树满二叉树和完全二叉树 1 满二叉树 FullBinaryTree 深度为k 且有2k 1个结点的二叉树特点 1 每一层上结点数都达到最大 2 度为1的结点n1 0 树叶都在最下一层上结点层序编号方法从根结点起从上到下逐层层内从左到右对二叉树的结点进行连续编号 2 完全二叉树 CompleteBinaryTree 深度为k 结点数为n的二叉树当且仅当每个结点的编号都与相同深度的满二叉树中从1到n的结点一一对应时称为完全二叉树完全二叉树的特点 1 每个结点i的左子树的深度Lhi 其结点i的右子树的深度Rhi等于0或1 即叶结点只可能出现在层次最大或次最大的两层上 2 完全二叉树结点数n满足2k 1 1 n 2k 1 3 满二叉树一定是完全二叉树反之不成立满二叉树完全二叉树 LH1 3RH1 1LH1 RH1 2 非完全二叉树非完全二叉树 LH2 0RH2 1LH2 RH2 0 1 1 6 2 2二叉树的性质性质1在二叉树的第i层上至多有2i 1个结点 i 1 性质2深度为k的二叉树至多有2k 1个结点 k 1 深度一定二叉树的最大结点数也确定性质3二叉树中终端结点数n0与度为2的结点数n2存在关系 n0 n2 1性质4结点数为n的完全二叉树其深度为 log2n l 性质5在按层序编号的n个结点的完全二叉树中任意一结点i 1 i n 有 i 1时结点i是树的根否则结点i的双亲为结点 i 2 i 1 2i n时结点i无左孩子为叶结点否则结点i的左孩子为结点2i 2i 1 n时结点i无右孩子否则结点i的右孩子为结点2i 1 6 2 3二叉树的存储结构同线性表一样二叉树的存储结构也有顺序和链表两种结构 1 顺序存储结构用一组地址连续的存储单元以层序顺序存放二叉树的数据元素结点的相对位置蕴含着结点之间的关系 bt 3 的双亲为 3 2 1 即在bt 1 中其左孩子在bt 2i bt 6 中其右孩子在bt 2i 1 bt 7 中这种存储结构适合于完全二叉树既不浪费存储空间又能很快确定结点的存放位置结点的双亲和左右孩子的存放位置但对一般二叉树可能造成存储空间的大量浪费 123456789101112ABCDE0000FG0000 一般二叉树也按完全二叉树形式存储无结点处用0表示例如深度为k 且只有k个结点的右单枝树每个非叶结点只有右孩子需2k 1个单元即有2k 1 k个单元被浪费链式存储结构二叉链表设计不同的结点结构可以构成不同的链式存储结构常用的有二叉链表三叉链表线索链表用空链域存放指向前驱或后继的线索由于二叉树每个结点至多只有2个孩子分别为左孩子和右孩子因此可以把每个结点分成三个域一个域存放结点本身的信息另外两个是指针域分别存放左右孩子的地址每个结点的结构表示为其中左链域lchild为指向左孩子的指针右链域rchild为指向右孩子的指针数据域data表示结点的值若某结点没有左孩子或右孩子其相应的链域为空指针对应的结构类型定义如下 typedefstructnode ElemTypedata structnode lchild structnode rchild BTree tree 其中 tree是指向根结点的指针二叉链表的结点结构二叉链表说明一个二叉链表由根指针root唯一确定若二叉树为空则root NULL 若结点的某个孩子不存在则相应的指针为空具有n个结点的二叉链表中共有2n个指针域其中只有n 1个用来指示结点的左右孩子其余的n 1个指针域为空 lchilddataparentrchild A C B D E 三叉链表 3 带双亲指针的二叉链表由于经常要在二叉树中寻找某结点的双亲时可在每个结点上再加一个指向其双亲的指针parent 形成一个带双亲指针的二叉链表就是三叉链表三叉链表的结点结构 6 2 4二叉树的基本运算 1 Inittree T 功能初始化操作建立一棵空的二叉树 2 Root T 功能求二叉树的根 3 Parent T x 功能求二叉树T中值为x的结点的双亲 4 Lchild T x 功能求结点的左孩子 5 Rchild T x 功能求结点的右孩子 6 Traverse T 功能遍历或访问二叉树T 7 creatree T 功能创建二叉树T 6 3 1遍历二叉树在二叉树的一些应用中常常要求在树中查找具有某种特征的结点或者对树中全部结点逐一进行某种处理这就引入了遍历二叉树的问题即如何按某条搜索路径访问树中的每一个结点使得每一个结点仅且仅被访问一次 6 3遍历二叉树和线索二叉树遍历二叉树指按一定的规律对二叉树的每个结点访问且仅访问一次的处理过程遍历对线性结构是容易解决的而二叉树是非线性的因而需要寻找一种规律使二叉树上的结点能排列在一个线性队列上从而便于遍历访问是一种抽象操作是对结点的某种处理例如可以是求结点的度或层次打印结点的信息或做其他任何工作一次遍历后使树中结点的非线性排列按访问的先后顺序变为某种线性排列遍历的次序假如以L D R分别表示遍历左子树遍历根结点和遍历右子树遍历整个二叉树则有DLR LDR LRD DRL RDL RLD六种遍历方案若规定先左后右则只有前三种情况分别规定为 DLR 先根序遍历 LDR 中根序遍历 LRD 后根序遍历 1 遍历方案LDR中序遍历 LRD后序遍历 DLR先序遍历 1 中序遍历二叉树算法思想若二叉树非空则 1 中序遍历左子树2 访问根结点3 中序遍历右子树算法描述 voidInorder BiTreebt bt为根结点指针if bt 根非空Inorder bt lchild visit bt data Inorder bt rchild 2 后序遍历二叉树算法思想若二叉树非空则 1 后序遍历左子树2 后序遍历右子树3 访问根结点算法描述 voidPostorder BiTreebt bt为根结点指针if bt Postorder bt lchild Postorder bt rchild visit bt data 3 先序遍历二叉树算法思想若二叉树非空则 1 访问根结点2 先序遍历左子树3 先序遍历右子树算法描述 voidPreorder BiTreebt bt为根结点指针if bt 根非空visit bt data Preorder bt lchild Preorder bt rchild 例表达式a b c d e f 遍历结果中序 a b c d e f后序 abcd ef 先序 a b cd ef 2 遍历算法 1 先序遍历的递归算法如下假定结点的元素值为字符型 preorder BTree root 前序遍历 if root NULL 如果不是空结点 printf c n root data 输出当前结点值preorder root lchild 递归前序遍历左子结点preorder root rchild 递归前序遍历右子结点 return 结束 2 中序遍历的递归算法如下voidinorder BTree root 中序遍历 if root NULL 如果不是空结点 inorder root lchild 递归中序遍历左子结点printf c n root data 输出当前结点值inorder root rchild 递归中序遍历右子结点 3 后序遍历的算法如下voidpostorder BTree root 后序遍历 if root NULL 如果不是空结点 postorder root lchild 递归后序遍历左子结点postorder root rchild 递归后序遍历右子结点printf c n root data 输出当前结点值通过上述三种不同的遍历方式得到三种不同的线性序列从二叉树的遍历定义可知三种遍历算法的不同之处仅在于访问根结点和遍历左右子树的先后关系如果在算法中隐去和递归无关的语句printf 则三种遍历算法是完全相同的遍历二叉树的算法中的基本操作是访问结点显然不论按那种方式进行遍历对含n个结点的二叉树其时间复杂度均为O n 6 3 2线索二叉树通过遍历二叉树可得到结点的一个线性序列在线性序列中很容易求得某个结点的直接前驱和后继但是在二叉树上只能找到结点的左孩子右孩子结点的前驱和后继只有在遍历过程中才能得到那么如何保存遍历二叉树后动态得到的线性序列以便快速找到某个结点的直接前驱和后继已知n个结点有n 1个前驱和n 1个后继一共有2n个链域其中 n 1个空链域 n 1个指针域因此可以用空链域来存放结点的前驱和后继线索二叉树就是利用n 1个空链域来存放结点的前驱和后继结点的信息有效利用二叉链表中空的存储空间指定原有的孩子指针为空的域来存放指向前驱和后继的信息这样的指针被称为线索加线索的过程称为线索化由此得到的二叉树称作线索二叉树结点结构在二叉链表中增加ltag和rtag两个标志域若结点有左子树则左链域lchild指示其左孩子 ltag 0 否则令左链域指示前驱 ltag 1 若结点有右子树则右链域rchild指示其右孩子 rtag 0 否则令右链域指示后继 rtag 1 中序先序和后序线索二叉树中所有实线均相同所有结点的标志位取值也完全相同只是当标志位取1时不同的线索二叉树将用不同的虚线表示中序遍历得到的线索二叉树称为中序线索二叉树先序遍历得到的线索二叉树称为先序线索二叉树后序遍历得到的线索二叉树称为后序线索二叉树 2 整体结构增设一个头结点令其lchild指向二叉树的根结点 ltag 0 rtag 1 并将该结点作为遍历访问的第一个结点的前驱和最后一个结点的后继最后用头指针指示该头结点线索二叉树的存储结点可描述如下 structnode ElemenTypedata 数据域intltag 左标志域intrtag 右标志域structnode lchild 左指针域structnode rchild 右指针域 BTree 1 已知一棵完全二叉树共有900个结点试求树的高度树中叶子结点个数树中度为1的结点个数最后一个非叶子结点是层序遍历序列中的第几个结点习题 2 设一棵二叉树的先序序列为中序序列为试画出该二叉树习题 3 设有二叉树如下试对其进行中序线索化画出相应的中序线索二叉树存储结构示意图习题树与二叉树的对应关系树与二叉树均可用二叉链表作为存储结构因此给定一棵树用二叉链表存储可唯一对应一棵二叉树反之亦然 6 4树和森林 2 树转换成二叉树将一棵树转化为等价的二叉树方法如下 1 在树中各兄弟堂兄弟除外之间加一根连线 2 对于任一结点只保留它与最左孩子的连线外删去它与其余孩子之间的连线 3 以树根为轴心将整棵树按顺时钟方向旋转约45 特点根无右子树应当注意的是和树对应的二叉树其左右子树的概念已改变为左是孩子右是兄弟 3 森林转换成二叉树树和森林都可转换成二叉树但树转换成二叉树后根结点无右分支而森林转换后的二叉树其根结点有右分支将森林转化为二叉树方法如下 1 将森林中的每一棵树转换成等价的二叉树 2 保留第一棵二叉树自第二棵二叉树始依次将后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子当所有的二叉树依此相连后所得到的二叉树就是由森林转化成的二叉树 3 以树根为轴心将整棵树按顺时钟旋转约45 4 二叉树转换成森林将当前根结点和其左子树作为森林的一棵树并将其右子树作为森林的其他子树重复上面直到某结点的右子树为空 5 树和森林的遍历 1 树的遍历树的遍历可有三条搜索路径先根次序遍历若树不空则先访问根结点然后依次先根遍历各棵子树后根次序遍历若树不空则先依次后根遍历各棵子树然后访问根结点按层次遍历若树不空则自上而下自左至右访问树中每个结点 A B C D E F G H J I K 先根遍历时顶点的访问次序 ABEFCDGHIJK后根遍历时顶点的访问次序 EFBCIJKHGDA层次遍历时顶点的访问次序 ABCDEFGHIJK 2 森林的遍历森林由三部分构成 1 森林中第一棵树的根结点 2 森林中第一棵树的子树森林 3 森林中其它树构成的森林 B C D E F G H J I K 1 先序遍历若森林不空则访问森林中第一棵树的根结点先序遍历森林中第一棵树的子树森林先序遍历森林中除第一棵树之外其余树构成的森林即依次从左至右对森林中的每一棵树进行先根遍历 2 中序遍历若森林不空则中序遍历森林中第一棵树的子树森林访问森林中第一棵树的根结点中序遍历森林中除第一棵树之外其余树构成的森林即依次从左至右对森林中的每一棵树进行后根遍历 1 二叉树遍历的应用2 最优二叉树哈夫曼树 6 5二叉树的应用 1 查找数据元素Search bt x 在bt为二叉树的根结点指针的二叉树中查找数据元素x 查找成功时返回该结点的指针查找失败时返回空指针 6 5 1二叉树遍历的应用 BiTreeSearch BiTreebt elemtypex 在bt为根结点指针的二叉树中查找数据元素x if bt data x returnbt 查找成功返回 if bt lchild NULL return Search bt lchild x 在bt lchild为根结点指针的二叉树中查找x if bt rchild NULL return Search bt rchild x 在bt rchild为根结点指针的二叉树中查找x returnNULL 查找失败返回 2 统计出给定二叉树中叶子结点的数目 1 顺序存储结构的实现intCountLeaf1 SqBiTreebt intk 一维数组bt 2k 1 为二叉树存储结构 k为二叉树深度函数值为叶子数 total 0 for i 1 i 2k 1 2 total return total 2 二叉链表存储结构的实现intCountLeaf2 BiTreebt bt为根结点所在链结点的指针返回值为bt的叶子数 if bt NULL return 0 if bt lchild NULL 3 创建二叉树二叉链表存储并显示设创建时按二叉树带空指针的先序次序输入结点值结点值类型为字符型输出按中序输出 CreateBinTree BinTree bt 是以二叉链表为存储结构建立一棵二叉树T的存储 bt为指向二叉树T根结点指针的指针设建立时的输入序列为 AB0D00CE00F00 建立如下图所示的二叉树存储 voidCreateBinTree BinTree T 以加入结点的先序序列输入构造二叉链表 charch scanf n c 构造右子树 InOrderOut bt 为按中序输出二叉树bt的结点 voidInOrderOut BinTreeT 中序遍历输出二叉树T的结点值 if T InOrderOut T lchild 中序遍历左子树 printf 3c T data 访问结点的数据 InOrderOut T rchild 中序遍历右子树 main BiTreebt CreateBinTree 4 表达式运算我们可以把任意一个算数表达式用一棵二叉树表示下图所示为表达式3x2 x 1 x 5的二叉树表示在表达式二叉树中每个叶结点都是操作数每个非叶结点都是运算符对于一个非叶子结点它的左右子树分别是它的两个操作数对该二叉树分别进行先序中序和后序遍历可以得到表达式的三种不同表示形式前缀表达式 3 xxx 1x5中缀表达式3 x x x 1 x 5后缀表达式3xx x 1x 5 中缀表达式是经常使用的算术表达式前缀表达式和后缀表达式分别称为波兰式和逆波兰式它们在编译程序中有着非常重要的作用 1 哈夫曼树的基本概念最优二叉树也称哈夫曼 Haffman 树是指对于一组带有确定权值的叶结点构造的具有最小带权路径长度的二叉树在许多应用中常常赋给树中结点一个有某种意义的实数称此实数为该结点的权从树根结点到该结点之间的路径长度与该结点上权的乘积称为结点的带权路径长度 WPL 6 5 2最优二叉树哈夫曼树树中所有叶子结点的带权路径长度之和称为该树的带权路径长度通常记为其中Wi为第i个叶结点的权值 li为第i个叶结点的路径长度 n为叶子结点的个数两结点间的路径从一结点到另一结点所经过的结点序列路径长度路径上的分支数树的路径长度从根到每一结点的路径长度之和如上图所示的二叉树它的带权路径长度值为 WPL 2 2 4 2 5 2 3 2 28 在给定一组具有确定权值的叶结点可以构造出不同的带权二叉树例如给出4个叶结点设其权值分别为1 3 5 7 我们可以构造出形状不同的多个二叉树这些形状不同的二叉树的带权路径长度将各不相同下图给出了其中4个不同形状的二叉树它们的带权路径长度分别为 a WPL 1 2 3 2 5 2 7 2 32 b WPL 1 2 3 3 5 3 7 l 33 c WPL 7 3 5 3 3 2 1 1 43 d WPL 1 3 3 3 5 2 7 1 29 由上可见由相同权值的一组叶子结点所构成的二叉树有不同的形态和不同的带权路径长度那么如何找到带权路径长度最小的二叉树即哈夫曼树呢据哈夫曼树的定义一棵二叉树要使其WPL值最小必须使权值越大的叶结点越靠近根结点而权值越小的叶结点越远离根结点哈夫曼 Haffman 依据这一特点提出了一种方法这种方法的基本思想是 1 由给定的n个权值 W1 W2 Wn 构造n棵只有一个叶结点的二叉树从而得到一个二叉树的集合F T1 T2 Tn 2 在F中选取根结点的权值最小和次小的两棵二叉树作为左右子树构造一棵新的二叉树这棵新的二叉树根结点的权值为其左右子树根结点权值之和 3 在集合F中删除作为左右子树的两棵二叉树并将新建立的二叉树加入到集合F中 4 重复 2 3 两步当F中只剩下一棵二叉树时这棵二叉树便是所要建立的哈夫曼树下图给出了一个叶结点权值集合为W 5 10 15 30 40 的哈夫曼树的构造过程可以计算出其带权路径长度为 WTL 5 10 4 15 3 30 2 40 205 哈夫曼树的结点的度数为0或2 没有度为1的结点对于同一组给定叶结点所构造的哈夫曼树树的形状可能不同但带权路径长度值是相同的一定是最小的 2 哈夫曼树的构造算法在构造哈夫曼树时可以设置一个结构数组HuffNode保存哈夫曼树中各结点的信息根据二叉树的性质可知具有n个叶子结点的哈夫曼树共有2n 1个结点所以数组HuffNode的大小设置为2n 1 数组元素的结构形式如下其中 weight域保存结点的权值 lchild和rchild域分别保存该结点的左右孩子结点在数组HuffNode中的序号从而建立起结点之间的关系为了判定一个结点是否已加入到要建立的哈夫曼树中可通过parent域的值来确定初始时parent的值为 1 当结点加入到树中时该结点parent的值为其双亲结点在数组HuffNode中的序号就不会是 1了构造哈夫曼树时首先将由n个字符形成的n个叶结点存放到数组HuffNode的前n个分量中然后根据前面介绍的哈夫曼方法的基本思想不断将两个小子树合并为一个较大的子树每次构成的新子树的根结点顺序放到HuffNode数组中的前n个分量的后面下面给出哈夫曼树的构造算法 defineMAXVALUE10000 定义最大权值 defineMAXLEAF30 定义叶子结点个数 defineMAXNODEMAXLEAF 2 1typedefstruct intweight intparent intlchild intrchild HNodeType voidHaffmanTree HNodeTypeHuffNode 哈夫曼树的构造算法 inti j m1 m2 x1 x2 n scanf d 输入叶子结点权值 for i 0 i n 1 i 构造哈夫曼树 m1 m2 MAXVALUE x1 x2 0 for j 0 j n i j if HuffNode j weight m1 将找出的两棵子树合并为一棵子树 HuffNode x1 parent n i HuffNode x2 parent n i HuffNode n i weight HuffNode x1 weight HuffNode x2 weight HuffNode n i lchild x1 HuffNode n i rchild x2 3 哈夫曼编码哈夫曼树的应用很广哈夫曼编码就是哈夫曼树在电讯通信中的应用之一通讯中常需要将文字转换成二进制字符串电文进行传送文字电文称为编码收到电文后要将电文转换成原来的文字电文文字称为译码在电报通信中电文是以二进制的0 1序列传送的最简单的二进制编码方式是等长编码假定需传送的电文是CDABB 在电文中仅使用A B C D4种字符则只需用两个字符串便可分辨可依次对其编码为 00 01 10 11 上述需发送的的电文是 1011000101 译码员可按两位一组进行译码恢复原来的电文例如需将文字 ABACCDA 转换成电文文中有四种字符用2位二进制便可分辨则文字 ABACCDA 的电文为 00010010101100共14位译码时只需每2位一译即可特点等长等频率编码译码容易但电文不一定最短采用不等长编码让出现次数多的字符用短码则文字 ABACCDA 的电文为 000011010共9位但无法译码它既可译为BBCCACA 也可译为AAAACCDA等采用不等长编码让出现次数多的字符用短码且任一编码不能是另一编码的前缀则文字 ABACCDA 的电文为 0110010101110共13位设有n种字符每种字符出现的次数为Wi 其编码长度为Li i 1 2 n 则整个电文总长度为 WiLi 要得到最短的电文即使得 WiLi最小也就是以字符出现的次数为权值构造一棵Huffman树并规定左分支编码位0 右分支编码为1 则字符的编码就是从根到该字符所在的叶结点的路径上的分支编号序列用构造Huffman树设计出来的编码称为Huffman编码为了获得传送电文的最短长度可将字符出现的次数频率作为权值赋予该结点构造一棵WPL最小的哈夫曼树由此得到的二进制前缀编码就是最优前缀编码也称哈夫曼编码可以验证用这样的编码传送电文可使总长最短例如设一文本的字符序列是 DATATRERTERAREAREAART此文本的字符集为 A D T R E 各字符出现的次数为 6 1 4 6 4 以此为权值构造一棵最优二叉树哈夫曼树如下图所示约定从各非终端结点发出的左分支表示0 右分支表示1 由根结点到叶结点的路径上所有0和1组成的序列就是该叶结点所表字符的哈夫曼编码由此可见根据权值构造哈夫曼树得出的哈夫曼编码使字符出现次数频率与码长呈反比关系如此得到的电文码长最短同时又避免了每一个字符编码是另一个字符编码的前缀保证了译码的唯一性下面讨论实现哈夫曼编码的算法实现哈夫曼编码的算法可分为两大部分 1 构造哈夫曼树 2 在哈夫曼树上求叶结点的编码求哈夫曼编码实质上就是在已建立的哈夫曼树中从叶结点开始沿结点的双亲链域回退到根结点每回退一步就走过了哈夫曼树的一个分支从而得到一位哈夫曼码值由于一个字符的哈夫曼编码是从根结点到相应叶结点所经过的路径上各分支所组成的0 1序列因此先得到的分支代码为所求编码的低位码后得到的分支代码为所求编码的高位码我们可以设置一结构数组HuffCode用来存放各字符的哈夫曼编码

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构第6章

文档简介

温馨提示

最新文档

评论

数据结构第6章

文档简介

温馨提示

最新文档

评论

相关文档