1、第第3 3章章 非线性数据结构非线性数据结构 3.7 图及其基本概念图及其基本概念 3.8 图的存储结构图的存储结构 3.8.1 邻接矩阵邻接矩阵3.8.2 邻接表邻接表3.9 图的遍历图的遍历 3.10 图的连通性及最小生成树图的连通性及最小生成树 习题习题 第第3 3章章 非线性数据结构非线性数据结构 3.1 树及其基本概念树及其基本概念 树型结构是一种应用十分广泛的非线性数据结构,它很类似自然界中的树,直观地讲,树型结构是以分支关系定义的层次结构。树(Tree)是n(n0)个结点的有限集合。当n=0时称为空树,否则在任一非空树中:第第3 3章章 非线性数据结构非线性数据结构 (1)有且仅
2、有一个称为该树之根的结点;(2)除根结点之外的其余结点可分为m(m0)个互不相交的集合T1,T2,Tm,且其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。第第3 3章章 非线性数据结构非线性数据结构 ABECFDGHJI 图3-1 树型结构 第第3 3章章 非线性数据结构非线性数据结构 这是一个递归定义,即在树的定义中又用到了树,它显示了树的固有特性。树中的每一个结点都是该树中某一棵子树的根。如图3-1所示的树中,A为根结点,其余的结点分为三个互不相交的有限集合:T1=B,E,F,T2=C,G,J,T3=D,H,I。T1、T2和T3都是A的子树,而它们本身也是一棵树。例如,T
3、1是一棵以B为根的树,其余结点分为互不相交的两个集合E和F,而E和F本身又是仅有一个根结点的树。第第3 3章章 非线性数据结构非线性数据结构 下面结合图3-1,给出树型结构中的一些基本术语。结点的度:一个结点拥有的子树数目。如A结点的度为3,它有三个子树T1、T2和T3。E、F结点的度为0,它们没有子树。叶子:度为零的结点称叶子或终端结点。树的度:一棵树上所有结点的度的最大值就是这棵树的度。第第3 3章章 非线性数据结构非线性数据结构 结点的层次:根结点的层数为1,其它任何结点的层数等于它的父结点的层数加1。树的深度:一棵树中,结点的最大层次值就是树的深度。图3-1中树的深度为4。森林:森林是
4、m(m0)棵互不相交的树的集合。孩子(child):某结点子树的根称为该结点的孩子结点。第第3 3章章 非线性数据结构非线性数据结构 双亲(parent):一个结点是它的那些子树的根的双亲结点。兄弟(sibling):同一个双亲的孩子之间互为兄弟。如A是B、C、D的双亲;B、C、D是A的孩子;B、C、D互为兄弟。堂兄弟(cousins):其双亲在同一层的结点互为堂兄弟。如G与E、F、H、I互为堂兄弟。第第3 3章章 非线性数据结构非线性数据结构 有序树:树T中各子树T1,T2,Tn的相对次序是有意义的,则称T为有序树。在有序树中,改变了子树的相对次序就变成了另一棵树。在计算机中表示一棵树时,就
5、隐含着一种确定的相对次序,所以后面我们讨论的都是有序树。第第3 3章章 非线性数据结构非线性数据结构 3.2 二二 叉叉 树树 3.2.1 二叉树的定义及其性质 1二叉树的定义 一个二叉树是一个有限结点的集合,该集合或者为空,或由一个根结点和两棵互不相交的被称为该根的左子树和右子树的二叉树组成。这是一个递归定义,由定义可知二叉树有下面两个主要特点:第第3 3章章 非线性数据结构非线性数据结构 (1)每个结点最多只能有两个孩子,即二叉树中不存在度大于2的结点。(2)二叉树的子树有左、右之分,其次序不能任意颠倒。二叉树可以有五种基本形态,如图3-2所示。第第3 3章章 非线性数据结构非线性数据结构
6、 (a)(b)(c)(d)(e)图3-2 二叉树的五种基本形态 第第3 3章章 非线性数据结构非线性数据结构 例3-1 画出具有3个结点的树和二叉树的所有不同形态。解:(1)具有3个结点的树有2种不同的形态,如图3-3所示。图3-3 有3个结点的所有树的不同形态第第3 3章章 非线性数据结构非线性数据结构 (a)(b)图3-3 有3个结点的所有树的不同形态 第第3 3章章 非线性数据结构非线性数据结构 (2)具有3个结点的二叉树有5种不同的形态,如图3-4所示。(a)(b)(c)(d)(e)图3-4 3个结点的所有二叉树的不同形态 第第3 3章章 非线性数据结构非线性数据结构 注意:树和二叉树
7、的区别主要是二叉树的结点的子树要区分左子树和右子树,即使在结点只有一个子树的情况下,也要明确指出该子树是左子树还是右子树。如二叉树T和T是不同的二叉树,但作为树,它们就是相同的。如图3-5所示。第第3 3章章 非线性数据结构非线性数据结构 ABT:(a)(b)AB:TAB(c):T 图3-5 二叉树与树的区别(a)二叉树T;(b)二叉树T;(c)树T第第3 3章章 非线性数据结构非线性数据结构 2二叉树的性质二叉树具有下列重要特性。性质1:在二叉树中,第i层的结点数最多有2i-1(i1)个。例如:层次i第i层最多结点数1 20=12 21=23 22=4 k 2k1 此性质可以用数学归纳法证明
8、。第第3 3章章 非线性数据结构非线性数据结构 性质2:在深度为k的二叉树中结点总数最多有2k1个。由性质1可见,深度为k的二叉树的最大结点数为:k1i1i2=2k1 第第3 3章章 非线性数据结构非线性数据结构 性质3:对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0=n2+1。证明:(1)由于在二叉树中,任一结点的度数小于或等于2,所以其结点总数 n=n0+n1+n2第第3 3章章 非线性数据结构非线性数据结构 (2)设B为二叉树中总的分支数目,由于二叉树中除了根结点之外,其余结点都有一个分支进入,所以B=n1即n=B+1而这些分支只能是由度数为1或2的结点所发出,
9、所以 B=n1+2n2于是得:n=n1+2n2+1第第3 3章章 非线性数据结构非线性数据结构 (3)由(1)和(2)得:n0+n1+n2=n1+2n2+1所以 n0=n2+1 证毕 下面介绍两种特殊形态的二叉树,满二叉树和完全二叉树。如果一棵二叉树的深度为k,并且含有2k1个结点,则称此二叉树为满二叉树。图3-6是一棵深度为4的满二叉树。第第3 3章章 非线性数据结构非线性数据结构 ACDHIJKLMNOEFGB图3-6 深度为4的满二叉树第第3 3章章 非线性数据结构非线性数据结构 可以看出这种树的特点是每一层的结点数都是最大结点数。对满二叉树的结点进行连续编号:从根结点起,自上而下逐层从
10、左到右给每个结点编一个从1开始的顺序号。图3-6就成为图3-7。第第3 3章章 非线性数据结构非线性数据结构 134891011121314155672图3-7 深度为4的满二叉树第第3 3章章 非线性数据结构非线性数据结构 深度为k,有n个结点的二叉树,当且仅当其每一个结点都与深度为k的满二叉树中的编号从1到n的结点一一对应时,称之为完全二叉树。如图3-8所示是一棵深度为4的完全二叉树。第第3 3章章 非线性数据结构非线性数据结构 134891011125672图3-8 深度为4的完全二叉树第第3 3章章 非线性数据结构非线性数据结构 可以看出,完全二叉树有下面的特点:(1)叶子只可能在层次
11、最大的两层上出现。(2)最下面一层的结点都集中在该层最左边的若干位置上。完全二叉树是一个十分重要的概念,在许多算法和算法分析中,都明显或隐含地用到了完全二叉树的概念。下面介绍完全二叉树的两个重要特性。性质4:具有n个结点的完全二叉树的深度为lbn+1第第3 3章章 非线性数据结构非线性数据结构 证明:假设深度为k,则根据性质2 2k11n2k1或 2k1n2k于是 k1lbnk 因为 k是整数 所以 k=+1第第3 3章章 非线性数据结构非线性数据结构 性质5:如果对一棵有n个结点的完全二叉树的结点按层序编号(从第1层到第+1层,每层从左到右),则对任一结点i(1in),有 (1)如果i=1,
12、则i是二叉树的根,无双亲;如果i1,则其双亲是结点。(2)如果2in,则结点i无左孩子;否则其左孩子是2i。(3)如果2i+1n,则结点i无右孩子;否则其右孩子是结点2i+1。证明从略。第第3 3章章 非线性数据结构非线性数据结构 另外,还有两种特殊的二叉树,平衡二叉树和二叉排序树。二叉排序树将在第4章中介绍,这里只介绍平衡二叉树的概念。二叉树上任一结点的左子树深度减去右子树深度的差值,称为此结点的平衡因子。若一棵二叉树中,每个结点的平衡因子之绝对值都不大于1,则称这棵二叉树为平衡二叉树。第第3 3章章 非线性数据结构非线性数据结构 例3-2 图3-9中有两棵二叉树,试判定其是否是平衡二叉树?
13、解:二叉树(a)是平衡二叉树。二叉树(b)中结点C的平衡因子为2,大于1,故不是平衡二叉树。第第3 3章章 非线性数据结构非线性数据结构 ABDECCBFEDA(a)(b)图3-9 两棵二叉树第第3 3章章 非线性数据结构非线性数据结构 3.2.2 二叉树的存储结构 对于二叉树,我们既可采用顺序存储,又可采用链式存储。1顺序存储结构 顺序存储就是将一棵二叉树的所有结点按照一定的次序顺序存放到一组连续的存储单元中,为此,必须把二叉树中所有结点构成一个适当的线性序列,以使各个结点在这个序列中的相互位置能反映出结点之间的逻辑关系。第第3 3章章 非线性数据结构非线性数据结构 对于完全二叉树,按图3-
14、8中的编号顺序,就能得到一个足以反映整个二叉树结构的线性序列。因此,可将完全二叉树中所有结点按编号顺序依次存储到一组连续的存储单元(即向量)中,这样既不浪费内存,又可以利用地址公式确定其结点的位置。但对于一般的二叉树,顺序分配常会造成内存的浪费,因为一般的二叉树也必须按完全二叉树的形式来存储。图3-8所示的完全二叉树,其顺序存储结构如图3-10(a)所示。第第3 3章章 非线性数据结构非线性数据结构 而图3-10(b)所示的二叉树,其顺序存储结构如图3-10(c)所示,图中以“0”表示不存在此结点。在最坏情况下,一个深度为k且只有k个结点的单支树(树中无度为2的结点)却需要2k 1个存储单元。
15、可见,浪费很大。所以,一般情况下,还是用链表来表示二叉树。第第3 3章章 非线性数据结构非线性数据结构 12345678910 11 12(a)102000(c)3123(b)图3-10 二叉树的顺序存储结构第第3 3章章 非线性数据结构非线性数据结构 2链式存储结构 因为树型结构是非线性的结构,所以在存储器里表示树型结构的最自然的方法是链式存储。根据二叉树的特性,任何一个结点最多有左、右两棵子树,所以每个结点至少设有三个域:数据域和左、右指针域。其结点结构为:lchildDatarchild第第3 3章章 非线性数据结构非线性数据结构 其中,lchild是左指针域,指向结点的左子树的根;da
16、ta是数据域;rchild是右指针域,指向结点的右子树的根。这种存储结构又称为二叉链表。在二叉链表中,我们可以比较方便地从某个结点出发,找到它的一个子结点,但如果要从某个结点找其父结点就比较麻烦了。有时为便于找到结点的双亲,还可增加一个指向其双亲的指针域(parent),其结点结构如下:lchilddataparentrchild第第3 3章章 非线性数据结构非线性数据结构 由这种结点结构所得的二叉树存储结构称为三叉链表。另外,还需设一个指针T指向树的根。若树为空,则T=NULL,否则T指向树的根。例3-3 画出给定二叉树的二叉链表和三叉链表存储结构。结果如图3-11所示。第第3 3章章 非线
17、性数据结构非线性数据结构 CBFEDA(a)(b)ABCDEFT(c)ABCDEFT图3-11 二叉树及其链表存储结构第第3 3章章 非线性数据结构非线性数据结构 3.3 二叉树的遍历二叉树的遍历 遍历二叉树就是按一定的次序,系统地访问树中的所有结点,使每个结点恰好被访问一次。所谓访问结点,其含义是很广的,可以理解为对结点的增、删、修改等各种运算的抽象。在本节讨论中,假定访问结点即为输出结点数据域值。二叉树的遍历是最重要和最基本的运算,二叉树的许多操作都是以遍历为基础的。第第3 3章章 非线性数据结构非线性数据结构 遍历二叉树的过程实际上就是按某种规律把二叉树的结点排成一个线性序列。由于二叉树
18、是非线性结构,它的每个结点都可能有两个分支,也就是说一个结点可能有两个后继,所以,二叉树的遍历比较复杂,按照不同规则遍历得到的结果也就不同。令L、D、R分别表示遍历左子树、访问根结点和遍历右子树,则对二叉树的遍历有六种规律:DLR、LDR、LRD、DRL、RDL、RLD。若规定先左后右,则只有三种方案:DLR、LDR和LRD,按照访问根的先后,分别称之为二叉树的先序(根)遍历,中序(根)遍历和后序(根)遍历。第第3 3章章 非线性数据结构非线性数据结构 基于二叉树的递归定义,可得下述遍历二叉树的递归算法定义。二叉树的三种遍历方式:(1)先序遍历:若二叉树为空,则空操作;否则 访问根结点;先序遍
19、历左子树;先序遍历右子树。第第3 3章章 非线性数据结构非线性数据结构 (2)中序遍历:若二叉树为空,则空操作;否则 中序遍历左子树;访问根结点;中序遍历右子树。(3)后序遍历:若二叉树为空,则空操作;否则 后序遍历左子树;后序遍历右子树。访问根结点;第第3 3章章 非线性数据结构非线性数据结构 二叉链表的C语言描述如下:struct tnode int data;struct tnode*lchild,*rchild;typedef struct tnode TNODE;根据先序遍历的定义,先序遍历二叉树的递归算法如下:第第3 3章章 非线性数据结构非线性数据结构 算法3-1 先序遍历根结点
20、指针为bt的二叉树。void preorder(TNODE*bt)if(bt!=NULL)printf(%d n,bt-data);preorder(bt-lchild);preorder(bt-rchild);第第3 3章章 非线性数据结构非线性数据结构 根据中序遍历的定义,中序遍历二叉树的递归算法如下:算法3-2 中序遍历根结点指针为bt的二叉树。void inorder(TNODE*bt)if(bt!=NULL)inorder(bt-lchild);printf(%d n,bt-data);inorder(bt-rchild);第第3 3章章 非线性数据结构非线性数据结构 根据后序遍历的
21、定义,后序遍历二叉树的递归算法如下:算法3-3 后序遍历根结点指针为bt的二叉树。void postorder(TNODE*bt)if(bt!=NULL)postorder(bt-lchild);postorder(bt-rchild);printf(%d n,bt-data);第第3 3章章 非线性数据结构非线性数据结构 下面重点以中序遍历为例,讨论二叉树的非递归遍历算法。利用一个辅助堆栈S,可以写出中序遍历二叉树的非递归算法。算法3-4 中序遍历bt所指二叉树,s为存储二叉树结点指针的工作栈。Step1.初始化 置堆栈s为空,设置临时指针变量p(btp);Step2.判定p=NULL 若p
22、=NULL,则执行Step4;第第3 3章章 非线性数据结构非线性数据结构 Step3.P进栈 将p指针入栈,然后置p=p-lchild,返回Step2;Step4.取栈顶元素,并退栈 若栈s为空,则算法结束,否则,将栈顶元素置指针变量P;Step5.访问结点p 访问结点P,然后置p=p-rchild,并返回Step2。如果设定栈s采用顺序存储结构,则可给出C语言描述如下。第第3 3章章 非线性数据结构非线性数据结构#define N m/*m为二叉树的结点个数*/void inorderf(TNODE*pt)TNODE *p;TNODE*sN;int top=1;p=bt;while(p!=
23、NULL)|(top!=1)第第3 3章章 非线性数据结构非线性数据结构 while(p!=NULL)top+;stop=p;p=p-lchild;if(top!=1)第第3 3章章 非线性数据结构非线性数据结构 p=stop;top;printf(%dn,p-data);p=p-rchild;第第3 3章章 非线性数据结构非线性数据结构 分析此算法的运算量,假定二叉树T有n个结点,每个结点都要入栈和出栈一次。因此,入栈和出栈都要执行n次,对结点的访问当然也需执行n次。这样,中序遍历二叉树算法的时间复杂度为O(n)。同理,只要改变对结点的访问位置,就可以容易地写出先序遍历二叉树的非递归算法。二
24、叉树后序遍历的非递归算法要复杂一些,每个结点都要经过进栈出栈进栈出栈这样两个重复过程。第一次出栈是为了能访问右子树,第二次出栈才是访问结点本身。有兴趣的读者可以参阅有关书籍。第第3 3章章 非线性数据结构非线性数据结构 例3-4 如图3-12所示的二叉树表示下述表达式:a+b*ce/f 试写出它的三种遍历序列。解:先序遍历二叉树,按访问结点的先后次序将结点排列起来,可得先序遍历序列为:+a*bc/ef中序遍历序列为:a+b*ce/f第第3 3章章 非线性数据结构非线性数据结构 后序遍历序列为:abc*+ef/从表达式来看,以上三个序列恰好为表达式的前缀表示(波兰式)、中缀表示和后缀表示(逆波兰
25、式)。第第3 3章章 非线性数据结构非线性数据结构 /a*efbc图3-12 二叉树 第第3 3章章 非线性数据结构非线性数据结构 3.4 树的存储结构和遍历树的存储结构和遍历 树在计算机内存储,可以用顺序存储方式、也可以用链式存储方式,这主要取决于要对树结构进行什么运算。这里主要介绍链式分配的存储结构。树的链式分配也有几种不同的方式。从结点指针域的个数是否固定来区分,可分为定长结点和不定长结点两种;从一个结点的各指针域存放的指针值的性质来区分,可以分为指向其所有孩子的多重链表和指向长子(最左边的孩子)及次弟(右邻的兄弟)的二叉链表,下面只介绍二叉链表。第第3 3章章 非线性数据结构非线性数据
26、结构 1二叉链表表示法 二叉链表表示法又称二叉树表示法,或孩子兄弟表示法。即以二叉链表作为树的存储结构。链表中结点的两个指针域分别指向该结点的第一个孩子和下一个兄弟结点。图3-13是一棵树,该树的二叉链表如图3-14所示。利用这种存储结构便于实现各种树的操作,首先易于实现找结点孩子等的操作,如果再为每个结点增设一个PARENT域,则同样能方便地实现求某结点双亲的操作。第第3 3章章 非线性数据结构非线性数据结构 ABCDHEGIF图3-13 树第第3 3章章 非线性数据结构非线性数据结构 ABCEDFHGI图3-14 图3-13中树的二叉链表第第3 3章章 非线性数据结构非线性数据结构 2树的
27、遍历 树的遍历有两种次序:一种是先序遍历树;另一种是后序遍历树。(1)先序遍历树:先访问树的根结点,然后从左到右依次先序遍历根的每棵子树。如先序遍历图3-13所示的树,得到的结点序列为:A B D E G H I C F。(2)后序遍历树:先从左到右依次后根遍历每棵子树,然后访问根结点。如后序遍历图3-13所示的树,得到的结点序列为:D G H I E B F C A。第第3 3章章 非线性数据结构非线性数据结构 3.5 树、森林与二叉树的转换树、森林与二叉树的转换 由于二叉树和树都可用二叉链表作为存储结构,则以二叉链表作为媒介可导出树与二叉树之间的一个对应关系。也就是说,给定一棵树,可以找到
28、惟一的一棵二叉树与之对应,从物理结构来看,它们的二叉链表是相同的,只是解释不同而已。图3-15给出了树与二叉树之间的对应关系。第第3 3章章 非线性数据结构非线性数据结构 ABCDEABEDC树对应二叉树存储存储ABCDEECBDABCEDA解释解释图3-15 树与二叉树的对应关系第第3 3章章 非线性数据结构非线性数据结构 下面给出树与二叉树之间的转换规则。1一般树转换为二叉树 步骤:(1)加线:亲兄弟之间加一虚连线。(2)抹线:抹掉(除最左一个孩子外)该结点到其余孩子之间的连线。(3)旋转:新加上去的虚线改实线且均向右斜(rchild),原有的连线均向左斜(lchild)。第第3 3章章
29、非线性数据结构非线性数据结构 例3-5 将图3-16(a)所示的一般树转换为二叉树。解:转换过程如图3-16(a)、(b)、(c)、(d)所示。将一棵由一般树转换来的二叉树还原为一般树的过程是上述过程的逆过程。第第3 3章章 非线性数据结构非线性数据结构 ABECFGDHAECFGHDB(a)(b)AECFGHDB(c)AECFGDHB(d)图3-16 一般树转换为二叉树的操作过程(a)一般树;(b)加线后;(c)抹线后;(d)旋转后第第3 3章章 非线性数据结构非线性数据结构 2森林转换为二叉树 森林是树的有限集合,利用树的转换思想,可以实现森林到二叉树的转换。步骤:(1)将各棵树分别转换为
30、二叉树。(2)按给出森林中树的次序,依次将后一棵二叉树作为前一棵二叉树根结点的右子树,则第一棵树的根结点是转换后二叉树的根。第第3 3章章 非线性数据结构非线性数据结构 如果想将一棵由森林转换得到的二叉树还原为森林,则可采用上述过程的逆过程来实现。例3-6 将图3-17(a)的森林转换成二叉树。解:转换过程如图3-17(b)、(c)所示。第第3 3章章 非线性数据结构非线性数据结构 GFEKJIHABCD(a)AGFED(b)ABCDGFEKIHJ(c)BKJHCI图3-17 森林转换成对应的二叉树的过程(a)森林;(b)各棵树对应的二叉树;(c)转换成的二叉树第第3 3章章 非线性数据结构非
31、线性数据结构 3.6 霍夫曼树及其应用霍夫曼树及其应用 霍夫曼树(Huffman Tree),又称最优树,是一类带权路径长度最短的树,有着广泛的应用。1树的路径长度和带权路径长度 结点间的路径长度:从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径,路径上的分支数称为这两个结点之间的路径长度。第第3 3章章 非线性数据结构非线性数据结构 树的路径长度:从树根到树中每一个结点的路径长度之和称为树的路径长度,一般记作PL。如图3-18所示的两棵二叉树,其路径长度分别计算如下:(a)PL=0+1+1+2+2+2+2+3=13 (b)PL=0+1+1+2+2+2+3=11第第3 3章章 非线
32、性数据结构非线性数据结构 187654321765432(a)(b)图3-18 二叉树的路径长度计算(a)PL=13;(b)PL=11第第3 3章章 非线性数据结构非线性数据结构 容易知道,对于有n个结点的所有二叉树而言,满二叉树或者完全二叉树具有最小的路径长度。我们把路径长度的概念推广到带权的路径长度(Weighted Path Length)。所谓带权是给树的每个终端结点赋以权值,则树的带权路径长度为WPL=n1iiiLW第第3 3章章 非线性数据结构非线性数据结构 其中,n为树的终端结点个数;Wi为第i个终端结点的权值;Li为从根结点到第i个终端结点的路径长度。在图3-19中的三棵二叉树
33、,都有四个终端结点,其权值分别为8、6、4、2,则它们的带权路径长度分别为 (a)WPL=2*2+4*2+6*2+8*2=40 (b)WPL=4*2+6*3+8*3+2*1=52 (c)WPL=8*1+6*2+4*3+2*3=38第第3 3章章 非线性数据结构非线性数据结构 由此可见,带权路径长度最小的二叉树不一定是完全二叉树。通常,在带权路径长度最小的二叉树中,权值越大的终端结点离二叉树的根越近。第第3 3章章 非线性数据结构非线性数据结构 246824688642(a)(b)(c)图3-19 具有不同带权路径长度的二叉树第第3 3章章 非线性数据结构非线性数据结构 2霍夫曼树和霍夫曼编码
34、一般地,假设有一组权值W1,W2,Wn,如何构造有n个叶子结点的二叉树,使各个叶子结点的权值分别为Wi(i=1,2,3,n),且其带权路径长度WPL为最小,这是一个很有实际意义的问题。霍夫曼在1952年首先提出了一个带有一般规律的算法,很好地解决了这个问题,因此人们把这种具有最小带权路径长度的二叉树称为霍夫曼树或者最优二叉树,相应的算法称为霍夫曼算法。该算法思想是:第第3 3章章 非线性数据结构非线性数据结构 (1)设给定的一组权值为W1,W2,Wn,据此生成森林F=T1,T2,Tn,F中的每棵二叉树Ti只有一个带权为Wi的根结点(i=1,2,n)。(2)在F中选取两棵根结点的权值最小和次小的
35、二叉树作为左、右子树构造一棵新的二叉树,新二叉树根结点的权值为其左、右子树根结点的权值之和。第第3 3章章 非线性数据结构非线性数据结构 (3)在F中删除这两棵权值最小和次小的二叉树,同时将新生成的二叉树并入森林F中。(4)重复(2)和(3),直到F中只有一棵二叉树为止。例如,给定一组权值2,7,4,8,图3-20给出了构造相应霍夫曼树的过程。第第3 3章章 非线性数据结构非线性数据结构 2748786248624137862413217(a)(b)(c)(d)图3-20 霍夫曼树的构造过程第第3 3章章 非线性数据结构非线性数据结构 霍夫曼树的应用很广,在不同的应用中叶子结点的权值可以有不同
36、的解释。霍夫曼树应用到信息编码中,权值可看成是某个符号出现的频率;应用到判定过程中,权值可看成是某类数据出现的频率;应用到排序过程中,权值可看成是已排好次序而待合并的序列的长度等。第第3 3章章 非线性数据结构非线性数据结构 下面简单地介绍一下霍夫曼树在信息通信中的应用不等长二进制前缀编码。在信息通信技术中,我们通常采用以二进制的0、1序列来传送通信信息。在发送端,必须将需传送的信息转换成二进制的0、1序列,然后通过调制解调器将二进制序列发送出去;在接收端,必须将接收到的0、1序列还原成相应的信息。在信息通信中,我们通常以字符传送为主。众所周知,字符集中的每个字符使用的频率是不等的。如果能让使
37、用频率较高的字符的编码尽可能短,这样就可以缩短整个信息通信过程中所需传送的二进制编码序列的长度,从而达到节省通信资源的目的。第第3 3章章 非线性数据结构非线性数据结构 设D=d1,d2,dn 为需要编码的字符集合。又设Wi为di在文本中出现的次数,现要求对D进行二进制编码。解决此问题的方法就是以Wi为权值构造霍夫曼树。在生成的霍夫曼树中,令所有的左分支取编码为0,令所有的右分支取编码为1,将从根结点出发到叶子结点的路径上各左、右分支的编码顺序排列就得到了该叶子结点所对应的字符的二进制前缀编码,该编码也称为霍夫曼编码。第第3 3章章 非线性数据结构非线性数据结构 例如,给出下面一个文本:CAS
38、T CATS SAT AT A TASA 则有D=C,A,S,T、W=2,7,4,5,构成的霍夫曼树如图3-21所示。由此得到D中每个字符的二进制前缀编码为 C:110S:111 A:0 T:10第第3 3章章 非线性数据结构非线性数据结构 图3-21 霍夫曼树应用于编码576241118010101第第3 3章章 非线性数据结构非线性数据结构 可以看出,出现次数最多的字符,其编码位数最少。相应文本的编码为 110011110 110010111111010 0100 1001110 这种编码的优点是:(1)对于给出的文本,其编码长度是最短的;(2)任一字符的编码均不可能是另一字符编码的开始部
39、分(前缀)。这样,两个字符之间就不需要分隔符,但是,两个词之间仍需要留空格,以起到分隔作用。第第3 3章章 非线性数据结构非线性数据结构 这种编码的缺点是:每个字符的编码长度不相等,译码时较困难。关于信息的编码还应考虑其它一些因素,如检测和纠错的能力等。总之,编码理论在它自己的领域里还有许多问题。这里仅是对霍夫曼树的应用举了一个简单的例子。第第3 3章章 非线性数据结构非线性数据结构 3.7 图及其基本概念图及其基本概念 图是一种重要的,比树更复杂的非线性数据结构。在树中,每个结点只与上层的父结点有联系,并可以与其下层的多个子结点有联系。但在图中,结点之间的联系是任意的,每个结点都可以与其它的
40、结点相联系。图的应用极为广泛,特别是近年来发展迅速,已渗入到诸如语言学、逻辑学、物理、化学、电信工程、计算机、数学及其它分支中。第第3 3章章 非线性数据结构非线性数据结构 图3-22 有向图示例1324G1第第3 3章章 非线性数据结构非线性数据结构 下面介绍图的一些常用的基本术语。(1)图。图G由两个集合V(G)和E(G)所组成,记作G=(V,E)。其中,V(G)是图中顶点的非空有限集合,E(G)是图中边的有限集合。(2)有向图。如果图中每条边都是顶点的有序对,即每条边都用箭头表明了方向,则此图为有向图。有向图中的边也称为弧,用尖括号括起一对顶点表示。第第3 3章章 非线性数据结构非线性数
41、据结构 图3-23 无向图示例1234G2第第3 3章章 非线性数据结构非线性数据结构 如图3-22所示G1为有向图,它由V(G1)和E(G1)组成。V(G1)=V1,V2,V3,V4E(G1)=,如其中弧,称V1为初始点或弧之尾,V2为终端点或弧之头。第第3 3章章 非线性数据结构非线性数据结构 (3)无向图。如果图中每条边都是顶点的无序对,则称此图为无向图。无向边用圆括号括起的两个相关顶点来表示。如图3-23所示的G2为无向图。V(G2)=V1,V2,V3,V4 E(G2)=(V1,V2),(V1,V3),(V3,V4),(V4,V1)注意,在无向图中,(V1,V2)与(V2,V1)表示同
42、一条边。第第3 3章章 非线性数据结构非线性数据结构 (4)子图。设有两个图GA和GB,且满足 V(GB)V(GA)E(GB)E(GA)则称GB是GA的子图。如图3-24所示。第第3 3章章 非线性数据结构非线性数据结构 132112132132G3G3的子图 图3-24 图与子图 第第3 3章章 非线性数据结构非线性数据结构 14235915251030 图3-25 网(带权图)第第3 3章章 非线性数据结构非线性数据结构 (5)带权图。在图的边或弧上加上一个相关联的数(权),称为带权图或网。如图3-25所示。(6)路径。图中一个顶点的序列称路径。如v到v的路径为(V=Vi0,Vi1,Vi2
43、,Vin=V),并且都属于集合E。路径上弧的数目称为该路径的长度。第第3 3章章 非线性数据结构非线性数据结构 在无向图中,若每一对顶点之间都有路径,则称此图为连通图。在有向图中,若每一对顶点u和v之间都存在v到u及u到v的路径,则称此图为强连通图。(7)邻接点。在无向图中,如果边(u,v)E,则u和v互为邻结点,即u是v的邻结点,v也是u的邻结点。在有向图中,如果弧E,则v是u的邻结点。称u邻接到v,或顶点v邻接自顶点u。第第3 3章章 非线性数据结构非线性数据结构 (8)顶点的度。在无向图中,顶点的度就是和该顶点相关联的边的数目,记为TD(V)。如图3-23中,TD(V3)=2。在有向图中
44、,以某顶点为弧头的弧的数目,称为此顶点的入度,记作ID(V);以某顶点为弧尾的弧的数目称为此顶点的出度,记作OD(V)。该顶点的度则是此顶点的入度与出度之和。如图3-24中G3,ID(V2)=1,OD(V2)=2,TD(V2)=ID(V2)+OD(V2)=3。第第3 3章章 非线性数据结构非线性数据结构 3.8 图的存储结构图的存储结构 图的结构比较复杂,存储的方法也很多,需要根据具体的图形和将来所要做的运算选取适当的存储结构。这里只讨论两种最常用的表示方法:邻接矩阵表示法和邻接表表示法。第第3 3章章 非线性数据结构非线性数据结构 3.8.1 邻接矩阵 根据图的定义可知,一个图的逻辑结构分两
45、部分,一部分是组成图的顶点的集合;另一部分是顶点之间的联系,即边或弧的集合。因此,在计算机中存储图只要解决对这两部分的存储表示即可。第第3 3章章 非线性数据结构非线性数据结构 可用一个一维数组存放图中所有顶点的信息;用一个二维数组来存放数据元素之间的关系的信息(即边或弧的集合E)。这个二维数组称之为邻接矩阵。邻接矩阵是表示顶点之间的邻接关系的矩阵。设G=(V,E)是有n(n1)个顶点的图,则G的邻接矩阵A是一个具有下列性质的nn阶矩阵ijij1 (V,V)V,VE(G)Ai,j0 反之若若第第3 3章章 非线性数据结构非线性数据结构 在一般情况下,我们不关心图中顶点的情况,若将顶点编号为1V
46、txnum,设弧上或边上无权值,则图的存储结构可以简化为用一个二维数组表示:int adjmatrixvtxnumvtxnum;如图3-23中的G2和图3-24中的G3,其邻接矩阵分别如图3-26中A2、A3所示。第第3 3章章 非线性数据结构非线性数据结构 0111100010011010A2010100A3010图3-26 图G2和G3的邻接矩阵第第3 3章章 非线性数据结构非线性数据结构 借助于邻接矩阵,可以很容易地求出图中顶点的度。从上例可以很容易看出,邻接矩阵有如下结论:(1)无向图的邻接矩阵是对称的,而有向图的邻接矩阵不一定对称。对无向图可考虑只存下三角(或上三角)元素。(2)对于
47、无向图,邻接矩阵第i行(或第i列)的元素之和是顶点Vi的度。(3)对于有向图,邻接矩阵第i行元素之和为顶点Vi的出度;第i列的元素之和为顶点Vi的入度。第第3 3章章 非线性数据结构非线性数据结构 网的邻接矩阵可定义为ijijijW (V,V)V,VE(G)Ai,j 反之若或其中Wij是边(Vi,Vj)或弧上的权值。第第3 3章章 非线性数据结构非线性数据结构 3.8.2 邻接表 邻接表是一种顺序分配和链式分配相结合的存储结构。它包括两个部分:一部分是链表;另一部分是向量。在邻接表中,对图中每个顶点建立一个单链表,第i个单链表中的结点包含了顶点Vi的所有邻接顶点。每个结点由三个域组成:adjv
48、ex、data和nextarc,如图3-27所示。第第3 3章章 非线性数据结构非线性数据结构 adjvexdatanextarc指向顶点Vi的下一邻接点的指针权值顶点Vi的邻接点在图中的位置图3-27 邻接表中表结点的结点结构第第3 3章章 非线性数据结构非线性数据结构 为便于邻接表操作,在每个单链表上附设一个头结点,在头结点中有两个域:vexdata和firstarc。如图3-28所示。vexdata firstarc指向Vi的第一个邻接点的指针存储Vi的名字或有关信息图3-28 邻接表中头结点的结点结构 第第3 3章章 非线性数据结构非线性数据结构 为了利用顺序存储结构的随机访问特性,邻
49、接表中将每个单链表的头结点以顺序结构的形式存储,以便能随机访问任一顶点的单链表。邻接表的存储结构可以用C语言描述如下:#define VTXUNMn /*n为图中顶点个数的最大可能值*/第第3 3章章 非线性数据结构非线性数据结构 struct arcnode int adjvex;float data;struct arcnode*nextarc;typedef struct arcnode ARCNODE;struct headnode int vexdata;ARCNODE*firstarc;adjlistVTXUNM;第第3 3章章 非线性数据结构非线性数据结构 对于图3-29中的图G
50、4和图3-30中的图G5,其邻接表存储结构如图3-29(b)和图3-30(b)所示。231231437ABCABC734(a)(b)图3-29 有向带权图及其邻接表第第3 3章章 非线性数据结构非线性数据结构 42123123124(a)(b)3413412412343图3-30 无向图及其邻接表 第第3 3章章 非线性数据结构非线性数据结构 在邻接表上容易找到任一顶点的第一个邻接点和下一个邻接点,但要判定任意两个顶点(Vi和Vj)之间是否有边或弧相连,则需搜索第i个或第j个链表,因此不及邻接矩阵方便。对一个图来说,邻接表不是惟一的,它取决于建立邻接表时,结点在每个单链表中的插入策略。另外,对