1、二叉树及其应用雅礼 朱全民二叉树二叉树是一种特殊的树型结构,它的特点是每个节点至多只有两个子节点。二叉树每个节点的子树有左右之分,其次序不能任意颠倒。二叉树也有特殊形式,例如满二叉树、完全二叉树等。例如右图就是一棵二叉树,并且是一棵完全二叉树。二叉树的存储结构常用的存储结构 type bitree=node node=record data:datatype;lchild,rchild:bitree;end;二叉树的遍历遍历(先序遍历,中序遍历,后序遍历)Proc preorder(bt:bitree);if btNil then visit(bt)preorder(bt.lchild);pr
2、eorder(bt.rchild);endP二叉树的性质在二叉树的第i层上最多有2i-1个结点深度为K的二叉树最多有2k-1个结点在二叉树中,叶子结点的总数总比为度数为2的结点多1有n个结点的完全二叉树的结点按层序编号,则对任意一结点i,有(1)如果i=1,则结点i是二查树的根,无双亲;如果i1,则双亲是i/2(2)如果2in,则结点i无左孩子,否则左孩子为2i(3)如果2i+1n,则结点i无右孩子,否则右孩子为2i+1树、森林转化为二叉树用用“孩子兄弟表示法孩子兄弟表示法”可以将任意一棵树转化为二可以将任意一棵树转化为二叉树的形式叉树的形式 森林转化为二叉树森林转化为二叉树 如果如果F=T1
3、,T2,Tm是森林,则可按如下规则转是森林,则可按如下规则转化为一棵二叉树。化为一棵二叉树。1)若若F为空,即为空,即m=0,则则B为空树为空树 2)若若F非空,即非空,即m0,则则B的根的根root即为森林中第一即为森林中第一棵树的根棵树的根root(T1),B的左子树为从的左子树为从T1中子树森林中子树森林F1=T11,T12,T1i转换而成的二叉树;其右子树转换而成的二叉树;其右子树Rb 是从森林是从森林F=T2,Tm中转换出来的二叉树中转换出来的二叉树树的儿子兄弟表示法在一棵树中,拥有同一个父结点的结点互称为兄弟兄弟。我们不妨假设树中每个结点的子结点是有序的(就像二叉树一样),则我们可
4、以将一棵树这样转化成二叉树:二叉树中每个结点对应原树的每个结点对于二叉树中的某个结点它的左子结点对应原树中该结点的第一个子结点;它的右子结点对应原树中该结点的下一个兄弟。原树转化后的树树的儿子兄弟表示法这样我们可以类似于二叉树的链式结构写出树的儿子兄弟表示法的存储结构:TYPE tree=node;node=record data :datatype;parent,child,brother :tree;/分别记录父亲、第一个儿子、下一个兄弟 end;树的儿子兄弟表示法给定给定m个实数个实数w1,w2,wm,(m=2),要求一个具有要求一个具有m个外个外部节点的扩充二叉树,每个外部部节点的扩充
5、二叉树,每个外部ki节点有一个节点有一个wi与之对应,与之对应,作为它的权作为它的权,使得带权外部路径长度使得带权外部路径长度 最小,其中最小,其中li是从根到外部节点的路径长度。是从根到外部节点的路径长度。最优二叉树(哈夫曼树)miiilw1算法1.构造m个只有1个节点的树2.找两个最小的权3.以这两个节点为左右儿子构造一个二叉树,并将该数的根节点权之为左右儿子权值之和4.继续第二步,直到剩下一棵树为止讨论最优最优k叉树就是指在一个节点最多可以有叉树就是指在一个节点最多可以有k个叶子节个叶子节点的时候,假设有点的时候,假设有n(n=k)个权值)个权值w1,w2,.wn,试构造出一棵有个叶子节
6、点的试构造出一棵有个叶子节点的k叉树。每个叶子节点有一个不同的权值叉树。每个叶子节点有一个不同的权值i。其中。其中树的带权路径长度最小的那棵树叫做最优树的带权路径长度最小的那棵树叫做最优k叉树。叉树。怎么构造怎么构造?分析最优最优k叉树必须具备的性质:叉树必须具备的性质:每个节点如果不是叶子节点,那么一定有每个节点如果不是叶子节点,那么一定有k个儿子个儿子节点。节点。权值大的节点不能在比权值小的节点下方。就是权值大的节点不能在比权值小的节点下方。就是权值大的节点到树根的长度要小于等于权值小的权值大的节点到树根的长度要小于等于权值小的节点到树根的长度。节点到树根的长度。算法根据给定的根据给定的n
7、个权值个权值wl,w2,wn构成构成n棵棵k叉叉树的森林树的森林F=T1,T2,Tn,其中每棵,其中每棵k叉树叉树Ti中都只有一个权值为中都只有一个权值为wi的根结点,其左右子树的根结点,其左右子树均空。均空。在森林在森林F中选出中选出k棵根结点权值最小的树棵根结点权值最小的树(当这样的当这样的树不止树不止k棵树时,可以从中任选棵树时,可以从中任选k棵棵),将这,将这k棵树棵树合并成一棵新树,为了保证新树仍是合并成一棵新树,为了保证新树仍是k叉树,需要叉树,需要增加一个新结点作为新树的根,并将所选的增加一个新结点作为新树的根,并将所选的k棵树棵树的根分别作为新根的左右孩子,将这的根分别作为新根
8、的左右孩子,将这k个孩子的权个孩子的权值之和作为新树根的权值。值之和作为新树根的权值。对新的森林对新的森林F重复重复(2),直到森林,直到森林F中只剩下一棵树中只剩下一棵树为止。这棵树便是最优为止。这棵树便是最优k叉树。叉树。反例假设假设k=3,当当n=5时,这样做是对的。但是当时,这样做是对的。但是当n=4时,时,用刚才的方法得到的用刚才的方法得到的“最优最优3叉树叉树”,但是,明显,但是,明显右图的那颗树会比左图的那颗树优。右图的那颗树会比左图的那颗树优。分析原因错误的原因:主要是左边的这棵树它并没有排满。可以错误的原因:主要是左边的这棵树它并没有排满。可以把第把第3层的一个节点拉到第层的
9、一个节点拉到第2层去,而这样做肯定会让层去,而这样做肯定会让WPL更小。更小。那么肯定要让第一次合并的时候,少合并几个点,后面那么肯定要让第一次合并的时候,少合并几个点,后面的操作就和上面所说得算法一样。并且让最后一次合并的操作就和上面所说得算法一样。并且让最后一次合并能合并能合并n棵树。从而让上面排满。棵树。从而让上面排满。那么第一次要合并多少个点呢?那么第一次要合并多少个点呢?首先每次合并会让树的总数减少首先每次合并会让树的总数减少k-1棵,而最后还有棵,而最后还有n棵。棵。那么完成了第一次合并后,剩下的树的个数正好模那么完成了第一次合并后,剩下的树的个数正好模k-1后等于后等于1。那么第
10、一次合并的树的个数就应该是。那么第一次合并的树的个数就应该是(n-2)mod(k-1)+2。而当而当k=2时,时,k-1=1,此时第一次合并的个数总是为,此时第一次合并的个数总是为2。改进算法根据给定的根据给定的n个权值个权值wl,w2,wn构成构成n棵棵k叉树的森林叉树的森林F=T1,T2,Tn。其中每棵。其中每棵k叉树叉树Ti中都只有一个权中都只有一个权值为值为wi的根结点,其左右子树均空。进行第一次合并操作的根结点,其左右子树均空。进行第一次合并操作选出最小的选出最小的(n-2)mod(k-1)+2颗根节点权值最小的树进行合颗根节点权值最小的树进行合并成一棵新树并成一棵新树,该树根的权值
11、为选出来的树的权值之和。该树根的权值为选出来的树的权值之和。在森林在森林F中选出中选出k棵根结点权值最小的树棵根结点权值最小的树(当这样的树不止当这样的树不止k棵树时,可以从中任选出棵树时,可以从中任选出k棵),将这棵),将这k棵树合并成一棵新棵树合并成一棵新树,为了保证新树仍是树,为了保证新树仍是k叉树,需要增加一个新结点作为新叉树,需要增加一个新结点作为新树的根,并将所选的树的根,并将所选的k棵树的根分别作为新根的孩子,将这棵树的根分别作为新根的孩子,将这k个孩子的权值之和作为新树根的权值。个孩子的权值之和作为新树根的权值。对新的森林对新的森林F重复重复(2),直到森林,直到森林F中只剩下
12、一棵树为止。这中只剩下一棵树为止。这棵树便是最优棵树便是最优k叉树。叉树。二叉堆定义定义堆是一棵完全二叉树,对于每一个非叶子结点,它堆是一棵完全二叉树,对于每一个非叶子结点,它的权值都不大于(或不小于)左右孩子的权值,我的权值都不大于(或不小于)左右孩子的权值,我们称这样的堆为小根堆(或大根堆)。们称这样的堆为小根堆(或大根堆)。描述如下描述如下:n个元素的序列个元素的序列k1,k2,kn,当且仅当满足,当且仅当满足 ki=k2i 并且并且 ki=k2i 并且并且 ki=k2i+1 二叉堆肯定是一颗完全二叉树二叉堆肯定是一颗完全二叉树在堆中插入元素x首先将元素首先将元素x放到堆中的最后一个位置
13、(即最放到堆中的最后一个位置(即最底层最右边的位置),然后不断地把底层最右边的位置),然后不断地把x往上调往上调整,直到整,直到x调不动为止(即大于它现在的父亲,调不动为止(即大于它现在的父亲,或者或者x处于根结点)。处于根结点)。定义一个堆:Var st:array1.maxn of longint;/存储堆 n:longint;/堆中元素个数13545 786213557864(1)将新节点插到最后将新节点插到最后(2)把新节点和父亲进行交换把新节点和父亲进行交换1557864(3)继续交换,直到重新满足堆的性质继续交换,直到重新满足堆的性质322插入(实际上是不断向上调整的过程)PROC
14、 heapup(k:longint);把第k个结点上调begin while k1 do begin i:=k div 2;i是k的父亲 if stistk then begin swap(i,k);k:=i;交换结点i和k end else exit;end;end;在堆中删除任意一个元素 这里说指的删除任意一个元素,是指在当前堆中位置为w的元素。过程如下:首先把位置w的元素和最后一个位置的元素交换,然后删去最后一个位置,这样w上的元素就被删除了。接着把位置w上的新元素不断下调,直到满足堆的性质。155786431557864315578634(1)当前要删除的节点是根节点的左儿子(2)将根
15、节点的左儿子和最后一个节点交换(3)将新的节点不断下调,直到满足堆的性质22插入(实际上是不断向上调整的过程)PROC heapdown(k:longint);把第k个结点往下调begin while k+k=n do begin i:=min 2k,2k+1;如果2k+1不存在直接返回k+k否则返回2个中间的值较小的元素 if stistk then begin swap(i,k);k:=i;end else exit end;end;堆的构造就是不断插入到堆的过程 62351分别插入权为分别插入权为6,2,3,5,1的元素的元素6(1)6(2)26(3)236(4)2356(5)2351堆
16、的插入.删除PROC add(x:longint);添加一个值为x的元素begin inc(n);stn:=x;up(n)end;PROC add(x:longint);添加一个值为x的元素begin inc(n);stn:=x;up(n)end;合并果子在一个果园里,多多已经将所有的果子打了下来,而且按果在一个果园里,多多已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。一堆。每一次合并,多多可以把两堆果子合并到一起,消耗的体力每一次合并,多多可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之
17、和。可以看出,所有的果子经过等于两堆果子的重量之和。可以看出,所有的果子经过n-1次合并之后,就只剩下一堆了。多多在合并果子时总共消耗次合并之后,就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所消耗体力之和。的体力等于每次合并所消耗体力之和。因为还要花大力气把这些果子搬回家,所以多多在合并果子因为还要花大力气把这些果子搬回家,所以多多在合并果子时要尽可能地节省体力。假定每个果子重量都为时要尽可能地节省体力。假定每个果子重量都为1,并且已,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使多多耗费的体力最少,并
18、输出这个最小的体的次序方案,使多多耗费的体力最少,并输出这个最小的体力耗费值。力耗费值。例如有例如有3种果子,数目依次为种果子,数目依次为1,2,9。可以先将。可以先将1、2堆合堆合并,新堆数目为并,新堆数目为3,耗费体力为,耗费体力为3。接着,将新堆与原先的第。接着,将新堆与原先的第三堆合并,又得到新的堆,数目为三堆合并,又得到新的堆,数目为12,耗费体力为,耗费体力为12。所。所以多多总共耗费体力以多多总共耗费体力=3+12=15。可以证明。可以证明15为最小的体力为最小的体力耗费值。耗费值。【输入文件】输入文件fruit.in包括两行,第一行是一个整数n(1=n=10000),表示果子的
19、种类数。第二行包含n个整数,用空格分隔,第i个ai(1=ai=20000)是第i个果子的数目。【输出文件】输出文件fruit.out包括一行,这一行只包含一个整数,也就是最小的体力耗费值。输入数据保证这个值小于231。【样例输入】31 2 9【样例输出】15【数据规模】对于30%的数据,保证有n=1000;对于50%的数据,保证有n=5000;对于全部的数据,保证有n=10000。合并果子合并果子把合成堆后的每堆的果子仍然看成相对独立的,那把合成堆后的每堆的果子仍然看成相对独立的,那么定义么定义timesi等于第等于第i堆果子被合并的次数,堆果子被合并的次数,ai为第为第i堆数字权值。则堆数字
20、权值。则 Totalcost=,目标求得是,目标求得是 minTotalcost。建立一棵二叉树,每堆果子分别为该树的叶节点,建立一棵二叉树,每堆果子分别为该树的叶节点,一种二叉树形态对应一种合并方案(一种二叉树形态对应一种合并方案(2堆果子合并堆果子合并则有共同父结点),所以该方案的则有共同父结点),所以该方案的Totalcost=depthi*vi,i是叶节点。解法是每次取出最小的两是叶节点。解法是每次取出最小的两个节点,并从节点集合中删除,然后合并这两点后个节点,并从节点集合中删除,然后合并这两点后再加入节点集合;重复,直到只剩一个节点;再加入节点集合;重复,直到只剩一个节点;niiiv
21、times1由于每次要取出最小的两个节点。(一般做法是每由于每次要取出最小的两个节点。(一般做法是每更新一次集合,重新排序,时间是更新一次集合,重新排序,时间是O(n2))。由)。由于于nTi而且jCi+1那么根据定理1,将K,i+1替换后肯定更优。于是得到了一个算法的基本流程:1.将任务按照Ti排序。2.从小到大枚举i。维护当前最优方案的集合U。每次将当前的任务I加入U后。如果不满足条件了,那么删去U中耗时最长的任务。3.输出最优方案即可。因此我们需要使用一种数据结构,它能快速删除耗时最长的任务,同时快速的插入一个新元素。显然,使用大根堆即能满足题目要求。二叉排序树(Binary Sort
22、Tree)二叉排序树又称为二叉查找(搜索)树(BST)它或者是一颗空树,或者是具有如下性质的二叉树:1)若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值2)若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值3)它左右子树分别为二叉排序树。BST的特点(1)二叉排序树中任一结点二叉排序树中任一结点x,其左,其左(右右)子树中任子树中任一结点一结点y(若存在若存在)的关键字必小的关键字必小(大大)于于x的关键字。的关键字。(2)二叉排序树中,各结点关键字是惟一的。实二叉排序树中,各结点关键字是惟一的。实际应用中,不能保证被查找的数据集中各元素的关际应用中,不能保证被查找的数据
23、集中各元素的关键字互不相同,所以可将二叉排序树定义中键字互不相同,所以可将二叉排序树定义中BST性性质质(1)里的里的小于小于改为改为大于等于大于等于,或将,或将BST性质性质(2)里的里的大于大于改为改为小于等于小于等于,甚至可同时修改这两,甚至可同时修改这两个性质。个性质。(3)按中序遍历该树所得到的中序序列是一个递按中序遍历该树所得到的中序序列是一个递增有序序列。增有序序列。实例BST的查找FUNC bstsrch(t:bitreptr;K:keytype):bitree if(t=nil)or(t.key=K)then return(t)else if t.keyK then retu
24、rn(bstsrch(t.lchild,k)else return(bstsrch(t.rchild,k)endFBST的插入在二叉排序树中插入新结点,要保证插入后仍满足在二叉排序树中插入新结点,要保证插入后仍满足BST性质。性质。其插入过程是:其插入过程是:(a)若二叉排序树若二叉排序树T为空,则为待插入的关键字为空,则为待插入的关键字key申请一个申请一个新结点,并令其为根;新结点,并令其为根;(b)若二叉排序树若二叉排序树T不为空,则将不为空,则将key和根的关键字比较:和根的关键字比较:(i)二者相等,则说明树中已有此关键字二者相等,则说明树中已有此关键字key,无须插入。,无须插入。
25、(ii)keyTkey,则将它插入根的右子树中。,则将它插入根的右子树中。子树中的插入过程与上述的树中插入过程相同。如此进行下子树中的插入过程与上述的树中插入过程相同。如此进行下去,直到将去,直到将key作为一个新的叶结点的关键字插入到二叉排作为一个新的叶结点的关键字插入到二叉排序树中,或者直到发现树中已有此关键字为止。序树中,或者直到发现树中已有此关键字为止。BST插入的递归算法PROC ins_bstree(var bst:bitree;k:keytp);采用链式存储结构 begin new(s);s.key:=k;s.lchild:=nil;s.rchild:=nil;if bst=ni
26、l then bst:=s;else if Kfkey then f.lchild:=s;else f.rchild:=send;BST的生成为进行不断插入的过程!但在生成BST的时候,可能会由于根结点选择不好,使得树很斜,查找的效率降低,可以使用随机产生根结点的方法,使得BST较平衡,下图就是两棵关键字相同的BST树.删除 分三种情况讨论1)删除叶子节点不破坏树的结构,修改其双亲结点:f.lchild:=NIL2)若只有左孩子Pl或者只有右孩子Pr,则只要令Pl或Pr直接为f的左孩子即可:f.lchild:=P.lchild;或者f.lchild:=P.rchild;3)左右孩子都有,设中序遍历的序列为ClC.QlQSlSPPrF,令P的左孩子为f的右孩子,而P的右孩子为S的右孩子 q:=p;s:=p.lchild;while srchildnil do q:=s;s:=s.rchild p.data:=s.data;if qp then q.rchild:=s.lchild else q.lchild:=s.lchild dispose(s)演讲完毕 谢谢观看2020