1、10.1 概述概述10.2 插入排序插入排序10.3 快速排序快速排序10.4 选择排序选择排序10.5 归并排序归并排序10.6 基数排序基数排序10.7 各种排序方法的综合比较各种排序方法的综合比较*1.了解排序的定义定义和各种排序方法的特点。2.熟悉各种方法的排序过程及其依据的原则方法的排序过程及其依据的原则。3.掌握各种排序方法的时间复杂度时间复杂度的分析方法。能从“关键字间的比较次数关键字间的比较次数”分析排序算法的平均平均情况和最坏最坏情况的时间性能。4.理解排序方法“稳定”或“不稳定”的含义,弄清楚在什么情况下要求应用的排序方法必须是稳定的。学习提要:学习提要:*重难点内容:重难
2、点内容:直接插入排序、折半插入排序、起泡排序、简单选择排序等排序方法的算法思想、实现和效率分析。希尔排序、快速排序、堆排序、归并排序等高效方法。*一、什么是排序一、什么是排序三、内部排序的方法三、内部排序的方法二、内部排序和外部排序二、内部排序和外部排序*一、什么是排序?一、什么是排序?排序是计算机内经常进行的一种操作,其目的是将一组“无序无序”的记录序列调的记录序列调整为整为“有序有序”的记录序列。例如:将下列关键字序列52,49,80,36,14,58,61,23,97,75调整为14,23,36,49,52,58,61,75,80,97*一般情况下,假设含n个记录的序列为 R1,R2,,
3、Rn 其相应的关键字序列为 K1,K2,,Kn 这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系:Kp1Kp2Kpn按此固有关系将上式记录序列重新排列为 Rp1,Rp2,,Rpn 的操作操作称作排序排序。*假设Ki=Kj(1i,jn,i j),且在排序前的序列中Ri领先于Rj(即ij)。若排序后的序列中Ri仍领先于Rj,则称所用的排序方法是稳定稳定的;反之,若可能排序后的序列中Rj领先于Ri,则称使用的排序方法是不稳不稳定定的。*例如:(14,36,49,49,52,80)排序后(52,49,80,36,14,49)排序前(14,36,49,49,52,80)稳定不稳定*二、内部
4、排序和外部排序二、内部排序和外部排序若整个排序过程不需要访问外存不需要访问外存便能完成,则称此类排序问题为内部排序内部排序;反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中 完成,则称此类排序问题为外部排序外部排序。*三、内部排序的方法三、内部排序的方法内部排序的过程是一个逐步扩大逐步扩大记录的有序序列长度有序序列长度的过程。经过一趟排序经过一趟排序有序序列区无 序 序 列 区有序序列区无 序 序 列 区*基于不同的“扩大扩大”有序序列长度的方法,内部排序方法方法,内部排序方法大致可分下列几种类型:插入类插入类交换类交换类选择类选择类 归并类归并类其它方法其它方法*1.插入类插
5、入类将无序子序列中的一个或几个记录“插入插入”到有序序列中,从而增加记录的有序子序列的长度。*2.交换类交换类通过“交换交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。*3.选择类选择类从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。*4.归并类归并类通过“归并归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。5.其它方法其它方法*待排记录的数据类型定义如下待排记录的数据类型定义如下:#define MAXSIZE 1000/待排顺序表最大长
6、度待排顺序表最大长度typedef int KeyType;/关键字类型为整数类型关键字类型为整数类型typedef struct KeyType key;/关键字项关键字项 InfoType otherinfo;/其它数据项其它数据项 RcdType;/记录类型记录类型typedef struct RcdType rMAXSIZE+1;/r0闲置闲置 int length;/顺序表长度顺序表长度 SqList;/顺序表类型顺序表类型*一、直接插入排序一、直接插入排序三、表插入排序三、表插入排序二、折半插入排序二、折半插入排序四、希尔(四、希尔(Shell)排序)排序*有序序列R1.i-1Ri
7、无序序列 Ri.n一趟插入排序的基本思想:有序序列R1.i无序序列 Ri+1.n*实现实现“一趟插入排序一趟插入排序”可分三步进行:可分三步进行:3将Ri 插入插入(复制)到Rj+1的位置上。2将Rj+1.i-1中的所有记录记录均后移后移 一个位置;1在R1.i-1中查找查找Ri的插入位置,R1.j.key Ri.key Rj+1.i-1.key;*一、直接插入排序一、直接插入排序利用“顺序查找顺序查找”实现“在R1.i-1中查找查找Ri的插入位置”算法的实现要点:算法的实现要点:*从Ri-1起向前进行顺序查找,监视哨设置在R0;R0=Ri;/设置“哨兵”循环结束表明Ri的插入位置为 j+1R
8、0jRifor(j=i-1;R0.keyRj.key;-j);/从后往前找j=i-1插入位置插入位置*对于在查找过程中找到的那些关键字不小于Ri.key的记录,并在查找的同时实现记录向后移动;for(j=i-1;R0.keyRj.key;-j);Rj+1=RjR0jRij=i-1上述循环结束后可以直接进行“插入”插入位置插入位置*第三趟排序后:(38,49,56)40,95例:例:待排序序列待排序序列(56,38,49,40,95)jijj404038495695key013245R564940第四趟排序后:(38,40,49,56)95*令 i=2,3,,n,实现整个序列的排序。for(i=
9、2;i=n;+i)if(Ri.keyRi-1.key)在 R1.i-1中查找Ri的插入位置;插入Ri;*void InsertionSort(SqList&L)/对顺序表 L 作直接插入排序。for(i=2;i=L.length;+i)if(L.ri.key L.ri-1.key)/InsertSortL.r0=L.ri;/复制为监视哨L.ri=L.ri-1;for(j=i-2;L.r0.key L.rj.key;-j)L.rj+1=L.rj;/记录后移L.rj+1=L.r0;/插入到正确位置*内部排序的时间分析时间分析:实现内部排序的基本操作基本操作有两个:(2)“移动移动”记录。(1)“比
10、较比较”序列中两个关键字的 大小;*对于直接插入排序:对于直接插入排序:最好最好的情况(关键字在记录序列中顺序有序):的情况(关键字在记录序列中顺序有序):“比较比较”的次数:最坏最坏的情况(关键字在记录序列中逆序有序):的情况(关键字在记录序列中逆序有序):“比较比较”的次数:112nni02)1)(4()1(2nnini“移动移动”的次数:“移动移动”的次数:2)1)(2(2nniniT(n)=O(n)稳定的稳定的*因为 R1.i-1 是一个按关键字有序的有序序列,则可以利用折半查找折半查找实现“在R1.i-1中查找查找Ri的插入位置”,如此实现的插入排序为折半插折半插入入排序。二、折半插
11、入排序二、折半插入排序*void BiInsertionSort(SqList&L)/BInsertSort在在 L.r1.i-1中折半查找插入位置;中折半查找插入位置;for(i=2;i=high+1;-j)L.rj+1=L.rj;/记录后移L.rhigh+1=L.r0;/插入*low=1;high=i-1;while(low=high)m=(low+high)/2;/折半if(L.r0.key L.rm.key)high=m-1;/插入点在低半区else low=m+1;/插入点在高半区*ilowhighmmlowlowmhighilowhighmhighmhighmlow例如例如:再如再
12、如:插入位置插入位置14 36 49 52 80 58 61 23 97 75L.r14 36 49 52 58 61 80 23 97 75L.r*折半插入排序时间分析时间分析:v时间复杂度:时间复杂度:折半插入排序比直接插入排序明显地减少了关键字间的“比较”次数,但记录“移动”的次数不变。T(n)=O(n)v空间复杂度:空间复杂度:S(n)=O(1)稳定的稳定的*三、表插入排序三、表插入排序 为了减少在排序过程中进行的“移动”记录的操作,必须改变排序过程中采用的存储结构。利用静态链表静态链表进行排序,并在排序完成之后,一次在排序完成之后,一次性地调整各个记录相互之间的位置性地调整各个记录相
13、互之间的位置,即将每个记录都调整到它们所应该在的位置上。*#define SIZE 100 /静态链表容量Typedef struct /表结点类型表结点类型 RcdType rc;/记录项 int next;/指针项SLNode;Typedef struct /静态链表类型静态链表类型 SLNode rSIZE;/0号单元为表头结点 int length;/链表当前长度SLinkListType;例如:例如:*void LInsertionSort(Elem SL,int n)/对记录序列SL1.n作表插入排序 SL0.key=MAXINT;SL0.next=1;SL1.next=0;for
14、(i=2;i=n;+i)for(j=0,k=SL0.next;SLk.key=SLi.key;j=k,k=SLk.next)SLj.next=i;SLi.next=k;/结点i插入在结点j和结点k之间/LinsertionSort*算法中使用了三个指针:其中:p指示第i个记录的当前位置 i指示第i个记录应在的位置 q指示第i+1个记录的当前位置如何在排序之后调整记录序列?如何在排序之后调整记录序列?例如:例如:*void Arrange(SLinkListType&SL,int n)p=SL.r0.next;/p指示第一个记录的当前位置 for(i=1;in;+i)while(pi)p=SL.
15、rp.next;q=SL.rp.next;/q指示尚未调整的表尾 if(p!=i)SL.rpSL.ri;/交换记录,使第交换记录,使第i个记录到位个记录到位 SL.ri.next=p;/指向被移走的记录指向被移走的记录 p=q;/p指示尚未调整的表尾,/为找第i+1个记录作准备 /Arrange*表插入排序时间分析:表插入排序时间分析:从表插入排序的过程表插入排序的过程可见,它的基本操作仍是将一个记录插入到已排好序的有序表中。和直接插入排序相比,不同之处是用修改2n次指针值代替移动记录,但比较次数相同。T(n)=O(n 2)重排记录的过程重排记录的过程,最坏的情况是每个记录到位都必须进行一次交
16、换,即移动3(n-1)次。稳定的稳定的*四、希尔排序(又称缩小增量排序)四、希尔排序(又称缩小增量排序)基本思想:基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。所谓“宏观”调整,指的是,“跳跃式”的插入排序。具体做法为:*将记录序列分成若干子序列,分别对每个子序列进行插入排序。其中,d 称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为 1。例如:例如:将 n 个记录分成 d 个子序列:R1,R1+d,R1+2d,R1+kd R2,R2+d,R2+2d,R2+kd Rd,R2d,R3d,Rkd,R(k+1)d*16 25 12 30 47 11 23 36 9 1
17、8 31 例如:第一趟希尔排序,设增量 d=511 23 12 9 18 16 25 36 30 47 31 第二趟希尔排序,设增量 d=39 18 12 11 23 16 25 31 30 47 36第三趟希尔排序,设增量 d=1 9 11 12 16 18 23 25 30 31 36 47 1 2 3 4 5 6 7 8 9 10 11*void ShellInsert(SqList&L,int dk)for(i=dk+1;i=n;+i)if(L.ri.key0&(L.r0.keyL.rj.key);j-=dk)L.rj+dk=L.rj;/记录后移,查找插入位置 L.rj+dk=L.r0
18、;/插入 /if/ShellInsert*void ShellSort(SqList&L,int dlta,int t)/增量为dlta的希尔排序 for(k=0;k1&flag=1;-i)flag=0;for(j=1;jL.rj+1.key)flag=1;x=L.rj;L.rj=L.rj+1;L.rj+1=x;结束条件为:最后一趟没有进行最后一趟没有进行“交换记录交换记录”。*起泡排序时间分析起泡排序时间分析:最好最好的情况(关键字在记录序列中的情况(关键字在记录序列中顺序有序顺序有序):):只需进行一趟起泡只需进行一趟起泡“比较比较”的次数:的次数:最坏最坏的情况(关键字在记录序列中的情况
19、(关键字在记录序列中逆序有序逆序有序):):需进行需进行n-1趟起泡趟起泡“比较比较”的次数:的次数:0“移动移动”的次数:的次数:“移动移动”的次数:的次数:n-12)1()1(2nnini2)1(3)1(32nnini稳定的稳定的*从起泡排序的过程可见,起泡排起泡排序序是一个增加有序序列长度增加有序序列长度的过程,也是一个缩小无序序列长度缩小无序序列长度的过程,每经过一趟起泡,无序序列的长度只缩小1。试设想,试设想,若能在经过一趟排序,使无序序列的长度缩小一半,则必能加快排序的速度。*二、一趟快速排序(一次划分)二、一趟快速排序(一次划分)目标:目标:找一个记录,以它的关键字作为“枢枢轴轴
20、”,凡其关键字小于枢轴关键字小于枢轴的记录均移动至移动至该记录之前该记录之前,反之,凡关键字大于枢轴关键字大于枢轴的记录均移动至该记录之后移动至该记录之后。致使一趟排序一趟排序之后,记录的无序序列L.r s.t将分割成两部分分割成两部分:L.r s.i-1和L.r i+1.t,且 L.rj.key L.r i.key L.r j.key (sji-1)枢轴枢轴 (i+1jt)。*p例例初始关键字:初始关键字:49 38 65 97 76 13 27 50 lhh 完成一趟排序:完成一趟排序:(27 38 13)49 (76 97 65 50)分别进行快速排序分别进行快速排序:(13)27 (3
21、8)49 (50 65)76 (97)快速排序结束:快速排序结束:13 27 38 49 50 65 76 974927lll4965h1349h4997h*int Partition(SqList&L,int low,int high)pivotkey=L.rlow.key;while(lowhigh)while(low=pivotkey)-high;L.rlow L.rhigh;while(lowhigh&L.rlow.key=pivotkey)+low;L.rlow L.rhigh;return low;/返回枢轴所在位置/Partition*int Partition(SqList&L
22、,int low,int high)/Partition L.r0=L.rlow;pivotkey=L.rlow.key;/枢轴 while(lowhigh)while(low=pivotkey)-high;/从右向左搜索L.rlow=L.rhigh;while(lowhigh&L.rlow.key=pivotkey)+low;/从左向右搜索L.rhigh=L.rlow;L.rlow=L.r0;return low;*三、快速排序三、快速排序 首先对无序的记录序列进行“一次划一次划分分”,之后分别分别对分割所得两个子序列“递归递归”进行快速排序进行快速排序。无 序 的 记 录 序 列无序记录子
23、序列(1)无序子序列(2)枢轴枢轴一次划分分别进行快速排序*void QSort(SqList&L,int low,int high)/对顺序表L中子序列L.rlow.high作快速排序 if(low high)/长度大于1 /QSort pivotloc=Partition(L,low,high);/对 L.rlow.high进行一次划分一次划分 QSort(L,low,pivotloc-1);/对低子序列递归排序,pivotloc是枢轴位置是枢轴位置 QSort(L,pivotloc+1,high);/对高子序列递归排序*void QuickSort(SqList&L)/对顺序表进行快速排
24、序 QSort(L,1,L.length);/QuickSort 第一次调用函数 Qsort 时,待排序记录序列的上、下界分别为 1 和 L.length。*快速排序的时间分析快速排序的时间分析:假设一次划分所得枢轴位置 i=k,则对n 个记录进行快排所需时间:其中 Tpass(n)为对 n 个记录进行一次划分所需时间。若待排序列中记录的关键字是随机分布的,则 k 取 1 至 n 中任意一值的可能性相同。T(n)=Tpass(n)+T(k-1)+T(n-k)*nkavgavgavgknTkTnCnnT1)()1(1)(设 Tavg(1)b则可得结果:)1ln()1)(22()(nncbnTav
25、g结论结论:快速排序的时间复杂度为快速排序的时间复杂度为O(nlogn)由此可得快速排序所需时间的平均值为:不稳定的不稳定的*若待排记录的若待排记录的初始状态为按关键字有序初始状态为按关键字有序时,快速排序将蜕化为起泡排序时,快速排序将蜕化为起泡排序,其时间复杂度为O(n2)。为避免出现这种情况,需在进行一次划分之前,进行“予处理予处理”,即:先对 L.rlow.key,L.rhigh.key和 L.r(low+high)/2.key,进行相互比较,然后取取关键字为“三者之中三者之中”的记录为为枢轴枢轴记录。*一、简单选择排序一、简单选择排序三、堆排序三、堆排序二、树型选择排序二、树型选择排序
26、*一、简单选择排序一、简单选择排序假设排序过程中,待排记录序列的状态为:有序序列R1.i-1无序序列 Ri.n 第 i 趟简单选择排序从中选出关键字最小的记录有序序列R1.i无序序列 Ri+1.n*void SelectSort(SqList&L,int n)/对记录序列R1.n作简单选择排序。for(i=1;iL.length;+i)/选择第 i 小的记录,并交换到位 /SelectSortj=SelectMinKey(L,i);/在 Ri.n 中选择关键字最小的记录if(i!=j)L.riL.rj;/与第 i 个记录交换*例例初始:49 38 65 97 76 13 27 jkkkkkkj
27、ji=11349一趟:13 38 65 97 76 49 27 i=2jjkkkkk2738二趟:13 27 65 97 76 49 38 三趟:13 27 38 97 76 49 65 四趟:13 27 38 49 76 97 65 五趟:13 27 38 49 65 97 76 六趟:13 27 38 49 65 76 97 排序结束:13 27 38 49 65 76 97*时间性能分析:时间性能分析:对 n 个记录进行简单选择排序,所需进行的 关键字间的比较次数关键字间的比较次数 总计为:移动记录的次数移动记录的次数,最小值为 0,最大值为3(n-1)。2)1()(11nninni不稳
28、定的不稳定的*三、堆排序三、堆排序堆是满足下列性质的数列k1,k2,kn:或或122iiiikkkk122iiiikkkk堆的定义堆的定义:12,36,27,65,40,34,98,81,73,55,49例如例如:是是小顶堆小顶堆12,36,27,65,40,14,98,81,73,55,49不是堆不是堆(小顶堆小顶堆)(大顶堆大顶堆)*kik2i k2i+1 若将该数列视作完全二叉树,则 k2i 是 ki 的左孩子;k2i+1 是 ki 的右孩子。1236276549817355403498例如例如:是堆是堆14不不*将无序序列建成一个堆建成一个堆,得到关键字最小(或最大)的记录;输出堆顶的
29、最输出堆顶的最小(大)值小(大)值后,使剩余的n-1个元素重又建成一个堆,则可得到n个元素的次小值;重复执行,得到一个有序序列,这个过程叫堆排序堆排序。堆排序即是利用堆排序即是利用堆的特性堆的特性对记录序列对记录序列进行排序的一种排序方法。进行排序的一种排序方法。*例如:例如:建大顶堆 98,81,49,73,36,27,40,55,64,12 12,81,49,73,36,27,40,55,64,98 交换 98 和 12重新调整为大顶堆 81,73,49,64,36,27,40,55,12,98 40,55,49,73,12,27,98,81,64,36*(1)如何由一个无序序列)如何由一
30、个无序序列建成建成一个堆?一个堆?堆排序需解决的两个问题堆排序需解决的两个问题:(2)如何在输出堆顶元素之后,)如何在输出堆顶元素之后,调整调整剩余元素使之成为一个新的剩余元素使之成为一个新的堆?堆?*输出堆顶元素之后,以堆中输出堆顶元素之后,以堆中最后最后一个元素一个元素替代之;然后将替代之;然后将根结点根结点值值与与左、右子树的根结点左、右子树的根结点值进行比较,值进行比较,并与其中并与其中小者小者(或(或大者大者)进行交换;)进行交换;重复上述操作,直至叶子结点,将重复上述操作,直至叶子结点,将得到新的堆,得到新的堆,称这个从堆顶至叶子称这个从堆顶至叶子的调整过程为的调整过程为“筛选筛选
31、”。第二个问题解决方法第二个问题解决方法筛选筛选:*98814973556412362740例如例如:是大顶堆是大顶堆1298128173641298比较比较比较*void HeapAdjust(RcdType&H,int s,int m)/已知 H.rs.m中记录的关键字除 H.rs 之外均 /满足堆的特征,本函数自上而下调整 H.rs 的 /关键字,使 H.rs.m 也成为一个大顶堆。/HeapAdjustrc=H.rs;/暂存 H.rs for(j=2*s;j=H.rj.key)break;/再作“根”和“子树根”之间的比较,/若“=”成立,则说明已找到 rc 的插 /入位置 s,不需要
32、继续往下调整H.rs=H.rj;s=j;/否则记录上移,尚需继续往下调整if(jm&H.rj.key0;-i)HeapAdjust(H.r,i,H.length);/建大顶堆for(i=H.length;i1;-i)H.r1H.ri;/将堆顶记录和当前未经排序子序列 /H.r1.i中最后一个记录相互交换 HeapAdjust(H.r,1,i-1);/对 H.r1 进行筛选*堆排序的时间复杂度分析:堆排序的时间复杂度分析:1.对深度为 k 的堆,“筛选”所需进行的关键字比较的次数至多为2(k-1);3.调整“堆顶”n-1 次,总共进行的关键 字比较的次数不超过 2(log2(n-1)+log2(
33、n-2)+log22)2n(log2n)因此,堆排序的时间复杂度为O(nlogn)。2.对 n 个关键字,建成深度为h(=log2n+1)的堆,所需进行的关键字比较的次数至多 4n;不稳定的不稳定的*归并:归并:将两个或两个以上的有序表组合成一个新的有序表。*在内部排序中,通常采用的是2-路归并排序。即:将两个位置相邻位置相邻的记录有序子序列归并为一个一个记录的有序序列。有有 序序 序序 列列 Rl.n有序子序列有序子序列 Rl.m有序子序列有序子序列 Rm+1.n这个操作对顺序表而言,是轻而易举的。*例例:给定待排序序列(49,38,65,97,76,13,27)初始关键字:49 38 65
34、 97 76 13 27一趟归并后:38 49 65 97 13 76 27二趟归并后:38 49 65 97 13 27 76三趟归并后:13 27 38 49 65 76 97*void Merge(RcdType SR,RcdType&TR,int i,int m,int n)/将有序的记录序列 SRi.m 和 SRm+1.n /归并为有序的记录序列 TRi.n/Mergefor(j=m+1,k=i;i=m&j=n;+k)/将SR中记录由小到大地并入TR if(SRi.key=SRj.key)TRk=SRi+;else TRk=SRj+;*if(i=m)TRk.n=SRi.m;/将剩余的
35、 SRi.m 复制到 TRif(j=n)TRk.n=SRj.n;/将剩余的 SRj.n 复制到 TR*归并排序的算法:归并排序的算法:如果记录无序序列 Rs.t 的两部分 Rs.(s+t)/2 和 R(s+t)/2+1.t分别按关键字有序,则利用上述归并算法很容易将它们归并成整个记录序列是一个有序序列。由此,应该先分别对这两部分进行 2-路归并排序。*例如:例如:52,23,80,36,68,14 (s=1,t=6)52,23,80 36,68,14 52,2380 52 23,52 23,52,8036,6814366836,6814,36,68 14,23,36,52,68,80 23*v
36、oid Msort(RcdType SR,RcdType&TR1,int s,int t)/将SRs.t 归并排序为 TR1s.t if(s=t)TR1s=SRs;else /Msort *m=(s+t)/2;/将SRs.t平分为SRs.m和SRm+1.tMsort(SR,TR2,s,m);/递归地将SRs.m归并为有序的TR2s.mMsort(SR,TR2,m+1,t);/递归地SRm+1.t归并为有序的TR2m+1.tMerge(TR2,TR1,s,m,t);/将TR2s.m和TR2m+1.t归并到TR1s.t*void MergeSort(SqList&L)/对顺序表 L 作2-路归并排
37、序 MSort(L.r,L.r,1,L.length);/MergeSort容易看出,对 n 个记录进行归并排序的时间复杂度为(nlogn)。即:每一趟归并的时间复杂度为 O(n),总共需进行 log2n 趟。稳定的稳定的*基数排序基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法。10.6.1 多关键字的排序多关键字的排序10.6.2 链式基数排序链式基数排序*例例:对52张扑克牌按以下次序排序:23A23A23A23A两个关键字:花色花色()面值面值(23A)并且“花色”地位高于“面值”。10.6.1 多关键字的排序多关键字的排序*n 个记录的序列个记录的序列 R
38、1,R2,,Rn对关键字对关键字 (Ki0,Ki1,Kid-1)有序有序是指:其中其中:K0 被称为被称为 “最主最主”位关键字位关键字Kd-1 被称为被称为 “最次最次”位关键字位关键字 对于序列中任意两个记录 Ri 和 Rj(1ijn)都满足满足下列(字典字典)有序有序关系:(Ki0,Ki1,Kid-1)(Kj0,Kj1,Kjd-1)*先对先对K0进行排序进行排序,并按 K0 的不同值将记录序列分成若干子序列之后,分别对 K1 进行排序,.,依次类推,直至最后直至最后对最次位关键对最次位关键字排序完成字排序完成为止为止。一、最高位优先一、最高位优先(MSD)法*先对先对 Kd-1 进行排序
39、,然后对 Kd-2 进行排序,依次类推,直至对最主位关键直至对最主位关键字字 K0 排序完成排序完成为止为止。按LSD排序,不必分成子序列,对每个关键字都是整个序列参加排序;并且可不通过关键字比较,而通过若干次分配与收集实现排序。二、最低位优先二、最低位优先(LSD)法*例如例如:学生记录含三个关键字:系别系别、班号班号和班内的序号班内的序号,其中以系别为最主位关键字。无序序列无序序列对对K2排序排序对对K1排序排序对对K0排序排序3,2,301,2,153,1,202,3,182,1,201,2,152,3,183,1,202,1,203,2,303,1,202,1,201,2,153,2,
40、302,3,18 1,2,152,1,202,3,183,1,203,2,30LSD的排序过程如下:*10.6.2 链式基数排序链式基数排序 假如多关键字的记录序列中,每个关键字的取值范围相同,则按LSD法进行排序时,可以采用“分配分配-收集收集”的方法,其好处是不需要进行关键字间的比较。对于数字型或字符型数字型或字符型的单关键字单关键字,可以看看成成是由多个数位或多个字符构成多个数位或多个字符构成的多关键字多关键字,此时可以采用采用这种“分配分配-收集收集”的办法进行进行排序排序,称作称作基数排序法基数排序法。*例如:例如:对下列这组关键字 209,386,768,185,247,606,2
41、30,834,539 首先按其“个位数”取值分别为 0,1,9 “分配分配”成 10 组,之后按从 0 至 9 的顺序将 它们“收集收集”在一起;然后按其“十位数”取值分别为 0,1,9 “分配分配”成 10 组,之后再按从 0 至 9 的顺序将它们“收集收集”在一起;最后按其“百位数”重复一遍上述操作。*在计算机上实现基数排序时,为减少所需辅助存储空间,应采用链表作存储结构,即链式基数排序,具体作法为:1.待排序记录以指针相链,构成一个链表;2.“分配”时,按当前“关键字位”所取值,将记录分配到不同的“链队列”中,每个队列中记录的“关键字位”相同;3.“收集”时,按当前关键字位取值从小到大将
42、各队列首尾相链成一个链表;4.对每个关键字位均重复 2)和 3)两步。*例例初始状态:278109063930589184505269008083109589269278063930083184505008e0e1e2e3e4e5e6e7e8e9f0f1f2f3f4f5f6f7f8f9一趟分配一趟分配930063083184505278008109589269一趟收集:一趟收集:*505008109930063269278083184589二趟收集:二趟收集:083184589063505269930e0e1e2e3e4e5e6e7e8e9f0f1f2f3f4f5f6f7f8f9二趟分配二趟分
43、配008109278930063083184505278008109589269一趟收集:*008063083109184269278505589930三趟收集:三趟收集:109008184930e0e1e2e3e4e5e6e7e8e9f0f1f2f3f4f5f6f7f8f9三趟分配三趟分配063083269278505589505008109930063269278083184589二趟收集:*提醒注意:提醒注意:“分配分配”和和“收集收集”的实际操作的实际操作仅为修改链表中的指针和设置队列的仅为修改链表中的指针和设置队列的头、尾指针;头、尾指针;为查找使用,该链表尚需应用为查找使用,该链表
44、尚需应用算法算法Arrange 将它调整为有序表。将它调整为有序表。*基数排序的时间复杂度为基数排序的时间复杂度为O(d(n+rd)其中:分配为O(n)收集为O(rd)(rd为“基”)d为“分配-收集”的趟数 基数排序时间分析:基数排序时间分析:*一、时间性能一、时间性能三、排序方法的稳定性能三、排序方法的稳定性能二、空间性能二、空间性能四、关于四、关于“排序方法的排序方法的 时间复杂度的下限时间复杂度的下限”*一、时间性能一、时间性能1.平均的时间性能平均的时间性能基数排序基数排序时间复杂度为时间复杂度为 O(nlogn):快速排序、堆排序和归并排序快速排序、堆排序和归并排序时间复杂度为时间
45、复杂度为 O(n2):直接插入排序、起泡排序和直接插入排序、起泡排序和简单选择排序简单选择排序时间复杂度为时间复杂度为 O(n):*2.当待排记录序列按关键字顺序有序时当待排记录序列按关键字顺序有序时3.简单选择排序简单选择排序、堆排序堆排序和和归并排序归并排序的时间性能不随不随记录序列中关键字的分布而改变。直接插入排序直接插入排序和起泡排序起泡排序能达到O(n)的时间复杂度,快速排序快速排序的时间性能蜕化为O(n2)。*二、空间性能二、空间性能指的是排序过程中所需的辅助空间大小。1.所有的简单排序方法简单排序方法(包括:直接插入、起泡和简单选择)和堆排序堆排序的空间复杂度为为O(1);2.快
46、速排序为快速排序为O(logn),为递归程序执行过程中,栈所需的辅助空间;*3.归并排序归并排序所需辅助空间最多,其空间复杂度为 O(n);4.链式基数排序链式基数排序需附设队列首尾指针,则空间复杂度为 O(rd)。*三、排序方法的稳定性能三、排序方法的稳定性能 2.当对多关键字的记录序列进行LSD方法方法排序时,必须采用稳定稳定的排序方法。1.快速排序快速排序、堆排序堆排序和和希尔排序希尔排序是是不稳不稳定定的排序方法的排序方法。3.对于不稳定的排序方法,只要能举出一个实例说明即可。*四、关于四、关于“排序方法的时间复杂度的下限排序方法的时间复杂度的下限”本章讨论的各种排序方法,除基数排序外
47、,其它方法都是基于基于“比较关键字比较关键字”进进行排序的排序方法。行排序的排序方法。可以证明,这类排序法可能达到的最可能达到的最快的时间复杂度为快的时间复杂度为O(nlogn)。(基数排序不是基于“比较关键字”的排序方法,所以它不受这个限制。)*例如例如:对三个关键字进行排序的判定树如下:树上的每一次“比较”都是必要的;树上的叶子结点包含所有可能情况。K1K3K2 K3K3K1K2K1K3K1K2K2K3K2K1K3K1K2K3K3K2K1K2K3K1K1K3K2是是是是是否否否否否*一般情况下,对n个关键字进行排序,可能得到的结果有n!种,由于含n!个叶子结点的二叉树的深度不小于log2(
48、n!)+1,则对 n 个关键字进行排序的比较次数至少是 log2(n!)nlog2n(斯蒂林近似公式)。所以,基于基于“比较关键字比较关键字”进行排序进行排序的的排序方法,排序方法,可能达到的最快的时间复杂可能达到的最快的时间复杂度为度为 O(nlogn)。*第十章作业10.1 10.3 10.1210.1 10.3 10.1210.1 以关键码序列(503,087,512,061,908,170,897,275,653,426)为例,手工执行以下排序算法,写出每一趟排序结束时的关键码状态:(1)直接插入排序;(2)希尔排序(增量d1=5);(3)快速排序;(4)堆排序;(5)归并排序;(6)基数排序;*1.设关键字序列为96,83,40,11,67,25,写出用下列算法排序时,第一趟结束时的状态。(1)希尔排序(d1=3)(2)快速排序 (3)归并排序 (4)堆排序*10.3 试问在10.1题所列各种排序方法中,哪些是稳定的?哪些是不稳定的?并为每一种不稳定的排序方法举出一个不稳定的实例。10.12 判别以下序列是否为堆(小顶堆或大顶堆)。如果不是,则把它调整为堆(要求记录交换次数最少)。(1)(100,86,48,73,35,39,42,57,66,21);(2)(12,70,33,65,24,56,48,92,86,33);*