[关闭]
@quinn 2015-03-29T18:24:22.000000Z 字数 2394 阅读 2766

归并和归并排序

排序算法


  1. 归并操作:是将两个有序独立的文件合并成为一个有序文件的过程。
  2. 归并排序:和快速排序的过程相反,它是两个递归调用(排序子文件)后是一个归并的过程。
    快速排序时,先分解成两个子问题后是两个递归调用(排序子文件)的过程。

1. 归并操作

1.1 基本的两路归并

将两个已经有序的数组 a 和 b 合并成一个有序的数组 c .
归并操作的过程如下:
1. 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置
3. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
4. 重复步骤3直到某一指针到达序列尾
5. 将另一序列剩下的所有元素直接复制到合并序列尾

  1. //将有序数组a,b合并成为一个有序数组c
  2. void mergeAB0(Item c[], Item a[], int M, Item b[], int N)
  3. {
  4. int k = 0;
  5. int i = 0, j = 0;
  6. while(k < M+N)
  7. {
  8. if(i == M) //a数组已完结
  9. {
  10. c[k++] = b[j++];
  11. continue;
  12. }
  13. if(j == N) //b数组已完结
  14. {
  15. c[k++] = a[i++];
  16. continue;
  17. }
  18. if(less(a[i], b[j]))
  19. c[k++] = a[i++];
  20. else
  21. c[k++] = b[j++];
  22. }
  23. }

此归并是稳定的,它保持了相同关键字的相对顺序。

1.2 抽象原位归并

目标:将数组a[l],……,a[m]和a[m+1],……,a[r]合并成一个有序文件,结果保存在a[l],……,a[r].

实现:通过构建双向序列(bitonic顺序),省略了1.1中的检查是否到达数组尾部的测试操作
将第一个数组复制到辅助数组aux[]中,将第二个数组按倒序方式紧跟第一个数组复制到aux[]中。第一个for循环移动第一个数组,使i指向l;第二个for移动第二个数组,使j指向r,为归并做好准备。接着,在归并操作(第三个for),将最大的元素当做观察哨,不管它在哪一个数组。

  1. //抽象原位归并算法:双向序列的归并算法,不稳定
  2. void mergeAB(Item a[], int l, int m, int r)
  3. {
  4. //构建双向序列
  5. int i, j, k;
  6. for(i = m+1; i > l; i--)
  7. aux[i-1] = a[i-1];
  8. for(j = m, k = r; j < r; j++, k--)
  9. aux[k] = a[j+1];
  10. //归并操作;此时,i=l,j=r
  11. for(k = l; k <= r; k++)
  12. {
  13. if(less(aux[i], aux[j]))
  14. a[k] = aux[i++];
  15. else
  16. a[k] = aux[j--];
  17. }
  18. }

此归并是不稳定的。

2. 归并排序

分治策略(1)将原文件分解成大小相等的2个子文件;(2)将2个子文件分别排序;(3)将2个有序的子文件进行合并

2.1 自顶向下的归并排序

  1. //自顶向下的merge sort
  2. void merge_sort(Item a[], int l, int r)
  3. {
  4. if(l >= r)
  5. return;
  6. //小文件改进
  7. // if(r-l < 10) {insertion_sort(a, l, r); return;}
  8. int m = (l+r)/2;
  9. merge_sort(a, l, m);
  10. merge_sort(a, m+1, r);
  11. mergeAB(a, l, m, r);
  12. }

算法分析
(1)对长度为N的文件,需进行lgN(树的深度)趟二路归并,每趟归并的时间为O(N),故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(NlgN)
(2)需要一个辅助数组来暂存两有序子文件归并的结果,故其辅助空间复杂度为O(N),显然它不是就地排序。
(3) 如果使用的归并算法是稳定的,排序算法就是稳定的。

2.2 自底向上的归并排序

每一个递归程序都有一个非递归程序与之对应。
原理:先求出小问题的解,在把它组合成较大问题的解。
(1) 将文件中的所有元素看作大小为1的有序子表,接着便利这些表进行1-1的归并,产生大小为2的有序子表;
(2) 然后遍历文件列表进行2-2归并,产生大小为4的有序子表
(3) 然后进行4-4归并,产生大小为8的有序子表,以此类推,直至整个表有序

通过在整个文件中进行多遍的m-m的归并,完成自底向上的归并排序,在每一遍中m加倍;仅当文件大小是m的偶数倍时,最后一个子文件的大小是m,否则最后的归并是m-x归并,x <= m

  1. //自底向上 merge_sort
  2. void merge_sort_BU(Item a[], int l, int r)
  3. {
  4. int i, m;
  5. for(m = 1; m <= r-l; m *= 2) //控制每层子问题的大小
  6. {
  7. for(i = l; i <= r-m; i+= 2*m) //从最左侧,依次递增 2m
  8. mergeAB(a, i, i+m-1, min(i+2*m-1, r));
  9. }
  10. }

性质 1:除了最后一个子文件外,所有子文件的大小都是2的幂,
性质 2:对N个元素的自底向上归并排序执行的遍数k,是使 2k>=N成立的最小值,即 lgN,也是N用二进制表示的位数。

2.3 归并排序的性能特征

运行时间与 NlgN 成正比,与输入无关;
使用额外的内存空间;
可以稳定实现。

3 归并排序的链表实现

4 归并排序与快速排序对比

  1. 递归实现中: 快速排序,在一个递归实现中,大多数工作(划分过程)在递归递归调用前完成;而归并排序是在递归之后。
  2. 非递归实现中: 快速排序必须使用栈,因为其保存了大的子问题,然后根据数据情况进行分解;归并排序的划分与数据无关。
  3. 稳定性: 稳定的归并操作,就能够保证稳定的归并排序;对基于数组的快速排序实现,将数组稳定的划分是不容易的,在递归之前,稳定性已经破坏,然而基于链表的快速排序是稳定的。
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注