[关闭]
@pastqing 2016-04-15T22:10:36.000000Z 字数 4614 阅读 2077

排序

java


一、内排序

内排序是指所有的数据都已读入内存, 在内存中进行排序的算法。排序过程中不需要对磁盘进行读写。同时,内排序也一般假定所有用到的辅助空间也可以直接存入内存中。


1.归并(Merge Sort)

思想:归并排序是典型的分治思想。将线性数据结构分成两个部分,分别对这两个部分进行排序,排序完成后,再将各自排好序的部分合成一个有序的数组。

实例代码:

  1. public void sort(int[] array, int[] helper, int left, int right) {
  2. if(left >= right)
  3. return ;
  4. //防止溢出
  5. int mid = left + (right - left) / 2;
  6. sort(array, helper, left, mid);
  7. sort(array, helper, mid + 1, right);
  8. //合并左右两部分
  9. int helperLeft = left;
  10. int helperRight = mid + 1;
  11. int cur = left;
  12. for(int i = left; i <= right; i++) {
  13. helper[i] = array[i];
  14. }
  15. while(helperLeft <= mid && helperRight <= right) {
  16. if(helper[helperLeft] <= helper[helperRight]) {
  17. array[cur++] = helper[helperLeft++];
  18. }else {
  19. array[cur++] = helper[helperRight++];
  20. }
  21. }
  22. while(helperLeft <= mid) {
  23. array[cur++] = helper[helperLeft++];
  24. }
  25. }

空间复杂度:需要一个helper[n]的辅助空间,故为O(n)

时间复杂度:每一趟归并的时间复杂度为O(n), 共需要进行log2n, 因此复杂度为O(nlogn)

动画演示参见右边连接: Comparison Sorting Algorithms


2.快速排序(Quick Sort)

思想:快速排序也是一种分治思想。它是随机选择一个元素作为轴值,利用该轴值将数组分为左右两部分,左边的元素都比轴值小,右边的都比轴值大,但它们是不完全排序的。在此基础上,再分别对分出来的左右两部分递归以上操作。

实例代码:

  1. public void sort(int[] array, int left, int right) {
  2. if(left >= right)
  3. return ;
  4. int index = partition(array, left, right);
  5. sort(array, left, index - 1);
  6. sort(array, index + 1, right);
  7. }
  8. private int partition(int[] array, int left, int right) {
  9. int pivot = array[right];
  10. while(left != right) {
  11. while(array[left] < pivot && left < right)
  12. left++;
  13. if(left < right) {
  14. int temp = array[right];
  15. array[right] = array[left];
  16. array[left] = temp;
  17. right--;
  18. }
  19. while(array[right] > pivot && right > left) {
  20. right--;
  21. }
  22. if(right > left) {
  23. int temp = array[left];
  24. array[left] = array[right];
  25. array[right] = temp;
  26. left++;
  27. }
  28. }
  29. array[left] = pivot;
  30. return left;
  31. }

空间复杂度:由于quick sort是递归的,需要借助一个工作栈来保存每一层递归调用的信息,其容量与递归调用的最大深度一致。最好情况下为O(log2_(n+1)), 最坏情况下为O(n), 平均情况下,栈的深度为O(log2_n)

时间复杂度:快速排序的运行时间与划分是否对称有关。最坏情况下发生在两个区域分别包含n-1个元素和0个元素,即对应初始排序就是基本有序或者逆序的状态,为O(n^2)。最好的情况下,就是划分后左右两部分大小都不大于n/2, 复杂度为O(nlog2_n)

动画演示参见右边连接: Comparison Sorting Algorithms


拓展: 利用快速排序思想,实现quick select。在平均复杂度为O(n)时间内从一个无序数组中返回第k大的元素

快速排序中,并不产生有序子序列,但每一趟排序,都会将一个元素放到他的最终位置上

实例代码:

  1. public int selection(int[] array, int left, int right, int k) {
  2. if(left >= right)
  3. return array[left];
  4. int index = partition(array, left, right);
  5. int size = index - left + 1;
  6. if(size == k)
  7. return array[left + size - 1];
  8. else if(size > k) {
  9. return selection(array, left, index - 1, k);
  10. }else
  11. return selection(array, index + 1, right, k - size);
  12. }

3.桶排序(Bucket Sort)

思想:桶排序是事先知道了待排序数组的一些基本信息(最大,最小范围),然后将数组放入有限的桶中,然后再分别对每个桶进行排序。然后再从桶中取出,形成有序序列。

下面给出一个例子,示意图来源:bubkoo的博客

设有数组 array = [29, 25, 3, 49, 9, 37, 21, 43],那么数组中最大数为 49,先设置 5 个桶,那么每个桶可存放数的范围为:0~9、10~19、20~29、30~39、40~49,然后分别将这些数放人自己所属的桶。
bucket-sort-1.png-3.6kB

然后,分别对每个桶里面的数进行排序,或者在将数放入桶的同时用插入排序进行排序。最后,将各个桶中的数据有序的合并起来,如下图:
bucket-sort-2.png-4.3kB

实例代码:以最简单的方式,每个桶就放一个数

  1. public void sort(int[] array, int n, int max) {
  2. int tempArray[] = new int[n];
  3. int i;
  4. for (i = 0; i < n; i++)
  5. tempArray[i] = array[i];
  6. int[] count = new int[max];
  7. for (i = 0; i < n; i++) { // 将元素放入桶中
  8. count[array[i]]++;
  9. }
  10. for (i = 1; i < max; i++) {
  11. count[i] = count[i - 1] + count[i];
  12. // count[i] 存的是 i+1 的值在原数组中开始的索引位置
  13. }
  14. for (i = n - 1; i >= 0; i--)
  15. //tempArray[i]的值在原数组中的下标应该是count[tempArray[i]] - 1
  16. array[--count[tempArray[i]]] = tempArray[i];
  17. }

空间复杂度:本例中就是O(max + n)

时间复杂度:桶排序的时间复杂度取决于各个桶之间数据进行排序的时间复杂度,即为O(n)


4.基数排序(Radix Sort)

思想:简单来说,基数排序就是对每一位数,都做一遍桶排序。

实例代码

  1. public void sort(int[] array, int n, int digits, int radix) {
  2. int radixModulo = 1; // radix modulo
  3. int[] tempArray = new int[n];
  4. int[] count = new int[radix];
  5. int digit;
  6. for(int i = 1; i <= digits; i++) {
  7. //每次初始化桶
  8. for (int j = 0; j < radix; j++)
  9. count[j] = 0;
  10. //put the element into bucket
  11. for(int j = 0; j < n; j++) {
  12. digit = (array[j] / radixModulo) % radix;
  13. count[digit]++;
  14. }
  15. //桶排序
  16. for(int j = 1; j < radix; j++) {
  17. count[j] = count[j - 1] + count[j];
  18. }
  19. for(int j = n - 1; j >= 0; j--) {
  20. digit = (array[j] / radixModulo) % radix;
  21. count[digit]-= 1;
  22. tempArray[count[digit]] = array[j];
  23. }
  24. for(int j = 0; j < n; j++) {
  25. array[j] = tempArray[j];
  26. }
  27. radixModulo *= radix;
  28. }
  29. }

动画演示参见右边连接: RadixSort


二、外排序

内存中无法保存全部数据,需要进行磁盘访问,每次读入部分数据到内存中进行排序。

思想: 假设文件需要分成K块读入, 需要从小到大排列

  1. 依次读入每个文件块,在内存中应用恰当的算法对当前文件块排序。此时,每个文件块相当于一个有小到大排列的序列。
  2. 在内存中建立一个最小值堆,读入每块文件的队头。
  3. 弹出堆顶元素,如果元素来自第i块,则从第i块文件中补充一个元素到最小值堆。弹出的元素暂时存在数组中。
  4. 当临时数组写满时,将数组写到磁盘里,并清空数组内容。
  5. 重复3,4步,直到所有文件块读取完毕。

堆排序

实例代码

建立大顶堆

  1. //构造一个初始大顶堆, 从第一个非叶子结点开始
  2. private void maxHeapify(int[] array, int index) {
  3. //求下标从0开始的左右孩子下标
  4. int left = 2 * index + 1;
  5. int right = 2 * index + 2;
  6. int max = 1; //the init index
  7. if(left <= heapSize - 1 && array[left] > array[index]) {
  8. max = left;
  9. }else
  10. max = index;
  11. if(right < heapSize - 1 && array[right] > array[max]) {
  12. max = right;
  13. }
  14. //交换
  15. if(max != index) {
  16. int temp = array[max];
  17. array[max] = array[index];
  18. array[index] = temp;
  19. maxHeapify(array, max);
  20. }
  21. }

堆排序
为了使取出堆顶操作不破坏堆结构, 就将堆顶元素与数组最后一个元素交换。这样数组的第n个位置为有序,前n-1个位置为无序,然后再对无序的部分进行调整即可。

  1. public void sort(int[] array) {
  2. for(int i = array.length - 1; i >= 1; i--) {
  3. int temp = array[i];
  4. array[i] = array[0];
  5. array[0] = temp;
  6. heapSize--;
  7. maxHeapify(array, 0);
  8. }
  9. }

空间复杂度O(1)
时间复杂度:建堆时间是O(n), 每次调整的时间复杂度为O(h)。平均时间复杂度为O(nlogn)

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注