蓬庄静 发表于 2025-12-8 10:20:03

十大经典排序算法

引言

所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。排序算法在很多领域得到相当地重视,尤其是在大量数据的处理方面。一个优秀的算法可以节省大量的资源。在各个领域中考虑到数据的各种限制和规范,要得到一个符合实际的优秀算法,得经过大量的推理和分析。
简介

排序算法可以分为:

[*]内部排序:数据记录在内存中进行排序。
[*]外部排序:因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。
常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等,本文只讲解内部排序算法。用一张图概括:

术语说明


[*]稳定:如果 A 原本在 B 前面,而 $A=B$,排序之后 A 仍然在 B 的前面。
[*]不稳定:如果 A 原本在 B 的前面,而 $A=B$,排序之后 A 可能会出现在 B 的后面。
[*]时间复杂度:定性描述一个算法执行所耗费的时间。
[*]空间复杂度:定性描述一个算法执行所需内存的大小。
算法分类

十种常见排序算法可以分类两大类别:比较类排序和非比较类排序。

常见的快速排序、归并排序、堆排序以及冒泡排序等都属于比较类排序算法。比较类排序是通过比较来决定元素间的相对次序,由于其时间复杂度不能突破 O(nlogn),因此也称为非线性时间比较类排序。在冒泡排序之类的排序中,问题规模为 n,又因为需要比较 n 次,所以平均时间复杂度为 O(n²)。在归并排序、快速排序之类的排序中,问题规模通过分治法消减为 logn 次,所以时间复杂度平均 O(nlogn)。
比较类排序的优势是,适用于各种规模的数据,也不在乎数据的分布,都能进行排序。可以说,比较排序适用于一切需要排序的情况。
而计数排序、基数排序、桶排序则属于非比较类排序算法。非比较排序不通过比较来决定元素间的相对次序,而是通过确定每个元素之前,应该有多少个元素来排序。由于它可以突破基于比较排序的时间下界,以线性时间运行,因此称为线性时间非比较类排序。 非比较排序只要确定每个元素之前的已有的元素个数即可,所有一次遍历即可解决。算法时间复杂度 $O(n)$。
非比较排序时间复杂度底,但由于非比较排序需要占用空间来确定唯一位置。所以对数据规模和数据分布有一定的要求。
冒泡排序 (Bubble Sort)

冒泡排序是一种简单的排序算法。它重复地遍历要排序的序列,依次比较两个元素,如果它们的顺序错误就把它们交换过来。遍历序列的工作是重复地进行直到没有再需要交换为止,此时说明该序列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢 “浮” 到数列的顶端。
算法步骤


[*]比较相邻的元素。如果第一个比第二个大,就交换它们两个;
[*]对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
[*]针对所有的元素重复以上的步骤,除了最后一个;
[*]重复步骤 1~3,直到排序完成。
图解算法


代码实现

/**
* 冒泡排序
* @param arr
* @return arr
*/
public static int[] bubbleSort(int[] arr) {
    for (int i = 1; i < arr.length; i++) {
      // Set a flag, if true, that means the loop has not been swapped,
      // that is, the sequence has been ordered, the sorting has been completed.
      boolean flag = true;
      for (int j = 0; j < arr.length - i; j++) {
            if (arr > arr) {
                int tmp = arr;
                arr = arr;
                arr = tmp;
       // Change flag
                flag = false;
            }
      }
      if (flag) {
            break;
      }
    }
    return arr;
}此处对代码做了一个小优化,加入了 is_sorted Flag,目的是将算法的最佳时间复杂度优化为 O(n),即当原输入序列就是排序好的情况下,该算法的时间复杂度就是 O(n)。
算法分析


[*]稳定性:稳定
[*]时间复杂度:最佳:$O(n)$ ,最差:$O(n^2)$, 平均:$O(n^2)$
[*]空间复杂度:$O(1)$
[*]排序方式:In-place
选择排序 (Selection Sort)

选择排序是一种简单直观的排序算法,无论什么数据进去都是 $O(n^2)$ 的时间复杂度。所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
算法步骤


[*]首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置
[*]再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
[*]重复第 2 步,直到所有元素均排序完毕。
图解算法


代码实现

/**
* 选择排序
* @param arr
* @return arr
*/
public static int[] selectionSort(int[] arr) {
    for (int i = 0; i < arr.length - 1; i++) {
      int minIndex = i;
      for (int j = i + 1; j < arr.length; j++) {
            if (arr < arr) {
                minIndex = j;
            }
      }
      if (minIndex != i) {
            int tmp = arr;
            arr = arr;
            arr = tmp;
      }
    }
    return arr;
}算法分析


[*]稳定性:不稳定
[*]时间复杂度:最佳:$O(n^2)$ ,最差:$O(n^2)$, 平均:$O(n^2)$
[*]空间复杂度:$O(1)$
[*]排序方式:In-place
插入排序 (Insertion Sort)

插入排序是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用 in-place 排序(即只需用到 $O(1)$ 的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂。插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
插入排序和冒泡排序一样,也有一种优化算法,叫做拆半插入。
算法步骤


[*]从第一个元素开始,该元素可以认为已经被排序;
[*]取出下一个元素,在已经排序的元素序列中从后向前扫描;
[*]如果该元素(已排序)大于新元素,将该元素移到下一位置;
[*]重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
[*]将新元素插入到该位置后;
[*]重复步骤 2~5。
图解算法


代码实现

/**
* 插入排序
* @param arr
* @return arr
*/
public static int[] insertionSort(int[] arr) {
    for (int i = 1; i < arr.length; i++) {
      int preIndex = i - 1;
      int current = arr;
      while (preIndex >= 0 && current < arr) {
            arr = arr;
            preIndex -= 1;
      }
      arr = current;
    }
    return arr;
}算法分析


[*]稳定性:稳定
[*]时间复杂度:最佳:$O(n)$ ,最差:$O(n^2)$, 平均:$O(n2)$
[*]空间复杂度:$O(1)$
[*]排序方式:In-place
希尔排序 (Shell Sort)

希尔排序是希尔 (Donald Shell) 于 1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为递减增量排序算法,同时该算法是冲破 $O(n^2)$ 的第一批算法之一。
希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录 “基本有序” 时,再对全体记录进行依次直接插入排序。
算法步骤

我们来看下希尔排序的基本步骤,在此我们选择增量 $gap=length/2$,缩小增量继续以 $gap = gap/2$ 的方式,这种增量选择我们可以用一个序列来表示,$\lbrace \frac{n}{2}, \frac{(n/2)}{2}, \dots, 1 \rbrace$,称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。
先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

[*]选择一个增量序列 $\lbrace t_1, t_2, \dots, t_k \rbrace$,其中 $t_i \gt t_j, i \lt j, t_k = 1$;
[*]按增量序列个数 k,对序列进行 k 趟排序;
[*]每趟排序,根据对应的增量 $t$,将待排序列分割成若干长度为 $m$ 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。
图解算法


代码实现

/**
* 希尔排序
*
* @param arr
* @return arr
*/
public static int[] shellSort(int[] arr) {
    int n = arr.length;
    int gap = n / 2;
    while (gap > 0) {
      for (int i = gap; i < n; i++) {
            int current = arr;
            int preIndex = i - gap;
            // Insertion sort
            while (preIndex >= 0 && arr > current) {
                arr = arr;
                preIndex -= gap;
            }
            arr = current;

      }
      gap /= 2;
    }
    return arr;
}算法分析


[*]稳定性:不稳定
[*]时间复杂度:最佳:$O(nlogn)$, 最差:$O(n^2)$ 平均:$O(nlogn)$
[*]空间复杂度:$O(1)$
归并排序 (Merge Sort)

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法 (Divide and Conquer) 的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为 2 - 路归并。
和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 $O(nlogn)$ 的时间复杂度。代价是需要额外的内存空间。
算法步骤

归并排序算法是一个递归过程,边界条件为当输入序列仅有一个元素时,直接返回,具体过程如下:

[*]如果输入内只有一个元素,则直接返回,否则将长度为 $n$ 的输入序列分成两个长度为 $n/2$ 的子序列;
[*]分别对这两个子序列进行归并排序,使子序列变为有序状态;
[*]设定两个指针,分别指向两个已经排序子序列的起始位置;
[*]比较两个指针所指向的元素,选择相对小的元素放入到合并空间(用于存放排序结果),并移动指针到下一位置;
[*]重复步骤 3 ~ 4 直到某一指针达到序列尾;
[*]将另一序列剩下的所有元素直接复制到合并序列尾。
图解算法


代码实现

/**
* 归并排序
*
* @param arr
* @return arr
*/
public static int[] mergeSort(int[] arr) {
    if (arr.length <= 1) {
      return arr;
    }
    int middle = arr.length / 2;
    int[] arr_1 = Arrays.copyOfRange(arr, 0, middle);
    int[] arr_2 = Arrays.copyOfRange(arr, middle, arr.length);
    return merge(mergeSort(arr_1), mergeSort(arr_2));
}

/**
* Merge two sorted arrays
*
* @param arr_1
* @param arr_2
* @return sorted_arr
*/
public static int[] merge(int[] arr_1, int[] arr_2) {
    int[] sorted_arr = new int;
    int idx = 0, idx_1 = 0, idx_2 = 0;
    while (idx_1 < arr_1.length && idx_2 < arr_2.length) {
      if (arr_1 < arr_2) {
            sorted_arr = arr_1;
            idx_1 += 1;
      } else {
            sorted_arr = arr_2;
            idx_2 += 1;
      }
      idx += 1;
    }
    if (idx_1 < arr_1.length) {
      while (idx_1 < arr_1.length) {
            sorted_arr = arr_1;
            idx_1 += 1;
            idx += 1;
      }
    } else {
      while (idx_2 < arr_2.length) {
            sorted_arr = arr_2;
            idx_2 += 1;
            idx += 1;
      }
    }
    return sorted_arr;
}算法分析


[*]稳定性:不稳定
[*]时间复杂度:最佳:$O(nlogn)$, 最差:$O(nlogn)$, 平均:$O(nlogn)$
[*]空间复杂度:$O(1)$
计数排序 (Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。
计数排序 (Counting sort) 是一种稳定的排序算法。计数排序使用一个额外的数组 C,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。它只能对整数进行排序。
算法步骤


[*]找出数组中的最大值 max、最小值 min;
[*]创建一个新数组 C,其长度是 max-min+1,其元素默认值都为 0;
[*]遍历原数组 A 中的元素 A,以 A - min 作为 C 数组的索引,以 A 的值在 A 中元素出现次数作为 C - min] 的值;
[*]对 C 数组变形,新元素的值是该元素与前一个元素值的和,即当 i>1 时 C = C + C;
[*]创建结果数组 R,长度和原始数组一样。
[*]从后向前遍历原始数组 A 中的元素 A,使用 A 减去最小值 min 作为索引,在计数数组 C 中找到对应的值 C - min],C - min] - 1 就是 A 在结果数组 R 中的位置,做完上述这些操作,将 count - min] 减小 1。
图解算法


代码实现

public static int partition(int[] array, int low, int high) {
    // 取最后一个元素作为中心元素
    int pivot = array;
    // 定义指向比中心元素大的指针,首先指向第一个元素
    int pointer = low;
    // 遍历数组中的所有元素,将比中心元素大的放在右边,比中心元素小的放在左边
    for (int i = low; i < high; i++) {
      if (array <= pivot) {
                // 将比中心元素小的元素和指针指向的元素交换位置
                // 如果第一个元素比中心元素小,这里就是自己和自己交换位置,指针和索引都向下一位移动
                // 如果元素比中心元素大,索引向下移动,指针指向这个较大的元素,直到找到比中心元素小的元素,并交换位置,指针向下移动
                swap(array, i, pointer);
            pointer++;
      }
      //每次打印排序后结果
      System.out.println(Arrays.toString(array));
    }
    // 将中心元素和指针指向的元素交换位置
    swap(array, pointer, high);
    return pointer;
}
public static void quickSort(int[] array, int low, int high) {
    if (low < high) {
          // 获取划分子数组的位置
      int position = partition(array, low, high);
      // 左子数组递归调用
      quickSort(array, low, position - 1);
      // 右子数组递归调用
      quickSort(array, position + 1, high);
    }
}

private static void swap(int[] arr, int i, int j) {
        int temp = arr;
        arr = arr;
        arr = temp;
}

// 洗牌算法,将输入的数组随机打乱
private static void shuffle(int[] nums) {
        Random rand = new Random();
        int n = nums.length;
        for (int i = 0 ; i < n; i++) {
                // 生成 的随机数
                int r = i + rand.nextInt(n - i);
                swap(nums, i, r);
        }
}算法分析

当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 $O(n+k)$。计数排序不是比较排序,排序的速度快于任何比较排序算法。由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上 1),这使得计数排序对于数据范围很大的数组,需要大量额外内存空间。

[*]稳定性:稳定,相等元素的相对位置在排序后不会改变
[*]时间复杂度:最佳:$O(n+k)$ 最差:$O(n+k)$ 平均:$O(n+k)$
[*]空间复杂度:O(k)
优化策略

处理负数和极大范围

当数据范围很大或包含负数时,标准计数排序可能面临问题,可以进行如下优化:






排序后的结果
内存优化

当只需要排序结果、不需要保持稳定性时,可以省略输出数组,直接更新原数组:
// Global variable that records the length of an array;
static int heapLen;

/**
* Swap the two elements of an array
* @param arr
* @param i
* @param j
*/
private static void swap(int[] arr, int i, int j) {
    int tmp = arr;
    arr = arr;
    arr = tmp;
}

/**
* Build Max Heap
* @param arr
*/
private static void buildMaxHeap(int[] arr) {
    for (int i = arr.length / 2 - 1; i >= 0; i--) {
      heapify(arr, i);
    }
}

/**
* Adjust it to the maximum heap
* @param arr
* @param i
*/
private static void heapify(int[] arr, int i) {
    int left = 2 * i + 1;
    int right = 2 * i + 2;
    int largest = i;
    if (right < heapLen && arr > arr) {
      largest = right;
    }
    if (left < heapLen && arr > arr) {
      largest = left;
    }
    if (largest != i) {
      swap(arr, largest, i);
      heapify(arr, largest);
    }
}

/**
* Heap Sort
* @param arr
* @return
*/
public static int[] heapSort(int[] arr) {
    // index at the end of the heap
    heapLen = arr.length;
    // build MaxHeap
    buildMaxHeap(arr);
    for (int i = arr.length - 1; i > 0; i--) {
      // Move the top of the heap to the tail of the heap in turn
      swap(arr, 0, i);
      heapLen -= 1;
      heapify(arr, 0);
    }
    return arr;
}桶排序 (Bucket Sort)

桶排序是一种分配式排序算法,将元素分到有限数量的桶里,每个桶再单独排序(比如用插入排序),最后依次把各个桶中的元素取出来即完成排序。
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:

[*]在额外空间充足的情况下,尽量增大桶的数量
[*]使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中
桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行。
算法步骤


[*]设置一个 BucketSize,作为每个桶所能放置多少个不同数值;
[*]遍历输入数据,并且把数据依次映射到对应的桶里去;
[*]对每个非空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
[*]从非空桶里把排好序的数据拼接起来。
图解算法


代码实现

/**
* Gets the maximum and minimum values in the array
*
* @param arr
* @return
*/
private static int[] getMinAndMax(int[] arr) {
    int maxValue = arr;
    int minValue = arr;
    for (int i = 0; i < arr.length; i++) {
      if (arr > maxValue) {
            maxValue = arr;
      } else if (arr < minValue) {
            minValue = arr;
      }
    }
    return new int[] { minValue, maxValue };
}

/**
* Counting Sort
*
* @param arr
* @return
*/
public static int[] countingSort(int[] arr) {
    if (arr.length < 2) {
      return arr;
    }
    int[] extremum = getMinAndMax(arr);
    int minValue = extremum;
    int maxValue = extremum;
    int[] countArr = new int;
    int[] result = new int;

    for (int i = 0; i < arr.length; i++) {
      countArr - minValue] += 1;
    }
    for (int i = 1; i < countArr.length; i++) {
      countArr += countArr;
    }
    for (int i = arr.length - 1; i >= 0; i--) {
      int idx = countArr - minValue] - 1;
      result = arr;
      countArr - minValue] -= 1;
    }
    return result;
}算法分析


[*]稳定性:稳定
[*]时间复杂度:最佳:$O(n+k)$ 最差:$O(n^2)$ 平均:$O(n+k)$
[*]空间复杂度:$O(n+k)$
基数排序 (Radix Sort)

基数排序也是非比较的排序算法,对元素中的每一位数字进行排序,从最低位开始排序,复杂度为 $O(n×k)$,$n$ 为数组长度,$k$ 为数组中元素的最大的位数;
基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。
算法步骤


[*]取得数组中的最大数,并取得位数,即为迭代次数 $N$(例如:数组中最大数值为 1000,则 $N=4$);
[*]A 为原始数组,从最低位开始取每个位组成 radix 数组;
[*]对 radix 进行计数排序(利用计数排序适用于小范围数的特点);
[*]将 radix 依次赋值给原数组;
[*]重复 2~4 步骤 $N$ 次
图解算法


代码实现

public static void countingSortForLargeRange(int[] arr) {
    // 找出数组中的最大值和最小值
    int max = arr, min = arr;
    for (int i = 1; i < arr.length; i++) {
      if (arr > max) {
            max = arr;
      }
      if (arr < min) {
            min = arr;
      }
    }
   
    // 计算范围
    int range = max - min + 1;
   
    // 如果范围过大,可以考虑使用其他排序算法
    if (range > arr.length * 100) {
      // 这里可以调用其他排序算法,如快速排序
      Arrays.sort(arr);
      return;
    }
   
    // 正常的计数排序逻辑
    // ...
}算法分析


[*]稳定性:稳定
[*]时间复杂度:最佳:$O(n×k)$ 最差:$O(n×k)$ 平均:$O(n×k)$
[*]空间复杂度:$O(n+k)$
基数排序 vs 计数排序 vs 桶排序
这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

[*]基数排序:根据键值的每位数字来分配桶
[*]计数排序:每个桶只存储单一键值
[*]桶排序:每个桶存储一定范围的数值

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 十大经典排序算法