CountingSort

计数排序(Counting sort)是一种稳定的线性时间排序算法。该算法于1954年由 Harold H. Seward 提出。计数排序使用一个额外的数组 C ,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。

计数排序(Counting sort)

基本原理

使用一个新的数组记录每个元素出现的次数,然后直接遍历输出这个数组里面的每一个大于 0 的元素的下标值,下标值输出的次数为对应的计数。

算法步骤

  • 花 O(n) 的时间扫描一下整个序列 arr,获取最小值 min 和最大值 max
  • 开辟一块新的空间创建新的数组 counts,长度为 ( max - min + 1)
  • 数组 counts 中 下标为 index 的元素记录的值是 arr 中元素值为 index 出现的次数
  • 最后输出目标整数序列,具体的逻辑是遍历数组 counts,输出相应计数次的元素下标值

动画演示

CountingSort

参考实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
import java.util.Arrays;

/**
* @author wylu
*/
public class CountingSort {

public static void unstableSort(int[] arr) {
int min = arr[0], max = arr[0];
for (int i = 1; i < arr.length; i++) {
if (arr[i] < min) min = arr[i];
if (arr[i] > max) max = arr[i];
}

int[] counts = new int[max - min + 1];
for (int e : arr){
counts[e - min]++;
}

for (int i = 0, j = 0; i < counts.length; i++) {
while ((counts[i]--) > 0) {
arr[j++] = i + min;
}
}
}

public static void stableSort(int[] arr) {
int min = arr[0], max = arr[0];
for (int e : arr) {
if (e < min) min = e;
if (e > max) max = e;
}

int[] counts = new int[max - min + 1];
//counts[i]保存着arr中等于 i+min 的元素个数
for (int e : arr) {
counts[e - min]++;
}

//counts[i]保存着小于等于 i+min 的元素个数
for (int i = 1; i < counts.length; i++) {
counts[i] += counts[i - 1];
}

//分配临时空间,暂存中间数据
int[] tmp = new int[arr.length];
for (int i = arr.length - 1; i >= 0; i--) {
//从后向前扫描保证计数排序的稳定性(重复元素相对次序不变)
//把每个元素arr[i]放到它在临时数组tmp中的正确位置上
//当再遇到重复元素时会被放在当前元素的前一个位置上保证计数排序的稳定性
tmp[--counts[arr[i] - min]] = arr[i];
}
System.arraycopy(tmp, 0, arr, 0, tmp.length);
}

public static void main(String[] args) {
int[] arr = {5, 3, 4, 7, 2, 4, 3, 4, 7};
CountingSort.stableSort(arr);
System.out.println(Arrays.toString(arr));
}
}

复杂度分析

排序算法 平均时间复杂度 最好情况 最坏情况 空间复杂度 排序方式 稳定性
计数排序 \(O(n+k)\) \(O(n+k)\) \(O(n+k)\) \(O(k)\) Out-place 稳定

扫描了两次数组 arr ,一次数组 counts ,所以时间复杂度为 \(2*n+n+k\) (扫描数组 counts 的时间复杂度是 \(n+k\) )。

References

https://en.wikipedia.org/wiki/Counting_sort

https://youliao.163yun.com/api-server/rss/xiaomi/item/IN2WDOMKAWVNTZV.html?ref=browser_news&s=mb&cp=cn-netease-youliao-browser&docid=44797c69e120935b2c4790d933d02a9b&itemtype=news&cateCode=rec&category=%E7%A7%91%E6%8A%80

https://mp.weixin.qq.com/s?__biz=MzI1MTIzMzI2MA==&mid=2650562543&idx=1&sn=c82892b85e1de790766896c6d80d7b3c&chksm=f1fee96cc689607a11ccc109098d070d38ef0bad61c0390fe01348b631bbd492945b6f2b0601&scene=0#rd