计数排序
Warning
本页面要介绍的不是 基数排序。
本页面将简要介绍计数排序。
定义¶
计数排序(英语:Counting sort)是一种线性时间的排序算法。
过程¶
计数排序的工作原理是使用一个额外的数组 \(C\),其中第 \(i\) 个元素是待排序数组 \(A\) 中值等于 \(i\) 的元素的个数,然后根据数组 \(C\) 来将 \(A\) 中的元素排到正确的位置。1
它的工作过程分为三个步骤:
- 计算每个数出现了几次;
- 求出每个数出现次数的 前缀和;
- 利用出现次数的前缀和,从右至左计算每个数的排名。
计算前缀和的原因¶
阅读本章内容只需要了解前缀和概念即可
直接将 \(C\) 中正数对应的元素依次放入 \(A\) 中不能解决元素重复的情形。
我们通过为额外数组 \(C\) 中的每一项计算前缀和,结合每一项的数值,就可以为重复元素确定一个唯一排名:
额外数组 \(C\) 中每一项的数值即是该 key 值下重复元素的个数,而该项的前缀和即是排在最后一个的重复元素的排名。
如果按照 \(A\) 的逆序进行排列,那么显然排序后的数组将保持 \(A\) 的原序(相同 key 值情况下),也即得到一种稳定的排序算法。
性质¶
稳定性¶
计数排序是一种稳定的排序算法。
时间复杂度¶
计数排序的时间复杂度为 \(O(n+w)\),其中 \(w\) 代表待排序数据的值域大小。
代码实现¶
伪代码¶
\[ \begin{array}{ll} 1 & \textbf{Input. } \text{An array } A \text{ consisting of }n\text{ positive integers no greater than } w. \\ 2 & \textbf{Output. } \text{Array }A\text{ after sorting in nondecreasing order stably.} \\ 3 & \textbf{Method. } \\ 4 & \textbf{for }i\gets0\textbf{ to }w\\ 5 & \qquad cnt[i]\gets0\\ 6 & \textbf{for }i\gets1\textbf{ to }n\\ 7 & \qquad cnt[A[i]]\gets cnt[A[i]]+1\\ 8 & \textbf{for }i\gets1\textbf{ to }w\\ 9 & \qquad cnt[i]\gets cnt[i]+cnt[i-1]\\ 10 & \textbf{for }i\gets n\textbf{ downto }1\\ 11 & \qquad B[cnt[A[i]]]\gets A[i]\\ 12 & \qquad cnt[A[i]]\gets cnt[A[i]]-1\\ 13 & \textbf{return } B \end{array} \]
const int N = 100010;
const int W = 100010;
int n, w, a[N], cnt[W], b[N];
void counting_sort() {
memset(cnt, 0, sizeof(cnt));
for (int i = 1; i <= n; ++i) ++cnt[a[i]];
for (int i = 1; i <= w; ++i) cnt[i] += cnt[i - 1];
for (int i = n; i >= 1; --i) b[cnt[a[i]]--] = a[i];
}
N = W = 100010
n = w = 0
a = b = [0] * N
cnt = [0] * W
def counting_sort():
for i in range(1, n + 1):
cnt[a[i]] += 1
for i in range(1, w + 1):
cnt[i] += cnt[i - 1]
for i in range(n, 0, -1):
b[cnt[a[i]] - 1] = a[i]
cnt[a[i]] -= 1