素数

素数与合数的定义，见数论基础。

素数计数函数：小于或等于 \(x\) 的素数的个数，用 \(\pi(x)\) 表示。随着 \(x\) 的增大，有这样的近似结果：\(\pi(x) \sim \dfrac{x}{\ln(x)}\)。

素数判定¶

我们自然地会想到，如何用计算机来判断一个数是不是素数呢？

实现¶

暴力做法自然可以枚举从小到大的每个数看是否能整除

C++Python

bool isPrime(a) {
  if (a < 2) return 0;
  for (int i = 2; i < a; ++i)
    if (a % i == 0) return 0;
  return 1;
}

def isPrime(a):
    if a < 2:
        return False
    for i in range(2, a):
        if a % i == 0:
            return False
    return True

这样做是十分稳妥了，但是真的有必要每个数都去判断吗？

很容易发现这样一个事实：如果 \(x\) 是 \(a\) 的约数，那么 \(\frac{a}{x}\) 也是 \(a\) 的约数。

这个结论告诉我们，对于每一对 \((x, \frac{a}{x} )\)，只需要检验其中的一个就好了。为了方便起见，我们之考察每一对里面小的那个数。不难发现，所有这些较小数就是 \([1, \sqrt{a}]\) 这个区间里的数。

由于 \(1\) 肯定是约数，所以不检验它。

C++Python

bool isPrime(a) {
  if (a < 2) return 0;
  for (int i = 2; i * i <= a; ++i)
    if (a % i == 0) return 0;
  return 1;
}

def isPrime(a):
    if a < 2:
        return False
    for i in range(2, int(sqrt(a)) + 1):
        if a % i == 0:
            return False
    return True

素性测试¶

定义¶

素性测试（Primality test）是一类在 不对给定数字进行素数分解（prime factorization）的情况下，测试其是否为素数的算法。

素性测试有两种：

确定性测试：绝对确定一个数是否为素数。常见示例包括 Lucas–Lehmer 测试和椭圆曲线素性证明。
概率性测试：通常比确定性测试快很多，但有可能（尽管概率很小）错误地将合数识别为质数（尽管反之则不会）。因此，通过概率素性测试的数字被称为 可能素数，直到它们的素数可以被确定性地证明。而通过测试但实际上是合数的数字则被称为 伪素数。有许多特定类型的伪素数，最常见的是费马伪素数，它们是满足费马小定理的合数。概率性测试的常见示例包括 Miller–Rabin 测试。

接下来我们将着重介绍几个概率性素性测试：

Fermat 素性测试¶

Fermat 素性检验 是最简单的概率性素性检验。

我们可以根据费马小定理得出一种检验素数的思路：

基本思想是不断地选取在 \([2, n-1]\) 中的基 \(a\)，并检验是否每次都有 \(a^{n-1} \equiv 1 \pmod n\)。

实现¶

C++Python

bool millerRabin(int n) {
  if (n < 3) return n == 2;
  // test_time 为测试次数,建议设为不小于 8
  // 的整数以保证正确率,但也不宜过大,否则会影响效率
  for (int i = 1; i <= test_time; ++i) {
    int a = rand() % (n - 2) + 2;
    if (quickPow(a, n - 1, n) != 1) return 0;
  }
  return 1;
}

def millerRabin(n):
    if n < 3:
        return n == 2
    # test_time 为测试次数,建议设为不小于 8
    # 的整数以保证正确率,但也不宜过大,否则会影响效率
    for i in range(1, test_time + 1):
        a = random.randint(0, 32767) % (n - 2) + 2
        if quickPow(a, n - 1, n) != 1:
            return False
    return True

如果 \(a^{n−1} \bmod n = 1\) 但 \(n\) 不是素数，则 \(n\) 被称为以 \(a\) 为底的 伪素数。我们在实践中观察到，如果 \(a^{n−1} \bmod n = 1\)，那么 \(n\) 通常是素数。但这里也有个反例：如果 \(n = 341\) 且 \(a = 2\)，即使 \(341 = 11 \cdot 31\) 是合数，有 \(2^{340}\equiv 1 {\pmod {341}}\)。事实上，\(341\) 是最小的伪素数基数。

很遗憾，费马小定理的逆定理并不成立，换言之，满足了 \(a^{n-1} \equiv 1 \pmod n\)，\(n\) 也不一定是素数。

卡迈克尔数¶

上面的做法中随机地选择 \(a\)，很大程度地降低了犯错的概率。但是仍有一类数，上面的做法并不能准确地判断。

对于合数 \(n\)，如果对于所有正整数 \(a\)，\(a\) 和 \(n\) 互素，都有同余式 \(a^{n-1} \equiv 1 \pmod n\) 成立，则合数 \(n\) 为 卡迈克尔数（Carmichael Number），又称为 费马伪素数。

比如，\(561 = 3 \times 11 \times 17\) 就是一个卡迈克尔数。

而且我们知道，若 \(n\) 为卡迈克尔数，则 \(m=2^{n}-1\) 也是一个卡迈克尔数，从而卡迈克尔数的个数是无穷的。（OEIS:A006931）

Miller–Rabin 素性测试¶

Miller–Rabin 素性测试（Miller–Rabin primality test）是进阶的素数判定方法。它是由 Miller 和 Rabin 二人根据费马小定理的逆定理（费马测试）优化得到的。因为和许多类似算法一样，它是使用伪素数的概率性测试，我们必须使用慢得多的确定性算法来保证素性。然而，实际上没有已知的数字通过了高级概率性测试（例如 Miller–Rabin）但实际上却是复合的。因此我们可以放心使用。

对数 n 进行 k 轮测试的时间复杂度是 \(O(k \log^3n)\)，利用 FFT 等技术可以优化到 \(O(k \log^2n \log \log n \log \log \log n)\)。

二次探测定理¶

如果 \(p\) 是奇素数，则 \(x^2 \equiv 1 \pmod p\) 的解为 \(x \equiv 1 \pmod p\) 或者 \(x \equiv p - 1 \pmod p\)。

要证明该定理，只需将上面的方程移项，再使用平方差公式，得到 \((x+1)(x-1) \equiv 0 \bmod p\)，即可得出上面的结论。

实现¶

根据卡迈克尔数的性质，可知其一定不是 \(p^e\)。

不妨将费马小定理和二次探测定理结合起来使用：

将 \(a^{n-1} \equiv 1 \pmod n\) 中的指数 \(n−1\) 分解为 \(n−1=u \times 2^t\)，在每轮测试中对随机出来的 \(a\) 先求出 \(v = a^{u} \bmod n\)，之后对这个值执行最多 \(t\) 次平方操作，若发现非平凡平方根时即可判断出其不是素数，否则再使用 Fermat 素性测试判断。

还有一些实现上的小细节：

对于一轮测试，如果某一时刻 \(a^{u \times 2^s} \equiv n-1 \pmod n\)，则之后的平方操作全都会得到 \(1\)，则可以直接通过本轮测试。
如果找出了一个非平凡平方根 \(a^{u \times 2^s} \not\equiv n-1 \pmod n\)，则之后的平方操作全都会得到 \(1\)。可以选择直接返回 false，也可以放到 \(t\) 次平方操作后再返回 false。

这样得到了较正确的 Miller Rabin：（来自 fjzzq2002）

C++Python

bool millerRabin(int n) {
  if (n < 3 || n % 2 == 0) return n == 2;
  int u = n - 1, t = 0;
  while (u % 2 == 0) u /= 2, ++t;
  // test_time 为测试次数，建议设为不小于 8
  // 的整数以保证正确率，但也不宜过大，否则会影响效率
  for (int i = 0; i < test_time; ++i) {
    int a = rand() % (n - 2) + 2, v = quickPow(a, u, n);
    if (v == 1) continue;
    int s;
    for (s = 0; s < t; ++s) {
      if (v == n - 1) break; // 得到平凡平方根 n-1，通过此轮测试
      v = (long long)v * v % n;
    }
    // 如果找到了非平凡平方根，则会由于无法提前 break; 而运行到 s == t
    // 如果 Fermat 素性测试无法通过，则一直运行到 s == t 前 v 都不会等于 -1
    if (s == t) return 0;
  }
  return 1;
}

def millerRabin(n):
    if n < 3 or n % 2 == 0:
        return n == 2
    u, t = n - 1, 0
    while u % 2 == 0:
        u = u // 2
        t = t + 1
    # test_time 为测试次数,建议设为不小于 8
    # 的整数以保证正确率,但也不宜过大,否则会影响效率
    for i in range(test_time):
        a = random.randint(2, n - 1)
        v = pow(a, u, n)
        if v == 1:
            continue
        s = 0
        while s < t:
            if v == n - 1:
                break
            v = v * v % n
            s = s + 1
        # 如果找到了非平凡平方根，则会由于无法提前 break; 而运行到 s == t
        # 如果 Fermat 素性测试无法通过，则一直运行到 s == t 前 v 都不会等于 -1
        if s == t:
            return False
    return True

另外，假设广义 Riemann 猜想（generalized Riemann hypothesis, GRH）成立，则对数 \(n\) 最多只需要测试 \([2, \min\{n-2, \lfloor 2\ln^2 n \rfloor\}]\) 中的全部整数即可确定数 \(n\) 的素性，证明参见注释 7。

而在 OI 范围内，通常都是对 \([1, 2^{64})\) 范围内的数进行素性检验。对于 \([1, 2^{32})\) 范围内的数，选取 \(\{2, 7, 61\}\) 三个数作为基底进行 Miller–Rabin 素性检验就可以确定素性；对于 \([1, 2^{64})\) 范围内的数，选取 \(\{2, 325, 9375, 28178, 450775, 9780504, 1795265022\}\) 七个数作为基底进行 Miller–Rabin 素性检验就可以确定素性。参见注释 8。

也可以选取 \(\{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37\}\)（即前 \(12\) 个素数）检验 \([1, 2^{64})\) 范围内的素数。

注意如果要使用上面的数列中的数 \(a\) 作为基底判断 \(n\) 的素性：

所有的数都要取一遍，不能只选小于 \(n\) 的；
把 \(a\) 换成 \(a \bmod n\)；
如果 \(a \equiv 0 \pmod n\)，则直接通过该轮测试。

反素数¶

定义¶

如果某个正整数 \(n\) 满足如下条件，则称为是 反素数：任何小于 \(n\) 的正数的约数个数都小于 \(n\) 的约数个数。

注：注意区分 emirp，它是用来表示从后向前写读是素数的数。

引入¶

其实顾名思义，素数就是因子只有两个的数，那么反素数，就是因子最多的数（并且因子个数相同的时候值最小），所以反素数是相对于一个集合来说的。

我所理解的反素数定义就是，在一个集合中，因素最多并且值最小的数，就是反素数。

过程¶

那么，如何来求解反素数呢？

首先，既然要求因子数，我首先想到的就是素因子分解。把 \(n\) 分解成 \(n=p_{1}^{k_{1}}p_{2}^{k_{2}} \cdots p_{n}^{k_{n}}\) 的形式，其中 \(p\) 是素数，\(k\) 为他的指数。这样的话总因子个数就是 \((k_1+1) \times (k_2+1) \times (k_3+1) \cdots \times (k_n+1)\)。

但是显然质因子分解的复杂度是很高的，并且前一个数的结果不能被后面利用。所以要换个方法。

我们来观察一下反素数的特点。

反素数肯定是从 \(2\) 开始的连续素数的幂次形式的乘积。
数值小的素数的幂次大于等于数值大的素数，即 \(n=p_{1}^{k_{1}}p_{2}^{k_{2}} \cdots p_{n}^{k_{n}}\) 中，有 \(k_1 \geq k_2 \geq k_3 \geq \cdots \geq k_n\)

解释：

如果不是从 \(2\) 开始的连续素数，那么如果幂次不变，把素数变成数值更小的素数，那么此时因子个数不变，但是 \(n\) 的数值变小了。交换到从 \(2\) 开始的连续素数的时候 \(n\) 值最小。
如果数值小的素数的幂次小于数值大的素数的幂，那么如果把这两个素数交换位置（幂次不变），那么所得的 \(n\) 因子数量不变，但是 \(n\) 的值变小。

另外还有两个问题，

对于给定的 \(n\)，要枚举到哪一个素数呢？

最极端的情况大不了就是 \(n=p_{1}p_{2} \cdots p_{n}\)，所以只要连续素数连乘到刚好小于等于 \(n\) 就可以的呢。再大了，连全都一次幂，都用不了，当然就是用不到的啦！
我们要枚举到多少次幂呢？

我们考虑一个极端情况，当我们最小的素数的某个幂次已经比所给的 \(n\)（的最大值）大的话，那么展开成其他的形式，最大幂次一定小于这个幂次。unsigned long long 的最大值是 \(2^{64} - 1\)，所以我这边习惯展开成 \(2^{64} - 1\)。

细节有了，那么我们具体如何具体实现呢？

我们可以把当前走到每一个素数前面的时候列举成一棵树的根节点，然后一层层的去找。找到什么时候停止呢？

当前走到的数字已经大于我们想要的数字了
当前枚举的因子已经用不到了（和 \(1\) 重复了嘻嘻嘻）
当前因子大于我们想要的因子了
当前因子正好是我们想要的因子（此时判断是否需要更新最小 \(ans\)）

然后 dfs 里面不断一层一层枚举次数继续往下迭代可以。

常见题型¶

求因子数一定的最小数

例题 Codeforces 27E. A number with a given number of divisors

求具有给定除数的最小自然数。请确保答案不超过 \(10^{18}\)。

解题思路

对于这种题，我们只要以因子数为 dfs 的返回条件基准，不断更新找到的最小值就可以了

参考代码

#include <stdio.h>
unsigned long long p[16] = {
    2,  3,  5,  7,  11, 13, 17, 19,
    23, 29, 31, 37, 41, 43, 47, 53};  // 根据数据范围可以确定使用的素数最大为53

unsigned long long ans;
unsigned long long n;

// depth: 当前在枚举第几个素数
// temp: 当前因子数量为 num的时候的数值
// num: 当前因子数
// up：上一个素数的幂，这次应该小于等于这个幂次嘛
void dfs(unsigned long long depth, unsigned long long temp,
         unsigned long long num, unsigned long long up) {
  if (num > n || depth >= 16) return;  // 边界条件
  if (num == n && ans > temp) {        // 取最小的ans
    ans = temp;
    return;
  }
  for (int i = 1; i <= up; i++) {
    if (temp * p[depth] > ans)
      break;  // 剪枝：如果加一个这个乘数的结果比ans要大，则必不是最佳方案
    dfs(depth + 1, temp = temp * p[depth], num * (i + 1),
        i);  // 取一个该乘数，进行对下一个乘数的搜索
  }
}

int main() {
  scanf("%llu", &n);
  ans = ~(unsigned long long)0;
  dfs(0, 1, 1, 64);
  printf("%llu\n", ans);
  return 0;
}

求 n 以内因子数最多的数

例题 ZOJ - More Divisors

大家都知道我们使用十进制记数法，即记数的基数是 \(10\)。历史学家说这是因为人有十个手指，也许他们是对的。然而，这通常不是很方便，十只有四个除数——\(1\)、\(2\)、\(5\) 和 \(10\)。因此，像 \(\frac{1}{3}\)、\(\frac{1}{4}\) 或 \(\frac{1}{6}\) 这样的分数不便于用十进制表示。从这个意义上说，以 \(12\)、\(24\) 甚至 \(60\) 为底会方便得多。主要原因是这些数字的除数要大得多——分别是 \(6\)、\(8\) 和 \(12\)。请回答：除数最多的不超过 \(n\) 的数是多少？

解题思路

思路同上，只不过要改改 dfs 的返回条件。注意这样的题目的数据范围，我一开始用了 int，应该是溢出了，在循环里可能就出不来了就超时了。上代码，0ms 过。注释就没必要写了上面写的很清楚了。

参考代码

#include <cstdio>
#include <iostream>

int p[16] = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53};
unsigned long long n;
unsigned long long ans,
    ans_num;  // ans 为 n 以内的最大反素数（会持续更新），ans_sum 为
              // ans的因子数。

// depth: 当前在枚举第几个素数
// temp: 当前因子数量为 num的时候的数值
// num: 当前因子数
// up：上一个素数的幂，这次应该小于等于这个幂次嘛
void dfs(int depth, unsigned long long temp, unsigned long long num, int up) {
  if (depth >= 16 || temp > n) return;
  if (num > ans_num) {  // 更新答案
    ans = temp;
    ans_num = num;
  }
  if (num == ans_num && ans > temp) ans = temp;  // 更新答案
  for (int i = 1; i <= up; i++) {
    if (temp * p[depth] > n)
      break;  // 剪枝：如果加一个这个乘数的结果比ans要大，则必不是最佳方案
    dfs(depth + 1, temp *= p[depth], num * (i + 1),
        i);  // 取一个该乘数，进行对下一个乘数的搜索
  }
  return;
}

int main() {
  while (scanf("%llu", &n) != EOF) {
    ans_num = 0;
    dfs(0, 1, 1, 60);
    printf("%llu\n", ans);
  }
  return 0;
}

参考资料与注释¶

Rui-Juan Jing, Marc Moreno-Maza, Delaram Talaashrafi, "Complexity Estimates for Fourier-Motzkin Elimination", Journal of Functional Programming 16:2 (2006) pp 197-217.
数论部分第一节：素数与素性测试
Miller-Rabin 与 Pollard-Rho 学习笔记 - Bill Yang's Blog
Primality test - Wikipedia
桃子的算法笔记——反素数详解（acm/OI）
The Rabin-Miller Primality Test
Bach, Eric , "Explicit bounds for primality testing and related problems", Mathematics of Computation, 55:191 (1990) pp 355–380.
Deterministic variant of the Miller-Rabin primality test