质数判定和快速质因数分解

First Post:

2025-08-11

Last Update:

2025-08-20

Word Count:

1.9k

Read Time:

7 min

Page View: loading...

质数的定义

通常，我们在正整数上定义质数与合数：

若正整数除了和没有其他正约数，那么称为质数（或素数、不可约数）。

若正整数且不是质数，则称是合数。

OI-wikioi-wiki.org/math/number-theory/basic

质数有一些有名的性质：

对于合数，存在满足；
大于的质数总可以表示为的形式，这是显然的，其中一个易得而不显然的结论是大于的质数对取模的结果总是；
质数有无穷多个。

质数个数

设表示小于或等于的质数的数量，随着的增大，有。

素性判定

所谓素性判定算法，就是判断给定数字是否为质数的算法。

暴力枚举

根据性质一，只需要枚举到以内的数即可。

bool is_prime(uint64_t n) {
  for (uint64_t p = 2; p * p <= n; ++p)
    if (n % p == 0)
      return false;
  return true;
}

优化 1

在对试除后，我们显然可以不再使用偶数试除。

bool is_prime(uint64_t n) {
  if (n % 2 == 0)
    return n == 2;
  for (uint64_t p = 3; p * p <= n; p += 2)
    if (n % p == 0)
      return false;
  return true;
}

优化 2

由于大于的质数只可能是的形式，因此可以进一步优化。

这个常数上优化应该不大，不给出实现了。

枚举质数

这个在复杂度上是有优化的，因此与暴力枚举分开。

可以将以内的质数全部使用筛法预处理掉，根据前文结论，这个量级大概是的。

预处理质数后分解质因数的效率未必劣于 Pollard Rho 算法。

这种方法的一个神秘优化是在预处理质数的同时预处理其快速取模算法，不知道常数上的优化效果。

上述两种方法亦能分解质因数，假如出题人懒得造全质数的测试点，平均情况下的运行效率较高。

好像有定理指出，在区间随机选择的正整数的最大质因子期望渐进为。

因此在期望意义下只会枚举到的因数。

实践上，对于少量以内的随机数，用这些方法分解质因数的效率是可以接受的。

筛法

上文中提到了筛法，但是没有给出实现。

for (size_t i = 2; i * i <= N; ++i)
  if (!vis[i])
    for (size_t j = i * i; j <= N; j += i)
      vis[j] = true;

这种方法的理论渐进复杂度为的，但在 OI 常见数据范围内，通常效率比的欧拉筛来的快。

给出线性筛的常见写法：

for (size_t i = 2; i <= N; ++i) {
  if (!vis[i])
    prime.push_back(i);
  for (size_t j : i) {
    if (i * j > N)
      break;
    vis[i * j] = true;
    if (i % j == 0)
      break;
  }
}

线性筛的常用领域是递推求数论函数。

素性判定算法（素性测试）

在较大的情形，我们常常需要效率更高的算法判断一个数是否为质数。

对于梅森素数形式的数（形如，为质数），有一个叫做 Lucas–Lehmer 测试的方法判定其是否为素数，其时间复杂度是的，相对于输入是的（本文暂且忽略大整数计算的时间复杂度，即采用算术计算的计算模型）。

尽管这个方法只能判断梅森素数，但它的时间复杂度比其他方法都要小，因此最大的梅森素数也是人类目前已知的最大的素数。

对于一般的大质数（对于 OI，一般是以内）常见的方法是 Miller–Rabin 测试。

Fermat 测试

先引入 Fermat 测试。

由于质数总是满足 Fermat 小定理的，因此若一个数不满足费马小定理，则它一定不是质数。

因此我们随机选取 base ，检验是否。

这个方法的时间复杂度是。

然而，存在一类“伪质数” ^{[1]oeis-A002997，Carmichael 数}，满足对于任意 base ，满足。

这样，这类“伪质数”只有我们随机选择时恰好选到与不互质的 base 才能判断，判断次数期望可能到达左右。

因此，我们需要对 Fermat 测试进行优化。

Miller–Rabin 测试

引入二次探测定理。

对于奇质数，的解只有和

只需将方程移项，得，由为奇质数，命题得证。

因此，我们记，先计算，若其与同余，则通过本轮测试；否则，将其不断平方到，若过程中未出现或结果不为，则本轮测试不通过，不然通过。

bool millerRabin(int n) {
  if (n < 3 || !(n & 1)) return n == 2;
  if (n % 3 == 0) return n == 3;
  int u = n - 1, t = 0;
  while (!(u & 1)) u >>=1, ++t;
  for (int i = 0; i < test_time; ++i) {
    int a = rand() % (n - 3) + 2, v = quickPow(a, u, n);
    if (v == 1) continue;
    int s;
    for (s = 0; s < t; ++s) {
      if (v == n - 1) break;
      v = (long long)v * v % n;
    }
    if (s == t) return false;
  }
  return true;
}

这里请假装 rand 是均匀随机的^{[2]在 Windows 下，rand 函数的值域很小，只有左右}。

根据 OI-wiki 上的注释，若 GRH 成立，则只需要使用内的所有整数作为 base 即可确定的素性。

仍然是 OI-wiki 的注释，对于以内的判断，只需要使用或前个质数作为 base；

对于内的判断。只需要使用即可，或者使用前个质数。

这里有一些我曾见过的强伪素数：

46856248255981
341550071728321
84983557412237221
230245660726188031
1134931906634489281
1144336081150073701
1167748053436849501
1646697619851137101
3825123056546413051
4265186605968234451
5474093792130026911
7033671664103127781
7361235187296010651
8276442534101054431
14688059738864848381
16043083915816662841

假如卡常需要不打算使用太多测试，不应该使用固定的 base，即使有时为了方便成绩申诉不愿写随机 base，也尽量不要选择太常用的 base，如，卡掉是容易的。

随机 base 的 Miller-Rabin 通常不好卡。

快速质因数分解

SPF 表

若时空允许，可以考虑或将每个数的最小质因子（spf）预处理出来（筛法）。

这样可以做到对每个数在质因数个数的复杂度内完成分解，最差情形，复杂度是的（质因子全为）。

Pollard Rho 算法

~~当代 OI 好像没啥应用空间，但是万一需要卡常呢。~~

简单来讲，对于非质数（使用素性判断确认），其最小质因子不超过。利用生日悖论的结论，可以在的复杂度极大概率试出的一个非平凡因子。

具体来讲，生日悖论，即下述反直觉的 事实: 假定一年有天，则只需要个人，其中存在两人生日相同的概率就超过；这个结论指出，从的整数中随机选数，期望选择次后，会出现两个相同的数。

int64_t Pollard_Rho(int64_t x) {
  int64_t s = 0, t = 0;
  int64_t c = (int64_t)rand() % (x - 1) + 1;
  int step = 0, goal = 1;
  int64_t val = 1;
  for (goal = 1;; goal <<= 1, s = t, val = 1) {
    for (step = 1; step <= goal; ++step) {
      t = ((__int128)t * t + c) % x;
      val = (__int128)val * abs(t - s) % x;
      if ((step % 127) == 0) {
        int64_t d = gcd(val, x);
        if (d > 1) return d;
      }
    }
    int64_t d = gcd(val, x);
    if (d > 1) return d;
  }
}

请继续假定 rand() % (x - 1) 生成的数是均匀的，不过应该没人对着这个卡。

对于那种两个相同量级的大质数相乘得到的数，Pollard Pho 的复杂度期望为。

毕竟是期望，可以看作有个大常数。

对于 Pollard Rho 非正解的题目，需要做好被卡的准备。

1.oeis-A002997，Carmichael 数 ↩
2.在 Windows 下，rand 函数的值域很小，只有左右 ↩

≡