「数学::质数」埃氏筛|欧拉筛（埃拉托斯特尼筛法|线性筛法）/ LeetCode 204（C++）

概述

1.埃氏筛

思路

复杂度

Code

2.欧拉筛（线性筛）

思路

复杂度

Code

总结

概述

上一节我们介绍了对判断一个数是否为质数的方法：「数学::质数」试除法 / Luogu P5736（C++）

那如果我们期望输出一个范围内的所有质数，使用试除法的时间复杂度是n√n，怎么办呢？

LeetCode 204：

给定整数 n ，返回 所有小于非负整数 n 的质数的数量 。

示例 1：

输入：n = 10
输出：4
解释：小于 10 的质数一共有 4 个, 它们是 2, 3, 5, 7 。

1.埃氏筛

思路

质数的倍数一定不是质数；反之，一个数不是任何比它小的质数的倍数，它一定是质数。

定义bool not_prim数组，not_prim[i]值为真，表示i不是质数；值为假，表示i是质数。

从i=2遍历到n:

如果not_prim[i]=false，表示它不是之前的任何一个数的倍数，也就是没有被筛掉，则它是质数，加入答案，再枚举它的倍数，将之筛掉。

如果not_prim[i]=true，表示它不是质数，直接枚举他的倍数，将之筛掉。

在枚举i的倍数依次筛掉时，我们可以直接从i^2开始枚举，因为i到i^2之间的数已经被i前面的数筛过了。下附证明

证明：

设有质数b，则kb为其整数倍(k=2,3...b-1)，即: 2b<=kb<=(b-1)*b。

注意到，k可表示为小于b的某一质数a的t倍。即：k=at(t>=1)。

则kb=atb，令tb=u，有kb=ua，其中u为a的某一倍数，因此筛a的倍数时已经筛掉了kb。

*注意*：我们只计算n以内的质数，因此ua=kb<n。

复杂度

时间复杂度: O(nlog(logn))

空间复杂度: O(n)

时间复杂度证明详见OI Wikihttps://oi-wiki.org/math/number-theory/sieve/，此处略去不表

Code

const int N=5e6+1;
class Solution {bool not_prim[N]={1,1,0};vector<int>prim;
public:int countPrimes(int n) {for(int i=2;i<n;i++){if(!not_prim[i])prim.push_back(i);for(long long j=1LL*i*i;j<n;j+=i)//1ll是为了防爆intnot_prim[j]=true;}return prim.size();}
};

2.欧拉筛（线性筛）

思路

埃氏筛进行了很多次无用的筛数，比如说枚举2的倍数后已经不必再枚举4的倍数了。

欧拉想了一个方法：限制每个数的枚举上限。

比如说限制2的枚举倍数，使得4的倍数不会被2全部枚举一遍，这样每个数都只枚举几次，使得时间复杂度达到线性级别，故又称线性筛。

bool not_prim数组和筛倍数的策略仍然保持不变，但是我们多了两条原则：

①：i不仅用于枚举[2,n)的所有数是否为质数，也作为倍数用来筛数。

这是指双层for循环，外层i枚举所有数，内层j枚举所有已获得的质数，令not_prim[prim[j]*i]=true;

*注意*：埃氏筛中，i枚举所有数，j枚举倍数；欧拉筛中，i枚举所有数，同时作为倍数，j则枚举已知质数。

②：i%prim[j]==0时停止继续枚举j，保证每个合数都被他的最小质因子筛掉。

我们重点讲一下这个原则：

考虑：

i会枚举[2,n)之间的所有数，那i自然就可以表示倍数k，那么对于每个i都枚举已知的prim[j]进行筛倍数是合理又合法的。

遍历到i时，已经知晓了[2,i]之间的所有数是否是质数。同时可以确定的是，prim[j]必定是小于等于i的质数，且其中元素升序排序。

在我们筛掉i*prim[j]=x后，如果i%prim[j]==0，即i=k*prim[j]，就不必再筛i*prim[j+1]=y了，因为i*prim[j+1]可以被分解为k*prim[j]*prim[j+1]，即k*prim[j+1]*prim[j]，其中k*prim[j+1]将是后续的某个i值。

如i=6是prime[1]=3的倍数，我们在筛完i*prim[1]=18之后，不必再筛i*prim[2]=30了，因为当i=10时，30会被i*prim[1]筛掉。

      j  0 1 2 3 
prime[j] 2 3 5 7

复杂度

时间复杂度: O(n)

空间复杂度: O(n)

Code

const int N=5e6+1;
class Solution {bool not_prim[N]={0};vector<int>prim;
public:int countPrimes(int n) {for(int i=2;i<n;i++){if(!not_prim[i])prim.push_back(i);for(int j=0;prim[j]*i<n;j++){not_prim[prim[j]*i]=true;if(!(i%prim[j]))break;}}return prim.size();}
};

*注意*：使用vector存储所有质数是为了减小空间复杂度，如果你希望达到欧拉筛的最优性能，可以开一个巨大的定长数组存储质数。