在自然数列的前n项中寻找全部素数的算法称为素数筛。
最朴素的筛法是逐项施用试除法,效率显然很低。
古希腊数学家Ἐρατοσθένους发明了更快的埃氏筛,后由Euler改进成线性筛。
线性筛相比埃氏筛,不会重复标记合数,时间复杂度降至O(n)。
埃氏筛的时间复杂度是O(nloglogn),推导过程详见OI Wiki:筛法
实现
为达O(n)时间复杂度,我们恪守最小质因数筛除原则,筛除质数之倍数时便能避免重复标记。
伪代码如下:
// 给定上限to,寻找前to项的全部素数
fn linear_sieve(to: Index) -> Sequence {
let composites = Set;
let primes = Sequence;
// 因为总循环从2开始,合数从前往后筛,
for i in 2..=to {
// 我们能假设未筛除者皆为质数
if i not in composites {
primes.push(i);
}
for prime in { primes 且 i * prime <= to } {
// 用当前项乘已知素数,标记所得合数;
composites.insert(i * prime);
if i % prime == 0 { // *
break;
}
}
}
return primes;
}
原理
线性筛的核心在于,只允许合数被它的最小质因数筛除,故而编程时是不保证合数按大小次序筛除的。
例如,对 an = 4,2筛除了8,*
处代码会立即结束内循环,以保证2能在之后乘6筛除12。
为什么要在此时结束循环?因为核心原则。注意,每次内循环,都有固定的因数an,而作为另一因数的质数按升序取用。一旦遇见因数不互质的情况,即质数p整除 an,说明此次外循环的最小质因数筛除已达上限。
重返例子 an = 4,已知素数乘其可得8、12,但12的最小质因数是2,应该由2筛除,故内循环没必要继续。根据质数分解定理,最小质因数蕴含于当前项。
合数表在前**⌜n / 2⌝**项便已完成,遍历前n项是为了集齐质数表。
参考