线性筛 | 三维天空

在自然数列的前n项中寻找全部素数的算法称为素数筛。

最朴素的筛法是逐项施用试除法，效率显然很低。

古希腊数学家Ἐρατοσθένους发明了更快的埃氏筛，后由Euler改进成线性筛。

线性筛相比埃氏筛，不会重复标记合数，时间复杂度降至O(n)。

埃氏筛的时间复杂度是O(nloglogn)，推导过程详见OI Wiki：筛法

实现

为达O(n)时间复杂度，我们恪守最小质因数筛除原则，筛除质数之倍数时便能避免重复标记。

伪代码如下：

// 给定上限to，寻找前to项的全部素数
fn linear_sieve(to: Index) -> Sequence {
    let composites = Set;
    let primes = Sequence;

    // 因为总循环从2开始，合数从前往后筛，
    for i in 2..=to {
        // 我们能假设未筛除者皆为质数
        if i not in composites {
            primes.push(i);
        }

        for prime in { primes 且 i * prime <= to } {
            // 用当前项乘已知素数，标记所得合数；
            composites.insert(i * prime);

            if i % prime == 0 { // *
                break;
            }
        }
    }

    return primes;
}

原理

线性筛的核心在于，只允许合数被它的最小质因数筛除，故而编程时是不保证合数按大小次序筛除的。

例如，对 a_n = 4，2筛除了8，*处代码会立即结束内循环，以保证2能在之后乘6筛除12。

为什么要在此时结束循环？因为核心原则。注意，每次内循环，都有固定的因数a_n，而作为另一因数的质数按升序取用。一旦遇见因数不互质的情况，即质数p整除 a_n，说明此次外循环的最小质因数筛除已达上限。

重返例子 a_n = 4，已知素数乘其可得8、12，但12的最小质因数是2，应该由2筛除，故内循环没必要继续。根据质数分解定理，最小质因数蕴含于当前项。

合数表在前**⌜n / 2⌝**项便已完成，遍历前n项是为了集齐质数表。

参考

Pecco - 算法学习笔记(17)：素数筛

TD-Sky: Rust实现线性筛