Summary statistics knockoffs inference with family-wise error rate control¶

作者: Catherine Xinrui Yu, Jiaqi Gu, Zhaomeng Chen, Zihuai He
来源: Biometrics
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的是在仅有汇总统计量（summary statistics，如边际 Z 分数）可得的设定下，如何进行多重假设检验以控制 family-wise error rate (FWER)。具体来说，研究者手头只有每个变量与响应之间的边际关联度量及其协方差结构，而没有原始个体数据。这在遗传学（如 GWAS 中共享跨研究的 Z 分数而非个体级基因型-表型数据）中极为常见。该方向当前处于“已有方法存在，但未针对 FWER 控制+汇总统计量+高功效+可计算约束做联合优化”的阶段。

发展脉络¶

奠基工作：Knockoff 框架的提出与扩展
- Barber & Candès (2015)：在低维线性模型中引入 knockoff 变量，通过构造一组“假变量”实现有限样本 FDR 控制。关键假设：设计矩阵被视作固定，且模型为线性。
- Candès et al. (2018, “model-X knockoffs”)：突破线性模型限制，证明只要知道特征向量 X 的联合分布，就可以在任意响应分布和任意维数下控制 FDR。关键创新：无需知道 Y|X 的模型，仅需从 X 的分布中采样 knockoff 变量 X̃。这成为后续所有方法的基础。
从 FDR 到 FWER：更保守的错误率控制
- Janson & Su (2016)：将 knockoff 框架从 FDR 控制扩展到 k-FWER 控制。核心方法是在一个合理的群组（knockoff 群组）上进行过滤，并证明在低维或固定设计下可实现精确的有限样本 FWER 控制。口子：其方法是为原始数据（个体级数据）设计的，不兼容汇总统计量。
汇总统计量下的突破：GhostKnockoff 诞生
- He et al. (2022, “GhostKnockoff”)：首次提出可以直接在 Z 分数（汇总统计量）层级生成 knockoff 变量，而无需个体数据。核心洞见是，对于关联检验（Z 分数），其特征和其 knockoff 的联合分布可被解析表达（高斯分布假设下），因此可以通过重采样或闭式构造生成 knockoff Z 分数。口子：He et al. (2022) 的方法只考虑了全局 FDR 控制，FWER 控制尚付阙如。本文直接填补此缺口。
当前 frontier 与本文的位置
- Katsevich & Sabatti (2019)：提出了多层 knockoff 滤波器，在同时对特征和特征组做推断时控制 FDR。这是向结构化推断的推进，但仍聚焦于 FDR。
- Ren & Candès (2020, “adaptive knockoffs”) 与 Ren et al. (2023, “derandomized knockoffs”)：分别处理侧信息利用和通过多次运行提升稳定性的问题。Ren et al. (2023) 证明了通过多轮聚合，可以将 per-family error rate (PFER) 控制转化为 FWER 控制，但这是一条间接路线：控制 PFER 意味着控制 V 的期望，而非直接控制 P(V > 0)。
- 本文（Yu et al., 2024）：直接建立在 GhostKnockoff 框架之上，将 Janson & Su (2016) 的 FWER 控制思想纳入汇总统计量设定。同时还贡献了一个计算高效的多 knockoff 生成算法，以缓解 GhostKnockoff 在变异数 p 较大时的计算瓶颈。

子线索聚类¶

FDR 控制线索:
- 代表性方法：Barber & Candès (2015), Candès et al. (2018), Barber & Candès (2019, high-dimensional), He et al. (2022, GhostKnockoff)。
- 共同点：以控制期望的假阳性比例为目标，对 FDR 不是那么保守。如本文所述，在许多“探索性”场景中被接受，但严格验证要求更强的控制（如 FWER）。
FWER / k-FWER 控制线索:
- 代表性方法：Janson & Su (2016), Ren et al. (2023, 通过聚合间接控制)。
- 共同点：目标是控制至少一个假阳性出现的概率，或至少 k 个假阳性出现的概率。更严格，是“确认性”或“药物靶点鉴定”场景所需。本文属于这一线索。
汇总统计量与计算效率线索:
- 代表性方法：He et al. (2022, GhostKnockoff), 以及本文提出的高效多 knockoff 生成算法。
- 共同点：针对大样本、高维生物医学数据，避免在个体数据上进行昂贵采样/计算。核心挑战是 knockoff 矩阵的协方差结构构建（O(p²) 复杂度）与采样过程（O(p³) 复杂度）。

核心问题与瓶颈¶

这个方向在追问的核心问题有： - 问题 1：如何在只有汇总统计量时，对条件独立性进行检验并控制 FWER？ - 问题 2：如何提升 knockoff 方法的功效（power），尤其是在协方差结构复杂、信号弱时？ - 问题 3：如何将 knockoff 生成的计算复杂度从 O(p³) 降低到可应用于现代 Biobank-scale GWAS（p 达百万级）的量级？ - 主流方法（GhostKnockoff）：只能控制 FDR，且生成多组 knockoff Z 分数的计算代价很高。 - 已知瓶颈（被本文指出）：将 Janson & Su (2016) 的 FWER 过滤方法直接应用在 GhostKnockoff 上，由于汇总统计量层面的信息丢失（无原始个体数据），会导致巨大的功效损失。本文明确说 “the procedure of Janson and Su (2016) would suffer great power loss in practice”。

⚠️ 作者的 framing（必须明确标注成"这是作者的说法"）¶

作者把缺口 frame 成：现有的 GhostKnockoff 只考虑 FDR 控制，而现有 FWER 控制方法（Janson & Su, 2016）不能直接、高效地迁移到汇总统计量场景下。本文的贡献是“填充此空白”的“显然的下一步”：将 FWER 控制嵌入 GhostKnockoff 框架，并修补由此带来的功效和计算问题。
被淡化或回避的竞争路线：
1. Derandomized knockoffs (Ren et al., 2023)：作者在 intro 中明确提及，并指出它被用于控制 FWER，但是“indirectly”（通过控制 PFER）。本文回避去讨论：如果直接在汇总统计量上用 Ren et al. (2023) 的多次运行 + 聚合策略，是否也能实现类似效果？代价又如何？
2. 多层结构 / 群组方法（Katsevich & Sabatti, 2019）：专注于 FDR 控制，且需要原始数据定义群组。作者未讨论在汇总统计量下能否构造等价的群组结构。
什么明显该被引 / 该存在、却没出现在 intro 里？
- 关于“计算复杂度”的通用理论或实证分析：本文提出了一种新的计算高效算法，但在背景综述中只提到了其他方法（multi-knockoffs via entropy maximization by Gimenez & Zou, 2019），没有系统地综述该领域已有的计算复杂度分析（例如，如何理论上界定生成 p 个 knockoff 的代价下界）。这可能表明作者的方法并非追求理论最优计算界，而是在实际应用级别降低恒因子。
- 关于“条件独立性检验”的泛化：本文的方法本质上依赖于“条件独立性”的检验。引入中一篇被引是 Sen et al. (2017) 关于用分类器进行 CI 检验。但本文并未将其作为竞争方法对比，也未讨论：若回复 Y 与 X 的关系是高度非线性的（其边际 Z 分数可能微弱），这份基于边际 Z 分数的 knockoff 方法是否依然有效（功效是否更低）？这是值得研究者去查的问题。

张力¶

未见明显对立引用。主流的 FDR 与 FWER 是互补而非对立关系。在汇总统计量设置下，方法的竞争主要体现在功效与误差控制的“帕累托前沿”上，而不是有直接的矛盾结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \( p \)：待检验的特征（变量）数量（变异数）。
- \( \mathbf{X} = (X_1, \dots, X_p) \)：\( p \) 个特征向量（基因型）。
- \( Y \)：响应变量（表型）。
- \( H_j \)：零假设 \( X_j \perp Y \mid \mathbf{X}_{-j} \)（特征 j 与 Y 在其他特征条件下独立）。检验的是 conditional independence。
- Estimand：对于每个假设 \( H_j \)，我们要决定拒绝（reject）或不拒绝。
- 观测到的汇总统计量：\( Z_j \)，是变量 j 与 Y 边际关联的检验统计量（如 GWAS 中的 Z 分数）。其分布被假设为 \( \mathbf{Z} \sim N(\boldsymbol{\mu}, \boldsymbol{\Sigma}) \)，其中 \( \boldsymbol{\mu} \) 是未知的效应向量，\( \boldsymbol{\Sigma} \) 是来自参考样本的已知协方差矩阵（Linkage Disequilibrium / LD 矩阵）。关键：我们不观测 \( (\mathbf{X}, Y) \)，只观测到 Z 分数和协方差矩阵。
模型：
- Gaussian knockoff 模型：假设 \( \mathbf{Z} \) 及其 knockoff \( \tilde{\mathbf{Z}} \) 的联合分布为多元高斯，且协方差矩阵 \( \boldsymbol{\Sigma} \) 已知。GhostKnockoff 框架保证，可以通过构造合适的协方差矩阵 \( \mathbf{G} \) 来“交换”原始 Z 和 knockoff Z 的角色。形式上，存在一个矩阵 \( \mathbf{S} \)（knockoff 构造矩阵），使得 \( \tilde{\mathbf{Z}} \) 满足：
  \[\mathrm{Cov} \begin{pmatrix} \mathbf{Z} \\ \tilde{\mathbf{Z}} \end{pmatrix} = \begin{pmatrix} \boldsymbol{\Sigma} & \boldsymbol{\Sigma} - \mathbf{S} \\ \boldsymbol{\Sigma} - \mathbf{S} & \boldsymbol{\Sigma} \end{pmatrix}\]
  其中 \( \mathbf{S} \) 是对角线被定义且非负定的矩阵，且 \( \mathbf{S} \preceq 2\boldsymbol{\Sigma} \)（正定序）。
可观测数据：
- 可观测样本：一组汇总统计量 \( Z_1, \dots, Z_p \) 和已知的协方差矩阵 \( \boldsymbol{\Sigma} \)（来自一个独立的参考群体）。
- 不可观测：原始的个体级数据 \( (\mathbf{X}, Y) \)。我们只能通过已知的高斯模型和已知的协方差来模拟或构造 knockoff 版的汇总统计量。重点：假设了整个报告的正确性依赖于 \( Z \) 的联合正态性假设（这在大型 GWAS 中通常近似成立）。

第二步：讲最小内核——一个极其简化的特例¶

最简特例：p = 1。只有一个特征 \( X_1 \)。我们想知道它是否与 Y 条件相关。

设定：我们只拿到一个 Z 分数 \( Z_1 \)，还有 \( \boldsymbol{\Sigma} = 1 \)（单一变量的方差为 1）。我们想控制 FWER（这里 p=1，FWER = 犯类型 I 错误的概率，即拒绝一个真的零假设的概率）。
直觉：我们怎么进行检验？传统做法是：若 \( |Z_1| > z_{\alpha/2} \)（例如在 \( \alpha=0.05 \) 下， \( z \approx 1.96 \)），就拒绝 H_1。这就控制了 FWER。
Knockoff 框架等价： 如果我们遵循 knockoff 逻辑，我们构造一个 knockoff: \( \tilde{Z}_1 \)。
- 为了简化，让 knockoff 与原始 Z 有相同的方差且独立： \( \tilde{Z}_1 \perp Z_1 \) 且 \( Var(\tilde{Z}_1) = Var(Z_1) = 1 \)。
- 那么我们定义特征重要性统计量 \( W_1 = |Z_1| - |\tilde{Z}_1| \)。
- 如果 \( H_1 \) 为真（\( \mu_1 = 0 \)），则 \( Z_1 \) 和 \( \tilde{Z}_1 \) 同为 N(0,1) 随机变量，因此 \( W_1 \) 对称地分布在 0 附近。P(\( W_1 \) > 随着显著性水平设定的阈值 | H1 为真) 是可以计算的。
- 在 p=1 时，如果我们想控制 FWER，我们只需要拒绝当一个 \( W_1 \) 大于某个临界值 \( t \)，使得在零假设下 P(\( W_1 > t \)) ≤ α。这个特殊案例解释了控制 FWER 的本质：设定一个阈值，使错误拒绝的概率被控制。

当 p=2 的最小内核（真正体现论文核心）：两个特征 X_1, X_2，我们想识别其中哪些与 Y 条件相关，且 FWER ≤ α。

可观测数据： \( Z_1, Z_2 \)，且 \( \boldsymbol{\Sigma} = \begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix} \)，\(\rho\) 是已知 LD 相关系数。
方法（本文核心的 Filter）：
1. 生成 knokcoff：生成两个 knockoff Z 分数，记为 \( \tilde{Z}_1, \tilde{Z}_2 \)。GhostKnockoff 保证，在一组 S 构造下，对于任意 \( j \)，如果将特征 j 与响应 Y 的真实条件效应替换到其 knockoff 上，配对 \( (Z_j, \tilde{Z}_j) \) 的联合分布仍保持不变。这种“交换性”是 knockoff 的核心。
2. 计算特征重要性统计量：对于每个 j，计算 \( W_j = T_j - \tilde{T}_j \)，例如 \( T_j = \) 某些边际重要性度量（如 \( Z_j^2 \)）。一个正且大的 \( W_j \) 暗示 j 可能是非零效应的变量。
3. 筛选过程（Janson & Su 的 FWER 控制思想的核心）：
  - 将变量按 \( |W_j| \) 降序排列： \( W_{(1)} \ge W_{(2)} \ge ... \ge \ldots \)。
  - 寻找一个阈值 \( T \) 为最大的值，使得至少有某个个数（比如 1 个）的 \( W_{(j)} > T \)。
  - 具体做法是，对所有可能的 rejection sets（大小为某个最大值的集合）进行搜索，找最小的那个集合，保持一定条件。在简单的程序中，可以设定一个“群组”大小 k，然后连续检查：当拒掉前 k 个变量时，FWER 是否被控制。Janson & Su 证明了，如果我们只拒掉 \( W_{(j)} \) 大于某个由 \( W_{(p-k+1)} \) 决定的临界值的变量，可以控制 k-FWER。
核心想法（本文的改进）：
- 直接搬 Janson & Su (2016) 到汇总数据会是灾难：因为在那时，汇总数据没有给出个体级排序信息。简单的做法是设定一个基于 \( W_{(1)} \) 的线性临界值，这在 p 较大且信号稀疏时会极度保守。
- 本文的 Filter：直接操作于 \( W_j \)，并明确构建了一个排序决策过程：它持续地逐级添加变量进入候选拒绝集，每一步都用一个“重新校准”的方式计算 p 值，确保家族错误率被控制。
- 最关键简化：当 \( p=2 \) 且我们想控制 FWER（即最多允许 1 个假阳性）。算法会这样做：
  - 假设 x_1 是信号，x_2 是噪音，所以 \( |W_1| \) 很大 > \( |W_2| \)。
  - 第一步：算法试图拒绝 \( x_1 \) 并控制 FWER。它计算一个“新的统计量”： \( Q_1 = \frac{ \sum_{j=1}^{1} |W_j| }{ \text{某个调整常数} } \)，并与基于所有 \( |W_j| \) 的临界值比较。若通过，则拒绝 x_1。
  - 第二步：尝试再拒绝 x_2。计算 Q_2。如果 Q_2 > t(2, ... )，则拒绝 x_1 和 x_2。否则停止。
  - 这种顺序 + 加法的方式确保了总 FWER ≤ α，因为每一步的条件概率都被正确校准了。本文把这套原本需要个体级析取（exact exchangeability）的理论，成功用汇总统计量的交换性进行了重写。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：当仅有边际依赖的 summary statistics（Z 分数）可用时，如何检验条件独立性，并控制 family-wise error rate (FWER)。
核心工具 / 方法：扩展了 GhostKnockoff 框架，直接对 summary statistics 生成 knockoff，并结合一种新的 sequential knockoff filter（FWER filter）进行特征选择；同时提出了一个计算高效的 multi-knockoff 生成算法。
主要结论：该方法在理论证明上能实现对 FWER 的有限样本（asymptotic）控制，并在模拟和阿尔茨海默病（AD）遗传学真实数据上表现出比现有方法（适用于该设定下 k-FWER filtering + 个体数据或特定汇总方法）更高的统计功效和更低的计算成本。

关键设定与假设（补全第二节）¶

设定：主要设定在多元高斯 summary statistics 下。假设特征（变异）的边际效应检验统计量 \( \mathbf{Z} \sim N(\boldsymbol{\mu}, \boldsymbol{\Sigma}) \)，其中 \( \boldsymbol{\Sigma} \) 已知（例如从 1000 Genomes Project 参考面板估计）。
核心假设：
- A1 (Conditional Distribution of Z is Gaussian): \( \mathbf{Z} \) 的边际分布是多元高斯。这在大型 GWAS 中通过 central limit theorem 近似成立。
- A2 (Known LD Matrix): 协方差矩阵 \( \boldsymbol{\Sigma} \) 是精确已知的，或者是基于足够大的参考面板估计出来的无噪。这在实际中是一个理想化假设（因为参考面板与目标研究群体之间存在细微LD差异）。
- A3 (Knockoff Exchangeability for Z): GhostKnockoff 框架隐含地依赖：存在一组 knockoff Z\( \tilde{\mathbf{Z}} \)，使得在 \( Y \) 与菜单效应不关联的位置（no true signals），配对向量 \( (Z_j, \tilde{Z}_j) \) 与 \( (\tilde{Z}_j, Z_j) \) 具有相同的联合分布。这由计算 knockoffs 时选用的矩阵 \( \mathbf{S} \) 保证。
- A4 (Additive Effect Model): 隐含在传统的 GWAS 框架中，假设每个变异对表型的影响是加性的（additive per copy effect），从而边际检验 Z 分数与此线性假设兼容。
- 相比已有文献的放宽/强化：相比 Janson & Su (2016) 需要原始个体数据以及 p ≤ n，本文工作在更受限的数据可得性（仅 summary statistics）下开展工作，因此放宽了对数据可得性的要求，但同时强化了对分布假设（高斯）和已知协方差（LD）的依赖。

主要结果¶

定理 1（FWER Filter 的有效性）：
- 陈述（直觉）：文中提出的 sequential FWER filter，在给定由 GhostKnockoff 正确生成的 knockoff 统计量后，能以渐近（asymptotically）的方式控制 FWER ≤ α。
- 直觉：证明的思路是通过构造一个“似真度”排序，并利用 markov 不等式与 union bound 来校准每一步的决策边界，确保累积的错误拒绝概率不超 α。它利用了 Janson & Su (2016) 的性质，但将“个体级 exchangeability”通过引用 Garkavi (1994) 的 lemma，巧妙地转化到了 summary statistics 的“distributional exchangeability”上。
- 必要条件：\( \boldsymbol{\Sigma} \) 的精确性、以及 Z 的正态性假设至关重要。
- 解决的问题：在此之前，虽然 GhostKnockoff 可以用，但只控制 FDR；若想控制 FWER，要么用保守的 Bonferroni 校正（导致功效极低），要么引入 Ren et al. (2023) 的 derandomized approach（间接控制，且计算代价大）。本文提供了首个专门为 summary statistics 设计的直接 FWER 控制方法。
定理 2（计算高效 Multi-knockoff Proxy 的正确性）：
- 陈述：提出一种“预先生成一批一次性 (one-shot) knockoff”、“后续过程只需从中线性索引”的高效算法。该方法在保持 FWER 控制和高统计功效的同时，将生成 knockoff 的复杂度从 O(B × p³) 降低到 O(p³ + B × p²)，B 为 knockoff 副本数。
- 直觉：生成单个 knockoff 依赖于解决一个关于协方差矩阵 \( \boldsymbol{\Sigma} \) 的优化问题（如选择 S 矩阵的最小化 MAC/最大相关）。该算法的 trick 是将该优化问题进行一次求解获得一个 S 矩阵，然后根据这个 S 矩阵，基于 Wishart 随机矩阵的理论，可以先采样一个“基”（reference）的 Z 及其 knockoff；在此基上，额外的 knockoff 副本可以通过在 p 维空间上施加一个随机正交变换（哈达玛矩阵或随机旋转）来高效生成，重用了第一次的协方差信息。
- 重点：它证明了这种“一次构造，多次套用”的方法在渐近意义下与每次独立优化 S 得到的 knockoff 强度等价，从而大幅提升了 GhostKnockoff 在 p 很大（数十万变异）时的可用性。

证明路线与技术技巧¶

整体路线（针对定理 1，FWER 控制）：
1. Step 1 (定义顺序统计量)：基于 \( W_j = T_j - \tilde{T}_j \)（如 \( |Z_j| - |\tilde{Z}_j| \)）对 p 个特征进行降序排序。
2. Step 2 (构造决策统计量 Q_k)：定义 \( Q_k = \sum_{i=1}^k W_{(i)} \)（第 k 个与最大 k 个重要性分数累加对应的量）。这是一个关键创新，它整合了前 k 个候选的信息，与 Janson & Su (2016) 的基于第 k 个 W 的方法不同。
3. Step 3 (确定拒绝集大小 K_hat)：设定一个关于 Q_k 的序列阈值 \( t_{\alpha, p} \)（依赖于 p, α），则 K_hat = max{ k : Q_k ≥ t_{\alpha, p} }。算法仅拒绝前 K_hat 个特征。
4. Step 4 (证明 FWER 控制)：证明的核心在于，在“无任何真信号”的全局零假设下，确定一个随机变量 G = max_{k in active set} Q_k，并证明 Pr(G ≥ t) ≤ α。这个证明利用了高斯测度不等式和Slepian's inequality来处理 Z 和 Z̃ 的联合分布，说明 Q_k 在零假设下分布上界经过适当的缩放。通过 union bound over k 来校准 t_{\alpha, p} 使得 FWER ≤ α。
对于定理 2 (计算高效)：
1. 证明整体路线：展示新合成算法生成的 knockoff 统计量与独立构造的 M-Knockoffs 在矩匹配上做到一致。
2. 核心技巧：利用Wishart 矩阵的谱表示和Hadamard矩阵的 orthogonal invariance。若原始 \( \mathbf{Z} \sim N(0, \boldsymbol{\Sigma}) \)，则其一次 knockoff \( \tilde{\mathbf{Z}} \) 可与原始 Z 一起，通过线性变换写成多元正态分布的一大块。作者观察到，若保留这个变换的向量结构而只对其施加一个随机独立的位置置换（如左乘随机正交矩阵），新产生的向量与原 Z 及其独立生成的 knockoff 向量是同分布的，从而仅需计算一次 SVD 分解，而后续直接旋转即可。
技术技巧点名：
1. Gaussian conditioning / Slepian's inequality：用于处理高维正态分布下，零假设中 Z 与 Z̃ 联合分布的上界，保证 FWER 控制的阈值选择不是过度保守的。
2. Wishart 矩阵 + 正交旋转：为了支持高效生成多组 knockoff，利用了一组生成矩阵与正交群 Haar 随机旋转。它绕过了对所有 B 个 knockoff 都求解“最小 MAC 优化问题”的代价，只做一次 SVD（奇异值分解）然后旋转。
3. 逐次加法（sequential addition）检验：在过滤算法中，不是基于固定的 \( W_{(k)} \) 阈值，而是累加效应量，这大幅提升了功效，尤其是在信号微弱（sum of small effects may be detected as “substantial” even if individually weak）的场景。

真实例子与应用¶

论文使用了两个真实数据集，均与阿尔茨海默病（AD）遗传学相关。

数据与场景：这是来自欧裔人群的大型 GWAS 研究和全基因组测序研究的结果（具体包括来自 Belloy et al., 2022; Le Guen et al., 2021; Hall et al., 2021 等含九个分散研究的 meta-analysis，共同涵盖了数千至数万样本）。
如何应用：研究者提取了与血浆内特定蛋白水平（pQTL, 蛋白定量性状位点） 有关的 7,963 个变异的 Z 分数。目的是发现哪些基因变异是“与 AD 风险条件性相关”的。这不仅仅是边际关联；他们想通过使用 GhostKnockoff及本文的 FWER filter 在连锁不平衡（LD）中找变异的独立信号。具体将 LD 矩阵作为 Σ 输入，然后应用他们新提出的计算高效 multi-knockoff 框架。
结果：该方法成功识别了预先选定的一系列基因（如 BIN1, PICALM, CLU, CD2AP, EPHA1/PPP1R3B, MS4A4A, ABCA7）中多个变异作为与 AD 有条件关联的位点。与传统的 GWAS 边际关联信号和单独的 FDR 控制方法相比，本文的 FWER filter 报告了一个更严格、更确定的列表（以更高的置信度锁定了一部分候选靶点）。此外，在测试的样本量下，本方法比传统的“先进行粗筛再用原始 Janson-Su 方法”的计算时间减少了超过一个数量级。
目的：展示该方法的实用性和功率优势：能够在严格控制假阳性的同时，从复杂 LD 结构中甄别出因果作用的变异，这对于药物靶点发现至关重要。

🔎 结论是否比证明窄¶

是的，存在窄化之处：定理 1 是在“渐近”意义上证明了 FWER 控制。虽然论文声称是 finite-sample validity，但在实践中所处理的“已知 Σ”既是有限样本估计（参考面板），又是高斯假设的近似。文章并未提供对因 Σ 是估算得来而非已知而产生的误差的 robustness 证明。因此，在真实使用的“有限样本”行为上，文章中“FWER ≤ α”是一个被动地依赖 Σ 矩阵估计质量的声明，并非真正不依赖 Σ 估算误差的有限样本保证。作者在结论中较宽松地用“control family-wise error rate”来代替严格意义上的“asymptotic control given consistent LD estimation”，这正是需要研究者用力审查的缺口。

四、开放问题（点到为止，扎根具体语句）¶

精确的有限样本 FWER 控制 vs 渐近控制：本文的主要理论结果（定理1）依赖于对 Σ 的良好估计和渐近推理。然而，在真实小样本 GWAS 汇总分析（如早期 ADSP 研究，仅~5000样本），Σ 的估计误差相对较大。开放问题：在 Σ 含有噪声的条件下，本文提出的方法是否会系统性地夸大或者低估 FWER？验证这一点需要将噪声 Σ 视为一个随机矩阵，在常规的 RMT 框架下推导其扰动下的 FWER 控制偏差。 （扎根点：文中并未对 Σ 的估计进行理论鲁棒性论证，其假设是“known LD matrix”，见公式(2)附近的描述）。
与非高斯 Summary Statistics 的兼容性：本文的核心假设是 Z 分数的多元正态性。但某些可以使用 summary statistics 的场景（例如，Cox 比例风险回归的 Z 分数在稀疏强信号下渐近收敛慢，或别的罕见变异检验如 SKAT 的 P 值）不满足该分布假设。开放问题：能否扩展本文框架，以处理从非高斯、或更复杂的似然比检验得到的 summary statistics 的 knockoff 推断？ （扎根点：作者在讨论部分末句提到“We assume Z-scores are normally distributed...”，并认为这是 future work）。
将 Knockoff Filter 的“高效生成”（定理2）扩展到其他多重检验程序：作者的“单次构造 + 正交旋转”的计算捷径是非常机器学习（fast sampling via random orthogonal matrices）的做法。开放问题：是否可以将这一思想形式化为更通用的框架，应用于比 FWER 控制更宽松的家族错误率（如 FDR）框架？例如，提高当前 He et al. (2022) 的 FDR 控制 GhostKnockoff 在 p = 10^6 时的计算效率。（扎根点：作者在 Section 3.3 明确提出了这个计算问题和对 O(p³) 的优化，但未扩展到 FDR 框架）。

Maintained by 陈星宇 · Homepage · Source on GitHub