Finding distributions that differ, with false discovery rate control¶

作者: Yonghoon Lee, Edgar Dobriban, Eric J Tchetgen Tchetgen
来源: Biometrika
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向研究的是半监督多重分布比较与选择问题：在仅有一个参考分布（null / control）的样本、以及多个比较组（treatment / test）样本的设定下，如何以分布自由的方式，从多个比较组中识别出那些分布确实与参考组不同的组，同时在多重比较中严格控制错误发现率（FDR）。当前该方向正处于从“单点异常检测”向“批量分布比较”过渡、并从“边际有效性”向“联合依赖结构下的精确 FDR 控制”推进的阶段。

发展脉络： - 奠基工作：经典非参数两样本检验（如置换检验 Eden & Yates 1933, Fisher 1935；秩和检验 Mann & Whitney 1947）为分布自由检验提供了基本框架，但它们主要针对单组比较，未系统处理多重比较下的 FDR。Benjamini & Yekutieli (2001) 证明了在 p 值满足正回归依赖（PRDS）条件下，BH 程序能控制 FDR，为多重非参数检验的依赖结构处理奠定了理论地基。 - 主要进展（Conformal 离群点检测）：Bates et al. (2021) 将 conformal inference 引入多重离群点检测，构造了 conformal p-value，证明了其满足 PRDS，从而实现了 FDR 控制。但作者在文中明确指出其局限：“Bates et al. [2023] consider detecting outliers, so they consider one datapoint from each distribution, which in our context implies that their method requires subsampling”——即该方法每组只能处理一个数据点，若要处理批量数据必须反复子抽样，导致计算昂贵且功效受损。 - 主要进展（半监督多重检验）：Mary & Roquain (2021) 研究了半监督多重检验，在仅有 null 样本时构造了 empirical p-value 并分析 BH 程序的 FDR 上下界，但作者指出其局限在于“upper and lower bounds for the FDR of the BH procedure based on empirical p-values. These bounds match when α(n+1)/m is an integer”——即 FDR 控制仅在特定参数组合下精确，一般情形只能给出界，且功效分析要求 null 样本量 n 远大于检验数 m。 - 当前 frontier（批量预测与选择）：Lee, Tchetgen & Dobriban (2024) 提出了 Batch Predictive Inference，为批量测试点的函数（如均值）提供分布自由的预测集，但该工作聚焦于预测覆盖，未触及多重分布差异检验的 FDR 控制。Marandon et al. (2022) 与 Magnani et al. (2023) 发展了基于 conformal 的自适应异常检测与闭合检验，但核心仍是“异常点识别”而非“多组分布与参考组的系统性比较”。 - 本文的位置：本文填补了“批量比较组 vs 单参考组”这一设定下精确、分布自由 FDR 控制的空白。通过引入 batch conformal p-value，一次性利用每组全量样本，避免了 Bates et al. 的子抽样损耗；通过证明 PRDS，打通了使用 BH 程序实现精确 FDR 控制的理论路径。

子线索聚类： 1. Conformal 离群/异常检测线：Bates et al. (2021) → Marandon et al. (2022) → Magnani et al. (2023)。这一簇将 conformal inference 从单点预测推向多重异常检测，核心是构造 marginally valid 的 conformal p-value/e-value 并在 PRDS 或闭合检验下控制 FDR。 2. 半监督多重检验线：Mary & Roquain (2021) → Blanchard & Roquain (2008) → Sarkar (2008)。这一簇在已知 null 样本但未知 null 分布的设定下，研究 empirical p-value 的依赖结构与 BH 程序的 FDR 控制，核心瓶颈是 FDR 界的精确性与对 n/m 比值的苛刻要求。 3. 经典非参数两样本/多样本检验线：置换检验 → 秩和检验 → Kim et al. (2020, minimax optimality) → Hu & Lin (2025, high-dim)。这一簇关注单组或两组分布差异的检验功效与渐近性质，未系统处理多重比较下的 FDR。

这个方向在追问的核心问题： 1. 在仅有 null 样本、未知 null 分布的半监督设定下，能否对多个比较组实现精确（而非渐近或带界）的 FDR 控制？ 当前主流（Mary & Roquain 2021）只能在特定参数下精确，一般情形有盈余。 2. 批量 conformal p-value 的联合依赖结构是什么？能否满足 PRDS 以启用 BH 程序？ Bates et al. (2021) 对单点 conformal p-value 证明了 PRDS，但批量情形下秩向量的联合分布更复杂，PRDS 是否成立是开放问题。 3. 如何避免子抽样导致的计算与功效损耗？ 直接套用单点 conformal 方法需要子抽样，在组样本量较大时计算昂贵且功效低。

⚠️ 作者的 framing： - 作者将缺口 frame 为：现有 conformal 离群检测方法（Bates et al.）每组只能用一个数据点，需要子抽样，导致低效；半监督 empirical p-value（Mary & Roquain）无法实现精确 FDR 控制。因此，构造一种能一次性利用全量组样本、且保证 PRDS 以实现精确 FDR 控制的 batch conformal p-value，是“显然的下一步”。 - 被淡化的竞争路线：经典置换检验在多样本设定下也可实现精确 FDR 控制（通过置换分布构造 p-value），但作者仅在计算成本层面提及其劣势（引用 Stranger et al. 2007, Salojärvi et al. 2017 等基因组学文献，指出“permutation tests are performed often, but are known to be expensive”），未深入比较置换检验在功效上与 batch conformal 的差异——这是一个值得研究者去查的缺口：在计算可行时，置换检验是否比 batch conformal 功效更高？ - 明显该引但未出现的文献：多组与单一对照组比较的经典多重检验框架（如 Dunnett test 及其非参数版本，Hothorn 2020 仅在模拟对比中被引用，未在理论定位中深入讨论）；以及高维两样本检验（Kim et al. 2020）在多样本 FDR 设定下的拓展——这些是该方向但未被作者纳入 intro 的理论脉络。

张力：未见明显对立引用。Bates et al. (2021) 与 Mary & Roquain (2021) 分别从 conformal 与 empirical p-value 角度切入，结论互补而非矛盾：前者在单点设定下实现 PRDS 与精确 FDR，后者在多样本设定下给出 FDR 界。本文统一了两者：在多样本设定下通过 batch conformal 实现了 PRDS 与精确 FDR，与 Mary & Roquain 的“仅在有界情形精确”结论形成张力——本文的方法在更宽松条件下达到了更强的控制。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(P\)：参考分布，未知但固定。
\(P^{(j)}\)：第 \(j\) 个比较组的分布，\(j \in \{1, \ldots, m\}\)，未知但固定。
\(H_0^{(j)}\)：第 \(j\) 个组的零假设，即 \(P^{(j)} = P\)。
\(H_1^{(j)}\)：第 \(j\) 个组的备择假设，即 \(P^{(j)} \neq P\)。
\(\mathcal{H}_0\)：真实零假设集合，\(\mathcal{H}_0 = \{j : P^{(j)} = P\}\)。
\(X_1, \ldots, X_n\)：来自参考分布 \(P\) 的独立同分布样本，可观测。
\(Y_1^{(j)}, \ldots, Y_{n_j}^{(j)}\)：来自第 \(j\) 个比较组分布 \(P^{(j)}\) 的独立同分布样本，可观测。
\(V(\cdot)\)：非一致性分数函数，将数据映射为实数得分，\(V: \mathcal{Z} \to \mathbb{R}\)。通常基于参考样本估计（如残差、条件分位数偏离等），可由研究者选择或构造。
\(S_i = V(X_i)\)：参考样本的得分，\(i \in \{1, \ldots, n\}\)。
\(T_k^{(j)} = V(Y_k^{(j)})\)：第 \(j\) 组比较样本的得分，\(k \in \{1, \ldots, n_j\}\)。
\(R_k^{(j)}\)：第 \(j\) 组第 \(k\) 个测试得分 \(T_k^{(j)}\) 在混合池 \(\{S_1, \ldots, S_n, T_k^{(j)}\}\) 中的秩（1 为最小，\(n+1\) 为最大）。
\(\hat{p}_k^{(j)} = R_k^{(j)} / (n+1)\)：第 \(j\) 组第 \(k\) 个测试点的 conformal p-value。
\(\hat{p}^{(j)}\)：第 \(j\) 组的 batch conformal p-value，定义为该组所有测试点 conformal p-value 的最小值：\(\hat{p}^{(j)} = \min_{k=1,\ldots,n_j} \hat{p}_k^{(j)}\)。
FDR：错误发现率，\(\text{FDR} = \mathbb{E}[\text{FP} / \max(\text{R}, 1)]\)，其中 FP 为错误拒绝数，R 为总拒绝数。
PRDS：正回归依赖性，即对任何递增函数 \(g\)，\(\forall j \in \mathcal{H}_0\)，条件期望 \(\mathbb{E}[g(\hat{p}^{(1)}, \ldots, \hat{p}^{(m)}) \mid \hat{p}^{(j)} \leq u]\) 关于 \(u\) 递增。

模型：数据生成机制为各组独立抽样：\(X_i \sim P\)，\(Y_k^{(j)} \sim P^{(j)}\)，各组间及组内独立。分数函数 \(V\) 可依赖额外的训练集（通过数据分割得到），但参考样本 \(X\) 与比较样本 \(Y^{(j)}\) 相对于 \(V\) 是条件独立的。核心假设是可交换性：在零假设 \(H_0^{(j)}\) 下，混合向量 \((S_1, \ldots, S_n, T_k^{(j)})\) 的联合分布对坐标置换不变。

可观测数据：研究者观测到参考样本 \(\{X_i\}_{i=1}^n\) 与各组比较样本 \(\{Y_k^{(j)}\}_{k=1}^{n_j}\)（\(j=1,\ldots,m\)）。不可观测的是各组分布 \(P^{(j)}\) 是否等于 \(P\)（即 \(\mathcal{H}_0\) 的真实成员），这只能靠假设检验去识别。分数函数 \(V\) 的构造可利用额外分割的训练集，这部分数据也是可观测的，但一旦 \(V\) 固定，参考集与测试集对 \(V\) 的条件独立性必须保证。

第二步：最小内核——最简特例（\(m=2\) 组，每组 \(n_j=1\) 个测试点，分数 \(V\) 已给定）

考虑最简特例：1 个参考组样本 \(X_1\)（\(n=1\)），2 个比较组各 1 个测试点 \(Y_1^{(1)}, Y_1^{(2)}\)（\(m=2, n_1=n_2=1\)），分数 \(V\) 为恒等映射（\(V(z)=z\)）。假设 \(H_0^{(1)}\) 成立（\(P^{(1)}=P\)），\(H_1^{(2)}\) 成立（\(P^{(2)}\neq P\)）。

Conformal p-value 的构造：
对组 1：混合池为 \(\{S_1, T_1^{(1)}\} = \{X_1, Y_1^{(1)}\}\)。在 \(H_0^{(1)}\) 下，\((X_1, Y_1^{(1)})\) 可交换，故 \(T_1^{(1)}\) 的秩 \(R_1^{(1)}\) 在 \(\{1, 2\}\) 上均匀分布。\(\hat{p}_1^{(1)} = R_1^{(1)} / 2\)，取值为 \(1/2\) 或 \(1\)，各概率 \(1/2\)。
对组 2：混合池为 \(\{S_1, T_1^{(2)}\} = \{X_1, Y_1^{(2)}\}\)。\(H_1^{(2)}\) 下不可交换，\(T_1^{(2)}\) 的秩偏向极端值，\(\hat{p}_1^{(2)}\) 倾向取小值。
Batch conformal p-value：\(\hat{p}^{(1)} = \hat{p}_1^{(1)}\)，\(\hat{p}^{(2)} = \hat{p}_1^{(2)}\)。
PRDS 的最小内核：要证：对任何递增函数 \(g\)，\(\mathbb{E}[g(\hat{p}^{(1)}, \hat{p}^{(2)}) \mid \hat{p}^{(1)} \leq u]\) 关于 \(u\) 递增（\(j=1 \in \mathcal{H}_0\)）。

在此特例中，\(\hat{p}^{(1)}\) 只依赖 \((X_1, Y_1^{(1)})\)，\(\hat{p}^{(2)}\) 只依赖 \((X_1, Y_1^{(2)})\)。关键观察：\(X_1\) 是共享的参考样本，它同时出现在两个混合池中，因此两个 p-value 不独立——它们的依赖完全通过 \(X_1\) 传递。

当 \(\hat{p}^{(1)} \leq 1/2\) 时，意味着 \(R_1^{(1)} = 1\)，即 \(Y_1^{(1)} < X_1\)。这“筛选出”了 \(X_1\) 较大的情形。在 \(X_1\) 较大时，\(Y_1^{(2)}\)（若来自偏大的 \(P^{(2)}\)）更容易大于 \(X_1\)，从而 \(R_1^{(2)}\) 更可能取大值（\(\hat{p}^{(2)}\) 更可能取大值）。因此，条件 \(\hat{p}^{(1)}\) 小反而筛选出了使 \(\hat{p}^{(2)}\) 更大的 \(X_1\) 状态——这正是正回归依赖的直觉：零假设下的 p-value 变小，筛选出的参考样本状态使得其他 p-value（无论是否在零假设下）倾向于变大。
归纳秩向量支配的核心想法（在此特例中的雏形）：在零假设下，\((S_1, T_1^{(1)})\) 可交换。我们可以构造一个“虚拟秩向量” \(\tilde{R}_1^{(1)}\)，使得 \(\tilde{R}_1^{(1)} \geq R_1^{(1)}\) 几乎必然成立，且 \(\tilde{R}_1^{(1)}\) 的分布与 \(X_1\) 的具体取值无关（仅依赖可交换结构）。在这个特例中，\(\tilde{R}_1^{(1)} = n+1 = 2\)（即假设测试点总是取最大秩）就是一个几乎必然支配 \(R_1^{(1)}\) 的虚拟秩——虽然粗糙，但它展示了核心思路：通过归纳构造，将真实秩替换为一个“更保守”的虚拟秩，该虚拟秩的联合分布具有单调性，从而 PRDS 成立。一般情形下的归纳构造需要处理多组、多个测试点、以及组间共享参考样本带来的复杂依赖，但最小内核已经揭示了：PRDS 的根源在于共享参考样本所传递的正依赖信息，而归纳秩支配是切断该依赖、构造保守单调结构的工具。

三、这篇论文做了什么¶

三句话： ① 研究了从多个比较组分布中识别出与参考分布不同的组、同时控制 FDR 的多重检验问题； ② 核心方法是构造 batch conformal p-value（各组测试点 conformal p-value 的最小值），并证明其满足 PRDS； ③ 主要结论是：基于 batch conformal p-value 的 BH 程序实现了精确、分布自由的 FDR 控制，且功效优于子抽样 conformal 方法，在某些已知分布设定下与参数方法可比。

关键设定与假设： - 设定：1 个参考组（样本量 \(n\)），\(m\) 个比较组（样本量 \(n_j\)），各组独立抽样。分数函数 \(V\) 通过数据分割从独立训练集估计，参考集与测试集对 \(V\) 条件独立。 - 核心假设： 1. 可交换性：在 \(H_0^{(j)}\) 下，\((S_1, \ldots, S_n, T_k^{(j)})\) 对坐标置换不变。这是 conformal inference 的标准假设，相比参数检验的分布假设极弱。 2. 连续性调整：分数 \(V\) 的分布可能非连续，导致秩有结。作者采用随机破结，或引用 Kuchibhotla (2020) 的加噪调整，使调整后分数的分布非原子，秩几乎必然唯一。这比 Bates et al. (2021) 的处理更明确。 3. 条件独立性：训练集、参考集、测试集三分割，\(V\) 仅依赖训练集。这是 split conformal 的标准要求，相比 full conformal 避免了重拟合计算，但牺牲了部分功效。 - 与已有文献的对比：可交换性假设与 Bates et al. (2021) 一致，但本文允许每组多个测试点（Bates et al. 仅单点）；三分割与 Romano et al. (2019) 的 split conformal 一致；PRDS 条件比 Benjamini & Yekutieli (2001) 的通用依赖设定更强，但比 Mary & Roquain (2021) 的 empirical p-value 依赖结构更易验证。

主要结果： 1. 定理 1（PRDS 性质）：在零假设组 \(\mathcal{H}_0\) 下，batch conformal p-value 向量 \((\hat{p}^{(1)}, \ldots, \hat{p}^{(m)})\) 满足 PRDS。直觉：共享参考样本使得各组 p-value 正依赖——零假设组 p-value 变小筛选出“参考样本偏极端”的状态，此时其他组 p-value 也倾向偏大（因测试点更难超过极端参考值）。必要条件：可交换性 + 非原子分数分布（通过加噪/随机破结保证）。解决的技术难点：多组、多测试点下秩向量的联合分布极其复杂（组间共享参考样本、组内多个测试点彼此不可交换），直接计算依赖结构不可行；归纳秩支配技术绕过了联合分布的显式计算。 2. 定理 2（精确 FDR 控制）：基于 batch conformal p-value 的 BH 程序，在目标水平 \(\alpha\) 下，\(\text{FDR} \leq \alpha\)，且等号在所有组均为零假设时成立（精确控制）。直觉：PRDS 保证了 BH 程序在依赖结构下的有效性（Benjamini & Yekutieli 2001 的经典结论），而 batch conformal p-value 的边际分布为 \(\text{Unif}(0,1)\)（在零假设下），使得 BH 的 FDR 界精确可达。必要条件：定理 1 的 PRDS + 零假设下 p-value 的边际均匀性。 3. 定理 3（Simes 检验的有效性）：Batch conformal p-value 可用于 Simes 检验，控制类型 I 错误。这引用 Sarkar (2008) 的结论：PRDS 下 Simes 不等式成立，是定理 1 的直接推论，拓展了方法的适用场景。

证明路线与技术技巧： - 整体路线（定理 1 的证明）： 1. 问题转化：将 PRDS 的证明转化为证明秩向量 \((R^{(j)}_k)_{j \in \mathcal{H}_0, k}\) 的联合分布满足某种单调性——即条件期望 \(\mathbb{E}[g(R) \mid R^{(j)}_k \leq r]\) 关于 \(r\) 递减（秩小 = p-value 小）。 2. 归纳构造虚拟秩向量：对每个零假设组 \(j \in \mathcal{H}_0\) 的每个测试点 \(k\)，构造虚拟秩 \(\tilde{R}_k^{(j)}\)，使得：(a) \(\tilde{R}_k^{(j)} \geq R_k^{(j)}\) 几乎必然（虚拟秩支配真实秩）；的联合分布具有理想单调性（条件期望递减）；(c) \(\tilde{R}_k^{(j)}\) 的构造仅依赖可交换结构，不依赖具体分布。 3. 归纳步骤：从 \(n\) 个参考样本出发，逐个插入零假设组的测试点。每插入一个测试点 \(T_k^{(j)}\)，其在当前混合池中的真实秩 \(R_k^{(j)}\) 受参考样本与已插入测试点的具体取值影响；但虚拟秩 \(\tilde{R}_k^{(j)}\) 被构造为“假设该测试点取当前池中的最大值”所对应的秩，从而 \(\tilde{R}_k^{(j)} \geq R_k^{(j)}\) 几乎必然，且 \(\tilde{R}_k^{(j)}\) 仅依赖池的大小与可交换性，不依赖取值。 4. 单调性传递：由于虚拟秩 \(\tilde{R}\) 的联合分布是可交换结构下的“最保守”分布（测试点总取最大秩），其条件期望天然单调——条件 \(\tilde{R}_k^{(j)}\) 小意味着池中已有极值点，使得后续插入点的虚拟秩更可能小（单调递减）。真实秩 \(R\) 被 \(\tilde{R}\) 支配，且 \(\tilde{R}\) 的单调性通过支配关系传递给 \(R\) 的 p-value（p-value = 秩/(n+1)，支配反转后变为 p-value 的单调递增），从而 PRDS 成立。 5. 非零假设组的处理：非零假设组 \(j \notin \mathcal{H}_0\) 的测试点不可交换，但其 p-value 仍依赖共享参考样本。PRDS 的定义仅要求对零假设组的 p-value 条件，非零假设组的 p-value 作为递增函数 \(g\) 的参数，其依赖结构无需额外假设——归纳构造仅针对零假设组，非零假设组通过共享参考样本自然被纳入正依赖结构。

关键跳跃点：归纳构造虚拟秩向量 \(\tilde{R}\) 并证明其几乎必然支配真实秩 \(R\)。难点在于：多组多测试点下，组间共享参考样本使得真实秩的联合分布无显式表达；组内多个测试点彼此不可交换（因它们来自同一 \(P^{(j)}\) 但混合池包含其他组已插入的点），无法直接套用 Bates et al. (2021) 的单点可交换论证。作者通过归纳插入 + 虚拟最大秩假设，绕过了联合分布的显式计算，将复杂依赖结构简化为可交换结构下的最保守情形。
技术技巧点名：
归纳秩构造：逐个插入测试点并赋予虚拟最大秩，保证支配性与单调性。用于定理 1 证明的核心步骤，替代了显式联合分布计算。
随机破结 / 加噪调整：引用 Kuchibhotla (2020)，对分数加小噪声使其分布非原子，保证秩几乎必然唯一。用于处理连续性缺失，是 PRDS 证明的技术前提。
三分割：训练集拟合 \(V\)，参考集计算 \(S_i\)，测试集计算 \(T_k^{(j)}\)。用于保证 \(V\) 固定下参考集与测试集的条件独立与可交换性，是 split conformal 的标准操作。
Benjamini & Yekutieli (2001) 的 PRDS-BH 理论：作为现成工具引用，将 PRDS 直接转化为 FDR 控制，无需重新证明 BH 的有效性。

真实例子与应用： 1. 丙型肝炎治疗数据： - 场景：识别对治疗有显著响应的患者亚组。参考组为无显著响应的患者，比较组为不同基因型/治疗方案的患者亚组。 - 方法应用：构造分数 \(V\) 为治疗响应的残差（基于协变量预测响应，残差反映纯治疗效应），计算各亚组的 batch conformal p-value，用 BH 程序筛选。 - 结果：识别出若干基因型-治疗方案组合具有显著治疗效应（分布与参考组不同），FDR 控制在目标水平。 - 说明什么：展示方法在真实临床数据上的适用性，验证 FDR 控制的实际有效性，并展示分数 \(V\) 的灵活构造（残差 = 条件均值偏离，连接到因果推断的结构）。

当前人口调查（CPS）数据：
场景：识别工作时间异常长的子人群。参考组为正常工作时间的人群，比较组为不同职业/教育/地区子人群。
方法应用：分数 \(V\) 为工作时间的标准化偏离，计算各子人群的 batch conformal p-value，BH 程序筛选。
结果：识别出若干子人群（如特定职业组）的工作时间分布显著偏长。
说明什么：展示方法在社会科学数据上的应用，验证分布自由性质在非正态、重尾数据（工作时间分布常右偏）下的稳健性。
模拟实验：
场景：参考分布为标准正态，比较组为均值偏移的正态（不同偏移量 \(\delta\) 与组数 \(m\)）。
方法应用：比较 batch conformal + BH 与子抽样 conformal + BH、以及已知正态分布的参数 t 检验 + BH。
结果：batch conformal 的 FDR 精确控制在目标水平；功效在 \(\delta\) 较大时接近参数 t 检验（尽管是分布自由的），在 \(\delta\) 中等时优于子抽样 conformal（因利用全量样本）。
说明什么：验证分布自由方法在已知分布设定下不显著劣于参数方法，且批量利用数据确实提升功效。

🔎 结论是否比证明窄： - 定理 1 的 PRDS 证明严格依赖“零假设组测试点与参考样本可交换”+“非原子分数分布”。作者在文中 claim batch conformal p-value 可用于 Simes 检验（定理 3），这严格依赖 Sarkar (2008) 的 PRDS-Simes 结论，条件与定理 1 一致，无泛化。 - 作者在讨论部分提及 batch conformal p-value 可拓展到 full conformal（不分割训练集，重拟合 \(V\)），但未给出证明，仅作为 conjecture。Full conformal 下 \(V\) 依赖全数据，可交换性条件更复杂，归纳秩支配技术是否仍成立是开放问题——这是一个结论比证明窄的地方，研究者需注意。

四、开放问题（点到为止，扎根具体语句）¶

Full conformal 拓展下的 PRDS 是否成立？ 作者在讨论部分提及“full-conformal e-values [Vovk and Wang, 2021], enabling more efficient use of the data”（引用 Lee et al. 2025），但本文的 PRDS 证明严格依赖三分割下的条件可交换性。Full conformal 下 \(V\) 随测试点变化，归纳秩支配的“虚拟最大秩假设”是否仍能保证几乎必然支配，需重新验证——扎根于本文讨论部分对 full conformal 的 conjecture。
分数函数 \(V\) 的选择对功效的影响与最优性：本文证明了对任何 \(V\)（满足非原子条件）FDR 均精确控制，但功效高度依赖 \(V\) 的选择（如残差 vs 分位数偏离）。作者在模拟中使用了条件均值残差，但未给出 \(V\) 的最优选择理论——扎根于第 5 节“the choice of the score function \(V\) is flexible... but the power depends on this choice”。
置换检验与 batch conformal 的功效-计算权衡：作者将置换检验的劣势定位为计算昂贵（引用基因组学文献），但未在理论层面比较两者在相同计算预算下的功效。在 \(n\) 与 \(n_j\) 较小、置换可行时，置换检验是否比 batch conformal 功效更高？——扎根于第 1 节“permutation tests are performed often, but are known to be expensive”，该判断仅基于计算，未涉及功效。
非零假设组间依赖对 FDR 的影响：本文的 PRDS 证明仅针对零假设组，非零假设组的依赖结构未受限。在备择假设组间存在强负依赖时，BH 程序的 FDR 是否仍精确控制？Benjamini & Yekutieli (2001) 的 PRDS 条件仅要求零假设组 PRDS，理论上不受备择假设组依赖影响，但实际功效可能受损——扎根于定理 1 的陈述“for \(j \in \mathcal{H}_0\)”，非零假设组未被纳入 PRDS 条件。

Maintained by 陈星宇 · Homepage · Source on GitHub

Finding distributions that differ, with false discovery rate control¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论