跳转至

Finding distributions that differ, with false discovery rate control

作者: Yonghoon Lee, Edgar Dobriban, Eric J Tchetgen Tchetgen
来源: Biometrika
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么: 这个子方向研究的是半监督多重分布比较与选择问题:在仅有一个参考分布(null / control)的样本、以及多个比较组(treatment / test)样本的设定下,如何以分布自由的方式,从多个比较组中识别出那些分布确实与参考组不同的组,同时在多重比较中严格控制错误发现率(FDR)。当前该方向正处于从“单点异常检测”向“批量分布比较”过渡、并从“边际有效性”向“联合依赖结构下的精确 FDR 控制”推进的阶段。

发展脉络: - 奠基工作:经典非参数两样本检验(如置换检验 Eden & Yates 1933, Fisher 1935;秩和检验 Mann & Whitney 1947)为分布自由检验提供了基本框架,但它们主要针对单组比较,未系统处理多重比较下的 FDR。Benjamini & Yekutieli (2001) 证明了在 p 值满足正回归依赖(PRDS)条件下,BH 程序能控制 FDR,为多重非参数检验的依赖结构处理奠定了理论地基。 - 主要进展(Conformal 离群点检测):Bates et al. (2021) 将 conformal inference 引入多重离群点检测,构造了 conformal p-value,证明了其满足 PRDS,从而实现了 FDR 控制。但作者在文中明确指出其局限:“Bates et al. [2023] consider detecting outliers, so they consider one datapoint from each distribution, which in our context implies that their method requires subsampling”——即该方法每组只能处理一个数据点,若要处理批量数据必须反复子抽样,导致计算昂贵且功效受损。 - 主要进展(半监督多重检验):Mary & Roquain (2021) 研究了半监督多重检验,在仅有 null 样本时构造了 empirical p-value 并分析 BH 程序的 FDR 上下界,但作者指出其局限在于“upper and lower bounds for the FDR of the BH procedure based on empirical p-values. These bounds match when α(n+1)/m is an integer”——即 FDR 控制仅在特定参数组合下精确,一般情形只能给出界,且功效分析要求 null 样本量 n 远大于检验数 m。 - 当前 frontier(批量预测与选择):Lee, Tchetgen & Dobriban (2024) 提出了 Batch Predictive Inference,为批量测试点的函数(如均值)提供分布自由的预测集,但该工作聚焦于预测覆盖,未触及多重分布差异检验的 FDR 控制。Marandon et al. (2022) 与 Magnani et al. (2023) 发展了基于 conformal 的自适应异常检测与闭合检验,但核心仍是“异常点识别”而非“多组分布与参考组的系统性比较”。 - 本文的位置:本文填补了“批量比较组 vs 单参考组”这一设定下精确、分布自由 FDR 控制的空白。通过引入 batch conformal p-value,一次性利用每组全量样本,避免了 Bates et al. 的子抽样损耗;通过证明 PRDS,打通了使用 BH 程序实现精确 FDR 控制的理论路径。

子线索聚类: 1. Conformal 离群/异常检测线:Bates et al. (2021) → Marandon et al. (2022) → Magnani et al. (2023)。这一簇将 conformal inference 从单点预测推向多重异常检测,核心是构造 marginally valid 的 conformal p-value/e-value 并在 PRDS 或闭合检验下控制 FDR。 2. 半监督多重检验线:Mary & Roquain (2021) → Blanchard & Roquain (2008) → Sarkar (2008)。这一簇在已知 null 样本但未知 null 分布的设定下,研究 empirical p-value 的依赖结构与 BH 程序的 FDR 控制,核心瓶颈是 FDR 界的精确性与对 n/m 比值的苛刻要求。 3. 经典非参数两样本/多样本检验线:置换检验 → 秩和检验 → Kim et al. (2020, minimax optimality) → Hu & Lin (2025, high-dim)。这一簇关注单组或两组分布差异的检验功效与渐近性质,未系统处理多重比较下的 FDR。

这个方向在追问的核心问题: 1. 在仅有 null 样本、未知 null 分布的半监督设定下,能否对多个比较组实现精确(而非渐近或带界)的 FDR 控制? 当前主流(Mary & Roquain 2021)只能在特定参数下精确,一般情形有盈余。 2. 批量 conformal p-value 的联合依赖结构是什么?能否满足 PRDS 以启用 BH 程序? Bates et al. (2021) 对单点 conformal p-value 证明了 PRDS,但批量情形下秩向量的联合分布更复杂,PRDS 是否成立是开放问题。 3. 如何避免子抽样导致的计算与功效损耗? 直接套用单点 conformal 方法需要子抽样,在组样本量较大时计算昂贵且功效低。

⚠️ 作者的 framing: - 作者将缺口 frame 为:现有 conformal 离群检测方法(Bates et al.)每组只能用一个数据点,需要子抽样,导致低效;半监督 empirical p-value(Mary & Roquain)无法实现精确 FDR 控制。因此,构造一种能一次性利用全量组样本、且保证 PRDS 以实现精确 FDR 控制的 batch conformal p-value,是“显然的下一步”。 - 被淡化的竞争路线:经典置换检验在多样本设定下也可实现精确 FDR 控制(通过置换分布构造 p-value),但作者仅在计算成本层面提及其劣势(引用 Stranger et al. 2007, Salojärvi et al. 2017 等基因组学文献,指出“permutation tests are performed often, but are known to be expensive”),未深入比较置换检验在功效上与 batch conformal 的差异——这是一个值得研究者去查的缺口:在计算可行时,置换检验是否比 batch conformal 功效更高? - 明显该引但未出现的文献:多组与单一对照组比较的经典多重检验框架(如 Dunnett test 及其非参数版本,Hothorn 2020 仅在模拟对比中被引用,未在理论定位中深入讨论);以及高维两样本检验(Kim et al. 2020)在多样本 FDR 设定下的拓展——这些是该方向但未被作者纳入 intro 的理论脉络。

张力: 未见明显对立引用。Bates et al. (2021) 与 Mary & Roquain (2021) 分别从 conformal 与 empirical p-value 角度切入,结论互补而非矛盾:前者在单点设定下实现 PRDS 与精确 FDR,后者在多样本设定下给出 FDR 界。本文统一了两者:在多样本设定下通过 batch conformal 实现了 PRDS 与精确 FDR,与 Mary & Roquain 的“仅在有界情形精确”结论形成张力——本文的方法在更宽松条件下达到了更强的控制。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • \(P\):参考分布,未知但固定。
  • \(P^{(j)}\):第 \(j\) 个比较组的分布,\(j \in \{1, \ldots, m\}\),未知但固定。
  • \(H_0^{(j)}\):第 \(j\) 个组的零假设,即 \(P^{(j)} = P\)
  • \(H_1^{(j)}\):第 \(j\) 个组的备择假设,即 \(P^{(j)} \neq P\)
  • \(\mathcal{H}_0\):真实零假设集合,\(\mathcal{H}_0 = \{j : P^{(j)} = P\}\)
  • \(X_1, \ldots, X_n\):来自参考分布 \(P\) 的独立同分布样本,可观测
  • \(Y_1^{(j)}, \ldots, Y_{n_j}^{(j)}\):来自第 \(j\) 个比较组分布 \(P^{(j)}\) 的独立同分布样本,可观测
  • \(V(\cdot)\):非一致性分数函数,将数据映射为实数得分,\(V: \mathcal{Z} \to \mathbb{R}\)。通常基于参考样本估计(如残差、条件分位数偏离等),可由研究者选择或构造
  • \(S_i = V(X_i)\):参考样本的得分,\(i \in \{1, \ldots, n\}\)
  • \(T_k^{(j)} = V(Y_k^{(j)})\):第 \(j\) 组比较样本的得分,\(k \in \{1, \ldots, n_j\}\)
  • \(R_k^{(j)}\):第 \(j\) 组第 \(k\) 个测试得分 \(T_k^{(j)}\) 在混合池 \(\{S_1, \ldots, S_n, T_k^{(j)}\}\) 中的秩(1 为最小,\(n+1\) 为最大)。
  • \(\hat{p}_k^{(j)} = R_k^{(j)} / (n+1)\):第 \(j\) 组第 \(k\) 个测试点的 conformal p-value。
  • \(\hat{p}^{(j)}\):第 \(j\) 组的 batch conformal p-value,定义为该组所有测试点 conformal p-value 的最小值:\(\hat{p}^{(j)} = \min_{k=1,\ldots,n_j} \hat{p}_k^{(j)}\)
  • FDR:错误发现率,\(\text{FDR} = \mathbb{E}[\text{FP} / \max(\text{R}, 1)]\),其中 FP 为错误拒绝数,R 为总拒绝数。
  • PRDS:正回归依赖性,即对任何递增函数 \(g\)\(\forall j \in \mathcal{H}_0\),条件期望 \(\mathbb{E}[g(\hat{p}^{(1)}, \ldots, \hat{p}^{(m)}) \mid \hat{p}^{(j)} \leq u]\) 关于 \(u\) 递增。

模型:数据生成机制为各组独立抽样:\(X_i \sim P\)\(Y_k^{(j)} \sim P^{(j)}\),各组间及组内独立。分数函数 \(V\) 可依赖额外的训练集(通过数据分割得到),但参考样本 \(X\) 与比较样本 \(Y^{(j)}\) 相对于 \(V\) 是条件独立的。核心假设是可交换性:在零假设 \(H_0^{(j)}\) 下,混合向量 \((S_1, \ldots, S_n, T_k^{(j)})\) 的联合分布对坐标置换不变。

可观测数据:研究者观测到参考样本 \(\{X_i\}_{i=1}^n\) 与各组比较样本 \(\{Y_k^{(j)}\}_{k=1}^{n_j}\)\(j=1,\ldots,m\))。不可观测的是各组分布 \(P^{(j)}\) 是否等于 \(P\)(即 \(\mathcal{H}_0\) 的真实成员),这只能靠假设检验去识别。分数函数 \(V\) 的构造可利用额外分割的训练集,这部分数据也是可观测的,但一旦 \(V\) 固定,参考集与测试集对 \(V\) 的条件独立性必须保证。

第二步:最小内核——最简特例(\(m=2\) 组,每组 \(n_j=1\) 个测试点,分数 \(V\) 已给定)

考虑最简特例:1 个参考组样本 \(X_1\)\(n=1\)),2 个比较组各 1 个测试点 \(Y_1^{(1)}, Y_1^{(2)}\)\(m=2, n_1=n_2=1\)),分数 \(V\) 为恒等映射(\(V(z)=z\))。假设 \(H_0^{(1)}\) 成立(\(P^{(1)}=P\)),\(H_1^{(2)}\) 成立(\(P^{(2)}\neq P\))。

  • Conformal p-value 的构造
  • 对组 1:混合池为 \(\{S_1, T_1^{(1)}\} = \{X_1, Y_1^{(1)}\}\)。在 \(H_0^{(1)}\) 下,\((X_1, Y_1^{(1)})\) 可交换,故 \(T_1^{(1)}\) 的秩 \(R_1^{(1)}\)\(\{1, 2\}\) 上均匀分布。\(\hat{p}_1^{(1)} = R_1^{(1)} / 2\),取值为 \(1/2\)\(1\),各概率 \(1/2\)
  • 对组 2:混合池为 \(\{S_1, T_1^{(2)}\} = \{X_1, Y_1^{(2)}\}\)\(H_1^{(2)}\) 下不可交换,\(T_1^{(2)}\) 的秩偏向极端值,\(\hat{p}_1^{(2)}\) 倾向取小值。
  • Batch conformal p-value:\(\hat{p}^{(1)} = \hat{p}_1^{(1)}\)\(\hat{p}^{(2)} = \hat{p}_1^{(2)}\)

  • PRDS 的最小内核: 要证:对任何递增函数 \(g\)\(\mathbb{E}[g(\hat{p}^{(1)}, \hat{p}^{(2)}) \mid \hat{p}^{(1)} \leq u]\) 关于 \(u\) 递增(\(j=1 \in \mathcal{H}_0\))。

在此特例中,\(\hat{p}^{(1)}\) 只依赖 \((X_1, Y_1^{(1)})\)\(\hat{p}^{(2)}\) 只依赖 \((X_1, Y_1^{(2)})\)。关键观察:\(X_1\) 是共享的参考样本,它同时出现在两个混合池中,因此两个 p-value 不独立——它们的依赖完全通过 \(X_1\) 传递。

  • \(\hat{p}^{(1)} \leq 1/2\) 时,意味着 \(R_1^{(1)} = 1\),即 \(Y_1^{(1)} < X_1\)。这“筛选出”了 \(X_1\) 较大的情形。在 \(X_1\) 较大时,\(Y_1^{(2)}\)(若来自偏大的 \(P^{(2)}\))更容易大于 \(X_1\),从而 \(R_1^{(2)}\) 更可能取大值(\(\hat{p}^{(2)}\) 更可能取大值)。因此,条件 \(\hat{p}^{(1)}\) 小反而筛选出了使 \(\hat{p}^{(2)}\) 更大的 \(X_1\) 状态——这正是正回归依赖的直觉:零假设下的 p-value 变小,筛选出的参考样本状态使得其他 p-value(无论是否在零假设下)倾向于变大。

  • 归纳秩向量支配的核心想法(在此特例中的雏形):在零假设下,\((S_1, T_1^{(1)})\) 可交换。我们可以构造一个“虚拟秩向量” \(\tilde{R}_1^{(1)}\),使得 \(\tilde{R}_1^{(1)} \geq R_1^{(1)}\) 几乎必然成立,且 \(\tilde{R}_1^{(1)}\) 的分布与 \(X_1\) 的具体取值无关(仅依赖可交换结构)。在这个特例中,\(\tilde{R}_1^{(1)} = n+1 = 2\)(即假设测试点总是取最大秩)就是一个几乎必然支配 \(R_1^{(1)}\) 的虚拟秩——虽然粗糙,但它展示了核心思路:通过归纳构造,将真实秩替换为一个“更保守”的虚拟秩,该虚拟秩的联合分布具有单调性,从而 PRDS 成立。一般情形下的归纳构造需要处理多组、多个测试点、以及组间共享参考样本带来的复杂依赖,但最小内核已经揭示了:PRDS 的根源在于共享参考样本所传递的正依赖信息,而归纳秩支配是切断该依赖、构造保守单调结构的工具


三、这篇论文做了什么

三句话: ① 研究了从多个比较组分布中识别出与参考分布不同的组、同时控制 FDR 的多重检验问题; ② 核心方法是构造 batch conformal p-value(各组测试点 conformal p-value 的最小值),并证明其满足 PRDS; ③ 主要结论是:基于 batch conformal p-value 的 BH 程序实现了精确、分布自由的 FDR 控制,且功效优于子抽样 conformal 方法,在某些已知分布设定下与参数方法可比。

关键设定与假设: - 设定:1 个参考组(样本量 \(n\)),\(m\) 个比较组(样本量 \(n_j\)),各组独立抽样。分数函数 \(V\) 通过数据分割从独立训练集估计,参考集与测试集对 \(V\) 条件独立。 - 核心假设: 1. 可交换性:在 \(H_0^{(j)}\) 下,\((S_1, \ldots, S_n, T_k^{(j)})\) 对坐标置换不变。这是 conformal inference 的标准假设,相比参数检验的分布假设极弱。 2. 连续性调整:分数 \(V\) 的分布可能非连续,导致秩有结。作者采用随机破结,或引用 Kuchibhotla (2020) 的加噪调整,使调整后分数的分布非原子,秩几乎必然唯一。这比 Bates et al. (2021) 的处理更明确。 3. 条件独立性:训练集、参考集、测试集三分割,\(V\) 仅依赖训练集。这是 split conformal 的标准要求,相比 full conformal 避免了重拟合计算,但牺牲了部分功效。 - 与已有文献的对比:可交换性假设与 Bates et al. (2021) 一致,但本文允许每组多个测试点(Bates et al. 仅单点);三分割与 Romano et al. (2019) 的 split conformal 一致;PRDS 条件比 Benjamini & Yekutieli (2001) 的通用依赖设定更强,但比 Mary & Roquain (2021) 的 empirical p-value 依赖结构更易验证。

主要结果: 1. 定理 1(PRDS 性质):在零假设组 \(\mathcal{H}_0\) 下,batch conformal p-value 向量 \((\hat{p}^{(1)}, \ldots, \hat{p}^{(m)})\) 满足 PRDS。直觉:共享参考样本使得各组 p-value 正依赖——零假设组 p-value 变小筛选出“参考样本偏极端”的状态,此时其他组 p-value 也倾向偏大(因测试点更难超过极端参考值)。必要条件:可交换性 + 非原子分数分布(通过加噪/随机破结保证)。解决的技术难点:多组、多测试点下秩向量的联合分布极其复杂(组间共享参考样本、组内多个测试点彼此不可交换),直接计算依赖结构不可行;归纳秩支配技术绕过了联合分布的显式计算。 2. 定理 2(精确 FDR 控制):基于 batch conformal p-value 的 BH 程序,在目标水平 \(\alpha\) 下,\(\text{FDR} \leq \alpha\),且等号在所有组均为零假设时成立(精确控制)。直觉:PRDS 保证了 BH 程序在依赖结构下的有效性(Benjamini & Yekutieli 2001 的经典结论),而 batch conformal p-value 的边际分布为 \(\text{Unif}(0,1)\)(在零假设下),使得 BH 的 FDR 界精确可达。必要条件:定理 1 的 PRDS + 零假设下 p-value 的边际均匀性。 3. 定理 3(Simes 检验的有效性):Batch conformal p-value 可用于 Simes 检验,控制类型 I 错误。这引用 Sarkar (2008) 的结论:PRDS 下 Simes 不等式成立,是定理 1 的直接推论,拓展了方法的适用场景。

证明路线与技术技巧: - 整体路线(定理 1 的证明): 1. 问题转化:将 PRDS 的证明转化为证明秩向量 \((R^{(j)}_k)_{j \in \mathcal{H}_0, k}\) 的联合分布满足某种单调性——即条件期望 \(\mathbb{E}[g(R) \mid R^{(j)}_k \leq r]\) 关于 \(r\) 递减(秩小 = p-value 小)。 2. 归纳构造虚拟秩向量:对每个零假设组 \(j \in \mathcal{H}_0\) 的每个测试点 \(k\),构造虚拟秩 \(\tilde{R}_k^{(j)}\),使得:(a) \(\tilde{R}_k^{(j)} \geq R_k^{(j)}\) 几乎必然(虚拟秩支配真实秩); 的联合分布具有理想单调性(条件期望递减);(c) \(\tilde{R}_k^{(j)}\) 的构造仅依赖可交换结构,不依赖具体分布。 3. 归纳步骤:从 \(n\) 个参考样本出发,逐个插入零假设组的测试点。每插入一个测试点 \(T_k^{(j)}\),其在当前混合池中的真实秩 \(R_k^{(j)}\) 受参考样本与已插入测试点的具体取值影响;但虚拟秩 \(\tilde{R}_k^{(j)}\) 被构造为“假设该测试点取当前池中的最大值”所对应的秩,从而 \(\tilde{R}_k^{(j)} \geq R_k^{(j)}\) 几乎必然,且 \(\tilde{R}_k^{(j)}\) 仅依赖池的大小与可交换性,不依赖取值。 4. 单调性传递:由于虚拟秩 \(\tilde{R}\) 的联合分布是可交换结构下的“最保守”分布(测试点总取最大秩),其条件期望天然单调——条件 \(\tilde{R}_k^{(j)}\) 小意味着池中已有极值点,使得后续插入点的虚拟秩更可能小(单调递减)。真实秩 \(R\)\(\tilde{R}\) 支配,且 \(\tilde{R}\) 的单调性通过支配关系传递给 \(R\) 的 p-value(p-value = 秩/(n+1),支配反转后变为 p-value 的单调递增),从而 PRDS 成立。 5. 非零假设组的处理:非零假设组 \(j \notin \mathcal{H}_0\) 的测试点不可交换,但其 p-value 仍依赖共享参考样本。PRDS 的定义仅要求对零假设组的 p-value 条件,非零假设组的 p-value 作为递增函数 \(g\) 的参数,其依赖结构无需额外假设——归纳构造仅针对零假设组,非零假设组通过共享参考样本自然被纳入正依赖结构。

  • 关键跳跃点归纳构造虚拟秩向量 \(\tilde{R}\) 并证明其几乎必然支配真实秩 \(R\)。难点在于:多组多测试点下,组间共享参考样本使得真实秩的联合分布无显式表达;组内多个测试点彼此不可交换(因它们来自同一 \(P^{(j)}\) 但混合池包含其他组已插入的点),无法直接套用 Bates et al. (2021) 的单点可交换论证。作者通过归纳插入 + 虚拟最大秩假设,绕过了联合分布的显式计算,将复杂依赖结构简化为可交换结构下的最保守情形。

  • 技术技巧点名

  • 归纳秩构造:逐个插入测试点并赋予虚拟最大秩,保证支配性与单调性。用于定理 1 证明的核心步骤,替代了显式联合分布计算。
  • 随机破结 / 加噪调整:引用 Kuchibhotla (2020),对分数加小噪声使其分布非原子,保证秩几乎必然唯一。用于处理连续性缺失,是 PRDS 证明的技术前提。
  • 三分割:训练集拟合 \(V\),参考集计算 \(S_i\),测试集计算 \(T_k^{(j)}\)。用于保证 \(V\) 固定下参考集与测试集的条件独立与可交换性,是 split conformal 的标准操作。
  • Benjamini & Yekutieli (2001) 的 PRDS-BH 理论:作为现成工具引用,将 PRDS 直接转化为 FDR 控制,无需重新证明 BH 的有效性。

真实例子与应用: 1. 丙型肝炎治疗数据: - 场景:识别对治疗有显著响应的患者亚组。参考组为无显著响应的患者,比较组为不同基因型/治疗方案的患者亚组。 - 方法应用:构造分数 \(V\) 为治疗响应的残差(基于协变量预测响应,残差反映纯治疗效应),计算各亚组的 batch conformal p-value,用 BH 程序筛选。 - 结果:识别出若干基因型-治疗方案组合具有显著治疗效应(分布与参考组不同),FDR 控制在目标水平。 - 说明什么:展示方法在真实临床数据上的适用性,验证 FDR 控制的实际有效性,并展示分数 \(V\) 的灵活构造(残差 = 条件均值偏离,连接到因果推断的结构)。

  1. 当前人口调查(CPS)数据
  2. 场景:识别工作时间异常长的子人群。参考组为正常工作时间的人群,比较组为不同职业/教育/地区子人群。
  3. 方法应用:分数 \(V\) 为工作时间的标准化偏离,计算各子人群的 batch conformal p-value,BH 程序筛选。
  4. 结果:识别出若干子人群(如特定职业组)的工作时间分布显著偏长。
  5. 说明什么:展示方法在社会科学数据上的应用,验证分布自由性质在非正态、重尾数据(工作时间分布常右偏)下的稳健性。

  6. 模拟实验

  7. 场景:参考分布为标准正态,比较组为均值偏移的正态(不同偏移量 \(\delta\) 与组数 \(m\))。
  8. 方法应用:比较 batch conformal + BH 与子抽样 conformal + BH、以及已知正态分布的参数 t 检验 + BH。
  9. 结果:batch conformal 的 FDR 精确控制在目标水平;功效在 \(\delta\) 较大时接近参数 t 检验(尽管是分布自由的),在 \(\delta\) 中等时优于子抽样 conformal(因利用全量样本)。
  10. 说明什么:验证分布自由方法在已知分布设定下不显著劣于参数方法,且批量利用数据确实提升功效。

🔎 结论是否比证明窄: - 定理 1 的 PRDS 证明严格依赖“零假设组测试点与参考样本可交换”+“非原子分数分布”。作者在文中 claim batch conformal p-value 可用于 Simes 检验(定理 3),这严格依赖 Sarkar (2008) 的 PRDS-Simes 结论,条件与定理 1 一致,无泛化。 - 作者在讨论部分提及 batch conformal p-value 可拓展到 full conformal(不分割训练集,重拟合 \(V\)),但未给出证明,仅作为 conjecture。Full conformal 下 \(V\) 依赖全数据,可交换性条件更复杂,归纳秩支配技术是否仍成立是开放问题——这是一个结论比证明窄的地方,研究者需注意。


四、开放问题(点到为止,扎根具体语句)

  1. Full conformal 拓展下的 PRDS 是否成立? 作者在讨论部分提及“full-conformal e-values [Vovk and Wang, 2021], enabling more efficient use of the data”(引用 Lee et al. 2025),但本文的 PRDS 证明严格依赖三分割下的条件可交换性。Full conformal 下 \(V\) 随测试点变化,归纳秩支配的“虚拟最大秩假设”是否仍能保证几乎必然支配,需重新验证——扎根于本文讨论部分对 full conformal 的 conjecture。

  2. 分数函数 \(V\) 的选择对功效的影响与最优性:本文证明了对任何 \(V\)(满足非原子条件)FDR 均精确控制,但功效高度依赖 \(V\) 的选择(如残差 vs 分位数偏离)。作者在模拟中使用了条件均值残差,但未给出 \(V\) 的最优选择理论——扎根于第 5 节“the choice of the score function \(V\) is flexible... but the power depends on this choice”。

  3. 置换检验与 batch conformal 的功效-计算权衡:作者将置换检验的劣势定位为计算昂贵(引用基因组学文献),但未在理论层面比较两者在相同计算预算下的功效。在 \(n\)\(n_j\) 较小、置换可行时,置换检验是否比 batch conformal 功效更高?——扎根于第 1 节“permutation tests are performed often, but are known to be expensive”,该判断仅基于计算,未涉及功效。

  4. 非零假设组间依赖对 FDR 的影响:本文的 PRDS 证明仅针对零假设组,非零假设组的依赖结构未受限。在备择假设组间存在强负依赖时,BH 程序的 FDR 是否仍精确控制?Benjamini & Yekutieli (2001) 的 PRDS 条件仅要求零假设组 PRDS,理论上不受备择假设组依赖影响,但实际功效可能受损——扎根于定理 1 的陈述“for \(j \in \mathcal{H}_0\)”,非零假设组未被纳入 PRDS 条件。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论