跳转至

Multiple testing with the horseshoe

作者: Sayantan Banerjee, Ismaël Castillo, Fanny Villers
主题: 数理统计 / 假设检验
相关性: 7/10
链接: https://arxiv.org/abs/2606.30375


一、领域脉络与小综述

这个方向是什么

本文研究的根本问题是:在高维稀疏信号检测中,如何利用连续收缩先验(continuous shrinkage priors,以 horseshoe 先验为代表)进行多重假设检验,并同时实现频率学派意义上的 FDR 控制和最优检测功效。 核心矛盾在于:连续收缩先验(如 horseshoe)虽然计算可扩展、自适应收缩,但由于其绝对连续(absolutely continuous)的性质,后验分布不产生精确零值,因此无法直接得到后验包含概率(posterior inclusion probability),使得基于后验的 FDR 控制变得非平凡。该方向当前成熟度:理论框架正在建立中,但已有 spike-and-slab 先验的完备理论作为参照。

发展脉络(history)

奠基工作: - Benjamini & Hochberg (1995) [7]:提出 FDR 概念和 BH 过程,在独立假设下控制 FDR。这是整个多重检验领域的基石。 - Efron et al. (2001) [21]:将经验贝叶斯(empirical Bayes)引入多重检验,提出 two-groups 模型,为贝叶斯方法提供了频率学派框架。 - Carvalho, Polson & Scott (2010) [12]:提出 horseshoe 先验,通过全局-局部尺度混合(global-local scale mixture)实现自适应收缩,成为连续收缩先验的代表。

主要进展: - van der Pas, Szabó & van der Vaart (2017) [49]:建立了 horseshoe 先验的后验收缩率(posterior contraction rates)和自适应性质,证明了其在稀疏序列模型中的近 minimax ℓ₂ 风险。留下的口子:该工作主要关注估计,未涉及多重检验。 - van der Pas, Szabó & van der Vaart (2017) [50]:研究了 horseshoe 先验的不确定性量化(uncertainty quantification),分析了边际可信区间(marginal credible sets)的频率学派校准性质。留下的口子:作者明确指出,对于多重检验,"there is no theory yet backing up one method or the other"(第4页),且不清楚如何用经验规则产生控制 FDR 的检验程序。 - Castillo & Roquain (2020) [15]:对 spike-and-slab 先验的 ℓ-value 程序建立了频率学派 FDR 控制理论,证明了其 FDR 趋于零,且 q-value 对强信号有接近目标水平的 FDR。留下的口子:该工作限于 spike-and-slab 先验(离散混合),不适用于连续收缩先验。 - Abraham, Castillo & Roquain (2024) [3]:建立了稀疏序列模型下多重检验风险 R = FDR + FNR 的 sharp minimax 边界,并证明 ℓ-value 程序达到该边界。留下的口子:同样限于 spike-and-slab 先验。

当前 frontier: - 连续收缩先验(horseshoe, horseshoe+, Dirichlet-Laplace 等)在多重检验中的理论性质几乎空白。已有工作如 Salomond (2017) [42] 仅获得大信号下的初步结果,Paul, Ghosh & Chakrabarti (2026) [36] 假设已知稀疏度 sₙ,自适应保证有限。

本文的位置: 本文是上述脉络的"显然下一步"——将 spike-and-slab 先验下已建立的 ℓ-value 理论(FDR 控制、最优检测边界)推广到连续收缩先验(以 horseshoe 为代表),通过引入 s-value、S-value 和 Cs-value 三个新统计量,填补了连续收缩先验在多重检验中的理论空白。

子线索聚类

  1. Spike-and-slab 先验的多重检验理论([2, 3, 15, 16, 24]):以离散混合先验为基础,利用后验包含概率 ℓ-value 进行检验,已建立完备的 FDR 控制和最优性理论。这是本文的"理论理想"参照。
  2. 连续收缩先验的估计理论([12, 47, 49, 50]):研究 horseshoe 等先验的后验收缩率、自适应性和不确定性量化,但几乎不涉及多重检验。本文直接建立在此之上。
  3. 经验贝叶斯多重检验([21, 29, 30, 43, 44, 45]):以 Efron 的 two-groups 模型和 Storey 的 q-value 为代表,通过数据驱动估计先验参数实现 FDR 控制。本文的 MMLE 选择 τ 属于此线索。
  4. 高维模型中的贝叶斯变量选择([17, 23, 27, 33, 41]):将连续收缩先验应用于高维回归、图模型等,但缺乏理论上的 FDR 控制保证。本文的模拟部分覆盖了这些模型。

这个方向在追问的核心问题

  1. 如何为连续收缩先验定义"后验包含概率"的替代量? 由于连续先验不产生精确零值,ℓ-value 不可用。本文的 s-value 是核心答案。
  2. 如何实现 FDR 的渐近频率学派控制? 即找到一个决策规则,使得在真实参数固定(非随机)下,FDR 收敛到目标水平 t。本文的 S-value 和 Cs-value 针对此问题。
  3. 如何达到最优检测边界(optimal detection boundary)? 即 FDR + FNR 风险达到 minimax 下界。本文的 s-value 被证明达到该边界。
  4. 如何自适应未知稀疏度 sₙ? 即程序不需要知道 sₙ 就能达到最优。本文通过 MMLE 估计 τ 实现自适应。

已知瓶颈: 连续收缩先验的绝对连续性使得后验分布不产生精确零值,因此无法直接使用 ℓ-value。已有的经验规则(如阈值化后验均值、使用可信区间)缺乏理论保证。

⚠️ 作者的 framing

作者把缺口 frame 成: "Because continuous shrinkage priors do not produce exact zeros however, variable selection and multiple testing require an additional decision rule. ... there is no theory yet backing up one method or the other."(第4页)——即连续收缩先验的多重检验理论完全空白,本文的 s-value 等是填补这一空白的"显然下一步"。

被淡化或回避的竞争路线: - Variational Bayes (VB) 方法(如 [18, 38]):作者在第3页提到 VB 方法"scales comparably to other optimisation procedures such as the LASSO",但指出"very little is known so far on their variable-selection properties, even assuming strong signal conditions"。作者将 VB 定位为"近似方法",而非理论框架。 - Knockoff 方法([6, 11]):仅在引言第一段作为 FDR 控制的"popular options"之一被提及,未进一步讨论。作者显然选择贝叶斯路线而非频率学派路线。

什么明显该被引/该存在、却没出现在 intro 里? - 低度多项式(low-degree polynomial)方法:对于稀疏信号检测的计算-统计权衡问题,低度多项式障碍(low-degree likelihood ratio)是近年活跃的方向。本文完全未涉及计算复杂性,这可能是作者有意回避——本文聚焦于统计最优性而非计算可行性。 - Donoho & Jin (2004) 的 Higher Criticism:作为稀疏信号检测的经典频率学派方法,未被引用。这可能是因为本文采用贝叶斯框架,而非频率学派检验。

张力

未见明显对立引用。各被引工作之间在方法论上互补而非矛盾:spike-and-slab 先验提供理论理想,连续收缩先验提供计算可扩展性,经验贝叶斯提供自适应参数选择。本文试图在连续收缩先验中复现 spike-and-slab 的理论性质。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

符号: - n:样本量/坐标数(在序列模型中,n 既是样本量也是参数维度)。 - θ = (θ₁, ..., θₙ) ∈ ℝⁿ:未知参数向量,每个 θᵢ 是第 i 个坐标的真实信号值。 - X = (X₁, ..., Xₙ):可观测数据向量,Xᵢ = θᵢ + εᵢ,其中 εᵢ ~ N(0,1) 独立。 - sₙ:稀疏度参数,即 θ 中非零坐标的个数。假设 sₙ/n → 0。 - S₀ = {i : θ₀ᵢ ≠ 0}:真实参数 θ₀ 的支持集。 - τ:horseshoe 先验的全局收缩参数(global shrinkage parameter),控制整体稀疏度。 - λᵢ:局部尺度参数(local scale parameter),服从半柯西分布 C⁺(0,1)。 - Π[·|X]:后验分布,即给定数据 X 下 θ 的条件分布。 - sᵢ(X):第 i 个坐标的 s-value,定义为 sᵢ(X) = 2 min(Π(θᵢ < 0|X), Π(θᵢ > 0|X))。 - Sᵢ(X):第 i 个坐标的 S-value,定义为 Sᵢ(X) = 2 min(Π(θᵢ < 0|Xᵢ ≥ |Xᵢ|), Π(θᵢ > 0|Xᵢ ≤ -|Xᵢ|))。 - φ(X) = (φ₁(X), ..., φₙ(X)) ∈ {0,1}ⁿ:多重检验决策规则,φᵢ = 1 表示拒绝 H₀ᵢ(即认为 θᵢ ≠ 0)。 - FDR(θ, φ) = E_θ[∑ 1{θᵢ=0, φᵢ=1} / (1 ∨ ∑ φᵢ)]:错误发现率。 - FNR(θ, φ) = E_θ[∑ 1{θᵢ≠0}(1-φᵢ) / (1 ∨ ∑ 1{θᵢ≠0})]:假阴性率。 - R(θ, φ) = FDR + FNR:组合多重检验风险。 - Φ(·):标准正态分布函数;ϕ(·):标准正态密度函数。 - ¯Φ(u) = 1 - Φ(u):标准正态生存函数。 - ζ_{sₙ/n} = √(2 log(n/sₙ)):检测边界的关键量。 - τₙ(s) = (s/n)√(log(n/s)):MMLE 的 oracle 收敛目标。 - C* = (2/π)^{3/2}:出现在 S-value 渐近分析中的常数。 - h(u) = (u²/2)ϕ(u)^{-1} = √(2π) e^{u²/2} / (u²/2):用于 s-value 边界的关键函数。 - H(u) = 1/(u ¯Φ(u)):用于 S-value 边界的关键函数。 - λ(·) = h^{-1}(·):h 的反函数;Λ(·) = H^{-1}(·):H 的反函数。

模型: - 稀疏正态均值模型(sparse normal means model):Xᵢ = θᵢ + εᵢ,εᵢ ~ N(0,1) i.i.d.,θ 属于 ℓ₀[sₙ] = {θ ∈ ℝⁿ : |{i : θᵢ ≠ 0}| ≤ sₙ}。 - Horseshoe 先验:θᵢ | λᵢ, τ ~ N(0, τ²λᵢ²),λᵢ ~ C⁺(0,1)(半柯西),τ 是全局参数(可通过 MMLE 估计或赋予半柯西先验)。 - 频率学派分析:假设数据 X 由真实固定参数 θ₀ 生成(X ~ P_{θ₀}),后验分布 Π[·|X] 在此假设下被分析。

可观测数据: - 实际能观测到:X = (X₁, ..., Xₙ),即带噪声的信号。每个 Xᵢ 是标量。 - 想要但观测不到:真实参数 θ₀(包括其支持集 S₀ 和信号强度)。潜在量:λᵢ(局部尺度参数),τ(全局参数)。这些只能通过后验推断或 MMLE 估计。

第二步:讲最小内核

最简特例:d=1(单坐标情形),τ 已知固定

考虑最简单的情形:只有一个坐标(n=1),观测 X = θ + ε,ε ~ N(0,1),θ 服从 horseshoe 先验 Π_τ(τ 已知)。我们要检验 H₀: θ = 0 vs H₁: θ ≠ 0。

核心问题:由于 horseshoe 先验是连续的,Π(θ = 0|X) = 0,无法像 spike-and-slab 那样用后验包含概率做检验。怎么办?

本文的关键想法:用后验分布中 θ 落在零两侧的概率的最小值的两倍作为检验统计量,即 s-value = 2 min(Π(θ < 0|X), Π(θ > 0|X))。

为什么这能工作? - 当 X 接近 0 时(信号弱),后验分布集中在 0 附近,Π(θ < 0|X) ≈ Π(θ > 0|X) ≈ 1/2,所以 s-value ≈ 1,不拒绝 H₀。 - 当 |X| 很大时(信号强),后验分布集中在 X 附近(远离 0),例如 X > 0 时 Π(θ < 0|X) 很小,所以 s-value 很小,拒绝 H₀。 - 因子 2 的作用:使得 s-value 在 X=0 时恰好等于 1(因为 Π(θ < 0|X=0) = 1/2,乘以 2 得 1),从而 s-value ∈ [0,1] 且与 ℓ-value 可比。

数学上:s-value 程序 φₜˢ(X) = 1{s(X;τ) < t} 等价于一个基于双边后验可信区间的程序:拒绝 H₀ 当且仅当 0 不在水平为 1-t 的中心化后验可信区间内(附录 A.6 证明)。这为 s-value 提供了直观的几何解释。

推广到 n 维:在 n 维独立情形下,每个坐标独立地应用上述规则,s-value 程序 φₜˢ(X) = (1{s(Xᵢ;τ) < t}, i=1,...,n)。本文证明,当 τ 通过 MMLE 自适应估计时,该程序在稀疏序列模型中达到最优 minimax 风险 R = FDR + FNR。


三、这篇论文做了什么

三句话

  1. 研究了什么问题:在高维稀疏正态均值模型下,利用连续收缩先验(以 horseshoe 为代表)进行多重假设检验,提出了 s-value、S-value 和 Cs-value 三个基于后验的决策规则,并建立了其频率学派最优性理论。
  2. 核心工具/方法:通过引入 s-value(后验分布中 θ 落在零两侧概率的最小值的两倍)作为 ℓ-value 的连续先验替代,结合 MMLE 自适应估计全局参数 τ,利用精细的积分不等式和浓度不等式分析后验行为。
  3. 主要结论:s-value 程序在稀疏序列模型中达到最优 minimax 多重检验风险 R = FDR + FNR(Theorem 1);S-value 程序在给定目标 FDR 水平 t 下渐近控制 FDR 于 t 并保持最优 FNR(Theorem 2);模拟验证了理论结果在高维回归和图模型中的适用性。

关键设定与假设

完整设定(在第二节最小记号基础上补充):

  • 稀疏信号类 L₀[sₙ; b](定义 (18)):θ ∈ ℓ₀[sₙ] 且对所有 i ∈ S_θ,|θᵢ| ≥ √(2 log(n/sₙ)) + b。这是检测边界附近的"最坏情形"信号类。
  • 边界信号类 L₀,=[sₙ; b](定义 (20)):θ ∈ ℓ₀[sₙ] 且对所有 i ∈ S_θ,|θᵢ| = √(2 log(n/sₙ)) + b。用于 Theorem 2 的精确 FDR 控制分析。
  • 假设
  • n, sₙ → ∞,sₙ/n → 0(稀疏性假设)。
  • εᵢ ~ N(0,1) i.i.d.(高斯噪声)。
  • Horseshoe 先验:θᵢ | λᵢ, τ ~ N(0, τ²λᵢ²),λᵢ ~ C⁺(0,1)。
  • τ 通过 MMLE 估计(定义 (15)),或通过层次贝叶斯(半柯西先验)采样。
  • 相比已有文献的放宽/强化
  • 放宽:相比 spike-and-slab 先验([3, 15]),本文使用连续收缩先验,避免了离散模型采样的计算困难。
  • 强化:相比已有 horseshoe 多重检验工作([36, 42]),本文不假设已知稀疏度 sₙ,通过 MMLE 实现完全自适应;且获得了精确常数级的浓度结果(Proposition 3),而非仅到常数级的界。

主要结果

Theorem 1(s-value 的最优性): - 陈述:对任意固定 b ∈ ℝ,令 φ̂ₜˢ 为 s-value 程序(使用 MMLE 估计 τ,固定水平 t ∈ (0,1))。则当 n, sₙ → ∞ 时, sup_{θ₀ ∈ L₀[sₙ; b]} {FDR(θ₀, φ̂ₜˢ) + FNR(θ₀, φ̂ₜˢ)} = ¯Φ(b) + o(1)。 - 直觉:¯Φ(b) 是 minimax 下界([3] Theorem 1),所以 s-value 程序达到最优。这意味着 s-value 程序在检测边界信号时,其 FDR+FNR 风险与最优程序不可区分。 - 必要条件:需要 MMLE ˆτ 集中在 [d₁τₙ(sₙ), d₂τₙ(sₙ)] 内(Proposition 1),且 s-value 的边界估计(Lemma 6.2)成立。 - 解决的技术难点:需要同时控制 FDR(趋于 0)和 FNR(趋于 ¯Φ(b)),且证明对 τ 的随机性鲁棒。

Theorem 2(S-value 的 FDR 控制): - 陈述:对任意固定 b ∈ ℝ 和 t ∈ (0, 1/2],令 φ̂ₜˢ 为 S-value 程序(使用 MMLE 估计 τ)。则对任意 θ₀ ∈ L₀,=[sₙ; b], FDR(θ₀, φ̂ₜˢ) → t,FNR(θ₀, φ̂ₜˢ) → ¯Φ(b),当 n, sₙ → ∞。 - 直觉:S-value 程序在渐近意义上精确控制 FDR 于目标水平 t,同时 FNR 达到最优(因为 ¯Φ(b) 是 FNR 的下界,见 [3] Theorem 3)。相比 s-value(FDR 趋于 0),S-value 更不保守,对中等信号有更高功效。 - 必要条件:需要 MMLE ˆτ 集中在精确常数级区间 [τₙ(sₙ)(Φ(b)-δ)/C, τₙ(sₙ)(Φ(b)+δ)/C] 内(Proposition 3),这比 Theorem 1 的常数级界更精细。 - 解决的技术难点:需要精确控制 FP 和 TP 的期望,使得 FDR = E[FP]/(E[FP]+E[TP]) → t。这要求 MMLE 的浓度达到匹配常数(matching constant),而 Theorem 1 只需要到常数级的界。

证明路线与技术技巧

Theorem 1 证明路线(Section 6.2-6.3 + Appendix A.1):

  1. s-value 的边界估计(Lemma 6.2):对固定 τ,将 s-value s(x;τ) 用简单函数 h(x) = (x²/2)ϕ(x)^{-1} 夹逼。关键技巧:将 horseshoe 的连续混合积分分解为三个区域([0, √2], [√2, M_τ], [M_τ, ∞)),分别用不同的不等式处理。对 x ∈ [√2, M_τ],得到 s(x;τ) ∈ [(1 - O(τ^{1/4}))/(1 + τ₊h(x)), (1 + O(τ^{1/4}))/(1 + τ₋h(x)/4)]。

  2. MMLE 的浓度(Proposition 1):证明 ˆτ ∈ [d₁τₙ(sₙ), d₂τₙ(sₙ)] 以高概率成立。上界来自 [49] Theorem 1;下界是新结果,通过分析边际似然导数 ∂M_τ/∂τ 在 τ 很小时的正性得到。关键技巧:将导数分解为 M₀(来自零坐标)和 M₁(来自非零坐标),分别控制。M₀ 用 [49] 的引理(Lemma A.13)得到 M₀ζ_τ/n → -C*;M₁ 用 Lemma A.14 得到 m_τ(x) ≈ μ_τ(x) = τ/(τ + πx²e^{-x²/2}/2),对强信号为正且足够大。

  3. FNR 上界(Section 6.3):将 FNR 分解为 (I) + (II),其中 (I) 对应 |Xᵢ| ∈ [√2, M_{τ₊}],(II) 对应其他。对 (I),用 s-value 上界反解出 |Xᵢ| < λ(τ_{t,+}) 的条件,再用 θ₀ ∈ L₀[sₙ; b] 将 |Xᵢ| 转化为 εᵢ 的条件,得到 E[(I)] ≤ sₙ¯Φ(b) + o(sₙ)。对 (II),证明其贡献为 o(sₙ)。

  4. FDR 上界(Appendix A.1):先证明 TP ≥ (Φ(b)-δ)sₙ 以高概率(事件 B),然后对 FP 用 s-value 下界得到 FP ≤ F₊,其中 E[F₊] = o(sₙ)。最后用 Jensen 不等式和 x/(x+d) 的凹性得到 FDR ≤ E[F₊]/(E[F₊]+csₙ) + o(1) = o(1)。

Theorem 2 证明路线(Appendix A.3.1):

  1. S-value 的边界估计(Lemma A.6):对 x ∈ [μₙ, M_τ/2],得到 Π(θ < 0|X ≥ x) ≈ ¯Φ(x)/(2¯Φ(x) + C*τ/x)。关键技巧:将 S-value 的积分表达式分解,利用 [49] 的 I_k 函数展开(Lemma A.15)。

  2. MMLE 的精确浓度(Proposition 3):证明 ˆτ ∈ [τₙ(sₙ)(Φ(b)-δ)/C, τₙ(sₙ)(Φ(b)+δ)/C] 以高概率成立。这比 Proposition 1 更强,需要精确常数。关键技巧:对导数 M₁ 的贡献进行更精细的三区域分解(S_small, S₁, S₂),利用 θ₀ ∈ L₀,=[sₙ; b] 的等号性质得到精确的上下界。

  3. FNR 控制:类似 Theorem 1,但用 S-value 的边界得到更精确的阈值 Λ(τ_{t,±})。

  4. FDR 控制:核心是证明 E[FP] ≈ sₙ(t/(1-t))Φ(b) 和 E[TP] ≈ sₙΦ(b),从而 FDR → t。关键技巧:

  5. 用 S-value 边界得到 FP 的近似期望:E[FP] ≈ n·2¯Φ(Λ(τ_{t,-})) ≈ sₙ(t/(1-t))Φ(b)。
  6. 用 MMLE 的精确浓度将 τ₊ 和 τ₋ 的差异控制在 δ 内,最终通过 δ → 0 得到精确极限。
  7. 下界部分(FDR ≥ t)通过构造事件 C_S 并用 Bernstein 不等式控制概率。

技术技巧点名: - 积分不等式:对 horseshoe 的连续混合积分进行三区域分解([0, √2], [√2, M_τ], [M_τ, ∞)),分别用不同的不等式处理(Lemma 6.2, Lemma A.6)。 - I_k 函数展开:利用 [49] 的 I_{-1/2}, I_{1/2}, I_{3/2} 函数展开(Lemma A.15),将复杂的连续混合积分近似为简单函数。 - Poisson-Binomial 随机占优:用 Binomial 分布随机占优 Poisson-Binomial 分布(Lemma S-25 in [3]),简化 FNR 和 TP 的概率控制。 - Bernstein 不等式(Lemma A.4):用于控制二项式和的偏差概率。 - Jensen 不等式 + 凹性:用 x/(x+d) 的凹性将 FDR 的期望上界转化为期望的比值(Appendix A.1)。 - 反函数技巧:利用 h(·) 和 H(·) 的反函数 λ(·) 和 Λ(·) 将 s-value/S-value 的阈值条件转化为 |Xᵢ| 的阈值条件。 - 精确常数浓度(Proposition 3):通过分析边际似然导数在 τ 不同区间的符号,得到 MMLE 的精确常数级浓度,这是 Theorem 2 的关键。

真实例子与应用

本文包含三个实证场景:

  1. 稀疏序列模型(Section 4.1):
  2. 数据:n=10⁴, sₙ=10(或 100),信号强度 µ ∈ {0, 0.5, ..., 8},非零坐标取相同值 µ。
  3. 方法应用:用 MMLE 估计 τ(新提出的快速近似算法,Appendix B.1.1),用 binary search 高效计算 s-value 阈值(Appendix B.1.2),用理论近似计算 S-value(Appendix B.1.3)。
  4. 结果(Figure 2):s-value 的 FDR 始终接近 0(验证 Theorem 1);S-value 的 FDR 在大信号时接近目标水平 t(验证 Theorem 2);Cs-value 的 FDR 略高于 t 但接近;阈值化方法(Thresh)FDR 过高。
  5. 说明:验证理论结果,展示 s-value 的保守性和 S-value 的平衡性。

  6. 高维线性回归(Section 4.2):

  7. 数据:n=3000, p=6000, s=30(或 n=5000, p=10000, s=10),信号强度 µ ∈ [0, 0.2],设计矩阵 X 的三种结构:独立(Σ=I)、AR(ρ) 相关、等相关(Σ_ρ)。
  8. 方法应用:用 Mhorseshoe 包([31, 32])进行层次贝叶斯后验采样,计算 s-value 和 Cs-value。
  9. 结果(Figures 3-4):独立设计下,s-value 和 Cs-value 的表现与序列模型定性一致;弱相关下表现相似;强相关下 FDR 仍接近控制,但略有偏差。
  10. 说明:展示方法在更复杂模型中的适用性,验证理论结果对相关设计的鲁棒性。

  11. 高斯图模型(Section 4.3):

  12. 数据:n=120, p=100/200,四种网络结构(随机、scale-free、hub),来自 [27] 的模拟设置。
  13. 方法应用:用 graphical horseshoe (GHS) 先验 [33] 进行后验采样,对精度矩阵的每个非对角元计算 s-value 和 Cs-value。
  14. 结果(Tables 1-2):s-value 的 FDR 远低于目标水平(保守),Cs-value 的 FDR 接近目标水平。与 [27] 中四种频率学派方法相比,s-value 和 Cs-value 是唯一能控制 FDR 的方法。
  15. 说明:展示方法在复杂高维模型中的实际有效性,特别是与竞争方法相比的 FDR 控制优势。

🔎 结论是否比证明窄

  • Theorem 1 的"其他信号形状":作者在第12页 Remark 中指出,Theorem 1 的证明可以推广到更一般的信号类 Θ_b(定义 (21)),但"albeit with somewhat more lengthy and technical proofs"。这意味着论文的正式证明仅覆盖了 L₀[sₙ; b] 类,而声称的"最优性"在更广信号类下是 conjecture 而非严格证明。
  • Theorem 2 的"其他信号形状":类似地,第13页 Remark 指出结果可以推广到 Θ_{b,=} 类,"as soon as the optimality quantity Λₙ(b) has a limit"。这同样是 conjecture。
  • Cs-value 的理论:第14页明确写道"In this work we do not consider theory for the Cs-value procedure",尽管模拟中 Cs-value 表现良好。作者推测 Theorem 2 对 Cs-value 也成立,但未证明。
  • 高维回归和图模型的理论:第21页 Discussion 指出"a minimax multiple testing framework for this setting ... has not yet been investigated",且"theory for these is also not available yet"。这意味着论文的理论结果严格限于序列模型,对回归和图模型的适用性仅由模拟支持。

四、开放问题

  1. Cs-value 的理论证明:作者在第14页明确表示未研究 Cs-value 的理论,但推测 Theorem 2 对 Cs-value 也成立。扎根于:"In this work we do not consider theory for the Cs-value procedure (12). However, based on the results derived in [2] for spike-and-slab priors, it can be expected that Theorem 2 carries over to the Cs-value procedure as well."(第14页)

  2. 高维线性回归的 minimax 多重检验框架:作者在第21页指出,高维回归的 minimax 多重检验框架尚未被研究。扎根于:"a minimax multiple testing framework for this setting (analog to the results of [3] for sparse sequences) has not yet been investigated."(第21页)

  3. 图模型的理论:作者在第21页指出,GGM 的理论尚未建立。扎根于:"Similarly, while we have seen strong empirical evidence in favour of the procedures for GGMs, theory for these is also not available yet."(第21页)

  4. 其他收缩先验的理论:作者在第21页 conjecture 结果对 spike-and-slab LASSO 和 Dirichlet-Laplace 先验也成立,但未证明。扎根于:"Another natural extension would be to obtain theory for other shrinkage priors: we conjecture that all the results of the paper remain valid for example for the Spike and Slab LASSO prior [40]."(第21页)

提醒:要确认这些是否真 gap,建议阅读同子领域近期约 5 篇的 intro(如 [2, 3, 15, 36, 50])。如果都指向同一方向,则是共识性 gap;如果互相打架,则可能是机会。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论