Bayesian Model Pursuit and Near-Oracle Sparse Signal Discovery Under Dependence¶

作者: Prasenjit Ghosh, Arijit Chakrabarti
主题: 数理统计 / 假设检验
相关性: 6/10
链接: https://arxiv.org/abs/2606.22490

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的子方向是在已知依赖结构（已知协方差矩阵）下，从高维稀疏信号中进行多重假设检验的最优性问题。具体地说，观测到一组n维正态随机变量，均值向量θ稀疏（大部分元素为0），协方差矩阵Σ已知且任意。目标是从中识别出非零的θ_i，同时控制错判风险。当前该子方向的成熟度是：在独立情形下，已有相当精细的渐近最优性理论（ABOS、尖锐风险界、sharp minimaxity）；但在依赖情形下，从贝叶斯风险角度理解“能达到多好”的问题仍远未解决，本文试图填补这一缺口。

发展脉络（history）¶

作者在introduction中引用了大量工作，将其串成一条线：

奠基工作：
- Benjamini & Hochberg (1995) 和 Benjamini & Yekutieli (2001)：开创了控制FDR的多重检验程序，其中BH程序是后续所有方法的基本参照。作者引用的语境是“central challenge is the control of erroneous discoveries under multiplicity”。
- Abramovich et al. (2006) 和 Bogdan et al. (2008, 2011)：开启了稀疏性下多重检验的渐近贝叶斯最优性（ABOS）研究，为理解独立情形下的Oracle性能提供了理论基础。作者将其定位为“Important themes include asymptotic Bayes optimality under sparsity (ABOS), Oracle risk approximations, local false discovery rate methods, and minimaxity considerations”。
- Donoho & Johnstone (1994)：提出了经典通用阈值 √(2 log n)，本文仿真中信号强度ψ²正是取此值，说明检测难度处于“有意义且非平凡”的边界。
主要进展（独立情形下的精确化）：
- Abraham et al. (2024) 建立了“sharp multiple testing boundary”；Paul et al. (2025) 获得了“sharp asymptotic minimaxity results for testing procedures induced by one-group global–local shrinkage priors”。作者指的语境是“More recently, attention has shifted toward understanding the fundamental limits of sparse multiple testing through sharp asymptotic risk characterizations”。这表明独立情形下的最优性理论已经非常精细。
当前frontier（依赖情形）：
- Cohen, Sackrowitz & Xu (2009) 提出了MRD（最大残差向下）程序，这是一种残差自适应（residual-adaptive）的逐步检验法。作者指出其与BSD的关键联系：“the BSD statistics admit an equivalent representation in terms of the corresponding MRD residual quantities”。
- Efron (2007) 论证了忽视依赖会导致严重误导，但同时也指出依赖可能包含有用信息：“failure to incorporate dependence may lead to substantially misleading inferential conclusions ... dependence may contain valuable information regarding the underlying signal configuration”。这构成了本文的基本立场：依赖不仅是nuisance，也是信息源。
- Ghosh & Chakrabarti (2015) 提出了原始的Bayesian Step-Down (BSD) 程序，但当时被定位为一个依赖感知的贝叶斯多重检验程序。本文是对它的“revisit, reformulate, and reinterpret”，将其提升为“后验引导的模型探究”（posterior-guided model pursuit）框架。
- Ghosh & Chakrabarti (2026a) 提供了局部单调残差逐步程序的可容许性结果；Ghosh & Chakrabarti (2026b) 提出了MRD-GBS程序（基于Gavrilov等人校准的MRD），在仿真中表现出与BSD惊人的一致性。这两篇（尤其是后者）构成了本文最直接、最关键的比较对象。
本文的位置：本文将自己定位在连接两个世界的位置：一是贝叶斯模型探究（模型搜索/随机搜索），一是依赖感知的残差检验。它声称（作者的原话）：“a central theme emerging from the present work is the interpretation of BSD as a posterior-guided model-pursuit strategy for sparse signal discovery under dependence ... the residual representation ... reveals that Bayesian model pursuit and residual-based multiple testing are far more closely related than might initially appear”。

子线索聚类¶

这些被引工作可以聚类在以下四条子线索上：

（频率学派）基于p值的多重检验： 主攻FDR/FWER控制。代表性工作：Benjamini & Hochberg (1995), Benjamini & Yekutieli (2001), Gavrilov et al. (2009), Blanchard & Roquain (2009)。核心关注点是有效性（Type I error control），通常只适用于独立或弱相关情景。集群特征：以p值为输入，对依赖结构的利用往往是调整阈值（如BY）或通过置换/自助法（如Romano et al., 2008），很少深入挖掘几何结构。
（贝叶斯/经验贝叶斯）稀疏性下的最优性： 主攻渐近Bayes最优性（ABOS）、Oracle风险近似、尖锐minimax边界。代表性工作：Abramovich et al. (2006), Bogdan et al. (2008, 2011), Abraham et al. (2024), Paul et al. (2025)。集群特征：通常假设独立，依赖是主要障碍。已建立“what is achievable under independence”的精细理论，但作者指出 “analogous questions become considerably more challenging in the presence of dependence” 来标记缺口。
（频率学派）依赖下的残差/几何方法： 利用协方差结构进行自适应残差化。代表性工作：Cohen et al. (2009) (MRD), Ghosh & Chakrabarti (2026b) (MRD-GBS)。集群特征：程序直接作用于原始数据向量，通过条件残差（如U_statistics）驱动，计算上处理Σ及其子矩阵的逆。MRD-GBS是本文最重要的频率学派对比对象。
（贝叶斯）变量选择与模型搜索： 代表性工作：George & McCulloch (1993, 1997)。集群特征：对高维模型空间进行随机/启发式搜索（如MCMC），但罕见直接用于多重检验。本文将BSD与这条线索联系起来，自称“Bayesian model selection and stochastic search literature ... BSD is developed in the distinct context of dependent multiple testing”。

这个方向在追问的核心问题（2-4个）¶

依赖信息能否以及如何被利用来提升稀疏信号恢复的贝叶斯效率？ 主流方法（如BH、BY）往往只做有效控制，忽视了依赖作为信息源的可能性。
在依赖下，可计算程序（如BSD）能在多大程度上逼近贝叶斯Oracle（本质上的最优规则）？ 这是本文的核心实证问题。
贝叶斯后验驱动与频率学残差驱动两种范式，其结构性的联系是什么？ MRD-GBS与BSD在仿真中的惊人一致暗示了一个深层几何结构，本文的Theorem 4.1部分回答了这个问题。
在依赖下，多重检验程序的可容许性（admissibility）如何刻画？ Cohen & Sackrowitz等人证明了基于p值的程序往往是不可容许的；本文通过Theorem 4.2证明BSD是可容许的。

⚠️ 作者的 framing（必须明确标注成"这是作者的说法"）¶

作者的缺口描述：作者声称“comparatively little is known about the attainable limits of sparse signal discovery from a Bayes-risk perspective... once the test statistics become correlated, the likelihood no longer factorizes, posterior inclusion probabilities depend on the full observation vector, and both the structure of the Bayes Oracle and the associated risk calculations become substantially more complicated”。这是作者为自己定义的核心问题空间：从贝叶斯风险角度对依赖下稀疏恢复的理解是“largely undeveloped”。
作者是如何将自己定位为“显然的下一步”的：作者声称“The contributions of this paper are multifaceted”，并列举了8点贡献，核心论点是“posterior-guided model pursuit perspective” + “residual representation” + “admissibility”。引言中宣称“we revisit, reformulate, and reinterpret the Bayesian Step-Down (BSD) procedure ... a central contribution ... is the development of a posterior-guided model-pursuit perspective for BSD”。
被淡化/回避的竞争路线：
1. 作者淡化了直接近似Bayes规则（如通过变分贝叶斯或MCMC）的可行性。他声称“我们的目标不是直接近似完整的贝叶斯规则”，但并未细致探讨这些计算方法的存活性。这暗示作者认为这些方法在依赖下仍然过于昂贵。
2. 作者回避了深层讨论已知协方差假设本身在现实中是否合理。他承认“The present work assumes that the covariance structure is known”，并简要提到高维协方差估计的文献（Ledoit & Wolf, Bickel & Levina, Cai & Liu），但完全没有推断已知的假设是否可松（如替换为估计量后程序是否欠稳健）。在Discussion部分，他将其定义为“an important challenge”而不是可处理的扩展。
值得去查的问题：什么明显该被引/该存在、却没出现在intro里？
- 低阶多项式的障碍（Low-degree polynomial barrier）：虽然本文没涉及计算下界，但作者讨论的“信号恢复能否被可计算程序（BSD是O(n²)）逼近”恰恰是统计-计算权衡（statistical-computational tradeoff）的经典场景。BSD这个计算复杂度相当低的程序能否真正“几乎达到穷举搜索的Oracle？”如果BSD不能，什么机制在阻挡？如果BSD能（仿真支持），这个结果对计算理论很有冲击。统计-计算权衡文献（如Hopkins, 2018; Kunisky et al., 2019 on the low-degree likelihood ratio）完全没有被提及，这可能是作者有意或无意忽略的，值得研究者自己去检验。
- 基于随机矩阵理论的依赖下检测界：如Johnstone & Onatski等人的工作关于“检测稀疏信号所需信噪比随本征值发散如何变化”，没有出现。这对于依赖结构感兴趣的读者是一个潜在补充方向。
- 强化学习（RL）或序列实验中的多重检验：BSD本质上是一个序贯程序。RL领域有大量关于online multiple testing的工作（如Jamieson & Jain, 2015），但作者没有引入。
张力：未见明显对立引用。各被引工作之间在独立情形下结论是一致的，在依赖下则更多是塑造方法的多样性而非彼此矛盾。唯一微妙的张力是：Cohen等人一系列工作（尤其是可容许性方面）证明基于p值的逐步程序是不可容许的，但本文的BSD与它共享残差几何，却证明了BSD的可容许性。这暗示可容许性不是由程序结构（stepwise）决定的，而是由残差变换的局部单调性决定的。这一张力是高价值信号，说明对于不同检验程序的结构分类有本质区别。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- n: 假设/坐标的个数（维度）。
- X = (X₁, …, Xₙ)ᵀ: 可观测的n维随机向量。
- θ = (θ₁, …, θₙ)ᵀ: 未知的n维均值向量。
- Σ: 已知的n×n正定协方差矩阵（依赖结构）。
- ν = (ν₁, …, νₙ)ᵀ: 潜在的二值指示向量。ν_i = 1 表示第i个信号是活跃的（θ_i ≠ 0），ν_i = 0 表示空（θ_i = 0）。这是无法直接观测到的，是我们要推断的对象。
- p: 先验活跃概率（理论上的信号比例）。
- ψ²: 信号强度（先验方差）。
- ϕ(X) = (ϕ₁, …, ϕₙ): 多重检验程序。ϕ_i(X) ∈ {0,1} 表示对第i个假设的决定（1表示拒绝H₀，即宣称发现信号）。
- δ₀, δₐ: 第I类错误（假阳性）和第II类错误（漏检）的损失权重。
- Bν = diag(ν₁, …, νₙ): 以ν为对角元的对角矩阵。
- S(j1,...,jt-1)_tj (X): BSD统计量——在第t步、已拒绝坐标(j₁,…,j{t-1})后，用于评估第j个候选坐标的“后验胜率”。
- U_(j1,...,jt-1)_tj (X): MRD残差统计量——在第t步、相同历史下，第j个坐标的协方差自适应残差。
模型:
1. 观测模型: X | θ ~ N_n(θ, Σ)。（给定均值向量θ和已知协方差Σ，X服从多元正态分布。）
2. 贝叶斯先验（稀疏诱导的two-group prior）: θ_i ~ (1-p)δ₀ + p N(0, ψ²)。即，坐标i有概率p是活跃的（来自一个相对较大方差ψ²的高斯分布），有概率1-p是0。这个先验是独立同分布的，即θ_i之间的相关性全部从Σ传入。
3. 边际模型（给定ν）: X | ν ~ N_n(0, Σ + ψ²B_ν)。活跃坐标的方差被ψ²放大，空坐标的方差不变。
可观测数据：研究者实际能够观测到的是向量X及其协方差矩阵Σ。ν是不可观测的潜在变量，通过贝叶斯假设（先验）和观测模型（似然）进行推断。

第二步：讲最小内核¶

本文的核心思路不是一个“特例推广”，而是一个“目标优化替换”的结构：因为在大规模依赖下直接优化全局后验风险（Bayes Oracle）是不可行的（指数级状态空间），所以设计一个易于计算的序贯过程（BSD），它在每一步仅局部最优地拓展当前活跃配置。证明该过程最终能几乎再现全局最优行为（近Oracle性能）。

最小内核：一个退化为“两步变量选择”的最简设定

假设只有两个坐标：n=2。我们想检验 (H₀₁：θ₁=0)、(H₀₂：θ₂=0)。协方差矩阵 Σ = [1, σ; σ, 1]，σ ≠ 0。先验活跃度 p 很小 (比如0.01)，信号强度ψ²很大。

符号: - X = (X₁, X₂)ᵀ：可观测。 - ν = (ν₁, ν₂)：潜在指示变量，取值为 (0,0), (1,0), (0,1), (1,1)。 - 目标：找到一个检验规则 ϕ(X) 以最小化期望错误数（设 δ₀ = δₐ = 1）。

Bayes Oracle（全局最优，但指数级）: 需要计算后验概率 P(ν₁=1 | X) 和 P(ν₂=1 | X)。这需要对4种可能的ν状态求和。虽然n=2可行，但当n变大时，需要枚举2ⁿ种状态，无法实现。

BSD（局部最优，序贯探索）: Step 1: 仅考虑那些恰有一个活跃信号的模型。这个集合是M₁ = { (1,0), (0,1) }。对于坐标1（j=1）和坐标2（j=2），分别计算“后验胜率”： - 对于坐标1：S₁₁(X) = P(ν₁=1, ν₂=0 | X) / P(ν₁=0, ν₂=0 | X)。这是（模型1）相对于（全局空模型）的后验优势。 - 对于坐标2：S₁₂(X) = P(ν₁=0, ν₂=1 | X) / P(ν₁=0, ν₂=0 | X)。

这两步的计算不需要对4种状态求和——分母都是全局空模型（ν=(0,0)），分子是(M₁中对应)模型。计算是直接的（通过多元正态密度）。

选择胜率最大的坐标，比如j₁=1。如果 S₁₁(X) > δ (这里δ=1)，则拒绝H₀₁，进入Step 2。否则终止，接受全部。

Step 2: 此时活跃配置已更新为{1}，剩余候选坐标集是{2}。现在只考虑将坐标2加到当前活跃配置中。比较： - 分子: 模型 (ν₁=1, ν₂=1) 的后验概率。 - 分母: 模型 (ν₁=1, ν₂=0) 的后验概率（当前活跃配置）。计算S_(1)_2₂(X) = P(ν₁=1, ν₂=1 | X) / P(ν₁=1, ν₂=0 | X)。

但此时，分子和分母都需要对全部可观测数据X求后验，而不仅仅是剩余的部分。由于协方差结构σ的存在，X₁中的信息通过相关性影响X₂的后验评估。如果S > δ，则拒绝H₀₂，认为坐标2也是信号；否则，不拒绝。

核心矛盾与突破： - 难在：当n很大时，第一步的决策（如坐标1是否为信号）会深刻影响后续所有步的后验评估。正确计算每个“拓展”的胜率需要全部数据，且每个“拓展”都涉及一个不同的全协方差子矩阵的逆。 - BSD的解法：本文的关键定理（Theorem 4.1）证明了，上述后验胜率S与一个简单的协方差自适应残差U之间存在显式映射（单调变换）。U是单变量的，其形式为：在第t步，对于剩余候选j，计算其条件均值调整后的标准化残差： U = (X_j - (历史已选坐标对j的条件期望)) / (条件标准差)。这个U完全由Σ的子矩阵和剩余数据决定，计算量是二次的，而不是指数的。BSD的本质是，后验模型追求被完全等价地为序贯残差搜索，而这个搜索的计算是O(n²)的。

结论：在这个最小内核（n=2）中，若第一步错误选择（比如信号是2但先选了1），BSD会通过残差U(1)₂中引入由此错误导致的偏误，从而修正第二部的识别。模拟证明，这种“序贯探索+残差自适应”策略，即使第一步有些偏差，最终也能近乎全局最优。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在任意已知协方差依赖下，研究稀疏信号发现（多重检验）的贝叶斯最优性问题，特别是探索一个可计算程序（Bayesian Step-Down, BSD）能在多大程度上逼近贝叶斯Oracle（理论上的最优决策规则）。
核心工具/方法：提出了一个后验引导的模型追踪（posterior-guided model pursuit）框架，实际实现为贝叶斯逐步向下（BSD）程序。关键技巧是残差表示定理：将BSD的后验胜率统计量显式化为协方差自适应MRD残差的局部单调变换，从而建立了与Cohen et al. (2009)的MRD程序之间的结构连接。
主要结论：①仿真显示，在广泛的一因子依赖结构下，BSD在贝叶斯风险和支持恢复上与Bayes Oracle几乎不可区分（近Oracle行为）。②BSD与MRD-GBS（一个完全不同的频率学派程序）结果高度一致。③通过残差表示和Ghosh & Chakrabarti (2026a)的结果，证明了BSD在任意协方差下关于向量损失函数是可容许的（admissible）。④BSD的计算复杂度仅为O(n²)，远优于Oracle的指数级。

关键设定与假设¶

核心设定（在第二节记号基础上补充）：
- 数据生成：X|θ ~ N_n(θ, Σ)，θ是稀疏均值向量，Σ是已知的正定矩阵。
- 贝叶斯框架：限制在经典的两组（two-group）先验：θ_i ~ (1-p)δ₀ + p N(0, ψ²)。p和ψ²已知，独立于X。这是整个Oracle定义和BSD后验计算的基石。
- 决策风险：对称损失（δ₀=δₐ=1），风险是期望总错误数（Type I + Type II）。
关键假设 vs 已有文献：
- 已知协方差 (Σ known)：这是本文和MRD文献（Cohen et al., 2009）的核心假设。相比BH（不需要Σ），这是一个更强的假设。作者在Discussion中承认是限制，但指出“standard in much of the dependent multiple-testing literature”。
- 正态性 (Normality)：假设听起来很紧，但残差（MRD residuals）是在正态假设下推导的。许多p值方法（如BH）也隐含正态性，但作者没有明确探讨对非正态的敏感度。
- 稀疏先验参数已知 (p, ψ² known)：这与Bogdan et al. (2011)的设定一致。相比之下，传统FDR方法（如BH）不需要这些参数。
- 已知的信号强度ψ²的高斯性：不影响核心几何性质，但影响了阈值δ的决策论解释。

主要结果¶

定理 4.1 (BSD–MRD 表示定理)：
- 陈述：对于任意阶段t、历史(j₁,...,j_{t-1})和候选j，BSD统计量S与MRD统计量U之间存在显式映射： S = (p/(1-p)) × √(σ/(ψ²+σ)) × exp( ψ²/(2(ψ²+σ)) × U² )。其中σ是残差方差σ_{j·(j₁,...,j_{t-1})}。
- 直觉：映射是U²的严格递增函数，且参数随阶段和位置自适应。所以，基于后验的排序完全等价于基于残差绝对值的排序。这解释了BSD与MRD程序的深层一致性。
- 必要条件：先验p>0, ψ²>0, 正定Σ。
- 解决的技术难点：将复杂的多维后验比率化简为单变量U（通过条件正态分布分解）。
定理 4.2 (BSD的可容许性)：
- 陈述：BSD程序关于向量损失函数（每个坐标一个风险分量）是可容许的。
- 直觉：在任意 Σ 下，不存在另一个程序在所有参数点上都不差于BSD且在某些点上严格更优。这是很强的最优性性质。
- 必要条件：定理4.1成立（证明BSD是局部单调残差程序） + Lemma 4.1 (Ghosh & Chakrabarti 2026a的结论)。
- 解决的技术难点：将贝叶斯驱动的程序与频率学派可容许性连接起来。
实证结果（仿真结论）：
- 核心发现：在一因子结构下，BSD的贝叶斯风险、FDR、FNR、Power曲线几乎与Bayes Oracle完全重合（视觉上不可区分）。
- 关键量化证据：表1（n=100）显示，在所有6种一因子结构中，BSD与Oracle的平均贝叶斯风险差值不超过10⁻³（如独立条件下都是0.1295，正因子下Oracle 0.0844 vs BSD 0.0844）。
- 对比结果：MRD-GBS（频率派）的表现几乎与BSD/Oracle一样好（风险差距常在0.001量级），MRD-CSX（原始MRD）较差，BH更差（尤其在强依赖下）。
- 稳健性（附录C）：在更一般的协方差结构（Equicorrelation, Toeplitz, Fraction Gaussian noise等）下，BSD仍然优于所有对比方法，MRD-GBS紧随其后。

证明路线与技术技巧¶

整体路线（证明定理4.1）: 1. 步1: 写出S(t)的定义（后验比率）。利用先验独立性：S = (p/(1-p) × (似然比))。 2. 步2: 对于分子（模型：只有坐标j是额外活跃）和分母（模型：当前活跃配置），写出X在其上的条件密度。利用正态条件分解：f(X) = f(X_j | X_rest) × f(X_rest)。 3. 步3: 观察到分母和分子共享相同的边际f(X_rest)（因为都假设其他坐标为空）。因此似然比约化为一维条件密度的比率。 4. 步4: 计算平均项和方差项得到f(X_j | X_rest)在两种模型下的表达式：后者（活跃模型）仅在方差上多了ψ²。 5. 步5: 直接计算出比率，得到显式表达式，其中U正是MRD残差。

关键跳跃点： * 跳跃点: 将全后验比率约化为单变量残差的单调变换。这一步利用了条件正态分布和依赖结构的三角分解性——关键是对“当前活跃集”的统计量进行清洁的条件描述，这是任何多元正态分析的标准工具，但在此用于贝叶斯后验让人感觉新颖。 * 难点：如果没有定理4.1，需要显式计算的高维后验分母（对2^(n-t)种模型求和）。作者通过技巧性地选择分母（将历史选出的坐标“固定”在活跃状态，其他全设为0），巧妙避免了求和。

技术技巧点名： * 多元正态的条件分解：将联合密度分解为条件密度（X_j | X_rest）和边际，以消除指数级求和的需要。 * 局部单调变换（locally monotone transformation）：证明S是|U|的严格增函数，从而将贝叶斯排序与残差排序联系起来。 * 鸡尾酒式归约：将贝叶斯先验权重(p/(1-p))和条件方差比例(√(σ/(ψ²+σ)))“凑”进一个可计算的解析式中。

真实例子与应用¶

本文没有使用任何真实数据集的实证分析。全部仿真（第5节和附录C）都是基于模拟数据（one-factor, equicorrelation, Toeplitz等）的Monte Carlo实验。本文宣称的目的是“The primary purpose of the Oracle in the present work is to provide a benchmark for quantifying the extent to which a computationally tractable dependence-aware procedure can approach Bayes-optimal sparse signal recovery”。因此，它属于纯方法+理论+仿真验证的论文，没有真实数据应用。

🔎 结论是否比证明窄 —— “近Oracle行为”¶

这是一个关键点。作者在叙述中很强地声称BSD具有“近Oracle行为”（Section 1: “BSD exhibits near-oracle behavior”；Section 5: “virtually indistinguishable from the Bayes Oracle”）。然而：

严格的证明：BSD的具体定理（可容许性定理4.2）完全是一个非渐近、有限样本的决策论性质，它不量化与目标准则（Bayes risk）的距离。换句话说，证明没有给出任何“BSD的风险接近Oracle风险”的理论界。
结论的实际支撑：全部落在仿真结果上，且是在特殊的单因子依赖结构下。作者在Section 6明确承认：“Although the present work does not provide a theoretical explanation for this phenomenon, the results suggest that ...”。这意味着空白的贡献点：一个“风险差距”的高阶泰勒展开/渐近界完全未建立。

对于我这样有高阶统计背景的研究者，这是一个清晰的信号——“近Oracle行为本质上是一个猜想，而非定理”。在一般Σ下没有理论保证，这非常接近于需要由更精确的理论填充的开问题。

四、开放问题¶

“近Oracle行为”的理论界：本文唯一最引人注目的实证结果是BSD几乎重制了Bayes Oracle的贝叶斯风险。然而论文明确承认“does not provide a theoretical explanation” (Section 6)。值得扎根的问题：对于BSD的序贯程序，能否在某种准稀疏条件（如Σ的最小特征值有界远离0）下，推导出它的贝叶斯风险与Oracle风险之间的差距的渐近界？这直接指向原文Section 6的一句：“Establishing conditions under which posterior-guided model-pursuit procedures can asymptotically approximate Bayes-optimal sparse signal recovery rules under dependence represents an important open problem.” (原文第55页)
未知协方差下的推广：本文依赖已知Σ。但许多真实场景中Σ未知且高维。BSD的残差表示依赖于已知条件协方差。开放问题：如何将BSD扩展至“插人”一个估计的协方差矩阵？估计误差对序贯搜索的影响如何刻画？作者在Section 6将其列为重要方向：“extending Bayesian model-pursuit procedures to settings with unknown dependence remains an important challenge.” (原文第55页)
非高斯推广：BSD的残差表示（定理4.1）本质上利用了正态性来获得显式的分解。开放问题：在更一般的分布族（如球形分布、指数族）下，是否还有类似的“后验-残差”可容许性结构？作者在Section 6末尾提出：“It would also be of considerable interest to extend the present framework beyond the Gaussian setting and to investigate whether similar residual-geometric structures arise in more general classes of dependence models.” (原文第55页)
计算复杂性与张量收缩（与研究者兴趣的关联点）：BSD的计算复杂度由矩阵求逆主导（O(n²)）。然而，在稀疏异质性依赖（如区块依赖）下，是否可以利用图/tensor结构（如你的einsum复杂度分析）进一步降低计算成本？本文未讨论，但对熟知高阶U统计量计算代价的你来说，是一个潜在切入口。

最后提示：要确认第1-3号问题中是否有真gap，建议你将本文的Cited by子域（关注的引用中寻找理论和仿真复用的模式）与Abraham 2024, Paul 2025, Ghosh & Chakrabarti (2026a,b)的intro做对比——若大家反复指向同样的缺口（如“无骨性风险界的BSD”），便是共识的缺口。

Maintained by 陈星宇 · Homepage · Source on GitHub