Sequential testing of conditionally constrained hypotheses¶

作者: Eugenio Clerico
主题: 数理统计 / 假设检验
相关性: 8/10
链接: https://arxiv.org/abs/2606.06769

一、领域脉络与小综述¶

这个方向是什么 这个子方向属于Anytime-valid inference（随时有效推断）与E-values（E值）理论，核心要解决的根本统计问题是：在序贯观察数据的过程中，如果允许在任意数据依赖的停止时间结束实验并做出推断，如何保证 Type I error 控制不被破坏？传统的 p-value 在 optional stopping 下失效，而 E-value（期望 \(\le 1\) 的非负统计量）及其序贯版本 E-process（在任意停止时间期望 \(\le 1\) 的非负过程）通过 Ville 不等式提供了不依赖样本量的有效性保证。当前该方向的成熟度处于理论奠基与快速扩张期：基础定义与基本性质已固定（如 Ramdas & Wang 2025 的专著），但针对复合零假设的 E-process 最优结构（Complete class / Admissibility）的刻画才刚刚开始，尤其是从单步向序贯、从简单假设向非参数条件假设的推广中存在大量测度论与凸分析的硬核技术缺口。

发展脉络 - 奠基工作：Shafer (2021) 与 Vovk & Wang (2021) 提出用赌博/投资框架替代 p-value，定义了 E-value 与合并规则；Ville (1939) 不等式提供了从 Supermartingale 到随时有效检验的数学桥梁。 - 方法进展：Waudby-Smith & Ramdas (2024) 与 Orabona & Jun (2024) 将赌博框架用于有界均值估计，构造了经验 Bernstein 置信序列；Grünwald et al. (2024) 提出 GROW（最坏情况最优增长率）准则与 Safe testing；Wasserman et al. (2020) 提出无需正则性条件的 Universal inference。这些工作提供了具体算法，但未回答“所有合法 E-variable 的结构是什么”。 - 当前 frontier：Ramdas et al. (2020) 证明了复合零假设下，Admissible 的 anytime-valid 推断必须依赖 Nonnegative martingale（逐点控制定理）；Ramdas et al. (2022) 发现检验可交换性时 Supermartingale 无效而 E-process 有效，揭示了两者并非总是等价；Clerico (2024) 与 Larsson et al. (2026) 在单步设定下，对由有限线性约束定义的非参数假设，证明了所有 E-variable 被仿射 E-variable 逐点控制（Complete-class 定理）；Clerico (2025) 将此推广到一维有界均值的序贯设定（Coin-betting martingale 控制）。 - 本文的位置：本文填补了从“单步有限约束”到“序贯条件有限约束”的缺口，证明了在更一般的条件非参数假设下，E-process 与 Test supermartingale（仿射 E-variable 的可预测乘积）逐点等价，解决了 Larsson et al. (2026) 与 Clerico (2024) 明确提出的开放问题。

子线索聚类 1. 算法与置信序列簇：Waudby-Smith & Ramdas (2024), Orabona & Jun (2024), Shekhar & Ramdas (2023), Chugg & Ramdas (2025), Wang & Ramdas (2023)。这一簇专注于有界/重尾均值的具体赌博算法与置信序列构造，追求经验上的紧致性，但不涉及全局最优性刻画。 2. E-value 基础与合并簇：Vovk & Wang (2021, 2024), Shafer (2021)。研究 E-value 的校准、合并与抽象性质，Vovk & Wang (2024) 证明序贯合并被 Martingale 合并控制，与本文的“可预测乘积控制”精神相通。 3. Admissibility 与 Complete-class 簇：Ramdas et al. (2020, 2022), Clerico (2024, 2025), Larsson et al. (2026)。这是本文所在的硬核理论簇，追问“最优检验的数学结构是什么”，使用凸分析、测度论与决策论工具。

这个方向在追问的核心问题 1. 结构刻画：对于给定的复合零假设，所有合法的 E-variable / E-process 的集合长什么样？是否存在一个最小完全类？ 2. Martingale 充分性：在什么条件下，E-process 提供的检验力不优于 Test supermartingale？即，何时“独角兽陈述”（Unicorn statement：任意 E-process 被单个 Supermartingale 控制）成立？ 3. 最优性准则：在完全类内，如何定义并求解最优元素（如 GROW / REGROW）？

⚠️ 作者的 framing - 作者的说法：作者将缺口 frame 为“单步 Complete-class 已有，但序贯推广因可测性选择问题而受阻”，并将本文定位为“首次在一般条件约束下解决这一可测性瓶颈”。 - 淡化/回避的路线：作者明确承认只处理有限约束（\(\Phi: X \to \mathbb{R}^m\)），排除了无限约束（如条件次高斯性，Larsson et al. 2026 讨论过）；作者只证明了“充分性”（仿射乘积构成完全类），未证明“必要性”（极小完全类），回避了哪些仿射乘积是 Admissible 的问题；作者未讨论与半参数效率界（Efficiency bound）或高阶影响函数（HOIF）的联系，而这些是处理无限维约束的标准工具。 - 缺失的引用：Intro 中未引用传统 Wald 序贯检验的 minimax 理论（如 Lai 1997 的序贯效率界），也未引用半参数约束检验的文献（如 Choi et al. 关于约束检验的效率界）。这可能是作者刻意聚焦于 E-value 新范式，但也留下了“新范式最优性与经典序贯最优性如何对接”的空白。

张力被引工作之间存在一个结构性张力：Ramdas et al. (2022) 证明检验可交换性时，Test supermartingale 是无用的（Powerless），必须用 E-process；而本文证明检验条件有限约束时，E-process 不优于 Test supermartingale。这两者并不矛盾（零假设结构不同），但它们划出了一道关键边界：零假设的几何/测度结构决定了 Martingale 是否充分。可交换性零假设的 Fork-convex hull 覆盖了所有分布，导致 Supermartingale 只能退化；而条件约束假设的凸结构允许仿射分离，使得 Supermartingale 足够。这道边界是后续研究的极高价值信号。

二、这篇论文做了什么¶

三句话 ① 研究了由有限维约束映射定义的条件非参数序贯假设的 E-process 完全类结构问题。 ② 核心工具是凸分离（构造单步仿射 E-variable）与 Borel 选择定理（解决序贯可测性瓶颈），辅以粗化假设与上半解析性证明。 ③ 主要结论是 Complete-class 定理：任意 E-process 被仿射单步 E-variable 的可预测乘积（Test supermartingale）逐点控制，在此类假设下 E-process 不提供额外检验力。

关键设定与假设 - 样本空间：\(X\) 为标准 Borel 空间。 - 约束映射：\(\Phi: X \to \mathbb{R}^m\) 为 Borel 函数（有限维！这是核心限制）。 - 目标集：\(S \subseteq \mathbb{R}^m\) 为非空凸集（需为 Borel 集，或通过相对内部化处理）。 - 条件零假设：\(\mathcal{H}^T_{\Phi, S} = \{ P \in \mathcal{P}^T_\Phi : E_P[\Phi(X_t) | X^{t-1}] \in S, \forall t \le T, \text{a.s.} \}\)。统计含义：给定过去，下一观测的 \(\Phi\)-均值必须落在凸集 \(S\) 内。涵盖了条件均值、均值+方差、重尾高阶矩约束。 - 有效域：\(X_{\Phi, S} = \{ x : \exists P \in \mathcal{H}_{\Phi, S}, P(\{x\}) > 0 \}\)。零假设下几乎必然在此域内，域外点可赋值 \(+\infty\)。 - 支撑函数：\(\sigma_{\Phi, S}(\lambda) = \sup_{y \in S \cap \text{aff} \Phi(X_{\Phi, S})} \lambda \cdot y\)。统计含义：在零假设可达的均值范围内，\(\lambda\) 方向的最大投影。 - 仿射 E-variable 类：\(\mathcal{E}_{\Lambda_{\Phi, S}} = \{ e_\lambda(x) = 1 + \lambda \cdot \Phi(x) - \sigma_{\Phi, S}(\lambda) : \lambda \in \Lambda_{\Phi, S} \}\)，其中 \(\Lambda_{\Phi, S}\) 保证 \(e_\lambda \ge 0\) 在 \(X_{\Phi, S}\) 上。统计含义：E-value 被简化为 \(\Phi\) 的仿射函数，截距由支撑函数决定，确保期望 \(\le 1\)。 - 非标准约定：\(0 \cdot \infty = \infty\)。确保在有效域外的控制关系成立。

主要结果 1. Proposition 1（单步完全类）：单步 E-variable 当且仅当被 \(\mathcal{E}_{\Lambda_{\Phi, S}}\) 中的元素逐点控制。直觉：零假设的凸性使得任何违反仿射控制的 E-variable，必能构造一个零假设分布使其期望 \(>1\)（通过凸组合）。 2. Theorem 1（序贯完全类）：序贯 E-process 当且仅当被 \(\mathcal{E}^\infty_{\Lambda_{\Phi, S}}\)（仿射 E-variable 的可预测乘积）逐点控制。直觉：每一步的“续押价值”都被仿射 E-variable 控制，且系数可随过去数据可测地选择，乘积构成 Supermartingale。必要条件：\(\Phi\) 有限维，\(S\) 凸且 Borel（或相对开）。

证明路线与技术技巧 - 整体路线： 1. 定义单步仿射类：利用支撑函数 \(\sigma_{\Phi, S}\) 定义 \(\Lambda_{\Phi, S}\) 与 \(e_\lambda\)，验证其合法性（Lemma 2）。 2. 归纳构造：假设在 \(T-1\) 步有可预测序列 \(\lambda^{T-1}\) 控制 E-process。在 \(T\) 步，对每个历史 \(x^{T-1}\)，定义“续押过程” \(\tilde{E}^{x^{T-1}}\)（原过程除以过去乘积）。 3. 逐点控制：定义续押包络 \(u(x^{T-1}, x) = \sup_{Q, \tau} E_Q[\tilde{E}^{x^{T-1}}_\tau]\)。对固定历史，用凸分离（Lemma 4）证明 \(u\) 被某 \(l_{x^{T-1}} \cdot \Phi(x)\) 控制。 4. 可测性跳跃：逐点存在的 \(l_{x^{T-1}}\) 未必可测。引入 Clerico (2026) 的 Borel 选择定理（Lemma 5），要求 \(u\) 为上半解析函数，从而选出 Borel 可测的 \(\lambda_T(x^{T-1})\)。 5. 上半解析性证明：为证明 \(u\) 是上半解析，引入粗化假设 \(\bar{\mathcal{H}}^T_{\Phi, S}\)（有限 \(d\)-叉树上的分布），证明 \(\sup\) 不变（Lemma 13），从而将停止时间化为有限“掩码”，使 \(\sup\) 成为可数极大化，确立上半解析性。 6. 一般化处理：通过相对内部化（\(S' = \text{relint}(S \cap A)\)）处理 \(S\) 非 Borel 的情况，并利用 \(0 \cdot \infty = \infty\) 处理有效域外的控制。

关键跳跃点：从逐点存在到可测选择（Lemma 5 的应用）。难点在于：凸分离给出了每个历史下的控制系数 \(l_{x^{T-1}}\)，但这只是一个存在性映射，不可测则无法构成合法的 Supermartingale。作者必须证明续押包络 \(u\) 满足 Clerico (2026) 选择定理的条件（上半解析性），这是整个证明最吃功夫的一步。
技术技巧点名：
凸分离：用于 Lemma 4 与单步证明。将 E-variable 的下图像与零假设均值约束分离，得到仿射控制。起作用：将抽象 E-variable 结构化为仿射形式。
Borel 选择定理：来自 Clerico (2026)。起作用：解决从逐点控制到可预测控制的测度论瓶颈，是本文区别于单步文献的核心技术增量。
上半解析性：来自测度论与描述集合论。起作用：为 Borel 选择定理提供输入条件。
粗化假设与树掩码：将一般分布上的 \(\sup\) 降至有限支撑分布（\(d\)-叉树），停止时间降至有限集合（掩码）。起作用：使 \(\sup\) 成为 Borel 函数的有限 max + 可数 \(\sup\)，从而证明上半解析性。
Carathéodory 定理与相对内部化：用于处理凸集的表示与测度论麻烦（非 Borel 凸集）。起作用：确保有限维表示与 \(S\) 的 Borel 替代。

真实例子与应用 本文为纯理论论文，无真实数据实证例子。但文中给出了几个标准统计设定作为理论框架的实例： 1. 有界均值：\(X=[a,b], \Phi(x)=x, S=\{\mu\}\)。此时 \(\mathcal{H}^T_{\Phi, S}\) 是条件均值恒为 \(\mu\) 的分布类，对应 Waudby-Smith & Ramdas (2024) 的设定。本文定理退化为 Clerico (2025) 的 Coin-betting 控制结果。 2. 均值+方差约束：\(X=\mathbb{R}, \Phi(x)=(x, x^2), S=\{\mu\} \times [0, B]\)。对应重尾设定（Wang & Ramdas 2023, Agrawal et al. 2021）。 3. 有限状态空间：\(X=\{1, \dots, n\}\)，任意零假设 \(\mathcal{H}\) 凸化后可被 \(\Phi(i)=u_i\)（坐标向量）与 \(S=\text{conv} \mathcal{H}\) 捕获。说明有限状态下的任意条件假设都被本文覆盖。

🔎 结论是否比证明窄 - Theorem 1 的陈述是“if and only if”，但证明的“only if”部分严格依赖 \(\Phi\) 是有限维（\(\mathbb{R}^m\)）且 \(S\) 是凸 Borel（或可相对内部化）。作者在 Discussion 中泛泛 claim “for a broad class of conditional non-parametric hypotheses, arbitrary e-processes offer no advantage”，但“broad class”实际上被“有限维约束”严格限制，排除了无限维约束（如次高斯性、半参数无穷维约束）。读者需注意此 claim 的边界。 - Discussion 中提出“whenever a one-step complete class is available... do predictable products form a complete class?”这是一个 Conjecture，作者只证明了仿射设定下的特例，未给出一般性证明。

三、开放问题¶

无限维约束的序贯完全类：要证/估什么：当 \(\Phi\) 取值于无限维空间（如条件次高斯性、半参数约束）时，E-process 是否仍被某类可预测乘积控制？扎根点：Discussion 第 1 段 “The restriction to finitely many constraints is a main limitation... Extending the domination result of Theorem 1 to infinitely many constraints remains open.” 以及 Clerico (2026) 明确留下的 “extending this type of selection theorem beyond [finite-dimensional affine]”。
极小完全类与 Admissibility：要证什么：在 \(\mathcal{E}^\infty_{\Lambda_{\Phi, S}}\) 中，哪些可预测乘积是 Admissible（不被同类中其他元素逐点控制）？扎根点：Discussion 第 4 段 “We do not identify an optimal e-process class whose elements are all admissible. Understanding what are the maximal elements in \(\mathcal{E}^\infty_{\Lambda_{\Phi, S}}\) would provide a sharper description...”
单步完全类到序贯完全类的一般原理：要证什么：是否任何单步完全类（不一定是仿射的）都可以通过可预测乘积提升为序贯完全类？扎根点：Discussion 第 2 段 “it would be interesting to understand whether this is an instance of a general principle... The main obstruction seems to be measurability.”
与半参数效率理论的对接：要估什么：仿射 E-variable \(1 + \lambda \cdot \Phi(x) - \sigma(\lambda)\) 的最优 \(\lambda\)（如 GROW 准则下）与半参数模型中的 Efficient influence function 有何代数/几何联系？扎根点：作者未引用半参数效率文献，但 \(\lambda \cdot \Phi\) 的结构与一阶影响函数高度相似，这是一个未被作者点出的隐性缺口。

四、最核心、最简单的例子 / 数学问题¶

最简特例：单位球上的均值零检验 剥掉所有一般性设定（有限维 \(\Phi\)、凸集 \(S\)、可测选择），本文的数学内核在 \(X = B\)（\(\mathbb{R}^m\) 中闭单位球），\(\Phi(x) = x\)（恒等映射），\(S = \{0\}\)（均值零）这一特例下完全裸露。

零假设：\(\mathcal{H}_{\Phi, S}\) 是 \(B\) 上均值为零的所有分布。有效域 \(X_{\Phi, S} = B\)。
仿射 E-variable：支撑函数 \(\sigma_{\Phi, S}(\lambda) = \sup_{y \in \{0\}} \lambda \cdot y = 0\)。条件 \(1 + \lambda \cdot x \ge 0\) 对所有 \(x \in B\) 成立，等价于 \(\|\lambda\|_2 \le 1\)（即 \(\lambda \in B\)）。故仿射 E-variable 为 \(e_\lambda(x) = 1 + \lambda \cdot x\)，其中 \(\lambda \in B\)。
单步命题退化为何：任何 E-variable \(E: B \to [0, \infty]\)（满足 \(E_P[E] \le 1\) 对所有均值零分布 \(P\)），必存在 \(\lambda \in B\) 使得 \(E(x) \le 1 + \lambda \cdot x\) 对所有 \(x \in B\)。
证明怎么走：考虑 \(E\) 的下图像 \(C = \text{conv}\{(x, z) : x \in B, z \le E(x)\}\)。若 \(E\) 不被任何 \(1 + \lambda \cdot x\) 控制，则 \(C\) 与垂直半线 \(\{(0, z) : z > 1\}\) 相交。这意味着存在 \(B\) 中点的凸组合（构成一个均值零分布）使得 \(E\) 的期望 \(>1\)，违反 E-variable 定义。分离超平面定理保证存在 \(\lambda\) 分离 \(C\) 与 \((0, 1)\)，即 \(E(x) \le 1 + \lambda \cdot x\)。由 \(E \ge 0\) 推出 \(\lambda \in B\)。
序贯情形退化为何：任何 E-process \(E_t(x^t)\)，必存在可预测序列 \(\lambda_t(x^{t-1}) \in B\)，使得 \(E_t(x^t) \le \prod_{s=1}^t (1 + \lambda_s(x^{s-1}) \cdot x_s)\) 对所有路径成立。这就是 Coin-betting martingale 控制定理。
为什么成立的关键想法：单步靠凸分离（几何），序贯靠可测选择（测度论）。凸分离给出了逐点的 \(\lambda\)，可测选择把逐点的 \(\lambda\) 缝合成可预测的 \(\lambda_t\)，使得乘积在所有时间点控制原过程。本文的整个技术大厦（粗化假设、上半解析、Borel 选择）都是为了在一般 \(\Phi\) 与 \(S\) 下复现这一缝合过程。

Maintained by 陈星宇 · Homepage · Source on GitHub

Sequential testing of conditionally constrained hypotheses¶

一、领域脉络与小综述¶

二、这篇论文做了什么¶

三、开放问题¶

四、最核心、最简单的例子 / 数学问题¶

评论