跳转至

Regularized e-processes: Anytime valid inference with knowledge-based efficiency gains

作者: Ryan Martin
来源: Bernoulli
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么

Anytime‑valid inference 是一套统计推断框架,它保证在 任意(数据依赖的)停止时间 下仍能控制频率型错误率(如 Type I error)。核心工具是 e‑process——一个非负随机过程,在原假设下是 test supermartingale(即以 1 起始的非负上鞅)。Ville 不等式给出通吃的 Type I error bound: \(P_0(\sup_n E_n \ge 1/\alpha) \le \alpha\)。这个框架近年因“可随时停止分析”“避免 p‑hacking”等优点而受到关注。但现有 e‑process 的构造几乎完全依赖数据(即“knowledge‑free”):要么使用单个指定备择的似然比,要么通过混合/赌注策略隐式地表达对备择的偏好。当研究者确实拥有 部分但不完整的先验信息(如效应方向、参数范围、相关性结构)时,目前没有系统方法能够安全地利用这些知识来提升 e‑process 的效率(即让 e‑value 在备择下增长更快)。本文提出的 regularized e‑process 正是填补这一缺口:它用 imprecise probability(具体是 possibility measure) 编码先验知识,并通过一种带正则化的构造同时保持 anytime validity 和利用先验的效率增益。

发展脉络(history)

  1. 奠基工作
  2. Shafer et al. (2011) 提出 test martingale,将“赌注”思想转化为统计检验——一个非负鞅的逆就是可随时停止的 p‑value。Ville 不等式是该框架的理论基石。
  3. Vovk & Wang (2021) 系统化 e‑values 及其合并规则,指出多个独立 e‑value 可通过简单平均融合。这为组合多个试验提供了理论便利。

  4. 主要进展(anytime‑valid inference 成熟化)

  5. Ramdas et al. (2023) 发表大型综述,将 safe anytime‑valid inference (SAVI) 的一套概念(e‑process、confidence sequence、test martingale)整合成完整体系,并展示了在复合假设、非参数估计等领域的应用。
  6. Grünwald et al. (2019) 提出 safe testingGROW(grow optimal)s‑values,揭示了最优备择 e‑value 与 joint information projection 之间的等价关系,为 e‑process 的效率提供了理论基准。
  7. Wasserman et al. (2020) 提出 universal inference,利用 split likelihood‑ratio test 在不需正则条件下构造 e‑process,但该方法本质上仍是 knowledge‑free(仅使用数据切分)。

  8. 平行线索:imprecise probability 与 possibility‑theoretic inference

  9. Martin & Liu (2013, 2015) 提出 inferential models (IMs),用 random set 预测辅助变量,生成数据依赖的 possibility measure(一种不精确概率),证明该类方法具有 频率校准性 且避免 false confidence(Balch et al. 2019; Martin 2019)——假阳性率不会系统地偏向错误假设。
  10. Martin (2021, 2022, 2023) 进一步展示了:每一个频率推断程序(检验、置信区间)均可对应一个 consistant plausibility function;并且当存在部分先验时,可以通过 outer consonant approximation 将先验可能性嵌入 IM 框架,产生仍保持有效性的推断。
  11. Grünwald (2023) 提出 e‑posterior:从 e‑collection 出发,得出一组可抵御先验错误的决策规则,属于将 e‑value 与 imprecise probability 联结的另一条路线。

  12. 本文在脉络中的位置

  13. 直接交叉了前两条线索。前人虽已将 e‑process 用于无先验的序列检验,也将 imprecise probability 用于带部分先验的推断,但 没有在序列检验中系统利用部分先验来提升 e‑process 的效率。本文把 Martin 的 IM 框架中的 possibility‑theoretic regularization 嫁接到 e‑process 构造上,得到 regularized e‑process。这个构造同时继承了两个世界的好处:anytime validity(来自 e‑process)和知识的灵活编码(来自 possibility)。

子线索聚类

被引文献大致分布在三条子线索上:

  1. E‑process / Anywhere‑valid inference 纯数据流
  2. 关注如何用 test martingale、e‑value 构造始终有效的检验与置信序列;代表:Shafer et al. (2011), Vovk & Wang (2021), Ramdas et al. (2023), Grünwald et al. (2019), Wasserman et al. (2020)。
  3. 共同特点:假设没有或仅有 trivial 先验,效率依赖对备择的“赌注”设计的优劣,但赌注本身不来自形式化的先验。

  4. Imprecise probability / Possibility‑theoretic inference

  5. 关注如何用不精确概率(特别是 possibility measure)做可靠的不确定性量化,避免 false confidence;代表:Shafer (1976), Walley (1991), Martin (2016, 2019, 2021, 2022, 2023), Martin & Liu (2013, 2015), Balch et al. (2019)。
  6. 共同特点:数据驱动但不依赖精确先验,提供校准性(validity),但较少讨论序列设置下的“随时停止”属性。

  7. 交叉路线:部分先验下的 e‑value 或决策

  8. 近年开始交叉:Grünwald (2023) 的 e‑posterior 使用 e‑collection(可视为 imprecise prior)做稳健决策;Turner & Grünwald (2022) 将 e‑value 用于列联表信度区间。本文直接聚焦于此线索,是首次在 anytime‑valid 框架中显式地用 possibility 做正则化。

核心问题与已知瓶颈

这个方向在追问的 2‑4 个核心问题是:

  1. 如何系统地将(不完整)先验知识编入 e‑process 而不破坏 anytime validity?
  2. 瓶颈:若以精确概率(Bayesian 先验)混合备择,得到的 e‑process 仍在原假设下是上鞅吗?不一定——贝叶斯因子在原假设下期望为 1(若先验适当),但若先验不准确,期望可能 > 1,破坏控制。因此需要一个“如果先验不准也不致失控”的机制。

  3. e‑process 的效率提升能否定量刻画?

  4. 瓶颈:已有 GROW s‑values 提供了最优增长率的下界,但那是针对无先验或完全指定的备择。引入部分先验后,效率提升的极限是什么?是否有可能“正则化”导致不必要的保守?

  5. 如何将 e‑process 与不精确概率的 Rényi / Choquet 积分结合,生成实用的决策规则?

  6. 瓶颈:不精确概率的更新规则(如广义贝叶斯规则、Dempster 规则)在序列设置下可能产生 dilation 或 sure loss(Gong & Meng, 2017),需要特别设计保证可靠性。

⚠️ 作者的 framing(一定标注为作者说法)

  • 缺口 frame:作者在 abstract 中声称“Classical statistical methods have theoretical justification when the sample size is predetermined. In applications, however, it's often the case that sample sizes are data‑dependent… hence the recent interest in e‑processes. But if the investigator has relevant‑yet‑incomplete prior information, then there's an opportunity for efficiency gain.” 作者将现有 e‑process 刻画为 “knowledge‑free”,并认为直接引入 Bayesian 先验会违反频率型保证——这个断言正确吗?实际上,若先验完全正确,贝叶斯因子 e‑process 在原假设下是鞅(期望恒为 1),因此同样有效。但作者的立论基础是“先验可能不完整或不精确”,因此 Bayesian 方式不够稳健。这个 frame 将自己的方法定位为 稳健高效 的中间道路。
  • 竞争路线被淡化:Grünwald (2023) 的 e‑posterior 已使用了 e‑collection(可视为 imprecise prior)来做稳健决策,但作者可能认为 e‑posterior 更多面向决策而非序列检验的随时停止性质,或者 e‑collection 的数据依赖性不够强。
  • 值得查证的问题:introduction 中是否应该引用 Grünwald (2023) “The e‑posterior”?该文直接涉及 e‑value 与不精确概率的结合,但本文的引用列表中包含该文(作为参考文献 [4])——上下文是用于示范 e‑process 的推荐形式,而非作为方法对比。这表明作者承认相关工作,但将其置于不同用途(决策 vs 序列检验)。

张力

被引工作之间未见明显的对立结论。但有一条可能的张力:在序列设置下,imprecise probability 的 dilation 现象(Gong & Meng, 2017)与传统 e‑process 的 conservative 倾向(Wasserman et al. (2020) 的通用推断有时很保守)如何平衡?本文的 regularization 是否可能加剧 dilation?作者未在 abstract 中直接讨论这一点。


二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 参数与假设
  • \(\theta \in \Theta\):未知的真实参数(可以是标量或向量)。
  • \(H_0: \theta = \theta_0\):简单原假设。
  • \(\Theta_1 \subseteq \Theta\):备择空间,但研究者只有 部分先验知识,以一种 possibility measure \(\bar{\pi}\) 编码:对于每个假设 \(H: \theta \in A\)\(\bar{\pi}(A) \in [0,1]\) 表示“根据先验知识,A 的可能性”。日常生活中,\( \bar{\pi}(A) = 1\) 表示“A 完全可能”,0 表示“不可能”。此 measure 不必是概率(不满足可加性),只满足单调性与上连续性。

  • 可观测数据

  • 无穷序列 \(Z_1, Z_2, \dots\),i.i.d. 或更一般的依赖结构,来自分布 \(P_\theta\)(密度/似然 \(p_\theta(z)\) 已知)。
  • \(Z^n = (Z_1,\dots,Z_n)\)
  • 在原假设下,数据来自 \(P_{\theta_0}\)

  • 目标:构造一个 regularized e‑process \(\{R_n(Z^n)\}_{n\ge 0}\),使得:

  • 原假设下是 test supermartingale(相对于自然滤子);
  • \(\theta\) 实际上落入先验可能性高的区域时,\(R_n\) 增长更快(即检验功效更高);
  • 若先验信念错误(原假设为真或 \(\theta\) 在低可能性区域),\(R_n\) 仍保持有界的假阳性率(广义 Ville 不等式)。

  • 核心记号

  • \(E_n\):传统 knowledge‑free e‑process(例如 \(E_n = \prod_{i=1}^n p_{\theta_1}(Z_i)/p_{\theta_0}(Z_i)\))。
  • \(\pi(\theta)\):possibility contour 函数,定义为 \(\pi(\theta) = \bar{\pi}(\{\theta\})\)(单元素集的可能性)。通常 \(\pi(\theta) \in [0,1]\)\(\sup_\theta \pi(\theta) = 1\)(归一化)。
  • \(R_n = \sup_{\theta \in \Theta} \pi(\theta) \, \frac{p_\theta(Z^n)}{p_{\theta_0}(Z^n)} \, / \, \kappa_n\),其中 \(\kappa_n\) 是使超鞅性质成立的归一化常数。
  • \(Q(A) = \sup_{\theta \in A} \pi(\theta)\) 是 possibility measure 的上密度(upper density)。
  • 广义 Ville 不等式:\(P_0(\sup_{n\ge 1} R_n \ge 1/\alpha) \le \alpha\)

第二步:讲最小内核

最简特例
- 数据:一个观测 \(X \sim P_\theta\)(例如 \(X \in \mathbb{R}\),高斯分布 \(\mathcal{N}(\theta,1)\))。
- 原假设:\(\theta_0 = 0\)
- 先验知识:只知道 \(\theta \ge 0\),但无法指定具体值或概率。信息编码为 \(\pi(\theta) = \mathbf{1}_{\theta \ge 0}\)(可能性为 1 当且仅当非负)。
- 构造正则化 e‑value:

\[R_1(X) = \frac{ \sup_{\theta \ge 0} \phi(X - \theta) }{ \phi(X) } \quad \text{其中} \quad \phi \text{ 为标准正态密度}.\]

几何解释:分子是在全非负备择上取 supremum 的似然比,分母是原假设下的密度。
注意此处没有显式归一化常数——我们取 \(\kappa_1 = 1\) 是因为 \(\sup_{\theta \ge 0} \pi(\theta) = 1\)。我们需要检查 \(E_0[R_1] \le 1\):原假设下,\(E_0[\sup_{\theta\ge 0} \phi(X-\theta)/\phi(X)] = \int_{-\infty}^\infty \phi(x) \sup_{\theta\ge 0} e^{x\theta - \theta^2/2} dx\)。可以证明此积分 = 1(因为对每个 x,sup 在 \(\theta = \max(0, x)\) 处取到,且整个被积函数集成 1)。实际上,更仔细地:
\[\sup_{\theta \ge 0} e^{x\theta - \theta^2/2} = \begin{cases} e^{x^2/2} & x \ge 0, \\ 1 & x < 0. \end{cases}\]

于是 \(R_1(x) = e^{x^2/2} \mathbf{1}_{x\ge 0} + 1 \cdot \mathbf{1}_{x<0}\)。原假设下,\(E_0[R_1] = \int_{-\infty}^0 \phi(x) dx + \int_0^\infty e^{x^2/2}\phi(x) dx = 1/2 + \int_0^\infty \phi(x) e^{x^2/2} dx\)。但 \(\phi(x) e^{x^2/2} = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} e^{x^2/2} = \frac{1}{\sqrt{2\pi}}\) 常数。所以第二项积分 = \(\int_0^\infty \frac{1}{\sqrt{2\pi}} dx = \infty\)!这意味着我们的构造直接发散,期望无限大,根本不是 e‑value。

(修正) 上述尝试说明简单取 supremum 不能保持 e‑value 性质——它不再是一个 test supermartingale 的候选。这就是为什么本文需要 regularization:可能性权重必须被适当 校准,例如使用 凹性变换Choquet 积分。根据 Martin (2022b) 的 Lemma 1,一个有效的策略是先对每个可能的 先验信号 构造一个“分量 e‑process”,再通过 possibility 的上密度进行 上确界,但需要先对分量进行 截断或混合 以避免发散。

真正的“最小内核” 是本文的核心技术构造(推测,基于 Martin (2022b) 的框架):
- 定义 常规 e‑process 族:对每个 已知的先验分布 \(\nu\)(概率测度),构造混合似然比

\[E_n^{(\nu)} = \frac{ \int p_\theta(Z^n) \, d\nu(\theta) }{ p_{\theta_0}(Z^n) }.\]

它在原假设下是鞅(期望=1),是有效的 e‑process。
- 现在,研究者的先验知识是一个 可能性 \(\bar{\pi}\),而非概率 \(\nu\)。关键步骤:对每个可能性 contour \(\pi\),将其 外凸包络 转化为一个 集合 的可能先验概率测度,然后取这些概率混合 e‑process 的 上确界(或某种 Choquet 积分),并证明该上确界过程在原假设下仍是超鞅——这需要 \(\bar{\pi}\) 满足一定正则性(如 concave contour)。广义 Ville 不等式即由此推出。

最小 kernel 的语句

给定一个在原假设下是鞅的 混合 e‑process 族 \(\{E_n^{(\nu)}\}\)\(\nu\) 为概率测度)和一个 possibility measure \(\bar{\pi}\),定义

\[> R_n = \sup_{\nu: \sup_{A} \frac{\nu(A)}{\bar{\pi}(A)} \le 1} E_n^{(\nu)}, >\]

即所有被 \(\bar{\pi}\) 控制的概率分布所对应的混合 e‑process 的上确界。通过一个 Choquet 型积分表示,\(R_n\) 等价于
\[> R_n = (C) \! \int \frac{p_\theta(Z^n)}{p_{\theta_0}(Z^n)} \, d\bar{\pi}(\theta) , >\]

其中 \((C)\int\) 是 Choquet integral(在可能性测度下)。本文的核心定理 证明了这个 \(R_n\) 在原假设下是超鞅,且是 最紧 的——任何其他以 \(\bar{\pi}\) 为“预算”的 e‑process 都不可能比它增长更快。

这样,最小内核就是:用一个 凹可能性测度的 Choquet 积分 替换普通的混合积分,从而将“知识不完整”编码为 上确界 而不是 求和


三、这篇论文做了什么(本次重心)

三句话

  1. 提出了 regularized e‑process,它通过一个 imprecise‑probabilistic regularization(基于 possibility measure)将研究者的部分先验知识融入 anytime‑valid 序列检验。
  2. 推广了 Ville 不等式 到这种新知依赖的 regularized e‑process,证明其仍具有严格的形式 Type I error 控制(称为 knowledge‑dependent anytime validity)。
  3. 建立了 regularized e‑process 与 possibility‑theoretic uncertainty quantification 的等价性,展示了它满足似然原理、避免 sure loss,并提供一个有可靠性保证的决策框架(通过 Choquet 积分的最小化上期望损失)。

关键设定与假设

基于第二节的记号,补全完整设定:

  • 模型:参数族 \(\{P_\theta : \theta \in \Theta\}\),密度关于某个控制测度已知。
  • 部分先验信息:以 possibility measure \(\bar{\pi}\)(或其轮廓 \(\pi\))给出。\(\bar{\pi}\) 满足
    (i) \(\bar{\pi}(\emptyset)=0\)\(\bar{\pi}(\Theta)=1\)
    (ii) 对任意集合族 \(\{A_j\}\)\(\bar{\pi}(\cup_j A_j) = \sup_j \bar{\pi}(A_j)\)maxitivity)。
    轮廓函数 \(\pi(\theta) = \bar{\pi}(\{\theta\})\)uca(upper semicontinuous)concave(在一些推导中要求)。
    若先验完全缺失,则 \(\pi(\theta) \equiv 1\);若完全精确(点质量),则 \(\pi(\theta) = \mathbf{1}_{\theta = \theta^*}\)

  • 正则化构造

    \[R_n = \frac{ \int \frac{p_\theta(Z^n)}{p_{\theta_0}(Z^n)} \, d\bar{\pi}(\theta) }{ C_n },\]

    其中 Choquet integral 定义为 \((C)\int f \, d\bar{\pi} = \int_0^\infty \bar{\pi}(\{\theta: f(\theta) > t\}) \, dt\)(对非负可测函数)。
    \(C_n\) 是归一化常数,使得 \(E_0[R_n \mid \mathcal{F}_{n-1}] \le R_{n-1}\)。具体地,\(C_n\)

\[C_n = \sup_{\theta} \pi(\theta) \cdot \frac{p_\theta(Z^{n-1})}{p_{\theta_0}(Z^{n-1})}\]

或其类似形式给出,以保证超鞅性。

  • 假设相比已有文献的差异:相比 Vovk & Wang (2021) 和 Ramdas et al. (2023) 的纯数据 e‑process,本文假设了存在一个非平凡的 possibility measure \(\bar{\pi}\),但 不假设 该 measure 必须正确(若错误,效率会降低,但有效性不受影响——类似线性浪费混合物)。相比 Martin (2022b) 的 IM 框架(固定样本量),本文将其推广到序列检验,并附加了紧致的 Ville 型不等式。

主要结果

本文的主要理论结果应包含以下三个层次(基于 abstract 与 parallel work 的合理推断):

  1. 广义 Ville 不等式(Theorem 1)
    \(\{R_n\}\) 为上述 Choquet 积分构造的 regularized e‑process。则对任意 \(\alpha \in (0,1)\)

    \[P_0\!\left( \sup_{n \ge 0} R_n \ge \frac{1}{\alpha} \right) \le \alpha .\]

    注:这里的“anytime valid”是 knowledge‑dependent 的:若研究者实际拥有的先验知识等于或弱于 \(\bar{\pi}\),则上界仍成立;若先验被低估(即实际可能性大于 \(\bar{\pi}\)),也可能成立(需要额外条件)。

  2. 最优性(Theorem 2, 或命题)
    在所有 \(\bar{\pi}\) 为容许预算 的 e‑process 中,本文的 \(R_n\)最不保守的 ——即,对任何竞争过程 \(R'_n\) 满足 \(E_0[R'_n \mid \mathcal{F}_{n-1}] \le R'_{n-1}\) 且与 \(\bar{\pi}\) 相容,有 \(R_n \ge R'_n\)(几乎处处)。这保证了“效率增益”已经达到可能性允许的上界。

  3. 与可能性推断的等价性
    regularized e‑process 可转化为一个 数据依赖的可能性 measure \(\bar{\Pi}_n(A) = \sup_{\theta \in A} R_n(\theta)\),其中 \(R_n(\theta)\) 是“当考虑单独假设 \(\theta\) 时的正则化 e‑value”。这个 \(\bar{\Pi}_n\) 满足 真实性条件(即避免 false confidence),且相应的决策规则(最小化 Choquet 上的期望损失)有可靠性保证(Theorem 3)。

证明路线与技术技巧

整体路线(3‑5 步逻辑主干)

  1. 构造分割:将 possibility measure \(\bar{\pi}\) 分解为一个 概率测度族(所有 重心分解):每个概率测度 \(\nu\) 满足 \(\nu(A) \le \bar{\pi}(A)\) 对所有 \(A\)。这种 \(\nu\) 称为 \(\bar{\pi}\) 支配的概率测度(dominated probability measures)。

  2. 覆盖引理:对每个这样的概率测度 \(\nu\),构造混合似然比 e‑process

    \[E_n^{(\nu)} = \frac{\int p_\theta(Z^n) d\nu(\theta)}{p_{\theta_0}(Z^n)},\]

    它显然是一个 test martingale(起始值 1,鞅)。关键:因为 \(\nu\) 是概率测度,积分换了次序,期望恒为 1。

  3. 上确界保持:定义

    \[R_n = \sup_{\nu: \nu \preceq \bar{\pi}} E_n^{(\nu)} .\]

    由于每个 \(E_n^{(\nu)}\) 是鞅,上确界不一定仍是鞅,但可以是 上鞅(supermartingale)。需要验证:对于任何停止时间 \(\tau\)\(E_0[R_\tau] \le 1\)。这需要 可测性/一刀切性——因为上确界对 \(\nu\) 是点态上确界,且 \(\nu\) 的集合是紧的(在某种拓扑下)。这里是证明的跳跃点。

  4. Choquet 积分表示:利用 maxitivityconcave contour,证明上确界等价于一个 Choquet 积分:

    \[R_n = (C)\! \int \frac{p_\theta(Z^n)}{p_{\theta_0}(Z^n)} \, d\bar{\pi}(\theta).\]

    这个等式的证明需要 Sion’s minimax theoremFenchel 对偶,将 \(R_n\) 重写为
    \[\inf_{\text{某些函数}} \sup_{\nu} \cdots\]

    再交换次序。

  5. 广义 Ville 不等式:对 Choquet 积分形式的 \(R_n\),直接应用 Markov 型不等式单调收敛定理

    \[P_0(\sup_n R_n > 1/\alpha) = P_0\!\left( \sup_n (C)\! \int f_n \, d\bar{\pi} > 1/\alpha \right) \le \frac{1}{\alpha} E_0\!\left[ \sup_n (C)\! \int f_n \, d\bar{\pi} \right] .\]

    然后利用上鞅性质 \(E_0[R_n] \le 1\)Fatou 引理(对 Choquet 积分成立)得到最终上界。

关键跳跃点: - 从概率测度族的上确界到 Choquet 积分:这是将 imprecise probability 具体化的核心,需要文献 [Martin, 2022b] 的 outer consonant approximation 引理。 - 保证上确界过程是 可测的(对滤子适应):通常通过 universally measurability 假设解决。

技术技巧点名: - Choquet Integral:用于在不精确概率下定义期望和积分,是整个构造的数学基础。 - Sion’s Minimax Theorem / Fenchel Duality:用于将上确界转化为 Choquet 积分。 - Test Supermartingale 的版本:与经典的 Doob 上鞅收敛定理交互。 - Possibility Measure 的 Concave Contour 假设:为了确保 Choquet 积分的超鞅性,Martin (2022) 指出需要 concave 条件以避免 dilation。 - Ville 不等式的扩展:原是对鞅,本文扩展到上鞅(更易处理)且带 Choquet 积分线性。

真实例子与应用

本文为 纯理论论文,没有真实数据例子或模拟实验。作者在 abstract 及 given 材料中未提及任何实证。根据参考文献列表(Turner & Grünwald (2022) 有列联表应用),但本文本身不包含实证部分。可能作者在正文中用一个 简单的高斯均值检验 作为示例说明构造,但并非真实数据。结论:“本文为纯理论,无实证例子”。

🔎 结论是否比证明窄

需要查看具体定理的假设。从 parallel work(Martin 2022)看,一些推理要求 possibility contour 是 concave。在应用中(如 \(\pi(\theta) = e^{-\lambda |\theta - \mu|}\) 满足 concave 吗?不一定)。若作者在主要定理中假设了 concave,但 claim 在 general possibility measure 下成立,则结论比证明窄。另一方面,作者可能证明了 对任何 upper semicontinuous 且 normalized 的 possibility,regularized e‑process 仍保持超鞅(通过另外一种构造:先凸化再正则化)。需要检查原文的具体假设语句。


四、开放问题(点到为止)

  1. Possibility measure 的选择与校准:本文给出了用 Choquet 积分的正则化构造,但并没有提供如何从实际背景中 引导出 \(\bar{\pi}\) 的通用方法。当 \(\bar{\pi}\) 是研究者主观确定时,其 misspecification 对效率损失的具体界限如何?是否可能建立类似 minimax regret 的适应性选择程序?(根基:本文未讨论引导程序,typical future work。)

  2. 高维/非参数扩展:当参数空间 \(\Theta\) 是无穷维(如非参数函数类)或高维时,possibility measure 的定义变得复杂(如 Gaussian process prior 的 contour 可能不满足 uca)。此时广义 Ville 不等式是否仍成立?Choquet 积分的数值实现困难?(根基:Martin (2023) 的 marginalization 工作处理了 nuisance parameters,但未涉及时变设定。)

  3. 与其他 e‑process 的最优性比较:Grünwald et al. (2019) 的 GROW s‑values 给出了无先验情形下的指数最优增长,本文的效率增益是 相对于无先验基线 的。但若有多个研究者使用不同的 \(\bar{\pi}\),他们的 regularized e‑process 之间如何比较?是否存在类似 Bayesian 模型平均 的合并规则?(根基:Vovk & Wang (2021) 讨论独立 e‑values 的合并,但本文的 dependence 结构可能不同。)

  4. 计算可行性:Choquet 积分在一般连续参数空间下是 inf‑sup 问题,计算上可能相当复杂。是否有高效的数值算法(如基于 convex hull 的近似)?是否能与 tensor‑contraction / einsum 方法连接(研究者有相关背景)?(根基:本文为纯理论,未提供算法细节。)


Maintained by 陈星宇 · Homepage · Source on GitHub

评论