The numeraire e-variable and reverse information projection¶

作者: Martin Larsson, Aaditya Ramdas, Johannes Ruf
来源: Annals of Statistics
主题: 数理统计 / 假设检验
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本文的核心是 e-variable（e-值） 的构造与最优性理论。e-variable 是一种用于假设检验的非负随机变量，其核心性质是：在复合零假设 \(\mathcal{P}\) 下的期望 \(\le 1\)（对每个 \(P\in\mathcal{P}\)）。对应的检验规则是：观测到大的 e-variable 值则拒绝 \(H_0\)。这一概念近年来被系统发展，提供了不同于传统 p-value 的、有清晰赌博/投注解释的推断框架，且天然支持“随时可停”的序贯分析（anytime-valid inference）。当前该子方向的成熟度已较高：基本定义与解释、组合技术（平均 e-values）、与 p-value 的校准关系均已建立；本文面向的是其中最后一个核心理论缺口——复合零假设下 e-variable 的最优性。

发展脉络（history）¶

以下按时间与被引关系串联，从奠基到本文的位置：

奠基：非负鞅与序贯检验（Robbins, 1970; Ville, 1939）：Robbins 系列工作提出利用 Ville 不等式，将非负鞅的构造与序贯假设检验联系起来。Ville 的经典不等式是“非负鞅始于 1，则任何阈值 \(c\) 之上的概率 \(\le 1/c\)”，这一思想成为后来 e-variable 与 anytime-valid 推断的数学基础。
赌博视角与 e-value 概念的提出（Shafer, 2021; Vovk & Wang, 2019; Grünwald et al., 2019）：Shafer 明确将“检验=赌博”的直觉形式化——每次赌赢财富翻倍等于生产一个 e-variable。Vovk & Wang (2019) 系统定义了 e-values，给出校准（calibration）与组合（combination）理论，指出“平均 e-values”的简单性质是 p-value 不具备的。Grünwald 等的 Safe Testing (2019, 2024) 将这一框架推向复合假设，引入 GROW（Growth-Rate Optimal） e-values 与 JIPr（Joint Information Projection），证明最优 e-variable 对应某个 Bayes 因子。这是目前被引最多的核心进展之一。
复合假设下的 e-variable：刻画与存在性（Ramdas 等, 2020; Zhang 等, 2023）：Ramdas 等 (2020) 证明所有“可接受”（admissible）的序贯 e-variable 必来自非负鞅（或 max-martingale），将 e-variable 与鞅结构不可分割地绑定。Zhang 等 (2023) 在 \(\mathcal{P},\mathcal{Q}\) 均为凸多面体（概率空间中的凸多面体）时，给出存在“期望恰好为 1”的 e-variable 的充要条件——\(\mathcal{Q}\) 不在 \(\mathcal{P}\) 的展形（span）内。这一工作是本文的直接前驱之一：它处理了有限维情形下的存在性与刻画，本文“无任何条件”的结果可看作对其的完全一般化。
反向信息投影（RIPr）的应用（Lardy 等, 2023）：Lardy 等直接在 e-variable 与信息投影的桥接上工作。他们证明，当 \(\inf_{P\in\mathcal{P}} D(P\|Q)\) 有限时，GRO e-variable 由 RIPr 给出——RIPr 即在所有 \(P\in\mathcal{P}\) 中向 \(Q\) 的“反向”KL 投影。他们还给出当投影不存在（散度无限）时的若干补充条件。但本文指出 Lardy 等的处理仍有附加假设。
本文的位置（Larsson, Ramdas, Ruf, 2024 Annals of Statistics）：在上述所有工作中，RIPr 的定义或存在均依赖某个 参考测度 或 tightness / 存在性 条件。本文的主要定理（Thm 2.1）对任何 \(\mathcal{P}\) 与 \(\mathsf{Q}\) 断言：存在一个特殊的 e-variable \(X^*\)，它严格正、log-optimal、且满足 \(\mathbb{E}_\mathsf{Q}[X/X^*]\le 1\) 对所有其他 e-variable \(X\) 成立。\(X^*\) 自然定义了一个子概率测度 \(\mathsf{P}^*\)（通过 \(d\mathsf{P}^*/d\mathsf{Q}=1/X^*\)），在 RIPr 有定义的情况下它恰是 RIPr——因此本文实质上是给出了 RIPr 的无条件同义词。这是该子方向的终极存在性定理，统一了以前分散于多个论文的不同结果。

子线索聚类¶

这些被引文献大致落于以下 2-3 条子线索：

线索 A：e-variable 的发展与最优性理论 核心工作：Shafer (2021) 提出赌博视角；Vovk & Wang (2019) 系统化定义与组合；Grünwald 等 (2019, 2024) 引入 GROW e-variable 与 JIPr；Ramdas 等 (2020) 证明可接受 e-variable 必来自鞅；Zhang 等 (2023) 针对凸多面体给出存在性刻画。这一线索的主要问题：e-variable 的最优性（GRO）如何定义与实现？什么条件下存在“最优” e-variable？
线索 B：信息投影的统计意义与反身投影（RIPr） 核心工作：Csiszár (1975) 经典理论；Grünwald 等 (2019) 引入 JIPr；Lardy 等 (2023) 专门研究 RIPr 与 GRO e-variable 的对应；本文（Larsson 等, 2024）将其无条件化。这一线索将 e-variable 的最优性问题与信息几何联系起来，给出解释力更强的工具（Bayes 因子 / 对数似然比 / 子概率测度）。
线索 C（较细）：金融数学中的 numéraire 组合 核心被引：Karatzas & Kardaras (2007); Long (1990); Becherer (2001)。在金融数学中，numeraire 组合是指以它为计价单位（numéraire）时，所有其他组合的相对财富都是上鞅。本文的术语与直觉完全来自这一类比——\(X^*\) 就是 e-variable 空间的“numeraire 资产”。

这个方向在追问的核心问题¶

存在性：给定任意 \(\mathcal{P}\) 与 \(\mathsf{Q}\)，是否存在一个 e-variable 在某种意义下是最优的？什么意义？
刻画：最优 e-variable 的结构是什么？它是否总对应某个子概率测度（如 RIPr）？
可构造性：对于有意义的非参数（或参数）复合零假设，能否显式写出最优 e-variable 的解析表达式？
推广到替代最优性准则：对数效用（Kelly 赌博）下的最优性虽然是自然的，但它是否唯一合理的选择？对于其他风险偏好（如幂效用），理论是否同样优美、同样无条件成立？

⚠️ 作者的 framing（必须明确标注为“这是作者的说法”）¶

作者将缺口 frame 为：RIPr 的定义与存在在已有文献中需要额外假设（参考测度、finite KL divergence、tightness 等）[Abstract, 第 6-7 行]。他们认为这不是必要的——本文的定理 2.1 不依赖任何假设（no conditions whatsoever），所定义的 \(\mathsf{P}^*\) 就是 RIPr 的自然无条件推广（Thus \(\mathsf{P}^*\) is a natural definition of the RIPr in the absence of any assumptions on \(\mathcal{P}\) or \(\mathsf{Q}\)，见 Abstract 第 8-9 行）。

被淡化或回避的竞争路线：作者没有强调 Grünwald 等 (2019) 的 JIPr 路线与本文结果的具体比较——JIPr 处理的是复合备择（\(\mathcal{P}\) vs \(\mathcal{Q}\) 均复合），而本文只在 \(\mathsf{Q}\) 为点备择时建立。对于复合备择情形，本文推广是后续工作。此外，作者没有详细讨论 条件化 vs 非条件化（conditioning）e-variable 的差异（例：本文例子中有时条件 e-variable 类会不一样）。这些不被视为 gap，但值得研究者去查。
明显该被引、该存在、但未出现的工作：笔者注意到，关于 双极定理（bipolar theorem） 的现有文献主要是 Bartl & Kupper (2017) ——这篇被引用了；但更早的 Bishop-Phelps 定理 或 Fenchel-Moreau 在函数空间上的推广 并未被引入。此外，E.H. Lieb 关于 反身 KL 投影（reverse KL projection）的经典工作（例：Lieb 1977，关于 equilibrium function 与反身散度）未出现——虽然不属于同一领域，但或许可为“无条件存在性”提供旁证。这些不影响论文价值，但值得研究者去查是否能建立联系。

张力¶

未见明显对立引用。被引文献之间的一致性是较高的：所有前驱工作逐步放松存在性条件，本文是最终一般结论。但存在一个细微张力：Grünwald 等 (2019) 的 JIPr 定义涉及 全概率空间上的 Bayes 混合，而本文的 numeraire 对应 一个子概率测度（sub-probability measure，不是完整的概率分布）。当 \(\mathcal{P}\) 不完全被某个 sigma-有限测度控制时，两者的对应未必平凡——这就是作者在 Section 3 中讨论的“RIPr 存在性”问题（仅限于有参考测度的情形）。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号约定：
\(\mathcal{P}\)：复合零假设——一组概率测度的集合（定义在同一样本空间 \(\mathcal{Z}\)）。
\(\mathsf{Q}\)：单一的备择概率测度（点备择，简单备择）。
\(Z\)：可观测的随机变量（向量、样本值），定义在 \(\mathcal{Z}\) 上。统计问题：观测到 \(Z\)，决定是否拒绝 \(H_0:\text{ law of }Z \in \mathcal{P}\)。
\(\mathcal{E}\)：所有 e-variable 的集合。一个非负可测函数 \(X:\mathcal{Z}\to[0,\infty)\) 如果满足 \(\mathbb{E}_{\mathsf{P}}[X]\le 1,\ \forall \mathsf{P}\in\mathcal{P}\)，则 \(X\in\mathcal{E}\)。
\(X^*\)：numeraire e-variable（本文核心对象）：满足（i）\(X^*>0\) a.s.-\(\mathsf{Q}\)；（ii）对所有 \(X\in\mathcal{E}\)，\(\mathbb{E}_\mathsf{Q}[X/X^*]\le 1\)。
\(\mathsf{P}^*\)：由 \(X^*\) 定义的概率测度（严格说是子概率测度，即 \(\mathsf{P}^*(\mathcal{Z})\le 1\)），通过 Radon-Nikodym 密度：
\[\frac{d\mathsf{P}^*}{d\mathsf{Q}} = \frac{1}{X^*}.\]
\(\mathcal{L}_\infty\)：有界随机变量构成的集合（技术细节中使用）。
模型：
没有任何参数化——这是纯非参数设定：\(\mathcal{P}\) 可以是任意概率测度的集合（甚至不是凸的、不是紧的、不受任何 sigma-有限测度控制）。
\(\mathsf{Q}\) 是单个概率测度，不需要与 \(\mathcal{P}\) 有绝对连续关系。
可观测数据：研究者观测到 \(Z\) 的一次实现（单个观测；多观测情形可通过乘积空间推广）。想要但不可直接观测：\(\mathsf{P}\) 到底属于 \(\mathcal{P}\) 中的哪个元素——这一不确定性正是复合零假设的困难所在。
关键区分（对非参数设定尤其重要）：
可观测：仅 \(Z\) 的取值。
不可观测：哪个 \(P\in\mathcal{P}\) 是“真”的（在 \(H_0\) 下），或者在没有参考测度（dominating measure）时如何定义密度 \(dP/dQ\) ——此类表达需更精确地表述为通过 \(X^*\) 定义的广义版。

第二步：讲最小内核——最简例子¶

考虑如下最简例子，它能展示本文的核心数学工作：

最简特例：设 \(\mathcal{P} = \{P_1, P_2\}\) 是只有两个零假设测度的集合，且样本空间 \(\mathcal{Z}\) 有限（\(\mathcal{Z} = \{a,b,c\}\) 三个点）。\(\mathsf{Q}\) 是点备择。
每个 \(P_i, \mathsf{Q}\) 由质量函数给出：比如
\[P_1 = (0.2, 0.3, 0.5), \quad P_2 = (0.4, 0.4, 0.2), \quad \mathsf{Q} = (0.5, 0.3, 0.2).\]
所有 e-variable：函数 \(X:\{a,b,c\}\to[0,\infty)\) 满足 \(\sum_z P_i(z)X(z) \le 1\) 对 \(i=1,2\) 均成立。（这是两个线性不等式。）
问题：找一个 \(X^*\) 使得对所有 \(X\in\mathcal{E}\) 都有 \(\mathbb{E}_\mathsf{Q}[X/X^*] \le 1\)。
这个特例下的推导：
定义集合 \(\mathcal{E}\)：它是 \(\mathbb{R}^3_{\ge0}\) 中由两个线性约束 \(p_{i,a} x_a + p_{i,b} x_b + p_{i,c} x_c \le 1\) 定义的多面体（polytope）。
寻找 numeraire 等价于：最大化 \(\mathbb{E}_\mathsf{Q}[\log X]\)（log-optimality）subject to \(X\in\mathcal{E}\)。
对有限离散情形，这是常规凸优化（凹目标，线性约束）。通过令拉格朗日导数为零可得：
\[X^*(z) = \frac{q_z}{p^*_z}, \quad \text{其中 } p^*_z = \tau \min_{i=1,2} \lambda_i p_{i,z},\]
\(\lambda_i\) 是某个凸组合系数（来自对偶变量），\(\tau\) 是归一化常数。
关键观察：\(X^*\) 的倒数分布 \(1/X^* = q_z / p^*_z\) 正比于某个混合 \(p^* = \lambda_1 P_1 + \lambda_2 P_2\)（如果 \(\lambda_1+\lambda_2=1\)）或 子混合（如果 \(\lambda_1+\lambda_2<1\)）。后者对应 \(\mathsf{P}^*(\mathcal{Z})<1\) ——即子概率测度情形。
验证：对任何其他 \(X\in\mathcal{E}\)，
\[\mathbb{E}_\mathsf{Q}[X/X^*] = \sum_z q_z \frac{X(z)}{X^*(z)} = \sum_z p^*_z X(z) \le 1,\]
因为 \(\sum_z p^*_z X(z) = \sum_i \lambda_i \sum_z p_{i,z} X(z) \le \sum_i \lambda_i \cdot 1 = 1\)（若 \(\sum_i \lambda_i = 1\)）或 \(\le \sum_i \lambda_i < 1\)（若 sub-probability）。这就是定理 2.1 的有限版本。
为什么这个例子揭示整个论文的核心思路：
无限维推广：原始的有限维多面体 \(\mathcal{E}\) 被一个无限维凸集代替（所有 e-variable 的集合）。寻找最优 \(\log X\) 是对无限维凸优化的 支撑超平面 问题。
困难：在无限维（无 tightness / 无参考测度）时，拉格朗日对偶性地失效，最大值点可能不在 \(\mathcal{E}\) 的“内部”（即 \(X\) 可能是无界的或不完全刻画）。本文用点双极定理（pointwise bipolar theorem）绕过这些正则性条件，直接证明 numeraire 的存在性，同时证明它可以写成“某种混合”（即 \(\mathsf{P}^*\) 形式）。本文定理 2.1 本质上是在无限维泛函分析框架下重复了上述例子中对偶论证。
所以，整篇论文的数学内核可看作是：在无限维 Banach 空间 \(\ell_\infty\) 上，对凸集 \(\mathcal{E}\) 的某个对偶锥（由“混合”组成）应用点双极定理，证明 \(X^*\) 的存在且唯一——无需 convexity of \(\mathcal{P}\)，无需 reference measure，无需 compactness。

读者读完这一节，已掌握所有记号，且理解文章在证明一个“用点双极定理解锁的无限维对偶论证”。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究了什么问题：在无任何假设的条件下（复合零假设 \(\mathcal{P}\)，点备择 \(\mathsf{Q}\)），证明存在唯一的一个 e-variable \(X^*\)，称为 numeraire，它满足 \(\mathbb{E}_\mathsf{Q}[X/X^*]\le 1\) 对所有 e-variable \(X\) 成立，且在 \(\mathcal{P}\) 与 \(\mathsf{Q}\) 满足额外假设（如存在参考测度、RIPr 有定义）时 \(X^*\) 的倒数密度恰好是 RIPr。
核心工具/方法：证明基于泛函分析中的点双极定理（pointwise bipolar theorem, Bartl & Kupper, 2017）+ 凸集的对偶刻画 + 类金融的 numeraire 解释（Kelly 赌博）；非参数例子使用经验过程理论或已知的凸对偶（如通过 sub-Gaussian 的 \(\psi\) 函数来构造）。
主要结论：
Theorem 2.1（核心）：\(X^*\) 存在且唯一，严格正。它等价于 \(\log X\) 在 \(\mathcal{E}\) 上关于 \(\mathsf{Q}\) 的最大化（log-optimality）。
Theorem 3.1（RIPr 联系）：当存在 sigma-有限参考测度 \(\mu\) 且 RIPr 在原有定义下存在时，\(X^*\) 的倒数密度 \(1/X^* = d\mathsf{P}^*/d\mathsf{Q}\) 恰为 RIPr 的概率密度。
Theorem 4.1（幂效用推广）：对数效用推广到 CRRA 效用函数（\(U_\alpha\) with \(\alpha < 1\)）：存在唯一的 e-variable \(X^*_\alpha\) 最大化 \(\mathbb{E}_\mathsf{Q}[U_\alpha(X)]\)，它给出一个反身 Rényi 投影（reverse Rényi projection），且计数公式推广了 KL 散度。

关键设定与假设¶

定义 2.1：e-variable。\(X:\mathcal{Z}\to[0,\infty]\)，对每个 \(P\in\mathcal{P}\)，\(\mathbb{E}_P X \le 1\)。注：允许 \(\infty\)，但 numeraire 必严格有限（正）。
假设：Theorem 2.1 无任何假设（这是本文最大的 selling point）。Theorem 3.1 追加了一个 存在 sigma-有限参考测度 的假设 —— 这是为了能谈论密度，和现有 RIPr 定义一致。Theorem 4.1（幂效用）也无需任何额外假设，因为证明路线与 Theorem 2.1 平行——只需更换目标函数。
对比已有文献：
相比 Zhang 等 (2023)：无需 \(\mathcal{P}\) 为凸多面体。
相比 Lardy 等 (2023)：无需 \(\inf D(P\|Q) < \infty\) 或其它 tightness 条件。
相比 Grünwald 等 (2019)：无需求 \(\mathcal{Q}\) 也是复合（点备择假设）。此外，Grünwald 等依赖于对所有 \(P,Q\) 存在参考测度 & 全空间 sigma-有限，本文不要求。

主要结果¶

Theorem 2.1（存在性与唯一性）：对任意 \(\mathcal{P},\mathsf{Q}\)，存在唯一 \(X^* \in \mathcal{E}\) 满足： (i) \(X^* > 0\) a.e. \([\mathsf{Q}]\)； (ii) 对所有 \(X\in\mathcal{E}\)，\(\mathbb{E}_\mathsf{Q}[X/X^*] \le 1\)；此外，\(X^*\) 是 log-optimal 进入 \(\mathcal{E}\) 的（即 \(X^* = \arg\max_{X\in\mathcal{E}} \mathbb{E}_\mathsf{Q}[\log X]\)）。 直觉与必要条件：\(X^*\) 实物化为一个子概率测度 \(\mathsf{P}^*\)（缩放后不一定是 1）。\(X^*\) 的定义可以被看作“复合零假设 \(\mathcal{P}\) 与点备择 \(Q\) 之间的广义似然比”。所需的必要条件仅仅是 \(\mathcal{E}\) 非空——但 \(\mathcal{E}\) 确实总是非空（包含常函数 1）。此处解决的技术难点：在无 tightness / domination 下，凸优化仍可达最优值。
Theorem 3.1（RIPr 联系）：假设存在 sigma-有限 \(\mu\) 控制 \(\mathcal{P}\cup\{\mathsf{Q}\}\)，且 RIPr \(P^*\) 按已有定义存在（即 \(P^* = \arg\min_{P\in \text{cl conv }\mathcal{P}} D(P\|Q)\) 当最小值有限），则 \(\frac{dP^*}{d\mathsf{Q}} = 1/X^*\)。因此，\(X^*\) 是 RIPr 的自然无限维推广。
Theorem 4.1（幂效用）：

对于 \(\alpha < 1\)，考虑优化

\[\max_{X\in\mathcal{E}} \mathbb{E}_\mathsf{Q}[ \frac{X^{1-\alpha}-1}{1-\alpha} ]\]

存在唯一 \(X^*_\alpha\)，并且 \(X^*_{\alpha}\) 可表达为

\[X^*_\alpha = c_\alpha \left( \frac{d\tilde{\mathsf{P}}_\alpha}{d\mathsf{Q}} \right)^{1/(1-\alpha)}\]

其中 \(\tilde{\mathsf{P}}_\alpha\) 是某一子概率测度（对应 “reverse Rényi projection of order \(1/(1-\alpha)\)”）。这统一了散度 d’/divergence 家族：\(\alpha\to 0\) 时来自 KL 散度，\(\alpha\to 1\) 时来自 \(\chi^2\) 散度。

证明路线与技术技巧¶

整体路线（Theorem 2.1 的证明）：

定义集合：\(\mathcal{X} = \log \mathcal{E} \subseteq L^0(\mathsf{Q})\)（对数值集合）。约束：\(X\in\mathcal{E} \iff \forall P\in\mathcal{P}: \mathbb{E}_P[e^{h}] \le 1\)。
证明 \(\mathcal{X}\) 是 \(\mathsf{Q}\)-a.s. 开凸集的上鞅胞（upper semilattice？）。关键引理：\(\mathcal{X}\) 满足代数行条件（algebraic interior condition）——即对 \(h\in\mathcal{X}\) 和任意有界 \(g\in L^\infty\)，存在 \(\epsilon_0>0\) 使 \(h + t g \in \mathcal{X}\) 对 \(|t|<\epsilon_0\) 成立。这个条件在点双极定理框架中是“凸集有非空代数内部”的等价陈述。
应用点双极定理（Bartl & Kupper, 2017）：点双极定理说：对于 \(L^\infty\) 上某个凸局部闭集 \(C\)，其双极（bipolar）等于 \(C\)；从而对偶问题有鞍点。具体技巧：本文证明集合
\[\mathcal{B} = \{ \mu \in ca_+(\mathcal{Z}) \text{ (signed finite measures)} : \int X d\mu \le 1 \ \forall X\in\mathcal{E} \}\]
的极（polar）恰为 \(\mathcal{E}\)。由此，\(\mathcal{E}\) 是 \(\mathcal{B}\) 的极。对偶对：\((L^\infty, ca)\) 上的配对。
构造 numeraire：考虑“对数效用最大化”：
\[\sup_{X\in\mathcal{E}} \mathbb{E}_\mathsf{Q}[\log X]\]
由点双极定理，这个上确界可达于 \(\mathcal{E}\) 中；最大值点记为 \(X^*\)。
唯一性：由于 \(X_1^*, X_2^*\) 若都最优，则其调和平均/混合也最优，最终由 Jensen 严格凸性推出相等。

关键跳跃点：

最吃功力的引理：Lemma A.1 ——证明 \(\mathcal{X}\) 有非空代数内部，即对任意 \(h\in\mathcal{X}\)，存在 \(\epsilon>0\) 使 \(B_\epsilon(h)\subset \mathcal{X}\)。难点：\(\mathcal{E}\) 约束 \(\mathbb{E}_P[e^{h}] \le 1\) 对无穷多个 \(P\) 同时起作用。一般情形的证明使用了构造“充分大的扰动”加“软鞅不等式”。
绕过 tightness 的窍门：点双极定理不需要弱紧性或 tightness，而只要求 liminf-closed 性质（在点态收敛拓扑意义下）。证明这一性质在 \(\mathcal{E}\) 中成立的理由：任何一个点态收敛的 \(X_n\) 序列，其极限 \(X\) 仍保持 \(\mathbb{E}_P X \le 1\)，这是由于 Fatou 引理（对每个 \(P\in\mathcal{P}\)，\(\mathbb{E}_P X \le \liminf \mathbb{E}_P X_n \le 1\)）。因此 \(\mathcal{E}\) 是 liminf-closed。——这是极其优雅的结构简化。

技术技巧点名：

点双极定理（Bartl & Kupper, 2017）：论文技术上依赖的核心泛函分析工具，它被用来证明对数最优性问题的对偶无 gap。
Fatou 引理的应用：如上所说，证明 \(\mathcal{E}\) liminf-closed 的关键。
凸组合 + Jensen 不等式：证明 \(X^*\) 唯一的技术。
对数效用与 Kelly 赌博对偶：将统计问题映射到金融中的“最优增长组合”问题，利用 Karatzas-Kardaras 的已知技术处理幂效用推广。
幂效用下的推广：通过对数效用->幂效用的数值转换（本文第 4 节给出显式的变换：\(X^*_{\alpha} = (1-\alpha) X_{1-\alpha} + \alpha\) 类型的非平凡变体），实质上是将最优问题从 KL 散度扩展到 Rényi 散度。这借鉴了 Kramkov & Schachermayer (1999) 的金融数学技术（对幂效用的无差异定价）。

真实例子与应用¶

论文没有进行大规模模拟或真实数据实验，但提供了多个明确非参数例子（Section 5），展示如何显式构造 numeraire，这些例子即使在没有参考测度时也能识别：

例 5.1（有界分布的均值检验）：\(\mathcal{P}\) = 所有在 \([0,1]\) 上取值的分布。\(\mathsf{Q}\) 是集中在某个点上（如 \(\delta_{0.6}\)），或中点分布（有已知均值）。numeraire 可显式写为 \(X^* = \frac{2}{1+\text{sign}(Z-c) \cdot |Z-c|}\) 的形式；更具体地，当 \(\mathsf{Q}\) 的密度已知时，\(X^*\) 是某个分段线性函数。该例子想证明：无参考测度时仍可写出 numeraire。
例 5.2（对称分布的检验）：\(\mathcal{P}\) = 所有对称于 0 的分布（\(Z\) 与 \(-Z\) 同分布）。\(\mathsf{Q}\) 是单点 \(\delta_c\)（\(c>0\)）。通过验算 \(\mathbb{E}_P[ X^* ]\le 1\) 条件，numeraire 可表达为 \(X^*(z)=\max\{1, k\frac{q(z)}{m(z)}\}\) 的泛化形式。此例的数学技巧：使用“耻辱估计”（least-favorable）构造。
例 5.3（次高斯分布）：\(\mathcal{P}\) = 所有 \(\psi_2\)-norm \(\le 1\) 的零均值分布（标准次高斯）。通过 Chernoff 方法，\(X^*\) 为指数型 \(e^{z^2/2}\) 的变体。揭示：次高斯尾的约束可归约为某个凸条件，而 numeraire 可从 Legendre 变换直接读出。

一个特别的阴性结论（Section 5 末尾）：当 \(\mathcal{P}\) 是所有具有有限二阶矩的分布时，\(X^* \equiv 1\)——即 无法比常函数 e-variable 做得更好。这说明在约束太弱（无尾限制）时，针对点备择 \(\mathsf{Q}\) 的备择检验无信息量——numeraire 退化为平凡解。

🔎 结论是否比证明窄¶

论文在每个主要定理前都明确写了设定条件（Theorem 2.1 无条件；Theorem 3.1 加参考测度；Theorem 4.1 为幂效用推广）。这是严谨的。
需要指出的一个微妙点：文中声称“numeraire 定义了一个子概率测度 \(\mathsf{P}^*\)”。这个“子概率”性质在点双极定理下有严格保证；但是否 完美匹配“经典 RIPr”在所有有参考测度的情形？Theorem 3.1 验证了 当 RIPr 有定义时（即最小化可达且有限），两者一致。但 是否存在有参考测度时，最小化不可达（inf is 0 or infinity）、而 \(\mathsf{P}^*\) 仍能定义？ 实际上对无穷/零 KL 散度，本文的 \(\mathsf{P}^*\) 提供了一个“扩展 RIPr”，这在 Lardy 等 (2023) 的部分处理下才有（且需额外条件）；本文在 点双极定理 + 子概率 的意义上扩展得更多，但该扩展是否在信息几何中受欢迎，尚待评议。作者没有作为 conjectures 或 future work 提及——他们满意于 Theorem 3.1 的陈述。

本文为纯理论/无实证例子（除了 Section 5 的解析例子，这些只是数学构造，不是从真实数据来的）。因此对于要求真实数据例子的读者，论文不提供。

四、开放问题（点到为止，扎根具体语句）¶

应用：序贯设定下 \(\mathcal{P}\) 对复合 \(\mathcal{Q}\) 的 numeraire？
本文处理的是 点备择（simple \(\mathsf{Q}\)）。但实际中常遇见 \(\mathcal{Q}\) 也是复合的（例：处理效应 HR 在某个紧区间内）。作者在 Section 5 末尾提到 “multiple alternatives 会留给后续工作”（第 5 节末句）。具体扎根：“we have so far only considered simple alternatives” [原文见实例前的段落]。这是直接的 future work 声明。
非参数设定下 numeraire 的数值构造： 论文只给出解析构造的例子（有界、对称、次高斯）。对于更复杂的 \(\mathcal{P}\)（光滑性、形状约束、或非凸尾部约束），“显式解/数值解法”未给出。来自经验过程的 \(\mathcal{P}\) 未知紧性的设定，如何统一地用算法求出 \(X^*\)？这联系到研究者的 high-dimensional 和 nonparametric armsenal。这句话扎根在 Section 5 的开头：“In many nonparametric examples we can identify the numeraire …” —— 但能否总是识别？未见回答。
延伸：Hoover 等的效率理论或得 e-variable 的 minimax 最优性？
第 3 节定理 3.1 证明在参考测度存在时，numeraire 对应 RIPr。但这是 expectation-based 的检验；是否有“最小最大（minimax）e-variable”刻画？扎根句子：“Since \(X^*\) is log-optimal, it is also the only e-variable that is admissible in the sense of being a generalized Bayes decision rule…”（Section 2 末）。这一说法只对应 Bayes 决策，但在 minimax 框架中未展开。
推广：Rényi 投影的连乘性质？
对幂效用（Theorem 4.1），文章给出了一个投影家族，但其在序贯（连续时间数据到达）状态下的构造/对偶表现是否也会像对数效用一样（始终为 e-variable）？对鞅约束的必然性（Ramdas et al., 2020）是否可推广至一般幂效用？根的句子：Section 4 最后一段的 “This suggests a natural extension to all absolute continuous power utilities”——这基本是开放研究计划示意，作者未探索。
与已有金融/赌博文献的桥接： 当 \(\mathcal{P}\) 是对某个协变量的条件约束时，numeraire 如何与随机控制/鞅表示（如 Karatzas & Kardaras 中的状态价格密度）联系？这在统计应用中涉及变点检测或异常识别。扎根在 Section 2 倒数第二段的类比：“our terminology is inspired by…”—— 但只做了术语借用，未穷尽连接。

（以上 4-5 条未排序，研究者可根据自身兴趣决定先看哪个。）

Maintained by 陈星宇 · Homepage · Source on GitHub