Bentkus-type asymptotic e-values¶

作者: Diego Martinez-Taboada, Ben Chugg, Aaditya Ramdas
主题: 数理统计 / 假设检验
相关性: 7/10
链接: https://arxiv.org/abs/2606.06332

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本问题是：在无方差上界假设（仅有有限非零方差）的均值检验设定下，如何构造既保持渐近有效性（asymptotic e-value），又在推断阈值上逼近经典 CLT 理想界（\(z_\delta = G^{-1}(\delta)\)）的检验统计量。当前该方向处于“概念框架已确立（渐近 e-value 被定义），但首批构造法存在常数级效率损失（missing factor）”的阶段，本文试图用非渐近集中不等式里的近优工具填补这一效率缺口。

发展脉络： 1. 奠基工作：Ramdas & Wang (2025) 系统化了 e-value 理论，确立了 e-value 在 optional stopping、任意依赖下的合并、以及不规则问题中的必要性。Ignatiadis et al. (2024) 首次定义了渐近 e-value（满足 \(\limsup EP[E_n] \le 1\)），并提出了基于指数函数的构造 \(E^\infty_n(\theta;\lambda) = \exp(\lambda Z_n(\theta) - \lambda^2/2)\)，但留下了一个口子：该构造的推断阈值下界为 \(\sqrt{2\log(1/\delta)}\)，与 CLT 阈值 \(z_\delta\) 之间存在一个被称为“missing factor”的缩放间隙。 2. 主要进展（非渐近集中不等式侧）：Bentkus (2002, 2004) 与 Pinelis (2006a, 2014b) 在非渐近设定下发展了基于 \(\alpha\)-powered positive functions 的近优集中不等式，证明了这类界可以将尾部概率的 \(\delta\)-依赖项从 \(\sqrt{2\log(1/\delta)}\) 压缩至 \(G^{-1}(\delta/c_\alpha)\)，从而回收了 Cramér-Chernoff 指数界中的 missing factor。Talagrand (1995) 与 Kuchibhotla (2024) 明确命名并讨论了 Hoeffding/Bennett 不等式中的 missing factor 现象。 3. 当前 frontier（渐近 e-value 的应用侧）：Chugg et al. (2026a) 将渐近 e-value 推向 post-hoc 推断（允许 \(\delta\) 数据依赖），提出了 ex-ante anchoring 与 method of mixtures 两种策略来处理数据依赖的 \(\delta\)；Wang & Ramdas (2022) 与 Xu et al. (2025) 发展了基于 e-value 的 e-BH 多重检验程序，证明了 e-value 在任意依赖结构下的 FDR 控制优势。 4. 本文的位置：本文将非渐近侧的 Bentkus 近优界“移植”到渐近 e-value 框架中，构造了 Bentkus-type 渐近 e-value，声称在固定 \(\delta\) 下消除了 missing factor，并在 post-hoc 与多重检验中展示了比指数 e-value 更紧的推断。

子线索聚类： - 线索 A：e-value 的概念与应用框架。Ramdas & Wang (2025), Wang & Ramdas (2022), Grünwald (2024), Chugg et al. (2026a) 等工作，聚焦于 e-value 的定义、optional stopping、post-hoc 推断、e-BH 多重检验。这一簇在建立 e-value 作为 p-value 替代品的合法性与应用场景。 - 线索 B：指数型 e-value 的构造与 missing factor。Ignatiadis et al. (2024), Waudby-Smith & Ramdas (2024), Catoni (2012), Howard et al. (2020, 2021) 等工作，聚焦于在有界或方差有界假设下构造指数型 e-value/置信序列，并暴露了指数型构造在无方差上界设定下的 missing factor 问题。 - 线索 C：近优集中不等式。Bentkus (2002, 2004), Pinelis (2006a, 2014b), Bentkus et al. (2006) 等工作，聚焦于用 \(\alpha\)-powered positive functions 替代指数函数，在非渐近设定下回收 missing factor，达到 \(G^{-1}(\delta/c_\alpha)\) 级别的近优性。

这个方向在追问的核心问题： 1. 在仅有有限方差（无上界）的渐近设定下，是否存在比指数型构造更紧的渐近 e-value？（本文回答：存在，且阈值可从 \(\sqrt{2\log(1/\delta)}\) 降至 \(G^{-1}(\delta/c_\alpha)\)）。 2. 渐近 e-value 在 \(\delta\) 数据依赖（post-hoc / 多重检验）时，如何选择 tuning parameter \(\lambda\)？ex-ante anchoring 与 method of mixtures 的代价是什么？（Chugg et al. (2026a) 提出问题，本文给出了 Bentkus-type 下的代价量化：mixing penalty \(\kappa\) 与 regret \(R(\delta) \le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\)）。 3. \(\alpha\)-powered positive functions 在渐近 e-value 框架下是否保持近优性？\(\alpha\) 的选择如何影响推断的稀疏/稠密权衡？（本文回答：保持近优性，但 \(\alpha=0\) 在稀疏多重检验中因二值化而失效，\(\alpha \ge 1\) 更稳健）。

⚠️ 作者的 framing： - 作者将缺口 frame 为“指数型渐近 e-value 存在 missing factor，而 Bentkus 的近优界在非渐近设定下已解决此问题，因此将 Bentkus 工具移植到渐近 e-value 是显然的下一步”。 - 被淡化或回避的竞争路线：作者未讨论基于 Edgeworth 展开或高阶渐近的 p-value 修正（这类路线可能在固定 \(\delta\) 下同样逼近 \(z_\delta\)，且不依赖 e-value 框架）；也未讨论基于 bootstrap 的渐近推断（bootstrap 在很多设定下可逼近 \(z_\delta\)，且不要求方差上界）。Intro 里缺失了这些经典渐近推断路线的对比，只对比了 CLT 阈值 \(z_\delta\) 作为“理想基准”，但未说明为何不直接用 CLT p-value 而非要构造 e-value（除了 e-value 在 post-hoc 与多重检验中的优势外，固定 \(\delta\) 下的优势并未与 CLT p-value 直接做 power 对比）。 - 明显该被引却未出现的：高阶渐近理论（如 Bhattacharya, Ghosh 等人的 Edgeworth 展开工作）、Bootstrap 推断（如 Hall, Beran 等人的工作），这些同样是解决渐近推断精度问题的经典路线。

张力：未见明显对立引用。被引工作之间更多是互补关系：线索 C（Bentkus 近优界）在非渐近设定下解决了 missing factor，线索 B（指数型 e-value）在渐近设定下暴露了 missing factor，本文将 C 的工具移植到 B 的设定中，逻辑上无矛盾。但存在一个隐含张力：Bentkus 近优界在非渐近设定下依赖于二项分布极值化（Bentkus 2004 的核心技巧），而本文在渐近设定下改用高斯分布极值化（因渐近设定下 \(Z_n \to Z\)），这一替换是否保留了近优性的全部优势？作者未明确讨论此张力。

二、这篇论文做了什么¶

三句话： ①研究了在仅有有限方差（无上界）的均值检验设定下，如何构造消除 missing factor 的渐近 e-value。 ②核心工具是 Bentkus 的 \(\alpha\)-powered positive functions（介于指示函数与指数函数之间的函数族 \(h_\alpha(u) = (1+u/\alpha)_+^\alpha\)），替代指数函数构造 e-value，并利用高斯分布的截断矩 \(I_\alpha(\lambda)\) 进行标准化。 ③主要结论是：Bentkus-type 渐近 e-value 的推断阈值下界为 \(G^{-1}(\delta/c_\alpha)\)（严格小于指数型的 \(\sqrt{2\log(1/\delta)}\)），在固定 \(\delta \le 0.1\) 时推断更紧；在 post-hoc 与多重检验中，method of mixtures 的 threshold regret 以 \(\ln(c_\alpha/\kappa)/G^{-1}(\delta)\) 为上界，随 \(\delta \to 0\) 渐近消失。

关键设定与假设： - 数据生成：\(X_1, \ldots, X_n\) i.i.d.，均值 \(EX_i = \mu\)，有限非零方差 \(\sigma^2 \in (0, \infty)\)，或更一般地，\((X_n)\) 位于高斯吸引域（domain of attraction of a Gaussian），即存在序列 \(a_n, b_n\) 使得 \(\sum_{i \le n} X_i - b_n / a_n \overset{d}{\to} N(0,1)\)。这比 Ignatiadis et al. (2024) 的有限方差假设更弱（有限方差是高斯吸引域的特例）。 - 检验问题：\(H_0: \mu \le \theta\)，无方差上界。此设定下作者声称“无已知非平凡 e-value 存在（可能根本不存在）”，因此必须依赖渐近 e-value。 - 核心定义： - 渐近 e-value：序列 \((E_n)_{n \ge 1}\) 满足 \(\limsup_{n \to \infty} E_P[E_n] \le 1\) 对所有 \(P \in \mathcal{P}\)。 - Bentkus-type e-value：\(E^\alpha_n(\theta; \lambda) = (Z_n(\theta) - \lambda)_+^\alpha / I_\alpha(\lambda)\)，其中 \(Z_n(\theta) = S_n(\theta)/V_n(\theta)\)，\(S_n(\theta) = \sum (X_i - \theta)\)，\(V_n(\theta) = (\sum (X_i - \theta)^2)^{1/2}\)，\(I_\alpha(\lambda) = E(Z - \lambda)_+^\alpha\)（\(Z \sim N(0,1)\)）。 - \(\alpha\)-powered positive functions：\(h_\alpha(u) = 1_{u \ge 0}\)（\(\alpha=0\)），\((1+u/\alpha)_+^\alpha\)（\(0 < \alpha < \infty\)），\(e^u\)（\(\alpha=\infty\)）。关键性质：\(h_\alpha(u) \le e^u\) 对所有 \(\alpha \in [0, \infty]\)，严格不等式对 \(\alpha < \infty\)。 - 假设放宽/强化：相比 Ignatiadis et al. (2024) 的有限方差假设，本文放宽至高斯吸引域（定理 4.1）；相比 Bentkus (2004) 的非渐近设定（要求有界或方差上界），本文放弃了非渐近有效性，换取了渐近设定下的无方差上界适用性。

主要结果： 1. 定理 4.1（渐近 e-value 的有效性）：在高斯吸引域假设下，\((E^\alpha_n(\theta; \lambda))_{n \ge 1}\) 是渐近 e-value。直觉：\(Z_n(\theta) \overset{d}{\to} Z\)，且 \((Z_n(\theta) - \lambda)_+^\alpha\) 一致可积（因被 \(\alpha^\alpha \exp(Z_n(\theta) - \lambda)\) 控制，而 \(\exp(Z_n(\theta))\) 一致可积），故均值收敛至 \(E(Z-\lambda)_+^\alpha / I_\alpha(\lambda) = 1\)。必要条件：高斯吸引域 + 一致可积性（后者通过 Chugg et al. (2026a) 的 Lemma C.1 保证）。 2. 定理 4.3（近优性，固定 \(\delta\)）：对任意 \(\alpha \in [0, \infty)\) 和 \(\delta \in (0,1)\)，推断阈值 \(\inf_\lambda U_{\delta,\alpha}(\lambda)\) 满足 \(G^{-1}(\delta) \le \inf_\lambda U_{\delta,\alpha}(\lambda) \le G^{-1}(\delta/c_\alpha)\)，其中 \(c_\alpha = e^\alpha \alpha^{-\alpha} \Gamma(\alpha+1)\)。特别地，\(\alpha=0\) 时 \(c_0=1\)，下界与上界重合为 \(G^{-1}(\delta)\)（精确回收 missing factor）；\(\alpha \in (0, 6.1)\) 时，\(G^{-1}(\delta/c_\alpha) < \sqrt{2\log(1/\delta)}\) 对 \(\delta \le 0.1\) 成立，即 Bentkus-type 严格优于指数型。直觉：\(\alpha\)-powered 函数比指数函数更紧，故阈值更接近 CLT 理想界；\(c_\alpha\) 是 Bentkus 界中的常数因子，\(\alpha=0\) 时无额外损失。 3. 定理 4.6（method of mixtures 的 threshold regret）：对混合 e-value \(E^\alpha_n(Z_n(\theta); \pi) = \int_\Lambda E^\alpha_n(Z_n(\theta); \lambda) \pi(\lambda) d\lambda\)（\(\pi\) 为紧区间 \(\Lambda\) 上的先验，\(\pi(\lambda) \ge \pi_{\min} > 0\)），混合阈值 \(Z_\pi(\delta)\) 满足 \(Z_\pi(\delta) \le Z_{\text{opt}}(\kappa \delta)\)（\(\kappa\) 为全局 mixing penalty，仅依赖 \(\pi, \Lambda, \alpha\)），且 regret \(R(\delta) = Z_\pi(\delta) - Z_{\text{opt}}(\delta) \le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\)。直觉：混合策略因对冲 \(\delta\) 的不确定性而付出常数级 penalty \(\kappa\)，但 regret 随 \(\delta \to 0\) 被 \(G^{-1}(\delta)\) 的增长所稀释，渐近消失。

证明路线与技术技巧： - 整体路线： 1. 构造 e-value：定义 \(E^\alpha_n(\theta; \lambda) = (Z_n(\theta) - \lambda)_+^\alpha / I_\alpha(\lambda)\)，利用 \(h_\alpha(u) \le e^u\) 保证其比指数型更紧。 2. 证明渐近有效性（定理 4.1）：\(Z_n \overset{d}{\to} Z\)（高斯吸引域）+ 连续映射定理（\(E^\alpha_n\) 对 \(Z_n\) 的映射在 \(\alpha > 0\) 时连续，\(\alpha=0\) 时在 \(Z_n \ne \lambda\) 处连续）+ 一致可积性（\((Z_n-\lambda)_+^\alpha \le \alpha^\alpha \exp(Z_n-\lambda)\)，后者一致可积）→ 均值收敛至 1。 3. 证明近优性（定理 4.3）： - 上界：定义变换存活函数 \(G_\alpha(\eta) = \inf_{\lambda < \eta} I_\alpha(\lambda)/(\eta-\lambda)^\alpha\)，引用 Bentkus et al. (2006, Lemma 1.1) 得 \(G_\alpha(\eta) \le c_\alpha G(\eta)\)（高斯分布的对数凹性保证 \(G = G_o\)），在 \(\eta^* = G^{-1}(\delta/c_\alpha)\) 处取值得 \(G_\alpha(\eta^*) \le \delta\)，由 infimum 定义推出 \(\inf_\lambda U_{\delta,\alpha}(\lambda) \le \eta^*\)。 - 下界：若 \(\inf_\lambda U_{\delta,\alpha}(\lambda) < G^{-1}(\delta)\)，则在 \(Z_n \sim N(0,1)\) 时（有限样本精确 e-value），Markov 不等式保证 \(P(E^\alpha_n \ge 1/\delta) \le \delta\)，但 \(P(Z_n \ge \inf_\lambda U_{\delta,\alpha}(\lambda)) > P(Z \ge G^{-1}(\delta)) = \delta\)，矛盾。 4. 证明混合 regret（定理 4.6）： - 建立 oracle 阈值与 e-value 上包络 \(M(z) = \max_{s \in \Lambda} E^\alpha_n(z; s)\) 的对偶性：\(M(Z_{\text{opt}}(\delta)) = 1/\delta\)。 - 证明混合 e-value 被上包络控制：\(E^\alpha_n(z; \pi) \le M(z)\)，且在 \(z \ge z_0 = Z_{\text{opt}}(1)\) 时，混合与包络的比值 \(H(z) = E^\alpha_n(z; \pi)/M(z)\) 有严格正下界 \(\kappa = \min_{z \ge z_0} H(z) > 0\)（因 \(\pi(\lambda) \ge \pi_{\min}\) 且 \(H(z) \to \kappa_\infty > 0\) 当 \(z \to \infty\)）。 - 由 \(M(Z_\pi(\delta)) \le 1/(\kappa \delta)\) 与对偶性得 \(Z_\pi(\delta) \le Z_{\text{opt}}(\kappa \delta)\)。 - Regret 上界：\(Z_{\text{opt}}(\kappa \delta) - Z_{\text{opt}}(\delta) \le G^{-1}(\kappa \delta/c_\alpha) - G^{-1}(\delta)\)，利用 Mills 比率界 \(\phi(t) > tG(t)\) 积分得 \(\le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\)。

关键跳跃点：
一致可积性的建立：从 \(h_\alpha(u) \le e^u\) 出发，将 \((Z_n-\lambda)_+^\alpha\) 控制在 \(\alpha^\alpha \exp(Z_n-\lambda)\)，然后引用 Chugg et al. (2026a) 的 Lemma C.1 证明 \(\exp(Z_n(\theta))\) 一致可积。这是定理 4.1 的核心难点，因为 \(\alpha\)-powered 函数的期望控制比指数函数更复杂（指数函数的矩生成函数天然存在，\(\alpha\)-powered 函数没有）。
近优上界的推导：从 Bentkus et al. (2006) 的 \(G_\alpha(\eta) \le c_\alpha G(\eta)\) 出发，需要在 \(\eta^* = G^{-1}(\delta/c_\alpha)\) 处取值，并利用 infimum 定义将 \(G_\alpha\) 的界转化为 \(U_{\delta,\alpha}\) 的界。这里的跳跃是：\(G_\alpha\) 是变换存活函数的 infimum，而 \(U_{\delta,\alpha}\) 是 e-value 阈值函数，两者的联系通过 \(E^\alpha_n(\theta; \lambda_\eta) = f_{\lambda_\eta, \eta, \alpha}(Z_n(\theta))/E f_{\lambda_\eta, \eta, \alpha}(Z)\) 建立（式 4.1 与 3.2 的连接），但最终 \(E^\alpha_n\) 不依赖 \(\eta\)（分母消去），简化为截断矩比值。
技术技巧点名：
\(\alpha\)-powered positive functions / Bentkus 近优界：用于替代指数函数，构造更紧的 e-value，核心在 \(h_\alpha(u) \le e^u\) 与 \(G_\alpha(\eta) \le c_\alpha G(\eta)\)。
一致可积性 + 连续映射定理：用于证明渐近 e-value 的均值收敛（定理 4.1），关键在用指数函数控制 \(\alpha\)-powered 函数的矩。
高斯分布的对数凹性：用于近优上界（定理 4.3），保证 \(G = G_o\)（log-concave hull），使得 Bentkus et al. (2006) 的界 \(G_\alpha \le c_\alpha G_o\) 简化为 \(G_\alpha \le c_\alpha G\)。
Mills 比率界 \(\phi(t) > tG(t)\)：用于混合 regret 的积分上界（定理 4.6），将 \(G^{-1}\) 的差分转化为对数比率。
Minkowski 不等式 + L\(\alpha\)-范数凸性：用于证明 ex-ante 阈值函数 \(U_{\delta,\alpha}(\lambda)\) 的凸性（命题 4.5），保证 \(\lambda\) 的优化可通过凸优化精确求解。
抛物柱面函数：用于 \(I_\alpha(\lambda)\) 的闭式表达（Lemma B.2），当 \(\alpha\) 为整数时退化为 \(\phi\) 与 \(G\) 的递推（Lemma 4.2）。

真实例子与应用： 1. Post-hoc 推断（表 2）： - 场景：观测统计量 \(Z \in \{2.1, 2.4, 2.7, 3.0\}\)，比较 Bentkus-type（\(\alpha=0,1,2\)）与指数型（\(\alpha=\infty\)）混合 e-value 的 post-hoc level \(\delta = 1/E(Z; \pi)\)。 - 方法：对每类 e-value，构造均匀混合 over 3 个 \(\lambda\)（分别优化 \(\delta \in \{0.1, 0.05, 0.01\}\)），计算 \(E(Z; \pi)\) 与 \(\delta\)。 - 结果：\(\alpha=1,2\) 的混合在所有 \(Z\) 值上产生更小的 \(\delta\)（更紧推断），例如 \(Z=2.1\) 时指数型 \(\delta=0.128\)（无法拒绝 \(H_0\) at level 0.1），而 \(\alpha=1\) 得 \(\delta=0.077\)（可拒绝）；\(Z=3.0\) 时 \(\alpha=2\) 得 \(\delta=0.009\)（跨过 0.01 阈值），指数型得 \(\delta=0.013\)（未跨过）。 - 说明什么：验证理论声称的“Bentkus-type 在常用 \(\delta\) 范围内更紧”，展示混合策略在 post-hoc 设定下的实用优势。

多重检验（表 3）：
场景：\(K=100\) 假设，FDR 目标 \(\delta^* = 0.1\)，非零假设比例 \(p \in \{0.01, 0.025, 0.05, 0.075, 0.1\}\)，零统计量 \(N(0,1)\)，非零统计量 \(N(3.5, 1)\)。
方法：对每类 e-value，构造均匀混合 over 10 个 \(\lambda\)（网格优化 for \(\delta \in [\delta^*/K, \rho \delta^*] = [0.001, 0.02]\)，\(\rho=0.2\)），应用 e-BH 程序，记录拒绝数。
结果：\(\alpha=1,2\) 在所有非零比例下均匀优于 \(\alpha=\infty\)（拒绝数更多）；\(\alpha=0\) 在稀疏比例（1%, 2.5%）下拒绝数为 0（因二值化无法排序），在稠密比例（7.5%, 10%）下优于所有其他 \(\alpha\)。
说明什么：验证 \(\alpha\) 的稀疏/稠密权衡（Remark 4.4），展示 Bentkus-type 在多重检验中的 power 优势，同时暴露 \(\alpha=0\) 的实际局限。

🔎 结论是否比证明窄： - 定理 4.3 的近优性声明“\(G^{-1}(\delta/c_\alpha) < \zeta_\delta\) for \(\delta < \tau(\alpha)\)”中，\(\tau(\alpha)\) 的定义涉及 Mills 比率的逆 \(M^{-1}(c_\alpha/\sqrt{2\pi})\)，作者仅计算了 \(\tau(6.1) \approx 0.1\)，但未给出 \(\tau(\alpha)\) 的显式表达或一般单调性分析。声称“Bentkus-type e-values with \(\alpha \in [0, 6.1)\) deliver better inference for fixed \(\delta \le 0.1\)”是基于 \(\tau(6.1)\) 的近似值，而非严格证明 \(\tau(\alpha)\) 对所有 \(\alpha < 6.1\) 都 \(\ge 0.1\)（虽然从 \(c_\alpha\) 的单调性可推测，但文中未证）。 - 定理 4.6 的混合 regret 上界 \(\ln(c_\alpha/\kappa)/G^{-1}(\delta)\) 依赖于 \(\kappa\) 的存在性（\(\pi(\lambda) \ge \pi_{\min} > 0\) 保证），但 \(\kappa\) 的具体值依赖 \(\pi, \Lambda, \alpha\)，文中未给出计算 \(\kappa\) 的方法或下界，仅证明其严格正。实际应用中 \(\kappa\) 可能很小，导致 regret 上界宽松。 - 引言中声称“no powerful e-value is known for the prominent case of random variables with no a priori known upper bound on the variance”且“it is likely that none exist”，这是推测而非证明，文中未给出不存在非渐近 e-value 的严格论证。

三、开放问题¶

非渐近 e-value 的不可能性：引言声称“无方差上界时可能不存在非平凡非渐近 e-value”，但未证明。要证：在仅有 \(EX_i = \theta, \sigma^2 \in (0, \infty)\) 的假设下，是否存在任何非负统计量 \(E_n\) 满足 \(E_\theta[E_n] \le 1\) 且在 \(\mu > \theta\) 时 \(E_\mu[E_n] \to \infty\)？扎根在引言第 2 段“there is no known nontrivial e-value (and it is likely that none exist) for null hypothesis (1.1)”。
\(\tau(\alpha)\) 的显式表达与单调性：定理 4.3 给出 \(\tau(\alpha) = \exp(-\frac{1}{2}[M^{-1}(c_\alpha/\sqrt{2\pi})]^2)\)，但未分析 \(\tau(\alpha)\) 作为 \(\alpha\) 的函数的性质。要估：\(\tau(\alpha)\) 是否单调递减？\(\tau(\alpha) \ge 0.1\) 的 \(\alpha\) 范围是否确切为 \([0, 6.1)\)？扎根在定理 4.3 后的段落“Observe that \(\tau(6.1) \approx 0.1\)”。
混合 penalty \(\kappa\) 的量化：定理 4.6 证明 \(\kappa > 0\) 存在，但未给出计算方法或下界。要算：对具体 \(\pi\)（如均匀分布）与 \(\Lambda\)，\(\kappa\) 的值或下界是什么？扎根在定理 4.6 的陈述“\(\kappa \in (0,1)\) is a strictly positive constant depending only on \(\pi, \Lambda\), and \(\alpha\)”。
与 CLT p-value 的直接 power 对比：本文只对比了 e-value 之间的阈值宽度，未对比 Bentkus-type e-value 与经典 CLT p-value（\(z_\delta\) 阈值）在固定 \(\delta\) 下的 power。要估：在有限样本下，Bentkus-type e-value 的 power 是否逼近 CLT p-value？差距多大？扎根在引言对 missing factor 的讨论（仅对比阈值，未对比 power）。

四、最核心、最简单的例子 / 数学问题¶

最简特例：\(\alpha = 0\)（指示函数情形）

当 \(\alpha = 0\) 时，\(\alpha\)-powered positive function 退化为指示函数 \(h_0(u) = 1_{u \ge 0}\)，Bentkus-type e-value 退化为：

\[E^0_n(\theta; \lambda) = \frac{(Z_n(\theta) - \lambda)_+^0}{I_0(\lambda)} = \frac{1_{Z_n(\theta) \ge \lambda}}{G(\lambda)}\]

其中 \(I_0(\lambda) = G(\lambda)\) 是标准高斯的存活函数。

要证的命题：\((E^0_n(\theta; \lambda))_{n \ge 1}\) 是渐近 e-value，且推断阈值 \(\inf_\lambda U_{\delta,0}(\lambda) = G^{-1}(\delta)\)（精确回收 missing factor）。

证明怎么走： 1. 渐近有效性：\(Z_n(\theta) \overset{d}{\to} Z\)（高斯吸引域）。\(E^0_n\) 对 \(Z_n\) 的映射在 \(Z_n \ne \lambda\) 处连续（指示函数在跳点 \(\lambda\) 处不连续，但 \(P(Z = \lambda) = 0\)，故连续映射定理仍适用），故 \(E^0_n \overset{d}{\to} 1_{Z \ge \lambda}/G(\lambda)\)。一致可积性：\(1_{Z_n \ge \lambda} \le \exp(Z_n - \lambda)\)（因 \(Z_n \ge \lambda\) 时 \(1 \le e^{Z_n - \lambda}\)），\(\exp(Z_n)\) 一致可积，故 \(E^0_n\) 一致可积。均值收敛至 \(E[1_{Z \ge \lambda}]/G(\lambda) = G(\lambda)/G(\lambda) = 1\)。 2. 近优性：阈值条件 \(E^0_n \ge 1/\delta\) 即 \(1_{Z_n \ge \lambda}/G(\lambda) \ge 1/\delta\)，要求 \(Z_n \ge \lambda\) 且 \(G(\lambda) \le \delta\)。故 \(\lambda \ge G^{-1}(\delta)\)，最小阈值为 \(\inf_\lambda U_{\delta,0}(\lambda) = G^{-1}(\delta)\)。下界 \(G^{-1}(\delta)\) 由 Markov 不等式保证（若 \(\inf_\lambda U_{\delta,0} < G^{-1}(\delta)\)，则 \(P(Z \ge \inf_\lambda U_{\delta,0}) > \delta\)，矛盾），上界 \(G^{-1}(\delta/c_0) = G^{-1}(\delta/1) = G^{-1}(\delta)\)，上下界重合。

为什么成立：\(\alpha=0\) 时，e-value 是二值的（要么 \(1/G(\lambda)\)，要么 0），其阈值逻辑与 CLT p-value 完全一致（\(Z_n \ge G^{-1}(\delta)\) 即拒绝），故精确回收 missing factor。代价是丧失了对 \(Z_n\) 的连续排序能力（Remark 4.4），在多重检验的稀疏设定下因无法区分信号强度而失效。

一般情形的“加壳”：\(\alpha > 0\) 时，\(h_\alpha(u) = (1+u/\alpha)_+^\alpha\) 是指示函数与指数函数之间的光滑插值，e-value 变为 \((Z_n - \lambda)_+^\alpha / I_\alpha(\lambda)\)，保留了连续排序能力（\(\alpha \ge 1\) 时 \(U_{\delta,\alpha}\) 凸且光滑），但引入常数因子 \(c_\alpha > 1\)，使得上界为 \(G^{-1}(\delta/c_\alpha)\) 而非精确的 \(G^{-1}(\delta)\)。证明的核心结构（一致可积性 + 连续映射 + Bentkus 界）在 \(\alpha=0\) 时已完整呈现，\(\alpha > 0\) 只是增加了 \(I_\alpha\) 的计算复杂度与 \(c_\alpha\) 的常数损失。

Maintained by 陈星宇 · Homepage · Source on GitHub

Bentkus-type asymptotic e-values¶

一、领域脉络与小综述¶

二、这篇论文做了什么¶

三、开放问题¶

四、最核心、最简单的例子 / 数学问题¶

评论