Bentkus-type asymptotic e-values¶
作者: Diego Martinez-Taboada, Ben Chugg, Aaditya Ramdas
主题: 数理统计 / 假设检验
相关性: 7/10
链接: https://arxiv.org/abs/2606.06332
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本问题是:在无方差上界假设(仅有有限非零方差)的均值检验设定下,如何构造既保持渐近有效性(asymptotic e-value),又在推断阈值上逼近经典 CLT 理想界(\(z_\delta = G^{-1}(\delta)\))的检验统计量。当前该方向处于“概念框架已确立(渐近 e-value 被定义),但首批构造法存在常数级效率损失(missing factor)”的阶段,本文试图用非渐近集中不等式里的近优工具填补这一效率缺口。
发展脉络: 1. 奠基工作:Ramdas & Wang (2025) 系统化了 e-value 理论,确立了 e-value 在 optional stopping、任意依赖下的合并、以及不规则问题中的必要性。Ignatiadis et al. (2024) 首次定义了渐近 e-value(满足 \(\limsup EP[E_n] \le 1\)),并提出了基于指数函数的构造 \(E^\infty_n(\theta;\lambda) = \exp(\lambda Z_n(\theta) - \lambda^2/2)\),但留下了一个口子:该构造的推断阈值下界为 \(\sqrt{2\log(1/\delta)}\),与 CLT 阈值 \(z_\delta\) 之间存在一个被称为“missing factor”的缩放间隙。 2. 主要进展(非渐近集中不等式侧):Bentkus (2002, 2004) 与 Pinelis (2006a, 2014b) 在非渐近设定下发展了基于 \(\alpha\)-powered positive functions 的近优集中不等式,证明了这类界可以将尾部概率的 \(\delta\)-依赖项从 \(\sqrt{2\log(1/\delta)}\) 压缩至 \(G^{-1}(\delta/c_\alpha)\),从而回收了 Cramér-Chernoff 指数界中的 missing factor。Talagrand (1995) 与 Kuchibhotla (2024) 明确命名并讨论了 Hoeffding/Bennett 不等式中的 missing factor 现象。 3. 当前 frontier(渐近 e-value 的应用侧):Chugg et al. (2026a) 将渐近 e-value 推向 post-hoc 推断(允许 \(\delta\) 数据依赖),提出了 ex-ante anchoring 与 method of mixtures 两种策略来处理数据依赖的 \(\delta\);Wang & Ramdas (2022) 与 Xu et al. (2025) 发展了基于 e-value 的 e-BH 多重检验程序,证明了 e-value 在任意依赖结构下的 FDR 控制优势。 4. 本文的位置:本文将非渐近侧的 Bentkus 近优界“移植”到渐近 e-value 框架中,构造了 Bentkus-type 渐近 e-value,声称在固定 \(\delta\) 下消除了 missing factor,并在 post-hoc 与多重检验中展示了比指数 e-value 更紧的推断。
子线索聚类: - 线索 A:e-value 的概念与应用框架。Ramdas & Wang (2025), Wang & Ramdas (2022), Grünwald (2024), Chugg et al. (2026a) 等工作,聚焦于 e-value 的定义、optional stopping、post-hoc 推断、e-BH 多重检验。这一簇在建立 e-value 作为 p-value 替代品的合法性与应用场景。 - 线索 B:指数型 e-value 的构造与 missing factor。Ignatiadis et al. (2024), Waudby-Smith & Ramdas (2024), Catoni (2012), Howard et al. (2020, 2021) 等工作,聚焦于在有界或方差有界假设下构造指数型 e-value/置信序列,并暴露了指数型构造在无方差上界设定下的 missing factor 问题。 - 线索 C:近优集中不等式。Bentkus (2002, 2004), Pinelis (2006a, 2014b), Bentkus et al. (2006) 等工作,聚焦于用 \(\alpha\)-powered positive functions 替代指数函数,在非渐近设定下回收 missing factor,达到 \(G^{-1}(\delta/c_\alpha)\) 级别的近优性。
这个方向在追问的核心问题: 1. 在仅有有限方差(无上界)的渐近设定下,是否存在比指数型构造更紧的渐近 e-value?(本文回答:存在,且阈值可从 \(\sqrt{2\log(1/\delta)}\) 降至 \(G^{-1}(\delta/c_\alpha)\))。 2. 渐近 e-value 在 \(\delta\) 数据依赖(post-hoc / 多重检验)时,如何选择 tuning parameter \(\lambda\)?ex-ante anchoring 与 method of mixtures 的代价是什么?(Chugg et al. (2026a) 提出问题,本文给出了 Bentkus-type 下的代价量化:mixing penalty \(\kappa\) 与 regret \(R(\delta) \le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\))。 3. \(\alpha\)-powered positive functions 在渐近 e-value 框架下是否保持近优性?\(\alpha\) 的选择如何影响推断的稀疏/稠密权衡?(本文回答:保持近优性,但 \(\alpha=0\) 在稀疏多重检验中因二值化而失效,\(\alpha \ge 1\) 更稳健)。
⚠️ 作者的 framing: - 作者将缺口 frame 为“指数型渐近 e-value 存在 missing factor,而 Bentkus 的近优界在非渐近设定下已解决此问题,因此将 Bentkus 工具移植到渐近 e-value 是显然的下一步”。 - 被淡化或回避的竞争路线:作者未讨论基于 Edgeworth 展开或高阶渐近的 p-value 修正(这类路线可能在固定 \(\delta\) 下同样逼近 \(z_\delta\),且不依赖 e-value 框架);也未讨论基于 bootstrap 的渐近推断(bootstrap 在很多设定下可逼近 \(z_\delta\),且不要求方差上界)。Intro 里缺失了这些经典渐近推断路线的对比,只对比了 CLT 阈值 \(z_\delta\) 作为“理想基准”,但未说明为何不直接用 CLT p-value 而非要构造 e-value(除了 e-value 在 post-hoc 与多重检验中的优势外,固定 \(\delta\) 下的优势并未与 CLT p-value 直接做 power 对比)。 - 明显该被引却未出现的:高阶渐近理论(如 Bhattacharya, Ghosh 等人的 Edgeworth 展开工作)、Bootstrap 推断(如 Hall, Beran 等人的工作),这些同样是解决渐近推断精度问题的经典路线。
张力: 未见明显对立引用。被引工作之间更多是互补关系:线索 C(Bentkus 近优界)在非渐近设定下解决了 missing factor,线索 B(指数型 e-value)在渐近设定下暴露了 missing factor,本文将 C 的工具移植到 B 的设定中,逻辑上无矛盾。但存在一个隐含张力:Bentkus 近优界在非渐近设定下依赖于二项分布极值化(Bentkus 2004 的核心技巧),而本文在渐近设定下改用高斯分布极值化(因渐近设定下 \(Z_n \to Z\)),这一替换是否保留了近优性的全部优势?作者未明确讨论此张力。
二、这篇论文做了什么¶
三句话: ①研究了在仅有有限方差(无上界)的均值检验设定下,如何构造消除 missing factor 的渐近 e-value。 ②核心工具是 Bentkus 的 \(\alpha\)-powered positive functions(介于指示函数与指数函数之间的函数族 \(h_\alpha(u) = (1+u/\alpha)_+^\alpha\)),替代指数函数构造 e-value,并利用高斯分布的截断矩 \(I_\alpha(\lambda)\) 进行标准化。 ③主要结论是:Bentkus-type 渐近 e-value 的推断阈值下界为 \(G^{-1}(\delta/c_\alpha)\)(严格小于指数型的 \(\sqrt{2\log(1/\delta)}\)),在固定 \(\delta \le 0.1\) 时推断更紧;在 post-hoc 与多重检验中,method of mixtures 的 threshold regret 以 \(\ln(c_\alpha/\kappa)/G^{-1}(\delta)\) 为上界,随 \(\delta \to 0\) 渐近消失。
关键设定与假设: - 数据生成:\(X_1, \ldots, X_n\) i.i.d.,均值 \(EX_i = \mu\),有限非零方差 \(\sigma^2 \in (0, \infty)\),或更一般地,\((X_n)\) 位于高斯吸引域(domain of attraction of a Gaussian),即存在序列 \(a_n, b_n\) 使得 \(\sum_{i \le n} X_i - b_n / a_n \overset{d}{\to} N(0,1)\)。这比 Ignatiadis et al. (2024) 的有限方差假设更弱(有限方差是高斯吸引域的特例)。 - 检验问题:\(H_0: \mu \le \theta\),无方差上界。此设定下作者声称“无已知非平凡 e-value 存在(可能根本不存在)”,因此必须依赖渐近 e-value。 - 核心定义: - 渐近 e-value:序列 \((E_n)_{n \ge 1}\) 满足 \(\limsup_{n \to \infty} E_P[E_n] \le 1\) 对所有 \(P \in \mathcal{P}\)。 - Bentkus-type e-value:\(E^\alpha_n(\theta; \lambda) = (Z_n(\theta) - \lambda)_+^\alpha / I_\alpha(\lambda)\),其中 \(Z_n(\theta) = S_n(\theta)/V_n(\theta)\),\(S_n(\theta) = \sum (X_i - \theta)\),\(V_n(\theta) = (\sum (X_i - \theta)^2)^{1/2}\),\(I_\alpha(\lambda) = E(Z - \lambda)_+^\alpha\)(\(Z \sim N(0,1)\))。 - \(\alpha\)-powered positive functions:\(h_\alpha(u) = 1_{u \ge 0}\)(\(\alpha=0\)),\((1+u/\alpha)_+^\alpha\)(\(0 < \alpha < \infty\)),\(e^u\)(\(\alpha=\infty\))。关键性质:\(h_\alpha(u) \le e^u\) 对所有 \(\alpha \in [0, \infty]\),严格不等式对 \(\alpha < \infty\)。 - 假设放宽/强化:相比 Ignatiadis et al. (2024) 的有限方差假设,本文放宽至高斯吸引域(定理 4.1);相比 Bentkus (2004) 的非渐近设定(要求有界或方差上界),本文放弃了非渐近有效性,换取了渐近设定下的无方差上界适用性。
主要结果: 1. 定理 4.1(渐近 e-value 的有效性):在高斯吸引域假设下,\((E^\alpha_n(\theta; \lambda))_{n \ge 1}\) 是渐近 e-value。直觉:\(Z_n(\theta) \overset{d}{\to} Z\),且 \((Z_n(\theta) - \lambda)_+^\alpha\) 一致可积(因被 \(\alpha^\alpha \exp(Z_n(\theta) - \lambda)\) 控制,而 \(\exp(Z_n(\theta))\) 一致可积),故均值收敛至 \(E(Z-\lambda)_+^\alpha / I_\alpha(\lambda) = 1\)。必要条件:高斯吸引域 + 一致可积性(后者通过 Chugg et al. (2026a) 的 Lemma C.1 保证)。 2. 定理 4.3(近优性,固定 \(\delta\)):对任意 \(\alpha \in [0, \infty)\) 和 \(\delta \in (0,1)\),推断阈值 \(\inf_\lambda U_{\delta,\alpha}(\lambda)\) 满足 \(G^{-1}(\delta) \le \inf_\lambda U_{\delta,\alpha}(\lambda) \le G^{-1}(\delta/c_\alpha)\),其中 \(c_\alpha = e^\alpha \alpha^{-\alpha} \Gamma(\alpha+1)\)。特别地,\(\alpha=0\) 时 \(c_0=1\),下界与上界重合为 \(G^{-1}(\delta)\)(精确回收 missing factor);\(\alpha \in (0, 6.1)\) 时,\(G^{-1}(\delta/c_\alpha) < \sqrt{2\log(1/\delta)}\) 对 \(\delta \le 0.1\) 成立,即 Bentkus-type 严格优于指数型。直觉:\(\alpha\)-powered 函数比指数函数更紧,故阈值更接近 CLT 理想界;\(c_\alpha\) 是 Bentkus 界中的常数因子,\(\alpha=0\) 时无额外损失。 3. 定理 4.6(method of mixtures 的 threshold regret):对混合 e-value \(E^\alpha_n(Z_n(\theta); \pi) = \int_\Lambda E^\alpha_n(Z_n(\theta); \lambda) \pi(\lambda) d\lambda\)(\(\pi\) 为紧区间 \(\Lambda\) 上的先验,\(\pi(\lambda) \ge \pi_{\min} > 0\)),混合阈值 \(Z_\pi(\delta)\) 满足 \(Z_\pi(\delta) \le Z_{\text{opt}}(\kappa \delta)\)(\(\kappa\) 为全局 mixing penalty,仅依赖 \(\pi, \Lambda, \alpha\)),且 regret \(R(\delta) = Z_\pi(\delta) - Z_{\text{opt}}(\delta) \le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\)。直觉:混合策略因对冲 \(\delta\) 的不确定性而付出常数级 penalty \(\kappa\),但 regret 随 \(\delta \to 0\) 被 \(G^{-1}(\delta)\) 的增长所稀释,渐近消失。
证明路线与技术技巧: - 整体路线: 1. 构造 e-value:定义 \(E^\alpha_n(\theta; \lambda) = (Z_n(\theta) - \lambda)_+^\alpha / I_\alpha(\lambda)\),利用 \(h_\alpha(u) \le e^u\) 保证其比指数型更紧。 2. 证明渐近有效性(定理 4.1):\(Z_n \overset{d}{\to} Z\)(高斯吸引域)+ 连续映射定理(\(E^\alpha_n\) 对 \(Z_n\) 的映射在 \(\alpha > 0\) 时连续,\(\alpha=0\) 时在 \(Z_n \ne \lambda\) 处连续)+ 一致可积性(\((Z_n-\lambda)_+^\alpha \le \alpha^\alpha \exp(Z_n-\lambda)\),后者一致可积)→ 均值收敛至 1。 3. 证明近优性(定理 4.3): - 上界:定义变换存活函数 \(G_\alpha(\eta) = \inf_{\lambda < \eta} I_\alpha(\lambda)/(\eta-\lambda)^\alpha\),引用 Bentkus et al. (2006, Lemma 1.1) 得 \(G_\alpha(\eta) \le c_\alpha G(\eta)\)(高斯分布的对数凹性保证 \(G = G_o\)),在 \(\eta^* = G^{-1}(\delta/c_\alpha)\) 处取值得 \(G_\alpha(\eta^*) \le \delta\),由 infimum 定义推出 \(\inf_\lambda U_{\delta,\alpha}(\lambda) \le \eta^*\)。 - 下界:若 \(\inf_\lambda U_{\delta,\alpha}(\lambda) < G^{-1}(\delta)\),则在 \(Z_n \sim N(0,1)\) 时(有限样本精确 e-value),Markov 不等式保证 \(P(E^\alpha_n \ge 1/\delta) \le \delta\),但 \(P(Z_n \ge \inf_\lambda U_{\delta,\alpha}(\lambda)) > P(Z \ge G^{-1}(\delta)) = \delta\),矛盾。 4. 证明混合 regret(定理 4.6): - 建立 oracle 阈值与 e-value 上包络 \(M(z) = \max_{s \in \Lambda} E^\alpha_n(z; s)\) 的对偶性:\(M(Z_{\text{opt}}(\delta)) = 1/\delta\)。 - 证明混合 e-value 被上包络控制:\(E^\alpha_n(z; \pi) \le M(z)\),且在 \(z \ge z_0 = Z_{\text{opt}}(1)\) 时,混合与包络的比值 \(H(z) = E^\alpha_n(z; \pi)/M(z)\) 有严格正下界 \(\kappa = \min_{z \ge z_0} H(z) > 0\)(因 \(\pi(\lambda) \ge \pi_{\min}\) 且 \(H(z) \to \kappa_\infty > 0\) 当 \(z \to \infty\))。 - 由 \(M(Z_\pi(\delta)) \le 1/(\kappa \delta)\) 与对偶性得 \(Z_\pi(\delta) \le Z_{\text{opt}}(\kappa \delta)\)。 - Regret 上界:\(Z_{\text{opt}}(\kappa \delta) - Z_{\text{opt}}(\delta) \le G^{-1}(\kappa \delta/c_\alpha) - G^{-1}(\delta)\),利用 Mills 比率界 \(\phi(t) > tG(t)\) 积分得 \(\le \ln(c_\alpha/\kappa)/G^{-1}(\delta)\)。
- 关键跳跃点:
- 一致可积性的建立:从 \(h_\alpha(u) \le e^u\) 出发,将 \((Z_n-\lambda)_+^\alpha\) 控制在 \(\alpha^\alpha \exp(Z_n-\lambda)\),然后引用 Chugg et al. (2026a) 的 Lemma C.1 证明 \(\exp(Z_n(\theta))\) 一致可积。这是定理 4.1 的核心难点,因为 \(\alpha\)-powered 函数的期望控制比指数函数更复杂(指数函数的矩生成函数天然存在,\(\alpha\)-powered 函数没有)。
-
近优上界的推导:从 Bentkus et al. (2006) 的 \(G_\alpha(\eta) \le c_\alpha G(\eta)\) 出发,需要在 \(\eta^* = G^{-1}(\delta/c_\alpha)\) 处取值,并利用 infimum 定义将 \(G_\alpha\) 的界转化为 \(U_{\delta,\alpha}\) 的界。这里的跳跃是:\(G_\alpha\) 是变换存活函数的 infimum,而 \(U_{\delta,\alpha}\) 是 e-value 阈值函数,两者的联系通过 \(E^\alpha_n(\theta; \lambda_\eta) = f_{\lambda_\eta, \eta, \alpha}(Z_n(\theta))/E f_{\lambda_\eta, \eta, \alpha}(Z)\) 建立(式 4.1 与 3.2 的连接),但最终 \(E^\alpha_n\) 不依赖 \(\eta\)(分母消去),简化为截断矩比值。
-
技术技巧点名:
- \(\alpha\)-powered positive functions / Bentkus 近优界:用于替代指数函数,构造更紧的 e-value,核心在 \(h_\alpha(u) \le e^u\) 与 \(G_\alpha(\eta) \le c_\alpha G(\eta)\)。
- 一致可积性 + 连续映射定理:用于证明渐近 e-value 的均值收敛(定理 4.1),关键在用指数函数控制 \(\alpha\)-powered 函数的矩。
- 高斯分布的对数凹性:用于近优上界(定理 4.3),保证 \(G = G_o\)(log-concave hull),使得 Bentkus et al. (2006) 的界 \(G_\alpha \le c_\alpha G_o\) 简化为 \(G_\alpha \le c_\alpha G\)。
- Mills 比率界 \(\phi(t) > tG(t)\):用于混合 regret 的积分上界(定理 4.6),将 \(G^{-1}\) 的差分转化为对数比率。
- Minkowski 不等式 + L\(\alpha\)-范数凸性:用于证明 ex-ante 阈值函数 \(U_{\delta,\alpha}(\lambda)\) 的凸性(命题 4.5),保证 \(\lambda\) 的优化可通过凸优化精确求解。
- 抛物柱面函数:用于 \(I_\alpha(\lambda)\) 的闭式表达(Lemma B.2),当 \(\alpha\) 为整数时退化为 \(\phi\) 与 \(G\) 的递推(Lemma 4.2)。
真实例子与应用: 1. Post-hoc 推断(表 2): - 场景:观测统计量 \(Z \in \{2.1, 2.4, 2.7, 3.0\}\),比较 Bentkus-type(\(\alpha=0,1,2\))与指数型(\(\alpha=\infty\))混合 e-value 的 post-hoc level \(\delta = 1/E(Z; \pi)\)。 - 方法:对每类 e-value,构造均匀混合 over 3 个 \(\lambda\)(分别优化 \(\delta \in \{0.1, 0.05, 0.01\}\)),计算 \(E(Z; \pi)\) 与 \(\delta\)。 - 结果:\(\alpha=1,2\) 的混合在所有 \(Z\) 值上产生更小的 \(\delta\)(更紧推断),例如 \(Z=2.1\) 时指数型 \(\delta=0.128\)(无法拒绝 \(H_0\) at level 0.1),而 \(\alpha=1\) 得 \(\delta=0.077\)(可拒绝);\(Z=3.0\) 时 \(\alpha=2\) 得 \(\delta=0.009\)(跨过 0.01 阈值),指数型得 \(\delta=0.013\)(未跨过)。 - 说明什么:验证理论声称的“Bentkus-type 在常用 \(\delta\) 范围内更紧”,展示混合策略在 post-hoc 设定下的实用优势。
- 多重检验(表 3):
- 场景:\(K=100\) 假设,FDR 目标 \(\delta^* = 0.1\),非零假设比例 \(p \in \{0.01, 0.025, 0.05, 0.075, 0.1\}\),零统计量 \(N(0,1)\),非零统计量 \(N(3.5, 1)\)。
- 方法:对每类 e-value,构造均匀混合 over 10 个 \(\lambda\)(网格优化 for \(\delta \in [\delta^*/K, \rho \delta^*] = [0.001, 0.02]\),\(\rho=0.2\)),应用 e-BH 程序,记录拒绝数。
- 结果:\(\alpha=1,2\) 在所有非零比例下均匀优于 \(\alpha=\infty\)(拒绝数更多);\(\alpha=0\) 在稀疏比例(1%, 2.5%)下拒绝数为 0(因二值化无法排序),在稠密比例(7.5%, 10%)下优于所有其他 \(\alpha\)。
- 说明什么:验证 \(\alpha\) 的稀疏/稠密权衡(Remark 4.4),展示 Bentkus-type 在多重检验中的 power 优势,同时暴露 \(\alpha=0\) 的实际局限。
🔎 结论是否比证明窄: - 定理 4.3 的近优性声明“\(G^{-1}(\delta/c_\alpha) < \zeta_\delta\) for \(\delta < \tau(\alpha)\)”中,\(\tau(\alpha)\) 的定义涉及 Mills 比率的逆 \(M^{-1}(c_\alpha/\sqrt{2\pi})\),作者仅计算了 \(\tau(6.1) \approx 0.1\),但未给出 \(\tau(\alpha)\) 的显式表达或一般单调性分析。声称“Bentkus-type e-values with \(\alpha \in [0, 6.1)\) deliver better inference for fixed \(\delta \le 0.1\)”是基于 \(\tau(6.1)\) 的近似值,而非严格证明 \(\tau(\alpha)\) 对所有 \(\alpha < 6.1\) 都 \(\ge 0.1\)(虽然从 \(c_\alpha\) 的单调性可推测,但文中未证)。 - 定理 4.6 的混合 regret 上界 \(\ln(c_\alpha/\kappa)/G^{-1}(\delta)\) 依赖于 \(\kappa\) 的存在性(\(\pi(\lambda) \ge \pi_{\min} > 0\) 保证),但 \(\kappa\) 的具体值依赖 \(\pi, \Lambda, \alpha\),文中未给出计算 \(\kappa\) 的方法或下界,仅证明其严格正。实际应用中 \(\kappa\) 可能很小,导致 regret 上界宽松。 - 引言中声称“no powerful e-value is known for the prominent case of random variables with no a priori known upper bound on the variance”且“it is likely that none exist”,这是推测而非证明,文中未给出不存在非渐近 e-value 的严格论证。
三、开放问题¶
- 非渐近 e-value 的不可能性:引言声称“无方差上界时可能不存在非平凡非渐近 e-value”,但未证明。要证:在仅有 \(EX_i = \theta, \sigma^2 \in (0, \infty)\) 的假设下,是否存在任何非负统计量 \(E_n\) 满足 \(E_\theta[E_n] \le 1\) 且在 \(\mu > \theta\) 时 \(E_\mu[E_n] \to \infty\)?扎根在引言第 2 段“there is no known nontrivial e-value (and it is likely that none exist) for null hypothesis (1.1)”。
- \(\tau(\alpha)\) 的显式表达与单调性:定理 4.3 给出 \(\tau(\alpha) = \exp(-\frac{1}{2}[M^{-1}(c_\alpha/\sqrt{2\pi})]^2)\),但未分析 \(\tau(\alpha)\) 作为 \(\alpha\) 的函数的性质。要估:\(\tau(\alpha)\) 是否单调递减?\(\tau(\alpha) \ge 0.1\) 的 \(\alpha\) 范围是否确切为 \([0, 6.1)\)?扎根在定理 4.3 后的段落“Observe that \(\tau(6.1) \approx 0.1\)”。
- 混合 penalty \(\kappa\) 的量化:定理 4.6 证明 \(\kappa > 0\) 存在,但未给出计算方法或下界。要算:对具体 \(\pi\)(如均匀分布)与 \(\Lambda\),\(\kappa\) 的值或下界是什么?扎根在定理 4.6 的陈述“\(\kappa \in (0,1)\) is a strictly positive constant depending only on \(\pi, \Lambda\), and \(\alpha\)”。
- 与 CLT p-value 的直接 power 对比:本文只对比了 e-value 之间的阈值宽度,未对比 Bentkus-type e-value 与经典 CLT p-value(\(z_\delta\) 阈值)在固定 \(\delta\) 下的 power。要估:在有限样本下,Bentkus-type e-value 的 power 是否逼近 CLT p-value?差距多大?扎根在引言对 missing factor 的讨论(仅对比阈值,未对比 power)。
四、最核心、最简单的例子 / 数学问题¶
最简特例:\(\alpha = 0\)(指示函数情形)
当 \(\alpha = 0\) 时,\(\alpha\)-powered positive function 退化为指示函数 \(h_0(u) = 1_{u \ge 0}\),Bentkus-type e-value 退化为:
要证的命题:\((E^0_n(\theta; \lambda))_{n \ge 1}\) 是渐近 e-value,且推断阈值 \(\inf_\lambda U_{\delta,0}(\lambda) = G^{-1}(\delta)\)(精确回收 missing factor)。
证明怎么走: 1. 渐近有效性:\(Z_n(\theta) \overset{d}{\to} Z\)(高斯吸引域)。\(E^0_n\) 对 \(Z_n\) 的映射在 \(Z_n \ne \lambda\) 处连续(指示函数在跳点 \(\lambda\) 处不连续,但 \(P(Z = \lambda) = 0\),故连续映射定理仍适用),故 \(E^0_n \overset{d}{\to} 1_{Z \ge \lambda}/G(\lambda)\)。一致可积性:\(1_{Z_n \ge \lambda} \le \exp(Z_n - \lambda)\)(因 \(Z_n \ge \lambda\) 时 \(1 \le e^{Z_n - \lambda}\)),\(\exp(Z_n)\) 一致可积,故 \(E^0_n\) 一致可积。均值收敛至 \(E[1_{Z \ge \lambda}]/G(\lambda) = G(\lambda)/G(\lambda) = 1\)。 2. 近优性:阈值条件 \(E^0_n \ge 1/\delta\) 即 \(1_{Z_n \ge \lambda}/G(\lambda) \ge 1/\delta\),要求 \(Z_n \ge \lambda\) 且 \(G(\lambda) \le \delta\)。故 \(\lambda \ge G^{-1}(\delta)\),最小阈值为 \(\inf_\lambda U_{\delta,0}(\lambda) = G^{-1}(\delta)\)。下界 \(G^{-1}(\delta)\) 由 Markov 不等式保证(若 \(\inf_\lambda U_{\delta,0} < G^{-1}(\delta)\),则 \(P(Z \ge \inf_\lambda U_{\delta,0}) > \delta\),矛盾),上界 \(G^{-1}(\delta/c_0) = G^{-1}(\delta/1) = G^{-1}(\delta)\),上下界重合。
为什么成立:\(\alpha=0\) 时,e-value 是二值的(要么 \(1/G(\lambda)\),要么 0),其阈值逻辑与 CLT p-value 完全一致(\(Z_n \ge G^{-1}(\delta)\) 即拒绝),故精确回收 missing factor。代价是丧失了对 \(Z_n\) 的连续排序能力(Remark 4.4),在多重检验的稀疏设定下因无法区分信号强度而失效。
一般情形的“加壳”:\(\alpha > 0\) 时,\(h_\alpha(u) = (1+u/\alpha)_+^\alpha\) 是指示函数与指数函数之间的光滑插值,e-value 变为 \((Z_n - \lambda)_+^\alpha / I_\alpha(\lambda)\),保留了连续排序能力(\(\alpha \ge 1\) 时 \(U_{\delta,\alpha}\) 凸且光滑),但引入常数因子 \(c_\alpha > 1\),使得上界为 \(G^{-1}(\delta/c_\alpha)\) 而非精确的 \(G^{-1}(\delta)\)。证明的核心结构(一致可积性 + 连续映射 + Bentkus 界)在 \(\alpha=0\) 时已完整呈现,\(\alpha > 0\) 只是增加了 \(I_\alpha\) 的计算复杂度与 \(c_\alpha\) 的常数损失。
Maintained by 陈星宇 · Homepage · Source on GitHub