A Theory of Bootstrap Coverage Calibration for Generalized Posterior Credible Sets¶
作者: Masahiro Tanaka
主题: 数理统计 / 假设检验
相关性: 6/10
链接: https://arxiv.org/abs/2606.25729
一、领域脉络与小综述¶
这个方向是什么¶
这个子方向研究的是广义后验(generalized posterior)的可信集(credible set)的频率覆盖率校准问题。广义后验用指数化的经验准则(如损失函数、估计方程、伪似然)替代传统似然函数,从而在模型误设下获得稳健性或处理非似然定义的目标参数。然而,这种灵活性带来一个根本问题:后验的曲率(决定可信集形状)与估计量的抽样协方差(决定频率覆盖)不再自动匹配。因此,一个名义上 95% 的后验可信集,在重复抽样下可能只有 80% 的真实覆盖率。校准问题就是要找到一个学习率(learning rate)参数 ω,使得广义后验可信集达到名义上的频率覆盖率。这个方向目前处于从经验方法向理论理解过渡的阶段——已有多种启发式校准算法,但对其高阶渐近性质、算法收敛性以及标量学习率的能力边界缺乏系统分析。
发展脉络¶
- 奠基工作:广义后验的提出与基本性质
- Chernozhukov & Hong (2003):提出 Laplace 型估计量(LTE),用指数化准则函数构造拟后验,并通过 MCMC 计算。这是广义后验在计量经济学中的早期形式,但未系统处理覆盖率问题。
- Jiang & Tanner (2008):提出 Gibbs 后验,用风险函数(如分类误差)而非似然构造后验,在高维变量选择中展示优势。这奠定了“损失函数驱动后验”的范式。
- Bissiri, Holmes & Walker (2016):提出一般贝叶斯更新框架(general Bayesian updating),用损失函数而非似然连接数据与参数,将 Gibbs 后验置于决策理论基础上。该文指出需要校准“学习率”参数,但未给出具体方法。
-
Zhang (2006a,b):从信息论角度分析最小信息复杂度密度估计,为广义后验的收敛性提供理论基础。
-
主要进展:校准问题的识别与算法
- Syring & Martin (2019):提出广义后验校准(GPC)算法——通过 bootstrap 重复抽样估计覆盖率曲线,并求解学习率使得 bootstrap 覆盖率等于名义水平。这是本文的直接前驱。该文是经验性的,没有理论证明。
- Miller (2021):系统建立了广义后验的渐近正态性(Bernstein-von Mises)、集中性和覆盖率的一阶理论。关键结论:只有当后验协方差与抽样协方差成比例时,标量学习率才能同时校准所有名义水平。这为本文的 Proposition 1 提供了直接引用。
- Wu & Martin (2023):比较了多种学习率选择方法(包括 GPC、SafeBayes、信息匹配等),发现 GPC 在覆盖率校准上通常优于其他方法。这强化了 GPC 作为校准工具的地位。
-
Tanaka (2024, 2025):提出基于序贯蒙特卡洛(SMC)和加权粒子优化的 GPC 计算加速方法。这些是本文作者的前期工作,但本文是理论分析而非算法改进。
-
当前 frontier 与本文的位置
- 当前 frontier 是理解 GPC 算法的高阶渐近性质:bootstrap 覆盖率近似误差如何传递到学习率估计?后验 Edgeworth 展开如何影响覆盖率?标量学习率到底能修复什么、不能修复什么?
- 本文的位置:在 Miller (2021) 的一阶理论和 Syring & Martin (2019) 的经验算法之间,提供二阶 Edgeworth 展开分析,分离覆盖率误差的两个来源(抽样 Edgeworth 修正 vs. 后验边界/中心/形状修正),并证明标量学习率只能做水平特定的尺度修正,不能修复形状误设。
子线索聚类¶
- 广义后验的构造与渐近理论(Chernozhukov & Hong 2003; Jiang & Tanner 2008; Bissiri et al. 2016; Miller 2021; Martin & Syring 2022):研究广义后验的定义、集中性、渐近正态性和覆盖率的一阶性质。Miller (2021) 是这一簇的集大成者。
- 学习率选择与校准方法(Syring & Martin 2019; Wu & Martin 2023; Tanaka 2024, 2025; Onizuka et al. 2024):提出并比较各种数据驱动选择学习率的方法,以 GPC 为核心。这一簇偏重算法与实证。
- 模型误设下的贝叶斯推断(Grünwald & van Ommen 2017; Holmes & Walker 2017; Müller 2013; Li & Rice 2024):研究模型误设如何导致后验不一致,并提出补救措施(如 SafeBayes、sandwich 调整)。这些工作解释了为什么校准是必要的,但通常不直接针对覆盖率。
- 后验 Edgeworth 展开(Kolassa & Kuffner 2020):证明正则后验密度的形式 Edgeworth 展开的有效性。本文将其推广到广义后验。
这个方向在追问的核心问题¶
- 覆盖率误差的结构:广义后验可信集的覆盖率误差由哪些成分组成?如何分离抽样分布误差与后验分布误差?
- 标量学习率的能力边界:一个标量参数 ω 能否同时校准所有名义水平?如果不能,它到底能修复什么?
- bootstrap 校准的理论保证:bootstrap 覆盖率曲线的根是否一致估计了总体根?收敛速率是多少?
- 算法收敛性:实际使用的随机逼近(Robbins-Monro)算法是否收敛到 bootstrap 根?有限 bootstrap、后验 Monte Carlo 和边界估计误差如何影响收敛?
⚠️ 作者的 framing¶
这是作者的说法:作者把缺口 frame 成“GPC 算法的理论状态不直接明了”——bootstrap 近似、后验模拟、Monte Carlo 估计和随机逼近多层叠加,且即使知道精确 bootstrap 覆盖率曲线,也不清楚什么条件保证其根接近总体根。作者将本文定位为“提供正则固定维数渐近下的系统分析”,分离覆盖率误差来源,并揭示标量学习率的结构性限制。
被淡化或回避的竞争路线: - SafeBayes(Grünwald & van Ommen 2017)和信息匹配(Holmes & Walker 2017)被提及但未深入比较。这些方法不直接针对覆盖率,而是针对预测风险或渐近协方差匹配。作者在 Section 1 末尾说“它们通常针对渐近协方差或预测/风险准则”,暗示 GPC 更直接地瞄准覆盖率。 - Sandwich 后验调整(Shaby 2014; Li & Rice 2024)被提及但未讨论。这些方法通过调整后验协方差来匹配 sandwich 估计量,可能比标量学习率更灵活(允许不同方向的不同缩放),但作者未将其作为竞争方案。
什么明显该被引/该存在、却没出现在 intro 里? - 高维设定下的校准:本文明确限制在固定维数(d 固定),但高维广义后验校准是一个活跃方向(如 Jiang & Tanner 2008 已涉及高维变量选择)。作者在 Discussion 中承认“高维校准不能通过固定维数 Edgeworth 展开获得”,但未引用任何高维校准文献。 - 经验似然(empirical likelihood)与广义后验的联系:经验似然也是一种不依赖完整似然的推断方法,其校准问题有独立文献。本文未提及。 - 贝叶斯非参数校准:广义后验在非参数设定下的校准问题(如 Lyddon et al. 2019 的 loss-likelihood bootstrap 涉及非参数模型)未被讨论。
张力¶
未见明显对立引用。被引工作之间在“校准是必要的”这一点上高度一致,分歧在于如何校准(bootstrap vs. 信息匹配 vs. sandwich 调整)以及校准目标(覆盖率 vs. 预测风险 vs. 协方差匹配)。本文的贡献在于揭示这些不同目标之间的不可通约性——即使校准了覆盖率,也不意味着协方差匹配。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
符号: - \(X_1, \dots, X_n\):独立同分布观测,来自未知分布 \(P_0\)。 - \(\theta \in \Theta \subset \mathbb{R}^d\):参数向量(\(d\) 固定)。 - \(R_n(\theta) = n^{-1} \sum_{i=1}^n \ell_\theta(X_i)\):经验准则函数(如负平均对数似然、经验风险)。 - \(\omega > 0\):学习率(标量),控制后验的分散程度。 - \(\pi(\theta)\):先验密度。 - \(\Pi_{n,\omega}(d\theta \mid X^n)\):广义后验,密度正比于 \(\exp\{-\omega n R_n(\theta)\} \pi(\theta)\)。 - \(\theta_0 = \theta(P_0)\):总体目标参数(如风险最小化者)。 - \(\hat{\theta}_n\):经验最小化者(\(\nabla R_n(\hat{\theta}_n) = 0\))。 - \(C_{n,\omega,\alpha}(X^n)\):后验可信集,后验概率为 \(1-\alpha\)。 - \(c_{n,\alpha}(\omega) = P_0\{\theta_0 \in C_{n,\omega,\alpha}\}\):频率覆盖率。 - \(P^*\):bootstrap 条件概率(给定原始数据)。 - \(\hat{\theta}_n^*\):bootstrap 样本的经验最小化者。 - \(c_{n,\alpha}^*(\omega) = P^*\{\hat{\theta}_n \in C_{n,\omega,\alpha}^*(X^{*n})\}\):bootstrap 覆盖率曲线。 - \(\hat{\omega}_n\):bootstrap 校准的学习率,满足 \(c_{n,\alpha}^*(\hat{\omega}_n) = 1-\alpha\)。 - \(J = \nabla^2 R(\theta_0)\):总体准则的 Hessian(曲率矩阵)。 - \(\Psi\):\(\sqrt{n}(\hat{\theta}_n - \theta_0)\) 的渐近协方差(sandwich 形式)。 - \(Q_\Lambda = \sum_{j=1}^d \lambda_j Z_j^2\):加权卡方分布,\(\lambda_j\) 是 \(J^{1/2} \Psi J^{1/2}\) 的特征值。
模型: - 数据生成机制:\(X_i \sim P_0\),独立同分布。 - 统计模型:参数 \(\theta\) 通过准则函数 \(R_n(\theta)\) 与数据连接,而非通过似然。\(R_n(\theta)\) 可以是损失函数、估计方程、伪似然等。 - 已知:先验 \(\pi(\theta)\),准则函数 \(\ell_\theta(x)\) 的形式。 - 要估的对象:\(\theta_0\)(总体目标),以及学习率 \(\omega\) 使得可信集有正确覆盖率。
可观测数据: - 可观测:\(X_1, \dots, X_n\)(原始样本),以及从 bootstrap 分布 \(P^*\) 重抽样的 \(X_1^*, \dots, X_n^*\)。 - 不可观测:总体分布 \(P_0\)、总体目标 \(\theta_0\)、总体覆盖率曲线 \(c_{n,\alpha}(\omega)\)。 - 关键识别假设:bootstrap 分布 \(P^*\) 是 \(P_0\) 的一致估计,使得 bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 近似 \(c_{n,\alpha}(\omega)\)。
第二步:最小内核——一维均值估计的特例¶
考虑最简单的特例:\(d=1\)(标量参数),准则函数为负平均对数似然,但模型可能误设。具体地:
- 设 \(X_i \sim P_0\),\(\mathbb{E}[X_i] = \mu_0\),\(\text{Var}(X_i) = \sigma^2\)。
- 准则函数:\(R_n(\theta) = \frac{1}{2n} \sum_{i=1}^n (X_i - \theta)^2\)(负对数似然,假设方差已知为 1,但实际方差可能不是 1)。
- 总体目标:\(\theta_0 = \mu_0\)(风险最小化者)。
- 经验最小化者:\(\hat{\theta}_n = \bar{X}_n\)。
- 广义后验:\(\Pi_{n,\omega}(\theta \mid X^n) \propto \exp\left\{-\frac{\omega n}{2} \cdot \frac{1}{n} \sum_{i=1}^n (X_i - \theta)^2\right\} \pi(\theta)\)。
- 若取平坦先验 \(\pi(\theta) \propto 1\),则后验为 \(\mathcal{N}(\bar{X}_n, (\omega n)^{-1})\)。
- 可信区间(后验等尾区间):\(C_{n,\omega,\alpha} = \left[\bar{X}_n - \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}, \bar{X}_n + \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}\right]\),其中 \(z_{1-\alpha/2}\) 是标准正态的 \(1-\alpha/2\) 分位数。
- 频率覆盖率:
\[c_{n,\alpha}(\omega) = P_0\left\{ \mu_0 \in \left[\bar{X}_n - \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}, \bar{X}_n + \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}\right] \right\} = P_0\left\{ |\sqrt{n}(\bar{X}_n - \mu_0)| \leq \frac{z_{1-\alpha/2}}{\sqrt{\omega}} \right\}.\]
- 由中心极限定理,\(\sqrt{n}(\bar{X}_n - \mu_0) \rightsquigarrow \mathcal{N}(0, \sigma^2)\),因此一阶近似:
\[c_{n,\alpha}(\omega) \to \Phi\left(\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) - \Phi\left(-\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right).\]
- 要校准到名义水平 \(1-\alpha\),需要:
\[\Phi\left(\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) - \Phi\left(-\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) = 1-\alpha \quad \Rightarrow \quad \frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma} = z_{1-\alpha/2} \quad \Rightarrow \quad \omega = \frac{1}{\sigma^2}.\]
- 核心洞察:校准后的学习率 \(\omega = 1/\sigma^2\) 恰好是“后验方差 = 抽样方差”的条件。如果模型正确(\(\sigma^2 = 1\)),则 \(\omega = 1\) 自动校准;如果模型误设(\(\sigma^2 \neq 1\)),则需要调整 \(\omega\) 来匹配方差。
这个特例揭示了本文的核心命题: 1. 标量学习率只能修复尺度:在这个一维例子中,后验和抽样分布都是正态的,唯一的差异是方差。标量 \(\omega\) 可以完美修复这个差异,因为两个分布的形状相同(都是正态)。 2. 在多维情况下,形状差异无法修复:如果后验协方差 \(J^{-1}/\omega\) 与抽样协方差 \(\Psi\) 不成比例(即特征值不全相等),则标量 \(\omega\) 只能同时缩放所有方向,无法改变椭球的偏心方向。因此,一个 \(\omega\) 不能同时校准所有名义水平。 3. bootstrap 校准的根:bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 近似 \(c_{n,\alpha}(\omega)\),其根 \(\hat{\omega}_n\) 一致估计 \(\omega^\dagger\)(总体根),收敛速率由 bootstrap 近似的精度决定。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在正则固定维数渐近框架下,分析广义后验校准(GPC)算法的理论性质——bootstrap 覆盖率曲线的根是否一致估计总体根、覆盖率误差的高阶结构、以及标量学习率的能力边界。
- 核心工具/方法:Edgeworth 展开(后验和抽样)、bootstrap 近似、随机逼近(Robbins-Monro)理论。
- 主要结论:① 在均匀覆盖近似和局部可识别条件下,bootstrap 根以相同速率一致估计总体根(Theorem 1);② 覆盖率误差可分解为抽样 Edgeworth 修正与后验边界/中心/形状修正(Theorem 2);③ 标量学习率只能在校准的特定名义水平上修复尺度,不能修复形状误设——仅当后验协方差与抽样协方差成比例时才能同时校准所有水平(Proposition 1)。
关键设定与假设¶
完整设定(在第二节最小记号基础上补充): - 准则函数:\(R_n(\theta) = n^{-1} \sum_{i=1}^n \ell_\theta(X_i)\),\(\ell_\theta\) 六次连续可微,有足够高阶的可积包络。 - 总体目标:\(\theta_0\) 是 \(R(\theta) = P_0 \ell_\theta\) 的唯一内点最小化者,\(J = \nabla^2 R(\theta_0)\) 正定。 - 先验:正且四次连续可微。 - 估计量:\(\hat{\theta}_n\) 是 \(\nabla R_n(\hat{\theta}_n) = 0\) 的一致内点局部最小化者。 - 后验集中性:后验质量在固定邻域外指数小,局部 Laplace 展开可逐项微分。 - bootstrap 正则性:bootstrap 版本满足相同条件,条件概率趋于 1。
关键假设: - Assumption 1(局部后验与抽样极限):准则函数在 \(\hat{\theta}_n\) 附近有二次展开(含三阶、四阶项),bootstrap 版本类似;后验和抽样均渐近正态;后验有 Edgeworth 展开(引用 Kolassa & Kuffner 2020 的结论推广到广义后验)。 - Assumption 2(均匀 bootstrap 近似与覆盖率根的识别):总体覆盖率曲线 \(c_{n,\alpha}(\omega)\) 在紧集 \(\Omega\) 上有唯一根 \(\omega^\dagger_n\),局部可识别(根附近有正的最小导数下界),bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 以速率 \(a_n\) 均匀近似 \(c_{n,\alpha}(\omega)\),且 bootstrap 方程在邻域内有解。
相比已有文献的强化/放宽: - 强化:要求后验 Edgeworth 展开(Kolassa & Kuffner 2020 只对正则后验证明,本文假设对广义后验也成立)。 - 放宽:不要求模型正确——准则函数可以不是似然,允许模型误设。 - 关键限制:固定维数(\(d\) 固定)、正则问题(准则函数光滑)、可信集有标量边界表示(排除任意 HPD 集)。
主要结果¶
Proposition 1(标量校准的极限): - 陈述:对于椭球可信集 \(E_{n,\omega,\alpha}\),一阶覆盖率为 \(P\{Q_\Lambda \leq q_{d,1-\alpha}/\omega\} + o(1)\),其中 \(Q_\Lambda = \sum \lambda_j Z_j^2\),\(\lambda_j\) 是 \(J^{1/2} \Psi J^{1/2}\) 的特征值。标量 \(\omega_0\) 能同时校准所有 \(\alpha \in (0,1)\) 当且仅当 \(\lambda_1 = \dots = \lambda_d = \omega_0^{-1}\),即 \(\Psi = \omega_0^{-1} J^{-1}\)。 - 直觉:后验椭球的形状由 \(J^{-1}\) 决定,抽样椭球的形状由 \(\Psi\) 决定。标量 \(\omega\) 只能同时缩放所有轴,不能改变椭球的偏心方向。只有当两个椭球形状相同(成比例)时,一个 \(\omega\) 才能同时匹配所有方向。 - 必要条件:后验协方差与抽样协方差成比例。 - 解决的技术难点:将覆盖率问题转化为加权卡方分布的分位数匹配问题,利用 Laplace 变换的唯一性证明特征值必须全相等。
Theorem 1(bootstrap 根的稳定性): - 陈述:在 Assumption 2 下,bootstrap 根 \(\hat{\omega}_n\) 满足 \(\hat{\omega}_n - \omega^\dagger_n = O_p(a_n)\),且 \(c_{n,\alpha}(\hat{\omega}_n) - (1-\alpha) = O_p(a_n)\)。 - 直觉:bootstrap 覆盖率曲线均匀近似总体曲线(速率 \(a_n\)),且总体曲线在根附近有正导数,因此根的误差被压缩到与近似误差同阶。 - 必要条件:均匀近似(Assumption 2.3)、局部可识别(Assumption 2.2 和 2.4)、bootstrap 方程有解(Assumption 2.5)。 - 解决的技术难点:将“根的一致估计”问题分解为“近似误差传递”问题,利用中值定理和导数下界得到速率。
Theorem 2(高阶覆盖率展开): - 陈述:对于有标量边界表示的可信集,覆盖率可展开为:
证明路线与技术技巧¶
整体路线(以 Theorem 1 为例): 1. 一致性:利用均匀近似(Assumption 2.3)和局部可识别(Assumption 2.2),证明 bootstrap 根 \(\hat{\omega}_n\) 是 \(\omega^\dagger_n\) 的一致估计。 2. 速率:在邻域 \(N_n\) 内应用中值定理,结合导数下界(Assumption 2.4),得到 \(|\hat{\omega}_n - \omega^\dagger_n| \leq \Delta_n / \eta\),其中 \(\Delta_n = \sup |c_{n,\alpha}^* - c_{n,\alpha}| = O_p(a_n)\)。 3. 覆盖率误差:直接由 bootstrap 方程和均匀近似得到 \(|c_{n,\alpha}(\hat{\omega}_n) - (1-\alpha)| \leq \Delta_n\)。
关键跳跃点: - 从均匀近似到根的一致估计:需要 Assumption 2.2 的“局部可识别”条件——在根附近,覆盖率曲线有正的最小导数下界。这保证了近似误差不会在求根过程中被放大。 - 从一阶到高阶:Theorem 2 的关键跳跃是将随机可信集边界(后验分位数)的 Edgeworth 展开与抽样分布的 Edgeworth 展开结合。这需要假设可信集有标量边界表示,使得边界修正 \(\delta_1, \delta_2\) 可以从后验 Edgeworth 展开中提取。
技术技巧点名: - Edgeworth 展开(后验和抽样):用于推导覆盖率的高阶展开(Theorem 2)。后验 Edgeworth 展开引用 Kolassa & Kuffner (2020) 的结论,推广到广义后验。 - bootstrap 近似:用 bootstrap 覆盖率曲线 \(c_{n,\alpha}^*\) 近似总体曲线 \(c_{n,\alpha}\)(Assumption 2.3)。 - 中值定理:在 Theorem 1 的证明中,用于将根的误差与覆盖率误差联系起来。 - Laplace 变换的唯一性:在 Proposition 1 的证明中,用于从分布相等推导特征值全相等。 - Kushner-Clark ODE 方法:在 Corollary 1 的证明中,用于分析随机逼近算法的收敛性。 - Robbins-Siegmund 收敛定理:在 Corollary 1 的证明中,用于处理局部 Lyapunov 函数。
真实例子与应用¶
本文为纯理论,无实证例子。论文没有模拟实验、真实数据分析或应用案例。所有结果都是理论定理和证明。
🔎 结论是否比证明窄¶
- Proposition 1 的结论(标量学习率只能同时校准所有水平当且仅当协方差成比例)是严格证明的,没有过度 claim。
- Theorem 1 的结论(bootstrap 根以速率 \(a_n\) 一致估计总体根)依赖于 Assumption 2 的多个条件,尤其是“均匀近似”和“局部可识别”。作者在 Section 4 开头承认“在光滑固定维数估计问题中,\(a_n\) 可以是 \(O(n^{-1})\)”,但未证明这个速率在一般条件下可达——这取决于具体的 Edgeworth 展开精度。
- Theorem 2 的结论依赖于“标量边界表示”假设,作者明确承认“这排除了任意最高后验密度集,除非其随机几何允许标量确定性等价表示”。因此,结论的适用范围比“所有可信集”窄。
- Corollary 1 的结论是局部的(在邻域 \(K_n\) 内收敛),作者承认“全局收敛需要额外的单调性或递归条件”。算法收敛性只在局部成立,不是全局保证。
- Discussion 中,作者说“bootstrap 校准在固定名义水平上是有效方法”,但 Theorem 1 只证明了根的一致估计,没有证明校准后的覆盖率误差比未校准的小——这需要比较 \(c_{n,\alpha}(\hat{\omega}_n)\) 与 \(c_{n,\alpha}(1)\) 的差距,而本文未做此比较。
四、开放问题¶
-
有限 bootstrap、后验 Monte Carlo 和边界估计误差的联合分析:本文只分析了“精确 bootstrap 覆盖率曲线”的根,但实际算法用 Monte Carlo 估计 \(c_{n,\alpha}^*(\omega)\)。这些额外误差如何影响根的收敛性和覆盖率?扎根于:Section 5 开头“The implemented GPC algorithm replaces \(c_{n,\alpha}^*\) with a Monte Carlo estimate”,以及 Discussion 第一点“the stochastic approximation results should be combined with a full analysis of the errors due to finite bootstrap resampling, posterior Monte Carlo, and boundary estimation”。
-
任意 HPD 集的多元后验 Edgeworth 定理:本文的 Theorem 2 限于有标量边界表示的可信集。对于任意形状的 HPD 集,需要真正的多元 Edgeworth 展开来处理随机边界。扎根于:Discussion 第二点“a genuinely multivariate posterior Edgeworth theorem for arbitrary highest posterior density sets would remove the restrictions imposed by the scalar radii used here”。
-
非光滑 Gibbs 损失的 Edgeworth 展开:本文假设准则函数光滑(六次可微)。对于非光滑损失(如分位数回归、支持向量机),一阶正态性可能成立但缺乏导数用于形式 Edgeworth 级数。需要不同的展开方法。扎根于:Discussion 第三点“non-smooth Gibbs losses require different expansions because first-order normality may hold without the derivatives used in formal Edgeworth series”。
-
高维校准:本文限制在固定维数。高维设定下(\(d \gg n\)),Edgeworth 展开失效,需要不同的校准策略(如基于稀疏性、随机矩阵理论)。扎根于:Discussion 第五点“a high-dimensional calibration cannot be obtained by using a fixed-dimensional Edgeworth expansion without additional structure”。
-
依赖数据的校准:本文假设独立观测。对于时间序列或空间数据,需要块 bootstrap 或依赖乘子 bootstrap 论证。扎根于:Discussion 第四点“dependent data require a block or dependent multiplier bootstrap argument”。
Maintained by 陈星宇 · Homepage · Source on GitHub