A Theory of Bootstrap Coverage Calibration for Generalized Posterior Credible Sets¶

作者: Masahiro Tanaka
主题: 数理统计 / 假设检验
相关性: 6/10
链接: https://arxiv.org/abs/2606.25729

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向研究的是广义后验（generalized posterior）的可信集（credible set）的频率覆盖率校准问题。广义后验用指数化的经验准则（如损失函数、估计方程、伪似然）替代传统似然函数，从而在模型误设下获得稳健性或处理非似然定义的目标参数。然而，这种灵活性带来一个根本问题：后验的曲率（决定可信集形状）与估计量的抽样协方差（决定频率覆盖）不再自动匹配。因此，一个名义上 95% 的后验可信集，在重复抽样下可能只有 80% 的真实覆盖率。校准问题就是要找到一个学习率（learning rate）参数 ω，使得广义后验可信集达到名义上的频率覆盖率。这个方向目前处于从经验方法向理论理解过渡的阶段——已有多种启发式校准算法，但对其高阶渐近性质、算法收敛性以及标量学习率的能力边界缺乏系统分析。

发展脉络¶

奠基工作：广义后验的提出与基本性质
Chernozhukov & Hong (2003)：提出 Laplace 型估计量（LTE），用指数化准则函数构造拟后验，并通过 MCMC 计算。这是广义后验在计量经济学中的早期形式，但未系统处理覆盖率问题。
Jiang & Tanner (2008)：提出 Gibbs 后验，用风险函数（如分类误差）而非似然构造后验，在高维变量选择中展示优势。这奠定了“损失函数驱动后验”的范式。
Bissiri, Holmes & Walker (2016)：提出一般贝叶斯更新框架（general Bayesian updating），用损失函数而非似然连接数据与参数，将 Gibbs 后验置于决策理论基础上。该文指出需要校准“学习率”参数，但未给出具体方法。
Zhang (2006a,b)：从信息论角度分析最小信息复杂度密度估计，为广义后验的收敛性提供理论基础。
主要进展：校准问题的识别与算法
Syring & Martin (2019)：提出广义后验校准（GPC）算法——通过 bootstrap 重复抽样估计覆盖率曲线，并求解学习率使得 bootstrap 覆盖率等于名义水平。这是本文的直接前驱。该文是经验性的，没有理论证明。
Miller (2021)：系统建立了广义后验的渐近正态性（Bernstein-von Mises）、集中性和覆盖率的一阶理论。关键结论：只有当后验协方差与抽样协方差成比例时，标量学习率才能同时校准所有名义水平。这为本文的 Proposition 1 提供了直接引用。
Wu & Martin (2023)：比较了多种学习率选择方法（包括 GPC、SafeBayes、信息匹配等），发现 GPC 在覆盖率校准上通常优于其他方法。这强化了 GPC 作为校准工具的地位。
Tanaka (2024, 2025)：提出基于序贯蒙特卡洛（SMC）和加权粒子优化的 GPC 计算加速方法。这些是本文作者的前期工作，但本文是理论分析而非算法改进。
当前 frontier 与本文的位置
当前 frontier 是理解 GPC 算法的高阶渐近性质：bootstrap 覆盖率近似误差如何传递到学习率估计？后验 Edgeworth 展开如何影响覆盖率？标量学习率到底能修复什么、不能修复什么？
本文的位置：在 Miller (2021) 的一阶理论和 Syring & Martin (2019) 的经验算法之间，提供二阶 Edgeworth 展开分析，分离覆盖率误差的两个来源（抽样 Edgeworth 修正 vs. 后验边界/中心/形状修正），并证明标量学习率只能做水平特定的尺度修正，不能修复形状误设。

子线索聚类¶

广义后验的构造与渐近理论（Chernozhukov & Hong 2003; Jiang & Tanner 2008; Bissiri et al. 2016; Miller 2021; Martin & Syring 2022）：研究广义后验的定义、集中性、渐近正态性和覆盖率的一阶性质。Miller (2021) 是这一簇的集大成者。
学习率选择与校准方法（Syring & Martin 2019; Wu & Martin 2023; Tanaka 2024, 2025; Onizuka et al. 2024）：提出并比较各种数据驱动选择学习率的方法，以 GPC 为核心。这一簇偏重算法与实证。
模型误设下的贝叶斯推断（Grünwald & van Ommen 2017; Holmes & Walker 2017; Müller 2013; Li & Rice 2024）：研究模型误设如何导致后验不一致，并提出补救措施（如 SafeBayes、sandwich 调整）。这些工作解释了为什么校准是必要的，但通常不直接针对覆盖率。
后验 Edgeworth 展开（Kolassa & Kuffner 2020）：证明正则后验密度的形式 Edgeworth 展开的有效性。本文将其推广到广义后验。

这个方向在追问的核心问题¶

覆盖率误差的结构：广义后验可信集的覆盖率误差由哪些成分组成？如何分离抽样分布误差与后验分布误差？
标量学习率的能力边界：一个标量参数 ω 能否同时校准所有名义水平？如果不能，它到底能修复什么？
bootstrap 校准的理论保证：bootstrap 覆盖率曲线的根是否一致估计了总体根？收敛速率是多少？
算法收敛性：实际使用的随机逼近（Robbins-Monro）算法是否收敛到 bootstrap 根？有限 bootstrap、后验 Monte Carlo 和边界估计误差如何影响收敛？

⚠️ 作者的 framing¶

这是作者的说法：作者把缺口 frame 成“GPC 算法的理论状态不直接明了”——bootstrap 近似、后验模拟、Monte Carlo 估计和随机逼近多层叠加，且即使知道精确 bootstrap 覆盖率曲线，也不清楚什么条件保证其根接近总体根。作者将本文定位为“提供正则固定维数渐近下的系统分析”，分离覆盖率误差来源，并揭示标量学习率的结构性限制。

被淡化或回避的竞争路线： - SafeBayes（Grünwald & van Ommen 2017）和信息匹配（Holmes & Walker 2017）被提及但未深入比较。这些方法不直接针对覆盖率，而是针对预测风险或渐近协方差匹配。作者在 Section 1 末尾说“它们通常针对渐近协方差或预测/风险准则”，暗示 GPC 更直接地瞄准覆盖率。 - Sandwich 后验调整（Shaby 2014; Li & Rice 2024）被提及但未讨论。这些方法通过调整后验协方差来匹配 sandwich 估计量，可能比标量学习率更灵活（允许不同方向的不同缩放），但作者未将其作为竞争方案。

什么明显该被引/该存在、却没出现在 intro 里？ - 高维设定下的校准：本文明确限制在固定维数（d 固定），但高维广义后验校准是一个活跃方向（如 Jiang & Tanner 2008 已涉及高维变量选择）。作者在 Discussion 中承认“高维校准不能通过固定维数 Edgeworth 展开获得”，但未引用任何高维校准文献。 - 经验似然（empirical likelihood）与广义后验的联系：经验似然也是一种不依赖完整似然的推断方法，其校准问题有独立文献。本文未提及。 - 贝叶斯非参数校准：广义后验在非参数设定下的校准问题（如 Lyddon et al. 2019 的 loss-likelihood bootstrap 涉及非参数模型）未被讨论。

张力¶

未见明显对立引用。被引工作之间在“校准是必要的”这一点上高度一致，分歧在于如何校准（bootstrap vs. 信息匹配 vs. sandwich 调整）以及校准目标（覆盖率 vs. 预测风险 vs. 协方差匹配）。本文的贡献在于揭示这些不同目标之间的不可通约性——即使校准了覆盖率，也不意味着协方差匹配。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号： - \(X_1, \dots, X_n\)：独立同分布观测，来自未知分布 \(P_0\)。 - \(\theta \in \Theta \subset \mathbb{R}^d\)：参数向量（\(d\) 固定）。 - \(R_n(\theta) = n^{-1} \sum_{i=1}^n \ell_\theta(X_i)\)：经验准则函数（如负平均对数似然、经验风险）。 - \(\omega > 0\)：学习率（标量），控制后验的分散程度。 - \(\pi(\theta)\)：先验密度。 - \(\Pi_{n,\omega}(d\theta \mid X^n)\)：广义后验，密度正比于 \(\exp\{-\omega n R_n(\theta)\} \pi(\theta)\)。 - \(\theta_0 = \theta(P_0)\)：总体目标参数（如风险最小化者）。 - \(\hat{\theta}_n\)：经验最小化者（\(\nabla R_n(\hat{\theta}_n) = 0\)）。 - \(C_{n,\omega,\alpha}(X^n)\)：后验可信集，后验概率为 \(1-\alpha\)。 - \(c_{n,\alpha}(\omega) = P_0\{\theta_0 \in C_{n,\omega,\alpha}\}\)：频率覆盖率。 - \(P^*\)：bootstrap 条件概率（给定原始数据）。 - \(\hat{\theta}_n^*\)：bootstrap 样本的经验最小化者。 - \(c_{n,\alpha}^*(\omega) = P^*\{\hat{\theta}_n \in C_{n,\omega,\alpha}^*(X^{*n})\}\)：bootstrap 覆盖率曲线。 - \(\hat{\omega}_n\)：bootstrap 校准的学习率，满足 \(c_{n,\alpha}^*(\hat{\omega}_n) = 1-\alpha\)。 - \(J = \nabla^2 R(\theta_0)\)：总体准则的 Hessian（曲率矩阵）。 - \(\Psi\)：\(\sqrt{n}(\hat{\theta}_n - \theta_0)\) 的渐近协方差（sandwich 形式）。 - \(Q_\Lambda = \sum_{j=1}^d \lambda_j Z_j^2\)：加权卡方分布，\(\lambda_j\) 是 \(J^{1/2} \Psi J^{1/2}\) 的特征值。

模型： - 数据生成机制：\(X_i \sim P_0\)，独立同分布。 - 统计模型：参数 \(\theta\) 通过准则函数 \(R_n(\theta)\) 与数据连接，而非通过似然。\(R_n(\theta)\) 可以是损失函数、估计方程、伪似然等。 - 已知：先验 \(\pi(\theta)\)，准则函数 \(\ell_\theta(x)\) 的形式。 - 要估的对象：\(\theta_0\)（总体目标），以及学习率 \(\omega\) 使得可信集有正确覆盖率。

可观测数据： - 可观测：\(X_1, \dots, X_n\)（原始样本），以及从 bootstrap 分布 \(P^*\) 重抽样的 \(X_1^*, \dots, X_n^*\)。 - 不可观测：总体分布 \(P_0\)、总体目标 \(\theta_0\)、总体覆盖率曲线 \(c_{n,\alpha}(\omega)\)。 - 关键识别假设：bootstrap 分布 \(P^*\) 是 \(P_0\) 的一致估计，使得 bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 近似 \(c_{n,\alpha}(\omega)\)。

第二步：最小内核——一维均值估计的特例¶

考虑最简单的特例：\(d=1\)（标量参数），准则函数为负平均对数似然，但模型可能误设。具体地：

设 \(X_i \sim P_0\)，\(\mathbb{E}[X_i] = \mu_0\)，\(\text{Var}(X_i) = \sigma^2\)。
准则函数：\(R_n(\theta) = \frac{1}{2n} \sum_{i=1}^n (X_i - \theta)^2\)（负对数似然，假设方差已知为 1，但实际方差可能不是 1）。
总体目标：\(\theta_0 = \mu_0\)（风险最小化者）。
经验最小化者：\(\hat{\theta}_n = \bar{X}_n\)。
广义后验：\(\Pi_{n,\omega}(\theta \mid X^n) \propto \exp\left\{-\frac{\omega n}{2} \cdot \frac{1}{n} \sum_{i=1}^n (X_i - \theta)^2\right\} \pi(\theta)\)。
若取平坦先验 \(\pi(\theta) \propto 1\)，则后验为 \(\mathcal{N}(\bar{X}_n, (\omega n)^{-1})\)。
可信区间（后验等尾区间）：\(C_{n,\omega,\alpha} = \left[\bar{X}_n - \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}, \bar{X}_n + \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}\right]\)，其中 \(z_{1-\alpha/2}\) 是标准正态的 \(1-\alpha/2\) 分位数。
频率覆盖率：
\[c_{n,\alpha}(\omega) = P_0\left\{ \mu_0 \in \left[\bar{X}_n - \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}, \bar{X}_n + \frac{z_{1-\alpha/2}}{\sqrt{\omega n}}\right] \right\} = P_0\left\{ |\sqrt{n}(\bar{X}_n - \mu_0)| \leq \frac{z_{1-\alpha/2}}{\sqrt{\omega}} \right\}.\]
由中心极限定理，\(\sqrt{n}(\bar{X}_n - \mu_0) \rightsquigarrow \mathcal{N}(0, \sigma^2)\)，因此一阶近似：
\[c_{n,\alpha}(\omega) \to \Phi\left(\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) - \Phi\left(-\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right).\]
要校准到名义水平 \(1-\alpha\)，需要：
\[\Phi\left(\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) - \Phi\left(-\frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma}\right) = 1-\alpha \quad \Rightarrow \quad \frac{z_{1-\alpha/2}}{\sqrt{\omega} \sigma} = z_{1-\alpha/2} \quad \Rightarrow \quad \omega = \frac{1}{\sigma^2}.\]
核心洞察：校准后的学习率 \(\omega = 1/\sigma^2\) 恰好是“后验方差 = 抽样方差”的条件。如果模型正确（\(\sigma^2 = 1\)），则 \(\omega = 1\) 自动校准；如果模型误设（\(\sigma^2 \neq 1\)），则需要调整 \(\omega\) 来匹配方差。

这个特例揭示了本文的核心命题： 1. 标量学习率只能修复尺度：在这个一维例子中，后验和抽样分布都是正态的，唯一的差异是方差。标量 \(\omega\) 可以完美修复这个差异，因为两个分布的形状相同（都是正态）。 2. 在多维情况下，形状差异无法修复：如果后验协方差 \(J^{-1}/\omega\) 与抽样协方差 \(\Psi\) 不成比例（即特征值不全相等），则标量 \(\omega\) 只能同时缩放所有方向，无法改变椭球的偏心方向。因此，一个 \(\omega\) 不能同时校准所有名义水平。 3. bootstrap 校准的根：bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 近似 \(c_{n,\alpha}(\omega)\)，其根 \(\hat{\omega}_n\) 一致估计 \(\omega^\dagger\)（总体根），收敛速率由 bootstrap 近似的精度决定。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在正则固定维数渐近框架下，分析广义后验校准（GPC）算法的理论性质——bootstrap 覆盖率曲线的根是否一致估计总体根、覆盖率误差的高阶结构、以及标量学习率的能力边界。
核心工具/方法：Edgeworth 展开（后验和抽样）、bootstrap 近似、随机逼近（Robbins-Monro）理论。
主要结论：① 在均匀覆盖近似和局部可识别条件下，bootstrap 根以相同速率一致估计总体根（Theorem 1）；② 覆盖率误差可分解为抽样 Edgeworth 修正与后验边界/中心/形状修正（Theorem 2）；③ 标量学习率只能在校准的特定名义水平上修复尺度，不能修复形状误设——仅当后验协方差与抽样协方差成比例时才能同时校准所有水平（Proposition 1）。

关键设定与假设¶

完整设定（在第二节最小记号基础上补充）： - 准则函数：\(R_n(\theta) = n^{-1} \sum_{i=1}^n \ell_\theta(X_i)\)，\(\ell_\theta\) 六次连续可微，有足够高阶的可积包络。 - 总体目标：\(\theta_0\) 是 \(R(\theta) = P_0 \ell_\theta\) 的唯一内点最小化者，\(J = \nabla^2 R(\theta_0)\) 正定。 - 先验：正且四次连续可微。 - 估计量：\(\hat{\theta}_n\) 是 \(\nabla R_n(\hat{\theta}_n) = 0\) 的一致内点局部最小化者。 - 后验集中性：后验质量在固定邻域外指数小，局部 Laplace 展开可逐项微分。 - bootstrap 正则性：bootstrap 版本满足相同条件，条件概率趋于 1。

关键假设： - Assumption 1（局部后验与抽样极限）：准则函数在 \(\hat{\theta}_n\) 附近有二次展开（含三阶、四阶项），bootstrap 版本类似；后验和抽样均渐近正态；后验有 Edgeworth 展开（引用 Kolassa & Kuffner 2020 的结论推广到广义后验）。 - Assumption 2（均匀 bootstrap 近似与覆盖率根的识别）：总体覆盖率曲线 \(c_{n,\alpha}(\omega)\) 在紧集 \(\Omega\) 上有唯一根 \(\omega^\dagger_n\)，局部可识别（根附近有正的最小导数下界），bootstrap 覆盖率曲线 \(c_{n,\alpha}^*(\omega)\) 以速率 \(a_n\) 均匀近似 \(c_{n,\alpha}(\omega)\)，且 bootstrap 方程在邻域内有解。

相比已有文献的强化/放宽： - 强化：要求后验 Edgeworth 展开（Kolassa & Kuffner 2020 只对正则后验证明，本文假设对广义后验也成立）。 - 放宽：不要求模型正确——准则函数可以不是似然，允许模型误设。 - 关键限制：固定维数（\(d\) 固定）、正则问题（准则函数光滑）、可信集有标量边界表示（排除任意 HPD 集）。

主要结果¶

Proposition 1（标量校准的极限）： - 陈述：对于椭球可信集 \(E_{n,\omega,\alpha}\)，一阶覆盖率为 \(P\{Q_\Lambda \leq q_{d,1-\alpha}/\omega\} + o(1)\)，其中 \(Q_\Lambda = \sum \lambda_j Z_j^2\)，\(\lambda_j\) 是 \(J^{1/2} \Psi J^{1/2}\) 的特征值。标量 \(\omega_0\) 能同时校准所有 \(\alpha \in (0,1)\) 当且仅当 \(\lambda_1 = \dots = \lambda_d = \omega_0^{-1}\)，即 \(\Psi = \omega_0^{-1} J^{-1}\)。 - 直觉：后验椭球的形状由 \(J^{-1}\) 决定，抽样椭球的形状由 \(\Psi\) 决定。标量 \(\omega\) 只能同时缩放所有轴，不能改变椭球的偏心方向。只有当两个椭球形状相同（成比例）时，一个 \(\omega\) 才能同时匹配所有方向。 - 必要条件：后验协方差与抽样协方差成比例。 - 解决的技术难点：将覆盖率问题转化为加权卡方分布的分位数匹配问题，利用 Laplace 变换的唯一性证明特征值必须全相等。

Theorem 1（bootstrap 根的稳定性）： - 陈述：在 Assumption 2 下，bootstrap 根 \(\hat{\omega}_n\) 满足 \(\hat{\omega}_n - \omega^\dagger_n = O_p(a_n)\)，且 \(c_{n,\alpha}(\hat{\omega}_n) - (1-\alpha) = O_p(a_n)\)。 - 直觉：bootstrap 覆盖率曲线均匀近似总体曲线（速率 \(a_n\)），且总体曲线在根附近有正导数，因此根的误差被压缩到与近似误差同阶。 - 必要条件：均匀近似（Assumption 2.3）、局部可识别（Assumption 2.2 和 2.4）、bootstrap 方程有解（Assumption 2.5）。 - 解决的技术难点：将“根的一致估计”问题分解为“近似误差传递”问题，利用中值定理和导数下界得到速率。

Theorem 2（高阶覆盖率展开）： - 陈述：对于有标量边界表示的可信集，覆盖率可展开为：

\[c_{n,\alpha}(\omega) = C_{0,\alpha}(\omega) + n^{-1/2} C_{1,\alpha}(\omega) + n^{-1} C_{2,\alpha}(\omega) + o(n^{-1}),\]

其中 \(C_{0,\alpha}(\omega) = G_{0,\omega}(r_0)\) 是一阶项，\(C_{1,\alpha}(\omega) = G_{1,\omega}(r_0) + g_{0,\omega}(r_0) \delta_1\) 包含抽样 Edgeworth 修正（\(G_{1,\omega}\)）和后验边界修正（\(\delta_1\)），\(C_{2,\alpha}(\omega)\) 包含二阶项。 - 直觉：覆盖率误差有两个来源：① 抽样分布的非正态性（Edgeworth 修正 \(G_{1,\omega}, G_{2,\omega}\)）；② 后验可信集边界、中心和形状的随机性（边界修正 \(\delta_1, \delta_2\)）。两者在二阶项中交互。 - 必要条件：标量边界表示（排除任意 HPD 集）、均匀 Edgeworth 展开、边界展开的平滑性。 - 解决的技术难点：将随机可信集边界纳入 Edgeworth 展开框架，通过 Taylor 展开分离边界修正与分布修正。

证明路线与技术技巧¶

整体路线（以 Theorem 1 为例）： 1. 一致性：利用均匀近似（Assumption 2.3）和局部可识别（Assumption 2.2），证明 bootstrap 根 \(\hat{\omega}_n\) 是 \(\omega^\dagger_n\) 的一致估计。 2. 速率：在邻域 \(N_n\) 内应用中值定理，结合导数下界（Assumption 2.4），得到 \(|\hat{\omega}_n - \omega^\dagger_n| \leq \Delta_n / \eta\)，其中 \(\Delta_n = \sup |c_{n,\alpha}^* - c_{n,\alpha}| = O_p(a_n)\)。 3. 覆盖率误差：直接由 bootstrap 方程和均匀近似得到 \(|c_{n,\alpha}(\hat{\omega}_n) - (1-\alpha)| \leq \Delta_n\)。

关键跳跃点： - 从均匀近似到根的一致估计：需要 Assumption 2.2 的“局部可识别”条件——在根附近，覆盖率曲线有正的最小导数下界。这保证了近似误差不会在求根过程中被放大。 - 从一阶到高阶：Theorem 2 的关键跳跃是将随机可信集边界（后验分位数）的 Edgeworth 展开与抽样分布的 Edgeworth 展开结合。这需要假设可信集有标量边界表示，使得边界修正 \(\delta_1, \delta_2\) 可以从后验 Edgeworth 展开中提取。

技术技巧点名： - Edgeworth 展开（后验和抽样）：用于推导覆盖率的高阶展开（Theorem 2）。后验 Edgeworth 展开引用 Kolassa & Kuffner (2020) 的结论，推广到广义后验。 - bootstrap 近似：用 bootstrap 覆盖率曲线 \(c_{n,\alpha}^*\) 近似总体曲线 \(c_{n,\alpha}\)（Assumption 2.3）。 - 中值定理：在 Theorem 1 的证明中，用于将根的误差与覆盖率误差联系起来。 - Laplace 变换的唯一性：在 Proposition 1 的证明中，用于从分布相等推导特征值全相等。 - Kushner-Clark ODE 方法：在 Corollary 1 的证明中，用于分析随机逼近算法的收敛性。 - Robbins-Siegmund 收敛定理：在 Corollary 1 的证明中，用于处理局部 Lyapunov 函数。

真实例子与应用¶

本文为纯理论，无实证例子。论文没有模拟实验、真实数据分析或应用案例。所有结果都是理论定理和证明。

🔎 结论是否比证明窄¶

Proposition 1 的结论（标量学习率只能同时校准所有水平当且仅当协方差成比例）是严格证明的，没有过度 claim。
Theorem 1 的结论（bootstrap 根以速率 \(a_n\) 一致估计总体根）依赖于 Assumption 2 的多个条件，尤其是“均匀近似”和“局部可识别”。作者在 Section 4 开头承认“在光滑固定维数估计问题中，\(a_n\) 可以是 \(O(n^{-1})\)”，但未证明这个速率在一般条件下可达——这取决于具体的 Edgeworth 展开精度。
Theorem 2 的结论依赖于“标量边界表示”假设，作者明确承认“这排除了任意最高后验密度集，除非其随机几何允许标量确定性等价表示”。因此，结论的适用范围比“所有可信集”窄。
Corollary 1 的结论是局部的（在邻域 \(K_n\) 内收敛），作者承认“全局收敛需要额外的单调性或递归条件”。算法收敛性只在局部成立，不是全局保证。
Discussion 中，作者说“bootstrap 校准在固定名义水平上是有效方法”，但 Theorem 1 只证明了根的一致估计，没有证明校准后的覆盖率误差比未校准的小——这需要比较 \(c_{n,\alpha}(\hat{\omega}_n)\) 与 \(c_{n,\alpha}(1)\) 的差距，而本文未做此比较。

四、开放问题¶

有限 bootstrap、后验 Monte Carlo 和边界估计误差的联合分析：本文只分析了“精确 bootstrap 覆盖率曲线”的根，但实际算法用 Monte Carlo 估计 \(c_{n,\alpha}^*(\omega)\)。这些额外误差如何影响根的收敛性和覆盖率？扎根于：Section 5 开头“The implemented GPC algorithm replaces \(c_{n,\alpha}^*\) with a Monte Carlo estimate”，以及 Discussion 第一点“the stochastic approximation results should be combined with a full analysis of the errors due to finite bootstrap resampling, posterior Monte Carlo, and boundary estimation”。
任意 HPD 集的多元后验 Edgeworth 定理：本文的 Theorem 2 限于有标量边界表示的可信集。对于任意形状的 HPD 集，需要真正的多元 Edgeworth 展开来处理随机边界。扎根于：Discussion 第二点“a genuinely multivariate posterior Edgeworth theorem for arbitrary highest posterior density sets would remove the restrictions imposed by the scalar radii used here”。
非光滑 Gibbs 损失的 Edgeworth 展开：本文假设准则函数光滑（六次可微）。对于非光滑损失（如分位数回归、支持向量机），一阶正态性可能成立但缺乏导数用于形式 Edgeworth 级数。需要不同的展开方法。扎根于：Discussion 第三点“non-smooth Gibbs losses require different expansions because first-order normality may hold without the derivatives used in formal Edgeworth series”。
高维校准：本文限制在固定维数。高维设定下（\(d \gg n\)），Edgeworth 展开失效，需要不同的校准策略（如基于稀疏性、随机矩阵理论）。扎根于：Discussion 第五点“a high-dimensional calibration cannot be obtained by using a fixed-dimensional Edgeworth expansion without additional structure”。
依赖数据的校准：本文假设独立观测。对于时间序列或空间数据，需要块 bootstrap 或依赖乘子 bootstrap 论证。扎根于：Discussion 第四点“dependent data require a block or dependent multiplier bootstrap argument”。

Maintained by 陈星宇 · Homepage · Source on GitHub