Wild bootstrap for mean response inference in functional linear regression models¶

作者: Hyemin Yeon, Xiongtao Dai, Daniel Nordman
主题: 非参数 / 半参数
相关性: 7/10
链接: https://arxiv.org/abs/2606.16089

一、领域脉络与小综述¶

这个方向是什么：本方向解决的是函数型线性回归模型（FLRM）中均值响应的区间推断问题。给定标量响应 \(Y\) 和函数型预测变量 \(X\)（取值于无限维希尔伯特空间），目标是对条件均值 \(\mu(X_0) \equiv \alpha + \langle \beta, X_0 \rangle\)（在某个新的函数型输入 \(X_0\) 处）构造置信区间。该问题的核心困难在于：（1）协方差算子 \(\Gamma\) 的逆无界，导致估计和推断都需要正则化（通常通过截断特征分解）；（2）无限维带来的 bootstrap 偏误（bootstrap bias）和分布逼近问题；（3）误差可能存在异方差（条件方差依赖于 \(X\)），从而影响 bootstrap 方案的选择。当前该子方向的成熟度属于方法已存在但各有明显局限的阶段——已有残差 bootstrap（RB）速度快但仅适用于同方差，配对 bootstrap（PB）适用范围广但计算昂贵且区间偏保守，而wild bootstrap（WB）作为一种介于二者之间的折中方案，此前在 FLRM 中未被正式研究。
发展脉络（history）：把本文 introduction 引用的工作串成一条线：
- 奠基工作：
  - Efron (1979) 和 Freedman (1981) 为经典线性回归中 bootstrap 方法（残差、配对）奠定基础。Freedman (1981) 特别给出了异方差下配对 bootstrap 的合理性。
  - Liu (1988) 和 Wu (1986) 提出 wild bootstrap（WB），旨在处理异方差回归，且计算上比 PB 轻量。Liu (1988) 将其表述为"残差 bootstrap 的异方差稳健版本"。
  - 在 FLRM 中，Cardot et al. (2007) 证明了均值响应估计量（FPCR）的 CLT——"It is impossible for \(a_n(\hat{\beta}_h - \beta)\) to converge in distribution to a non-degenerate random element in \(H\) for any diverging scaling sequence"，且给出了针对均值响应 \(T_{\text{mean},n}(X_0)\) 的正态极限。这为后续 bootstrap 推断提供了理论起点。
- 主要进展：
  - González-Manteiga & Martínez-Calvo (2011) 首次将 bootstrap（RB 以及一种 WB 变体）引入 FLRM，但仅针对同方差情形下的均值响应或投影 \(\langle \beta, X_0 \rangle\)。本文指出其 WB 方案与本文有本质区别：未考虑异方差下的 studentization 且处理的是"有偏 or 不完整的均值"。
  - Yeon et al. (2023) 在同方差下系统研究了 RB 的均响应推断，证明其一致性并给出截断参数选择建议。
  - Khademnoe & Hosseini-Nasab (2024) 和 Lin & Lin (2025) 将 bootstrap 用于同方差 FLRM 的斜率检验（\(H_0: \beta = 0\)）。
- 当前 frontier / 本文位置：
  - Yeon et al. (2024a) 提出了异方差下带偏差校正的 PB，但其计算昂贵且区间宽度对截断参数敏感。
  - 本文是第一个在 FLRM 中正式建立 wild bootstrap 一致性的工作，填补了"异方差下、计算高效的区间推断"这一 gap。作者明确指出："formal inference with WB for even mean inference has not been established for FLRMs under possible heteroscedastic errors, which represents a methodological and theoretical gap"。
子线索聚类：这些被引文献大致落于 3 条子线索：
1. 均值响应估计与 CLT（Cardot et al., 2007; Hall & Horowitz, 2007; Cai & Hall, 2006）：关注点估计、FPCR 的收敛速率和 CLT。这些文献为推断提供了渐近正态性基础，但未直接处理 bootstrap 的有限样本改进。
2. 同方差下的 bootstrap 推断（González-Manteiga & Martínez-Calvo, 2011; Yeon et al., 2023; Khademnoe & Hosseini-Nasab, 2024; Lin & Lin, 2025）：主要使用 RB。核心假设是误差同方差，因此在异方差下 RB 会失效（论文数值实验中 RB 覆盖率极低，甚至无法绘出）。
3. 异方差下的 bootstrap 推断（Yeon et al., 2024a; 本文）：Yeon et al. (2024a) 使用 PB，但其计算负担重（需每次 resample 后重新估计协方差算子）。本文提出 WB 作为折中。此外，Freedman (1981) 在经典 LRM 中提供了配对 bootstrap 的理论，是 PB 的支撑，但在 FLRM 中 PB 的宽区间和计算成本是其短板。
这个方向在追问的核心问题：
1. 如何构造 FLRM 中均值响应的有效区间推断？——CLT 收敛慢且依赖于未知协方差 \(\Lambda\) 和截断参数 \(h_n\)，因此 bootstrap 的良好有限样本性质至关重要。
2. 如何兼顾计算效率与异方差稳健性？——RB 快但只对同方差有效，PB 稳健但计算昂贵。WB 能否同时做到"快"且"能处理异方差"？
3. 如何处理无限维带来的逼近偏误（bootstrap bias）？——FLRM 中 FPCR 估计量 \(\hat{\beta}_h\) 即使一致，其 bootstrap 版本也会因为来自同一截断而产生额外偏误（Yeon et al. (2023) 和本文都通过采用不同截断水平 \(g_n, h_n\) 来处理这一问题）。
4. 如何选择截断参数 \(h_n\)？——对均值响应推断，截断参数选择不仅影响点估计偏误，还影响区间覆盖率和宽度。现有方法（cross-validation, 方差解释比例）不保证对区间估计最优。
⚠️ 作者的 framing：作者把缺口 frame 成"WB 是 RB 和 PB 的自然折中（bridge the gap）"——它的设计是"fixed regressors like RB + resampled errors like WB"，因此 计算速度比 PB 快很多，同时覆盖范围比 RB 宽（异方差）。作者通过强调以下点来 positioning：
- WB 下可以提出稳定化波动方法（SVM）选择 \(h_n\)，而 PB 因为区间宽度不稳定难以应用此策略。
- WB 在高偏态异方差下甚至优于 PB（图 2-3），这是一个强 claim。
- WB 的理论证明风格与 PB 不同（bootstrap 数据不可交换），需要新的处理。
- 被淡化/回避的竞争路线：作者未深入讨论如何将 PB 的偏差校正方法（Yeon et al., 2024a）移植到 WB，也未比较 WB 与贝叶斯方法（如基于高斯过程的函数型回归）的区间推断。
- 值得研究者去查的问题：在归入零均值假设时，本文的模拟和例子都假设 \(E[Y]=0, E[X]=0\)，并将截距剥离。在实际应用中其建议的截断参数选择是否对非零截距鲁棒？另外，原始数据的预白化步骤（如先对 \(X\) 进行 Karhunen–Loève 展开）是否会影响 WB 的覆盖性能？本文未讨论这一实操细节。
张力：未见明显对立引用。主要张力存在于不同 bootstrap 方法在不同条件下的表现权衡（RB 快但仅在 homoscedastic 下准；PB 准但慢且保守；WB 居中）。这本质上是trade-off而不是contradiction。本文的工作就是将 WB 纳入这一 trade-off 图谱。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号：
- \(Y_i\)：标量响应，可观测。
- \(X_i\)：函数型预测变量，取值于希尔伯特空间 \(H\)（例如 \(L^2[0,1]\)），可观测。
- \(\varepsilon_i\)：误差项，满足 \(E[\varepsilon_i | X_i] = 0\)，但 \(\text{Var}(\varepsilon_i | X_i) = \sigma^2(X_i)\) 可能依赖于 \(X_i\)（异方差），不可观测。
- \(\alpha\)：截距（标量），要估计的参数。
- \(\beta \in H\)：斜率函数，要估计的参数（无限维）。
- \(\mu(X) \equiv \alpha + \langle \beta, X \rangle\)：均值响应，要推断的 estimand。
- \(\Gamma = E[(X - E[X]) \otimes (X - E[X])]\)：\(X\) 的协方差算子，紧算子且自伴，不可直接观测，但可用样本估计。
- \(\Delta = E[(Y - E[Y])(X - E[X])]\)：\(X\) 与 \(Y\) 的交叉协方差函数，可估计。
- \(\gamma_j, \phi_j\)：\(\Gamma\) 的第 \(j\) 个特征值（非负、非增、趋于零）和特征函数。
- \(\hat{\gamma}_j, \hat{\phi}_j\)：\(\hat{\Gamma}_n\) 的样本特征值和特征函数。
- \(h_n, k_n, g_n\)：三个不同的截断水平。\(h_n\) 用于目标 FPCR 估计 \(\hat{\beta}_{h_n}\) 和缩放 \(\hat{s}_{h_n}(x)\)；\(k_n\) 用于计算原始残差 \(\hat{\varepsilon}_{i,k_n}\)；\(g_n\) 用于 WB 生成过程中的估计 \(\hat{\mu}_{g_n}(X_i)\)。
- \(\hat{\beta}_{h_n} = \sum_{j=1}^{h_n} \hat{\gamma}_j^{-1} \langle \hat{\Delta}_n, \hat{\phi}_j \rangle \hat{\phi}_j\)：FPCR 估计量（截断正则化后）。
- \(\hat{s}_{h_n}(x) = \langle \hat{\Lambda}_n \hat{\Gamma}_{h_n}^{-1} (x - \bar{X}), \hat{\Gamma}_{h_n}^{-1} (x - \bar{X}) \rangle\)：估计的缩放因子（用于 studentization），其中 \(\hat{\Lambda}_n\) 是基于残差 \(\hat{\varepsilon}_{i,k_n}\) 的样本协方差算子。
- \(W_i\)：乘子随机变量，独立于原始数据，均值为 0，方差为 1。用于生成 WB 误差。
- \(T_{\text{mean}, n}(X_0)\)：目标统计量（学生化的均值响应估计误差）。
- \(T_{\text{mean}, n}^*(X_0)\)：WB 版本的统计量。
模型：
- 数据生成机制：\(Y_i = \alpha + \langle \beta, X_i \rangle + \varepsilon_i\)，其中 \(\{X_i\}_{i=1}^n\) 是独立同分布（iid）于分布 \(P_X\)（带 \(E[\|X\|^2] < \infty\)），\(\varepsilon_i\) 条件于 \(X_i\) 独立，且 \(E[\varepsilon_i | X_i] = 0\)。
- 要估计的参数：\(\alpha\)（标量）和 \(\beta\)（函数，无限维）。
- 已知的部分：\(\Gamma\) 的谱分解结构已知（特征值多项式衰减速率为 \(a\)，特征函数为光滑基底如 Fourier），但具体数值未知。误差的条件方差 \(\sigma^2(X)\) 形式未知（可以是同方差或异方差）。
- 要识别的对象：\(\beta = \Gamma^{-1} \Delta\)，只要 \(\{\, x: \Gamma x = 0 \,\} = \{0\}\) 即可识别。
可观测数据：
- 实际能观测到的是什么：独立同分布样本 \(\{(Y_i, X_i)\}_{i=1}^{n}\)。\(X_i\) 是函数型曲线，实际观测时可能在离散网格上（如等距 50 点或 365 点），但本文假设是光滑曲线（在 \(H\) 中完全观测）。误差 \(\varepsilon_i\) 永远观测不到，只能通过残差近似。
- 想要的但观测不到的：真正的斜率函数 \(\beta\)、真正的均.error 条件方差 \(\sigma^2(X)\)、以及 \(\Gamma\) 的精确逆 \(\Gamma^{-1}\)（无界）。
- 关键区分：\(X_0\) 是一个新的、独立于训练集的函数型输入，其分布与 \(X_i\) 同分布。可在新点做推断是可观测的（输入新曲线 \(X_0\)，可计算 \(\hat{\mu}(X_0)\)），但真正的 \(\mu(X_0)\) 是未知的。

第二步：讲最小内核——最简特例¶

最简特例：假设 \(H = \mathbb{R}^1\)（即 \(X\) 是标量而非函数），且误差为异方差——这本质上是经典线性回归。那么 FLRM 退化为：

\[Y_i = \alpha + \beta X_i + \varepsilon_i,\quad \varepsilon_i \text{ 独立于 } X_i, \quad E[\varepsilon_i] = 0,\, \text{Var}(\varepsilon_i) = \sigma^2(X_i).\]

此时 \(\Gamma = \text{Var}(X) > 0\)（正标量），\(\beta = \Gamma^{-1} \Delta = \text{Cov}(X,Y) / \text{Var}(X)\)。FPCR 估计量 \(\hat{\beta}_h\) 退化为 OLS 估计量 \(\hat{\beta} = (\sum_i X_i^2)^{-1} \sum_i X_i Y_i\)（通常中心化后）。截断参数 \(h_n\) 消失（因为一维时 \(\Gamma^{-1}\) 有界），所以本文的 \(s_h(x) = \Lambda / \Gamma^2 \cdot x^2\)，其中 \(\Lambda = E[X^2 \varepsilon^2]\)。

在这个最简特例下： - 目标统计量：

\[T_{\text{mean}, n}(X_0) = \frac{\sqrt{n}}{\hat{s}^{1/2}(X_0)} \big( \hat{\mu}(X_0) - \mu(X_0) \big),\]

其中 \(\hat{\mu}(X_0) = \hat{\alpha} + \hat{\beta} X_0\)，\(\hat{s}(X_0) = \hat{\Lambda} / \hat{\Gamma}^2 \cdot X_0^2\)。

Wild bootstrap 过程（一维版本）：
- 计算 OLS 残差：\(\hat{\varepsilon}_i = Y_i - \hat{\mu}(X_i)\)。
- 生成乘子 \(W_i\)（例如 \(W_i \sim N(0,1)\)，独立于一切）。
- 生成 bootstrap 响应：\(Y_i^* = \hat{\mu}(X_i) + W_i \hat{\varepsilon}_i\)。
- 在 bootstrap 样本 \(\{(Y_i^*, X_i)\}\) 上重新计算 \(\hat{\beta}^*\) 和 \(\hat{\mu}^*(X_0)\)，以及 bootstrap 缩放 \(\hat{s}^*(X_0)\)（用 bootstrap 残差 \(\hat{\varepsilon}_i^* = Y_i^* - \hat{\mu}^*(X_i)\) 计算）。
- 计算 bootstrap 统计量：
  \[T_{\text{mean}, n}^*(X_0) = \frac{\sqrt{n}}{[\hat{s}^*(X_0)]^{1/2}} \big( \hat{\mu}^*(X_0) - \hat{\mu}(X_0) \big)。\]
为什么 WB 能工作（核心想法）：
- 在经典一维回归中，若误差同方差，残差 bootstrap（RB，从 \(\{\hat{\varepsilon}_i\}\) 中随机抽样替换）会给出一致逼近，因为 \(\hat{\varepsilon}_i \approx \varepsilon_i\)，且 \(\varepsilon_i\) 是 iid。
- 若误差异方差，RB 失败：因为从所有残差中均匀抽样得到的 bootstrap 误差方差是 \(\frac{1}{n}\sum_i \hat{\varepsilon}_i^2 \to E[\varepsilon^2]\)，这与理想方差 \(\text{Var}(\varepsilon_i|X_i) = \sigma^2(X_i)\) 不匹配。
- WB 的修正：通过乘以 \(W_i\)（均值为 0，方差为 1），\(W_i \hat{\varepsilon}_i\) 的条件（于原始数据）方差是 \(\hat{\varepsilon}_i^2 \xrightarrow{p} \sigma^2(X_i)\)——即每一个 bootstrap 残差刻画了对应观测的条件方差。因此 bootstrap 复制了异方差的结构，即使每次 resample 是依赖同一组固定 \(X_i\) 的。
推广到 FLRM 的额外困难：
- 在函数型情形下，\(\hat{\beta}_{h_n}\) 不是 OLS 而是截断 FPCR。当 \(h_n\) 增大，\(\hat{\beta}_{h_n}\) 的方差增大但偏误减小，导致均衡。Wild bootstrap 必须处理这种“截断引入的额外偏误”以及“缩放因子 \(\hat{s}_{h_n}\) 的估计误差”在 bootstrap 世界中的传播。本文通过引入三个不同的截断水平（\(g_n, k_n, h_n\)）来分离这些效应。

三、这篇论文做了什么¶

三句话：
1. 研究了什么问题：在函数型线性回归模型（FLRM）中提出并证明了 wild bootstrap（WB）方法在均值响应（\(\mu(X_0) = \alpha + \langle \beta, X_0 \rangle\)）和中心化投影（\(\langle \beta, X_0 - E[X] \rangle\)）上的区间推断一致性。
2. 核心工具/方法：采用乘子 wild bootstrap（在残差上施加独立随机权重\(W_i\)），构建 bootstrap 残差分布，并提出了一个稳定化波动方法（SVM）来实际选择截断水平 \(h_n\)——这一策略利用了 WB 区间在 \(h_n\) 上宽度和中心更稳定的特点。
3. 主要结论：在温和的假设下（含特征值多项式衰减、斜率函数平滑、异方差误差满足矩条件），WB 条件分布依概率逼近目标统计量的渐近分布；模拟和实际数据（US 天气数据）显示，WB 在异方差和强偏态下比 RB 和 PB 更平衡（Coverage 和计算时间），且 SVM 选出的截断水平可获得合理的覆盖率。
关键设定与假设（补充第二节中的记号）：
- 核心定义：
  - 三个截断水平 \(h_n, k_n, g_n\)。
  - 目标估计量：\(\hat{\beta}_{h_n} = \sum_{j=1}^{h_n} \hat{\gamma}_j^{-1} \langle \hat{\Delta}_n, \hat{\phi}_j \rangle \hat{\phi}_j\)（FPCR）。
  - 缩放因子：\(\hat{s}_{h_n}(x) = \| \hat{\Lambda}_n^{1/2} \hat{\Gamma}_{h_n}^{-1} (x - \bar{X}) \|^2\)，其中 \(\hat{\Lambda}_n\) 基于残差 \(\hat{\varepsilon}_{i,k_n}\)。
- 关键假设（来自正文和附录S1.2）：
  - (A1)-(A4)：特征值 \(\gamma_j\) 以 \(j^{-a}\) (\(a>2\)) 衰减，特征函数 \(\phi_j\) 光滑，斜率系数 \(\langle \beta, \phi_j \rangle\) 以 \(j^{-b}\) (\(b>1\)) 衰减，FPC scores 有足够高矩（如 \(E[\xi^{10}]<\infty\) 在例2中）。
  - 条件 (C)：误差条件方差 \(\sigma^2(X) = E[\varepsilon^2|X]\) 存在且满足某种 Lipschitz 型条件。
  - 条件 (L)：误差的（条件）四阶矩有界：\(E[\varepsilon^4|X] <C\) a.s.。
  - 条件 (R)：硬约束 \(g_n / h_n \to 0\)，即用于生成 WB 估计 \(\hat{\mu}_{g_n}\) 的截断水平远小于目标估计量截断水平 \(h_n\)——这是为了避免 WB 分布逼近中的偏误。
  - 条件 (W1)-(W2)：乘子 \(W_i\) 独立于原始数据，均值为 0，方差为 1，且四阶矩有界（标准正态、双点分布等均满足）。
  - 条件 (D)：截断水平增长率满足 \(n^{-1/2} h_n^{7/2} (\log h_n)^4 = o(1)\) 和 \(h_n \to \infty\)——确保截断引入的估计误差可忽略。
- 相比已有文献的放松/强化：放宽了同方差假设（相比 Yeon et al. (2023)），但又不像 Yeon et al. (2024a) 的 PB 那样要求每个 bootstrap resample 都重算协方差算子；截断参数允许因 \(X_0\) 变化（SVM 可针对不同 \(X_0\) 选不同 \(h_n\)），这在 cross-validation 或 FVE 方法中无法做到。
主要结果：
- 定理 1（一致性）：在附录的附加条件下，对任意新的 \(X_0\)（与训练集独立同分布），有
  \[\sup_{y \in \mathbb{R}} | P^*(T_n^*(X_0) \le y | X_0) - P(T_n(X_0) \le y | X_0) | \xrightarrow{p} 0\]
  其中 \(T_n\) 是 \(T_{\text{mean},n}\) 或 \(T_{\text{proj},n}\)。直觉：WB 通过固定 \(X_i\) 并在 \(\hat{\varepsilon}_i\) 上乘以随机权重 \(W_i\)，在 bootstrap 世界中复制了原始统计量的渐近正态性。
- 必要条件：关键是截断水平需要满足 \(g_n/h_n \to 0\)（条件 (R)），且 \(h_n\) 不能增长太快（条件 (D)）。
- 解决的技术难点：WB 的 bootstrap 数据不具有 exchangeability（因为 \(\varepsilon_i^*\) 的方差依赖于固定的 \(\hat{\varepsilon}_i\) 和 \(X_i\)），所以无法用简单的 reordering 论证。理论证明（附录 S1.3）需要先证明 WB 版本的 FPCR 估计量 \(\hat{\beta}_{h_n}^*\) 的正态性，再证明柱状态统计量的分布逼近成立。
证明路线与技术技巧：
- 整体路线（3-5步）：
  1. 将目标统计量 \(T_n(X_0)\) 展开为 \(n^{-1/2} \sum_{i=1}^n \psi_i(X_0) + o_p(1)\)（由 CLT，\(\psi_i\) 是影响函数），其中影响函数涉及 \(\Gamma^{-1} (X_i - E[X])\) 与误差 \(\varepsilon_i\) 的乘积。
  2. 将 WB 统计量 \(T_n^*(X_0)\) 展开为 \(n^{-1/2} \sum_{i=1}^n W_i \hat{\varepsilon}_{i,k_n} \cdot \hat{R}(X_0, X_i) + o_{P^*}(1)\)，其中 \(\hat{R}\) 是估计的残差权重（涉及 \(\hat{\Gamma}_{h_n}^{-1}\) 和 \(\hat{\Lambda}_n\)）。
  3. 关键跳跃点（引理 S.??）：证明 \(n^{-1} \sum_i \hat{\varepsilon}_{i,k_n}^2 \hat{R}^2(X_0, X_i) \xrightarrow{p} \lim_{n} s_{h_n}(X_0)\) 且 \(n^{-1} \sum_i \hat{\varepsilon}_{i,k_n}^3 \hat{R}^3(X_0, X_i) = o_p(1)\)——这是 Lindeberg 条件的 bootstrap 版本。
  4. 利用乘子 \(W_i\) 的独立性及其矩条件（W1-W2），对固定数据 \((Y_i, X_i)\)，条件于它们，\(\sum_i W_i \hat{\varepsilon}_{i,k_n} \hat{R}(X_0, X_i)\) 的条件均值和方差匹配即可，且 Lyapunov 条件（由 (W2) 和误差矩条件 (L) 保证）成立。
  5. 结合残差置换引理（证明 bootstrap 影响函数的一致估计性）和高斯条件的连续性，得到 Kolmogorov 距离收敛到 0。
- 技术技巧点名：
  - 乘子 bootstrap（multiplier bootstrap）：核心技巧。通过 \(W_i \hat{\varepsilon}_{i,k_n}\) 构造残差，而不是从 \(\{\hat{\varepsilon}_{i,k_n}\}\) 中重抽样。
  - 经验过程理论：用来处理截断算子 \(\hat{\Gamma}_{h_n}^{-1}\) 的一致收敛性（Cardot et al. (2007) 的方法）。
  - 高阶矩控制：对乘子 \(W_i\) 和误差矩的四阶/六阶条件进行 Taylor 展开和 Lyapunov CLT。
  - 条件 (R) 的巧妙运用：\(g_n/h_n \to 0\) 确保 \(\hat{\mu}_{g_n}\) 生成的 WB 响应逼近真实 \(\mu(X_i)\) 时偏误可忽略。
真实例子与应用：
- 数据/场景：US Weather（nClimGridDaily）——2022 年 47 个州的日均温度序列（\(X_i\)，函数型，\(M = 365\) 个离散时间点）和年总降水量（\(Y_i\)，标量）。新点 \(X_{0,l}\) 为四大区域（东北、南部、中北部、西部）的日均温度均值曲线。
- 方法如何应用：
  - 先由交叉验证确定 \(k_n = g_n = 6\)。
  - 对每个区域，在 WB、RB、PB 下计算中心化投影 \(\langle \beta, X_{0,l} - E[X] \rangle\) 的 95% 置信区间。
  - 对西部区域（异方差和偏态最严重），绘制区间随截断参数 \(h_n\) 的变化图（图 7）。WB 区间（粉色）在 \(h_n \ge 9\) 后中心与宽度趋于稳定。
  - 应用 SVM（\(\rho_w = \rho_c = 0.01\), \(r\) 从 1 到 10）自动选出 \(h_n = 9\)（西部），类似地东北 9、南部 12、中北部 10。
- 结果：WB 区间表明四个区域的投影均显著不为 0（所有区间不含零），即各区域总降水量显著偏离全美均值——东北和南部偏多，中北部和西部偏少。
- 这个例子想说明：① WB 在实际数据中操作可行，SVM 能自动选 \(h_n\)；② WB 在异方差和偏态下比 RB 稳健，计算上比 PB 高效（图 4）；③ 当误差分布复杂（具偏态），PB 区间过宽（保守）而 WB 更适中。
🔎 结论是否比证明窄：
- 定理 1 明确要求 \(X_0\) 与训练数据独立同分布（"新回归器 \(X_0\) 与样本 \(\{(Y_i, X_i)\}_{i=1}^n\) 独立且与 \(X\) 同分布"）。但作者在正文中声称“Theorem 1 could also be extended to cases where the new predictor \(X_0\) depends on the observed regressors \(\{X_i\}_{i=1}^n\) or when \(X_0\) and \(\{X_i\}\) do not share the same distribution”，并引用 Yeon et al. (2023, Propositions S3, S4, S6, S7) 作为支撑。但这只是一个断言，本文没有提供正式证明——在本文的证明框架下，这些扩展所需的条件（如 \(X_0\) 是 \(\{X_i\}\) 的线性组合时的限制）可能不成立或需要额外假设。这是一个值得验证的 claim。

四、开放问题¶

WB 用于斜率显著性检验（\(H_0: \beta = 0\)）：本文提出 WB “could potentially be applied for slope tests under heteroscedastic errors in future research” (Section 6)。这需要将 WB 从区间估计扩展到假设检验设定，并处理检验统计量（如 \( \|\hat{\beta}_{h_n}\|^2\) 的截断偏误）在 bootstrap 下的分布——一个直接的开放问题，扎根于本文 Section 6 的第一句话。
复杂 FLRM 的 WB 推断：论文只针对标量响应 FLRM。作者提出了“bootstrap developments could also be meaningfully considered for inference about more complicated FLRMs such as with functional response (Dette & Tang, 2024) or as with generalized (Müller & Stadtmüller, 2005), partial (Shin, 2009), or high-dimensional (Xue & Yao, 2021) FLRMs”（Section 6）。对谱状响应或高维 \(X\) 情形，WB 的乘子构造和缩放因子都会变化。
稀疏函数型回归的 bootstrap 推断：当 \(X\) 只被稀疏观测（每根曲线仅少数点），FPCR 估计和截断变得不理想。作者将它列为“unique challenges from sparseness”（Section 6）。WB 在这类设定下的覆盖表现和理论一致性均未知。
截断参数 \(h_n\) 的最优选择：论文使用的 SVM 是启发式的，没有最优性保证——“An optimal choice for bootstrap coverage accuracy requires more investigation, outside the scope of the current study”（Section 5.1）。这是一个开放问题：能否定义 bootstrap 区间覆盖率（或宽度）的 oracle 最优 \(h_n\)，并设计数据驱动的选择？

提醒：要确认这些是不是真 gap，建议去读近期的相关 5 篇文献（如 Yeon et al. (2024a)、Lin & Lin (2025)、以及 Dette & Tang (2024)）的 intro——若都指向同一个方向，那就是共识 gap；若互相打架，则是机会。

Maintained by 陈星宇 · Homepage · Source on GitHub