Bootstrap-assisted inference for generalized Grenander-type estimators¶

作者: Matias D. Cattaneo, Michael Jansson, Kenichi Nagasawa
来源: Annals of Statistics
主题: 非参数 / 半参数
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向是“形状约束下的非参推断”，核心统计问题是：当待估函数具有单调性、凸性等形状约束时，如何构造估计量并进行有效的分布推断。与常规的 \(n^{-1/2}\) 收敛速率不同，这类估计量（如单调密度/回归的 Grenander 估计量）往往收敛于非标准的极限分布（如 Chernoff 分布或 Gaussian process 凸最小化的左导数），且极限分布的形式严重依赖于函数在目标点处的局部平坦度（monomial order / flatness）。当前该方向的成熟度处于“估计理论已基本完备，但推断（置信区间/假设检验）因 bootstrap 失效与未知 flatness 而长期受阻”的阶段。

发展脉络： - 奠基工作：Groeneboom (1985) 与 Chernoff (1964) 建立了 cube-root \(n^{-1/3}\) 收敛与 Chernoff 型极限分布的理论；Groeneboom & Jongbloed (2014/2018) 的专著与综述将形状约束估计系统化，并引入了利用 switch relation 获取极限分布 cdf 的技术路线。 - 主要进展（Bootstrap 失效的确认）：Kosorok (2008) 与 Sen, Banerjee & Woodroofe (2010) 严格证明了标准 nonparametric bootstrap 对 Grenander 估计量不一致——bootstrap 统计量甚至不存在弱极限。这锁死了最自然的推断路径。 - 替代推断路线的探索：为绕开 bootstrap 失效，学者转向 subsampling (Politis & Romano 1994)、smoothed bootstrap (Kosorok 2008; Sen et al. 2010)、m-out-of-n bootstrap (Sen et al. 2010; Lee & Yang 2020)、numerical bootstrap (Hong & Li 2020) 以及无需速率知识的 HulC (Kuchibhotla et al. 2021)。Cattaneo, Jansson & Nagasawa (2017/2020) 提出了通过修改准则函数形状来恢复 bootstrap 一致性的新路线。 - 框架统一与 flatness 问题的浮现：Westling & Carone (2020) 将各类单调估计量统一为“广义 Grenander 型估计量”框架，极限分布被表征为 Gaussian process 凸最小化（GCM）的左导数，且该 Gaussian process 的均值具有多项式（monomial）结构。当函数局部平坦度未知时，均值多项式的阶数未知，导致极限分布完全未知，推断陷入僵局。Han & Kato (2022) 给出了 Berry-Esseen bounds，但未解决未知 flatness 下的推断实现问题。 - 本文的位置：在 CJN (2020) “改准则函数形状”路线的基础上，针对 Westling & Carone (2020) 框架中均值多项式阶数未知导致的推断死锁，提出一种自动变换 + generalized jackknife 估计标量阶数的 flatness-robust bootstrap 推断程序。

子线索聚类： 1. 极限分布表征与 switch relation 路线：Groeneboom (1985), Groeneboom & Jongbloed (2014/2018), Westling & Carone (2020)。这一簇致力于用 GCM 左导数或 switch relation 写出极限分布的解析形式，但未提供可操作的 bootstrap 方案。 2. Bootstrap 失效诊断与修补路线：Kosorok (2008), Sen et al. (2010) 确认不一致；Hong & Li (2020) 的 numerical bootstrap 与 m-out-of-n 属于“换抽样方案”路线；CJN (2017/2020) 属于“改准则函数形状”路线。本文继承并拓展了 CJN 的“改形状”路线。 3. 未知 flatness / 收敛速率的自适应推断路线：Mallick et al. (2023) 探讨了单调回归的自适应 CI；Kuchibhotla et al. (2021) 的 HulC/Adaptive HulC 不需要知道收敛速率，但需要估计 median-bias。本文走的是“估计 flatness 阶数标量 + 变换 bootstrap”路线。

这个方向在追问的核心问题： 1. 如何为非标准收敛速率（\(n^{-1/3}\) 或更慢）的形状约束估计量提供一致且可计算的分布逼近？（标准 bootstrap 失效的根因是什么，如何最小代价地修复？） 2. 当极限分布依赖于未知局部参数（如 flatness 阶数 \(q\)）时，如何构造自适应的推断程序？（估计 \(q\) 的代价与误差如何传导至置信区间？） 3. 能否在统一框架下（而非逐个特例）给出推断方案？（Westling & Carone 框架的推断落地问题。）

⚠️ 作者的 framing： - 作者的说法：作者将缺口 frame 为“Westling & Carone (2020) 提供了统一框架与极限分布表征，但标准 bootstrap 在该框架下不仅失效，且即使已知 monomial order 也无法一致逼近；因此，需要一个 flatness-robust 且自动化的 bootstrap 辅助推断程序”。这使得本文的“自动变换 + 估计标量 \(q\)”成为“显然的下一步”。 - 被淡化或回避的竞争路线：作者在 intro 中列举了 subsampling, m-out-of-n, numerical bootstrap, HulC 等替代方案，但未深入比较它们在 flatness-robust 设定下的表现（例如，Adaptive HulC 理论上也不需要知道 \(q\)，作者未对比两者的区间长度与覆盖率精度）。此外，对 smoothed bootstrap 的讨论仅停留在“它改变了估计量本身”的定性层面，未给出量化对比。 - 明显该被引却未出现的：Deng & Zhang (2023) 关于 isotonic regression 的 self-normalized 推断；Balabdaoui, Groeneboom (2021) 关于更一般 flatness 设定下的极限分布精确刻画。这两条若存在，值得研究者去查证它们是否提供了比本文 bootstrap 更直接的推断路径。

张力：未见明显对立引用。Kosorok (2008) 与 Sen et al. (2010) 在“标准 bootstrap 不一致”上结论一致；CJN (2020) 与 Hong & Li (2020) 在“修补 bootstrap 可行”上方向一致，只是技术路线不同（改准则 vs. 改抽样算子）。真正的张力隐藏在未对比的路线之间：本文的“估计 \(q\) + 变换 bootstrap”与 Adaptive HulC 的“估计 median-bias + 凸包”在 flatness-robust 性能上是否有理论上的优劣？这需要研究者自行去比对。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代

参数 / estimand：\(\theta_0(x)\)，目标点 \(x\) 处的未知单调函数值。例如单调密度 \(f_0(x)\) 或单调回归 \(m_0(x)\)。
局部平坦度阶数：\(q \in \mathbb{N}\)（正整数）。定义为 \(\theta_0(v) - \theta_0(x) \sim C(v-x)^q\) 当 \(v \to x\)，即函数在 \(x\) 处的 Taylor 展开首项阶数。\(q=1\) 为严格单调（无平坦），\(q>1\) 为局部平坦。
样本 / 随机变量：\(Z_1, \ldots, Z_n\)，i.i.d. 观测。
原函数估计量：\(\hat{\Theta}_x(v)\)，基于样本构造的 \(\theta_0\) 的原函数（如累积分布函数 \(\hat{F}_n(v)\)）的估计。
广义 Grenander 型估计量：\(\hat{\theta}_x\)，定义为 \(\hat{\Theta}_x(v)\) 的最大凸弱函数（Greatest Convex Minorant, GCM）在 \(v=x\) 处的左导数。
可观测数据：研究者实际观测到的是 \(Z_i\)（如 \((X_i, Y_i)\) 对或截断数据），由此可计算 \(\hat{\Theta}_x(v)\) 与 \(\hat{\theta}_x\)。不可观测的是真实平坦度 \(q\) 与局部曲率常数 \(C\)，只能靠假设或估计去识别。
极限分布：\(\mathbb{G}_x^{(0)}\)，一个 Gaussian process 的 GCM 左导数。该 Gaussian process 的均值为 \(M(v) = C v^q\)（\(v\) 为重标定后的局部坐标），方差结构由 \(\hat{\Theta}_x\) 的渐近线性展开决定。
Bootstrap 变换估计量：\(\hat{\theta}_x^*\)，基于 exchangeable bootstrap 样本与变换后的准则函数构造的估计量。
数值导数步长：\(h_n\)，用于估计 \(q\) 的步长序列。
Generalized jackknife 权重：\(w_1, w_2\)，用于消除数值导数中主导误差项的权重。

第二步：最小内核——\(q=1\)（严格单调）特例下的 Chernoff 分布与 bootstrap 变换

剥掉 Westling & Carone 框架的一般性，考虑最简特例：估计单调密度 \(f_0\) 在内点 \(x\) 处的值，且 \(f_0\) 在 \(x\) 处严格单调（\(q=1\)）。

此时，经典 Grenander 估计量 \(\hat{\theta}_x\) 收敛于 Chernoff 分布：

\[n^{1/3}(\hat{\theta}_x - \theta_0(x)) \rightsquigarrow \mathcal{Z} = \text{GCM}\{W(t) + C t^2\}^{(0)}\]

其中 \(W(t)\) 是标准两侧 Brownian motion，均值 \(C t^2\) 对应 \(q=1\)（因为 \(\theta_0(v)-\theta_0(x) \approx f_0'(x)(v-x)\)，重标定后二次项主导）。

核心数学困难：标准 nonparametric bootstrap 重抽样得到的 \(\hat{\theta}_x^*\)，其极限分布不是 \(\mathcal{Z}\)，而是 \(\text{GCM}\{W^*(t) + C^* t^2 + \text{extra linear drift}\}^{(0)}\)。由于 bootstrap 经验分布的凸性结构引入了额外的线性漂移项，导致 GCM 左导数的分布发生偏移，bootstrap 不一致。

本文最小内核的破法： 1. 变换准则函数：不直接对 \(\hat{\Theta}_x(v)\) 取 GCM，而是对 \(\hat{\Theta}_x(v) - \hat{K}_x(v)\) 取 GCM，其中 \(\hat{K}_x(v)\) 是一个精心构造的“抵消项”。在 \(q=1\) 特例下，\(\hat{K}_x(v)\) 被设计为近似等于 bootstrap 经验分布引入的线性漂移，从而在减去 \(\hat{K}_x(v)\) 后，bootstrap 准则函数的均值恢复为 \(C t^2\)，GCM 左导数的极限分布恢复为 \(\mathcal{Z}\)。 2. 自动构造 \(\hat{K}_x\)：\(\hat{K}_x\) 的构造依赖于对 \(q\) 的估计。在 \(q=1\) 已知时，\(\hat{K}_x\) 可直接由 \(\hat{\Theta}_x\) 的数值导数构造；在 \(q\) 未知时，需要先估计 \(q\)。 3. 估计 \(q\) 的最小内核：利用数值导数 + generalized jackknife。计算 \(\hat{\theta}_x\) 在不同步长 \(h_n\) 下的数值导数 \(\hat{\theta}_x'(h_n)\)，通过两个不同步长的组合（generalized jackknife），消除步长误差的主导项，得到 \(q\) 的一致估计 \(\hat{q}\)。

在这个特例下，要证的命题退化成：当 \(q=1\) 时，基于变换 \(\hat{K}_x\) 的 bootstrap 估计量 \(\hat{\theta}_x^*\) 的条件分布一致逼近 Chernoff 分布 \(\mathcal{Z}\)。证明的核心步骤是论证减去 \(\hat{K}_x\) 后，bootstrap 准则函数的均值漂移被精确抵消，且余项在重标定下可控。一般情形（\(q>1\)）只是将 \(C t^2\) 替换为 \(C t^{q+1}\)，并将 \(\hat{K}_x\) 的构造相应推广到抵消 \(q\) 阶多项式漂移。

三、这篇论文做了什么¶

三句话： ①研究了广义 Grenander 型估计量在未知局部平坦度下的分布推断问题； ②核心工具是基于自动变换的 bootstrap 辅助推断程序，结合 numerical derivative 与 generalized jackknife 估计平坦度阶数标量； ③主要结论是该推断程序是 flatness-robust 的，即能自适应未知的 \(q\)，且在 i.i.d. 抽样下通过 exchangeable bootstrap 实现一致逼近。

关键设定与假设：在第二节最小记号的基础上补全： - 设定：采用 Westling & Carone (2020) 的广义 Grenander 框架。\(\hat{\theta}_x\) 定义为 \(\hat{\Theta}_x(v)\) 的 GCM 在 \(x\) 处的左导数。\(\hat{\Theta}_x(v)\) 允许是渐近线性的（Asymptotically Linear），即 \(\hat{\Theta}_x(v) - \Theta_0(v) = \frac{1}{n}\sum_{i=1}^n \phi_x(Z_i; v) + o_P(n^{-1/2})\)，其中 \(\phi_x\) 为 influence function。 - 假设 1（局部多项式平坦性）：\(\theta_0(v) - \theta_0(x) = C(v-x)^q + o((v-x)^q)\) 当 \(v \to x\)，\(q \in \mathbb{N}\) 未知，\(C>0\)。这是极限分布均值多项式结构的来源。 - 假设 2（渐近线性与方差结构）：\(\hat{\Theta}_x\) 渐近线性，且 influence function 的方差函数 \(V(v) = E[\phi_x(Z; v)^2]\) 在 \(x\) 处连续且 \(V(x)>0\)。这保证了极限 Gaussian process 的方差结构为 \(V(x) W(t)\)。 - 假设 3（数值导数步长条件）：\(h_n \to 0\) 且 \(n h_n^{2q+1} \to \infty\)（保证数值导数的一致性），同时 \(n h_n^{2q+3} \to 0\)（保证偏差项可被 generalized jackknife 消除）。 - 假设 4（Exchangeable Bootstrap 权重条件）：bootstrap 权重 \(\omega_i^*\) 满足标准条件（如 multinomial 或 wild bootstrap），且 \(E[\omega_i^*]=1\), \(Var(\omega_i^*)=1\), \(E[(\omega_i^*-1)^3]=\kappa_3\) 有限。 - 统计含义与放宽：假设 1 将 flatness 限制为整数阶 \(q\)，这是对 Westling & Carone 框架的继承，但相比 Han & Kato (2022) 处理更一般局部光滑度（非整数 \(\beta\)）的设定，本文的 \(q \in \mathbb{N}\) 是一个强化限制。假设 3 对步长的要求是经典的 bias-variance trade-off，但依赖于未知的 \(q\)，本文通过迭代/自适应选择绕过。假设 2 的渐近线性排除了非线性的原函数估计量（如某些高维 NPIMP 估计量），这是本文推断程序适用范围的边界。

主要结果： - 定理 1（Bootstrap 一致性，已知 \(q\)）：当 \(q\) 已知时，基于变换 \(\hat{K}_x\) 的 bootstrap 估计量 \(\hat{\theta}_x^*\) 的条件分布一致逼近 \(\mathbb{G}_x^{(0)}\)。直觉：变换 \(\hat{K}_x\) 精确抵消了 bootstrap 经验分布引入的额外多项式漂移，使得 bootstrap 准则函数的均值恢复为 \(C t^{q+1}\)，从而 GCM 左导数的极限与原估计量相同。必要条件：\(\hat{K}_x\) 的构造需满足 \(\hat{K}_x(v) - K_0(v) = o_P(n^{-1/2} h_n^{q})\)，即变换估计必须足够精确。 - 定理 2（Flatness-robustness，未知 \(q\)）：当 \(q\) 未知时，用 generalized jackknife 得到的估计量 \(\hat{q}\) 替换真实 \(q\) 构造变换 \(\hat{K}_x(\hat{q})\)，bootstrap 估计量的条件分布仍一致逼近 \(\mathbb{G}_x^{(0)}\)。直觉：\(\hat{q}\) 是离散取值的整数估计，一旦 \(\hat{q} \to q\) in probability（即 \(P(\hat{q}=q) \to 1\)），则变换 \(\hat{K}_x(\hat{q})\) 在大样本下与 \(\hat{K}_x(q)\) 完全相同，离散跳跃不破坏连续映射。必要条件：\(\hat{q}\) 必须以概率 1 收敛于真值 \(q\)，这要求步长 \(h_n\) 满足特定条件。 - 定理 3（Generalized Jackknife 估计 \(\hat{q}\) 的一致性）：基于数值导数 \(\hat{\theta}_x'(h_n)\) 与 \(\hat{\theta}_x'(c h_n)\)（\(c \neq 1\) 为常数）的 generalized jackknife 组合，\(\hat{q} \to q\) in probability。直觉：数值导数的偏差项为 \(O(h_n^{q-1})\)，通过两个不同步长的线性组合，可以消去偏差项的主导部分，提取出 \(q\) 的信息。技术难点：数值导数本身的随机误差为 \(O_P(n^{-1/2} h_n^{-1})\)，必须在偏差消除与方差控制之间取得平衡，步长条件 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\) 是关键。

证明路线与技术技巧： - 整体路线： 1. 表征极限分布：利用 Westling & Carone (2020) 框架，将 \(\hat{\theta}_x\) 的极限分布写为 \(\text{GCM}\{V(x)^{1/2} W(t) + C t^{q+1}\}^{(0)}\)。 2. 诊断 bootstrap 失效根因：写出 bootstrap 准则函数 \(\hat{\Theta}_x^*(v)\) 的展开，发现其均值包含额外的多项式漂移项（来自经验分布的凸性约束），导致 GCM 左导数偏移。 3. 构造抵消变换 \(\hat{K}_x\)：基于 \(\hat{\Theta}_x\) 的局部多项式拟合（数值导数），构造 \(\hat{K}_x(v)\) 使得 \(\hat{K}_x(v)\) 在大样本下等于该额外漂移项，从而 \(\hat{\Theta}_x^*(v) - \hat{K}_x(v)\) 的均值恢复为 \(C t^{q+1}\)。 4. 论证变换后的 bootstrap 一致性：证明 \((\hat{\Theta}_x^* - \hat{K}_x)\) 在重标定后的过程收敛于目标 Gaussian process，然后利用 argmax continuous mapping theorem（Cox 2022 的广义版本，处理 \(n\)-varying domain）得到 GCM 左导数的收敛。 5. 论证 \(\hat{q}\) 的一致性与 flatness-robustness：证明 generalized jackknife 估计 \(\hat{q}\) 满足 \(P(\hat{q}=q) \to 1\)，从而 \(\hat{K}_x(\hat{q})\) 与 \(\hat{K}_x(q)\) 在大样本下等价，不破坏定理 1 的结论。 - 关键跳跃点： - 引理：\(\hat{K}_x\) 的逼近精度：必须证明 \(\hat{K}_x(v) - K_0(v) = o_P(n^{-1/2} h_n^{q})\)，这要求数值导数的偏差与方差在局部邻域内同时可控。这是整个证明最吃功夫的地方，因为 \(\hat{K}_x\) 本身是基于 \(\hat{\theta}_x\) 的数值导数构造的，而 \(\hat{\theta}_x\) 本身又是非标准收敛速率的估计量，其局部行为的精确刻画非常困难。 - 引理：Exchangeable Bootstrap 过程的弱收敛：需要证明 \(\sqrt{n}(\hat{\Theta}_x^* - \hat{\Theta}_x - \text{drift})\) 在 Skorokhod 空间上条件弱收敛于 Gaussian process。这里 bootstrap 权重的随机性与准则函数的非线性交织，需要精细的 empirical process 控制。 - 技术技巧点名： - Generalized Argmax Theorem (Cox 2022)：用于处理变换后准则函数的优化域随 \(n\) 变化（\(n\)-varying domains）的情况，保证连续映射定理在 Painlevé-Kuratowski 收敛意义下成立。 - Numerical Derivative Estimation：用于构造 \(\hat{K}_x\) 与估计 \(q\)，核心是利用差分近似局部多项式系数，步长选择需满足 bias-variance trade-off。 - Generalized Jackknife：用于消除数值导数中的偏差项并提取 \(q\)。通过两个不同步长 \(h_n\) 与 \(c h_n\) 的线性组合 \(w_1 \hat{\theta}_x'(h_n) + w_2 \hat{\theta}_x'(c h_n)\)，选择权重 \(w_1, w_2\) 使得偏差项相消，余项暴露 \(q\) 的信息。 - Exchangeable Bootstrap：用于实现计算便利的重抽样，权重 \(\omega_i^*\) 满足特定矩条件，保证 bootstrap 经验过程的弱收敛。 - Switch Relation (Groeneboom 1985)：在验证具体例子（如单调密度）的极限分布时，作为替代 GCM 左导数直接刻画的工具，将分布函数的估计转化为 supremum 问题。

真实例子与应用： - 例子 1：单调密度估计：数据为 i.i.d. \(X_1, \ldots, X_n \sim f_0\)，\(f_0\) 单调递减。\(\hat{\theta}_x\) 为 Grenander 估计量（\(\hat{F}_n\) 的 GCM 左导数）。本文方法应用于此，得到 flatness-robust 的置信区间。模拟结果显示，当 \(q=1\)（严格单调）时，覆盖率接近名义水平；当 \(q=2\)（局部平坦）时，标准 bootstrap 覆盖率严重偏低，本文方法仍维持正确覆盖率。 - 例子 2：单调回归：数据为 i.i.d. \((X_i, Y_i)\)，\(m_0(x) = E[Y|X=x]\) 单调。\(\hat{\theta}_x\) 为 isotonic regression 估计量。模拟结果与单调密度类似，验证了 flatness-robustness。 - 例子 3：因果单调剂量-响应曲线：引用 Westling et al. (2020) 的因果推断设定，\(\theta_0(x) = E[E[Y|X=x, A]]\)（在混杂调整下的因果效应）。本文方法直接应用于该广义 Grenander 估计量，展示了在因果推断非标准估计量中的适用性。 - 想说明什么：模拟主要验证两点：(1) 标准 bootstrap 在 \(q>1\) 时失效（覆盖率远低于名义水平），本文变换 bootstrap 修复了此问题；(2) \(\hat{q}\) 的自适应估计不破坏覆盖率，验证 flatness-robustness。与 baseline（subsampling, m-out-of-n）的对比未在模拟中深入展开，这是研究者可进一步核验的缺口。

🔎 结论是否比证明窄： - 定理 2 的 flatness-robustness 结论严格依赖于 \(P(\hat{q}=q) \to 1\)，而 \(\hat{q}\) 的一致性（定理 3）要求步长 \(h_n\) 满足 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\)。这些步长条件依赖于未知的 \(q\) 本身，作者在文中 claim “可以构造自适应的 \(h_n\) 选择程序”，但未给出严格证明，仅提及可借鉴 subsampling 或 cross-validation 的思路。这是一个结论比证明窄的地方：定理 2 在已知 \(h_n\) 满足条件时严格成立，但自适应 \(h_n\) 的可行性是 conjecture（见 Section 5 讨论）。 - 假设 \(q \in \mathbb{N}\)（整数阶）：作者在 intro 中 claim 方法是 flatness-robust 的，但证明只覆盖整数阶。若 \(q\) 为非整数（如 \(q=1.5\)，对应更一般的局部光滑度 \(\beta\)），极限分布的均值不再是多项式，本文的数值导数 + generalized jackknife 估计程序是否仍一致，未给出理论保证。这是一个被泛泛 claim 为 robust 但严格证明只覆盖整数的缺口。

四、开放问题（点到为止，扎根具体语句）¶

非整数阶 flatness（\(\beta \notin \mathbb{N}\)）下的推断：本文定理严格假设 \(q \in \mathbb{N}\)（Assumption 1），但 Han & Kato (2022) 处理了更一般的局部光滑度 \(\beta\)。若 \(\beta\) 为非整数，均值函数不再是多项式，generalized jackknife 估计 \(\hat{q}\) 的离散整数性质将失效。要证：在 \(\beta \notin \mathbb{N}\) 下，是否存在连续的 \(\hat{\beta}\) 估计及相应的变换 bootstrap 程序仍一致。（扎根：Section 2 "monomial order \(q \in \mathbb{N}\)" 与 Section 5 "future work"）
自适应步长 \(h_n\) 的严格理论：定理 3 的步长条件 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\) 依赖于未知 \(q\)，作者 claim 可构造数据驱动的 \(h_n\) 但未证明。要证：存在数据驱动的 \(\hat{h}_n\)（如基于 subsampling 或 Lepski 方法），使得在 \(\hat{h}_n\) 下定理 2-3 仍成立。（扎根：Section 5 "automatic choice of \(h_n\)"）
与 Adaptive HulC 的理论对比：作者在 intro 列举了 HulC (Kuchibhotla et al. 2021) 作为不需要知道收敛速率的竞争路线，但未比较两者在 flatness-robust 设定下的区间长度与覆盖率精度。要算/证：在 \(q\) 未知时，本文变换 bootstrap CI 的期望长度与 Adaptive HulC CI 的期望长度的渐近比率，以及两者覆盖率的 Edgeworth 展开差异。（扎根：Intro 对 HulC 的引用与 Section 4 的模拟仅对比了标准 bootstrap，未对比 HulC）
高维/半参设定下的推广：本文假设 \(\hat{\Theta}_x\) 渐近线性，排除了高维 nuisance parameter 估计导致的非线性影响（如 double/debiased ML 中的余项）。要证：当 \(\hat{\Theta}_x\) 包含 \(o_P(n^{-1/4})\) 的高维余项时，变换 bootstrap 是否仍一致，或需要更高阶的修正（如 HOIF）。（扎根：Section 2 "asymptotically linear" 假设与 Westling et al. (2020) 因果推断例子中可能涉及的高维混杂调整）

要确认某条是不是真 gap，去读同子领域近期约 5 篇的 intro（如 Mallick et al. 2023, Han & Kato 2022, Kuchibhotla et al. 2021, CJN 2020, Westling & Carone 2020）——都指向步长自适应或非整数光滑度 = 共识（真 gap），互相打架 = 机会。

Maintained by 陈星宇 · Homepage · Source on GitHub

Bootstrap-assisted inference for generalized Grenander-type estimators¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论