Bootstrap-assisted inference for generalized Grenander-type estimators¶
作者: Matias D. Cattaneo, Michael Jansson, Kenichi Nagasawa
来源: Annals of Statistics
主题: 非参数 / 半参数
相关性: 7/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: 这个子方向是“形状约束下的非参推断”,核心统计问题是:当待估函数具有单调性、凸性等形状约束时,如何构造估计量并进行有效的分布推断。与常规的 \(n^{-1/2}\) 收敛速率不同,这类估计量(如单调密度/回归的 Grenander 估计量)往往收敛于非标准的极限分布(如 Chernoff 分布或 Gaussian process 凸最小化的左导数),且极限分布的形式严重依赖于函数在目标点处的局部平坦度(monomial order / flatness)。当前该方向的成熟度处于“估计理论已基本完备,但推断(置信区间/假设检验)因 bootstrap 失效与未知 flatness 而长期受阻”的阶段。
发展脉络: - 奠基工作:Groeneboom (1985) 与 Chernoff (1964) 建立了 cube-root \(n^{-1/3}\) 收敛与 Chernoff 型极限分布的理论;Groeneboom & Jongbloed (2014/2018) 的专著与综述将形状约束估计系统化,并引入了利用 switch relation 获取极限分布 cdf 的技术路线。 - 主要进展(Bootstrap 失效的确认):Kosorok (2008) 与 Sen, Banerjee & Woodroofe (2010) 严格证明了标准 nonparametric bootstrap 对 Grenander 估计量不一致——bootstrap 统计量甚至不存在弱极限。这锁死了最自然的推断路径。 - 替代推断路线的探索:为绕开 bootstrap 失效,学者转向 subsampling (Politis & Romano 1994)、smoothed bootstrap (Kosorok 2008; Sen et al. 2010)、m-out-of-n bootstrap (Sen et al. 2010; Lee & Yang 2020)、numerical bootstrap (Hong & Li 2020) 以及无需速率知识的 HulC (Kuchibhotla et al. 2021)。Cattaneo, Jansson & Nagasawa (2017/2020) 提出了通过修改准则函数形状来恢复 bootstrap 一致性的新路线。 - 框架统一与 flatness 问题的浮现:Westling & Carone (2020) 将各类单调估计量统一为“广义 Grenander 型估计量”框架,极限分布被表征为 Gaussian process 凸最小化(GCM)的左导数,且该 Gaussian process 的均值具有多项式(monomial)结构。当函数局部平坦度未知时,均值多项式的阶数未知,导致极限分布完全未知,推断陷入僵局。Han & Kato (2022) 给出了 Berry-Esseen bounds,但未解决未知 flatness 下的推断实现问题。 - 本文的位置:在 CJN (2020) “改准则函数形状”路线的基础上,针对 Westling & Carone (2020) 框架中均值多项式阶数未知导致的推断死锁,提出一种自动变换 + generalized jackknife 估计标量阶数的 flatness-robust bootstrap 推断程序。
子线索聚类: 1. 极限分布表征与 switch relation 路线:Groeneboom (1985), Groeneboom & Jongbloed (2014/2018), Westling & Carone (2020)。这一簇致力于用 GCM 左导数或 switch relation 写出极限分布的解析形式,但未提供可操作的 bootstrap 方案。 2. Bootstrap 失效诊断与修补路线:Kosorok (2008), Sen et al. (2010) 确认不一致;Hong & Li (2020) 的 numerical bootstrap 与 m-out-of-n 属于“换抽样方案”路线;CJN (2017/2020) 属于“改准则函数形状”路线。本文继承并拓展了 CJN 的“改形状”路线。 3. 未知 flatness / 收敛速率的自适应推断路线:Mallick et al. (2023) 探讨了单调回归的自适应 CI;Kuchibhotla et al. (2021) 的 HulC/Adaptive HulC 不需要知道收敛速率,但需要估计 median-bias。本文走的是“估计 flatness 阶数标量 + 变换 bootstrap”路线。
这个方向在追问的核心问题: 1. 如何为非标准收敛速率(\(n^{-1/3}\) 或更慢)的形状约束估计量提供一致且可计算的分布逼近?(标准 bootstrap 失效的根因是什么,如何最小代价地修复?) 2. 当极限分布依赖于未知局部参数(如 flatness 阶数 \(q\))时,如何构造自适应的推断程序?(估计 \(q\) 的代价与误差如何传导至置信区间?) 3. 能否在统一框架下(而非逐个特例)给出推断方案?(Westling & Carone 框架的推断落地问题。)
⚠️ 作者的 framing: - 作者的说法:作者将缺口 frame 为“Westling & Carone (2020) 提供了统一框架与极限分布表征,但标准 bootstrap 在该框架下不仅失效,且即使已知 monomial order 也无法一致逼近;因此,需要一个 flatness-robust 且自动化的 bootstrap 辅助推断程序”。这使得本文的“自动变换 + 估计标量 \(q\)”成为“显然的下一步”。 - 被淡化或回避的竞争路线:作者在 intro 中列举了 subsampling, m-out-of-n, numerical bootstrap, HulC 等替代方案,但未深入比较它们在 flatness-robust 设定下的表现(例如,Adaptive HulC 理论上也不需要知道 \(q\),作者未对比两者的区间长度与覆盖率精度)。此外,对 smoothed bootstrap 的讨论仅停留在“它改变了估计量本身”的定性层面,未给出量化对比。 - 明显该被引却未出现的:Deng & Zhang (2023) 关于 isotonic regression 的 self-normalized 推断;Balabdaoui, Groeneboom (2021) 关于更一般 flatness 设定下的极限分布精确刻画。这两条若存在,值得研究者去查证它们是否提供了比本文 bootstrap 更直接的推断路径。
张力: 未见明显对立引用。Kosorok (2008) 与 Sen et al. (2010) 在“标准 bootstrap 不一致”上结论一致;CJN (2020) 与 Hong & Li (2020) 在“修补 bootstrap 可行”上方向一致,只是技术路线不同(改准则 vs. 改抽样算子)。真正的张力隐藏在未对比的路线之间:本文的“估计 \(q\) + 变换 bootstrap”与 Adaptive HulC 的“估计 median-bias + 凸包”在 flatness-robust 性能上是否有理论上的优劣?这需要研究者自行去比对。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代
- 参数 / estimand:\(\theta_0(x)\),目标点 \(x\) 处的未知单调函数值。例如单调密度 \(f_0(x)\) 或单调回归 \(m_0(x)\)。
- 局部平坦度阶数:\(q \in \mathbb{N}\)(正整数)。定义为 \(\theta_0(v) - \theta_0(x) \sim C(v-x)^q\) 当 \(v \to x\),即函数在 \(x\) 处的 Taylor 展开首项阶数。\(q=1\) 为严格单调(无平坦),\(q>1\) 为局部平坦。
- 样本 / 随机变量:\(Z_1, \ldots, Z_n\),i.i.d. 观测。
- 原函数估计量:\(\hat{\Theta}_x(v)\),基于样本构造的 \(\theta_0\) 的原函数(如累积分布函数 \(\hat{F}_n(v)\))的估计。
- 广义 Grenander 型估计量:\(\hat{\theta}_x\),定义为 \(\hat{\Theta}_x(v)\) 的最大凸弱函数(Greatest Convex Minorant, GCM)在 \(v=x\) 处的左导数。
- 可观测数据:研究者实际观测到的是 \(Z_i\)(如 \((X_i, Y_i)\) 对或截断数据),由此可计算 \(\hat{\Theta}_x(v)\) 与 \(\hat{\theta}_x\)。不可观测的是真实平坦度 \(q\) 与局部曲率常数 \(C\),只能靠假设或估计去识别。
- 极限分布:\(\mathbb{G}_x^{(0)}\),一个 Gaussian process 的 GCM 左导数。该 Gaussian process 的均值为 \(M(v) = C v^q\)(\(v\) 为重标定后的局部坐标),方差结构由 \(\hat{\Theta}_x\) 的渐近线性展开决定。
- Bootstrap 变换估计量:\(\hat{\theta}_x^*\),基于 exchangeable bootstrap 样本与变换后的准则函数构造的估计量。
- 数值导数步长:\(h_n\),用于估计 \(q\) 的步长序列。
- Generalized jackknife 权重:\(w_1, w_2\),用于消除数值导数中主导误差项的权重。
第二步:最小内核——\(q=1\)(严格单调)特例下的 Chernoff 分布与 bootstrap 变换
剥掉 Westling & Carone 框架的一般性,考虑最简特例:估计单调密度 \(f_0\) 在内点 \(x\) 处的值,且 \(f_0\) 在 \(x\) 处严格单调(\(q=1\))。
此时,经典 Grenander 估计量 \(\hat{\theta}_x\) 收敛于 Chernoff 分布:
核心数学困难:标准 nonparametric bootstrap 重抽样得到的 \(\hat{\theta}_x^*\),其极限分布不是 \(\mathcal{Z}\),而是 \(\text{GCM}\{W^*(t) + C^* t^2 + \text{extra linear drift}\}^{(0)}\)。由于 bootstrap 经验分布的凸性结构引入了额外的线性漂移项,导致 GCM 左导数的分布发生偏移,bootstrap 不一致。
本文最小内核的破法: 1. 变换准则函数:不直接对 \(\hat{\Theta}_x(v)\) 取 GCM,而是对 \(\hat{\Theta}_x(v) - \hat{K}_x(v)\) 取 GCM,其中 \(\hat{K}_x(v)\) 是一个精心构造的“抵消项”。在 \(q=1\) 特例下,\(\hat{K}_x(v)\) 被设计为近似等于 bootstrap 经验分布引入的线性漂移,从而在减去 \(\hat{K}_x(v)\) 后,bootstrap 准则函数的均值恢复为 \(C t^2\),GCM 左导数的极限分布恢复为 \(\mathcal{Z}\)。 2. 自动构造 \(\hat{K}_x\):\(\hat{K}_x\) 的构造依赖于对 \(q\) 的估计。在 \(q=1\) 已知时,\(\hat{K}_x\) 可直接由 \(\hat{\Theta}_x\) 的数值导数构造;在 \(q\) 未知时,需要先估计 \(q\)。 3. 估计 \(q\) 的最小内核:利用数值导数 + generalized jackknife。计算 \(\hat{\theta}_x\) 在不同步长 \(h_n\) 下的数值导数 \(\hat{\theta}_x'(h_n)\),通过两个不同步长的组合(generalized jackknife),消除步长误差的主导项,得到 \(q\) 的一致估计 \(\hat{q}\)。
在这个特例下,要证的命题退化成:当 \(q=1\) 时,基于变换 \(\hat{K}_x\) 的 bootstrap 估计量 \(\hat{\theta}_x^*\) 的条件分布一致逼近 Chernoff 分布 \(\mathcal{Z}\)。证明的核心步骤是论证减去 \(\hat{K}_x\) 后,bootstrap 准则函数的均值漂移被精确抵消,且余项在重标定下可控。一般情形(\(q>1\))只是将 \(C t^2\) 替换为 \(C t^{q+1}\),并将 \(\hat{K}_x\) 的构造相应推广到抵消 \(q\) 阶多项式漂移。
三、这篇论文做了什么¶
三句话: ①研究了广义 Grenander 型估计量在未知局部平坦度下的分布推断问题; ②核心工具是基于自动变换的 bootstrap 辅助推断程序,结合 numerical derivative 与 generalized jackknife 估计平坦度阶数标量; ③主要结论是该推断程序是 flatness-robust 的,即能自适应未知的 \(q\),且在 i.i.d. 抽样下通过 exchangeable bootstrap 实现一致逼近。
关键设定与假设: 在第二节最小记号的基础上补全: - 设定:采用 Westling & Carone (2020) 的广义 Grenander 框架。\(\hat{\theta}_x\) 定义为 \(\hat{\Theta}_x(v)\) 的 GCM 在 \(x\) 处的左导数。\(\hat{\Theta}_x(v)\) 允许是渐近线性的(Asymptotically Linear),即 \(\hat{\Theta}_x(v) - \Theta_0(v) = \frac{1}{n}\sum_{i=1}^n \phi_x(Z_i; v) + o_P(n^{-1/2})\),其中 \(\phi_x\) 为 influence function。 - 假设 1(局部多项式平坦性):\(\theta_0(v) - \theta_0(x) = C(v-x)^q + o((v-x)^q)\) 当 \(v \to x\),\(q \in \mathbb{N}\) 未知,\(C>0\)。这是极限分布均值多项式结构的来源。 - 假设 2(渐近线性与方差结构):\(\hat{\Theta}_x\) 渐近线性,且 influence function 的方差函数 \(V(v) = E[\phi_x(Z; v)^2]\) 在 \(x\) 处连续且 \(V(x)>0\)。这保证了极限 Gaussian process 的方差结构为 \(V(x) W(t)\)。 - 假设 3(数值导数步长条件):\(h_n \to 0\) 且 \(n h_n^{2q+1} \to \infty\)(保证数值导数的一致性),同时 \(n h_n^{2q+3} \to 0\)(保证偏差项可被 generalized jackknife 消除)。 - 假设 4(Exchangeable Bootstrap 权重条件):bootstrap 权重 \(\omega_i^*\) 满足标准条件(如 multinomial 或 wild bootstrap),且 \(E[\omega_i^*]=1\), \(Var(\omega_i^*)=1\), \(E[(\omega_i^*-1)^3]=\kappa_3\) 有限。 - 统计含义与放宽:假设 1 将 flatness 限制为整数阶 \(q\),这是对 Westling & Carone 框架的继承,但相比 Han & Kato (2022) 处理更一般局部光滑度(非整数 \(\beta\))的设定,本文的 \(q \in \mathbb{N}\) 是一个强化限制。假设 3 对步长的要求是经典的 bias-variance trade-off,但依赖于未知的 \(q\),本文通过迭代/自适应选择绕过。假设 2 的渐近线性排除了非线性的原函数估计量(如某些高维 NPIMP 估计量),这是本文推断程序适用范围的边界。
主要结果: - 定理 1(Bootstrap 一致性,已知 \(q\)):当 \(q\) 已知时,基于变换 \(\hat{K}_x\) 的 bootstrap 估计量 \(\hat{\theta}_x^*\) 的条件分布一致逼近 \(\mathbb{G}_x^{(0)}\)。直觉:变换 \(\hat{K}_x\) 精确抵消了 bootstrap 经验分布引入的额外多项式漂移,使得 bootstrap 准则函数的均值恢复为 \(C t^{q+1}\),从而 GCM 左导数的极限与原估计量相同。必要条件:\(\hat{K}_x\) 的构造需满足 \(\hat{K}_x(v) - K_0(v) = o_P(n^{-1/2} h_n^{q})\),即变换估计必须足够精确。 - 定理 2(Flatness-robustness,未知 \(q\)):当 \(q\) 未知时,用 generalized jackknife 得到的估计量 \(\hat{q}\) 替换真实 \(q\) 构造变换 \(\hat{K}_x(\hat{q})\),bootstrap 估计量的条件分布仍一致逼近 \(\mathbb{G}_x^{(0)}\)。直觉:\(\hat{q}\) 是离散取值的整数估计,一旦 \(\hat{q} \to q\) in probability(即 \(P(\hat{q}=q) \to 1\)),则变换 \(\hat{K}_x(\hat{q})\) 在大样本下与 \(\hat{K}_x(q)\) 完全相同,离散跳跃不破坏连续映射。必要条件:\(\hat{q}\) 必须以概率 1 收敛于真值 \(q\),这要求步长 \(h_n\) 满足特定条件。 - 定理 3(Generalized Jackknife 估计 \(\hat{q}\) 的一致性):基于数值导数 \(\hat{\theta}_x'(h_n)\) 与 \(\hat{\theta}_x'(c h_n)\)(\(c \neq 1\) 为常数)的 generalized jackknife 组合,\(\hat{q} \to q\) in probability。直觉:数值导数的偏差项为 \(O(h_n^{q-1})\),通过两个不同步长的线性组合,可以消去偏差项的主导部分,提取出 \(q\) 的信息。技术难点:数值导数本身的随机误差为 \(O_P(n^{-1/2} h_n^{-1})\),必须在偏差消除与方差控制之间取得平衡,步长条件 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\) 是关键。
证明路线与技术技巧: - 整体路线: 1. 表征极限分布:利用 Westling & Carone (2020) 框架,将 \(\hat{\theta}_x\) 的极限分布写为 \(\text{GCM}\{V(x)^{1/2} W(t) + C t^{q+1}\}^{(0)}\)。 2. 诊断 bootstrap 失效根因:写出 bootstrap 准则函数 \(\hat{\Theta}_x^*(v)\) 的展开,发现其均值包含额外的多项式漂移项(来自经验分布的凸性约束),导致 GCM 左导数偏移。 3. 构造抵消变换 \(\hat{K}_x\):基于 \(\hat{\Theta}_x\) 的局部多项式拟合(数值导数),构造 \(\hat{K}_x(v)\) 使得 \(\hat{K}_x(v)\) 在大样本下等于该额外漂移项,从而 \(\hat{\Theta}_x^*(v) - \hat{K}_x(v)\) 的均值恢复为 \(C t^{q+1}\)。 4. 论证变换后的 bootstrap 一致性:证明 \((\hat{\Theta}_x^* - \hat{K}_x)\) 在重标定后的过程收敛于目标 Gaussian process,然后利用 argmax continuous mapping theorem(Cox 2022 的广义版本,处理 \(n\)-varying domain)得到 GCM 左导数的收敛。 5. 论证 \(\hat{q}\) 的一致性与 flatness-robustness:证明 generalized jackknife 估计 \(\hat{q}\) 满足 \(P(\hat{q}=q) \to 1\),从而 \(\hat{K}_x(\hat{q})\) 与 \(\hat{K}_x(q)\) 在大样本下等价,不破坏定理 1 的结论。 - 关键跳跃点: - 引理:\(\hat{K}_x\) 的逼近精度:必须证明 \(\hat{K}_x(v) - K_0(v) = o_P(n^{-1/2} h_n^{q})\),这要求数值导数的偏差与方差在局部邻域内同时可控。这是整个证明最吃功夫的地方,因为 \(\hat{K}_x\) 本身是基于 \(\hat{\theta}_x\) 的数值导数构造的,而 \(\hat{\theta}_x\) 本身又是非标准收敛速率的估计量,其局部行为的精确刻画非常困难。 - 引理:Exchangeable Bootstrap 过程的弱收敛:需要证明 \(\sqrt{n}(\hat{\Theta}_x^* - \hat{\Theta}_x - \text{drift})\) 在 Skorokhod 空间上条件弱收敛于 Gaussian process。这里 bootstrap 权重的随机性与准则函数的非线性交织,需要精细的 empirical process 控制。 - 技术技巧点名: - Generalized Argmax Theorem (Cox 2022):用于处理变换后准则函数的优化域随 \(n\) 变化(\(n\)-varying domains)的情况,保证连续映射定理在 Painlevé-Kuratowski 收敛意义下成立。 - Numerical Derivative Estimation:用于构造 \(\hat{K}_x\) 与估计 \(q\),核心是利用差分近似局部多项式系数,步长选择需满足 bias-variance trade-off。 - Generalized Jackknife:用于消除数值导数中的偏差项并提取 \(q\)。通过两个不同步长 \(h_n\) 与 \(c h_n\) 的线性组合 \(w_1 \hat{\theta}_x'(h_n) + w_2 \hat{\theta}_x'(c h_n)\),选择权重 \(w_1, w_2\) 使得偏差项相消,余项暴露 \(q\) 的信息。 - Exchangeable Bootstrap:用于实现计算便利的重抽样,权重 \(\omega_i^*\) 满足特定矩条件,保证 bootstrap 经验过程的弱收敛。 - Switch Relation (Groeneboom 1985):在验证具体例子(如单调密度)的极限分布时,作为替代 GCM 左导数直接刻画的工具,将分布函数的估计转化为 supremum 问题。
真实例子与应用: - 例子 1:单调密度估计:数据为 i.i.d. \(X_1, \ldots, X_n \sim f_0\),\(f_0\) 单调递减。\(\hat{\theta}_x\) 为 Grenander 估计量(\(\hat{F}_n\) 的 GCM 左导数)。本文方法应用于此,得到 flatness-robust 的置信区间。模拟结果显示,当 \(q=1\)(严格单调)时,覆盖率接近名义水平;当 \(q=2\)(局部平坦)时,标准 bootstrap 覆盖率严重偏低,本文方法仍维持正确覆盖率。 - 例子 2:单调回归:数据为 i.i.d. \((X_i, Y_i)\),\(m_0(x) = E[Y|X=x]\) 单调。\(\hat{\theta}_x\) 为 isotonic regression 估计量。模拟结果与单调密度类似,验证了 flatness-robustness。 - 例子 3:因果单调剂量-响应曲线:引用 Westling et al. (2020) 的因果推断设定,\(\theta_0(x) = E[E[Y|X=x, A]]\)(在混杂调整下的因果效应)。本文方法直接应用于该广义 Grenander 估计量,展示了在因果推断非标准估计量中的适用性。 - 想说明什么:模拟主要验证两点:(1) 标准 bootstrap 在 \(q>1\) 时失效(覆盖率远低于名义水平),本文变换 bootstrap 修复了此问题;(2) \(\hat{q}\) 的自适应估计不破坏覆盖率,验证 flatness-robustness。与 baseline(subsampling, m-out-of-n)的对比未在模拟中深入展开,这是研究者可进一步核验的缺口。
🔎 结论是否比证明窄: - 定理 2 的 flatness-robustness 结论严格依赖于 \(P(\hat{q}=q) \to 1\),而 \(\hat{q}\) 的一致性(定理 3)要求步长 \(h_n\) 满足 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\)。这些步长条件依赖于未知的 \(q\) 本身,作者在文中 claim “可以构造自适应的 \(h_n\) 选择程序”,但未给出严格证明,仅提及可借鉴 subsampling 或 cross-validation 的思路。这是一个结论比证明窄的地方:定理 2 在已知 \(h_n\) 满足条件时严格成立,但自适应 \(h_n\) 的可行性是 conjecture(见 Section 5 讨论)。 - 假设 \(q \in \mathbb{N}\)(整数阶):作者在 intro 中 claim 方法是 flatness-robust 的,但证明只覆盖整数阶。若 \(q\) 为非整数(如 \(q=1.5\),对应更一般的局部光滑度 \(\beta\)),极限分布的均值不再是多项式,本文的数值导数 + generalized jackknife 估计程序是否仍一致,未给出理论保证。这是一个被泛泛 claim 为 robust 但严格证明只覆盖整数的缺口。
四、开放问题(点到为止,扎根具体语句)¶
- 非整数阶 flatness(\(\beta \notin \mathbb{N}\))下的推断:本文定理严格假设 \(q \in \mathbb{N}\)(Assumption 1),但 Han & Kato (2022) 处理了更一般的局部光滑度 \(\beta\)。若 \(\beta\) 为非整数,均值函数不再是多项式,generalized jackknife 估计 \(\hat{q}\) 的离散整数性质将失效。要证:在 \(\beta \notin \mathbb{N}\) 下,是否存在连续的 \(\hat{\beta}\) 估计及相应的变换 bootstrap 程序仍一致。(扎根:Section 2 "monomial order \(q \in \mathbb{N}\)" 与 Section 5 "future work")
- 自适应步长 \(h_n\) 的严格理论:定理 3 的步长条件 \(n h_n^{2q+1} \to \infty\) 且 \(n h_n^{2q+3} \to 0\) 依赖于未知 \(q\),作者 claim 可构造数据驱动的 \(h_n\) 但未证明。要证:存在数据驱动的 \(\hat{h}_n\)(如基于 subsampling 或 Lepski 方法),使得在 \(\hat{h}_n\) 下定理 2-3 仍成立。(扎根:Section 5 "automatic choice of \(h_n\)")
- 与 Adaptive HulC 的理论对比:作者在 intro 列举了 HulC (Kuchibhotla et al. 2021) 作为不需要知道收敛速率的竞争路线,但未比较两者在 flatness-robust 设定下的区间长度与覆盖率精度。要算/证:在 \(q\) 未知时,本文变换 bootstrap CI 的期望长度与 Adaptive HulC CI 的期望长度的渐近比率,以及两者覆盖率的 Edgeworth 展开差异。(扎根:Intro 对 HulC 的引用与 Section 4 的模拟仅对比了标准 bootstrap,未对比 HulC)
- 高维/半参设定下的推广:本文假设 \(\hat{\Theta}_x\) 渐近线性,排除了高维 nuisance parameter 估计导致的非线性影响(如 double/debiased ML 中的余项)。要证:当 \(\hat{\Theta}_x\) 包含 \(o_P(n^{-1/4})\) 的高维余项时,变换 bootstrap 是否仍一致,或需要更高阶的修正(如 HOIF)。(扎根:Section 2 "asymptotically linear" 假设与 Westling et al. (2020) 因果推断例子中可能涉及的高维混杂调整)
要确认某条是不是真 gap,去读同子领域近期约 5 篇的 intro(如 Mallick et al. 2023, Han & Kato 2022, Kuchibhotla et al. 2021, CJN 2020, Westling & Carone 2020)——都指向步长自适应或非整数光滑度 = 共识(真 gap),互相打架 = 机会。
Maintained by 陈星宇 · Homepage · Source on GitHub