跳转至

The HulC: confidence regions from convex hulls

作者: Arun Kumar Kuchibhotla, Sivaraman Balakrishnan, Larry Wasserman
来源: Journal of the Royal Statistical Society Series B
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么: 这个子方向要解决的根本问题是:在弱正则性条件(甚至不保证估计量有极限分布、或 bootstrap/CLT 失效)下,如何为任意参数构建具有有限样本或渐近覆盖保证的置信集。当前该方向的成熟度处于“从特例修补走向统一框架”的阶段:经典方法(Wald, Bootstrap)依赖强正则条件,近年的“Universal Inference”打破了条件限制但代价是置信集过宽;本论文试图在“弱条件”与“窄宽度”之间找到第三条路——仅依赖估计量的中位数偏差。

发展脉络: - 奠基工作:经典推断基于极限分布(Stigler, 2007; Lehmann & Casella, 1998)与 Wald 区间,要求估计量渐近正态且方差可估;M-估计的高阶偏差修正(Kosmidis et al., 2018; Kim, 2016)与中位数偏差分析(Kuchibhotla, 2021)为“只看中位数偏差”提供了理论素材,但未将其用于置信区间构建。 - 主要进展:Bootstrap 与 Sub-sampling 成为弱条件下的主力,但它们各有硬伤:Bootstrap 在方向可微函数等非标准问题下不一致(Fang & Santos, 2019,作者原话:“bootstrap is inconsistent unless κ(·) is differentiable”);高维 CLT 与 Bootstrap 近似虽取得近乎最优误差界(Chernozhukov et al., 2020; Deng, 2020; Fang & Koike, 2021),但依赖维数/样本量比例与矩条件;Sub-sampling 虽弱条件成立,但必须预知收敛速率(作者原话:“unlike sub-sampling, the HulC does not require knowledge of the rate of convergence”)。 - 当前 frontier:无正则条件的推断——Wasserman et al. (2019) 的 Universal Inference 提出了基于 split LRT 的有限样本有效方法,作者原话称其“have finite-sample guarantees without regularity conditions”,但代价是置信集宽度通常远超最优(作者在本文 intro 中明确指出其宽度劣势)。Rinaldo et al. (2016) 探索了 sample splitting + bootstrap,但未摆脱 bootstrap 的正则性依赖。 - 本文的位置:本文提出 HulC,定位为“弱条件 + 无需速率 + 近最优宽度”的统一推断框架。它用中位数偏差替代极限分布,用凸包替代分位数估计,试图填补 Universal Inference(太宽)与 Bootstrap/Sub-sampling(条件太强或需速率)之间的缺口。

子线索聚类: 1. 弱条件/无分布推断:Universal Inference (Wasserman et al., 2019) → HulC (本文)。这一簇追求有限样本或极弱条件下的覆盖保证,核心代价是宽度。Universal Inference 用 likelihood ratio,HulC 用凸包。 2. Bootstrap/Sub-sampling 的边界与修补:Bootstrap 在非标准问题失效 (Fang & Santos, 2019) → 高维修补 (Chernozhukov et al., 2020; Deng, 2020) → Sub-sampling 需速率。这一簇在强条件下近乎最优,但在弱条件或未知速率下有硬边界。 3. 估计量的偏差结构:M-估计的中位数偏差界 (Kuchibhotla, 2021) → 均值/中位数偏差修正 (Kosmidis et al., 2018; Kim, 2016)。这一簇为 HulC 提供了“中位数偏差已知或可估”的输入。

这个方向在追问的核心问题: 1. 在估计量极限分布不存在或未知时,能否构建覆盖有效的置信集? 当前主流(Bootstrap/Sub-sampling)在方向可微等场景失效;Universal Inference 有效但宽度劣。 2. 能否在不预知收敛速率的情况下构建置信集? Sub-sampling 需速率;Wald 需方差(隐含速率 \(n^{-1/2}\));Universal Inference 与 HulC 不需要。 3. 弱条件下的置信集宽度能否接近最优? Universal Inference 的宽度常为 \(O(n^{-1/4})\)(远劣于 \(O(n^{-1/2})\));HulC 声称在许多情况下近最优。

⚠️ 作者的 framing: - 作者把缺口 frame 成“现有方法要么条件太强(Bootstrap),要么需速率(Sub-sampling),要么太宽(Universal Inference)”,从而让 HulC 成为“显然的下一步”:只需中位数偏差、不需速率、宽度近最优。 - 被淡化的竞争路线:高维 CLT/Bootstrap 的近期进展(Chernozhukov et al., 2020; Deng, 2020)在强矩条件与维数限制下已达到近乎最优误差界,作者虽引用但未深入对比 HulC 在这些条件下的宽度是否真比修正 Bootstrap 更窄;基于 influence function 的半参数推断(如 one-step/debiased ML)在满足 Neyman orthogonality 时可获 \(\sqrt{n}\)-速率与正态极限,HulC 在这些经典半参数设定下是否比 cross-fitting + bootstrap 更优,作者未做基准对比。 - 明显该被引却未出现的:半参数有效推断的基准工作(如 Robins et al. 的 HOIF / one-step estimator 理论,或 Chernozhukov et al. 的 Double/Debiased ML 论文)——HulC 声称适用于半参数设定,但 intro 未引用这些半参数推断的标杆,研究者应去查 HulC 在半参数有效估计量上的宽度是否真能匹敌 cross-fitting + bootstrap。

张力: 未见明显对立引用。Bootstrap 与 Universal Inference 的结论不矛盾,只是适用条件与宽度代价不同;HulC 定位在两者之间,未与任何一方在相同条件下得出相反结论。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • \(\theta_0\):目标参数,可以是任意维数 \(d\) 的参数/泛函/estimand。
  • \(X_1, \ldots, X_n\):可观测的 i.i.d. 随机变量(样本),服从分布 \(P\)\(P\) 可以是参数、半参数或非参数模型,本文不限定其结构。
  • \(\hat{\theta}_S\):基于子样本 \(\{X_i : i \in S\}\)\(S \subseteq \{1, \ldots, n\}\))计算的估计量。本文核心操作是将 \(\{1, \ldots, n\}\) 分成 \(B\) 个互不相交的子集 \(S_1, \ldots, S_B\),在每个子集上算出 \(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\)
  • \(B\):分批数,由目标覆盖率 \(1-\alpha\) 和中位数偏差 \(\delta\) 决定。
  • \(\delta\):估计量 \(\hat{\theta}_S\) 的(渐近)中位数偏差,定义为 \(\delta := \sup_{t \geq 0} \max\left( \mathbb{P}(\hat{\theta}_S - \theta_0 \leq -t) - 1/2, 1/2 - \mathbb{P}(\hat{\theta}_S - \theta_0 \leq t) \right)\)。当 \(\delta=0\) 时,估计量中位数无偏(median-unbiased);\(\delta\) 越大,中位数偏离真值越远。
  • \(\mathrm{HulC}(\alpha, \delta)\):置信集,定义为 \(\{\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\}\) 的凸包:\(\mathrm{Conv}\left(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\right)\)
  • 可观测数据\(X_1, \ldots, X_n\) 完全可观测;\(\theta_0\) 不可观测,是要推断的对象;\(\delta\) 在基本 HulC 中需预设(如已知 M-估计渐近中位数偏差为 0),在 Adaptive HulC 中从数据估出。

第二步:最小内核——一维中位数无偏估计量的特例

剥掉所有一般性(多维、非零中位数偏差、Adaptive 估偏差),最小内核是:一维参数 \(\theta_0 \in \mathbb{R}\),估计量 \(\hat{\theta}_S\) 渐近中位数无偏(\(\delta=0\)),即 \(\mathbb{P}(\hat{\theta}_S \leq \theta_0) \to 1/2\)\(\mathbb{P}(\hat{\theta}_S \geq \theta_0) \to 1/2\)

在这个特例下,HulC 的核心命题退化成: \(n\) 个样本分成 \(B\) 个子集,取 \(B\) 个估计量的凸包(此时凸包就是区间 \([\min_j \hat{\theta}_{S_j}, \max_j \hat{\theta}_{S_j}]\)),该区间覆盖 \(\theta_0\) 的概率 \(\geq 1 - 2^{-B}\)

为什么成立?证明怎么走? 1. 中位数无偏的含义\(\mathbb{P}(\hat{\theta}_{S_j} \leq \theta_0) \geq 1/2\)\(\mathbb{P}(\hat{\theta}_{S_j} \geq \theta_0) \geq 1/2\)。即每个估计量以至少 \(1/2\) 的概率落在 \(\theta_0\) 的左侧,也以至少 \(1/2\) 的概率落在右侧。 2. 不覆盖的唯一条件:区间 \([\min_j \hat{\theta}_{S_j}, \max_j \hat{\theta}_{S_j}]\) 不覆盖 \(\theta_0\),意味着 \(\theta_0\) 严格小于所有 \(\hat{\theta}_{S_j}\)(全在右侧)或严格大于所有 \(\hat{\theta}_{S_j}\)(全在左侧)。 3. 概率界:由于各子集互不相交,\(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\) 独立。“全在右侧”的概率 \(\leq (1/2)^B\),“全在左侧”的概率 \(\leq (1/2)^B\)。总不覆盖概率 \(\leq 2 \cdot (1/2)^B = 2^{-B}\)。 4. \(B\):要达到覆盖率 \(1-\alpha\),只需 \(2^{-B} \leq \alpha\),即 \(B \geq \log_2(1/\alpha)\)。例如 \(\alpha=0.05\)\(B \geq 5\),只需 5 个子估计量!

一般情形只是这个内核的“加壳”: - 若 \(\delta > 0\)(中位数有偏),每个估计量偏向一侧的概率从 \(1/2\) 变成 \(1/2 + \delta\),不覆盖概率界变成 \((1/2 + \delta)^B + (1/2 + \delta)^B\),选 \(B\) 使得此界 \(\leq \alpha\) 即可。 - 若 \(\theta_0\)\(d\) 维,凸包是 \(d\) 维凸多面体,不覆盖意味着 \(\theta_0\) 不在凸包内(等价于存在一个超平面将 \(\theta_0\) 与所有 \(\hat{\theta}_{S_j}\) 分开),覆盖概率界仍依赖各估计量偏向同一侧的概率,通过中位数偏差 \(\delta\) 控制。 - Adaptive HulC 用 sub-sampling 从数据估 \(\delta\),再代入选 \(B\),是“参数 \(\delta\) 未知”时的数据驱动扩展。


三、这篇论文做了什么

三句话: ①研究了在弱正则性条件下(不要求极限分布存在、不要求 bootstrap 一致、不预知收敛速率)如何构建任意参数的置信集; ②核心方法是 HulC——将数据分 \(B\) 批、各批算估计量、取凸包作为置信集,仅需估计量的(渐近)中位数偏差 \(\delta\) 来决定 \(B\);进一步提出 Adaptive HulC 用 sub-sampling 从数据估 \(\delta\); ③主要结论:HulC 置信集的覆盖概率有非渐近保证 \(1 - 2(1/2 + \delta)^B\)(或渐近保证),宽度在许多情况下接近最优(与 Wald 区间同阶),且在 bootstrap 失效的例子中仍成立。

关键设定与假设: 在第二节最小记号基础上补全: - 数据与估计量\(X_1, \ldots, X_n\) i.i.d. \(\sim P\)\(\hat{\theta}_S\) 是基于子样本 \(S\) 的估计量,可以是任意 M-估计、Z-估计、非参数估计量等。本文不要求 \(\hat{\theta}_S\) 有极限分布或特定速率。 - 中位数偏差 \(\delta\):定义为 \(\delta := \limsup_{|S| \to \infty} \sup_{t \geq 0} \max\left( \mathbb{P}(\hat{\theta}_S - \theta_0 \leq -t) - 1/2, 1/2 - \mathbb{P}(\hat{\theta}_S - \theta_0 \leq t) \right)\)。这是 HulC 唯一需要的“分布信息”。假设 \(\delta\) 已知(基本 HulC)或可从数据估出(Adaptive HulC)。 - 分批数 \(B\)\(B\) 是满足 \((1/2 + \delta)^B + (1/2 + \delta)^B \leq \alpha\) 的最小整数,即 \(B \geq \lceil \log(2/\alpha) / \log(1/(1/2 + \delta)) \rceil\)。当 \(\delta=0\)\(B \geq \lceil \log_2(2/\alpha) \rceil\)。 - 子集划分:将 \(\{1, \ldots, n\}\) 随机等分成 \(B\) 个互不相交子集 \(S_1, \ldots, S_B\),每子集大小约 \(n/B\)。 - 统计含义与放宽: - 不要求极限分布存在:相比 Wald/Bootstrap(要求 \(\hat{\theta}_n\) 渐近正态或 bootstrap 分布一致),HulC 只要求中位数偏差 \(\delta\) 存在且有限,这在许多非标准问题(如方向可微函数、形状约束)中成立。 - 不要求收敛速率已知:相比 Sub-sampling(需预知速率 \(n^{-r}\) 以选带宽),HulC 的 \(B\) 只依赖 \(\alpha\)\(\delta\),不依赖速率。 - 不要求方差有限:某些重尾分布下 MLE 无方差但有中位数偏差界(Kuchibhotla, 2021),HulC 可用而 Wald 不可用。 - 强化了什么:HulC 要求各子集估计量独立(通过 sample splitting 保证),这牺牲了全样本估计量的效率(每子集只用 \(n/B\) 个点)。

主要结果: 1. 定理 1(非渐近覆盖保证):若 \(\hat{\theta}_{S_j}\) 的中位数偏差满足 \(\mathbb{P}(\hat{\theta}_{S_j} - \theta_0 \leq -t) \leq 1/2 + \delta\)\(\mathbb{P}(\hat{\theta}_{S_j} - \theta_0 \geq t) \leq 1/2 + \delta\) 对所有 \(t \geq 0\),则 \(\mathbb{P}(\theta_0 \in \mathrm{Conv}(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B})) \geq 1 - 2(1/2 + \delta)^B\)。直觉:中位数偏差控制了估计量偏向同一侧的概率,凸包覆盖真值除非所有估计量偏向同一侧。必要条件:\(\delta < 1/2\)(否则界无意义)。 2. 定理 2(渐近覆盖保证):若 \(\hat{\theta}_{S_j}\) 的渐近中位数偏差为 \(\delta\)(即 \(\limsup\) 定义),则当 \(n \to \infty\) 时覆盖率 \(\to 1 - 2(1/2 + \delta)^B\)。这放宽了非渐近版的要求,允许有限样本时中位数偏差略偏离 \(\delta\)。 3. 定理 3-4(Adaptive HulC 的覆盖保证):用 sub-sampling 估 \(\delta\)\(\hat{\delta}\),代入选 \(\hat{B}\)。在 \(\hat{\delta}\) 一致估 \(\delta\) 的条件下,Adaptive HulC 的覆盖率渐近 \(\geq 1-\alpha\)。技术难点:\(\hat{B}\) 是随机变量,需控制 \(\hat{B}\) 过小导致覆盖不足的概率。 4. 宽度分析(命题 1-2 & 定理 5-6):在一维 \(\delta=0\) 且估计量渐近正态(方差 \(\sigma^2/n\))时,HulC 区间宽度 \(W_n = \max_j \hat{\theta}_{S_j} - \min_j \hat{\theta}_{S_j}\) 的期望满足 \(\mathbb{E}[W_n] \approx 2\sigma \sqrt{2\log(2/\alpha) / (n/B)} = 2\sigma \sqrt{2B\log(2/\alpha)/n}\)。当 \(\alpha=0.05\)\(B=5\),宽度约为 Wald 区间(\(2\sigma \sqrt{2\log(2/\alpha)/n}\))的 \(\sqrt{5} \approx 2.24\) 倍。作者指出在许多情况下此宽度是“近最优”的,因为任何基于 \(n/B\) 子样本的置信区间宽度至少为 \(O(\sqrt{B/n})\),HulC 的 \(\sqrt{B}\) 因子是 sample splitting 的固有代价,且 \(B\) 只依赖 \(\alpha\)\(\delta\)(不随 \(n\) 增长),故宽度与 Wald 同阶(差常数因子)。

证明路线与技术技巧: - 整体路线(覆盖保证): 1. 定义不覆盖事件\(\theta_0 \notin \mathrm{Conv}(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B})\) 等价于存在超平面将 \(\theta_0\) 与所有 \(\hat{\theta}_{S_j}\) 分开(一维时即全偏左或全偏右)。 2. 分解不覆盖概率:利用凸集分离定理,不覆盖概率 \(\leq \sum_{v: \|v\|=1} \mathbb{P}(\forall j: v^T(\hat{\theta}_{S_j} - \theta_0) > 0)\)。一维时方向 \(v\) 只有 \(\pm 1\),退化成“全偏左 + 全偏右”。 3. 用中位数偏差界控制同向概率\(\mathbb{P}(\forall j: v^T(\hat{\theta}_{S_j} - \theta_0) > 0) \leq \prod_j \mathbb{P}(v^T(\hat{\theta}_{S_j} - \theta_0) > 0) \leq (1/2 + \delta)^B\)(由独立性 + 中位数偏差定义)。 4. 合并得覆盖界:总不覆盖概率 \(\leq 2(1/2 + \delta)^B\)(一维)或更一般的界(多维需覆盖所有方向 \(v\),作者用对称性简化)。 - 关键跳跃点: - 多维不覆盖概率的界:一维时方向只有两个,界是 \(2(1/2+\delta)^B\);多维时方向无穷,需将“存在方向使所有估计量偏向该侧”的概率界住。作者的关键跳跃是:利用中位数偏差的对称定义(左右同界),将多维不覆盖概率界仍控制在 \(2(1/2+\delta)^B\),不随维数 \(d\) 增长。这依赖凸集分离定理与中位数偏差的 uniform 定义。 - Adaptive HulC 的 \(\hat{B}\) 控制\(\hat{B}\) 是随机的,过小会导致覆盖不足。作者用 sub-sampling 估 \(\delta\) 的一致性(在弱条件下成立)来保证 \(\hat{B}\) 以高概率 \(\ge\) 所需最小 \(B\),从而渐近覆盖有效。 - 技术技巧点名: - Sample splitting:保证各子集估计量独立,使同向概率可分解为乘积。这是 HulC 的基础,代价是每子集样本量 \(n/B\)。 - 凸集分离定理:将“点不在凸包内”转化为“存在超平面分离”,是多维覆盖证明的核心几何工具。 - 中位数偏差界:替代极限分布,用 \(\sup_t\) 的 uniform 界控制偏向概率。引用 Kuchibhotla (2021) 的 M-估计中位数偏差界作为输入。 - Sub-sampling 估 \(\delta\):在 Adaptive HulC 中,用 sub-sampling 估计中位数偏差,依赖 sub-sampling 在弱条件下的一致性(不需预知速率,只需估偏差的符号/大小)。 - Order statistics 的浓度不等式:在宽度分析中,引用 Boucheron & Thomas (2012) 的次序统计量浓度界来控制 \(\max_j \hat{\theta}_{S_j} - \min_j \hat{\theta}_{S_j}\) 的期望与尾部。 - Binomial 超期望概率:引用 Greenberg & Mohri (2013) 与 Doerr (2017) 的 Binomial 尾界来精确计算 \(B\) 个独立中位数无偏估计量同向的概率,优化 \(B\) 的选择。

真实例子与应用: 论文包含多个真实/模拟例子,重点讲三个: 1. 方向可微函数的推断(Fang & Santos, 2019 场景): - 数据/场景\(X_1, \ldots, X_n\) i.i.d. \(\sim P\),目标 \(\theta_0 = \kappa(\mu_0)\),其中 \(\mu_0 = \mathbb{E}[X]\)\(\kappa\) 是方向可微函数(如 max 函数)。Bootstrap 在此场景不一致(除非 \(\kappa\) 可微)。 - 怎么用 HulC:将数据分 \(B\) 批,每批算 \(\hat{\theta}_{S_j} = \kappa(\bar{X}_{S_j})\),取凸包。由于 \(\kappa\) 是方向可微的,\(\hat{\theta}_{S_j}\) 的渐近中位数偏差 \(\delta=0\)(极限分布虽非正态但中位数无偏),选 \(B=5\)\(\alpha=0.05\))。 - 结果:HulC 置信区间覆盖率接近 95%,而 Bootstrap 置信区间覆盖率显著偏低(因不一致)。宽度比 Sub-sampling 略宽但无需预知速率。 - 想说明什么:HulC 在 Bootstrap 失效的非标准问题中仍有效,且无需速率知识。 2. 形状约束回归(单调回归): - 数据/场景\((X_i, Y_i)\)\(Y_i = f_0(X_i) + \xi_i\)\(f_0\) 单调,目标 \(\theta_0 = f_0(x_0)\)(某点值)。单调回归 LSE 的极限分布含 nuisance 参数(导数未知),Bootstrap 与 Sub-sampling 需估导数或选带宽。 - 怎么用 HulC:分 \(B\) 批,每批算单调 LSE \(\hat{f}_{S_j}(x_0)\),取凸包。引用 Sen (1968) 与 Deng et al. (2020) 的结果,单调 LSE 的中位数偏差 \(\delta=0\)(渐近中位数无偏)。 - 结果:HulC 置信区间覆盖有效,宽度与基于 pivot 的 Deng et al. (2020) 方法相近,但无需估 nuisance 参数。 - 想说明什么:HulC 在 nuisance 参数存在的半参数问题中绕过了 nuisance 估计,只需中位数偏差。 3. 错配线性回归(M-估计的中位数偏差): - 数据/场景:线性回归模型错配(真实函数非线性),目标 \(\theta_0\) 是错配模型下的最优线性系数。M-估计的极限分布依赖 nuisance(条件均值、方差等),Bootstrap 依赖模型正确指定。 - 怎么用 HulC:分 \(B\) 批,每批算 LAD 估计 \(\hat{\theta}_{S_j}\),取凸包。引用 Kuchibhotla et al. (2021) 的结果,LAD 估计的中位数偏差 \(\delta=0\)(渐近中位数无偏)。 - 结果:HulC 置信区间覆盖有效,而 Wald 区间(用 sandwich 方差)在错配下因方差估不准而覆盖偏低。 - 想说明什么:HulC 在模型错配下仍有效,无需估复杂 nuisance 方差。

🔎 结论是否比证明窄: - 宽度“近最优”的 claim:作者在多处 claim HulC 置信集宽度在许多情况下“近最优”,但严格证明只在一维、\(\delta=0\)、估计量渐近正态的特例下给出(命题 1-2),且宽度是 Wald 区间的 \(\sqrt{B}\) 倍(\(B\) 是常数如 5,故同阶但常数因子约 2.24)。对于多维、非正态、\(\delta>0\) 的情形,宽度分析只有启发式讨论(第 5 节),无严格最优性定理。研究者应将“近最优”视为\(\delta=0\) + 正态特例下有严格界、在一般情形下是 conjecture。 - Adaptive HulC 的覆盖保证:定理 3-4 证明渐近覆盖 \(\geq 1-\alpha\),但要求 sub-sampling 估 \(\delta\) 的一致性。此一致性在弱条件下成立(引用 Politis & Romano 的 sub-sampling 理论),但有限样本下 \(\hat{\delta}\) 可能偏小导致 \(\hat{B}\) 过小、覆盖不足,作者未给有限样本覆盖界,只给渐近界。


四、开放问题(点到为止,扎根具体语句)

  1. 半参数有效估计量上的宽度最优性:HulC 在半参数有效估计量(如 one-step/debiased ML,渐近正态且 \(\delta=0\))上的宽度是否比 cross-fitting + bootstrap 更宽?本文未与半参数推断标杆做基准对比。扎根点:第 5 节宽度分析只对比 Wald 与 Universal Inference,未对比半参数有效推断方法。
  2. 多维且 \(\delta>0\) 时的宽度界:本文严格宽度界只在一维 \(\delta=0\) 给出;多维且 \(\delta>0\) 时凸包体积/直径的浓度界是什么?扎根点:第 5 节命题 1-2 只覆盖一维正态,多维只给启发式。
  3. Adaptive HulC 的有限样本覆盖保证:当前 Adaptive HulC 只有渐近覆盖保证,有限样本下 \(\hat{\delta}\) 估偏导致覆盖不足的概率界是什么?扎根点:定理 3-4 只有渐近界,作者在讨论中承认“finite-sample validity of the Adaptive HulC remains an open question”。
  4. 与高维 CLT/Bootstrap 的对比:在强矩条件与维数 \(d \ll n\) 下,修正 Bootstrap(Chernozhukov et al., 2020; Deng, 2020)已达近乎最优误差界;HulC 在这些条件下的宽度是否比修正 Bootstrap 更窄?扎根点:intro 引用高维 CLT 工作但未做宽度基准对比。

要确认某条是否真 gap,建议读同子领域近期 5 篇 intro:若都指向“半参数有效推断的宽度基准缺失”= 共识真 gap;若高维 Bootstrap 修补与 HulC 互相打架 = 机会。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论