The HulC: confidence regions from convex hulls¶

作者: Arun Kumar Kuchibhotla, Sivaraman Balakrishnan, Larry Wasserman
来源: Journal of the Royal Statistical Society Series B
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本问题是：在弱正则性条件（甚至不保证估计量有极限分布、或 bootstrap/CLT 失效）下，如何为任意参数构建具有有限样本或渐近覆盖保证的置信集。当前该方向的成熟度处于“从特例修补走向统一框架”的阶段：经典方法（Wald, Bootstrap）依赖强正则条件，近年的“Universal Inference”打破了条件限制但代价是置信集过宽；本论文试图在“弱条件”与“窄宽度”之间找到第三条路——仅依赖估计量的中位数偏差。

发展脉络： - 奠基工作：经典推断基于极限分布（Stigler, 2007; Lehmann & Casella, 1998）与 Wald 区间，要求估计量渐近正态且方差可估；M-估计的高阶偏差修正（Kosmidis et al., 2018; Kim, 2016）与中位数偏差分析（Kuchibhotla, 2021）为“只看中位数偏差”提供了理论素材，但未将其用于置信区间构建。 - 主要进展：Bootstrap 与 Sub-sampling 成为弱条件下的主力，但它们各有硬伤：Bootstrap 在方向可微函数等非标准问题下不一致（Fang & Santos, 2019，作者原话：“bootstrap is inconsistent unless κ(·) is differentiable”）；高维 CLT 与 Bootstrap 近似虽取得近乎最优误差界（Chernozhukov et al., 2020; Deng, 2020; Fang & Koike, 2021），但依赖维数/样本量比例与矩条件；Sub-sampling 虽弱条件成立，但必须预知收敛速率（作者原话：“unlike sub-sampling, the HulC does not require knowledge of the rate of convergence”）。 - 当前 frontier：无正则条件的推断——Wasserman et al. (2019) 的 Universal Inference 提出了基于 split LRT 的有限样本有效方法，作者原话称其“have finite-sample guarantees without regularity conditions”，但代价是置信集宽度通常远超最优（作者在本文 intro 中明确指出其宽度劣势）。Rinaldo et al. (2016) 探索了 sample splitting + bootstrap，但未摆脱 bootstrap 的正则性依赖。 - 本文的位置：本文提出 HulC，定位为“弱条件 + 无需速率 + 近最优宽度”的统一推断框架。它用中位数偏差替代极限分布，用凸包替代分位数估计，试图填补 Universal Inference（太宽）与 Bootstrap/Sub-sampling（条件太强或需速率）之间的缺口。

子线索聚类： 1. 弱条件/无分布推断：Universal Inference (Wasserman et al., 2019) → HulC (本文)。这一簇追求有限样本或极弱条件下的覆盖保证，核心代价是宽度。Universal Inference 用 likelihood ratio，HulC 用凸包。 2. Bootstrap/Sub-sampling 的边界与修补：Bootstrap 在非标准问题失效 (Fang & Santos, 2019) → 高维修补 (Chernozhukov et al., 2020; Deng, 2020) → Sub-sampling 需速率。这一簇在强条件下近乎最优，但在弱条件或未知速率下有硬边界。 3. 估计量的偏差结构：M-估计的中位数偏差界 (Kuchibhotla, 2021) → 均值/中位数偏差修正 (Kosmidis et al., 2018; Kim, 2016)。这一簇为 HulC 提供了“中位数偏差已知或可估”的输入。

这个方向在追问的核心问题： 1. 在估计量极限分布不存在或未知时，能否构建覆盖有效的置信集？ 当前主流（Bootstrap/Sub-sampling）在方向可微等场景失效；Universal Inference 有效但宽度劣。 2. 能否在不预知收敛速率的情况下构建置信集？ Sub-sampling 需速率；Wald 需方差（隐含速率 \(n^{-1/2}\)）；Universal Inference 与 HulC 不需要。 3. 弱条件下的置信集宽度能否接近最优？ Universal Inference 的宽度常为 \(O(n^{-1/4})\)（远劣于 \(O(n^{-1/2})\)）；HulC 声称在许多情况下近最优。

⚠️ 作者的 framing： - 作者把缺口 frame 成“现有方法要么条件太强（Bootstrap），要么需速率（Sub-sampling），要么太宽（Universal Inference）”，从而让 HulC 成为“显然的下一步”：只需中位数偏差、不需速率、宽度近最优。 - 被淡化的竞争路线：高维 CLT/Bootstrap 的近期进展（Chernozhukov et al., 2020; Deng, 2020）在强矩条件与维数限制下已达到近乎最优误差界，作者虽引用但未深入对比 HulC 在这些条件下的宽度是否真比修正 Bootstrap 更窄；基于 influence function 的半参数推断（如 one-step/debiased ML）在满足 Neyman orthogonality 时可获 \(\sqrt{n}\)-速率与正态极限，HulC 在这些经典半参数设定下是否比 cross-fitting + bootstrap 更优，作者未做基准对比。 - 明显该被引却未出现的：半参数有效推断的基准工作（如 Robins et al. 的 HOIF / one-step estimator 理论，或 Chernozhukov et al. 的 Double/Debiased ML 论文）——HulC 声称适用于半参数设定，但 intro 未引用这些半参数推断的标杆，研究者应去查 HulC 在半参数有效估计量上的宽度是否真能匹敌 cross-fitting + bootstrap。

张力：未见明显对立引用。Bootstrap 与 Universal Inference 的结论不矛盾，只是适用条件与宽度代价不同；HulC 定位在两者之间，未与任何一方在相同条件下得出相反结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(\theta_0\)：目标参数，可以是任意维数 \(d\) 的参数/泛函/estimand。
\(X_1, \ldots, X_n\)：可观测的 i.i.d. 随机变量（样本），服从分布 \(P\)。\(P\) 可以是参数、半参数或非参数模型，本文不限定其结构。
\(\hat{\theta}_S\)：基于子样本 \(\{X_i : i \in S\}\)（\(S \subseteq \{1, \ldots, n\}\)）计算的估计量。本文核心操作是将 \(\{1, \ldots, n\}\) 分成 \(B\) 个互不相交的子集 \(S_1, \ldots, S_B\)，在每个子集上算出 \(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\)。
\(B\)：分批数，由目标覆盖率 \(1-\alpha\) 和中位数偏差 \(\delta\) 决定。
\(\delta\)：估计量 \(\hat{\theta}_S\) 的（渐近）中位数偏差，定义为 \(\delta := \sup_{t \geq 0} \max\left( \mathbb{P}(\hat{\theta}_S - \theta_0 \leq -t) - 1/2, 1/2 - \mathbb{P}(\hat{\theta}_S - \theta_0 \leq t) \right)\)。当 \(\delta=0\) 时，估计量中位数无偏（median-unbiased）；\(\delta\) 越大，中位数偏离真值越远。
\(\mathrm{HulC}(\alpha, \delta)\)：置信集，定义为 \(\{\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\}\) 的凸包：\(\mathrm{Conv}\left(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\right)\)。
可观测数据：\(X_1, \ldots, X_n\) 完全可观测；\(\theta_0\) 不可观测，是要推断的对象；\(\delta\) 在基本 HulC 中需预设（如已知 M-估计渐近中位数偏差为 0），在 Adaptive HulC 中从数据估出。

第二步：最小内核——一维中位数无偏估计量的特例

剥掉所有一般性（多维、非零中位数偏差、Adaptive 估偏差），最小内核是：一维参数 \(\theta_0 \in \mathbb{R}\)，估计量 \(\hat{\theta}_S\) 渐近中位数无偏（\(\delta=0\)），即 \(\mathbb{P}(\hat{\theta}_S \leq \theta_0) \to 1/2\) 且 \(\mathbb{P}(\hat{\theta}_S \geq \theta_0) \to 1/2\)。

在这个特例下，HulC 的核心命题退化成：将 \(n\) 个样本分成 \(B\) 个子集，取 \(B\) 个估计量的凸包（此时凸包就是区间 \([\min_j \hat{\theta}_{S_j}, \max_j \hat{\theta}_{S_j}]\)），该区间覆盖 \(\theta_0\) 的概率 \(\geq 1 - 2^{-B}\)。

为什么成立？证明怎么走？ 1. 中位数无偏的含义：\(\mathbb{P}(\hat{\theta}_{S_j} \leq \theta_0) \geq 1/2\) 且 \(\mathbb{P}(\hat{\theta}_{S_j} \geq \theta_0) \geq 1/2\)。即每个估计量以至少 \(1/2\) 的概率落在 \(\theta_0\) 的左侧，也以至少 \(1/2\) 的概率落在右侧。 2. 不覆盖的唯一条件：区间 \([\min_j \hat{\theta}_{S_j}, \max_j \hat{\theta}_{S_j}]\) 不覆盖 \(\theta_0\)，意味着 \(\theta_0\) 严格小于所有 \(\hat{\theta}_{S_j}\)（全在右侧）或严格大于所有 \(\hat{\theta}_{S_j}\)（全在左侧）。 3. 概率界：由于各子集互不相交，\(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B}\) 独立。“全在右侧”的概率 \(\leq (1/2)^B\)，“全在左侧”的概率 \(\leq (1/2)^B\)。总不覆盖概率 \(\leq 2 \cdot (1/2)^B = 2^{-B}\)。 4. 选 \(B\)：要达到覆盖率 \(1-\alpha\)，只需 \(2^{-B} \leq \alpha\)，即 \(B \geq \log_2(1/\alpha)\)。例如 \(\alpha=0.05\) 时 \(B \geq 5\)，只需 5 个子估计量！

一般情形只是这个内核的“加壳”： - 若 \(\delta > 0\)（中位数有偏），每个估计量偏向一侧的概率从 \(1/2\) 变成 \(1/2 + \delta\)，不覆盖概率界变成 \((1/2 + \delta)^B + (1/2 + \delta)^B\)，选 \(B\) 使得此界 \(\leq \alpha\) 即可。 - 若 \(\theta_0\) 是 \(d\) 维，凸包是 \(d\) 维凸多面体，不覆盖意味着 \(\theta_0\) 不在凸包内（等价于存在一个超平面将 \(\theta_0\) 与所有 \(\hat{\theta}_{S_j}\) 分开），覆盖概率界仍依赖各估计量偏向同一侧的概率，通过中位数偏差 \(\delta\) 控制。 - Adaptive HulC 用 sub-sampling 从数据估 \(\delta\)，再代入选 \(B\)，是“参数 \(\delta\) 未知”时的数据驱动扩展。

三、这篇论文做了什么¶

三句话： ①研究了在弱正则性条件下（不要求极限分布存在、不要求 bootstrap 一致、不预知收敛速率）如何构建任意参数的置信集； ②核心方法是 HulC——将数据分 \(B\) 批、各批算估计量、取凸包作为置信集，仅需估计量的（渐近）中位数偏差 \(\delta\) 来决定 \(B\)；进一步提出 Adaptive HulC 用 sub-sampling 从数据估 \(\delta\)； ③主要结论：HulC 置信集的覆盖概率有非渐近保证 \(1 - 2(1/2 + \delta)^B\)（或渐近保证），宽度在许多情况下接近最优（与 Wald 区间同阶），且在 bootstrap 失效的例子中仍成立。

关键设定与假设：在第二节最小记号基础上补全： - 数据与估计量：\(X_1, \ldots, X_n\) i.i.d. \(\sim P\)；\(\hat{\theta}_S\) 是基于子样本 \(S\) 的估计量，可以是任意 M-估计、Z-估计、非参数估计量等。本文不要求 \(\hat{\theta}_S\) 有极限分布或特定速率。 - 中位数偏差 \(\delta\)：定义为 \(\delta := \limsup_{|S| \to \infty} \sup_{t \geq 0} \max\left( \mathbb{P}(\hat{\theta}_S - \theta_0 \leq -t) - 1/2, 1/2 - \mathbb{P}(\hat{\theta}_S - \theta_0 \leq t) \right)\)。这是 HulC 唯一需要的“分布信息”。假设 \(\delta\) 已知（基本 HulC）或可从数据估出（Adaptive HulC）。 - 分批数 \(B\)：\(B\) 是满足 \((1/2 + \delta)^B + (1/2 + \delta)^B \leq \alpha\) 的最小整数，即 \(B \geq \lceil \log(2/\alpha) / \log(1/(1/2 + \delta)) \rceil\)。当 \(\delta=0\)，\(B \geq \lceil \log_2(2/\alpha) \rceil\)。 - 子集划分：将 \(\{1, \ldots, n\}\) 随机等分成 \(B\) 个互不相交子集 \(S_1, \ldots, S_B\)，每子集大小约 \(n/B\)。 - 统计含义与放宽： - 不要求极限分布存在：相比 Wald/Bootstrap（要求 \(\hat{\theta}_n\) 渐近正态或 bootstrap 分布一致），HulC 只要求中位数偏差 \(\delta\) 存在且有限，这在许多非标准问题（如方向可微函数、形状约束）中成立。 - 不要求收敛速率已知：相比 Sub-sampling（需预知速率 \(n^{-r}\) 以选带宽），HulC 的 \(B\) 只依赖 \(\alpha\) 和 \(\delta\)，不依赖速率。 - 不要求方差有限：某些重尾分布下 MLE 无方差但有中位数偏差界（Kuchibhotla, 2021），HulC 可用而 Wald 不可用。 - 强化了什么：HulC 要求各子集估计量独立（通过 sample splitting 保证），这牺牲了全样本估计量的效率（每子集只用 \(n/B\) 个点）。

主要结果： 1. 定理 1（非渐近覆盖保证）：若 \(\hat{\theta}_{S_j}\) 的中位数偏差满足 \(\mathbb{P}(\hat{\theta}_{S_j} - \theta_0 \leq -t) \leq 1/2 + \delta\) 且 \(\mathbb{P}(\hat{\theta}_{S_j} - \theta_0 \geq t) \leq 1/2 + \delta\) 对所有 \(t \geq 0\)，则 \(\mathbb{P}(\theta_0 \in \mathrm{Conv}(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B})) \geq 1 - 2(1/2 + \delta)^B\)。直觉：中位数偏差控制了估计量偏向同一侧的概率，凸包覆盖真值除非所有估计量偏向同一侧。必要条件：\(\delta < 1/2\)（否则界无意义）。 2. 定理 2（渐近覆盖保证）：若 \(\hat{\theta}_{S_j}\) 的渐近中位数偏差为 \(\delta\)（即 \(\limsup\) 定义），则当 \(n \to \infty\) 时覆盖率 \(\to 1 - 2(1/2 + \delta)^B\)。这放宽了非渐近版的要求，允许有限样本时中位数偏差略偏离 \(\delta\)。 3. 定理 3-4（Adaptive HulC 的覆盖保证）：用 sub-sampling 估 \(\delta\) 得 \(\hat{\delta}\)，代入选 \(\hat{B}\)。在 \(\hat{\delta}\) 一致估 \(\delta\) 的条件下，Adaptive HulC 的覆盖率渐近 \(\geq 1-\alpha\)。技术难点：\(\hat{B}\) 是随机变量，需控制 \(\hat{B}\) 过小导致覆盖不足的概率。 4. 宽度分析（命题 1-2 & 定理 5-6）：在一维 \(\delta=0\) 且估计量渐近正态（方差 \(\sigma^2/n\)）时，HulC 区间宽度 \(W_n = \max_j \hat{\theta}_{S_j} - \min_j \hat{\theta}_{S_j}\) 的期望满足 \(\mathbb{E}[W_n] \approx 2\sigma \sqrt{2\log(2/\alpha) / (n/B)} = 2\sigma \sqrt{2B\log(2/\alpha)/n}\)。当 \(\alpha=0.05\)，\(B=5\)，宽度约为 Wald 区间（\(2\sigma \sqrt{2\log(2/\alpha)/n}\)）的 \(\sqrt{5} \approx 2.24\) 倍。作者指出在许多情况下此宽度是“近最优”的，因为任何基于 \(n/B\) 子样本的置信区间宽度至少为 \(O(\sqrt{B/n})\)，HulC 的 \(\sqrt{B}\) 因子是 sample splitting 的固有代价，且 \(B\) 只依赖 \(\alpha\) 和 \(\delta\)（不随 \(n\) 增长），故宽度与 Wald 同阶（差常数因子）。

证明路线与技术技巧： - 整体路线（覆盖保证）： 1. 定义不覆盖事件：\(\theta_0 \notin \mathrm{Conv}(\hat{\theta}_{S_1}, \ldots, \hat{\theta}_{S_B})\) 等价于存在超平面将 \(\theta_0\) 与所有 \(\hat{\theta}_{S_j}\) 分开（一维时即全偏左或全偏右）。 2. 分解不覆盖概率：利用凸集分离定理，不覆盖概率 \(\leq \sum_{v: \|v\|=1} \mathbb{P}(\forall j: v^T(\hat{\theta}_{S_j} - \theta_0) > 0)\)。一维时方向 \(v\) 只有 \(\pm 1\)，退化成“全偏左 + 全偏右”。 3. 用中位数偏差界控制同向概率：\(\mathbb{P}(\forall j: v^T(\hat{\theta}_{S_j} - \theta_0) > 0) \leq \prod_j \mathbb{P}(v^T(\hat{\theta}_{S_j} - \theta_0) > 0) \leq (1/2 + \delta)^B\)（由独立性 + 中位数偏差定义）。 4. 合并得覆盖界：总不覆盖概率 \(\leq 2(1/2 + \delta)^B\)（一维）或更一般的界（多维需覆盖所有方向 \(v\)，作者用对称性简化）。 - 关键跳跃点： - 多维不覆盖概率的界：一维时方向只有两个，界是 \(2(1/2+\delta)^B\)；多维时方向无穷，需将“存在方向使所有估计量偏向该侧”的概率界住。作者的关键跳跃是：利用中位数偏差的对称定义（左右同界），将多维不覆盖概率界仍控制在 \(2(1/2+\delta)^B\)，不随维数 \(d\) 增长。这依赖凸集分离定理与中位数偏差的 uniform 定义。 - Adaptive HulC 的 \(\hat{B}\) 控制：\(\hat{B}\) 是随机的，过小会导致覆盖不足。作者用 sub-sampling 估 \(\delta\) 的一致性（在弱条件下成立）来保证 \(\hat{B}\) 以高概率 \(\ge\) 所需最小 \(B\)，从而渐近覆盖有效。 - 技术技巧点名： - Sample splitting：保证各子集估计量独立，使同向概率可分解为乘积。这是 HulC 的基础，代价是每子集样本量 \(n/B\)。 - 凸集分离定理：将“点不在凸包内”转化为“存在超平面分离”，是多维覆盖证明的核心几何工具。 - 中位数偏差界：替代极限分布，用 \(\sup_t\) 的 uniform 界控制偏向概率。引用 Kuchibhotla (2021) 的 M-估计中位数偏差界作为输入。 - Sub-sampling 估 \(\delta\)：在 Adaptive HulC 中，用 sub-sampling 估计中位数偏差，依赖 sub-sampling 在弱条件下的一致性（不需预知速率，只需估偏差的符号/大小）。 - Order statistics 的浓度不等式：在宽度分析中，引用 Boucheron & Thomas (2012) 的次序统计量浓度界来控制 \(\max_j \hat{\theta}_{S_j} - \min_j \hat{\theta}_{S_j}\) 的期望与尾部。 - Binomial 超期望概率：引用 Greenberg & Mohri (2013) 与 Doerr (2017) 的 Binomial 尾界来精确计算 \(B\) 个独立中位数无偏估计量同向的概率，优化 \(B\) 的选择。

真实例子与应用：论文包含多个真实/模拟例子，重点讲三个： 1. 方向可微函数的推断（Fang & Santos, 2019 场景）： - 数据/场景：\(X_1, \ldots, X_n\) i.i.d. \(\sim P\)，目标 \(\theta_0 = \kappa(\mu_0)\)，其中 \(\mu_0 = \mathbb{E}[X]\)，\(\kappa\) 是方向可微函数（如 max 函数）。Bootstrap 在此场景不一致（除非 \(\kappa\) 可微）。 - 怎么用 HulC：将数据分 \(B\) 批，每批算 \(\hat{\theta}_{S_j} = \kappa(\bar{X}_{S_j})\)，取凸包。由于 \(\kappa\) 是方向可微的，\(\hat{\theta}_{S_j}\) 的渐近中位数偏差 \(\delta=0\)（极限分布虽非正态但中位数无偏），选 \(B=5\)（\(\alpha=0.05\)）。 - 结果：HulC 置信区间覆盖率接近 95%，而 Bootstrap 置信区间覆盖率显著偏低（因不一致）。宽度比 Sub-sampling 略宽但无需预知速率。 - 想说明什么：HulC 在 Bootstrap 失效的非标准问题中仍有效，且无需速率知识。 2. 形状约束回归（单调回归）： - 数据/场景：\((X_i, Y_i)\)，\(Y_i = f_0(X_i) + \xi_i\)，\(f_0\) 单调，目标 \(\theta_0 = f_0(x_0)\)（某点值）。单调回归 LSE 的极限分布含 nuisance 参数（导数未知），Bootstrap 与 Sub-sampling 需估导数或选带宽。 - 怎么用 HulC：分 \(B\) 批，每批算单调 LSE \(\hat{f}_{S_j}(x_0)\)，取凸包。引用 Sen (1968) 与 Deng et al. (2020) 的结果，单调 LSE 的中位数偏差 \(\delta=0\)（渐近中位数无偏）。 - 结果：HulC 置信区间覆盖有效，宽度与基于 pivot 的 Deng et al. (2020) 方法相近，但无需估 nuisance 参数。 - 想说明什么：HulC 在 nuisance 参数存在的半参数问题中绕过了 nuisance 估计，只需中位数偏差。 3. 错配线性回归（M-估计的中位数偏差）： - 数据/场景：线性回归模型错配（真实函数非线性），目标 \(\theta_0\) 是错配模型下的最优线性系数。M-估计的极限分布依赖 nuisance（条件均值、方差等），Bootstrap 依赖模型正确指定。 - 怎么用 HulC：分 \(B\) 批，每批算 LAD 估计 \(\hat{\theta}_{S_j}\)，取凸包。引用 Kuchibhotla et al. (2021) 的结果，LAD 估计的中位数偏差 \(\delta=0\)（渐近中位数无偏）。 - 结果：HulC 置信区间覆盖有效，而 Wald 区间（用 sandwich 方差）在错配下因方差估不准而覆盖偏低。 - 想说明什么：HulC 在模型错配下仍有效，无需估复杂 nuisance 方差。

🔎 结论是否比证明窄： - 宽度“近最优”的 claim：作者在多处 claim HulC 置信集宽度在许多情况下“近最优”，但严格证明只在一维、\(\delta=0\)、估计量渐近正态的特例下给出（命题 1-2），且宽度是 Wald 区间的 \(\sqrt{B}\) 倍（\(B\) 是常数如 5，故同阶但常数因子约 2.24）。对于多维、非正态、\(\delta>0\) 的情形，宽度分析只有启发式讨论（第 5 节），无严格最优性定理。研究者应将“近最优”视为在 \(\delta=0\) + 正态特例下有严格界、在一般情形下是 conjecture。 - Adaptive HulC 的覆盖保证：定理 3-4 证明渐近覆盖 \(\geq 1-\alpha\)，但要求 sub-sampling 估 \(\delta\) 的一致性。此一致性在弱条件下成立（引用 Politis & Romano 的 sub-sampling 理论），但有限样本下 \(\hat{\delta}\) 可能偏小导致 \(\hat{B}\) 过小、覆盖不足，作者未给有限样本覆盖界，只给渐近界。

四、开放问题（点到为止，扎根具体语句）¶

半参数有效估计量上的宽度最优性：HulC 在半参数有效估计量（如 one-step/debiased ML，渐近正态且 \(\delta=0\)）上的宽度是否比 cross-fitting + bootstrap 更宽？本文未与半参数推断标杆做基准对比。扎根点：第 5 节宽度分析只对比 Wald 与 Universal Inference，未对比半参数有效推断方法。
多维且 \(\delta>0\) 时的宽度界：本文严格宽度界只在一维 \(\delta=0\) 给出；多维且 \(\delta>0\) 时凸包体积/直径的浓度界是什么？扎根点：第 5 节命题 1-2 只覆盖一维正态，多维只给启发式。
Adaptive HulC 的有限样本覆盖保证：当前 Adaptive HulC 只有渐近覆盖保证，有限样本下 \(\hat{\delta}\) 估偏导致覆盖不足的概率界是什么？扎根点：定理 3-4 只有渐近界，作者在讨论中承认“finite-sample validity of the Adaptive HulC remains an open question”。
与高维 CLT/Bootstrap 的对比：在强矩条件与维数 \(d \ll n\) 下，修正 Bootstrap（Chernozhukov et al., 2020; Deng, 2020）已达近乎最优误差界；HulC 在这些条件下的宽度是否比修正 Bootstrap 更窄？扎根点：intro 引用高维 CLT 工作但未做宽度基准对比。

要确认某条是否真 gap，建议读同子领域近期 5 篇 intro：若都指向“半参数有效推断的宽度基准缺失”= 共识真 gap；若高维 Bootstrap 修补与 HulC 互相打架 = 机会。

Maintained by 陈星宇 · Homepage · Source on GitHub

The HulC: confidence regions from convex hulls¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论