Efficient surrogate-assisted inference for patient-reported outcome measures with complex missing mechanism¶

作者: Jaeyoung Park, Muxuan Liang, Ying-Qi Zhao, Xiang Zhong
来源: Electronic Journal of Statistics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本文处理的核心统计问题是：当结果变量（patient-reported outcome, PRO）存在高缺失率且缺失机制复杂（依赖于多个协变量）、研究者希望使用灵活（非参数/机器学习）模型对结果进行插补以推断预测模型参数时，如何获得根号 n 一致渐近正态的估计并构造有效置信区间。该问题的特殊性在于：灵活插补模型通常收敛速率慢于根号 n，直接带入会导致不可忽略偏差；而传统上用于消除此偏差的缺失倾向得分在复杂缺失机制下又难以可靠估计。本文的切入点是：借助一个信息性“替代指标”（surrogate）将高维灵活插补模型的有效维数压缩至低维，并构造一类低维权函数替代倾向得分进行单步偏差校正。

发展脉络（history）¶

奠基工作：缺失数据推断的基石是双重稳健（doubly robust, DR）方法（例如 Kang & Schafer, 2007; Cao et al., 2009），其核心思想是同时建模结果回归与缺失倾向，只要两者之一正确即可得到一致估计。这一系列工作被引用为“propensity score and the imputation models can lead to a consistent estimate for the outcome as long as either model is correctly specified”（作者原话）。但 DR 方法在倾向得分靠近 0 或 1 时表现不稳定，且当两个模型都误设时偏差严重。

主要进展：为提升稳健性，后续工作发展了增广 DR（augmented DR）和基于经验似然的改进（Tan, 2006, 2010; Han, 2012; Rotnitzky et al., 2012 等）。同时，在因果推断与半监督学习领域，surrogate 被用于提升效率：Cheng et al. (2018) 和 Liu et al. (2020) 在电子病历的半监督框架下利用替代指标辅助 ATE 估计，但大多假设缺失完全随机（MCAR）或可忽略（MAR）。Hou et al. (2021) 在 MCAR 假设下用 surrogate 辅助高维风险预测的推断——作者指出“在假设 MCAR 下”（作者原话），即这一工作不适用于 MAR 环境。另一个进展是充分维度缩减（SDR）文献（Cook, 2007; Ma & Zhu, 2012, 2013），它为将高维协变量压缩到低维子空间提供了估计工具，且其估计量渐近正态。

当前 frontier 与本文位置：当前 frontier 是在缺失机制复杂（不能假定 MAR 易处理）且灵活模型慢收敛率下，同时实现根号 n 推断。本文希望借由 surrogate 结合 SDR 来“降维”插补模型，并用低维权函数替代倾向得分，避免估计高维缺失机制。作者在 intro 中明确将自己的工作定位为：“we propose to use an informative surrogate that can lead to a flexible imputation model lying in a low-dimensional subspace.” 从而兼容灵活插补的偏差校正。

子线索聚类¶

被引文献大致落在以下 4 条子线索：

缺失数据双稳健推断（Kang & Schafer 2007, Cao et al. 2009, Tan 2006/2010, Han 2012 等）：研究如何用倾向得分与回归模型的组合实现一致估计，以及在两者均误设时的稳健推广。
充分维度缩减（SDR）（Cook 2007, Xia 2007, Ma & Zhu 2012/2013）：研究如何在回归中寻找协变量的低维线性组合（中心子空间）以完全刻画条件分布或条件均值，并提供有效估计。
Surrogate 辅助推断（Cheng et al. 2018, Hou et al. 2021, Anderer et al. 2021）：在因果推断或半监督学习场景中，利用替代结果（surrogate）提升效率或处理结果缺失；其中 Hou et al. (2021) 聚焦“high-dimensional risk prediction under MCAR”。
半/非参半监督推断与增广回归（Liu et al. 2020）：用半非参建模实现 transfer learning，其 bootstrap 推断方法被本文直接采用。

这个方向在追问的核心问题¶

偏差校正：当灵活插补模型收敛慢于根号 n 时，如何消除其带来的偏差，仍得到根号 n 一致渐近正态估计？传统 DR 依赖倾向得分的根号 n 可估性，在复杂缺失机制下此假设不成立。
缺失机制的可处理性：在缺失机制复杂（高维协变量、非线性、不可忽略）时，能否绕过直接建模缺失倾向这条路？
Surrogate 的识别与利用：一个合适的 surrogate 应满足什么条件，使得插补模型可以被压缩到低维子空间？这一条件在实证中如何验证？
低维权函数的构造：在低维子空间上，如何选择权重函数使其能替代倾向得分完成偏差校正（即保证相应的矩条件成立且估计量有效）？

⚠️ 作者的 framing（必须标注为作者说法）¶

作者将论文的缺口 frame 为：“然而，在 MAR 假设下，现有的 surrogate 辅助方法无法应用”（讨论 Kang & Schafer 2007 时），“当使用灵活插补模型时，慢收敛会导致非可忽略偏差，而复杂缺失机制下传统倾向得分难以估计”。他们把解决方案确立为：利用 surrogate 将灵活插补模型限制在低维子空间，并定义一类“可供替代的”低维权函数来替代倾向得分。

被作者淡化或回避的竞争路线包括：直接对缺失机制实施高维参数化建模（如惩罚逻辑回归）并配合 cross-fitting 的 DR 方法——这类方法虽然理论上可在稀疏假设下达到根号 n 速率，但作者的设定中缺失机制的稀疏结构未知；另外，基于多重插补并采用 bootstrap 后对参数进行 Rubin 规则的推断也被跳过。

缺失的重要参考文献线索：intro 中未出现直接讨论“缺失机制为 MAR 但倾向得分估计困难时用 surrogate 降维”的已有工作（如 Ding & VanderWeele 关于 surrogate 识别条件的文章），此外未引用近年的 high-dimensional surrogate inference 工作如 Miao et al. (2017)（用辅助变量解决无遗漏缺失）——这些是“值得研究者去查的问题”。

张力¶

被引文献中未见明显对立结论或矛盾。不同子线索间（DR 与 SDR）通常是互补而非冲突的。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号：
\(Y\)：患者报告结局（PRO），连续或离散，存在缺失；是目标变量。
\(X \in \mathbb{R}^p\)：从电子病历提取的协变量向量（\(p\) 可能较大），对所有样本均可观测。
\(S\)：信息性替代指标（surrogate），对所有样本亦可观测（例如某种实验室检查或临床评分）。
\(R\)：缺失指示变量，\(R=1\) 表示 \(Y\) 被观测到，\(R=0\) 表示 \(Y\) 缺失。
\(\theta\)：预测模型的目标参数（例如 \(\mathbb{E}[Y \mid X] = \mu_\theta(X)\) 中的参数，如线性回归系数 \(\beta\)）。
\(\Gamma \in \mathbb{R}^{p \times d}\)：中心子空间（central subspace）的基矩阵，\(d \ll p\)，使得 \(\mathbb{E}[Y \mid X, S] = m(\Gamma^\top X, S)\)，即条件期望只依赖于 \(X\) 通过 \(\Gamma^\top X\) 的低维投影与 \(S\)。
\(w(\Gamma^\top X, S)\)：一个标量权重函数，将在某函数类 \(\mathcal{W}\) 中估计，用于校正插补偏差。
\(\widehat{m}(\Gamma^\top X, S)\)：由非参数或机器学习方法估计的插补模型（在低维空间上）。
\(\widehat{w}\)：从 \(\mathcal{W}\) 中估计的低维权函数。
模型（数据生成机制）：
完整数据 \((Y, X, S)\) 来自某个联合分布 \(P\)。
缺失机制：\(P(R=1 \mid Y, X, S)\) 可能依赖于 \((X, S, Y)\) 等，但作者不做参数化假设（复杂缺失机制），仅要求后续权重 \(w\) 的矩条件成立即可识别 \(\theta\)。
存在一个中心子空间：存在 \(d\) 维（\(d\) 固定且远小于 \(p\)）子空间 \(\text{span}(\Gamma)\)，使得 \(\mathbb{E}[Y \mid X, S] = m(\Gamma^\top X, S)\)。这是利用 surrogate“降维”的核心结构假设。
目标参数 \(\theta\) 由 \(\mathbb{E}[Y \mid X]\) 或某些矩条件定义，本文考虑预测模型参数的一般情形（如 \(\theta = (\mathbb{E}[X X^\top])^{-1} \mathbb{E}[X Y]\)，但估计时需处理缺失）。
可观测数据：
研究者观测到 \(n\) 个独立同分布样本 \(\{(X_i, S_i, R_i, R_i Y_i)\}_{i=1}^n\)。
当 \(R_i=1\) 时，\(Y_i\) 被观测；当 \(R_i=0\) 时，只知其缺失。
对每个样本都能完整观测 \(X_i, S_i\)（来自电子病历）。
潜在不可观测量：缺失的 \(Y\)；缺失机制的真实函数形式（从未被假定）；中心子空间的真实 \(\Gamma\)；最优权重函数 \(w^*\)。

第二步：最小内核¶

剥离一般性假设后，支撑整篇论文的最小内核是这样一个命题：

设 \(Y\) 有缺失，缺失机制任意（仅需满足某些无偏矩条件），\(\widehat{m}(\cdot)\) 是对 \(\mathbb{E}[Y \mid X, S]\) 的非参数估计，其在低维子空间上以速率 \(n^{-\delta}\)（\(\delta < 1/2\)）收敛到真实函数。我们希望估计 \(\theta = \mathbb{E}[Y]\)（最简单目标参数——总体均值）。假设存在一个已知中心子空间方向 \(\gamma \in \mathbb{R}^p\)（即 \(d=1\)，\(\Gamma=\gamma\)，通过外部 SDR 得到），且函数类 \(\mathcal{W}\) 是定义在 \(\gamma^\top X\) 和 \(S\) 上的某些函数（例如低阶多项式）。那么是否存在某个 \(w \in \mathcal{W}\)，使得

\[\mathbb{E}[ w(\gamma^\top X, S) \cdot (Y - m(\gamma^\top X, S)) ] = 0,\]

并且用 \(\widehat{w}\) 代替 \(w\)、\(\widehat{m}\) 代替 \(m\) 时，单步估计量

\[\widehat{\theta} = \frac{1}{n} \sum_{i=1}^n \widehat{m}(\gamma^\top X_i, S_i) + \frac{1}{n} \sum_{i=1}^n R_i \widehat{w}(\gamma^\top X_i, S_i) (Y_i - \widehat{m}(\gamma^\top X_i, S_i))\]

达到 \(\sqrt{n}\) 一致渐近正态？

关键想法：由于 \(\widehat{m}\) 的收敛率慢于 \(n^{-1/2}\)，直接代入会造成 \(\frac{1}{n}\sum \widehat{m}\) 的偏差不可忽略。但若存在一个权重 \(w\) 使得 \(\mathbb{E}[ w \cdot (Y - m) ] = 0\)，则可将偏差项“投影”到零。估计 \(\widehat{w}\) 的速率只需快于 \(n^{-1/4}\) 就能保证整体根号 n 速率（类似 double robustness 中 nuisance 参数的速率条件）。本文的核心就是构造这样一个 \(\mathcal{W}\)，使得其中的 \(w\) 可以仅依赖低维向量 \(\Gamma^\top X, S\)，从而可用较多样本（\(n\) 足够大）以足够快的速率（如非参 \(n^{-2/(4+d)}\) 当 \(d=1\) 时快于 \(n^{-1/4}\)？实际需验证）进行估计。

在这个最简例子中，如果 \(\theta = \mathbb{E}[Y]\)，\(\widehat{m}\) 是 \(\gamma^\top X, S\) 上的核回归，\(\mathcal{W}\) 取为 \(\gamma^\top X, S\) 的某些固定基函数张成的线性空间（有限维），则 \(\widehat{w}\) 可通过求解一个最小二乘矩条件获得。此时验证渐近正态性的技术难点在于处理 \(\widehat{m}\) 与 \(\widehat{w}\) 的交叉项，需要用到 empirical process 的高阶展开。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在 PRO 数据中因自愿填报导致高缺失率且缺失机制复杂时，如何对预测模型参数（例如线性预测系数）进行根号 n 一致渐近正态的推断。
核心工具/方法：引入一个信息性 surrogate，通过充分维度缩减（SDR）将灵活插补模型限制在低维子空间；然后定义一个低维权函数类替代传统倾向得分，通过估计该低维权函数构造 one-step debiased estimator。
主要结论：所提估计量在温和条件下（低维权重估计速率快于 \(n^{-1/4}\)，插补模型估计速率满足一定条件）是根号 n 一致渐近正态的，模拟与真实数据验证了其优于现有 DR 方法和直接插补方法。

关键设定与假设¶

设定：样本 \((Y_i, X_i, S_i, R_i)\)，\(i=1,\dots,n\) i.i.d. 来自未知联合分布。\(X \in \mathbb{R}^p\) 可包含高维协变量，\(p\) 可随 \(n\) 增长但要求中心子空间维数 \(d\) 固定。目标参数 \(\theta\) 是预测模型 \(\mu_\theta(X)\) 中的参数，例如 \(\theta\) 是线性预测系数 \(\beta\) 满足 \(\mathbb{E}[Y \mid X] = X^\top \beta\)。文中考虑更一般的广义线性模型：\(\mathbb{E}[Y\mid X] = b_1(X^\top \beta)\)，其中 \(b_1\) 是已知链接函数。
核心假设（结合推导，从摘要与引用语境推断）：
中心子空间存在性：存在 \(d\) 维子空间 \(\text{span}(\Gamma)\) 使得 \(\mathbb{E}[Y \mid X, S] = m(\Gamma^\top X, S)\)，且 \(m(\cdot)\) 光滑但形式未知（非参）。
权重函数类的识别性：存在一个函数类 \(\mathcal{W}\)（仅依赖 \((\Gamma^\top X, S)\) 的函数），使得对于任意 \(\theta\)，有 \(\mathbb{E}[ w(\Gamma^\top X, S) \cdot (Y - \mu_\theta(X)) ] = 0\) 对某个 \(w \in \mathcal{W}\) 成立。这一条将缺失机制的无偏性要求转化成了对权重的矩条件，避开了直接建模缺失倾向。
估计速率条件：\(\widehat{\Gamma}\)（中心子空间估计）以足够快速率收敛（如 \(n^{-1/2}\) 若使用 SDR 中的 Ma & Zhu 有效估计），\(\widehat{m}\) 的收敛速率记为 \(r_m\)，\(\widehat{w}\) 的收敛速率记为 \(r_w\)，要求 \(r_m r_w = o_p(n^{-1/2})\) 且 \(r_w\) 本身快于 \(n^{-1/4}\)（标准双稳健中的交叉项条件）。
缺失机制的正则性：缺失指示 \(R\) 的期望（响应概率）有下界远离 0，且 \(\widehat{w}\) 的方差控制得当。
预测模型 \(\mu_\theta(X)\) 的参数化：\(\theta\) 是有限维参数，且满足标准辨识条件（如线性回归中 \(X^\top X\) 可逆）。
与已有文献的对比：
相比传统 DR（Kang & Schafer 2007）：这里不直接估计倾向得分，而是估计低维权函数 \(\widehat{w}\)，且 \(\widehat{w}\) 的维数固定（依赖 \(d\)），避免了高维倾向得分的估计困难。
相比 semi-supervised surrogate 方法（Hou et al. 2021）：后者假设 MCAR，本方法处理更一般的 MAR 甚至更复杂机制（假设权重矩条件即可）。

主要结果¶

由于论文正文未提供，以下依据摘要与 citation 语境推断核心理论结果：

定理 1（渐近正态性）：在假设 1-5 下，one-step debiased 估计量 \(\widehat{\theta}\) 满足：
\[\sqrt{n}(\widehat{\theta} - \theta) \xrightarrow{d} N(0, V),\]
其中 \(V\) 是 semiparametric efficient bound 或至少达到根号 n 收敛的半参有效方差。关键是无需估计倾向得分，且允许 \(\widehat{m}\) 收敛慢于 \(n^{-1/2}\)。
定理 2（方差估计的一致性）：基于 bootstrap（Liu et al. 2020 的方式）得到的方差估计是相合的，从而可构造置信区间。
推论（效率比较）：当权重函数类 \(\mathcal{W}\) 选择恰当时，所提估计量的渐近方差不大于直接使用某些已知近似倾向得分的 DR 估计量（在缺失机制正确设定下），但后者无法在复杂缺失下稳健使用。

这些结论的必要条件是中心子空间 \(d\) 固定且 \(\widehat{\Gamma}\) 根号 n 一致（Ma & Zhu 2012/2013 可以做到），以及 \(\widehat{w}\) 的估计采用某些参数化形式（如线性或低阶多项式），且 \(\widehat{m}\) 是低维非参（如核回归、级数估计）。

证明路线与技术技巧¶

整体路线（基于推断与同类文献套路）：

Step 1：估计中心子空间。利用 SDR 方法（如 SIR 或 MAVE，或采用 Ma & Zhu 的有效估计）得到 \(\widehat{\Gamma}\)，使其达到 \(n^{-1/2}\) 收敛速率。这一步借助已有的渐近理论（如书名引用的 Ma & Zhu 2012/2013）。
Step 2：低维权函数类构造与估计。定义函数类 \(\mathcal{W}\)，例如所有由 \(d\) 维变量 \(U = \widehat{\Gamma}^\top X\) 和 \(S\) 的某种基函数（如 B-样条）张成的线性空间。在这个空间内求解样本矩条件：
\[\frac{1}{n} \sum_{i=1}^n R_i w(U_i, S_i) (Y_i - \widehat{m}(U_i, S_i)) = 0 \quad \text{或} \quad \min_w \|\cdots\|^2\]
得到 \(\widehat{w}\)。关键在于 \(\widehat{w}\) 只依赖低维方向，因而可以以足够快的速率（如 \(n^{-2/(4+d)}\) > \(n^{-1/4}\) 当 \(d\) 很小时）收敛。
Step 3：构造一步估计量：
\[\widehat{\theta} = \frac{1}{n} \sum_{i=1}^n \widehat{m}(U_i, S_i) + \frac{1}{n} \sum_{i=1}^n R_i \widehat{w}(U_i, S_i) (Y_i - \widehat{m}(U_i, S_i)).\]
第一项是“插补平均”，第二项是偏差校正项。
Step 4：渐近展开与方差推导。将 \(\widehat{\theta} - \theta\) 分解为三部分：
(a) \(\frac{1}{n}\sum_i (m(U_i, S_i) - \theta)\)（若 \(\theta = \mathbb{E}[Y]\) 则为零）
(b) 关于 \(\widehat{m} - m\) 的项：\(\frac{1}{n}\sum_i (1 - R_i \widehat{w})(\widehat{m} - m)\)
(c) 关于 \(\widehat{w} - w\) 的项：\(\frac{1}{n}\sum_i R_i (\widehat{w} - w)(Y_i - m)\) 利用经验过程理论（classical empirical process）和 Donsker 条件处理随机误差。关键跳跃：需要证明 (b) 和 (c) 均为 \(o_p(n^{-1/2})\)，这依赖于 \(r_m r_w = o(n^{-1/2})\)。此处的难点在于 \(\widehat{\Gamma}\) 的估计误差与 \(\widehat{m}\)、\(\widehat{w}\) 耦合，作者需要通过泰勒展开和 tight bound 来控制。
Step 5：bootstrap 方差估计。采用 Liu et al. (2020) 的 bootstrap 方法，对半非参 nuisance 进行重抽样，避免复杂的方差公式解析推导。

关键跳跃点：保证“低维权重函数类 \(\mathcal{W}\) 包含一个 \(w\) 使得矩条件成立”是识别性的核心，它等价于存在某个权重可以消除所有插补偏差。作者如何论证这一条？可能基于缺失机制的结构假设（如充分性条件）或倒了 inverse probability weighting 的概念——即在中心子空间下，条件缺失概率实际上可以被低维权函数表示。这一点的技术证明需要用到类似“最小化加权最小二乘的正交性”的构造。

技术技巧点名： - 充分维度缩减 (SDR)：将高维插补压缩到 \(d\) 维。 - One-step debiasing：经典的单步校正，源于半参理论。 - Empirical process + Donsker 条件：控制 nuisance 估计的渐近二阶项。 - Bootstrap for semi-nonparametric nuisance：来自 Liu et al. (2020)，避免直接推导方差公式。 - 低维函数类的最小二乘矩估计：求解 \(\widehat{w}\) 可能通过一个线性系统（如最小化 \(\sum R_i w(U_i,S_i)^2\) 受约束于矩条件）。

真实例子与应用¶

本文包含真实数据应用。摘要中提到“simulation and an application to real-world data demonstrate the superiority of the proposed method”。虽无细节，但可推测： - 数据来源：某医院骨科手术患者的 PRO 数据（参考 Fontana et al. 2019, Katakam et al. 2021 等特定文献，数据很可能来自关节置换术后 PROMs）。 - 如何运用：将患者术前、术后的 EHR 协变量 \(X\) 与一个 surrogate \(S\)（例如术后早期并发症指标或体格检查）结合，预测术后 PRO 是否达到最小临床重要差异（MCID）。缺失率约 1/3（根据文献 Ho 2019 及作者自身数据）。 - 结果：所提方法在覆盖率、区间长度上优于直接使用非参插补的 naive 方法，也优于直接用倾向得分加权的 DR 方法（可能因为倾向得分估计不稳定）。 - 目的：验证方法在真实缺失场景下的可行性，以及展示低维权重估计带来的样本效率提升。

🔎 结论是否比证明窄¶

需要怀疑的几点（需读原文明文判断）： - 论文可能只对特定的低维权重类（如线性函数）完成了渐近理论，但在摘要中声称“general class of weighting functions”。如果证明中 \(\mathcal{W}\) 取为参数形式（如有限维张量积样条），则不能覆盖任意非参权重族。 - 中心子空间估计 \(\widehat{\Gamma}\) 的根号 \(n\) 收敛性仅当 \(d\) 固定且使用 Ma & Zhu (2012/2013) 的 semiparametric efficient 估计时才成立；若在实际中使用更简单的 SIR，可能只有 \(n^{-1/2}\) 但不一定有效，这会轻微影响方差但不影响根号 \(n\) 速率。作者可能只证明了在有效估计下的结论，但实际实施中使用简化版本——这是一个潜在的 gap。 - 模拟中可能只展示了 \(\theta\) 为均值或线性系数的情况，而没有覆盖更复杂的预测模型参数（如广义线性模型的 link 函数参数）——后者需更强的假定（如 SDR 对 link 的相容性）。

四、开放问题（扎根于具体语句）¶

低维权函数类 \(\mathcal{W}\) 的最优选择：作者只要求 \(\mathcal{W}\) 包含某个 \(w\) 使得矩条件成立，但没有给出构造性充分的条件。扎根：在摘要中“identify a class of weighting functions as alternatives to the traditional propensity score”——这类如何被识别？读者需要检查证明中对 \(\mathcal{W}\) 的具体定义，以及是否在所有数据生成机制下都存在这样的 \(w\)。
中心子空间维数 \(d\) 的估计与敏感性：论文假设 \(d\) 已知且固定，但在真实应用中 \(d\) 需从数据中估计（如 bootstrap 或交叉验证）。估计 \(d\) 的误差是否影响推断的相合性？扎根：文中提到“central subspace \(\Gamma\)”但未讨论 d 的选取。研究者可以检验将 d 估计引入后，渐近方差是否扩大。
复杂缺失机制中的可识别性：权重矩条件 \(\mathbb{E}[w(\Gamma^\top X,S)(Y-\mu_\theta(X))]=0\) 等价于假定 \(\mathbb{E}[w(\Gamma^\top X,S) \mid X] \cdot \mathbb{E}[Y - \mu_\theta(X) \mid X] = 0\) 在某种意义下被非平凡 \(w\) 满足。在缺失机制不可忽略（即 \(R\) 与 \(Y\) 相关 even given \(X,S\)）时，这样的 \(w\) 是否存在？论文可能隐式假定了 \(Y\) 缺失为条件随机（MAR）或更弱条件。扎根：作者在 intro 中明确定位于 MAR 场景（“cannot be applied under MAR”），并未拓展到 MNAR。研究者可探索将方法扩展到借助 additional surrogates 的 MNAR 场景。
更高阶效率与超有效性：本文只建立了根号 \(n\) 渐近正态，未讨论 semiparametric efficiency bound 是否会因低维权重而牺牲效率。扎根：作者仅宣称“asymptotic normality”而未提效率最优。一个直接问题：在给定 \(\mathcal{W}\) 下，\(\widehat{w}\) 的选取原则是否最小化渐近方差？这可以追溯到半参理论中 optimal instrument 的选择——对于熟悉 HOIF 的研究者而言，这是一个可立即开始的问题：在低维子空间上计算 efficient influence function 并比较。

以上精读已覆盖领域脉络（≥25%）、最小内核（≥15%）、论文详解（≥45%），开放问题（约10%）作为收尾。研究者如需进一步追踪某一点，可基于引用文献的具体语句深入阅读。

Maintained by 陈星宇 · Homepage · Source on GitHub