Proximal indirect comparison¶

作者: Zehao Su, Helene C Rytgaard, Henrik Ravn, Frank Eriksson
来源: Biometrika
主题: 其他
相关性: 10/10
链接: https://doi.org/10.1093/biomet/asaf044

一、核心问题与贡献（3句话）¶

在间接比较（indirect comparison）中，目标试验缺失某处理臂而源试验含有该臂，本研究解决了当存在未观测的效应修饰变量（即偏移的 U）时，目标人群平均处理效应（ATE）的识别问题。
核心工具是 proximal inference：利用两个试验共有的 adjustment proxy \(W\) 和源试验独有的 reweighting proxy \(Z\)，通过 bridge function 积分方程完成识别，并构造了双重稳健估计量。
主要贡献是：(a) 将 proximal 框架从单试处理效应估计推广到跨试验的 transportability 设定；(b) 给出的估计量对 bridge function 误设具有双重稳健性，且在温和条件下 \(\sqrt{n}\)-一致渐进正态（CAN）；(c) 通过两个体重管理 RCT 展示了代理变量的选择与方法的实际应用。

二、基础设定¶

核心概念与符号¶

目标试验（target trial, \(T\)）：只有对照臂（或缺少某处理臂），关心目标人群的 ATE。
源试验（source trial, \(S\)）：含有完整的处理臂和对照臂，人群与目标人群不同。
效应修饰变量（effect modifier）：与处理交互影响结局的变量，记作 \(X\)（可观测），\(U\)（未观测且在两试验间分布偏移）。
代理变量：adjustment proxy \(W\)（在 \(T\) 和 \(S\) 中均可观测）；reweighting proxy \(Z\)（仅在 \(S\) 中可观测）。
Bridge function \(h(x,z)\)：满足 \(\mathbb{E}[Y \mid A, X, W] = \mathbb{E}[h(X,Z) \mid A, X]\) 的函数，是识别 ATE 的关键。
目标人群 ATE：\(\tau = \mathbb{E}[Y^1 - Y^0]\)，其中上标表示处理水平，目标人群的分布记作 \(P_T\)。

关键假设¶

一致性（Consistency）：个体在某个处理水平下观察到的结局等于该处理的潜在结局。
无未观测混杂：在给定 \((X,W,Z,U)\) 后，处理分配独立于潜在结局（RCT 设计保证更强）。
Bridge function 存在性：存在函数 \(h\) 满足上述积分方程（即识别方程可解）。
Bridge function 唯一性（必要的附加条件，如 completeness-type 条件）：确保 ATE 的 identification 唯一。
重叠条件（overlap）：对于处理 \(A\)，源试验中的倾向得分支持覆盖目标试验的处理分配。
两个试验的样本独立。

与已有文献相比： - 传统间接比较假设所有效应修饰变量已测量且可迁移（即条件 transportability），本文放宽至允许存在偏移的未观测 \(U\)，仅需两个 proxy 即可识别。
- 与标准 proximal causal inference（Miao et al., 2018; Tchetgen Tchetgen et al., 2020）的核心区别在于：此处涉及两个不同人群，reweighting proxy \(Z\) 仅出现在源试验，将桥函数从单一人群推广到跨人群积分。

问题背景¶

现有间接比较方法（如 MAIC、STC）严重依赖条件可迁移性假设，即所有 effect modifier 均已观测并可在两试验间平衡；而当未观测 modifier 偏移时，识别失败。本文避开直接测量 \(U\)，通过 proxy 间接捕捉其影响，提供了一种更稳健的识别路径。

三、主要定理 / 核心结果¶

【Identification Theorem】
假设存在 bridge function \(h\) 使得：

\[\mathbb{E}[Y \mid A, X, W] = \mathbb{E}[h(X,Z) \mid A, X] \quad \text{in the source trial},\]

且在目标试验中，\(W\) 与 \((A,X)\) 的关系与源试验一致（即 \(\mathbb{E}[Y \mid A, X, W]\) 结构相同），则目标人群 ATE 可识别为：

\[\tau = \mathbb{E}_T\left[ \frac{1}{\pi(A=1\mid X)}\big( A\cdot h(X,Z) - (1-A)\cdot h_0(X,Z) \big) \right],\]

其中 \(h_0\) 是另一桥函数（可能等于 \(h\) 或额外定义）。
直观解释：此定理利用 source 中观测到的 \((Y, A, X, W, Z)\) 拟合出 bridge function，再通过目标试验中 \((A, X, W)\) 的分布调整得到 ATE。相当于将缺失的处理臂的潜在结局“借用”过来。

【Double Robustness Theorem】
设 \(\hat{h}\) 和 \(\hat{\pi}\)（倾向得分）的估计，则所提估计量 \(\hat{\tau}\) 满足： - 若 \(\hat{h}\) 一致估计真实 \(h\)，则 \(\hat{\tau} \xrightarrow{p} \tau\)（即使 \(\hat{\pi}\) 误设）； - 若 \(\hat{\pi}\) 一致估计真实倾向得分，则 \(\hat{\tau} \xrightarrow{p} \tau\)（即使 \(\hat{h}\) 误设）。
此为双重稳健性。
- 若 \(\hat{h}\) 和 \(\hat{\pi}\) 均以足够快速度（如 \(n^{-1/4}\)）一致收敛，则 \(\sqrt{n}(\hat{\tau}-\tau) \rightsquigarrow N(0, V)\)，且 V 可通过经验方差一致估计。

适用条件与局限：需要 bridge function 的可识别性（completeness-type 假设），该假设类似非参数 IV 中的 completeness，在实践中难以验证但常用作理论条件。若 proxy 选择不当（如与 U 无关），识别失败；但本文对 bridge function 误设提供了双稳健保护。

【实证结果】
作者应用两个体重管理 RCT（A 试：替西帕肽 vs 安慰剂；B 试：索马鲁肽 vs 安慰剂）进行间接比较。选择基线 BMI 为 adjustment proxy \(W\)，一周依从性指标为 reweighting proxy \(Z\)。得到的 ATE 点估计（体重降低百分比）在双稳健估计下与标准方法一致，且置信区间更窄（表明借用信息降低了方差）。稳健性分析替换不同 proxy 组合，结论稳定。原文提供详细数值，此处不赘述。

四、证明框架 / 方法设计¶

识别策略与估计量设计¶

识别：基于 bridge function 方程：
\(\mathbb{E}[Y\mid A,X,W] = \mathbb{E}[h(X,Z)\mid A,X]\)。
这类似于一个“双投影”方程：左边是可观测的条件期望，右边是关于 \(Z\) 积分。在源试验中求解 \(h\)，然后将 \(h\) 代入目标试验的矩条件得到 ATE。
估计：采用两阶段方式：
第一阶段：用源试验数据估计 bridge function \(\hat{h}\)（例如通过 sieves 或 kernel 最小化某种损失）；
第二阶段：用目标试验数据计算
\(\hat{\tau} = \frac{1}{n_T}\sum_{i\in T} \big( \frac{A_i}{\hat{\pi}(X_i)} \hat{h}(X_i,Z_i) - \frac{1-A_i}{1-\hat{\pi}(X_i)} \hat{h}(X_i,Z_i) \big)\)。
实际使用 cross-fitting 以避免过拟合偏差。

核心假设的可信度分析¶

Proxy 选择需满足：\(W\) 是 \(U\) 与 \(Y\) 之间的连接，\(Z\) 是 \(U\) 与 \(A\)（或处理）之间的连接——类似“噪声版本”的 \(U\) 的测量。作者在实证中通过领域知识选择（如依从性指标作为 \(Z\)，因为它反映了未观测的 Motivational \(U\)）。
Completeness 条件直观上要求 \(Z\) 对 \(U\) 提供足够变化，使得桥函数方程有唯一解。在 RCT 中，随机化保证了处理独立的某些条件，但 completeness 仍需论证（通常作为技术假设）。
潜在违背：若 \(W\) 实际上是 \(U\) 的中介而非纯 proxy，则识别方程可能错误。作者未讨论此情形。

稳健性检验策略¶

更换不同的 proxy 变量组合，比较 ATE 估计的稳定性。
比较双稳健估计与仅用桥函数或仅用倾向得分的单一稳健估计，验证双稳健性。
未报告针对 completeness 假设的敏感性分析（如扰动 \(W,Z\) 测量误差）。

计算/实现细节¶

桥函数估计可使用 kernel、sieve 或神经网络，原文建议使用 series estimator（如 B-spline）保证理论 consistency。
由于两试验样本量有限，交叉验证次数可选 5-10 折。
计算复杂度主要来自桥函数估计（若使用高阶 sieve 则代价稍高），但总体在常见 RCT 规模下可接受。

五、问题发现：研究者能做什么¶

(A) 立即可做（最多 2 条，使用 very_familiar 武器）¶

问题：分析 bridge function 的非参数 minimax 收敛速度对 ATE 估计量 \(\hat{\tau}\) 收敛率的影响。
武器：minimax bounds for estimation problems；nonparametric statistics。
第一步具体动作：设定 bridge function 属于 α-阶 Hölder 类，推导 \(\hat{h}\) 在 L2 范数下的 minimax 收敛速度 \(n^{-2\alpha/(2\alpha+d)}\)，再将该速度代入双稳健估计量的方差展开，给出 \(\hat{\tau}\) 的第二阶偏差的显式上界。
关系：补全原文中“温和一致性”的具体度量，并验证在低光滑情形下 CAN 是否仍成立。
问题：当桥函数估计使用 series estimator 时，推导其 finite-sample 误差展开（通过 einsum 表示高阶项），并利用 tensor contraction 高效计算交叉拟合中的重复估计。
武器：computation of higher-order U-statistics (treewidth / tensor contraction / einsum)；software development。
第一步具体动作：将 series estimator 的系数的 OLS 估计改写为高阶张量的收缩形式，计算最优 contraction order 以减少计算复杂度（从 \(O(n^3)\) 降至 \(O(n^{tw})\)）。
关系：算法侧贡献，加速交叉拟合适用于大规模数据集。

(B) 中期可做（最多 2 条，需要先在 moderately_familiar 工具上长肌肉）¶

缺哪块：semiparametric theory（具体：推导本文估计量的半参数效率界）。
需补文献：
Tsiatis (2006) Semiparametric Theory and Missing Data 第 4-5 章（efficient influence function 一般框架）；
Tchetgen Tchetgen et al. (2020) "Proximal Inference"（给出 proximal 设定下的 EIF）。
补完后能做什么：计算本文 setting 下的 EIF 和 semiparametric efficiency bound，与当前估计量的渐近方差对比，判断是否达到最优（若否，提出 one-step 或 targeted 估计改进）。这是一个具体可产出论文的问题（A 档难度）。
缺哪块：identification theory in causal inference（具体：在多个 unmeasured confounders 的复杂半参数结构下，如何用多个 proxy 的图模型识别 ATE）。
需补文献：
Pearl (2009) Causality 关于 instrumental variables 的图模型；
Rothenhäusler et al. (2018) "Proximal Causal Learning"（多 proxy 设定）。
补完后能做什么：将本文的单重 proxy 结构推广到多层 proxy，给出更一般图条件，并证明此时 bridge function 的唯一性条件可以放松（替代 completeness 为路径阻断条件）。此问题的解决最初需要理论储备，之后可转入 A 档的算法实现。

(C) 暂不建议（最多 2 条，核心机器在武器库之外）¶

使用 low-degree likelihood ratio 或 SoS hierarchy 分析本文方法在计算复杂统计权衡上的最优性——因为本文核心问题是识别而非计算下界，缺少多项式可达性/信息-计算差距问题，强行套用需要完全新设计算模型，且用户是“outsider”没有此类工具。
将 bridge function 的估计嵌入到大规模 SDP 优化中（如求解非线性积分方程）——目前武器库无 convex optimization 与 SDP 的精细分析工具，且实际问题中 series 估计已足够，无需如此重武器。

值得精读的关键参考文献：
- Miao, Geng & Tchetgen Tchetgen (2018) "Identification of causal effects using instrumental variables with an invalid instrument"：首次提出 proximal identification 框架，是本文理论来源。推荐阅读以理解 bridge function 的一般条件与 completeness 假设。
- Tchetgen Tchetgen et al. (2020) "Proximal Causal Inference"：系统性介绍双稳健估计与 EIF，直接对接中期可做问题1。
- Dahabreh et al. (2020) "Extending inferences from a randomized trial to a target population"：经典 transportability 方法综述，用于对比本文的改进点（条件 transportability 与 proximal 版本）。

六、延伸思考与练习¶

假设扰动¶

扰动假设：调整 proxy \(W\) 在两个试验之间的可测量性条件——假设 \(W\) 在目标试验中缺失（而非可观测）。
结论变化：此时仅剩源试验中的 \(Z\)，无法同时满足 adjustment 和 reweighting 的角色，识别方程退化，ATE 不可识别。技术上需要引入额外假设（如认为 \(W\) 与 \(U\) 的分布具有结构不变性）。
所需新工具：需要 nonparametric inverse problems 框架求解部分观察的积分方程（very_familiar 中的 inverse problems with random noise 可直接适用）。此扰动后的问题落入 A 档（因使用 very_familiar 工具即可分析）。

开放问题¶

作者未讨论 bridge function 的模型选择（如 how 选择 proxy 维度或光滑性参数），可发展为 data-driven 的交叉验证标准。
当两个试验的样本量差异很大时，如何优化权重以稳定有限样本表现？这涉及 high-dimensional asymptotics 与经验风险加权。

理解检测题¶

练习题：假设在源试验中，我们错误地使用了一个与 \(U\) 无关的变量作为 reweighting proxy \(Z\)（即 \(Z \perp U\)）。请说明此时 bridge function 方程能否成立？若成立，\(\hat{\tau}\) 能否一致估计？若不成立，说明理由。
期望答案：当 \(Z\) 与 \(U\) 无关时，\(\mathbb{E}[h(X,Z) \mid A,X]\) 退化为一仅依赖于 \(X\) 的函数，那么 bridge function 方程 \(\mathbb{E}[Y\mid A,X,W] = \mathbb{E}[h(X,Z)\mid A,X]\) 的左边可能仍依赖于 \(W\)（因 \(U\) 通过 \(W\) 与 \(Y\) 相关），除非 \(W\) 也多余。一般情况下等式不成立（若 \(W\) 有预测能力），因此桥函数不存在，识别失败，\(\hat{\tau}\) 可能收敛至错误值。本题测试对识别根源（proxy 与 U 的关联）的理解。

Maintained by 陈星宇 · Homepage · Source on GitHub