Proximal indirect comparison¶
作者: Zehao Su, Helene C Rytgaard, Henrik Ravn, Frank Eriksson
来源: Biometrika
主题: 其他
相关性: 10/10
链接: https://doi.org/10.1093/biomet/asaf044
一、核心问题与贡献(3句话)¶
- 在间接比较(indirect comparison)中,目标试验缺失某处理臂而源试验含有该臂,本研究解决了当存在未观测的效应修饰变量(即偏移的 U)时,目标人群平均处理效应(ATE)的识别问题。
- 核心工具是 proximal inference:利用两个试验共有的 adjustment proxy \(W\) 和源试验独有的 reweighting proxy \(Z\),通过 bridge function 积分方程完成识别,并构造了双重稳健估计量。
- 主要贡献是:(a) 将 proximal 框架从单试处理效应估计推广到跨试验的 transportability 设定;(b) 给出的估计量对 bridge function 误设具有双重稳健性,且在温和条件下 \(\sqrt{n}\)-一致渐进正态(CAN);(c) 通过两个体重管理 RCT 展示了代理变量的选择与方法的实际应用。
二、基础设定¶
核心概念与符号¶
- 目标试验(target trial, \(T\)):只有对照臂(或缺少某处理臂),关心目标人群的 ATE。
- 源试验(source trial, \(S\)):含有完整的处理臂和对照臂,人群与目标人群不同。
- 效应修饰变量(effect modifier):与处理交互影响结局的变量,记作 \(X\)(可观测),\(U\)(未观测且在两试验间分布偏移)。
- 代理变量:adjustment proxy \(W\)(在 \(T\) 和 \(S\) 中均可观测);reweighting proxy \(Z\)(仅在 \(S\) 中可观测)。
- Bridge function \(h(x,z)\):满足 \(\mathbb{E}[Y \mid A, X, W] = \mathbb{E}[h(X,Z) \mid A, X]\) 的函数,是识别 ATE 的关键。
- 目标人群 ATE:\(\tau = \mathbb{E}[Y^1 - Y^0]\),其中上标表示处理水平,目标人群的分布记作 \(P_T\)。
关键假设¶
- 一致性(Consistency):个体在某个处理水平下观察到的结局等于该处理的潜在结局。
- 无未观测混杂:在给定 \((X,W,Z,U)\) 后,处理分配独立于潜在结局(RCT 设计保证更强)。
- Bridge function 存在性:存在函数 \(h\) 满足上述积分方程(即识别方程可解)。
- Bridge function 唯一性(必要的附加条件,如 completeness-type 条件):确保 ATE 的 identification 唯一。
- 重叠条件(overlap):对于处理 \(A\),源试验中的倾向得分支持覆盖目标试验的处理分配。
- 两个试验的样本独立。
与已有文献相比:
- 传统间接比较假设所有效应修饰变量已测量且可迁移(即条件 transportability),本文放宽至允许存在偏移的未观测 \(U\),仅需两个 proxy 即可识别。
- 与标准 proximal causal inference(Miao et al., 2018; Tchetgen Tchetgen et al., 2020)的核心区别在于:此处涉及两个不同人群,reweighting proxy \(Z\) 仅出现在源试验,将桥函数从单一人群推广到跨人群积分。
问题背景¶
现有间接比较方法(如 MAIC、STC)严重依赖条件可迁移性假设,即所有 effect modifier 均已观测并可在两试验间平衡;而当未观测 modifier 偏移时,识别失败。本文避开直接测量 \(U\),通过 proxy 间接捕捉其影响,提供了一种更稳健的识别路径。
三、主要定理 / 核心结果¶
【Identification Theorem】
假设存在 bridge function \(h\) 使得:
直观解释:此定理利用 source 中观测到的 \((Y, A, X, W, Z)\) 拟合出 bridge function,再通过目标试验中 \((A, X, W)\) 的分布调整得到 ATE。相当于将缺失的处理臂的潜在结局“借用”过来。
【Double Robustness Theorem】
设 \(\hat{h}\) 和 \(\hat{\pi}\)(倾向得分)的估计,则所提估计量 \(\hat{\tau}\) 满足:
- 若 \(\hat{h}\) 一致估计真实 \(h\),则 \(\hat{\tau} \xrightarrow{p} \tau\)(即使 \(\hat{\pi}\) 误设);
- 若 \(\hat{\pi}\) 一致估计真实倾向得分,则 \(\hat{\tau} \xrightarrow{p} \tau\)(即使 \(\hat{h}\) 误设)。
此为双重稳健性。
- 若 \(\hat{h}\) 和 \(\hat{\pi}\) 均以足够快速度(如 \(n^{-1/4}\))一致收敛,则 \(\sqrt{n}(\hat{\tau}-\tau) \rightsquigarrow N(0, V)\),且 V 可通过经验方差一致估计。
适用条件与局限:需要 bridge function 的可识别性(completeness-type 假设),该假设类似非参数 IV 中的 completeness,在实践中难以验证但常用作理论条件。若 proxy 选择不当(如与 U 无关),识别失败;但本文对 bridge function 误设提供了双稳健保护。
【实证结果】
作者应用两个体重管理 RCT(A 试:替西帕肽 vs 安慰剂;B 试:索马鲁肽 vs 安慰剂)进行间接比较。选择基线 BMI 为 adjustment proxy \(W\),一周依从性指标为 reweighting proxy \(Z\)。得到的 ATE 点估计(体重降低百分比)在双稳健估计下与标准方法一致,且置信区间更窄(表明借用信息降低了方差)。稳健性分析替换不同 proxy 组合,结论稳定。原文提供详细数值,此处不赘述。
四、证明框架 / 方法设计¶
识别策略与估计量设计¶
- 识别:基于 bridge function 方程:
\(\mathbb{E}[Y\mid A,X,W] = \mathbb{E}[h(X,Z)\mid A,X]\)。
这类似于一个“双投影”方程:左边是可观测的条件期望,右边是关于 \(Z\) 积分。在源试验中求解 \(h\),然后将 \(h\) 代入目标试验的矩条件得到 ATE。 - 估计:采用两阶段方式:
- 第一阶段:用源试验数据估计 bridge function \(\hat{h}\)(例如通过 sieves 或 kernel 最小化某种损失);
- 第二阶段:用目标试验数据计算
\(\hat{\tau} = \frac{1}{n_T}\sum_{i\in T} \big( \frac{A_i}{\hat{\pi}(X_i)} \hat{h}(X_i,Z_i) - \frac{1-A_i}{1-\hat{\pi}(X_i)} \hat{h}(X_i,Z_i) \big)\)。
实际使用 cross-fitting 以避免过拟合偏差。
核心假设的可信度分析¶
- Proxy 选择需满足:\(W\) 是 \(U\) 与 \(Y\) 之间的连接,\(Z\) 是 \(U\) 与 \(A\)(或处理)之间的连接——类似“噪声版本”的 \(U\) 的测量。作者在实证中通过领域知识选择(如依从性指标作为 \(Z\),因为它反映了未观测的 Motivational \(U\))。
- Completeness 条件直观上要求 \(Z\) 对 \(U\) 提供足够变化,使得桥函数方程有唯一解。在 RCT 中,随机化保证了处理独立的某些条件,但 completeness 仍需论证(通常作为技术假设)。
- 潜在违背:若 \(W\) 实际上是 \(U\) 的中介而非纯 proxy,则识别方程可能错误。作者未讨论此情形。
稳健性检验策略¶
- 更换不同的 proxy 变量组合,比较 ATE 估计的稳定性。
- 比较双稳健估计与仅用桥函数或仅用倾向得分的单一稳健估计,验证双稳健性。
- 未报告针对 completeness 假设的敏感性分析(如扰动 \(W,Z\) 测量误差)。
计算/实现细节¶
- 桥函数估计可使用 kernel、sieve 或神经网络,原文建议使用 series estimator(如 B-spline)保证理论 consistency。
- 由于两试验样本量有限,交叉验证次数可选 5-10 折。
- 计算复杂度主要来自桥函数估计(若使用高阶 sieve 则代价稍高),但总体在常见 RCT 规模下可接受。
五、问题发现:研究者能做什么¶
(A) 立即可做(最多 2 条,使用 very_familiar 武器)¶
-
问题:分析 bridge function 的非参数 minimax 收敛速度对 ATE 估计量 \(\hat{\tau}\) 收敛率的影响。
武器:minimax bounds for estimation problems;nonparametric statistics。
第一步具体动作:设定 bridge function 属于 α-阶 Hölder 类,推导 \(\hat{h}\) 在 L2 范数下的 minimax 收敛速度 \(n^{-2\alpha/(2\alpha+d)}\),再将该速度代入双稳健估计量的方差展开,给出 \(\hat{\tau}\) 的第二阶偏差的显式上界。
关系:补全原文中“温和一致性”的具体度量,并验证在低光滑情形下 CAN 是否仍成立。 -
问题:当桥函数估计使用 series estimator 时,推导其 finite-sample 误差展开(通过 einsum 表示高阶项),并利用 tensor contraction 高效计算交叉拟合中的重复估计。
武器:computation of higher-order U-statistics (treewidth / tensor contraction / einsum);software development。
第一步具体动作:将 series estimator 的系数的 OLS 估计改写为高阶张量的收缩形式,计算最优 contraction order 以减少计算复杂度(从 \(O(n^3)\) 降至 \(O(n^{tw})\))。
关系:算法侧贡献,加速交叉拟合适用于大规模数据集。
(B) 中期可做(最多 2 条,需要先在 moderately_familiar 工具上长肌肉)¶
- 缺哪块:semiparametric theory(具体:推导本文估计量的半参数效率界)。
需补文献: - Tsiatis (2006) Semiparametric Theory and Missing Data 第 4-5 章(efficient influence function 一般框架);
-
Tchetgen Tchetgen et al. (2020) "Proximal Inference"(给出 proximal 设定下的 EIF)。
补完后能做什么:计算本文 setting 下的 EIF 和 semiparametric efficiency bound,与当前估计量的渐近方差对比,判断是否达到最优(若否,提出 one-step 或 targeted 估计改进)。这是一个具体可产出论文的问题(A 档难度)。 -
缺哪块:identification theory in causal inference(具体:在多个 unmeasured confounders 的复杂半参数结构下,如何用多个 proxy 的图模型识别 ATE)。
需补文献: - Pearl (2009) Causality 关于 instrumental variables 的图模型;
- Rothenhäusler et al. (2018) "Proximal Causal Learning"(多 proxy 设定)。
补完后能做什么:将本文的单重 proxy 结构推广到多层 proxy,给出更一般图条件,并证明此时 bridge function 的唯一性条件可以放松(替代 completeness 为路径阻断条件)。此问题的解决最初需要理论储备,之后可转入 A 档的算法实现。
(C) 暂不建议(最多 2 条,核心机器在武器库之外)¶
- 使用 low-degree likelihood ratio 或 SoS hierarchy 分析本文方法在计算复杂统计权衡上的最优性——因为本文核心问题是识别而非计算下界,缺少多项式可达性/信息-计算差距问题,强行套用需要完全新设计算模型,且用户是“outsider”没有此类工具。
- 将 bridge function 的估计嵌入到大规模 SDP 优化中(如求解非线性积分方程)——目前武器库无 convex optimization 与 SDP 的精细分析工具,且实际问题中 series 估计已足够,无需如此重武器。
值得精读的关键参考文献:
- Miao, Geng & Tchetgen Tchetgen (2018) "Identification of causal effects using instrumental variables with an invalid instrument":首次提出 proximal identification 框架,是本文理论来源。推荐阅读以理解 bridge function 的一般条件与 completeness 假设。
- Tchetgen Tchetgen et al. (2020) "Proximal Causal Inference":系统性介绍双稳健估计与 EIF,直接对接中期可做问题1。
- Dahabreh et al. (2020) "Extending inferences from a randomized trial to a target population":经典 transportability 方法综述,用于对比本文的改进点(条件 transportability 与 proximal 版本)。
六、延伸思考与练习¶
假设扰动¶
扰动假设:调整 proxy \(W\) 在两个试验之间的可测量性条件——假设 \(W\) 在目标试验中缺失(而非可观测)。
结论变化:此时仅剩源试验中的 \(Z\),无法同时满足 adjustment 和 reweighting 的角色,识别方程退化,ATE 不可识别。技术上需要引入额外假设(如认为 \(W\) 与 \(U\) 的分布具有结构不变性)。
所需新工具:需要 nonparametric inverse problems 框架求解部分观察的积分方程(very_familiar 中的 inverse problems with random noise 可直接适用)。此扰动后的问题落入 A 档(因使用 very_familiar 工具即可分析)。
开放问题¶
- 作者未讨论 bridge function 的模型选择(如 how 选择 proxy 维度或光滑性参数),可发展为 data-driven 的交叉验证标准。
- 当两个试验的样本量差异很大时,如何优化权重以稳定有限样本表现?这涉及 high-dimensional asymptotics 与经验风险加权。
理解检测题¶
练习题:假设在源试验中,我们错误地使用了一个与 \(U\) 无关的变量作为 reweighting proxy \(Z\)(即 \(Z \perp U\))。请说明此时 bridge function 方程能否成立?若成立,\(\hat{\tau}\) 能否一致估计?若不成立,说明理由。
期望答案:当 \(Z\) 与 \(U\) 无关时,\(\mathbb{E}[h(X,Z) \mid A,X]\) 退化为一仅依赖于 \(X\) 的函数,那么 bridge function 方程 \(\mathbb{E}[Y\mid A,X,W] = \mathbb{E}[h(X,Z)\mid A,X]\) 的左边可能仍依赖于 \(W\)(因 \(U\) 通过 \(W\) 与 \(Y\) 相关),除非 \(W\) 也多余。一般情况下等式不成立(若 \(W\) 有预测能力),因此桥函数不存在,识别失败,\(\hat{\tau}\) 可能收敛至错误值。本题测试对识别根源(proxy 与 U 的关联)的理解。
Maintained by 陈星宇 · Homepage · Source on GitHub