Multiply robust estimation for causal survival analysis with treatment noncompliance¶
作者: Chao Cheng, Bo Liu, Lisa Wruck, Fan Li, Fan Li
来源: Annals of Applied Statistics
主题: 因果推断
相关性: 9/10
链接: https://doi.org/10.1214/25-aoas2117
一、核心问题与贡献¶
①本文研究了处理不依从与生存结局并存下的主生存因果效应识别与估计问题。②基于主可忽略性与单调性假设,结合逆概率加权(IPW)与嵌套 g-formula 构造了多重稳健半参数估计量,并提出了针对主可忽略性违反的敏感性分析框架。③证明了当部分工作模型误设时估计量仍保持相合性,并在 ADAPTABLE 试验中揭示了不同依从类型间的异质性效应,解释了意向治疗(ITT)效应为零的现象。
二、基础设定¶
- 核心概念与符号:
- $Z$: 处理分配(工具变量)
- $D$: 实际接受的处理
- $T$: 生存时间
- $S \in {co, al, at}$: 主分层(依从者、永远接受者、永远不接受者,单调性下无抗拒者 defier)
- $SCE_s(t)$: 主分层 $s$ 内在时间 $t$ 的生存因果效应
- 关键假设:
- Monotonicity(单调性):$D(1) \ge D(0)$。含义:排除 defier,使主分层结构可解。与标准 IV 文献一致。
- Principal Ignorability(PI,主可忽略性):$S \perp Z \mid X$。含义:在协变量条件下,主分层分布不依赖于分配。相比传统 CACE 估计依赖的排除限制,PI 假设允许主分层内效应异质性,但要求协变量能完全解释主分层与分配的关联,假设极强且不可证伪。
- Censoring at random(条件独立删失):生存时间删失机制条件独立于结局。
- 问题背景:传统 IV 方法在生存结局下难以直接应用,且通常只能估计 compliers 的效应。当存在异质性且 ITT 为零时,仅看 compliers 效应无法揭示全貌。与 Ding & Lu (2017) 的主分层框架相比,本文将其拓展至生存数据;相比传统生存 IV 估计,本文利用 PI 假设识别所有主分层(always-takers, never-takers, compliers)的效应。
三、主要定理 / 核心结果¶
- 原文陈述:构造的多重稳健估计量涉及三个工作模型:主分层概率模型 $\pi_s(X)$,生存结局模型 $S(t|Z, S, X)$,分配机制模型 $e(X)$。当三个模型中有一个误设,甚至在特定组合下有两个误设时,估计量仍具有相合性。
- 直观解释:通过将 IPW(对 $Z$ 加权以模拟 $S$ 的随机化)与嵌套 g-formula(对 $T$ 的条件期望建模)结合在同一个估计方程中,使得误设模型的残差项与正确设定的倾向得分或结局模型正交,从而吸收偏差。
- 解决了什么技术难点:解决了生存数据中主分层不可观测导致的 IPW 方差过大及 g-formula 模型误设偏差问题,提供了双重保险;同时解决了 PI 假设不可检验带来的推断脆弱性问题。
- 适用条件与局限:PI 假设极强,且不可证伪;生存模型通常需要参数化或半参数假设(如 Cox 模型),若核心结构模型全部误设则稳健性失效。
四、证明框架 / 方法设计¶
- 识别策略与估计量设计:
- 识别:利用 PI 和单调性,将 $P(S=s|X)$ 表达为 $P(D=d|Z=z, X)$ 的函数。利用嵌套反事实框架表达主分层内的生存概率。
- 估计量:构造基于影响函数的估计方程。核心形式为 IPW 项 + 嵌套 g-formula 项 - 校正项。
- 核心假设的可信度分析:PI 假设不可证伪,必须依赖领域知识。单调性在医学试验中通常合理(如只存在不依从服药,不存在反向吃药)。
- 敏感性分析策略:针对 PI 假设的违反,引入敏感性参数 $\delta$(衡量 $S$ 与 $Z$ 在给定 $X$ 下的残余关联),将 $\delta$ 偏离 0 的程度映射到估计量的偏差,绘制 tipping point 图。
- 计算/实现细节:生存模型可能涉及 Cox partial likelihood,主分层概率使用 multinomial logistic regression。估计方程求解可能需要数值迭代。
五、与研究者兴趣的关联¶
- 连接到哪个子方向:主分层因果推断;半参数效率与多重稳健估计;不可证伪假设的敏感性分析。
- 可借鉴的核心思路或技术工具:
- 将 multiply robust 估计方程构造技巧应用于带有潜变量(主分层)的生存分析中,这可以迁移到 longitudinal survival 或 mediation 分析中的潜变量建模。
- 对不可证伪假设(PI)的敏感性分析参数化技巧(引入 $\delta$ 刻画条件关联),对研究 proximal CI 中 unmeasured confounding 的敏感性分析有直接参考价值。
- 值得精读的关键参考文献:
- Ding, P., & Lu, J. (2017). Principal stratification analysis using principal scores. JRSS-B. (主分层与 PI 假设的奠基性工作,理解本文识别逻辑的必读文献)
- Robins, J. M., Rotnitzky, A., & Scharfstein, D. O. (2000). Sensitivity analysis for selection bias. (敏感性分析框架的经典文献,本文敏感性分析的思路来源)
六、延伸思考与练习¶
- 假设扰动:若放宽单调性假设(允许 defier 存在),PI 假设是否足以识别所有主分层的生存效应?技术上需要什么新工具?(提示:可能需要额外的排除限制或工具变量,或转向部分识别 bounding 策略)。
- 开放问题:如何在 PI 假设下,结合机器学习(如 DML/cross-fitting)进行非参数/半参数的多重稳健估计,以避免生存结局模型的参数误设,同时保证 $\sqrt{n}$-收敛率?
- 理解检测题:假设生存结局模型 $S(t|Z, S, X)$ 和主分层概率模型 $\pi_s(X)$ 均误设,但分配机制模型 $e(X)$ 正确设定,请基于本文的多重稳健估计方程结构,说明此时估计量为何仍然相合(提示:分析估计方程取期望后的极限行为与正交性)。
Maintained by 陈星宇 · Homepage · Source on GitHub