Multiply robust estimation for causal survival analysis with treatment noncompliance¶

作者: Chao Cheng, Bo Liu, Lisa Wruck, Fan Li, Fan Li
来源: Annals of Applied Statistics
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在存在处理非依从性和右删失的随机化试验或观察性研究中，如何识别并估计潜在主层（latent principal strata，如依从者、始终接受者、始终拒绝者）内部的生存分布或因果效应。当前该方向的成熟度处于“识别理论已建立多种路径，但针对生存数据（含删失）的半参数有效与稳健估计刚起步”的阶段。

发展脉络： - 奠基工作：Frangakis & Rubin (1999/2002) 提出主层分层框架，将非依从者按潜在接受行为 \((A(1), A(0))\) 划分为潜在子群，定义了主层因果效应。留下的口子：主层属于潜在变量，无法观测，如何识别与估计？ - 主要进展（IV/ER 路线）：Angrist, Imbens & Rubin (1996) 利用工具变量（IV）与排除限制假设识别了依从者平均因果效应（CACE）。Yu et al. (2015) [13] 将此延伸至生存数据，在半参数变换模型下估计 CACE。留下的口子：排除限制假设要求处理分配对始终接受者/始终拒绝者无效应，这在许多医学场景（如阿司匹林剂量）中不可信；且该方法无法估计非依从者亚组的效应。 - 主要进展（PI 路线）：Jo & Stuart (2009) [2] 与 Ding & Lu (2017) [3] 提出主层可忽略性假设，即给定协变量，潜在主层与潜在结局均值独立，作为排除限制的替代，使得所有主层的效应可识别。留下的口子：仅针对连续/二值结局，未处理生存数据特有的右删失问题；且依赖正确指定主层得分模型。 - 当前 frontier（稳健估计）：Jiang, Yang & Ding (2022) [10] 在非生存结局下推导了主层因果效应的非参数识别公式，并提出了三重稳健估计量。作者在本文引言中明确引用并定位此工作：“尽管在主层可忽略性下因果推断方法有所进展（Ding and Lu, 2017; Jiang et al., 2022），但针对生存结局的发展极少，生存结局因右删失需要独特处理。” - 本文的位置：填补 Jiang et al. (2022) 留下的生存数据空白，在 PI + 单调性下推导主层生存因果效应的识别公式，并构造多重稳健估计量，同时针对 PI 与单调性这两个核心识别假设开发正式的敏感性分析。

子线索聚类： 1. IV + 排除限制路线：依赖 \(Z \perp Y | A\) 的排除限制识别 CACE。代表工作：Yu et al. (2015) [13]（生存数据下的 CACE 半参数变换模型）、Wei et al. (2021) [17]（依从者分位数因果效应）。此簇的瓶颈是排除限制在剂量比较等场景常不成立，且无法估计始终接受者/拒绝者的效应。 2. 主层可忽略性（PI）路线：依赖 \(U \perp Y(z) | X\) 识别所有主层效应。代表工作：Jo & Stuart (2009) [2]、Ding & Lu (2017) [3]（主层得分与敏感性分析）、Jiang et al. (2022) [10]（三重稳健估计）。此簇的瓶颈是 PI 假设极强且不可检验，且此前未覆盖删失生存结局。 3. 生存因果的稳健估计路线：不涉及非依从性，仅处理混杂与删失。代表工作：Bai et al. (2013) [8]（双重稳健生存分布估计）、Westling et al. (2023) [11]（交叉拟合双重稳健均匀置信带）。此簇的瓶颈是未考虑处理非依从性带来的潜在分层问题。

这个方向在追问的核心问题： 1. 在排除限制不可信时，如何利用主层可忽略性识别所有主层的生存因果效应？ 2. 生存数据中的右删失如何与主层的潜在变量结构交互，从而影响识别公式与 nuisance 模型的设定？ 3. 如何构造估计量，使其在多个 nuisance 模型（主层得分、结局回归、删失机制）部分误设时仍保持一致性？ 4. 核心识别假设（PI 与单调性）不可检验，如何量化其违反对因果结论的影响？

⚠️ 作者的 framing： - 作者将缺口 frame 为“生存结局因右删失需要独特处理，而现有 PI 路线未覆盖”，使得本文的“多重稳健 + 删失机制”成为 PI 路线的显然下一步。 - 被淡化或回避的竞争路线：作者虽提及 IV 路线（如 Yu et al. 2015），但未深入比较 PI 与 ER 在生存设定下的优劣权衡；ER 假设弱于 PI（ER 仅限制始终接受/拒绝者的效应为零，PI 则要求条件独立），但 ER 只能识别 CACE，作者选择了 PI 以获取更广的异质性效应，这一选择代价（PI 的不可检验性更强）被敏感性分析部分弥补，但未与 ER 路线的敏感性分析做直接对比。 - 明显该被引却未出现的：Proximal causal inference 近年在处理潜在变量与不可观测混杂上有突破（如用代理变量替代强不可检验的 PI 假设），引言中未见此路线的讨论，这是一个值得研究者去查的缺口。

张力：被引的这些工作之间未见明显对立引用。但存在隐含的设定张力：IV 路线（Yu et al. 2015）依赖 ER 识别 CACE，PI 路线（Jiang et al. 2022）依赖 PI 识别所有主层效应。两者在识别策略上互斥（不能同时作为主识别假设，除非两者均成立），但在单调性下可共存。本文选择 PI 作为主识别假设，ER 仅作为敏感性分析的一个特例（当 PI 违反程度趋向 ER 对应的约束时），这一设定选择本身构成了论文的逻辑起点。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据 - 参数 / estimand： - \(S_z^u(t)\)：主层 \(u\) 在处理 \(z\) 下的潜在生存概率，即 \(P(T(z) > t \mid U = u)\)。这是本文要估计的核心因果 estimand。 - 随机变量 / 样本： - \(Z \in \{0, 1\}\)：随机化处理分配（如高剂量 vs 低剂量）。 - \(A \in \{0, 1\}\)：实际接受的处理。 - \(X\)：基线协变量向量。 - \(Y = \min(T, C)\)：观测到的生存/删失时间。 - \(\Delta = I(T \le C)\)：删失指示变量（1 表示观测到死亡，0 表示右删失）。 - 维数 / 样本量等指标： - \(n\)：样本量。\(t\)：时间点。 - 潜在量： - \(A(z)\)：在分配 \(z\) 下会实际接受的处理。 - \(T(z)\)：在分配 \(z\) 下的潜在生存时间。 - \(C(z)\)：在分配 \(z\) 下的潜在删失时间（通常假设 \(C(1)=C(0)=C\)，即删失不受分配影响，或条件独立）。 - \(U = (A(1), A(0))\)：主层。在单调性 \(A(1) \ge A(0)\) 下，有三层：依从者 \(c\) (\(A(1)=1, A(0)=0\))，始终接受者 \(a\) (\(A(1)=1, A(0)=1\))，始终拒绝者 \(n\) (\(A(1)=0, A(0)=0\))。 - 模型 / 数据生成机制： - 随机化：\(Z \perp \{A(1), A(0), T(1), T(0), C\} | X\)（或无条件独立）。 - 单调性：\(A(1) \ge A(0)\) 几乎必然成立。 - 主层可忽略性（PI）：\(U \perp T(z) | X\)（给定协变量，主层类别与潜在生存时间独立）。 - 删失机制：\(C \perp T | (X, Z, U)\)（条件独立删失，或更弱的 \(C \perp T | (X, Z, A)\)）。 - 可观测数据： - 研究者实际观测到的是 \((X_i, Z_i, A_i, Y_i, \Delta_i)\) for \(i=1,\dots,n\)。 - 想要但观测不到的是：\(U_i\)（主层类别，因为个体只经历一个分配 \(Z_i\)，只能观测到一个 \(A_i\)，另一个 \(A(1-Z_i)\) 是反事实的）、\(T_i\)（当 \(\Delta_i=0\) 时 \(T_i\) 被删失不可见）。

第二步：讲最小内核 整篇论文的证明与方法本质上是“带删失机制的三重稳健识别”的推广。最简特例是无删失的二值结局（即 \(T \in \{0, 1\}\)，此时 \(\Delta=1, Y=T\)）。

在这个特例下，要估的是 \(P(Y(1)=1 | U=c)\)（依从者在处理下的潜在结局均值）。由于 \(U\) 不可观测，在 \(Z=1\) 组中，观测到 \(A=1\) 的人混有 \(c\) 和 \(a\)。要剥离出 \(c\) 的效应，需利用 PI 假设 \(U \perp Y(1) | X\)。此时，识别公式退化为：

\[P(Y(1)=1 | U=c) = \frac{E[I(Z=1)I(A=1)Y / e(X)]}{E[I(Z=1)I(A=1) / e(X)]} \times \frac{1}{P(U=c|X)} \text{ 的加权形式}\]

三重稳健性意味着：只要 \((\pi_c, e)\) 正确，或 \((m_1, e)\) 正确，或 \((\pi_c, m_1)\) 正确（注意这里 \(e\) 的角色），估计量就一致。

本文的加壳：当 \(Y\) 变为生存时间且存在删失时，上述 \(Y\) 和 \(m_1(X)\) 必须被替换为涉及生存概率 \(S(t|X, Z, A)\) 和删失概率 \(G(t|X, Z, A)\) 的动态过程。最小内核的困难在于：生存函数是随时间 \(t\) 变化的累积量，且 \(m_z(X)\) 和 \(Y\) 的替换必须引入 IPCW（逆概率删失加权）或风险率建模，这使得 nuisance 函数从静态的均值/概率变成了动态的生存曲线，三重稳健的交叉抵消结构必须在时间过程上成立，且需处理 Kaplan-Meier 型的非参数步函数与半参数模型的嵌套。本文的关键想法是：将 IPCW 结构嵌入 Jiang et al. 的三重稳健框架，通过将删失机制 \(G(t|X, Z, A)\) 作为第四个 nuisance 模型，并证明在特定组合下（如结局模型 + 删失模型正确，或主层得分 + 删失模型正确），估计量仍保持一致。

三、这篇论文做了什么¶

三句话： ① 研究了在处理非依从与右删失下，基于主层可忽略性与单调性假设的主层生存因果效应的识别与估计问题。 ② 核心工具是结合逆概率删失加权（IPCW）、主层得分加权与结局回归，构造多重稳健估计量。 ③ 主要结论是该估计量在 1 个甚至特定 2 个 nuisance 模型误设时仍保持一致，并在 ADAPTABLE 试验中揭示了依从者、始终接受者与始终拒绝者的异质性生存效应解释了 ITT 的零结果，同时提供了针对 PI 与单调性违反的敏感性分析框架。

关键设定与假设：在第二节最小记号基础上补全： - 主层可忽略性（PI）：\(U \perp T(z) | X\)。统计含义：给定协变量，个体的依从类型不提供关于其潜在生存时间的额外信息。相比 IV 路线的排除限制（ER：\(Z \perp T(z) | U, X\)），PI 允许估计始终接受者/拒绝者的效应，但假设更强、更不可检验。 - 单调性：\(A(1) \ge A(0)\) a.s.。统计含义：不存在违抗者。这是标准假设，本文在敏感性分析中放宽了它。 - 条件独立删失：\(C \perp T | (X, Z, A)\) 或更强版本。统计含义：在观测到的协变量与实际接受的处理条件下，删失与潜在死亡时间独立。 - 随机化：\(Z \perp \{U, T(1), T(0)\} | X\)。

主要结果： 1. 非参数识别定理：在 PI + 单调性 + 独立删失下，主层生存概率 \(S_z^u(t)\) 可由观测数据分布非参数识别。识别公式涉及 \(P(A|Z,X)\)（推导主层得分）、\(P(T>t|X,Z,A)\)（结局生存模型）与 \(P(C>t|X,Z,A)\)（删失模型）。 2. 多重稳健估计量：构造了 \(S_z^u(t)\) 的多重稳健估计量。理论结果证明：该估计量在以下任一条件满足时一致： - 结局模型与删失模型均正确（即使主层得分误设）； - 主层得分与删失模型均正确（即使结局模型误设）； - 主层得分与结局模型均正确（即使删失模型误设——这通常需要更强的条件或特定结构，本文的“有时两个误设”指的就是这种特定组合）。这比标准双重稳健多了一层保护，特别保护了最易误设的主层得分模型（因为 \(U\) 不可观测，主层得分模型最难检验）。 3. 敏感性分析框架： - 对 PI 违反：引入敏感性参数 \(\delta\)（如条件 odds ratio），量化 \(U\) 与 \(T(z)\) 的残余依赖，推导偏倚作为 \(\delta\) 的函数。 - 对单调性违反：引入违抗者比例 \(\pi_d(X)\)，推导主层效应估计随 \(\pi_d\) 变化的偏倚轨迹。

证明路线与技术技巧： - 整体路线： 1. 从 PI 与单调性出发，推导 \(S_z^u(t)\) 的三种不同识别路径（IPW 型、回归型、G-computation 型）。 2. 将三种路径的 nuisance 函数（主层得分 \(\pi_u(X)\)、处理概率 \(e(X)\)、结局生存 \(m_z(X, t)\)、删失生存 \(G(X, Z, A, t)\)）提取出来。 3. 利用半参数理论中的影响函数构造技术，将三种识别公式组合成一个单一的多重稳健估计量。 4. 对估计量进行一阶泰勒展开，分析残差项。证明当特定 nuisance 组合正确时，残差项的高阶误差在概率上收敛到零。 5. 建立渐近正态性，推导方差估计量（涉及 nuisance 模型的导数/风险率）。 - 关键跳跃点： - 从静态三重稳健到动态生存过程的跳跃。难点在于生存函数 \(S(t)\) 是积分/乘积极限过程，其影响函数包含随时间 \(t\) 变化的 Martingale 增量。作者必须将 Jiang et al. (2022) 的代数抵消结构嵌入生存分析的经验过程，确保抵消不仅在 \(t=0\) 成立，而是在所有 \(t \in [0, \tau]\) 成立。 - 主层得分 \(\pi_u(X)\) 的估计。因为 \(U\) 不可观测，\(\pi_c(X) = P(A=1|Z=1,X) - P(A=0|Z=0,X)\)（在单调性下）。这要求处理模型 \(P(A|Z,X)\) 必须在两个干预组下分别正确拟合，且差值非负（保证单调性）。如果差值为负，需截断或修正，此处的经验过程处理是技术卡点。 - 技术技巧点名： - Inverse Probability of Censoring Weighting (IPCW)：用于将删失机制纳入识别公式，构造 \(I(C \ge t) / G(t|X,Z,A)\) 加权，解决右删失。 - Efficient Influence Function / Semiparametric theory：用于推导多重稳健估计量的具体形式。通过找到 \(S_z^u(t)\) 在非参数模型下的影响函数，其天然具有多重稳健结构（影响函数总是由条件期望与逆概率加权的残差构成）。 - Empirical Process / Martingale Integral：用于证明随时间 \(t\) 变化的估计量的均匀收敛与渐近正态性，处理 Kaplan-Meier 型步函数的随机收敛。

真实例子与应用： - 数据 / 场景：ADAPTABLE 试验 (Jones et al. 2021) [1]。比较 81mg vs 325mg 阿司匹林对心血管患者死亡或住院的预防效果。该试验存在严重非依从性（大量 325mg 组患者实际服用 81mg，反之较少）。 - 怎么用上去：将剂量分配作为 \(Z\)，实际服用作为 \(A\)，死亡/住院时间作为 \(T\)。利用本文方法估计始终高剂量接受者、依从者、始终低剂量接受者的生存概率差。 - 得到什么结果：ITT 分析显示两剂量组无显著差异。本文主层分析揭示：依从者中 325mg 有微弱优势；始终高剂量接受者中 325mg 反而更差（可能因为高剂量导致出血）；始终低剂量接受者中无差异。这种异质性正好解释了 ITT 的零结果（异质性效应相互抵消）。 - 想说明什么：(1) 验证多重稳健方法在真实删失+非依从数据下的可行性；(2) 展示主层分析比 ITT 能提供更深的机制洞察；(3) 通过敏感性分析展示结论对 PI 与单调性中等程度的违反具有稳健性。

🔎 结论是否比证明窄：作者在摘要中 claim “consistent even if one, and sometimes two, of the required models are misspecified”。这里的“sometimes two”在正文中是有严格条件限定的（通常要求误设的两个模型不包含删失模型，或特定组合使得残差项的偏倚可被另一个正确模型吸收）。这一 claim 不能泛化为“任意两个误设都行”，务必核对正文中 Theorem 的具体条件（如：Outcome + Principal score 正确，Censoring 误设是否可行？取决于 Censoring 是否在影响函数中被 Outcome 完全吸收）。

四、开放问题（点到为止，扎根具体语句）¶

半参数效率界：本文构造了多重稳健估计量，但未讨论其是否达到 \(S_z^u(t)\) 在 PI + 单调性 + 独立删失设定下的半参数效率界。扎根点：引言提及“Jiang et al. (2022) 提出了三重稳健估计量”，但 Jiang et al. 讨论了效率界，本文未明确 claim 效率性。若使用参数 nuisance 模型且未做 cross-fitting，通常不达到效率界。
均匀置信带：本文提供了点态的渐近正态性推断，但未构造 \(S_z^u(t)\) 在 \(t \in [0, \tau]\) 上的均匀置信带。扎根点：引言提及“Westling et al. (2023) has proposed strategies to construct uniform confidence bands for the average treatment effects in survival analysis without noncompliance”，本文将此作为前人进展，但自身仅停留在点态推断，未延伸至主层效应的均匀推断。
PI 假设的代理变量放宽：PI 假设极强且不可检验，本文仅做了敏感性分析，未尝试用代理变量放宽 PI。扎根点：引言完全未提及 Proximal Causal Inference 路线（用两个代理变量替代不可观测的 \(U\)），这是一个明显的缺失，值得研究者去查近期 Proximal PS 文献是否覆盖了生存结局。
非单调性下的生存 MR 估计：本文依赖单调性识别主层得分，Tong et al. (2025) [18] 在非单调性下做了半参数主层分析，但未覆盖生存数据与多重稳健。扎根点：引言提及单调性是标准假设并在敏感性分析中检验，但未给出非单调性下的 MR 识别公式。

Maintained by 陈星宇 · Homepage · Source on GitHub

Multiply robust estimation for causal survival analysis with treatment noncompliance¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论