Randomized Interventional Effects in Semicompeting Risks, With Application to a Hematopoietic Cell Transplantation Study¶

作者: Yuhao Deng, Rui Wang, Tao Zhang, Xiang Zhan
来源: Statistics in Medicine
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：半竞争风险与因果中介分析的结合，旨在解决临床/流行病学中“中间事件（如复发）影响终点事件（如死亡），且终点事件会截断中间事件观测”的因果路径拆解问题。核心统计/科学问题是：如何将处理对终点事件的总效应，分解为不经过中间事件的直接效应与经过中间事件的间接效应，并在存在右删失与处理诱导的时变混杂下给出非参数识别与估计。该方向目前处于理论框架争鸣与特定应用场景落地的交汇期：识别框架已从“跨世界反事实”转向“随机干预/分离效应”，但时间-事件结局下的非参数估计与敏感性分析仍缺乏系统工具。

发展脉络： - 奠基工作：VanderWeele (2011) 与 Imai et al. (2010) 将中介分析引入生存数据与一般框架，确立了自然直接/间接效应（NDE/NIE）与顺序可忽略性假设。但作者在文中明确指出其瓶颈：“Identifying natural effects requires sequential ignorability, meaning there should be no post-treatment confounding between mediator and outcome (Imai et al., 2010)”——一旦出现处理诱导的时变混杂，NDE/NIE不可识别。 - 主要进展（识别破局）：为绕开跨世界反事实与处理诱导混杂，两条路线兴起： 1. 随机干预效应：VanderWeele et al. (2014) 提出从参考分布随机抽取中介变量定义效应；VanderWeele & Tchetgen Tchetgen (2016) 与 Lin & VanderWeele (2017) 将其扩展至纵向/生存数据，但作者指出其缺口：“has not been extended to time-to-event outcomes”且对时变混杂的边际/条件处理存在分歧。 2. 分离效应/干预主义：Robins et al. (2020) 与 Stensrud et al. (2019, 2021) 提出将处理拆分为两个组件分别作用于中介与结局，作者引用时点明其限制：“requires dismissible treatment components, which essentially excludes unmeasured confounding between mediator and outcome (Stensrud et al., 2022)”。 - 当前 frontier（半竞争风险特化）：Huang (2021) 首次将半竞争风险显式建模为因果中介问题，提出基于时变权重与鞅理论的非参数估计；Nevo & Gorfine (2020) 提出基于事件顺序分层的新 estimands 与部分识别。作者对 Huang 的引用隐含了其只解决了估计而未触及时变混杂下的随机干预识别。 - 本文的位置：填补“随机干预框架在时间-事件结局下尚未建立”的缺口，将 VanderWeele & Tchetgen Tchetgen (2016) 的纵向随机干预效应移植到半竞争风险右删失设定，给出识别公式、NPMLE 估计与 frailty 敏感性分析。

子线索聚类： 1. 随机干预效应：VanderWeele et al. (2014) → VanderWeele & Tchetgen Tchetgen (2016) → Zheng & van der Laan (2017) → Díaz et al. (2023)。核心：用随机抽取中介分布绕开跨世界反事实，允许处理诱导混杂，但代价是直接/间接效应不再严格相加等于总效应（除非如 Vansteelandt & Daniel 2017 做特定修正）。 2. 分离效应/干预主义：Robins et al. (2020) → Stensrud et al. (2019, 2021)。核心：将处理物理拆分为两个组件，保留“可加性”与“可操纵性”，但要求“可分离处理组件”假设，且仍排斥中介-结局间的未测量混杂。 3. 半竞争风险因果建模：Huang (2021) → Nevo & Gorfine (2020) → Xu et al. (2019)。核心：针对“终点截断中间事件”的数据结构特化 estimands（主分层、路径特定、鞅补偿），但多依赖较强参数/半参数假设或仅给出部分识别。

这个方向在追问的核心问题： 1. 识别：在存在处理诱导的时变混杂与右删失下，何种直接/间接效应 estimands 可非参数识别？所需假设的最弱形式是什么？ 2. 分解相加性：随机干预效应不满足 NDE+NIE=TE，如何修正或重新定义以保持总效应的完整分解（Vansteelandt & Daniel 2017 的路线 vs. 接受不相加）？ 3. 因果解释：随机干预间接效应是否满足“尖锐零假设”（Miles 2022 指出若无更强假设则不满足），其因果实质是“中介分布的随机重分配”而非“自然层级”？ 4. 估计与敏感性：在右删失与半竞争风险下，如何实现非参数/半参数高效估计？如何对中介-结局间未测量混杂（frailty）做定量敏感性分析？

⚠️ 作者的 framing： - 作者将缺口 frame 为：“randomized interventional effects framework [...] has not been extended to time-to-event outcomes”，从而将本文定位为将已有纵向框架向生存数据的自然推广。 - 被淡化的竞争路线：Stensrud et al. (2021) 的分离效应框架同样适用于竞争风险/时间-事件，且保留了可加性与可操纵性，但作者仅在假设对比中提及其“requires dismissible treatment components”，未深入比较两种框架在半竞争风险下的实质差异（如：随机干预效应牺牲可加性换取弱识别条件，分离效应保留可加性但要求物理可分离处理——这是价值判断，留给读者）。 - 明显该引但未引的：Miles (2022) 对随机干预间接效应因果解释的批评（“do not satisfy sharp null criterion without stronger assumptions”）未出现在 intro，这对本文 estimands 的因果实质构成直接挑战，值得研究者去查。

张力：未见明显对立引用（不同框架在不同假设下得出不同识别公式，属于互补而非矛盾）。但存在隐含张力：随机干预效应的“不相加性”与分离效应的“可加但需可分离处理”在因果解释上是两条不可兼得的路线，本文选择了前者但未显式论证为何在半竞争风险下后者不可行或不合适。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(A\)：二值处理（如供体类型：\(1=\)匹配无关供体 MUD，\(0=\)单倍体相合供体 Haplo）。
\(L(t)\)：时变混杂向量（如移植后时间 \(t\) 的 GVHD 状态、其他临床指标），受 \(A\) 与过去 \(L\) 影响。
\(N_1(t)\)：中间事件（非终点事件，如复发 relapse）的计数过程，\(N_1(t)=1\) 表示在 \(t\) 之前发生复发。
\(N_2(t)\)：终点事件（如死亡 death）的计数过程，\(N_2(t)=1\) 表示在 \(t\) 之前死亡。半竞争风险核心：\(N_2(t)=1 \Rightarrow N_1(t)\) 被右删失（死亡截断复发的观测），但 \(N_1(t)=1\) 不截断 \(N_2(t)\)。
\(C\)：独立右删失时间（如失访），观测到 \(\tilde{T} = \min(T_1, T_2, C)\) 与 \(\Delta_1, \Delta_2\) 指示哪个事件先发生。
\(b\)：潜在 frailty（未观测的个体脆弱性），用于敏感性分析，代表中介-结局间的未测量混杂。
\(\bar{L}(t), \bar{N}_1(t)\)：历史过程（\(\bar{L}(t) = \{L(s): 0 \le s \le t\}\)）。
\(F(t; a) = P(N_2(t)=1 \mid A=a)\)：处理 \(a\) 下终点事件的累积发生率（总效应的基石）。
\(G_{a^* \mid \bar{L}, \bar{N}_1}\)：在给定历史下，中间事件过程的条件分布（随机干预的“参考分布”）。

模型（数据生成机制）：时间-事件数据按离散时间 \(t=1,2,\dots\) 生成：\(A \rightarrow L(1) \rightarrow N_1(1) \rightarrow N_2(1) \rightarrow L(2) \rightarrow \cdots\)。\(A\) 影响 \(L\)、\(N_1\)、\(N_2\)；\(L(t)\) 是 \(A\) 诱导的时变混杂（影响 \(N_1(t), N_2(t)\) 且受过去 \(A, N_1\) 影响）；\(N_1\) 与 \(N_2\) 共享未观测 frailty \(b\)（敏感性分析引入）。右删失 \(C\) 独立于所有潜在过程。

可观测数据：对每个个体 \(i\)，观测到 \((A_i, \tilde{T}_i, \Delta_{1i}, \Delta_{2i}, \bar{L}_i(\tilde{T}_i), \bar{N}_{1i}(\tilde{T}_i))\)。想要但观测不到的：若 \(\Delta_{2i}=1\)（死亡先发生），则该个体在死亡后的复发时间 \(T_{1i}\) 永远未知（被截断）；frailty \(b_i\) 不可测。

第二步：最小内核——离散时间、单时间点、无删失的随机干预效应

剥掉连续时间、右删失、时变混杂序列，考虑最简特例：单时间点 \(t=1\)，二值中介 \(M=N_1(1) \in \{0,1\}\)，二值结局 \(Y=N_2(1) \in \{0,1\}\)，无删失，无时变混杂 \(L\)。

总效应：\(TE = F(1;1) - F(1;0) = P(Y=1 \mid A=1) - P(Y=1 \mid A=0)\)。
自然直接/间接效应（跨世界，不可识别）：\(NDE = P(Y_{1,M_0}=1) - P(Y_{0,M_0}=1)\)，需跨世界反事实 \(Y_{1,M_0}\)，若存在 \(A \rightarrow M \rightarrow Y\) 的未测混杂则不可识别。
随机干预直接/间接效应（本文核心）：
设参考分布 \(G_{0}\) 为 \(A=0\) 下 \(M\) 的边际分布：\(P(M=1 \mid A=0)\)。
想象一个随机干预：将 \(M\) 随机抽取为 \(M' \sim G_{0}\)（与个体实际的 \(M\) 无关），然后让 \(A\) 与 \(M'\) 共同决定 \(Y\)。
随机干预直接效应（RIDE）：\(RIDE = P(Y_{1,M'}=1 \mid M' \sim G_0) - P(Y_{0,M'}=1 \mid M' \sim G_0)\)。
- 在此特例下，\(P(Y_{a,M'}=1 \mid M' \sim G_0) = \sum_{m=0,1} P(Y=1 \mid A=a, M=m) P(M=m \mid A=0)\)。
- 直觉：固定 \(M\) 的分布为 \(A=0\) 下的自然分布，比较 \(A=1\) vs \(A=0\) 对 \(Y\) 的效应——这是“通过 \(A\) 直接路径”的效应，因为 \(M\) 的分布被锁在 \(A=0\) 的状态。
随机干预间接效应（RIIE）：\(RIIE = P(Y_{0,M'}=1 \mid M' \sim G_1) - P(Y_{0,M'}=1 \mid M' \sim G_0)\)。
- \(G_1\) 是 \(A=1\) 下 \(M\) 的分布。固定 \(A=0\)，比较 \(M\) 分布从 \(G_0\) 变为 \(G_1\) 时 \(Y\) 的变化——这是“通过 \(M\) 间接路径”的效应。
分解：\(TE = RIDE + RIIE\)（在此特例下成立，因为 \(P(Y=1 \mid A=a) = \sum_m P(Y=1 \mid A=a, M=m) P(M=m \mid A=a)\)，展开即得）。

最小内核的数学实质：用“边际/条件分布的随机重分配”替代“跨世界反事实”，将不可识别的自然效应转化为可识别的期望叠加（g-formula）。在一般时间-事件设定下，核心困难变为：如何定义“中间事件过程 \(N_1(t)\) 的随机抽取”及其与“时变混杂 \(L(t)\) 序列”的依赖结构，并在右删失下给出非参数识别与估计。

三、这篇论文做了什么¶

三句话： ①研究了半竞争风险下处理对终点事件的总效应如何分解为直接与间接效应（经中间事件），在存在处理诱导的时变混杂与右删失时给出识别与估计。 ②核心工具是随机干预框架（从参考分布随机抽取中间事件过程）与非参数最大似然估计（NPMLE）。 ③主要结论是给出了时间-事件结局下随机干预效应的识别公式（边际与条件版本），证明了 NPMLE 的大样本性质，并提出了基于 frailty 的敏感性分析方法。

关键设定与假设：在第二节记号基础上补全： - 离散时间纵向设定：\(t=1,\dots,K\)。完整数据为 \((A, L(1), N_1(1), N_2(1), \dots, L(K), N_1(K), N_2(K))\)，受右删失 \(C\) 截断。 - 半竞争风险结构：\(N_2(t)=1 \Rightarrow N_1(s)\) 对 \(s \ge t\) 不可观测（死亡截断复发）。 - 识别假设（核心）： 1. N1 & N2 的条件独立性：给定历史 \(\bar{L}(t), \bar{N}_1(t-1), A\)，\(N_1(t)\) 与 \(N_2(t)\) 独立（无 frailty 时的基准假设；敏感性分析中通过引入 \(b\) 放松此条）。 2. 顺序可忽略性（随机干预版）：\((N_1(t), N_2(t)) \perp A \mid \bar{L}(t), \bar{N}_1(t-1)\)（无处理-混杂未测依赖）；且 \(C \perp (A, N_1, N_2, L)\)（独立删失）。 3. 参考分布的选取： - 边际版：\(G_{a^*}\) 为 \(A=a^*\) 下 \(N_1\) 过程的边际分布（边际化掉时变混杂 \(L\)），对应 VanderWeele & Tchetgen Tchetgen (2016)。 - 条件版：\(G_{a^* \mid \bar{L}}\) 为给定 \(\bar{L}\) 下 \(N_1\) 过程的条件分布，对应 Zheng & van der Laan (2017) 与 Lin & VanderWeele (2017)。 - 统计含义：条件版允许时变混杂 \(L(t)\) 影响 \(N_1\) 与 \(N_2\) 且受 \(A\) 影响（处理诱导混杂），但要求 \(L(t)\) 可观测；边际版进一步将 \(L(t)\) 积分掉，识别公式更简洁但因果解释更弱（因 \(L\) 的路径被模糊化）。相比自然效应的顺序可忽略性，本文假设不要求“无处理诱导混杂”，这是随机干预框架的核心放宽。

主要结果： 1. 识别公式（Theorem 1 类）： - 边际随机干预效应： \(RIIE_{margin}(t) = \sum_{\bar{n}_1} \left[ P(N_2(t)=1 \mid A=0, \bar{N}_1=\bar{n}_1) \right] \times \left[ P(\bar{N}_1=\bar{n}_1 \mid A=1) - P(\bar{N}_1=\bar{n}_1 \mid A=0) \right]\) 直觉：固定 \(A=0\)，将 \(N_1\) 的分布从 \(A=0\) 换为 \(A=1\)，看 \(N_2\) 的变化。识别依赖于 \(N_1\) 与 \(N_2\) 在给定 \(A\) 与历史下的条件独立性（无 frailty）。 - 条件随机干预效应：类似但在给定 \(\bar{L}\) 下抽取 \(N_1\)，识别公式多一层对 \(\bar{L}\) 的条件/积分。 - 分解：\(TE(t) = RIDE(t) + RIIE(t)\)（边际版在无 frailty 下严格成立；条件版需额外条件）。 2. NPMLE 估计（Theorem 2 类）： - 将识别公式中的条件概率参数化为离散时间下的联合分布，通过非参数最大似然（离散时间下的经验分布/ Turnbull 型估计）估计所有条件概率。 - 大样本性质：NPMLE 是一致且渐近正态的，作者引用 Zeng & Lin (2008) 的 Donsker class 理论论证 \(\{\psi: \beta \in \mathcal{B}, \Lambda \in \mathcal{A}\}\) 是 Donsker class，从而保证估计的渐近有效性。 3. 敏感性分析： - 引入潜在 frailty \(b \sim N(0,1)\)，假设 \(N_1(t)\) 与 \(N_2(t)\) 给定 \((\bar{L}, A, b)\) 下独立，但边际相关。 - Frailty 效应 \(\alpha_z > 0\)（\(z\) 指供体类型），表示 \(b\) 对终点事件的增强效应（“greater value of \(b\) may represent an individual being in weaker conditions”）。 - 通过变动 \(\alpha_z\) 的值，重新计算识别公式（此时需对 \(b\) 积分），观察直接/间接效应的估计如何随未测混杂强度变化。

证明路线与技术技巧： - 整体路线： 1. 定义 estimands：用潜在结果 \(N_2(t; a, \bar{N}_1^{a^*})\) 定义随机干预效应，其中 \(\bar{N}_1^{a^*}\) 是从 \(G_{a^*}\) 或 \(G_{a^* \mid \bar{L}}\) 随机抽取的中间事件过程。 2. 识别：在条件独立性（无 frailty）与顺序可忽略性下，将潜在期望拆解为观测数据的 g-formula（对 \(\bar{n}_1, \bar{l}\) 的求和/积分）。 3. 估计：将 g-formula 中的条件概率用离散时间 NPMLE 替换，论证替换后的泛函是 Donsker class，从而继承半参数有效性。 4. 敏感性：引入 frailty \(b\)，修改条件独立性假设，重新推导识别公式（含对 \(b\) 的积分），用 NPMLE 估计条件概率，对 \(\alpha_z\) 做网格搜索。 - 关键跳跃点： - 从跨世界到观测分布的跳跃：核心是利用“随机抽取 \(\bar{N}_1^{a^*}\) 与实际 \(\bar{N}_1\) 独立”这一设定，将 \(P(N_2(t; a, \bar{N}_1^{a^*})=1)\) 拆解为 \(\sum_{\bar{n}_1} P(N_2(t)=1 \mid A=a, \bar{N}_1=\bar{n}_1) P(\bar{N}_1=\bar{n}_1 \mid A=a^*)\)——这要求 \(N_2(t)\) 给定 \((A, \bar{N}_1)\) 下与 \(\bar{N}_1^{a^*}\) 独立（即无跨世界依赖），而随机干预框架通过“随机抽取”物理上保证了这一点。 - 半竞争风险的截断处理：死亡截断复发观测导致 \(P(\bar{N}_1=\bar{n}_1 \mid A=a)\) 的直接估计不可行。作者利用条件独立性假设，将 \(P(\bar{N}_1=\bar{n}_1 \mid A=a)\) 拆解为条件于存活的逐步乘积，从而用存活个体的数据估计。 - 技术技巧点名： - Donsker class 理论：用于论证 NPMLE 估计的泛函空间性质，保证渐近正态性与有效性（引用 Zeng & Lin 2008）。 - 离散时间 g-formula：将连续时间问题离散化为有限时间点，用乘积极限型公式识别条件概率，避免连续时间下的测度论困难。 - Frailty 模型与积分：敏感性分析中，对 \(b \sim N(0,1)\) 的积分用数值方法（如 Gauss-Hermite 求积）计算，\(\alpha_z\) 作为敏感性参数扫描。

真实例子与应用： - 数据/场景：造血干细胞移植（HCT）研究，比较匹配无关供体（MUD, \(A=1\)）vs. 单倍体相合供体（Haplo, \(A=0\)）对死亡（\(N_2\)）的效应，中介为复发（\(N_1\)），时变混杂为移植物抗宿主病（GVHD, \(L(t)\)）。数据来自 CIBMTR 注册库，含右删失。 - 怎么用上去： 1. 估计 \(P(N_2(t)=1 \mid A=a, \bar{N}_1=\bar{n}_1, \bar{L}=\bar{l})\) 与 \(P(\bar{N}_1=\bar{n}_1 \mid A=a^*, \bar{L}=\bar{l})\)（条件版）或边际版对应概率。 2. 代入识别公式，计算 \(TE, RIDE, RIIE\) 在各时间点的估计。 3. 对 frailty 参数 \(\alpha_z\) 做敏感性分析（\(\alpha_z\) 从 0 到某正值扫描）。 - 得到什么结果： - 总效应：MUD 相比 Haplo 降低死亡风险（在 PTCy 预防下）。 - 直接效应与间接效应：复发的中介效应（RIIE）占一定比例，但直接效应（RIDE，不经过复发）为主。 - 敏感性分析：frailty 效应 \(\alpha_z\) 较小时结论稳健（“The frailty effect is small”，引用 Chang et al. 2017, 2020 的临床证据支持 \(\alpha_z\) 不大的合理性）。 - 想说明什么：展示方法在真实半竞争风险数据上的可行性，验证 PTCy 下 MUD 的生存优势主要不通过复发中介，且结论对潜在 frailty 不敏感。

🔎 结论是否比证明窄： - 分解相加性：作者在边际版下 claim \(TE = RIDE + RIIE\)，但证明仅依赖“无 frailty 下的条件独立性”与“边际抽取”。在条件版下，相加性需额外条件（如 \(L\) 不受 \(N_1\) 影响），作者未显式陈述此条件的必要性，仅泛泛 claim“条件版也可分解”——这是比证明宽的 claim。 - 因果解释：作者将 RIIE 解释为“间接效应”，但 Miles (2022) 证明随机干预间接效应在无更强假设下不满足尖锐零假设，作者未在文中限制此解释的范围。

四、开放问题（点到为止）¶

随机干预间接效应的因果实质：Miles (2022) 指出随机干预间接效应不满足尖锐零假设，本文的 RIIE 在何种额外假设下可具有真正的中介因果解释？扎根在本文对 RIIE 的定义与 Miles (2022) 的批评。
条件版分解的相加性条件：条件随机干预效应下 \(TE = RIDE + RIIE\) 的严格必要条件是什么？扎根在本文条件版识别公式的推导中隐含的对 \(\bar{L}\) 路径的积分依赖。
连续时间下的识别与估计：本文离散化时间以避免测度论困难，连续时间下（连续 \(N_1(t)\) 过程）的随机干预效应识别公式与 NPMLE 性质如何？扎根在本文“离散时间设定”的假设与 Zheng & van der Laan (2017) 的连续时间生存设定。
高维/多中介半竞争风险：当存在多个中间事件（如复发+感染）或高维时变混杂时，NPMLE 的维度灾难如何克服？能否用 cross-fitting / debiased ML 替代 NPMLE？扎根在本文 NPMLE 的非参数性质与 Díaz et al. (2023) 的 debiased ML 路线。

（要确认某条是否真 gap，建议读 Miles 2022 近期评论、Stensrud 2021 的分离效应框架、以及 Díaz 2023 的 longitudinal interventional effects 估计理论——若都指向“条件版相加性/因果解释不清”则是共识，若互相打架则是机会。）

Maintained by 陈星宇 · Homepage · Source on GitHub