Direct and indirect treatment effects in the presence of semicompeting risks¶

作者: Yuhao Deng, Yi Wang, Xiao-Hua Zhou
来源: Biometrics
主题: 因果推断
相关性: 8/10
机构绿灯: Peking University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae032

一、领域脉络与小综述¶

这个方向是什么：这个子方向处理的是半竞争风险数据下的因果中介分析。其核心统计/科学问题是：当终点事件（如死亡）会"删失"中间事件（如疾病进展），但中间事件不影响终点事件的发生时，如何将处理对终点事件的总效应分解为"直接效应"（不经过中间事件）和"间接效应"（经过中间事件）？这一定义与识别的困难在于：一旦终点事件先发生，中间事件的潜在状态便永远无法观测，导致传统的中介分析框架无法直接套用。该方向目前处于方法论的构建与完善期，已有若干分解策略被提出，但不同策略所需的假设与因果解释存在差异，尚未形成统一标准。

发展脉络：根据 Introduction 的引用梳理，该领域的发展线索如下：

奠基工作（定义与识别困境）：
- Fine, Jiang & Chappell (2001)：首次在半竞争风险背景下提出了直接与间接效应的概念，奠定了问题的基本框架。作者指出，该工作虽然开启了这一方向，但留下了"如何合理定义因果参数"以及"如何在合理假设下识别这些参数"的口子。
- Xu, Kalbfleisch & Tai (2010)：进一步探讨了半竞争风险下的因果推断，但主要关注点在于竞争风险的一般性框架，未专门针对中介效应分解给出完整解决方案。
主要进展（中介分析的引入）：
- VanderWeele (2010) 与 Huang (2021)：将经典的 mediation analysis 引入生存数据，处理中介与结果均为事件时间的情形。作者在文中引用他们是为了说明：在标准生存数据中，中介分析已相对成熟，但在半竞争风险（即终点事件会截断中介事件）这一更复杂的结构下，现有方法面临挑战。
- Geskus (2011)：在竞争风险框架下讨论了因果参数的定义，为后续工作提供了潜在结果框架的数学语言。
当前 Frontier（本文的位置）：
- 本文试图填补的缺口是：现有的分解策略往往只关注某一种路径（如仅基于 hazard 或仅基于 prevalence），且对关键的"跨世界假设"（cross-world assumptions）往往含糊其辞或假设过强。作者提出，需要明确区分并对比"基于患病率"与"基于风险率"两种分解策略，并厘清各自所需的识别假设。

子线索聚类：被引文献大致落在以下两条子线索上： * 线索一：半竞争风险的参数定义与估计。这一簇关注如何在 \(T_2\)（终点事件）截断 \(T_1\)（中间事件）的结构下定义因果参数。代表工作包括 Fine et al. (2001) 和 Xu et al. (2010)。 * 线索二：生存数据的中介分析。这一簇关注如何将经典的直接/间接效应分解推广到时间-事件数据。代表工作包括 VanderWeele (2010) 和 Huang (2021)。本文位于这两条线索的交汇点：既处理半竞争风险结构，又进行中介效应分解。

这个方向在追问的核心问题： 1. 定义问题：在半竞争风险下，"间接效应"的因果定义是什么？由于终点事件发生后中介事件不再可观测，如何定义"通过中介发生的效应"？ 2. 识别问题：需要什么样的跨世界假设才能识别这些效应？这些假设在现实中有多少合理性？ 3. 分解策略的差异性：基于患病率与基于风险率的分解，在因果解释和数值结果上有何不同？

⚠️ 作者的 framing：作者将缺口 frame 为：现有文献虽然触及了半竞争风险下的效应分解，但缺乏对两种不同分解策略（Prevalence vs. Hazard）的系统对比，且对识别所需的跨世界假设缺乏明确界定。作者通过提出并对比这两种策略，将自己的工作定位为"厘清概念、明确假设"的必要一步。 * 淡化的竞争路线：作者未深入讨论基于复制方程或结构嵌套模型的动态治疗策略，而是聚焦于反事实框架下的静态分解。 * 缺失的引用：Introduction 中未引用 Pearl 的因果图框架或 Robins 的 g-formula/g-estimation 在竞争风险下的早期工作，这可能意味着作者选择在潜在结果框架下通过"假设堆叠"来解决问题，而非借助图模型的可识别性准则。研究者可自行判断这是否意味着图模型方法在此问题上的局限性或作者的偏好。

张力：未见明显对立引用。文献主要呈现为接力式发展，即不断尝试在更复杂的结构下定义因果量，而非在相同设定下得出相反结论。

二、最核心、最简单的例子 / 数学问题¶

在展开全文技术细节前，先交代清楚符号与模型，再给出支撑整篇论文的最小内核。

第一步：符号、模型与可观测数据

符号定义：
- \(Z\)：处理变量，二值（\(1=\)处理，\(0=\)对照）。
- \(T_1\)：非终末事件时间，如疾病进展时间。
- \(T_2\)：终末事件时间，如死亡时间。
- \(X\)：基线协变量向量。
- \((T_1(1), T_2(1))\) 与 \((T_1(0), T_2(0))\)：处理组与对照组的潜在结果。
- \(C\)：独立删失时间。
- \(Y_1 = T_1 \wedge C\)：\(T_1\) 的观测时间，\(\Delta_1 = I(T_1 \le C)\) 为其指示变量。
- \(Y_2 = T_2 \wedge C\)：\(T_2\) 的观测时间，\(\Delta_2 = I(T_2 \le C)\) 为其指示变量。
模型与数据生成机制：
- 半竞争风险结构：核心约束是 \(T_1\) 与 \(T_2\) 存在不对称关系。若 \(T_2 < T_1\)（死亡先于疾病进展），则 \(T_1\) 被截断，无法观测；若 \(T_1 < T_2\)，则两者均可观测（在无独立删失 \(C\) 的前提下）。这区别于标准竞争风险（两者互斥）和标准中介（中介与结果均可测）。
- 随机化假设：本文设定在完全随机化实验（completely randomized experiments）下，即 \(Z \perp (T_1(z), T_2(z), X)\)，这大大简化了识别条件，无需调整 \(X\) 即可识别边际效应。
可观测数据：
- 研究者实际观测到的是 iid 样本 \(\{Z_i, Y_{1i}, \Delta_{1i}, Y_{2i}, \Delta_{2i}\}_{i=1}^n\)。
- 不可观测的潜在量：当 \(T_2 < T_1\) 时，我们观测不到 \(T_1\) 的真实值（只知道 \(T_1 > T_2\)）；更重要的是，因果推断所需的跨世界潜在结果（如 \(T_1(1)\) 与 \(T_2(0)\) 的联合分布）是永远不可观测的，必须依靠假设来识别。

第二步：最小内核

论文的核心数学困难在于：如何定义并识别"间接效应"。在标准中介分析中，间接效应常定义为 \(Y(1, M(0)) - Y(0, M(0))\)（纯间接效应）。但在半竞争风险下，若 \(T_2(0) < T_1(0)\)（对照组中死亡先于疾病进展），则 \(T_1(0)\) 未发生，此时"固定中介状态"这一操作在数学上变得模糊。

本文的最小内核是提出了两种不同的反事实累积发生率定义，分别对应两种分解策略：

策略一：调整患病率
- 直觉：想象一个反事实世界，在这个世界里，非终末事件 \(T_1\) 的"患病率"分布被强制设定为与对照组（\(Z=0\)）一致，但终末事件 \(T_2\) 的风险结构仍保持处理组（\(Z=1\)）的特性。
- 最简情形：假设 \(T_1\) 与 \(T_2\) 独立（仅在此最小内核中假设，全文无此假设）。此时，间接效应可以通过 \(P(T_2(1) \le t | T_1(1) \sim F_{T_1(0)})\) 来捕捉。即，把处理组的 \(T_1\) 分布"替换"成对照组的分布，看 \(T_2\) 的风险如何变化。
- 识别关键：需要假设跨世界的联合分布结构，使得我们可以用观测数据重构这种"混合世界"的风险。
策略二：调整风险率
- 直觉：不直接调整分布，而是调整 \(T_1\) 的风险函数。定义一个反事实世界，其中 \(T_1\) 的 hazard 与对照组一致。
- 最简情形：在 \(T_1\) 与 \(T_2\) 独立的特例下，这看似与策略一相同，但在非独立的一般情形下，两者产生本质分歧。调整 hazard 意味着我们在动态地改变 \(T_1\) 发生的瞬时概率，这进而影响 \(T_2\) 的累积风险。

核心数学命题：在随机化实验下，若满足特定的跨世界假设（如 stochastic monotonicity 或特定独立性），上述两种反事实累积发生率是可识别的，且可以表示为观测数据分布的泛函。论文的后续证明主要围绕这些泛函的估计及其渐近性质展开。

三、这篇论文做了什么¶

三句话： ① 研究了半竞争风险数据下，如何将处理对终末事件的总效应分解为直接效应与间接效应。 ② 核心工具是基于反事实累积发生率的两种分解策略（调整患病率 vs. 调整风险率），并利用随机化假设与跨世界独立性进行识别。 ③ 主要结论是建立了两种分解策略下的非参数识别公式，构造了相应的估计量，证明了其渐近正态性，并通过模拟与实例展示了两种分解在实际数据中的差异。

关键设定与假设：

半竞争风险结构：\(T_2\) 终点事件会截断 \(T_1\) 非终末事件，反之不成立。这是数据结构的基石。
随机化假设：\(Z \perp (T_1(z), T_2(z))\)。由于是完全随机实验，无需考虑混杂调整，简化了识别公式。
跨世界假设：这是识别的核心难点。
- 对于 Prevalence-based decomposition：需要假设处理组与对照组在 \(T_1\) 上的随机性关系，通常涉及对 \(T_1(1)\) 和 \(T_1(0)\) 联合分布的约束（如无处理效应异质性约束或随机符号假设）。
- 对于 Hazard-based decomposition：需要更强的结构假设，通常涉及对条件风险 \(h(t|Z)\) 的跨世界独立性假设。
- 统计含义：这些假设本质上是解决"因果中介分析"中固有的不可识别问题。由于我们永远无法同时观测 \(T_1(1)\) 和 \(T_2(0)\)，必须借助外生假设来填补信息缺口。相比已有文献，本文明确列出了这些假设，而非含糊带过。

主要结果：

识别定理：
- 定理表明，在随机化与跨世界假设下，反事实累积发生率 \(F^{d}(t)\)（直接效应路径）与 \(F^{i}(t)\)（间接效应路径）均可由观测分布 \(\{P(T_1|Z), P(T_2|Z)\}\) 表出。
- 具体公式涉及对 \(T_1\) 分布的积分或对风险函数的加权，形式上类似于 g-formula 的推广。
估计量的渐近性质：
- 作者提出了非参数估计量（基于 Kaplan-Meier 或 Nelson-Aalen 累积风险估计）。
- 核心定理：证明了估计量 \(\hat{\tau}_{total}(t), \hat{\tau}_{direct}(t), \hat{\tau}_{indirect}(t)\) 服从高斯过程，且收敛于某个零均值高斯过程。
- 解决的技术难点：半竞争风险数据中的非正则性问题。当 \(t\) 接近尾端时，有效样本量减少，方差估计变得不稳定。作者通过经验过程理论处理了这一难点。
两种分解的差异：
- 理论上，Prevalence-based 方法关注的是"改变 \(T_1\) 的分布对 \(T_2\) 的影响"，而 Hazard-based 方法关注的是"改变 \(T_1\) 的瞬时风险对 \(T_2\) 的影响"。
- 在 \(T_1\) 与 \(T_2\) 不独立的情形下，两者不等价。模拟结果显示，两者的数值差异在 \(T_1\) 对 \(T_2\) 影响较强时更为显著。

证明路线与技术技巧：

整体路线：
1. 定义参数：写出反事实累积发生率的因果定义。
2. 识别：利用随机化与跨世界假设，将因果参数转化为观测数据分布的泛函。这一步通常涉及概率分解与重积分变换。
3. 估计：将识别公式中的未知分布替换为非参数估计量（如 KM 估计）。
4. 渐近分析：利用经验过程理论，证明估计量的收敛性与渐近正态性。
关键跳跃点：
- 识别步骤中的跨世界假设处理：如何从 \(P(T_2(1) | T_1(1))\) 过渡到 \(P(T_2(1) | T_1(0))\)？这是识别的核心难点。作者利用了特定的独立性或单调性假设，将不可观测的跨世界条件概率转化为可观测边际概率的组合。具体而言，可能使用了类似"stochastic intervention"的技巧，将 \(T_1(0)\) 视为一种干预分布。
技术技巧点名：
- Functional Delta Method：用于从 KM 估计的渐近性质推导出复杂泛函（如积分、比值）的渐近性质。
- Empirical Process Theory：处理生存数据估计量的弱收敛问题，特别是处理删失带来的非正则性。
- Influence Function：虽然文中未明示使用半参数效率理论，但渐近方差的推导通常隐含了 Influence Function 的计算。对于研究者这类熟悉效率理论的读者，可以尝试推导这些估计量的 Efficient Influence Function，看是否达到半参数有效界。

真实例子与应用： * 数据场景：论文使用了两个真实数据集（具体数据集名称需参见 Supplementary Materials，正文摘要提及）。 * 应用方式：将总效应分解为直接与间接效应，对比两种分解策略的结果。 * 结果与说明：模拟实验展示了在不同样本量与删失率下，估计量的偏差与覆盖率均表现良好。真实数据分析展示了两种分解在实际医学问题中的解释差异，例如在某种疾病治疗中，直接效应可能占主导，而在另一种情形下，间接效应（通过疾病进展）不可忽视。这验证了方法的实用性，并强调了"选择何种分解策略需依据科学问题背景"这一结论。

🔎 结论是否比证明窄：本文在完全随机化实验设定下给出了严格证明。结论部分未过度外推至观察性研究。然而，跨世界假设的验证性较弱——这是因果中介分析的通病，作者在正文中明确指出了这一点，并未声称这些假设可被数据验证，而是强调其不可验证性，需依靠领域知识判断。这一点是诚实的。

四、开放问题¶

观察性研究的推广：本文局限于完全随机化实验（\(Z \perp (T_1, T_2)\)）。在观察性研究中，存在混杂 \(X\)，此时识别公式需调整为条件版本。问题：在存在高维混杂 \(X\) 时，如何结合 Double Machine Learning 或 Debiasing 技术构造稳健的估计量？（扎根于本文设定：假设部分明确限定于随机化实验）。
跨世界假设的敏感性分析：跨世界假设（如 \(T_1(1) \perp T_2(0)\) 的某种变体）本质不可验证。问题：能否构建一套敏感性分析框架，量化当跨世界假设违背时，直接/间接效应估计的偏差？（扎根于本文 Limitation：作者承认跨世界假设不可验证）。
半参数效率界：本文提出的估计量是基于识别公式的直接代入。问题：在切空间中，该估计量是否达到半参数效率界？若未达到，如何构造 One-step Estimator 或 Estimating Equation 来提升效率？（扎根于本文证明：使用了 Functional Delta Method，未讨论效率界）。
竞争风险数目的扩展：本文仅考虑一个非终末事件与一个终末事件。问题：若存在多个非终末事件（如多种并发症）或多个终末事件，分解策略应如何推广？（扎根于本文模型：设定为单一 \(T_1\) 与单一 \(T_2\)）。

Maintained by 陈星宇 · Homepage · Source on GitHub

Direct and indirect treatment effects in the presence of semicompeting risks¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题¶

评论