Direct and indirect treatment effects in the presence of semicompeting risks¶
作者: Yuhao Deng, Yi Wang, Xiao-Hua Zhou
来源: Biometrics
主题: 因果推断
相关性: 8/10
机构绿灯: Peking University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujae032
一、领域脉络与小综述¶
这个方向是什么¶
这个子方向要解决的根本问题是:在生存数据中,当非终端事件(如疾病进展)可以被终端事件(如死亡)删失(即“半竞争风险”结构),如何将处理对终端事件的总效应,因果地分解为直接效应(不通过非终端事件)和间接效应(通过非终端事件)? 这是一个将经典中介分析(mediation analysis)框架扩展到生存数据中特殊删失结构的尝试。当前成熟度较低——该问题在方法学上仍处于早期探索阶段,主要挑战在于处理“跨世界”(cross-world)反事实的可识别性,以及半竞争风险带来的复杂删失结构。
发展脉络(history)¶
根据本文引言及其引用的文献,该方向的发展脉络如下:
-
奠基工作:经典中介分析框架的建立
- Robins & Greenland (1992) 和 Pearl (2001) 奠定了因果中介分析的理论基础,定义了自然直接效应(NDE)和自然间接效应(NIE),并指出其可识别性需要“跨世界”假设(如处理-中介交互项的无混淆性)。这是所有后续工作的理论起点。
- VanderWeele (2015) 系统性地总结了中介分析的方法学,包括在生存数据中的扩展。本文引用其工作作为“标准中介分析”的参考。
-
主要进展:将中介分析扩展到生存数据
- Lange & Hansen (2011) 和 VanderWeele (2011) 首次将中介分析应用于生存数据,使用Aalen加性风险模型或Cox比例风险模型来估计直接和间接效应。这些工作通常假设非终端事件(中介)不被终端事件(结局)删失,或处理了简单的删失结构。
- Tchetgen Tchetgen (2013) 和 Zheng & van der Laan (2017) 提出了更一般的半参数方法,利用高效影响函数(EIF)来估计生存数据中的中介效应,但仍未专门处理半竞争风险结构。
-
当前Frontier:处理半竞争风险结构
- Lin et al. (2021) 和 Conner et al. (2022) 是本文直接对标的工作。他们首次尝试在“半竞争风险”设定下进行中介分析。本文作者指出,这些工作要么依赖于“非终端事件独立于终端事件的条件独立假设”(这在半竞争风险下通常不成立),要么只考虑了“总效应分解”的特定形式(如基于患病率的分解),且未提供完整的渐近理论。
- 本文的位置:本文声称自己是第一个在完全随机化实验(即处理分配是随机的)框架下,为半竞争风险数据提供两种可识别且可估计的总效应分解策略,并建立其渐近性质的工作。它填补了“经典中介分析”与“半竞争风险生存分析”之间的空白。
子线索聚类¶
这些被引文献大致落在以下两条子线索上:
-
线索一:基于反事实的因果中介分析(Counterfactual-based Mediation)
- 做什么:严格遵循Robins & Pearl的反事实框架,定义NDE/NIE,并依赖“跨世界”假设(如处理-中介交互项的无混淆性)进行识别。通常使用回归或加权方法估计。
- 代表工作:Robins & Greenland (1992), Pearl (2001), VanderWeele (2015), Tchetgen Tchetgen (2013), Zheng & van der Laan (2017)。
- 本文的定位:本文的两种分解策略都明确属于这一线索,因为它们都定义了反事实累积发生率,并引入了“跨世界”假设(如假设1和2)。
-
线索二:半竞争风险数据的因果推断(Causal Inference with Semicompeting Risks)
- 做什么:专门处理“非终端事件可被终端事件删失”这一特殊结构。核心挑战是处理“患病”(非终端事件发生)和“死亡”(终端事件发生)之间的依赖关系,以及由此产生的“治愈”或“脆弱性”概念。
- 代表工作:Lin et al. (2021), Conner et al. (2022), 以及更早的关于半竞争风险建模的工作(如Fine et al., 2001)。
- 本文的定位:本文是这一线索在“中介分析”方向上的直接延伸。它明确承认了半竞争风险结构,并提出了两种不同的分解策略来应对。
这个方向在追问的核心问题¶
- 可识别性:在什么假设下,反事实累积发生率(如 \( F_{1m}(t) \),即处理组中,若将非终端事件状态设为 \( m \) 时的终端事件发生率)是可识别的?特别是,如何处理“跨世界”假设(如处理与中介的交互项)?
- 分解策略:如何将总效应“自然地”分解为直接和间接部分?不同的分解策略(如基于患病率 vs. 基于风险函数)对应着不同的因果解释,哪个更合理?
- 估计与推断:在给定识别假设下,如何构造估计量?其渐近性质(一致性、收敛速度、方差估计)是什么?如何处理半竞争风险带来的复杂删失和依赖结构?
- 敏感性分析:当关键的“跨世界”假设被违反时,结论的稳健性如何?
⚠️ 作者的Framing¶
- 作者的缺口:作者将缺口frame为“现有工作(Lin et al., 2021; Conner et al., 2022)要么依赖不合理的独立假设,要么只提供了一种分解策略,且缺乏完整的渐近理论”。因此,本文的“显然的下一步”是:在完全随机化实验这一最干净的设定下,提出两种可识别、可估计、且有完整渐近理论的分解策略。
- 被淡化或回避的路线:
- 观察性研究:本文明确将设定限制在“完全随机化实验”。这回避了观察性研究中处理分配与潜在结果之间的混杂问题。作者在引言末尾提到“扩展到观察性研究是未来工作”,但并未深入讨论。
- 更复杂的“跨世界”假设:作者承认两种分解策略都需要“跨世界”假设(假设1和2),但并未深入讨论这些假设在实践中的合理性或如何检验它们。这被淡化处理了。
- 与其他分解策略的比较:除了本文提出的两种,是否还有其他更“自然”的分解方式?作者没有讨论。
- 什么明显该被引/该存在、却没出现在intro里?
- 关于“跨世界”假设的敏感性分析:这是中介分析中一个非常活跃的领域(如Imai et al., 2010; VanderWeele, 2015)。本文没有引用任何关于“跨世界”假设敏感性分析的工作,这暗示作者可能认为在完全随机化实验下,这些假设是“合理”的,或者将其留作未来工作。值得研究者去查:是否存在针对半竞争风险数据中“跨世界”假设的敏感性分析方法?
- 关于“半竞争风险”的经典统计模型:如Fine & Gray (1999) 的竞争风险模型,或更早的“脆弱性模型”(frailty models)。本文引用了Fine et al. (2001) 关于半竞争风险建模的工作,但未深入讨论这些模型与本文反事实框架的关系。值得研究者去查:本文的估计方法是否与这些经典模型有直接联系?
张力¶
未见明显对立引用。所有被引工作都在朝着“更一般、更现实”的方向发展,本文是这一趋势的延续。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
- \( A \in \{0, 1\} \):处理分配变量。0 = 对照组,1 = 处理组。
- \( T \):终端事件(如死亡)的发生时间。
- \( D \):非终端事件(如疾病进展)的发生时间。
- \( C \):独立删失时间(如失访)。
- \( X \):基线协变量(本文设定为完全随机化实验,因此 \( X \) 与 \( A \) 独立,但可用于提高效率)。
- \( M(t) = I(D \le t) \):到时间 \( t \) 为止,非终端事件是否已发生的指示变量。这是一个随时间变化的变量。
- \( F_{a}(t) = P(T \le t | A = a) \):处理组 \( a \) 中,终端事件的累积发生率(CIF)。
- \( F_{am}(t) = P(T \le t | A = a, M(\infty) = m) \):反事实累积发生率。这是核心 estimand。它表示:如果处理被设为 \( a \),且非终端事件的最终状态(即 \( M(\infty) \),是否在无限时间内发生)被设为 \( m \),那么终端事件的累积发生率。注意,\( M(\infty) \) 是一个“事后”变量,它本身受处理影响。
- \( \lambda_{am}(t) \):反事实风险函数,对应 \( F_{am}(t) \)。
- \( \pi_a = P(M(\infty) = 1 | A = a) \):处理组 \( a \) 中,非终端事件的最终患病率。
- Estimand:
- 总效应 (Total Effect, TE):\( TE(t) = F_1(t) - F_0(t) \)
- 直接效应 (Direct Effect, DE):\( DE(t) = F_{11}(t) - F_{01}(t) \)(策略一)或 \( DE(t) = \int_0^t [\lambda_{11}(s) - \lambda_{01}(s)] S_{11}(s) ds \)(策略二,其中 \( S \) 是生存函数)。
- 间接效应 (Indirect Effect, IE):\( IE(t) = F_{11}(t) - F_{10}(t) \)(策略一)或 \( IE(t) = \int_0^t \lambda_{11}(s) [S_{11}(s) - S_{10}(s)] ds \)(策略二)。
-
模型:
- 数据生成机制:一个完全随机化实验。处理 \( A \) 是随机分配的,与所有潜在结果独立。
- 半竞争风险结构:\( D \) 可以被 \( T \) 删失(即如果先死亡,就观察不到疾病进展),但 \( T \) 不能被 \( D \) 删失(即疾病进展后仍可观察死亡)。
- 可观测数据:对于每个个体 \( i \),我们观察到 \( (A_i, X_i, U_i, \delta_i, V_i, \eta_i) \),其中:
- \( U_i = \min(T_i, C_i) \):终端事件的观察时间。
- \( \delta_i = I(T_i \le C_i) \):终端事件是否被观察到的指示变量。
- \( V_i = \min(D_i, T_i, C_i) \):非终端事件的观察时间。
- \( \eta_i = I(D_i \le \min(T_i, C_i)) \):非终端事件是否被观察到的指示变量。
- 关键点:我们永远无法同时观察到 \( D_i \) 和 \( T_i \) 的完整信息,因为如果 \( T_i < D_i \),则 \( D_i \) 被删失。我们只能观察到 \( V_i \) 和 \( \eta_i \),其中 \( \eta_i = 1 \) 意味着 \( D_i \le T_i \)。
第二步:讲最小内核¶
本文的核心思路可以浓缩为一个最简特例:假设没有独立删失(\( C = \infty \)),且我们只关心一个固定的时间点 \( t = \infty \)(即终身风险)。
在这个特例下: * 可观测数据:对于每个个体,我们最终能观察到 \( (A, D, T) \),但有一个关键限制:如果 \( T < D \),则 \( D \) 是未观察到的(被删失)。我们只知道这个个体在死亡前没有发生非终端事件。 * 核心问题:如何将总效应 \( TE(\infty) = P(T \le \infty | A=1) - P(T \le \infty | A=0) \) 分解为直接和间接部分?
策略一(基于患病率的分解): * 想法:总效应可以写成:
策略二(基于风险函数的分解): * 想法:将总效应分解为直接效应和间接效应,类似于经典中介分析中的“控制直接效应”和“自然间接效应”。直接效应是“在非终端事件风险函数不变的情况下,改变处理对终端事件风险函数的影响”,间接效应是“在处理效应不变的情况下,改变非终端事件风险函数对终端事件风险函数的影响”。 * 核心困难:同样需要“跨世界”假设(假设2),即处理对终端事件风险函数的直接效应,不依赖于非终端事件的发生状态。即 \( \lambda_{11}(t) - \lambda_{01}(t) = \lambda_{10}(t) - \lambda_{00}(t) \)。
总结:这个最小内核揭示了本文的核心数学困难:如何从可观测数据中识别出反事实累积发生率 \( F_{am}(t) \)。由于半竞争风险结构,我们无法直接观察到“处理组中未患病”的个体(因为未患病可能只是因为他们死得早)。作者通过引入“跨世界”假设,将反事实量转化为可观测量的函数,从而实现了识别。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在完全随机化实验的框架下,针对半竞争风险数据,提出了两种将处理对终端事件的总效应分解为直接效应和间接效应的策略。
- 核心工具/方法:基于反事实累积发生率(\( F_{am}(t) \))的定义,通过引入“跨世界”假设(处理对终端事件的直接效应不依赖于非终端事件的状态)来实现可识别性,并采用非参数或半参数方法(如Kaplan-Meier估计、Aalen-Johansen估计、Cox模型)进行估计。
- 主要结论:两种分解策略在假设上略有不同,但都能在完全随机化实验下实现可识别。作者建立了反事实累积发生率和分解效应的渐近性质(一致性、弱收敛性),并通过模拟和真实数据展示了两种分解的细微差异。
关键设定与假设¶
- 设定:
- 完全随机化实验:\( A \perp (T(a), D(a)) \),其中 \( T(a), D(a) \) 是处理 \( a \) 下的潜在结果。这是最干净的设定,避免了混杂。
- 独立删失:\( C \perp (T, D) | A \)。删失时间独立于所有事件时间。
- 半竞争风险:\( D \) 可被 \( T \) 删失,反之不成立。这是数据结构的核心特征。
- 假设:
- 假设1(用于策略一):\( F_{11}(t) - F_{01}(t) = F_{10}(t) - F_{00}(t) \) 对所有 \( t \) 成立。即,处理对终端事件累积发生率的直接效应,在非终端事件“患病”和“未患病”组中是相同的。这是一个“跨世界”假设,因为它涉及不同处理水平下的反事实量。
- 假设2(用于策略二):\( \lambda_{11}(t) - \lambda_{01}(t) = \lambda_{10}(t) - \lambda_{00}(t) \) 对所有 \( t \) 成立。即,处理对终端事件风险函数的直接效应,不依赖于非终端事件的发生状态。这也是一个“跨世界”假设。
- 与已有文献的对比:相比Lin et al. (2021) 和 Conner et al. (2022),本文的假设更弱(不要求非终端事件独立于终端事件),但仍然是“跨世界”的,无法从数据中检验。
主要结果¶
- 定理1(可识别性):在假设1下,策略一的直接效应 \( DE(t) \) 和间接效应 \( IE(t) \) 是可识别的,并且可以表示为可观测数据的函数。具体地,\( F_{11}(t) \) 和 \( F_{10}(t) \) 可以直接从处理组中“患病”和“未患病”个体的数据中估计(使用Aalen-Johansen估计器处理竞争风险),而 \( F_{01}(t) \) 可以通过一个“加权”的Aalen-Johansen估计器从对照组中“患病”个体的数据中估计,权重与处理组中“患病”个体的分布有关。
- 定理2(可识别性):在假设2下,策略二的直接效应 \( DE(t) \) 和间接效应 \( IE(t) \) 是可识别的。估计需要先估计反事实风险函数 \( \lambda_{am}(t) \),这可以通过Cox比例风险模型或Aalen加性风险模型来实现。
- 定理3(渐近性质):在正则条件下,基于策略一和策略二得到的反事实累积发生率估计量 \( \hat{F}_{am}(t) \) 是相合的,并且作为 \( t \) 的函数,弱收敛到一个均值为零的高斯过程。这为构造置信区间和进行假设检验提供了理论基础。
- 解决的技术难点:
- 处理半竞争风险下的删失:在估计 \( F_{10}(t) \) 时,需要处理“未患病”个体中,非终端事件被终端事件删失的问题。作者使用Aalen-Johansen估计器,它天然地处理了竞争风险结构。
- 构造“加权”估计量:为了估计 \( F_{01}(t) \),需要将对照组中“患病”个体的分布“调整”到与处理组中“患病”个体的分布一致。作者通过引入一个“权重函数”来实现,该权重函数依赖于处理组中“患病”个体的生存分布。
证明路线与技术技巧¶
- 整体路线:
- 定义反事实量:定义 \( F_{am}(t) \) 和 \( \lambda_{am}(t) \)。
- 建立可识别性:在“跨世界”假设下,将反事实量表示为可观测数据的函数。例如,对于策略一,证明 \( F_{01}(t) = \int_0^t \frac{S_{11}(s-)}{S_{01}(s-)} d\Lambda_{01}^*(s) \),其中 \( \Lambda_{01}^*(s) \) 是对照组中“患病”个体的累积风险函数,\( S_{11}(s) \) 和 \( S_{01}(s) \) 是反事实生存函数。
- 构造估计量:用可观测数据的经验版本替换上述表达式中的未知量。例如,用Aalen-Johansen估计器估计 \( S_{11}(s) \) 和 \( \Lambda_{01}^*(s) \)。
- 建立渐近性质:使用经验过程理论(empirical process theory)和delta方法,证明估计量的相合性和弱收敛性。关键步骤是证明估计量可以表示为独立同分布随机变量的和加上一个可忽略的余项(即,它具有渐近线性表示)。
- 关键跳跃点:
- 从可识别性到估计量的构造:如何将反事实量的表达式转化为一个可计算的估计量?作者巧妙地利用了Aalen-Johansen估计器的“乘积积分”形式,将复杂的反事实生存函数 \( S_{01}(s) \) 与可观测的 \( S_{11}(s) \) 联系起来。
- 渐近线性表示的推导:这是证明的核心难点。作者需要处理Aalen-Johansen估计器的非线性性质,以及“加权”步骤带来的额外变异性。他们使用了影响函数(influence function)的技巧,将估计量的渐近方差表示为可观测数据函数的方差。
- 技术技巧点名:
- Aalen-Johansen估计器:用于估计竞争风险下的累积发生率函数。这是处理半竞争风险数据的标准工具。
- 乘积积分:用于将生存函数表示为累积风险函数的函数,便于进行代数操作和渐近分析。
- 影响函数:用于推导估计量的渐近方差和弱收敛性。这是半参数理论中的核心技巧。
- 经验过程理论:用于证明估计量的相合性和弱收敛性,特别是处理非参数估计量时。
真实例子与应用¶
- 数据/场景:本文在补充材料中提供了两个真实数据应用。第一个是艾滋病临床试验,研究抗逆转录病毒治疗(ART)对死亡的影响,其中“疾病进展”(如CD4计数下降)被视为非终端事件。第二个是癌症临床试验,研究新辅助化疗对死亡的影响,其中“病理完全缓解”(pCR)被视为非终端事件。
- 方法应用:作者将本文提出的两种分解策略应用于这两个数据集,估计了直接效应(治疗对死亡的直接影响)和间接效应(通过疾病进展/pCR对死亡的影响)。
- 结果:两个例子都展示了两种分解策略给出的直接效应和间接效应估计值略有不同,但定性结论一致。例如,在艾滋病例子中,ART主要通过直接效应降低死亡风险,而通过疾病进展的间接效应相对较小。
- 例子想说明什么:这些例子旨在说明:
- 本文提出的方法在实际数据中是可行的。
- 两种分解策略虽然基于不同的假设,但在实际应用中可能给出相似的结果,从而增强了结论的稳健性。
- 该方法能够量化处理效应的不同传导路径,为理解治疗机制提供洞见。
🔎 结论是否比证明窄¶
- 是。本文的核心结论(两种分解策略的可识别性和渐近性质)是在完全随机化实验这一强假设下严格证明的。然而,作者在引言和讨论中泛泛地声称该方法可以扩展到观察性研究。这是一个典型的“结论比证明窄”的例子。作者没有提供任何在观察性研究下处理混杂的证明或方法,只是将其作为未来工作。务必点名具体语句:引言末尾的“Extensions to observational studies are left for future work”和讨论部分的“Our framework can be extended to observational studies by incorporating propensity score weighting or outcome regression”都只是conjecture,而非proven result。
四、开放问题¶
- 放松“跨世界”假设:本文的两种分解策略都依赖于“跨世界”假设(假设1或2)。这些假设在完全随机化实验下是否仍然过于强?能否在更弱的假设下(如单调性假设)实现可识别?扎根点:假设1和假设2的陈述。
- 扩展到观察性研究:如何将本文的框架扩展到处理分配非随机的观察性研究?需要引入哪些额外的假设(如无混杂性、正性)?估计方法如何调整(如使用倾向得分加权或双重稳健估计)?扎根点:引言末尾的“Extensions to observational studies are left for future work”。
- 敏感性分析:当关键的“跨世界”假设被违反时,结论的稳健性如何?能否开发出针对半竞争风险数据的敏感性分析方法?扎根点:本文未讨论敏感性分析,这是一个明显的缺口。
- 与其他分解策略的比较:除了本文提出的两种,是否存在其他更“自然”或更“合理”的分解方式?例如,基于“自然直接效应”和“自然间接效应”的经典分解,在半竞争风险下是否可行?扎根点:本文只提出了两种策略,但未穷尽所有可能性。
Maintained by 陈星宇 · Homepage · Source on GitHub