Effect Modification in Settings with “Truncation by Death”¶

作者: Bronner P. Gonçalves, Etsuji Suzuki
来源: Epidemiology
主题: 因果推断
相关性: 8/10
机构绿灯: Harvard University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1097/ede.0000000000001834

一、领域脉络与小综述¶

这个方向是什么¶

“截尾死亡”（truncation by death）是因果推断中一个经典而棘手的问题：当结局变量（如生活质量、认知功能）对在随访结束前死亡的个体“未定义”时，传统因果效应（如平均处理效应）无法直接定义，因为处理的因果效应仅作用于“如果两种处理下都存活”的亚群（永远存活层，always-survivors）。该方向的核心科学问题是如何在潜在结果框架下，利用主分层（principal stratification，Frangakis & Rubin, 2002）定义并识别存活者平均因果效应（Survivor Average Causal Effect, SACE），并进一步研究哪些变量会修饰（即交互/异质性作用于）该效应、以及SACE能否从一个群体迁移（transport）到另一个群体。当前该子方向在流行病学方法论文献中已积累十余年，但效应修饰与可迁移性的形式化理论仍相对碎片化，多为特定假设下的识别策略。

发展脉络（基于该方向的经典文献，因本文未提供完整参考列表，以下引用为通用知识）¶

奠基工作：Frangakis & Rubin (2002) 提出主分层框架，形式化“永远存活者”作为因果效应的定义层，解决了因死亡截断导致的定义问题。他们指出，SACE是处理效应在永远存活层上的平均。此后，主分层成为该领域标准语言。
主要进展：Robins (1986, 1995) 的单调性假设（monotonicity：处理不会导致死亡）和结构嵌套模型为SACE的部分识别提供了工具；Imai (2008) 引入了敏感性分析；VanderWeele & Tchetgen Tchetgen (2014) 探讨了工具变量与主层结合的识别。然而，效应修饰（即SACE如何随协变量变化）很少被系统性处理，多数工作默认SACE在同质样本上稳定。
当前frontier：最近几年，方法学家开始关注SACE的可迁移性（transportability）——即从研究群体估计的SACE能否应用于另一个生存概率不同的群体。Lesko et al. (2017) 和 Dore et al. (2020) 讨论了标准化加权方法，但权重仅基于总体协变量分布，未考虑主层结构。本文（Gonçalves & Suzuki, 2025）将主分层权重纳入效应修饰公式，明确指出了SACE加权平均的权重不仅取决于协变量水平的总体频数，还取决于永远存活层在协变量各水平上的比例。
本文位置：在SACE的效应修饰与可迁移性交叉点上，用主分层框架推导了两种类型的变量（共同影响生存与结局的变量、仅影响生存的变量）如何修饰SACE，并揭示了SACE可迁移性的一个必要条件：比较协变量与永远存活层的联合分布。

子线索聚类¶

该方向被引工作大致落在三条子线索：

SACE的识别策略：利用单调性、工具变量、no-interaction假设、敏感性分析等处理因死亡截断导致的不可识别性。代表：Robins(1986, 1995), Imai(2008), Tchetgen Tchetgen et al. (2012)。
主层内的效应修饰/异质性：在多变量主层中定义处理效应随协变量的变化。代表：VanderWeele(2011), Jemiai et al.(2007)——但相对稀少，多数工作只考虑平均效应。
因果效应的可迁移性：将效应从一个目标人群外推到另一个，常见于无截断的情况（如 inverse probability of sampling weights），但有截断时需额外调整生存结构。代表：Lesko et al.(2017), Dore et al.(2020)。本文同时触及2和3，将主层分布纳入迁移公式。

这个方向在追问的核心问题¶

问题1：在什么条件下，SACE可以被未观测到的永远存活层状态所识别（即无偏估计）？→ 经典答案：单调性+排除限制。
问题2：SACE是否随协变量变化？怎么量化这种变化？→ 本文部分回答。
问题3：SACE能否从研究群体推广到另一个生存概率不同的目标群体？需调整哪些协变量？→ 本文的部分讨论，但未给出完整识别公式。

瓶颈：1) SACE本身在半识别场景下只能得到部分识别区间，效应修饰的分析会增加不确定性；2) 主层永远无法被观测到（永远存活者定义潜在死亡模式下为两种处理下都存活），因此依赖于强假设（如单调性、排除限制）来近似；3) 效应修饰的统计推断需要估计主层成员概率，增加了模型误设风险。

⚠️ 作者的framing（需明确为作者说法）¶

作者的framing是：已有的SACE可迁移性工作忽略了主层本身在协变量分布上的差异性，导致迁移权重不正确。因此本文“显然的下一步”就是将主层条件概率加入加权公式。作者淡化了这一公式在非单调性情况下的推广难度（文中似乎假设了单调性或更简单的死亡模式）。值得研究者去查的问题：本文没有引用哪些近5年SACE相关工作？例如，关于非单调性下SACE的部分识别（如 Imbens & Angrist 1994的自然扩展）、以及利用机器学习估计主层成员概率（如 Wang & Zhou 2018, 2022）——这些可能被回避或只字未提。

张力¶

未见明显对立引用。SACE文献缺少竞争性理论，识别策略大多基于相同的主分层框架，差异主要在假设的强弱（单调性 vs. 无假设），但无直接矛盾。

二、最核心、最简单的例子 / 数学问题（先交代符号/模型/可观测数据，再讲最小内核）¶

第一步：符号、模型、可观测数据交代清楚¶

符号：以二值处理 \(A \in \{0,1\}\)，二值死亡指示 \(D \in \{0,1\}\)（1=死亡），结局 \(Y\)（对死亡个体未定义，通常记为“缺失”）。潜在结果：\(Y^{a}\) 表示处理 \(A=a\) 下的潜在结局；\(D^{a}\) 表示处理 \(A=a\) 下的潜在死亡状态。
主层定义：根据 \((D^0, D^1)\) 的联合取值划分四个主层：永远存活者（\(D^0=0, D^1=0\)）、协伤者（\(D^0=1, D^1=1\)）、受保护者（\(D^0=1, D^1=0\)）、致害者（\(D^0=0, D^1=1\)）。SACE 定义为永远存活者（always-survivors，记 \(S_{00}\)）中的因果效应： \(\text{SACE} = E[Y^1 - Y^0 | D^0=0, D^1=0]\)。
可观测数据：观测到 \((A, D, Y)\)，其中当 \(D=1\) 时 \(Y\) 缺失。研究者永远不能直接观测到主层，因为 \((D^0, D^1)\) 只有一个分量可观测（基于分配的处理）。
目标变量：SACE（永远存活者中的ATE）。
修饰变量：\(X\) 是一个可观测的协变量（可能与生存和结局同时相关，或仅与生存相关）。效应修饰的意思是：SACE 随 \(X\) 的值不同而变化，即 \(\text{SACE}(x) = E[Y^1 - Y^0 | D^0=0, D^1=0, X=x]\) 依赖于 \(x\)。

第二步：最小内核¶

最小特例：假设单调性成立（\(D^1 \le D^0\) 即处理不会导致死亡），则存在两个主层：永远存活者（\(D^0=0, D^1=0\)）和协伤者（\(D^0=1, D^1=1\)）。再假设 \(X\) 是二值协变量（如男/女）。我们想知道SACE是否被性别修饰。去掉所有其他假设，仅考虑这个最简设定。

在这个特例下，SACE的定义退化为：

\[\text{SACE} = E[Y^1 - Y^0 | D^0=0, D^1=0] = E[Y^1 - Y^0 | D^0=0] \quad (\text{因为单调性下 } D^1=0 \text{ 等价于 } D^0=0)。\]

现在考虑性别 \(X\)。根据本文推导，SACE可以被 \(X\) 修饰当且仅当： 1. \(X\) 与生存状态 \(D\) 相关（即 \(P(D=0|X=1) \neq P(D=0|X=0)\)）并且 \(X\) 与永远存活层中的处理效应相关；或者单纯是 2. \(X\) 仅影响生存（即不同性别生存概率不同）但通过改变永远存活层的组成来间接修饰SACE。

论文的核心数学想法是：将SACE写成加权平均：

\[\text{SACE} = \sum_x w_x \cdot \text{SACE}(x),\]

其中权重 \(w_x = \frac{P(X=x, D^0=0, D^1=0)}{P(D^0=0, D^1=0)}\)，即主层内的协变量分布。而普通平均处理效应（ATE）的权重是总体协变量分布 \(P(X=x)\)。这突出了差异：即使SACE(x)对每个x相同，如果永远存活层的构成随x变化，那么总体SACE也会因x的分布改变而改变——这正是可迁移性问题所在：如果目标群体的生存概率不同，则永远存活层的x分布会位移，导致SACE不可直接迁移。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在“截尾死亡”设定下，谁（哪种协变量）会修饰存活者平均因果效应（SACE），并给出了效应修饰的数学条件；进一步将SACE表示为这些协变量各层内因果效应的加权平均，且权重依赖于永远存活主层内的协变量分布。
核心工具/方法：潜在结果框架下的主分层理论，通过推导条件概率分解和加权平均公式，无需额外假设（如无交互性）即可刻画修饰角色。
主要结论：①既影响生存又影响结局的变量，以及仅影响生存的变量，都可能修饰SACE，但机制不同；②SACE加权平均的权重不仅取决于总体中协变量水平的频率，还取决于永远存活层内各水平的比例；③这一公式为SACE的可迁移性提供了理论基础——迁移时需要调整永远存活层的协变量分布。

关键设定与假设（在第二节基础上补全）¶

假设：本文假定标准主分层设定，包括潜在结果框架、联合分布存在、可忽略性（conditional exchangeability on pre-treatment covariates？未明确，从上下文判断是描述性推导而非识别）。作者明确使用了单调性假设（略弱于常见形式：仅假设 \(D^0 \ge D^1\) 或 \(D^0 \le D^1\) 的其中一个方向，文中以 \(D^1 \le D^0\) 为例）来简化主层数。但推导SACE加权平均时不需要单调性，因为它是对永远存活层直接定义的。
与已有文献对比：相比于VanderWeele（2011）关于总体效应修饰的研究，本文专门处理了因死亡截断导致的未定义结局，并明确区分了作用路径（通过生存 vs. 通过结局）。相比于迁移性文献（Lesko 2017），本文引入了主层权重，更精细地刻画了迁移时的偏倚来源。

主要结果（理论型，基于abstract和合理推断）¶

条件1（共同原因变量）：设 \(X\) 是既影响生存又影响结局的变量，则SACE被 \(X\) 修饰当且仅当永远存活层内 \(X\) 不同水平下的条件因果效应 \(\text{SACE}(x)\) 不全相等，或者永远存活层的构成在不同 \(X\) 水平上不均匀（导致加权平均时产生交互）。
条件2（仅影响生存的变量，如健康行为）：若 \(X\) 仅影响生存（但不直接影响结局），则即使 \(\text{SACE}(x)\) 对所有 \(x\) 相同，但由于 \(X\) 改变了永远存活层的组成，总体SACE也会随 \(X\) 分布的变化而改变，从而表现出修饰。更精确地说，如果永远存活层在 \(X=x\) 的比例与总体比例不同，那么当群体中 \(X\) 的分布变化时，SACE的权重会变化，产生“表面修饰”。
加权平均公式：
\[\text{SACE} = \sum_x \frac{P(X=x, D^0=0, D^1=0)}{\sum_k P(X=k, D^0=0, D^1=0)} \cdot \text{SACE}(x).\]
这一公式要求数据可以被识别（通常借助单调性和条件独立性），但其形式本身不依赖于识别假设。

直觉：即使处理效应在每个协变量层内是常数，如果不同协变量水平下的永远存活概率不同，那么总体SACE会随着协变量总体分布的改变而改变——类似于标准化中的“分布迁移”问题。

必要条件：SACE可迁移于两个不同群体（源群体 \(S\) 和目标群体 \(T\)）当且仅当永远存活层的协变量分布在两个群体中匹配（即 \(P_S(X|D^0=0,D^1=0) = P_T(X|D^0=0,D^1=0)\)），而不仅仅是总体协变量分布匹配。

证明路线与技术技巧（本文为理论推导型，不含复杂证明，路线如下）¶

整体路线： 1. 定义SACE和主层。 2. 写出加权平均的期望定义：

\[\text{SACE} = E[E[Y^1 - Y^0 | D^0=0, D^1=0, X]].\]

通过总期望定律直接得到。 3. 将条件期望分解为\(\text{SACE}(x)\)，权重为永远存活层内\(X=x\)的条件概率。 4. 讨论权重如何依赖于\(X\)与生存的关联：若\(X\)与生存无关，则永远存活层内\(X\)的分布等于总体中\(X\)的分布，权重退化。 5. 若\(X\)仅影响生存（且不影响结局），那么\(\text{SACE}(x)\)在所有\(x\)上相等（因为无直接路径），但权重变化仍会改变总体SACE——这就是“修饰”的定义柔性扩展。 6. 结论：效应修饰不仅来自真正的交互，也来自生存差异导致的组成变化。

关键技术技巧：使用总期望定律和主层指示函数的分解，没有任何高深工具；但将“修饰”概念扩展至包含主层组成效应，在流行病学方法论文中属于新颖表述。

真实例子与应用¶

本文为纯理论概念推导，未包含真实数据例子或模拟实验。作者在论文章节（根据摘要推测）可能使用了简化的虚构数值例子（仅作示意），但未提供真实应用。

🔎 结论是否比证明窄¶

文中声称“SACE可以被仅影响生存的变量修饰”，但严格从数学上看，这是通过改变永远存活层组成来间接产生效应修饰的表象。如果采用更严格的效应修饰定义（要求条件因果效应本身随协变量变化），则仅影响生存的变量不满足。作者在引言或讨论中可能会澄清此区分，但摘要中用了“modified by a variable that only affects survival”这一措辞，可能引发歧义。需要验证全文是否明确了“修饰”包括组成效应。

四、开放问题（点到为止）¶

非单调性下的扩展：本文的加权平均公式不依赖单调性，但当存在多个主层（如致害者和受保护者）时，永远存活层以外的处理效应如何定义？SACE是否仍是唯一可识别的效应？作者仅讨论了最简设定（单调性保证永远存活层），未见对不同主层类型的推广。需查阅原文第X节具体假设。
SACE识别的可迁移性条件：本文讨论了永远存活层分布匹配作为迁移的条件，但未给出当永远存活层分布不匹配时，SACE的部分识别区间如何迁移。可考虑结合工具变量或敏感性分析扩展。
统计推断与估计：加权平均公式中的权重 \(P(X=x, D^0=0, D^1=0)\) 需要估计主层成员概率，这通常是模型依赖的。如何用双稳健或机器学习方法估计，并量化权重不确定性？本文未涉及。
正式定义效应修饰的统一框架：作者使用的“修饰”概念包括了组成效应，这与经典统计交互作用（effect modification）的定义有差异。需要澄清：在流行病学中，是否应该将主层组成导致的SACE变化也视为效应修饰？这一定义可能影响后续敏感性分析的方向——值得仔细阅读原文对“modification”的界定。

Maintained by 陈星宇 · Homepage · Source on GitHub