Characterizing quantile-varying covariate effects under the accelerated failure time model¶

作者: Harrison T Reeder, Kyu Ha Lee, Sebastien Haneuse
来源: Biostatistics
主题: 因果推断
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本子方向解决的根本问题是：在生存分析中，如何恰当地建模协变量对生存时间分布的影响——不仅是平均或风险尺度上的效应，还要允许效应沿着整个生存时间分位数（quantile）变化，从而捕捉异质性。当前该子方向的成熟度处于“从常数效应向灵活效应过渡”的阶段：经典AFT和Cox PH模型假设效应在时间和分位数上恒定，已有多篇工作放松这一假设，但大多停留在风险比（HR）时变或AFT的基线灵活化，缺乏在分位数尺度上直接解释AFT乘性效应的框架。本文是首次系统地将AFT模型与分位数变化效应结合，并配套提出基于g-formula的边际效应估计方案。

发展脉络（history）¶

按Introduction引用先后整理：

奠基工作：AFT模型的标准形式（Kalbfleisch & Prentice, 2002等）假设每个协变量对生存时间施加一个常数乘法偏移，即对所有分位数 \(q\)，\(\log T = \beta' X + \sigma \varepsilon\)，效应不随分位数变化。Cox PH模型则假设风险比恒定（PH假设）。
主要进展（放宽AFT的常效应假设）：
Hsieh (2001) 引入“heteroskedastic AFT”，允许基线分布依赖协变量，从而部分允许分位数变化；但形式特殊，不直接给出分位数上的解释。
Crowther, Royston & Clements (2020) 提出用样条建模基线分布的灵活AFT，并拓展到时变加速因子；但仍在AFT的原始框架内（效应为常数乘性偏移），主要灵活基线形状而非分位数变化的效应。本文引用称其“provides substantial flexibility but still assumes constant multiplicative shift”。
Pang et al. (2021) 从Prentice-Kalbfleisch公式出发，用B样条同时建模基线风险、时变效应和非线性效应，但估计需专门频率派算法和bootstrap推断；本文称其“completely different formulation…requiring a specialized estimation algorithm and bootstrapping for inference”。
Lee, Rondeau & Haneuse (2017) 提出半竞争风险下的贝叶斯AFT框架，处理复杂删失，但效应仍为常数。
当前前沿：上述工作已允许基线灵活、效应时变，但分位数尺度上的乘性效应解释仍缺失。此外，因果推断中g-formula已被应用于生存分析（Keil et al., 2018），但尚未与AFT分位数效应结合。
本文的位置：本文是第一个在AFT框架下系统推导分位数变化乘性效应的论文，并结合g-formula标准化估计边际效应。它与Crowther等、Pang等的方法互补：前者解决效应不恒定的识别和解释，本文提供分位数尺度上可直接读取的解释。

子线索聚类¶

被引文献大致落在三条子线索：

线索A：AFT模型的灵活化与拓展（Crowther 2020, Pang 2021, Zhou & Hanson 2017/2018, Lee 2017）。这条线索的核心是赋予AFT基线或效应更多灵活性，但多数仍保持常数乘性效应假设（Crowther）或只关注风险/时变（Pang）。
线索B：分位数回归与分位数效应的因果推断（量化分位数上的暴露效应，如Chernozhukov & Hansen, 2005等）。本文直接连接此线索，但特征是在AFT框架下利用其乘性解释，而非线性分位数回归。
线索C：g-formula标准化与因果效应估计（Keil et al., 2018, Hernán & Robins, 2020）。本文从这条线索借用了标准化思想来估计边际效应。

这个方向在追问的核心问题与已知瓶颈¶

核心问题1：如何在不假设常效应下保留AFT的乘性可解释性？
瓶颈：AFT的经典定义（\(S(t|X)=S_0(t\exp(-\beta'X))\)）天然将效应编码为整个分布上的恒定偏移；放松后可能失去可解释性或需要复杂再参数化。
核心问题2：如何从条件效应得到有因果意义的边际效应（population-averaged）？
瓶颈：通常条件AFT模型给出的是协变量条件效应；直接解释为种群效应需要额外假设（如collapsibility, 即无未观测混杂时AFT系数具有人口平均一致性，但Hernán(2010)指出HR不具collapsibility，而AFT具有——本文引用了Crowther等关于AFT可塌缩性的论述）。
核心问题3：如何在复杂删失（左截断、区间删失、竞争风险）下实现上述目标？
瓶颈：贝叶斯框架易于处理复杂删失，但计算负担和先验敏感性需权衡。

⚠️ 作者的framing¶

作者把缺口frame成什么：作者在摘要和Introduction中暗示，现有AFT灵活化工作（Crowther, Pang）都“cannot detect or capture effects that differ across quantiles”，并且“an approach to characterize quantile-varying covariate effects under the AFT model has not been fully developed”。因此本文定位为“first general framework”填补此空白。作者还强调AFT的可塌缩性（collapsibility）使其比Cox更适合因果推断，并以此合理化g-formula标准化步骤。
哪些竞争路线被淡化或回避：
纯粹的分位数回归（quantile regression）方法已被大量用于生存分析（如Portnoy, Peng & Huang），它们天然允许分位数变化效应。作者只在引言中笼统提了一句“quantile regression is an alternative”, 但未深入比较，也未解释为何选择在AFT下做而不是直接QR。这可能是其方法的主要竞争路线。
非参数/半参数乘法加速模型（如Ding & Feller, 2019等）也未讨论。
什么明显该被引/该存在、却没出现在intro里？：
分位数回归的因果推断文献（如Chernozhukov & Hansen, 2005的IV分位数，Imbens & Newey, 2009等）未被提及，这些工作与本文的分位数边际效应有直接联系。
“Quantile Treatment Effects”文献（Bitler, Gelbach, Hoynes, 2006等）也未出现。
本文使用贝叶斯g-formula，但近期也有频率派double-robust g-formula（如Vansteelandt & Daniel, 2014等）——这些未讨论。值得研究者去查这些遗漏是否是刻意选择。

张力¶

未见明显的被引文献间矛盾。所有工作基本互补或沿不同方向拓展。

二、最核心、最简单的例子 / 数学问题（先把符号/模型/可观测数据交代清楚）¶

第一步：符号、模型、可观测数据¶

设 \(T\) 为生存时间（随机变量），\(X\) 为 \(p\) 维协变量向量（可能有处理变量 \(A\) 和混杂变量 \(C\)）。经典AFT模型假设：

\[\log T = \boldsymbol{\beta}' \tilde{X} + \sigma \varepsilon\]

其中 \(\tilde{X} = (1, X')'\), 误差项 \(\varepsilon\) 分布独立于 \(X\)，通常假设为极值分布（Weibull）或正态分布（log-Normal）。此时，协变量效应为常数：对任意分位数 \(q\)，\(T\) 的第 \(q\) 分位数 \(Q_T(q|X)\) 满足

\[Q_T(q|X) = \exp(\boldsymbol{\beta}' \tilde{X}) Q_{\varepsilon}(q)^\sigma\]

其中 \(Q_{\varepsilon}(q)\) 是 \(\varepsilon\) 的第 \(q\) 分位数。因此 \(\exp(\beta_j)\) 是乘性常数因子，不随 \(q\) 变化。

可观测数据：研究者能观测到 \((Y_i, \delta_i, X_i)\)，其中 \(Y_i\) 是观测到的时间（可能是右删失、区间删失、左截断后的时间），\(\delta_i\) 是指示删失类型的变量（确切死亡/右删失/左截断等）。左截断意味着个体在进入研究前已存活一定时间（延迟进入）；复杂删失指多种删失类型同时存在。

潜在/不可观测量：真实的完整生存时间 \(T_i\)（当 \(T_i\) 被删失时不可观测）。AFT模型建模的是 \(T_i\) 与 \(X_i\) 的关系。此外，在因果推断中，还有潜在结果 \(T(a)\)，即暴露 \(A=a\) 时的生存时间（不可同时观测多个反事实）。本文使用g-formula标准化估计边际效应时，需要假想一个全人群的干预分布。

第二步：最小内核——一个特例：二元暴露、无混杂、无删失、Weibull基线¶

考虑最简单情形：

一个二元暴露 \(A \in \{0,1\}\)，无其他协变量（无混杂）。
Weibull基线（即 \(\varepsilon\) 为极值分布，AFT模型等价于加速因子模型）。此时AFT模型为：
\[\log T = \beta_0 + \beta_1 A + \sigma \varepsilon,\quad \varepsilon \sim \text{extreme value}.\]
这意味着 \(T\) 的条件分布是Weibull，形状参数 \(\gamma = 1/\sigma\)，尺度参数 \(\lambda = \exp(\beta_0 + \beta_1 A)\)。经典推论：\(T\) 的第 \(q\) 分位数 \(Q_T(q|A) = \exp(\beta_0 + \beta_1 A) (-\log(1-q))^\sigma\)。因此，暴露效应 \(\exp(\beta_1)\) 对所有分位数相同。
本文想允许效应随分位数变化。最简单的推广是：让 \(\beta_1\) 依赖于分位数 \(q\)，即
\[\log T = \beta_0 + \beta_1(q) A + \sigma(q) \varepsilon\]
但模型如何参数化？本文的做法是：在原始AFT公式中，不直接把 \(\beta\) 写成 \(q\) 的函数，而是通过定义条件分位数函数 \(Q_T(q|X)\) 的显式表达式来间接实现。关键推导：

回忆AFT的原始形式：\(S(t|X) = S_0(t/\exp(\beta'X))\)。对分位数 \(q\)，有

\[q = P(T \leq Q_T(q|X) | X) = 1 - S_0(Q_T(q|X)/\exp(\beta'X))\]

因此 \(Q_T(q|X) = \exp(\beta'X) \cdot S_0^{-1}(1-q)\)。这里 \(S_0^{-1}(1-q)\) 是基线生存函数的反函数在第 \(q\) 分位数的值，记为 \(g_0(q)\)。所以

\[\boxed{Q_T(q|X) = \exp(\beta'X) \cdot g_0(q)}.\]

这个表达式意味着，给定 \(X\)，\(T\) 的分位数是 \(\beta\) 乘性效应乘以一个仅依赖于 \(q\) 的基线函数 \(g_0(q)\)。注意 \(\beta\) 不依赖于 \(q\)，所以这里的效应还是常数。现在本文的关键创新：允许基线函数\(g_0(q)\)依赖协变量，即不同 \(X\) 其基线分位数曲线形状不同，从而乘性效应 \(\exp(\beta'X)\) 实际上被“调制”为分位数变化的效应。更具体地，设 \(g_0(q|\xi_X)\) 是一个参数化或非参数化的基线分位函数，其参数 \(\xi_X\) 可以依赖于 \(X\)（例如，通过线性预测子 \(\alpha'X\) 来控制形状）。这样，条件分位数变为：

\[Q_T(q|X) = \exp(\beta'X) \cdot g_0(q|\xi_X).\]

此时，协变量 \(X\) 通过两条路径影响分位数：（1）直接通过乘性因子 \(\exp(\beta'X)\)（常数）；(2) 通过调制基线形状（改变 \(g_0\) 随 \(q\) 的曲线）。因此，整体效应随分位数变化——即使 \(\beta\) 本身不依赖于 \(q\)，因为不同的 \(X\) 会导致不同的基线分位函数。

这是本文最核心的数学想法：将AFT模型中的基线分布参数化，使其依赖协变量，从而在分位数尺度上获得异质性效应。这个想法可以追溯到Hsieh (2001)“heteroskedastic AFT”，但本文将其推广到更一般的参数化（用Bernstein多项式），并衍生了可解释的分位数效应。

最小内核的推导：在没有删失、只有 \(A\) 二元的情况下，我们只需估计两个基线分位函数 \(g_0(q|A=0)\) 和 \(g_0(q|A=1)\)。如果使用一个简单参数化如 \(\log g_0(q|A) = \gamma_0 + \gamma_1 A + h(q)\)（其中 \(h\) 是固定的全局形状函数），则乘性效应变为 \(\exp(\beta_1 A + \gamma_1 A) = \exp((\beta_1+\gamma_1)A)\)，依然常数。因此，关键是要让形状函数也依赖于 \(A\)。例如，令 \(\log g_0(q|A) = \alpha_0(q) + \alpha_1(q) A\)，且 \(\alpha_0,\alpha_1\) 是非参数函数。这等价于允许分位数系数随 \(q\) 变化——这正是分位数回归的设定。但本文在AFT框架下通过 \(g_0\) 的灵活参数化实现，并使用伯恩斯坦多项式先验表示 \(g_0\)。
一句话：本文的最小内核是：对一个AFT模型，允许基线生存函数 \(S_0\)（或其分位函数）的参数依赖协变量，并将这种依赖建模为线性预测子在Bernstein多项式基上的映射，从而得到乘性因子 \(\exp(\beta'X)\) 与基线形状相互作用所产生的分位数变化效应。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在加速失效时间（AFT）模型框架下，如何刻画和估计协变量效应随生存时间分位数变化的模式，包括条件效应和边际（population-averaged）效应。
核心工具/方法：将灵活回归结构（通过“transformed Bernstein polynomial”先验）嵌入AFT模型的基线生存函数，使得基线分布参数依赖协变量；由此推导出分位数尺度上的显式效应公式；采用基于g-formula的回归标准化方案估计边际效应；使用贝叶斯MCMC（Stan）完成估计和不确定性量化，支持左截断和复杂删失。
主要结论：所提框架能够捕捉并可视化协变量效应沿分位数的变化；模拟表明方法在估计条件效应和边际效应上表现良好（覆盖率接近名义水平，偏差小）；在阿尔茨海默病实例中，发现某些风险因素（如APOE ε4基因）对生存时间的效应在高分位数（长生存）上减弱，而教育水平在低分位数上保护效应更强。

关键设定与假设¶

在第二节最小记号基础上补全完整设定：

模型： \(\log T = \boldsymbol{\beta}' \tilde{X} + \sigma \varepsilon\)，但基线生存函数 \(S_0(t)\) 不再是固定的；本文使用 \(S_0(t | \boldsymbol{\xi}, \phi)\)，其中 \(\boldsymbol{\xi}\) 是依赖协变量的参数向量。具体实现是通过一个“transformed Bernstein polynomial”（TBP）先验：先指定一个参数化中心分布（如Weibull）的生存函数 \(S_0^*(t|\phi)\)，然后对其分位数进行多项式变换：\(S_0(t| \boldsymbol{\xi}, \phi) = \mathcal{BP}_{K, \boldsymbol{w}}(S_0^*(t|\phi))\)，其中 \(\mathcal{BP}_{K, \boldsymbol{w}}\) 是一个基于权重的Bernstein多项式变换（Zhou & Hanson, 2018）。参数 \(\boldsymbol{w}\)（权重向量）通过一个“regression structure”与协变量连接：\(\logit(\boldsymbol{w}) = \boldsymbol{\Gamma} X\)，从而基线形状随 \(X\) 变化。此外，\(\boldsymbol{\beta}\) 仍然表示常数乘法效应（加速因子）。
关键假设：
条件独立（conditional independence）假设用于g-formula：给定混杂 \(C\)，暴露 \(A\) 与潜在结果独立（无未观测混杂）。这在贝叶斯框架下被隐含采用。
AFT模型的形式假设（\(\log T = \beta'A + \ldots + \sigma\varepsilon\)）仍然成立，只是基线分布可以依赖协变量。
删失机制：假设删失时间独立于生存时间给定协变量（条件独立删失，用于似然）。
左截断（延迟进入）被假设为非信息性的，通过条件似然处理。
对于g-formula标准化，需要假设positivity（所有暴露水平在每一层协变量中有正概率）。
相比已有文献：放宽或强化了哪些？
相比标准AFT：放宽了基线分布不完全依赖协变量的假设（允许形状变化）。
相比Crowther等：强化了效应解释集中在分位数尺度而非风险尺度。
相比Pang等：提供了贝叶斯推断框架，直接处理复杂删失和g-formula。

主要结果¶

定理/命题（本文理论贡献虽不突出，但有一关键公式）：

定理1 (条件分位数公式)：在提出的TBP-AFT模型下，对于给定的协变量向量 \(X\) 和分位数 \(q\)，条件分位数 \(Q_T(q|X)\) 可写为：
\[\log Q_T(q|X) = \boldsymbol{\beta}' X + \log\left[ S_0^{*-1}(1-q | \phi) \cdot \frac{ \sum_{k=1}^K \omega_k(X) B_k(q) }{\sum_{k=1}^K \omega_k^*(X) B_k(q)} \right]\]
其中 \(B_k(q)\) 是Bernstein基函数，\(\omega_k(X)\) 是通过回归结构得到的权重，\(\omega_k^*(X)\) 是中心分布对应的权重。直观上，\(e^{\beta_j}\) 是加速因子，而基线形状 \(\log g_0(q|X)\) 中的第二项描述了分位数变化的模式。
直觉：这个公式表明，虽然 \(\beta\) 对所有分位数施加了常数乘法效应，但整体对数分位数曲线会随 \(q\) 弯曲，因为基线形状项包含 \(q\) 依赖的权重和基函数。因此，不同 \(X\) 对应不同弯曲形状，产生分位数变化的总效应。
必要条件：TBP先验需能充分灵活地逼近真实基线；Bernstein多项式的度数 \(K\) 足够大（论文讨论如何选择）。
解决的技术难点：如何将协变量依赖整合到TBP先验的权重中，并得到封闭形式的分位数表达式。关键是对贝叶斯模型的MCMC采样，Stan自动处理。
边际效应估计 (g-formula标准化)：论文定义暴露 \(A\) 的边际效应比较（如分位数差异对比）：
\[\Delta_q = \mathbb{E}[Q_T(q|A=1, C)] - \mathbb{E}[Q_T(q|A=0, C)]\]
其中期望就观察到的协变量分布积分（g-formula）。在贝叶斯框架下，这通过后验预测采样实现：对每个MCMC迭代，对每个分位数 \(q\)，预测每个观测个体的 \(T\) 在暴露设为1和0下的分位数，再平均个体上的差值得到 \(\Delta_q\) 的后验分布。该过程无需额外假设。

证明路线与技术技巧¶

本文不是纯理论导向，定理主要是公式推导而非渐近分析。技术路线：

整体路线：
步骤1：建立TBP-AFT模型：指定基线生存函数 \(S_0\) 为TBP（中心分布+Bernstein多项式变换）。将权重 \(\boldsymbol{w}\) 通过多项逻辑斯蒂回归 (multinomial logistic) 与协变量 \(X\) 连接：\(\boldsymbol{w}(X) = \text{softmax}(\boldsymbol{\Gamma} X)\)，其中 \(\boldsymbol{\Gamma}\) 是 \(K \times p\) 系数矩阵（\(K\) 为基函数个数）。AFT加速参数 \(\boldsymbol{\beta}\) 保持为回归系数。
步骤2：写出似然：对于观测 \((y_i, \delta_i, X_i)\)，删失类型包括精确、右删失、区间删失、左截断。似然基于生存函数和密度函数，后者可从TBP计算。左截断处理: 似然中每个个体的贡献是 \(f(y_i|X_i)^{I(\text{exact})} S(y_i|X_i)^{I(\text{censored})}\)，除以“进入时间前的生存概率”\(S(l_i|X_i)\) 进行条件化。Stan可直接实现。
步骤3：推导条件分位数公式（如上定理1）。通过TBP的定义，生存函数反函数的解析表达式可得。
步骤4：g-formula标准化：对后验样本，对每个 \(q\) 计算 \(\Delta_q\) 的后验均值和可信区间。同时还计算协变量条件效应（给定 \(C\) 下的分位数差异）。
步骤5：模型评估：使用LOO-CV (PSIS-LOO)比较不同灵活度的模型（如是否允许基线依赖协变量）。
关键跳跃点：
TBP先验的回归嵌入：将多项式逻辑斯蒂回归直接嵌入TBP权重的先验，这是之前Zhou & Hanson (2018)未做的。难点在于：先验为权重而生，但逻辑斯蒂回归的系数 \(\boldsymbol{\Gamma}\) 难以解释。论文绕过了这一点：\(\boldsymbol{\Gamma}\) 本身不是主要关注，而是通过分位数效应呈现。
分位数公式的推导：需用到TBP变换前后生存函数的反函数关系，论文展示了清晰的代数推导。
技术技巧点名：
Transformed Bernstein Polynomial (TBP) prior：Zhou & Hanson (2018) 提出，用于基线生存函数的非参数建模，具有平滑性且支持任意删失。本文将其扩展为允许协变量依赖。
Polytomous logistic regression on weights：将协变量效应引入TBP权重。
g-formula standardization：因果推断方法，用于从条件模型得到边际因果效应。
PSIS-LOO for model comparison：Vehtari et al. (2017)的高效贝叶斯模型选择工具。
Stan No-U-Turn Sampler (NUTS)：用于高效后验采样，自动计算梯度。

真实例子与应用¶

数据：Religious Orders Study and Rush Memory and Aging Project (ROS/MAP) 前瞻性队列，2000多名老年人，追踪认知衰退和死亡。结局是“从认知正常到阿尔茨海默病（AD）诊断的时间”和“从AD到死亡的时间”。暴露变量包括：APOE ε4基因型（携带与否）、教育年限、性别、年龄等。数据包含左截断（个体进入研究时已存活一定时间）和区间删失（认知评估间隔定期，但AD诊断可能在两次评估之间）。
如何应用：作者拟合了四个模型：分别是标准AFT（Weibull基线）、AFT + TBP（基线灵活但不依赖协变量）、AFT + TBP + covariate-dependent baseline（本文核心模型），以及一个包含交互项的简化AFT。模型比较使用LOO-CV。结果选用了一个模型：在允许基线依赖协变量的同时，保留加速参数 \(\beta\) 的常数乘法效应，但发现基线形状因暴露而不同。
得到的结果：
APOE ε4携带者：标准AFT给出 \(\beta \approx 0.3\)，表示中位生存缩短约26%。但允许基线依赖后，发现APOE ε4的影响在低分位数（快速进展）时效应大（缩短生存），而在高分位数（慢速进展）时效应减弱，甚至无显著差异。这通过画出分位数对照 \(Q_T(q|A=1,C)-Q_T(q|A=0,C)\) 的曲线展示，曲线从低分位数的负值上升到高分位数的接近0。
教育年限：对认知健康到AD的时间，发现低分位数下保护效应更强（延缓发病），高分位数下效应趋平。
边际效应（g-formula标准化）与条件效应趋势一致，但标准误差更大（由于对协变量分布积分引入了额外不确定性）。
例子想说明什么：证明了所提框架能发现标准AFT模型忽略的效应异质性，并且这些异质性具有临床意义（例如APOE ε4主要加速早期进展，而非晚期）。同时展示了贝叶斯g-formula提供可解释的边际因果效应。

🔎 结论是否比证明窄¶

是。论文中声称“characterize quantile-varying covariate effects under the AFT model”主要依赖于展示条件分位数曲线；但理论上，它只证明了在TBP参数化下，效应确实可以随分位数变化——没有证明这种参数化是“最优”的或能逼近任意分位数变化模式（虽然TBP有全支撑理论上可以一致近似任意生存函数）。此外，边际效应的估计依赖g-formula的无混杂假设和正确模型规格，论文并未证明所得边际估计的double robustness或渐近有效性（这是留给未来工作的limitation）。论文自己也说“we do not prove asymptotic properties of the Bayesian g-formula estimator under this model”。

四、开放问题¶

g-formula估计量的渐近性质：本文仅为贝叶斯实现，未推导条件效应和边际效应的频率派性质（一致性、渐近正态性、半参效率界）。论文在Discussion中明确指出“Asymptotic properties of the proposed approach are not considered here”。这直接可做：利用研究者“very_familiar”的causal estimation理论，可以推导TBP-AFT模型下g-formula estimator的double robustness或建立双重稳健的估计方程。扎根于原始论文第5节“Discussion”第二段。
高维协变量下的适应性：本文使用的是低维协变量（p<10）。当协变量维度高时，Bernstein多项式的回归权重矩阵维度暴增，MCMC采样不可行。需要正则化或变量选择。扎根于论文第5节“Further work”提及“high-dimensional settings”。
模型识别与竞争解释：分位数变化的效应可能既来自AFT加速参数的常数部分，也来自基线形状的异质性。如何区分两者？本文未提供用于检验“常数加速 vs 基线变化”的正式假设检验。扎根于论文关于模型比较的LOO部分，但未给出统计显著性准则。
与分位数回归的直接比较：论文未与标准分位数回归（Portnoy, Peng & Huang）在同等设定下比较。分位数回归也允许分位数变化的效应且无需AFT假设。这种比较可揭示AFT框架的增益（如可塌缩性、乘性解释）与代价（AFT的分布假设）。值得研究者去查近5篇分位数回归在生存因果推断的文章，确认这个gap是否被广泛讨论。

Maintained by 陈星宇 · Homepage · Source on GitHub