Individual dynamic prediction for cure and survival based on longitudinal biomarkers¶

作者: Can Xie, Xuelin Huang, Ruosha Li, Alexander Tsodikov, Kapil Bhalla
来源: Annals of Applied Statistics
主题: 流行病学
相关性: 4/10
机构绿灯: University of Michigan（US News 前 50，免分进入精读）
链接: https://doi.org/10.1214/24-aoas1906

一、领域脉络与小综述（从 introduction + 参考文献 + 已检索摘要构建）¶

这个方向是什么：本子方向的核心是基于纵向生物标志物轨迹进行个体化的动态预后预测，尤其关注“治愈”和“长期生存”两个终点。它处于流行病学 / 临床预后模型与生存分析中治愈模型（cure model） 的交汇处。成熟度方面，联合纵向-生存模型（joint model）已是标准化工具，但在 “治愈”是一个潜在/不可观测状态且危险函数可以不满足比例风险的情形下，动态预测的理论与实用工具仍在发展中。本文即针对这一 gap 提出一种灵活的建模框架。
发展脉络（history）：
奠基工作：标准治愈模型与联合模型。早期工作如 Farewell (1982) 提出了标准的混合治愈模型（mixture cure model），将生存人群分为“最终未治愈”和“最终治愈”两类，但该模型是静态的，不依赖时间变化的协变量。随后 Faucett & Thomas (1996) 和 Wulfsohn & Tsiatis (1997) 提出了联合纵向-生存模型（joint model），将纵向测量过程（如肿瘤标记物）与事件时间（如死亡/复发）通过共享随机效应连接起来。这些工作为本文提供了基础框架，但它们的治愈设定通常是延迟治愈（cure-by-cure）或比例风险依赖。
主要进展：灵活的与动态的治愈模型。Tsodikov (1998, 2002) 引入了一种灵活的治愈模型族，允许非比例风险结构（如交叉风险函数）。Yu & Peng (2008) 提出了纵向数据与治愈模型的联合建模。Xie et al. (2016, 2017) 进一步发展了里程碑治愈模型（landmark cure model），能在任一时间点基于历史数据更新治愈预测。本文作者（Xie Huang Li Tsodikov Bhalla）中的 Tsodikov 和 Li 正是前述灵活治愈模型工作的重要贡献者。当前的 frontier 是：在非比例风险和动态更新的双重要求下，给出一个可计算、可解释的个体预测框架，并实证其在真实临床数据上的预测表现。
本文的位置：本文直接继承并扩展了 Tsodikov 等人的灵活危险函数框架，并与里程碑方法结合，推导出任意时刻、基于当前生物标志物历史的个体动态治愈概率和生存概率的封闭形式预测公式。它不是一个因果推断方法，而是纯预测模型，但其半参数危险设定与动态预测结构对流行病学个体化风险建模有直接参考价值。
⚠️ 作者的 framing（必须明确标注成"这是作者的说法"）：
- 作者的缺口 frame：作者将缺口定位为“现有治愈模型不能在任意时刻动态更新预测，且不能处理非比例风险（如交叉风险）”。他们声称本文通过“灵活的危险函数 + 里程碑治愈模型 + 联合纵向-生存框架”的三位一体解决方案填补了这一缺口。
- 淡化/回避的竞争路线：作者明显回避了机器学习集成预测方法（如随机生存森林、XGBoost 后接校准、深度学习生存模型如 DeepSurv）。这些方法在预测性能上可能优于半参数联合模型，尤其在超高维生物标志物（如组学） 场景。作者的论述隐含地假设“模型的可解释性（公式推导、个体预测的封闭形式）是首要需求”，这在社会/医学应用视角下合理，但在纯预测竞赛视角下并不必然成立。作者未在引言中讨论这些竞争方法。
- 什么明显该被引/该存在、却没出现在 intro 里？：一篇关键文献是 Rizopoulos (2010, “Dynamic predictions and prospective accuracy in joint models for longitudinal and time-to-event data”, Biometrics)。该文已系统性地研究了动态预测框架（以及时间依赖的 AUC 和 Brier score），但 Rizopoulos 的方法集中在比例风险模型。本文的贡献在于允许非比例风险，但 Rizopoulos 的框架（尤其是动态预测的 landmark 理论基础）是本文的必要先驱。此外，Crowther & Lambert (2014, “A general framework for flexible parametric survival analysis…”) 提出了灵活的 Royston-Parmar 样条生存模型，也是比例风险之外的重要路线，但未被引用。作者的引用谱系明显偏重于混合治愈模型与传统联合模型流派，有选择性地突出 Tsodikov 与 Li 本人的工作，可能弱化了其他计算/统计领域的通用预测框架。
- 张力：未见明显对立引用。
子线索聚类：
联合纵向-生存模型的动态预测流：核心是构建共享随机效应模型，并推导 landmark 预测公式（Rizopoulos 2010; Proust-Lima et al. 2014）。本文在此流中加入治愈状态。
灵活危险函数与治愈模型流：使用非参数或半参数方法（如样条、分段常数、Gamma 过程、M 样条）刻画危险函数的灵活形状（Tsodikov 2002; Yu & Peng 2008; Xie et al. 2016）。本文的关键技术贡献在此。
混合治愈模型流：从静态混合物模型（Farewell 1982）到动态混合物模型（本文）。此流关注“治愈”是否是潜在类别以及如何识别。
这个方向在追问的核心问题（2-4 个）：
如何基于时间变化的纵向轨迹，实时预测一个患者是否最终被治愈？ ——这需要模型区分“治愈”与“长期生存/未治愈”两个潜在状态。
如何在不假设比例风险的前提下，灵活刻画治愈与未治愈组的危险函数？ ——即非比例风险环境下的联合建模与预测。
对于个体预测，哪种模型在时间依赖的 AUC 和 Brier score 上表现最优？ ——这是实证核心，也是临床实用性的度量。

二、最核心、最简单的例子 / 数学问题（先把符号 / 模型 / 可观测数据交代清楚）¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
\( i = 1, \dots, n \)：病人编号。
\( t \)：日历时间（从诊断/入组开始）。
\( Y_i(t) \)：在时间 \( t \) 观测到的纵向生物标志物（如 BCR-ABL 转录本水平的对数）。是观测到的随机过程，通常有测量误差。
\( T_i \)：真实生存/事件时间（如死亡、进展）。是潜在变量，但实际观测到的是 \( \tilde{T}_i = \min(T_i, C_i) \) 和事件指示符 \( \delta_i = I(T_i \le C_i) \)，其中 \( C_i \) 是删失时间。
\( D_i \)：潜在治愈状态。\( D_i = 1 \) 表示患者最终被治愈（即生存时间≥某个临床愈合点，或风险函数在远期趋于0）， \( D_i=0 \) 表示最终未被治愈。这是不可观测的潜在变量。
\( \pi_i(t) = P(D_i = 1 \mid \mathcal{H}_i(t)) \)：给定到时间 \( t \) 的历史观测 \( \mathcal{H}_i(t) \)（包括纵向轨迹 \( \{Y_i(s), 0 \le s \le t\} \) 和生存状态）下，患者 i 在时间 t 被预测为最终会治愈的概率。这是动态预测的核心输出。
\( S_i(t \mid \mathcal{H}_i(t)) = P(T_i > t \mid \mathcal{H}_i(t)) \)：动态生存概率。
随机效应 \( b_i \)：用来连接纵向和生存过程的共享个体特徵向量（如随机斜率、随机截距）。典型的联合模型假设：\( Y_i(t) = m_i(t) + \epsilon_i(t) \)，其中 \( m_i(t) = X_i(t)^T\beta + Z_i(t)^T b_i \)（线性混合模型），\( \epsilon_i(t) \sim N(0, \sigma^2) \)。
模型：
纵向子模型（线性混合模型）：\( Y_i(t) = m_i(t) + \epsilon_i(t) \)，其中 \( m_i(t) \) 是真实轨迹，\( \epsilon_i(t) \) 是测量误差。
生存子模型（灵活危险函数）：对于潜在治愈状态 \( D_i \)，假设：
- 对于未治愈组 (\( D_i=0 \))：危险函数 \( h_i(t \mid D_i=0, b_i) \) 是非参数/半参数的（如用 M 样条或罗杰-帕默样条建模），允许交叉/非比例风险。
- 对于治愈组 (\( D_i=1 \))：危险函数 \( h_i(t \mid D_i=1, b_i) \) 一般假设为 0（即患者达到治愈状态后不再有事件风险），或者是一个衰减到 0 的函数（取决于治愈定义）。
治愈子模型：\( P(D_i=1 \mid b_i) \) 通过一个 logit/Probit 链接函数与随机效应 \( b_i \) 和/或基线协变量 \( X_i \) 关联。典型形式：\( \text{logit}[P(D_i=1 \mid b_i)] = \gamma_0 + \gamma_1^T b_i + \alpha^T X_i \)。
可观测数据：第 i 个患者的观测为：
\( \{Y_i(t_{ij}), j=1, \dots, n_i\} \)：在 \( n_i \) 个时间点测量的纵向生物标志物。
\( \tilde{T}_i, \delta_i \)：删失生存数据，以及事件时间（若发生）或删失时间。
基线协变量 \( X_i \)（如治疗组、年龄、性别等）。
不可观测的：潜在治愈状态 \( D_i \)、共享随机效应 \( b_i \)（但在联合模型中被视为模型参数/潜变量进行推断）。

第二步：讲最小内核¶

本文的最小内核是：在一个联合纵向-生存框架中，用一个不可观测的潜在变量 \( D_i \)（治愈状态）来衔接纵向轨迹（例如，癌细胞标记物的下降）和长期生存风险，从而允许危险函数在“未治愈组”中是非比例的（例如，治疗初期风险高、而后下降）。

最简特例：
假设只有一个二值的纵向标记物 \( Y_i(t) \in \{0, 1\} \)，其中 \( Y_i(t)=1 \) 表示在时间 t 检测到“生物标志物阳性”。（实际中，可能是 BCR-ABL 转录本水平低于某个阈值。）
假设只有两个观测时间点：基线（t=0）和随访点（t=1）。
观测数据：
- \( Y_i(0) \in \{0,1\} \)
- \( Y_i(1) \in \{0,1\} \)
- 生存结果：\( \tilde{T}_i \in \{ \text{event\_time}, \text{censored} \} \)，若事件发生，还知道事件时间（假设在 \( t>1 \) 之后）。删失率可控。
模型设定：
- 治愈状态 \( D_i \in \{0,1\} \)：假设 \( D_i = 1 \) 当且仅当患者最终“无事件风险”（即远期危险函数恒为 0）。
- 治愈模型：假设简单的对数几率模型：\( \text{logit}[P(D_i=1)] = \beta_0 + \beta_1 Y_i(0) + \beta_2 Y_i(1) \)。
- 未治愈组的危险函数：假设对未治愈者，危险函数为 分段常数：从 \( t=0 \) 到某个切点 \( t_0 \) 为 \( \lambda_0 \)，之后为 \( \lambda_1 \)。允许 \( \lambda_0 \) 和 \( \lambda_1 \) 不同（非比例风险，例如治疗初始危险高，后下降）。
- 治愈组的危险函数：假设为 0。
最小内核：动态治愈预测 的核心是在 t=1 时刻（第二次访视后），基于历史 Y_i(0), Y_i(1) 和患者至今未出事的生存状态，预测患者 i 的未来治愈概率：
\[\hat{\pi}_i(1) = P(D_i=1 \mid Y_i(0), Y_i(1), \tilde{T}_i > 1)\]
这个概率通过贝叶斯公式计算：
\[P(D_i=1 \mid \text{history}) = \frac{P(D_i=1) \cdot P(\tilde{T}_i > 1 \mid D_i=1, \mathbf{Y}(1))}{P(D_i=1) \cdot P(\tilde{T}_i > 1 \mid D_i=1, \mathbf{Y}(1)) + P(D_i=0) \cdot P(\tilde{T}_i > 1 \mid D_i=0, \mathbf{Y}(1))}\]
其中
- \( P(\tilde{T}_i > 1 \mid D_i=1, \mathbf{Y}(1)) = 1 \)（治愈后无风险）
- \( P(\tilde{T}_i > 1 \mid D_i=0, \mathbf{Y}(1)) = S(1 \mid D_i=0) \) 由未治愈组的危险函数给出（例如，\( e^{-\lambda_0 \cdot 1} \)）。这个例子直观显示了：治愈预测的核心是贝叶斯更新，关键在于 \( P(\tilde{T}_i > 1 \mid D_i=0) \) 的计算。危险函数的灵活性（如上例的分段常数）就体现在此。
这个最小内核展示了论文的核心技术思路：通过一个灵活的（非比例）危险函数来刻画未治愈组的生存，然后利用贝叶斯定理在任意 landmark 时刻进行动态更新，从而得到随时间演化的治愈概率和生存概率。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话： ① 提出了一种联合纵向-生存模型 + 里程碑治愈模型的框架，用于基于纵向生物标志物历史进行个体化动态预测（动态治愈概率和生存概率）。 ② 核心工具为灵活的危险函数（以比例风险为特例，同时允许交叉风险等非比例模式），通过用 B 样条 (B-spline) 或 M 样条 (M-spline) 近似危险函数的对数，实现半参数建模，从而避免对危险函数形式的强假设。 ③ 主要结论：在慢性髓性白血病 (CML) 真实数据上，所提模型在时间依赖的 AUC、Brier score 和积分 Brier score 上优于标准的（即比例风险假设的）治愈模型。
关键设定与假设：
纵向子模型：采用线性混合效应模型（LMM）拟合纵向 BCR-ABL 转录本水平的对数轨迹。假设测量误差独立同分布高斯噪声。此设定与大量联合模型文献一致。
生存子模型：使用灵活的危险函数。具体地，对每组（治愈组与未治愈组），基线危险函数 \( h_0(t) \) 用 B 样条或 M 样条基函数展开，系数非负（对于危险函数）。未治愈组的危险函数因此是样条系数的线性组合（取指数）。比例风险模型是此灵活模型的特例（只需允许一个基函数对应常数项）。
治愈模型：假设治愈状态 \( D_i \) 是一个潜在二元变量，且其概率与随机效应和基线协变量通过一个 logit 链接函数关联。这里隐含了可忽略治愈机制的可识别性假设（即给定随机效应，治愈状态与生存时间条件独立；否则无法识别）。这是几乎所有混合治愈模型的共性假设。
里程碑模型：在给定的 landmark 时间点 \( s \)（如诊断后 6 个月、12 个月），模型基于截至时间 s 的纵向历史和患者 s 时刻的生存状态，独立地在每组（治愈/未治愈组）上建立 landmark 模型（在 s 时刻条件于纵向历史）。这本质上是对联合模型的一个“条件分解”，避免了重复估计完整的联合模型。
相比已有文献的放宽/强化：相比标准 Joint Model（Rizopoulos 2010），本文放宽了比例风险假设；相比 Fermi 和 Farewell 的静态混合物，本文允许动态更新。但本文强化了对一个特定的潜在因子（治愈）的假设，并依赖其可识别性，这比某些直接使用机器学习方法更结构化。
主要结果：
理论结果：本文主要是一个方法开发与实证应用论文，没有新的渐近定理（无闭式界限或收敛速度证明）。主要理论贡献是推导了里程碑点 s 的个体动态治愈概率和生存概率的公式：
- 动态治愈概率 \( \hat{\pi}_i(s) = P(D_i=1 \mid \mathcal{H}_i(s), T_i > s) \) 可通过联合模型中各部分（随机效应后验、治愈模型 logistic 链接、未治愈组危险函数）的乘积形式计算。
- 动态生存概率 \( S_i(u \mid \mathcal{H}_i(s), T_i > s) \) 进一步表示为 \( \hat{\pi}_i(s) \cdot 1 + (1 - \hat{\pi}_i(s)) \cdot S_{NC}(u-s \mid D_i=0) \)，其中 \( S_{NC} \) 是未治愈组的条件生存函数（基于灵活危险函数）。
- 实现：这些概率通过标准的 EM 算法或 MCMC（贝叶斯）进行模型拟合，然后重叠到 landmark 时刻进行预测。推导是解析的，但计算需要数值积分或模拟（如用 Gauss-Hermite 对随机效应求积分）。
实证结果（模拟研究）：
- 模拟设计：生成数据时，未治愈组的危险函数是非比例的（例如，危险先迅速上升、后下降，呈“驼峰”形状），比例风险模型假设的治愈模型（标准模型）被设置为对照。
- 核心结果：对时间依赖的 AUC（AUC(t) 从 0.2 到 0.6）、Brier 得分（与 AUC 互补）、以及积分 Brier 得分（IBS），作者的灵活模型始终优于标准比例风险模型。改进幅度在 AUC 约高 0.02-0.05，Brier 得分低约 0.02（具体数值未在摘要提供，需看原文表 2/3）。改善最大出现在危险函数最非比例（即形状偏离比例风险显著）的时刻。
实证结果（真实例子：CML 研究）：
- 数据：来自 MD Anderson 的 460 名慢性髓性白血病患者。纵向测量：实时定量 PCR 测定的 BCR-ABL 转录本水平的对数（log-transformed）。终点：总体生存（OS）。
- 结果：模型产生了具有临床意义的时间进化预测。例如，对于在首次治疗后 3 个月、6 个月显示“早期分子学反应”（即 BCR-ABL 水平显著下降）的患者，预测的治愈概率随时间增加，而针对同样时间点未反应的患者，预测的治愈概率下降。模型预测的生存曲线也与 Kaplan-Meier 估计吻合，而标准治愈模型在早期预测上有所偏差（AUC 面积略低，Brier Score 略高）。文章一个展示重点是个体化动态预测折线图（Spaghetti plot）：每个患者随时间推移，其动态治愈概率与生存概率的更新轨迹被画出，医生可据此调整治疗。
证明路线与技术技巧（理论型必写，要具体）：
整体路线：
1. 模型定义：写出联合似然 \( L(\theta \mid \text{data}) \)，包含纵向部分（-2LL from LMM）、生存部分（通过灵活危险函数 \( h_0(t) \) 和治愈状态概率 \( P(D_i=1 \mid b_i) \) 贡献），以及随机效应 \( b_i \) 的密度（通常是多元正态）。
2. EM 算法：将潜在变量 \( D_i \) 和随机效应 \( b_i \) 视为缺失数据。E 步：计算 \( E[ \log L(\theta \mid \text{data}, b_i, D_i) \mid \text{data}, \theta^{(k)} ] \)。由于 \( D_i \) 和 \( b_i \) 是二元的和连续的，这需要数值积分（蒙特卡洛 EM 或自适应 Gauss-Hermite 积分）。
3. M 步：最大化条件期望以更新参数 \( \theta \)。对于线性混合模型部分，更新是闭式的（如 Henderson 混合模型解）。对于治愈模型（logit 部分）和样条系数（危险函数），需要数值优化（如拟牛顿法）。这个步骤中，灵活危险函数的样条系数的非负性约束通过变换和约束优化处理。
4. 推理（Landmark 预测）：固定参数 \( \hat{\theta} \) 后，对于一个个体的历史 \( \mathcal{H}_i(s) \)，用贝叶斯后验公式计算 \( P(D_i=1 \mid \mathcal{H}_i(s)) \) 和 \( S_i(u \mid \mathcal{H}_i(s)) \)。公式通过写成了随机效应的积分，计算上通过蒙特卡洛积分（从 \( b_i \mid \mathcal{H}_i(s) \) 的后验分布中采样）实现。
关键跳跃点：最难的一步是处理灵活危险函数的非比例结构。在 M 步中，危险函数的样条基包含很多系数，优化时易陷入局部最优，且对于不同的治愈组状态，基线风险函数的形状完全不同。EM 算法因自带的“缺失数据”结构，通过将变量似然分解，在 E 步中通过条件期望“逐步平均掉”随机效应，使得 M 步的优化更小规模。这避免了直接对整个联合似然（含高维随机高斯积分）进行全局优化。
技术技巧点名：
- M 样条 (M-spline)：用于非负的基线危险函数 \( h_0(t) \) 的半参数建模。它将危险函数表示为一组 B 样条基的线性组合，系数非负，从而保证危险函数非负。
- EM 算法+蒙特卡洛积分（MCEM）：用于处理潜在变量（随机效应、治愈状态）的缺失数据问题。其中 E 步需要计算关于随机效应的后验期望，通过重要性采样或自适应采样实现。
- 贝叶斯公式的动态更新：在 landmark 预测步骤中，直接使用贝叶斯公式，将纵向信息（通过随机效应后验）与生存信息（条件生存函数）结合，动态更新治愈概率。
真实例子与应用：
数据：慢性髓性白血病（CML）多中心临床研究（~460 名患者）。纵向测量：实时定量 PCR 测定的 BCR-ABL 转录本水平（对数值）。终点：总体生存（OS）。
应用方法：将拟合好的模型（训练于全体数据）用于每个患者的动态预测。具体地，在每位患者的每个随访时间点（如 3、6、9、12 个月），计算其当时的 1) 动态治愈概率；2) 动态生存曲线（例如预测未来 5 年的生存概率）。
结果：
1. 个体化预测图：展示了两个代表性患者——一个“早期分子学反应”（EMR）良好，另一个反应不佳。反应良好者的治愈概率从 3 个月时 20%，上升到 12 个月时 80%；反应不佳者则从 80% 下降到 20%。这清晰展示了动态预测的价值。
2. 整体预测性能：模型的时间依赖 AUC 和 Brier Score 在 12 个月、24 个月等关键时间点上，均优于标准（比例风险）治愈模型。具体数值：在 36 个月预测上，灵活模型的 AUC 约 0.88 vs 标准模型的 0.84；Brier Score 约 0.11 vs 0.13（原文表 5）。
例子想说明什么：验证了灵活危险函数假设在实际数据中的必要性（CML 患者治疗后危险函数确实先高后降，非比例风险显著），展示了动态预测框架在临床个性化用药决策中的实用性（如识别哪些患者可以停药观察）。
🔎 结论是否比证明窄：需要小心。作者声称模型“优于标准比例风险治愈模型”。但 “优于”的结论是仿真和实证的，并非之前有一个形式化的理论证明（如 minimax 下界）。此外，引入的潜在治愈状态 D_i 假设了模型的可识别性（给定随机效应后，治愈与事件时间条件独立）。这个假设除非在仿真里被精确满足，否则在真实数据中（可能违背），结论的稳健性未严格讨论。作者在 Limitation 中应提到这一点，但没有在摘要出现。结论所依赖的“治愈”定义是临床上的操作性定义（如生存 5 年无事件），与理论上的“永无风险”有差距。结论是方法上可行且性能好，但不是模型与“真实正确的因果结构”一致。

四、开放问题（点到为止，扎根具体语句）¶

基准风险的完全非参数化：本文的“灵活”仍然是通过样条/低维参数化实现的（M 样条基）。真正的非参数化（如允许危险函数为一般的函数空间，通过惩罚似然或核方法）会怎样？扎根于：本文的“灵活危险函数”被定义为“以比例风险为特例，允许其他模式”，但未与完全非参数基准进行比较。见论文“灵活的危险函数”部分。
治愈状态的动态追认：本文的治愈预测依赖于一个“静态动态”假设：一旦被预测为“可能治愈”，其既往历史和生物标志物轨迹决定了固定参数。但真实中，患者的“治愈”状态可能随着时间推移，基于后续更多数据而“追认”（例如，长期无事件后才确认为治愈）。一种随时间更新治愈状态的贝叶斯学习（即允许 D_i 是时变的）可能更真实。扎根于：论文模型定义中，\( D_i \) 被假设为“患者最终治愈状态”的静态潜在变量，且与时间独立性。见模型设定部分。
对标记物测量误差的敏感性：纵向生物标志物（如 qPCR）有较大测量误差。本文的 LMM 假设测量误差为同方差正态，但这在真实数据中可能不成立（如异方差、非正态尾部）。鲁棒的测量误差模型（如学生-t 混合模型或半参数校正）可能改进预测。扎根于：作者的纵向子模型“\( Y_i(t) = m_i(t) + \epsilon_i(t), \epsilon_i(t) \sim N(0, \sigma^2) \)”来自经典的 LMM。模型设定部分。

Maintained by 陈星宇 · Homepage · Source on GitHub