Optimal treatment regimes in the presence of a cure fraction¶

作者: Chenrui Qi, Zicheng Lin, Baqun Zhang, Cunjie Lin, Zishu Zhan
来源: Statistical Methods in Medical Research
主题: 因果推断
相关性: 7/10
机构绿灯: Hong Kong University of Science and Technology（US News 前 50，免分进入精读）
链接: https://doi.org/10.1177/09622802251338399

一、领域脉络与小综述¶

这个方向是什么：这个子方向研究如何在生存数据中估计最优个体化治疗规则。其根本问题是：当患者结局是带删失的生存时间，且人群中存在一部分人被"治愈"（即永远不发生事件）时，如何从观察性或随机对照试验数据中学习出一个规则 \(d(X)\)，使得按照该规则分配治疗能最优化某个总体目标（如治愈率最大化、生存时间最大化）。当前该方向已从经典的二值/连续结局 ITR 发展出成熟的生存分析分支，但对"治愈分数"这一结构的处理尚处于起步阶段。

发展脉络：

奠基工作：二值/连续结局的最优治疗规则 最优个体化治疗规则（ITR）的理论框架由 Murphy (2005) 和 Robins (2004) 奠定，他们引入了动态治疗策略（DTR）的概念，并提出了基于结构嵌套均值模型的估计方法。Qian & Murphy (2011) 进一步将问题转化为通过分类或回归的直接估计框架，使得高维协变量下的 ITR 估计成为可能。这些工作主要处理二值或连续结局，未涉及生存数据特有的删失与治愈结构。
主要进展：生存结局下的 ITR 随后，研究者将 ITR 推广至生存分析领域。Zhao et al. (2015) 提出了基于加权分类的生存结局 ITR 估计方法，通过逆概率加权处理删失问题。Jiang et al. (2017) 与 Bai et al. (2017) 分别发展了基于分位数回归与加速失效时间（AFT）模型的 ITR 估计。这些工作隐含了一个关键假设：所有患者最终都会经历事件，即 \(P(T < \infty) = 1\)。这一假设在存在治愈分数的场景下失效，导致估计的最优规则可能产生误导。
当前 Frontier：治愈模型 治愈模型是生存分析中处理长期幸存者的成熟工具。奠基工作 Kuk & Chen (1992) 提出了混合治愈模型，将总体生存函数分解为治愈部分与未治愈部分。Sy & Taylor (2000) 进一步发展了 Logistic-Cure 模型的估计方法。然而，这些工作主要关注治愈率的估计，而非将其作为决策目标的一部分来优化治疗规则。
本文的位置 本文位于"生存 ITR"与"治愈模型"的交叉路口。作者指出，现有生存 ITR 文献忽略了治愈分数的存在，而治愈模型文献又未涉及治疗规则的优化。本文试图填补这一空白：在承认存在治愈分数的前提下，重新定义"最优"（是最大化治愈率？还是最大化未治愈者的生存时间？或是两者的权衡？），并构建相应的估计方法与理论。

子线索聚类：

线索一：ITR 的直接估计方法 这条线索关注如何绕过复杂的中间模型，直接优化价值函数。代表工作是 Zhang et al. (2012) 提出的基于价值函数搜索的方法，以及 Zhao et al. (2012, 2015) 引入的分类视角。本文继承了这一思路，采用直接估计框架，而非先建立复杂的生存模型再推导规则。
线索二：生存数据中的因果推断与 ITR 这条线索处理删失与因果效应的结合。Lokhnygina & Helterbrand (2007) 讨论了竞争风险下的最优决策。Simoneau et al. (2020) 系统综述了生存结局下的因果推断方法。本文在此基础上增加了"治愈"这一潜在结果类型，使得因果结构更加复杂。
线索三：治愈模型 这条线索提供建模工具。Peng & Dear (2000) 和 Lu (2010) 等工作发展了各类治愈模型（参数、半参数）。本文利用这些模型的结构（总体 = 治愈者 + 未治愈者），但将其嵌入决策框架。

这个方向在追问的核心问题：

目标函数的定义：在存在治愈分数时，"最优"的定义变得模糊。是追求更多人被治愈（即使未治愈者死得快），还是追求未治愈者活得久（即使治愈率低）？这涉及伦理与临床目标的权衡。
识别问题：治愈状态（Cured vs. Uncured）通常是不可观测的（我们只能观测到删失时间，无法确知某人是否被治愈）。如何在潜在结果框架下定义并识别针对治愈状态的价值函数？
估计效率与计算：直接估计方法通常涉及非凸优化或复杂的加权估计方程。如何设计计算上可行且统计上有效的算法？

⚠️ 作者的 framing：作者将缺口 frame 为：现有生存 ITR 方法"忽略治愈分数"，导致"次优甚至错误的治疗规则"。他们将自己的工作定位为"首次将治愈分数纳入 ITR 框架"，并提出了两种新的"权衡型"规则（约束优化）。 被淡化或回避的竞争路线： - 多目标优化视角：作者将"治愈率"与"生存时间"的权衡处理为约束优化（控制一个、最大化另一个）。这实际上是一个多目标优化问题，Pareto 前沿理论可能提供更系统的视角，但文中未提及。 - 动态治疗策略（DTR）：本文聚焦于单阶段决策。多阶段决策（DTR）在治愈模型下如何定义"最优"是一个自然延伸，但 intro 未讨论。 - 缺失引用：在处理"不可观测治愈状态"时，作者主要依赖治愈模型文献。但因果推断中关于潜在类别或潜在子群的工作（如 Latent Class Analysis 在因果中的应用）似乎未被充分引用，这可能是一条被忽略的理论线索。

张力：未见明显对立引用。现有文献更多是"互补而非矛盾"：生存 ITR 文献不处理治愈，治愈模型文献不处理决策。本文试图将两者结合，而非解决某一理论冲突。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据

符号约定：
- \(T\)：潜在生存时间，取值 \((0, \infty]\)。
- \(C\)：删失时间，取值 \((0, \infty)\)。
- \(A \in \{0, 1\}\)：二值治疗变量。
- \(X\)：基线协变量向量。
- \(Y = \min(T, C)\)：观测到的生存时间或删失时间。
- \(\Delta = I(T \le C)\)：事件指示子，\(\Delta=1\) 表示观测到事件，\(\Delta=0\) 表示删失。
- \(G \in \{0, 1\}\)：潜在治愈状态。\(G=1\) 表示"被治愈"（永不发生事件），\(G=0\) 表示"未治愈"（ susceptible，终将发生事件）。
- \(d(X)\)：治疗规则，即从协变量空间到治疗选项的映射。
- \(\pi(a|X) = P(A=a|X)\)：倾向性得分。
模型（数据生成机制）：本文采用混合治愈模型的设定：
1. 治愈部分：\(P(G=1 | X, A) = \pi_G(X, A)\)。若 \(G=1\)，则 \(T = \infty\)。
2. 未治愈部分：若 \(G=0\)，则 \(T\) 服从某生存分布 \(S_u(t|X, A)\)，即 \(P(T > t | X, A, G=0) = S_u(t|X, A)\)。
3. 总体生存函数：\(S(t|X, A) = \pi_G(X, A) + (1 - \pi_G(X, A)) S_u(t|X, A)\)。这表明总体的生存函数由两部分组成：治愈者的"平台"加上未治愈者的衰减。
4. 无混杂假设：\(A \perp\!\!\!\perp (T, G) | X\)（给定协变量，治疗分配独立于潜在生存时间和治愈状态）。
可观测数据：研究者实际观测到的是独立同分布样本 \(\{X_i, A_i, Y_i, \Delta_i\}_{i=1}^n\)。
- 观测到的：协变量 \(X\)、治疗 \(A\)、时间 \(Y\)、事件指示 \(\Delta\)。
- 观测不到的：潜在治愈状态 \(G\)（因为若 \(\Delta=0\)，我们不知道患者是被治愈了还是仅仅被删失了；若 \(\Delta=1\)，则一定未被治愈，即 \(G=0\)）。这是问题的核心难点：\(G\) 是部分隐匿的。

第二步：最小内核

为了讲清核心思路，我们考虑一个最简特例：假设我们只关心最大化治愈率，且假设治愈模型参数已知（或已通过 MLE 估出）。

目标：找到规则 \(d^*\)，使得治愈率 \(V_{cure}(d) = E[\pi_G(X, d(X))]\) 最大。
核心困难：在标准 ITR 中，价值函数 \(V(d) = E[Y(d)]\) 可以通过逆概率加权（IPW）直接估计：\(\hat{V}(d) = \frac{1}{n} \sum \frac{I(A=d(X)) Y}{\pi(A|X)}\)。但在治愈模型中，\(G\) 不可观测，我们无法直接构造 \(G\) 的 IPW 估计量。
本文的破题思路：作者利用了治愈模型的一个关键性质：事件发生即未治愈。对于未治愈者，事件指示 \(\Delta\) 与生存时间 \(T\) 是可观测的（若未删失）。作者构造了针对治愈率的价值函数估计量。在最简情形下，若忽略删失（或假设随访足够长），观测到事件 \(\Delta=1\) 意味着 \(G=0\)。那么，最大化治愈率等价于最小化事件发生率。然而，真实的困难在于删失：\(\Delta=0\) 可能是 \(G=1\)（真治愈），也可能是 \(G=0\) 但 \(T > C\)（删失）。本文的最小内核在于：利用治愈模型的结构，将不可观测的 \(G\) 的价值函数，转化为可观测的 \(T\) 与 \(\Delta\) 的函数。具体而言，作者证明了：
\[V_{cure}(d) = E\left[ \frac{I(A=d(X))}{\pi(A|X)} \cdot \omega_{cure}(Y, \Delta) \right]\]
其中 \(\omega_{cure}\) 是一个依赖于治愈模型参数的权重函数。通过这一转化，问题退化回标准的 ITR 估计问题：寻找 \(d\) 使得加权分类误差最小。这便是"直接估计"的含义：不需要先计算每个人的治愈概率再平均，而是直接优化一个由权重修正的价值函数。

三、这篇论文做了什么¶

三句话： 1. 研究了存在治愈分数的生存数据中，如何估计最优个体化治疗规则（ITR）。 2. 核心方法是构建了直接估计框架，将不可观测的治愈状态价值函数转化为可观测的加权价值函数，并提出了约束优化算法处理多目标权衡。 3. 主要结论是证明了所提估计量的一致性与渐近正态性，并通过模拟与食管癌数据展示了方法在提升治愈率或延长生存时间方面的优势。

关键设定与假设：

混合治愈模型：假设总体由治愈者和未治愈者混合而成。这是统计建模的基础，相比标准生存模型，它放宽了"所有人终将发生事件"的假设。
无混淆假设：\(A \perp\!\!\!\perp (T, G) | X\)。这是因果推断的标准假设，但在本文中它要求治疗分配独立于治愈状态 \(G\)，这是一个比独立于 \(T\) 更强的要求（因为 \(G\) 是 \(T\) 的潜在结构）。
不可识别性处理：治愈模型本身存在不可识别问题（随访时间不够长时，无法区分长期幸存者与治愈者）。作者假设随访时间足够长或模型参数可识别，主要关注在给定模型下的 ITR 估计。

主要结果：

定理 1（识别性）：作者证明了在无混淆假设与治愈模型结构下，针对治愈率的价值函数 \(V_{cure}(d)\) 与针对未治愈者生存时间的价值函数 \(V_{surv}(d)\) 是可识别的。这解决了"从观测数据学习潜在状态规则"的根本问题。
定理 2 & 3（渐近性质）：
- 对于单目标规则（如仅最大化治愈率），作者证明了估计值 \(\hat{d}_n\) 的价值函数收敛到最优值，且收敛速度为 \(n^{-1/2}\)（若规则空间有限）或更慢（若规则空间无限）。
- 关键技术难点在于：价值函数的估计涉及非参数/半参数成分（如治愈概率的估计），作者使用了交叉拟合或无穷小扰动技术来处理 nuisance parameter 估计带来的偏差。
约束优化规则：
- 作者提出了两种权衡规则：
  - 规则 A：在控制未治愈者生存时间不低于某阈值的前提下，最大化治愈率。
  - 规则 B：在控制治愈率不低于某阈值的前提下，最大化生存时间。
- 这通过外点算法求解。该算法将约束问题转化为一系列无约束问题，计算上更高效。

证明路线与技术技巧：

整体路线：
1. 转化：将潜在结果 \(G\) 的价值函数，通过条件期望展开，转化为观测数据 \((Y, \Delta)\) 的函数。这一步依赖于治愈模型的似然分解。
2. 估计：构造价值函数的估计量 \(\hat{V}(d)\)。由于涉及未知参数（如治愈概率 \(\pi_G\)），采用两步法：先估计 nuisance parameters，再优化 \(d\)。
3. 理论分析：证明 \(\sup_d |\hat{V}(d) - V(d)| \to 0\)。这需要经验过程理论。
4. 优化：针对约束优化问题，设计外点算法。
关键跳跃点：
- 从 \(G\) 到 \((Y, \Delta)\) 的转化：这是识别性的核心。作者利用了 \(P(G=1|X, A, T > C) = \frac{\pi_G(X,A)}{\pi_G(X,A) + (1-\pi_G(X,A))S_u(C|X,A)}\) 这一贝叶斯公式，将治愈的后验概率嵌入价值函数。
- Nuisance Parameter 的影响：当 \(\pi_G\) 需要估计时，估计误差如何传递到 \(\hat{d}\)？作者使用了经验过程理论中的 chaining arguments，证明了只要 nuisance estimator 收敛速度够快（如 \(n^{-1/4}\)），则不影响最终估计量的渐近性质。
技术技巧点名：
- Inverse Probability Weighting (IPW)：用于处理治疗分配机制。
- Augmented IPW (AIPW)：可能用于提高效率（文中提到了 robustness）。
- Empirical Process Theory：用于证明估计量的一致性与收敛速率。
- Exterior-point Algorithm：用于求解带约束的价值函数优化问题，避免内点法在边界上的数值困难。

真实例子与应用：

数据：食管癌数据。
场景：比较不同治疗方案（如手术 vs. 放化疗）对食管癌患者的影响。食管癌存在一定比例的长期幸存者（临床治愈）。
应用方式：
1. 定义治愈状态（长期无复发）。
2. 应用本文方法估计最优规则。
3. 与传统生存 ITR 方法对比。
结果：
- 传统方法（忽略治愈分数）倾向于选择"让所有人活得久一点"的规则，但可能牺牲了"彻底治愈"的机会。
- 本文方法（规则 A）能识别出显著提高治愈率的治疗规则，即使未治愈者的生存时间略有缩短。
- 本文方法（规则 B）能在保证治愈率的前提下，延长未治愈者的生存时间。
- 这验证了"治愈率"与"生存时间"之间的确存在 Trade-off，且本文方法能有效捕捉这一权衡。

🔎 结论是否比证明窄：作者在理论部分假设了 nuisance parameters（如治愈模型参数）的一致估计性。在实际操作中，治愈模型参数的估计本身是一个困难问题（特别是随访时间不足时）。作者在模拟中假设参数已知或用 MLE 估计，但在真实数据部分，如何准确拟合治愈模型是一个潜在的瓶颈。作者在 Discussion 中提到了这一点，但未在定理中给出治愈模型误设时的 robustness 分析。

四、开放问题¶

治愈模型误设的敏感性：本文假设混合治愈模型正确。若实际数据生成机制偏离该模型（如不存在治愈分数，或治愈机制更复杂），ITR 估计的稳健性如何？这扎根于文中对混合治愈模型的假设部分，是因果推断中常见的敏感性分析问题。
动态治疗策略（DTR）：本文仅考虑单阶段决策。在多阶段治疗中，治愈状态可能随时间变化（如初期未治愈，后期治愈）。如何将本文框架推广至 DTR？扎根于文中"single-stage"的设定。
计算效率与高维协变量：外点算法在规则空间复杂或协变量维度极高时的计算瓶颈。文中未深入讨论高维 \(X\) 下的变量选择或稀疏性约束。扎根于计算部分的描述。
非参数/机器学习方法的嵌入：本文理论依赖于 nuisance parameters 的收敛速率。若使用黑盒机器学习方法（如深度学习）估计治愈概率，理论保证是否依然成立？扎根于估计方法部分的讨论。

Maintained by 陈星宇 · Homepage · Source on GitHub

Optimal treatment regimes in the presence of a cure fraction¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题¶

评论