Statistical methods for cost-effectiveness analysis of left-truncated and right-censored survival data with treatment delays¶

作者: Polyna Khudyakov, Li Xu, Ce Yang, Donna Spiegelman, Molin Wang
来源: Journal of the Royal Statistical Society Series C
主题: 流行病学
相关性: 6/10
机构绿灯: Harvard University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/jrsssc/qlaf035

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在观察性流行病学或公共卫生研究中，当生存时间数据同时受到左截断（left truncation，只有经历某事件后才进入观察池）与右删失（right censoring，观察终止时事件尚未发生）影响，且患者实际接受治疗的时间存在延迟（treatment delay）时，如何对成本效益分析（CEA）中的核心指标——增量成本效益比（ICER）与增量净收益（INB）——进行无偏估计与严格推断。当前该方向的成熟度处于"方法已成型、理论性质部分依赖模拟验证、特定复杂设定（如延迟+截断+分层）尚缺统一渐近框架"的阶段。

发展脉络： - 奠基工作：将生存分析引入成本效益评估。早期CEA多基于参数生存模型或无截断/删失的简单均值比较。引用中如 Willan & Lin (2001) 等工作，确立了基于生存时间的期望成本与期望效益的数学表达，但未系统处理左截断带来的选择偏倚。 - 主要进展：处理复杂观察机制。作者在 intro 中点出，后续工作（如 Zhao & Tian 2011, Bang & Tsiatis 2002）引入了逆概率加权（IPW）或增广IPW（AIPW）来处理右删失下的成本估计。然而，作者明确指出这些工作"未考虑左截断"（left truncation未被纳入生存时间的似然或加权结构），且"未考虑治疗延迟"（treatment delay）。 - 当前 frontier：同时处理左截断与右删失的半参数框架。已有文献（如作者自引的先前工作）可能在单纯左截断右删失下给出了分层Cox的似然，但一旦引入"从符合条件到实际接受治疗"的时间差（delay），风险集的构造与期望成本的积分下限均发生改变，此前的似然函数与估计量不再直接适用。 - 本文的位置：填补"左截断 + 右删失 + 治疗延迟 + 协变量调整"这一组合设定下的估计与推断空白，给出基于分层Cox部分似然的显式估计量与方差公式。

子线索聚类： 1. 基于IPW/AIPW的因果与成本推断：以 Bang & Tsiatis 为代表，用逆概率加权处理右删失，依赖删失机制的模型化。本文虽提及，但未走这条路线，而是依赖Cox似然。 2. 基于Cox比例风险模型的半参数推断：以分层Cox为核心，利用风险集的动态构造自然吸收左截断信息（条件似然），这是本文的主线。 3. 治疗延迟与时间依赖暴露的因果刻画：在因果推断中，延迟启动治疗相当于一个 time-dependent treatment。本文将延迟时间直接嵌入生存时间的起点重定义，而非用g-formula等因果框架。

这个方向在追问的核心问题： 1. 左截断改变了风险集的构成，如何在不引入额外加权偏倚的情况下，利用Cox部分似然自然校正这种选择偏倚？ 2. 治疗延迟使得"符合条件时间"与"治疗开始时间"产生错位，期望成本的积分区间应从哪个时间点起算？从符合条件起算会引入不可观测的偏倚，从治疗起算则改变了生存时间的定义。 3. 在分层Cox下，INB/ICER作为多个参数（成本系数、风险比、基线生存函数积分）的非线性泛函，其渐近方差如何通过delta方法或影响函数严格推导？

⚠️ 作者的 framing（这是作者的说法）：作者把缺口 frame 成："现有CEA方法要么忽略左截断，要么忽略治疗延迟，而公共卫生现实中两者同时存在"，从而让本文的"同时处理两者+协变量调整"成为显然的下一步。被淡化或回避的路线：作者没有讨论半参数效率界（semiparametric efficiency bound），也没有对比AIPW路线在双重稳健性上的优势；更没有触及因果推断中处理延迟的g-computation 或 IPW for time-dependent confounding（如 Robins的序列g-估计）。 明显该被引却未出现的：关于左截断右删失下Cox模型渐近理论的经典文献（如 Andersen & Gill 1982 的扩展，或 Kalbfleisch & Prentice 对左截断风险集的严格处理），以及因果推断中处理 treatment delay 的 longitudinal causal inference 文献（如 Hernán et al. 的 emulated trials 框架）。这值得研究者去查证：是作者刻意选择了纯统计视角，还是遗漏了因果视角的对照？

张力：未见明显对立引用。不同路线（IPW vs Cox似然）在各自假设下均能给出一致估计，但假设的强弱不同（IPW需删失/截断机制模型正确，Cox需风险模型正确），作者未在 intro 中展开这种假设依赖性的对比张力。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(T\)：潜在生存时间（从治疗开始到事件发生的时间，不可直接完全观测）。
\(A\)：治疗指示变量（\(A=1\) 接受新治疗，\(A=0\) 对照）。
\(D\)：治疗延迟时间（从患者符合治疗条件/入组，到实际开始接受治疗的时间差，\(D \ge 0\)）。
\(L\)：左截断时间（从出生/某基准点到符合条件的时间，只有 \(L \le T+D\) 的个体才能被观测到）。
\(C\)：右删失时间（从治疗开始到删失发生的时间）。
\(X\)：可观测的协变量/风险因素向量。
\(V\)：实际可观测的生存/随访时间，\(V = \min(T, C)\)。
\(\Delta\)：事件指示变量，\(\Delta = I(T \le C)\)（1表示观察到事件，0表示删失）。
\(E(\cdot)\)：期望成本或效益，是本文要估的 estimand。
可观测数据：对于进入观察池的个体（满足 \(L \le V+D\)），研究者能观测到 \((X, A, D, L, V, \Delta)\) 以及随访期间累积的成本与效益。观测不到的是：若 \(\Delta=0\)，真实的 \(T\) 与后续成本；若 \(L > V+D\)，该个体根本不出现在样本中（选择偏倚的来源）。

第二步：最小内核——带延迟的单时间点二值治疗下的期望效益估计

剥掉分层、多协变量与成本细节，最小内核是：如何定义并估计一个带延迟启动的事件的期望生存时间（效益的代理）。

在没有延迟(\(D=0\))且无截断删失时，期望效益就是 \(E(T|A=1) - E(T|A=0)\)。引入延迟 \(D\) 后，患者真正面临风险的时间段是 \([D, T+D]\)。如果从符合条件起算总生存，总时间是 \(W = T + D\)。但 \(T\) 才是治疗带来的效益期。 核心数学困难：左截断要求只有 \(L \le W\) 的个体进入风险集。在Cox模型中，风险集在时间点 \(t\) 的定义是 \(\{i: L_i \le t \le W_i\}\)。由于 \(W = T+D\)，延迟 \(D\) 使得风险集的左端点（入组时间）与右端点（事件/删失时间）之间的跨度被人为拉长。如果不把 \(D\) 从 \(W\) 中剥离，估计出的基线生存函数 \(S_0(t)\) 将包含延迟期的伪风险，导致期望效益 \(E(T)\) 的积分 \(\int S_0(t) dt\) 发生偏倚。

最简特例下的解法：在 \(A\) 取0/1，单一时间点的最简情形下，本文的核心思路是：将时间轴重参数化为"治疗开始后的时间"。令 \(t^* = t - D\) 为治疗开始后的时间尺度。Cox部分似然在这个 \(t^*\) 尺度下构建：

\[L(\beta) = \prod_{k: \Delta_k=1} \frac{\exp(X_k \beta + A_k \alpha)}{\sum_{j \in R(t^*_k)} \exp(X_j \beta + A_j \alpha)}\]

其中风险集 \(R(t^*_k)\) 变为：在"治疗开始后时间" \(t^*\) 仍处于风险中的人，即满足 \(L_j - D_j \le t^*_k \le V_j\) 的个体。通过这种时间轴的平移，\(D\) 被彻底从风险期的比较中剔除，\(\alpha\) 真正捕捉了治疗对 \(T\) 的效应。随后，期望效益 \(E(T|A=1)\) 通过基线生存函数的积分 \(\int_0^\tau \hat{S}_0(t^*|A=1) dt^*\) 得到，这里 \(\hat{S}_0\) 由Breslow估计量在 \(t^*\) 尺度下算出。这就是整篇论文在数学上干的事：用时间平移重构风险集，剥离延迟对似然与生存函数积分的污染。

三、这篇论文做了什么¶

三句话： ①研究了左截断右删失生存数据中，存在治疗延迟时ICER与INB的估计与推断问题。 ②核心工具是经过时间轴平移（扣除延迟时间）重构风险集的半参数分层Cox比例风险模型，结合Breslow估计与delta方法。 ③主要结论是：给出了ICER/INB的显式估计量及其渐近方差公式，模拟显示有限样本性质良好，并在坦桑尼亚艾滋病数据中完成实证。

关键设定与假设： - 分层Cox模型：假设不同层（strata）有各自的基线风险 \(h_{0s}(t)\)，但治疗与协变量的效应 \(\alpha, \beta\) 跨层共享。相比纯Cox，放宽了基线风险相同的假设；相比参数模型，保留了基线风险的非参数性。 - 左截断与右删失机制：假设截断时间 \(L\) 与删失时间 \(C\) 在给定协变量下，与潜在生存时间 \(T\) 独立（即独立截断与独立删失假设，这是Cox部分似然一致性的根基）。文中未讨论若此假设失效时的敏感性。 - 治疗延迟假设：假设延迟时间 \(D\) 是已知的、可观测的确定性变量（或给定协变量下与 \(T\) 独立）。作者未将其视为一个需要建模的随机过程，也未讨论 \(D\) 与后续生存的因果纠缠。 - 成本与效益的结构：假设成本在事件发生或删失前按某速率累积，效益为生存时间的单调变换（如QALY），期望值通过基线生存函数的积分表达。

主要结果： 1. 估计量的构造：通过时间平移 \(t^* = t - D\) 重构部分似然，得到 \(\hat{\alpha}, \hat{\beta}\)；在此基础上计算Breslow基线生存函数估计 \(\hat{S}_{0s}(t^*)\)；最终期望成本与效益通过 \(\hat{S}_{0s}(t^*)\) 的积分显式写出，进而组合出 \(\hat{ICER} = \Delta \hat{E}(Cost) / \Delta \hat{E}(Benefit)\) 与 \(\hat{INB} = k \Delta \hat{E}(Benefit) - \Delta \hat{E}(Cost)\)（\(k\)为阈值）。 2. 渐近推断：利用delta方法，将 \(\hat{INB}\) 的渐近方差表达为成本与效益估计量协方差的线性组合。由于效益估计量依赖非参数的 \(\hat{S}_{0s}(t^*)\)，其方差公式涉及基线累积风险的方差与协变量的加权求和（类似 Andersen et al. 的Greenwood公式扩展）。 3. 模拟验证：在不同延迟分布（如 \(D\) 服从指数分布、常数延迟）与不同截断/删失比例下，估计量的偏差极小，覆盖率接近名义水平。

证明路线与技术技巧： - 整体路线： 1. 建立带延迟的时间平移尺度下的分层Cox部分似然。 2. 证明该似然下参数估计 \(\hat{\alpha}, \hat{\beta}\) 的渐近正态性（沿用经典Cox理论框架）。 3. 利用Breslow估计量得到基线生存函数，通过积分构造期望成本/效益的估计量。 4. 将INB/ICER视为这些积分泛函的函数，应用delta方法推导渐近方差。 - 关键跳跃点：从 \(\hat{S}_{0s}(t^*)\) 的方差到 \(\int \hat{S}_{0s}(t^*) dt\) 的方差。积分泛函的方差不能简单由点态方差积分得到，因为生存函数在不同时间点高度相关。作者依赖了生存分析中累积风险估计量的渐近线性化（influence function展开），将 \(\int \hat{S} dt\) 的方差转化为风险集统计量与参数估计协方差的二次型。 - 技术技巧点名： - 分层Cox部分似然：用于在控制层特异基线风险的同时，剥离左截断对风险集的筛选。 - 时间轴平移：核心技巧，将 \(t\) 替换为 \(t-D\)，使延迟不出现在风险比较中。 - Delta方法：用于从底层参数/泛函的渐近方差推导出非线性组合（INB/ICER）的渐近方差。 - Breslow估计：用于在部分似然下恢复非参数基线生存函数。

真实例子与应用： - 数据/场景：坦桑尼亚艾滋病患者的换药治疗成本效益评估。患者符合换药条件后，并非立刻换药，存在延迟；且只有符合条件后才进入观察（左截断）。 - 怎么用上去：将符合条件到换药的时间作为 \(D\)，换药后的生存时间作为 \(T\)，应用本文估计量计算换药相对于不换药的INB。 - 得到什么结果：给出了INB的点估计与置信区间，表明在特定成本阈值下换药具有经济性。 - 想说明什么：验证方法在真实左截断+延迟数据下的可操作性，展示相对于忽略延迟的传统分析的差异。

🔎 结论是否比证明窄：本文的渐近方差推导严格依赖delta方法与Cox模型的经典渐近理论，这些理论在左截断右删失下已被证明成立。然而，论文在模拟中展示了有限样本性质，但未在正文中给出INB估计量的严格半参数效率界分析。作者claim了估计量的"excellent finite sample properties"，但这仅是模拟现象，未被理论定理全覆盖。此外，对延迟时间 \(D\) 的处理假设了其可被简单扣除，若 \(D\) 与 \(T\) 存在未观测的依赖（如病情越重延迟越短），当前的似然重构将失效，这一点在文中仅作为"limitation"提及，未给出敏感性分析的量化边界。

四、开放问题（点到为止）¶

要估什么：在左截断+右删失+延迟设定下，INB/ICER的半参数效率界是什么？当前基于Cox+delta方法的估计量是否达到该界？扎根点：文中仅用delta方法给方差，未讨论效率，intro中亦未引用semiparametric efficiency相关文献。
要证什么：当延迟时间 \(D\) 与潜在生存 \(T\) 不独立（存在unmeasured confounding between delay and survival）时，当前时间平移估计量的偏倚有多大？扎根点：文中Assumption部分隐含了 \(D\) 的可忽略性，但Limitations仅一句话提及，未展开。
要算什么：能否用影响函数路线构造双重稳健（DR）估计量，使得在Cox模型错判但删失/截断模型正确时仍一致？扎根点：intro明确回避了IPW/AIPW路线，但未证明Cox路线在模型错判下的后果。
要查什么：intro中缺失的因果推断文献（如Hernán的emulated trials或Robins的g-formula for treatment delay），是否已经给出了更一般的识别公式，使得本文的Cox特例只是其一个参数化子集？扎根点：intro的引用池完全局限于生存分析/CEA文献，未跨入causal inference。要确认此gap是否真实，需查5篇近期的causal survival analysis文献的intro。

Maintained by 陈星宇 · Homepage · Source on GitHub

Statistical methods for cost-effectiveness analysis of left-truncated and right-censored survival data with treatment delays¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止）¶

评论