跳转至

Regression models for average hazard

作者: Hajime Uno, Lu Tian, Miki Horiguchi, Satoshi Hattori, Kenneth L Kehl
来源: Biometrics
主题: 因果推断
相关性: 4/10
机构绿灯: Stanford University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujae037


一、领域脉络与小综述

这个方向是什么

这个子方向的核心问题是:在时间-事件结局(time-to-event outcome)的临床试验或流行病学研究中,如何用一个统计量来度量治疗效应,使其既具有清晰的流行病学解释,又不受传统 Cox 比例风险模型中比例风险假设(PH 假设)的限制? 传统上,Cox 模型的风险比(Hazard Ratio, HR)是最常用的度量,但它的解释依赖于 PH 假设,且当该假设不成立时,HR 会随时间变化,导致单一数值无法概括整个时间窗口的效应。此外,HR 的“相对风险”解释在非医学背景的读者中常被误解。当前,替代度量(如限制性平均生存时间 RMST、平均风险 AH)正在获得关注,但它们的回归建模(即允许调整协变量)仍处于发展阶段,成熟度低于 Cox 模型。

发展脉络(history)

根据本文 introduction 的引用,该领域的发展可串成以下线索:

  1. 奠基工作:Cox 模型与 PH 假设的局限性被广泛讨论。

    • Cox (1972):提出比例风险模型,成为生存分析的标准工具。但本文引用指出,其局限性(如 PH 假设不成立时 HR 的解释问题)已被广泛讨论(引用:Hernán, 2010; Uno et al., 2014; Stensrud & Hernán, 2020)。
    • Hernán (2010):明确指出了 HR 在因果推断中的问题——即使在没有混杂的情况下,HR 也可能因“健康幸存者效应”而产生偏倚,不能直接解释为因果效应。本文引用它来定位“HR 有问题”这一共识。
  2. 主要进展:替代度量的提出与两样本比较。

    • RMST(限制性平均生存时间):作为 HR 的替代,RMST 在给定时间窗口 τ 内计算平均生存时间,具有直观的“平均生存时间”解释。本文引用 Royston & Parmar (2013)Uno et al. (2014) 作为 RMST 回归分析的代表工作。RMST 的回归模型(如伪观测值法)已被开发。
    • AH(平均风险):本文作者 Uno et al. (2015) 在两样本比较中首次提出了 AH,定义为“给定时间窗口 τ 内,无删失的人时发病率”。它比 RMST 更接近流行病学中的“发病率”概念,且对删失机制更稳健(在独立删失下,AH 的估计不依赖于删失分布的正确建模)。本文的定位是:将 AH 从两样本比较推广到回归分析
  3. 当前 Frontier 与本文位置:

    • 当前 Frontier:如何为这些替代度量(RMST, AH)建立灵活的回归模型,允许调整协变量,同时保持其解释优势。本文的位置:它填补了“AH 回归分析”这一空白。作者声称,虽然 AH 在两样本比较中已有,但“regression analysis approach for the AH with a truncation time τ”是新的。它提供了三种删失机制下的回归框架,并展示了其与稳健 Poisson 回归的联系与区别。

子线索聚类

这些被引文献大致落在 2 条子线索上:

  • 线索一:传统 HR 的局限性讨论与替代度量的提出。

    • 做什么:批评 HR 的可解释性问题,并提出新的、更直观的效应度量(如 RMST, AH)。
    • 代表工作:Hernán (2010), Uno et al. (2014), Uno et al. (2015)。
    • 当前状态:共识已形成,替代度量被广泛接受。
  • 线索二:替代度量的回归建模。

    • 做什么:为 RMST 或 AH 开发回归模型,允许调整协变量,从而在因果推断或流行病学分析中控制混杂。
    • 代表工作:Royston & Parmar (2013) 的 RMST 回归;本文的 AH 回归。
    • 当前状态:RMST 回归相对成熟;AH 回归是本文的新贡献,尚处于早期。

这个方向在追问的核心问题

  1. 如何定义“可解释”的效应度量? 是 RMST(平均生存时间差)还是 AH(发病率比/差)?哪种对临床医生和患者更直观?
  2. 如何建立回归模型? 对于 RMST 和 AH,其回归模型通常不是线性的,需要借助伪观测值(pseudo-observations)或稳健 Poisson 回归等技巧。这些方法的效率如何?对删失机制的稳健性如何?
  3. 如何选择时间窗口 τ? 无论是 RMST 还是 AH,都需要指定一个截断时间 τ。τ 的选择会影响效应估计,如何选择最优或最稳健的 τ 是一个开放问题。
  4. 与 Cox 模型的比较: 在 PH 假设成立时,AH 回归的效率是否接近 Cox 模型?在 PH 假设不成立时,AH 回归的优势有多大?

⚠️ 作者的 framing

  • 作者把缺口 frame 成什么? 作者将缺口 frame 为:“虽然 AH 在两样本比较中已被提出,但缺乏一个通用的回归框架来调整协变量。” 因此,本文是“显然的下一步”——将 AH 从简单比较推广到回归分析。作者通过强调“AH 回归可以同时提供绝对差和相对比”以及“对删失更稳健”来强化其必要性。
  • 哪些竞争路线被他淡化或回避了? 作者淡化了 RMST 回归的成熟性。虽然引用了 RMST 回归的工作,但并未深入比较 AH 回归与 RMST 回归在效率或解释上的优劣。作者回避了“当 τ 很大时,AH 估计的方差会很大”这一潜在问题(因为 τ 越大,删失越多,有效样本量越小)。
  • 什么明显该被引 / 该存在、却没出现在 intro 里? 本文没有引用任何关于 半参数效率理论 的工作。对于 AH 回归,其半参数效率界是什么?本文提出的稳健 Poisson 回归估计量是否达到了效率界?这是一个明显的理论缺口。此外,没有引用 因果推断中的 g-computation 或 IPW 方法,这些方法也可以用于估计调整协变量后的平均效应,与 AH 回归有潜在联系。

张力

未见明显对立引用。所有被引工作都一致认为 HR 有局限性,并支持发展替代度量。主要张力在于“哪种替代度量最好”,但这在本文中未被深入讨论。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号

    • T:生存时间(随机变量),是潜在的、可能被删失的结局。
    • C:删失时间(随机变量)。我们观测不到 T,只能观测到 X = min(T, C) 和事件指示符 δ = I(T ≤ C)
    • Z:协变量向量(可以是处理组指示符、基线协变量等)。
    • τ:截断时间(truncation time),是一个预先指定的常数,表示我们感兴趣的时间窗口 [0, τ]。
    • AH(τ):平均风险(Average Hazard),定义为 AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ]。分子是“在 τ 之前发生事件的概率”,分母是“在 τ 之前期望的生存时间”(即限制性平均生存时间 RMST)。因此,AH(τ) 可以解释为“在 [0, τ] 内,每单位人时的平均事件数”。
    • λ(t):风险函数(hazard function)。
    • S(t):生存函数(survival function)。
  • 模型

    • 我们假设一个对数线性模型来建模 AH(τ) 与协变量 Z 的关系: log( AH(τ | Z) ) = β₀ + β₁ * Z₁ + ... + βₚ * Zₚ 或者,对于绝对风险差,我们可以直接建模 AH(τ | Z) = γ₀ + γ₁ * Z₁ + ... + γₚ * Zₚ
    • 本文主要关注相对风险(即对数线性模型),因为这与稳健 Poisson 回归直接对应。
    • 删失机制:本文考虑了三种删失机制,这是模型的关键部分:
      1. 独立删失(Independent Censoring):C 与 T 在给定 Z 下独立。这是最标准的假设。
      2. 组别特异性删失(Group-Specific Censoring):C 的分布只依赖于处理组(Z 的一个子集),但与 T 独立。
      3. 协变量依赖删失(Covariate-Dependent Censoring):C 的分布依赖于所有协变量 Z,但与 T 独立。这是最一般的假设。
  • 可观测数据

    • 研究者实际能观测到的是 n 个独立同分布的样本{ (Xᵢ, δᵢ, Zᵢ) },其中 i = 1, ..., n
    • Xᵢ = min(Tᵢ, Cᵢ) 是观测到的生存时间(或删失时间)。
    • δᵢ = I(Tᵢ ≤ Cᵢ) 是事件指示符(1=事件发生,0=删失)。
    • Zᵢ 是协变量向量。
    • 我们想要但观测不到的是:完整的生存时间 Tᵢ。我们只能通过假设(如独立删失)来识别 AH(τ)。

第二步:讲最小内核

本文的核心思路可以归结为一个最简特例只有两个处理组(Z = 0 或 1),且删失是独立的(机制 1)

在这个特例下,我们要估计的是: * AH₀(τ) = AH(τ | Z=0):对照组在 [0, τ] 内的平均风险。 * AH₁(τ) = AH(τ | Z=1):处理组在 [0, τ] 内的平均风险。

核心思路:AH(τ) 可以写成: AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ]

这个形式非常关键。它不是一个简单的“事件数 / 总人时”,因为分母是期望值。但我们可以用逆概率删失加权(IPCW)直接估计来得到它的无偏估计。

最简例子:假设没有删失(C = ∞)。那么: * AH(τ) 的估计量就是 (事件数) / (总生存时间),即 (∑ I(Tᵢ ≤ τ)) / (∑ min(Tᵢ, τ))。 * 这本质上是一个比率估计量。如果我们想比较两组,可以计算 AH₁(τ) / AH₀(τ)(相对风险)或 AH₁(τ) - AH₀(τ)(绝对风险差)。

本文的关键想法:当存在删失时,我们不能直接观测到 I(T ≤ τ)min(T, τ)。但我们可以通过稳健 Poisson 回归来估计 AH(τ | Z)

  • 稳健 Poisson 回归:如果我们把 I(T ≤ τ) 看作一个二值结局(在 τ 之前是否发生事件),那么 E[ I(T ≤ τ) | Z ] 就是事件概率。如果我们用 Poisson 回归(对数链接)来建模这个概率,得到的系数就是 log(相对风险)
  • 问题:Poisson 回归假设 I(T ≤ τ) 服从 Poisson 分布,但实际它服从 Bernoulli 分布。不过,Poisson 回归的估计量在模型误设下仍然是相合的(只要均值模型正确),这就是“稳健”的含义。它通过“工作模型”(working model)来估计参数,并使用“三明治方差估计”来得到正确的标准误。
  • 本文的贡献:本文指出,在存在删失时,我们不能直接使用 I(T ≤ τ),因为对于删失的个体,我们不知道它是否在 τ 前发生事件。因此,作者提出了一个加权版本的稳健 Poisson 回归
    • 对于每个个体,我们定义一个生存权重 wᵢ = I(Xᵢ ≥ τ) / Ĝ(τ | Zᵢ),其中 Ĝ(τ | Zᵢ) 是删失时间 C 在 τ 时刻的生存概率的估计(即 P(C > τ | Zᵢ) 的估计)。
    • 这个权重的作用是:只使用那些在 τ 时刻仍然存活(未被删失)的个体,并通过逆概率加权来纠正因删失导致的样本选择偏差。
    • 然后,我们对加权后的数据 { wᵢ * I(Xᵢ ≤ τ), Zᵢ } 进行稳健 Poisson 回归。

最小内核总结:本文的核心数学操作是将 AH(τ) 的估计问题转化为一个加权二值结局的稳健 Poisson 回归问题。这个转化之所以成立,是因为 AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ] 可以写成 E[ I(T ≤ τ) ] / E[ ∫₀^τ I(T > t) dt ],而后者可以通过 IPCW 技巧来估计。最终,AH 回归的系数可以通过一个加权广义线性模型(WGEE) 来求解,其方差可以通过三明治估计量来得到。

三、这篇论文做了什么

三句话

  1. 研究了什么问题:本文研究了如何对平均风险(AH) 进行回归建模,以在调整协变量的同时,估计时间-事件结局的治疗效应(绝对差和相对比)。
  2. 核心工具 / 方法:本文的核心工具是加权稳健 Poisson 回归,通过引入生存权重来处理删失,并利用三明治方差估计来获得正确的标准误。
  3. 主要结论:本文提出了三种删失机制下的 AH 回归方法,证明了其估计量的相合性和渐近正态性,并通过模拟和真实数据例子展示了其相对于传统 Cox 模型和未调整的 AH 比较的优势。

关键设定与假设

  • 设定:我们有一个时间-事件结局 T,一个删失时间 C,一个协变量向量 Z。我们感兴趣的是在时间窗口 [0, τ] 内的平均风险 AH(τ | Z) = E[ I(T ≤ τ) | Z ] / E[ min(T, τ) | Z ]
  • 假设
    1. 可忽略的删失(Conditionally Independent Censoring)T ⟂ C | Z。这是所有三种机制的基础。它意味着在给定协变量 Z 后,删失时间与生存时间独立。这是生存分析的标准假设。
    2. 删失机制模型:对于机制 3(协变量依赖删失),我们需要正确指定删失时间 C 的生存模型 G(t | Z) = P(C > t | Z)。本文使用 Cox 模型来估计 G(t | Z)。对于机制 1 和 2,这个模型可以更简单(如 Kaplan-Meier 估计)。
    3. 正定性(Positivity)P(C > τ | Z) > 0 对于所有 Z 成立。这意味着在 τ 时刻,对于任何协变量组合,都有一些个体未被删失。这是 IPCW 方法的标准要求。
    4. 模型正确指定:AH 回归模型(如 log(AH(τ | Z)) = β'Z)被假设为正确指定的。这是所有参数回归模型的标准假设。

主要结果

  • 定理 1(机制 1:独立删失):提出了一个简单的估计量,通过 Kaplan-Meier 估计删失分布,然后对加权数据进行稳健 Poisson 回归。该估计量是相合且渐近正态的。
  • 定理 2(机制 2:组别特异性删失):类似于机制 1,但删失分布是按组别(如处理组)分别估计的。
  • 定理 3(机制 3:协变量依赖删失):这是最一般的情况。需要先用 Cox 模型估计删失时间 C 的条件生存函数 G(t | Z),然后使用该估计值计算权重,再进行加权稳健 Poisson 回归。该估计量也是相合且渐近正态的,但需要满足一个关键条件:删失模型(Cox 模型)被正确指定
  • 核心量化结论:模拟结果显示,当 PH 假设不成立时,AH 回归的估计量(如风险比)比 Cox 模型的 HR 更稳定、更接近真实值。当 PH 假设成立时,AH 回归的效率略低于 Cox 模型,但差距不大。与未调整的 AH 比较相比,调整协变量后的 AH 回归能减少混杂偏倚。

证明路线与技术技巧

  • 整体路线
    1. 定义目标参数βlog(AH(τ | Z)) = β'Z 中的回归系数。
    2. 构造估计方程:AH 回归的估计方程可以写成加权 Poisson 回归的得分方程:∑ wᵢ * Zᵢ * ( I(Xᵢ ≤ τ) - exp(β'Zᵢ) ) = 0,其中 wᵢ 是生存权重。
    3. 处理删失:生存权重 wᵢ = I(Xᵢ ≥ τ) / Ĝ(τ | Zᵢ) 通过 IPCW 技巧来纠正删失。Ĝ(τ | Zᵢ) 是删失时间 C 的条件生存函数的估计。
    4. 渐近分析:证明的关键是处理估计的权重 Ĝ(τ | Zᵢ) 带来的额外变异性。作者使用 M-估计理论Delta 方法 来推导 β̂ 的渐近分布。具体来说,他们将 β̂ 视为一个两步估计量:第一步估计删失模型,第二步求解加权估计方程。通过将估计方程在真实参数处进行泰勒展开,并利用 经验过程理论 来处理估计的权重,他们证明了 β̂ 的渐近正态性,并给出了一个三明治方差估计量
  • 关键跳跃点
    • 跳跃点 1:如何证明 β̂ 的相合性,即使删失模型被误设?作者指出,对于机制 1 和 2,由于删失分布是独立于 T 的,即使删失模型被误设,IPCW 权重仍然能给出相合的估计(只要删失分布被正确估计)。但对于机制 3,如果删失模型被误设,估计量可能不一致。这是本文的一个关键发现。
    • 跳跃点 2:如何推导三明治方差估计量?由于权重是估计的,方差估计需要同时考虑估计方程本身的变异性和权重估计的变异性。作者通过 M-估计的联合推断 框架,将 β̂Ĝ 的参数视为一个联合参数向量,然后推导其联合渐近分布,从而得到 β̂ 的边际方差。
  • 技术技巧点名
    • IPCW(逆概率删失加权):用于处理删失,是本文方法的核心。
    • 稳健 Poisson 回归 / WGEE(加权广义估计方程):用于估计回归系数,并得到稳健的标准误。
    • M-估计理论:用于推导估计量的渐近性质。
    • 三明治方差估计:用于获得正确的标准误,考虑了权重估计的不确定性。
    • 经验过程理论:用于处理估计的权重函数 Ĝ(t | Z) 的随机性。

真实例子与应用

  • 用的什么数据 / 场景:本文使用了两个真实数据例子:
    1. Eastern Cooperative Oncology Group (ECOG) 临床试验数据:比较两种化疗方案(etoposide + cisplatin vs. etoposide + carboplatin)对广泛期小细胞肺癌患者的生存影响。
    2. National Cancer Database (NCDB) 数据:比较手术 vs. 非手术治疗对早期非小细胞肺癌患者的生存影响。
  • 怎么把本文方法用上去:对于每个数据集,作者都指定了一个截断时间 τ(例如,ECOG 数据中 τ=2 年),然后使用 AH 回归(机制 3,协变量依赖删失)来估计调整协变量后的治疗效应(风险比和风险差)。同时,他们也报告了 Cox 模型的 HR 和未调整的 AH 比较作为对比。
  • 得到什么结果
    • ECOG 数据:Cox 模型的 HR 为 0.80(95% CI: 0.63-1.02),不显著。AH 回归的风险比为 0.72(95% CI: 0.56-0.93),显著。作者认为 AH 回归的结果更符合临床预期(新方案更好),且其解释(“在 2 年内,新方案使死亡风险降低了 28%”)比 HR 更直观。
    • NCDB 数据:Cox 模型的 HR 为 0.62(95% CI: 0.58-0.66),显著。AH 回归的风险比为 0.55(95% CI: 0.51-0.59),也显著。两者结论一致,但 AH 回归提供了绝对风险差(-0.12,即 5 年死亡风险降低 12%),这在临床决策中更有用。
  • 这个例子想说明什么:这两个例子旨在展示 AH 回归的实用性解释优势。第一个例子展示了当 PH 假设可能不成立时,AH 回归能提供更稳定、更显著的效应估计。第二个例子展示了 AH 回归能同时提供相对和绝对效应度量,便于临床沟通。

🔎 结论是否比证明窄

  • 窄的地方:本文的证明主要依赖于删失模型被正确指定(对于机制 3)。但在真实数据例子中,作者使用了 Cox 模型来估计删失分布,并假设其正确。作者在讨论中承认了这一点,并指出“misspecification of the censoring model may lead to biased estimates”。这是一个重要的局限性。
  • 泛泛 claim 的地方:作者在摘要和引言中声称 AH 回归“can be more robust than Poisson regression in the presence of censoring”。这个 claim 在文中被证明了吗?实际上,本文的 AH 回归就是一个加权版本的稳健 Poisson 回归。它比“未加权的”Poisson 回归更稳健,因为后者会因删失而产生偏倚。但作者没有与“使用 IPCW 的 Poisson 回归”进行比较,所以这个 claim 有点模糊。

四、开放问题

  1. 半参数效率界:本文提出的加权稳健 Poisson 回归估计量是否达到了 AH(τ | Z) 的半参数效率界?这是一个重要的理论问题,扎根于本文未引用任何半参数效率理论这一事实。研究者可以尝试推导 AH 回归的 efficient influence function,并比较本文估计量的方差是否达到了该下界。
  2. 删失模型误设的稳健性:本文的机制 3 要求删失模型被正确指定。能否开发一个双重稳健的 AH 回归估计量,使得只要结局模型(AH 回归模型)或删失模型之一被正确指定,估计量就是相合的?这类似于因果推断中的双重稳健估计。扎根于本文讨论部分对删失模型误设的担忧。
  3. 最优 τ 的选择:AH 回归依赖于截断时间 τ 的选择。如何基于数据选择最优的 τ?是否存在一个“最小化方差”或“最大化检验功效”的 τ 选择准则?这是一个开放问题,扎根于本文未讨论 τ 的选择
  4. 与 RMST 回归的效率比较:本文没有与 RMST 回归进行系统的效率比较。在什么条件下,AH 回归比 RMST 回归更有效?反之亦然?这是一个实证问题,扎根于本文未进行此类比较

Maintained by 陈星宇 · Homepage · Source on GitHub

评论