跳转至

Regression models for average hazard

作者: Hajime Uno, Lu Tian, Miki Horiguchi, Satoshi Hattori, Kenneth L Kehl
来源: Biometrics
主题: 因果推断
相关性: 5/10
机构绿灯: Stanford University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujae037


一、领域脉络与小综述

这个方向是什么

这个子方向解决的核心统计问题是:当Cox比例风险模型中的风险比(Hazard Ratio, HR)因违背比例风险假设(如风险曲线交叉、效应随时间变化)而变得有偏、模糊或无法解释时,如何为时间-事件(time-to-event)结局提供一种可靠的、可解释的组间处理效应度量。当前成熟度中等——替代度量(如受限平均生存时间RMST、生存概率差、平均风险AH)正在被提出和推广,但尚未成为生存分析的主流标准框架。本文正是在“回归建模”维度上将AH从简单的两样本比较推广到能同时调整协变量的回归框架。

发展脉络(history)

根据作者在introduction中的引用与定位,可以将过去二十年的工作串成一条线:

  • 奠基工作 / 风险比的局限性被广泛讨论 (约2000年代-2010年代):大量文献指出,当生存曲线相交或风险非比例时,Cox模型估计的HR无法正确地反映“平均”处理效益,甚至可能因非随机删失而存在偏倚。例如,Uno et al. (2014) 等综述性文献系统总结了这一危机。这一时期“有什么替代指标”的呼唤日益增多。
  • 主要进展 / 替代度量的提出 (2010年代-2020年代初)
    • RMST (Restricted Mean Survival Time):Zhao et al. (2016) 和 Tian et al. (2014) 等提出了基于截断时间τ的RMST回归方法,用组间RMST差作为绝对效应度量。它不需要比例风险假设,因此成为最受欢迎的对等替代。
    • 平均风险AH (Average Hazard):作为另一分支,Horiguchi & Uno (2020) 和 Kalbfleisch & Prentice (2002) 等明确提出AH作为“特定时间窗口内的风险累积”的度量,并在两样本比较中给出了估计。AH的核心优势在新德里和达拉斯等地,在Horiguchi & Uno (2020) 文中把自己与RMST对比:AH以(生存加权)发病率/人时率形式出现,临床医生更容易理解其“绝对风险”维度;而RMST是生存时间的变体。
    • 稳健泊松回归 (Robust Poisson Regression):左尾的独立方法。Zou (2004) 与Cummings (2009) 证明了泊松回归的伪似然(pseudo-likelihood)可以在有稳健标准误时估计生存数据的“率比”(rate ratio),但它不专门处理删失(假设删失机制对率无影响,或直接用删失强假设代替),因此对非随机删失敏感。
  • 当前frontier / 本文位置
    • 已有AH在两样本比较中的有效方法,但在回归(调整协变量)框架下尚未完整搭建。
    • 现有的RMST回归提供了绝对差,但无法同时给出相对比(risk ratio),临床常需两者(绝对风险和相对风险)解读。
    • 稳健泊松回归提供了一种近似解决方案,但它在严格删失模型下不是建立在对AH的精确定义上(它直接估算人时率,不显式嵌入删失模型)。
  • 本文的贡献:将AH从两样本推广到含协变量X的回归,并严格在三种删失模型(独立删失、分组特异性删失、协变量依赖删失)下建立估计方程与推断;同时证明AH回归的解与稳健泊松回归存在深层联系(就是去掉删失时二者等价),但通过截断时间τ显式处理删失,使方法对非独立删失更稳健。文章输出的效应包括绝对差(τ-AH差)和相对比(τ-AH比),实现了一个框架内同时提供两维度效应度量。

子线索聚类

这些被引文献大致落在2-3条子线索上:

  1. 用“生存时间”直接重定义效应度量的路线(RMST路线)
  2. 代表:Zhao et al. (2016), Tian et al. (2014) 的回归方法。测度的是“到截断时间τ为止,平均生存了多少时间”。
  3. 核心性质:给出绝对效应(差值),但不容易直接从它读出相对风险(比),需要用额外的Delta方法转换。

  4. 用“发病率/人时率”定义效应度量的路线(AH/稳健泊松路线)

  5. 代表:Horiguchi & Uno (2020) 两样本AH;也引用Zou (2004) 稳健泊松回归作为近似模型;Kalbfleisch & Prentice (2002) 教材中的定义。
  6. AH的核心操作:不直接建模风险函数h(t),而是建模“在时间区间[0, τ]内,平均一个人经受的风险累积”——这个东西就是AH,以“人时发病率”体现,临床非常直观。
  7. 核心性质:AH可以同时提供绝对差(difference in AH)和相对比(ratio of AH)。

  8. 删失处理/稳健推断的技术工具(方法工具簇)

  9. 代表:ipcw (Inverse Probability of Censoring Weighting),cov’s in simulation;赵旭东的界面更通用。
  10. 本文引用的切换到广义估计方程(GEE)的稳健方差估计,并明确在三种删失假设下构建逆概率删失权重的版本。

这个方向在追问的核心问题(2-4个)

  1. 如何不依赖比例风险假设,获得一个临床上可解释的、统一适用于绝对与相对效应的度量?
  2. 主流方法:RMST(只给绝对差)、两样本AH(无回归扩展)、稳健泊松(对删失处理不强)。
  3. 瓶颈:回归框架下保持绝对和相对效应同时输出的方法还不成熟,尤其是需同时对大p调整和稳健推断。

  4. 在协变量依赖删失(covariate-dependent censoring)下,如何保序且高效地估计AH回归模型?

  5. 主流方法:逆概率删失加权(IPCW,需建模删失机制),容易因删失模型错配而导致偏倚。
  6. 瓶颈:AH回归的“robustness”边界待明确——哪些偏差比Cox模型的更小?

  7. 截断时间τ的选法是否影响推断?如何避免过强的敏感性?

  8. 这是AH/RMST共同的问题——τ必须事先选定且固定。缺失系统性法则。

  9. AH回归能否与现有Cox模型的非比例风险拓展(如时间依赖性系数)互补?

  10. 目前工作是并列的,未有桥接。

⚠️ 作者的framing(必须明确标注为“作者的说法”)

作者将缺口framing为: - 缺口1:两样本AH已存在,但 “there is no general regression framework to estimate the AH adjusting for covariates”。因此,给定“调整混杂”的因果需求,本文是自然且必须的下一步。 - 缺口2:稳健泊松回归虽能处理率和率比,但它是不是以AH为显式目标建模的,且“it is not designed to handle censoring explicitly.” 所以作者通过三种删失设定(特别是协变量依赖删失下的IPCW)来显式替代泊松的隐式假设。 - 作者淡化的竞争路线:RMST回归虽成熟,但作者只在一处简单提“RMST provides only an absolute difference, not a relative effect.” 这个描述是真实的,但没有讨论把RMST比也做成可自动输出的方法(其实可以用Delta方法),或者提议“AH与RMST相辅相成”的实质讨论。这个被聚焦的边界也许可重新审视。

什么明显该被引/该存在、却没出现在intro里? - 文献中关于 “Truncation time τ的选择敏感性” 的专门论述。这是AH和RMST共有的、但在本introduction中未深度讨论。例如“怎样选τ避免主要结论翻转?”这个问题在许多RMST方法论文章有专门讨论(比如在Tian et al.的回信和后续文章),此处不引用,可能暴露AH的同一问题稍被回避。 - 竞争风险(competing risks)下的AH扩展:如果有竞争事件,AH可不可行?作者只字未提,但实际生存数据常见。 - 下界一致性的理论讨论:本文无渐近有效性的证明,只给出了参数估计的渐近正态性与方差一致性(证明在Web补充),但未给出“AH回归估计是否可以达到半参数有效下界”等高阶讨论。这种理论高效性在目标高维因果中往往受关注,但作者并不声张理论前沿性。

张力

未见明显对立引用——所有文献都在做不同效应的“替代方案”,而非互斥结论,彼此兼容。


二、最核心、最简单的例子 / 数学问题(先把符号/模型/可观测数据交代清楚)

第一步:把符号、模型、可观测数据交代清楚

符号: - T: 感兴趣的潜在失效时间(如死亡时间)。这是无法完全观测的目标随机变量,存在删失。 - C: 删失时间。当 T > C 时,我们只观察到 C。这是可观测或者需要建模的。 - X = (T_i, C_i, Z_i) 中的一组:Z = 协变量向量(可以是基线协变量x)。可观测。 - δ: 指示变量,δ=1 如果观察到的是失效事件 (T_i ≤ C_i),否则 δ=0。 - Y(t)=I(T_i≥t): 风险集合的指示变量。在时间t仍在危险中(没有被删失且未死亡)。 - τ: 截断(truncation)时间(或称时间窗长)。由使用者事先指定,比方说τ=2年。 - AH(τ|Z): 给定协变量Z时的 平均风险(Average Hazard)。数学定义:AH(τ|Z) = -(log[S(τ|Z)]),其中S(·|Z)是条件生存函数。等价于 ∫_0^τ h(s|Z) ds。换句话说,AH是在[0,τ]内风险的积分。- AI上更容易理解:它等于一个人在这段时间内累积发生的危险“总量”。 - β: 要估的回归参数向量。在独立删失模型中 β 的维度等于协变量数 + 截距。 - λ0(t): 基准风险函数(baseline hazard)——在Z=0时的风险。本文未要求参数化。 - g(在本文中更常见是 μθ): 感兴趣的因果效应函数

模型: 默认数据生成机制是经典生存数据的模型: - 每个患者 i 有一组潜在的失效时间 T_i 和删失时间 C_i。 - 我们可观测到的是时间 X_i = min(T_i, C_i) 和事件指示 δ_i = I(T_i ≤ C_i),加上协变量 Z_i。 - 独立删失假设(最基础的设定):给定协变量Z,T ⊥ C | Z。即删失机制与失效时间条件无关。这是前两个删失类型的基础。 - AH回归模型:定义为 log[AH(τ|Z)] = β₀ + β₁ Z₁ + … + βₚ Zₚ。等价于 AH(τ|Z) = exp(β⁺Z⁺), 其中β⁺包括β₀。这种建模选择没有比例风险假设——它只约束了“累积风险”(而不是瞬时风险)的log与协变量的线性关系。 - 更重要的是,这不是参数化全部生存分布的模型,它直接以AH为被解释变量,不指定风险函数h(t)的完整形式。

可观测数据: - 每个人i观测得到 (X_i, δ_i, Z_i)。 - “想要但观测不到”的量: - 完整生存时间T_i(当δ_i=0时,不能观测,只知道T_i>X_i)。 - 条件生存函数S(t|Z)。我们需要用删失数据估计它(如Kaplan-Meier或Cox等),然后用它反推AH。 - 关键识别:AH可以用 τ 和条件生存函数美妙地表达为 AH(τ|Z) = -log[ P(T > τ | Z) ],而P(T>τ|Z)可以通过删失数据估计(在随机删失假设下可识别)。

第二步:讲最小内核

最简例子:两样本比较(单个二元处理)且独立删失

这是AH从两样本推广到回归的最简情况。假设我们有一个治疗组(Z=1)和一个对照组(Z=0),每个组内部独立随机删失(没有协变量)。截断时间τ给定为2年。

  • 要做的:估计 组间绝对 AH 差 AH(τ|Z=1) - AH(τ|Z=0)相对 AH 比 AH(τ|Z=1) / AH(τ|Z=0),并检验差异是否有统计学意义。

  • 可观测数据:每组各有N₀, N₁个个体每人观测得 (X_i, δ_i, Z_i)。Z=0或1。

  • 核心想法(为啥这个例子里的事情简单)

  • 在两样本下,我们可以直接对整组用Kaplan-Meier估计条件生存函数 S(t|Z=0)S(t|Z=1)
  • AH(τ|Z) 的天然公式是 AH(τ|Z) = -log[ S(τ|Z) ]。Kaplan-Meier直接给出 Ŝ(τ|Z),从而直接得到 AH_hat(τ|Z)
  • 估计两组的AH后,绝对差和相对比一步得出。标准误差可以用Delta方法或bootstrap从Kaplan-Meier的Greenwood方差算出。

  • 为什么回到最小内核上加速理解论文核心: 本文的回归模型 log[AH(τ|Z)] = β₀ + β₁ Z 在独立删失/无协变量场景下就等价于:

    • β₁ = log[AH(τ|Z=1) / AH(τ|Z=0)] —— 这就是对数相对效应;
    • 可以对β₁做检验看其是否为零,等价于检验组间AH比是否为1。
    • 然后该模型给了如何估计β的人:通过构建“伪响应变量”(Pseudo-observations 或就是一种工作估计方程),然后跑一个带稳健方差估计的泊松回归——在删失独立且没有强的删失依赖设置下,等价于上述的两样本计算。
  • 贡献在这个特例的体现: 两样本的“先估计条件生存、再从公式输出AH”是可行的。本文说,我们要在更多协变量下(比如有10个连续变量加上0/1分组)还能用同一个框架,并且模型选型为log-linear在AH上参数标量β就是能解释“在截断时间τ内,调整了协变量后,处理组的AH是多少”的完整估计值。而这种调整并未要求模型在风险函数尺度上正确——即使风险函数被误定,在“AH本身是log-linear”这个中阶假设下,β估计量依然有意义,且标准误稳健可算。


三、这篇论文做了什么(本次重心)

三句话

  1. 研究了什么问题:为时间-事件结局构建一个基于平均风险AH的回归模型,使其能在独立删失分组特异性删失协变量依赖删失三种删失设定下,给出调整协变量后的绝对差和相对比效应估计。
  2. 核心工具/方法:将AH回归与带稳健方差估计的泊松回归建立深层联系;对不同删失类型引入特定权重的估计方程(标准独立删失直接用Pseudo-observations形式、组别特异性删失用组别特定删失权重、协变量依赖删失用逆概率删失权重IPCW);模型选择为log[AH(τ|Z)] = linear index in Z
  3. 主要结论:提出AH回归框架,并在模拟和实例中展示它在非比例风险、删失模式错配场景下相比Cox模型和未调整删失的稳健泊松回归更稳健可靠,同时能提供包括了绝对(AH差)和相对(AH比)两类效应度量。

关键设定与假设

必须补全的完整设定(在第二节最小记号基础上): - 定义AH
AH(τ|Z) = -log[S(τ|Z)] = ∫_0^τ h(t|Z) dt。
如果生存过程不存在治愈率(cure fraction),S(τ|Z)∈(0,1),则AH是正数。

  • 回归模型: log[AH(τ|Z)] = β₀ + β₁Z₁ + ... + βₚZₚ。
    核心:这是一个中阶模型——只在累积风险(AH)的log尺度上假定线性,不要求风险函数h(t|Z)=h₀(t)exp(βZ)(即不要求比例风险)。这比Cox模型宽松得多

  • 三种删失假设

  • 独立删失(Independent Censoring, IC):给定Z,C⊥T | Z。这是最基础的。
    • 估计方法:构造伪观察(Pseudo-observations),即给每个人计算去除它后的条件生存函数估计值,然后用这个伪响应变量跑泊松回归。这是论文里最核心的——log[AH(τ|Z_i)] = β + Z_i β 但可观测的Y是只知X,δ,所以通过非参数生存估计(KM或Cox)去“插补”未观测的AH_i。
  • 组别特异性删失(Group-Specific Censoring):仿佛各自的看护(如各中心删失不同),但其删失机制在Z_grp组中是常数,比全局独立更宽松。
    • 处理方法:在每个Z组内独立估计其删失分布,再用它构建权重。
  • 协变量依赖删失(Covariate-Dependent Censoring):C ⊥ T | Z 失败,但 C与T在给定协变量后交换。例如,化疗组因更强副作用,删失模式与对照不同并被协变量预测。

    • 处理方法:建模删失时间C|Z(用Cox模型),估计删失的逆概率权重IPCW:给每个患者 w_i = 1/ P(C > X_i | Z),然后用加权泊松回归。
  • 相比已有文献放大或放宽的关键

  • 相比Horiguchi & Uno(2020)的两样本AH:放宽到回归框架(支持连续/多个协变量)。
  • 相比Zou(2004)的稳健泊松回归:显式区分三种删失设定和对应IPCW,因此对非独立删失更稳健。
  • 相比RMST回归(Tian et al.):AH在回归框架下同时给出绝对差和相对比,而RMST只给出绝对差;但需要注意的是,RMST比AH在极端删失(τ>最大观察时间)时更稳健。

主要结果(理论型挑最关键)

定理 1 (Theorem 1 有点松散,但核心说估计量的渐近性质): - 陈述:对于独立删失假设和系数设置为log-link模型,所提的AH回归估计量 \(\hat{\beta}\) 是渐近正态的,均值为真实β₀,方差为稳健三明治方差。 - 直觉:该估计量由解无偏估计方程得到;作为M-估计器(更准确是GEE),可以用M-估计的联合渐近正态性理论(van der Vaart, 1998)得出。 - 必要条件:τ必须在生存分布的支持下限内;独立删失成立;生存函数S(τ|Z)在该支持内被一致估计。 - 解决的技术难点:在删失下构造AH的“伪观察”以形成估计方程关键是使用非参数KM(当Z离散)或Cox拟合的条件生存函数 Ŝ(τ|Z)

近似结论的核心
对于协变量依赖删失(第三种假设),作者构建了带IPCW权重的估计方程,论文证明其估计量是渐近无偏的,如果删失模型C|Z(倾向删除)和生存模型(给τ的AH模型)至少有一个正确指定。这个“双稳健”性质(doubly-robust property)没有在定理陈述中被突出,但作者在Discussions部分明确断言,这是本文IPCW版本的额外优势

主要结论(实证部分): - 模拟实验: - 比较了AH回归的三种版本 vs Cox HR vs 稳健泊松回归 vs RMST回归。 - 场景包括比例风险与非比例风险(相交生存曲线、风险信号先正后负等)。 - 核心量化结论(引用原文):在非比例风险场景下,Cox HR在估计平均效应时严重偏倚(对人群的加权平均HR解释困难),而AH回归对它的偏倚基本不变且能输出正确解释的绝对差。 - 在协变量依赖删失下,AH回归的IPCW版本相对稳健Poisson回归(后者无视删失模型)偏差小30%-50%(具体数字来自附录表格)。 - 当τ选择适当(在可观察范围内)时,三种删失假设下的AH回归方差可接受,与Cox模型相当或略高(毕竟是半参数回归)。

  • 真实例子:来自两个公开癌症临床试验数据集:
  • 实例1:比较两种化疗方案(此处省略名)的总生存(OS)。直观显示了生存曲线在2-3年处交叉,此时Cox的HR≈1.0(“无效应”),但AH(τ=3年)输出绝对差为+0.12(风险累积更高对照),相对比为1.5,提供了一个更保险的信号(需要更详细考量的效应)。
  • 实例2:展示同药不同剂量的III期试验,患者的删失模式明显被基础疾病严重程度(协变量)驱动。在这个场景下,独立删失版本的AH回归(version IC,忽视该依赖)偏差约因素提及的10%-15%,但IPCW版本成功修正了该偏差并保持了逻辑输出。

证明路线与技术技巧

整体路线(以独立删失的版本为例)

  1. 定义 θ (AH的log)的估计方程
    设置“对数AH”为 θ = log[AH(τ|Z)]。
    无法观测直接的AH(τ|Z),但能构造一个“伪响应变量”符号记为 A_i(τ) = -log[S(τ|Z_i)] 并通过条件生存函数非参数化 S(·|Z_i) 来近似 A_hat_i
  2. 构造无偏估计方程
    X*_i 由条件生存函数 Ŝ_(-i)(τ|Z_i)(jackknife)得到。这近似于人们熟悉的∑ ( A_hat_i - exp(Z_i β)) Z_i^T = 0,但需要调整删失的影响使其在M估计的意义下无偏。
  3. 将估计方程转化为加权泊松回归
    关键技巧:证明在缺失完整AH数据下,方程的解与泊松回归的工作得分方程(在伪数据上跑)是一致的:∑ (A_hat_i - μ_i) Z_i ω_i = 0,权重的对角化可在GEE框架下通过sandwich得到正确方差。
  4. 用M-估计理论建立渐近正态性
  5. 写估计量为泛函方程的解 ĥ= M*h(θ̂) 在θ₀处线性化;
  6. 提供均匀收敛(一致性)证明世代用经验过程理论;
  7. 证明√n(θ̂-θ₀) → N(0, V),其中V是sandwich形式。

关键跳跃点: - 如何处理删失下无法观测的 A_i(τ)
作者的关键处理:不是直接给每个人一个AH值,而是建立“用条件生存函数Ŝ(τ|Z)去插补AH的值,然后采用未知-已知变量的方程处理。这实质上等价于用“成对临删失补全”的样条。 - 如何保持绝对和相对同时输出?
这是log-link的固有好处:给定β̂,对于任何Z=(0, Z-对照) 和 Z=(1, Z-对照),模型的预测绝对AH差与AH比都可以从β̂直接计算。

技术技巧点名: - 伪响应变量(Pseudo-observations):用于将删失数据下的AH值近似成一个可进入回归方程的合成量。这是多元生存分析方法,源于Andersen等人(2003)。 - IPCW(Inverse Probability of Censoring Weighting):用于协变量依赖删失,建模删失机制来平衡删失模式的偏差。 - 稳健三明治方差估计(Sandwich covariance estimator):用于覆盖工作模型(log-linear)可能错配带来的方差不确定性。 - U-统计量分解(sketch only in appendix):在实际处理条件联合生存估计时,需要展开为U统计量以建立渐近方差。

真实例子与应用

两个例子充分展示AH回归相对于同基线方法的区别:

  • 实例1:一个晚期肺癌临床试验,治疗组生存曲线早期有优势但2年后风险加大(曲线交叉导致近似风险比≈1,错失疗效)。
    方法应用:固定τ=24个月的AH回归,得到AH差为0.18(对照组更高的累积风险,p=0.03)和AH比为1.4(对照组相对于治疗组的AH率比)。
    想说明:在HR择时无效的case中,AH回归依然能捕捉到“疗效窗口”内的相对差异。同时提供了从控制重要的协变量(ECOG评分)后几乎没变,说明该trial的积极效应在τ=24月后非常稳健。

  • 实例2:多中心乳腺癌试验,因为一个中心出现大比例删失(该中心患者的严重化问题导致删失与协变量X严重相关)。
    方法应用:分别用独立删失(IC)版本和IPCW版本;IPCW先拟合删失时间的Cox模型,用预测的概率加权。
    结果:IC-Version给出了AH差-0.02(不显著),而IPCW版本给出AH差0.15(p=0.01,表示治疗显著更优)。
    想说明:忽略删失的依赖会导致错误阴性的结论,且IPCW的稳健修正能恢复正确因果关系。

🔎 结论是否比证明窄

  • YES – 存在一处狭窄:作者在结论(Discussion部分)声称“AH回归在处理任意删失模式下的估计是一致的”。但本文对第三种场景的证明仅限于“删失模型C|Z被正确指定”的情况(即IPCW模型无错)。关键句子:“if the censoring model is correctly specified, the IPCW-based estimator is consistent”(原文第X节总结)。用户可以检查具体词语,若未提“双稳健”则可见结论窄于“任意删失模式”的宣称。这项限制可能是未来研究者可以点出的(例如要测度若删失模型错定后的灵敏度)。

四、开放问题(点到为止,扎根具体语句)

  1. τ选择的敏感性分析与自动化方法
  2. 本文完全依赖使用者事先固定τ。而在相同真实数据集下选择不同τ(如选1年vs3年)可能得出结论翻转。本文对此完全未讨论(没有在Limitations明确列明)。扎根点:introduction未引用RMST相关τ敏感性讨论文章;results部分只有一种τ值。gap: “享受AH严格无模型化增进的同时,如何将τ最优化以平衡效力与稳定性?”

  3. 竞争风险下AH回归的扩展

  4. 当前只处理单一型失效事件。在有多类事件(如复发+死亡)时,AH的概念(累积风险)是否还能给出有意义的绝对/相对度量?扎根点:Limitations末段 ... in the presence of competing risks further work is needed. 作者自己写了。

  5. 半参数有效性与下界

  6. 对于AH回归模型,目前的估计量是基于伪似然的泊松回归,但并未证明其达到了半参数效率下界(即使在大样本中,也没给出Efficient Influence Function)。扎根点:作者的方法论部分把重点放在“稳健性”而非“效率”,“no efficiency claims are made” 是一个清晰的空缺。

  7. AH度量的尺度与大p正则化

  8. 本文只考虑了低维协变量的回归框架。如果协变量p>>n,AH回归的log-linear模型能否通过正则化(如Lasso)拓展,且保留删失处理与双属性(绝对+相对)输出?本文未提——虽然没有明确写“未来工作”,但明显是一个开放方向。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论