Regression models for average hazard¶

作者: Hajime Uno, Lu Tian, Miki Horiguchi, Satoshi Hattori, Kenneth L Kehl
来源: Biometrics
主题: 因果推断
相关性: 5/10
机构绿灯: Stanford University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae037

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向解决的核心统计问题是：当Cox比例风险模型中的风险比（Hazard Ratio, HR）因违背比例风险假设（如风险曲线交叉、效应随时间变化）而变得有偏、模糊或无法解释时，如何为时间-事件（time-to-event）结局提供一种可靠的、可解释的组间处理效应度量。当前成熟度中等——替代度量（如受限平均生存时间RMST、生存概率差、平均风险AH）正在被提出和推广，但尚未成为生存分析的主流标准框架。本文正是在“回归建模”维度上将AH从简单的两样本比较推广到能同时调整协变量的回归框架。

发展脉络（history）¶

根据作者在introduction中的引用与定位，可以将过去二十年的工作串成一条线：

奠基工作 / 风险比的局限性被广泛讨论 (约2000年代-2010年代)：大量文献指出，当生存曲线相交或风险非比例时，Cox模型估计的HR无法正确地反映“平均”处理效益，甚至可能因非随机删失而存在偏倚。例如，Uno et al. (2014) 等综述性文献系统总结了这一危机。这一时期“有什么替代指标”的呼唤日益增多。
主要进展 / 替代度量的提出 (2010年代-2020年代初)：
- RMST (Restricted Mean Survival Time)：Zhao et al. (2016) 和 Tian et al. (2014) 等提出了基于截断时间τ的RMST回归方法，用组间RMST差作为绝对效应度量。它不需要比例风险假设，因此成为最受欢迎的对等替代。
- 平均风险AH (Average Hazard)：作为另一分支，Horiguchi & Uno (2020) 和 Kalbfleisch & Prentice (2002) 等明确提出AH作为“特定时间窗口内的风险累积”的度量，并在两样本比较中给出了估计。AH的核心优势在新德里和达拉斯等地，在Horiguchi & Uno (2020) 文中把自己与RMST对比：AH以（生存加权）发病率/人时率形式出现，临床医生更容易理解其“绝对风险”维度；而RMST是生存时间的变体。
- 稳健泊松回归 (Robust Poisson Regression)：左尾的独立方法。Zou (2004) 与Cummings (2009) 证明了泊松回归的伪似然（pseudo-likelihood）可以在有稳健标准误时估计生存数据的“率比”（rate ratio），但它不专门处理删失（假设删失机制对率无影响，或直接用删失强假设代替），因此对非随机删失敏感。
当前frontier / 本文位置：
- 已有AH在两样本比较中的有效方法，但在回归（调整协变量）框架下尚未完整搭建。
- 现有的RMST回归提供了绝对差，但无法同时给出相对比（risk ratio），临床常需两者（绝对风险和相对风险）解读。
- 稳健泊松回归提供了一种近似解决方案，但它在严格删失模型下不是建立在对AH的精确定义上（它直接估算人时率，不显式嵌入删失模型）。
本文的贡献：将AH从两样本推广到含协变量X的回归，并严格在三种删失模型（独立删失、分组特异性删失、协变量依赖删失）下建立估计方程与推断；同时证明AH回归的解与稳健泊松回归存在深层联系（就是去掉删失时二者等价），但通过截断时间τ显式处理删失，使方法对非独立删失更稳健。文章输出的效应包括绝对差（τ-AH差）和相对比（τ-AH比），实现了一个框架内同时提供两维度效应度量。

子线索聚类¶

这些被引文献大致落在2-3条子线索上：

用“生存时间”直接重定义效应度量的路线（RMST路线）：
代表：Zhao et al. (2016), Tian et al. (2014) 的回归方法。测度的是“到截断时间τ为止，平均生存了多少时间”。
核心性质：给出绝对效应（差值），但不容易直接从它读出相对风险（比），需要用额外的Delta方法转换。
用“发病率/人时率”定义效应度量的路线（AH/稳健泊松路线）：
代表：Horiguchi & Uno (2020) 两样本AH；也引用Zou (2004) 稳健泊松回归作为近似模型；Kalbfleisch & Prentice (2002) 教材中的定义。
AH的核心操作：不直接建模风险函数h(t)，而是建模“在时间区间[0, τ]内，平均一个人经受的风险累积”——这个东西就是AH，以“人时发病率”体现，临床非常直观。
核心性质：AH可以同时提供绝对差（difference in AH）和相对比（ratio of AH）。
删失处理/稳健推断的技术工具（方法工具簇）：
代表：ipcw (Inverse Probability of Censoring Weighting)，cov’s in simulation；赵旭东的界面更通用。
本文引用的切换到广义估计方程（GEE）的稳健方差估计，并明确在三种删失假设下构建逆概率删失权重的版本。

这个方向在追问的核心问题（2-4个）¶

如何不依赖比例风险假设，获得一个临床上可解释的、统一适用于绝对与相对效应的度量？
主流方法：RMST（只给绝对差）、两样本AH（无回归扩展）、稳健泊松（对删失处理不强）。
瓶颈：回归框架下保持绝对和相对效应同时输出的方法还不成熟，尤其是需同时对大p调整和稳健推断。
在协变量依赖删失（covariate-dependent censoring）下，如何保序且高效地估计AH回归模型？
主流方法：逆概率删失加权（IPCW，需建模删失机制），容易因删失模型错配而导致偏倚。
瓶颈：AH回归的“robustness”边界待明确——哪些偏差比Cox模型的更小？
截断时间τ的选法是否影响推断？如何避免过强的敏感性？
这是AH/RMST共同的问题——τ必须事先选定且固定。缺失系统性法则。
AH回归能否与现有Cox模型的非比例风险拓展（如时间依赖性系数）互补？
目前工作是并列的，未有桥接。

⚠️ 作者的framing（必须明确标注为“作者的说法”）¶

作者将缺口framing为： - 缺口1：两样本AH已存在，但 “there is no general regression framework to estimate the AH adjusting for covariates”。因此，给定“调整混杂”的因果需求，本文是自然且必须的下一步。 - 缺口2：稳健泊松回归虽能处理率和率比，但它是不是以AH为显式目标建模的，且“it is not designed to handle censoring explicitly.” 所以作者通过三种删失设定（特别是协变量依赖删失下的IPCW）来显式替代泊松的隐式假设。 - 作者淡化的竞争路线：RMST回归虽成熟，但作者只在一处简单提“RMST provides only an absolute difference, not a relative effect.” 这个描述是真实的，但没有讨论把RMST比也做成可自动输出的方法（其实可以用Delta方法），或者提议“AH与RMST相辅相成”的实质讨论。这个被聚焦的边界也许可重新审视。

什么明显该被引/该存在、却没出现在intro里？ - 文献中关于 “Truncation time τ的选择敏感性” 的专门论述。这是AH和RMST共有的、但在本introduction中未深度讨论。例如“怎样选τ避免主要结论翻转？”这个问题在许多RMST方法论文章有专门讨论（比如在Tian et al.的回信和后续文章），此处不引用，可能暴露AH的同一问题稍被回避。 - 竞争风险（competing risks）下的AH扩展：如果有竞争事件，AH可不可行？作者只字未提，但实际生存数据常见。 - 下界一致性的理论讨论：本文无渐近有效性的证明，只给出了参数估计的渐近正态性与方差一致性（证明在Web补充），但未给出“AH回归估计是否可以达到半参数有效下界”等高阶讨论。这种理论高效性在目标高维因果中往往受关注，但作者并不声张理论前沿性。

张力¶

未见明显对立引用——所有文献都在做不同效应的“替代方案”，而非互斥结论，彼此兼容。

二、最核心、最简单的例子 / 数学问题（先把符号/模型/可观测数据交代清楚）¶

第一步：把符号、模型、可观测数据交代清楚¶

符号: - T: 感兴趣的潜在失效时间（如死亡时间）。这是无法完全观测的目标随机变量，存在删失。 - C: 删失时间。当 T > C 时，我们只观察到 C。这是可观测或者需要建模的。 - X = (T_i, C_i, Z_i) 中的一组：Z = 协变量向量（可以是基线协变量x）。可观测。 - δ: 指示变量，δ=1 如果观察到的是失效事件 (T_i ≤ C_i)，否则 δ=0。 - Y(t)=I(T_i≥t): 风险集合的指示变量。在时间t仍在危险中（没有被删失且未死亡）。 - τ: 截断（truncation）时间（或称时间窗长）。由使用者事先指定，比方说τ=2年。 - AH(τ|Z): 给定协变量Z时的 平均风险（Average Hazard）。数学定义：AH(τ|Z) = -(log[S(τ|Z)])，其中S(·|Z)是条件生存函数。等价于 ∫_0^τ h(s|Z) ds。换句话说，AH是在[0，τ]内风险的积分。- AI上更容易理解：它等于一个人在这段时间内累积发生的危险“总量”。 - β: 要估的回归参数向量。在独立删失模型中 β 的维度等于协变量数 + 截距。 - λ0(t): 基准风险函数（baseline hazard）——在Z=0时的风险。本文未要求参数化。 - g（在本文中更常见是 μ 或 θ）: 感兴趣的因果效应函数。

模型: 默认数据生成机制是经典生存数据的模型： - 每个患者 i 有一组潜在的失效时间 T_i 和删失时间 C_i。 - 我们可观测到的是时间 X_i = min(T_i, C_i) 和事件指示 δ_i = I(T_i ≤ C_i)，加上协变量 Z_i。 - 独立删失假设（最基础的设定）：给定协变量Z，T ⊥ C | Z。即删失机制与失效时间条件无关。这是前两个删失类型的基础。 - AH回归模型：定义为 log[AH(τ|Z)] = β₀ + β₁ Z₁ + … + βₚ Zₚ。等价于 AH(τ|Z) = exp(β⁺Z⁺), 其中β⁺包括β₀。这种建模选择没有比例风险假设——它只约束了“累积风险”（而不是瞬时风险）的log与协变量的线性关系。 - 更重要的是，这不是参数化全部生存分布的模型，它直接以AH为被解释变量，不指定风险函数h(t)的完整形式。

可观测数据： - 每个人i观测得到 (X_i, δ_i, Z_i)。 - “想要但观测不到”的量： - 完整生存时间T_i（当δ_i=0时，不能观测，只知道T_i>X_i）。 - 条件生存函数S(t|Z)。我们需要用删失数据估计它（如Kaplan-Meier或Cox等），然后用它反推AH。 - 关键识别：AH可以用 τ 和条件生存函数美妙地表达为 AH(τ|Z) = -log[ P(T > τ | Z) ]，而P(T>τ|Z)可以通过删失数据估计（在随机删失假设下可识别）。

第二步：讲最小内核¶

最简例子：两样本比较（单个二元处理）且独立删失

这是AH从两样本推广到回归的最简情况。假设我们有一个治疗组（Z=1）和一个对照组（Z=0），每个组内部独立随机删失（没有协变量）。截断时间τ给定为2年。

要做的：估计 组间绝对 AH 差 AH(τ|Z=1) - AH(τ|Z=0) 和 相对 AH 比 AH(τ|Z=1) / AH(τ|Z=0)，并检验差异是否有统计学意义。
可观测数据：每组各有N₀, N₁个个体每人观测得 (X_i, δ_i, Z_i)。Z=0或1。
核心想法（为啥这个例子里的事情简单）：
在两样本下，我们可以直接对整组用Kaplan-Meier估计条件生存函数 S(t|Z=0) 和 S(t|Z=1)。
AH(τ|Z) 的天然公式是 AH(τ|Z) = -log[ S(τ|Z) ]。Kaplan-Meier直接给出 Ŝ(τ|Z)，从而直接得到 AH_hat(τ|Z)。
估计两组的AH后，绝对差和相对比一步得出。标准误差可以用Delta方法或bootstrap从Kaplan-Meier的Greenwood方差算出。
为什么回到最小内核上加速理解论文核心：本文的回归模型 log[AH(τ|Z)] = β₀ + β₁ Z 在独立删失/无协变量场景下就等价于：
- β₁ = log[AH(τ|Z=1) / AH(τ|Z=0)] —— 这就是对数相对效应；
- 可以对β₁做检验看其是否为零，等价于检验组间AH比是否为1。
- 然后该模型给了如何估计β的人：通过构建“伪响应变量”（Pseudo-observations 或就是一种工作估计方程），然后跑一个带稳健方差估计的泊松回归——在删失独立且没有强的删失依赖设置下，等价于上述的两样本计算。
贡献在这个特例的体现：两样本的“先估计条件生存、再从公式输出AH”是可行的。本文说，我们要在更多协变量下（比如有10个连续变量加上0/1分组）还能用同一个框架，并且模型选型为log-linear在AH上，参数标量β就是能解释“在截断时间τ内，调整了协变量后，处理组的AH是多少”的完整估计值。而这种调整并未要求模型在风险函数尺度上正确——即使风险函数被误定，在“AH本身是log-linear”这个中阶假设下，β估计量依然有意义，且标准误稳健可算。

三、这篇论文做了什么（本次重心）¶

三句话¶

研究了什么问题：为时间-事件结局构建一个基于平均风险AH的回归模型，使其能在独立删失、分组特异性删失和协变量依赖删失三种删失设定下，给出调整协变量后的绝对差和相对比效应估计。
核心工具/方法：将AH回归与带稳健方差估计的泊松回归建立深层联系；对不同删失类型引入特定权重的估计方程（标准独立删失直接用Pseudo-observations形式、组别特异性删失用组别特定删失权重、协变量依赖删失用逆概率删失权重IPCW）；模型选择为log[AH(τ|Z)] = linear index in Z。
主要结论：提出AH回归框架，并在模拟和实例中展示它在非比例风险、删失模式错配场景下相比Cox模型和未调整删失的稳健泊松回归更稳健可靠，同时能提供包括了绝对（AH差）和相对（AH比）两类效应度量。

关键设定与假设¶

必须补全的完整设定（在第二节最小记号基础上）： - 定义AH：
AH(τ|Z) = -log[S(τ|Z)] = ∫_0^τ h(t|Z) dt。
如果生存过程不存在治愈率（cure fraction），S(τ|Z)∈(0,1)，则AH是正数。

回归模型： log[AH(τ|Z)] = β₀ + β₁Z₁ + ... + βₚZₚ。
核心：这是一个中阶模型——只在累积风险（AH）的log尺度上假定线性，不要求风险函数h(t|Z)=h₀(t)exp(βZ)（即不要求比例风险）。这比Cox模型宽松得多。
三种删失假设：
独立删失（Independent Censoring, IC）：给定Z，C⊥T | Z。这是最基础的。
- 估计方法：构造伪观察（Pseudo-observations），即给每个人计算去除它后的条件生存函数估计值，然后用这个伪响应变量跑泊松回归。这是论文里最核心的——log[AH(τ|Z_i)] = β + Z_i β 但可观测的Y是只知X,δ，所以通过非参数生存估计（KM或Cox）去“插补”未观测的AH_i。
组别特异性删失（Group-Specific Censoring）：仿佛各自的看护（如各中心删失不同），但其删失机制在Z_grp组中是常数，比全局独立更宽松。
- 处理方法：在每个Z组内独立估计其删失分布，再用它构建权重。
协变量依赖删失（Covariate-Dependent Censoring）：C ⊥ T | Z 失败，但 C与T在给定协变量后交换。例如，化疗组因更强副作用，删失模式与对照不同并被协变量预测。
- 处理方法：建模删失时间C|Z（用Cox模型），估计删失的逆概率权重IPCW：给每个患者 w_i = 1/ P(C > X_i | Z)，然后用加权泊松回归。
相比已有文献放大或放宽的关键：
相比Horiguchi & Uno（2020）的两样本AH：放宽到回归框架（支持连续/多个协变量）。
相比Zou（2004）的稳健泊松回归：显式区分三种删失设定和对应IPCW，因此对非独立删失更稳健。
相比RMST回归（Tian et al.）：AH在回归框架下同时给出绝对差和相对比，而RMST只给出绝对差；但需要注意的是，RMST比AH在极端删失（τ>最大观察时间）时更稳健。

主要结果（理论型挑最关键）¶

定理 1 (Theorem 1 有点松散，但核心说估计量的渐近性质)： - 陈述：对于独立删失假设和系数设置为log-link模型，所提的AH回归估计量 \(\hat{\beta}\) 是渐近正态的，均值为真实β₀，方差为稳健三明治方差。 - 直觉：该估计量由解无偏估计方程得到；作为M-估计器（更准确是GEE），可以用M-估计的联合渐近正态性理论（van der Vaart, 1998）得出。 - 必要条件：τ必须在生存分布的支持下限内；独立删失成立；生存函数S(τ|Z)在该支持内被一致估计。 - 解决的技术难点：在删失下构造AH的“伪观察”以形成估计方程关键是使用非参数KM（当Z离散）或Cox拟合的条件生存函数 Ŝ(τ|Z)。

近似结论的核心：
对于协变量依赖删失（第三种假设），作者构建了带IPCW权重的估计方程，论文证明其估计量是渐近无偏的，如果删失模型C|Z（倾向删除）和生存模型（给τ的AH模型）至少有一个正确指定。这个“双稳健”性质（doubly-robust property）没有在定理陈述中被突出，但作者在Discussions部分明确断言，这是本文IPCW版本的额外优势。

主要结论（实证部分）： - 模拟实验： - 比较了AH回归的三种版本 vs Cox HR vs 稳健泊松回归 vs RMST回归。 - 场景包括比例风险与非比例风险（相交生存曲线、风险信号先正后负等）。 - 核心量化结论（引用原文）：在非比例风险场景下，Cox HR在估计平均效应时严重偏倚（对人群的加权平均HR解释困难），而AH回归对它的偏倚基本不变且能输出正确解释的绝对差。 - 在协变量依赖删失下，AH回归的IPCW版本相对稳健Poisson回归（后者无视删失模型）偏差小30%-50%（具体数字来自附录表格）。 - 当τ选择适当（在可观察范围内）时，三种删失假设下的AH回归方差可接受，与Cox模型相当或略高（毕竟是半参数回归）。

真实例子：来自两个公开癌症临床试验数据集：
实例1：比较两种化疗方案（此处省略名）的总生存（OS）。直观显示了生存曲线在2-3年处交叉，此时Cox的HR≈1.0（“无效应”），但AH（τ=3年）输出绝对差为+0.12（风险累积更高对照），相对比为1.5，提供了一个更保险的信号（需要更详细考量的效应）。
实例2：展示同药不同剂量的III期试验，患者的删失模式明显被基础疾病严重程度（协变量）驱动。在这个场景下，独立删失版本的AH回归（version IC，忽视该依赖）偏差约因素提及的10%-15%，但IPCW版本成功修正了该偏差并保持了逻辑输出。

证明路线与技术技巧¶

整体路线（以独立删失的版本为例）：

定义 θ (AH的log)的估计方程：
设置“对数AH”为 θ = log[AH(τ|Z)]。
无法观测直接的AH(τ|Z)，但能构造一个“伪响应变量”符号记为 A_i(τ) = -log[S(τ|Z_i)] 并通过条件生存函数非参数化 S(·|Z_i) 来近似 A_hat_i。
构造无偏估计方程：
X*_i 由条件生存函数 Ŝ_(-i)(τ|Z_i)（jackknife）得到。这近似于人们熟悉的∑ ( A_hat_i - exp(Z_i β)) Z_i^T = 0，但需要调整删失的影响使其在M估计的意义下无偏。
将估计方程转化为加权泊松回归：
关键技巧：证明在缺失完整AH数据下，方程的解与泊松回归的工作得分方程（在伪数据上跑）是一致的：∑ (A_hat_i - μ_i) Z_i ω_i = 0，权重的对角化可在GEE框架下通过sandwich得到正确方差。
用M-估计理论建立渐近正态性：
写估计量为泛函方程的解 ĥ= M*h(θ̂) 在θ₀处线性化；
提供均匀收敛（一致性）证明世代用经验过程理论；
证明√n(θ̂-θ₀) → N(0, V)，其中V是sandwich形式。

关键跳跃点： - 如何处理删失下无法观测的 A_i(τ)？
作者的关键处理：不是直接给每个人一个AH值，而是建立“用条件生存函数Ŝ(τ|Z)去插补AH的值，然后采用未知-已知变量的方程处理。这实质上等价于用“成对临删失补全”的样条。 - 如何保持绝对和相对同时输出？
这是log-link的固有好处：给定β̂，对于任何Z=(0, Z-对照) 和 Z=(1, Z-对照)，模型的预测绝对AH差与AH比都可以从β̂直接计算。

技术技巧点名： - 伪响应变量（Pseudo-observations）：用于将删失数据下的AH值近似成一个可进入回归方程的合成量。这是多元生存分析方法，源于Andersen等人（2003）。 - IPCW（Inverse Probability of Censoring Weighting）：用于协变量依赖删失，建模删失机制来平衡删失模式的偏差。 - 稳健三明治方差估计（Sandwich covariance estimator）：用于覆盖工作模型（log-linear)可能错配带来的方差不确定性。 - U-统计量分解（sketch only in appendix）：在实际处理条件联合生存估计时，需要展开为U统计量以建立渐近方差。

真实例子与应用¶

两个例子充分展示AH回归相对于同基线方法的区别：

实例1：一个晚期肺癌临床试验，治疗组生存曲线早期有优势但2年后风险加大（曲线交叉导致近似风险比≈1，错失疗效）。
方法应用：固定τ=24个月的AH回归，得到AH差为0.18（对照组更高的累积风险，p=0.03）和AH比为1.4（对照组相对于治疗组的AH率比）。
想说明：在HR择时无效的case中，AH回归依然能捕捉到“疗效窗口”内的相对差异。同时提供了从控制重要的协变量（ECOG评分）后几乎没变，说明该trial的积极效应在τ=24月后非常稳健。
实例2：多中心乳腺癌试验，因为一个中心出现大比例删失（该中心患者的严重化问题导致删失与协变量X严重相关）。
方法应用：分别用独立删失（IC）版本和IPCW版本；IPCW先拟合删失时间的Cox模型，用预测的概率加权。
结果：IC-Version给出了AH差-0.02（不显著），而IPCW版本给出AH差0.15（p=0.01，表示治疗显著更优）。
想说明：忽略删失的依赖会导致错误阴性的结论，且IPCW的稳健修正能恢复正确因果关系。

🔎 结论是否比证明窄¶

YES – 存在一处狭窄：作者在结论（Discussion部分）声称“AH回归在处理任意删失模式下的估计是一致的”。但本文对第三种场景的证明仅限于“删失模型C|Z被正确指定”的情况（即IPCW模型无错）。关键句子：“if the censoring model is correctly specified, the IPCW-based estimator is consistent”（原文第X节总结）。用户可以检查具体词语，若未提“双稳健”则可见结论窄于“任意删失模式”的宣称。这项限制可能是未来研究者可以点出的（例如要测度若删失模型错定后的灵敏度）。

四、开放问题（点到为止，扎根具体语句）¶

τ选择的敏感性分析与自动化方法：
本文完全依赖使用者事先固定τ。而在相同真实数据集下选择不同τ（如选1年vs3年）可能得出结论翻转。本文对此完全未讨论（没有在Limitations明确列明）。扎根点：introduction未引用RMST相关τ敏感性讨论文章；results部分只有一种τ值。gap: “享受AH严格无模型化增进的同时，如何将τ最优化以平衡效力与稳定性？”
竞争风险下AH回归的扩展：
当前只处理单一型失效事件。在有多类事件（如复发+死亡）时，AH的概念（累积风险）是否还能给出有意义的绝对/相对度量？扎根点：Limitations末段 ... in the presence of competing risks further work is needed. 作者自己写了。
半参数有效性与下界：
对于AH回归模型，目前的估计量是基于伪似然的泊松回归，但并未证明其达到了半参数效率下界（即使在大样本中，也没给出Efficient Influence Function）。扎根点：作者的方法论部分把重点放在“稳健性”而非“效率”，“no efficiency claims are made” 是一个清晰的空缺。
AH度量的尺度与大p正则化：
本文只考虑了低维协变量的回归框架。如果协变量p>>n，AH回归的log-linear模型能否通过正则化（如Lasso）拓展，且保留删失处理与双属性（绝对+相对）输出？本文未提——虽然没有明确写“未来工作”，但明显是一个开放方向。

Maintained by 陈星宇 · Homepage · Source on GitHub