Regression models for average hazard¶

作者: Hajime Uno, Lu Tian, Miki Horiguchi, Satoshi Hattori, Kenneth L Kehl
来源: Biometrics
主题: 因果推断
相关性: 4/10
机构绿灯: Stanford University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae037

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向的核心问题是：在时间-事件结局（time-to-event outcome）的临床试验或流行病学研究中，如何用一个统计量来度量治疗效应，使其既具有清晰的流行病学解释，又不受传统 Cox 比例风险模型中比例风险假设（PH 假设）的限制？传统上，Cox 模型的风险比（Hazard Ratio, HR）是最常用的度量，但它的解释依赖于 PH 假设，且当该假设不成立时，HR 会随时间变化，导致单一数值无法概括整个时间窗口的效应。此外，HR 的“相对风险”解释在非医学背景的读者中常被误解。当前，替代度量（如限制性平均生存时间 RMST、平均风险 AH）正在获得关注，但它们的回归建模（即允许调整协变量）仍处于发展阶段，成熟度低于 Cox 模型。

发展脉络（history）¶

根据本文 introduction 的引用，该领域的发展可串成以下线索：

奠基工作：Cox 模型与 PH 假设的局限性被广泛讨论。
- Cox (1972)：提出比例风险模型，成为生存分析的标准工具。但本文引用指出，其局限性（如 PH 假设不成立时 HR 的解释问题）已被广泛讨论（引用：Hernán, 2010; Uno et al., 2014; Stensrud & Hernán, 2020）。
- Hernán (2010)：明确指出了 HR 在因果推断中的问题——即使在没有混杂的情况下，HR 也可能因“健康幸存者效应”而产生偏倚，不能直接解释为因果效应。本文引用它来定位“HR 有问题”这一共识。
主要进展：替代度量的提出与两样本比较。
- RMST（限制性平均生存时间）：作为 HR 的替代，RMST 在给定时间窗口 τ 内计算平均生存时间，具有直观的“平均生存时间”解释。本文引用 Royston & Parmar (2013) 和 Uno et al. (2014) 作为 RMST 回归分析的代表工作。RMST 的回归模型（如伪观测值法）已被开发。
- AH（平均风险）：本文作者 Uno et al. (2015) 在两样本比较中首次提出了 AH，定义为“给定时间窗口 τ 内，无删失的人时发病率”。它比 RMST 更接近流行病学中的“发病率”概念，且对删失机制更稳健（在独立删失下，AH 的估计不依赖于删失分布的正确建模）。本文的定位是：将 AH 从两样本比较推广到回归分析。
当前 Frontier 与本文位置：
- 当前 Frontier：如何为这些替代度量（RMST, AH）建立灵活的回归模型，允许调整协变量，同时保持其解释优势。本文的位置：它填补了“AH 回归分析”这一空白。作者声称，虽然 AH 在两样本比较中已有，但“regression analysis approach for the AH with a truncation time τ”是新的。它提供了三种删失机制下的回归框架，并展示了其与稳健 Poisson 回归的联系与区别。

子线索聚类¶

这些被引文献大致落在 2 条子线索上：

线索一：传统 HR 的局限性讨论与替代度量的提出。
- 做什么：批评 HR 的可解释性问题，并提出新的、更直观的效应度量（如 RMST, AH）。
- 代表工作：Hernán (2010), Uno et al. (2014), Uno et al. (2015)。
- 当前状态：共识已形成，替代度量被广泛接受。
线索二：替代度量的回归建模。
- 做什么：为 RMST 或 AH 开发回归模型，允许调整协变量，从而在因果推断或流行病学分析中控制混杂。
- 代表工作：Royston & Parmar (2013) 的 RMST 回归；本文的 AH 回归。
- 当前状态：RMST 回归相对成熟；AH 回归是本文的新贡献，尚处于早期。

这个方向在追问的核心问题¶

如何定义“可解释”的效应度量？ 是 RMST（平均生存时间差）还是 AH（发病率比/差）？哪种对临床医生和患者更直观？
如何建立回归模型？ 对于 RMST 和 AH，其回归模型通常不是线性的，需要借助伪观测值（pseudo-observations）或稳健 Poisson 回归等技巧。这些方法的效率如何？对删失机制的稳健性如何？
如何选择时间窗口 τ？ 无论是 RMST 还是 AH，都需要指定一个截断时间 τ。τ 的选择会影响效应估计，如何选择最优或最稳健的 τ 是一个开放问题。
与 Cox 模型的比较： 在 PH 假设成立时，AH 回归的效率是否接近 Cox 模型？在 PH 假设不成立时，AH 回归的优势有多大？

⚠️ 作者的 framing¶

作者把缺口 frame 成什么？ 作者将缺口 frame 为：“虽然 AH 在两样本比较中已被提出，但缺乏一个通用的回归框架来调整协变量。” 因此，本文是“显然的下一步”——将 AH 从简单比较推广到回归分析。作者通过强调“AH 回归可以同时提供绝对差和相对比”以及“对删失更稳健”来强化其必要性。
哪些竞争路线被他淡化或回避了？ 作者淡化了 RMST 回归的成熟性。虽然引用了 RMST 回归的工作，但并未深入比较 AH 回归与 RMST 回归在效率或解释上的优劣。作者回避了“当 τ 很大时，AH 估计的方差会很大”这一潜在问题（因为 τ 越大，删失越多，有效样本量越小）。
什么明显该被引 / 该存在、却没出现在 intro 里？ 本文没有引用任何关于 半参数效率理论 的工作。对于 AH 回归，其半参数效率界是什么？本文提出的稳健 Poisson 回归估计量是否达到了效率界？这是一个明显的理论缺口。此外，没有引用 因果推断中的 g-computation 或 IPW 方法，这些方法也可以用于估计调整协变量后的平均效应，与 AH 回归有潜在联系。

张力¶

未见明显对立引用。所有被引工作都一致认为 HR 有局限性，并支持发展替代度量。主要张力在于“哪种替代度量最好”，但这在本文中未被深入讨论。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- T：生存时间（随机变量），是潜在的、可能被删失的结局。
- C：删失时间（随机变量）。我们观测不到 T，只能观测到 X = min(T, C) 和事件指示符 δ = I(T ≤ C)。
- Z：协变量向量（可以是处理组指示符、基线协变量等）。
- τ：截断时间（truncation time），是一个预先指定的常数，表示我们感兴趣的时间窗口 [0, τ]。
- AH(τ)：平均风险（Average Hazard），定义为 AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ]。分子是“在 τ 之前发生事件的概率”，分母是“在 τ 之前期望的生存时间”（即限制性平均生存时间 RMST）。因此，AH(τ) 可以解释为“在 [0, τ] 内，每单位人时的平均事件数”。
- λ(t)：风险函数（hazard function）。
- S(t)：生存函数（survival function）。
模型：
- 我们假设一个对数线性模型来建模 AH(τ) 与协变量 Z 的关系： log( AH(τ | Z) ) = β₀ + β₁ * Z₁ + ... + βₚ * Zₚ 或者，对于绝对风险差，我们可以直接建模 AH(τ | Z) = γ₀ + γ₁ * Z₁ + ... + γₚ * Zₚ。
- 本文主要关注相对风险（即对数线性模型），因为这与稳健 Poisson 回归直接对应。
- 删失机制：本文考虑了三种删失机制，这是模型的关键部分：
  1. 独立删失（Independent Censoring）：C 与 T 在给定 Z 下独立。这是最标准的假设。
  2. 组别特异性删失（Group-Specific Censoring）：C 的分布只依赖于处理组（Z 的一个子集），但与 T 独立。
  3. 协变量依赖删失（Covariate-Dependent Censoring）：C 的分布依赖于所有协变量 Z，但与 T 独立。这是最一般的假设。
可观测数据：
- 研究者实际能观测到的是 n 个独立同分布的样本：{ (Xᵢ, δᵢ, Zᵢ) }，其中 i = 1, ..., n。
- Xᵢ = min(Tᵢ, Cᵢ) 是观测到的生存时间（或删失时间）。
- δᵢ = I(Tᵢ ≤ Cᵢ) 是事件指示符（1=事件发生，0=删失）。
- Zᵢ 是协变量向量。
- 我们想要但观测不到的是：完整的生存时间 Tᵢ。我们只能通过假设（如独立删失）来识别 AH(τ)。

第二步：讲最小内核¶

本文的核心思路可以归结为一个最简特例：只有两个处理组（Z = 0 或 1），且删失是独立的（机制 1）。

在这个特例下，我们要估计的是： * AH₀(τ) = AH(τ | Z=0)：对照组在 [0, τ] 内的平均风险。 * AH₁(τ) = AH(τ | Z=1)：处理组在 [0, τ] 内的平均风险。

核心思路：AH(τ) 可以写成： AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ]

这个形式非常关键。它不是一个简单的“事件数 / 总人时”，因为分母是期望值。但我们可以用逆概率删失加权（IPCW） 或直接估计来得到它的无偏估计。

最简例子：假设没有删失（C = ∞）。那么： * AH(τ) 的估计量就是 (事件数) / (总生存时间)，即 (∑ I(Tᵢ ≤ τ)) / (∑ min(Tᵢ, τ))。 * 这本质上是一个比率估计量。如果我们想比较两组，可以计算 AH₁(τ) / AH₀(τ)（相对风险）或 AH₁(τ) - AH₀(τ)（绝对风险差）。

本文的关键想法：当存在删失时，我们不能直接观测到 I(T ≤ τ) 和 min(T, τ)。但我们可以通过稳健 Poisson 回归来估计 AH(τ | Z)。

稳健 Poisson 回归：如果我们把 I(T ≤ τ) 看作一个二值结局（在 τ 之前是否发生事件），那么 E[ I(T ≤ τ) | Z ] 就是事件概率。如果我们用 Poisson 回归（对数链接）来建模这个概率，得到的系数就是 log(相对风险)。
问题：Poisson 回归假设 I(T ≤ τ) 服从 Poisson 分布，但实际它服从 Bernoulli 分布。不过，Poisson 回归的估计量在模型误设下仍然是相合的（只要均值模型正确），这就是“稳健”的含义。它通过“工作模型”（working model）来估计参数，并使用“三明治方差估计”来得到正确的标准误。
本文的贡献：本文指出，在存在删失时，我们不能直接使用 I(T ≤ τ)，因为对于删失的个体，我们不知道它是否在 τ 前发生事件。因此，作者提出了一个加权版本的稳健 Poisson 回归：
- 对于每个个体，我们定义一个生存权重 wᵢ = I(Xᵢ ≥ τ) / Ĝ(τ | Zᵢ)，其中 Ĝ(τ | Zᵢ) 是删失时间 C 在 τ 时刻的生存概率的估计（即 P(C > τ | Zᵢ) 的估计）。
- 这个权重的作用是：只使用那些在 τ 时刻仍然存活（未被删失）的个体，并通过逆概率加权来纠正因删失导致的样本选择偏差。
- 然后，我们对加权后的数据 { wᵢ * I(Xᵢ ≤ τ), Zᵢ } 进行稳健 Poisson 回归。

最小内核总结：本文的核心数学操作是将 AH(τ) 的估计问题转化为一个加权二值结局的稳健 Poisson 回归问题。这个转化之所以成立，是因为 AH(τ) = E[ I(T ≤ τ) ] / E[ min(T, τ) ] 可以写成 E[ I(T ≤ τ) ] / E[ ∫₀^τ I(T > t) dt ]，而后者可以通过 IPCW 技巧来估计。最终，AH 回归的系数可以通过一个加权广义线性模型（WGEE） 来求解，其方差可以通过三明治估计量来得到。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：本文研究了如何对平均风险（AH） 进行回归建模，以在调整协变量的同时，估计时间-事件结局的治疗效应（绝对差和相对比）。
核心工具 / 方法：本文的核心工具是加权稳健 Poisson 回归，通过引入生存权重来处理删失，并利用三明治方差估计来获得正确的标准误。
主要结论：本文提出了三种删失机制下的 AH 回归方法，证明了其估计量的相合性和渐近正态性，并通过模拟和真实数据例子展示了其相对于传统 Cox 模型和未调整的 AH 比较的优势。

关键设定与假设¶

设定：我们有一个时间-事件结局 T，一个删失时间 C，一个协变量向量 Z。我们感兴趣的是在时间窗口 [0, τ] 内的平均风险 AH(τ | Z) = E[ I(T ≤ τ) | Z ] / E[ min(T, τ) | Z ]。
假设：
1. 可忽略的删失（Conditionally Independent Censoring）：T ⟂ C | Z。这是所有三种机制的基础。它意味着在给定协变量 Z 后，删失时间与生存时间独立。这是生存分析的标准假设。
2. 删失机制模型：对于机制 3（协变量依赖删失），我们需要正确指定删失时间 C 的生存模型 G(t | Z) = P(C > t | Z)。本文使用 Cox 模型来估计 G(t | Z)。对于机制 1 和 2，这个模型可以更简单（如 Kaplan-Meier 估计）。
3. 正定性（Positivity）：P(C > τ | Z) > 0 对于所有 Z 成立。这意味着在 τ 时刻，对于任何协变量组合，都有一些个体未被删失。这是 IPCW 方法的标准要求。
4. 模型正确指定：AH 回归模型（如 log(AH(τ | Z)) = β'Z）被假设为正确指定的。这是所有参数回归模型的标准假设。

主要结果¶

定理 1（机制 1：独立删失）：提出了一个简单的估计量，通过 Kaplan-Meier 估计删失分布，然后对加权数据进行稳健 Poisson 回归。该估计量是相合且渐近正态的。
定理 2（机制 2：组别特异性删失）：类似于机制 1，但删失分布是按组别（如处理组）分别估计的。
定理 3（机制 3：协变量依赖删失）：这是最一般的情况。需要先用 Cox 模型估计删失时间 C 的条件生存函数 G(t | Z)，然后使用该估计值计算权重，再进行加权稳健 Poisson 回归。该估计量也是相合且渐近正态的，但需要满足一个关键条件：删失模型（Cox 模型）被正确指定。
核心量化结论：模拟结果显示，当 PH 假设不成立时，AH 回归的估计量（如风险比）比 Cox 模型的 HR 更稳定、更接近真实值。当 PH 假设成立时，AH 回归的效率略低于 Cox 模型，但差距不大。与未调整的 AH 比较相比，调整协变量后的 AH 回归能减少混杂偏倚。

证明路线与技术技巧¶

整体路线：
1. 定义目标参数：β 是 log(AH(τ | Z)) = β'Z 中的回归系数。
2. 构造估计方程：AH 回归的估计方程可以写成加权 Poisson 回归的得分方程：∑ wᵢ * Zᵢ * ( I(Xᵢ ≤ τ) - exp(β'Zᵢ) ) = 0，其中 wᵢ 是生存权重。
3. 处理删失：生存权重 wᵢ = I(Xᵢ ≥ τ) / Ĝ(τ | Zᵢ) 通过 IPCW 技巧来纠正删失。Ĝ(τ | Zᵢ) 是删失时间 C 的条件生存函数的估计。
4. 渐近分析：证明的关键是处理估计的权重 Ĝ(τ | Zᵢ) 带来的额外变异性。作者使用 M-估计理论 和 Delta 方法 来推导 β̂ 的渐近分布。具体来说，他们将 β̂ 视为一个两步估计量：第一步估计删失模型，第二步求解加权估计方程。通过将估计方程在真实参数处进行泰勒展开，并利用 经验过程理论 来处理估计的权重，他们证明了 β̂ 的渐近正态性，并给出了一个三明治方差估计量。
关键跳跃点：
- 跳跃点 1：如何证明 β̂ 的相合性，即使删失模型被误设？作者指出，对于机制 1 和 2，由于删失分布是独立于 T 的，即使删失模型被误设，IPCW 权重仍然能给出相合的估计（只要删失分布被正确估计）。但对于机制 3，如果删失模型被误设，估计量可能不一致。这是本文的一个关键发现。
- 跳跃点 2：如何推导三明治方差估计量？由于权重是估计的，方差估计需要同时考虑估计方程本身的变异性和权重估计的变异性。作者通过 M-估计的联合推断 框架，将 β̂ 和 Ĝ 的参数视为一个联合参数向量，然后推导其联合渐近分布，从而得到 β̂ 的边际方差。
技术技巧点名：
- IPCW（逆概率删失加权）：用于处理删失，是本文方法的核心。
- 稳健 Poisson 回归 / WGEE（加权广义估计方程）：用于估计回归系数，并得到稳健的标准误。
- M-估计理论：用于推导估计量的渐近性质。
- 三明治方差估计：用于获得正确的标准误，考虑了权重估计的不确定性。
- 经验过程理论：用于处理估计的权重函数 Ĝ(t | Z) 的随机性。

真实例子与应用¶

用的什么数据 / 场景：本文使用了两个真实数据例子：
1. Eastern Cooperative Oncology Group (ECOG) 临床试验数据：比较两种化疗方案（etoposide + cisplatin vs. etoposide + carboplatin）对广泛期小细胞肺癌患者的生存影响。
2. National Cancer Database (NCDB) 数据：比较手术 vs. 非手术治疗对早期非小细胞肺癌患者的生存影响。
怎么把本文方法用上去：对于每个数据集，作者都指定了一个截断时间 τ（例如，ECOG 数据中 τ=2 年），然后使用 AH 回归（机制 3，协变量依赖删失）来估计调整协变量后的治疗效应（风险比和风险差）。同时，他们也报告了 Cox 模型的 HR 和未调整的 AH 比较作为对比。
得到什么结果：
- ECOG 数据：Cox 模型的 HR 为 0.80（95% CI: 0.63-1.02），不显著。AH 回归的风险比为 0.72（95% CI: 0.56-0.93），显著。作者认为 AH 回归的结果更符合临床预期（新方案更好），且其解释（“在 2 年内，新方案使死亡风险降低了 28%”）比 HR 更直观。
- NCDB 数据：Cox 模型的 HR 为 0.62（95% CI: 0.58-0.66），显著。AH 回归的风险比为 0.55（95% CI: 0.51-0.59），也显著。两者结论一致，但 AH 回归提供了绝对风险差（-0.12，即 5 年死亡风险降低 12%），这在临床决策中更有用。
这个例子想说明什么：这两个例子旨在展示 AH 回归的实用性和解释优势。第一个例子展示了当 PH 假设可能不成立时，AH 回归能提供更稳定、更显著的效应估计。第二个例子展示了 AH 回归能同时提供相对和绝对效应度量，便于临床沟通。

🔎 结论是否比证明窄¶

窄的地方：本文的证明主要依赖于删失模型被正确指定（对于机制 3）。但在真实数据例子中，作者使用了 Cox 模型来估计删失分布，并假设其正确。作者在讨论中承认了这一点，并指出“misspecification of the censoring model may lead to biased estimates”。这是一个重要的局限性。
泛泛 claim 的地方：作者在摘要和引言中声称 AH 回归“can be more robust than Poisson regression in the presence of censoring”。这个 claim 在文中被证明了吗？实际上，本文的 AH 回归就是一个加权版本的稳健 Poisson 回归。它比“未加权的”Poisson 回归更稳健，因为后者会因删失而产生偏倚。但作者没有与“使用 IPCW 的 Poisson 回归”进行比较，所以这个 claim 有点模糊。

四、开放问题¶

半参数效率界：本文提出的加权稳健 Poisson 回归估计量是否达到了 AH(τ | Z) 的半参数效率界？这是一个重要的理论问题，扎根于本文未引用任何半参数效率理论这一事实。研究者可以尝试推导 AH 回归的 efficient influence function，并比较本文估计量的方差是否达到了该下界。
删失模型误设的稳健性：本文的机制 3 要求删失模型被正确指定。能否开发一个双重稳健的 AH 回归估计量，使得只要结局模型（AH 回归模型）或删失模型之一被正确指定，估计量就是相合的？这类似于因果推断中的双重稳健估计。扎根于本文讨论部分对删失模型误设的担忧。
最优 τ 的选择：AH 回归依赖于截断时间 τ 的选择。如何基于数据选择最优的 τ？是否存在一个“最小化方差”或“最大化检验功效”的 τ 选择准则？这是一个开放问题，扎根于本文未讨论 τ 的选择。
与 RMST 回归的效率比较：本文没有与 RMST 回归进行系统的效率比较。在什么条件下，AH 回归比 RMST 回归更有效？反之亦然？这是一个实证问题，扎根于本文未进行此类比较。

Maintained by 陈星宇 · Homepage · Source on GitHub