Sensitivity bounds for bias in hazard ratios: A causal hazard perspective¶

作者: Yan-Lin Chen, Hsiang-Hsi Hung, Sheng-Hsuan Lin
来源: Statistical Methods in Medical Research
主题: 因果推断
相关性: 7/10
链接: https://doi.org/10.1177/09622802261436811

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本问题是：在生存分析中，如何对观察性研究的处理效应进行因果推断与敏感性分析。具体而言，Cox 比例风险模型估计出的 hazard ratio（HR）由于存在选择偏差，无法直接解释为因果效应；本方向旨在量化这一偏差，并提供不依赖强参数假设的敏感性分析工具。当前该方向正处于从"定性批评"向"定量框架"成熟的阶段，尤其是将 Ding & VanderWeele 的 E-value 框架向生存分析迁移的工作。

发展脉络： 1. 奠基与问题提出：Hernán (2010) 在 Epidemiology 发表了具有影响力的批评，指出由于条件存活带来的选择偏差，hazard ratio 即使在无混淆假设下也无法被解释为因果效应。这是定性层面的起点。 2. 因果定义的澄清：Aalen et al. (2015) 提出了 "causal hazard ratio" 的概念，试图在潜在结果框架下定义一个因果层面的 hazard ratio，为后续的识别与估计提供了明确的 estimand。Martinussen & Vansteelandt (2013) 则进一步探讨了因果 hazard 的结构嵌套模型。 3. 敏感性分析工具的成熟：在一般因果推断领域，VanderWeele & Ding (2017) 提出了 E-value，用于量化未观测混淆解释观察效应所需的强度。这一工具因其简单易用而迅速流行。 4. 本文的位置：本文试图填补上述两条线索之间的空白——将 E-value 的敏感性分析框架与 Aalen 的 causal hazard ratio 结合，量化 Hernán 提出的选择偏差，推导 HR bias 的非参数上界及其对应的 E-value。

子线索聚类： - 线索一：Hazard Ratio 的因果解释困境。核心文献是 Hernán (2010) 和 Aalen et al. (2015)。这一簇工作集中在概念澄清和定义重构，指出常规 HR 存在"built-in selection bias"，并尝试定义出无偏的因果量。 - 线索二：一般敏感性分析与 E-value。核心文献是 VanderWeele & Ding (2017) 及 Ding & VanderWeele (2016) 关于 risk ratio bounds 的工作。这一簇提供了成熟的数学工具（bounding formulas），但主要针对二值结局或连续结局，未涉及时间维度上的累积偏差。 - 线索三：结构嵌套加速失效模型（SNFTM）。Martinussen & Vansteelandt (2013) 等工作试图通过结构模型直接估计因果 hazard。这是一条"正面强攻"的路线，而本文选择的是"偏差界定"的路线。

这个方向在追问的核心问题： 1. 常规 HR 与因果 HR 之间的偏差到底有多大？能否给出非参数的上界？ 2. 这一偏差如何随时间演化？（Hernán 定性指出偏差会累积，本文试图定量证明） 3. 需要多强的未观测混淆才能消除观察到的 HR 效应？（即生存分析版的 E-value）

⚠️ 作者的 framing：作者将本文 frame 为 Hernán 定性批评的"定量补完"，以及 Ding & VanderWeele 敏感性分析框架向生存分析的"自然推广"。 - 被淡化的竞争路线：作者几乎没有讨论通过设计（如 instrumental variable）或更复杂的结构模型（如 SNFTM）直接识别因果 HR 的方法。作者默认了"研究者只能拿到观察性数据且只能跑 Cox 模型"这一前提，从而将问题锁定在"事后敏感性分析"上。 - 缺失的引用：Introduction 中未引用关于 competing risks 或 informative censoring 在敏感性分析中的工作，这可能是一个潜在的边界条件。

张力：未见明显对立引用。主流共识是常规 HR 存在选择偏差，分歧在于如何处理：是弃用 HR 转用其他参数（如 RMST），还是通过建模修正 HR。本文选择了后者。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据

在展开证明之前，先明确本文的核心设定：

符号与变量：
- \(T\): 事件发生时间。
- \(A\): 二值处理（\(A=1\) 为处理组，\(A=0\) 为对照组）。
- \(X\): 可观测协变量。
- \(U\): 不可观测混淆变量。
- \(T(a)\): 潜在结果，即在干预水平 \(A=a\) 下的事件发生时间。
模型与因果定义：
- 常规 HR (Conventional HR): \(\lambda(t|A=1)/\lambda(t|A=0)\)。这是 Cox 模型直接估计的量，条件于 \(A\) 和 \(X\)。由于 \(T(1)\) 和 \(T(0)\) 不可同时观测，且存活人群集合随时间变化，该量混杂了选择偏差。
- 因果 HR (Causal HR): 定义为 \(\lambda_{T(1)}(t) / \lambda_{T(0)}(t)\)。这是在总体层面比较潜在结果的 hazard，是本文的目标 estimand。
- HR Bias: 定义为 \(B(t) = \text{Conventional HR}(t) / \text{Causal HR}(t)\)。
可观测数据：研究者能观测到的是 \((T, A, X)\) 的 i.i.d. 样本，以及潜在的删失指示。\(U\) 是不可观测的。
核心假设：
- Ignorability (无混淆): \(T(a) \perp A | X\)。注意：这是针对潜在结果的假设。
- Positivity: 处理分配概率有界。
- Monotonicity: 类似于 Ding & VanderWeele (2016)，假设 \(U\) 对结局的影响方向是单调的（如 \(U\) 越大风险越高）。

第二步：最小内核

为了理解本文的核心数学贡献，我们剥离掉连续时间、连续协变量等复杂性，考虑一个离散时间、二值结局、无协变量的最简特例：

假设我们关注两个时间点 \(t=1, 2\)。 - 在 \(t=1\) 时，处理组和对照组的风险集都是完整的，此时选择偏差尚未产生。如果假设无混淆，则观察到的 HR 等于因果 HR。 - 在 \(t=2\) 时，风险集变成了"在 \(t=1\) 存活的人"。此时，如果处理有效，处理组在 \(t=1\) 的高危人群被移除了，导致 \(t=2\) 时处理组的平均风险降低。 - 核心数学困难：如何量化这个"存活人群构成不同"带来的偏差？ - 本文的最小内核思路：作者利用了类似 VanderWeele & Arah (2011) 的混淆偏差分解公式，但在生存分析的语境下进行了动态推导。在最简单的二值 \(U\) 情形下，偏差 \(B(t)\) 可以被分解为两部分：一部分来自可观测协变量 \(X\) 的不平衡（可通过设计消除），另一部分来自不可观测 \(U\)。作者证明了，偏差 \(B(t)\) 实际上是一个关于"未观测混淆强度"（记为 \(\gamma\)，即 \(U\) 对结局风险的最大效应）和"处理与 \(U\) 关联强度"（记为 \(\alpha\)，即 \(U\) 与处理分配的关联）的函数。 最简命题：在给定的敏感性参数 \((\alpha, \gamma)\) 下，常规 HR 与因果 HR 的比值存在一个非参数的上界。这个上界随着时间 \(t\) 的增加而单调递增（即偏差累积）。

直观上，这就像在计算一个动态的"选择偏差放大器"：每过一个时间点，存活人群的筛选效应就增强一次，导致观察到的 HR 与真实因果 HR 的偏离越来越大。本文的核心数学工作就是推导出这个"放大器"的精确数学形式，并据此计算 E-value。

三、这篇论文做了什么¶

三句话： 1. 研究了生存分析中常规 hazard ratio 因选择偏差导致的因果解释问题。 2. 核心方法是借鉴 Ding & VanderWeele 的敏感性分析框架，在离散和连续时间下推导了 HR bias 的非参数上界。 3. 主要结论是证明了 HR bias 会随时间累积，并给出了对应的 E-value 公式，用于评估未观测混淆能否解释观察到的效应。

关键设定与假设： - Causal Hazard Ratio 定义：采用了 Aalen (2015) 的定义，即潜在结果的 hazard 之比。这一定义避开了"条件于存活"带来的选择偏差。 - 敏感性参数： - \(RR_{U \sim A}\): 未观测混淆 \(U\) 与处理 \(A\) 的关联强度。 - \(RR_{T \sim U | A}\): 在给定处理下，\(U\) 对结局 \(T\) 的风险比。 - 假设的放宽：相比传统的参数敏感性分析（如假设 \(U\) 为正态分布），本文仅要求单调性假设和有界风险比，属于半参数/非参数方法。

主要结果： - 定理 1（离散时间偏差界）：在离散时间设定下，给出了常规 HR 与因果 HR 偏差的显式上界公式。公式显示，偏差是时间 \(t\) 的函数，且随着时间推移，界逐渐变宽（偏差可能更大）。 - 定理 2（连续时间偏差界）：将离散结果推广到连续时间，利用微分方程/极限论证，给出了连续情形下的偏差界。 - 推论（E-value for HR bias）：基于上述界，导出了 E-value。例如，如果观察到的 HR 为 2.0，且假设因果 HR 为 1.0（即无效应），则 E-value 告诉我们：未观测混淆需要与处理和结局的关联强度都达到多少，才能完全解释这个观察到的 HR=2.0。 - 累积效应的证明：文章严格证明了偏差随时间累积的性质。这意味着，在随访后期，Cox 模型的结果在因果解释上更加不可靠。

证明路线与技术技巧： - 整体路线： 1. 分解偏差：首先利用条件概率公式，将观察到的 hazard 分解为"因果 hazard"加上"由 \(U\) 引起的偏差项"。 2. 应用 Bounding 技术：利用 Ding & VanderWeele (2016) 中的 risk ratio bounding 技术，将偏差项用敏感性参数 \((\alpha, \gamma)\) 的函数表示。 3. 时间递推：在离散时间下，建立偏差随时间步进的递推关系；在连续时间下，转化为微分不等式。 4. 求解 E-value：将偏差界转化为 E-value 的闭式解。 - 关键跳跃点：从静态的 risk ratio bound 推广到动态的 hazard ratio bound 是本文的主要技术难点。作者需要处理"存活人群集合"随时间变化带来的概率测度变化。 - 技术技巧： - Risk Ratio Bounding (VanderWeele & Ding): 核心工具，用于非参数地界定混淆偏差。 - Survival Function Decomposition: 利用 \(S(t) = \exp(-\int \lambda(u) du)\) 将 hazard 层面的偏差转化为 survival 层面的不等式，反之亦然。 - Monotonicity Assumption: 用于简化偏差界的表达式，避免复杂的积分路径讨论。

真实例子与应用： - 数据：文章使用了经典的 Stanford Heart Transplant Data 作为真实数据例子。 - 应用方式：作者首先拟合了标准的 Cox 模型，得到了常规 HR。然后应用本文的方法，计算了在不同时间点 \(t\) 的 HR bias 上界和 E-value。 - 结果解读：结果显示，随着随访时间延长，解释观察到的处理效应所需的 E-value 逐渐减小（或者偏差界变宽），这印证了"偏差随时间累积"的理论发现——即越到后期，Cox 模型的结果越容易被未观测混淆解释，或者其因果解释越不可靠。 - 目的：该例子旨在展示方法在实际数据中的可操作性，并直观验证"偏差累积"这一理论性质。

🔎 结论是否比证明窄：文章声称提供了"nonparametric sensitivity analysis"，但实际上依赖于两个关键假设： 1. Monotonicity of U's effect: 假设 \(U\) 对风险的影响方向一致。如果 \(U\) 对不同人群有异质性影响，公式可能不成立。 2. No other unmeasured confounders: 假设 \(U\) 是唯一的未观测混淆（或可视为所有未观测混淆的聚合）。结论部分有时暗示该方法可"通用"，但证明严格依赖于上述假设。研究者在阅读时应注意这些假设在具体应用中是否合理。

四、开放问题¶

异质性处理效应与竞争风险：本文假设了因果 HR 的定义清晰，但在存在竞争风险或处理效应异质性时，Aalen 的因果 HR 定义本身可能需要修正。本文框架能否推广到竞争风险模型？——扎根于 Introduction 对 Aalen 定义的引用及 Limitation 部分。
时变混淆：本文主要考虑基线混淆 \(U\)。对于随时间变化的未观测混淆 \(U(t)\)，偏差累积公式将如何变化？这直接关系到 longitudinal causal inference 的核心难点。——扎根于 Discussion 中关于 time-varying confounding 的简短提及。
界的紧性：本文给出的界是"上界"，即最坏情况。在什么数据生成机制下，这个界是紧的？是否存在利用数据协方差结构来 sharpen 这个界的方法？——扎根于 minimax bounds 的研究传统，本文未深入讨论界的可达性。
与 SNFTM 的结合：能否将本文的敏感性分析与结构嵌套加速失效模型（SNFTM）结合，直接在估计阶段进行校正，而非仅在敏感性分析阶段？——扎根于 Martinussen & Vansteelandt (2013) 这条被引用但未被本文方法整合的路线。

Maintained by 陈星宇 · Homepage · Source on GitHub

Sensitivity bounds for bias in hazard ratios: A causal hazard perspective¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题¶

评论