Sensitivity bounds for bias in hazard ratios: A causal hazard perspective¶
作者: Yan-Lin Chen, Hsiang-Hsi Hung, Sheng-Hsuan Lin
来源: Statistical Methods in Medical Research
主题: 因果推断
相关性: 7/10
链接: https://doi.org/10.1177/09622802261436811
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本问题是:在生存分析中,如何对观察性研究的处理效应进行因果推断与敏感性分析。具体而言,Cox 比例风险模型估计出的 hazard ratio(HR)由于存在选择偏差,无法直接解释为因果效应;本方向旨在量化这一偏差,并提供不依赖强参数假设的敏感性分析工具。当前该方向正处于从"定性批评"向"定量框架"成熟的阶段,尤其是将 Ding & VanderWeele 的 E-value 框架向生存分析迁移的工作。
发展脉络: 1. 奠基与问题提出:Hernán (2010) 在 Epidemiology 发表了具有影响力的批评,指出由于条件存活带来的选择偏差,hazard ratio 即使在无混淆假设下也无法被解释为因果效应。这是定性层面的起点。 2. 因果定义的澄清:Aalen et al. (2015) 提出了 "causal hazard ratio" 的概念,试图在潜在结果框架下定义一个因果层面的 hazard ratio,为后续的识别与估计提供了明确的 estimand。Martinussen & Vansteelandt (2013) 则进一步探讨了因果 hazard 的结构嵌套模型。 3. 敏感性分析工具的成熟:在一般因果推断领域,VanderWeele & Ding (2017) 提出了 E-value,用于量化未观测混淆解释观察效应所需的强度。这一工具因其简单易用而迅速流行。 4. 本文的位置:本文试图填补上述两条线索之间的空白——将 E-value 的敏感性分析框架与 Aalen 的 causal hazard ratio 结合,量化 Hernán 提出的选择偏差,推导 HR bias 的非参数上界及其对应的 E-value。
子线索聚类: - 线索一:Hazard Ratio 的因果解释困境。核心文献是 Hernán (2010) 和 Aalen et al. (2015)。这一簇工作集中在概念澄清和定义重构,指出常规 HR 存在"built-in selection bias",并尝试定义出无偏的因果量。 - 线索二:一般敏感性分析与 E-value。核心文献是 VanderWeele & Ding (2017) 及 Ding & VanderWeele (2016) 关于 risk ratio bounds 的工作。这一簇提供了成熟的数学工具(bounding formulas),但主要针对二值结局或连续结局,未涉及时间维度上的累积偏差。 - 线索三:结构嵌套加速失效模型(SNFTM)。Martinussen & Vansteelandt (2013) 等工作试图通过结构模型直接估计因果 hazard。这是一条"正面强攻"的路线,而本文选择的是"偏差界定"的路线。
这个方向在追问的核心问题: 1. 常规 HR 与因果 HR 之间的偏差到底有多大?能否给出非参数的上界? 2. 这一偏差如何随时间演化?(Hernán 定性指出偏差会累积,本文试图定量证明) 3. 需要多强的未观测混淆才能消除观察到的 HR 效应?(即生存分析版的 E-value)
⚠️ 作者的 framing: 作者将本文 frame 为 Hernán 定性批评的"定量补完",以及 Ding & VanderWeele 敏感性分析框架向生存分析的"自然推广"。 - 被淡化的竞争路线:作者几乎没有讨论通过设计(如 instrumental variable)或更复杂的结构模型(如 SNFTM)直接识别因果 HR 的方法。作者默认了"研究者只能拿到观察性数据且只能跑 Cox 模型"这一前提,从而将问题锁定在"事后敏感性分析"上。 - 缺失的引用:Introduction 中未引用关于 competing risks 或 informative censoring 在敏感性分析中的工作,这可能是一个潜在的边界条件。
张力: 未见明显对立引用。主流共识是常规 HR 存在选择偏差,分歧在于如何处理:是弃用 HR 转用其他参数(如 RMST),还是通过建模修正 HR。本文选择了后者。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型与可观测数据
在展开证明之前,先明确本文的核心设定:
- 符号与变量:
- \(T\): 事件发生时间。
- \(A\): 二值处理(\(A=1\) 为处理组,\(A=0\) 为对照组)。
- \(X\): 可观测协变量。
- \(U\): 不可观测混淆变量。
- \(T(a)\): 潜在结果,即在干预水平 \(A=a\) 下的事件发生时间。
- 模型与因果定义:
- 常规 HR (Conventional HR): \(\lambda(t|A=1)/\lambda(t|A=0)\)。这是 Cox 模型直接估计的量,条件于 \(A\) 和 \(X\)。由于 \(T(1)\) 和 \(T(0)\) 不可同时观测,且存活人群集合随时间变化,该量混杂了选择偏差。
- 因果 HR (Causal HR): 定义为 \(\lambda_{T(1)}(t) / \lambda_{T(0)}(t)\)。这是在总体层面比较潜在结果的 hazard,是本文的目标 estimand。
- HR Bias: 定义为 \(B(t) = \text{Conventional HR}(t) / \text{Causal HR}(t)\)。
- 可观测数据:研究者能观测到的是 \((T, A, X)\) 的 i.i.d. 样本,以及潜在的删失指示。\(U\) 是不可观测的。
- 核心假设:
- Ignorability (无混淆): \(T(a) \perp A | X\)。注意:这是针对潜在结果的假设。
- Positivity: 处理分配概率有界。
- Monotonicity: 类似于 Ding & VanderWeele (2016),假设 \(U\) 对结局的影响方向是单调的(如 \(U\) 越大风险越高)。
第二步:最小内核
为了理解本文的核心数学贡献,我们剥离掉连续时间、连续协变量等复杂性,考虑一个离散时间、二值结局、无协变量的最简特例:
假设我们关注两个时间点 \(t=1, 2\)。 - 在 \(t=1\) 时,处理组和对照组的风险集都是完整的,此时选择偏差尚未产生。如果假设无混淆,则观察到的 HR 等于因果 HR。 - 在 \(t=2\) 时,风险集变成了"在 \(t=1\) 存活的人"。此时,如果处理有效,处理组在 \(t=1\) 的高危人群被移除了,导致 \(t=2\) 时处理组的平均风险降低。 - 核心数学困难:如何量化这个"存活人群构成不同"带来的偏差? - 本文的最小内核思路: 作者利用了类似 VanderWeele & Arah (2011) 的混淆偏差分解公式,但在生存分析的语境下进行了动态推导。 在最简单的二值 \(U\) 情形下,偏差 \(B(t)\) 可以被分解为两部分:一部分来自可观测协变量 \(X\) 的不平衡(可通过设计消除),另一部分来自不可观测 \(U\)。 作者证明了,偏差 \(B(t)\) 实际上是一个关于"未观测混淆强度"(记为 \(\gamma\),即 \(U\) 对结局风险的最大效应)和"处理与 \(U\) 关联强度"(记为 \(\alpha\),即 \(U\) 与处理分配的关联)的函数。 最简命题:在给定的敏感性参数 \((\alpha, \gamma)\) 下,常规 HR 与因果 HR 的比值存在一个非参数的上界。这个上界随着时间 \(t\) 的增加而单调递增(即偏差累积)。
直观上,这就像在计算一个动态的"选择偏差放大器":每过一个时间点,存活人群的筛选效应就增强一次,导致观察到的 HR 与真实因果 HR 的偏离越来越大。本文的核心数学工作就是推导出这个"放大器"的精确数学形式,并据此计算 E-value。
三、这篇论文做了什么¶
三句话: 1. 研究了生存分析中常规 hazard ratio 因选择偏差导致的因果解释问题。 2. 核心方法是借鉴 Ding & VanderWeele 的敏感性分析框架,在离散和连续时间下推导了 HR bias 的非参数上界。 3. 主要结论是证明了 HR bias 会随时间累积,并给出了对应的 E-value 公式,用于评估未观测混淆能否解释观察到的效应。
关键设定与假设: - Causal Hazard Ratio 定义:采用了 Aalen (2015) 的定义,即潜在结果的 hazard 之比。这一定义避开了"条件于存活"带来的选择偏差。 - 敏感性参数: - \(RR_{U \sim A}\): 未观测混淆 \(U\) 与处理 \(A\) 的关联强度。 - \(RR_{T \sim U | A}\): 在给定处理下,\(U\) 对结局 \(T\) 的风险比。 - 假设的放宽:相比传统的参数敏感性分析(如假设 \(U\) 为正态分布),本文仅要求单调性假设和有界风险比,属于半参数/非参数方法。
主要结果: - 定理 1(离散时间偏差界):在离散时间设定下,给出了常规 HR 与因果 HR 偏差的显式上界公式。公式显示,偏差是时间 \(t\) 的函数,且随着时间推移,界逐渐变宽(偏差可能更大)。 - 定理 2(连续时间偏差界):将离散结果推广到连续时间,利用微分方程/极限论证,给出了连续情形下的偏差界。 - 推论(E-value for HR bias):基于上述界,导出了 E-value。例如,如果观察到的 HR 为 2.0,且假设因果 HR 为 1.0(即无效应),则 E-value 告诉我们:未观测混淆需要与处理和结局的关联强度都达到多少,才能完全解释这个观察到的 HR=2.0。 - 累积效应的证明:文章严格证明了偏差随时间累积的性质。这意味着,在随访后期,Cox 模型的结果在因果解释上更加不可靠。
证明路线与技术技巧: - 整体路线: 1. 分解偏差:首先利用条件概率公式,将观察到的 hazard 分解为"因果 hazard"加上"由 \(U\) 引起的偏差项"。 2. 应用 Bounding 技术:利用 Ding & VanderWeele (2016) 中的 risk ratio bounding 技术,将偏差项用敏感性参数 \((\alpha, \gamma)\) 的函数表示。 3. 时间递推:在离散时间下,建立偏差随时间步进的递推关系;在连续时间下,转化为微分不等式。 4. 求解 E-value:将偏差界转化为 E-value 的闭式解。 - 关键跳跃点:从静态的 risk ratio bound 推广到动态的 hazard ratio bound 是本文的主要技术难点。作者需要处理"存活人群集合"随时间变化带来的概率测度变化。 - 技术技巧: - Risk Ratio Bounding (VanderWeele & Ding): 核心工具,用于非参数地界定混淆偏差。 - Survival Function Decomposition: 利用 \(S(t) = \exp(-\int \lambda(u) du)\) 将 hazard 层面的偏差转化为 survival 层面的不等式,反之亦然。 - Monotonicity Assumption: 用于简化偏差界的表达式,避免复杂的积分路径讨论。
真实例子与应用: - 数据:文章使用了经典的 Stanford Heart Transplant Data 作为真实数据例子。 - 应用方式:作者首先拟合了标准的 Cox 模型,得到了常规 HR。然后应用本文的方法,计算了在不同时间点 \(t\) 的 HR bias 上界和 E-value。 - 结果解读:结果显示,随着随访时间延长,解释观察到的处理效应所需的 E-value 逐渐减小(或者偏差界变宽),这印证了"偏差随时间累积"的理论发现——即越到后期,Cox 模型的结果越容易被未观测混淆解释,或者其因果解释越不可靠。 - 目的:该例子旨在展示方法在实际数据中的可操作性,并直观验证"偏差累积"这一理论性质。
🔎 结论是否比证明窄: 文章声称提供了"nonparametric sensitivity analysis",但实际上依赖于两个关键假设: 1. Monotonicity of U's effect: 假设 \(U\) 对风险的影响方向一致。如果 \(U\) 对不同人群有异质性影响,公式可能不成立。 2. No other unmeasured confounders: 假设 \(U\) 是唯一的未观测混淆(或可视为所有未观测混淆的聚合)。 结论部分有时暗示该方法可"通用",但证明严格依赖于上述假设。研究者在阅读时应注意这些假设在具体应用中是否合理。
四、开放问题¶
- 异质性处理效应与竞争风险:本文假设了因果 HR 的定义清晰,但在存在竞争风险或处理效应异质性时,Aalen 的因果 HR 定义本身可能需要修正。本文框架能否推广到竞争风险模型?——扎根于 Introduction 对 Aalen 定义的引用及 Limitation 部分。
- 时变混淆:本文主要考虑基线混淆 \(U\)。对于随时间变化的未观测混淆 \(U(t)\),偏差累积公式将如何变化?这直接关系到 longitudinal causal inference 的核心难点。——扎根于 Discussion 中关于 time-varying confounding 的简短提及。
- 界的紧性:本文给出的界是"上界",即最坏情况。在什么数据生成机制下,这个界是紧的?是否存在利用数据协方差结构来 sharpen 这个界的方法?——扎根于 minimax bounds 的研究传统,本文未深入讨论界的可达性。
- 与 SNFTM 的结合:能否将本文的敏感性分析与结构嵌套加速失效模型(SNFTM)结合,直接在估计阶段进行校正,而非仅在敏感性分析阶段?——扎根于 Martinussen & Vansteelandt (2013) 这条被引用但未被本文方法整合的路线。
Maintained by 陈星宇 · Homepage · Source on GitHub