跳转至

Addressing the influence of unmeasured confounding in observational studies with time-to-event outcomes: a semiparametric sensitivity analysis approach

作者: Linda Amoafo, Shiyao Xu, Elizabeth Platz, Daniel Scharfstein
来源: Biostatistics
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么 这个子方向要解决的根本统计问题是:在观测性研究中,当“无未测量混杂”这一不可验证的核心假设被破坏时,如何定量地评估和限制因果效应估计的偏差。当前,该方向在二值处理、连续/二值结局下已有较成熟的参数与半参数框架,但在时间-事件(生存)结局竞争暴露下,由于删失与未测量混杂的联合扭曲,边际潜在结果分布的识别与估计仍处于从特定模型(如Cox模型偏差校正)向非/半参数框架过渡的阶段。

发展脉络 根据 introduction 的引用线索,该方向的发展可串成如下主线:

  • 奠基工作(匹配与IPW下的敏感性分析):Rosenbaum (2002) 奠定了匹配设计下的敏感性分析框架;Tan (2006) 将其扩展到逆概率加权(IPW)框架。这些工作留下了口子:如何脱离匹配/IPW的特定估计路线,给出更一般的半参数框架?
  • 主要进展(一般混杂结构与无假设界限):VanderWeele & Arah (2011) 给出了连续/分类变量下的一般偏差公式;Ding & VanderWeele (2015) 提出了E-value,作者在引用时明确指出其定位:“We are specifically interested in drawing inference about the difference in the marginal distributions of the time-to-event under competing treatments”——这表明本文刻意将目标从E-value所针对的风险比转移到边际分布差异。Carnegie et al. (2016) 与 Bonvini & Kennedy (2019) 分别从“模拟潜在混杂因子”与“未测量混杂比例”角度切入,但均未系统处理删失数据。
  • 当前 frontier(生存数据下的敏感性分析):Lin et al. (2013) 针对Cox模型给出了偏差公式;Huang et al. (2019) 将模拟混杂法扩展到生存与竞争风险;Lee et al. (2024) 针对受限平均生存时间(RMST)差异构建了基于优化的敏感性分析。作者引用 Lee et al. (2024) 时指出其处理了RMST差异,这为本文留下了口子:从单一汇总统计量(RMST)扩展到整个边际生存分布
  • 本文的位置:本文将半参数影响函数(IF)技术引入生存数据的敏感性分析,通过“无删失数据IF → 观测数据IF”的映射,填补了“竞争暴露下边际潜在生存分布的半参数敏感性估计”这一空白。

子线索聚类 被引文献大致落在三条子线索上: 1. 风险比/比值比尺度下的混杂偏差界限:VanderWeele & Arah (2011), Ding & VanderWeele (2015), VanderWeele & Ding (2017)。这一簇在做“不依赖混杂因子具体分布的尖锐代数界限”,但局限于相对风险尺度。 2. 边际敏感性模型与优化/重加权路线:Rosenbaum (2002), Zhao et al. (2017), Lee et al. (2024)。这一簇通过约束倾向得分偏离的程度,将敏感性分析转化为线性分式规划或约束优化问题,但估计量往往依赖IPW,方差大且未深入挖掘半参数效率。 3. 模拟混杂与比例混杂路线:Carnegie et al. (2016), Bonvini & Kennedy (2019), Huang et al. (2019)。这一簇直接对未测量混杂 \(U\) 的分布或出现比例建模,通过EM算法或非参数重加权估计,但计算成本高且对 \(U\) 的参数化假设较强。

这个方向在追问的核心问题 1. 如何选择与参数化敏感性参数,使其既有临床/科学解释性,又能保证偏差界限的尖锐性? 2. 如何在存在删失的情况下,将无混杂下的因果识别与估计理论,稳健地映射到有混杂的敏感性分析框架中? 3. 如何构建不依赖特定参数模型(如Cox)的、针对整个生存分布的半参数敏感性估计量,并控制其方差与单调性?

⚠️ 作者的 framing - 作者的 framing:作者将缺口 frame 为“现有生存数据敏感性分析多针对风险比或RMST,而我们想要整个边际分布;现有方法缺乏基于影响函数的半参数框架”。这让使用IF映射成为“显然的下一步”。 - 被淡化或回避的竞争路线:作者回避了 E-value 路线(Ding & VanderWeele 2015)在生存分析中直接套用的可能性,也未深入对比 Bonvini & Kennedy (2019) 的“比例混杂”模型在删失数据下的理论难度。 - 明显该被引却未出现的文献:Robins 系列关于删失数据下 IF 映射的奠基工作(如 Robins & Rotnitzky 1992 关于因果失效时间与删失的半参数效率界)未在 intro 中显式定位;此外,近期 DML 在生存分析中的应用(如 Hou et al. 2021 的生存函数 DML)也未出现。这是值得研究者去查的缺口:本文的 IF 映射是否与 Robins 早期的删失 IF 映射等价,还是有新的推广?

张力 未见明显对立引用。但 Ding & VanderWeele (2015) 声称其 E-value 方法“无假设且比有假设的方法更不保守”,而本文采用了特定的选择偏差函数参数化(假设了 \(\pi_a(X, U)\)\(\pi_a(X)\) 的关系),两者在“是否对混杂结构做参数假设”上存在隐含的路线张力。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • \(X\):基线协变量(可观测,维度 \(p\))。
  • \(A\):处理/暴露变量(可观测,取值 \(a \in \{1, \dots, K\}\),本文核心关注 \(K=2\) 的竞争暴露)。
  • \(U\):未测量混杂(不可观测,潜在变量)。
  • \(T(a)\):潜在生存时间(不可观测,只有在接受处理 \(a\) 时才能观测到 \(T = T(a)\))。
  • \(C\):删失时间(不可观测,当 \(C < T\) 时发生删失)。
  • \(Y\):可观测时间:\(Y = \min(T, C)\)
  • \(\Delta\):删失指示器:\(\Delta = I(T \le C)\)(1表示未删失,0表示删失)。
  • Estimand(目标量)\(\bar{F}_T(t, a) = P(T(a) > t)\),即在处理 \(a\) 下,潜在生存时间超过 \(t\) 的边际概率(边际生存函数)。
  • \(\pi_a(X)\):观测到的倾向得分:\(P(A=a | X)\)
  • \(\pi_a(X, U)\):扩展倾向得分:\(P(A=a | X, U)\)(包含未测量混杂,不可观测)。
  • \(S_C(t | X, A)\):给定 \((X, A)\) 下删失时间的生存函数:\(P(C > t | X, A)\)
  • 可观测数据\(O = (X, A, Y, \Delta)\)。研究者拥有 \(n\) 个独立的 \(O_i\) 样本。想要估的是 \(\bar{F}_T(t, a)\),但 \(T(a)\)\(U\) 均不可观测。

模型与数据生成机制: 假设数据生成满足:1) 一致性:若 \(A=a\)\(T=T(a)\);2) 无干扰;3) 正值性:\(\pi_a(X) > 0\)\(S_C(t|X,A) > 0\);4) 在给定 \((X, U)\) 下,\(A\)\(T(a)\) 独立(即 \(A \perp T(a) | X, U\),这是无混杂的真正条件);5) 在给定 \((X, A, U)\) 下,\(C\)\(T\) 独立(条件独立删失)。

第二步:讲最小内核

剥掉所有一般性(如 \(K\) 个处理、GAM估计、PAVA单调性约束),最小内核是单一时间点 \(t\)、二值处理(\(A \in \{0, 1\}\))、无删失(\(C=\infty\))下的 IF 推导与映射

在这个最简特例下,可观测数据退化为 \(O = (X, A, T)\)\(\Delta=1\) 恒成立。Estimand 退化为 \(\psi(a) = P(T(a) > t) = E[I(T>t) | A=a]\) 在无混杂下的识别。 - 核心数学困难:当存在 \(U\) 时,\(A \perp T(a) | X\) 不成立,标准的 AIPW 估计量 \(\hat{\psi}(a) = E_n\left[ \frac{I(A=a) I(T>t)}{\pi_a(X)} + \left(1 - \frac{I(A=a)}{\pi_a(X)}\right) \mu_a(X) \right]\)(其中 \(\mu_a(X) = E[I(T>t)|A=a, X]\))不再识别 \(\psi(a)\),偏差为 \(E\left[ \mu_a(X, U) - \mu_a(X) \right]\)。 - 本文破法(最小内核):引入选择偏差函数(selection bias function)\(q_a(X, U) = \log \frac{\pi_a(X, U)}{1-\pi_a(X, U)} - \log \frac{\pi_a(X)}{1-\pi_a(X)}\),即加入 \(U\) 后倾向得分 log-odds 的变化。将 \(\pi_a(X, U)\) 参数化为 \(\pi_a(X)\)\(q_a\) 的函数。然后,在无删失数据的非参数模型下,求 \(\psi(a)\) 关于分布 \(P\)路径导数,推导出包含 \(q_a\) 的非参数影响函数 \(\tilde{\phi}(O_{full})\)(其中 \(O_{full} = (X, A, T, U)\))。 - 关键跳跃:由于 \(U\) 不可观测,\(\tilde{\phi}\) 无法直接用于估计。本文利用条件期望映射,将 \(\tilde{\phi}(O_{full})\)\(U\) 积分,结合选择偏差函数的参数化假设,将其转化为仅依赖可观测数据 \(O\) 的 IF \(\phi(O)\)。在这个最简特例下,这个映射本质上就是:把包含 \(U\) 的项,用 \(q_a\) 的参数化假设替换为可观测的 \(A\)\(X\) 的函数,从而在数学上消去 \(U\),得到一个可算的、带敏感性参数的 AIPW 型估计量。


三、这篇论文做了什么

三句话 ① 研究了观测性研究中时间-事件结局下未测量混杂的敏感性分析问题,目标是竞争暴露下潜在结果边际生存分布 \(\bar{F}_T(t, a)\) 的识别与估计。 ② 核心工具是非参数影响函数(IF)及其从无删失全数据到有删失观测数据的映射。 ③ 主要结论是建立了一套半参数估计流程:通过 GAM 估计处理与删失机制,利用 IF 映射构建一步估计量,并用 PAVA 保证生存函数估计的单调性。

关键设定与假设 在第二节最小记号基础上补全: - 假设 A1(条件可交换性)\(A \perp T(a) | X, U\)。统计含义:只有控制了未测量混杂 \(U\) 后,处理才是因果无混杂的。相比标准因果推断文献,这是将无混杂假设“推给”了不可观测的 \(U\)。 - 假设 A2(条件独立删失)\(C \perp T | X, A, U\)。统计含义:删失不仅要在给定 \((X, A)\) 下独立于生存时间,还要在给定 \(U\) 下独立。这比标准的独立删失假设更强,因为 \(U\) 不可观测,此假设完全不可验证。 - 假设 A3(选择偏差函数参数化):定义 \(q_a(X, U) = \log\frac{\pi_a(X, U)(1-\pi_a(X))}{\pi_a(X)(1-\pi_a(X, U))}\),并假设 \(q_a(X, U)\) 被限制在某个范围 \(\delta\) 内(如 \(|q_a| \le \delta\)),或进一步假设 \(q_a\) 不依赖 \(X\)(即 \(q_a(X, U) = q_a(U)\))。统计含义:这是敏感性参数的锚定点,\(\delta\) 越大,允许的未测量混杂影响越强。相比 Rosenbaum 模型(约束 odds ratio 偏离倍数),本文的 \(q_a\) 直接在倾向得分的 log-odds 上操作,与 AIPW 估计量的结构更契合。 - 假设 A4(半参数建模):对 \(\pi_a(X)\)\(S_C(t|X,A)\) 采用广义可加模型(GAM)建模。统计含义:为了在有限样本下稳定估计高维倾向得分与删失概率,放弃了完全非参数估计,引入了可加性结构假设。

主要结果 - 定理 1(无删失全数据 IF):在假设 A1, A3 下,推导了 \(\bar{F}_T(t, a)\) 在无删失全数据 \((X, A, T, U)\) 下的非参数影响函数。直觉:该 IF 包含了标准 AIPW 项加上一个由 \(q_a(X, U)\) 调制的偏差修正项。必要条件是 \(q_a\) 的参数化形式已知,否则 IF 无法显式表达。 - 定理 2(观测数据 IF 映射):在假设 A2 下,将定理 1 的 IF 映射到观测数据 \((X, A, Y, \Delta)\) 下,得到 \(\phi(O)\)。直觉:映射利用了 \(E[\tilde{\phi}(X, A, T, U) | X, A, Y, \Delta]\),将涉及 \(U\) 的部分用 \(q_a\) 的参数化假设消解,将涉及 \(T\) 的部分用删失机制 \(S_C\) 的逆概率加权重构。解决的技术难点是:如何在不可观测 \(U\) 且存在删失时,保持估计量的局部无偏性(即 IF 性质)。 - 估计流程与单调性约束:基于映射后的 IF \(\phi(O)\),构建一步估计量 \(\hat{\bar{F}}_T(t, a) = P_n[\phi(O; \hat{\pi}_a, \hat{S}_C, \hat{\mu}_a, \delta)]\)。由于 \(\bar{F}_T(t, a)\) 作为 \(t\) 的函数必须单调递减,而一步估计量在有限样本下可能违反单调性,作者引用 Leeuw et al. (2009) 的 PAVA(Pool-Adjacent-Violators Algorithm)对估计曲线进行强制单调化。

证明路线与技术技巧 - 整体路线: 1. 定义目标量 \(\bar{F}_T(t, a)\) 与包含 \(U\) 的扩展倾向得分 \(\pi_a(X, U)\)。 2. 引入选择偏差函数 \(q_a(X, U)\),将 \(\pi_a(X, U)\) 参数化为 \(\pi_a(X)\)\(q_a\) 的函数。 3. 在全数据 \((X, A, T, U)\) 的非参数 Tangent 空间中,求 \(\bar{F}_T(t, a)\) 的路径导数,推导出全数据 IF \(\tilde{\phi}\)。 4. 利用条件期望映射 \(E[\tilde{\phi} | O]\),结合 \(q_a\) 的参数化,将 \(\tilde{\phi}\) 中对 \(U\) 的依赖转化为对 \(A\)\(q_a\) 的依赖,得到无删失但不含 \(U\) 的 IF。 5. 引入删失机制 \(S_C\),利用 Robins-Rotnitzky 的 IF 映射规则(将 \(I(T>t)\) 替换为 \(I(Y>t)\Delta / S_C(t|X,A)\) 加上删失时的条件期望修正项),得到最终的观测数据 IF \(\phi(O)\)。 6. 代入 GAM 估计的 \(\hat{\pi}_a, \hat{S}_C, \hat{\mu}_a\),计算一步估计量,并用 PAVA 修正单调性。 - 关键跳跃点:从全数据 IF \(\tilde{\phi}\) 到观测数据 IF \(\phi\) 的映射。难点卡在:全数据 IF 中包含 \(E[I(T>t) | X, A, U]\)\(\mu_a(X, U)\) 等涉及 \(U\) 的项,而 \(U\) 不可观测,无法直接求条件期望。作者通过假设 \(q_a(X, U)\) 的结构(如 \(q_a\) 仅依赖 \(U\) 且给定 \(X, A\)\(U\) 的分布可由 \(\pi_a(X)\)\(q_a\) 推导),将 \(E[\cdot | X, A]\) 下的 \(U\) 积分转化为可计算的代数式。 - 技术技巧点名: - 非参数影响函数推导:用于定理 1,计算路径导数以获得局部最小方差无偏估计量结构。 - IF 映射:用于定理 2,这是处理删失数据因果推断的经典工具,将全数据 IF 转化为观测数据 IF。 - GAM(广义可加模型):用于估计 \(\pi_a(X)\)\(S_C(t|X,A)\),避免高维非参数估计的维度灾难,引用了 Wood (2006) 与 Hastie & Tibshirani (2017)。 - PAVA(池邻违规者算法):用于后处理步骤,保证边际生存函数估计的单调性,引用了 Leeuw et al. (2009)。 - Horowitz et al. (2004) 收敛速度界:用于论证 GAM 估计代入 IF 后的收敛性质,保证一步估计量的渐近有效性前提( nuisance 参数估计收敛速度需达到 \(n^{-1/4}\))。

真实例子与应用 - 用的什么数据/场景:前列腺癌观测性研究数据,比较两种竞争治疗策略:根治性前列腺切除术(RP, \(A=1\))与外照射放疗+雄激素剥夺(EBRT+AD, \(A=0\))。 - 怎么把本文方法用上去:以年龄、PSA水平、Gleason评分等为 \(X\),前列腺癌特异性生存时间为 \(T\),其他原因死亡或失访为删失 \(C\)。设定敏感性参数 \(\delta\) 的范围(对应 \(q_a\) 的约束),对每个 \(\delta\) 值计算 \(\bar{F}_T(t, 1)\)\(\bar{F}_T(t, 0)\) 的估计曲线,进而计算两者的差异(边际生存概率差)。 - 得到什么结果:在无未测量混杂(\(\delta=0\))时,RP 相对 EBRT+AD 有生存优势;随着 \(\delta\) 增大(允许更强的未测量混杂),生存优势的置信区间变宽,展示了结论对未测量混杂的敏感程度。 - 这个例子想说明什么:验证本文 IF 映射估计流程在真实删失生存数据上的可行性,并展示半参数敏感性分析如何将定性的“可能有混杂”转化为定量的“混杂强度需达到 \(\delta\) 才能翻转结论”。

🔎 结论是否比证明窄 本文在定理 1 与定理 2 中严格证明了 IF 的推导与映射公式,但在估计量的渐近分布与置信区间理论上,并未给出完整证明。文中依赖 GAM 估计的收敛界(引用 Horowitz et al. 2004)来 claim 一步估计量的渐近正态性,但未显式处理 PAVA 修正对渐近分布的影响(PAVA 在边界点处的分布是非标准的)。此外,作者 claim 该方法可扩展到竞争风险,但仅在讨论中提及,未给出对应的 IF 映射推导。


四、开放问题(点到为止)

  1. 观测数据 IF 估计量的严格渐近分布与方差估计:本文给出了 IF 映射公式,但未推导带 PAVA 修正后估计量的渐近分布。要证什么:PAVA 修正后 \(\hat{\bar{F}}_T(t, a)\) 的逐点与联合置信带如何构建?扎根在文中关于 PAVA 的应用部分及缺失的方差估计理论讨论。
  2. 独立删失假设(A2)的敏感性分析:本文假设 \(C \perp T | X, A, U\),但 \(U\) 不可观测使得此假设极难验证。要估什么:如果删失也依赖未测量混杂,IF 映射需如何修正?扎根在假设 A2 的陈述,这是一个明显的、本文回避的不可验证假设。
  3. Higher-Order Influence Functions (HOIF) 的引入:当 GAM 估计的收敛速度达不到 \(n^{-1/4}\) 时,一阶 IF 估计量会有剩余偏差。要估什么:在删失数据与敏感性分析框架下,如何构建二阶或高阶 IF 来修正偏差?扎根在文中对 Horowitz et al. (2004) 收敛界的依赖,以及研究者自身对 HOIF 的熟悉度。
  4. 竞争风险下累积发生率函数(CIF)的 IF 映射:作者在 intro 中提到“competing exposures”,但核心推导只针对特定原因的生存函数。要证什么:在 Fine-Gray 框架或边际 CIF 下,选择偏差函数 \(q_a\) 与 IF 映射的解析形式是什么?扎根在 intro 对竞争暴露的 framing 与正文仅处理全生存的落差。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论