Addressing the influence of unmeasured confounding in observational studies with time-to-event outcomes: a semiparametric sensitivity analysis approach¶

作者: Linda Amoafo, Shiyao Xu, Elizabeth Platz, Daniel Scharfstein
来源: Biostatistics
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么 这个子方向要解决的根本统计问题是：在观测性研究中，当“无未测量混杂”这一不可验证的核心假设被破坏时，如何定量地评估和限制因果效应估计的偏差。当前，该方向在二值处理、连续/二值结局下已有较成熟的参数与半参数框架，但在时间-事件（生存）结局与竞争暴露下，由于删失与未测量混杂的联合扭曲，边际潜在结果分布的识别与估计仍处于从特定模型（如Cox模型偏差校正）向非/半参数框架过渡的阶段。

发展脉络 根据 introduction 的引用线索，该方向的发展可串成如下主线：

奠基工作（匹配与IPW下的敏感性分析）：Rosenbaum (2002) 奠定了匹配设计下的敏感性分析框架；Tan (2006) 将其扩展到逆概率加权（IPW）框架。这些工作留下了口子：如何脱离匹配/IPW的特定估计路线，给出更一般的半参数框架？
主要进展（一般混杂结构与无假设界限）：VanderWeele & Arah (2011) 给出了连续/分类变量下的一般偏差公式；Ding & VanderWeele (2015) 提出了E-value，作者在引用时明确指出其定位：“We are specifically interested in drawing inference about the difference in the marginal distributions of the time-to-event under competing treatments”——这表明本文刻意将目标从E-value所针对的风险比转移到边际分布差异。Carnegie et al. (2016) 与 Bonvini & Kennedy (2019) 分别从“模拟潜在混杂因子”与“未测量混杂比例”角度切入，但均未系统处理删失数据。
当前 frontier（生存数据下的敏感性分析）：Lin et al. (2013) 针对Cox模型给出了偏差公式；Huang et al. (2019) 将模拟混杂法扩展到生存与竞争风险；Lee et al. (2024) 针对受限平均生存时间（RMST）差异构建了基于优化的敏感性分析。作者引用 Lee et al. (2024) 时指出其处理了RMST差异，这为本文留下了口子：从单一汇总统计量（RMST）扩展到整个边际生存分布。
本文的位置：本文将半参数影响函数（IF）技术引入生存数据的敏感性分析，通过“无删失数据IF → 观测数据IF”的映射，填补了“竞争暴露下边际潜在生存分布的半参数敏感性估计”这一空白。

子线索聚类 被引文献大致落在三条子线索上： 1. 风险比/比值比尺度下的混杂偏差界限：VanderWeele & Arah (2011), Ding & VanderWeele (2015), VanderWeele & Ding (2017)。这一簇在做“不依赖混杂因子具体分布的尖锐代数界限”，但局限于相对风险尺度。 2. 边际敏感性模型与优化/重加权路线：Rosenbaum (2002), Zhao et al. (2017), Lee et al. (2024)。这一簇通过约束倾向得分偏离的程度，将敏感性分析转化为线性分式规划或约束优化问题，但估计量往往依赖IPW，方差大且未深入挖掘半参数效率。 3. 模拟混杂与比例混杂路线：Carnegie et al. (2016), Bonvini & Kennedy (2019), Huang et al. (2019)。这一簇直接对未测量混杂 \(U\) 的分布或出现比例建模，通过EM算法或非参数重加权估计，但计算成本高且对 \(U\) 的参数化假设较强。

这个方向在追问的核心问题 1. 如何选择与参数化敏感性参数，使其既有临床/科学解释性，又能保证偏差界限的尖锐性？ 2. 如何在存在删失的情况下，将无混杂下的因果识别与估计理论，稳健地映射到有混杂的敏感性分析框架中？ 3. 如何构建不依赖特定参数模型（如Cox）的、针对整个生存分布的半参数敏感性估计量，并控制其方差与单调性？

⚠️ 作者的 framing - 作者的 framing：作者将缺口 frame 为“现有生存数据敏感性分析多针对风险比或RMST，而我们想要整个边际分布；现有方法缺乏基于影响函数的半参数框架”。这让使用IF映射成为“显然的下一步”。 - 被淡化或回避的竞争路线：作者回避了 E-value 路线（Ding & VanderWeele 2015）在生存分析中直接套用的可能性，也未深入对比 Bonvini & Kennedy (2019) 的“比例混杂”模型在删失数据下的理论难度。 - 明显该被引却未出现的文献：Robins 系列关于删失数据下 IF 映射的奠基工作（如 Robins & Rotnitzky 1992 关于因果失效时间与删失的半参数效率界）未在 intro 中显式定位；此外，近期 DML 在生存分析中的应用（如 Hou et al. 2021 的生存函数 DML）也未出现。这是值得研究者去查的缺口：本文的 IF 映射是否与 Robins 早期的删失 IF 映射等价，还是有新的推广？

张力未见明显对立引用。但 Ding & VanderWeele (2015) 声称其 E-value 方法“无假设且比有假设的方法更不保守”，而本文采用了特定的选择偏差函数参数化（假设了 \(\pi_a(X, U)\) 与 \(\pi_a(X)\) 的关系），两者在“是否对混杂结构做参数假设”上存在隐含的路线张力。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(X\)：基线协变量（可观测，维度 \(p\)）。
\(A\)：处理/暴露变量（可观测，取值 \(a \in \{1, \dots, K\}\)，本文核心关注 \(K=2\) 的竞争暴露）。
\(U\)：未测量混杂（不可观测，潜在变量）。
\(T(a)\)：潜在生存时间（不可观测，只有在接受处理 \(a\) 时才能观测到 \(T = T(a)\)）。
\(C\)：删失时间（不可观测，当 \(C < T\) 时发生删失）。
\(Y\)：可观测时间：\(Y = \min(T, C)\)。
\(\Delta\)：删失指示器：\(\Delta = I(T \le C)\)（1表示未删失，0表示删失）。
Estimand（目标量）：\(\bar{F}_T(t, a) = P(T(a) > t)\)，即在处理 \(a\) 下，潜在生存时间超过 \(t\) 的边际概率（边际生存函数）。
\(\pi_a(X)\)：观测到的倾向得分：\(P(A=a | X)\)。
\(\pi_a(X, U)\)：扩展倾向得分：\(P(A=a | X, U)\)（包含未测量混杂，不可观测）。
\(S_C(t | X, A)\)：给定 \((X, A)\) 下删失时间的生存函数：\(P(C > t | X, A)\)。
可观测数据：\(O = (X, A, Y, \Delta)\)。研究者拥有 \(n\) 个独立的 \(O_i\) 样本。想要估的是 \(\bar{F}_T(t, a)\)，但 \(T(a)\) 和 \(U\) 均不可观测。

模型与数据生成机制：假设数据生成满足：1) 一致性：若 \(A=a\) 则 \(T=T(a)\)；2) 无干扰；3) 正值性：\(\pi_a(X) > 0\) 且 \(S_C(t|X,A) > 0\)；4) 在给定 \((X, U)\) 下，\(A\) 与 \(T(a)\) 独立（即 \(A \perp T(a) | X, U\)，这是无混杂的真正条件）；5) 在给定 \((X, A, U)\) 下，\(C\) 与 \(T\) 独立（条件独立删失）。

第二步：讲最小内核

剥掉所有一般性（如 \(K\) 个处理、GAM估计、PAVA单调性约束），最小内核是单一时间点 \(t\)、二值处理（\(A \in \{0, 1\}\)）、无删失（\(C=\infty\)）下的 IF 推导与映射。

在这个最简特例下，可观测数据退化为 \(O = (X, A, T)\)，\(\Delta=1\) 恒成立。Estimand 退化为 \(\psi(a) = P(T(a) > t) = E[I(T>t) | A=a]\) 在无混杂下的识别。 - 核心数学困难：当存在 \(U\) 时，\(A \perp T(a) | X\) 不成立，标准的 AIPW 估计量 \(\hat{\psi}(a) = E_n\left[ \frac{I(A=a) I(T>t)}{\pi_a(X)} + \left(1 - \frac{I(A=a)}{\pi_a(X)}\right) \mu_a(X) \right]\)（其中 \(\mu_a(X) = E[I(T>t)|A=a, X]\)）不再识别 \(\psi(a)\)，偏差为 \(E\left[ \mu_a(X, U) - \mu_a(X) \right]\)。 - 本文破法（最小内核）：引入选择偏差函数（selection bias function）\(q_a(X, U) = \log \frac{\pi_a(X, U)}{1-\pi_a(X, U)} - \log \frac{\pi_a(X)}{1-\pi_a(X)}\)，即加入 \(U\) 后倾向得分 log-odds 的变化。将 \(\pi_a(X, U)\) 参数化为 \(\pi_a(X)\) 与 \(q_a\) 的函数。然后，在无删失数据的非参数模型下，求 \(\psi(a)\) 关于分布 \(P\) 的路径导数，推导出包含 \(q_a\) 的非参数影响函数 \(\tilde{\phi}(O_{full})\)（其中 \(O_{full} = (X, A, T, U)\)）。 - 关键跳跃：由于 \(U\) 不可观测，\(\tilde{\phi}\) 无法直接用于估计。本文利用条件期望映射，将 \(\tilde{\phi}(O_{full})\) 对 \(U\) 积分，结合选择偏差函数的参数化假设，将其转化为仅依赖可观测数据 \(O\) 的 IF \(\phi(O)\)。在这个最简特例下，这个映射本质上就是：把包含 \(U\) 的项，用 \(q_a\) 的参数化假设替换为可观测的 \(A\) 与 \(X\) 的函数，从而在数学上消去 \(U\)，得到一个可算的、带敏感性参数的 AIPW 型估计量。

三、这篇论文做了什么¶

三句话 ① 研究了观测性研究中时间-事件结局下未测量混杂的敏感性分析问题，目标是竞争暴露下潜在结果边际生存分布 \(\bar{F}_T(t, a)\) 的识别与估计。 ② 核心工具是非参数影响函数（IF）及其从无删失全数据到有删失观测数据的映射。 ③ 主要结论是建立了一套半参数估计流程：通过 GAM 估计处理与删失机制，利用 IF 映射构建一步估计量，并用 PAVA 保证生存函数估计的单调性。

关键设定与假设 在第二节最小记号基础上补全： - 假设 A1（条件可交换性）：\(A \perp T(a) | X, U\)。统计含义：只有控制了未测量混杂 \(U\) 后，处理才是因果无混杂的。相比标准因果推断文献，这是将无混杂假设“推给”了不可观测的 \(U\)。 - 假设 A2（条件独立删失）：\(C \perp T | X, A, U\)。统计含义：删失不仅要在给定 \((X, A)\) 下独立于生存时间，还要在给定 \(U\) 下独立。这比标准的独立删失假设更强，因为 \(U\) 不可观测，此假设完全不可验证。 - 假设 A3（选择偏差函数参数化）：定义 \(q_a(X, U) = \log\frac{\pi_a(X, U)(1-\pi_a(X))}{\pi_a(X)(1-\pi_a(X, U))}\)，并假设 \(q_a(X, U)\) 被限制在某个范围 \(\delta\) 内（如 \(|q_a| \le \delta\)），或进一步假设 \(q_a\) 不依赖 \(X\)（即 \(q_a(X, U) = q_a(U)\)）。统计含义：这是敏感性参数的锚定点，\(\delta\) 越大，允许的未测量混杂影响越强。相比 Rosenbaum 模型（约束 odds ratio 偏离倍数），本文的 \(q_a\) 直接在倾向得分的 log-odds 上操作，与 AIPW 估计量的结构更契合。 - 假设 A4（半参数建模）：对 \(\pi_a(X)\) 和 \(S_C(t|X,A)\) 采用广义可加模型（GAM）建模。统计含义：为了在有限样本下稳定估计高维倾向得分与删失概率，放弃了完全非参数估计，引入了可加性结构假设。

主要结果 - 定理 1（无删失全数据 IF）：在假设 A1, A3 下，推导了 \(\bar{F}_T(t, a)\) 在无删失全数据 \((X, A, T, U)\) 下的非参数影响函数。直觉：该 IF 包含了标准 AIPW 项加上一个由 \(q_a(X, U)\) 调制的偏差修正项。必要条件是 \(q_a\) 的参数化形式已知，否则 IF 无法显式表达。 - 定理 2（观测数据 IF 映射）：在假设 A2 下，将定理 1 的 IF 映射到观测数据 \((X, A, Y, \Delta)\) 下，得到 \(\phi(O)\)。直觉：映射利用了 \(E[\tilde{\phi}(X, A, T, U) | X, A, Y, \Delta]\)，将涉及 \(U\) 的部分用 \(q_a\) 的参数化假设消解，将涉及 \(T\) 的部分用删失机制 \(S_C\) 的逆概率加权重构。解决的技术难点是：如何在不可观测 \(U\) 且存在删失时，保持估计量的局部无偏性（即 IF 性质）。 - 估计流程与单调性约束：基于映射后的 IF \(\phi(O)\)，构建一步估计量 \(\hat{\bar{F}}_T(t, a) = P_n[\phi(O; \hat{\pi}_a, \hat{S}_C, \hat{\mu}_a, \delta)]\)。由于 \(\bar{F}_T(t, a)\) 作为 \(t\) 的函数必须单调递减，而一步估计量在有限样本下可能违反单调性，作者引用 Leeuw et al. (2009) 的 PAVA（Pool-Adjacent-Violators Algorithm）对估计曲线进行强制单调化。

证明路线与技术技巧 - 整体路线： 1. 定义目标量 \(\bar{F}_T(t, a)\) 与包含 \(U\) 的扩展倾向得分 \(\pi_a(X, U)\)。 2. 引入选择偏差函数 \(q_a(X, U)\)，将 \(\pi_a(X, U)\) 参数化为 \(\pi_a(X)\) 与 \(q_a\) 的函数。 3. 在全数据 \((X, A, T, U)\) 的非参数 Tangent 空间中，求 \(\bar{F}_T(t, a)\) 的路径导数，推导出全数据 IF \(\tilde{\phi}\)。 4. 利用条件期望映射 \(E[\tilde{\phi} | O]\)，结合 \(q_a\) 的参数化，将 \(\tilde{\phi}\) 中对 \(U\) 的依赖转化为对 \(A\) 与 \(q_a\) 的依赖，得到无删失但不含 \(U\) 的 IF。 5. 引入删失机制 \(S_C\)，利用 Robins-Rotnitzky 的 IF 映射规则（将 \(I(T>t)\) 替换为 \(I(Y>t)\Delta / S_C(t|X,A)\) 加上删失时的条件期望修正项），得到最终的观测数据 IF \(\phi(O)\)。 6. 代入 GAM 估计的 \(\hat{\pi}_a, \hat{S}_C, \hat{\mu}_a\)，计算一步估计量，并用 PAVA 修正单调性。 - 关键跳跃点：从全数据 IF \(\tilde{\phi}\) 到观测数据 IF \(\phi\) 的映射。难点卡在：全数据 IF 中包含 \(E[I(T>t) | X, A, U]\) 与 \(\mu_a(X, U)\) 等涉及 \(U\) 的项，而 \(U\) 不可观测，无法直接求条件期望。作者通过假设 \(q_a(X, U)\) 的结构（如 \(q_a\) 仅依赖 \(U\) 且给定 \(X, A\) 下 \(U\) 的分布可由 \(\pi_a(X)\) 与 \(q_a\) 推导），将 \(E[\cdot | X, A]\) 下的 \(U\) 积分转化为可计算的代数式。 - 技术技巧点名： - 非参数影响函数推导：用于定理 1，计算路径导数以获得局部最小方差无偏估计量结构。 - IF 映射：用于定理 2，这是处理删失数据因果推断的经典工具，将全数据 IF 转化为观测数据 IF。 - GAM（广义可加模型）：用于估计 \(\pi_a(X)\) 与 \(S_C(t|X,A)\)，避免高维非参数估计的维度灾难，引用了 Wood (2006) 与 Hastie & Tibshirani (2017)。 - PAVA（池邻违规者算法）：用于后处理步骤，保证边际生存函数估计的单调性，引用了 Leeuw et al. (2009)。 - Horowitz et al. (2004) 收敛速度界：用于论证 GAM 估计代入 IF 后的收敛性质，保证一步估计量的渐近有效性前提（ nuisance 参数估计收敛速度需达到 \(n^{-1/4}\)）。

真实例子与应用 - 用的什么数据/场景：前列腺癌观测性研究数据，比较两种竞争治疗策略：根治性前列腺切除术（RP, \(A=1\)）与外照射放疗+雄激素剥夺（EBRT+AD, \(A=0\)）。 - 怎么把本文方法用上去：以年龄、PSA水平、Gleason评分等为 \(X\)，前列腺癌特异性生存时间为 \(T\)，其他原因死亡或失访为删失 \(C\)。设定敏感性参数 \(\delta\) 的范围（对应 \(q_a\) 的约束），对每个 \(\delta\) 值计算 \(\bar{F}_T(t, 1)\) 与 \(\bar{F}_T(t, 0)\) 的估计曲线，进而计算两者的差异（边际生存概率差）。 - 得到什么结果：在无未测量混杂（\(\delta=0\)）时，RP 相对 EBRT+AD 有生存优势；随着 \(\delta\) 增大（允许更强的未测量混杂），生存优势的置信区间变宽，展示了结论对未测量混杂的敏感程度。 - 这个例子想说明什么：验证本文 IF 映射估计流程在真实删失生存数据上的可行性，并展示半参数敏感性分析如何将定性的“可能有混杂”转化为定量的“混杂强度需达到 \(\delta\) 才能翻转结论”。

🔎 结论是否比证明窄 本文在定理 1 与定理 2 中严格证明了 IF 的推导与映射公式，但在估计量的渐近分布与置信区间理论上，并未给出完整证明。文中依赖 GAM 估计的收敛界（引用 Horowitz et al. 2004）来 claim 一步估计量的渐近正态性，但未显式处理 PAVA 修正对渐近分布的影响（PAVA 在边界点处的分布是非标准的）。此外，作者 claim 该方法可扩展到竞争风险，但仅在讨论中提及，未给出对应的 IF 映射推导。

四、开放问题（点到为止）¶

观测数据 IF 估计量的严格渐近分布与方差估计：本文给出了 IF 映射公式，但未推导带 PAVA 修正后估计量的渐近分布。要证什么：PAVA 修正后 \(\hat{\bar{F}}_T(t, a)\) 的逐点与联合置信带如何构建？扎根在文中关于 PAVA 的应用部分及缺失的方差估计理论讨论。
独立删失假设（A2）的敏感性分析：本文假设 \(C \perp T | X, A, U\)，但 \(U\) 不可观测使得此假设极难验证。要估什么：如果删失也依赖未测量混杂，IF 映射需如何修正？扎根在假设 A2 的陈述，这是一个明显的、本文回避的不可验证假设。
Higher-Order Influence Functions (HOIF) 的引入：当 GAM 估计的收敛速度达不到 \(n^{-1/4}\) 时，一阶 IF 估计量会有剩余偏差。要估什么：在删失数据与敏感性分析框架下，如何构建二阶或高阶 IF 来修正偏差？扎根在文中对 Horowitz et al. (2004) 收敛界的依赖，以及研究者自身对 HOIF 的熟悉度。
竞争风险下累积发生率函数（CIF）的 IF 映射：作者在 intro 中提到“competing exposures”，但核心推导只针对特定原因的生存函数。要证什么：在 Fine-Gray 框架或边际 CIF 下，选择偏差函数 \(q_a\) 与 IF 映射的解析形式是什么？扎根在 intro 对竞争暴露的 framing 与正文仅处理全生存的落差。

Maintained by 陈星宇 · Homepage · Source on GitHub

Addressing the influence of unmeasured confounding in observational studies with time-to-event outcomes: a semiparametric sensitivity analysis approach¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止）¶

评论