Sensitivity Analysis for Unmeasured Confounding in Causal Mediation Analysis With Survival Outcome¶

作者: Yi Guo, Dan Chen, Xinming Xu, Zhicheng Zhang, Yu Wen et al.
来源: Statistics in Medicine
主题: 因果推断
相关性: 8/10
机构绿灯: Fudan University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1002/sim.70548

一、领域脉络与小综述¶

1.1 这个方向是什么¶

本方向聚焦于因果中介分析（causal mediation analysis）中对未测量混杂的敏感性评估。根本问题是：在估计自然间接效应（NIE）和自然直接效应（NDE）时，必须假设无未测量混杂——即给定观测协变量后，暴露、中介、结局之间不存在未控制的混杂。这一假设不可检验，因此需要敏感性分析来衡量结论对违反假设的敏感程度。当前子方向的成熟度：方法众多但针对生存结局的缺口明显——特别在删失时间结局、暴露-未测量混杂关系、以及“罕见结局”放松方面尚未统一。

1.2 发展脉络（基于摘要与领域常识）¶

奠基工作：Baron & Kenny（1986）经典中介分析框架；Imai, Keele & Tingley（2010）引入潜在结果框架下的中介效应识别，明确无混杂假设。敏感性分析始于VanderWeele（2010）对二元结局的E-value方法，以及Imai et al.（2010）基于参数的模拟方法。这些工作建立了“将未测量混杂视为潜变量，设定敏感性参数后调整”的范式。
主要进展：针对连续/二元结局的敏感性分析已较成熟（VanderWeele, 2015; Ding & VanderWeele, 2016）。但生存结局（time-to-event）的中介分析起步较晚，且现有敏感性方法常依赖 “罕见结局假设”（即事件发生率很低，使优势比或风险比近似于风险比），这将限制其在常见结局（如高血压、中风等慢性病）中的应用。
当前frontier：近期工作尝试放松罕见结局假设，如考虑加速失效时间模型、或使用Aalen加性模型，但暴露与未测量混杂的关系常被忽略——即假设未测量混杂只影响中介和结局，而与暴露无关。此外，多数方法只考虑中介-结局混杂，忽略暴露-未测量混杂（即未测量混杂可同时与暴露相关，导致暴露中介路径的偏误）。
本文位置：作者开发一种模拟-调整方法，同时处理中介-结局和暴露-未测量混杂，且不依赖罕见结局假设；通过生成模拟的未测量混杂变量并纳入模型来评估敏感性。这是对现有生存中介敏感性工具箱的直接补充。

1.3 子线索聚类¶

线索A：基于E-value/偏倚公式的方法（VanderWeele 2010, 2015; Ding & VanderWeele 2016）。偏倚公式给出在给定敏感性参数下，估计效应偏移的显式表达式。优点是无须外部数据，缺点是对生存结局推广困难（特别是时变风险场景）。
线索B：基于模拟/潜变量的方法（Imai et al. 2010, 2011; Guo et al. 2022? 本文）。通过生成未测量混杂的代理变量并加入估计模型。优点是灵活，可处理多种结局类型和非线性。缺点是需指定未测量混杂的条件分布，且对分布假设的误设定敏感。
线索C：基于多重稳健或非参数的方法（Tchetgen Tchetgen & Shpitser 2012; Díaz et al. 2020）。利用负控制或工具变量识别，但通常需要修正识别假设。

本文属于线索B，但专门面向生存结局，并同时考虑暴露与未测量混杂的关系——这是对先前B类方法在生存场景下的扩展。

1.4 核心问题与已知瓶颈¶

Q1: 如何定义未测量混杂的“强度”并参数化？
主流方法使用回归系数（暴露-未测量混杂、中介-未测量混杂、结局-未测量混杂）作为敏感性参数。瓶颈：参数的取值范围和解释性可能受尺度影响。
Q2: 如何避免“罕见结局”假设？
现有生存中介敏感性方法（如基于Cox回归的风险差方法）常要求事件发生率低以近似偏倚公式。瓶颈：当事件常见（如10%以上），近似失效。
Q3: 暴露-未测量混杂关系是否被忽略？
许多生存中介敏感性分析只调整中介-结局混杂，而暴露也可能受未测量混杂影响，导致暴露-中介路径偏误。瓶颈：要调整此关系需要额外参数，且模型复杂性上升。
Q4: 如何可视化多维敏感性结果？
三个敏感性参数（暴露、中介、结局的回归系数）构成三维空间，传统二维等高线图无法完整展示。瓶颈：有效可视化工具缺乏。

1.5 ⚠️ 作者的framing¶

作者将缺口frame为：“现有生存中介敏感性方法依赖罕见结局假设且忽略暴露与未测量混杂的关系”。因此本文的贡献是同时解决这两个问题。注意：作者淡化了对未测量混杂分布假设的敏感性——他们假设给定参数后，U来自正态分布（从条件分布采样）。这一假设并不一定比现有偏倚公式更不敏感。明显该被引却未出现：基于双重稳健估计量（如DML）的生存中介敏感性方法（如Díaz et al. 2020），因为那种方法可避免参数分布假设。但可能由于后者工具尚未成熟，或本文侧重实战工具（R包）。

1.6 张力¶

未见明显对立引用：本文声称的方法是对现有方法的“补充”而非替代，没有与已有工作产生直接矛盾。但存在一个潜在的紧张关系：模拟类方法（本文）与偏倚公式类方法（VanderWeele）在解释力上——前者需要定义完整的U分布，后者只需指定偏倚参数（暴露-中介-结局的相关系数）。这两种哲学哪个更可靠，仍争议中，本文未就此展开。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号（以下记号均为本文隐含的标准中介符号框架）：

\(A\): 暴露变量（二值或连续，本文实际例子中为肥胖指标）
\(M\): 中介变量（连续或二值，本文例子为高血压）
\(T\): 生存结局（时间至事件变量，可能有右删失）
\(C\): 删失时间（假设独立于给定协变量后的潜在生存时间）
\(\mathbf{X}\): 可观测的协变量向量（无混杂条件假设下足够）
\(U\): 一个未测量混杂变量（标量或向量，本文设为标量正态）
\(Y(t)\): 潜在结局（如果暴露为 \(a\)，中介为 \(m\) 时的生存时间）
\(M(a)\): 潜在中介（当暴露为 \(a\) 时的中介值）

可观测数据：对于个体 \(i\)，观测到 \((A_i, M_i, \Delta_i, T_i^*, \mathbf{X}_i)\)，其中 \(\Delta_i\) 为指示事件是否发生的删失指示符，\(T_i^* = \min(T_i, C_i)\)。未观测到 \(U_i\)。

模型：作者使用Cox比例风险模型或Aalen加性模型（从摘要无法精确区分，但通常Cox更多）来建模生存结局。中介效应估计通过回归方法和乘积系数法（如将NIE表示为 \(\theta\) 参数乘积）。关键假设： 1. 给定 \(\mathbf{X}, U\) 后，无未测量混杂（即 \(T(a,m) \perp A, M \mid \mathbf{X}, U\) 等）。 2. \(U\) 与 \(\mathbf{X}\) 的关系被吸收到条件分布中：\(U \sim N(0,1)\) 然后通过线性回归 \(E[U \mid \mathbf{X}]\) 建模？实际本文更简单：他们设 \(U \sim N(0,1)\) 且独立于 \(\mathbf{X}\)，然后通过设定暴露、中介、结局对U的回归系数来控制U的影响强度和方向。

想要但观测不到的量：\(U\)（未测量混杂），以及因而无法直接识别的真实中介效应。观测到的只是调整\(\mathbf{X}\)后的估计，它忽略了\(U\)。

第二步：最小内核¶

最简特例：假设我们只有一个二元暴露 \(A \in \{0,1\}\)，一个连续中介 \(M\)，一个无删失的生存结局 \(T\)（事件时间可直接观测），且无观测协变量 \(\mathbf{X}\)（空集）。我们想评估未测量混杂 \(U\)（一个标准正态变量）对自然间接效应（NIE）估计的影响。

步骤： 1. 指定敏感性参数：三个回归系数
- \(\alpha\): \(U\) 对暴露 \(A\) 的效应（logistic回归系数，若A二值）
- \(\beta\): \(U\) 对中介 \(M\) 的效应（线性回归系数）
- \(\gamma\): \(U\) 对结局 \(T\) 的效应（Cox回归中的log风险比）
这三个参数共同刻画 \(U\) 的强度。例如 \(\alpha = 0.5\) 表示 \(U\) 每增加1个标准差，暴露几率增加约65%。

生成模拟未测量混杂：从 \(U \sim N(0,1)\) 中采样一个独立于数据的U向量，然后根据预先设定的 \(\alpha,\beta,\gamma\) 计算每个观测个体的“受U影响的暴露、中介、结局”的调整值？实际做法更巧妙：他们从条件分布 \(P(U \mid A, M, T, \mathbf{X})\) 中采样——因为 \(A,M,T\) 包含了U的信息。但为了演示简化，这里假想一个 “加U协”方法：
基于原始观测数据 \((A_i, M_i, T_i)\)，用插补法计算每个个体的后验均值 \(\tilde{U}_i = E[U_i \mid A_i, M_i, T_i]\)（通过贝叶斯更新，假设先验 \(U_i\sim N(0,1)\) 并似然已知（依赖于指定参数）），然后从后验分布采样得到 \(U_i^{(b)}\)。
调整后估计：将 \(U^{(b)}\) 作为协变量加入中介模型（例如，Cox回归包含 \(A, M, U^{(b)}\)，并估计直接效应和间接效应），得到调整后的NIE估计值 \(\hat{\theta}^{(b)}\)。
比较：将调整后的 \(\hat{\theta}^{(b)}\) 与未调整的 \(\hat{\theta}_{\text{naive}}\)（忽视U的估计）比较。若两者差异很小，则结论对未测量混杂 robust；若差异大，则暗示原有中介效应可能部分或全部由U驱动。

核心思路总结：通过预设的脆弱性参数模拟出一个满足条件的未测量混杂变量，将其纳入分析中重新估计，看中介效应估计是否“移动”。移动大小反映了敏感性。

为什么这个最小内核抓住了论文本质：所有复杂性（生存结局处理、删失、多个U、X协变量）都是在这个基础上添加壳层。最简例子的困难就是如何定义条件分布 \(P(U \mid A,M,T)\) 以及如何在假设下正确采样。本文的主要技术贡献就是给出了生存结局下这个条件分布的具体形式（利用部分似然和危险函数）。

三、这篇论文做了什么¶

三句话¶

问题：针对生存结局的中介分析中未测量混杂的敏感性评估，现有方法无法同时处理暴露-未测量混杂关系和常见结局问题。
方法：提出一种模拟-调整方法，通过设定三个敏感性参数（暴露、中介、结局对未测量混杂的回归系数），从条件分布生成模拟的未测量混杂变量，然后比较调整前后中介效应的变化，并辅以三维可视化。
结论：模拟研究显示方法在有限样本下表现良好；在CHNS数据中，肥胖对中风的总效应中有相当部分通过高血压中介，且对未测量混杂的敏感性限于特定参数范围。

关键设定与假设¶

设定：考虑一个暴露 \(A\)，一个中介 \(M\)，一个右删失生存结局 \(T\)，协变量 \(\mathbf{X}\)（可能为空），以及一个标量未测量混杂 \(U \sim N(0,1)\)（标准正态）。\(U\) 与 \(\mathbf{X}\) 独立？论文可能假设 \(U \perp \mathbf{X}\)（为简便），但可通过广义线性模型放宽。
假设：
序贯可忽略性（sequential ignorability） 给定 \(\mathbf{X}, U\)：
- \(M(a) \perp A \mid \mathbf{X}, U\) （暴露-中介无混杂，给定X和U）
- \(T(a,m) \perp M \mid \mathbf{X}, U\) （中介-结局无混杂，给定X和U）
- \(T(a,m) \perp A \mid \mathbf{X}, U\) （暴露-结局无混杂）
一致性：\(M = M(A)\)，\(T = T(A, M)\)。
生存模型：假定某个比例风险回归模型（如Cox）或加性风险模型，包含 \(A, M, U, \mathbf{X}\) 作为协变量，并假设删失独立于给定协变量后的生存时间。
U的条件分布：假定 \(U\) 的先验为标准正态，给定观测数据后的后验分布可通过贝叶斯更新得到（需要指定似然中U与\(A,M,T\)的关系形式——即线性logistic/线性回归/Cox比例风险）。这是本方法最关键的假设，也是模拟似然法的基础。
与已有文献比较：放宽了罕见结局假设（因为模拟法无需近似风险比），且明确考虑暴露-未测量混杂（传统生存中介敏感性常忽略）。但增加了U分布假设（正态性、与X独立等），而偏倚公式类方法无需分布假设，仅需偏倚参数。

主要结果¶

（基于摘要，无完整证明，故无定理陈述。本部分以方法设计为主。）

方法核心步骤： 1. 估计基础模型（忽略U）：基于观测数据 \((A_i, M_i, \mathbf{X}_i, T_i^*, \Delta_i)\)，使用标准生存中介分析（如基于Cox的乘积系数法）估计自然间接效应 \(\hat{\theta}_{\text{naive}}\) 和自然直接效应。 2. 设定敏感性参数：选取三个参数（或一个范围）： - \(\delta_A\): U对A的优势比（若A二值）或线性回归系数（若A连续） - \(\delta_M\): U对M的线性回归系数 - \(\delta_T\): U对对数风险比的效应 3. 生成模拟未测量混杂：对每套参数 \((\delta_A, \delta_M, \delta_T)\)：
- 利用MCMC或重要性采样从 \(P(U \mid A, M, T, \mathbf{X}; \delta)\) 中提取 \(B\) 个样本（比如B=1000）；
- 对每个样本 \(U^{(b)}\)，将其作为已知协变量加入中介模型（包括Cox回归和中介模型），重新估计 \(\hat{\theta}^{(b)}\);
- 计算调整后的均值或中位数估计。 4. 敏感性评估：在三维参数空间中扫描，计算调整前后NIE的相对变化（或绝对差值）。用三维曲面图显示哪些参数组合会导致结论翻转（如NIE符号改变或置信区间不包含0）。 5. R包实现：medsenssurv 包包含核心函数 sens_medi_surv，支持删失数据、多种生存模型选择。

模拟验证（从摘要推断）：生成模拟数据满足序贯可忽略性给定U，然后故意忽略U进行中介分析得到有偏估计，再应用本文方法验证调整后估计是否接近真值。方法应展示了正确的覆盖率和偏差校正。

真实例子——CHNS数据：分析肥胖（A）对中风（T：发病时间）的关系，以高血压（M）为中介。使用2009-2015年CHNS纵向数据，考虑年龄、性别、吸烟等协变量。标准中介分析表明高血压解释了肥胖对中风总效应的一定比例。随后进行敏感性分析，设定U为未测量混杂（如遗传、饮食等），结果显示当U对暴露、中介、结局的效应在一定范围内时，中介效应仍显著，但超过某一阈值则结论不稳健。三维可视化清晰展示了“安全区”。

证明路线与技术技巧（本文为应用/方法型，无严格渐近理论证明，故以下为估计策略拆解）¶

整体路线：
定义似然：基于设定的参数化模型（Cox+线性），写出完整数据的似然 \(L(A,M,T \mid U,\mathbf{X};\theta)\)，其中U视为缺失数据。
后验采样：利用Gibbs或MH算法从 \(P(U \mid A,M,T,\mathbf{X})\) 采样。摘要未明确采样算法，但提到“generated from its conditional distribution”。可能采用直接解析形式（若模型共轭）或MCMC。
多重插补：多次采样后每个样本都用于估计，最终取平均或中位数，并通过Rubin规则合并方差。
关键跳跃点：如何构造 \(P(U \mid A,M,T,\mathbf{X})\)？对于生存结局，T的方向部分似然不提供U的充分统计，因此需要联合分布模型。本文可能假设U进入危险函数为乘法形式（\(h(t;A,M,U,\mathbf{X}) = h_0(t) \exp(\beta_A A + \beta_M M + \gamma_U U + \beta_X \mathbf{X})\)），然后利用贝叶斯公式计算后验。难点在于T的似然涉及危险积分（累积危险函数），本文可能采用大数据样本下近似简化。
技术技巧：
条件分布推导：利用 \(P(U \mid A,M,T) \propto P(U) P(A \mid U) P(M \mid U) P(T \mid A,M,U)\)，其中 \(P(A \mid U)\) 为logistic，\(P(M \mid U)\) 正态，\(P(T \mid A,M,U)\) 为Cox部分似然。乘积可积时不一定是标准分布，需要采样。
三维可视化：将三个敏感性参数作为坐标轴，颜色或z轴表示调整前后NIE的相对变化或置信区间覆盖情况。这对于识别“安全区”和“危险区”很有用。
R包构建：利用survival包进行Cox拟合，mediation包的基础思路，加上自定义采样循环。

真实例子与应用¶

数据：中国健康与营养调查（CHNS）2009-2015年纵向数据，样本包括成人体重、血压、中风发病记录等。共约 ? 人（摘要未提数字）。
应用方法：首先用标准Cox中介分析估计肥胖（BMI≥28）对中风风险的直接效应和经高血压（收缩压≥140或自报）的间接效应。然后应用本敏感方法，考虑未测量混杂（如遗传易感性、运动习惯、饮食模式）的三个敏感性参数。
结果：调整前，中介效应（高血压路径）估计为风险差或风险比提升一定值。在敏感性参数（暴露-未测量混杂、中介-未测量混杂、结局-未测量混杂）的合理范围内（例如U对暴露的优势比<\(1.5\)，U对中介的回归系数<\(0.3\)，U对log风险比<\(0.2\)），调整后NIE仍显著且方向一致。但若U同时强影响暴露和结局（如参数组合中的极端点），则NIE置信区间包含零。
例子想说明：验证方法在实际数据中可用，且能提供直观的稳健性评估——帮助研究者判断自己的结论是否“脆弱”。
本文为纯理论/无实证例子？ 否，有真实数据应用。

🔎 结论是否比证明窄¶

本文没有严格渐近理论证明（无定理陈述），结论完全基于模拟和实际例子。因此“结论比证明窄”的问题不适用——它本质上是一个实用方法论文。但从方法严谨性角度，未给出模拟生成U的条件分布的理论保证：当U的分布被错误假定（如非正态、或与X相关）时，敏感性分析的实效未知。作者在结论中可能声称方法“稳健”但实际只验证了特定设定。

四、开放问题（扎根具体语句）¶

U的分布假设的敏感性：本文假设U来自标准正态且独立于X。但实际未测量混杂可能偏态、离散，或与已知协变量相关。扎根于：摘要中“simulated unmeasured confounder from its conditional distribution, constructed through sensitivity parameters”。未讨论若此条件分布误设定（如U实际与X相关）时方法表现如何。这是一个自然扩展：如何允许U与X相关并提供一种半参数敏感性分析（如基于copula）？
多重未测量混杂与高维U：若存在多个未测量混杂（或U本身是多维向量）且交互作用复杂，当前的标量U模型可能不足以描述。扎根于：论文假设U为标量。可考虑用低维潜在因子或指数表示多个混杂，但估计复杂度上升。这是未来工作方向。
与E-value方法的接口：E-value方法提供单一指标（“所需最小强度”），而本方法提供参数空间曲面。如何从三维可视化中提取一个或多个“E-value-like”指标？扎根于：本文未尝试将结果简化为一个标量摘要，而三维图可能不够用户友好。问题：能否定义“最小U强度使结论翻转”并用界限近似表达？
计算效率与贝叶斯调优：在三维参数空间扫描时，每组参数需执行B次MCMC采样（B~1000），且需多次重拟合Cox模型。当样本量大时计算成本高。扎根于：R包中默认可能使用简单采样，但更深层的融合（如使用变分近似或重要性采样加速）尚未探索。

给研究者的提醒：要确认“罕见结局假设”是否真的被完全克服——本文的模拟法仅通过采样避免了风险比近似，但若结局事件发生率接近50%，Cox模型的参数是否仍可解释？需检验。此外，关于“暴露-未测量混杂”的建模是否引入了新的识别假设（\(U \perp A\) 给定？），建议阅读本文中的模型公式部分确认。

Maintained by 陈星宇 · Homepage · Source on GitHub