Sensitivity analysis for causal mediation: bridge score, sharp sensitivity bounds, and calibration¶

作者: Yuki Ohnishi, Fan Li
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.18724

一、核心问题与贡献¶

①研究了因果中介分析中，当序贯可忽略性的第二阶段（中介-结局无混杂）被破坏时，如何在加法尺度上进行非参数敏感性分析的问题。②核心工具是提出由两个处理特异性中介密度构成的 bridge score 作为 balancing score，并基于此推导了由残差选择比和结局范围参数刻画的 sharp additive envelope。③主要贡献在于获得了比全协变量尺度更紧的 sharp bound，并提供了尺度相容的 benchmark calibration 与残差预算校准，结合 Bayesian g-computation 实现了完整的推断。

二、基础设定¶

核心概念与符号：
\(O_i = (X_i, A_i, M_i, Y_i)\)：基线协变量、处理、中介、结局。
\(\theta = E\{Y(1, M(0))\}\)：跨世界中介均值（识别 NDE 和 NIE 的核心）。
\(B(m, x) = (f_0(m|x), f_1(m|x))\)：Bridge score，由控制组和处理组在给定协变量下的中介密度构成的二维向量。
\(\Delta_a(m, b)\)：Bridge score 敏感性函数，衡量给定 bridge score 下，中介取值带来的残差混杂。
\(\gamma_a(m, b)\)：残差选择参数，潜在混杂 \(U\) 在给定中介与不给定中介下的似然比上确界。
\(\eta_a(m, b)\)：结局范围参数，\(U\) 特异性结局均值的极差。
关键假设：
Assumption 1-3：一致性、正值性、处理随机化。标准设定，刻意不假设中介可忽略性。
Assumption 4 (Latent bridge score representation)：存在标量潜在混杂 \(U\) 使得 \(Y(1,m) \perp\!\!\!\perp M | A=a, B(m), U\)。统计学含义：将不可验证的中介可忽略性替换为存在单一潜在混杂因子的假设，仅用于定界，不改变观测数据模型。相比直接假设无混杂，该假设将敏感性分析参数化为 \((\gamma_a, \eta_a)\)。
\(X \perp\!\!\!\perp U | A, B(m)\)（Remark 1）：统计学含义：在 bridge score 层内，观测协变量与未观测混杂解耦。这是保证 \(\eta_a\) 在 bridge score 尺度上比全协变量尺度更紧的必要条件；若违背，意味着未观测混杂与观测协变量在 score 内仍强相关，bridge score 对结局范围的降维优势将丧失。
问题背景：现有加法尺度上的中介敏感性分析（如 Imai et al. 2010 的 \(\rho\) 参数）依赖强参数假设，而非参数的 Manski-style bounds 又过宽；乘法尺度（Ding & Vanderweele 2016）虽有 sharp bound 但不适用于连续结局的加法效应。本文填补了加法尺度下 sharp bound 的空白，并通过 bridge score 解决了高维协变量下敏感性函数难以校准的维度灾难问题。

三、主要定理 / 核心结果¶

Lemma 1 (Balancing property)：
原文陈述：\(f(x|A=a, M=m, B(m)=b) = f(x|A=a, B(m)=b)\)；若中介可忽略性成立，则 \(Y(a,m) \perp\!\!\!\perp M | A=a, B(m)\)。
直观解释：Bridge score 对中介事件平衡了协变量分布，类似于倾向得分对处理分配的平衡作用。一旦固定了处理和 bridge score，中介的具体取值不再携带关于 \(X\) 的额外信息。
技术难点：证明利用了在 \(B(m,x)=b\) 的水平集上，\(f_a(m|x)\) 为常数，从而在贝叶斯公式中消去了对 \(x\) 的依赖。
Theorem 2 (Sharp additive bound)：
原文陈述：\(|\Delta_a(m, b)| \le \Xi_a(m, b) := \eta_a(m, b) \frac{\gamma_a(m, b)-1}{\gamma_a(m, b)}\)，且该界是 sharp 的。
直观解释：混杂函数的最大绝对值由“混杂对结局的影响幅度”(\(\eta_a\))与“混杂被中介选择的倾斜程度”(\(\gamma_a\))共同决定。当 \(\gamma_a \to \infty\) 或 \(\eta_a\) 增大时，界变宽；当 \(\gamma_a=1\)（无选择倾斜）或 \(\eta_a=0\)（对结局无影响）时，界退化为 0（即序贯可忽略性成立）。
技术难点：在加法尺度上构造与 Ding & Vanderweele (2016) 乘法尺度对应的 sharp envelope。
适用条件与局限：需要 Assumption 4 成立。局限在于 \(\eta_a\) 和 \(\gamma_a\) 仍是不可识别的，需要后续的校准策略将其与观测数据联系。
Proposition 2 (Bridge score 紧致性)：
原文陈述：\(\gamma_a(m, b) \le \sup_{x:B(m,x)=b} \gamma_a^*(m, x)\)；在 \(X \perp\!\!\!\perp U | A, B(m)\) 下，\(\eta_a(m, b) \le \sup_{x:B(m,x)=b} \eta_a^*(m, x)\)。
直观解释：在 bridge score 上做敏感性校准，严格不差于在全协变量空间上做校准。因为 bridge score 吸收了 \(X\) 中与中介相关的变异，压缩了残差选择的空间。

四、证明框架 / 方法设计¶

证明主干逻辑：构造法 + Hahn 分解 + 极值测度构造。
关键逻辑步骤（以 Theorem 2 为例）：
积分表示：将 \(\Delta_a\) 表示为潜在结局回归 \(\psi_a(u)\) 关于测度差 \(F_1 - F_0\) 的符号积分（\(F_1, F_0\) 分别为 \(U\) 在给定和不给定 \(M\) 下的条件分布）。
仿射缩放：将 \(\psi_a\) 归一化至 \([0,1]\)，将 \(\eta_a\) 提取为积分外的乘法常数。
总变差上界：利用 Hahn 分解和 \(\gamma_a\) 的定义，证明测度差的总变差上确界为 \((\gamma_a - 1)/\gamma_a\)。
Sharpness 构造：构造一个特定的 \(U \sim Unif(0,1)\) 及其条件分布 \(dF_1/dF_0 = \gamma_a \cdot 1\{u \in [0, 1/\gamma_a]\}\)，使得积分精确达到上界。
最关键的技巧性跳跃点：Step 4 中的极值测度构造。将 \(F_1\) 构造为在测度为 \(1/\gamma_a\) 的集合上密度为 \(\gamma_a\)、其余地方为 0 的分布。这一构造不仅满足了似然比约束，还完美最大化了概率质量的转移，是证明 sharpness 的核心。
方法设计 (Bayesian g-computation)：
标量泛函约化（Corollary 1）：将无穷维的敏感性函数 \(\Delta_a(m,b)\) 积分降维为标量 \(\bar{\Delta}_a\)，使得 \(\theta = \theta_{SI} + \bar{\Delta}_0 - \bar{\Delta}_1\)。
推断算法：在 MCMC 迭代中，利用参数模型抽取 bridge score 和结局回归的后验，在蒙特卡洛逼近的 \([-\bar{\Xi}_a, \bar{\Xi}_a]\) 区间上为 \(\bar{\Delta}_a\) 抽取先验（如均匀先验），从而将识别不确定性、估计不确定性和敏感性不确定性全量传播至 NDE/NIE 的后验分布中。

五、与研究者兴趣的关联¶

连接子方向：Causal mediation sensitivity analysis / Proximal causal inference 的敏感性分析框架。
可借鉴的核心思路：
Bridge score 作为 balancing score 的降维思想：在 Proximal CI 中，bridge function 同样是处理两个不可识别/高维法则（处理分配机制与混杂机制）的工具。本文将两个处理特异性的中介密度耦合为二维向量并证明其 balancing 性质，这种“将识别所需的两个法则投影到同一低维平衡尺度”的思路，可迁移至 Proximal CI 中对 negative control 设定下不可验证完整性假设的敏感性分析。
Sharp bound 的 Hahn 分解与极值构造技术：将混杂偏倚分解为 selection tilt (\(\gamma\)) 和 outcome range (\(\eta\))，并利用测度论构造证明 sharpness，这一套分析框架可直接用于 IV 排他性假设或 Proximal 识别假设的敏感性界推导。
值得精读的关键参考文献：
Ding & Vanderweele (2016) Sharp sensitivity bounds for mediation under unmeasured mediator-outcome confounding：本文 Theorem 2 的乘法尺度前传，对比阅读可深刻理解加法与乘法尺度下 sharp bound 构造的异同。
Miao et al. (2024) A confounding bridge approach for double negative control inference on causal effects：理解 Proximal CI 中的 bridge function 与本文 bridge score 的本质区别（前者解积分方程，后者做协变量平衡），思考二者结合的可能。

六、延伸思考与练习¶

假设扰动：若修改 Remark 1 中的假设 \(X \perp\!\!\!\perp U | A, B(m)\)（即观测协变量与未观测混杂在 bridge score 层内仍存在强相关），\(\eta_a\) 的界将不再保证比协变量尺度更紧。技术上，需要引入 \(X\) 与 \(U\) 条件依赖的度量（如条件互信息或偏 \(R^2\)）来修正 \(\eta_a\) 的上界，这将导致敏感性参数增加，可能需要新的降维或校准策略。
开放问题：如何将 bridge score 框架扩展到多中介或纵向中介设定？此时 bridge score 的维度将随中介数量指数增长，如何引入结构化假设（如中介间的条件独立性或张量分解）来避免维度灾难？
理解检测题：假设潜在混杂因子 \(U\) 不是标量而是一个高维向量，Theorem 2 中的 sharp bound \(\eta_a (\gamma_a - 1)/\gamma_a\) 是否仍然成立？如果成立，\(\gamma_a\) 的统计含义和校准难度会发生什么变化？

Maintained by 陈星宇 · Homepage · Source on GitHub