跳转至

Sensitivity analysis for causal mediation: bridge score, sharp sensitivity bounds, and calibration

作者: Yuki Ohnishi, Fan Li
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.18724


一、核心问题与贡献

①研究了因果中介分析中,当序贯可忽略性的第二阶段(中介-结局无混杂)被破坏时,如何在加法尺度上进行非参数敏感性分析的问题。②核心工具是提出由两个处理特异性中介密度构成的 bridge score 作为 balancing score,并基于此推导了由残差选择比和结局范围参数刻画的 sharp additive envelope。③主要贡献在于获得了比全协变量尺度更紧的 sharp bound,并提供了尺度相容的 benchmark calibration 与残差预算校准,结合 Bayesian g-computation 实现了完整的推断。

二、基础设定

  • 核心概念与符号
  • \(O_i = (X_i, A_i, M_i, Y_i)\):基线协变量、处理、中介、结局。
  • \(\theta = E\{Y(1, M(0))\}\):跨世界中介均值(识别 NDE 和 NIE 的核心)。
  • \(B(m, x) = (f_0(m|x), f_1(m|x))\):Bridge score,由控制组和处理组在给定协变量下的中介密度构成的二维向量。
  • \(\Delta_a(m, b)\):Bridge score 敏感性函数,衡量给定 bridge score 下,中介取值带来的残差混杂。
  • \(\gamma_a(m, b)\):残差选择参数,潜在混杂 \(U\) 在给定中介与不给定中介下的似然比上确界。
  • \(\eta_a(m, b)\):结局范围参数,\(U\) 特异性结局均值的极差。
  • 关键假设
  • Assumption 1-3:一致性、正值性、处理随机化。标准设定,刻意不假设中介可忽略性。
  • Assumption 4 (Latent bridge score representation):存在标量潜在混杂 \(U\) 使得 \(Y(1,m) \perp\!\!\!\perp M | A=a, B(m), U\)统计学含义:将不可验证的中介可忽略性替换为存在单一潜在混杂因子的假设,仅用于定界,不改变观测数据模型。相比直接假设无混杂,该假设将敏感性分析参数化为 \((\gamma_a, \eta_a)\)
  • \(X \perp\!\!\!\perp U | A, B(m)\)(Remark 1):统计学含义:在 bridge score 层内,观测协变量与未观测混杂解耦。这是保证 \(\eta_a\) 在 bridge score 尺度上比全协变量尺度更紧的必要条件;若违背,意味着未观测混杂与观测协变量在 score 内仍强相关,bridge score 对结局范围的降维优势将丧失。
  • 问题背景:现有加法尺度上的中介敏感性分析(如 Imai et al. 2010 的 \(\rho\) 参数)依赖强参数假设,而非参数的 Manski-style bounds 又过宽;乘法尺度(Ding & Vanderweele 2016)虽有 sharp bound 但不适用于连续结局的加法效应。本文填补了加法尺度下 sharp bound 的空白,并通过 bridge score 解决了高维协变量下敏感性函数难以校准的维度灾难问题。

三、主要定理 / 核心结果

  1. Lemma 1 (Balancing property)
  2. 原文陈述\(f(x|A=a, M=m, B(m)=b) = f(x|A=a, B(m)=b)\);若中介可忽略性成立,则 \(Y(a,m) \perp\!\!\!\perp M | A=a, B(m)\)
  3. 直观解释:Bridge score 对中介事件平衡了协变量分布,类似于倾向得分对处理分配的平衡作用。一旦固定了处理和 bridge score,中介的具体取值不再携带关于 \(X\) 的额外信息。
  4. 技术难点:证明利用了在 \(B(m,x)=b\) 的水平集上,\(f_a(m|x)\) 为常数,从而在贝叶斯公式中消去了对 \(x\) 的依赖。

  5. Theorem 2 (Sharp additive bound)

  6. 原文陈述\(|\Delta_a(m, b)| \le \Xi_a(m, b) := \eta_a(m, b) \frac{\gamma_a(m, b)-1}{\gamma_a(m, b)}\),且该界是 sharp 的。
  7. 直观解释:混杂函数的最大绝对值由“混杂对结局的影响幅度”(\(\eta_a\))与“混杂被中介选择的倾斜程度”(\(\gamma_a\))共同决定。当 \(\gamma_a \to \infty\)\(\eta_a\) 增大时,界变宽;当 \(\gamma_a=1\)(无选择倾斜)或 \(\eta_a=0\)(对结局无影响)时,界退化为 0(即序贯可忽略性成立)。
  8. 技术难点:在加法尺度上构造与 Ding & Vanderweele (2016) 乘法尺度对应的 sharp envelope。
  9. 适用条件与局限:需要 Assumption 4 成立。局限在于 \(\eta_a\)\(\gamma_a\) 仍是不可识别的,需要后续的校准策略将其与观测数据联系。

  10. Proposition 2 (Bridge score 紧致性)

  11. 原文陈述\(\gamma_a(m, b) \le \sup_{x:B(m,x)=b} \gamma_a^*(m, x)\);在 \(X \perp\!\!\!\perp U | A, B(m)\) 下,\(\eta_a(m, b) \le \sup_{x:B(m,x)=b} \eta_a^*(m, x)\)
  12. 直观解释:在 bridge score 上做敏感性校准,严格不差于在全协变量空间上做校准。因为 bridge score 吸收了 \(X\) 中与中介相关的变异,压缩了残差选择的空间。

四、证明框架 / 方法设计

  • 证明主干逻辑:构造法 + Hahn 分解 + 极值测度构造。
  • 关键逻辑步骤(以 Theorem 2 为例):
  • 积分表示:将 \(\Delta_a\) 表示为潜在结局回归 \(\psi_a(u)\) 关于测度差 \(F_1 - F_0\) 的符号积分(\(F_1, F_0\) 分别为 \(U\) 在给定和不给定 \(M\) 下的条件分布)。
  • 仿射缩放:将 \(\psi_a\) 归一化至 \([0,1]\),将 \(\eta_a\) 提取为积分外的乘法常数。
  • 总变差上界:利用 Hahn 分解和 \(\gamma_a\) 的定义,证明测度差的总变差上确界为 \((\gamma_a - 1)/\gamma_a\)
  • Sharpness 构造:构造一个特定的 \(U \sim Unif(0,1)\) 及其条件分布 \(dF_1/dF_0 = \gamma_a \cdot 1\{u \in [0, 1/\gamma_a]\}\),使得积分精确达到上界。
  • 最关键的技巧性跳跃点:Step 4 中的极值测度构造。将 \(F_1\) 构造为在测度为 \(1/\gamma_a\) 的集合上密度为 \(\gamma_a\)、其余地方为 0 的分布。这一构造不仅满足了似然比约束,还完美最大化了概率质量的转移,是证明 sharpness 的核心。
  • 方法设计 (Bayesian g-computation)
  • 标量泛函约化(Corollary 1):将无穷维的敏感性函数 \(\Delta_a(m,b)\) 积分降维为标量 \(\bar{\Delta}_a\),使得 \(\theta = \theta_{SI} + \bar{\Delta}_0 - \bar{\Delta}_1\)
  • 推断算法:在 MCMC 迭代中,利用参数模型抽取 bridge score 和结局回归的后验,在蒙特卡洛逼近的 \([-\bar{\Xi}_a, \bar{\Xi}_a]\) 区间上为 \(\bar{\Delta}_a\) 抽取先验(如均匀先验),从而将识别不确定性、估计不确定性和敏感性不确定性全量传播至 NDE/NIE 的后验分布中。

五、与研究者兴趣的关联

  • 连接子方向:Causal mediation sensitivity analysis / Proximal causal inference 的敏感性分析框架。
  • 可借鉴的核心思路
  • Bridge score 作为 balancing score 的降维思想:在 Proximal CI 中,bridge function 同样是处理两个不可识别/高维法则(处理分配机制与混杂机制)的工具。本文将两个处理特异性的中介密度耦合为二维向量并证明其 balancing 性质,这种“将识别所需的两个法则投影到同一低维平衡尺度”的思路,可迁移至 Proximal CI 中对 negative control 设定下不可验证完整性假设的敏感性分析。
  • Sharp bound 的 Hahn 分解与极值构造技术:将混杂偏倚分解为 selection tilt (\(\gamma\)) 和 outcome range (\(\eta\)),并利用测度论构造证明 sharpness,这一套分析框架可直接用于 IV 排他性假设或 Proximal 识别假设的敏感性界推导。
  • 值得精读的关键参考文献
  • Ding & Vanderweele (2016) Sharp sensitivity bounds for mediation under unmeasured mediator-outcome confounding:本文 Theorem 2 的乘法尺度前传,对比阅读可深刻理解加法与乘法尺度下 sharp bound 构造的异同。
  • Miao et al. (2024) A confounding bridge approach for double negative control inference on causal effects:理解 Proximal CI 中的 bridge function 与本文 bridge score 的本质区别(前者解积分方程,后者做协变量平衡),思考二者结合的可能。

六、延伸思考与练习

  • 假设扰动:若修改 Remark 1 中的假设 \(X \perp\!\!\!\perp U | A, B(m)\)(即观测协变量与未观测混杂在 bridge score 层内仍存在强相关),\(\eta_a\) 的界将不再保证比协变量尺度更紧。技术上,需要引入 \(X\)\(U\) 条件依赖的度量(如条件互信息或偏 \(R^2\))来修正 \(\eta_a\) 的上界,这将导致敏感性参数增加,可能需要新的降维或校准策略。
  • 开放问题:如何将 bridge score 框架扩展到多中介或纵向中介设定?此时 bridge score 的维度将随中介数量指数增长,如何引入结构化假设(如中介间的条件独立性或张量分解)来避免维度灾难?
  • 理解检测题:假设潜在混杂因子 \(U\) 不是标量而是一个高维向量,Theorem 2 中的 sharp bound \(\eta_a (\gamma_a - 1)/\gamma_a\) 是否仍然成立?如果成立,\(\gamma_a\) 的统计含义和校准难度会发生什么变化?

Maintained by 陈星宇 · Homepage · Source on GitHub

评论