跳转至

Recanting twins: addressing intermediate confounding in mediation analysis

讲者: Iván Díaz
讨论人: Daniel Malinsky
来源: OCIS (Online Causal Inference Seminar)
日期: 2024-02-20
主题: 因果推断
视频: https://youtu.be/9hAUwC6Ecnw · 幻灯片

本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。


一、这场报告在讲哪条工作线

这场报告位于 「中介分析(mediation analysis)」 这个子方向的核心争论点上:当存在中间混杂(intermediate confounding)时,如何定义、识别并分解因果效应沿不同路径(路径特异性效应, path-specific effects)的作用

方向背景:中介分析的标准目标是分解处理 AY 的总效应(ATE)为间接效应(通过 M)与直接效应(其他所有路径)。奠基性工作(Pearl, 2001; Robins & Greenland, 1992)提出了自然直接/间接效应(natural direct/indirect effects, NDE/NIE),但其识别需要极强的交叉世界(cross-world)独立性假设,且它们在有变量 Z 同时影响 MY、且 Z 本身受 A 影响不可识别——这个问题被称为“recanting witness”(Avin, Shpitser & Pearl, 2005)。一个流行的替代方案是随机干预直接/间接效应(interventional direct/indirect effects)(VanderWeele, 2009 等),它在更弱假设下可识别,但(1)它分解的不是 ATE 而是另一个总效应,(2)Miles (2023, JRSS-B) 指出它不满足“中介尖锐零准则”(mediational sharp null criterion),即当个体层面完全无中介时,该效应仍可非零。

这场报告的站位:讲者 Díaz 试图提出一种新的路径特异性效应分解,能同时满足以下三个要求: 1. 分解的是 ATE 本身(而非某个替代总效应); 2. 满足路径特异性尖锐零准则(path-specific sharp null criterion); 3. 在有中间混杂 Z 时仍然可识别(解决 recanting witness 问题)。

二、最小内核 / 一个最简例子

符号与模型:标准中介情境(DAG 如幻灯片 p.3):

W → A → Z → M → Y
       ↓   ↗
  • 可观测W(基前协变量), A(二值处理), Z(中间混杂变量), M(中介变量), Y(结局)。
  • SCM(M₁)W = f_W(U_W)A = f_A(W, U_A)Z = f_Z(W, A, U_Z)M = f_M(W, A, Z, U_M)Y = f_Y(W, A, Z, M, U_Y)。这里 U_· 是外生误差。

关键估 then / 参数: - ATE ψ = E[Y(1) - Y(0)],其中 Y(a)A=a 时的反事实结局。 - 想要分解 ψ 为四条路径的贡献: - P₁: A → Y(直接) - P₂: A → Z → Y(通过 Z 到 Y) - P₃: A → Z → M → Y(通过 Z 和 M) - P₄: A → M → Y(通过 M,不经过 Z)

最简特例(二值 Z,二值 M,一个时间点): - 自然路径特异性效应的构造思路:定义一组嵌套的反事实(p.10),例如 - Y_{S0} = Y(1, Z(1), M(1, Z(1))) - Y_{S1} = Y(0, Z(1), M(1, Z(1)))(将 A→Y 路径的输入改为 0) - Y_{S2} = Y(0, Z(0), M(1, Z(1)))(再将 A→Z→Y 路径的输入改为 0,但 A→Z→M→Y 路径仍用 Z(1)) - 依此类推直到 Y_{S4}。 - 问题Y_{S2}Z(1) 同时出现于 A→Z→Y 路径(需置为 Z(0))和 A→Z→M→Y 路径(需保留为 Z(1))。这种“一个变量要同时说两种不同故事”的状态就是 recanting witness,导致 Y_{S2} 的分布不可识别。

Díaz 的解决方案(recanting twins): - 定义“recanting twin” T(a) 为从条件分布 Z(a) | W 中做一次随机抽样的变量(即 Z(a) 的随机副本)。 - 在对比 Y_{S1}Y_{S2}(用于定义 P₂ 效应)时,在两个反事实中将 recanting witness Z(1) 用其 twin T(1) 替换。类似地,在 P₃ 的对比中用 T(0) 替换 Z(0)。 - 结果:因为 T(a) 是随机变量,Z(a)T(a) 的结合效应被解耦,新的对比变得可识别。

最终分解(p.13):

ψ = ψ_{P1} + ψ_{P2} + ψ_{P3} + ψ_{P4} + ψ_{P2_P3}
其中前四项分别是四个路径的效应,ψ_{P2_P3} 度量中间混杂的程度(当无中间混杂时此项为零,且所有 ψ 退化为自然路径效应)。

三、报告主体:讲者讲了什么

[0:00-0:05] 导入 - 报告基于与 Tat-Thang Vo, Nicholas Williams, Richard Liu, Kara E. Rudolph 的合作。大部分内容概念性,估计/数值/应用见论文。

[0:05-0:12] 动机与方法回顾 - 讲者快速回顾 DAG(p.3)与例:吸烟(A)→ 血管加压素(Z)→ 高血压(M)→ 心肌梗死(Y)(改编自 Robins & Richardson, 2010)。 - 定义 SCM M₁(p.4),引出两类反事实解释(p.5): 1. 干预主义解释(政策相关,需可操纵原因); 2. 非能动解释(科学相关,可处理不可操纵原因如 race;引用 Malinsky, 2018)。 - 介绍 NDE/NIE(p.6)的两个问题: - 假设不可实验验证; - 有中间混杂 Z 时不可识别(Avin, Shpitser & Pearl, 2005)。

[0:12-0:18] 随机干预效应及其不足 - 介绍随机干预效应(p.7):定义 G(a) 为从 M(a) | W 的随机抽样;分解为 E[Y(1, G(1)) - Y(1, G(0))](间接)+ E[Y(1, G(0)) - Y(0, G(0))](直接)。 - 问题: - 不分解 ATE(而是一个替代总效应); - 不满足中介尖锐零准则(Miles, 2023)。 - 讲者重点解释尖锐零准则(p.8-9):定义“通过 M 的因果影响”为个体水平 sup_{·}|⋯| > 0;随机干预效应可能在无个体经历中介时仍然非零,故作为中介指标不可靠。 - 推广到路径特异性尖锐零准则(p.9 表):四条路径各有定义,理想的分解应满足:若某路径无个体水平因果影响,则其对应效应为零。

[0:18-0:22] Recanting witness 与现有分解的不可识别性 - 自然路径特异性效应的定义(p.10):五个嵌套反事实 Y_{S0} ∼ Y_{S4},效应为各相邻对的期望差值。 - Y_{S2} 的分布不可识别,因 Z(1) 需同时对 A→Z→YA→Z→M→Y 路径承担不同角色(recanting witness 命名来自 Pearl & Avin)。

[0:22-0:30] Recanting twins 的定义与分解 - 核心定义(p.11-12): - T(a)Z(a) | W,称为 Z(1-a)recanting twin(术语由 Eric Tchetgen 建议)。 - 对 P₂:用 T(1) 替代 Z(1)(变量 Y^1_{S1} = Y(0, Z(1), M(1, T(1))); - 对 P₃:用 T(0) 替代 Z(0)(变量 Y^2_{S2} = Y(0, T(0), M(1, Z(1)))。 - 得到五个参数分解(p.13): - ψ_{P1} ∼ ψ_{P4}:路径效应; - ψ_{P2_P3}:中间混杂度量(若要估计中间混杂,可直接估计此项并检验其为零)。 - 定理 1(p.13):所有 ψ 满足路径特异性尖锐零准则,且与自然路径效应同号。 - 中间混杂的精确定义(p.14):无中间混杂 = 误差空间可划分为子集,使得 A→Z, Z→M, Z→Y 不同时激活于任一单位。 - 定理 2(p.15):在无中间混杂时 ψ_{P2_P3}=0 且所有 ψ 退化(个体水平)为自然路径效应。

[0:30-0:35] 识别假设与公式 - 识别条件(p.16): - 连续可忽略性Y(a,z,m) ⟂ (A,Z,M) | W 等; - 关键交叉世界假设Y(a,z,m) ⟂ M(a',z') | Z, W(不同于 NDE/NIE 的交叉世界,干预的是 Z)。 - 注意(讲者强调):该交叉世界假设在中间混杂存在时可满足,不排除中间混杂。 - 识别公式(p.17):给出了各 E[Y_{Si} | W] 的显式表达式,涉及 E[Y|a,z,m,W]P(z,m|a,W) 等。讲者称“ugly looking”但可估计。

[0:35-0:40] 未满足的目标与 separable effects 模型 - 回顾三项目标(p.18): - ✅ 分解 ATE - ✅ 路径特异性尖锐零准则 - ❌ 识别假设可实验验证(当前仍需交叉世界假设) - 引入 可分离效应模型(Robins & Richardson, 2010; Stensrud et al., 2023)(p.19-21): - 将 A 分解为 (A_Z, A_M, A_Y),分别作用于 Z, M, Y 的路径(如:烟中尼古丁作用于下丘脑(AZ)尼古丁作用于其他器官(AM)其他毒素(AY))。 - 进一步将 Z 分解为 (Z_M, Z_Y)(如:释放入循环系统的加压素(ZM)释放入脑的加压素(ZY))。 - 在此模型 M₃ 下,交叉世界假设可替换为一系列 单一世界反事实独立性(单世界干预图可检验),从而可实验验证(p.22-23)。

[0:40-45] 实际建议与总结 - 实用建议(p.24):若无可分离知识,最佳选择是确保测量所有已知 (A,Z,M,Y) 的共同起因(U_A ⟂ (U_Y, U_M, U_Z) | W 等)。 - 结束语引用 Vo et al. (2024, arXiv:2401.04450) 与 Díaz (2023, JRSS-B)。

[0:45-1:06] 讨论者 Daniel Malinsky 的评论 - 总结贡献:满足三项理想性质(分解ATE、尖锐零准则、无中间混杂时退化为自然效果)。 - 讨论点 1(个体水平解释):随机干预(recanting twin)导致个体水平反事实难以解释——T(1) 对某个体是随机抽取值,可能意外匹配或偏离其原 Z(1),使个体对比含义模糊。讲者回应:这是随机干预的普遍“feature”;应仅在总体水平解释(作为对因果依赖关系的度量)。 - 讨论点 2(效应量可比性):两个非零路径效应的大小是否可直接比较未知;与自然效应之间的缩放因子不可识别。讲者同意需研究序关系保持性(若新效应用于排序,是否与自然效应顺序一致?),认为是开放问题。 - 讨论点 3(实用流程):建议先检验 ψ_{P2_P3} 是否零;若不可拒绝,才用自然效应(可识别)。讲者回应:其实可直接估计新效应,检验只用于解释(中间混杂是否存在)。

四、对应论文与开放问题

对应论文: - 核心论文:Vo, T. T., Williams, N., Liu, R., Rudolph, K. E., & Díaz, I. (2024). “Recanting twins: addressing intermediate confounding in mediation analysis.” arXiv:2401.04450. (讲者口头确认 p.25) - 前期基础:Díaz, I. (2023). “Non-agency interventions for causal mediation in the presence of intermediate confounding.” Journal of the Royal Statistical Society Series B. (讲者引用 p.25)—— 提出了 recanting twins 的雏形(针对总效应分解,部分定义)。

开放问题(基于报告与讨论,按时间与来源列出):

  1. [Díaz 讨论,~1:04:00] 序关系保持性:在新与自然路径效应之间,是否保持“哪一个更大”的顺序?若无此性质,新效应在相对效应大小比较中的解释力受限。
  2. [Malinsky 讨论点 1,~0:55-0:57] 个体水平解释:recanting twin 是随机变量,个体水平反事实含义模糊(讲者也承认此为“feature”)。能否构建既满足所有理想性质(分解ATE、尖锐零准则、可验证假设)又保持个体水平解释的估计?
  3. [Malinsky 讨论点 2,~0:57-0:59] 效应量标度:新效应与自然效应之间的缩放因子不可识别。是否存在无识别假设的有界标尺(如上下界),使其大小具有绝对意义?
  4. [Malinsky 讨论点 3,~0:59-1:02] 假设检验与选择后的推断:先生成与检验 ψ_{P2_P3}=0,然后选择用新效应或自然效应——这会导致后选择推断的问题(如置信区间覆盖率的偏差)。如何规避或量化此影响?
  5. [slides 13-14,未在讨论展开但显式未答] ψ_{P2_P3} 的估计与推断性质:此参数是否容易估计(如是否可构造稳健且高效的倍减机器学习?其收敛率是多少?)——报告仅给出识别公式(p.17)与文本陈述(p.25),但未给估计策略的详细理论。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论