Two fundamental problems in causal mediation analysis Discussant [standard form]: James Robins (Harvard University) and Thomas Richardson (University of Washington)¶

讲者: Caleb Miles
来源: OCIS (Online Causal Inference Seminar)
日期: 2023-10-03
主题: 因果推断
视频: https://youtu.be/GKwmVJtVJRk · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

一、这场报告在讲哪条工作线¶

这场报告同时处理了因果中介分析方向下的两条工作线，它们都聚焦于“自然间接效应”（NIE）的识别与解释困境。

方向背景：从中介分析“好做”到“不好做”的演化
奠基与主流路线：Baron & Kenny (1986) 的“乘积法”基于线性SEM，无因果解释。Robins & Greenland (1992) 与 Pearl (2001) 用反事实定义了NIE，但识别需要四个很强的无混杂假设，尤其是“第四个假设”（即无暴露诱导的中介-结局混杂，且需要跨世界反事实独立性）。
当前frontier（部分放松假设）：VanderWeele, Vansteelandt & Robins (2014) 提出的“随机干预NIE”（NIER）通过将中介替换为分布上的随机抽样来避开第四个假设，使识别只需“标准”因果假设。这一度使中介分析看似又回到“容易”状态。然而学界（尤其Thomas Richardson等人）流传“folk wisdom”，认为NIER并不真正捕捉中介。
可分离效应框架：Robins & Richardson (2010, 2022) 提出将暴露分解为两个成分（例如烟草中的尼古丁与焦油），分别只通过中介或直接作用于结局。这一框架提供了另一条理解“间接效应”的途径，且不需要对中介本身进行干预。
这场报告站在哪
Part I（已发表，JRSSB 2023）：Caleb 正式化并证明了“folk wisdom”——NIER 不满足“尖锐零准则”（Sharp Null Criterion, SNC）：即使没有人间间接效应（mediational sharp null 成立），NIER仍可非零。他通过两个反例分别说明：（a）有暴露诱导的混杂时，（b）无跨世界反事实独立性时。在能够使NIER满足SNC的附加条件下，NIER退化为NIE，因此没有提供优势。结论：如果他定义的“中介”是合理的，则 NIER 不是真正的间接效应测量，我们回到了NIE，而NIE需要更强的（理想情况下无法验证的）假设。
Part II（工作论文）：他提出，即使只考虑单个时间点的中介M_t，其“之前”的所有中介实例{M_t, 0<t<t}会自动充当暴露诱导的混杂（mediator autoconfounding），从而使NIE通常无法识别。他进而论证，研究者真正关心的应是经过整个中介过程的效应（NIEF），而单点M_t只能提供一个下界*（方向一致时）。这引出了一个开放问题：需要更密集地测量中介过程（如函数型数据方法）。

二、最小内核 / 一个最简例子¶

符号设定： - A ∈ {a, a}：二值暴露（假设随机化，无基线协变量） - Y：结局（这里取二值，{0,1}） - M：在A与Y之间测量的单一时间点中介（二值，{0,1}） - 反事实：Y(a, m), M(a), Y{a', M(a'')}（嵌套反事实） - 目标估计量（estimand）：NIE = E[Y{a, M(a)}] - E[Y{a, M(a)}]；NIER = E[Y{a, G(a)}] - E[Y{a, G(a*)}]，其中G(a')是与M(a')同分布但不依赖于M(a')的随机变量。

最简特例（Part I的反例核心思路）：假设总人口分成两类，各占一半： - 第1类：A对M无个体效应（M(a)=M(a)=0），但M对Y有正效应（例如，Y(a,1)-Y(a,0)=1 某类个体）。注意：因为A不改变其M，所以对于这个人，“A影响M且M影响Y”不成立→ 此人无个体间接效应。 - 第2类：A对M有正效应（M(a)=1, M(a)=0），但M对Y完全无个体效应（Y(a,1)=Y(a,0)）。同样，此人也无个体间接效应。因此，“没有个体间间接效应”成立（mediational sharp null 成立）。但NIER的表达式可写成某种关于遗传学混合的东西（没有NIE的结构保），计算表明它可等于例如 ±1/4（Y二元时非零）。

直观理解：NIER强行将M的分布打乱，导致计数时会“借用”第1类个体的M→Y效应来“假装”存在A→M→Y的途径，而事实上每个人都不满足“A影响M且M影响Y”。

三、报告主体：讲者讲了什么¶

[0:00-0:02] 开场、背景 - 承认自己同时讲了已完成论文（Part I）和工作论文（Part II），强调概念性（识别与解释）而非估计。

[0:04-0:06] 传统中介与反事实定义 - 指出Baron-Kenny的乘积法缺乏因果定义、不考虑混杂、局限于线性模型。 - 介绍为什么会需要“第四个假设”（无暴露诱导的中介-结局混杂，跨世界独立性），展示L（暴露诱导的混杂）的DAG。

[0:12-0:14] NIER 的定义 - 讲者明确：NIER将M(a'）替换为随机变量G(a')，其性质保证NIER 仅需标准因果假设 就可识别，规避了第四个假设。

[0:15-0:17] “什么是真正的中介效果？” - 引入“个体间接效应”的定义：对个体i，同时满足M_i(a)≠M_i(a) 和 Y_i(a', M_i(a))≠Y_i(a', M_i(a))。 - “尖锐零准则”（SNC）：若无任何个体间接效应，则间接效应指标体系应等于0（若为差尺度）。NIE显然满足SNC。

[0:18-0:19] 主要结果（Part I） - 结果1（有暴露诱导混杂时）：NIER不满足SNC。 - 结果2（无跨世界独立性时）：NIER也不满足SNC。 - 证明sketch（讲者口头给出的）：构造反例。一半人群A不影响M，另一半M不影响Y → 无人同时满足二者，因此sharp null成立。但NIER表达式中出现了不抵消的交叉项，可非零（例如±1/4，Y为二值时）。讲者强调：例子可以感觉“过分人为”，但若想排除它，需要额外更强的假设——并且在那些假设下，NIER退化为NIE，因此无优势。

[0:20-0:23] NIE与NIER等价的条件与Part I总结 - 在暴露诱导混杂情形，若满足“A→L, L→M, L→Y 之一缺失，或无平均L-M交互”则NIER = NIE且满足SNC，但那时NIE本身也一样可识别。 - 类似地，在可分离效应模型下（例如尼古丁与焦油分解）NIER = NIE且满足SNC，但同样NIE可识别。 - 结论：NIER缺乏真实间接效应解释；“最好我们能做”的是针对NIE的部分识别界（如Miles等人, 2017）。不过NIER仍有合理的联合随机干预解释。 - 开放问题：是否存在其他非平凡的间接效应度量，在“弱”假设下满足SNC？他提到Díaz (2022) 可能部分解决。

[0:24-0:26] Q&A部分（略）：回答NIER是否改变问题（是的，它本质上是对干预分布的对比，而非机制分解）。

[0:27-0:30] Part II: 中介过程的核心作用 - 主题：即使只考虑单一时间点中介M_t，其“之前”的所有实例（如M_{t/2}）会自动扮演暴露诱导混杂的角色（中介自混淆）。因此，无额外强假设，NIE通常不可识别。 - 好消息：在尖零假设下（即A不影响任何时刻的中介，或中介在任何时刻不影响Y），识别公式仍可收敛到0 → 可获得一份一致检验。 - 更现实的替代情形：可能需要A只在t附近影响M，或M只通过t处影响Y（相当于SUTVA假设）。这在实际中很难保证。

[0:30-0:36] 三种应对 - （来自VanderWeele et al. 2014）： 1. 改用NIER（但Part I已指出其解释问题）。 2. 仅估计经过M_t的路径特定效应（限制性——丢掉了早期中介的影响）。 3. 联合考虑通过所有{t_k}的联合间接效应 → 他认为最合理，但为何只停在t？他提议考虑整条中介过程{NIEF}。

[0:36-0:41] NIEF与NIEC的关系及结论 - 可观测量下，NIEC（经过单点M_t）是NIEF的一个组成部分（还有通过M_{<t}等的另三条路径）。 - 若假设所有路径效应同号，|NIEF| ≥ |NIEC|，且符号相同。因此NIEC可作为|NIEF|的下界——然而NIEC本身通常不可识别（因自混淆）。 - 但因NIEC在尖零置信下可识别（公式收敛到0），故可用它来检验NIEF的存在性和方向。但不能同样用于自然直接效应（因为下界方向相反）。 - 建议：认真考虑中介过程；如有可能，测量中介过程更频繁（如函数型数据分析方法）。

[1:00-1:18] 讨论（Robins & Richardson） - Jamie Robins 详细介绍了可分离效应框架：将A分解为N（只影响M）和O（只直接/不通过M影响Y）两个成分。只要N和O是真实可干预的，就可以用标准的G-公式识别NIER，并且（在特定DAG中）它正好等于NIE。 - 在有暴露诱导混杂L的情况下，可分离效应框架给出了更精细的分类：按N和O与L的因果关系（三种情形A, B, C）得到不同识别公式，而在经典框架下均无法识别NIE。 - Robins 的核心观点：他定义的“可分离间接效应”是真正的间接效应（满足SNC），而Caleb讨论的NIER（随机干预方法）本质上不是间接效应。Robins认为后者应打上引号称为“干预主义伪中介”。 - Thomas Richardson 补充：N与O必须是真实的概念性干预，否则无反事实意义。

四、对应论文与开放问题¶

(a) 对应论文¶

Part I（已发表）：
Miles, C.H. (2023). On the causal interpretation of randomized interventional indirect effects. Journal of the Royal Statistical Society: Series B (In press).
arXiv: https://arxiv.org/abs/2203.00245（讲者明确提到：arXiv链接，JRSSB接收）
Part II（工作论文）：
未提供arXiv/参考文献。讲者称“work in progress”。
讨论相关：
Robins, J.M. & Richardson, T.S. (2010). Alternative graphical causal models and the identification of direct effects.
Robins, J.M., Richardson, T.S. & Shpitser, I. (2022). An interventionist approach to mediation analysis. (二者均列在参考文献中)
Díaz, I. (2022). Causal influence, causal effects, and path analysis in the presence of intermediate confounding. arXiv:2205.08000.（讲者提到的可能部分解决开放问题的文章）

(b) 报告留下的开放问题（每条扎根于转写/幻灯片）¶

是否存在非平凡的间接效应度量，在弱假设（不需跨世界独立性、不需排除暴露诱导混杂）下满足SNC？（[0:25-0:26], Slide "The Big Open Question"）讲者提到Díaz (2022)可能部分解决，但“remains to be seen”。
“可分离效应”框架中的N/O成分在真实世界中何时是“真实可干预”的？（Thomas Richardson 在讨论中指出：没有免费午餐，N/O必须是真实可能执行的干预，否则反事实无意义。[1:10-1:14]）
Part II的完整理论：如何将NIEF定义为经过整条中介过程{M_t}的效应？其识别、估计与SNC性质如何？（整场Part II均为工作论文中开放）
在实践中，当只有单次中介测量时，NIEC 在哪些情形下可以被非参数部分识别（不只是0假设检验）？（[0:40-0:41]：“NIEC is not identified (without further assumptions)”；“we can at least use NIEC to test for the presence and direction of NIEF”）。
函数型数据分析方法（如Lindquist 2012; Zeng et al. 2023）如何形式化地嵌入NIEF的识别与估计？（[0:42]讲者提到可参考这类文章，但未具体展开）。

Maintained by 陈星宇 · Homepage · Source on GitHub