Two fundamental problems in causal mediation analysis Discussant [standard form]: James Robins (Harvard University) and Thomas Richardson (University of Washington)¶
讲者: Caleb Miles
来源: OCIS (Online Causal Inference Seminar)
日期: 2023-10-03
主题: 因果推断
视频: https://youtu.be/GKwmVJtVJRk · 幻灯片
本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。
一、这场报告在讲哪条工作线¶
这场报告同时处理了因果中介分析方向下的两条工作线,它们都聚焦于“自然间接效应”(NIE)的识别与解释困境。
- 方向背景:从中介分析“好做”到“不好做”的演化
- 奠基与主流路线:Baron & Kenny (1986) 的“乘积法”基于线性SEM,无因果解释。Robins & Greenland (1992) 与 Pearl (2001) 用反事实定义了NIE,但识别需要四个很强的无混杂假设,尤其是“第四个假设”(即无暴露诱导的中介-结局混杂,且需要跨世界反事实独立性)。
- 当前frontier(部分放松假设):VanderWeele, Vansteelandt & Robins (2014) 提出的“随机干预NIE”(NIER)通过将中介替换为分布上的随机抽样来避开第四个假设,使识别只需“标准”因果假设。这一度使中介分析看似又回到“容易”状态。然而学界(尤其Thomas Richardson等人)流传“folk wisdom”,认为NIER并不真正捕捉中介。
-
可分离效应框架:Robins & Richardson (2010, 2022) 提出将暴露分解为两个成分(例如烟草中的尼古丁与焦油),分别只通过中介或直接作用于结局。这一框架提供了另一条理解“间接效应”的途径,且不需要对中介本身进行干预。
-
这场报告站在哪
- Part I(已发表,JRSSB 2023):Caleb 正式化并证明了“folk wisdom”——NIER 不满足“尖锐零准则”(Sharp Null Criterion, SNC):即使没有人间间接效应(mediational sharp null 成立),NIER仍可非零。他通过两个反例分别说明:(a)有暴露诱导的混杂时,(b)无跨世界反事实独立性时。在能够使NIER满足SNC的附加条件下,NIER退化为NIE,因此没有提供优势。结论:如果他定义的“中介”是合理的,则 NIER 不是真正的间接效应测量,我们回到了NIE,而NIE需要更强的(理想情况下无法验证的)假设。
- Part II(工作论文):他提出,即使只考虑单个时间点的中介M_t,其“之前”的所有中介实例{M_t, 0<t<t}会自动充当暴露诱导的混杂(mediator autoconfounding),从而使NIE通常无法识别。他进而论证,研究者真正关心的应是经过整个中介过程的效应(NIEF),而单点M_t只能提供一个下界*(方向一致时)。这引出了一个开放问题:需要更密集地测量中介过程(如函数型数据方法)。
二、最小内核 / 一个最简例子¶
符号设定: - A ∈ {a, a}:二值暴露(假设随机化,无基线协变量) - Y:结局(这里取二值,{0,1}) - M:在A与Y之间测量的单一时间点中介(二值,{0,1}) - 反事实:Y(a, m), M(a), Y{a', M(a'')}(嵌套反事实) - 目标估计量(estimand):NIE = E[Y{a, M(a)}] - E[Y{a, M(a)}];NIER = E[Y{a, G(a)}] - E[Y{a, G(a*)}],其中G(a')是与M(a')同分布但不依赖于M(a')的随机变量。
最简特例(Part I的反例核心思路): 假设总人口分成两类,各占一半: - 第1类:A对M无个体效应(M(a)=M(a)=0),但M对Y有正效应(例如,Y(a,1)-Y(a,0)=1 某类个体)。注意:因为A不改变其M,所以对于这个人,“A影响M且M影响Y”不成立→ 此人无个体间接效应。 - 第2类:A对M有正效应(M(a)=1, M(a)=0),但M对Y完全无个体效应(Y(a,1)=Y(a,0))。同样,此人也无个体间接效应。 因此,“没有个体间间接效应”成立(mediational sharp null 成立)。但NIER的表达式可写成某种关于遗传学混合的东西(没有NIE的结构保),计算表明它可等于例如 ±1/4(Y二元时非零)。
直观理解:NIER强行将M的分布打乱,导致计数时会“借用”第1类个体的M→Y效应来“假装”存在A→M→Y的途径,而事实上每个人都不满足“A影响M且M影响Y”。
三、报告主体:讲者讲了什么¶
[0:00-0:02] 开场、背景 - 承认自己同时讲了已完成论文(Part I)和工作论文(Part II),强调概念性(识别与解释)而非估计。
[0:04-0:06] 传统中介与反事实定义 - 指出Baron-Kenny的乘积法缺乏因果定义、不考虑混杂、局限于线性模型。 - 介绍为什么会需要“第四个假设”(无暴露诱导的中介-结局混杂,跨世界独立性),展示L(暴露诱导的混杂)的DAG。
[0:12-0:14] NIER 的定义 - 讲者明确:NIER将M(a')替换为随机变量G(a'),其性质保证NIER 仅需标准因果假设 就可识别,规避了第四个假设。
[0:15-0:17] “什么是真正的中介效果?” - 引入“个体间接效应”的定义:对个体i,同时满足M_i(a)≠M_i(a) 和 Y_i(a', M_i(a))≠Y_i(a', M_i(a))。 - “尖锐零准则”(SNC):若无任何个体间接效应,则间接效应指标体系应等于0(若为差尺度)。NIE显然满足SNC。
[0:18-0:19] 主要结果(Part I) - 结果1(有暴露诱导混杂时):NIER不满足SNC。 - 结果2(无跨世界独立性时):NIER也不满足SNC。 - 证明sketch(讲者口头给出的):构造反例。一半人群A不影响M,另一半M不影响Y → 无人同时满足二者,因此sharp null成立。但NIER表达式中出现了不抵消的交叉项,可非零(例如±1/4,Y为二值时)。讲者强调:例子可以感觉“过分人为”,但若想排除它,需要额外更强的假设——并且在那些假设下,NIER退化为NIE,因此无优势。
[0:20-0:23] NIE与NIER等价的条件与Part I总结 - 在暴露诱导混杂情形,若满足“A→L, L→M, L→Y 之一缺失,或无平均L-M交互”则NIER = NIE且满足SNC,但那时NIE本身也一样可识别。 - 类似地,在可分离效应模型下(例如尼古丁与焦油分解)NIER = NIE且满足SNC,但同样NIE可识别。 - 结论:NIER缺乏真实间接效应解释;“最好我们能做”的是针对NIE的部分识别界(如Miles等人, 2017)。不过NIER仍有合理的联合随机干预解释。 - 开放问题:是否存在其他非平凡的间接效应度量,在“弱”假设下满足SNC?他提到Díaz (2022) 可能部分解决。
[0:24-0:26] Q&A部分(略):回答NIER是否改变问题(是的,它本质上是对干预分布的对比,而非机制分解)。
[0:27-0:30] Part II: 中介过程的核心作用 - 主题:即使只考虑单一时间点中介M_t,其“之前”的所有实例(如M_{t/2})会自动扮演暴露诱导混杂的角色(中介自混淆)。因此,无额外强假设,NIE通常不可识别。 - 好消息:在尖零假设下(即A不影响任何时刻的中介,或中介在任何时刻不影响Y),识别公式仍可收敛到0 → 可获得一份一致检验。 - 更现实的替代情形:可能需要A只在t附近影响M,或M只通过t处影响Y(相当于SUTVA假设)。这在实际中很难保证。
[0:30-0:36] 三种应对 - (来自VanderWeele et al. 2014): 1. 改用NIER(但Part I已指出其解释问题)。 2. 仅估计经过M_t的路径特定效应(限制性——丢掉了早期中介的影响)。 3. 联合考虑通过所有{t_k}的联合间接效应 → 他认为最合理,但为何只停在t?他提议考虑整条中介过程{NIEF}。
[0:36-0:41] NIEF与NIEC的关系及结论 - 可观测量下,NIEC(经过单点M_t)是NIEF的一个组成部分(还有通过M_{<t}等的另三条路径)。 - 若假设所有路径效应同号,|NIEF| ≥ |NIEC|,且符号相同。因此NIEC可作为|NIEF|的下界——然而NIEC本身通常不可识别(因自混淆)。 - 但因NIEC在尖零置信下可识别(公式收敛到0),故可用它来检验NIEF的存在性和方向。但不能同样用于自然直接效应(因为下界方向相反)。 - 建议:认真考虑中介过程;如有可能,测量中介过程更频繁(如函数型数据分析方法)。
[1:00-1:18] 讨论(Robins & Richardson) - Jamie Robins 详细介绍了可分离效应框架:将A分解为N(只影响M)和O(只直接/不通过M影响Y)两个成分。只要N和O是真实可干预的,就可以用标准的G-公式识别NIER,并且(在特定DAG中)它正好等于NIE。 - 在有暴露诱导混杂L的情况下,可分离效应框架给出了更精细的分类:按N和O与L的因果关系(三种情形A, B, C)得到不同识别公式,而在经典框架下均无法识别NIE。 - Robins 的核心观点:他定义的“可分离间接效应”是真正的间接效应(满足SNC),而Caleb讨论的NIER(随机干预方法)本质上不是间接效应。Robins认为后者应打上引号称为“干预主义伪中介”。 - Thomas Richardson 补充:N与O必须是真实的概念性干预,否则无反事实意义。
四、对应论文与开放问题¶
(a) 对应论文¶
- Part I(已发表):
- Miles, C.H. (2023). On the causal interpretation of randomized interventional indirect effects. Journal of the Royal Statistical Society: Series B (In press).
- arXiv: https://arxiv.org/abs/2203.00245(讲者明确提到:arXiv链接,JRSSB接收)
- Part II(工作论文):
- 未提供arXiv/参考文献。讲者称“work in progress”。
- 讨论相关:
- Robins, J.M. & Richardson, T.S. (2010). Alternative graphical causal models and the identification of direct effects.
- Robins, J.M., Richardson, T.S. & Shpitser, I. (2022). An interventionist approach to mediation analysis. (二者均列在参考文献中)
- Díaz, I. (2022). Causal influence, causal effects, and path analysis in the presence of intermediate confounding. arXiv:2205.08000.(讲者提到的可能部分解决开放问题的文章)
(b) 报告留下的开放问题(每条扎根于转写/幻灯片)¶
-
是否存在非平凡的间接效应度量,在弱假设(不需跨世界独立性、不需排除暴露诱导混杂)下满足SNC?([0:25-0:26], Slide "The Big Open Question")讲者提到Díaz (2022)可能部分解决,但“remains to be seen”。
-
“可分离效应”框架中的N/O成分在真实世界中何时是“真实可干预”的?(Thomas Richardson 在讨论中指出:没有免费午餐,N/O必须是真实可能执行的干预,否则反事实无意义。[1:10-1:14])
-
Part II的完整理论:如何将NIEF定义为经过整条中介过程{M_t}的效应?其识别、估计与SNC性质如何?(整场Part II均为工作论文中开放)
-
在实践中,当只有单次中介测量时,NIEC 在哪些情形下可以被非参数部分识别(不只是0假设检验)?([0:40-0:41]:“NIEC is not identified (without further assumptions)”;“we can at least use NIEC to test for the presence and direction of NIEF”)。
-
函数型数据分析方法(如Lindquist 2012; Zeng et al. 2023)如何形式化地嵌入NIEF的识别与估计?([0:42]讲者提到可参考这类文章,但未具体展开)。
Maintained by 陈星宇 · Homepage · Source on GitHub