Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators¶
讲者: Judith Lok
来源: OCIS (Online Causal Inference Seminar)
日期: 2020-08-18
主题: 因果推断
视频: https://www.youtube.com/watch?v=AB_DR0JhflU · 幻灯片
本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。
相关论文¶
- 1903.04697 (尚未精读 —
talks read --id … --read-papers可补)
一、这场报告在讲哪条工作线¶
这场报告立足于 因果中介分析(causal mediation analysis) 这个子方向。该方向的核心追问是:将一个总处理效应(ATE)分解为通过中介变量 M 的间接效应(mediated)和其余的直接效应(direct),并且在什么假设下这种分解具有因果解释。
奠基与主流路线:
- 经验传统始于 Baron & Kenny (1986) 的“产品方法”(product method),线性模型无交互时,间接效应 = a × b(a 是 A→M 的斜率,b 是 M→Y 的斜率)。
- 因果框架由 Robins & Greenland (1992) 和 Pearl (2001) 建立,提出自然间接效应和自然直接效应(natural indirect / direct effects),定义基于跨世界反事实(cross-world counterfactual)E[Y(1, M(0))]。识别该量需要交叉世界独立性假设(Y(a',m) ⟂ M(a) | C),这意味着即使处理 A 随机化,也必须无后处理混杂,且不能仅靠随机化中介来满足。这个假设在实践中争议很大。
当前 frontier 的几条路线:
1. 放松交叉世界假设的各种方法(例如通过 IV、近端因果推断等)。
2. 用随机干预(stochastic intervention)替代人为设定中介到某个值,从个体水平的反事实转向分布水平的干预——这就是本场报告的核心路线。
3. 处理高维中介、方向性(纵向)因果分解等。
这场报告站在哪:报告基于讲者 Lok (2016)* 提出的有机间接效应和直接效应(organic indirect / direct effects)。该定义核心思想是:不要求能人为设定 M 到某个特定值(有时不可行,如 BMI 或病毒载量),而是考虑一种对 M 的随机干预 I:这种干预改变 M 的分布使其类似于另一处理状态下的分布,但对 Y 没有直接影响(条件于 M 和 C)。随即,报告在 2020 年论文(Lok & Bosch, 2020)中做了关键推广:将有机干预与“不处理”(A=0)结合,称相对于 A=0 的有机间接效应,而非 2016 版相对于 A=1 的版本。这一转向有两个实际好处:
- 产品方法在线性模型中即使有 A×M 交互也成立(更接近 Baron & Kenny 原版,后者要求无交互)。
- 这个间接效应仅需处理组的中介分布信息,但结局条件期望只需要控制组(A=0)的数据**,这对新药研发(尚无处理组的结局数据)极为重要。
关键参考文献(转写中明确提到的):
- Baron & Kenny (1986). “The moderator–mediator variable distinction in social psychological research.”
- Robins & Greenland (1992). “Identifiability and exchangeability for direct and indirect effects.”
- Pearl (2001). “Direct and indirect effects.”
- Lok (2016). “Causal organic indirect and direct effects.” Statistics in Medicine.
- Lok & Bosch (2020). “Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators.” arXiv:1903.04697.
- 讨论人 Imai (幻灯片) 提到 van der Laan 等的工作,转写中听作“Vanessa did less” = van der Laan(见幻灯片“van der Laan”的引用),对应 van der Laan & Petersen (2007) 等的随机干预方法。
二、最小内核 / 一个最简例子¶
符号与模型¶
设可观测数据为随机向量 (A, C, M, Y),其中:
- A ∈ {0,1}:处理(随机化);
- C:预处理协变量(M 与 Y 的共同原因);
- M:中介(连续或二值);
- Y:结局。
潜在变量:
- M(a):处理 A=a 下观察到的中介值;
- Y(a):处理 A=a 下的结局(不涉及 M);
- Y(a, m):在 A=a 下将 M 强制设为 m 时的结局(这是个体水平干预的反事实)。
有机间接效应不依赖 Y(a, M(a')) 这种跨世界量,而是依赖一个对 M 的随机干预 I。干预 I 定义为:条件于 C,它使 M 的分布等于 M(1) 在 C 上的条件分布(记作 M(1)|C),但干预本身不对 Y 产生额外影响(直接效应被阻断)。定义有机间接效应(相对于 A=0) 为:
有机直接效应(相对于 A=0):
最简例子(连续、无交互、无 C)¶
设 A 随机化(不考虑 C)。线性模型:
A×M 交互。Baron & Kenny 产品法间接效应估计量 = \alpha_1 * \beta_2。自然间接效应(E[Y(1, M(0))] - E[Y(0, M(0))])在该模型下也等于 \alpha_1 * \beta_2。
有机间接效应(相对于 A=0) 的计算:
- E[Y(1, M(1))] = β_0 + β_1 + β_2 (α_0 + α_1)(处理组实际均值)。
- E[Y(0, M(1))] 定义为:用 M(1) 的分布(在控制组的人身上,但 M 从处理组分布抽取)替换控制组 M 分布后、控制组结局公式下的期望。计算得此值为 β_0 + β_2 (α_0 + α_1)。
- 有机间接效应 = β_1 + β_2 α_1 - (β_0 + β_2 (α_0 + α_1) - β_0 - β_2 α_0)
化简后 = β_1?等一下,这里需要小心:
实际上在无交互线性模型下,有机间接效应(两种定义)和自然间接效应都等于 α_1 β_2,见报告结论。更关键的是即使有交互(Y = β_0 + β_1 A + β_2 M + β_3 A·M + ε),有机间接效应(相对于 A=0)依然等于 α_1 * β_2(平均像个产品),而自然间接效应需要有交互时项。
所以核心思想:用分布偏移来避免“设定 M 的值”,同时保留产品公式的可操作性。
三、报告主体:讲者讲了什么¶
[0:02:58–0:05:20] 背景与动机
- 中介分析源自 Baron & Kenny (1986),已被大量应用(94,000+ 引用)。
- 通常估计 a×b 产品,但因果解释需要处理 M 与 Y 的共同原因 C,即使在 RCT 中。
- 举例:降压药(A)→血压(M)→心脏病(Y);HIV 治愈药(A)→病毒库(M)→病毒反弹时间(Y)。
[0:05:20–0:07:35] 自然间接/直接效应的争议
- 自然效应定义:E[Y(1, M(0))] 等,涉及跨世界反事实。讲者点名两大问题:
(1) 即使能设定 M,M(0) 在处理组中未被观测;
(2) 如何“设定”M(如 BMI=25)不唯一(Cole & Frangakis, 2009 例子)。
- 识别自然效应需要强交叉世界独立性假设,且不允许后处理混杂。
[0:07:36–0:10:29] 有机干预的定义
- 引入对 M 的随机干预 I,满足两个条件:
(1) 条件于 C,干预后 M 的分布 = 处理组 M 的条件分布(即 M(1)|C);
(2) 条件于 C,给定 M=m,无论是自然还是干预后得到的 m,Y 的条件分布相同(即 I 对 Y 无直接效应)。
- 满足此两条的 I 称为有机干预。
- 用血压例子:降压药降血压 10 mmHg;有机干预可以是盐摄入减少,也降血压 10 mmHg 且不改变形状。
[0:10:30–0:23:10] 有机间接/直接效应定义与识别
- 有机间接效应(相对于 A=1):
E[Y(1, M(1))] - E[Y(1, M(0,I))],其中 M(0,I) 指在 A=0 下经有机干预后的中介。
- 讲者给出识别公式(中介公式):
E[Y(1, M(0,I))] = ∫[∫E[Y|A=1, M=m, C=c] dP_{M|A=0}(m|c)] dP_C(c)——与自然效应的中介公式形式相同。
- 关键:这个表达式仅包含可观测量,且不依赖于具体选哪个有机干预 I(只要有机性成立)。
- 结论:有机效应泛化了自然效应(当“设定 M=M(0)”的干预有机时)。
[0:28:52–0:31:10] 新结果:相对于 A=0 的版本与产品方法
- 报告的核心新贡献:不是组合“干预 + 处理 A=1”,而是组合“干预 + 不处理 A=0”。
- 有机间接效应(相对于 A=0) = E[Y(1, M(1))] - E[Y(0, M(1))],其中 Y(0, M(1)) 表示“在 A=0 下但 M 的分布取 A=1 的条件分布”。
- 好处:在线性模型中,该间接效应 = A→M 效应 × M→Y 效应(条件于 C 下),且即使有 A×M 交互也成立。这是“更接近 Baron & Kenny”的含义。
- 此外仅需结局数据在 A=0 下,这对新药预测试验非常吸引人。
[0:31:10–0:42:30] HIV 治愈应用
- 数据:AIDS Clinical Trials Group (ACTG) 研究,124 名 HIV 感染者,均未接受治愈治疗(A=0),但有 ART 中断后病毒库(M)和病毒反弹(Y)的测量。
- 假设新治愈药 A 能将病毒库降低 1 log10(即 10 倍)。讲者用“分布平移”模型:将 M(0) 减 1 log10 后作为 M(1) 的分布,该平移本身可以看作一种有机干预(需领域知识验证)。
- 估计出有机间接效应 (relative risk difference) 显示:以细胞相关 HIV RNA 为靶点的间接效应更大,提示该中介可能是更好的治疗靶点。
[0:42:30–0:48:30] 二元中介的产品方法
- 当 M 为二值时(HIV 抑制状态),条件于 C,有机间接效应(相对于 A=0)为:
E[ζ*(0)|C] = [P(M=1|A=1, C) - P(M=1|A=0, C)] × [E(Y|A=0, M=1, C) - E(Y|A=0, M=0, C)]
即 A 对 M 的概率差 × M 对 Y 的均值差(在 A=0 下)。这是一个真正的产品。整体间接效应再对 C 的边缘分布平均即可。
- 该公式与自然间接效应在交叉世界假设下相同,但有机框架不需要该假设。
[0:48:30–0:57:50] 讨论人 Kosuke Imai 的点评
- Imai 的幻灯片(已提供)补充了与自然效应的对比细节。
- 主要问题:有机效应与自然效应的关系:Imai 认为在交叉世界独立性下,自然效应退化为有机效应,所以“有机是自然的特例而非泛化”。讲者辩称:自然效应需要人能设定 M 的个体值,很多情况下不可行;有机效应只要求存在某种改变分布的干预,领域专家可以判断,更现实。
- Imai 还指出:有机效应可以被视为“随机干预效应”(stochastic intervention effect),已有广泛文献;其对高维中介的可能价值被关注。
[0:57:50–结束] 未来方向
- 测量误差(HIV 病毒库有检测下限);
- 允许后处理混杂;
- 其他应用场景(药物开发筛选)。
四、对应论文与开放问题¶
对应的论文(一个来源为转写,一个为arXiv摘要,均经幻灯片确认):
- 报告核心:Lok & Bosch (2020) Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators. arXiv:1903.04697. 最新版本发布于报告前一天(2020-08-17)。
- 基础框架:Lok (2016) Causal organic indirect and direct effects. Statistics in Medicine.
开放问题(转写中明确提及,不是我的猜测):
-
[0:48:30–0:52:30] 有机干预的领域特异性
如何在一个新应用中判断一个干预是否“有机”?报告强调需要领域专家讨论,但没有给出形式化判定条件。这使得方法对非领域研究者不够透明。
(对应转写:0:48:30 “whether an intervention is organic can be discussed with subject matter experts.”) -
[0:18:00–0:19:30] 有机条件(2)需要条件于 C 的原因
如果不条件于 C,由于 M(0) 和 M(1) 条件分布不同,给定 M=m 会传递不同 C 信息,导致分布不等。这意味着 C 必须足够丰富以捕捉所有共同原因。若 C 缺失某些共同原因(未测量混杂),有机识别是否仍成立? 转写仅承认“可以放松”,但未给出细节。
(对应转写:0:18:00 “if we take this condition on C out of the conditioning event… conveys different information on C.”) -
[0:52:30–0:55:00] 自然效应与有机效应的优先级
讨论人 Imai 和讲者就是孰为“一般化”存在分歧。这本质上是一个概念定义问题:哪种效应在更弱的假设下可识别并具可操作性?目前没有共识。
(对应幻灯片第5页讨论和0:52:30–0:55:00 讲者回应。) -
[0:57:50–结束] 二元中介产品方法的可推广性
产品方法给出了封闭形式,但仅适用于二元中介和可忽略的后处理混杂。能否扩展到多元/高维中介? 讨论人 Imai 暗示随机干预思路可能对高维有用。
(对应幻灯片第7页:“general stochastic intervention on mediators; potentially useful for high-dimensional mediators.”) -
[0:47:00–0:48:30] 实际估计中的测量误差
HIV 应用中 M 有检测下限(assay limit),讲者指出已考虑“fall below assay limit”的情况,但未详述方法,且称“ongoing work with Ari Tianovsky”。
(对应转写:0:48:30 “the outcome logistic regression model also holds for mediators below the assay limit… working on that with Ari Tianovsky.”)
Maintained by 陈星宇 · Homepage · Source on GitHub