跳转至

Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators

讲者: Judith Lok
来源: OCIS (Online Causal Inference Seminar)
日期: 2020-08-18
主题: 因果推断
视频: https://www.youtube.com/watch?v=AB_DR0JhflU · 幻灯片

本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。

相关论文

  • 1903.04697 (尚未精读 — talks read --id … --read-papers 可补)

一、这场报告在讲哪条工作线

这场报告立足于 因果中介分析(causal mediation analysis) 这个子方向。该方向的核心追问是:将一个总处理效应(ATE)分解为通过中介变量 M 的间接效应(mediated)和其余的直接效应(direct),并且在什么假设下这种分解具有因果解释。

奠基与主流路线
- 经验传统始于 Baron & Kenny (1986) 的“产品方法”(product method),线性模型无交互时,间接效应 = a × b(a 是 A→M 的斜率,b 是 M→Y 的斜率)。
- 因果框架由 Robins & Greenland (1992)Pearl (2001) 建立,提出自然间接效应和自然直接效应(natural indirect / direct effects),定义基于跨世界反事实(cross-world counterfactual)E[Y(1, M(0))]。识别该量需要交叉世界独立性假设Y(a',m) ⟂ M(a) | C),这意味着即使处理 A 随机化,也必须无后处理混杂,且不能仅靠随机化中介来满足。这个假设在实践中争议很大。

当前 frontier 的几条路线
1. 放松交叉世界假设的各种方法(例如通过 IV、近端因果推断等)。
2. 用随机干预(stochastic intervention)替代人为设定中介到某个值,从个体水平的反事实转向分布水平的干预——这就是本场报告的核心路线。
3. 处理高维中介、方向性(纵向)因果分解等。

这场报告站在哪:报告基于讲者 Lok (2016)* 提出的有机间接效应和直接效应(organic indirect / direct effects)。该定义核心思想是:不要求能人为设定 M 到某个特定值(有时不可行,如 BMI 或病毒载量),而是考虑一种对 M 的随机干预 I:这种干预改变 M 的分布使其类似于另一处理状态下的分布,但对 Y 没有直接影响(条件于 M 和 C)。随即,报告在 2020 年论文(Lok & Bosch, 2020)中做了关键推广:将有机干预与“不处理”(A=0)结合,称相对于 A=0 的有机间接效应,而非 2016 版相对于 A=1 的版本。这一转向有两个实际好处:
-
产品方法在线性模型中即使有 A×M 交互也成立(更接近 Baron & Kenny 原版,后者要求无交互)。
-
这个间接效应仅需处理组的中介分布信息,但结局条件期望只需要控制组(A=0)的数据**,这对新药研发(尚无处理组的结局数据)极为重要。

关键参考文献(转写中明确提到的):
- Baron & Kenny (1986). “The moderator–mediator variable distinction in social psychological research.”
- Robins & Greenland (1992). “Identifiability and exchangeability for direct and indirect effects.”
- Pearl (2001). “Direct and indirect effects.”
- Lok (2016). “Causal organic indirect and direct effects.” Statistics in Medicine.
- Lok & Bosch (2020). “Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators.” arXiv:1903.04697.
- 讨论人 Imai (幻灯片) 提到 van der Laan 等的工作,转写中听作“Vanessa did less” = van der Laan(见幻灯片“van der Laan”的引用),对应 van der Laan & Petersen (2007) 等的随机干预方法。


二、最小内核 / 一个最简例子

符号与模型

设可观测数据为随机向量 (A, C, M, Y),其中:
- A ∈ {0,1}:处理(随机化);
- C:预处理协变量(M 与 Y 的共同原因);
- M:中介(连续或二值);
- Y:结局。

潜在变量
- M(a):处理 A=a 下观察到的中介值;
- Y(a):处理 A=a 下的结局(不涉及 M);
- Y(a, m):在 A=a 下将 M 强制设为 m 时的结局(这是个体水平干预的反事实)。

有机间接效应不依赖 Y(a, M(a')) 这种跨世界量,而是依赖一个对 M 的随机干预 I。干预 I 定义为:条件于 C,它使 M 的分布等于 M(1)C 上的条件分布(记作 M(1)|C),但干预本身不对 Y 产生额外影响(直接效应被阻断)。定义有机间接效应(相对于 A=0 为:

\[\zeta^*(0) = E[ Y(1, M(1)) ] - \sum_m E[ Y(0, m) ] \cdot \Pr(M(1)=m)\]
第一项是处理组实际结局;第二项是“将 M 的分布替换为处理组分布,但结局机制保留在控制组水平”时预期的平均结局。

有机直接效应(相对于 A=0):

\[\xi^*(0) = \sum_m E[ Y(0, m) ] \cdot \Pr(M(1)=m) - E[ Y(0, M(0)) ]\]

最简例子(连续、无交互、无 C)

A 随机化(不考虑 C)。线性模型:

\[M = \alpha_0 + \alpha_1 A + \varepsilon_M, \quad Y = \beta_0 + \beta_1 A + \beta_2 M + \varepsilon_Y\]
这里没有 A×M 交互。Baron & Kenny 产品法间接效应估计量 = \alpha_1 * \beta_2。自然间接效应(E[Y(1, M(0))] - E[Y(0, M(0))])在该模型下也等于 \alpha_1 * \beta_2

有机间接效应(相对于 A=0 的计算:
- E[Y(1, M(1))] = β_0 + β_1 + β_2 (α_0 + α_1)(处理组实际均值)。
- E[Y(0, M(1))] 定义为:用 M(1) 的分布(在控制组的人身上,但 M 从处理组分布抽取)替换控制组 M 分布后、控制组结局公式下的期望。计算得此值为 β_0 + β_2 (α_0 + α_1)
- 有机间接效应 = β_1 + β_2 α_1 - (β_0 + β_2 (α_0 + α_1) - β_0 - β_2 α_0)
化简后 = β_1?等一下,这里需要小心:
实际上在无交互线性模型下,有机间接效应(两种定义)和自然间接效应都等于 α_1 β_2,见报告结论。更关键的是即使有交互Y = β_0 + β_1 A + β_2 M + β_3 A·M + ε),有机间接效应(相对于 A=0)依然等于 α_1 * β_2(平均像个产品),而自然间接效应需要有交互时项。

所以核心思想:用分布偏移来避免“设定 M 的值”,同时保留产品公式的可操作性。


三、报告主体:讲者讲了什么

[0:02:58–0:05:20] 背景与动机
- 中介分析源自 Baron & Kenny (1986),已被大量应用(94,000+ 引用)。
- 通常估计 a×b 产品,但因果解释需要处理 M 与 Y 的共同原因 C,即使在 RCT 中。
- 举例:降压药(A)→血压(M)→心脏病(Y);HIV 治愈药(A)→病毒库(M)→病毒反弹时间(Y)。

[0:05:20–0:07:35] 自然间接/直接效应的争议
- 自然效应定义:E[Y(1, M(0))] 等,涉及跨世界反事实。讲者点名两大问题
(1) 即使能设定 M,M(0) 在处理组中未被观测;
(2) 如何“设定”M(如 BMI=25)不唯一(Cole & Frangakis, 2009 例子)。
- 识别自然效应需要强交叉世界独立性假设,且不允许后处理混杂。

[0:07:36–0:10:29] 有机干预的定义
- 引入对 M 的随机干预 I,满足两个条件:
(1) 条件于 C,干预后 M 的分布 = 处理组 M 的条件分布(即 M(1)|C);
(2) 条件于 C,给定 M=m,无论是自然还是干预后得到的 m,Y 的条件分布相同(即 I 对 Y 无直接效应)。
- 满足此两条的 I 称为有机干预
- 用血压例子:降压药降血压 10 mmHg;有机干预可以是盐摄入减少,也降血压 10 mmHg 且不改变形状。

[0:10:30–0:23:10] 有机间接/直接效应定义与识别
- 有机间接效应(相对于 A=1):
E[Y(1, M(1))] - E[Y(1, M(0,I))],其中 M(0,I) 指在 A=0 下经有机干预后的中介。
- 讲者给出识别公式(中介公式):
E[Y(1, M(0,I))] = ∫[∫E[Y|A=1, M=m, C=c] dP_{M|A=0}(m|c)] dP_C(c)——与自然效应的中介公式形式相同。
- 关键:这个表达式仅包含可观测量,且不依赖于具体选哪个有机干预 I(只要有机性成立)。
- 结论:有机效应泛化了自然效应(当“设定 M=M(0)”的干预有机时)。

[0:28:52–0:31:10] 新结果:相对于 A=0 的版本与产品方法
- 报告的核心新贡献:不是组合“干预 + 处理 A=1”,而是组合“干预 + 不处理 A=0”。
- 有机间接效应(相对于 A=0) = E[Y(1, M(1))] - E[Y(0, M(1))],其中 Y(0, M(1)) 表示“在 A=0 下但 M 的分布取 A=1 的条件分布”。
- 好处:在线性模型中,该间接效应 = A→M 效应 × M→Y 效应(条件于 C 下),且即使有 A×M 交互也成立。这是“更接近 Baron & Kenny”的含义。
- 此外仅需结局数据在 A=0 下,这对新药预测试验非常吸引人。

[0:31:10–0:42:30] HIV 治愈应用
- 数据:AIDS Clinical Trials Group (ACTG) 研究,124 名 HIV 感染者,均未接受治愈治疗(A=0),但有 ART 中断后病毒库(M)和病毒反弹(Y)的测量。
- 假设新治愈药 A 能将病毒库降低 1 log10(即 10 倍)。讲者用“分布平移”模型:将 M(0) 减 1 log10 后作为 M(1) 的分布,该平移本身可以看作一种有机干预(需领域知识验证)。
- 估计出有机间接效应 (relative risk difference) 显示:以细胞相关 HIV RNA 为靶点的间接效应更大,提示该中介可能是更好的治疗靶点。

[0:42:30–0:48:30] 二元中介的产品方法
- 当 M 为二值时(HIV 抑制状态),条件于 C,有机间接效应(相对于 A=0)为:
E[ζ*(0)|C] = [P(M=1|A=1, C) - P(M=1|A=0, C)] × [E(Y|A=0, M=1, C) - E(Y|A=0, M=0, C)]
A 对 M 的概率差 × M 对 Y 的均值差(在 A=0 下)。这是一个真正的产品。整体间接效应再对 C 的边缘分布平均即可。
- 该公式与自然间接效应在交叉世界假设下相同,但有机框架不需要该假设。

[0:48:30–0:57:50] 讨论人 Kosuke Imai 的点评
- Imai 的幻灯片(已提供)补充了与自然效应的对比细节。
- 主要问题:有机效应与自然效应的关系:Imai 认为在交叉世界独立性下,自然效应退化为有机效应,所以“有机是自然的特例而非泛化”。讲者辩称:自然效应需要人能设定 M 的个体值,很多情况下不可行;有机效应只要求存在某种改变分布的干预,领域专家可以判断,更现实。
- Imai 还指出:有机效应可以被视为“随机干预效应”(stochastic intervention effect),已有广泛文献;其对高维中介的可能价值被关注。

[0:57:50–结束] 未来方向
- 测量误差(HIV 病毒库有检测下限);
- 允许后处理混杂;
- 其他应用场景(药物开发筛选)。


四、对应论文与开放问题

对应的论文(一个来源为转写,一个为arXiv摘要,均经幻灯片确认):
- 报告核心:Lok & Bosch (2020) Causal organic indirect and direct effects: closer to Baron and Kenny, with a product method for binary mediators. arXiv:1903.04697. 最新版本发布于报告前一天(2020-08-17)。
- 基础框架:Lok (2016) Causal organic indirect and direct effects. Statistics in Medicine.

开放问题(转写中明确提及,不是我的猜测):

  1. [0:48:30–0:52:30] 有机干预的领域特异性
    如何在一个新应用中判断一个干预是否“有机”?报告强调需要领域专家讨论,但没有给出形式化判定条件。这使得方法对非领域研究者不够透明。
    (对应转写:0:48:30 “whether an intervention is organic can be discussed with subject matter experts.”)

  2. [0:18:00–0:19:30] 有机条件(2)需要条件于 C 的原因
    如果不条件于 C,由于 M(0) 和 M(1) 条件分布不同,给定 M=m 会传递不同 C 信息,导致分布不等。这意味着 C 必须足够丰富以捕捉所有共同原因。若 C 缺失某些共同原因(未测量混杂),有机识别是否仍成立? 转写仅承认“可以放松”,但未给出细节。
    (对应转写:0:18:00 “if we take this condition on C out of the conditioning event… conveys different information on C.”)

  3. [0:52:30–0:55:00] 自然效应与有机效应的优先级
    讨论人 Imai 和讲者就是孰为“一般化”存在分歧。这本质上是一个概念定义问题:哪种效应在更弱的假设下可识别并具可操作性?目前没有共识。
    (对应幻灯片第5页讨论和0:52:30–0:55:00 讲者回应。)

  4. [0:57:50–结束] 二元中介产品方法的可推广性
    产品方法给出了封闭形式,但仅适用于二元中介和可忽略的后处理混杂。能否扩展到多元/高维中介? 讨论人 Imai 暗示随机干预思路可能对高维有用。
    (对应幻灯片第7页:“general stochastic intervention on mediators; potentially useful for high-dimensional mediators.”)

  5. [0:47:00–0:48:30] 实际估计中的测量误差
    HIV 应用中 M 有检测下限(assay limit),讲者指出已考虑“fall below assay limit”的情况,但未详述方法,且称“ongoing work with Ari Tianovsky”。
    (对应转写:0:48:30 “the outcome logistic regression model also holds for mediators below the assay limit… working on that with Ari Tianovsky.”)


Maintained by 陈星宇 · Homepage · Source on GitHub

评论