L or M 1—Critical Challenges in Mediation Analysis¶

作者: Etsuji Suzuki
来源: Epidemiology
主题: 因果推断
相关性: 8/10
链接: https://doi.org/10.1097/ede.0000000000001888

一、领域脉络与小综述¶

这个方向是因果中介分析的estimand（因果量）定义与识别的比较研究。该子方向所要解决的根本问题是：在存在中介变量（一个或多个）的因果路径中，该如何定义和识别“直接效应”和“间接效应”这些因果量，使其既有清晰的因果解释（对应某个可操作的介入或机制），又能被可观测数据识别（即其识别公式仅依赖可观测数据的分布，而不需要不可检验的交叉世界假设）。当前的成熟度是：自然直接/间接效应（NDE/NIE）和介入直接/间接效应（IDE/IIE）已成为标准框架，但关于其假设强度与因果解释力的争论仍在持续。本文是一篇发表在《Epidemiology》上的评论/短评，聚焦于多有序中介情形下可分离路径特定效应（separable path-specific effects, SPSEs）与经典estimand之间的比较。

发展脉络：从 Introduction 所引的参考文献，可串出一条清晰的线索：

奠基工作（自然效应经典框架）：Pearl (2001; ref 6) 与 Robins & Greenland (1992; ref 7) 奠定了自然直接/间接效应的定义基础，借助反事实框架，将效应分解为通过中介路径的部分。其核心识别条件是 cross-world independence（跨世界独立性）假设，即给定协变量后，处理与中介的潜在结果是相互独立的。Pearl (2014; ref 5) 则是对该框架的进一步阐述。
主要进展（对自然效应假设的反思与介入效应的提出）：VanderWeele & Vansteelandt (2009; ref 10) 和 VanderWeele (2009) 推广了自然效应用于连续中介和一般处理。然而，Didelez (2018; ref 4) 等作者则开始质疑 cross-world 假设的可行性——它涉及不同世界下的反事实量，在现实中的可验证性极低。由此，介入效应（interventional effects） 被提出（VanderWeele & Tchetgen Tchetgen, 2017; ref 2; Didelez et al. 2006），其定义基于随机介入（将中介随机化到给定协变量后的某分布），从而不再需要cross-world假设。这是当前的主流框架之一。
当前 Frontier（多中介下的可分离效应与路径特定效应）：Didelez et al. (2006) 和 Didelez (2019; ref 1) 进一步推广介入效应。Stensrud et al. (2021; ref 3) 提出了可分离效应（separable effects）框架，通过将处理变量拆解为多个“因子”，分别对应不同的路径，从而定义路径特定效应。其关键优势是可避免cross-world假设。Chen & Lin (2024; ref 8) 则将可分离效应框架扩展到多个有序中介的情形，提出了可分离路径特定效应（SPSEs）。本文（Suzuki） 站在这个点上，对 Chen & Lin 的提议进行评论，从流行病学实质性问题的角度，比较 SPSEs 与 NDE/NIE、IDE/IIE 之间的优劣和适用边界。

子线索聚类：这些被引文献大致可落在三至四条相互交叉的子线索上：

线索一（自然效应系列）：核心是基于cross-world假设的 NDE/NIE，强调其直接对应“阻塞”、“活跃”某一中介路径的因果解释。代表性工作：Pearl (2001), Robins & Greenland (1992), VanderWeele & Vansteelandt (2009)。其弱点是对cross-world假设的强依赖和不可检验性。
线索二（介入效应系列）：通过随机化中介来定义效应，回避cross-world假设。更“干净”但对应的介入可能不那么自然（是随机化而非固定某个中介值）。代表性工作：VanderWeele & Tchetgen Tchetgen (2017), Didelez et al. (2006), Didelez (2019)。该系列在多中介下还有待充分拓展。
线索三（可分离效应系列）：通过拆解处理变量为独立因子来定义路径效应。在单中介下比介入效应更强。Stensrud et al. (2021) 引入该框架。Chen & Lin (2024) 将其推广到多中介。Suzuki 的评论即是在此基础上展开，比较其与自然效应、介入效应在实际应用中的差异。
线索四（中介分析的更一般性讨论）：如 Robins & Greenland (1992) 对中介分析困难性的早期论述，以及一些综述性文献（ref 1-3, 9-11）作为背景板。

这个方向在追问的核心问题： 1. 哪个 estimand 更“定义得好”？：即某个因果量能否对应一个现实可操作的介入或清晰的因果机制解释。自然效应（阻塞/活跃中介路径）vs.介入效应（随机化中介）vs.可分离效应（拆解处理因子）。 2. 哪个 estimand 更难识别？：主要是对交叉世界独立性假设的依赖程度——依赖越强，其在观察性研究中越难被保证，从而其识别的“可信度”可能越低。 3. 多中介（尤其是有序中介）下，各 estimand 能否推广、如何推广？：Chen & Lin 给出了一个答案，但 Suzuki 提出了质疑。 4. 在给定实质性（流行病学）问题下，如何选择 estimand？：这通常是作者结尾的观点——选择不是纯数学的，而是取决于研究者想回答的具体科学问题。

⚠️ 作者的 framing：Suzuki 的核心论点是将“选择最合适的 estimand”这一流行病学研究实践中的问题 frame 成 了本评论的必然落脚点。他认为 Chen & Lin 的 SPSEs“potentially clarifies some of the underlying questions, but also opens the door to some challenges”，并据此从多个角度对 SPSEs 提出批评（如需要更复杂变量定义、人为的因子拆解、自然效应不可简化到可分离效应等）。他的框架可以概括为：“尽管可分离效应框架在避免交叉世界假设方面有理论优势，但在应用层面，它可能引入更复杂且更不直观的定义，导致因果解释的模糊性；且不同 estimand 可能给出不同甚至相反的答案，研究者需谨慎对待。” 他淡化了“可分离效应框架在数学上更优雅且识别假设更弱”这一竞争优势，而是强调其实践中的“适用性问题”。

张力：Suzuki 的评论本身与 Chen & Lin 的提议之间存在明确的张力。更广泛的张力存在于 可分离效应支持者（如 Stensrud, Chen & Lin）与介入效应支持者（如 Didelez）之间：可分离效应虽避免了交叉世界假设，但强行拆解处理变量可能在实际应用中难以操作或解释。而自然效应支持者则可能强调其对直观的科学问题（如“如果阻断M路径会怎样”）的对应性。本评论中未引用 Didelez 等介入效应提议者对可分离/多中介框架的具体批评，也未提及在经济或社科领域中更常用的多层中介模型或结构方程模型。一个明显的缺失是：该评论没有引用 Didelez (2018) 或其它明确讨论 “cross-world independence assumption is untestable and thus reliance on it is problematic” 的文献来为自己的批评（如SPSEs对自然效应的可归约性）提供攻击基础。值得去查 Didelez 等对可分离效应框架的直接批评。未见明显对立引用（即两篇直接争锋相对的论文被同时引用为支持/反对的证据），但张力是存在的，主要存在于框架的因果解释力与现实操作性之间。

二、最核心、最简单的例子 / 数学问题（先把符号 / 模型 / 可观测数据交代清楚）¶

第一步：记号、模型、可观测数据¶

记号 (Notation)：
- \(A\)：处理变量 (treatment)，可以是二值或连续，研究者感兴趣其因果效应如何传导。
- \(M\)：中介变量 (mediator)，一个或多个。在本文的评论中，涉及多个有序中介，如 \(M_1, M_2, \dots, M_K\)，其顺序在时间上是固定的（\(A \rightarrow M_1 \rightarrow M_2 \rightarrow \dots \rightarrow Y\)）。
- \(Y\)：结局变量 (outcome)。
- \(C\)：一组基线协变量 (baseline covariates)，用以调整混淆。
- \(Y(a, m)\)：潜在结局 (potential outcome)，即若处理被设为 \(A=a\)，中介被设为 \(M=m\) 时的结局值。
- \(M(a)\)：潜在中介，即若处理被设为 \(a\) 时的中介值。
- \(Y(a)\)：潜在结局，由 \(Y(a, M(a))\) 给出，即处理设为 \(a\) 时的结局。
- \(NDE(a) = \mathbb{E}[Y(a, M(a^*)) - Y(a^*, M(a^*))]\)：自然直接效应（以 \(a^*\) 为对照），反映若将处理从 \(a^*\) 改为 \(a\)但将中介固定在处理 \(a^*\) 下的水平时的预期变化。
- \(NIE(a) = \mathbb{E}[Y(a, M(a)) - Y(a, M(a^*))]\)：自然间接效应，反映若将中介从 \(a^*\) 水平改为 \(a\) 水平但保持处理为 \(a\) 时的预期变化。
- \(M^{(a)}\)（上标带括号或星号）：表示从 \(M(a)\) 的分布中随机抽样得到的中介值，用于定义介入效应。
- \(G \sim A \perp M\)：交叉世界独立性假设，即 \(Y(a, m) \perp M(a')\) 对于任意 \((a, a')\) 成立。这是识别自然效应的关键假设，且不可检验。
- \(\psi(a) = \mathbb{E}[Y(a, M^{(a^*)})]\)：介入直接效应的潜变量形式。
- \(\psi_d^{(do)} = \text{(由可分离效应或介入效应定义的效应量)}\)：可分离效应框架将处理变量 \(A\) 分解为两个独立因子 \(A_d\)（对结局直接影响）和 \(A_m\)（只通过中介影响结局），使得 \(Y \perp A_d \mid (A_m, C, M^*)\) 之类。
模型 (Model)：没有完全参数化，而是一个反事实框架或结构因果模型。数据生成机制是：\(C \rightarrow (A, M, Y)\)，\(A \rightarrow M \rightarrow Y\)，且可能存在 \(A \rightarrow Y\)（直接效应）。关键是还有一个隐含的时间顺序与因果顺序：\(C \rightarrow M\)；\(A\) 影响 \(M\) 和 \(Y\) 的一些路径。在多有序中介下，有序列 \(A \rightarrow M_1 \rightarrow M_2 \rightarrow \dots \rightarrow Y\)，且 \(M_1\) 也直接影响 \(M_2\)。本文讨论的核心是identification，不涉及估计，因此没有具体参数形式。
可观测数据：我们实际能观察到的是 \((A, M, Y, C)\) 的联合分布。与因果推断的许多问题一样，我们想要的是不可观测的潜在量（如 \(Y(a, m)\)、\(M(a)\) 等），这些只能通过假设（如无混淆性、交叉世界独立性）来将其与可观测数据联系起来。

第二步：最小内核——单中介下的自然直接/间接效应 vs. 介入直接/间接效应 vs. 可分离效应¶

为了讲清核心挑战，我们退化到一个中介变量、二值处理（\(A \in \{0, 1\}\)）、无协变量的最简设定。

经典自然效应分解（依赖于cross-world独立假设）： \(NDE(1) = \mathbb{E}[Y(1, M(0))] - \mathbb{E}[Y(0, M(0))]\) （直接效应，当处理从0变成1但中介固定为0时的变化） \(NIE(1) = \mathbb{E}[Y(1, M(1))] - \mathbb{E}[Y(1, M(0))]\) （间接效应，当处理固定为1但中介从0水平变成1水平时的变化）识别需要公式 \(\mathbb{E}[Y(1, M(0))] = \sum_m \mathbb{E}[Y | A=1, M=m] P(M=m | A=0)\)。其关键障碍是：\(Y(a, m)\) 与 \(M(a')\) 之间的独立性假设——即 \(Y(a, m)\) 和 \(M(a')\) 在给定协变量下必须独立（cross-world independence），这一假设不可检验，世界之间并不实际共存。
介入效应（回避cross-world假设）：将自然效应中的“固定”中介值（\(M(0)\) 的某个特定值）换成从中介的边际分布中随机抽样。例如，介入效应用 \(\mathbb{E}[Y(1, M^{(0)})]\) 来代替 \(\mathbb{E}[Y(1, M(0))]\)（其中 \(M^{(0)} \sim P_{M|A=0}\) 的分布）。这样，介入直接效应为 \(\mathbb{E}[Y(1, M^{(0)})] - \mathbb{E}[Y(0, M^{(0)})]\)，它对应的是“如果我们将处理从0变为1，但将中介随机化到处理组0下中介的分布”。此定义不再需要 \(Y(1, m) \perp M(0)\)，只需要条件可交换性（处理与潜在结果的独立）以及 Positivity。这更容易满足。
可分离效应（更严苛但直接避免交叉世界假设）： Stensrud et al. (2021) 的方法是：将处理 \(A\) 拆解为两个独立的“因子” \(A_d\) 和 \(A_m\)，使得 \(A_d\) 只影响 \(Y\)（直接路径），\(A_m\) 只影响 \(M\)（间接路径）。则直接效应定义为 \(\mathbb{E}[Y^{}(A_d=1, A_m=0)] - \mathbb{E}[Y^{}(A_d=0, A_m=0)]\)，其中 \(Y^{}(a_d, a_m)\) 是因子版本下的潜在结局。关键在于，这个拆解需要一个概念上的操作（例如，改变处方药中某成分的剂量而不改变药效的其余部分），并且确实需要 \(A_d\) 和 \(A_m\) 在条件上独立（即 \(Y \perp A_d \mid (A_m, C)\)）。这在单中介下可能可行（如在药物研究中），但所需因子拆解的人为性强。
最小内核结论：本文评论的核心是多有序中介情形下，可分离效应框架推广到路径特定效应（SPSEs）是否在因果解释上优于自然或介入效应。最简特例是只有两个有序中介。在这个特例下，Chen & Lin 定义了 \(A\) 的三个因子（\(A_{m1}\) 影响 \(M_1\)；\(A_{m2}\) 影响 \(M_2\)；\(A_{y}\) 影响 \(Y\)）来映射三条路径。Suzuki 则指出，这种人为定义可能是可行的，但跨世界独立性假设只是被“转移”到了这些因子之间。关键难题是：即使拆解了 \(A\)，要识别这些因子对应的路径效应，依然需要类似cross-world的假设（如潜在结局 \(Y(a_d, a_{m1}, a_{m2})\) 与各因子独立于对方）。因此，本文的核心挑战是“在不同的 estimand 框架下，如何权衡识别假设的现实可操作性与所得到的因果效应的可解释性”，而该挑战在多中介下被放大了。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话： ① 本文以流行病学评论的形式，探讨了在多有序中介情形下，Chen & Lin (2024) 提出的可分离路径特定效应（SPSEs）与经典的自然直接/间接效应（NDE/NIE）、介入直接/间接效应（IDE/IIE）之间的关系与差异。② 核心工具是逻辑比较和假设分析，作者并没有提出新的估计方法或定理，而是通过审视各 estimand 的因果解释力与识别假设（特别是cross-world独立性）来批判性地评估。③ 主要结论是：中介分析中 estimand 的选择必须紧密结合流行病学实质性问题的背景，而非纯数学便利；不同estimand（NDE/NIE, IDE/IIE, SPSEs）在不同场景下各有利弊，研究者应明确自己要考虑的“操作”是什么，并据此选择最匹配的 estimand。
关键设定与假设：论文围绕着一个多有序中介设定展开，处理 \(A\) 影响一系列有序中介 \(M_1, M_2, \dots, M_K\)，并顺序影响结局 \(Y\)。核心假设包括：
- 一致性 (Consistency): 若 \(A=a\)，则观测到的 \(M\) 等于潜在中介 \(M(a)\)，观测到的 \(Y\) 等于 \(Y(a)\)。
- 无混淆性 (No unmeasured confounding, a) 处理与中介和结局的联合关系无混杂。(b) 中介与结局之间无混杂，给定处理。
- 交叉世界独立性 (Cross-world independence): 对于自然效应，需要 \(Y(a, m) \perp M(a') \mid C\)。对于介入效应，这一假设被回避。对于可分离效应，需要对应的“拆解因子”之间的独立性（即 \(A_d\) 和 \(A_m\) 在给定其它变量下是独立的，且与 \(M\) , \(Y\) 也独立）。
- 相比已有的单中介自然/介入效应文献，本文讨论的多中介设定更具一般性；相比介入效应（随机化中介），可分离效应要求变强（需要人为定义“因子”）；相比朴素假设（忽略中介顺序），多中介序贯假设（\(A \rightarrow M_1 \rightarrow M_2\)）在流行病学中很常见。
主要结果：本文不是一篇提出新方法的论文，而是一篇评论性论文，因此没有定理或数值实验。其主要“结果”是论点，通过几个关键对比来呈现：
1. 自然效应 vs. 介入效应: 正如已有文献，Suzuki 重申了自然效应定义直观（对应“阻塞”一特定中介路径），但依赖不可检验的cross-world假设；介入效应回避了该假设，但对应的介入是“随机化中介”，可能无法对应清晰的科学问题（比如你想问的是“如果固定了中介M的值会怎样”，而不是“如果中介M随机分布会怎样”）。
2. 可分离效应 vs. 自然效应: Chen & Lin 的 SPSEs 试图在多中介下避免交叉世界假设。Suzuki 指出，理解它们的因果解释时，需要将其与自然效应进行对比。例如：在特定可分离效应分解下，直接效应不一定等于自然直接效应；或者一个可分离效应可能对应一个更复杂的人为的定义，其“操作”可能并不直观。作者列出了一些“它们可能给出相反答案”的场景。
3. “可操作”的二维性: 作者反复强调，一个好的 estimand 不仅要数学上可识别，还要“可操作”。对于多有序中介，一个极端的挑战是要区分“如果通过影响 M1 来改变 M2，与直接改变 M2”之间的差异——这在自然效应中是清晰（通过交叉世界假设）但在可分离效应中则是通过人为拆解处理器来实现。作者认为，这种人为因素可能让可分离效应的解释变复杂。
4. 当路径效应可归约时: 在单中介可忽略条件下，某些路径效应（例如通过 M2 的路径，而不通过 M1 的路径）可归约到自然或介入效应。但序列中介（有序中介）很可能导致不存在这种简化的结果，这使得选择更困难。作者通过例子说明，不同选择可能导致不同结论，因此流行病学家必须仔细考虑其科学问题，而不是默认选择某种框架。
证明路线与技术技巧（本文为评论，无证明）：本文没有数学证明或模拟。它采取的是一套论证路线：
1. 定位: 先概述中介分析三大框架（自然、介入、可分离）。
2. 聚焦: 特别关注 Chen & Lin (2024) 对可分离效应向多有序中介的推广。
3. 比较: 逐一对比 SPSEs 与 NDE/NIE、IDE/IIE 之间的关系（如 SPSEs 在特定条件下是否等于 NDE？它们是否更弱/更强的假设？）。
4. 挑战: 主要挑战是“因果解释力与操作性”之间的张力。Suzuki 用了几个假设性流行病学例子（如药物对多个生物标志物的作用）来展示不同 estimand 的差异。
5. 总结: 强调没有放之四海而皆准的最佳 estimand，研究者必须基于自己的研究目标（比如追问“阻塞 M1 路径 vs. 随机化 M1 分布”的区别）来选择。
🔎 结论是否比证明窄：本文为评论，结论部分是作者基于比较分析的主观判断，非严格证明。作者明确指出的局限性是，其讨论局限于 Cross-world 假设与定义的操作性，并未涉及估计效率或稳健性。有观点（如 SpSPEs 在不同操作下的多义性）是作者基于逻辑推测，缺乏仿真或数据支持。作者没有声称自己的论点具有严格证明，而是将之作为“供讨论之用”的评论。

四、开放问题（点到为止，扎根具体语句）¶

跨世界独立性假设的替代识别策略：Suzuki 指出了所有自然效应都依赖该假设。一个开放问题是：“在有序中介下，能否建立一套不依赖交叉世界假设但仍能识别特定路径效应的识别策略？” 这扎根于 Suzuki 对 cross-world 假设的担忧。可以尝试探索利用更高阶的U统计量或多项式统计量（您熟悉的高维U-统计量工具）来构造对交叉世界假设敏感性分析的更稳健的统计量。
介入效应在多中介下的拓展与理论比较：作者讨论了介入效应在单中介下的优势，但提到它在多中介下的定义还未成熟。一个开放问题是：“在多序列中介下，介入效应（随机化中介的分布）的扩展定义是什么？其识别假设是否比可分离效应更弱？” 这扎根于 Suzuki 文中“interventional effects have been less well-studied in settings with multiple mediators”这一表述。这可以与您的identification theory非常相关的方向——推导出对应的 estimand 及其识别条件。
可分离效应框架下的效率界与半参数理论：可分离效应框架（SPSEs）是一个新框架。一个开放问题是：“对于给定拆解方式的SPSEs，其半参数效率界是什么样的？如何构造出最小方差的（半参数）估计量？” 这扎根于作者提到需要使用debiased machine learning等有效估计方法。该问题直接连接了您的Causal inference + 半参数理论兴趣。
缺失数据对各类estimand识别的影响：本文评论未讨论缺失数据。一个开放的、实际的流行病学问题是：“在有序中介下，当处理、中介或结局存在缺失时，不同expand框架（自然/介入/可分离）的识别和估计如何变化？” 缺失数据问题在该领域未系统解决。

Maintained by 陈星宇 · Homepage · Source on GitHub