跳转至

Identification, Estimation, and Inference for Sequential Causally Ordered Mediation Pathways

作者: Ritoban Kundu, Canyi Chen, Peter X. K. Song
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.02833


一、领域脉络与小综述

这个方向是什么

这个子方向是纵向因果中介分析(longitudinal causal mediation analysis),其根本问题是:当一个处理(exposure)X 通过一组在时间上有先后顺序的中间变量 M1 → M2 → ... → MK 影响结局 Y 时,如何将总效应(total effect)分解并识别为沿这些有序路径的"路径特定效应"(path-specific effects, PSEs),并进一步对该效应进行有效的统计推断(估计的渐近性质与假设检验的 I 类错误控制)。该方向当前成熟度:估计部分已有若干理论推进,但推断部分(尤其是面对复合零假设时的检验)几乎空白

发展脉络

奠基工作: - Sobel [1982]:Sobel 检验,为单一中介的间接效应检验提供了最经典的渐近检验框架(统计量为 ab / SE(ab))。但该检验在 a = 0b = 0 时极限分布不是标准正态 ∓ 留下"复合零假设下 I 类错误膨胀/保守"的长期问题。 - MacKinnon et al. [2002]:系统比较了 Sobel 检验、MaxP 检验等在单一中介下的表现,明确指出 "co-existence of two different limiting distributions under the null" 导致标准检验过于保守。

向多中介扩展(识别与估计): - Daniel et al. [2015]Lin and VanderWeele [2017]Zhou [2022]:将单中介拓展到多个顺序中介的路径特定效应识别——主要贡献在识别(identification) 而非推断。本文第 2 节引用它们时定位为"已有工作 largely focused on estimation"。 - 尤其是 Zhou [2022] 提出了 S→M1 ⇝ Y 这样的复合路径(composite pathway),解决了跨世界(cross-world)独立性不满足时的可识别性问题;本文的 τ†_k 定义直接源于这个思路(见 Section 3.2,引用 [Zhou, 2022])。

当前 frontier(推断层面): - Barfield et al. [2017]:提出 MaxP 检验,但在复合零假设下仍保守。 - He et al. [2024]Roy et al. [2024]Chen et al. [2024]:提出新的检验方法(自适应 bootstrap、数据分割等),但全部局限于单中介K=1)。本文在 Section 6.1 中明确列出了这些近作为竞争基准,并指出"all these new approaches remain restricted to the single-mediator testing problems"。 - Dai et al. [2022]Liu et al. [2022]Liu [2025]:将检验推广至多中介,但不处理顺序/时序因果序("not equipped to handle sequential or temporal causal ordering among mediators" —— 本文原话)。它们主要依赖对三种零假设类型的比例的估计来增强功效。

本文的位置:紧贴 Roy et al. [2024] 的数据分割策略,将单中介的经验推广至任意 K ≥ 1,提出了 SOMET(Seqentially Ordered Mediation Effect Test)。同时用线性 SEM / 广义线性模型给出闭合形式的路径效应表达式(识别+估计),并建立 MLE 的渐近正态性。

子线索聚类

被引文献大致落在四条子线索上:

  1. 识别理论(identification of PSEs with multiple mediators):
  2. Avin et al. [2005](交叉世界独立性与路径效应的可识别性,奠定了 s1 = s3 的条件),Daniel et al. [2015]、Lin and VanderWeele [2017]、Zhou [2022]。
  3. 核心问题:在图结构中,哪些路径效应是可识别的?是否需要跨世界假设?

  4. 单中介的推断方法(testing for a single mediator under composite null):

  5. Sobel [1982]、MacKinnon et al. [2002]、Fritz and MacKinnon [2007]、Barfield et al. [2017](经典问题)。
  6. He et al. [2024](自适应 bootstrap)、Roy et al. [2024](data-splitting + studentized t)、Chen et al. [2024](分位数中介)。
  7. 核心问题:当 H0 可由 (α=0, η≠0)、(α≠0, η=0)、(α=0, η=0) 三种情形组成时,如何设计一个对三种情形的 I 类错误同时有效的检验?

  8. 多中介但无时序序的推断

  9. Dai et al. [2022]、Liu et al. [2022]、Liu [2025]:发展针对并列(非顺序)多中介的高维/大规模检验,依靠零假设类型比例估计增强功效;不适用于 SCOM。

  10. 应用驱动

  11. 两个实证分析(All of Us 和 ELEMENT)为方法提供落地场景;引用的流行病学和生物学文献(Valdez et al. [2007]、Wang et al. [2019]、Perng et al. [2019] 等)为 DAG 结构提供合理性。

该方向在追问的核心问题(2-4个)

  1. 识别:在 S → M1 → M2 → ... → MK → Y 的 DAG 下,如何定义和识别"路径特定效应"(PSEs)?哪些路径是可识别的?(已相对成熟:Zhou [2022] 的 composite pathway 解决了大部分可识别问题。)

  2. 估计:给定线性 SEM 或 GLM 设定,路径效应估计量的渐近分布是什么?复杂串联的 Delta 方法如何展开?(本文 Theorem 2 及递归方差公式已给出答案。)

  3. 检验:当检验 H0: α_k * η_{Mk⇝Y} = 0(复合零假设)、且三种不同零配置导致检验统计量极限分布不同时,如何设计一个无需先验知识且能控制 I 类错误的检验?(本文 SOMET 给出了基于数据分割 + studentized t 的解答。)

  4. 功率:如何在面对复合零假设时,既控制 I 类错误,又不牺牲太多统计功效?

⚠️ 作者的 framing

这是作者的说法:作者将缺口 frame 为——"estimations are done, but rigorous methods for hypothesis testing remain almost absent"(直接从第 1 节引文:"existing work has been largely focused on estimation, whereas rigorous methods of hypothesis testing ... remain almost absent")。这样一来,本文的 SOMET 就成了"显然的下一步"——已有识别和估计,只差检验。

作者淡化的竞争路线: - Dai et al. [2022]、Liu et al. [2022]、Liu [2025] 的零比例估计路线:作者只提及"rely on accurate estimation of null composition",但没有详细讨论这些方法在单中介(Sobel 问题)中是否也有效,也没有对比其在 SCOM 下的可扩展性。这个 "rely on accurate estimation of null composition" 是否是致命弱点,需要研究者亲自去读这些文献核实。 - 非参数/半参数方法:除 Zhou [2022] 外,本文几乎全部依赖参数化线性/Gaussian SEM。没有讨论对模型误设定的稳健性(只在定理前面有普通 regularity conditions)。作者在引言第 3 段说 "unified framework accommodates continuous, binary and count outcomes"——但所有结论都建立在 (6) 式正态线性响应模型+独立同方差误差上;对非正态误差或异方差未做任何处理。

什么明显该被引却未出现在 intro 里? - 更高的 model-free / semiparametric 检验策略:比如基于 EIF / DML 的检验——近年来因果推断中检验中介效应已有部分 DML 工作(如 Chernozhukov et al. 2018 的 DML 框架),但本文完全没有引用。这暗示作者有意停留在参数式 SEM 的框架内。 - 中介效应收缩/筛选方面的工作(如 high-dimensional mediator screening):ELEMENT 应用涉及 65 个代谢物,属于"多候选中介单路径"而非高维中介,因此不涉及。

张力

未见明显对立引用。各引用的关系基本是"扩展性"而非"矛盾性":一边承接 Sobel 问题,一边向多顺序中介推。唯一的隐性张力在于零比例估计路线 vs. 数据分割路线——二者解决相同问题的逻辑完全不同,但要比较性能需读原文看模拟设置。


二、这篇论文做了什么

三句话

  1. 研究问题:对于 K ≥ 1 个有严格因果时序的中介(SCOM(K)),如何识别、估计并检验复合路径特定效应(composite path-specific effects)τ†_k(S→Mk⇝Y)
  2. 核心方法:在参数化线性-Gaussian SEM 或 GLM-Gaussian SEM 框架下,用 MLE 估计效应,并用 Q-fold 数据分割 + Studentized t 统计量 + Cauchy 组合法 构建检验(SOMET),解决复合零假设下的 I 类错误控制问题。
  3. 主要结论:SOMET 在复合零假设的所有三种配置下((α,η)=(0,非0)、 (非0,0)、(0,0))均能有效控制 I 类错误,且在模拟中几乎总比 Sobel、MaxP、及它们的 Bootstrap 版本有更高统计功效。

关键设定与假设

  • SCOM(K) 设定M1→M2→...→MK 是严格顺序因果,由 G-SEM(1) 定义(实质是递归的 Markov 链结构)。
  • Assumption 3 (Consistency):标准,无特别。
  • Assumption 4:这是该方向最关键的复杂假设组:(i) Y(s, mK) ⊥ S | W (无处理-结局混杂)、(ii) Y(s,mK) ⊥ Mk | S, Mk-1, W (无中介-结局混杂,给定历史)、(iii)-(v) 跨世界独立性——确保嵌套反事实的期望可化简为条件期望的迭代积分。与 Avin et al. [2005] 的经典可识别性条件一致。
  • 比已有文献放宽/强化:相对于 Daniel et al. [2015] 等,本文未放宽识别假设(仍然依赖无跨世界混杂的强独立性),但在推断上强化了:从只有估计推到有检验。
  • 模型参数假设:所有 Mk | past 是线性 + Gaussian 误差Y 的模型要么是线性正态,要么是 probit/logistic/poisson/负二项。这是一个强参数假设——误差独立性 + 正态性 + 线性 = 似然有闭合形式。

主要结果(理论型)

  • Theorem 1:识别公式——Γ(s0, s | W) 可写为条件期望对中介条件分布迭代积分的形式。无分层悖论。定理的证明在附录 A.1,本质是借助 Assumption 4 的逐项独立性来拆开嵌套反事实。
  • Theorem 2(最关键):MLE (α̂_k, η̂_{Mk⇝Y}) 的联合渐近正态性:两者渐近独立(协方差=0),各自方差由递归公式给出。这是后续 SOMET 设计——T_αT_η 可独立计算——的基石。证明中使用了似然正交性 (likelihood orthogonality),这是参数模型的特殊优势。
  • Theorem 3(SOMET 的极限分布):在 H0(复合零)下,~T_{S→Mk⇝Y} 的极限分布是 t_{Q-1},不依赖于零配置。数据分割+Student's t 让 (α,η)=(0,0) 时原本的 N(0, 1/4) 收敛到同一 t 分布——这就是 "elegantly overcoming conservativeness" 的核心。

  • 证明骨架

  • Assumptions 3-4 → Theorem 1(迭代积分识别)
  • 线性 SEM / GLM 假设 + 正态误差 → Corollary 1-3(闭合表达式)
  • MLE 的 standard regularity conditions → Theorem 2 (渐近正态 + 独立)
  • Lemma 1:Sobel 统计量 T_S 的极限分布是 N(0,1)N(0, 1/4) 取决于参数是否为 0
  • Q-fold 数据分割 + 各子集 Sobel 统计量的极限 N(0, 1)(0, 1/4) → 经 Studentized t 变换 → 两者均收敛到 t_{Q-1} (Theorem 3)
  • 多次分割后 p 值通过 Cauchy 组合法聚合(来自 Liu et al. [2022])

🔎 结论是否比证明窄

  • Section 2.1 声明 "requires strong parametric assumptions" 但主要结论都基于参数模型。Theorem 1 看起来是非参数识别(不依赖模型形式),但之后的估计和检验全部是参数推断。也就是说,作者声称"非参数识别"的 Theorem 1,并未被用在非参数估计或检验中——论文的实际操作全是参数 MLE。这意味着:论文标题中的 "Identification" 是非参数的,但 "Estimation and Inference" 是参数的。这个 gap 可被研究者追问。

  • Section 9 "Concluding Remarks" 中 "Developing scalable alternatives to the Cauchy combination test"——但模拟中 SOMET 用了 500 / 1000 轮数据分割,计算成本很高:# splits * Q 次 MLE 拟合,当 K 增大或 n 很大时确实是个负担。

  • 在 Section 6.3 中,作者认为"虽然理论上一次 Q 折分割就够,但为了提高功效建议进行 B 轮分割并用 Cauchy 组合"——这意味着就理论 I 类错误控制而言,SOMET 的单轮版本已有效,但功率偏低;B 轮能提升功率。但是这意味着整个推断流程有额外调参(B 和 Q)——没有提供自动选择规则。


三、值不值得做 / 研究者能做什么

领域层面的判断材料

  • 共识 vs. 一家之言
  • "复合零假设下检验难题" 是社区真在乎的:MacKinnon et al. [2002]->Barfield et al. [2017]->He et al. [2024]->Roy et al. [2024] 是一条清晰的"解决单中介复合零检验"的注意力链。本文引用的 He, Roy, Chen 都是 2024 年发表的,说明这个方向很活跃。
  • "多顺序中介的检验" 还不是共识:目前只有本文一条线。需要去查:是否有接近的工作(比如将多顺序中介转化为结构方程单个参数归零的问题?)

  • 真 gap:建议读

  • Roy et al. [2024](单中介 data-splitting 的原版)
  • Zhou [2022](多顺序中介的识别 + 估计,不涉及检验)
  • Liu [2025](多中介但非顺序的检验——对比其与本文的假设差异)

问题种子清单

(A) 立即可做(≤ 2条)

A1. 将 SOMET 的 Q-fold 数据分割流程在您的 einsum / tensor-contraction 框架下重新实现,并对比其计算复杂度扎根:本文 Section 6.3 的 SOMET 需要 B * Q 次 MLE 拟合——对线性 SEM 是 OLS,对 GLM 是 IRWLS——但 Q 的量级是 O(√n)B500-1000。当 K 较大(≥4)时,计算成本不可忽略。 为何能攻:您的 very_familiar 包括"computation of HOU-statistics (treewidth / tensor contraction / einsum)"。而线性 SEM 的路径效应估计本质上是多线性形式(一个 K+1 阶张量沿暴露/协变量方向的缩并)。将 SOMET 的 T_αT_η 计算表达为张量缩并序列(einsum 风格)后,可能一次性计算所有子数据集的所有 K 个路径的检验统计量,避免重复拟合。 谁在做:未见应用 tensor-contraction 到 SCOM 检验中的工作;这个角度是独特的。 第一步:选 K=3 的线性 SEM 设置,写出 (α̂, η̂, σ²_α̂, σ²_η̂)·的 einsum 表达式;验证和 MLE 直接拟合结果一致。

A2. 在单中介(K=1)情形下,将 SOMET 与 He et al. [2024] 的自适应 bootstrap 比较,找出各自优势的参数区域扎根:本文只比较了 Sobel、MaxP、及其 bootstrap 版本,没有与 He et al. [2024] 比较。Section 6.1 引用 He [2024] 为"recent advances",但未在模拟中包含。 为何能攻:您非常熟悉 causal inference 的 estimation theory 与 hypothesis testing,可以直接用单中介环境快速验证。这是个小任务(不需新方法,只是比较)。 第一步:用本文的线性 SEM(2)(K=1,即 Y= γS S + β M1 + ...M1=α1 S + ...)设定,生成 3 种零配置+多种 α1/β 比值的数据,跑 SOMET(自己实现 Q-fold)和 He [2024] 的 bootstrap,画出 I 类错误 / 功效对比图。

(B) 中期可做(≤ 2条)

B1. 将 SOMET 推广到"非超高斯误差"下的 稳健 检验扎根:Theorem 1 的识别公式年来使用非参数积分(不假设误差分布),但 Theorem 2 之后的方差估计隐含着正态性假设(MLE 的 Fisher 信息量)。Section 9 的 future work 没有明确提到这一条,但这是与移除了假设之间的张力。 缺什么moderately_familiar 中的 HOIF(higher-order influence functions)用于非参数方差估计——可在非正态误差下构造稳健的 σ̂²_α_kσ̂²_η怎么补:先读 B. E. Hansen (2022, "Econometrics") 对 "sandwich variance for M-estimation" 的处理 → 替换 Theorem 2 的渐近方差为 empirical sandwich 版本 → 再验证 SOMET 的结果稳健性。 完成后接回 A1:将该稳健方差用 einsum 加速,同时完成。

B2. 将本文的 SOMET 与 zero-proportion-based 方法(Liu [2025])在同个模拟框架下比较,解析出各方法在面对 SCOM(K) 复合零假设时的优缺点扎根:本文 Section 6.1 引用了 Liu [2025] 等,但没有模拟比较。文中对 zero-proportion 的评价是"rely on accurate estimation of null composition"——这是不是真的致命,需要实证验证。 缺什么moderately_familiar 中的 identification theory 帮您理解 Liu [2025] 的假设(都是并列中介,不用顺序因果),需要再读原文确认是否真不能直接调用来比;若不可,需自己设计一个与本文参数设定相同的并列中介版本作为比较基线。 完成后接回 A2:可以跟 A2 结合成一个大的 mediation testing procedure comparison 项目。

(C) 暂不建议(≤ 1条)

C1. 将识别放松到允许 Mk 之间有反馈(non-DAG)的高阶路径分解原因:Section 9 的 future work 中提到了"dynamic feedback between mediators and outcomes"——这需要进入非递推(non-recursive)SEM图级可识别性定理,但这需要 SoS 层级推理或体制类代数几何工具才能证明识别。您目前的工具包(U-统计量、einsum、高维渐近、HOIF)主要处理无环模型。这个项目目前武器库内不易绕过。


迁移视角

  • 迁移口 1(方法 T + 目标领域 + 为什么可行)
  • 方法 T:SOMET 的 Q-fold 数据分割 + Studentized t 变换(目的:解决同一统计量在不同零配置下渐进方差不同导致的 I 类错误控制问题)。
  • 目标领域去偏机器学习(DML)中的假设检验。DML 的 θ̂θ=0θ≠0 下收敛速度不同,√n(θ̂ - θ) 的渐近方差一般是 sandwich,但若 θ=0 且 nuisance 的估计误差很大,可能规则性条件不成立使 sandwich 失效。
  • 为什么可行:SOMET 的核心理念——把一次估计分散成 Q 份,各自有一个渐近正态的"子"统计量,再 Studentized——可以直接用于 DML 中的 cross-fitting。已有工作(如 Chernozhukov et al. 2018)用 cross-fitting 做点估计,但做检验时仍用 normal approximation;引入 Q-fold studentized t 可能更稳健。你的 very_familiar 包括 semiparametric theory + estimation theory,是进入这个迁移口的天然切入点。

  • 迁移口 2

  • 方法 TCauchy combination test for dependent p-values(Liu et al. [2022]),本文用来聚合多次数据分割的 p 值。
  • 目标领域高维基因组中介的检验。当前方法(如 Dai et al. [2022]、Liu et al. [2022])在聚合大量平行中介的检验 p 值时,假定的是独立或弱依赖。Cauchy 组合法可以对任意依赖结构有效。
  • 为什么可行:你的 high-dimensional asymptotics + HOU-statistics theory 可以用来分析 Cauchy 组合法在高维条件下的 power/tradeoff(如哪些 p 值分布下失效、哪些下最优)。

四、延伸与下一步

沿引用链的阅读路线

  • 必读地基(2 篇)
  • Roy et al. [2024] "Subsampling-based tests in mediation analysis"——那篇是 SOMET 的单中介版本原型。弄清数据分割如何拯救复合零假设,是看懂本文 Theorem 3 的前提。
  • Zhou [2022] "Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators"——本文的识别定义(τ†_k)直接来源于这篇。弄清(i)为什么 S→M1→Y 单独不可识别而只能作为复合路径、(ii)s1 = s3 条件,是看懂本文 Section 3.2-3.3 的前提。

  • 前沿扩展(3 篇)

  • He et al. [2024] ——自适应 bootstrap 路径,与 SOMET 路线形成竞争。
  • Liu [2025] "A simple and powerful method for large-scale composite null" ——零比例统计路径,对比看看 SOMET 的 CDF-free studentized 策略 vs. 比例估计策略的优劣。
  • Avin et al. [2005] "Identifiability of path-specific effects"——要深挖可识别性假设,这是最原始的图论/因果论 paper(经典引用)。

假设扰动

  • 扰动假设:Assumption 4(v) —— Y(s, mK) ⊥ Mk(sk, m_k-1) | W(与潜在中介的跨世界独立性)。这意味着没有中介-结局的混淆受处理影响
  • 改变这个假设会如何:如果这个混淆存在,Theorem 1 的迭代积分公式不再成立,需要采用 instrumental variableproximal causal inference 的方法来识别。SOMET 的整个分布理论就会坍缩。
  • 技术上需要moderately_familiar 中的 identification theory + proximal causal inference 工具包,加上某种断点回归 / 自然实验来获得对混淆变量的替代替代变量。
  • 落入哪一档:此扰动后的项目 -> C 档(暂不建议),因为武器库中缺少 proximal inference 的实战经验,且需要学习大量新文献(Tchetgen Tchetgen et al., Miao et al. 等)。

理解检测题

题目(应用核心思路,非记忆性):

考虑一个 SCOM(2) 设定,其中 α1=0, α2≠0, β1=0, β2≠0。计算 τ†_1(S→M1⇝Y)τ†_2(S→M2⇝Y) 的真值。然后画出在该参数配置下,Sobel 统计量 T_S 的渐近分布(提示:利用 Lemma 1 与 Theorem 2 的协方差结构)。再解释若采用 SOMET(Q 折分割,Q=5),为什么最后的检验统计量仍然服从 t_{4}——即使 Sobel 统计量的渐近分布是 N(0, 1) 而不是 N(0, 1/4)

目的:检验是否搞懂了:

  • 复合零假设的三种类型与 Lemma 1 的区分;
  • 为何 (α,η)≠(0,0) 时 Sobel 统计量趋近 N(0,1)
  • 数据分割 + Studentized t 如何"消除"方差的不确定性。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论