Identification, Estimation, and Inference for Sequential Causally Ordered Mediation Pathways¶

作者: Ritoban Kundu, Canyi Chen, Peter X. K. Song
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.02833

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向是纵向因果中介分析（longitudinal causal mediation analysis），其根本问题是：当一个处理（exposure）X 通过一组在时间上有先后顺序的中间变量 M1 → M2 → ... → MK 影响结局 Y 时，如何将总效应（total effect）分解并识别为沿这些有序路径的"路径特定效应"（path-specific effects, PSEs），并进一步对该效应进行有效的统计推断（估计的渐近性质与假设检验的 I 类错误控制）。该方向当前成熟度：估计部分已有若干理论推进，但推断部分（尤其是面对复合零假设时的检验）几乎空白。

发展脉络¶

奠基工作： - Sobel [1982]：Sobel 检验，为单一中介的间接效应检验提供了最经典的渐近检验框架（统计量为 ab / SE(ab)）。但该检验在 a = 0 且 b = 0 时极限分布不是标准正态 ∓ 留下"复合零假设下 I 类错误膨胀/保守"的长期问题。 - MacKinnon et al. [2002]：系统比较了 Sobel 检验、MaxP 检验等在单一中介下的表现，明确指出 "co-existence of two different limiting distributions under the null" 导致标准检验过于保守。

向多中介扩展（识别与估计）： - Daniel et al. [2015]、Lin and VanderWeele [2017]、Zhou [2022]：将单中介拓展到多个顺序中介的路径特定效应识别——主要贡献在识别（identification） 而非推断。本文第 2 节引用它们时定位为"已有工作 largely focused on estimation"。 - 尤其是 Zhou [2022] 提出了 S→M1 ⇝ Y 这样的复合路径（composite pathway），解决了跨世界（cross-world）独立性不满足时的可识别性问题；本文的 τ†_k 定义直接源于这个思路（见 Section 3.2，引用 [Zhou, 2022]）。

当前 frontier（推断层面）： - Barfield et al. [2017]：提出 MaxP 检验，但在复合零假设下仍保守。 - He et al. [2024]、Roy et al. [2024]、Chen et al. [2024]：提出新的检验方法（自适应 bootstrap、数据分割等），但全部局限于单中介（K=1）。本文在 Section 6.1 中明确列出了这些近作为竞争基准，并指出"all these new approaches remain restricted to the single-mediator testing problems"。 - Dai et al. [2022]、Liu et al. [2022]、Liu [2025]：将检验推广至多中介，但不处理顺序/时序因果序（"not equipped to handle sequential or temporal causal ordering among mediators" —— 本文原话）。它们主要依赖对三种零假设类型的比例的估计来增强功效。

本文的位置：紧贴 Roy et al. [2024] 的数据分割策略，将单中介的经验推广至任意 K ≥ 1，提出了 SOMET（Seqentially Ordered Mediation Effect Test）。同时用线性 SEM / 广义线性模型给出闭合形式的路径效应表达式（识别+估计），并建立 MLE 的渐近正态性。

子线索聚类¶

被引文献大致落在四条子线索上：

识别理论（identification of PSEs with multiple mediators）：
Avin et al. [2005]（交叉世界独立性与路径效应的可识别性，奠定了 s1 = s3 的条件），Daniel et al. [2015]、Lin and VanderWeele [2017]、Zhou [2022]。
核心问题：在图结构中，哪些路径效应是可识别的？是否需要跨世界假设？
单中介的推断方法（testing for a single mediator under composite null）：
Sobel [1982]、MacKinnon et al. [2002]、Fritz and MacKinnon [2007]、Barfield et al. [2017]（经典问题）。
He et al. [2024]（自适应 bootstrap）、Roy et al. [2024]（data-splitting + studentized t）、Chen et al. [2024]（分位数中介）。
核心问题：当 H0 可由 (α=0, η≠0)、(α≠0, η=0)、(α=0, η=0) 三种情形组成时，如何设计一个对三种情形的 I 类错误同时有效的检验？
多中介但无时序序的推断：
Dai et al. [2022]、Liu et al. [2022]、Liu [2025]：发展针对并列（非顺序）多中介的高维/大规模检验，依靠零假设类型比例估计增强功效；不适用于 SCOM。
应用驱动：
两个实证分析（All of Us 和 ELEMENT）为方法提供落地场景；引用的流行病学和生物学文献（Valdez et al. [2007]、Wang et al. [2019]、Perng et al. [2019] 等）为 DAG 结构提供合理性。

该方向在追问的核心问题（2-4个）¶

识别：在 S → M1 → M2 → ... → MK → Y 的 DAG 下，如何定义和识别"路径特定效应"（PSEs）？哪些路径是可识别的？（已相对成熟：Zhou [2022] 的 composite pathway 解决了大部分可识别问题。）
估计：给定线性 SEM 或 GLM 设定，路径效应估计量的渐近分布是什么？复杂串联的 Delta 方法如何展开？（本文 Theorem 2 及递归方差公式已给出答案。）
检验：当检验 H0: α_k * η_{Mk⇝Y} = 0（复合零假设）、且三种不同零配置导致检验统计量极限分布不同时，如何设计一个无需先验知识且能控制 I 类错误的检验？（本文 SOMET 给出了基于数据分割 + studentized t 的解答。）
功率：如何在面对复合零假设时，既控制 I 类错误，又不牺牲太多统计功效？

⚠️ 作者的 framing¶

这是作者的说法：作者将缺口 frame 为——"estimations are done, but rigorous methods for hypothesis testing remain almost absent"（直接从第 1 节引文："existing work has been largely focused on estimation, whereas rigorous methods of hypothesis testing ... remain almost absent"）。这样一来，本文的 SOMET 就成了"显然的下一步"——已有识别和估计，只差检验。

作者淡化的竞争路线： - Dai et al. [2022]、Liu et al. [2022]、Liu [2025] 的零比例估计路线：作者只提及"rely on accurate estimation of null composition"，但没有详细讨论这些方法在单中介（Sobel 问题）中是否也有效，也没有对比其在 SCOM 下的可扩展性。这个 "rely on accurate estimation of null composition" 是否是致命弱点，需要研究者亲自去读这些文献核实。 - 非参数/半参数方法：除 Zhou [2022] 外，本文几乎全部依赖参数化线性/Gaussian SEM。没有讨论对模型误设定的稳健性（只在定理前面有普通 regularity conditions）。作者在引言第 3 段说 "unified framework accommodates continuous, binary and count outcomes"——但所有结论都建立在 (6) 式正态线性响应模型+独立同方差误差上；对非正态误差或异方差未做任何处理。

什么明显该被引却未出现在 intro 里？ - 更高的 model-free / semiparametric 检验策略：比如基于 EIF / DML 的检验——近年来因果推断中检验中介效应已有部分 DML 工作（如 Chernozhukov et al. 2018 的 DML 框架），但本文完全没有引用。这暗示作者有意停留在参数式 SEM 的框架内。 - 中介效应收缩/筛选方面的工作（如 high-dimensional mediator screening）：ELEMENT 应用涉及 65 个代谢物，属于"多候选中介单路径"而非高维中介，因此不涉及。

张力¶

未见明显对立引用。各引用的关系基本是"扩展性"而非"矛盾性"：一边承接 Sobel 问题，一边向多顺序中介推。唯一的隐性张力在于零比例估计路线 vs. 数据分割路线——二者解决相同问题的逻辑完全不同，但要比较性能需读原文看模拟设置。

二、这篇论文做了什么¶

三句话¶

研究问题：对于 K ≥ 1 个有严格因果时序的中介（SCOM(K)），如何识别、估计并检验复合路径特定效应（composite path-specific effects）τ†_k(S→Mk⇝Y)。
核心方法：在参数化线性-Gaussian SEM 或 GLM-Gaussian SEM 框架下，用 MLE 估计效应，并用 Q-fold 数据分割 + Studentized t 统计量 + Cauchy 组合法 构建检验（SOMET），解决复合零假设下的 I 类错误控制问题。
主要结论：SOMET 在复合零假设的所有三种配置下（(α,η)=(0,非0)、 (非0,0)、(0,0)）均能有效控制 I 类错误，且在模拟中几乎总比 Sobel、MaxP、及它们的 Bootstrap 版本有更高统计功效。

关键设定与假设¶

SCOM(K) 设定：M1→M2→...→MK 是严格顺序因果，由 G-SEM(1) 定义（实质是递归的 Markov 链结构）。
Assumption 3 (Consistency)：标准，无特别。
Assumption 4：这是该方向最关键的复杂假设组：(i) Y(s, mK) ⊥ S | W (无处理-结局混杂)、(ii) Y(s,mK) ⊥ Mk | S, Mk-1, W (无中介-结局混杂，给定历史)、(iii)-(v) 跨世界独立性——确保嵌套反事实的期望可化简为条件期望的迭代积分。与 Avin et al. [2005] 的经典可识别性条件一致。
比已有文献放宽/强化：相对于 Daniel et al. [2015] 等，本文未放宽识别假设（仍然依赖无跨世界混杂的强独立性），但在推断上强化了：从只有估计推到有检验。
模型参数假设：所有 Mk | past 是线性 + Gaussian 误差，Y 的模型要么是线性正态，要么是 probit/logistic/poisson/负二项。这是一个强参数假设——误差独立性 + 正态性 + 线性 = 似然有闭合形式。

主要结果（理论型）¶

Theorem 1：识别公式——Γ(s0, s | W) 可写为条件期望对中介条件分布迭代积分的形式。无分层悖论。定理的证明在附录 A.1，本质是借助 Assumption 4 的逐项独立性来拆开嵌套反事实。
Theorem 2（最关键）：MLE (α̂_k, η̂_{Mk⇝Y}) 的联合渐近正态性：两者渐近独立（协方差=0），各自方差由递归公式给出。这是后续 SOMET 设计——T_α 和 T_η 可独立计算——的基石。证明中使用了似然正交性 (likelihood orthogonality)，这是参数模型的特殊优势。
Theorem 3（SOMET 的极限分布）：在 H0（复合零）下，~T_{S→Mk⇝Y} 的极限分布是 t_{Q-1}，不依赖于零配置。数据分割+Student's t 让 (α,η)=(0,0) 时原本的 N(0, 1/4) 收敛到同一 t 分布——这就是 "elegantly overcoming conservativeness" 的核心。
证明骨架：
Assumptions 3-4 → Theorem 1（迭代积分识别）
线性 SEM / GLM 假设 + 正态误差 → Corollary 1-3（闭合表达式）
MLE 的 standard regularity conditions → Theorem 2 (渐近正态 + 独立)
Lemma 1：Sobel 统计量 T_S 的极限分布是 N(0,1) 或 N(0, 1/4) 取决于参数是否为 0
Q-fold 数据分割 + 各子集 Sobel 统计量的极限 N(0, 1) 或 (0, 1/4) → 经 Studentized t 变换 → 两者均收敛到 t_{Q-1} (Theorem 3)
多次分割后 p 值通过 Cauchy 组合法聚合（来自 Liu et al. [2022]）

🔎 结论是否比证明窄¶

Section 2.1 声明 "requires strong parametric assumptions" 但主要结论都基于参数模型。Theorem 1 看起来是非参数识别（不依赖模型形式），但之后的估计和检验全部是参数推断。也就是说，作者声称"非参数识别"的 Theorem 1，并未被用在非参数估计或检验中——论文的实际操作全是参数 MLE。这意味着：论文标题中的 "Identification" 是非参数的，但 "Estimation and Inference" 是参数的。这个 gap 可被研究者追问。
Section 9 "Concluding Remarks" 中 "Developing scalable alternatives to the Cauchy combination test"——但模拟中 SOMET 用了 500 / 1000 轮数据分割，计算成本很高：# splits * Q 次 MLE 拟合，当 K 增大或 n 很大时确实是个负担。
在 Section 6.3 中，作者认为"虽然理论上一次 Q 折分割就够，但为了提高功效建议进行 B 轮分割并用 Cauchy 组合"——这意味着就理论 I 类错误控制而言，SOMET 的单轮版本已有效，但功率偏低；B 轮能提升功率。但是这意味着整个推断流程有额外调参（B 和 Q）——没有提供自动选择规则。

三、值不值得做 / 研究者能做什么¶

领域层面的判断材料¶

共识 vs. 一家之言：
"复合零假设下检验难题" 是社区真在乎的：MacKinnon et al. [2002]->Barfield et al. [2017]->He et al. [2024]->Roy et al. [2024] 是一条清晰的"解决单中介复合零检验"的注意力链。本文引用的 He, Roy, Chen 都是 2024 年发表的，说明这个方向很活跃。
"多顺序中介的检验" 还不是共识：目前只有本文一条线。需要去查：是否有接近的工作（比如将多顺序中介转化为结构方程单个参数归零的问题？）
真 gap：建议读
Roy et al. [2024]（单中介 data-splitting 的原版）
Zhou [2022]（多顺序中介的识别 + 估计，不涉及检验）
Liu [2025]（多中介但非顺序的检验——对比其与本文的假设差异）

问题种子清单¶

(A) 立即可做（≤ 2条）¶

A1. 将 SOMET 的 Q-fold 数据分割流程在您的 einsum / tensor-contraction 框架下重新实现，并对比其计算复杂度。扎根：本文 Section 6.3 的 SOMET 需要 B * Q 次 MLE 拟合——对线性 SEM 是 OLS，对 GLM 是 IRWLS——但 Q 的量级是 O(√n)，B 是 500-1000。当 K 较大（≥4）时，计算成本不可忽略。 为何能攻：您的 very_familiar 包括"computation of HOU-statistics (treewidth / tensor contraction / einsum)"。而线性 SEM 的路径效应估计本质上是多线性形式（一个 K+1 阶张量沿暴露/协变量方向的缩并）。将 SOMET 的 T_α、T_η 计算表达为张量缩并序列（einsum 风格）后，可能一次性计算所有子数据集的所有 K 个路径的检验统计量，避免重复拟合。 谁在做：未见应用 tensor-contraction 到 SCOM 检验中的工作；这个角度是独特的。 第一步：选 K=3 的线性 SEM 设置，写出 (α̂, η̂, σ²_α̂, σ²_η̂)·的 einsum 表达式；验证和 MLE 直接拟合结果一致。

A2. 在单中介（K=1）情形下，将 SOMET 与 He et al. [2024] 的自适应 bootstrap 比较，找出各自优势的参数区域。扎根：本文只比较了 Sobel、MaxP、及其 bootstrap 版本，没有与 He et al. [2024] 比较。Section 6.1 引用 He [2024] 为"recent advances"，但未在模拟中包含。 为何能攻：您非常熟悉 causal inference 的 estimation theory 与 hypothesis testing，可以直接用单中介环境快速验证。这是个小任务（不需新方法，只是比较）。 第一步：用本文的线性 SEM(2)（K=1，即 Y= γS S + β M1 + ...，M1=α1 S + ...）设定，生成 3 种零配置+多种 α1/β 比值的数据，跑 SOMET（自己实现 Q-fold）和 He [2024] 的 bootstrap，画出 I 类错误 / 功效对比图。

(B) 中期可做（≤ 2条）¶

B1. 将 SOMET 推广到"非超高斯误差"下的 稳健检验。扎根：Theorem 1 的识别公式年来使用非参数积分（不假设误差分布），但 Theorem 2 之后的方差估计隐含着正态性假设（MLE 的 Fisher 信息量）。Section 9 的 future work 没有明确提到这一条，但这是与移除了假设之间的张力。 缺什么：moderately_familiar 中的 HOIF（higher-order influence functions）用于非参数方差估计——可在非正态误差下构造稳健的 σ̂²_α_k 与 σ̂²_η。 怎么补：先读 B. E. Hansen (2022, "Econometrics") 对 "sandwich variance for M-estimation" 的处理 → 替换 Theorem 2 的渐近方差为 empirical sandwich 版本 → 再验证 SOMET 的结果稳健性。 完成后接回 A1：将该稳健方差用 einsum 加速，同时完成。

B2. 将本文的 SOMET 与 zero-proportion-based 方法（Liu [2025]）在同个模拟框架下比较，解析出各方法在面对 SCOM(K) 复合零假设时的优缺点。扎根：本文 Section 6.1 引用了 Liu [2025] 等，但没有模拟比较。文中对 zero-proportion 的评价是"rely on accurate estimation of null composition"——这是不是真的致命，需要实证验证。 缺什么：moderately_familiar 中的 identification theory 帮您理解 Liu [2025] 的假设（都是并列中介，不用顺序因果），需要再读原文确认是否真不能直接调用来比；若不可，需自己设计一个与本文参数设定相同的并列中介版本作为比较基线。 完成后接回 A2：可以跟 A2 结合成一个大的 mediation testing procedure comparison 项目。

(C) 暂不建议（≤ 1条）¶

C1. 将识别放松到允许 Mk 之间有反馈（non-DAG）的高阶路径分解。原因：Section 9 的 future work 中提到了"dynamic feedback between mediators and outcomes"——这需要进入非递推（non-recursive）SEM 或图级可识别性定理，但这需要 SoS 层级推理或体制类代数几何工具才能证明识别。您目前的工具包（U-统计量、einsum、高维渐近、HOIF）主要处理无环模型。这个项目目前武器库内不易绕过。

迁移视角¶

迁移口 1（方法 T + 目标领域 + 为什么可行）：
方法 T：SOMET 的 Q-fold 数据分割 + Studentized t 变换（目的：解决同一统计量在不同零配置下渐进方差不同导致的 I 类错误控制问题）。
目标领域：去偏机器学习（DML）中的假设检验。DML 的 θ̂ 在 θ=0 和 θ≠0 下收敛速度不同，√n(θ̂ - θ) 的渐近方差一般是 sandwich，但若 θ=0 且 nuisance 的估计误差很大，可能规则性条件不成立使 sandwich 失效。
为什么可行：SOMET 的核心理念——把一次估计分散成 Q 份，各自有一个渐近正态的"子"统计量，再 Studentized——可以直接用于 DML 中的 cross-fitting。已有工作（如 Chernozhukov et al. 2018）用 cross-fitting 做点估计，但做检验时仍用 normal approximation；引入 Q-fold studentized t 可能更稳健。你的 very_familiar 包括 semiparametric theory + estimation theory，是进入这个迁移口的天然切入点。
迁移口 2：
方法 T：Cauchy combination test for dependent p-values（Liu et al. [2022]），本文用来聚合多次数据分割的 p 值。
目标领域：高维基因组中介的检验。当前方法（如 Dai et al. [2022]、Liu et al. [2022]）在聚合大量平行中介的检验 p 值时，假定的是独立或弱依赖。Cauchy 组合法可以对任意依赖结构有效。
为什么可行：你的 high-dimensional asymptotics + HOU-statistics theory 可以用来分析 Cauchy 组合法在高维条件下的 power/tradeoff（如哪些 p 值分布下失效、哪些下最优）。

四、延伸与下一步¶

沿引用链的阅读路线¶

必读地基（2 篇）：
Roy et al. [2024] "Subsampling-based tests in mediation analysis"——那篇是 SOMET 的单中介版本原型。弄清数据分割如何拯救复合零假设，是看懂本文 Theorem 3 的前提。
Zhou [2022] "Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators"——本文的识别定义（τ†_k）直接来源于这篇。弄清（i）为什么 S→M1→Y 单独不可识别而只能作为复合路径、（ii）s1 = s3 条件，是看懂本文 Section 3.2-3.3 的前提。
前沿扩展（3 篇）：
He et al. [2024] ——自适应 bootstrap 路径，与 SOMET 路线形成竞争。
Liu [2025] "A simple and powerful method for large-scale composite null" ——零比例统计路径，对比看看 SOMET 的 CDF-free studentized 策略 vs. 比例估计策略的优劣。
Avin et al. [2005] "Identifiability of path-specific effects"——要深挖可识别性假设，这是最原始的图论/因果论 paper（经典引用）。

假设扰动¶

扰动假设：Assumption 4(v) —— Y(s, mK) ⊥ Mk(sk, m_k-1) | W（与潜在中介的跨世界独立性）。这意味着没有中介-结局的混淆受处理影响。
改变这个假设会如何：如果这个混淆存在，Theorem 1 的迭代积分公式不再成立，需要采用 instrumental variable 或 proximal causal inference 的方法来识别。SOMET 的整个分布理论就会坍缩。
技术上需要：moderately_familiar 中的 identification theory + proximal causal inference 工具包，加上某种断点回归 / 自然实验来获得对混淆变量的替代替代变量。
落入哪一档：此扰动后的项目 -> C 档（暂不建议），因为武器库中缺少 proximal inference 的实战经验，且需要学习大量新文献（Tchetgen Tchetgen et al., Miao et al. 等）。

理解检测题¶

题目（应用核心思路，非记忆性）：

考虑一个 SCOM(2) 设定，其中 α1=0, α2≠0, β1=0, β2≠0。计算 τ†_1(S→M1⇝Y) 和 τ†_2(S→M2⇝Y) 的真值。然后画出在该参数配置下，Sobel 统计量 T_S 的渐近分布（提示：利用 Lemma 1 与 Theorem 2 的协方差结构）。再解释若采用 SOMET（Q 折分割，Q=5），为什么最后的检验统计量仍然服从 t_{4}——即使 Sobel 统计量的渐近分布是 N(0, 1) 而不是 N(0, 1/4)。

目的：检验是否搞懂了：

复合零假设的三种类型与 Lemma 1 的区分；
为何 (α,η)≠(0,0) 时 Sobel 统计量趋近 N(0,1)；
数据分割 + Studentized t 如何"消除"方差的不确定性。

Maintained by 陈星宇 · Homepage · Source on GitHub