Identification and estimation of mediational effects of longitudinal modified treatment policies¶

作者: Brian Gilbert, Katherine Hoffman, Nicholas Williams, Kara Rudolph, Edward J Schenck et al.
来源: Biostatistics
主题: 因果推断
相关性: 9/10
链接: https://doi.org/10.1093/biostatistics/kxaf031

一、核心问题与贡献¶

①本文研究了纵向连续处理、时依混杂与中介设定下因果中介效应的识别与估计问题。②基于非参数结构方程模型（NPSEM）完成效应识别，构造了双重稳健伪结果，并结合交叉拟合序贯回归进行估计。③所得估计量在半参数模型下达到有效界，具有 $n^{-1/2}$-CAN 性质，并在 COVID-19 数据中揭示了直接与间接效应方向相反的"不一致中介"现象。

二、基础设定¶

核心概念与符号：
$\text{LMTP}$ (Longitudinal Modified Treatment Policies)：纵向修正处理策略，将实际处理轨迹 $\bar{A}$ 映射为 $d(\bar{A}, \epsilon)$，支持连续/纵向干预。
$\text{NPSEM}$：非参数结构方程模型，定义 $L_t, A_t, M_t, Y$ 的时序生成机制。
$\theta_d, \theta_{d,m}$：LMTP 干预下的总体均值与给定中介路径下的干预均值。
自然直接效应 (NDE) 与自然间接效应 (NIE)：通过干预策略的增量 $\epsilon$ 分解。
关键假设：
序贯可忽略性 (Sequential Exchangeability)：$Y(\bar{a}, \bar{m}) \perp!!!\perp A_t | \bar{L}t, \bar{A}{t-1}, \bar{M}_{t-1}$。含义：控制过去历史后，当前处理无未测混杂。相比横截面假设，这是纵向因果的必要强化。
纵向正值性 (Longitudinal Positivity)：$P(A_t | \bar{L}t, \bar{A}{t-1}, \bar{M}_{t-1})$ 的支撑集包含 LMTP 支撑集。含义：保证干预策略可观测。对连续处理，这要求条件密度比有界。
一致性：潜在结果等于观测结果。
NPSEM：假设数据由非参数结构方程生成。相比传统中介分析依赖的线性结构方程模型（LSEM），极大放宽了函数形式与分布假设，允许非线性交互与反馈环路。
问题背景：现有中介分析多局限于横截面或离散/二值处理，无法处理纵向连续处理与时依混杂/中介的复杂反馈。最相关文献区别：Díaz et al. (2023) 提出了 LMTP 但未涉及中介分析；传统纵向中介分析（如 VanderWeele）多依赖参数回归。本文填补了 LMTP 与中介分析的空白。

三、主要定理 / 核心结果¶

识别定理
原文陈述：在 NPSEM 与序贯可忽略性下，LMTP 下的中介效应可通过 G-计算公式（嵌套的序贯条件期望与密度比加权）识别。
直观解释：通过前向迭代条件期望，将反事实分布的联合测度转化为可观测分布的泛函，连续处理下的概率比被替换为条件密度比 $r_t$。
解决的技术难点：连续处理下无法使用离散倾向得分倒数加权，通过密度比 $r_t = \frac{g(d_t | \bar{L}_t)}{g(A_t | \bar{L}_t)}$ 实现了从观测分布到干预分布的测度转换。
适用条件与局限：严格依赖序贯可忽略性与正值性；若存在未测时依混杂，识别公式失效。
有效影响函数 (EIF) 与双重稳健性定理
原文陈述：给出了参数 $\theta_d$ 的 EIF $\phi(O)$，基于 EIF 构造的估计量在干扰参数（处理机制 $g$ 或结果机制 $Q$）之一正确设定时具有一致性。
直观解释：EIF 刻画了半参数模型下的信息下界，双重稳健性意味着即使处理机制模型误设，只要结果回归模型正确，估计仍一致，反之亦然。
适用条件与局限：双重稳健性要求至少一个干扰参数模型正确；若均误设，则估计量有偏。
渐近正态与效率定理
原文陈述：使用交叉拟合序贯回归估计干扰参数后，基于伪结果的一步估计量 $\hat{\theta}_n = \mathbb{P}_n \hat{\phi}(O)$ 是 $n^{-1/2}$-CAN 的，且达到半参数有效界。
直观解释：交叉拟合切断了伪结果对样本的过拟合，消除了经验过程项，使得中心极限定理成立。
适用条件与局限：要求干扰参数的估计具有 $L_2$ 收敛速度 $o_p(n^{-1/4})$（如使用随机森林等慢速机器学习仍可满足）。

四、证明框架 / 方法设计¶

证明主干逻辑：构造法 + 经验过程理论。
拆解关键逻辑步骤：
参数空间与切线空间分析：在 NPSEM 下计算目标参数 $\theta_d$ 的路径导数，推导出 EIF $\phi(O)$。
二阶余项分析：证明目标参数真实值与初始估计的差可展开为 $\mathbb{P}(\phi) + \text{Second-order remainder}$，证明二阶余项是干扰参数估计误差的乘积（如 $R_2 \propto |\hat{g}-g| |\hat{Q}-Q|$）。
伪结果前向递归构造：从最后时间点 $T$ 向前至 $t=1$，在每一步计算条件期望 $\hat{Q}t = \mathbb{E}[\hat{Y}{dr, t+1} | \bar{L}_t, A_t]$，并利用密度比 $\hat{r}_t$ 调整权重，构造双重稳健伪结果。
交叉拟合去相关：将样本分为 $V$ 份，在每一步序贯回归中，使用不在当前折的样本估计干扰参数，切断 $\hat{\phi}$ 与 $\mathbb{P}_n$ 的依赖。
渐近展开：利用交叉拟合性质，将 $\sqrt{n}(\hat{\theta}_n - \theta)$ 分解为 $\sqrt{n}\mathbb{P}_n \phi(O) + o_p(1)$，前者由中心极限定理主导。
最关键的技巧性引理/跳跃点：纵向连续处理下双重稳健伪结果的嵌套构造。在 LMTP 中，必须将密度比 $r_t$ 与条件期望 $Q_t$ 的估计误差在每一步解耦。通过构造特定的伪结果 $\hat{Y}{dr, t} = \hat{Q}_t + \hat{r}_t(\hat{Y}{dr, t+1} - \hat{Q}_t)$，使得二阶余项恰好抵消，这是保证 DR 性质与 $n^{-1/2}$ 收敛的核心跳跃。
数学工具评价：是经典半参数理论（EIF, One-step estimation）、交叉拟合与纵向因果推断（g-computation, sequential regression）的巧妙组合，并无全新分析框架，但在连续干预中介设定下的技术整合极具价值。

五、与研究者兴趣的关联¶

连接子方向：纵向因果中介分析与半参数效率理论。
可借鉴的核心思路：
将 LMTP (Modified Treatment Policies) 引入中介分析，处理连续干预的密度比 $r_t$ 构造，可迁移到其他连续处理/IV 设定下的干扰参数校正。
纵向设定下双重稳健伪结果的交叉拟合序贯回归实现，为高维/复杂纵向数据的 DML 提供了算法模板，特别是如何处理多步条件期望的嵌套估计而不破坏渐近性质。
值得精读的关键参考文献：
Díaz, I., et al. (2023). "Longitudinal modified treatment policies." Biometrika. （理由：LMTP 的奠基性文章，理解本文处理连续干预机制与密度比的基础）。
Luedtke, A. R., & van der Laan, M. J. (2016). "Sequential regression for doubly robust estimation." International Journal of Biostatistics. （理由：序贯回归与交叉拟合结合的经典文献，本文方法的技术前驱）。

六、延伸思考与练习¶

假设扰动：若修改"序贯可忽略性"假设，存在时依未测混杂 $U_t$，结论如何变化？技术上需要引入 Proximal CI 的 Negative Control 设定，利用未测混杂的代理变量重构识别公式，此时 EIF 的推导将包含代理变量的条件期望，双重稳健性可能升级为对处理/结果/代理变量模型的三重稳健或需更强的完整性假设。
开放问题：
当纵向时间 $T$ 随样本量 $n$ 增长时（高维纵向），该序贯回归的误差累积是否可控？收敛条件是什么？
如何在 LMTP 中介框架下进行数据驱动的敏感度分析，以度量违背序贯可忽略性时的效应稳健性？
理解检测题：假设在 $T=2$ 的纵向设定下，处理 $A_t$ 为连续变量。请写出自然间接效应（NIE）的 EIF 中涉及时间 $t=2$ 的密度比项 $r_2$ 的具体表达式，并解释当干预策略退化为静态二值干预（$d(A_t)=1$）时，该密度比项如何退化为传统的倾向得分倒数权重（IPTW）项。

Maintained by 陈星宇 · Homepage · Source on GitHub