跳转至

Counterfactual inference in sequential experiments

作者: Raaz Dwivedi, Katherine Tian, Sabina Tomkins, Predrag Klasnja, Susan Murphy et al.
来源: Annals of Statistics
主题: 因果推断
相关性: 8/10
链接: https://doi.org/10.1214/25-aos2519


核心问题与动机

本文解决的是序贯设计实验中细粒度(个体-时间尺度)反事实均值的统计推断问题。在多个体、多时间点的自适应序贯实验(如微随机试验 MRT)中,干预策略随时间及历史动态变化。对该尺度反事实均值进行推断对于个性化决策至关重要,但面临核心挑战:若不对反事实均值做任何结构假设,未知参数数量($N \times T \times |\mathcal{A}|$)将远超观测数据量($N \times T$),导致推断不可行。已有方法往往依赖强参数假设(如双线性潜因子模型)或仅能估计总体平均/边际效应,无法在最小尺度上提供有效的推断保证,且对自适应策略的假设过强。

主要贡献

  • 提出非参数潜因子模型:将反事实均值建模为 $\mu_{it}(a) = f(u_i, v_t, a)$,其中 $u_i, v_t$ 为个体与时间潜因子,$f$ 为非参数函数。这是对非线性混合效应模型和双线性潜因子模型的非参数推广,大幅降低了模型误设风险。
  • 设计基于近邻的估计量:提出一种针对潜因子结构的近邻变体方法,在极小化自适应策略假设的前提下,实现个体-时间点尺度的反事实均值估计。
  • 建立非渐近高概率误差界:为每个个体在每个时间点的反事实均值估计提供了有限样本保证,并在正则条件下推导出渐近有效的置信区间。
  • 放宽对自适应策略的假设:方法不要求干预策略满足特定的平稳性或遗忘性,适用于一般的自适应序贯实验。

方法框架

  • 模型设定:$N$ 个个体,$T$ 个时间点。$A_{it}$ 为干预,$Y_{it}$ 为结果。目标量为反事实均值 $\mu_{it}(a) = \mathbb{E}[Y_{it}(a)]$。
  • 关键假设
  • 非参数潜因子结构:$\mu_{it}(a) = f(u_i, v_t, a)$,$u_i \in \mathbb{R}^{d_1}, v_t \in \mathbb{R}^{d_2}$ 为低维潜因子,$f$ 为光滑非参数函数。
  • 自适应策略有界:干预概率 $\pi_t(a|H_{it})$(倾向得分)有下界,允许策略依赖于历史 $H_{it}$,但不要求参数化形式。
  • 方法步骤
  • 基于观测数据构建个体与时间的相似性度量(利用潜因子结构的几何性质);
  • 在潜空间中寻找目标个体-时间点 $(i,t)$ 的近邻集合;
  • 利用逆概率加权(IPW)或直接平滑技术,结合近邻信息聚合估计 $\hat{\mu}_{it}(a)$。

主要理论结果

  • 非渐近高概率界:对于任意个体 $i$ 和时间 $t$,估计误差 $|\hat{\mu}{it}(a) - \mu{it}(a)|$ 以高概率被控制,收敛速率依赖于潜因子的内在维度及非参数函数 $f$ 的光滑度。
  • 渐近分布与置信区间:当 $N, T \to \infty$ 且以合适速率增长时,估计量具有渐近正态性。基于此可构建 $\mu_{it}(a)$ 的逐点置信区间,实现了从矩阵补全到因果推断的理论跨越。

实验 / 数值仿真

  • 仿真设计:在不同 $N, T$ 规模及不同自适应策略下,验证所提近邻估计量的有限样本表现。
  • 评估指标:置信区间的覆盖率及估计的均方误差。
  • 主要发现:所提方法在细粒度反事实均值估计上优于传统聚合方法,且置信区间在自适应策略下保持名义覆盖率。在 HeartSteps 移动健康临床试验的真实数据中,成功估计了个体在不同时间点接受干预的反事实效果。

与研究者兴趣的关联

  • 纵向因果推断:直接切入 longitudinal/sequential 因果推断,处理时间序列上的自适应策略,与 MRT 等前沿实验设计高度相关。
  • 半参数/非参数理论:利用非参数潜因子模型放宽参数假设,其近邻估计与光滑度假设下的收敛率分析,是典型的非参数理论应用。
  • 高维统计与矩阵补全:$N \times T$ 反事实均值矩阵的估计本质上是因果视角的矩阵补全问题,潜因子模型与高维随机矩阵理论深度绑定。
  • 效率理论:本文给出了逐点 CI,但未讨论半参数有效边界,这为后续 debiased ML 或效率边界研究留下了明确空间。

局限性与开放问题

  • 潜因子维度的选择:实际应用中潜因子的维度 $d_1, d_2$ 及近邻参数的选择缺乏理论指导,可能对超参数敏感。
  • 未测量混淆:模型假设潜因子捕获了所有个体与时间异质性,若存在未观测的时变混淆,方法的因果识别可能受损(可结合 Proximal CI 思路改进)。
  • 效率缺失:近邻方法通常不是半参数有效估计,如何在潜因子结构下推导 $\mu_{it}(a)$ 的半参数有效边界并构造 debiased 估计量,是一个极具价值的开放问题。
  • $T$ 固定的情况:理论要求 $N, T \to \infty$,对于 $T$ 较小(如短面板)的纵向数据,现有渐近保证失效。

Maintained by 陈星宇 · Homepage · Source on GitHub