Counterfactual inference in sequential experiments¶

作者: Raaz Dwivedi, Katherine Tian, Sabina Tomkins, Predrag Klasnja, Susan Murphy et al.
来源: Annals of Statistics
主题: 因果推断
相关性: 8/10
链接: https://doi.org/10.1214/25-aos2519

核心问题与动机¶

本文解决的是序贯设计实验中细粒度（个体-时间尺度）反事实均值的统计推断问题。在多个体、多时间点的自适应序贯实验（如微随机试验 MRT）中，干预策略随时间及历史动态变化。对该尺度反事实均值进行推断对于个性化决策至关重要，但面临核心挑战：若不对反事实均值做任何结构假设，未知参数数量（$N \times T \times |\mathcal{A}|$）将远超观测数据量（$N \times T$），导致推断不可行。已有方法往往依赖强参数假设（如双线性潜因子模型）或仅能估计总体平均/边际效应，无法在最小尺度上提供有效的推断保证，且对自适应策略的假设过强。

主要贡献¶

提出非参数潜因子模型：将反事实均值建模为 $\mu_{it}(a) = f(u_i, v_t, a)$，其中 $u_i, v_t$ 为个体与时间潜因子，$f$ 为非参数函数。这是对非线性混合效应模型和双线性潜因子模型的非参数推广，大幅降低了模型误设风险。
设计基于近邻的估计量：提出一种针对潜因子结构的近邻变体方法，在极小化自适应策略假设的前提下，实现个体-时间点尺度的反事实均值估计。
建立非渐近高概率误差界：为每个个体在每个时间点的反事实均值估计提供了有限样本保证，并在正则条件下推导出渐近有效的置信区间。
放宽对自适应策略的假设：方法不要求干预策略满足特定的平稳性或遗忘性，适用于一般的自适应序贯实验。

方法框架¶

模型设定：$N$ 个个体，$T$ 个时间点。$A_{it}$ 为干预，$Y_{it}$ 为结果。目标量为反事实均值 $\mu_{it}(a) = \mathbb{E}[Y_{it}(a)]$。
关键假设：
非参数潜因子结构：$\mu_{it}(a) = f(u_i, v_t, a)$，$u_i \in \mathbb{R}^{d_1}, v_t \in \mathbb{R}^{d_2}$ 为低维潜因子，$f$ 为光滑非参数函数。
自适应策略有界：干预概率 $\pi_t(a|H_{it})$（倾向得分）有下界，允许策略依赖于历史 $H_{it}$，但不要求参数化形式。
方法步骤：
基于观测数据构建个体与时间的相似性度量（利用潜因子结构的几何性质）；
在潜空间中寻找目标个体-时间点 $(i,t)$ 的近邻集合；
利用逆概率加权（IPW）或直接平滑技术，结合近邻信息聚合估计 $\hat{\mu}_{it}(a)$。

主要理论结果¶

非渐近高概率界：对于任意个体 $i$ 和时间 $t$，估计误差 $|\hat{\mu}{it}(a) - \mu{it}(a)|$ 以高概率被控制，收敛速率依赖于潜因子的内在维度及非参数函数 $f$ 的光滑度。
渐近分布与置信区间：当 $N, T \to \infty$ 且以合适速率增长时，估计量具有渐近正态性。基于此可构建 $\mu_{it}(a)$ 的逐点置信区间，实现了从矩阵补全到因果推断的理论跨越。

实验 / 数值仿真¶

仿真设计：在不同 $N, T$ 规模及不同自适应策略下，验证所提近邻估计量的有限样本表现。
评估指标：置信区间的覆盖率及估计的均方误差。
主要发现：所提方法在细粒度反事实均值估计上优于传统聚合方法，且置信区间在自适应策略下保持名义覆盖率。在 HeartSteps 移动健康临床试验的真实数据中，成功估计了个体在不同时间点接受干预的反事实效果。

与研究者兴趣的关联¶

纵向因果推断：直接切入 longitudinal/sequential 因果推断，处理时间序列上的自适应策略，与 MRT 等前沿实验设计高度相关。
半参数/非参数理论：利用非参数潜因子模型放宽参数假设，其近邻估计与光滑度假设下的收敛率分析，是典型的非参数理论应用。
高维统计与矩阵补全：$N \times T$ 反事实均值矩阵的估计本质上是因果视角的矩阵补全问题，潜因子模型与高维随机矩阵理论深度绑定。
效率理论：本文给出了逐点 CI，但未讨论半参数有效边界，这为后续 debiased ML 或效率边界研究留下了明确空间。

局限性与开放问题¶

潜因子维度的选择：实际应用中潜因子的维度 $d_1, d_2$ 及近邻参数的选择缺乏理论指导，可能对超参数敏感。
未测量混淆：模型假设潜因子捕获了所有个体与时间异质性，若存在未观测的时变混淆，方法的因果识别可能受损（可结合 Proximal CI 思路改进）。
效率缺失：近邻方法通常不是半参数有效估计，如何在潜因子结构下推导 $\mu_{it}(a)$ 的半参数有效边界并构造 debiased 估计量，是一个极具价值的开放问题。
$T$ 固定的情况：理论要求 $N, T \to \infty$，对于 $T$ 较小（如短面板）的纵向数据，现有渐近保证失效。

Maintained by 陈星宇 · Homepage · Source on GitHub