跳转至

Fit CATE Once: Model-Assisted Randomization Tests Without Sample Splitting

作者: Fangnan Zheng, Yao Zhang
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.09116


核心问题与动机

本文要解决在面板随机实验中,如何在不使用样本分割的情况下,将条件平均处理效应(CATE)模型整合到随机化检验中的问题。重要性在于:随机化检验提供有限样本有效性,而灵活的CATE模型能捕捉复杂的异质性,两者结合可大幅提升检验功效。已有方法的不足:直接在实现分配上拟合CATE会破坏检验有效性(条件独立性被破坏);对每个随机化分配重新拟合模型计算代价过高;使用样本分割会牺牲统计功效。

主要贡献

  • 提出基于残差协方差结构的“无分配”CATE估计方法,避免在实现分配上拟合模型,从而无需样本分割即可保持随机化检验的有限样本有效性。
  • 建立了对角矩(识别常数效应幅度)和非对角矩(识别滞后特定CATE向量)的局部/全局识别理论,以及估计量的一致性。
  • 开发了CATE辅助的随机化检验,证明其控制第一类错误,且功效高于协变量调整和样本分割方法。
  • 证明了无分配CATE估计可用于发现异质性子群并构建子群特定的有效随机化检验。

方法框架

核心模型设定:加法结果模型 $Y_{i,t} = \mu_{0,t}(X_i) + \sum_{l=0}^{t-1} 1{A_i = t-l} \tau_l(X_i) + \epsilon_{i,t}$。 关键假设: 1. No interference & No anticipation:标准面板因果假设。 2. Additive outcome model (Assumption 1):处理效应以滞后特定量平移结果均值,误差条件均值为0。 3. Lag-invariant effect & Time-invariant residual variance (Assumptions 2 & 3):用于对角矩估计,滞后效应恒定且误差方差跨期不变。 4. Serially uncorrelated errors (Assumption 4):$\Sigma_\epsilon(x)$ 为对角阵,用于非对角矩估计,排除误差的序列相关。

方法步骤: 1. 残差化:计算 $R_{i,t} = Y_{i,t} - \mu_t(X_i)$,其协方差结构分解为 $\Sigma_R(x) = \Sigma_A(x;\tau) + \Sigma_\epsilon(x)$,其中 $\Sigma_A(x;\tau)$ 仅依赖 $\tau(x)\tau(x)^\top$。 2. 估计无符号CATE: - 对角矩法:利用 $c_{t,t}(x) = \tau^2_(x)v_t(x) + \sigma^2_\epsilon(x)$,通过跨期差分消除 $\sigma^2_\epsilon(x)$,识别常数效应幅度 $m^(x) = |\tau^(x)|$。 - 非对角矩法:将估计转化为二次矩匹配问题 $c(x) = F_x(\tau)$。通过非线性最小二乘 (NLS) 或凸松弛(半正定规划 SDP,目标函数含迹惩罚以鼓励秩一解)求解 $B(x) = \tau(x)\tau(x)^\top$,取其顶部特征对得到谱估计器 $\hat{\tau}^{sp}_\pm(x)$。 3. 符号定向:选择最拟合观测结果轨迹的符号,或利用少量已揭示的分配学习符号。 4. 构建检验*:使用估计的CATE作为干扰模型 $\hat{\eta}$ 构建检验统计量,因 $\hat{\eta} \perp!!!\perp A_{[N]} | X_{[N]}, Y_{[N]}$,保证p值有效性。

主要理论结果

  • Theorem 1 (检验有效性):若干扰模型 $\hat{\eta}$ 满足条件独立性 $\hat{\eta} \perp!!!\perp A_{[N]} | X_{[N]}, Y_{[N]}$,则基于其的随机化检验在有限样本下控制第一类错误。
  • Proposition 2 (对角矩识别):在对角矩设定下,若设计产生足够变异($v_t(x) \neq \bar{v}(x)$),处理效应幅度 $m^*(x)$ 被点识别。
  • Proposition 3 (一致性):插入幅度估计器 $\hat{m}^(x)$ 依概率收敛于 $m^(x)$。
  • Proposition 5 (局部识别):在非对角矩设定下,若 Jacobian 矩阵 $J_x(\tau(x))$ 满秩(即 $\text{span}{H_{t,s}(x)\tau(x)} = \mathbb{R}^T$),则 $\tau(x)$ 在局部仅可识别到全局符号($\pm$)。
  • Proposition 6 (充分设计条件):在等概率分配和几何衰减 CATE 模式下,满秩条件在除有限个例外分配概率外均成立(generic nondegeneracy)。

实验 / 数值仿真

  • 实验设计:合成与半合成面板实验数据。
  • 评估指标:第一类错误控制、统计功效、CATE估计一致性。
  • 主要发现:CATE辅助的随机化检验有效控制第一类错误,且功效显著高于未调整、协变量调整和样本分割的基线方法;无符号CATE估计量具有一致性,且仅需少量分配信息即可热启动有符号CATE估计。

与研究者兴趣的关联

  • 因果推断:直连面板实验与随机化检验,巧妙解决了模型辅助推断中有效性与功效的权衡,无需样本分割。
  • 半参数/非参数理论与效率:利用残差二阶矩进行非参数识别(二次逆问题),避免了直接拟合处理分配带来的偏倚,属于巧妙的矩识别策略。
  • 统计计算:利用半正定规划(SDP)凸松弛求解非凸的二次矩匹配问题,为秩一矩阵恢复提供了数值算法思路。

局限性与开放问题

  • 局限:加法模型假设排除了处理与未观测变量的非加性交互;滞后不变CATE假设排除了日历时间对效应的修正(如季节性);非对角矩方法要求误差序列不相关,限制了在潜在冲击序列相关场景的应用。
  • 开放问题:如何放松序列不相关误差假设(如允许特定结构的 $\Sigma_\epsilon$);全局符号模糊性是否可以通过更高阶矩或更巧妙的矩条件完全消除;如何将该方法扩展到具有干扰或预期效应的更复杂面板设计。

Maintained by 陈星宇 · Homepage · Source on GitHub