Fit CATE Once: Model-Assisted Randomization Tests Without Sample Splitting¶

作者: Fangnan Zheng, Yao Zhang
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.09116

核心问题与动机¶

本文要解决在面板随机实验中，如何在不使用样本分割的情况下，将条件平均处理效应（CATE）模型整合到随机化检验中的问题。重要性在于：随机化检验提供有限样本有效性，而灵活的CATE模型能捕捉复杂的异质性，两者结合可大幅提升检验功效。已有方法的不足：直接在实现分配上拟合CATE会破坏检验有效性（条件独立性被破坏）；对每个随机化分配重新拟合模型计算代价过高；使用样本分割会牺牲统计功效。

主要贡献¶

提出基于残差协方差结构的“无分配”CATE估计方法，避免在实现分配上拟合模型，从而无需样本分割即可保持随机化检验的有限样本有效性。
建立了对角矩（识别常数效应幅度）和非对角矩（识别滞后特定CATE向量）的局部/全局识别理论，以及估计量的一致性。
开发了CATE辅助的随机化检验，证明其控制第一类错误，且功效高于协变量调整和样本分割方法。
证明了无分配CATE估计可用于发现异质性子群并构建子群特定的有效随机化检验。

方法框架¶

核心模型设定：加法结果模型 $Y_{i,t} = \mu_{0,t}(X_i) + \sum_{l=0}^{t-1} 1{A_i = t-l} \tau_l(X_i) + \epsilon_{i,t}$。关键假设： 1. No interference & No anticipation：标准面板因果假设。 2. Additive outcome model (Assumption 1)：处理效应以滞后特定量平移结果均值，误差条件均值为0。 3. Lag-invariant effect & Time-invariant residual variance (Assumptions 2 & 3)：用于对角矩估计，滞后效应恒定且误差方差跨期不变。 4. Serially uncorrelated errors (Assumption 4)：$\Sigma_\epsilon(x)$ 为对角阵，用于非对角矩估计，排除误差的序列相关。

方法步骤： 1. 残差化：计算 $R_{i,t} = Y_{i,t} - \mu_t(X_i)$，其协方差结构分解为 $\Sigma_R(x) = \Sigma_A(x;\tau) + \Sigma_\epsilon(x)$，其中 $\Sigma_A(x;\tau)$ 仅依赖 $\tau(x)\tau(x)^\top$。 2. 估计无符号CATE： - 对角矩法：利用 $c_{t,t}(x) = \tau^2_(x)v_t(x) + \sigma^2_\epsilon(x)$，通过跨期差分消除 $\sigma^2_\epsilon(x)$，识别常数效应幅度 $m^(x) = |\tau^(x)|$。 - 非对角矩法：将估计转化为二次矩匹配问题 $c(x) = F_x(\tau)$。通过非线性最小二乘 (NLS) 或凸松弛（半正定规划 SDP，目标函数含迹惩罚以鼓励秩一解）求解 $B(x) = \tau(x)\tau(x)^\top$，取其顶部特征对得到谱估计器 $\hat{\tau}^{sp}_\pm(x)$。 3. 符号定向：选择最拟合观测结果轨迹的符号，或利用少量已揭示的分配学习符号。 4. 构建检验*：使用估计的CATE作为干扰模型 $\hat{\eta}$ 构建检验统计量，因 $\hat{\eta} \perp!!!\perp A_{[N]} | X_{[N]}, Y_{[N]}$，保证p值有效性。

主要理论结果¶

Theorem 1 (检验有效性)：若干扰模型 $\hat{\eta}$ 满足条件独立性 $\hat{\eta} \perp!!!\perp A_{[N]} | X_{[N]}, Y_{[N]}$，则基于其的随机化检验在有限样本下控制第一类错误。
Proposition 2 (对角矩识别)：在对角矩设定下，若设计产生足够变异（$v_t(x) \neq \bar{v}(x)$），处理效应幅度 $m^*(x)$ 被点识别。
Proposition 3 (一致性)：插入幅度估计器 $\hat{m}^(x)$ 依概率收敛于 $m^(x)$。
Proposition 5 (局部识别)：在非对角矩设定下，若 Jacobian 矩阵 $J_x(\tau(x))$ 满秩（即 $\text{span}{H_{t,s}(x)\tau(x)} = \mathbb{R}^T$），则 $\tau(x)$ 在局部仅可识别到全局符号（$\pm$）。
Proposition 6 (充分设计条件)：在等概率分配和几何衰减 CATE 模式下，满秩条件在除有限个例外分配概率外均成立（generic nondegeneracy）。

实验 / 数值仿真¶

实验设计：合成与半合成面板实验数据。
评估指标：第一类错误控制、统计功效、CATE估计一致性。
主要发现：CATE辅助的随机化检验有效控制第一类错误，且功效显著高于未调整、协变量调整和样本分割的基线方法；无符号CATE估计量具有一致性，且仅需少量分配信息即可热启动有符号CATE估计。

与研究者兴趣的关联¶

因果推断：直连面板实验与随机化检验，巧妙解决了模型辅助推断中有效性与功效的权衡，无需样本分割。
半参数/非参数理论与效率：利用残差二阶矩进行非参数识别（二次逆问题），避免了直接拟合处理分配带来的偏倚，属于巧妙的矩识别策略。
统计计算：利用半正定规划（SDP）凸松弛求解非凸的二次矩匹配问题，为秩一矩阵恢复提供了数值算法思路。

局限性与开放问题¶

局限：加法模型假设排除了处理与未观测变量的非加性交互；滞后不变CATE假设排除了日历时间对效应的修正（如季节性）；非对角矩方法要求误差序列不相关，限制了在潜在冲击序列相关场景的应用。
开放问题：如何放松序列不相关误差假设（如允许特定结构的 $\Sigma_\epsilon$）；全局符号模糊性是否可以通过更高阶矩或更巧妙的矩条件完全消除；如何将该方法扩展到具有干扰或预期效应的更复杂面板设计。

Maintained by 陈星宇 · Homepage · Source on GitHub