跳转至

Semiparametric Inference for Causal Effects on Functional Outcomes

作者: Junzhu Nie, Chengxiu Ling, Mengfei Ran
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.26964


一、核心问题与贡献

①研究了在平行趋势假设下,具有功能型(函数型)结果的因果推断中功能型平均处理效应(fATT)的识别与半参数估计问题。②核心工具是基于 Hilbert 空间推导的 efficient influence function (EIF)、Neyman 正交性、cross-fitting 以及函数型经验过程理论。③主要贡献在于:推导了 fATT 的 EIF 确立了半参数效率界,构造了消除非参数重建与干扰函数估计偏差的 debiased 估计量,证明了其在 \(L^2(\mathcal{T})\)\(\ell^\infty(\mathcal{T})\) 中的弱收敛,并给出了渐近有效的 uniform confidence band,同时论证了离散采样重建误差的渐近可忽略性。

二、基础设定

  • 核心概念与符号
  • \(\mathcal{T} \subset \mathbb{R}\):紧区间(如时间域);\(H = L^2(\mathcal{T})\):平方可积函数构成的 Hilbert 空间。
  • \(W_i = (\Delta Y_i, D_i, X_i)\):观测数据,\(\Delta Y_i(\cdot) = Y_{i1}(\cdot) - Y_{i0}(\cdot) \in H\) 为前后期功能型结果变化。
  • \(\tau_0(t) = E[Y_{i1}^1(t) - Y_{i1}^0(t) | D_i=1]\):功能型 ATT (fATT) 曲线,目标 estimand。
  • \(\pi_0(x) = P(D=1|X=x)\):倾向得分;\(\mu_a(x)(t) = E[\Delta Y(t)|X=x, D=a]\):条件均值函数(\(H\)-值回归)。
  • \(\phi(W; \eta_0)(t)\):fATT 的有效影响函数;\(\psi(W; \eta)(t)\):未中心化的 Neyman 正交得分。
  • 关键假设
  • SUTVANo anticipation:标准潜在结果框架,前期潜在结果不受干预影响。
  • Covariate-adjusted functional parallel trends\(E[\Delta Y_i^0(t)|X_i, D_i=1] = E[\Delta Y_i^0(t)|X_i, D_i=0]\)。将标量 DiD 的平行趋势推广至条件期望曲线层面,允许通过 \(X\) 调整选择偏差。
  • Overlap (Positivity)\(c \le \pi_0(X) \le 1-c\)。与标量设定一致,保证逆概率加权稳定。
  • Product-rate condition\(\|\hat{\mu}_0 - \mu_0\|_2 \|\hat{\pi} - \pi_0\|_2 = o_p(n^{-1/2})\)。半参数正交估计的标准假设,允许干扰函数以慢于 \(n^{-1/4}\) 的速度收敛。
  • Reconstruction error control\(\max_i \|\widehat{\Delta Y}_i - \Delta Y_i\|_H = o_p(n^{-1/2})\)(逐点推断)及 \(\max_i \|\widehat{\Delta Y}_i - \Delta Y_i\|_\infty = o_p(n^{-1/2})\)(Uniform 推断)。比传统 FDA 仅要求 \(o_p(1)\) 更严,确保离散采样重建不破坏 \(\sqrt{n}\)-推断。
  • 问题背景:现有 DiD 方法多针对标量结果,功能型数据常退化为标量摘要或逐点分析,后者丧失轨迹结构且面临多重比较问题。与 Ecker et al. (2024) 及 Sparkes et al. (2024) 仅关注功能型处理效应的 SCB 不同,本文首次在 DiD 设计下统一了协变量调整识别、双重稳健估计、半参数效率界与稀疏/噪声测量重建。

三、主要定理 / 核心结果

  1. Theorem 1 (Asymptotic Linearity in \(H\))
  2. 陈述\(\sqrt{n}(\hat{\tau} - \tau_0) = \frac{1}{\sqrt{n}} \sum_{i=1}^n \phi(W_i; \eta_0) + r_n\),其中 \(\|r_n\|_H = o_p(1)\)
  3. 直观解释:估计量的一阶展开由 EIF 驱动,余项 \(r_n\) 汇集了干扰函数估计的正交化高阶误差与重建误差,在 Hilbert 空间中渐近可

Maintained by 陈星宇 · Homepage · Source on GitHub

评论