Semiparametric Inference for Causal Effects on Functional Outcomes¶
作者: Junzhu Nie, Chengxiu Ling, Mengfei Ran
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.26964
一、核心问题与贡献¶
①研究了在平行趋势假设下,具有功能型(函数型)结果的因果推断中功能型平均处理效应(fATT)的识别与半参数估计问题。②核心工具是基于 Hilbert 空间推导的 efficient influence function (EIF)、Neyman 正交性、cross-fitting 以及函数型经验过程理论。③主要贡献在于:推导了 fATT 的 EIF 确立了半参数效率界,构造了消除非参数重建与干扰函数估计偏差的 debiased 估计量,证明了其在 \(L^2(\mathcal{T})\) 与 \(\ell^\infty(\mathcal{T})\) 中的弱收敛,并给出了渐近有效的 uniform confidence band,同时论证了离散采样重建误差的渐近可忽略性。
二、基础设定¶
- 核心概念与符号:
- \(\mathcal{T} \subset \mathbb{R}\):紧区间(如时间域);\(H = L^2(\mathcal{T})\):平方可积函数构成的 Hilbert 空间。
- \(W_i = (\Delta Y_i, D_i, X_i)\):观测数据,\(\Delta Y_i(\cdot) = Y_{i1}(\cdot) - Y_{i0}(\cdot) \in H\) 为前后期功能型结果变化。
- \(\tau_0(t) = E[Y_{i1}^1(t) - Y_{i1}^0(t) | D_i=1]\):功能型 ATT (fATT) 曲线,目标 estimand。
- \(\pi_0(x) = P(D=1|X=x)\):倾向得分;\(\mu_a(x)(t) = E[\Delta Y(t)|X=x, D=a]\):条件均值函数(\(H\)-值回归)。
- \(\phi(W; \eta_0)(t)\):fATT 的有效影响函数;\(\psi(W; \eta)(t)\):未中心化的 Neyman 正交得分。
- 关键假设:
- SUTVA 与 No anticipation:标准潜在结果框架,前期潜在结果不受干预影响。
- Covariate-adjusted functional parallel trends:\(E[\Delta Y_i^0(t)|X_i, D_i=1] = E[\Delta Y_i^0(t)|X_i, D_i=0]\)。将标量 DiD 的平行趋势推广至条件期望曲线层面,允许通过 \(X\) 调整选择偏差。
- Overlap (Positivity):\(c \le \pi_0(X) \le 1-c\)。与标量设定一致,保证逆概率加权稳定。
- Product-rate condition:\(\|\hat{\mu}_0 - \mu_0\|_2 \|\hat{\pi} - \pi_0\|_2 = o_p(n^{-1/2})\)。半参数正交估计的标准假设,允许干扰函数以慢于 \(n^{-1/4}\) 的速度收敛。
- Reconstruction error control:\(\max_i \|\widehat{\Delta Y}_i - \Delta Y_i\|_H = o_p(n^{-1/2})\)(逐点推断)及 \(\max_i \|\widehat{\Delta Y}_i - \Delta Y_i\|_\infty = o_p(n^{-1/2})\)(Uniform 推断)。比传统 FDA 仅要求 \(o_p(1)\) 更严,确保离散采样重建不破坏 \(\sqrt{n}\)-推断。
- 问题背景:现有 DiD 方法多针对标量结果,功能型数据常退化为标量摘要或逐点分析,后者丧失轨迹结构且面临多重比较问题。与 Ecker et al. (2024) 及 Sparkes et al. (2024) 仅关注功能型处理效应的 SCB 不同,本文首次在 DiD 设计下统一了协变量调整识别、双重稳健估计、半参数效率界与稀疏/噪声测量重建。
三、主要定理 / 核心结果¶
- Theorem 1 (Asymptotic Linearity in \(H\)):
- 陈述:\(\sqrt{n}(\hat{\tau} - \tau_0) = \frac{1}{\sqrt{n}} \sum_{i=1}^n \phi(W_i; \eta_0) + r_n\),其中 \(\|r_n\|_H = o_p(1)\)。
- 直观解释:估计量的一阶展开由 EIF 驱动,余项 \(r_n\) 汇集了干扰函数估计的正交化高阶误差与重建误差,在 Hilbert 空间中渐近可
Maintained by 陈星宇 · Homepage · Source on GitHub