Nested Sensitivity Envelopes for Transported Quantile Treatment Effects¶
作者: Pengyun Wang
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.09264
核心问题与动机¶
本文解决的是在内部有效性(源样本存在未测量处理混杂)与外部有效性(条件协变量下源样本到目标人群的潜在结果分布不可迁移)同时受损时,目标人群分位数处理效应(QTE)的识别与推断问题。重要性在于:现实中的迁移学习/泛化问题常面临这两重挑战,而现有灵敏度分析多针对平均处理效应(ATE)等线性估计量,无法直接处理 QTE 估计中“先刻画反事实 CDF 界,再通过广义逆映射求分位数”的非光滑非线性链式结构。已有方法无法给出整个 CDF 过程的联合尖锐界,也缺乏针对该部分识别集的半参数有效推断理论。
主要贡献¶
- 嵌套封闭形式 CDF 包络线:提出双层灵敏度框架(源混杂 OR 界 $\Gamma$ + 迁移似然比界 $\Lambda$),推导出目标反事实 CDF 的封闭形式尖锐界 $T_\Lambda \circ C_\Gamma$,证明其过程水平尖锐性,且严格优于单一乘积似然比松弛。
- 半参数效率理论:推导了非光滑 CDF 界过程的正则切空间与有效影响函数,特别揭示了观测性研究中源倾向得分对边界估计的必要贡献项,构建了交叉拟合 Neyman 正交单步估计器。
- 非光滑推断与分位数反转:针对分位数映射的广义逆非光滑性,在正则集上使用乘数 Bootstrap,在存在结点/质量点的非正则集上利用 Hadamard 方向可微性与子抽样,通过反转同时 CDF 置信带获得 QTE 及其区间壳的诚实置信集。
- 二维崩溃前沿推断:将 $(\Gamma, \Lambda)$ 灵敏度参数空间下的崩溃前沿视为水平集统计量,构建了区间壳非反驳区域的内外置信集。
方法框架¶
模型设定:源样本 $(R=1)$ 观测 $(X, A, Y)$,目标样本 $(R=0)$ 仅观测 $X$。 关键假设: 1. Assumption 1 (Sampling & Overlap):重叠假定,密度比 $\omega(x) = dP_0^X/dP_1^X$ 与倾向得分 $e_a(x)$ 有界且远离 0/1。 2. Assumption 2 (Source Marginal Treatment-Confounding Sensitivity):内部有效性,边际优势比界 $\Gamma \ge 1$:$\Gamma^{-1} \le \frac{e_a(x)/(1-e_a(x))}{g_a(y,x)/(1-g_a(x))} \le \Gamma$。 3. Assumption 3 (Conditional Source-to-Target Outcome-Shift Sensitivity):外部有效性,条件似然比界 $\Lambda \ge 1$:$\Lambda^{-1} \le \frac{dF_a^T(\cdot|x)}{dF_a^S(\cdot|x)}(y) \le \Lambda$。
方法步骤: 1. 源 CDF 界:定义 $\ell_\Gamma(e)=e+(1-e)/\Gamma$, $u_\Gamma(e)=e+\Gamma(1-e)$,源潜在结果 CDF 界为: $C_\Gamma^-(p,e) = \max{\ell_\Gamma(e)p, 1-u_\Gamma(e)(1-p)}$, $C_\Gamma^+(p,e) = \min{u_\Gamma(e)p, 1-\ell_\Gamma(e)(1-p)}$ 2. 嵌套迁移 CDF 界:将源界输入迁移映射 $T_\Lambda$,得目标条件 CDF 界: $b_{a,s}^-(y,x) = T_\Lambda^-{C_\Gamma^-(p_a(y,x), e_a(x))}$, $b_{a,s}^+(y,x) = T_\Lambda^+{C_\Gamma^+(p_a(y,x), e_a(x))}$ 3. 边际化与求逆:对目标协变量分布取期望得 $\psi_{a,s}^\pm(y)$,通过广义逆映射得 QTE 尖锐界 $q_{a,s}^-(\tau) = \inf{y: \psi_{a,s}^+(y) \ge \tau}$。 4. 估计与推断:基于有效影响函数构建交叉拟合单步估计器,利用 Subsampling/Bootstrap 处理方向可微映射的推断。
主要理论结果¶
- Proposition 1 (Nested Closed Form & Non-collapse):嵌套映射 $T_\Lambda \circ C_\Gamma$ 给出联合灵敏度模型下的尖锐界,且严格比单一乘积似然比松弛更紧(给出反例数值证明不等式可严格成立)。
- Lemma 4 (Process-level Sharpness):证明存在阈值倾斜,使得上下包络线作为整个 CDF 路径同时可达,而非仅逐点可达。
- Efficient Influence Function:给出了 CDF 界过程的正则梯度,其中源倾向得分的贡献项为 $G_e{p_a(y,X), e_a(X)}{1(A=a)-e_a(X)}$,在观测性研究中不可或缺。
- Asymptotic Distribution:
- 正则指数集上:交叉拟合估计量具有均匀渐近线性性,收敛于高斯过程。
- 非正则集(存在结点/质量点)上:利用 Hadamard 方向可微性,通过子抽样获得有效临界值,极限为非高斯 sup 范数极限。
实验 / 数值仿真¶
(未在提供文本中体现)
与研究者兴趣的关联¶
- 因果推断与灵敏度分析:直接推进了迁移学习/泛化中的联合灵敏度分析(内部混杂+外部分布偏移),将一阶矩(ATE)的灵敏度分析拓展至分布参数(QTE)。
- 效率理论与 Debiased ML:推导了部分识别下非光滑边界过程的半参数有效影响函数,并使用 Cross-fitting + Neyman-orthogonality 消除 nuisance 估计的一阶误差,是 Debiased ML 在部分识别框架下的标准且前沿的应用。
- 数理统计(假设检验/方向可微):利用 Hadamard 方向可微性处理分位数反转的非正则推断,以及构建二维崩溃前沿的水平集推断,属于非标准推断中的核心技术。
局限性与开放问题¶
- 重叠假定要求:假设了密度比 $\omega(X)$ 和倾向得分 $e_a(X)$ 严格有界远离 0/1,在高维协变量或强选择偏倚下可能不满足,如何结合高维重叠假定或 Proximal CI 放松此条件是开放问题。
- 灵敏度参数的先验设定:二维 $(\Gamma, \Lambda)$ 的选择在实际中极具挑战,虽然提出了崩溃前沿,但如何结合数据驱动的选择或更结构化的假设(如 IV 假设)来缩窄界仍待研究。
- 纵向/面板数据扩展:当前模型限于截面数据,如何将此嵌套包络线与方向可微推断拓展至纵向因果推断中的动态处理策略是重要方向。
Maintained by 陈星宇 · Homepage · Source on GitHub