Post-selection inference for causal effects after causal discovery¶

作者: Ting-Hsuan Chang, Zijian Guo, Daniel Malinsky
来源: Biometrika
主题: 因果推断
相关性: 9/10
链接: https://doi.org/10.1093/biomet/asaf073

一、核心问题与贡献¶

①研究了在基于条件独立性检验的因果发现（如PC算法）选出图模型后，对固定的总体真实因果效应进行post-selection推断的问题。②核心方法是一种基于重抽样与筛选的推断框架，通过在因果发现中引入随机变动的中间检验统计量多次执行选图，并对基于各选中图构建的置信区间取并集。③主要贡献是证明了该并集置信集对固定的总体因果效应参数具有渐近正确的覆盖概率，克服了同一数据双重使用导致的置信区间失效及目标泛函错配问题。

二、基础设定¶

核心概念与符号：
$G$: 有向无环图（DAG）
$\tau$: 目标因果效应参数（如ATE，固定的总体真实值）
$\tau_G$: 图$G$对应的识别泛函（若$G$错，$\tau_G \neq \tau$）
$\hat{G}$: 数据驱动的因果发现算法（如PC）选出的图
$CI_{union}$: 基于多次重抽样选图构建的置信区间并集
关键假设：
忠实性假设：条件独立关系完全由图结构蕴含，无偶然抵消。统计学含义是保证总体存在唯一的真实DAG $G_0$；与部分弱化忠实性假设的文献相比，本文依赖此假设保证渐近相合性。
多元高斯分布：观测数据服从多元高斯分布。统计学含义是将条件独立性检验等价为偏相关系数为0的检验，简化了重抽样统计量的分布推导；这是为了聚焦核心逻辑的强化假设，但框架本身可模块化替换。
因果充分性：无隐藏混杂因子。这是因果发现与效应识别的基础假设。
问题背景：
针对不足：传统做法将同一数据用于选图（模型选择）和估计（推断），导致Type I error膨胀；且若选错图，推断的是数据依赖的选择泛函$\tau_{\hat{G}}$而非真实因果效应$\tau$。
与最相关文献的区别：(1) 传统 Selective Inference（如Lee et al. 2016）针对选定模型对应的参数$\tau_{\hat{G}}$做条件推断，而本文针对固定的真实参数$\tau$做无条件推断；(2) IDA类算法仅估计可能效应的集合，不提供有效的置信区间，本文填补了推断空白。

三、主要定理 / 核心结果¶

原文陈述：设 $\hat{G}^{(b)}$ 为第 $b$ 次重抽样筛选选出的图，$CI^{(b)}$ 为基于 $\hat{G}^{(b)}$ 构建的 $\tau$ 的 $1-\alpha$ 水平置信区间。令 $CI_{union} = \bigcup_{b=1}^B CI^{(b)}$，则在正则条件下，$\liminf_{n \to \infty} P(\tau \in CI_{union}) \ge 1 - \alpha$。
直观解释：即使选出的图可能错误导致识别泛函错配，只要重抽样扰动遍历了足够多的可能图，且对每个图构建了保守的区间，取并集后就能"兜住"真实的参数。这避免了推断目标随数据漂移的问题。
解决了什么技术难点：打破了"选错图即推断错误泛函"的困境。传统PoSI在选错模型时只能保证覆盖$\tau_{\hat{G}}$，本文通过并集逻辑与因果发现算法的渐近相合性，保证了对固定目标$\tau$的覆盖。
适用条件与局限：依赖PC算法的渐近相合性（$P(\hat{G} = G_0) \to 1$）及高斯假设。局限在于并集区间可能较宽（保守），且重抽样次数$B$的理论要求虽有限但实际需足够大以覆盖图空间。

四、证明框架 / 方法设计¶

证明主干逻辑：构造法 + 渐近分析。将"选图"视为随机事件，通过重抽样控制事件概率，利用并集的覆盖逻辑与算法相合性桥接至真实参数。
拆解为3-5个关键逻辑步骤：
重抽样统计量构造：将原始偏相关检验统计量加入独立高斯噪声（或乘以随机扰动因子），生成扰动统计量，执行PC算法得到$\hat{G}^{(b)}$。
图特定泛函的渐近正态性：对于固定的图$G$，基于其调整集计算的效应估计量 $\hat{\tau}_G$ 满足渐近正态性，可构建 $1-\alpha$ 水平的 $CI_G$。
覆盖概率的分解与转移：证明 $P(\tau \notin CI_{union}) \le \sum_b P(\tau \notin CI^{(b)})$。关键在于处理当$\hat{G}^{(b)} \neq G_0$时$\tau_{\hat{G}^{(b)}} \neq \tau$的问题。
相合性桥接：利用PC算法的相合性，证明当$n \to \infty$时，重抽样选出正确图$G_0$的概率趋于1，此时$\tau_{\hat{G}^{(b)}} = \tau$，且错误图对应的区间在渐近意义下不会破坏并集的整体覆盖保证。
最关键的技巧性引理或"跳跃点"：重抽样扰动与并集的交互作用。单纯对同一数据选出的单图做推断无法处理泛函错配；引入随机扰动使得选图过程具有"遍历性"，结合并集操作，使得即使有限样本下选错图，只要扰动生成了包含正确调整集的图，并集就能覆盖$\tau$。
数学工具评价：是经典PoSI思想（Berk et al., 2013的并集覆盖）与因果发现算法特性的巧妙组合。并非全新分析框架，但成功将"Union over possible models"迁移到了具有复杂依赖结构的图搜索空间中。

五、与研究者兴趣的关联¶

连接到哪个子方向：Post-selection inference in causal inference（处理调整集/图结构不确定性的假设检验与区间估计）。
可借鉴的核心思路或技术工具："Resampling and screening + Union CI"框架。在处理高维/图结构不确定性时，若选择过程可能导致识别泛函错配，可通过引入随机扰动生成多个选择结果，对每个结果构建区间再取并集，从而对固定的因果参数提供有效推断。这一思路可迁移至工具变量选择、混杂选择等场景。
值得精读的关键参考文献：
Berk, R. et al. (2013). "Valid post-selection inference". Annals of Statistics. - PoSI并集覆盖思想的源头，理解本文推断逻辑的基石。
Lee, J. D. et al. (2016). "Exact post-selection inference, with application to the lasso". Annals of Statistics. - 对比Selective inference（条件推断）与本文Unconditional inference（无条件推断）的根本区别。

六、延伸思考与练习¶

假设扰动：若放宽"忠实性假设"（即允许偶然抵消导致条件独立），总体真实图不再唯一，此时固定的总体因果效应$\tau$可能随等价图变化。结论会如何变化？技术上需要定义新的目标参数（如所有等价图下效应的集合），并构造覆盖该集合的置信带，可能需要引入partial identification的数学工具。
开放问题：如何缩小并集置信区间的宽度？当前取并集可能过于保守。能否结合图空间的先验概率或重抽样选出特定图的概率，对并集进行加权或修剪，同时保持覆盖保证？
理解检测题：假设在某次重抽样中，PC算法选出了一个错误的图$\hat{G}^$，使得基于$\hat{G}^$的调整集计算的效应泛函极限$\tau_{\hat{G}^} \neq \tau$。请解释：为什么基于$\hat{G}^$构建的单个置信区间$CI^*$在渐近下无法覆盖$\tau$，但本文的并集置信区间$CI_{union}$仍能在渐近意义上保证覆盖$\tau$？

Maintained by 陈星宇 · Homepage · Source on GitHub