Confidence intervals for causal effects in sequential decision making¶
作者: Vladimir Vovk, Ruodu Wang
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.25687
一、核心问题与贡献¶
①研究了在 back-door 与 front-door 准则适用时,因果效应(如 ATE)的置信区间与置信序列构造问题,设定从标准 IID 延伸到干预依赖历史数据的序贯决策场景。②核心工具是基于 Hoeffding 不等式与重对数律(LIL)的区间算术,将因果效应的识别表达式视为多元多项式,对其每个构成概率分别构造置信区间并利用区间算术聚合。③主要贡献是给出了三种设定(IID、固定 horizon 的 adaptive、anytime-valid adaptive)下因果效应置信区间半宽度的精确有限样本界,明确量化了 adaptivity 与序贯性带来的 LIL 项推断精度代价。
二、基础设定¶
- 核心概念与符号:
- \(P(y|do(\tilde{x}))\):基于 back-door (式2) 或 front-door (式4) 准则定义的因果效应。
- \(\#_{xy}\) 等:频数记号,如 \(\#_{\tilde{x}yz} = |\{n \in [N] : (X_n, Y_n, Z_n) = (\tilde{x}, y, z)\}|\)。
- \(\hat{p}\):标准频率估计(如 \(\hat{p}(y|\tilde{x}, z) = \#_{\tilde{x}yz} / \#_{\tilde{x}z}\))。
- \(\hat{\hat{p}}\):截断至 \(T_{\#_{\tilde{x}z}}^U\)(最大 \(2^k \le \#_{\tilde{x}z}\))的频率估计,仅使用前半段数据以消除 adaptivity 带来的依赖性。
- \(T_n^U\):最大满足 \(2^k \le n\) 的整数,用于 LIL 界中的离散时间缩放。
-
区间算术:\(a \pm \Delta a\) 表示 \([a-\Delta a, a+\Delta a] \cap [0,1]\),Lemma 11 给出加法与乘法下误差的线性可加性。
-
关键假设:
- 有限离散变量空间:\(X, Y, Z\) 均取值于有限集。统计学含义:使得因果效应可表示为有限个概率参数的多元多项式,从而适用区间算术与 Bonferroni 校正;与已有文献(常假设连续或高维)相比,这是为了获得精确有限样本界而做出的强化假设。
- DAG 因果结构已知且满足 back-door/front-door 准则:隐含了因果可识别性假设。与标准因果推断文献一致,但本文不处理不可识别或需一般化识别公式(如含除法的 napkin graph)的情况。
-
Adaptive 设定下的条件独立性(强解释):\(Z_n\) 独立于过去,\(Y_n\) 仅依赖于 \((X_n, Z_n)\) 且独立于过去,但 \(X_{n+1}\) 可依赖全部历史。统计学含义:干预机制的 adaptivity 仅影响 \(X\) 的生成,不破坏 \(Z\) 的 IID 性与 \(Y\) 的条件 IID 性;这是对标准 IID 假设的精准放宽,仅在最关键的决策节点引入依赖。
-
问题背景:已有因果效应推断方法多依赖 IID 假设与渐近正态性(如半参数有效估计),无法处理序贯决策中干预依赖历史的设定,且缺乏有限样本保证。最相关文献 Vovk (1996) 给出了渐近结果但无有限样本界;Vovk & Wang (2026) 基于 e-value 处理了预测集但难以直接推广至强解释的 adaptive 设定。本文用纯测度论概率(Hoeffding + LIL)替代 e-value/betting 框架,填补了 adaptive 因果推断有限样本界的空白。
三、主要定理 / 核心结果¶
- Theorem 1 (IID Back-door CI):
- 原文陈述:\(P(y|do(\tilde{x}))\) 的 \((1-\delta)\)-CI 中点为 \(\sum_z \hat{p}(y|\tilde{x},z)\hat{p}(z)\),半宽为 \(|Z|\sqrt{\frac{\ln 4|Z|/\delta}{2N}} + \sum_z \sqrt{\frac{\ln 4|Z|/\delta}{2\#_{\tilde{x}z}}}\)。
- 直观解释:因果效应是概率参数的线性组合,半宽是各参数 Hoeffding 界
Maintained by 陈星宇 · Homepage · Source on GitHub