Confidence intervals for causal effects in sequential decision making¶

作者: Vladimir Vovk, Ruodu Wang
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.25687

一、核心问题与贡献¶

①研究了在 back-door 与 front-door 准则适用时，因果效应（如 ATE）的置信区间与置信序列构造问题，设定从标准 IID 延伸到干预依赖历史数据的序贯决策场景。②核心工具是基于 Hoeffding 不等式与重对数律（LIL）的区间算术，将因果效应的识别表达式视为多元多项式，对其每个构成概率分别构造置信区间并利用区间算术聚合。③主要贡献是给出了三种设定（IID、固定 horizon 的 adaptive、anytime-valid adaptive）下因果效应置信区间半宽度的精确有限样本界，明确量化了 adaptivity 与序贯性带来的 LIL 项推断精度代价。

二、基础设定¶

核心概念与符号：
\(P(y|do(\tilde{x}))\)：基于 back-door (式2) 或 front-door (式4) 准则定义的因果效应。
\(\#_{xy}\) 等：频数记号，如 \(\#_{\tilde{x}yz} = |\{n \in [N] : (X_n, Y_n, Z_n) = (\tilde{x}, y, z)\}|\)。
\(\hat{p}\)：标准频率估计（如 \(\hat{p}(y|\tilde{x}, z) = \#_{\tilde{x}yz} / \#_{\tilde{x}z}\)）。
\(\hat{\hat{p}}\)：截断至 \(T_{\#_{\tilde{x}z}}^U\)（最大 \(2^k \le \#_{\tilde{x}z}\)）的频率估计，仅使用前半段数据以消除 adaptivity 带来的依赖性。
\(T_n^U\)：最大满足 \(2^k \le n\) 的整数，用于 LIL 界中的离散时间缩放。
区间算术：\(a \pm \Delta a\) 表示 \([a-\Delta a, a+\Delta a] \cap [0,1]\)，Lemma 11 给出加法与乘法下误差的线性可加性。
关键假设：
有限离散变量空间：\(X, Y, Z\) 均取值于有限集。统计学含义：使得因果效应可表示为有限个概率参数的多元多项式，从而适用区间算术与 Bonferroni 校正；与已有文献（常假设连续或高维）相比，这是为了获得精确有限样本界而做出的强化假设。
DAG 因果结构已知且满足 back-door/front-door 准则：隐含了因果可识别性假设。与标准因果推断文献一致，但本文不处理不可识别或需一般化识别公式（如含除法的 napkin graph）的情况。
Adaptive 设定下的条件独立性（强解释）：\(Z_n\) 独立于过去，\(Y_n\) 仅依赖于 \((X_n, Z_n)\) 且独立于过去，但 \(X_{n+1}\) 可依赖全部历史。统计学含义：干预机制的 adaptivity 仅影响 \(X\) 的生成，不破坏 \(Z\) 的 IID 性与 \(Y\) 的条件 IID 性；这是对标准 IID 假设的精准放宽，仅在最关键的决策节点引入依赖。
问题背景：已有因果效应推断方法多依赖 IID 假设与渐近正态性（如半参数有效估计），无法处理序贯决策中干预依赖历史的设定，且缺乏有限样本保证。最相关文献 Vovk (1996) 给出了渐近结果但无有限样本界；Vovk & Wang (2026) 基于 e-value 处理了预测集但难以直接推广至强解释的 adaptive 设定。本文用纯测度论概率（Hoeffding + LIL）替代 e-value/betting 框架，填补了 adaptive 因果推断有限样本界的空白。

三、主要定理 / 核心结果¶

Theorem 1 (IID Back-door CI)：
原文陈述：\(P(y|do(\tilde{x}))\) 的 \((1-\delta)\)-CI 中点为 \(\sum_z \hat{p}(y|\tilde{x},z)\hat{p}(z)\)，半宽为 \(|Z|\sqrt{\frac{\ln 4|Z|/\delta}{2N}} + \sum_z \sqrt{\frac{\ln 4|Z|/\delta}{2\#_{\tilde{x}z}}}\)。
直观解释：因果效应是概率参数的线性组合，半宽是各参数 Hoeffding 界

Maintained by 陈星宇 · Homepage · Source on GitHub

Confidence intervals for causal effects in sequential decision making¶

一、核心问题与贡献¶

二、基础设定¶

三、主要定理 / 核心结果¶

评论