Causal inference with spatio-temporal data: estimating the effects of airstrikes on insurgent violence in Iraq¶

讲者: Georgia Papadogeorgou and Lihua Lei
来源: OCIS (Online Causal Inference Seminar)
日期: 2020-07-28
主题: 因果推断
视频: https://www.youtube.com/watch?v=Tvm3fFYVroo · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

相关论文¶

2006.06138 （尚未精读 — talks read --id … --read-papers 可补）

一、这场报告在讲哪条工作线¶

这场报告实际由两个独立演讲组成，分别对应两条不同的工作线：前后各 30 分钟。

第一部分（讲者：Georgia Papadogeorgou）——时空点过程数据的因果推断

子方向： 空间-时间因果推断，特别是当处理变量和结果变量都表现为空间点模式（点过程）时的因果效应识别与估计。这个方向追问的是：如何在连续空间和时间上定义“一个点模式处理”对一个“点模式结果”的因果效应，并允许不受限制的空间溢出和时间传递效应。
奠基与主流路线：
1. 传统做法是任意空间离散化（如把伊拉克地图分成格子/行政区），然后用面板数据或 DID 方法，但离散化方案影响结果且忽略空间连续性（Kocher et al., 2011；Dell and Querubin, 2018）。
2. 另一派假设参数化的空间溢出模式（如距离衰减函数）。
3. 在因果推断方法论一端，关于随机干预（stochastic intervention）的文献已较成熟——不对比“全体处理 vs. 全体控制”，而对比“处理来自分布 F vs. 来自分布 G”（Díaz Muñoz and van der Laan, 2012；Young et al., 2014；Lok, 2016；Kennedy, 2019）。
这场报告的站位： 首次将随机干预框架、点过程建模（非齐次泊松过程）与空间核平滑结合起来，用于连续空间、连续时间、点模式处理与点模式结果，并在处理后不做空间离散化、不预设溢出距离衰减形状。完全放开空间溢出和时间传递的结构。应用层面的独特之处在于：数据来自伊拉克战争（2007-2008 年美空军解密的每日空袭与叛乱袭击位置），这是政治学/军事冲突研究的核心实证问题。

第二部分（讲者：Lihua Lei）—— 个体处理效应（ITE）的共形推断

子方向： 个体处理效应的不确定性量化。已知 CATE 的置信区间方法众多（因果森林、BART、X-learner 等），但直接为 ITE（Y₁ - Y₀）构造有限样本、无需渐近假设的区间估计仍是一个缺口。困难在于 ITE 包含两个潜在结果之差，而两者之间的相关性完全不可识别。
奠基与主流路线：
1. CATE 估计方法：因果森林（Wager and Athey, 2018），BART（Chipman et al., 2010），X-learner（Künzel et al., 2019）等。这些方法对 ITE 的覆盖性质一般无理论保证。
2. 共形推断（Conformal inference）：由 Vovk 等（1990s）提出，是一种不依赖于分布的有限样本预测区间构造方法，但要求数据可交换（i.i.d. 或交换性假设）。在协变量漂移（covariate shift）下的加权共形推断由 Barber/Candès/Tibshirani（2019）发展。
3. 分位数回归（Quantile regression）与共形推断结合（split conformal quantile regression, Romano et al., 2019）。
这场报告的站位： 将加权分位回归共形推断（weighted split CQR）应用于反事实推断，解决了随机试验（已知倾向分）下 ITE 区间的有限样本精确覆盖问题，以及在观察性研究下的双重稳健性——倾向分或条件分位数的准确估计之一即可保证近似覆盖。方法层面上强调黑箱相容性——任何分位数回归方法都可直接嵌入并保持区间有效性，覆盖性质不依赖分位数估计的准确性（只要权重已知）。

二、最小内核 / 一个最简例子¶

第一部分（Georgia Papadogeorgou）

可观测数据： 时间 t = 1, …, T（T = 约 500 天）。空间 Ω = 伊拉克境内所有点。每天 t，我们观测一套处理点（空袭坐标）和一套结果点（叛乱袭击坐标）。还可能有随时间变化的协变量 X_t（如过去暴力水平、人口密度等——幻灯片提及但具体哪些未明说）。
潜在结果（不可观测量）： 对每一个可能的处理历史 w̄_T = (w₁, …, w_T)，每个点 s 在时间 t 有一个潜在的二元结果 Y_t(s; w̄_T)。观测到的结果是真实处理历史下的潜在结果 Y_t(s) = Y_t(s; W̄_T)。
因果 estimand： 不是 ATE，而是随机干预下的期望结果数量。给定一个假设的处理分布 F_h（非齐次泊松过程，强度函数 h(ω)），定义
\[\bar{N}_B(F_h) = \frac{1}{T} \sum_{t=1}^{T} \mathbb{E} \left[ N_B(Y_t(W^{t-1}, w_t)) \mid F_h \right]\]
其中 N_B(·) 是区域 B 内的结果事件计数。因果效应比较两个不同随机干预：τ_B(F_{h'}, F_{h''}) = \bar{N}B(F{h''}) - \bar{N}B(F{h'})。
最简特例（d=1，即只在单个时间点 t 干预，且只关心区域 B）：
- 设定：一天 t，只看一个区域 B（如巴格达市）。处理分布 F_h 是一个强度函数 h(ω) 的泊松过程（例如在整个伊拉克上空均匀抛撒空袭，总日均数为 3）。结果 Y_t 是当天 B 内叛乱袭击的点模式。
- 核心思想：对每个 Ω 中的点 ω，用空间核平滑将离散的袭击点“摊成”连续的风险表面，然后用IPW 权重 f_h(W_t)/e_t(W_t) 将观测到的风险表面重新加权，使其反映在假设分布 F_h 下本应出现的期望结果表面。对整个 B 积分即得估计 \hat{N}_B(F_h)。
- 这个特例忽略了时间传递；但在原设定中，历史 W^{t-1} 会被控制（unconfoundedness 假设的条件包含过去所有观测）。

第二部分（Lihua Lei）

可观测数据： (X_i, T_i, Y_i), i = 1, …, n。X 是协变量，T ∈ {0, 1} 是处理，Y 是观测结果。
潜在结果（不可观测量）： Y(0), Y(1)。观测 Y = T·Y(1) + (1-T)·Y(0)。个体处理效应 ITE = Y(1) - Y(0)。
因果 estimand： 对每个个体 i，一个区间估计 Ĉ(X_i) 满足 P(ITE_i ∈ Ĉ(X_i)) ≥ 1-α。
最简特例（二值处理、随机试验）：
- 已知倾向分 e(x) = P(T=1|X=x) = 0.5（完全随机）。
- 假设我们把问题简化为只推断缺失的反事实 Y(1)（对控制组个体而言）。观测数据来自控制组（T=0）：(X_i, Y_i(0))，即红分布。目标分布是全体人群的 X 边际与处理组 Y(1) 的条件分布：p(X) × p(Y(1)|X) = p(X) × p(Y|X, T=1)（由于强可忽略性）。所以这是一个协变量漂移问题：训练-校准来自 p(X|T=0)，预测目标来自 p(X)。
- 共形推断思路：将校准组内每个样本的符号距离（sign distance——从点到估计的条件分位数包络的带符号最近距离）用权重 w_i = (1 - e(X_i))/e(X_i) 重新加权，得到一个加权经验分布。取该分布的 (1-α) 分位数作为区间半径。若倾向分已知，区间覆盖在有限样本中精确≥ 1-α，与分位数回归的质量无关。

三、报告主体：讲者讲了什么¶

第一部分（Georgia Papadogeorgou）¶

[0:01:45 – 0:05:55] 动机与挑战： 介绍伊拉克战争空袭效果争议。说明目前文献两大缺陷：任意空间离散化 + 预设溢出/传递函数。提出本工作的三个方法论挑战：空间溢出、时间传递、无穷多可能处理/结果位置。
[0:05:55 – 0:11:57] 设置与符号： 严格定义点模式处理 W_t(s) 和结果 Y_t(s)，引入潜在结果 Y_t(w̄_t) 和观测一致性。时间可变协变量 X_t 也用类似上划线记法。此处关键：处理集 和 结果集 是有限点集，但潜在结果对任意可能的处理历史（无限多种）都有定义——这是点过程因果推断本质难点。
[0:11:57 – 0:17:17] 随机干预与 estimands： 详细介绍非齐次泊松过程 h(ω) 作为随机干预的生成机制。定义 B 区域期望结果数量 \bar{N}B(F_h) 和因果效应 τ_B(F{h'}, F_{h''})。展示三个例子：(i) 改变剂量（保持空间分布不变）；(ii) 改变空间分布（保持总剂量不变）；(iii) 多时间窗口干预（滞后效应）。 [幻灯片 6-8]
[0:17:17 – 0:21:50] 假设与估计量：
- Unconfoundedness：W_t ⊥ {Y_T, X_T} | W^{t-1}, Y^{t-1}, X^{t}（非预期性，类似 Bojinov and Shephard 2019）。定义倾向得分 e_t(w) = f(w | 观测历史)。
- Overlap：e_t(w) > δ·f_h(w) 对所有 w ∈ W。要求任何在随机干预下可能出现的处理模式在真实世界中也非零概率出现。
- 估计量（[0:19:01 – 0:21:50]）：
  \[\hat{Y}_t(F_h; \omega) = \frac{f_h(W_t)}{e_t(W_t)} \sum_{s \in S_{Y_t}} K_b(||\omega - s||)\]
  分子：处理密度比 IPW 权重；分母：核平滑结果表面。对 ω 在 B 上积分得 \hat{N}_{Bt}(F_h)；时间平均得 \hat{N}_B(F_h)。给出方差上界的一致估计（非贝叶斯，bootstrap 式或似 sandwich 公式——口语未明确，【幻灯片第 10 页】称“consistent estimator for variance upper bound”）。
[0:21:50 – 0:29:20] 实证应用与结果：
- 使用 2006 年空袭数据做核平滑得到基础空间分布 φ₀。
- 研究问题 1：剂量效应（从日均 1 → 6 次空袭，保持分布等比例放大）。主要发现：增加空袭持续 3/7/30 天后，叛乱袭击显著增加（而非减少），集中在巴格达-摩苏尔走廊。7 天干预导致约 +10 起 IED 袭击和 +16 起小规模交火（相对日均 30 起，增幅 33–50%）。U 形图，说明滞后峰值约在 7 天。
- 研究问题 2：空间重分配效应（保持总次数不变，更集中于巴格达）。发现：巴格达叛乱减少，但摩苏尔（约 400 公里外）袭击显著增加——这是非结构化空间溢出效应的强证据，传统空间计量模型无法发现。
[0:28:58 – 0:29:20] 未来工作： 纳入平民伤亡作为中介变量，比较空袭与替代战略。

第二部分（Lihua Lei）¶

[0:30:44 – 0:33:42] 问题陈述： 介绍 ITE 及为何 CATE 不足（同一 CATE 下三种不同个体异质性→不同决策）。提出三个假设：超总体、SUTVA、强可忽略性。
[0:33:42 – 0:38:20] 核心约化： ITE 推断 ≈ 反事实推断（只缺一个潜在结果）。利用强可忽略性，问题转化为“协变量漂移”下的预测区间：控制组提供 p(X|T=0) × p(Y(0)|X)；目标为 p(X) × p(Y(0)|X)。权重 w = (1-e(X))/e(X)。
[0:38:20 – 0:42:30] 方法：加权分裂分位回归共形推断（Weighted Split CQR）：
- 第一步：随机分割数据为训练 / 校准集。
- 第二步：在训练集拟合 Y(1) 的条件分位数 q̂₅(x) 和 q̂₉₅(x)。
- 第三步：对校准集每个点，计算到包络 [q̂₅(x), q̂₉₅(x)] 的符号距离 d_i = 距离内部为负、外部为正。
- 第四步：用权重 w_i = (1 - ê(X_i))/ê(X_i) 加权 d_i 的经验分布，取加权 (1-α) 分位数作为半径 δ̂（α = 0.1）。
- 输出区间：Ĉ(X) = [q̂₅(X) - δ̂(X), q̂₉₅(X) + δ̂(X)]。
- 理论保证：
  1. 若倾向分 e(x) 已知（随机试验），则 P(Y(1) ∈ Ĉ(X)) ≥ 1-α（有限样本、不依赖分位数估计质量）；且上界 ≤ 1-α + O(1/√n × (E[1/(e(X)(1-e(X)))])^{1/2})（需弱重叠条件：E[1/e] < ∞）。
  2. 若倾向分未知但用估计值 ê，则满足双重稳健性质：若 ê 或分位数估计之一良好，覆盖近似控制。
[0:41:44 – 0:45:50] 从反事实到 ITE 的两种策略：
- 朴素 (Naïve)： 分别构造 Ĉ₁(Y(1)) 和 Ĉ₀(Y(0))（各用 1-α/2 覆盖），取差集 [l₁-u₀, u₁-l₀]。通过 Bonferroni 确保 ≥ 1-α，但保守。
- 嵌套 (Nested)： 对数据库中的个体（已知一个潜在结果）先用共形推断得 ITE 区间，然后以这些区间为“伪结果”训练一个从 X 到区间端点的预测模型，再推广到全体人群。更高效（模拟显示保守性大幅降低），但理论保证需二次共形重校准。
[0:46:30 – 0:57:40] 数值评估：
- 模拟设置：Wager & Athey (2018) 的因果森林数据生成变体；Y(0) ≡ 0（简化 ITE → 反事实推断）；X 维度 10 或 100；同/异方差；独立/相关特征。倾向分已知？不，都用随机森林估计。
- 比较方法：因果森林（RF+Jackknife）、X-learner（RF+Bootstrap）、BART（贝叶斯后验→可信区间转预测区间）、自己的方法（加权 split CQR + 黑箱核）。
- 关键结果：
  - CATE 覆盖：所有比较方法在部分场景严重欠覆盖（尤其 d=100），自己的方法偏保守（因目标不同）。
  - ITE 覆盖：比较方法中 BART 在同方差时完美，异方差欠覆盖；自己的方法在所有场景几乎精确 90%（黑箱选随机森林/梯度提升时）。【[0:52:54] 显示即使 BART 作为黑箱欠覆盖，加权 CQR 围绕 BART 仍能校准至目标覆盖。】
  - 条件覆盖：BART 在条件方差大的子群中欠覆盖严重；自己的方法保持稳健。
- 真实数据模拟：全国学校心智研究数据集 (ACIC 2018)，混合类型协变量 + 异方差。BART ITE 覆盖约 85%，自己的方法约 90%，区间宽度仅延长约 10–15%。
[0:59:06 – 1:02:35] Q&A 关键点：
- 问题：ITE 不可识别性（Y(1) 与 Y(0) 相关性未知）是否影响方法？答：嵌套方法在独立生成潜在结果时表现好；若完美正相关则偏保守，若极端负相关则稍欠覆盖。Bonferroni 朴素方法和二次共形重校准方法可保证保守性（不依赖相关性），但代价是更宽区间。

四、对应论文与开放问题¶

对应论文¶

第一部分（Georgia Papadogeorgou）： - 标题（从转写+幻灯片推测）： "Causal Inference with Spatio-temporal Point Pattern Data: Estimating the Effects of Airstrikes on Insurgent Violence in Iraq" - 合作者（据幻灯片）： Kosuke Imai, Jason Lyall, Fan Li（Fun Li 在 QA 中）。 - arXiv/出版（待核实）： 转写未给出 arXiv 号。根据内容和合作者，这篇很可能发表于政治学方法论或因果推断期刊，如 Journal of the American Statistical Association 或 Political Analysis（需检索确认）。

第二部分（Lihua Lei）： - 对应论文： Lihua Lei, Emmanuel J. Candès. "Conformal Inference of Counterfactuals and Individual Treatment Effects." arXiv: 2006.06138, 2020.（与用户提供的摘要完全一致） - 软件包： R 包 cfcausal（可 GitHub 获取）。[0:48:49]

开放问题（从转写提取，每条附时间戳）¶

[0:28:58 – 0:29:12] Georgia 第一部分：纳入平民伤亡作为中介变量。 如何将中介分析框架引入点过程因果推断？目前她的方法只估计处理→结果的直接效应，但空军可能在意外造成平民伤亡，这可能是抬升叛乱动机的中介通道。中介操作要求的更强干扰性假设在空间连续设置下如何放松？
[0:29:12 – 0:29:20] Georgia 第一部分：比较空袭与替代战略。 随机干预框架可否用于比较“空袭 vs. 地面巡逻 vs. 无人机的不同泊松分布”？这需要为每个替代战略指定一个点过程模型；但各战略同时期不可观测（只有一种战略被实施），比较需要依赖跨时间/跨情景的外推，识别条件更强。
[0:59:06 – 1:02:35] Lei 第二部分 Q&A：如何应对 Y(1) 与 Y(0) 的负相关？ Lei 指出现论文的嵌套方法不保证覆盖当潜在结果反相关时。朴素 Bonferroni 方法保守但宽；二次共形重校准方法保障覆盖但不适合高维时用。问题：是否存在可实际使用且几乎有效的区间构造方法，在不知道相关性的前提下达到接近标称覆盖？
[Lei 在结束时提到 JSM 贡献论文（未在本次报告详细讲）]： 他将在 JSM 2020 有一个扩展，可能涉及更复杂的数据结构或更高的维度。具体内容未给定，但潜在问题是：当协变量维度远大于样本量时，连通共形推断的重加权方差如何控制？

Maintained by 陈星宇 · Homepage · Source on GitHub