Policy relevance of causal quantities in networks¶

讲者: Dean Eckles
来源: OCIS (Online Causal Inference Seminar)
日期: 2026-03-10
主题: 因果推断
视频: https://youtu.be/pBhOtOhKEtc · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

相关论文¶

2507.14391 （尚未精读 — talks read --id … --read-papers 可补）

一、这场报告在讲哪条工作线¶

方向：网络干扰下的因果 estimand 选择——因果解释与政策相关性的张力。

在因果推断中，“无干扰”（SUTVA）是一个基本假设。然而，在实际的社会网络、邻居效应、传染病等场景中，一个单元的结果往往受到其他单元处理状态的影响——这就是“干扰”（interference）。这个方向的核心问题一直是：在这种干扰下，我们应该关注何种因果量（estimand）？

早期基础与主流路线：在干扰存在的设定下，一个常用的技术是暴露映射（exposure map / exposure mapping），即把全局的处理分配向量 Z ∈ {0,1}^n 粗化为每个单元的一个低维“暴露”（如“自己是否被处理 + 有几个被处理的邻居”）。这一思想被 Aronow & Samii (2017, Annals of Applied Statistics) 系统化，但其前身可追溯到 Hudgens & Halloran (2008) 的两阶段随机化框架，以及 Manski (2013) 关于社会交互作用的识别讨论。利用暴露映射，研究者可以定义诸如“直接效应”（自己的处理）、“间接效应/溢出效应”（邻居的处理）等 estimand —— 这些 estimand 构成了主流文献中描述网络干预效果的基本语言。
当前的张力与这篇报告的位置：上述暴露映射定义的 estimand（报告称为“平均焦点期望结果”，AFEO）有一个天然的优点：它们通常可以被解释为单元级因果效应的加权平均（即具有“unit-level causal interpretation”）。但一个问题逐渐浮现：这些 estimand 是否对“政策选择”有用？ 即，给定一个政策空间（如选择多大比例的人接受处理），我们是否需要知道这些 AFEO 才能选出最优政策？此前有文献（如 Auerbach et al. 的一篇评注）已指出暴露效应在“无强假设”下对社会政策选择不直接有用。而 Eckles 和 Loomba 的这篇工作，从理论逻辑上证明了更强的结论：即使暴露映射完全正确（correctly specified），AFEO 通常也不足以（insufficient for）识别最优政策。原因在于，即使是像“均匀伯努利（homogeneous Bernoulli）”这样简单的同质处理分配政策，也会在具有不同网络结构的单元间诱导出异质的暴露分布——而 AFEO 无法捕捉这种异质性，从而无法预测政策变化后实际的平均福利。
关键已知工作（基于幻灯片确认）：
- Aronow & Samii (2017)：提出并详尽阐述了基于暴露映射的估计框架。
- Cai et al. (2015, AER)：中国农村气候保险推广实验，被用作应用的典型例子，其中暴露映射（邻居中接受密集推广的人数）被用来量化溢出效应。
- Lee et al. (202x)：移动数据套餐推广的随机化座位实验，也是分析中使用的例子。
报告的核心主张：在干扰环境下，研究者常常面对一个两难选择——“单元级因果可解释性”（unit-level causal interpretation）与“政策选择充足性”（sufficiency for policy choice）不可兼得。报告主张，应更多地关注期望平均结果（Expected Average Outcome, EAO）（或在扣除成本后即功利福利），因其同时具备这两个属性，是连接因果推断与政策决策的最直接 estimand。

二、最小内核 / 一个最简例子¶

为了看清报告的核心思想，我们构造一个可能最简单的网络与暴露映射。

符号定义： - N = 3 个节点，构成一条链：1 — 2 — 3。 - Z ∈ {0,1}³：全局处理分配向量。 - Yi(Z)：单元 i 在全局分配 Z 下的潜在结果（干扰存在，所以 Yi 可能依赖于所有 Zj）。 - 暴露映射 d_i(Z)：假设我们关心的是“自己处理与否 + 邻居中处理的人数”。对链图： - d_i ∈ { (0,0), (0,1), (0,2), (1,0), (1,1), (1,2) } —— 但注意在链上，节点 1 和 3 最多只有一个邻居，所以实际可达的暴露有限。 - 单位级因果效应：如“将节点 i 暴露从 (0,0) 变为 (1,0)”的个体效应。

一个关键的“直觉”例子（基于幻灯片与转写中 biclique 例子的精神）:

假设我们只考虑一个简单的暴露映射：d_i(Z) = 自己是否处理 (Zi) ，并赋值为二元（0/1）。那么，在没有干扰时，这就是标准的 ATE。

现在引入干扰。假设暴露映射扩展为：d_i(Z) = (Zi, 邻居中处理人数)。但我们真正关心的是一个均匀伯努利政策 π(p)：每个单元独立地以概率 p 被分配处理。在此政策下，期望平均福利是： EAO(p) = Eπ(p) [ (1/N) Σ_i Yi(Z) ]

现在来看平均焦点期望结果 (Average Focal Expected Outcome, AFEO)——这是报告批评的主要对象。FAEO 的定义是：对每一个可能的暴露值 d，我们计算「先对每个单元，在其落入暴露 d 的所有 Z 上取期望结果」；再对所有满足该暴露的单元取平均。例如，AFEO(暴露 = (1, [至少一个邻居被处理])):
- 先对每个单元 i，考虑所有 Z 中使 Zi=1 且至少一个邻居被处理的，计算期望 E[Yi(Z) | Zi=1, 至少一个邻居被处理]。 - 然后对满足该暴露的所有单元取平均。

现在报告的核心论点通过这个例子变得清晰： 1. AFEO 有单元级因果解释：AFEO(d) 之间的对比（如对比暴露 (1,0) 和 (0,0)）可以被视为一个加权平均的单元级因果效应——这是它的“好”性质。 2. AFEO 不足以识别最优政策（即使暴露映射正确）：假设我们观测到的 AFEO 显示，单元在“恰好有 1 个被处理邻居”时，平均结果最好。但这并不意味着我们应该把“每个单元都恰好有一个被处理邻居”作为目标——因为这在大多数网络中不可行（如把链中间节点2强制设为只有一个被处理邻居，意味着必须精准控制其两个邻居中的一个——这与均匀伯努利政策相悖）。更关键地，即使我们只在不同 p 的均匀伯努利政策间做选择，AFEO 也无法唯一确定 EAO(p)。为什么呢？因为 AFEO 对不同单元 在相同的暴露标签下取了期望，但抹去了单元的特性（如度） ，而均匀伯努利政策会使得不同度的单元以不同的概率落入特定暴露。因此，两组不同的真实数据生成过程（比如度 2 的单元 vs 度 3 的单元对暴露的响应完全不同）可以产生完全一样的 AFEO，但会产生完全不同的 EAO(p) 曲线。从 AFEO 我们无法区分这两种情况，也就无法选择最优 p。

EAO 解决了这个问题：EAO(p) 直接对政策 π(p) 下的平均结果求期望，它是关于 p 的确定性函数。一旦知道了 EAO(p)（或能估计它），我们就可以通过最大化 EAO(p) - cost(p) 来选择最优 p。

总结： - 一个最简的三节点链（或报告中的 biclique）网络，配合一个简单的暴露映射（如邻居处理人数），就足以展示京核矛盾：AFEO 有因果解释但政策信息不足，EAO 政策信息充足但（通常情况下）缺乏直接的单元级因果解释。二者不能兼得。

三、报告主体：讲者讲了什么¶

[0:00-0:05] 开场与提醒 - 讲者 Dean Eckles，合作者 Sahil Loomba（Imperial College London & MIT）。 - 提醒：NetSci 2026 相关工作坊的扩展摘要当天截止。

[0:05-0:15] 动机：无干扰下 ATE 的两个好性质 - 重温无干扰下 ATE 的核心地位。 - 两个好性质：(1) 是单元级因果效应的汇总（对个体效应 Yi(1)-Yi(0) 取平均）；(2) 在某些条件下可被用于政策选择（如 sign(ATE) 决定是否全面推广，或利用 ATE 结合成本函数选择最优伯努利比例）。

[0:15-0:25] 问题设定：网络干扰下的困境 - 在干扰存在时，潜在结果表是 n 行 × 2^n 列的，我们只观测到一列。 - 这个报告聚焦于 做定义（定义 estimand），而非估计与推断：即使我们知道了整张表，如何压缩？

[0:25-0:35] 主流方案：暴露映射（Exposure Map）与 AFEO - 暴露映射 d_i(Z)：把全局 Z 粗化为一个“剂量”（如邻居处理人数）。正确地指定暴露映射意味着它定义了结果函数的位集（level sets）。 - 核心参考：Aronow & Samii (2017)。 - 由此可定义 平均焦点期望结果 (AFEO)：AFEO(d) = 对单元取平均后的「在指定暴露 d 下的期望结果」。AFEO 被视为“剂量-响应曲线”。 - 授课式例子：Cai et al. (2015) 的农村保险实验——分析邻居被“密集推广”人数对保险采纳的影响。以及 Lee et al. 的移动数据实验。

[0:35-0:45] 核心宣示：AFEO 虽有好性质，但不足以用于政策选择——即使暴露映射完全正确 - 单元级因果可解释性（Unit-level Causal Interpretation）：讲者定义了一个清晰的“因果汇总”标准：一个 estimand 如果是单元级因果效应的加权组合（如 ATE），则称其具有该性质。AFEO 之间的对比满足这一性质（在一定的正则条件下）。 - 但问题在于“政策选择充分性（Sufficiency for Policy Choice）”： - 定义：一组 estimand 是政策充分的，当且仅当存在一个已知函数（不依赖于潜在结果表），能从这些 estimand 的值直接选出最优政策（功利福利下的 expected welfare）。 - 宣示：AFEO 通常不满足这一性质。 - 为什么？通过一个直觉例子阐述：在一个 2-cliques 构成的网络中，不同度的节点（度 2 与度 3）在统一伯努利政策 π(p) 下，落入特定暴露（如有“恰好一个被处理邻居”）的概率不同（即暴露分布异质）。因此，即使暴露映射完全正确，并且我们知道了每个暴露下的 AFEO，不同的真实单元级响应模式（哪个度群体对“恰好一个被处理邻居”响应最强）可以生成完全相同的 AFEO 但导致完全不同的 EAO(p) 曲线。 - 关键点：AFEO 只告诉我们“在暴露 d 下的平均结果”，但不告诉我们当政策改变时，哪些单元会改变到哪组暴露——这需要知道单元度或其他协变量的分布。而均匀伯努利政策本身诱导了异质暴露。因此，AFEO 不足以为政策优化提供足够信息。

[0:45-1:05] 技术拓展与界定：反向次序的 estimand——EFAO - 讲者进一步定义 期望焦点平均结果 (Expected Focal Average Outcome, EFAO)：先在一个特定 Z 下对所有焦点单元（如“被处理单元”）平均，再对政策 π 取期望。这是 AFEO 的“次序互换”版本。 - EFAO 的困境：EFAO 对政策选择更有用吗？不，EFAO 通常缺乏单元级因果解释（不同政策下组成焦点组的单元在变化）。 - 结论：AFEO 与 EFAO 通常不交换（do not commute）——它们仅当焦点映射 F 对所有单元是确定的（即 F ≡ 1，找所有单元）时才相等，而这正是 EAO。

[1:05-1:12] 总结与讨论 - 重申核心张力：有因果解释的（AFEO）政策信息不足；政策相关的（EAO）缺乏直接的因果汇总特性。 - 号召：应给予 EAO（期望平均结果）更多的关注和直接的估计工作。 - 讨论嘉宾（Molly Offer-West）补充了另一个视角：AFEO 与 EFAO 的对比可被理解为“先平均单元再平均分配” vs “先平均分配再平均单元”。并指出，从一个实验设计（设计会唯一确定 AFEO）迁移到另一个政策分布，本质上是一种分布外推（transport）问题。

四、对应论文与开放问题¶

对应论文（基于幻灯片与转写确认）： - Loomba, S., & Eckles, D. (2025). Policy relevance of causal quantities in networks. arXiv:2507.14391. （讲者强调刚发布了新版本）

报告留下的开放问题与可能的后续方向（基于转写内容，直接引用出处）：

[0:51-0:53 — Molly Offer-West 讨论部分] “从 AFEO 到最优政策选择的分布外推 (transport)”。 既然从实验设计下估计的 AFEO 无法直接用于预测另一个政策下的 EAO，这本质上是一个分布迁移（transportability）或处理变量下的_composition_ learning 问题。开放问题：是否存在一种引进了辅助协变量（如度、中心性）的估计策略，使得我们可以从实验设计下识别/估计出 AFEO，并利用这些协变量调整到新政策，从而实现政策充分？这与 Proximal Causal Inference 或半参数传输理论有何联系？
[0:50-0:55] 边界（bounds）的分析与改进。讲者展示了利用 AFEO 可计算 EAO 在分布上的一些边界（bounds）。但这些边界在实践中有多紧？对于常见的网络结构（朋友网络、稀疏图），这些边界是否窄到足以支持政策决策？开放问题：能否结合网络结构信息（如聚类系数、度分布）给出更紧的 sharp bounds？这些边界在有限样本下的估计与推断问题是什么？
[1:10-1:12] 当暴露映射（exposure map）本身是 misspecified 时，情况如何？ 讲者承认正确指定的假设对因果解释有帮助，但核心不充分性是在正确指定下依然成立。开放问题：当暴露映射 misspecified 时，AFEO 是否还具有任何（有限的）政策信息价值？或者，是否存在一个“稳健的” AFEO 类，对 misspecification 不敏感却仍保持一定的政策相关性？这导向了高维/半参数因果推断中的“双稳健”或“Neyman-orthogonal”估计思想。
[1:05-1:08] Policy Learning 的直接视角。报告暗示 EAO 是真正需要直接估计与比较的对象。开放问题：在具有干扰的大型网络实验中，我们能否设计直接以 EAO 为目标的实验（如“平均处理效应最近”的估计），并发展相应的有限样本学习理论（类似“最优政策学习”文献中的 regret bound）？这与现有的侧重于暴露效应估计的实验设计有何不同？
[0:48-0:50] AFEO 是否“总是”有单元级因果解释？ 讲者定义了一个严格的“单元级因果汇总”标准（凸组合形式）。但即使满足这个标准，AFEO 的因果解释也是反事实（counterfactual） 的情景：它描述的是“如果我们（通过某种无法直接从实验中复制的干预）强制所有经历暴露 d 的单元同时维持那个暴露”，但如何实现这样的个体干预（如强制一个人恰好有一个被处理邻居）与处理分配的约束冲突。开放问题：能否找到一个更精细的因果框架（如“allowable transformations”或“causal mechanisms”），使得 AFEO 的因果解释力更强，而不仅仅是形式上的凸组合？这联系到“因果机制（机制因果）与分配非混乱性（stochastic interference）”的概念。

Maintained by 陈星宇 · Homepage · Source on GitHub