Efficient Nonparametric Estimation of Stochastic Policy Effects with Clustered Interference¶

讲者: Michael Hudgens, Chanhwa Lee
来源: OCIS (Online Causal Inference Seminar)
日期: 2023-09-26
主题: 因果推断
视频: https://youtu.be/3Q8yttwn_WI · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

相关论文¶

2212.10959 （尚未精读 — talks read --id … --read-papers 可补）

一、这场报告在讲哪条工作线¶

本报告属于集群干扰下的因果推断这一子方向。该方向追问的是：当个体间存在干扰（interference，即一个人受处理的状况影响着另一个人的结果）时，如何定义、识别和估计因果效应。干扰既可以是直接传染（疫苗接种影响他人感染），也可以是间接溢出（卫生设施改善影响邻居健康）。

奠基与主流路线： - 两阶段随机实验（Hayes et al. 2000, Longini et al. 2002, Sinclair et al. 2012, Basse & Feller 2017）是黄金标准：先随机分配集群到不同分配策略（policies），再在集群内随机分配个体到处理/对照。这在无干扰和可忽略处理的条件下直接给出因果识别。 - 基于观察数据的方法（Tchetgen Tchetgen & VanderWeele 2012; Perez-Heydrich et al. 2014; Liu et al. 2016, 2019）发展了逆概率加权（IPW）和双重稳健（DR）估计量，利用了集群层面的倾向得分。Park & Kang (2022) 证明了其中一个估计量是局部半参数有效的。Chakladar et al. (2022) 将其扩展到右删失结果。 - 然而，这些方法主要针对一种特定的政策——"Type B"政策：即所有个体在反事实下以相同概率独立选择处理（伯努利分布，概率α）。在观察数据中，其他反事实政策可能更相关：比如如果集群内个体间存在处理选择的依赖，Type B便不现实。

当前frontier与本报告的定位： - Papadogeorgou et al. (2019, Biometrics) 和 Barkley et al. (2020, Ann Appl Stat) 提出了参数化"偏移"政策：基于 GLMM 对 A|X 建模，然后偏移系数γ。它们的优点包括：允许集群内处理选择依赖；保持个体倾向得分的排序。缺点是依赖于参数模型是否正确。 - 本报告对应的工作线（Lee, Zeng, Hudgens 2023, arXiv:2212.10959）实现了非参数化：提出了一类不依赖参数模型的随机政策（CIPS 和 TPB），并开发出了相应的非参数有效样本分割估计量。它允许用任意数据自适应方法估计非参数函数，而估计量仍保持 √m 收敛、渐近正态和非参数有效。这是该子方向从参数/半参数向完全非参数的关键一步。

关键文献对照（人名可能有ASR错误，以幻灯片为准）： - 奠基：Tchetgen Tchetgen & VanderWeele (2012) - 参数化偏移政策：Papadogeorgou et al. (2019), Barkley et al. (2020) - 双重稳健/半参数有效方法：Liu et al. (2016, 2019), Park & Kang (2022) - 本报告（非参数）：Lee et al. (2023, arXiv:2212.10959) - 增量倾向得分干预（CIPS灵感来源）：Kennedy (2019, JASA)——但Kennedy的工作不处理集群干扰。

二、最小内核 / 一个最简例子¶

符号与设定： - 有 m 个独立集群（cluster）。对于集群 i，有 N_i 个个体（集群大小）。 - 对于个体 j 在集群 i： - Y_ij：结果变量（标量）。 - A_ij：二元处理（0/1）。 - X_ij：协变量（向量）。 - 集群层面的观测向量：O_i = (Y_i, A_i, X_i, N_i)，其中 Y_i = (Y_i1,...,Y_iN_i)，A_i = (A_i1,...,A_iN_i)，X_i = (X_i1,...,X_iN_i)。 - 潜在结果：Y_ij(a_i) —— 当集群 i 的所有个体按 a_i ∈ {0,1}^{N_i} 接受处理时，个体 j 的结果。允许干扰：Y_ij(a_ij, a_{i(-j)}) 依赖于他人处理。

最简特例：考虑 两个集群（m = 2），每个集群只有 1个个体（N_i = 1）。因此 A_i 是标量 0/1。 - 干扰不存在（因为每个集群只有一个个体），但设定仍允许处理效果在不同集群间不同。 - 我们希望估计一个反事实政策的效果，例如 CIPS 政策（增量倾向得分偏移）： - 观测到的倾向得分（propensity score）：π_i = P(A_i = 1 | X_i, N_i=1)。 - CIPS 政策：反事实下个体接受处理的概率变为 π_i,δ = (δ * π_i) / (δ * π_i + 1 - π_i)，其中 δ 是用户指定的常数（例如 δ = 2，表示处理发生的几率翻倍）。 - 政策 Q 定义：对集群 i，Q(1|X_i, 1) = π_i,δ, Q(0|X_i,1) = 1 - π_i,δ。

目标：该政策的平均潜在结果（期望平均结果）： µ(Q) = E[ ∑_{a∈{0,1}} Y_i(a) * Q(a | X_i, 1) ] 这里 Y_i(1) 和 Y_i(0) 是传统潜在结果。µ(Q) 就是已知协变量和反事实偏移概率的平均结果。

核心思想（报告的方法）：为了估计 µ(Q)，我们不直接建模 Y_i(a) 与 X_i 的关系，而是构造一个影响函数（EIF） 并将其积分。 - 借助识别假设（无未测量混杂、一致性、正定性），可将 µ(Q) 识别为可观测分布的泛函： Ψ(w) = E[ ∑_a w(a, X_i, 1) * E[Y_i | A_i = a, X_i, 1] ] 对于 µ(Q)，w(1, x, 1) = π_{δ}，w(0, x, 1) = 1 - π_{δ}。 - 报告的关键是写出这个泛函的 EIF，具体公式为幻灯片 slide 17 的 φ*_µ(Q)。在最简单例子里，A_i 为标量，求和退化为两项。EIF 中填入用第一份数据估计的非参数函数（如 g(a) = E[Y_i|A_i=a, X_i, 1] 和 h(a) = P(A_i=a|X_i, 1)），然后对第二份数据的 O_i 求平均。交叉拟合（样本分割）保证独立性和速率补偿。

这个最简例子的意义：剥离了集群大小、向量处理、依赖结构等复杂性，只保留了"处理影响函数 + 非参数估计 + 一个政策参数"的核心配方。报告的全部技术复杂性（集群内求和、d=2^{N_i} 大小的指数级求和、近似）是在此基础上的扩展。

三、报告主体：讲者讲了什么¶

引言与背景 [0:00 - 0:10]： - Michael Hudgens 先开场（[0:00]），介绍在线因果推断研讨会，感谢参与者。 - 他简要阐述了干扰的概念、示例（疫苗、现金转移），定义了集群干扰（partial/clustered interference）。 - 说明了两阶段随机实验是理想设计（[0:05]），但现实是观察数据，已有 IPW/DR 方法（[0:07]）。 - 关键 insight ([0:08])：现有方法只针对 Type B 政策（伯努利独立选择），更相关的生活化政策应考虑处理选择依赖，如 Papadogeorgou & Barkley 的偏移政策，但依赖参数模型。 - 因此，报告的目的是：发展非参数随机政策（不靠参数模型），并给出非参数有效的估计量。

定义与政策 [0:12 - 0:18]： - Chanhwa Lee 接过话筒（[0:12]），正式给出符号：m 集群，N_i 个体，Y_ij, A_ij, X_ij，集群观测向量 O_i。 - 定义了政策 Q：一个概率分布，给定集群协变量和大小，决定每个集群内处理分配的模式。它不一定是独立同伯努利的。 - 举例：确定型政策（全部处理）、Type B 政策（独立同概率 α）。指出 Type B 不现实。 - 提出新政策： 1. CIPS 政策（[0:16]）：从 Kennedy (2019) 增量倾向得分干预扩展而来。先定义 π_ij = P(A_ij=1|X_i, N_i)，再人为偏移成 π_ij,δ（倍率 δ）。例如，δ = 2 代表 "odds of vaccination 翻倍，簇内其他人处理模式也随之改变"。 2. TPB 政策（[0:17]）：反事实下要求集群内处理比例至少为 ρ（如 ρ = 0.5，意味着"每个城市至少 50% 个体接种疫苗"）。它通过截断概率质量函数恢复正定性，是一个混合理性的政策。

估计量与EIF [0:18 - 0:26]： - 定义了三个关键估计量：µ(Q)（政策下期望平均结果）、µ_1(Q)（处理组结果）、µ_0(Q)（对照组结果），从而派生出直接效果、整体效果、溢出效果等因果对比。 - 识别假设（[0:19]，assumptions A1-A5）：一致性、可交换性（条件独立性）、正定性、有穷矩、有穷集群大小。 - 小节中有一个 Q&A ([0:19-0:20]，针对可交换性假设)：Chanhwa 解释，识别后一切工作基于可观测数据，非参数函数（如 G, H）只需估计，不需要再假设潜在结果的结构。 - 定理（EIF 形式 1）（[0:21]）：对给定的权重函数 w(a, x, n)，Ψ(w) 的非参数 EIF 可写为幻灯片 slide 17 的形式。其核心是经典 AIPW 形式的推广：∑_a [w(a) * G(a) + 校正项] 减去 Ψ。 - 进一步，这个 EIF 应用于 µ(Q)，得到其 EIF 的具体表达式。

非参数函数估计 [0:26 - 0:29]： - 非参数函数 η = (G, H, w, φ) 需要估计。其中 G 是结果回归，H 是簇内的处理概率。 - 如果是个体水平条件独立（Y_ij ⟂ Y_ik | A_i, X_i, N_i 且 A_ij ⟂ A_ik | X_i, N_i），高阶干扰可被简化：个体回归 g* 仅依赖于该个体的处理值和该个体的协变量（可能加一个比例），倾向得分 p* 只依赖个体协变量（slide 19）。这大幅降低了估计问题的维度。 - 推荐使用 SuperLearner 或其他数据自适应方法。

样本分割估计量 [0:29 - 0:35]： - 核心结构图（slide 20）：数据分为"估算"和"评估"两组，交叉验证式分别估计非参数函数和计算 EIF 的样本平均。 - 数学形式（[0:31]）：(1/K) ∑_{k=1}^K (1/m_k) ∑_{i: S_i=k} φ(O_i; ˆη_{(-k)})，其中 ˆη_{(-k)} 是排除第 k 折后估计得到的非参数函数。 - 计算难点与对策（[0:31-0:32]）：EIF 中有对 a_i ∈ {0,1}^{N_i} 的求和，当 N_i ≥ 20 时指数爆炸。对策：用随机采样近似，从 {0,1}^{N_i} 中均匀采样 r 个配置，估算求和。 - 波动性控制：重复样本分割 S 次，取中位数（Chernozhukov et al. 2018 的 split-robust estimator）。

理论结果 [0:35 - 0:43]： - 分解式（slide 22）： ˆΨ - Ψ = 1/K ∑_k [ (P_k - P) φ(η) + (P_k - P)(φ(ˆη) - φ(η)) + P(φ(ˆη) - φ(η)) ] - 第一项：渐近正态，方差为 EIF 方差 σ^2(w)。 - 第二项：因交叉拟合，可被 OP(||φ(ˆη) - φ(η)|| / √m_k ) 控制，使非参数函数收敛减慢时仍奏效。 - 第三项：高阶余项——对 Type B 等于 r_G * r_H（double robustness）；对 CIPS 等于 r_π^2 + r_π * r_G（需 π 一致估计）。 - 主要定理（[0.36-0.38]）：若所有非参数函数估计的收敛率至少为 m^{-1/4}，则 √m (ˆΨ - Ψ) / ˆσ → N(0,1)，且方差估计量 ˆσ^2 收敛到有效界 E[φ*^2]。估计量是一致、渐近正态、非参数有效的。 - 举例说明不同政策的要求（[0:38]）：Type B 允许 r_G * r_H 可慢到 m^{-1/2}；而 CIPS 要求 r_π = o(1)（π 必须一致），而 r_G 可以慢一些。 - 更进一步：对政策族（例如 α ∈ A 连续集），估计量作为函数在 ℓ∞(A) 上收敛到一个高斯过程（slide 26）。

模拟与应用 [0:43 - 0:53]： - 模拟设定（[0:43-0:44]）：m=500 集群，N_i ~ Unif(5,20)，非线性倾向得分与结果函数，以检验非参数 vs 参数（logistic）方法的差异。 - 结果（slide 28，表 1）：非参数方法（SuperLearner）在 bias、RMSE、coverages 上均明显优于参数 logistic 回归，后者在某些效果下的覆盖率只有 ~22%（严重 misspecification）。这直接验证了非参数方法的稳健性。 - 实际应用（[0:45-0:50]）：用塞内加尔人口与健康调查 (DHS) 数据，探究 WASH 设施对手足腹泻的干预效果与溢出效应。集群为 Census block，U=household。 - CIPS 结果图（slide 30）：µ(δ) 与 µ_1(δ) 随 δ 增加（提高申请 water / flush toilet 的机率）而显著上升，但 µ_0(δ) 变化较小，暗示了非清洁家庭从邻居的清洁设施中获得了保护性溢出效应。TPB 结果类似（slide 31），随着所需的最小处理比例 ρ 增加，µ(ρ) 上升，但 µ_0(ρ) 几乎不变。这支持了“溢出效应”的实质存在。 - 结论（[0:52-0:53]）：非参数方法允许使用任意数据自适应模型，避免 mis-specification；应用表明 WASH 设施不仅保护处理者，也给未处理邻居带来溢出保护。

讨论与开放问题 [0:53-1:05]： - Chris 和 Hyunsong 的评论： 1. 关于 CIPS/TPB 政策的适用性与科学问题匹配——讲者回应认为这些政策是"预测性"的，而非"最优分配"性。 2. 关于协变量平衡——目前缺乏原则性方法，是一个开放问题。 3. 关于超总体（clusters i.i.d.）假设 vs 单一大型图（general interference）——Chanhwa 指出后者需借助图论结构（如局部依赖性）进行推断，但理论工具尚不完善。

四、对应论文与开放问题¶

对应论文¶

直接对应论文： Lee, Zeng, & Hudgens. (2023). "Efficient Nonparametric Estimation of Stochastic Policy Effects with Clustered Interference." arXiv:2212.10959v2.
合作者：Chanhwa Lee (UNC 生物统计博士), Donglin Zeng (密歇根大学), Michael G. Hudgens (UNC).
报告覆盖了该论文的全部主要技术内容，除可能一些引理外。 幻灯片引用确认了该 arXiv 论文（slide 34）。 免责：转录稿中误将 "Chanhwa Lee" 听作 "Chen Hua Lee"，"Donglin Zeng" 听作 "Dong Ling Zhang"，以幻灯片为准。

开放问题（扎根于讨论部分）：¶

政策优化（[0:53-0:56]，Hyunsong 与 Chris 讨论）：如何基于这些有效的非参数估计量，去学习一个在各种集群间实现最优分配的单一政策（如 CIPS 中选取最优 δ，TPB 中选取最优 ρ）？报告中的高斯过程收敛性初步回答了"用于单一政策的推断"，但多政策选择和偏差-方差权衡仍开放。
协变量平衡（[0:52-0:54]，Hyunsong 提问）：在存在干扰且使用非参数随机政策的观察研究中，如何原则性地评估协变量平衡？目前只有 ad-hoc 的方法（更好的做法是类似 "逆概率加权后的标准化均值差"），缺乏一个与效率界及政策评价直接挂钩的正式诊断。
从集群到一般网络（[1:00-1:04] Chris 与 Chanhwa）：报告假设了集群间是独立的 i.i.d. 单元。当只有一个大型网络（图），而非独立集群时，如何进行有效甚至最优的推断？需要发展基于空间/spatial 或马尔科夫随机场结构的理论。Carbon et al. 用了空间依赖的 central limit theorems，但如何与半参数有效界结合仍未知。这看起来是“hardest problem”。

Maintained by 陈星宇 · Homepage · Source on GitHub