跳转至

Efficient Nonparametric Estimation of Stochastic Policy Effects with Clustered Interference

讲者: Michael Hudgens, Chanhwa Lee
来源: OCIS (Online Causal Inference Seminar)
日期: 2023-09-26
主题: 因果推断
视频: https://youtu.be/3Q8yttwn_WI · 幻灯片

本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。

相关论文

  • 2212.10959 (尚未精读 — talks read --id … --read-papers 可补)

一、这场报告在讲哪条工作线

本报告属于集群干扰下的因果推断这一子方向。该方向追问的是:当个体间存在干扰(interference,即一个人受处理的状况影响着另一个人的结果)时,如何定义、识别和估计因果效应。干扰既可以是直接传染(疫苗接种影响他人感染),也可以是间接溢出(卫生设施改善影响邻居健康)。

奠基与主流路线: - 两阶段随机实验(Hayes et al. 2000, Longini et al. 2002, Sinclair et al. 2012, Basse & Feller 2017)是黄金标准:先随机分配集群到不同分配策略(policies),再在集群内随机分配个体到处理/对照。这在无干扰和可忽略处理的条件下直接给出因果识别。 - 基于观察数据的方法(Tchetgen Tchetgen & VanderWeele 2012; Perez-Heydrich et al. 2014; Liu et al. 2016, 2019)发展了逆概率加权(IPW)和双重稳健(DR)估计量,利用了集群层面的倾向得分。Park & Kang (2022) 证明了其中一个估计量是局部半参数有效的。Chakladar et al. (2022) 将其扩展到右删失结果。 - 然而,这些方法主要针对一种特定的政策——"Type B"政策:即所有个体在反事实下以相同概率独立选择处理(伯努利分布,概率α)。在观察数据中,其他反事实政策可能更相关:比如如果集群内个体间存在处理选择的依赖,Type B便不现实。

当前frontier与本报告的定位: - Papadogeorgou et al. (2019, Biometrics) 和 Barkley et al. (2020, Ann Appl Stat) 提出了参数化"偏移"政策:基于 GLMM 对 A|X 建模,然后偏移系数γ。它们的优点包括:允许集群内处理选择依赖;保持个体倾向得分的排序。缺点是依赖于参数模型是否正确。 - 本报告对应的工作线(Lee, Zeng, Hudgens 2023, arXiv:2212.10959)实现了非参数化:提出了一类不依赖参数模型的随机政策(CIPS 和 TPB),并开发出了相应的非参数有效样本分割估计量。它允许用任意数据自适应方法估计非参数函数,而估计量仍保持 √m 收敛、渐近正态和非参数有效。这是该子方向从参数/半参数向完全非参数的关键一步。

关键文献对照(人名可能有ASR错误,以幻灯片为准): - 奠基:Tchetgen Tchetgen & VanderWeele (2012) - 参数化偏移政策:Papadogeorgou et al. (2019), Barkley et al. (2020) - 双重稳健/半参数有效方法:Liu et al. (2016, 2019), Park & Kang (2022) - 本报告(非参数):Lee et al. (2023, arXiv:2212.10959) - 增量倾向得分干预(CIPS灵感来源):Kennedy (2019, JASA)——但Kennedy的工作不处理集群干扰。


二、最小内核 / 一个最简例子

符号与设定: - 有 m 个独立集群(cluster)。对于集群 i,有 N_i 个个体(集群大小)。 - 对于个体 j 在集群 i: - Y_ij:结果变量(标量)。 - A_ij:二元处理(0/1)。 - X_ij:协变量(向量)。 - 集群层面的观测向量:O_i = (Y_i, A_i, X_i, N_i),其中 Y_i = (Y_i1,...,Y_iN_i)A_i = (A_i1,...,A_iN_i)X_i = (X_i1,...,X_iN_i)。 - 潜在结果Y_ij(a_i) —— 当集群 i 的所有个体按 a_i ∈ {0,1}^{N_i} 接受处理时,个体 j 的结果。允许干扰:Y_ij(a_ij, a_{i(-j)}) 依赖于他人处理。

最简特例: 考虑 两个集群m = 2),每个集群只有 1个个体N_i = 1)。因此 A_i 是标量 0/1。 - 干扰不存在(因为每个集群只有一个个体),但设定仍允许处理效果在不同集群间不同。 - 我们希望估计一个反事实政策的效果,例如 CIPS 政策(增量倾向得分偏移): - 观测到的倾向得分(propensity score):π_i = P(A_i = 1 | X_i, N_i=1)。 - CIPS 政策:反事实下个体接受处理的概率变为 π_i,δ = (δ * π_i) / (δ * π_i + 1 - π_i),其中 δ 是用户指定的常数(例如 δ = 2,表示处理发生的几率翻倍)。 - 政策 Q 定义:对集群 iQ(1|X_i, 1) = π_i,δ, Q(0|X_i,1) = 1 - π_i,δ

目标: 该政策的平均潜在结果(期望平均结果): µ(Q) = E[ ∑_{a∈{0,1}} Y_i(a) * Q(a | X_i, 1) ] 这里 Y_i(1)Y_i(0) 是传统潜在结果。µ(Q) 就是已知协变量和反事实偏移概率的平均结果。

核心思想(报告的方法): 为了估计 µ(Q),我们不直接建模 Y_i(a)X_i 的关系,而是构造一个影响函数(EIF) 并将其积分。 - 借助识别假设(无未测量混杂、一致性、正定性),可将 µ(Q) 识别为可观测分布的泛函: Ψ(w) = E[ ∑_a w(a, X_i, 1) * E[Y_i | A_i = a, X_i, 1] ] 对于 µ(Q)w(1, x, 1) = π_{δ}w(0, x, 1) = 1 - π_{δ}。 - 报告的关键是写出这个泛函的 EIF,具体公式为幻灯片 slide 17 的 φ*_µ(Q)。在最简单例子里,A_i 为标量,求和退化为两项。EIF 中填入用第一份数据估计的非参数函数(如 g(a) = E[Y_i|A_i=a, X_i, 1]h(a) = P(A_i=a|X_i, 1)),然后对第二份数据的 O_i 求平均。交叉拟合(样本分割)保证独立性和速率补偿。

这个最简例子的意义:剥离了集群大小、向量处理、依赖结构等复杂性,只保留了"处理影响函数 + 非参数估计 + 一个政策参数"的核心配方。报告的全部技术复杂性(集群内求和、d=2^{N_i} 大小的指数级求和、近似)是在此基础上的扩展。


三、报告主体:讲者讲了什么

引言与背景 [0:00 - 0:10]: - Michael Hudgens 先开场([0:00]),介绍在线因果推断研讨会,感谢参与者。 - 他简要阐述了干扰的概念、示例(疫苗、现金转移),定义了集群干扰(partial/clustered interference)。 - 说明了两阶段随机实验是理想设计([0:05]),但现实是观察数据,已有 IPW/DR 方法([0:07])。 - 关键 insight ([0:08]):现有方法只针对 Type B 政策(伯努利独立选择),更相关的生活化政策应考虑处理选择依赖,如 Papadogeorgou & Barkley 的偏移政策,但依赖参数模型。 - 因此,报告的目的是:发展非参数随机政策(不靠参数模型),并给出非参数有效的估计量。

定义与政策 [0:12 - 0:18]: - Chanhwa Lee 接过话筒([0:12]),正式给出符号:m 集群,N_i 个体,Y_ij, A_ij, X_ij,集群观测向量 O_i。 - 定义了政策 Q:一个概率分布,给定集群协变量和大小,决定每个集群内处理分配的模式。它不一定是独立同伯努利的。 - 举例:确定型政策(全部处理)、Type B 政策(独立同概率 α)。指出 Type B 不现实。 - 提出新政策: 1. CIPS 政策([0:16]):从 Kennedy (2019) 增量倾向得分干预扩展而来。先定义 π_ij = P(A_ij=1|X_i, N_i),再人为偏移成 π_ij,δ(倍率 δ)。例如,δ = 2 代表 "odds of vaccination 翻倍,簇内其他人处理模式也随之改变"。 2. TPB 政策([0:17]):反事实下要求集群内处理比例至少为 ρ(如 ρ = 0.5,意味着"每个城市至少 50% 个体接种疫苗")。它通过截断概率质量函数恢复正定性,是一个混合理性的政策。

估计量与EIF [0:18 - 0:26]: - 定义了三个关键估计量:µ(Q)(政策下期望平均结果)、µ_1(Q)(处理组结果)、µ_0(Q)(对照组结果),从而派生出直接效果、整体效果、溢出效果等因果对比。 - 识别假设([0:19],assumptions A1-A5):一致性、可交换性(条件独立性)、正定性、有穷矩、有穷集群大小。 - 小节中有一个 Q&A ([0:19-0:20],针对可交换性假设):Chanhwa 解释,识别后一切工作基于可观测数据,非参数函数(如 G, H)只需估计,不需要再假设潜在结果的结构。 - 定理(EIF 形式 1)([0:21]):对给定的权重函数 w(a, x, n)Ψ(w) 的非参数 EIF 可写为幻灯片 slide 17 的形式。其核心是经典 AIPW 形式的推广:∑_a [w(a) * G(a) + 校正项] 减去 Ψ。 - 进一步,这个 EIF 应用于 µ(Q),得到其 EIF 的具体表达式。

非参数函数估计 [0:26 - 0:29]: - 非参数函数 η = (G, H, w, φ) 需要估计。其中 G 是结果回归,H 是簇内的处理概率。 - 如果是个体水平条件独立Y_ij ⟂ Y_ik | A_i, X_i, N_iA_ij ⟂ A_ik | X_i, N_i),高阶干扰可被简化:个体回归 g* 仅依赖于该个体的处理值和该个体的协变量(可能加一个比例),倾向得分 p* 只依赖个体协变量(slide 19)。这大幅降低了估计问题的维度。 - 推荐使用 SuperLearner 或其他数据自适应方法。

样本分割估计量 [0:29 - 0:35]: - 核心结构图(slide 20):数据分为"估算"和"评估"两组,交叉验证式分别估计非参数函数和计算 EIF 的样本平均。 - 数学形式([0:31]):(1/K) ∑_{k=1}^K (1/m_k) ∑_{i: S_i=k} φ(O_i; ˆη_{(-k)}),其中 ˆη_{(-k)} 是排除第 k 折后估计得到的非参数函数。 - 计算难点与对策([0:31-0:32]):EIF 中有对 a_i ∈ {0,1}^{N_i} 的求和,当 N_i ≥ 20 时指数爆炸。对策:用随机采样近似,从 {0,1}^{N_i} 中均匀采样 r 个配置,估算求和。 - 波动性控制:重复样本分割 S 次,取中位数(Chernozhukov et al. 2018 的 split-robust estimator)。

理论结果 [0:35 - 0:43]: - 分解式(slide 22): ˆΨ - Ψ = 1/K ∑_k [ (P_k - P) φ(η) + (P_k - P)(φ(ˆη) - φ(η)) + P(φ(ˆη) - φ(η)) ] - 第一项:渐近正态,方差为 EIF 方差 σ^2(w)。 - 第二项:因交叉拟合,可被 OP(||φ(ˆη) - φ(η)|| / √m_k ) 控制,使非参数函数收敛减慢时仍奏效。 - 第三项:高阶余项——对 Type B 等于 r_G * r_H(double robustness);对 CIPS 等于 r_π^2 + r_π * r_G(需 π 一致估计)。 - 主要定理([0.36-0.38]):若所有非参数函数估计的收敛率至少为 m^{-1/4},则 √m (ˆΨ - Ψ) / ˆσ → N(0,1),且方差估计量 ˆσ^2 收敛到有效界 E[φ*^2]。估计量是一致、渐近正态、非参数有效的。 - 举例说明不同政策的要求([0:38]):Type B 允许 r_G * r_H 可慢到 m^{-1/2};而 CIPS 要求 r_π = o(1)(π 必须一致),而 r_G 可以慢一些。 - 更进一步:对政策族(例如 α ∈ A 连续集),估计量作为函数在 ℓ∞(A) 上收敛到一个高斯过程(slide 26)。

模拟与应用 [0:43 - 0:53]: - 模拟设定([0:43-0:44]):m=500 集群,N_i ~ Unif(5,20),非线性倾向得分与结果函数,以检验非参数 vs 参数(logistic)方法的差异。 - 结果(slide 28,表 1):非参数方法(SuperLearner)在 bias、RMSE、coverages 上均明显优于参数 logistic 回归,后者在某些效果下的覆盖率只有 ~22%(严重 misspecification)。这直接验证了非参数方法的稳健性。 - 实际应用([0:45-0:50]):用塞内加尔人口与健康调查 (DHS) 数据,探究 WASH 设施对手足腹泻的干预效果与溢出效应。集群为 Census block,U=household。 - CIPS 结果图(slide 30):µ(δ)µ_1(δ) 随 δ 增加(提高申请 water / flush toilet 的机率)而显著上升,但 µ_0(δ) 变化较小,暗示了非清洁家庭从邻居的清洁设施中获得了保护性溢出效应。TPB 结果类似(slide 31),随着所需的最小处理比例 ρ 增加,µ(ρ) 上升,但 µ_0(ρ) 几乎不变。这支持了“溢出效应”的实质存在。 - 结论([0:52-0:53]):非参数方法允许使用任意数据自适应模型,避免 mis-specification;应用表明 WASH 设施不仅保护处理者,也给未处理邻居带来溢出保护。

讨论与开放问题 [0:53-1:05]: - Chris 和 Hyunsong 的评论: 1. 关于 CIPS/TPB 政策的适用性与科学问题匹配——讲者回应认为这些政策是"预测性"的,而非"最优分配"性。 2. 关于协变量平衡——目前缺乏原则性方法,是一个开放问题。 3. 关于超总体(clusters i.i.d.)假设 vs 单一大型图(general interference)——Chanhwa 指出后者需借助图论结构(如局部依赖性)进行推断,但理论工具尚不完善。


四、对应论文与开放问题

对应论文

  • 直接对应论文Lee, Zeng, & Hudgens. (2023). "Efficient Nonparametric Estimation of Stochastic Policy Effects with Clustered Interference." arXiv:2212.10959v2.
  • 合作者:Chanhwa Lee (UNC 生物统计博士), Donglin Zeng (密歇根大学), Michael G. Hudgens (UNC).
  • 报告覆盖了该论文的全部主要技术内容,除可能一些引理外。 幻灯片引用确认了该 arXiv 论文(slide 34)。 免责:转录稿中误将 "Chanhwa Lee" 听作 "Chen Hua Lee","Donglin Zeng" 听作 "Dong Ling Zhang",以幻灯片为准。

开放问题(扎根于讨论部分):

  1. 政策优化([0:53-0:56],Hyunsong 与 Chris 讨论):如何基于这些有效的非参数估计量,去学习一个在各种集群间实现最优分配的单一政策(如 CIPS 中选取最优 δ,TPB 中选取最优 ρ)?报告中的高斯过程收敛性初步回答了"用于单一政策的推断",但多政策选择和偏差-方差权衡仍开放。
  2. 协变量平衡([0:52-0:54],Hyunsong 提问):在存在干扰且使用非参数随机政策的观察研究中,如何原则性地评估协变量平衡?目前只有 ad-hoc 的方法(更好的做法是类似 "逆概率加权后的标准化均值差"),缺乏一个与效率界及政策评价直接挂钩的正式诊断。
  3. 从集群到一般网络([1:00-1:04] Chris 与 Chanhwa):报告假设了集群间是独立的 i.i.d. 单元。当只有一个大型网络(图),而非独立集群时,如何进行有效甚至最优的推断?需要发展基于空间/spatial 或马尔科夫随机场结构的理论。Carbon et al. 用了空间依赖的 central limit theorems,但如何与半参数有效界结合仍未知。这看起来是“hardest problem”。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论