Design Sensitivity and Its Implications for Weighted Observational Studies¶
讲者: Sam Pimentel
讨论人: Jacob Dorn
来源: OCIS (Online Causal Inference Seminar)
日期: 2025-05-13
主题: 因果推断
视频: https://youtu.be/O2Yt9N5FVbY · 幻灯片
本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。
相关论文¶
- 2307.00093 (尚未精读 —
talks read --id … --read-papers可补)
一、这场报告在讲哪条工作线¶
方向:观测研究中加权估计量的未测量混杂敏感性分析,以及如何将敏感性分析从事后的“诊断”前移到设计阶段,通过一个称为 design sensitivity(设计灵敏度) 的渐近量来优化研究设计。
奠基工作:Rosenbaum(2004, 2010)等人在匹配框架下提出了“敏感性分析的power”和“design sensitivity”的概念——在无未测量混杂的“有利情形”下,敏感性分析拒绝零假设的概率会随样本量增大而趋向1,但一旦未测量混杂强度超过某个阈值(design sensitivity),这个概率就迅速降为0。Rosenbaum的工作主要针对配对匹配设计(使用Wilcoxon符号秩检验或类似方法)。
主流路线: - 针对不同估计策略和敏感性模型开发design sensitivity的计算方法与渐近理论(通常涉及相位转换现象)。 - 近年扩展到加权估计(IPW、逆概率权重)和回归调整,特别是利用方差基础敏感性模型(Variance-Based Sensitivity Model, VBM) 或边际敏感性模型(Marginal Sensitivity Model, MSM)。 - 与之平行的是 “E-value” 或 “robustness value” 方法(VanderWeele & Ding, 2017),它们给出一个标量值来衡量一个点估计需要多强的未测量混杂才能被推翻,但通常不涉及设计阶段的优化。
这场报告站在: - 将Rosenbaum的design sensitivity从匹配推广到加权估计(主要为ATT的IPW估计)。 - 专门针对两个具体的敏感性模型:VBM(以权重方差比/\(R^2\)为参数)和MSM(以单个单位权重比的上界为参数),给出design sensitivity的闭式表达。 - 核心创新不是推导本身(类似于Rosenbaum已有框架),而是把design sensitivity当作设计工具:在只看到协变量和处理的“设计阶段”(即不看结局)就可以计算design sensitivity,通过调整处理定义、纳入标准、权重修剪等设计选择来提升design sensitivity,从而使后续的敏感性分析更可能得到稳健结论。 - 哥伦比亚和平公投案例是贯穿的应用,展示了两种假设(暴力暴露 vs. 总统支持)的design sensitivity差异,以及修剪极端权重或改变处理阈值如何大幅改善design sensitivity。
关键论文(有把握): - Rosenbaum (2004) “Design sensitivity in observational studies.” Biometrika. - Rosenbaum (2010) Design of Observational Studies. Springer. —— 匹配design sensitivity的基础。 - Huang, Soriano, Pimentel (2023) “Design Sensitivity and Its Implications for Weighted Observational Studies.” arXiv:2307.00093. —— 本报告对应论文。 - Crump et al. (2009) “Dealing with limited overlap in estimation of average treatment effects.” Biometrika —— 权重修剪的经典文献。
二、最小内核 / 一个最简例子¶
符号与设定(二值处理、ATT): - 样本 \(i=1,\ldots,n\),每个单位有处理 \(Z_i\in\{0,1\}\),结局 \(Y_i\)(连续),协变量 \(X_i\)。 - 潜在结局 \(Y_i(1),Y_i(0)\),观测结局 \(Y_i = Z_iY_i(1)+(1-Z_i)Y_i(0)\)。 - 目标 estimand:ATT \(\tau = \mathbb{E}[Y(1)-Y(0)\mid Z=1]\)。 - 假设无未测量混杂(条件可忽略性):\(Y(1), Y(0) \perp\!\!\!\perp Z \mid X\)。如果成立,可用权重 \(\hat{w}_i = \frac{\hat{P}(Z=1\mid X_i)}{1-\hat{P}(Z=1\mid X_i)}\)(倾向得分比)构造加权估计:
敏感性模型(VBM):假设真实权重 \(w^*\) 与观测权重 \(w\) 之间满足方差关系
Design Sensitivity:定义为在有利情形(无真实未测量混杂,即 \(w^*=w\))下,敏感性分析在 \(\Gamma = R^2\) 处的渐近功率趋势。具体地,对固定 \(\Gamma\),敏感性分析在样本量 \(n\to\infty\) 时功率要么趋于1(若 \(R^2\) 小于某个阈值),要么趋于0(若 \(R^2\) 大于该阈值)。这个阈值就是 design sensitivity \(\Gamma^*\)。大于 \(\Gamma^*\) 的 \(R^2\) 会使得即使真实效应存在且样本无限大,敏感性分析也无法拒绝零假设。
最简特例(\(d=1\),二值处理,控制组样本): - 假设 \(Z=0\) 控制组中,观测权重 \(W\) 和结局 \(Y\) 服从联合正态(仅为示例),均值为0,方差分别为 \(\sigma_W^2, \sigma_Y^2\),相关系数 \(\rho\)。 - 在VBM下,design sensitivity的闭式为(转写中讲者给出三个输入量:权重-结局相关性 \(\rho\),权重方差 \(\sigma_W^2\),结局方差 \(\sigma_Y^2\),但未写出具体函数;论文中一般形式为 \(\Gamma^* = 1 - \frac{\sigma_W^2}{\sigma_Y^2}\rho^2\) 或类似,此处需核对论文原文)。 - 直觉:\(\rho\) 大(权重能解释结局变异)→ \(\Gamma^*\) 大→更稳健;\(\sigma_W^2\) 大(权重有极端值)→ \(\Gamma^*\) 小→更容易被未测量混杂推翻。
三、报告主体:讲者讲了什么¶
[H:MM] 0:00–0:10 :主持人介绍报告、合作者 Melody Huang(Yale)、Jacob Dorn(UPenn)作为讨论人。Sam Pimentel 开始,感谢NSF,指出 arXiv 2307.00093 是预印本,幻灯片包含一些更新内容。
[0:10–0:20] :运行例子:2016哥伦比亚和平公投。指出结果高度异质性(96%赞成到19%),引出两个假设:a)暴力暴露(2011-2015期间是否发生暴力事件);b)总统支持(2014总统选举中支持率是否>50%)。将每个市视为单位,二值处理,目标 estimand 为ATT。展示数据:暴力暴露与多个协变量(人口、海拔、社会经济地位)相关,因此简单均值差有偏。
[0:20–0:25] :加权估计器(IPW)介绍。形式:\(\hat{\tau}_w =\) 处理组均值 \(-\) 加权对照组均值。权重 \(\hat{w}_i\) 基于倾向得分 \(P(Z=1|X)\) 的估计。
[0:25–0:30] :条件可忽略性假设及其脆弱性。无法从数据验证,因此需要敏感性分析。定义敏感性模型:允许真实权重 \(w^*\) 与观测权重 \(w\) 有偏差,偏差度量 \(f_\nu(w^*, w) \le \Gamma\)。效果区间 \([L_\nu(\Gamma,w), U_\nu(\Gamma,w)]\) 是真实ATT在 \(\nu(\Gamma,w)\) 内所有可能权重的区间。实际操作中,加上抽样误差构造置信区间(CI),然后寻找使CI包含零的最小\(\Gamma\)作为稳健性证书。
[0:30–0:35] :现有敏感性分析的问题:常作为论文结尾“附加”,若结果对微小混杂就很敏感,为时已晚。目标:在设计阶段(只看协变量和处理,不看结局)预测敏感性结果,从而优化设计。引出 design sensitivity 概念。
[0:35–0:40] :Power of a sensitivity analysis。定义:在有利情形(无未测量混杂、非零真实效应、指定结局分布)下,敏感性分析(给定\(\Gamma\))的CI排除零的概率。与常规power区别:零分布不再以0为中心,而是被偏移到效果区间的靠近备择假设的一端(最保守情形)。
[0:40–0:45] :Theorem 1:敏感性分析功率的渐近公式。关键项是 \(\sqrt{n}(c - \tau_W)\),其中 \(c\) 是效果区间的上界(或下界),\(\tau_W\) 是真实ATT(无混杂下)。当 \(n\to\infty\),功率只由 \(c - \tau_W\) 的符号决定:若负(\(c<\tau_W\))则功率→1;若正(\(c>\tau_W\))则功率→0。这个相变点就是 design sensitivity \(\Gamma^*\)(即使得 \(c = \tau_W\) 的 \(\Gamma\))。展示模拟图:不同样本量下功率对\(\Gamma\)的曲线,显示在\(\Gamma^*\)处骤降。
[0:45–0:50] :方差基础敏感性模型(VBM)。动机:理想权重比观测权重有额外方差,用 \(R^2\) 度量额外方差占总方差的比例。与回归分析中“未观测因素解释的方差比”类似,便于解释。VBM允许极端个体(只要总体方差可控),且能导出效果区间和design sensitivity的闭式表达。
[0:50–0:55] :VBM下的Design Sensitivity公式。仅涉及三个可观测量:权重-结局相关系数 \(\rho_{WY|Z=0}\)、权重方差 \(\text{Var}(W|Z=0)\)、结局方差 \(\text{Var}(Y|Z=0)\)。(讲者说“设计敏感性由这三个量给出”,但幻灯片中公式未完整显示,转写中未给出精确函数;公式在论文Theorem 2中应为 \(\Gamma^* = 1 - \frac{\text{Var}(W)}{\text{Var}(Y)}\rho^2\) 之类——待核实)。强调高相关性→高design sensitivity;高方差(尤其权重方差)→低design sensitivity。提到需用小部分结局数据(hold-out) 或先验知识来估计这些量,以保持“设计阶段”不出于同一批数据。
[0:55–1:00] :哥伦比亚数据结果。横轴效应量,纵轴design sensitivity(\(R^2\)尺度)。两条曲线:总统支持假设有很高design sensitivity(效应25个百分点时>0.6);暴力暴露假设即使大效应(30个百分点)design sensitivity也仅约0.1。提示即使大效应,暴力暴露研究也极易被中等未测量混杂推翻,而总统支持研究更稳健。
[1:00–1:05] :设计决策:1)处理定义(二元化阈值);2)纳入标准(只关注靠近阈值的市,或排除极端市);3)权重修剪(Crump et al.)。这些决策通常只基于无混杂假设评估,但报告用design sensitivity评估它们对稳健性的影响。展示一个大表格:多种阈值、修剪、子集的选择,并重新计算design sensitivity曲线。
[1:05–1:10] :结果:通过修剪极端权重和改变处理定义(排除极端暴力地区),暴力暴露假设的design sensitivity从0.1提高到约0.5(黄色/橙色曲线)。指出极端权重不仅增大方差,也恶化敏感性——这是以前未被强调的。但提醒:改变设计可能同时改变真实效应量,需全面考虑。
[1:10–1:15] :总结与展望。核心信息:敏感性分析应纳入设计阶段。未来方向:扩展至回归调整(比加权使用更广)、其他敏感性模型(MSM)、分位数处理效应等。讨论人Jacob Dorn随后发言,将VBM放在L2敏感性模型框架中,并与L∞(如Tan类模型)比较,指出VBM(L2)便于校准(通过精度/方差比)。提问环节涉及设计阶段是否必须假设无混杂、与Rosenbaum文献的关系、子群体敏感性参数解释等问题。讲者回应:power框架有助于确保公平比较;很多见解来自Rosenbaum但应用于新设计选择;子群体下VBM的常数解释更复杂。
四、对应论文与开放问题¶
对应论文(基本确认): - arXiv: 2307.00093, “Design Sensitivity and Its Implications for Weighted Observational Studies”, authors: Melody Huang, Dan Soriano, Samuel D. Pimentel. 讲者在[0:01:40]提到arXiv链接。幻灯片标题和作者与摘要一致。讨论人Jacob Dorn引用了“Wong and Pimentel variance-based sensitivity analysis”——可能指同一篇或其早期版本(注:Wong可能是对“Huang”的听错,但合作者Dan Soriano也牵涉其中,需核实)。
开放问题(直接从转写中提取): 1. 回归调整的design sensitivity [1:10–1:15]: 讲者表示“也很想连接到回归分析,因为比加权更流行”,但尚未完成。研究者可考虑推广design sensitivity到基于回归的估计(如OLS调整、双重机器学习)。 2. 其他敏感性模型(如MSM)的design sensitivity [1:10–1:15]: 讲者因时间未展开,但仍为方向。MSM基于L∞约束,其design sensitivity可能与VBM不同;Jacob Dorn在讨论中也对比了L∞与L2模型。 3. 分位数处理效应的设计敏感性 [1:10–1:15]: 讲者提出猜想“分位数处理效应可能有更好design sensitivity”,数值上需验证,数学上需推导。 4. 子群体与条件敏感性模型 [1:05–1:10, 讨论部分]: Jacob Dorn问到当改变纳入标准时,VBM的方差参数是否应重新校准,因它依赖条件分布。讲者认为这是VBM相对于L∞模型的弱点,有待解决。 5. 实际使用中如何获得设计阶段所需的结局信息 [0:50–0:55]: 讲者提出用hold-out pilot样本,但如何有效实施、如何选择pilot大小、如何避免pilot对后续推断的污染,仍是开放问题。
注意:以上所有开放问题来自转写中讲者或讨论者明确提及的“未完成”“未探索”“猜想”,不包含我自己推断的延伸。
Maintained by 陈星宇 · Homepage · Source on GitHub