跳转至

Estimands and estimation of COVID-19 vaccine effectiveness under the test-negative design: connections to causal inference

讲者: Mireille Schnitzer
讨论人: David Benkeser
来源: OCIS (Online Causal Inference Seminar)
日期: 2022-05-17
主题: 因果推断
视频: https://youtu.be/NN3V2ggZXjk · 幻灯片

本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。


一、这场报告在讲哪条工作线

背景:报告围绕检验阴性设计(Test-Negative Design, TND) 展开。TND 是一种用于快速评估疫苗效果的观察性研究设计,最早用于流感疫苗(Skowronski et al., 2007),后被逐步形式化(Jackson & Nelson 2013; Foppa et al. 2013; Dean 2019 等),并在 COVID-19 疫情期间被大规模采用。该设计与传统病例-对照研究的区别在于:病例是“症状+检测阳性(目标病原体)”,对照是“症状+检测阴性(其他病原体)”,且仅纳入有症状的检测者。这种设计被认为能部分控制医疗寻求行为(healthcare-seeking behavior)带来的混杂。

这个子方向在追问什么:TND 的 estimand 究竟是什么?它能否被解释为因果效应?在什么假设下可以做到?经典应用中,TND 通过逻辑回归得到疫苗效力的点估计(1 - exp(β)),但其因果含义长期未被严格形式化。已有工作(Sullivan et al. 2016, Lipsitch et al. 2016, Shi et al. 2017)用有向无环图讨论了偏倚来源,但未系统证明因果参数的识别性。本报告填补了这一空白。

当前frontier:COVID-19 疫情使得 TND 使用激增,但也暴露了深层问题——例如无症状检测者的纳入、检测可及性的变化、社区疫苗接种覆盖率对个体感染风险的干扰(interference)等。部分流行病学家呼吁抛弃 TND,改用随机监测队列(如 Marc Lipsitch 在 NEJM 访谈中提到的 UK 系统)。报告在理想化设定下建立 TND 的统计识别与因果解释,并初步讨论干扰带来的挑战,是后续更现实扩展的基础。

本报告的位置:Mireille Schnitzer(蒙特利尔大学)在这篇 2022 年的工作(对应论文:估计 arXiv 未提供,但幻灯片末有合作者 Nita 和 Bo)中,首次系统给出了 TND 下边际风险比(marginal risk ratio)的识别公式(类似 g-formula),指出逻辑回归估计的是条件风险比(在“疫苗对非目标感染无影响”的假设下),并提出了 IPTW 估计量(使用对照组拟合倾向性得分)。同时,她将 TND 连接至因果推断的 SUTVA 框架,并探讨了干扰(partial interference)对 estimand 含义的影响。

二、最小内核 / 一个最简例子

为了理解报告核心思想,考虑一个简化版 TND:

可观测数据:假设我们关注社区中所有因出现 呼吸道症状(咳嗽、发烧等)而前往医院急诊的人。他们都会被做 PCR 检测,检测结果分为 阳性(感染 SARS-CoV-2,记 I=2)或 阴性(感染其他病原体,记 I=1)。同时记录每个人的 疫苗接种状态 V(1=已接种某疫苗, 0=未接种)和一组 混杂因素 C(如年龄、基础疾病)。此外,只有 因症状而住院H=1)且 有症状W=1)且 确实存在某种感染I≠0)的人才被纳入分析。报告中的符号:Y = H * W * I(I=2) 是复合结局(COVID-19 住院病例)。注意 I=0(无感染)的人不在样本中。

目标 estimand:我们希望估计疫苗对“因 COVID-19 住院”的 边际风险比(marginal risk ratio):

ψ_mRR = E[Pr(Y=1 | V=1, C)] / E[Pr(Y=1 | V=0, C)]

其中内层概率是在给定 C 和对照 V 下的条件风险,外层平均是对 C 的总体分布取期望。注意这个定义是 前瞻性的(从人群角度看接种与不接种的风险比),而不是 TND 条件样本中的比值。

识别策略:直接前瞻性数据不可得,因为我们只观测到 TND 条件样本(S=1,即 H=1, W=1, I≠0)。报告的核心定理(幻灯片第 21 页)表明,在“疫苗对其他感染无影响”的假设下,有:

ETND[ Y * I(V=v) * q0 / Pr(V=v | C) ] = E[Pr(Y=1 | V=v, C)]

其中 q0 = Pr(S=1) 是入选概率(常数),Pr(V=v | C)前瞻性倾向得分。关键在于,Pr(V=v | C) 可由 对照组(即检测阴性者 I=1)的数据估计,因为在“疫苗无影响”假设下,对照组中的疫苗接种分布与前瞻性人群一致。因此,可以通过 IPTW 来估计两个期望的比值(q0 在比值中消去)。

最简特例:假设只有一个二元混杂 C(如年龄组>65),疫苗接种 V 也是二值。在这个最简设定下,估算流程为: 1. 在 TND 样本中,取 检测阴性 的子集,拟合逻辑回归 logit Pr(V=1|C) = α0 + α1 C,得到 ˆPr(V|C)。 2. 对整个 TND 样本,对每个个体 k 计算权重 w_k = I(V_k = v) / ˆPr(V=v | C_k)。 3. 疫苗组(v=1)的加权平均结局 = ∑ I(I_k=2) * I(V_k=1) / ˆPr(V=1|C_k) / n;对照组类似。 4. 边际风险比 = 上述两个加权平均之比。

假设:除“疫苗对非目标感染无影响”外,还需标准因果假设:一致性、条件可交换性((I(v), W(v), H(v)) ⊥ V | C)、正值性。报告还讨论了干扰(partial interference)下的变形。

三、报告主体:讲者讲了什么

以下按时间顺序梳理,时间戳基于 ASR 转写,幻灯片页码供对照。


[0:02:05–0:06:19] 背景与动机(幻灯片 1–4) - 讲者介绍 COVID-19 疫情背景,指出快速获取疫苗效果证据的迫切需求。临床随机试验证明效力,但现实世界中使用不同方案、混合疫苗类型、不同变种,需要观察性研究。 - 提及魁北克(加拿大)2022 年 1 月停止社区 PCR 检测,改为抗原自报,影响数据源。强调 TND 的优势:利用常规检测数据,快速评估。

[0:06:20–0:07:42] TND 定义与已有形式化(幻灯片 5–6) - TND 最早由 Skowronski et al. (2007) 提出用于流感疫苗效果评估。日益形式化的工作:Jackson & Nelson (2013), Foppa et al. (2013), Dean (2019/2020) 等。Sullivan, Tchetgen Tchetgen, Cowling (2016) 和 Lipsitch, Jha, Simonsen (2016) 使用 DAG 讨论偏倚,但 因果参数的识别性从未被正式证明——这是本报告的动机。

[0:07:43–0:10:20] TND 实施细节(幻灯片 7) - 源人群:具有可能由 SARS-CoV-2 感染引起的症状(咳嗽、发烧等)并接受 PCR/抗原检测的人。两个版本:社区检测点或住院患者。假设检测前个体不知自身感染状态。 - 分析:以检测结果(阳性/阴性)为因变量,以疫苗接种状态和混杂为自变量的逻辑回归。VE = 1 - exp(β)。

[0:10:24–0:12:04] TND 在新环境中的变化(幻灯片 8) - 检测动机多样化(旅行、接触者追踪、入院筛查),不再仅由症状驱动。研究多使用行政数据而非主动招募。关键:快速回答需求,但可靠性需要检验

[0:12:05–0:14:14] 案例:安大略省的前后对比(幻灯片 9) - 2021 年预印本(Buchan et al. 2022, medRxiv)使用了包含无症状检测者的“TND”,结果得出两剂疫苗有害(负点估计),三剂无效。经修订后仅纳入有症状者,重新分析得出保护性结论。讲者强调:TND 的 estimand 是 针对有症状感染(而非所有感染) 的疫苗效力。此案例展示设计不当的后果。

[0:14:15–0:17:49] 变量定义与 DAG(幻灯片 10–12) - 引入变量:V(疫苗接种状态),I(感染类型:2=SARS-CoV-2, 1=其他感染, 0=无感染),W(症状,仅当 I≠0 时可能发生),H(因症状住院),C(可测混杂如年龄、合并症),U(不可测共同原因,不影响 V 如潜在易感性)。 - 展示 DAG(幻灯片 11):C 影响所有变量,U 影响 I, W, H。TND 设计中,W=1, H=1 被条件化(矩形框),此外 I≠0(无感染被排除),导致选择性偏倚。

[0:17:50–0:21:00] 完整数据与观测数据(幻灯片 13) - 完整数据 O完整 = (C, V, I, W, H);观测数据是条件于 H=1, W=1, I≠0 下的 (C, V, I)。复合结局 Y = H * W * I(I=2)

[0:21:04–0:30:00] 逻辑回归估计了什么?OR → RR 的条件(幻灯片 14–17) - 类比 Prentice & Pyke (1979) 的病例-对照逻辑回归结果:在 TND 条件样本中,逻辑回归识别出 条件比值比 (conditional odds ratio): OR = Pr(I=2 | Z, S=1) / Pr(I=1 | Z, S=1) / (参考) = exp(β)。 - 使用条件概率,可转换为 前瞻性比值比[Pr(I=2, W=1, H=1 | V=v, C)] / [Pr(I=1, W=1, H=1 | V=v, C)] 的比。 - 关键额外假设:COVID-19 疫苗对其他感染(及所致症状、住院)无影响。此假设下,Pr(I=1, W=1, H=1 | V=v, C) = Pr(I=1, W=1, H=1 | V=参考, C),于是 OR 简化为 前瞻性风险比(risk ratio): RR = Pr(I=2, W=1, H=1 | V=v, C) / Pr(I=2, W=1, H=1 | V=参考, C)。 - 因此,逻辑回归在假设下估计的是 条件风险比(conditional RR)(若模型正确)。但由于使用逻辑回归,模型强制不同 C 下的 OR 为常数,忽略效应修饰(effect modification)。

[0:30:00–0:32:00] Q&A 第一段:回答关于无症状感染和检测可及性的问题。讲者指出 TND 通过仅纳入有症状者并条件于测试行为可缓解部分偏倚,但不能完全消除。

[0:32:05–0:37:20] 边际风险比的识别与 IPTW(幻灯片 20–24) - 讲者提出 直接估计边际风险比 ψ_mRR 的方法。证明识别性定理(幻灯片 21):E[Pr(Y=1 | V=v, C)] = ETND[ Y * I(V=v) * q0 / Pr(V=v | C) ]。关键:Pr(V=v | C) 是前瞻性倾向得分,不能直接在 TND 样本中估计。 - 但利用“疫苗对其他感染无影响”假设,可证明(幻灯片 23): Pr(V=v | I=1, W=1, H=1, C) = Pr(V=v | C),即 TND 样本中对照组的倾向得分等于前瞻性倾向得分。因此,可用对照组数据拟合倾向得分模型(如逻辑回归),再对全 TND 样本做 IPTW(幻灯片 24)。 - 估计量:分子 n^{-1} Σ I(I=2, V=v) / ˆPr(V=v | C),分母同理,比值为边际风险比。也可用加权逻辑回归来稳定估计。

[0:37:20–0:41:50] 因果解释(无干扰时)(幻灯片 25–26) - 介绍 Rubin 因果模型:SUTVA、一致性、条件可交换性、正值性。在本设定中,潜在结果三元组 (I(v), W(v), H(v)) 需同时无混杂。在这些标准假设下,边际风险比可解释为 边际因果风险比Pr(I(v)=2, W(v)=1, H(v)=1) / Pr(I(参考)=2, W(参考)=1, H(参考)=1)

[0:41:50–0:44:05] 干扰(interference)问题(幻灯片 27–30) - 传染病背景下,他人接种可能影响自身感染风险(间接效应)。讲者采用“区块”结构(如社区),假设个体只与同区块成员交互,且相依性可通过区块疫苗接种覆盖率来概括。 - 潜在结果写作 Y_j(v_j, f(v_{-j})),其中 f 是覆盖率。此时直接效应(固定覆盖率)、间接效应(改变覆盖率)、总效应定义不清,且识别需额外的区块级无混杂假设。TND 逻辑回归所估计的条件风险比,在存在干扰时不再对应单一简单因果参数,而是各区块效应的加权混杂。

[0:44:05–0:46:50] 模拟研究(幻灯片 31–33) - 三种设定:(1) 基本无效应修饰;(2) 有效应修饰(疫苗效果因协变量而异);(3) 存在部分干扰(覆盖率作为效应修饰)。 - 结果:无效应修饰时,逻辑回归和 IPTW 均表现良好;有效应修饰时,逻辑回归有偏(因强制常 OR),IPTW 无偏但方差大;存在干扰时,两种方法估计的参数都难以解释——IPTW 估计的边际风险比大致对应最高覆盖率下的直接效应,而逻辑回归的值更高且更不明确。

[0:46:50–0:47:10] 结束致谢:感谢合作者 Nita 和 Bo。

[0:47:00–1:05:00] 讨论(David Benkeser)与 Q&A - Benkeser 强调“没有唯一的 VE,上下文决定一切”,肯定本工作在形式化 TND 的 estimand、考虑效应修饰和干扰方面的贡献。他提出开放问题:如何在快速回答与改进设计之间平衡?能否自适应地随时间精炼估计?最需要资金改进 TND 的哪个环节? - 最后一个问题(Eric Tchetgen Tchetgen)关于医疗寻求行为(healthcare-seeking behavior)的残余混杂和选择偏倚。讲者承认这是极大挑战,实际中难以完全消除,可能需要更丰富的变量(如风险规避倾向)。Benkeser 提到有观点呼吁抛弃 TND 改用随机监测队列(Marc Lipsitch 的提议),但认为两者应互补。

四、对应论文与开放问题

对应论文:报告未直接给出 arXiv/DOI。合作者包括“Nita and Bo”(可能为 Nita Perreira 和某位 Bo,名字无全称,需查看视频描述或后续出版以确认)。讲者近期一篇相关论文: - Schnitzer, M. E. (2022). “Estimands and estimation of COVID-19 vaccine effectiveness under the test-negative design: connections to causal inference.” Online Causal Inference Seminar 报告。该工作的正式版本可能已发表在 Statistica SinicaAmerican Journal of Epidemiology 等期刊。具体标题与来源需核查。

开放问题(扎根于转写与幻灯片)

  1. 效应修饰的灵活建模 [0:28:50–0:29:40, 幻灯片 18]:逻辑回归禁止效应的非参数异质性;IPTW 能给出边际效应,但方差较大。如何在高维协变量下稳健估计边际风险比?是否可结合非参或机器学习(如 DML)?

  2. 干扰下 estimand 的澄清 [0:44:00–0:46:30, 幻灯片 28–30]:当存在干扰时,TND 估计的条件风险比不再对应简单的直接效应,而是块特异性直接效应的加权平均(权重取决于块规模)。如何定义一个有政策意义的因果参数?是否可通过设计(例如块随机化)实现识别?

  3. 医疗寻求行为引起的残余混杂与选择偏倚 [1:00:00–1:02:10]:TND 未能完全控制这种行为。怎样检测或量化这种偏倚?是否可借助辅助数据(如社区调查)来校正?Eric Tchetgen Tchetgen 的提问暗示了需要发展敏感性分析方法。

  4. 快速回答 vs. 更优设计的权衡 [0:53:40–0:55:40, Benkeser 讨论]:如何设计自适应更新策略,先用 TND 给出初步答案,再逐步用更严格的设计(如基于随机样本人群的队列)进行校正?是否存在统计方法(如整合校准)可以动态组合两种来源的信息?

  5. 检测可用性变化的时间影响 [0:07:43–0:08:10]:疫情期间检测行为(有症状/无症状、不同时间段)剧烈变化,这违反了 TND 的理想条件。如何将此纳入 DAG 或估计方法?是否可利用时间作为工具变量(如检测政策改变)来辅助识别?


Maintained by 陈星宇 · Homepage · Source on GitHub

评论