Estimands and estimation of COVID-19 vaccine effectiveness under the test-negative design: connections to causal inference¶

讲者: Mireille Schnitzer
讨论人: David Benkeser
来源: OCIS (Online Causal Inference Seminar)
日期: 2022-05-17
主题: 因果推断
视频: https://youtu.be/NN3V2ggZXjk · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

一、这场报告在讲哪条工作线¶

背景：报告围绕检验阴性设计（Test-Negative Design, TND） 展开。TND 是一种用于快速评估疫苗效果的观察性研究设计，最早用于流感疫苗（Skowronski et al., 2007），后被逐步形式化（Jackson & Nelson 2013; Foppa et al. 2013; Dean 2019 等），并在 COVID-19 疫情期间被大规模采用。该设计与传统病例-对照研究的区别在于：病例是“症状+检测阳性（目标病原体）”，对照是“症状+检测阴性（其他病原体）”，且仅纳入有症状的检测者。这种设计被认为能部分控制医疗寻求行为（healthcare-seeking behavior）带来的混杂。

这个子方向在追问什么：TND 的 estimand 究竟是什么？它能否被解释为因果效应？在什么假设下可以做到？经典应用中，TND 通过逻辑回归得到疫苗效力的点估计（1 - exp(β)），但其因果含义长期未被严格形式化。已有工作（Sullivan et al. 2016, Lipsitch et al. 2016, Shi et al. 2017）用有向无环图讨论了偏倚来源，但未系统证明因果参数的识别性。本报告填补了这一空白。

当前frontier：COVID-19 疫情使得 TND 使用激增，但也暴露了深层问题——例如无症状检测者的纳入、检测可及性的变化、社区疫苗接种覆盖率对个体感染风险的干扰（interference）等。部分流行病学家呼吁抛弃 TND，改用随机监测队列（如 Marc Lipsitch 在 NEJM 访谈中提到的 UK 系统）。报告在理想化设定下建立 TND 的统计识别与因果解释，并初步讨论干扰带来的挑战，是后续更现实扩展的基础。

本报告的位置：Mireille Schnitzer（蒙特利尔大学）在这篇 2022 年的工作（对应论文：估计 arXiv 未提供，但幻灯片末有合作者 Nita 和 Bo）中，首次系统给出了 TND 下边际风险比（marginal risk ratio）的识别公式（类似 g-formula），指出逻辑回归估计的是条件风险比（在“疫苗对非目标感染无影响”的假设下），并提出了 IPTW 估计量（使用对照组拟合倾向性得分）。同时，她将 TND 连接至因果推断的 SUTVA 框架，并探讨了干扰（partial interference）对 estimand 含义的影响。

二、最小内核 / 一个最简例子¶

为了理解报告核心思想，考虑一个简化版 TND：

可观测数据：假设我们关注社区中所有因出现 呼吸道症状（咳嗽、发烧等）而前往医院急诊的人。他们都会被做 PCR 检测，检测结果分为阳性（感染 SARS-CoV-2，记 I=2）或阴性（感染其他病原体，记 I=1）。同时记录每个人的 疫苗接种状态 V（1=已接种某疫苗, 0=未接种）和一组 混杂因素 C（如年龄、基础疾病）。此外，只有 因症状而住院（H=1）且 有症状（W=1）且 确实存在某种感染（I≠0）的人才被纳入分析。报告中的符号：Y = H * W * I(I=2) 是复合结局（COVID-19 住院病例）。注意 I=0（无感染）的人不在样本中。

目标 estimand：我们希望估计疫苗对“因 COVID-19 住院”的 边际风险比（marginal risk ratio）：

ψ_mRR = E[Pr(Y=1 | V=1, C)] / E[Pr(Y=1 | V=0, C)]，

其中内层概率是在给定 C 和对照 V 下的条件风险，外层平均是对 C 的总体分布取期望。注意这个定义是 前瞻性的（从人群角度看接种与不接种的风险比），而不是 TND 条件样本中的比值。

识别策略：直接前瞻性数据不可得，因为我们只观测到 TND 条件样本（S=1，即 H=1, W=1, I≠0）。报告的核心定理（幻灯片第 21 页）表明，在“疫苗对其他感染无影响”的假设下，有：

ETND[ Y * I(V=v) * q0 / Pr(V=v | C) ] = E[Pr(Y=1 | V=v, C)]，

其中 q0 = Pr(S=1) 是入选概率（常数），Pr(V=v | C) 是 前瞻性倾向得分。关键在于，Pr(V=v | C) 可由 对照组（即检测阴性者 I=1）的数据估计，因为在“疫苗无影响”假设下，对照组中的疫苗接种分布与前瞻性人群一致。因此，可以通过 IPTW 来估计两个期望的比值（q0 在比值中消去）。

最简特例：假设只有一个二元混杂 C（如年龄组>65），疫苗接种 V 也是二值。在这个最简设定下，估算流程为： 1. 在 TND 样本中，取 检测阴性 的子集，拟合逻辑回归 logit Pr(V=1|C) = α0 + α1 C，得到 ˆPr(V|C)。 2. 对整个 TND 样本，对每个个体 k 计算权重 w_k = I(V_k = v) / ˆPr(V=v | C_k)。 3. 疫苗组（v=1）的加权平均结局 = ∑ I(I_k=2) * I(V_k=1) / ˆPr(V=1|C_k) / n；对照组类似。 4. 边际风险比 = 上述两个加权平均之比。

假设：除“疫苗对非目标感染无影响”外，还需标准因果假设：一致性、条件可交换性（(I(v), W(v), H(v)) ⊥ V | C）、正值性。报告还讨论了干扰（partial interference）下的变形。

三、报告主体：讲者讲了什么¶

以下按时间顺序梳理，时间戳基于 ASR 转写，幻灯片页码供对照。

[0:02:05–0:06:19] 背景与动机（幻灯片 1–4） - 讲者介绍 COVID-19 疫情背景，指出快速获取疫苗效果证据的迫切需求。临床随机试验证明效力，但现实世界中使用不同方案、混合疫苗类型、不同变种，需要观察性研究。 - 提及魁北克（加拿大）2022 年 1 月停止社区 PCR 检测，改为抗原自报，影响数据源。强调 TND 的优势：利用常规检测数据，快速评估。

[0:06:20–0:07:42] TND 定义与已有形式化（幻灯片 5–6） - TND 最早由 Skowronski et al. (2007) 提出用于流感疫苗效果评估。日益形式化的工作：Jackson & Nelson (2013), Foppa et al. (2013), Dean (2019/2020) 等。Sullivan, Tchetgen Tchetgen, Cowling (2016) 和 Lipsitch, Jha, Simonsen (2016) 使用 DAG 讨论偏倚，但 因果参数的识别性从未被正式证明——这是本报告的动机。

[0:07:43–0:10:20] TND 实施细节（幻灯片 7） - 源人群：具有可能由 SARS-CoV-2 感染引起的症状（咳嗽、发烧等）并接受 PCR/抗原检测的人。两个版本：社区检测点或住院患者。假设检测前个体不知自身感染状态。 - 分析：以检测结果（阳性/阴性）为因变量，以疫苗接种状态和混杂为自变量的逻辑回归。VE = 1 - exp(β)。

[0:10:24–0:12:04] TND 在新环境中的变化（幻灯片 8） - 检测动机多样化（旅行、接触者追踪、入院筛查），不再仅由症状驱动。研究多使用行政数据而非主动招募。关键：快速回答需求，但可靠性需要检验。

[0:12:05–0:14:14] 案例：安大略省的前后对比（幻灯片 9） - 2021 年预印本（Buchan et al. 2022, medRxiv）使用了包含无症状检测者的“TND”，结果得出两剂疫苗有害（负点估计），三剂无效。经修订后仅纳入有症状者，重新分析得出保护性结论。讲者强调：TND 的 estimand 是 针对有症状感染（而非所有感染） 的疫苗效力。此案例展示设计不当的后果。

[0:14:15–0:17:49] 变量定义与 DAG（幻灯片 10–12） - 引入变量：V（疫苗接种状态），I（感染类型：2=SARS-CoV-2, 1=其他感染, 0=无感染），W（症状，仅当 I≠0 时可能发生），H（因症状住院），C（可测混杂如年龄、合并症），U（不可测共同原因，不影响 V 如潜在易感性）。 - 展示 DAG（幻灯片 11）：C 影响所有变量，U 影响 I, W, H。TND 设计中，W=1, H=1 被条件化（矩形框），此外 I≠0（无感染被排除），导致选择性偏倚。

[0:17:50–0:21:00] 完整数据与观测数据（幻灯片 13） - 完整数据 O完整 = (C, V, I, W, H)；观测数据是条件于 H=1, W=1, I≠0 下的 (C, V, I)。复合结局 Y = H * W * I(I=2)。

[0:21:04–0:30:00] 逻辑回归估计了什么？OR → RR 的条件（幻灯片 14–17） - 类比 Prentice & Pyke (1979) 的病例-对照逻辑回归结果：在 TND 条件样本中，逻辑回归识别出 条件比值比 (conditional odds ratio)： OR = Pr(I=2 | Z, S=1) / Pr(I=1 | Z, S=1) / (参考) = exp(β)。 - 使用条件概率，可转换为 前瞻性比值比： [Pr(I=2, W=1, H=1 | V=v, C)] / [Pr(I=1, W=1, H=1 | V=v, C)] 的比。 - 关键额外假设：COVID-19 疫苗对其他感染（及所致症状、住院）无影响。此假设下，Pr(I=1, W=1, H=1 | V=v, C) = Pr(I=1, W=1, H=1 | V=参考, C)，于是 OR 简化为 前瞻性风险比（risk ratio）： RR = Pr(I=2, W=1, H=1 | V=v, C) / Pr(I=2, W=1, H=1 | V=参考, C)。 - 因此，逻辑回归在假设下估计的是 条件风险比（conditional RR）（若模型正确）。但由于使用逻辑回归，模型强制不同 C 下的 OR 为常数，忽略效应修饰（effect modification）。

[0:30:00–0:32:00] Q&A 第一段：回答关于无症状感染和检测可及性的问题。讲者指出 TND 通过仅纳入有症状者并条件于测试行为可缓解部分偏倚，但不能完全消除。

[0:32:05–0:37:20] 边际风险比的识别与 IPTW（幻灯片 20–24） - 讲者提出 直接估计边际风险比 ψ_mRR 的方法。证明识别性定理（幻灯片 21）：E[Pr(Y=1 | V=v, C)] = ETND[ Y * I(V=v) * q0 / Pr(V=v | C) ]。关键：Pr(V=v | C) 是前瞻性倾向得分，不能直接在 TND 样本中估计。 - 但利用“疫苗对其他感染无影响”假设，可证明（幻灯片 23）： Pr(V=v | I=1, W=1, H=1, C) = Pr(V=v | C)，即 TND 样本中对照组的倾向得分等于前瞻性倾向得分。因此，可用对照组数据拟合倾向得分模型（如逻辑回归），再对全 TND 样本做 IPTW（幻灯片 24）。 - 估计量：分子 n^{-1} Σ I(I=2, V=v) / ˆPr(V=v | C)，分母同理，比值为边际风险比。也可用加权逻辑回归来稳定估计。

[0:37:20–0:41:50] 因果解释（无干扰时）（幻灯片 25–26） - 介绍 Rubin 因果模型：SUTVA、一致性、条件可交换性、正值性。在本设定中，潜在结果三元组 (I(v), W(v), H(v)) 需同时无混杂。在这些标准假设下，边际风险比可解释为 边际因果风险比：Pr(I(v)=2, W(v)=1, H(v)=1) / Pr(I(参考)=2, W(参考)=1, H(参考)=1)。

[0:41:50–0:44:05] 干扰（interference）问题（幻灯片 27–30） - 传染病背景下，他人接种可能影响自身感染风险（间接效应）。讲者采用“区块”结构（如社区），假设个体只与同区块成员交互，且相依性可通过区块疫苗接种覆盖率来概括。 - 潜在结果写作 Y_j(v_j, f(v_{-j}))，其中 f 是覆盖率。此时直接效应（固定覆盖率）、间接效应（改变覆盖率）、总效应定义不清，且识别需额外的区块级无混杂假设。TND 逻辑回归所估计的条件风险比，在存在干扰时不再对应单一简单因果参数，而是各区块效应的加权混杂。

[0:44:05–0:46:50] 模拟研究（幻灯片 31–33） - 三种设定：(1) 基本无效应修饰；(2) 有效应修饰（疫苗效果因协变量而异）；(3) 存在部分干扰（覆盖率作为效应修饰）。 - 结果：无效应修饰时，逻辑回归和 IPTW 均表现良好；有效应修饰时，逻辑回归有偏（因强制常 OR），IPTW 无偏但方差大；存在干扰时，两种方法估计的参数都难以解释——IPTW 估计的边际风险比大致对应最高覆盖率下的直接效应，而逻辑回归的值更高且更不明确。

[0:46:50–0:47:10] 结束致谢：感谢合作者 Nita 和 Bo。

[0:47:00–1:05:00] 讨论（David Benkeser）与 Q&A - Benkeser 强调“没有唯一的 VE，上下文决定一切”，肯定本工作在形式化 TND 的 estimand、考虑效应修饰和干扰方面的贡献。他提出开放问题：如何在快速回答与改进设计之间平衡？能否自适应地随时间精炼估计？最需要资金改进 TND 的哪个环节？ - 最后一个问题（Eric Tchetgen Tchetgen）关于医疗寻求行为（healthcare-seeking behavior）的残余混杂和选择偏倚。讲者承认这是极大挑战，实际中难以完全消除，可能需要更丰富的变量（如风险规避倾向）。Benkeser 提到有观点呼吁抛弃 TND 改用随机监测队列（Marc Lipsitch 的提议），但认为两者应互补。

四、对应论文与开放问题¶

对应论文：报告未直接给出 arXiv/DOI。合作者包括“Nita and Bo”（可能为 Nita Perreira 和某位 Bo，名字无全称，需查看视频描述或后续出版以确认）。讲者近期一篇相关论文： - Schnitzer, M. E. (2022). “Estimands and estimation of COVID-19 vaccine effectiveness under the test-negative design: connections to causal inference.” Online Causal Inference Seminar 报告。该工作的正式版本可能已发表在 Statistica Sinica 或 American Journal of Epidemiology 等期刊。具体标题与来源需核查。

开放问题（扎根于转写与幻灯片）：

效应修饰的灵活建模 [0:28:50–0:29:40, 幻灯片 18]：逻辑回归禁止效应的非参数异质性；IPTW 能给出边际效应，但方差较大。如何在高维协变量下稳健估计边际风险比？是否可结合非参或机器学习（如 DML）？
干扰下 estimand 的澄清 [0:44:00–0:46:30, 幻灯片 28–30]：当存在干扰时，TND 估计的条件风险比不再对应简单的直接效应，而是块特异性直接效应的加权平均（权重取决于块规模）。如何定义一个有政策意义的因果参数？是否可通过设计（例如块随机化）实现识别？
医疗寻求行为引起的残余混杂与选择偏倚 [1:00:00–1:02:10]：TND 未能完全控制这种行为。怎样检测或量化这种偏倚？是否可借助辅助数据（如社区调查）来校正？Eric Tchetgen Tchetgen 的提问暗示了需要发展敏感性分析方法。
快速回答 vs. 更优设计的权衡 [0:53:40–0:55:40, Benkeser 讨论]：如何设计自适应更新策略，先用 TND 给出初步答案，再逐步用更严格的设计（如基于随机样本人群的队列）进行校正？是否存在统计方法（如整合校准）可以动态组合两种来源的信息？
检测可用性变化的时间影响 [0:07:43–0:08:10]：疫情期间检测行为（有症状/无症状、不同时间段）剧烈变化，这违反了 TND 的理想条件。如何将此纳入 DAG 或估计方法？是否可利用时间作为工具变量（如检测政策改变）来辅助识别？

Maintained by 陈星宇 · Homepage · Source on GitHub

Estimands and estimation of COVID-19 vaccine effectiveness under the test-negative design: connections to causal inference¶

一、这场报告在讲哪条工作线¶

二、最小内核 / 一个最简例子¶

三、报告主体：讲者讲了什么¶

四、对应论文与开放问题¶

评论