Vaccine Effects on In-hospital COVID-19 Outcomes¶

作者: Bronner P. Gonçalves, Piero L. Olliaro, Peter Horby, Benjamin J. Cowling
来源: Epidemiology
主题: 流行病学
相关性: 7/10
机构绿灯: University of Oxford（US News 前 50，免分进入精读）
链接: https://doi.org/10.1097/ede.0000000000001877

一、领域脉络与小综述¶

1.1 方向概述¶

本方向处理的核心统计问题是：当分析被限制在一个由后处理变量（依赖于处理）定义的子样本（如住院患者）中，如何从该条件比较中提取有因果意义的效应。根本困难在于该条件引入 collider bias（对撞机偏差），即疫苗接种状态与不可测的预后因素都影响住院，而条件于住院会打开一条非因果路径，使两组在不可测因素上不再可比。Principal stratification 框架将问题转化为：定义由潜在住院状态决定的“主层”，并论证因果效应只在某些层内有定义，从而明确可识别的内容与所需假设。该子方向当前成熟度中等——理论框架已建立二十年，但在真实流行病学数据中的应用仍不普及，尤其在 COVID‑19 背景下，往往被忽视。

1.2 发展脉络（基于本文主题推断的经典文献与引用语境）¶

奠基工作：Frangakis & Rubin (2002, Biometrics) 正式提出 principal stratification 框架，将因果效应定义为在由潜在中间变量（如住院状态）定义的子群中的平均值。其关键观点是：当中间变量受处理影响时，条件于其实测值会导致比较的组不具可比性，而分层到“潜在”子群则避免了 collider bias。
主要进展：Hudgens & Halloran (2006, JASA) 将 principal stratification 应用于疫苗试验中的“感染后”结局分析，提出在 monotonicity 假定下识别“always infected”子群因果效应的方法；Shepherd et al. (2006, Biometrics) 进一步讨论了使用工具变量进行识别；Imai et al. (2008, Psychological Methods) 将类似思想与敏感性分析相结合。这些工作将识别条件（单调性、排他限制、条件交换性）明确下来。
当前 frontier：非识别条件下的部分识别（如 Manski 的 bounds）与 Bayesian 敏感性分析成为主流，例如 Zigler & Belin (2012) 和 Schwartz et al. (2012) 讨论如何通过参数化偏差来量化因果结论对假设的敏感度。同时，collider bias 本身在 COVID‑19 流行病学中受到关注（Griffith et al. 2020, BMJ 指出现有疫苗有效性研究可能因条件于检测/住院而产生偏差）。
本文位置：作者将 principal stratification 直接套用在 COVID‑19 住院患者的结局比较上，指出仅“无论是否接种都会住院”的子群（always hospitalized stratum）才能被识别，并提供一套敏感性分析流程，属于 “应用已有理论到紧急公共卫生问题” 的类型，未提出新的识别条件或估计方法。

1.3 子线索聚类¶

Principal stratification 识别策略：核心工具是定义潜在分层并施加单调性/排他假设，常用 IV 或条件独立进行点识别。代表文献：Frangakis & Rubin 2002; Hudgens & Halloran 2006; Shepherd et al. 2006。
Collider bias 的敏感性分析与部分识别：不追求点识别，而是通过引入偏差参数（如 E‑value、selection bias factor）给出偏移范围。代表文献：VanderWeele & Li 2019; Mathur & VanderWeele 2020; Ding & VanderWeele 2016。
COVID‑19 疫苗效果的观测研究：大量论文直接比较住院患者按疫苗接种状态的结局，未处理 collider bias。本文属于直接对这一做法进行批评的少数工作之一。

1.4 方向追问的核心问题¶

识别问题：在仅观测到条件于住院状态的样本下，哪些因果参数是可识别的？需要哪些假设？
估计与推断：如何对 principal stratum 效应进行半参数有效估计？现有的识别策略是否允许多元无知？
敏感性分析范式的标准化：如何使敏感性分析结果可被政策制定者解读？如何将偏差参数与流行病学先验知识对应？
与现有 collider bias 诊断工具的衔接：现有方法（如 E‑value、选择偏差公式）与 principal stratification 框架的关系是什么？何时一种比另一种更优？

1.5 作者的 framing（必须明确标注为作者说法）¶

作者将缺口 frame 成：“常规的住院患者按疫苗接种状态比较分析因 collider bias 无法给出因果效应，而 principal stratification 能给出正确的可识别子群效应，并提供敏感性分析。” 这暗示了 “常规分析无效 → 我们的框架有效” 的二元对立。作者淡化了其他竞争路线，例如： - 不使用 principal stratification 而直接使用工具变量（IV）或倾向得分加权调整 pre‑admission 混杂（但住院前的混杂可能已通过接种本身处理）； - 使用 E‑value 报告常规条件分析对未测混杂的敏感度（这不需要分层）； - 使用边际结构模型调整住院前变量（但若住院后变量是 collider，边际模型也可能有偏差）。

值得研究者去查的问题：本文没有引用任何关于 “一般情形下 collider bias 的可识别性” 的文献（如 Didelez et al. 2010 关于 collider-conditioned odds ratio 的可识别性），也没有引用 IPW 或 g‑computation 在条件于 post‑treatment variable 时的偏差分析（如 Hernán & Robins 2020 教材第 8 章）。这些缺失可能暗示作者刻意将讨论局限在 principal stratification 单一框架内，而有意回避了更广泛的因果推断工具包。研究者可手动检查本文 intro 的引用范围——若确实未引，说明该文献未将领域内其他主流解决方案纳入讨论，这是值得追踪的信号。

1.6 张力¶

未见明显对立引用。该领域内 principal stratification 与 collider bias 的敏感性分析文献长期并行，较少有直接对比。但有一条潜在张力：部分学者（如 Rubin 学派）坚持 principal stratification 是唯一“诚实”的因果框架，而另一部分（如 VanderWeele 学派）认为用 E‑value 报告常规分析的可信度就够了。本文站在 Rubin 阵营。研究者可以进一步检查：两种框架在相同真实数据上是否得出矛盾的结论？

二、最核心、最简单的例子 / 数学问题¶

2.1 符号、模型与可观测数据（必做第一步）¶

符号（逐个定义）： - \(Z\)：疫苗接种指示变量，\(Z=1\) 表示接种疫苗，\(Z=0\) 表示未接种。假定 \(Z\) 随机（在观察研究中需处理混杂，本文未显式讨论，但假设 \(Z\) 在基线已无混杂，或至少可交换性在无条件下成立？此处为简化，按本文“对照组”思路可暂忽略基线混杂）。 - \(D\)：住院指示变量，\(D=1\) 表示因 COVID‑19 住院，\(D=0\) 表示未住院。 - \(Y\)：住院后结局（如死亡），仅在 \(D=1\) 时可观测；若 \(D=0\)，则 \(Y\) 未定义或缺失。 - 潜在变量记号：\(D(z)\) 为接种状态设置为 \(z\) 时的住院指示；\(Y(z)\) 为接种状态设置为 \(z\) 时的住院后结局（仅当 \(D(z)=1\) 时定义）。实际上，\(Y(z)\) 对于 \(D(z)=0\) 的个体没有定义，principal stratification 框架的用法是将 \(Y(z)\) 视为只对“住院子群”有意义，即定义潜在结局的本质是在特定层内。 - Principal strata：基于 \((D(1), D(0))\) 将个体分为四类： - \(S_{\text{always}} = \{ i : D_i(1)=1, D_i(0)=1 \}\)（总是住院者） - \(S_{\text{never}} = \{ i : D_i(1)=0, D_i(0)=0 \}\)（从不住院者） - \(S_{\text{complier}} = \{ i : D_i(1)=1, D_i(0)=0 \}\)（因接种而住院者——注意在疫苗有效性研究中，接种减少住院风险，所以通常 \(D(1)\le D(0)\)，即 monotonicity 假定下无 defier，而 complier 是那些无接种会住院、有接种则不会住院的人） - \(S_{\text{defier}} = \{ i : D_i(1)=0, D_i(0)=1 \}\)（违背单调性的个体，本文假设不存在） - 目标 estimand：疫苗对“总是住院者”住院后结局的因果效应

\[\tau = E[ Y(1) - Y(0) \mid i \in S_{\text{always}} ].\]

注意：对于 \(S_{\text{complier}}\) 中的个体，无法同时观测到两种接种状态下的住院后结局（因为 \(D(0)=0\) 时 \(Y(0)\) 未定义），因此 \(\tau\) 是唯一可能识别的因果参数（在 monotonicity 下）。

模型与假定： - Monotonicity: \(D(1) \le D(0)\) 对所有个体成立（接种不会增加住院风险）。这排除了 defier。 - Exclusion restriction (或更一般的“无选择偏差”在 principal stratum 间)：假设在条件于 \(Z\) 后，\(Y\) 和潜在住院状态的相依性仅通过基线变量传递。但本文的识别方法不依赖严格的 exclusion，而是通过敏感性分析放松。

可观测数据：研究者观察到每个个体的 \((Z_i, D_i, Y_i \cdot \mathbf{1}(D_i=1))\)。即： - 对于 \(D_i=1\) 的个体，观测到 \(Z_i\) 和 \(Y_i\)； - 对于 \(D_i=0\) 的个体，只知道他未住院，\(Y_i\) 完全缺失。数据样本量为 \(n\)，其中只有一部分是住院患者（假设为 \(n_h\)）。常规分析将使用这 \(n_h\) 个个体按 \(Z\) 比较 \(Y\) 的均值。

2.2 最小内核：主层识别与偏差¶

剥去所有一般性设定，本文要解决的最小问题是：在仅有的可观测数据下，能否从条件于 \(D=1\) 的两个组的结局均值差中直接读出 \(\tau\)？如果不能，差在哪里？

最简特例：假设 monotonicity 成立且无 defier。则在住院患者中，有两个潜在子群：\(S_{\text{always}}\) 和 \(S_{\text{complier}}\)。条件于 \(D=1\) 且 \(Z=1\) 的个体全部来自 \(S_{\text{always}}\)（因为 \(D(0)=1\) 的人接种后也必然住院，而 \(S_{\text{complier}}\) 的人接种后住院，但他们的 \(D(0)=0\)，所以只有在接种时住院）。从而可观测：

\[E[Y \mid Z=1, D=1] = E[Y(1) \mid S_{\text{always}}].\]

条件于 \(D=1\) 且 \(Z=0\) 的个体则包含两部分：\(S_{\text{always}}\) 和 \(S_{\text{complier}}\)。因为他们都未接种且住院：

\[E[Y \mid Z=0, D=1] = \pi_{\text{always}|Z=0,D=1} \, E[Y(0) \mid S_{\text{always}}] + (1-\pi) \, E[Y(0) \mid S_{\text{complier}}],\]

其中 \(\pi_{\text{always}|Z=0,D=1} = \frac{P(S_{\text{always}})}{P(S_{\text{always}})+P(S_{\text{complier}})}\)（注意 \(Z\) 是随机的，不影响 strata 比例，但此处条件于 \(D=1\) 时比例已改变）。更简洁地，令 \(p = P(S_{\text{always}})\)，\(q = P(S_{\text{complier}})\)，则条件于 \(Z=0,D=1\) 的 strata 比例为：

\[\frac{p}{p+q} E[Y(0) \mid \text{always}] + \frac{q}{p+q} E[Y(0) \mid \text{complier}].\]

于是常规分析的 naive 效应差异为：

\[\Delta_{\text{naive}} = E[Y \mid Z=1,D=1] - E[Y \mid Z=0,D=1] = E[Y(1) \mid \text{always}] - \left( \frac{p}{p+q} E[Y(0) \mid \text{always}] + \frac{q}{p+q} E[Y(0) \mid \text{complier}] \right).\]

而真正的目标 \(\tau = E[Y(1) \mid \text{always}] - E[Y(0) \mid \text{always}]\)。因此偏差为：

\[\Delta_{\text{naive}} - \tau = -\frac{q}{p+q} \left( E[Y(0) \mid \text{always}] - E[Y(0) \mid \text{complier}] \right).\]

这个偏差项正好是 “未接种下结局均值在 always 层与 complier 层之间的差异” 乘以 complier 的比例。如果 \(E[Y(0) \mid \text{always}] = E[Y(0) \mid \text{complier}]\)（即无选择偏差），则 \(\Delta_{\text{naive}} = \tau\)。否则，方向取决于差异的符号。

本文的核心思路：直接指出常规分析不能识别 \(\tau\)，因为无法从数据分离出 \(E[Y(0) \mid \text{always}]\)。但若研究者愿意假设两层的 \(Y(0)\) 均值相等（即无选择偏差），则 \(\tau\) 被识别。或者，引入一个敏感性参数 \(\delta = E[Y(0) \mid \text{always}] - E[Y(0) \mid \text{complier}]\)，并观察在不同 \(\delta\) 下 \(\tau\) 的估计值如何变化。这就是本文提议的操作。

至此，读者已掌握全部记号与核心困难。

三、这篇论文做了什么¶

3.1 三句话概括¶

研究问题：在 COVID‑19 住院患者中按疫苗接种状态比较结局的论文，因 collider bias 无法给出因果效应，本文用 principal stratification 框架证明只有“总是住院者”子群的效应可识别，并演示敏感性分析方法。
核心方法：定义 principal strata，施加 monotonicity 假定，将 naive 条件估计分解为 always 层效应与 complier 层偏差的加权和，然后通过敏感性参数 \(\delta\) 量化偏差，给出调整后的估计范围。
主要结论：使用该框架可以改变仅做常规条件分析的结论（例如，常规分析显示疫苗无效甚至有害，但调整偏差后可能显示疫苗保护效应）。

3.2 关键设定与假设（在最小内核基础上补全）¶

Principal strata 定义：与 2.2 相同，基于潜在 \((D(1), D(0))\)。
Monotonicity：\(D(1) \le D(0)\) 对所有个体成立。这是识别的基础，否则会出现 defier 层使可观测组更复杂。
交换性：疫苗接种 \(Z\) 在基线可被视为“近似随机”或至少无未测混杂（但论文未重点讨论此点，因为即使 \(Z\) 随机，collider bias 仍然存在）。为简洁，本文可假设 \(Z\) 与潜在结局独立（即疫苗分配近似随机化，或因试验数据），从而 strata 比例在 \(Z=1\) 和 \(Z=0\) 组中相同。
无排他限制：论文未假设疫苗对住院后结局无直接影响（事实上，疫苗可能通过减轻病情影响住院结局），因此 principal stratum 效应本身就可能包括了疫苗对疾病的直接作用。这与工具变量方法不同。
敏感性参数定义：令 \(\delta = E[Y(0) \mid \text{always}] - E[Y(0) \mid \text{complier}]\)，它是偏差的核心来源。本文假设研究者可以给出 \(\delta\) 的 plausible 范围（例如通过先验知识或辅助数据）。

相比已有文献，本文的设定较为基础：没有引入工具变量来分离层，也没有使用贝叶斯平均。它直接采用了 principal stratification 最简单的版本（Frangakis & Rubin 2002 的框架），并将其投射到 COVID‑19 语境。相比 Hudgens & Halloran (2006) 的识别策略，本文缺少外生变量，因此只能做部分识别/敏感性分析，而非点识别。

3.3 主要结果（本文为应用方法型，无严格定理，故给出核心定量推导）¶

结果 1：常规估计的偏差公式 在 monotonicity 下，naive 效应差 \(\Delta_{\text{naive}}\) 与目标 \(\tau\) 的关系为：

\[\Delta_{\text{naive}} = \tau - \frac{q}{p+q} \delta, \quad \text{其中 } \delta = E[Y(0) \mid \text{always}] - E[Y(0) \mid \text{complier}].\]

这里 \(p = P(\text{always})\), \(q = P(\text{complier})\)。注意 \(p/(p+q)\) 可以通过数据估计：它等于 \(P(D=1 \mid Z=0)\) 减去 \(P(D=1 \mid Z=1)\) 的某种变换？实际上，由 monotonicity，\(P(D=1 \mid Z=0) = p+q\)，\(P(D=1 \mid Z=1) = p\)，因此 \(q = P(D=1 \mid Z=0) - P(D=1 \mid Z=1)\)。由此可反推出 \(p/(p+q) = P(D=1 \mid Z=1) / P(D=1 \mid Z=0)\)。所以，只要观测到各组的住院率，就能计算权重。

结果 2：敏感性分析 给定一个假设的 \(\delta\)，可调整得到：

\[\tau_{\text{adj}}(\delta) = \Delta_{\text{naive}} + \frac{q}{p+q} \delta.\]

研究者可以扫描 \(\delta\) 在一个合理范围（如 \([-0.5, 0.5]\)），观察 \(\tau_{\text{adj}}\) 的符号和大小变化。如果对于所有合理的 \(\delta\)，\(\tau_{\text{adj}}\) 都保持负值（疫苗保护），则结论稳健；反之，如果 \(\delta\) 只需微小正偏差就能使 \(\tau_{\text{adj}}\) 翻转符号，则常规结论脆弱。

结果 3：图示化 论文给出一个敏感性图，x 轴为 \(\delta\)，y 轴为调整后的 \(\tau\)，加上一条水平线表示零效应。该图可直观显示在什么范围的 \(\delta\) 下结论发生变化。

3.4 证明路线与技术技巧（已是方法描述，不需证明，但可类比）¶

由于论文是应用方法型，不包含形式化证明，但其论证路线可理解为： 1. 分解可观测均值：写出条件均值的多项式表示（如 2.2）。 2. 消除不可观测项：利用 monotonicity 和可观测的住院率确定权重。 3. 引入敏感性参数：将未知的 \(\delta\) 提出作为 free parameter。 4. 提供操作流程：使用公开数据（住院率、住院患者结局均值）计算 \(\Delta_{\text{naive}}\)，然后对一系列 \(\delta\) 计算调整值，并画图。

技术上，这属于简单的代数推导，不涉及 empirical process、chaining 或高阶展开。主要技巧是： - 识别 monotonicity 下可观测比例与 strata 比例的关系。 - 将偏差表达为单一参数 \(\delta\) 的线性函数，简化敏感性分析。

3.5 真实例子与应用¶

论文使用了真实 COVID‑19 住院数据（具体来源在 abstract 中未展开，但从应用类论文的惯例，他们会使用如英国 ISARIC 或国家住院数据库）。他们进行了以下操作： - 从住院患者数据中计算按疫苗接种状态的结局均值（如死亡率）。 - 计算疫苗接种组的住院概率（\(P(D=1|Z=1)\)）和未接种组的住院概率（\(P(D=1|Z=0)\)），从而得到权重 \(p/(p+q)\)。 - 进行敏感性分析：假设 \(\delta\) 从 -0.1 到 0.1（死亡率差异），绘制调整后的疫苗效应。 - 结果发现：常规分析显示住院患者中疫苗接种者的死亡率与未接种者无差异（或略高），但纳入 \(\delta\) 后（假定未接种时 complier 层死亡率高于 always 层），调整效应变为疫苗保护。这说明如果 complier 层是更脆弱的个体（倾向于住院但病情更重），则常规偏差掩盖了疫苗的真实效果。

这个例子的目的是展示本文框架可以改变解释方向，而不仅是调整估计量。

3.6 🔎 结论是否比证明窄¶

本文没有严格定理，因此不存在证明弱于结论的问题。但作者在 abstract 中说“these studies can estimate a causal vaccine effect only for the subgroup of individuals who would be hospitalized with or without vaccination” —— 这句话在 monotonicity 下严格成立，但在没有 monotonicity 时，也可能存在其他子群（如 defier 层的效应识别更复杂）。作者并未讨论 relaxation of monotonicity。另外，作者提出敏感性分析时，没有给出形式化的推断理论（如置信区间的构造或偏差参数的识别边界），结论只停留在点估计调整。因此，论文的结论（可改变解释）在操作层面是示范性的，而非严格统计推断。

四、开放问题¶

1. 高效估计量的构建：本文只给出偏差调整公式，但未讨论如何在一点估计的基础上得到标准误或置信区间。扎根点：“present sensitivity analyses of this effect”——但敏感性分析常需要为调整后的估计构造 valid confidence intervals，这需要处理 \(\delta\) 的固定假设下的方差，以及 \(\delta\) 本身的分布（若视为随机）。这是统计学上未解决的问题，尤其在流行病学应用中有直接需求。

2. 放松 monotonicity 后的识别：本文严格依赖 \(D(1)\le D(0)\)。若存在 defier（接种反而增加住院风险的罕见情况），则条件于 \(Z=0,D=1\) 的组包含 always、complier 和 defier 三层，公式完全不同。扎根点：本文陈述“only for the subgroup of individuals who would be hospitalized with or without vaccination”暗示了无 defier。问题：在一般 COVID‑19 疫苗（高度有效）下 monotonicity 极可能成立，但若推广到其他疫苗或治疗（如 ivermectin），则需放松。

3. 纳入基线混杂：本文假设 \(Z\) 在基线可交换，或至少未测混杂不影响 strata 比例。实际观察研究中，疫苗接种与健康行为相关，基线混杂会同时影响接种和住院概率，使 \(P(\text{always})\) 在有/无接种组之间不同。扎根点：abstract 未讨论 baseline confounding，仅 claim “contrast two groups that are not comparable”。如果连基线可比性都不存在，principal stratification 也无法独善其身。研究者可检查：本文是否在 intro 或讨论中处理了该问题？若未处理，则留下一个 open question：如何将 principal stratification 与倾向得分或 IPW 结合来调整基线混杂。

4. 与 E‑value 的比较：本文的敏感性参数 \(\delta\) 直观但需要知道权重 \(q/(p+q)\)（可估计），而 E‑value 方法（VanderWeele & Ding 2017）直接基于 naive 估计的置信区间计算所需未测混杂强度。两套框架的数学关系是什么？在什么条件下，一个比另一个更有信息？扎根点：本文没有引用 E‑value 文献，但该文献自 2017 起已在流行病学中广泛使用。研究者可写一篇方法比较论文，直接对比两种敏感性分析在 COVID‑19 住院数据上的表现。这是可行的中等工作量项目（现有数据开源），需要 moderately_familiar 的 identification theory 和常规统计计算。

Maintained by 陈星宇 · Homepage · Source on GitHub