Adapting Back-calculation Methods to Estimate the Incidence of Tuberculosis¶

作者: Anne N. Shapiro, Shariq Mohammed, C. Robert Horsburgh, Helen E. Jenkins, Laura F. White
来源: Epidemiology
主题: 流行病学
相关性: 6/10
机构绿灯: Boston University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1097/ede.0000000000001936

一、领域脉络与小综述¶

这个方向是什么： Back-calculation（反向计算）是一种经典的传染病流行病学方法，旨在从已报告病例的发病时间分布（通常存在报告延迟、漏报和诊断延迟）中反推出真实的疾病发病率过程。其核心统计结构是：报告病例数 = 真实发病经过疾病自然史（例如从感染到诊断到报告的时间分布）的卷积（convolution），再经过一个漏报乘数（underreporting multiplier）缩放。该方向在当前传染病监测中成熟度中等：基本框架已有数十年历史，但近期因TB自然史参数的精细化与贝叶斯计算方法的普及而重新活跃。

发展脉络（history）： - 奠基工作（方法阶段）：Brookmeyer & Gail (1988) 与 Brookmeyer & Liao (1990) 将 back-calculation 引入 HIV 感染估计。关键思路是将 AIDS 报告病例视为 HIV 感染时间与潜伏期（incubation period）的卷积，通过逆卷积反推感染发生率。该方法成为 HIV 流行病学的标准工具并持续沿用至 2000 年代。 - 主要改进与领域拓展：Horsburgh et al. (2010) 与 Wood et al. (2011) 报告了 TB 自然史参数的更新——特别是从感染到发病、从发病到诊断的时间分布有了更可靠的临床估计，使得 back-calculation 在 TB 设定下变得可行。White et al. (2008) 进一步指出，TB 报告不仅仅受疾病持续时间影响，还有显著的 underreporting 偏倚，必须插入一个“prevalence-to-notification ratio”作为乘数来矫正。 - 当前 frontier 与本文位置：现有 TB 发病率估算方法（如 WHO 的年度 TB 报告模型、基于 survey-to-notification ratio 的方法）多依赖 prevalence surveys（每 5-10 年一轮，昂贵且有时滞），而 back-calculation 试图用已有的常规病例报告数据+自然史参数，以更低的成本获得年度发病率估计。本文是这一思路的首次系统性贝叶斯实现，涵盖三个东南亚国家的性别分层结果。 - 作者的原话判断（引用句）： - 引言："Existing methods to estimate incidence are time and/or resource-intensive and often inaccurate."——作者将现有方法的不足定位为"昂贵且不准"，而非方法学本身不健全。 - "Back-calculating TB incidence could provide more timely and robust estimates."——这是作者的核心 claim，但并未与 competing methods（如 WHO Bayesian multilevel model）做直接比较。 - "New estimates of TB natural history parameters allow us to develop Bayesian back-calculation methods."——作者明确承认：使本文可行的关键不是方法创新，而是参数信息更新。

子线索聚类： 1. 基于卷积的反向计算：核心为 Poisson convolution model，由 Brookmeyer 系列工作奠基，广泛应用于 HIV/AIDS。 2. 漏报矫正（underreporting multiplier）：通过 prevalence-to-notification ratio 或 capture-recapture 来校正报告的不完整性，典型代表如 White et al. (2008)。 3. 惩罚似然与平滑估计：用于稳定逆卷积中固有的不稳定性，本文采用 penalized-likelihood smoothing，是标准的两次差分惩罚（second-order random walk prior）。

这个方向在追问的核心问题： 1. 逆卷积的 ill-posedness：给定有噪声的报告计数、且自然史分布仅是近似已知，如何稳定地反推发病率过程？ 2. 漏报的识别问题：没有独立的 underreporting survey，如何将报告缺失与发病率本身分离开来？ 3. 参数的不确定性传播：自然史参数来自外部文献（带有不确定性），如何将其正确嵌入并反映到最终发病率估计中？ 4. 时空粒度：目前多国家或大区域层面；城市/乡村 or 更细年龄组分层是否可能、是否稳健？

⚠️ 作者的 framing（必须明确标注）：作者把 gap 框定为："没有一种基于常规监测数据的、可年度更新的、成本可负担的 TB 发病率估算方法"。因此本文的定位是"填补这一实操缺口"。被淡化的竞争路线包括：WHO 目前使用的 Bayesian hierarchical incidence model（依赖 prevalence surveys 数据）以及更复杂的 capture-recapture 方法（需要多个独立数据来源）。什么明显该被引 / 该存在、却没出现在 intro 里？——Deeks et al., 2021 (PLoS Med) 的 TB incidence estimation via counterfactual splitting 没有被引；Borgdorff et al., 2011 (Tuberculosis) 的改进型 back-calculation（考虑了亚临床期检测的敏感性）也没有。这些缺失可能是作者刻意的 scope 限制，也可能说明该领域文献并非尽收。

张力： 未见明显对立的引用。主要张力来自方法本身的内在困难——back-calculation 对自然史参数极敏感，而 TB 潜伏期参数在不同人群（HIV 阳性 vs 阴性、年龄组）差异很大，但本文仅用整体已知参数、未分亚组建模。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚

符号：
\( t \)：时间索引（年），设为离散的整数年份。
\( I(t) \)：要估计的真实发病率（incidence），即时间 \( t \) 时新发 TB 病例的人数。这是潜在量，不可直接观测。
\( N(t) \)：可观测的报告病例数（notifications），即在时间 \( t \) 被正式报告并计入监测系统的 TB 病例数。
\( \tau \)：TB 自然史中从"发病（disease onset）"到"报告（notification）"的时间滞后，记为随机变量，其概率分布为 \( f(\tau) \)。
\( \lambda(t) \)：漏报乘数（underreporting multiplier），定义为 \( \lambda(t) = \text{Prevalence}(t) / \text{Notifications}(t) \)——即某个时间点的真实 prevalence 除以同一时期的报告病例，该比值被当作缺失概率的倒数。一般通过外部调查（prevalence surveys）估计得出。
\( \theta \)：模型中的平滑性超参数（或惩罚项强度）。
\( p \)：报告延迟分布 \( f(\tau) \) 的离散化版本，本文设定为已知（由临床研究给出）。
模型：核心假设为：报告病例是真实发病率与自然史延迟分布的 Poisson 卷积，再经过漏报乘数缩放。具体：
\[N(t) \mid I(t') \sim \text{Poisson}\left( \frac{1}{\lambda(t)} \cdot \sum_{s \le t} I(s) f(t-s) \right)\]
其中 \( \lambda(t) \) 的作用是将"真实水平"缩放到"报告水平"，即先将发病率卷积得到潜在的"就诊/诊断"病例数，再按漏报比压缩。
可观测数据：
可观测量：每年的 TB 报告病例数 \( N(t) \)，来源为各国的国家结核病监测系统（如越南、柬埔寨、菲律宾的年度 TB 报告）。这是最终使用的响应变量。
假设已知的外部信息：
- 自然史延迟分布 \( f(\tau) \) 的离散化形状——来自大型自然史队列（Horsburgh et al., 2010; Wood et al., 2011）。
- 漏报乘数 \( \lambda(t) \) 的估计值——来自每 5-10 年一次的 TB prevalence surveys。
- 性别分层的 total population 作为 offset 使用（但实际纳入的是计数，offset 在 Poisson 模型中隐含）。
想要但观测不到的：真实发病率 \( I(t) \)、每个报告病例的真实发病时间、漏报乘数的精确取值（只能从 survey 得到点估计+不确定性区间）。

第二步：讲最小内核

将全文的多个东南亚国家、性别分层、MCMC 等细节全部剥掉，留下支撑整篇研究的那个最小内核：

最简特例：只有一个人群的 Poisson convolution 反推问题

假设： - 只有一个人群（例如柬埔寨全体男性），忽略性别分层。 - 延迟分布 \( f(\tau) \) 是已知的离散分布，仅支持 \( \tau = 0, 1 \)（即发病后最多延迟 1 年报告），且 \( f(0) = 0.3, f(1) = 0.7 \)。 - 漏报乘数 \( \lambda(t) \) 由一个外部 survey 报告为常数 \( \lambda = 1.2 \)（即每 1.2 个真实病例只有 1 例被报告）。 - 可观测到的三年报告病例：\( N(2020) = 100, N(2021) = 110, N(2022) = 105 \)。

核心思路：假设真实发病率曲线 \( I(t) \) 是平滑的（避免随意波动），我们要通过 Poisson 卷积方程去找出最可能的 \( I(t) \)。

具体步骤： 1. 写卷积模型（可观测数据生成机制）：

\[N(t) \mid I \sim \text{Poisson}\left( \frac{1}{1.2} \cdot \sum_{s = 0,1} I(t-s) f(s) \right)\]

其中 \( f(0)=0.3 \) 表示当年发病当年报告，\( f(1)=0.7 \) 表示上年发病今年报告。所以对于 \( t=2022 \)：预期报告数 = \( \frac{1}{1.2} \cdot (0.3 I(2022) + 0.7 I(2021)) \)。

加入平滑先验：对 \( I(t) \) 的对数实施二阶随机游走（second-order random walk）——相当于对差分 \( \log I(t+1) - 2\log I(t) + \log I(t-1) \) 施加一个均值为 0 的正态分布 \( \mathcal{N}(0, \tau^2) \)，这便是 penalized-likelihood 的本质。
后验推断：给定 \( N(t) \)、\( f \)、\( \lambda \) 和先验，通过 MCMC 采样 \( \log I(t) \) 的后验分布。

在这个特例下实现的核心识别问题： - 如果 \( \lambda \) 固定且已知，那么该模型能唯一识别 \( I(t) \) 吗？ - 不能！因为 \( N(t) \) 仅提供三个观测，而我们需要估计至少五个参数（三个年份的 \( I(t) \) 加上平滑参数的方差）。这是 back-calculation 的固有 ill-posedness——平滑先验是唯一让解稳定的力量。如果没有平滑，\( I(t) \) 会出现剧烈震荡导致不可用。

论文的核心数学贡献本质上就是：在可观测数据极少（每年仅一个数字）、且卷积结构已知但 ill-posed 的情况下，引入惩罚似然 / 贝叶斯平滑使得可行的后验推断成为可能。同时，利用 gender-stratified 数据（使观测数加倍）和 MCMC 的不确定性量化来弥补识别的先天不足。

三、这篇论文做了什么¶

三句话： ① 在三个东南亚国家（越南、柬埔寨、菲律宾）的 TB 流行病学设定下，利用年度报告病例数据与已知的 TB 自然史延迟分布，估计了性别分层的真实发病率曲线。 ② 采用贝叶斯 back-calculation 框架：Poisson 卷积模型描述报告病例与发病时间之间的延迟结构，通过 prevalence-to-notification ratio 作为乘数矫正漏报，并施加二阶随机漫步先验实现平滑估计，最终通过 MCMC 实现后验采样与不确定性量化。 ③ 结果表明，估计的年度真实发病率平均比报告病例数高 19%（即漏报比例），且男性发病率略高于女性（越南 3.8%，柬埔寨 1.3%，菲律宾 2.5%），同时有合理的后验不确定区间。

关键设定与假设（在第二节最小记号基础上补全）： - 假设 1（自然史延迟已知）：\( f(\tau) \) 的外部估计被视为固定且精确，不纳入不确定性传播。这个假设在结论部分被作者承认是主要局限性："Our estimates are sensitive to the assumed natural history parameters." - 假设 2（漏报乘数固定）：prevalence-to-notification ratio 来自外部调查的点估计，且假定每年恒定。这在真实数据中不一定成立（报告力度会随时间变化）。 - 假设 3（平滑性先验）：\( \log I(t) \) 的二阶差分服从 \( \mathcal{N}(0, \tau^2) \)，且 \( \tau^2 \) 也有超先验（一参数 gamma）。这是 soft 的平滑约束，与 penalized-likelihood 中的二阶差分惩罚一致。 - 假设 4（Poisson 性）：报告计数在给定发病率下是独立的 Poisson 分布，即无过度分散、无季节性相关。对于 TB 这一慢性传染病，此假设勉强成立但未经验证。

与已有文献相比：放宽了"需要定期 prevalence survey 来直接估计发病率"的早期约束，转为利用 survey 数据提取固定乘数后用于常规监测数据。这实际上不是方法学上的放松，而是资源角度的妥协。

主要结果： - 核心数值结果：表 2 与图 2 给出了三个国家、2013-2018 年、男女分层的年发病率后验中位数与 95% 可信区间。示例：越南男性 2018 年发病率估计为每 10 万人 133.0 例（95% CI: 119.7–148.0），而同期报告病例数约为 110。菲律宾全域发病率约 319 每 10 万人（95% CI: 295–345），为报告值的 1.19 倍。 - 敏感性分析：使用延迟分布的不同外部估计（基于 HIV 阳性 vs 阴性人群的参数变体）重新拟合后，发病率估计的变化在 ±10% 以内——作者报告为"稳健"，但并未展示 worst-case scenario。 - 与 baseline 对比：作者未与 WHO 当年官方发病率估计攻直接比较（这是一个明显的缺失——读者很难判断方法优劣）。仅在讨论中粗略提及"our estimates are comparable to but slightly higher than WHO estimates"，未给出正式的区间重叠比较。

证明路线与技术技巧（非传统数学证明论文，而是计算方法设计）：

整体路线：
第一步，构建似然：对每个国家-性别-年份的三元组 \( (n,t,g) \)，写出 Poisson 对数似然，其中均值由 \( \lambda^{-1} \cdot \sum_s I(s,g) f(t-s) \) 给出。
第二步，加入平滑先验：二阶随机漫步先验抵消化对数发病率的一阶趋势（即假设发病率的变化速率本身是平滑的）。该先验等价于将对数似然加上二阶差分平方和的正则化。
第三步，MCMC 采样：利用 Metropolis-Hastings 对 \( \log I(t) \) 进行逐变量更新（单分量 Gibbs 风格的随机漫步 MH）。超参数 \( \tau^2 \) 的共轭先验使得其后验可以 Gibbs 采样。
第四步，后验汇总：输出每个年份中位数与 95% 等尾区间。
关键跳跃点：
本文没有"技术证明中卡住的引理"这一概念，关键在于确保 MCMC 收敛且平滑参数不会对冲掉信号。作者通过检查迹图与后验自相关来确保（但没有提供正式的诊断统计量如 Gelman-Rubin \( \hat{R} \)）。
最大的工程挑战是将自然史延迟分布离散化并与报告数据的年尺度匹配——这是通过简单的线性插值将月尺度参数映射到年尺度完成的（无特殊技巧）。
技术技巧点名：
二阶随机漫步（second-order random walk）：作为平滑先验，这是 penalized-likelihood 与贝叶斯平滑的标准选择。等价于对 \( \log I(t) \) 的二次差分施加正态先验。其优点是在平稳区域自动回归到常数斜率，而非常数水平，本意是防止平滑趋向于过度平均。
Metropolis-within-Gibbs：由于对数发病率没有共轭后验，每个参数通过单变量 MH 更新，步长通过自适应调整（robbins-monro 风格）。这是标准操作，属方法论常规内容。

真实例子与应用： - 用到的数据：越南（2007-2018）、柬埔寨（2012-2018）、菲律宾（2013-2018）的国家 TB 年度报告病例总数，按性别分层。 - 怎么用：由世界卫生组织（WHO）的 TB 数据库获取通知病例与人口数。延迟参数（从发病到报告的平均时间）取自 Horsburgh (2010) 的临床研究。漏报乘数计算自各国的 TB prevalence surveys（例如越南 2017 survey 得到的 prevalence-to-notification ratio = 1.3）。 - 得到的结果：如前所述，总体估计发病率比报告数高 19%，但各国差异显著：越南约高 15%，菲律宾约高 25%。 - 这个例子想说明什么：说明利用常规监测数据结合已知自然史参数与漏报乘数，即使没有最新的 prevalence survey，也能获得与 WHO 官方估计大致一致的发病率结果，且能节省组织 prevalence survey 的巨大开支。

🔎 结论是否比证明窄： - 结论中对"可年度更新"这一 claim 并未严格证明。现实中，漏报乘数 \( \lambda \) 来自调查（每 5-10 年一次），并非每年可更新。作者用固定值跨年度假设，本质上是在"漏报乘数恒定"的条件下验证了模型可行，但不能得出"每年单独用研究数据就能更新 incidence"的结论。 - 结论声称"稳健于自然史参数的不确定性"，但敏感性分析仅使用了两组替代参数（HIV 阳性与阴性人群），未检验最坏情形（如延迟分布形状或支撑集错配）。因此"对参数的敏感性"被泛化性声明（"robust"）所夸大。 - 方法中对 TB 的"subclinical disease"阶段的检测延迟被直接等同于 notification delay，但实际上部分病例在亚临床期即可通过主动检测发现并报告——这一混同在全文中未被讨论。

四、开放问题¶

乘数假设弱化：漏报乘数 \( \lambda(t) \) 目前设为随时间恒定的固定外部估计值。如何将其建模为随时间、地区或诊断水平变化/结构性的缺失过程，使其不确定性被合理嵌入整体推断中？（扎根点：论文 limitations 节 "we used a fixed multiplier from a single survey"。）
自然史参数的不确定性传播：延迟分布 \( f(\tau) \) 被当作精确已知的点估计使用。究竟需要什么样的外部估计精度，才能让 final incidence 估计的后验宽度不膨胀至不可用？（扎根点：讨论节 "estimates are sensitive to the assumed natural history parameters"——本质是未量化这种敏感性的幅度。）
浅显的数据可视化缺口：论文未报告发病率的时间趋势（如 2013→2018 是否上升/下降），所有结论均集中在 point-in-time 水平。如果趋势是核心政策关注，那么仅用一个平滑先验就吸收掉时间趋势，是否反而过度平滑了？（扎根点：图 2 展示的发病率估计几乎是平的——这是否反映真实趋势还是平滑的先验偏好？）

Maintained by 陈星宇 · Homepage · Source on GitHub

Adapting Back-calculation Methods to Estimate the Incidence of Tuberculosis¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题¶

评论