Trends in obesity-related cardiovascular and cancer mortality in Switzerland 1995-2019: an analysis of multiple causes of death¶

作者: Bernadette W A van der Linden, Célia A Viehl, Nazihah Noor, Tim Adair, Salvatore Vaccarella et al.
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 2/10
机构绿灯: University of Melbourne（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/aje/kwag003

一、领域脉络与小综述¶

这个方向是什么¶

本文属于 应用流行病学中的死亡率趋势分析 子方向，根本问题是：在肥胖患病率持续上升的全球背景下，肥胖对特定死因（心血管疾病、癌症）的死亡率贡献如何随时间变化？它能否拖累或扭转整体死亡率的长期下降趋势？当前成熟度：这是一个已有几十年历史的经典流行病学分析领域，分析工具（年龄标准化死亡率、分段回归、年龄-时期-队列模型）都已成熟，本文的核心贡献不在于发明新方法，而在于将这套框架应用于瑞士这一特定环境，并借助 多种死亡原因分析 (multiple cause of death, MCOD) 这一较新的数据使用范式，回答一个具体的公共卫生问题。

发展脉络 (history)¶

奠基工作 (公共卫生里程碑):
- Flegal et al. (2000s) 等经典工作：确立肥胖与心血管疾病及部分癌症的流行病学关联，并为肥胖患病率上升趋势提供了全球范围的估计。
- References [1-3] 引用了 "全球肥胖流行" 的核心证据，如 NCD Risk Factor Collaboration (2017) 的全球肥胖趋势报告 (ref 1)。
主要进展 (美国案例引发关注):
- Masters et al. (2013, 2018) (refs 8, 9): 这批发表在《Journal of the American Medical Association》和《American Journal of Epidemiology》的工作，是本文最关键的对话对象。作者指出："studies from the United States [...] have shown that steep increases in obesity have contributed to adverse trends in obesity-related mortality and to slowing decline in overall CVD mortality, particularly among younger generations"（论文 Intro 部分）。这直接定义了一个“令人担忧”的基线（美国模式）。
当前 frontier (探索不同社会背景下的模式异质性):
- 当前关键问题是：美国的模式（肥胖相关死亡上升拖累整体心血管死亡下降）是否是一种普适现象，还是特定于美国的社会、医疗与营养环境？其他高收入国家（如瑞士）的情况如何？
- 瑞士的优势：作者强调瑞士的肥胖流行速度较慢，且儿童肥胖率出现下降（Introduction 部分引用了瑞士的儿童肥胖数据）。这使得瑞士成为一个天然的“反例”来对比美国。
本文的位置:
- 本文是一个 对比性应用验证。它的位置不是提出新方法，而是 在一个新国家（瑞士）用相同的数据范式（MCOD）和标准工具（分段回归、APC模型），检验从美国案例中提炼出的假说是否成立。

子线索聚类¶

这些被引文献大致落在 2 条子线索上： - 线索 1: 肥胖与死亡率的关系及其时间趋势 (因果流行病学核心) - 包括 全球肥胖趋势 (refs 1-3)、各国肥胖相关的死亡率估计 (refs 4-7, 10-12 涵盖了美国、加拿大、英国、澳大利亚、意大利等)。这一簇工作研究的是肥胖流行率上升如何转化为死亡率变化。 - 瑞士本土的肥胖流行病学研究 (refs 15-17): 提供了瑞士肥胖患病率的具体数据，特别是 ref 16 (Ehrsam et al., 2004) 报告了瑞士儿童肥胖率下降，这与作者的核心论点之一直接相关。 - 线索 2: 多种死亡原因分析 (MCOD) 方法学 - 这是一个相对较新的子线索。与传统死因分析仅使用“根本死因 (underlying cause of death, UCOD)”不同，MCOD 使用死亡证明上记录的所有死因（contributing causes）。refs 18, 19 (Anker et al., 2018; Stallard, 2017) 是这个领域的代表性方法学工作，它们演示了 MCOD 如何提供比 UCOD 更丰富的信息，特别是当一种疾病（肥胖）是另一种（CVD、癌症）的促进因素时。

这个方向在追问的核心问题¶

肥胖流行率的上升是否必然导致肥胖相关死亡率的上升？ 美国的答案显然是“是”。但在医疗管理（改善的 CVD 二级预防）和不同人群肥胖流行模式（肥胖增速更慢、儿童肥胖率下降）的背景下，这个答案是否还有普适性？
多死因分析 (MCOD) 是否能比传统死因分析 (UCOD) 提供更多关于肥胖对死亡率影响的信号？ 这是本文的方法论核心关切——即使肥胖不是根本死因，它作为伴发死因（contributing cause）的贡献有多大？
世代效应是否比时期效应更重要？ 美国数据显示年轻世代（出生更晚）的肥胖相关死亡率更高，这暗示了早期生命期的暴露和惯性对长期健康的影响。本文的 APC 模型专门用来检验瑞士是否也出现这种代际风险转移。
已知瓶颈：主要的瓶颈在于 数据可比性 和 归因方法的模糊性。MCOD 数据在不同时期的编码标准（ICD 版本变更）、不同国家的死亡证明填写惯例会有变化。另外，肥胖本身作为一种“死因”在死亡证明上的记录率远低于其真实作用（作者在 Introduction 中提到“obesity reporting is incomplete”），导致可能存在系统性低估。

⚠️ 作者的 framing¶

作者把缺口 frame 成什么：
- 作者将美国案例（高肥胖相关死亡率、拖累总体下降、年轻世代风险更高）定义为 “典型威胁”。
- 而瑞士被定位为 “非典型但具有公共卫生学意义的对照”（更慢的肥胖流行、儿童肥胖率下降）。
- 因此，本文的科研问题是：“如果在一个肥胖流行更慢、儿童肥胖率已见顶的国家，我们是否仍能看到类似美国的模式？” 这使得本课题看起来是一个“显然的下一步”验证，而它的结果（没看到类似模式）则是给公共卫生政策带来的重要信号。
哪些竞争路线被淡化或回避：
- 更深层的因果识别问题被回避：本文并未尝试建立“肥胖→死亡”的因果效应。它只是一个 趋势关联性分析。作者小心翼翼地将所有讨论框定为“肥胖相关 (obesity-related)”而非“obesity-attributable”。作者没有讨论混杂因素（如社会经济地位、吸烟的变化、医疗可及性的改善）对趋势的影响。
- 肥胖测量问题被淡化：文中使用的肥胖定义是死亡证明上的“肥胖”编码。这在论文中被坦率地承认是“incomplete reporting”，但并未探讨这种报告偏倚是如何随时间或人群系统变化的。作者选择淡化这个测量异质性问题，直接假设报告概率是稳定的或均匀的（证据：直接使用原始计数）。
什么明显该被引/该存在、却没出现在 intro 里？
- 该领域内关于 MCOD 与 UCOD 方法比较的经验评估文献。虽然引用了 Anker (2018) 和 Stallard (2017)，但缺少定量的、专门比较肥胖相关死因在 MCOD vs UCOD 中差异的工作（例如，是否在 UCOD 分析中肥胖的作用被严重低估？哪些癌症在 MCOD 中才更显著？）
- 对肥胖与心血管/Cancer 因果关系机制的流行病学综述（比如，更常引用孟德尔随机化或中介分析来独立确认 MCOD 模式背后的因果路径）。这会让读者更容易理解为什么 MCOD 中肥胖与某癌种的关联是有生物学先验的。
- 未引入“特定死因归因分数 (Population Attributable Fraction, PAF)”的概念，这些概念常用来定量的评估肥胖对死亡率的贡献比例。本文只用了“相关 (related)”而未量化归因。

张力¶

未见明显对立引用。所有被引用的工作（全球趋势、美国警示、瑞士数据、MCOD 方法学）在方向上基本一致，都是围绕着“肥胖与死亡趋势的潜在负面关联”这个共识展开。本文的核心张力是与美国结果的比较（结果不同，但这并非文献中的矛盾，而是异质性）。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号:
- t : 年份 (1995-2019)。这是时间维度（时期效应）。
- a : 年龄组 (age groups)。比如 35-44, 45-54, …, 85+。年龄调整时的标准人群是欧洲标准人口 (European Standard Population, ESP 2013)。
- g : 出生世代 (birth cohort)。通过 g = t - a 近似定义。
- y_{t, a, s, c} : 死亡计数 (deaths counts)。对于糖尿病特定并发症 c (心血管疾病 CVD、癌症 Cancer) 和性别 s (男/女)。观测数据是每个年份-年龄-性别-死因格子的死亡人数。
- pop_{t, a, s} : 暴露人口 (person-years)。对应年份、年龄、性别的年中人口估计。
- r_{t, a, s} : 粗死亡率 (crude mortality rate) = y_{t, a, s} / pop_{t, a, s}。
- ASMR_{t, s} : 年龄标准化死亡率 (Age-Standardized Mortality Rate)。这是本文分析的核心可观测响应变量。其计算方式为：ASMR_{t, s} = Σ_a [ (pop_{a}^{ESP} / Σ_a pop_{a}^{ESP}) × r_{t, a, s} ]。即：以欧洲标准人群的年龄结构为权重，对粗死亡率加权平均。单位是 每 10 万人。
模型:
- 数据生成机制 (DGM)：这是一个 准泊松模型，用于计数数据。假设 y_{t, a, s} ~ Poisson(pop_{t, a, s} × λ_{t, a, s})，其中 λ_{t, a, s} 是真实死亡率。年龄标准化死亡率 ASMR_{t, s} 是 λ_{t, a, s} 的一个加权线性组合。
- 分段回归模型 (Segmented Regression)：用于分析 ASMR_{t, s} 随时间 t 的变化趋势。模型形式是：log(ASMR_{t, s}) = β_0 + β_1 × t + β_2 × (t - τ_0)_+ + ε。其中 τ_0 是断点（转折点），(t - τ_0)_+ 是截断函数（如果 t > τ_0 则 = t - τ_0，否则为0）。这个模型允许斜率在 τ_0 处改变。 β_1 是断点前斜率，β_1 + β_2 是断点后斜率。 \( β_2 \) 的显著性检验判断是否存在趋势变化。平均年度变化百分比 (AAPC) 是通过分段斜率估计出来的。
- 年龄-时期-队列模型 (APC Model)：这是一个具有 识别性非唯一性 的经典统计模型，形式为 log(λ_{t,a,g}) = μ + α_a + β_t + γ_g。其中 α_a 是年龄效应（随着年龄的自然风险变化），β_t 是时期效应（对所有年龄同时产生影响的事件，如医疗进步、政策变化），γ_g 是出生世代效应（反映特定世代特有的、与年龄无关的长期风险暴露）。模型的可识别性问题：由于 g = t - a，这三个效应线性相关，需要额外约束（如假设某两个相邻世代的效应相等）才能得到唯一解。本文采用这种模型来分离世代效应。
可观测数据： 研究者能观测到的是：
1. 瑞士所有成人（≥35岁） 在 1995-2019 年之间的死亡记录。数据来自瑞士联邦统计局 (Swiss Federal Statistical Office, FSO)。
2. 每条死亡记录包含：根本死因 (UCOD) 和最多 5 个其他（伴发）死因，全部根据国际疾病分类（ICD-10 版本经过映射调整）编码。
3. 将肥胖定义为：如果在 UCOD 或任一伴发死因中以 ICD-10 码 E65-E68 出现。如果死亡记录中包含 E65-E68 且 UCOD 是 CVD（I00-I99）或癌症（C00-D48），则归为“肥胖相关心血管死亡”或“肥胖相关癌症死亡”，反之则归为“肥胖无关”。
4. 与死亡记录匹配的人口数据：每年、每岁、每个性别的年中人口数（瑞士联邦统计局）。 观测不到的是：个体的肥胖状态（肥胖是死因记录的一部分，但不是对所有活人的测量）；个体层面的混杂因素（吸烟、社会经济地位）；或因果效应的反事实（如果此人没有肥胖会如何？）。

第二步：讲最小内核¶

最简特例：假设我们只关心一个性别的人群（比如男性），一个年龄组（比如 60-69 岁），一个死因（肥胖相关 CVD）。同时，我们只比较两个时间点：2000 年和 2015 年。
1. 记号退化为：t∈{2000, 2015}, a=60, s=M。观测数据变成：y_{2000}, y_{2015} 和 pop_{2000}, pop_{2015}。
2. 论文问题退化为：这两个年份的肥胖相关 CVD 死亡率 (ASMR) 有没有显著差异？是上升了还是下降了？
3. 证明怎么走：分段回归在这里退化为一个普通的 t 检验。我们在 2015 年计算 ASMR_{2015}，2000 年计算 ASMR_{2000}。它们的天然方差是泊松噪声（假设死亡是独立事件）。我们直接计算 ASMR_{2015} / ASMR_{2000} 的比值，并报告一个 z 检验统计量。断点 (τ_0) 的识别，本不需要——我们只有两个点。
4. 为什么成立：在这个最小特例下，复杂度完全消失。结论不过是“瑞士老年男性中，肥胖相关 CVD 死亡率在 2000 到 2015 年间下降”，可以直接从原始 Z 检验读出。全文中驾驶的“女性和男性综合模式”、“分年龄组模式”、“分死因模式”以及“世代效应控制”，都只是这个简单差值比较的推广和精细化。
核心数学困难：本文的核心统计困难不在于计算复杂性，而在于 趋势的分辨 和 世代效应的分离。考虑到数据是粗死亡率，是泊松或准泊松分布，真实信号（死亡率的变化百分点）可能很小，而噪声（每年波动的死亡人数）相对较大。此外，APC 模型本质上是一个多重共线性问题（时期、年龄、世代线性相关）。作者选择使用 APC web tool (基于 Rosenburg 方法，即施加一个约束来解决秩亏) 来获得世代效应。
最小内核：这个简单案例展示了论文的实质操作：直接比较ASMR并检验其差异是否统计显著，而非复杂模型。整篇论文在本质上是这一简单逻辑 在多维度（性别×死因×年龄组×时间点）上的重复，并用分段回归和 APC 模型来系统化地处理多个时间点和区分时期、世代效应。

三、这篇论文做了什么¶

三句话：
1. 研究了什么问题：这五年间，瑞士肥胖相关心血管疾病和癌症的死亡率趋势，以及这些趋势如何（或无如何）影响整体 CVD 和癌症死亡率的长期下降。
2. 核心工具/方法：使用瑞士死亡统计中的多死因数据，通过分段回归估计年龄标准化死亡率 (ASMR) 的年度变化及断点，并用年龄-时期-队列 (APC) 模型分离并比较出生世代的效应。
3. 主要结论：与美国模式不同，瑞士肥胖相关死亡率并未拖累总体心血管死亡率的稳步下降；并且，在年轻一代中，肥胖相关死亡率较老一辈更低。
关键设定与假设：
- 核心定义：肥胖相关死亡 = 死亡证明上任何一处提到肥胖（ICD-10: E65-E68），且根本死因（UCOD）是 CVD 或癌症。这个定义是不严谨的并会引入 1) 遗漏：如果肥胖是病因但医生没在死亡证明上写，就被纳入肥胖无关组；2) 错误归因：如果一个人既肥胖又死于其它与肥胖无关的罕见病，仍被归为“肥胖相关”，但其他与肥胖无关的死因被大量高估。这是本文最大的假设——肥胖的报告不完整，但报告概率在时间上和人口群体间恒定（或至少变化方向不扭曲主要趋势）。
- 分段回归假设：存在一个断点，在断点前后死亡率的变化率是恒定的。这假设死亡率不是周期性的，也不是曲线地、突变地（非断点）变化。
- APC 模型假设：经过约束处理后（constraints imposed to ensure identifiability），可分离出的世代效应反映真实的、世代固定化的风险因素暴露，而非混杂的时期效应和年龄效应不同。这是 APC 模型的经典识别问题（非唯一性），本文没有对约束的选择进行敏感性分析。
主要结果：
1. 肥胖相关 CVD 死亡率趋势：从 1995-2005 年显著上升（APC 女性: +3.0%, 男性: +5.6%），然后从 2005-2019 年显著下降（APC 女性: -7.2%, 男性: -4.8%）。趋势变化的转折点（2005 年）非常显著。
2. 肥胖相关癌症死亡率趋势：与 CVD 相似但更温和：早期轻微上升，后期下降放缓/持平。关键信号在于，肥胖无关癌症死亡率在 2005 年后也出现了下降放缓，这导致总癌症死亡率在 2005 年后下降停滞。这个结果说明，总癌症趋势的放缓不能归咎于肥胖，而更多地源于肥胖无关癌症部分的趋势变化。
3. 总体 CVD 死亡率：一直稳步下降。肥胖相关死亡率的早期上升并没有减缓整体 CVD 死亡率的下降趋势——因为肥胖无关 CVD 死亡率的下降幅度更大，足以覆盖其增加。这是论文的核心发现，与美国的负面结果形成鲜明对比。
4. APC 世代效应：肥胖相关死亡率在更晚出生的世代中更低。这意味着，出生在 1960 年代及以后的人，其肥胖相关的死亡风险低于他们父母那一代。这与美国“年轻世代风险更高”的模式相反。作者将此归因于瑞士“儿童肥胖率下降”和“更好的肥胖相关疾病管理”。
证明路线与技术技巧：
- 整体路线 (三步法):
  1. 数据整理: 先把 25 年、全人口、所有死因的 700 万+ 条记录按“肥胖相关”与“肥胖无关”标记，再按性别和死因（CVD 和癌症）分 4 大组。
  2. 趋势描述: 对每大组计算每年的 ASMR。对 ASMR 的时间序列应用分段回归（Joanpoint Regression Program from NCI 标准工具），识别断点并报告分段 APC。这是对趋势的纯统计描述。
  3. 世代分离: 使用 APC 模型（来自 NCI 的 APC Web Tool）对全数据（年龄×时期×性别×死因格子）拟合。施加约束来识别世代效应（约束：相邻两个世代效应相等，如 1945-1954 与 1955-1964 效应相等）。最终以热图/胎儿图形式展示世代效应（每一代相对于参考世代的风险）。
- 关键技术技巧:
  - Joanpoint 分段回归：这是本文最复杂的统计工具。它通过网格搜索 + 假设检验（BIC 或修正的 AIC + 置换检验）确定断点的个数和位置。这里的关键技巧是： 对数线性模型，好处是估计 APC（年度百分比变化）直接来自回归系数 100*(exp(β)-1)。置信区间来自正态近似。
  - APC 模型：应用 APC Web Tool，它使用约束来克服“识别问题”。γ_g (世代效应) 的约束使其可被唯一估计。这是分析世代差异的标准化方法，但带有主观性（约束选择）。
  - MCOD 编码映射：因为研究跨越 25 年，ICD 版本从 ICD-9 过渡到 ICD-10。作者做了明确的编码映射（REFERENCES 中的 ref 22 或自己建立的桥接），但不会出现在论文中，是严格的数据处理步骤。
真实例子与应用：
- 数据：瑞士联邦统计局提供的 1995-2019 年全国死亡记录。覆盖所有 ≥35 岁的居民，数据集大小约 800,000 条死亡记录。
- 怎么应用：
  1. MCOD 赋值：对每条死亡记录，检查其伴发死因中是否存在 ICD-10 代码 E65-E68。
  2. 分组：根据性别、死亡记录的 UCOD（心血管类、癌症类、其他）和 MCOD 存在（肥胖相关 vs 无关），分成 4×2 = 8 个子组（男/女 × CVD/癌症 × 肥胖相关/无关）。
  3. ASMR 计算：对每个子组每年，计算 ASMR（每 10 万人），使用欧洲标准人口作为权重。引用自 Results 第一部分。
  4. 分段回归：对每个子组的 25 年 ASMR 序列使用 Joanpoint 程序。输出是断点位置和分段 APC（及 95%CI）。这部分的结果构成了论文的 Figure 2 和 Table 2。
  5. APC 模型：对每种死因和性别的全死亡率矩阵（年份×年龄）应用 APC 模型。输出是世代效应率比（Rate Ratio）。这部分结果构成了论文的 Figure 3。
- 得到什么结果：
  - 核心结果：肥胖相关 CVD 死亡率在 2005 年后显著下降；肥胖无关 CVD 死亡率持续下降，未受干扰。这个结果直接驳斥了美国案例在本土的适用性。
  - APC 世代结果：对于肥胖相关 CVD 和癌症，最晚生育世代（1980年及以后出生）的死亡率是最低的，与之前世代有显著差异。这提供了乐观的政策信号。
- 例子想说明什么：这个例子不是为了“验证理论”（因为本文不是理论驱动），而是为了 展示一个与大众认知（或美国模式）相反的公共卫生现象 并解释其缘由（管理改善、儿童肥胖率下降）。它也展示了 MCOD 数据的 分析能力——如果用 UCOD 分析，肥胖的贡献将被完全掩盖。
🔎 结论是否比证明窄：是。全文中多处结论的“强度”大于实际证明的严谨性。
- 因果归因：在 Discussion 中，作者将观察到的低世代效应归因于“improved management of obesity-related conditions”和“reduced childhood obesity prevalence”。但是，本文并没有任何证据表明因果关系。观察到的世代效应完全可能是：1) 出生在更晚世代的人吸烟率降低 (吸烟对 CVD/Cancer 的驱动更强) 或者是；2) 更富有的、更健康的世代导致的混淆（医疗可及性更好）。结论并没有确认肥胖管理的改善是原因。
- 肥胖报告不完整性：作者坦承“underreporting of obesity on death certificates”。结论里的“肥胖相关死亡率”只是“被记录的肥胖相关死亡率”。如果报告不完整性在不同世代间有系统性差异（比如，更年轻世代死于医院外更常见，医院内报告肥胖更少），那么世代效应本身就是观测偏差，而非真实的保护效应。结论没有量化这种偏倚的可能影响。

四、开放问题¶

MCOD 报告偏倚的量化：本文完全依赖于死亡证明上对肥胖的记录。一个直接的开放问题是：能否用瑞士已有的全国健康调查数据（如瑞士健康调查 SHS，包含自报身高体重计算 BMI），与死亡记录进行链接，来量化 MCOD 报告中肥胖的敏感性、特异性，以及这种偏倚是否在不同世代、社会经济地位群体中有差异？扎根处：Discussion 第一段：“some limitations of the study need to be acknowledged. Obesity reporting on death certificates is incomplete.”
因果推断的强化：论文结论中的归因（“管理改善”、“儿童肥胖率下降”）是后验推测。一个明确的开放问题是：能否利用瑞士的政策变化（例如，2000 年后政府对 CVD 二级预防的投入变化、初级保健改革）作为准自然实验，通过工具变量或 DID 设计，将观察到的死亡率趋势更可靠地归因于这些具体的政策/管理因素？扎根处：Discussion 最后几段对“管理改善”的引用，以及 refs 24-27 引用的是“指南 (guidelines)”和“处置 (management)”，但未建立因果关系。
流行病学信号 vs 流行度信号：本文关心的是肥胖的死亡标记（MCOD 上的编码），而非肥胖的流行度。开放问题是：人口水平的肥胖真实流行度变化趋势，与 MCOD 中的肥胖出现趋势，它们之间的时间滞后结构是什么？如果将 BMI 类别的真实患病率（从 SHS）作为解释变量纳入分段回归，能否改进对未来 MCOD 趋势的预测？扎根处：Introduction 中提到了“obesity prevalence is rising globally”，但本文只用了死亡证书的结果。
更精细的'肥胖'分类与竞争风险：文中肥胖被定义为 ICD-10 E65-E68。这包含 E66 (肥胖) 和 E65 (局部肥胖) 等。一个开放的精细问题是：区分'严重肥胖 (E66.0, E66.1)'与'一般肥胖 (E66.8, E66.9)'以及'代谢健康型肥胖 vs 不健康型肥胖'，是否能揭示不同的趋势？ 例如，严重肥胖对年轻世代 CVD 死亡风险的贡献是否正在上升（即使整体趋势下降）？扎根处：Methods 部分关于 ICD-10 代码的定义，以及 Discussion 中对肥胖“健康”和“不健康”区别的淡化。

Maintained by 陈星宇 · Homepage · Source on GitHub