Trends in obesity-related cardiovascular and cancer mortality in Switzerland 1995-2019: an analysis of multiple causes of death¶
作者: Bernadette W A van der Linden, Célia A Viehl, Nazihah Noor, Tim Adair, Salvatore Vaccarella et al.
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 2/10
机构绿灯: University of Melbourne(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/aje/kwag003
一、领域脉络与小综述¶
这个方向是什么¶
本文属于 应用流行病学中的死亡率趋势分析 子方向,根本问题是:在肥胖患病率持续上升的全球背景下,肥胖对特定死因(心血管疾病、癌症)的死亡率贡献如何随时间变化?它能否拖累或扭转整体死亡率的长期下降趋势?当前成熟度:这是一个已有几十年历史的经典流行病学分析领域,分析工具(年龄标准化死亡率、分段回归、年龄-时期-队列模型)都已成熟,本文的核心贡献不在于发明新方法,而在于将这套框架应用于 瑞士 这一特定环境,并借助 多种死亡原因分析 (multiple cause of death, MCOD) 这一较新的数据使用范式,回答一个具体的公共卫生问题。
发展脉络 (history)¶
- 奠基工作 (公共卫生里程碑):
- Flegal et al. (2000s) 等经典工作:确立肥胖与心血管疾病及部分癌症的流行病学关联,并为肥胖患病率上升趋势提供了全球范围的估计。
References [1-3]引用了 "全球肥胖流行" 的核心证据,如 NCD Risk Factor Collaboration (2017) 的全球肥胖趋势报告 (ref 1)。
- 主要进展 (美国案例引发关注):
- Masters et al. (2013, 2018) (
refs 8, 9): 这批发表在《Journal of the American Medical Association》和《American Journal of Epidemiology》的工作,是本文最关键的对话对象。作者指出:"studies from the United States [...] have shown that steep increases in obesity have contributed to adverse trends in obesity-related mortality and to slowing decline in overall CVD mortality, particularly among younger generations"(论文 Intro 部分)。这直接定义了一个“令人担忧”的基线(美国模式)。
- Masters et al. (2013, 2018) (
- 当前 frontier (探索不同社会背景下的模式异质性):
- 当前关键问题是:美国的模式(肥胖相关死亡上升拖累整体心血管死亡下降)是否是一种普适现象,还是特定于美国的社会、医疗与营养环境?其他高收入国家(如瑞士)的情况如何?
- 瑞士的优势:作者强调瑞士的肥胖流行速度较慢,且儿童肥胖率出现下降(
Introduction部分引用了瑞士的儿童肥胖数据)。这使得瑞士成为一个天然的“反例”来对比美国。
- 本文的位置:
- 本文是一个 对比性应用验证。它的位置不是提出新方法,而是 在一个新国家(瑞士)用相同的数据范式(MCOD)和标准工具(分段回归、APC模型),检验从美国案例中提炼出的假说是否成立。
子线索聚类¶
这些被引文献大致落在 2 条子线索上:
- 线索 1: 肥胖与死亡率的关系及其时间趋势 (因果流行病学核心)
- 包括 全球肥胖趋势 (refs 1-3)、各国肥胖相关的死亡率估计 (refs 4-7, 10-12 涵盖了美国、加拿大、英国、澳大利亚、意大利等)。这一簇工作研究的是肥胖流行率上升如何转化为死亡率变化。
- 瑞士本土的肥胖流行病学研究 (refs 15-17): 提供了瑞士肥胖患病率的具体数据,特别是 ref 16 (Ehrsam et al., 2004) 报告了瑞士儿童肥胖率下降,这与作者的核心论点之一直接相关。
- 线索 2: 多种死亡原因分析 (MCOD) 方法学
- 这是一个相对较新的子线索。与传统死因分析仅使用“根本死因 (underlying cause of death, UCOD)”不同,MCOD 使用死亡证明上记录的所有死因(contributing causes)。refs 18, 19 (Anker et al., 2018; Stallard, 2017) 是这个领域的代表性方法学工作,它们演示了 MCOD 如何提供比 UCOD 更丰富的信息,特别是当一种疾病(肥胖)是另一种(CVD、癌症)的促进因素时。
这个方向在追问的核心问题¶
- 肥胖流行率的上升是否必然导致肥胖相关死亡率的上升? 美国的答案显然是“是”。但在医疗管理(改善的 CVD 二级预防)和不同人群肥胖流行模式(肥胖增速更慢、儿童肥胖率下降)的背景下,这个答案是否还有普适性?
- 多死因分析 (MCOD) 是否能比传统死因分析 (UCOD) 提供更多关于肥胖对死亡率影响的信号? 这是本文的方法论核心关切——即使肥胖不是根本死因,它作为伴发死因(contributing cause)的贡献有多大?
- 世代效应是否比时期效应更重要? 美国数据显示年轻世代(出生更晚)的肥胖相关死亡率更高,这暗示了早期生命期的暴露和惯性对长期健康的影响。本文的 APC 模型专门用来检验瑞士是否也出现这种代际风险转移。
- 已知瓶颈:主要的瓶颈在于 数据可比性 和 归因方法的模糊性。MCOD 数据在不同时期的编码标准(ICD 版本变更)、不同国家的死亡证明填写惯例会有变化。另外,肥胖本身作为一种“死因”在死亡证明上的记录率远低于其真实作用(作者在
Introduction中提到“obesity reporting is incomplete”),导致可能存在系统性低估。
⚠️ 作者的 framing¶
- 作者把缺口 frame 成什么:
- 作者将美国案例(高肥胖相关死亡率、拖累总体下降、年轻世代风险更高)定义为 “典型威胁”。
- 而瑞士被定位为 “非典型但具有公共卫生学意义的对照”(更慢的肥胖流行、儿童肥胖率下降)。
- 因此,本文的科研问题是:“如果在一个肥胖流行更慢、儿童肥胖率已见顶的国家,我们是否仍能看到类似美国的模式?” 这使得本课题看起来是一个“显然的下一步”验证,而它的结果(没看到类似模式)则是给公共卫生政策带来的重要信号。
- 哪些竞争路线被淡化或回避:
- 更深层的因果识别问题被回避:本文并未尝试建立“肥胖→死亡”的因果效应。它只是一个 趋势关联性分析。作者小心翼翼地将所有讨论框定为“肥胖相关 (obesity-related)”而非“obesity-attributable”。作者没有讨论混杂因素(如社会经济地位、吸烟的变化、医疗可及性的改善)对趋势的影响。
- 肥胖测量问题被淡化:文中使用的肥胖定义是死亡证明上的“肥胖”编码。这在论文中被坦率地承认是“incomplete reporting”,但并未探讨这种报告偏倚是如何随时间或人群系统变化的。作者选择淡化这个测量异质性问题,直接假设报告概率是稳定的或均匀的(证据:直接使用原始计数)。
- 什么明显该被引/该存在、却没出现在 intro 里?
- 该领域内关于 MCOD 与 UCOD 方法比较的经验评估文献。虽然引用了 Anker (2018) 和 Stallard (2017),但缺少定量的、专门比较肥胖相关死因在 MCOD vs UCOD 中差异的工作(例如,是否在 UCOD 分析中肥胖的作用被严重低估?哪些癌症在 MCOD 中才更显著?)
- 对肥胖与心血管/Cancer 因果关系机制的流行病学综述(比如,更常引用孟德尔随机化或中介分析来独立确认 MCOD 模式背后的因果路径)。这会让读者更容易理解为什么 MCOD 中肥胖与某癌种的关联是有生物学先验的。
- 未引入“特定死因归因分数 (Population Attributable Fraction, PAF)”的概念,这些概念常用来定量的评估肥胖对死亡率的贡献比例。本文只用了“相关 (related)”而未量化归因。
张力¶
- 未见明显对立引用。所有被引用的工作(全球趋势、美国警示、瑞士数据、MCOD 方法学)在方向上基本一致,都是围绕着“肥胖与死亡趋势的潜在负面关联”这个共识展开。本文的核心张力是与美国结果的比较(结果不同,但这并非文献中的矛盾,而是异质性)。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
t: 年份 (1995-2019)。这是时间维度(时期效应)。a: 年龄组 (age groups)。比如 35-44, 45-54, …, 85+。年龄调整时的标准人群是欧洲标准人口 (European Standard Population, ESP 2013)。g: 出生世代 (birth cohort)。通过g = t - a近似定义。y_{t, a, s, c}: 死亡计数 (deaths counts)。对于 糖尿病特定并发症c(心血管疾病 CVD、癌症 Cancer) 和 性别s(男/女)。观测数据是每个年份-年龄-性别-死因格子的死亡人数。pop_{t, a, s}: 暴露人口 (person-years)。对应年份、年龄、性别的年中人口估计。r_{t, a, s}: 粗死亡率 (crude mortality rate) =y_{t, a, s} / pop_{t, a, s}。ASMR_{t, s}: 年龄标准化死亡率 (Age-Standardized Mortality Rate)。这是本文分析的核心可观测响应变量。其计算方式为:ASMR_{t, s} = Σ_a [ (pop_{a}^{ESP} / Σ_a pop_{a}^{ESP}) × r_{t, a, s} ]。即:以欧洲标准人群的年龄结构为权重,对粗死亡率加权平均。单位是每 10 万人。
-
模型:
- 数据生成机制 (DGM):这是一个 准泊松模型,用于计数数据。假设
y_{t, a, s} ~ Poisson(pop_{t, a, s} × λ_{t, a, s}),其中λ_{t, a, s}是真实死亡率。年龄标准化死亡率ASMR_{t, s}是λ_{t, a, s}的一个加权线性组合。 - 分段回归模型 (Segmented Regression):用于分析
ASMR_{t, s}随时间t的变化趋势。模型形式是:log(ASMR_{t, s}) = β_0 + β_1 × t + β_2 × (t - τ_0)_+ + ε。其中τ_0是断点(转折点),(t - τ_0)_+是截断函数(如果t > τ_0则= t - τ_0,否则为0)。这个模型允许斜率在τ_0处改变。β_1是断点前斜率,β_1 + β_2是断点后斜率。 \( β_2 \) 的显著性检验判断是否存在趋势变化。平均年度变化百分比 (AAPC) 是通过分段斜率估计出来的。 - 年龄-时期-队列模型 (APC Model):这是一个具有 识别性非唯一性 的经典统计模型,形式为
log(λ_{t,a,g}) = μ + α_a + β_t + γ_g。其中α_a是年龄效应(随着年龄的自然风险变化),β_t是时期效应(对所有年龄同时产生影响的事件,如医疗进步、政策变化),γ_g是出生世代效应(反映特定世代特有的、与年龄无关的长期风险暴露)。模型的可识别性问题:由于g = t - a,这三个效应线性相关,需要额外约束(如假设某两个相邻世代的效应相等)才能得到唯一解。本文采用这种模型来分离世代效应。
- 数据生成机制 (DGM):这是一个 准泊松模型,用于计数数据。假设
-
可观测数据: 研究者能观测到的是:
- 瑞士所有成人(≥35岁) 在 1995-2019 年之间的死亡记录。数据来自瑞士联邦统计局 (Swiss Federal Statistical Office, FSO)。
- 每条死亡记录包含:根本死因 (UCOD) 和最多 5 个其他(伴发)死因,全部根据国际疾病分类(ICD-10 版本经过映射调整)编码。
- 将肥胖定义为:如果在 UCOD 或任一伴发死因中以 ICD-10 码
E65-E68出现。如果死亡记录中包含E65-E68且UCOD是 CVD(I00-I99)或癌症(C00-D48),则归为“肥胖相关心血管死亡”或“肥胖相关癌症死亡”,反之则归为“肥胖无关”。 - 与死亡记录匹配的人口数据:每年、每岁、每个性别的年中人口数(瑞士联邦统计局)。 观测不到的是:个体的肥胖状态(肥胖是死因记录的一部分,但不是对所有活人的测量);个体层面的混杂因素(吸烟、社会经济地位);或因果效应的反事实(如果此人没有肥胖会如何?)。
第二步:讲最小内核¶
-
最简特例:假设我们只关心一个性别的人群(比如男性),一个年龄组(比如 60-69 岁),一个死因(肥胖相关 CVD)。同时,我们只比较两个时间点:2000 年和 2015 年。
- 记号退化为:
t∈{2000, 2015},a=60,s=M。观测数据变成:y_{2000},y_{2015}和pop_{2000},pop_{2015}。 - 论文问题退化为:这两个年份的肥胖相关 CVD 死亡率 (
ASMR) 有没有显著差异?是上升了还是下降了? - 证明怎么走:分段回归在这里退化为一个普通的 t 检验。我们在 2015 年计算
ASMR_{2015},2000 年计算ASMR_{2000}。它们的天然方差是泊松噪声(假设死亡是独立事件)。我们直接计算ASMR_{2015} / ASMR_{2000}的比值,并报告一个 z 检验统计量。断点 (τ_0) 的识别,本不需要——我们只有两个点。 - 为什么成立:在这个最小特例下,复杂度完全消失。结论不过是“瑞士老年男性中,肥胖相关 CVD 死亡率在 2000 到 2015 年间下降”,可以直接从原始 Z 检验读出。全文中驾驶的“女性和男性综合模式”、“分年龄组模式”、“分死因模式”以及“世代效应控制”,都只是这个简单差值比较的推广和精细化。
- 记号退化为:
-
核心数学困难:本文的核心统计困难不在于计算复杂性,而在于 趋势的分辨 和 世代效应的分离。考虑到数据是粗死亡率,是泊松或准泊松分布,真实信号(死亡率的变化百分点)可能很小,而噪声(每年波动的死亡人数)相对较大。此外,
APC模型本质上是一个多重共线性问题(时期、年龄、世代线性相关)。作者选择使用 APC web tool (基于 Rosenburg 方法,即施加一个约束来解决秩亏) 来获得世代效应。 -
最小内核:这个简单案例展示了论文的实质操作:直接比较
ASMR并检验其差异是否统计显著,而非复杂模型。整篇论文在本质上是这一简单逻辑 在多维度(性别×死因×年龄组×时间点)上的重复,并用分段回归和 APC 模型来系统化地处理多个时间点和区分时期、世代效应。
三、这篇论文做了什么¶
-
三句话:
- 研究了什么问题:这五年间,瑞士肥胖相关心血管疾病和癌症的死亡率趋势,以及这些趋势如何(或无如何)影响整体 CVD 和癌症死亡率的长期下降。
- 核心工具/方法:使用瑞士死亡统计中的多死因数据,通过分段回归估计年龄标准化死亡率 (ASMR) 的年度变化及断点,并用年龄-时期-队列 (APC) 模型分离并比较出生世代的效应。
- 主要结论:与美国模式不同,瑞士肥胖相关死亡率并未拖累总体心血管死亡率的稳步下降;并且,在年轻一代中,肥胖相关死亡率较老一辈更低。
-
关键设定与假设:
- 核心定义:肥胖相关死亡 = 死亡证明上任何一处提到肥胖(ICD-10: E65-E68),且根本死因(UCOD)是 CVD 或癌症。这个定义是不严谨的并会引入 1) 遗漏:如果肥胖是病因但医生没在死亡证明上写,就被纳入肥胖无关组;2) 错误归因:如果一个人既肥胖又死于其它与肥胖无关的罕见病,仍被归为“肥胖相关”,但其他与肥胖无关的死因被大量高估。这是本文最大的假设——肥胖的报告不完整,但报告概率在时间上和人口群体间恒定(或至少变化方向不扭曲主要趋势)。
- 分段回归假设:存在一个断点,在断点前后死亡率的变化率是恒定的。这假设死亡率不是周期性的,也不是曲线地、突变地(非断点)变化。
- APC 模型假设:经过约束处理后(constraints imposed to ensure identifiability),可分离出的世代效应反映真实的、世代固定化的风险因素暴露,而非混杂的时期效应和年龄效应不同。这是 APC 模型的经典识别问题(非唯一性),本文没有对约束的选择进行敏感性分析。
-
主要结果:
- 肥胖相关 CVD 死亡率趋势:从 1995-2005 年显著上升(APC 女性: +3.0%, 男性: +5.6%),然后从 2005-2019 年显著下降(APC 女性: -7.2%, 男性: -4.8%)。趋势变化的转折点(2005 年)非常显著。
- 肥胖相关癌症死亡率趋势:与 CVD 相似但更温和:早期轻微上升,后期下降放缓/持平。关键信号在于,肥胖无关癌症死亡率在 2005 年后也出现了下降放缓,这导致总癌症死亡率在 2005 年后下降停滞。这个结果说明,总癌症趋势的放缓不能归咎于肥胖,而更多地源于肥胖无关癌症部分的趋势变化。
- 总体 CVD 死亡率:一直稳步下降。肥胖相关死亡率的早期上升并没有减缓整体 CVD 死亡率的下降趋势——因为肥胖无关 CVD 死亡率的下降幅度更大,足以覆盖其增加。这是论文的核心发现,与美国的负面结果形成鲜明对比。
- APC 世代效应:肥胖相关死亡率在更晚出生的世代中更低。这意味着,出生在 1960 年代及以后的人,其肥胖相关的死亡风险低于他们父母那一代。这与美国“年轻世代风险更高”的模式相反。作者将此归因于瑞士“儿童肥胖率下降”和“更好的肥胖相关疾病管理”。
-
证明路线与技术技巧:
- 整体路线 (三步法):
- 数据整理: 先把 25 年、全人口、所有死因的 700 万+ 条记录按“肥胖相关”与“肥胖无关”标记,再按性别和死因(CVD 和癌症)分 4 大组。
- 趋势描述: 对每大组计算每年的 ASMR。对 ASMR 的时间序列应用分段回归(Joanpoint Regression Program from NCI 标准工具),识别断点并报告分段 APC。这是对趋势的纯统计描述。
- 世代分离: 使用 APC 模型(来自 NCI 的 APC Web Tool)对全数据(年龄×时期×性别×死因格子)拟合。施加约束来识别世代效应(约束:相邻两个世代效应相等,如 1945-1954 与 1955-1964 效应相等)。最终以热图/胎儿图形式展示世代效应(每一代相对于参考世代的风险)。
- 关键技术技巧:
- Joanpoint 分段回归:这是本文最复杂的统计工具。它通过网格搜索 + 假设检验(BIC 或修正的 AIC + 置换检验)确定断点的个数和位置。这里的关键技巧是: 对数线性模型,好处是估计 APC(年度百分比变化)直接来自回归系数
100*(exp(β)-1)。置信区间来自正态近似。 - APC 模型:应用
APC Web Tool,它使用约束来克服“识别问题”。γ_g(世代效应) 的约束使其可被唯一估计。这是分析世代差异的标准化方法,但带有主观性(约束选择)。 - MCOD 编码映射:因为研究跨越 25 年,ICD 版本从 ICD-9 过渡到 ICD-10。作者做了明确的编码映射(
REFERENCES中的ref 22或自己建立的桥接),但不会出现在论文中,是严格的数据处理步骤。
- Joanpoint 分段回归:这是本文最复杂的统计工具。它通过网格搜索 + 假设检验(BIC 或修正的 AIC + 置换检验)确定断点的个数和位置。这里的关键技巧是: 对数线性模型,好处是估计 APC(年度百分比变化)直接来自回归系数
- 整体路线 (三步法):
-
真实例子与应用:
- 数据:瑞士联邦统计局提供的 1995-2019 年全国死亡记录。覆盖所有 ≥35 岁的居民,数据集大小约 800,000 条死亡记录。
- 怎么应用:
- MCOD 赋值:对每条死亡记录,检查其伴发死因中是否存在 ICD-10 代码
E65-E68。 - 分组:根据性别、死亡记录的 UCOD(心血管类、癌症类、其他)和 MCOD 存在(肥胖相关 vs 无关),分成 4×2 = 8 个子组(男/女 × CVD/癌症 × 肥胖相关/无关)。
- ASMR 计算:对每个子组每年,计算 ASMR(每 10 万人),使用欧洲标准人口作为权重。引用自
Results第一部分。 - 分段回归:对每个子组的 25 年 ASMR 序列使用 Joanpoint 程序。输出是断点位置和分段 APC(及 95%CI)。这部分的结果构成了论文的
Figure 2和Table 2。 - APC 模型:对每种死因和性别的全死亡率矩阵(年份×年龄)应用 APC 模型。输出是世代效应率比(Rate Ratio)。这部分结果构成了论文的
Figure 3。
- MCOD 赋值:对每条死亡记录,检查其伴发死因中是否存在 ICD-10 代码
- 得到什么结果:
- 核心结果:肥胖相关 CVD 死亡率在 2005 年后显著下降;肥胖无关 CVD 死亡率持续下降,未受干扰。这个结果直接驳斥了美国案例在本土的适用性。
- APC 世代结果:对于肥胖相关 CVD 和癌症,最晚生育世代(1980年及以后出生)的死亡率是最低的,与之前世代有显著差异。这提供了乐观的政策信号。
- 例子想说明什么:这个例子不是为了“验证理论”(因为本文不是理论驱动),而是为了 展示一个与大众认知(或美国模式)相反的公共卫生现象 并解释其缘由(管理改善、儿童肥胖率下降)。它也展示了 MCOD 数据的 分析能力——如果用 UCOD 分析,肥胖的贡献将被完全掩盖。
-
🔎 结论是否比证明窄:是。全文中多处结论的“强度”大于实际证明的严谨性。
- 因果归因:在 Discussion 中,作者将观察到的低世代效应归因于“improved management of obesity-related conditions”和“reduced childhood obesity prevalence”。但是,本文并没有任何证据表明因果关系。观察到的世代效应完全可能是:1) 出生在更晚世代的人吸烟率降低 (吸烟对 CVD/Cancer 的驱动更强) 或者是;2) 更富有的、更健康的世代导致的混淆(医疗可及性更好)。结论并没有确认肥胖管理的改善是原因。
- 肥胖报告不完整性:作者坦承“underreporting of obesity on death certificates”。结论里的“肥胖相关死亡率”只是“被记录的肥胖相关死亡率”。如果报告不完整性在不同世代间有系统性差异(比如,更年轻世代死于医院外更常见,医院内报告肥胖更少),那么世代效应本身就是观测偏差,而非真实的保护效应。结论没有量化这种偏倚的可能影响。
四、开放问题¶
-
MCOD 报告偏倚的量化:本文完全依赖于死亡证明上对肥胖的记录。一个直接的开放问题是:能否用瑞士已有的全国健康调查数据(如瑞士健康调查 SHS,包含自报身高体重计算 BMI),与死亡记录进行链接,来量化 MCOD 报告中肥胖的敏感性、特异性,以及这种偏倚是否在不同世代、社会经济地位群体中有差异? 扎根处:Discussion 第一段:“some limitations of the study need to be acknowledged. Obesity reporting on death certificates is incomplete.”
-
因果推断的强化:论文结论中的归因(“管理改善”、“儿童肥胖率下降”)是后验推测。一个明确的开放问题是:能否利用瑞士的政策变化(例如,2000 年后政府对 CVD 二级预防的投入变化、初级保健改革)作为准自然实验,通过工具变量或 DID 设计,将观察到的死亡率趋势更可靠地归因于这些具体的政策/管理因素? 扎根处:Discussion 最后几段对“管理改善”的引用,以及
refs 24-27引用的是“指南 (guidelines)”和“处置 (management)”,但未建立因果关系。 -
流行病学信号 vs 流行度信号:本文关心的是肥胖的死亡标记(MCOD 上的编码),而非肥胖的流行度。开放问题是:人口水平的肥胖真实流行度变化趋势,与 MCOD 中的肥胖出现趋势,它们之间的时间滞后结构是什么?如果将 BMI 类别的真实患病率(从 SHS)作为解释变量纳入分段回归,能否改进对未来 MCOD 趋势的预测? 扎根处:
Introduction中提到了“obesity prevalence is rising globally”,但本文只用了死亡证书的结果。 -
更精细的'肥胖'分类与竞争风险:文中肥胖被定义为 ICD-10 E65-E68。这包含
E66(肥胖) 和E65(局部肥胖) 等。一个开放的精细问题是:区分'严重肥胖 (E66.0, E66.1)'与'一般肥胖 (E66.8, E66.9)'以及'代谢健康型肥胖 vs 不健康型肥胖',是否能揭示不同的趋势? 例如,严重肥胖对年轻世代 CVD 死亡风险的贡献是否正在上升(即使整体趋势下降)?扎根处:Methods 部分关于 ICD-10 代码的定义,以及 Discussion 中对肥胖“健康”和“不健康”区别的淡化。
Maintained by 陈星宇 · Homepage · Source on GitHub