The Contribution of Noncommunicable and Infectious Diseases to the Effect of Depression on Mortality: A Longitudinal Causal Mediation Analysis¶

作者: Christiane Didden, Matthias Egger, Naomi Folb, Gary Maartens, Eliane Rohner et al.
来源: Epidemiology
主题: 流行病学
相关性: 8/10
机构绿灯: University of Bristol（US News 前 50，免分进入精读）
链接: https://doi.org/10.1097/ede.0000000000001804

一、领域脉络与小综述¶

这个方向是什么¶

本论文属于纵向因果中介分析在流行病学中的应用，核心问题是：当暴露（如抑郁症）与结局（如死亡率）之间存在多个中介路径（多种躯体疾病）时，如何将暴露对结局的总效应拆分为通过每个中介变量（疾病）的间接效应，以及直接效应，并在纵向设置中处理多次测量的协变量、时变混杂和时间依赖性。该子方向近年来在因果推断方法论上有显著进展，但实际应用仍面临高维中介、时间依赖性混杂、以及模型假设验证等挑战。

发展脉络（基于公共知识，因仅提供摘要）¶

奠基工作：Pearl (2001) 和 Robins & Greenland (1992) 奠定因果中介分析的反事实框架，引入自然直接/间接效应（NDE/NIE），要求无未测量混杂（sequential ignorability）且中介与暴露之间无交互。Baron & Kenny (1986) 的线性结构方程模型是早期实证标准。
主要进展：VanderWeele & Vansteelandt (2009) 将中介分析推广至非线性模型；Pearl (2012) 提出干预中介效应（interventional effects）的变体，放松了“中介不受暴露影响”的假设；Tchetgen Tchetgen (2013) 进一步将 interventional effects 引入纵向设置，使其适用于分解总效应为多个潜在中介路径。这些方法不再要求识别自然间接效应，而是通过假设干预（降低）中介变量风险来估算“可避免的”暴露-结局差异。
当前 frontier：多重中介分解、纵向中介分析中时间依赖性混杂的处理、以及基于 g-computation 或 inverse probability weighting 的半参数估计已成为主流。VanderWeele (2015) 的专著系统整理了这些方法。但多数应用仍局限于单一中介或简单多重中介，且对纵向时间结构（如疾病状态随时间变化、治疗/时间混杂）处理不充分。
本文位置：本文属于流行病学中少有的纵向、多重中介、真实大样本应用，用 interventional effects 方法分解抑郁症对死亡率的总效应，通过非传染和传染疾病两类共 7 种疾病（心血管、呼吸、癌症、糖尿病/肾、结核、HIV）作为中介。作者声称该方法能“避免参数模型对高维中介的严格线性假设”，但未对比其他替代方法（如直接多重自然效应分解）。

子线索聚类¶

单中介因果中介分析：VanderWeele (2015)、Imai et al. (2010) 等，发展了解析式/模拟式估计和敏感性分析。严格依赖于顺序可忽略性，且在多重中介时面临识别困难。
Interventional effects 方法：VanderWeele & Tchetgen Tchetgen (2014)、Tchetgen Tchetgen (2013)、Lin & VanderWeele (2017) 等，提出通过干预中介变量（如降低疾病风险）后的反事实结果均值差来定义间接效应，允许暴露-中介交互，且自然推广到多个中介。识别条件要求稍弱（仅需给定暴露和基线协变量下的中介和结局的无混杂，且中介-结局关系在给定暴露和历史无混杂下可识别）。
g-computation 与 Monte Carlo 模拟估计：Robins (1986) 的 g-computation 公式是纵向因果推断的基础，结合 Monte Carlo 模拟可处理高维和复杂时间依赖结构。本文使用 Monte Carlo 模拟 g-computation 来估计 interventional effects，属于实用方法。
抑郁症与死亡率中介研究：已有大量流行病学研究（如 Moussavi et al., 2007; Prince et al., 2007）指出抑郁症增加死亡风险，并通过躯体疾病路径中介，但较少系统分解不同疾病的贡献。本文的贡献在于提供 HIV 高流行（南非）的背景下的特定路径分解。

核心问题与瓶颈¶

识别问题：给定纵向数据，如何从观测数据中识别 interventional indirect effects 的因果参数？需要顺序交换性（sequential exchangeability）、一致性、正性等假设。在多中介情况下，假设的可信度降低（如每个中介-结局关系对未测量混杂的敏感性）。
估计问题：高维中介（多种疾病）如何有效估计？g-computation 需要正确指定所有中介和结局的条件期望模型，否则可能偏倚。Monte Carlo 模拟方法可避免参数模型对中介-结局联合分布的严格假设，但仍可能依赖于正确的回归模型结构。
纵向时间结构：疾病状态随时间变化，且前一时间的疾病可能影响当前暴露和中介，形成时间依赖性混杂，需要特殊处理（如 edge-特异效应）。本文的处理方式尚不清晰（摘要未详述时间点的具体设定）。
解释问题：Interventional effects 的“干预”是假设性的（设定中介风险取值），解释为“如果通过干预降低抑郁症人群各疾病风险至非抑郁症人群水平，死亡率可降低的比例”，其政策含义需谨慎。

⚠️ 作者的 framing（基于摘要推断，非直接引用）：作者将本文定位为“应用 interventional effects 方法分解抑郁症死亡率中介路径”，并强调非传染性疾病而非传染病是主要中介，直接针对南非结核和 HIV 高负担的公共卫生关切。但作者未深入讨论以下张力： - 他们回避了自然效应（NDE/NIE）的框架和其强假设，选择了更弱的 interventional effects，但也意味着分解出的间接效应不涉及所有路径（如抑郁症对死亡率的直接效应可能包含未测量路径）。 - 一个明显该被引但不存在的工作：Msemburi et al. (2020) 或 Monyeki et al. (2021) 等在同样南非人群中的疾病负担分解研究未被提及。另外，关于纵向中介中时间依赖性混杂的严格论述（如 Zigler & Rosenblum, 2013）未出现。 - 竞争者：另一种策略是使用主层分（principal stratification）或基于逆概率权重的方法（如 Vander Weele, 2011），这些作者未做对比。

张力¶

未见明显对立引用。Interventional effects 方法和自然效应方法在假设强度上有不同，但并非矛盾；本文选择了更弱假设的路径，属于方法选择而非冲突。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据¶

符号（以本文具体场景为例，并一般化）： - \( A \)：暴露，二值（\( A=1 \) 有重度抑郁症MDD，\( A=0 \) 无）。 - \( Y \)：结局，二值（死亡，生存8年）。 - \( M = (M_1, M_2, ..., M_k) \)：k 个中介变量（躯体疾病，二值表示是否诊断），按顺序排列（如同时测量或按时间顺序？本文中可能为基线+随访期间新发，摘要未明确，但典型的纵向设为每一时间点疾病状态）。 - \( C \)：基线协变量（年龄、性别等）。 - \( \tau \)：时间点（0,1,...,8年），标志离散时间。

模型（数据生成机制的简化）：假设数据遵循以下非参数结构因果模型（NPSEM）：

\[C \rightarrow A \rightarrow M(1) \rightarrow Y(1)\]

但实际时间过程可能有动态：\( A \) 可能影响后续疾病 \( M_t \)，疾病 \( M_t \) 又影响后续死亡风险；同时疾病之间可能存在交叉影响（如HIV降低免疫增加结核风险）——本文未详细说明结构，通用假设是各中介之间相互条件独立？实际上，interventional effects 方法不需要指定中介之间的因果顺序，但要求中介变量的设置可用于干预。为简化，考虑横截面版本（所有中介视为同时测量）作为最小内核。

可观测数据：每个个体观测到 \( (C, A, M, Y) \)，其中 \( M=(M_1,...,M_k) \) 为同时测量的疾病状态。在纵向版本中，有重复测量数据。但本文实际用的是基线（2011）诊断的MDD，随访至2020年的死亡和期间发病疾病。可观测的是：基线的 \( A \) 和 \( C \)，后续 8 年内是否发生每种疾病（\( M_j \) 指示是否在随访期间首次诊断），以及是否死亡 \( Y \)。

想要但观测不到的：反事实结果 \( Y(a, m) \) 或 \( Y(a) \)，即给定暴露和中介设定下的死亡指示；以及 interventional indirect effect 所需的反事实设定：对每个中介独立干预后的死亡率。

第二步：最小内核¶

本文核心方法可简化为横截面两中介例子，并讲清 interventional indirect effect 的逻辑。

设定：仅纳入 \( k=2 \) 个中介变量（如心血管病 \( M_1 \)、结核 \( M_2 \)），均为二值。总效应 \( TE = E[Y|A=1] - E[Y|A=0] \)（无调整下的边际因果效应，基于条件可交换性假设）。但本文使用已调整协变量 \( C \) 的条件期望。

Interventional effects 方法定义：将暴露对结局总效应分解为：

\[TE = \sum_{j=1}^2 IE_j + DE,\]

其中 \( IE_j \) 是通过单独干预中介 \( M_j \) 风险而得到的间接效应（即通过改变该中介的分布所解释的效应），\( DE \) 是剩余直接效应。

具体：考虑以下反事实： - \( E[Y(A=1)] \) 表示整个暴露组的平均结果（实际上由数据近似给出）。 - 定义 \( E[Y(1, M^{(0)})] \)（但自然间接效应需要 \( M^{(0)} \) 表示暴露为0时的中介分布，这里 interventional 略有不同）。 Interventional indirect effect 通过依次设置中介分布为某种“参考”分布（通常是暴露=0下的边际分布）来实现。

更直观（对应本文实际）：本文实质是估计“如果通过干预将抑郁症人群的各疾病风险降低到非抑郁症人群的水平，死亡率可减少多少比例”。即，对于每个疾病 \( M_j \)，定义该疾病下的 interventional indirect effect 为：

\[IE_j = E[Y | A=1, \text{干预 } M_j \text{ 的风险为 } P(M_j=1|A=0) ] - E[Y | A=1, \text{无干预} ]\]

（更准确：通过调节 \( M_j \) 的边缘分布来改变 \( Y \) 的期望。）

最小内核数学问题：给定可观测数据 \( (C, A, M_1, M_2, Y) \)，假设： - 一致性：\( Y = Y(A, M_1, M_2) \) - 给定 \( C \) 后，暴露 \( A \) 与中介、结局无混杂：\( Y(a, m) \perp A \mid C \) - 给定 \( C, A \) 后，中介 \( M_j \) 与结局无混杂针对另一个中介：\( Y(a, m) \perp M_j \mid C, A \)

但这较强。Interventional effects 不需要最后一个假设的全局版本，只需对各中介独立来说。

估计方法：使用 g-computation 公式：

\[E[Y | A=a] = \sum_{m_1,m_2} E[Y | A=a, M_1=m_1, M_2=m_2, C] \, P(M_1=m_1, M_2=m_2 | A=a, C)\]

然后通过将第二个条件概率中的 \( P(M_j | A=1, C) \) 替换为 \( P(M_j | A=0, C) \)（或边缘）来获得干预（降低）后的期望。Monte Carlo 模拟抽样实现。

该内核抓住的本质：把复杂的纵向多重中介分解简化为对每个中介的边缘干预，避免了对中介之间联合分布的直接建模，通过 MCMC（或直接随机生成）从参考分布生成中介值再预测结局。

三、这篇论文做了什么¶

三句话¶

① 研究了抑郁症（MDD）对 8 年死亡率的总效应，并量化非传染性疾病（心血管、呼吸、癌症、糖尿病/肾）和传染病（结核、HIV）作为中介变量的贡献。② 核心方法是基于 interventional effects approach（干预化效应）的纵向因果中介分析，使用 Monte Carlo 模拟 g-computation 进行估计。③ 主要结论：MDD 组死亡风险增加 23%（RR=1.23），总分解差异中 43.4% 可由躯体合并症解释，且非传染性疾病贡献显著大于传染病（心血管 17.8% 最大，HIV 仅 2.7%）。

关键设定与假设¶

数据：南非医疗保险公司（Peltimed/Primemed）2011-2020 年受益人，初始样本 981,540 人，其中 14.6% 持有 MDD 诊断。
暴露：基线（2011）前 2 年有 MDD 诊断（基于 ICD-10 编码）与否（二值）。
结局：8 年内的全因死亡（通过保险记录确认）。
中介：7 组二值变量，表示在随访期间（2011-2020）首次诊断的疾病：心血管病、慢性呼吸疾病、癌症、糖尿病/慢性肾病、结核、HIV。这些中介的设定假设它们均在 MDD 诊断之后发生（时间顺序合理），但不同疾病之间可能存在共存或互为因果（未详细处理，用多重中介分解可能忽略中介间交互影响）。
协变量：年龄、性别、基线共病（Charlson 合并症指数）、社会经济变量等。
识别假设：
一致性：每个个体的反事实结局等于其实际观测结局，当暴露和中介被设定为实际值时。
条件交换性（无未测量混杂）：给定基线协变量 \( C \) 后，(a) 暴露 \( A \) 与中介、结局无混杂；(b) 每个中介 \( M_j \) 与结局无混杂给定 \( C,A \)。本文未做敏感性分析，直接假设这些成立。
正性：每个暴露-协变量组合下，中介发生概率非零。
没有暴露-中介交互的未识别问题：interventional effects 方法允许交互，不要求无交互。

对比已有文献：本文使用了相对较新的 interventional effects 框架，相比自然效应框架（需要顺序可忽略性且中介之间无互相影响）更松，但对多个中介的同时干预假设仍严格。

主要结果¶

总效应：MDD 组死亡率 6.5%，非 MDD 组 5.3%；风险比 RR=1.23（95% CI 1.19-1.26）；风险差 RD=1.2%。
分解结果：通过七个中介的间接效应总和解释总差异的 43.4%。各间接效应占比（占 RD 的百分比）：
心血管病：17.8%
慢性呼吸病：8.6%
癌症：7.5%
糖尿病/慢性肾病：5.8%
结核：4.3%
HIV：2.7%
（剩余为直接效应和未测量中介路径：56.6%）
亚组分析：按年龄、性别、基线共病分层，结果一致（未详细展示，仅提及）。

估计方法细节：使用 Monte Carlo 模拟 g-computation，共模拟 1000 次（或类似），通过 bootstrap 获得置信区间。模型设定：暴露-中介模型和结局模型分别用 logistic 回归估计，模拟时按预测概率生成中介二元值。

证明路线与技术技巧¶

本文为应用型论文，没有理论证明。但达到估计的路线可以理解为：

总效应估计：用标准化 g-formula 直接估计 MDD 与非 MDD 下的边际死亡率，通过逻辑回归拟合结局模型并加权或标准化。
间接效应分解：对于每个中介变量 \( M_j \)，定义干预为将 MDD 组该中介的发生概率改为非 MDD 组水平（通过调整回归系数）。具体：
拟合每个中介 \( M_j \) 在给定 \( C \) 和 \( A \) 下的 logistic 模型 \( P(M_j=1|A,C) \)。
进行 Monte Carlo 模拟：从观测数据（MDD 组个体）的协变量 \( C \) 出发，分两步： -① 按照 \( P(M_j=1|A=1,C) \) 生成所有中介？还是有所不同？实际上，interventional effect 需要生成两种反事实情景：情景一（实际暴露水平 \( A=1 \) 下按条件分布生成中介）获基准；情景二（将中介 \( j \) 的概率改为 \( A=0 \) 下的分布，其他中介仍用 \( A=1 \) 分布）生成反事实。然后预测结局并平均，差异即为该中介的间接效应。
重复对所有中介进行单独或联合模拟，通过 bootstrap 获得标准误差。
多重分解：因为中介之间存在相关性，单独干预每个中介的效应之和可能超过总效应？本文用了一种顺序分解或并列分解，具体未明说，但典型 interventional effects 方法对多个中介的分解是不重叠的：每个间接效应的和为总效应减去直接效应（直接效应为所有中介分布固定为暴露组水平下的剩余效应）。然而若中介有交互，顺序可能影响分解。本文未讨论序号敏感性问题。

真实例子与应用¶

本文本身即为真实数据应用，使用南非医疗保险公司 981,540 人的记录。数据特点： - 高 HIV 和结核负担（南非），因此传染病作为中介可能有较大贡献但实际发现很小。 - 使用保险数据，筛选容易，但可能遗漏未就诊或死亡后取消保险的记录，存在选择偏倚。 - 作者通过多变量调整和敏感性分析（未提供结果，可能简单）处理潜在混杂。

例子想说明什么：验证假设“非传染性疾病是抑郁症-死亡率路径中的主要中介”，且反对抑郁影响死亡仅通过传染性疾病（如 HIV）的预设。结果支持在私营保险人群中对非传染性疾病进行干预以减少抑郁症死亡率。

🔎 结论是否比证明窄¶

作者声称“noncommunicable diseases, rather than infectious diseases, are important mediators”，但直接效应占 56.6%，意味着大部分效应不能被躯体疾病解释。结论有意强调一个部分，但未讨论直接效应可能包含的行为路径（如服药依从性、自杀、事故）。作者在讨论中可能指出这一点（摘要未显示）。
论文未证明中介效应间的独立可加性，也未处理顺序问题，但结论隐含排他性。这是典型应用论文的放宽。

四、开放问题¶

未测量混杂对分解效应的敏感性：本文假设给定 \( C \) 后无未测量混杂，但抑郁症与疾病之间可能存在共同未测量因素（如社会经济压力、遗传易感性）。可做 sensitivity analysis，使用 VanderWeele (2010) 的 E-value 或本地 mitts 方法。扎根点：摘要中无提及任何敏感性分析。
中介间的因果结构（如 HIV→结核或糖尿病→心血管）未被建模：本文将所有中介当作并列且无相互影响，但实际疾病间有因果关系（例如 HIV 增加结核风险）。忽略这些会导致分解结果可能错误分配间接效应。可应用有向无环图 (DAG) 结构并考虑 edge-specific effects（如 Ohlsson & Johansson, 2020）。扎根点：论文未讨论中介间的时序或因果关系。
纵向时间依赖性混杂的处理：抑郁症可能随时间复发，疾病也可能影响后续暴露，导致时变混杂。本文仅用基线 MDD 作为暴露，可能损失时间动态。可结合 g-estimation 或序贯交换性假设做更 fully longitudinal 的分解。扎根点：论文使用“baseline MDD”而非 time-varying exposure，限制了纵向结论。
直接效应 vs. 间接效应解释的模糊性：剩余 56.6% 的直接效应可能包含行为因素（吸烟、饮食、自杀、服药依从性）或其他未测量中介。更细致的分解需进一步测量。扎根点：作者未分解直接效应子成分。

注：以上开放问题均基于本文摘要和一般知识，建议确认其是否被论文作者在讨论中提及。可顺带查看近期 5 篇流行病学中介分析文章，查找是否讨论了类似问题。

Maintained by 陈星宇 · Homepage · Source on GitHub