AJE — Vol 195 Issue 3 · 2026-06-24¶

共 9 篇 · American Journal of Epidemiology
目录核对 ⚠️ 疑似漏 18 篇（对照 OpenAlex 27 篇）：10.1093/aje/kwaf100、10.1093/aje/kwaf126、10.1093/aje/kwaf049、10.1093/aje/kwaf072、10.1093/aje/kwaf094 等

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期内容主要围绕因果推断方法应用与流行病学观测数据分析两条主线展开，辅以机器学习在表型分类与风险预测中的方法学探讨。因果推断主线集中关注纵向数据的处理与识别策略，涉及含糖饮料摄入、财富冲击、健康差异及死亡率研究；数据分析主线则涵盖复杂调查数据的贝叶斯估计、筛查策略的模型模拟以及大规模队列的趋势描述。

在因果推断与识别策略方面，本期多篇论文针对不同数据结构展示了具体的分析框架。针对纵向随访中的时变混杂与反馈循环，Estimating sex-specific population-level effects... 与 Memory trajectories before and after a negative wealth shock 分别采用逆概率加权（IPW）估计边际结构模型和分段线性轨迹模型，前者处理童年暴露的纵向效应，后者刻画暴露前后的动态轨迹变化。针对不可观测混杂与变量选择问题，Covariate adjustment in LGBTQ+ health disparities research 系统阐述了如何利用 DAG 识别调整集以避免对中介变量的过度调整，而 All-cause mortality around the anniversary of a sibling’s death 则采用病例-交叉设计，通过自身对照消除时间不变混杂。此外，Risk-based guidance for choosing fecal immunochemical test... 在筛查策略优化中引入了微模拟模型，体现了决策建模在因果参数框架下的应用。

在数据整合与机器学习应用方面，Obtaining population-based estimates for survey data... 提出结合贝叶斯分层模型与事后分层技术，解决了多期调查数据合并时无法保留抽样权重的问题。Improving classification of myocardial infarction... 与 Revisiting the social determinants of health... 均引入机器学习工具，前者利用 PheCAP 管道优化 EHR 表型分类的灵敏度，后者结合 SHAP 值解释跨国死亡率预测模型中的特征贡献，二者均未涉及因果识别，侧重于提升预测性能与模型可解释性。

对于关注因果推断与半参数效率的研究者，建议优先阅读 Estimating sex-specific population-level effects...（IPW/MSM 应用）、Covariate adjustment in LGBTQ+ health disparities research（DAG/中介分析）以及 Obtaining population-based estimates for survey data...（贝叶斯分层/事后分层）。

因果推断 (causal_inference, 1 篇)¶

1. 10.1093/aje/kwaf225 — Estimating sex-specific population-level effects of limiting sugar-sweetened beverages or 100% fruit juices during childhood on insulin resistance, central adiposity, and glycemic outcomes in late adolescence¶

作者: Soren Harnois-Leblanc, Sheryl L Rifas-Shiman, Karen M Switkowski, Wei Perng, Izzuddin M Aris, Emily Oken et al.
期刊/来源: American Journal of Epidemiology
机构: Harvard University · Harvard Pilgrim Health Care · Colorado School of Public Health · Massachusetts General Hospital
分类: vol 195 · issue 3 · pp 850-858
相关性 8/10 · novelty: application
摘要: 本文利用Project Viva前瞻性出生队列数据，估计童年期限制含糖饮料（SSB）和100%果汁摄入对青少年期胰岛素抵抗（HOMA-IR）、中心性肥胖（腰围、躯干脂肪量）及血糖指标的性别特异性人群效应。研究纳入481名女性和491名男性，从3至10岁通过食物频率问卷反复测量饮料摄入，结局在青少年晚期测量。为处理时变混杂和删失，采用逆概率加权（IPW）估计纵向边际结构模型（MSM），假设序贯可忽略性和正性以识别因果效应。结果发现，男孩中将SSB限制为每周1份可使HOMA-IR降低0.28单位（95%CI -0.61, 0.02）、腰围减少1.91 cm（-3.79, -0.05），而女孩效应接近零且精度更低；100%果汁的限制效应在两性中均较小且不精确。该文是因果推断方法在营养流行病学中的规范应用，对您从事纵向因果推断的实证研究具有直接参考价值。
关键技术: Inverse probability weighting, Marginal structural models, Longitudinal causal inference, Time-varying confounding adjustment, Sex-specific effect estimation
为什么对您有用: 该论文属于流行病学中纵向因果推断的典型应用，直接对应您的primary interest中'causal inference (longitudinal)'子方向。您very_familiar武器库中的'estimation theory in causal inference'足以理解其IPW/MSM方法并评估其权重建模合理性（例如检查倾向性得分模型是否充分），您也可用semiparametric theory对其方差估计进行理论审视。当前可基于其分析代码进行敏感性分析或中介分析扩展，属于立即可做的工作。

流行病学 (epidemiology, 8 篇)¶

1. 10.1093/aje/kwaf209 — Obtaining population-based estimates for survey data using Bayesian hierarchical models with poststratification¶

作者: Yunxuan Zhang, Thomas M Gill, Karen Bandeen-Roche, Robert D Becher, Kendra Davis-Plourde, Emma X Zang
期刊/来源: American Journal of Epidemiology
机构: Yale University · Johns Hopkins University
分类: vol 195 · issue 3 · pp 816-823
相关性 7/10 · novelty: application
摘要: 研究问题是在无法保留抽样权重的情况下，如何合并多期调查数据（NHATS 2011 与 2015 队列）以获得总体层面的估计。核心方法是 Bayesian hierarchical models 配合 poststratification：先建立分层贝叶斯模型估计各 poststratum 的参数，再根据人口普查的 poststratum 人数进行加权调整，从而绕开传统 survey weights 的限制。验证策略是将贝叶斯方法得到的 frailty 患病率估计与官方加权估计进行对比，两者高度一致，随后应用于合并队列的分析。本文属于流行病学应用，方法学 novelty 有限，但提供了处理复杂调查数据合并的实际案例。
关键技术: Bayesian hierarchical model, poststratification, survey weights, population-based estimation, model-based inference
为什么对您有用: 本文属于流行病学 secondary interest 的应用型论文，展示了如何在 survey data 中处理抽样权重缺失的问题。对您而言，这是一篇展示贝叶斯方法在流行病学调查数据中应用的入门级案例，但核心工具（贝叶斯分层模型）不在您 primary interest 的因果推断或效率理论主线内。follow-up 判断：暂不可做——本文是应用导向，没有需要用您武器库（higher-order U / semiparametric efficiency / DML）攻克的开放问题；若您想了解 survey data 的贝叶斯处理方式，可作为轻松读物。

2. 10.1093/aje/kwaf197 — Covariate adjustment in LGBTQ+ health disparities research: aligning methods with assumptions¶

作者: Colleen A Reynolds, Jarvis T Chen, Payal Chakraborty, Lori B Chibnik, Janet W Rich-Edwards, Brittany M Charlton
期刊/来源: American Journal of Epidemiology
机构: Harvard University · Harvard Pilgrim Health Care · Massachusetts General Hospital · Brigham and Women's Hospital
分类: vol 195 · issue 3 · pp 634-643
相关性 7/10 · novelty: application
摘要: 本文针对 LGBTQ+ 健康差异研究中的因果推断问题，系统阐述了如何利用有向无环图（DAG）识别合适的调整变量集。作者通过模拟实验（1000 个样本量为 10000 的数据集，结局为妊娠丢失）展示了常见调整变量（如医学辅助生殖）实为中介变量而非混杂因子，对其调整会阻断间接效应从而引入偏差。文章进一步讨论了社会暴露因素下中介分析的复杂性，包括暴露诱导的中介-结局混杂，以及样本招募和选择可能导致的 collider 分层偏倚。最后，作者将 heterosexism（污名化和歧视）作为 DAG 中的未观测节点，指导调整集的决策。本文是流行病学因果推断方法应用的入门级读物，对您在 identification theory 和 DAG 因果结构分析方面有直接参考价值。
关键技术: directed acyclic graphs (DAGs), mediator vs confounder distinction, collider stratification bias, exposure-induced mediator-outcome confounding, identification of adjustment sets, simulation study
为什么对您有用: (1) 本文是流行病学因果推断应用的入门级读物，DAG 因果结构分析清晰，适合作为 identification theory 在实际研究中的应用范例。(2) 武器库中 identification theory in causal inference（moderately_familiar）足以支撑阅读和批判性思考，无需额外补充。(3) 值得花时间读全文——作为方法论反思文章，它展示了如何将因果识别理论应用于具体领域问题，对您在流行病学应用场景下的因果推断工作有借鉴意义。

3. 10.1093/aje/kwaf272 — Memory trajectories before and after a negative wealth shock, the United States Health and Retirement Study, 1998-2020¶

作者: Tsai-Chin Cho, Ashly C Westrick, Sara D Adar, HwaJung Choi, Kenneth M Langa, Lindsay C Kobayashi
期刊/来源: American Journal of Epidemiology
机构: University of Michigan · Institute for Social Research · Henry Ford Health System · Michigan Medicine · Department of Health Services
分类: vol 195 · issue 3 · pp 728-735
相关性 6/10 · novelty: application
摘要: 本研究利用美国健康与退休研究（HRS）1998-2020年的纵向数据，纳入14969名51岁及以上成年人，考察负财富冲击（两年内家庭总财富损失≥75%）与记忆衰退轨迹之间的双向关系。约1/3的参与者（34.6%）在研究期间经历了负财富冲击。使用分段线性轨迹模型，比较冲击组与非冲击组在冲击前后的记忆变化。结果表明：经历冲击者在冲击前已有更快的年龄相关记忆衰退（每十年额外下降0.04个标准差，95%CI -0.07至-0.01）；冲击发生时记忆水平出现急性下降（-0.08 SD，95%CI -0.10至-0.05）；但冲击后记忆衰老速度反而减慢（每十年改善0.04 SD，95%CI 0.01-0.06）。作者建议关注面临财富损失风险的中老年群体的记忆健康保护。该研究为流行病学中财富与认知健康的纵向因果分析提供了丰富的公开数据和分析模板。
关键技术: Health and Retirement Study (HRS), piecewise linear trajectory model, negative wealth shock, longitudinal cohort study, event study design
为什么对您有用: 本文属于流行病学应用，使用公开的HRS纵向数据研究财富冲击与记忆轨迹，对您secondary interest的流行病学应用方向具有直接参考价值。您非常熟悉的非参数统计和因果推断工具（如敏感性分析、IV方法）可用于批判性评估该分析的因果解释和潜在偏倚，例如处理冲击内生性、调整时变混杂等。该论文的数据与分析流程值得花时间阅读全文，作为流行病学队列研究方法的入门样例。

4. 10.1093/aje/kwaf223 — Improving classification of myocardial infarction with machine learning in a diverse population¶

作者: Alicia W Chen, Chuan Hong, Yuk Lam Ho, Nicholas Link, Jacqueline P Honerlaw, Vidisha Tanukonda et al.
期刊/来源: American Journal of Epidemiology
机构: VA Boston Healthcare System · Harvard University · VA Office of Research and Development · Cancer Research And Biostatistics · Atlanta VA Health Care System · Brigham and Women's Hospital · VA New England Healthcare System · Geriatric Research Education and Clinical Center 等
分类: vol 195 · issue 3 · pp 841-849
相关性 5/10 · novelty: application
摘要: 本研究在电子健康记录（EHR）数据中，比较了基于ICD编码的规则算法与机器学习管道PheCAP（集成自然语言处理）对心肌梗死（MI）的分类性能，特别关注黑人群体中的表现差异。使用美国退伍军人健康管理局（VHA）2002至2019年间约1150万退伍军人数据，其中403份随机抽取的病历作为金标准（医师人工审核），并对黑人群体进行了过采样。结果显示，ICD算法阳性预测值（PPV）极高（总体0.97）但灵敏度很低（总体0.17）；PheCAP在保持良好PPV（总体0.90）的同时将灵敏度提升至0.66（黑人群体0.79）。将PheCAP分类结果应用于整个VHA人群后，成功复现了一项已知MI风险因素研究的关联发现，且统计功效显著高于ICD算法分类。该研究提供了EHR表型分类方法对下游因果推断功效影响的实证证据，对您而言，可作为流行病学研究中phenotyping质量评估的参考范例。
关键技术: PheCAP pipeline, natural language processing, ICD-based algorithm, positive predictive value (PPV), sensitivity, electronic health records (EHR) phenotyping
为什么对您有用: 本文直接服务于您对流行病学应用和因果推断的兴趣：它展示了pheotyping方法（ML vs. ICD）的选择如何影响后续风险因素关联研究的统计功效，这正是EHR-based causal inference的核心环节。您掌握的因果推断估计理论（如IV、proximal CI）和软件工程能力可以立即用于评估这类pheotyping偏差对因果估计的影响（立即可做），例如通过模拟研究量化灵敏度/特异度对ATE估计的偏倚。

5. 10.1093/aje/kwaf213 — All-cause mortality around the anniversary of a sibling’s death: findings from Swedish National Register Data¶

作者: Sandra Rogne, Alessandra Grotta, Can Liu, Lisa Berg, Jan Saarela, Ichiro Kawachi et al.
期刊/来源: American Journal of Epidemiology
机构: Stockholm University · Centre for Health Equity Studies · Karolinska Institutet · Åbo Akademi University · University of Helsinki · Harvard University · Örebro University
分类: vol 195 · issue 3 · pp 824-831
相关性 5/10 · novelty: application
摘要: 本文利用瑞典全国登记数据（1990-2016），采用时间分层病例-交叉设计，研究兄弟姊妹死亡周年纪念日前后的全因死亡率变化。病例-交叉设计通过个体自身作为对照（纪念日前后的时间窗口 vs 其他时间），有效控制时间不变混杂因素。使用条件逻辑回归估计比值比，并按照性别、年龄、兄弟姊妹性别、排行、父母是否健在等变量进行分层分析。结果显示，女性在纪念日当天死亡率显著降低（OR=0.44, 95% CI: 0.21-0.93）；而50岁以下男性在纪念日前12天至纪念日期间死亡率升高（OR=1.40, 95% CI: 1.05-1.86）。总体上，兄弟姊妹死亡周年与死亡率无显著关联，但存在性别和年龄特异模式。该研究为流行病学中短暂暴露的因果效应估计提供了实例，其分析思路可迁移至其他自对照设计研究。
关键技术: case-crossover design, conditional logistic regression, stratification analysis, Swedish National Register data
为什么对您有用: 本文属于流行病学应用，核心方法是病例-交叉设计——一种自对照因果推断方法，直接关联研究者的因果推断兴趣（identification与估计）。已有技术武器库中的非参数统计和因果推断基础可以完全理解本文方法；若要进一步拓展至更灵活的纵向因果推断（如DML或g-formula），则需在 semiparametric theory 和 identification theory 上提升。本文是流行病学应用的务实范例，适合作为入门读物，值得花时间阅读全文以了解研究设计与数据分层策略。

6. 10.1093/aje/kwaf214 — Risk-based guidance for choosing fecal immunochemical test or colonoscopy in colorectal cancer screening: a modeling study¶

作者: Luuk A van Duuren, Jean-Luc Bulliard, Matthias Harlass, Ekaterina Plys, Douglas A Corley, Florian Froehlich et al.
期刊/来源: American Journal of Epidemiology
机构: Erasmus MC · Centre universitaire de médecine générale et santé publique, Lausanne · Kaiser Permanente · University of Basel · University Hospital of Basel · Department of Biomedicine Basel
分类: vol 195 · issue 3 · pp 832-840
相关性 5/10 · novelty: application
摘要: 该研究针对结直肠癌筛查中同时提供结肠镜和粪便免疫化学试验（FIT）的场景，旨在制定高效的分流策略以优化资源利用（在给定结肠镜需求量下最大化质量调整生命年）。使用瑞士数据的MISCAN-Colon微模拟模型评估了三类策略：基于年龄的（先双年FIT，到某年龄转十年一次结肠镜）、基于风险评分的（仅高风险个体做结肠镜）、以及基于FIT结果的（根据定量FIT值接近阳性阈值时转结肠镜，部分策略还结合年龄）。参考策略为全结肠镜和50岁时均等选择FIT或结肠镜。结果显示，基于年龄和风险评分的策略（在54、64或74岁转换或评估）是有效的，与参考策略相比可在不增加结肠镜需求的前提下分别提升QALYs 10.0%和6.7%；而基于FIT的策略无效。结论指出，像瑞士和美国这样的筛查项目仅依靠年龄来指导个体选择FIT或结肠镜即可提高效率，更复杂的风险评分或既往FIT方法并不优于简单年龄策略。该研究对流行病学中的筛查政策评估具有直接参考价值，特别是其模型框架和策略比较思路可用于其他癌症或慢性病筛查问题。
关键技术: MISCAN-Colon microsimulation model, cost-effectiveness analysis, quality-adjusted life-years (QALY), decision analysis, age-based risk stratification
为什么对您有用: (1) 本文是流行病学领域的应用研究，聚焦结直肠癌筛查策略的优化，与您的次要兴趣“流行病学（应用、数据集、因果推断）”高度对应，可作为该方向的政策评估入门读物。(2) 技术库中的“软件发展”能力可用于复现或扩展其微模拟模型（例如改用更灵活的Python实现），但武器库没有直接支撑该文核心方法的“建模与模拟”专项；若要深入改进模型结构或推导解析近似，还需补充健康经济学建模技能（如马尔可夫决策过程）。(3) 本文值得花时间读全文，一方面了解流行病学筛查策略评估的标准框架（微模拟、QALY、敏感性分析），另一方面其结论“简单年龄策略优于复杂风险评分”对统计方法学本身有启示——说明在资源约束下，复杂模型未必有实际优势，与您关注的统计计算权衡有潜在联系。

作者: Jiani Yan
期刊/来源: American Journal of Epidemiology
机构: Leverhulme Trust · University of Oxford · Science Oxford
分类: vol 195 · issue 3 · pp 681-688
相关性 5/10 · novelty: application
摘要: 该研究利用美国HRS、欧洲SHARE和英国ELSA三个大型老龄化队列，探讨死亡率的可预测性。作者采用机器学习与可解释AI（如SHAP等）同时进行预测和解释，从人口学、社会经济、心理学、社会联系、童年逆境、成年逆境、健康行为七大领域提取特征。领域层面，人口学和社会经济因素在三个数据集中均是最重要的预测因子；但在个体风险因素层面，不同队列之间存在显著差异，提示社会决定因素具有情境特异性。该方法属于传统预测建模，未涉及因果识别或非参数推断，但数据集整合与跨国家比较的设计值得流行病学应用研究者参考。
关键技术: machine learning, explainable AI (SHAP), cross-country comparison, multiple imputation
为什么对您有用: 该论文属于流行病学领域的真实数据应用，使用三个大型老龄化队列分析死亡率的可解释预测，方向匹配次要兴趣中的流行病学应用。研究者可以利用非常熟悉的高维统计和非参数方法，对论文中识别的关键风险因素进行更精细的交互效应分析或因果识别（例如用HOIF估计高阶交互重要性），从而超越SHAP的线性近似。立即可做程度较低，因为需要先熟悉ELSA/SHARE的数据结构和缺失处理机制，属于中期可做的方向。

8. 10.1093/aje/kwaf201 — Suicide mortality trends among cancer patients in Taiwan: suicide prevention efforts and cancer care improvements¶

作者: Bo-Yu Hsiao, Chun-Ju Chiang, Ya-Wen Yang, Wen-Chung Lee
期刊/来源: American Journal of Epidemiology
机构: National Taiwan University · National Cancer Registry
分类: vol 195 · issue 3 · pp 807-815
相关性 4/10 · novelty: application
摘要: 本研究聚焦台湾癌症患者的自杀死亡率长期趋势，并评估国家自杀预防计划与癌症治疗改善的潜在关联。利用1985-2018年台湾癌症登记数据库与死亡档案，采用joinpoint回归估计年龄标准化自杀率的年度百分比变化（APC），并通过标准化死亡率比（SMR）将癌症患者与一般人群对比，按性别、年龄、癌症类型、分期及诊断后时间分层分析。结果显示，2005年后癌症患者自杀率下降幅度显著大于一般人群（女性APC -5.46%，p=0.0436）；胰腺、肺、口腔癌自杀率较高但持续下降；晚期患者风险仍居高位。该研究提供了大规模癌症队列中自杀流行病学的系统描述，分层策略可复用于其他慢性病人群的自杀风险监测。对您而言，这是一个流行病学应用范例，数据结构和分层分析方法可直接迁移，并可启发后续采用因果推断方法（如差中差）评估自杀预防政策的效果。
关键技术: joinpoint regression, age-standardized suicide rates, standardized mortality ratio (SMR), annual percent change (APC), stratified analysis
为什么对您有用: 本文是癌症流行病学应用的优质入门读物：方法透明（joinpoint回归、SMR），数据来源清晰（全岛登记），分层详尽。研究者现有的非参数统计和估计理论武器库足以复现并扩展其推断（如变化点检验的精确化）。值得花时间全文阅读以获取疾病自然史和风险分布的背景知识，为后续将因果推断工具（如IV、DID）应用于自杀预防政策评估打下领域基础。

Maintained by 陈星宇 · Homepage · Source on GitHub