跳转至

AJE — Vol 195 Issue 6 · 2026-06-19

  • 共 21 篇 · American Journal of Epidemiology
  • 目录核对 ⚠️ 疑似漏 12 篇(对照 OpenAlex 33 篇):10.1093/aje/kwaf065、10.1093/aje/kwaf278、10.1093/aje/kwaf098、10.1093/aje/kwaf135、10.1093/aje/kwaf279 等

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期论文主要围绕三条方法论主线展开:因果识别与缺失/选择偏倚处理、纵向/时空数据的半参数与参数建模、以及高维/网络/多状态数据的结构化分析。因果推断主线最为密集,涵盖了目标试验 emulation、工具变量、IPW、边际结构模型、联合模型、CCA 的 DAG 理论辩护、空间混淆评论以及政策靶向性形式化(共 9 篇);纵向与时空建模主线聚焦于固定效应、多状态转移、贝叶斯时空分布滞后及轨迹模型(共 5 篇);结构化数据主线涉及多水平模型、传播网络聚类与中介分析(共 3 篇);其余为常规流行病学监测与描述性关联研究。

因果识别与偏倚处理主线在本期推进了多个具体痛点。在缺失数据与选择偏倚上,两篇论文形成直接交锋:“Resurrecting complete-case analysis”利用 DAG 论证协变量调整可使 CCA 在 MNAR 下无偏,而 Commentary 则指出其信息损失与效率问题未解;另一篇“Smoking hot joint models”引入 XMAR 假设与序贯敏感性分析以处理纵向失访,而“Requirement for written informed consent”实证展示了前瞻性知情同意引入的选择偏倚。在混杂调整与识别上,“Bringing spatial confounding”评论警示了空间混淆调整不足反而增大偏倚的风险;“Leukotriene-modifying agent”同时使用边际结构模型(IPW)与病例-时间-对照设计以处理时变混杂;“Referral of patients”以强工具变量(F=637)估计记忆专科转诊的因果效应;“An approach to estimating”则在潜在结果框架下形式化了政策干预效果与靶向性的识别边界及敏感性分析。

纵向与时空建模主线推进了复杂随访数据的参数与半参数策略。“The protective effect of housing”与“Exploring the association”均采用固定效应模型控制不随时间变化的混杂;“Cardiovascular disease”使用多状态加权 Cox 模型估计转移风险并辅以未测量混杂敏感性分析;“Spatiotemporal analysis”构建贝叶斯时空分布滞后模型(BSTDLM)分离滞后效应与空间异质性;“Obstructive sleep apnea”结合互补 log-log 模型与群组轨迹模型刻画发病 hazard 与纵向轨迹。

与因果推断及半参数效率最贴的论文适合优先阅读:关注缺失数据因果识别理论的可直接看“Resurrecting complete-case analysis”及其 Commentary;关注时变混杂与 IPW/MSM 的可看“Leukotriene-modifying agent”与“Estimating the effect of hepatitis C”;关注空间混淆与选择偏倚识别边界的可看“Bringing spatial confounding”、“Requirement for written informed consent”及形式化政策靶向性的“An approach to estimating”。

因果推断 (causal_inference, 3 篇)

1. 10.1093/aje/kwaf284 — Resurrecting complete-case analysis: a defense

  • 作者: Maya B Mathur, Ilya Shpitser, Tyler J VanderWeele
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Boston University · Harvard University · Johns Hopkins University · Johns Hopkins Medicine · Harvard University Press · Quantitative BioSciences · Stanford Medicine · Stanford University
  • 分类: vol 195 · issue 6 · pp 1765-1778
  • 相关性 9/10 · novelty: weaker_assumption
  • 摘要: 本文重新评估了完整案例分析(CCA)在估计处理效应时的有效性。传统观点认为CCA仅当时数据完全随机缺失(MCAR)才有效,而作者论证:通过合理的协变量调整,CCA在数据非随机缺失(MNAR)的某些因果结构下也可以消除偏差,甚至优于基于缺失随机(MAR)假设的多重插补(MI)方法。文章利用有向无环图(DAG)系统刻画了协变量调整消除偏差的条件,指出当协变量能阻断缺失变量与结果之间的路径时偏差消失。即使偏差未完全消除,调整后的CCA也常能减小偏差,并可作为MI的敏感性分析。论文强调,流行病学家在控制混杂时已熟悉协变量选择原理,同样的逻辑可迁移至缺失数据处理。本文为因果推断中的缺失数据问题提供了实用的识别框架,尤其适用于流行病学应用中的敏感性分析。
  • 关键技术: complete-case analysis (CCA), covariate adjustment, directed acyclic graphs (DAGs), multiple imputation (MI), missing at random (MAR) vs. missing not at random (MNAR), sensitivity analysis
  • 为什么对您有用: 本文直接对应您因果推断兴趣中的识别与敏感性分析子方向,尤其聚焦缺失数据下处理效应的偏差消除条件。您武器库中的identification theory in causal inference(moderately_familiar)可立即用于剖析其DAG假设的合理性,而estimation theory in causal inference(very_familiar)可帮助评估其协变量选择策略的效率。其提供的因果结构框架属概念性工具,无需计算实现,因此可立即可做——用已熟悉的因果推断语言即可展开深入阅读并评估对您实际数据分析的启发。

2. 10.1093/aje/kwag062 — Bringing spatial confounding into the causal inferential fold

  • 作者: Alexander P Keil, Maria E Kamenetsky
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Department of Health and Human Services
  • 分类: vol 195 · issue 6 · pp 1647-1650
  • 相关性 8/10 · novelty: minor
  • 摘要: 该评论针对Li et al.关于二元暴露空间混淆处理方法的文章,讨论环境流行病学中空间混淆对因果推断的影响。作者指出,若对空间混淆调整不充分,偏倚反而可能增大,而非减小。文章强调了空间混淆在环境暴露研究中的普遍性,并认为现有方法(如空间模型调整)可能被误用。作者对部分术语提出异议,但认同问题的严重性及Li et al.方法的实用性。本文为流行病学因果推断中空间结构的处理提供了重要的警示。对您有用:这是因果推断在流行病学应用中的具体识别难题,可借助 moderately familiar 的 identification theory 来形式化空间混淆条件,但空间模型细节不在当前武器库,需补充背景后才能深入参与。
  • 关键技术: spatial confounding, causal inference in environmental epidemiology, binary exposure, confounding adjustment
  • 为什么对您有用: 本文讨论环境流行病学中的空间混淆问题,属于因果推断在流行病学应用中的具体识别难题。研究者可借助 moderately familiar 的 identification theory in causal inference 来形式化空间混淆的识别条件。但核心机器不在武器库里:详细的空间模型理论(如条件自回归模型、空间随机效应)暂不熟悉,因此目前为暂不可做状态,需先补充空间统计基础。

3. 10.1093/aje/kwag038 — An approach to estimating how effective and well targeted Extreme Risk Protection Orders have been with respect to suicide prevention

  • 作者: Sonja A Swanson, Jessica Handy, Veronica A Pear, Yifan Zhang, David Studdert, Hyunseung Kang et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of Pittsburgh · Centers for Disease Control and Prevention · Stanford University · Stanford Medicine · University of Wisconsin–Madison · Children's Hospital of Philadelphia · University of Pennsylvania · Northeastern University
  • 分类: vol 195 · issue 6 · pp 1670-1676
  • 相关性 8/10 · novelty: application
  • 摘要: 本文提出一个因果推断框架,用于评估极端风险保护令(ERPO)在自杀预防中的效果及靶向性(即是否针对高风险个体)。设定在观察性数据下,利用ERPO签发记录和自杀死亡数据,形式化了效果与靶向性的因果估计量。作者描述了在现有数据下这些估计量可被识别或被边界化的条件,这依赖于对未测量混杂和选择偏差的合理假设。方法核心是借助潜在结果框架和因果图模型进行推理,并通过敏感性分析评估假设偏离的影响。提供了可调整的R代码实现这些方法,并讨论了实践中的关键考虑。该工作直接连接了流行病学应用与因果推断,对于关心政策评估的研究者具有实际参考价值。
  • 关键技术: Causal inference with observational data, Bounded identification for treatment effects, Causal estimands for targeting and effectiveness, Policy evaluation using ERPO data
  • 为什么对您有用: 该论文将因果推断方法应用于流行病学中自杀预防的政策评估,属于您secondary interests中的流行病学应用。您对estimation theory in causal inference和identification theory非常熟悉,可立即可用这些知识审视其识别条件是否合理,并可能提出更紧的边界或引入额外的敏感性分析方法。因此,立即可做。

流行病学 (epidemiology, 18 篇)

1. 10.1093/aje/kwag037 — Evaluating the 2023 Mexican Dietary Guidelines for type 2 diabetes prevention: a target trial emulation in Mexican women

  • 作者: Dalia Stern, M Arturo Aguilar-López, Liliana Gomez-Flores-Ramos, Sonia Rodriguez-Ramirez, Mildred Chávez-Cárdenas, Deirdre K Tobias et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: National Institute of Public Health · Institute for Social Security and Services for State Workers · Brigham and Women's Hospital · Harvard University · Harvard Global Health Institute · Brown University
  • 分类: vol 195 · issue 6 · pp 1698-1706
  • 相关性 9/10 · novelty: application
  • 摘要: 在墨西哥教师队列中,采用 target trial emulation 框架评估 2023 版墨西哥膳食指南对 2 型糖尿病(T2D)的 9 年预防效果,目标 estimand 为干预与常规饮食下的风险比与风险差。由于基线对多项指南成分的依从率过低(<10%),作者对推荐阈值进行了适应性调整,确保每项成分至少 10% 人群满足。核心估计方法为 parametric g-formula,通过参数模型模拟纵向干预下的反事实风险,并给出 95% 置信区间。9 年 T2D 风险在常规饮食下为 8.44%,干预下为 7.11%(风险差 −1.33 pp,95% CI 包含零),提示适度潜在收益但统计精度不足。对您而言,本文展示了流行病学队列中 longitudinal causal inference 的完整应用范式(parametric g-formula + target trial),可作为理解真实数据因果分析的入门案例。
  • 关键技术: target trial emulation, parametric g-formula, longitudinal causal inference, risk difference estimation, cohort data linkage
  • 为什么对您有用: 本文直接连接到 epidemiology secondary interest,展示了 longitudinal causal inference 中 parametric g-formula 与 target trial emulation 在真实队列数据上的应用流程。从 technical_arsenal 角度,您对 identification theory in causal inference 与 semiparametric theory(moderately_familiar)的掌握足以审视本文参数模型假设的局限——parametric g-formula 的模型误设风险正是 semiparametric / HOIF 方法可切入的改进口子。阅读判断:作为流行病学因果应用的入门读物值得花时间读全文,但方法学 novelty 为 application 级别,无需深入跟进其估计细节。

2. 10.1093/aje/kwag034 — Referral of patients with cognitive impairment to specialty memory care: associations with patient-centered outcomes and specificity of diagnoses

  • 作者: Erin L Ferguson, Silvia Miramontes, Justin S White, Katherine L Possin, Anna Chodos, Fan Xia et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of California, San Francisco · Boston University · University Memory and Aging Center · Global Brain Health Institute
  • 分类: vol 195 · issue 6 · pp 1739-1748
  • 相关性 8/10 · novelty: application
  • 摘要: 本文研究初级保健医生将认知障碍患者转诊至记忆专科对患者结局和诊断特异性的影响。研究者使用电子健康记录数据,定义转诊状态和医生转诊偏好(作为工具变量),采用Aalen可加风险模型分别估计传统回归和工具变量(IV)分析下的关联。IV阶段F统计量高达637,表明工具变量强。传统分析显示转诊与5年随访期间获得更具体认知诊断和抑郁诊断的累积风险增加相关;IV分析中,转诊显著降低体重下降风险,但其他结局估计不精确。文章讨论记忆专科转诊的潜在利弊,并强调在获取专科服务障碍背景下需进一步研究。本文是因果推断方法(IV)在流行病学真实数据中的典型应用,与您对流行病学应用和因果推断的次要兴趣直接相关。
  • 关键技术: instrumental variable analysis, Aalen additive hazards model, preference-based instrument, electronic health records, cumulative hazard difference
  • 为什么对您有用: 本文属于流行病学应用,使用了工具变量方法处理转诊偏倚,与你对因果推断在流行病学中应用的次要兴趣高度吻合。文中强工具变量的构造(医生偏好)可启发类似场景的IV设计,且Aalen可加风险模型在纵向数据中的使用也可与你已有的估计理论(很熟悉)产生连接。作为应用论文,本文适合作为流行病学方向的一个入门案例,清晰展示了数据结构和模型假设,值得阅读全文理解其分析逻辑。

3. 10.1093/aje/kwag013 — The protective effect of housing affordability on childhood asthma risk: a longitudinal fixed-effects analysis

  • 作者: Yuxi Li, Ankur Singh, Rebecca Bentley
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Melbourne Health · The University of Sydney · The University of Melbourne
  • 分类: vol 195 · issue 6 · pp 1555-1562
  • 相关性 8/10 · novelty: application
  • 摘要: 该研究利用澳大利亚儿童纵向研究(2006-2018年六轮数据)评估住房可负担性和租金援助变化对儿童哮喘发作风险的影响。采用固定效应逻辑回归模型估计儿童个体内关联,以控制不随时间变化的混杂因素。主要分析样本包含3773名基线无哮喘儿童,子样本包含522名低收入租房家庭。结果显示,从不可负担住房转为可负担住房使哮喘风险降低31%(OR=0.69, 95% CI 0.52-0.90),低收入租房者获得租金援助后哮喘发生几率降低65%(OR=0.35, 95% CI 0.14-0.85)。敏感性分析(滞后暴露、替代定义、未调整收入模型)结果一致。结论支持住房可负担性作为哮喘预防的政策杠杆,并展示了纵向个体内设计在结构性干预因果评估中的实用性。对您而言,这是一篇流行病学纵向因果推断的应用实例,方法虽为标准固定效应模型,但数据分析和敏感性分析流程完整,可为类似纵向队列的因果推断研究提供范例。
  • 关键技术: fixed-effects logistic regression, within-child design, longitudinal study, sensitivity analysis, time-varying exposure
  • 为什么对您有用: 本文属于流行病学应用方向,使用纵向固定效应设计进行结构性干预的因果推断,与您secondary interest中的流行病学应用直接相关。方法层面(固定效应logistic回归)属于您非常熟悉的因果推断估计工具,但此处重点关注如何利用同一人群的反复测量控制个体不变混杂,思路简洁清晰。这是一篇可快速阅读的实证范例,无方法学创新,但若您未来涉及纵向队列的因果分析,其分析框架(敏感性分析、暴露滞后等)可参考;不涉及您武器库中更前沿的DML或proximal CI工具,因此属于暂不可做的新方向,仅作了解。

4. 10.1093/aje/kwag063 — Smoking hot joint models for attrition bias—XMAR-ks the spot

  • 作者: Michael E Griswold, Ravi Varadhan
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of Mississippi Medical Center · Johns Hopkins University
  • 分类: vol 195 · issue 6 · pp 1651-1658
  • 相关性 7/10 · novelty: application
  • 摘要: 本文关注纵向研究中因失访(attrition)导致的选择偏倚问题,以吸烟与认知衰退的关系为例,探讨信息性删失的影响。方法上,比较了标准线性混合模型与联合模型(Joint Model)的估计结果,并引入“扩展缺失随机”(XMAR)假设——联合模型的关键识别条件。作者将XMAR置于一个扩大的四层次缺失分类体系中,与传统的MAR、MNAR等概念并列。通过吸烟与认知衰退的实例数据,展示了序贯敏感性分析(sequential sensitivity analysis)的步骤,量化XMAR偏离对因果估计的影响。结果表明,联合模型在XMAR假设下可部分缓解失访偏倚,但对模型假设的偏离仍敏感,需要敏感性分析作为必备工具。对您有用:本文为纵向因果推断中的失访问题提供了清晰的敏感性分析框架,与您对纵向因果推断和敏感性分析的兴趣直接相关。
  • 关键技术: Joint model, Extended Missing at Random (XMAR), Sequential sensitivity analysis, Linear mixed model, Informative censoring, Attrition bias
  • 为什么对您有用: 本文属于流行病学应用,但方法学核心——XMAR假设与联合模型——直接关联到您“纵向因果推断中的敏感性分析”这一兴趣子方向。您的技术武器库中的“因果推断中的估计理论”和“非参数统计”足以理解并批判性地评估文中的模型假设与敏感性分析方法;尤其是您熟悉的“敏感性分析”思路可与文中序贯方法进行对比或扩展。本文对流行病学失访问题的阐述清晰,适合作为进入该应用领域的入门读物;若需进一步工作,可考虑在您的HOIF或高维U统计框架下为联合模型推导更紧的效率界或更稳健的推断方法——属于中期可做(需先在“HOIF”或“semiparametric theory”上提升)。

5. 10.1093/aje/kwag072 — Leukotriene-modifying agent chemoprophylaxis for severe influenza illness: a multi-approach study

  • 作者: Brittney M Snyder, Corinne A Riddell, Tebeb Gebretsadik, Tan Ding, Rees L Lee, William D Dupont et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Vanderbilt University Medical Center · University of California, Berkeley · University of Arizona · University of Maryland, Baltimore · Johns Hopkins University · CHI Associates (United States) · University of Virginia
  • 分类: vol 195 · issue 6 · pp 1634-1646
  • 相关性 7/10 · novelty: application
  • 摘要: 该研究旨在评估白三烯调节剂(LMA)对严重流感的化学预防效果,采用回顾性队列设计,利用TennCare和DoD MHS两大数据源(1995-2019年)。研究使用了三种因果推断方法:边际结构模型(逆概率加权调整时变混杂)、Cox比例风险模型(固定协变量调整)以及病例-时间-对照设计(控制不可测时变混杂)。孟鲁司特占LMA处方的99%,主要分析针对该药物。结果显示,边际结构模型和比例风险模型在TennCare中的调整发病率比分别为1.26(95%CI: 0.99-1.59)和1.14(0.92-1.41),在DoD MHS中则接近1;病例-时间-对照分析在DoD MHS中出现显著正向关联(OR=1.91, 1.29-2.84)。综合不同人群和设计的证据,不支持LMA用于严重流感化学预防。该论文是流行病学中应用因果推断方法的典型范例,展示了边际结构模型在时变暴露和混杂下的实际操作流程,对您(关注流行病学应用和因果推断方法)具有参考价值。
  • 关键技术: marginal structural model, inverse probability weighting, case–time–control design, Cox proportional hazards model, sensitivity analysis via multiple designs
  • 为什么对您有用: (1)该论文属于流行病学领域的因果推断应用,直接对接您的secondary_interests中的流行病学方向,尤其展示了边际结构模型在时变治疗和混杂下的实施细节,可作为应用范例;(2)您的very_familiar技术库中包含估计理论在因果推断中的应用,足以理解该论文的逆概率加权和模型设定。该论文本身并不提出新方法,但完整的多方法比较(三种设计)对您评估实际研究中因果方法的稳健性有教学价值;(3)值得花时间阅读全文,以获取流行病学中因果推断设计的实际操作经验,并作为您讲授或理解应用因果推断的案例。

6. 10.1093/aje/kwag024 — Estimating the effect of hepatitis C infection on multidrug-resistant tuberculosis treatment outcomes under hypothetical interventions on regimen composition and adherence

  • 作者: Allison LaHood, James Robins, Helen R Stagg, Sara Sauer, Saman Ahmed, Mathieu Bastard et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Harvard University · Harvard Global Health Institute · University of London · London School of Hygiene & Tropical Medicine · Interactive Research and Development · Epicentre (South Africa) · Ospedale Sacro Cuore Don Calabria · Médecins Sans Frontières 等
  • 分类: vol 195 · issue 6 · pp 1615-1623
  • 相关性 7/10 · novelty: application
  • 摘要: 本文利用endTB前瞻性队列(NCT03259269)中1530名耐多药/利福平耐药结核病(MDR/RR-TB)患者的纵向数据,评估丙型肝炎病毒(HCV)合并感染对治疗结局(死亡、治疗失败、失访)的影响。研究者采用逆概率加权(IPW)调整基线混杂因素(如年龄、性别、既往治疗史等),估计HCV与复合不良结局的风险差,并进一步构建反事实伪总体,模拟两类假设干预:消除失访、确保所有患者使用优先抗结核药物并维持良好依从性。在加权后,未调整的风险差从14.1%降至11.0%,消除失访后进一步降至7.7%,而在确保强效方案依从性的伪总体中风险差为7.0%(置信区间跨零)。结果表明HCV与不良结局的关联部分由基线混杂和失访机制解释,改善治疗保留度可能缩小差异。本文是典型的因果推断在流行病学队列中的应用,使用IPW处理时依从混杂,对研究者而言可作为实际数据中因果估计流程的参考,尤其是负对照和敏感性分析思路可迁移至自身因果推断工作。
  • 关键技术: inverse probability weighting, marginal structural models, hypothetical interventions, sensitivity analysis, observational cohort
  • 为什么对您有用: 本文属于流行病学应用,使用了因果推断中的IPW和反事实干预模拟,与研究者次要兴趣(流行病学应用)直接匹配。研究者可借鉴其处理失访和依从性混杂的分析框架,并思考能否用proximal causal inference或HOIF(中等熟悉)改进其估计效率或处理未测量混杂。这是一篇方法学常规但数据质量高的应用文章,适合作为进入流行病学数据分析的入门阅读,武器库中'非参数统计'和'因果推断估计理论'可直接支撑复现和扩展其分析。

7. 10.1093/aje/kwag009 — Exploring the association between higher education and steeper cognitive decline in a nationally representative longitudinal study in India

  • 作者: Emma Nichols, Richard N Jones, Alden L Gross, Eleanor Hayes-Larson, Erik Meijer, Miguel Arce Renteria et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of Southern California · Brown University · Johns Hopkins University · Columbia University · University of Michigan
  • 分类: vol 195 · issue 6 · pp 1596-1604
  • 相关性 7/10 · novelty: application
  • 摘要: 本文利用印度纵向老化研究(LASIDAD)数据,估计教育水平与认知衰退的关联。采用线性混合效应模型,调整人口学及早期社会经济因素后,发现高教育组比无教育组的认知衰退更快(例如高中及以上组每年多衰退0.05个标准差)。通过补充分析排除实践效应和选择性生存对结果的解释,但模拟因果结构显示结果与其中一设定一致。方法上使用了多模型比较、敏感性分析等常规流行病学工具。尽管因果识别策略朴素,但系统地考虑了纵向认知数据分析中的常见偏倚来源。对研究者而言,本文展示了如何处理纵向健康数据中的缺失、实践效应和选择性偏倚,是流行病学入门级但方法论完整的实证案例。
  • 关键技术: Linear mixed effects models, Practice effects adjustment, Selective survival analysis, Sensitivity analysis for causal structure
  • 为什么对您有用: 本文是流行病学纵向数据分析的典型应用,清晰展示了教育-认知关联的估计与敏感性分析流程,适合作为入门读物理解纵向健康研究中的常见挑战。研究者的非参数统计和高维渐近知识虽不直接用于此文,但可帮助评估模型假设(如随机效应分布、缺失机制)。武器库中的‘非参数统计’和‘估计理论’可用于批判性审视其混合模型的参数假设是否合理。总体值得花时间阅读全文,以熟悉印度LASIDAD数据结构和流行病学分析习惯。

8. 10.1093/aje/kwag068 — Commentary on “ Resurrecting complete-case analysis: a defense ”: the loss of information remains unresolved

  • 作者: Benjamin Stockton, Ofer Harel
  • 期刊/来源: American Journal of Epidemiology
  • 机构: New York University · University of Connecticut
  • 分类: vol 195 · issue 6 · pp 1779-1781
  • 相关性 6/10 · novelty: minor
  • 摘要: 本文是对 Mathur 等人“为完整病例分析辩护”一文的评论,聚焦于缺失数据下 CCA 的理论适用边界与信息损失问题。目标 estimand 是因果效应(如 ATE),在非 MCAR 缺失机制下,Mathur 等利用流行病学家熟悉的因果推断工具(selection diagram / collider bias)刻画了 CCA 无偏的一般条件;Stockton 与 Harel 则指出,即便 CCA 在特定条件下可保证无偏,其固有的信息损失与效率降低仍未解决,且 principled adjusted CCA 作为敏感性分析的角色需谨慎定位。核心机制涉及 missingness 的因果图建模与 IPW / MI 等方法的效率对比,CCA 的效率劣势源于丢弃观测数据导致的 semiparametric efficiency bound 差异。主要结论是:adjusted CCA 可作为辅助敏感性检查,但不能替代 likelihood / MI / IPW 等保留信息的方法。对您有用之处在于:该评论将缺失机制与因果图结合,直接连接到因果推断的 identification 理论与 semiparametric efficiency 理论。
  • 关键技术: complete-case analysis, missing data mechanisms, causal selection diagram, collider bias, semiparametric efficiency bound, sensitivity analysis
  • 为什么对您有用: (1) 本文将缺失数据机制用因果图(selection diagram / collider)建模,直接连接到因果推断 identification 理论与流行病学应用;(2) 评论中提到的 CCA 效率劣势可由您 very_familiar 的 semiparametric efficiency bound 与 minimax 理论精确刻画——计算 CCA vs IPW 的效率比是直接可攻的口子;(3) 立即可做:用 efficiency bound 工具量化 adjusted CCA 在不同缺失机制下的效率损失,推导更紧的界。
  • 作者: Renning Zheng, Sanjay K Das, Trung Duong Tran, Nadine A Friedrich, Stirling M Cummings, Anakaren Gonzalez et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Cedars-Sinai Medical Center · Tsinghua University · Cleveland Clinic · Durham VA Health Care System · California State University, Long Beach · Duke University Health System
  • 分类: vol 195 · issue 6 · pp 1659-1665
  • 相关性 6/10 · novelty: application
  • 摘要: 在回顾性图表审查(chart-review)研究采用前瞻性入组的设定下,本文研究了书面知情同意要求如何引入选择偏倚,核心 estimand 是同意组与拒绝组在关键协变量及前列腺癌(PCa)风险上的差异。利用 IRB 批准的知情同意豁免协议,作者识别出 2202 名计划接受初始前列腺活检的退伍军人患者,同时这些患者被招募进入一个需书面同意的最低风险前瞻性观察研究。通过比较同意组(1238人)与拒绝组(964人),发现同意者年龄更低、PCa 风险显著偏低(多变量 OR=0.41, 95% CI 0.31–0.54),但种族分布相似。结论是书面同意要求导致样本不能代表全部合格人群,建议对前瞻性入组的图表审查研究豁免书面同意以减少选择偏倚。对您而言,本文提供了一个典型的流行病学选择偏倚实证案例,可用于思考 IV 或 proximal CI 方法在纠正此类 consent-bias 中的潜力。
  • 关键技术: selection bias quantification, multivariable logistic regression, chart-review study design, informed consent waiver, observational study comparability
  • 为什么对您有用: 本文直接连接到流行病学应用中的因果推断子方向——选择偏倚的识别与量化,是 consent-bias 这一具体机制的实证展示。您武器库中的 identification theory in causal inference 可以攻这篇 paper 的口子:当前研究仅用 logistic 回归量化偏倚,而未从 identification 角度正式定义 consent-bias 下的调整 estimand 或提出偏倚校正框架。follow-up 粗判:中期可做——需先在 moderately_familiar 的 identification theory 上长肌肉,将 consent 机制形式化为 treatment selection 或 missing-data 问题,再探讨 proximal CI 或 IV 在此场景的 identification 条件。

10. 10.1093/aje/kwaf289 — Cardiovascular disease and mortality following placental abruption

  • 作者: Cande V Ananth, Rachel Lee, Linda Valeri, Sonia M Grandi, Todd Rosen, William J Kostis et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Rutgers, The State University of New Jersey · Johnson University · Environmental and Occupational Health Sciences Institute · Harvard University · New York University · 3M (United States) · University of Toronto · Hospital for Sick Children 等
  • 分类: vol 195 · issue 6 · pp 1546-1554
  • 相关性 6/10 · novelty: application
  • 摘要: 本研究基于美国新泽西州1993–2020年近290万次单胎分娩的回顾性队列数据,估计胎盘早剥对母体后续非致命性CVD住院、全因死亡及CVD住院后死亡的多状态转移风险。采用multistate weighted Cox模型估计各转移路径的hazard ratio,并在仅初产(parity 1)与连续两次分娩(parity 1-2)两个非重叠队列中分别分析。关键方法亮点是对未测量混杂偏倚进行了校正(sensitivity analysis框架),校正后HR略有衰减但仍显著(如初产队列:delivery→CVD住院 aHR 1.27,delivery→全因死亡 aHR 1.77)。对您可能有用:本文展示了流行病学大队列中多状态因果模型与未测量混杂sensitivity分析的结合应用,可作为epidemiology方向的应用案例阅读。
  • 关键技术: multistate Cox model, weighted Cox estimation, unmeasured confounding correction, retrospective cohort design, hazard ratio estimation
  • 为什么对您有用: (1) 连接到epidemiology子方向——大队列多状态生存模型与未测量混杂校正的应用案例;(2) 您technical_arsenal中的identification theory in causal inference可直接审视其未测量混杂校正的假设强度与sensitivity parameter选取逻辑;(3) 中期可做——若想在此类epidemiology数据上做方法学推进,需先在moderately_familiar的semiparametric theory上长肌肉(如将多状态Cox的influence function推导与debiasing结合),但作为应用阅读本文是好的入门。

11. 10.1093/aje/kwag002 — Spatiotemporal analysis of human response to wildfire events and PM2.5 exposure

  • 作者: Yuming Sun, Andrew Lee, Stella E Lee, Tanujit Dey
  • 期刊/来源: American Journal of Epidemiology
  • 机构: William & Mary · Brigham and Women's Hospital
  • 分类: vol 195 · issue 6 · pp 1507-1516
  • 相关性 6/10 · novelty: application
  • 摘要: 本研究旨在评估加州野火产生的PM2.5对公众搜索行为的影响,利用2016-2020年11个指定市场区域(DMA)的烟尘PM2.5浓度与Google Trends搜索指数(“空气污染”和“空气净化器”)作为公众意识与准备度的代理。采用贝叶斯时空分布滞后模型(BSTDLM),该模型同时捕捉时间滞后效应与空间异质性,并通过时空随机效应控制未观测混杂。结果显示,烟尘PM2.5每增加1单位(6.6 μg/m³),“空气污染”搜索量立即上升149%(95% CrI: 107%, 486%),而“空气净化器”搜索量在前两周分别上升34%和68%。空间上,棕榈泉(Palm Springs)响应最强;气象条件(温度、气压、风速、湿度)对搜索反应的修饰作用显著。社会经济脆弱性较高的社区搜索兴趣较低,提示信息公平性问题。该研究为环境流行病学中公众行为响应的时空建模提供了实际分析框架,其数据集和建模思路可用于验证因果推断方法(如工具变量或断点回归)在类似暴露-行为关系中的适用性。
  • 关键技术: Bayesian spatiotemporal distributed lag model, Google Trends data as proxy, spatial random effects, distributed lag structure, credible intervals
  • 为什么对您有用: 该论文直接对应您流行病学(secondary interest)的实际数据分析需求,公开的PM2.5与搜索数据可作为因果推断方法的测试平台。您武器库中的非参数统计与高维方法可用于扩展其模型假设(例如放松线性滞后的约束),而您在因果推断中的估计理论(特别是滞后暴露的识别假设)可用来批判性评估本文结果的因果解释力度。中期可做:需先在identification theory in causal inference上熟悉分布式暴露的识别条件与工具变量方法,才能将该文的分析框架升级为具有更清晰因果结构的研究。
  • 作者: Kening Jiang, Adam P Spira, Nicholas S Reed, Frank R Lin, Jennifer A Deal
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Johns Hopkins University · Johns Hopkins Medicine · Behavioral Pharma (United States) · Optimal Solutions (United States) · New York University
  • 分类: vol 195 · issue 6 · pp 1563-1571
  • 相关性 6/10 · novelty: application
  • 摘要: 本研究探讨阻塞性睡眠呼吸暂停(OSA)对功能性听力损失的纵向因果效应,目标 estimand 为 OSA 高风险对听力损失发病的 hazard ratio 及轨迹组归属的相对风险比。数据来自 NHATS 2013–2021 共 8 轮随访(n=1433),OSA 风险由修改版 STOP-BANG 评分≥3 定义,功能性听力损失为自报耳聋/助听器使用/日常交流困难。方法采用离散时间互补 log-log 模型估计发病 hazard,并用 group-based trajectory modeling 切分轨迹组后做多类别 logistic 回归。主要结果显示高风险 OSA 与发病 hazard 1.34 倍(95% CI 1.06–1.70)及稳定听力损失组 RRR 1.79(1.32–2.42)相关。对您而言,本文提供了流行病学队列数据集与纵向因果效应估计的实证案例,但方法学 novelty 有限。
  • 关键技术: discrete-time complementary log-log model, group-based trajectory modeling, multinomial logistic regression, longitudinal cohort analysis, STOP-BANG screening score
  • 为什么对您有用: 本文属于流行病学纵向因果应用,连接您 secondary interest 中的 epidemiology 数据集与 longitudinal causal estimation,但所用方法(cloglog 模型 + GBTM)属于标准描述性纵向分析,未触及您 primary interest 中的 semiparametric efficiency / proximal CI / IV 等因果识别与估计理论。您的 technical_arsenal 中 identification theory in causal inference 与 semiparametric theory 可直接攻这篇 paper 的核心口子:当前分析仅依赖 STOP-BANG 评分作为 OSA 替代暴露,存在测量误差与混杂,用 proximal CI 的 negative control 或 IV 方法可重新审视其 identification 策略。follow-up 粗判:立即可做——用 very_familiar 的 causal identification 工具即可对该数据集的混杂与测量偏倚做重新建模。

13. 10.1093/aje/kwag011 — The long-term impact of racial and ethnic school composition on late-life cognition, depressive symptoms, and overall health among older US Latinos

  • 作者: Sirena Gutierrez, Marilyn D Thomas, Paola Gilsanz, Jacqueline M Torres
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of California, San Francisco · San Francisco General Hospital · University of San Francisco · Kaiser Permanente
  • 分类: vol 195 · issue 6 · pp 1517-1525
  • 相关性 5/10 · novelty: application
  • 摘要: 本文研究美国拉丁裔老年人晚年认知、抑郁症状及自评健康与其早年(至12年级)学校种族/民族构成的长期关联,estimand 为各构成类型(1年单位)对记忆分数(0-20)、抑郁症状(0-8)及差自评健康(yes/no)的回归系数/相对风险。基于 Health and Retirement Study 的 315 名≥50岁拉丁裔样本,采用调整社会人口学因素的回归模型估计关联,未使用 IV 或 g-formula 等因果识别策略。主要实证结果:在多数拉丁裔学校时长与差自评健康风险正相关(RR=1.05),在多数黑人学校时长与更低记忆、更多抑郁及更差自评健康相关,在多数白人学校时长则呈现保护性关联。对您可能有用:本文提供了流行病学队列数据集(HRS)中种族构成暴露的长期健康结局应用案例,但方法学上仅为调整协变量的回归,缺乏因果推断设计。
  • 关键技术: cohort observational study, multivariable regression adjustment, risk ratio estimation, long-term health outcome association
  • 为什么对您有用: (1) 连接到流行病学 secondary interest 的因果推断应用,但本文仅做回归调整未处理混杂,无 IV / proximal / mediation 等因果设计;(2) 若想用 technical_arsenal 中的 identification theory in causal inference 或 semiparametric theory 对该 HRS 数据集重新做更严格的因果分析(如 sensitivity analysis 或 longitudinal mediation),武器库完全支撑,属于立即可做;(3) 作为流行病学应用阅读,本文数据集和科学问题有价值,但方法学 novelty 低,不值得花时间读全文细节,只需关注 HRS 数据结构。

14. 10.1093/aje/kwag067 — Network analysis of pairwise relative tuberculosis transmission probabilities in Lima, Peru

  • 作者: Anne N Shapiro, Meredith B Brooks, Chuan Chin Huang, Megan B Murray, Laura F White, Helen E Jenkins
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Boston University · Brigham and Women's Hospital · Center for Disease Dynamics, Economics & Policy · Harvard University · Harvard Global Health Institute
  • 分类: vol 195 · issue 6 · pp 1689-1697
  • 相关性 4/10 · novelty: application
  • 摘要: 本文研究结核病传播事件的识别问题,利用成对传播概率构建网络,并采用聚类算法分析传播集群。研究者首先通过一种改进的朴素贝叶斯分类器迭代算法估计有向的成对传播概率,然后使用这些概率构建网络,并尝试剪枝低概率边以降低噪声。在模拟数据上评估了多种聚类算法的性能,并在秘鲁利马队列数据中应用,最后用二元熵度量检验集群的均匀性。结果显示不同边缘剪枝和聚类方法下集群一致性较好,但年龄、性别、社会经济地位等特征在集群内呈现高异质性。该方法可推广到其他传染病暴发,但存在估计传播概率时未充分处理混杂因素的问题。对您有用:本文是流行病学中传播网络分析的应用案例,其传播概率估计框架可与因果推断中的负对照或工具变量方法结合,以提高识别准确性。
  • 关键技术: Naïve Bayes classifier, pairwise transmission probability, network clustering, edge trimming, binary entropy measure
  • 为什么对您有用: 本文属于二级兴趣流行病学领域,提供了一个利用成对概率构建传播网络的分析框架,涉及未观察到的感染路径推断。武器库中‘因果推断的估计理论’可用来改进其传播概率估计中可能存在的混杂偏倚,但需要先掌握流行病学中传播动力学的领域知识。因此属于中期可做:先学习流行病学基本概念,再用identification theory(如IV、proximal)重新审视识别假设。

15. 10.1093/aje/kwag051 — Beyond Black and White: relationships between segregation, environmental burden, and birth outcomes among Black and Latino populations

  • 作者: Melissa R Fiffer, Aaron Lilienfeld, Dominique Zephyr, Joshua L Tootoo, Abdul-Nasah Soale, Mercedes A Bravo et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: University of Illinois Chicago · Comer Children's Hospital · Case Western Reserve University · Duke Institute for Health Innovation · University of Chicago
  • 分类: vol 195 · issue 6 · pp 1526-1536
  • 相关性 3/10 · novelty: application
  • 摘要: 本文基于1990-2015年美国72,246个普查区数据,构建了非西班牙裔黑人与拉丁裔联合种族隔离指标(RI-NHB+H),并分析了其与环境正义指数(EJI)的空间相关性。主要方法包括计算趋势对比(RI-NHB+H vs RI-NHB)、空间相关性分析,以及利用北卡罗来纳州504,363条出生记录(2015-2019)拟合多水平线性模型,评估EJI、RI-NHB+H与出生体重百分位数的关联。结果显示,隔离指标在大多数地区上升,且EJI与出生体重的负向关联在高隔离区更强,但西班牙裔母亲在中度隔离区有显著负关联,高隔离区则不显著。该研究揭示了种族隔离的动态变化及其与环境负担联合影响生殖健康的累积效应,但分析以关联为主,缺乏明确的因果识别策略。对于关注流行病学应用的统计研究者,本文提供了翔实的公开数据(出生记录与EJI)和可复现的分析框架,值得作为入门读物。
  • 关键技术: Racial isolation composite measure, Environmental Justice Index (EJI), Spatial correlation, Multilevel linear regression, Birthweight percentile modeling, Trend analysis 1990-2015
  • 为什么对您有用: 本文属于流行病学应用方向,使用公开数据(北卡罗来纳州出生记录)和常规回归方法,适合作为该领域的入门材料。研究者当前非常熟悉的软件技能(如R/Python)足以复现分析,并可在因果推断层面升级(如利用IV或固定效应模型识别隔离-环境-健康的因果路径),这需动用moderately_familiar的identification theory,可作为中期拓展目标。值得花时间阅读全文以熟悉流行病学常见数据结构(空间、分层、多水平)和分析思路。

16. 10.1093/aje/kwag019 — Flush with data: harnessing emergency department wastewater as an innovative approach for surveillance of infectious diseases

  • 作者: Zachary T Renfro, Alessandro Zulli, Julie Parsonnet, Alexandria Boehm, Christopher L Bennett
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Stanford Medicine · Stanford University
  • 分类: vol 195 · issue 6 · pp 1666-1669
  • 相关性 3/10 · novelty: application
  • 摘要: 本文提出在美国急诊科(ED)场景下对可传播传染病进行常规废水监测的流行病学 surveillance 新方案,核心 estimand 是社区级传染病负担的及时估计。方法上属于监测框架设计,未涉及复杂统计模型,主要依赖废水流行病学(wastewater-based epidemiology)的浓度-负担映射逻辑,强调 ED 废水比大型污水处理厂数据更具局部时效性。实证部分仅基于 COVID-19 期间废水监测的成功经验进行类比论证,无新数据集或统计推断结果。对您而言,本文是流行病学监测数据的 gateway reading,展示了废水数据作为公共卫生观测变量的结构,但方法学 novelty 极低。
  • 关键技术: wastewater-based epidemiology, surveillance design, community-level burden estimation, emergency department setting
  • 为什么对您有用: 本文属于流行病学 secondary interest 的 gateway reading:(1) 清晰展示了废水监测数据在公共卫生 surveillance 中的角色与数据结构(浓度、时间、局部性),对理解流行病学观测数据的设计有帮助;(2) 武器库中的因果推断与 semiparametric 理论暂无直接攻入口子,因为本文缺乏统计模型与推断问题;(3) 作为入门读物值得花 10 分钟浏览 abstract 与图表以了解废水数据形态,但无需读全文。

17. 10.1093/aje/kwag055 — Metabolomic profiling of genotype-derived ABO blood group, secretor status, and Lewis antigens and association with pancreatic ductal adenocarcinoma risk

  • 作者: Ting Zhang, Steven C Moore, Sheng Fu, Demetrius Albanes, Linda M Liao, Erikka Loftfield et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: National Cancer Institute · University of Utah · Huntsman Cancer Institute
  • 分类: vol 195 · issue 6 · pp 1572-1584
  • 相关性 2/10 · novelty: application
  • 摘要: 在胰腺导管腺癌(PDAC)的流行病学巢式病例-对照研究中,目标是探究 ABO 血型基因位点与 1478 种前诊断血清代谢物之间的关联,以及代谢物是否中介 ABO-PDAC 的因果路径。作者先用线性回归与固定效应 meta-analysis 筛选 ABO 相关代谢物(FDR<0.20),再用 logistic 回归评估这些代谢物与 PDAC 的关联,最后通过中介分析检验代谢物是否解释 ABO 对 PDAC 的效应。结果显示非 O 型和 A 型血与 13/20 种代谢物相关,其中 sphingosine 等与 PDAC 正相关、fibrinopeptide B 逆相关,但中介效应均不显著,提示 ABO 相关代谢物是 PDAC 的独立风险因子而非中介变量。对您可能有用:本文展示了流行病学中介分析(mediation)在基因-代谢物-疾病路径上的实证应用,但方法学上仅用标准线性/logistic 回归与差值法中介检验,无 semiparametric efficiency 或 sensitivity analysis 等现代因果中介工具。
  • 关键技术: nested case-control study, fixed-effect meta-analysis, FDR-controlled metabolite screening, logistic regression, mediation analysis (difference method), genotype-derived ABO blood group
  • 为什么对您有用: 本文属于流行病学应用,连接到您的 secondary interest——epidemiology (datasets, applied causal work)中的中介分析实证案例。从 technical_arsenal 角度,本文的中介分析仅用经典差值法,未涉及您 very_familiar 的 semiparametric efficiency 或 moderately_familiar 的 identification theory / sensitivity analysis,因此方法学上没有可攻的口子;但数据集(8个巢式病例-对照、1478代谢物+基因型)可作为练习现代因果中介方法(如 sensitivity analysis for mediation)的真实数据素材。Follow-up 判断:中期可做——若想用 HOIF / semiparametric efficiency 改进高维中介分析,需先在 moderately_familiar 的 semiparametric theory 上长肌肉,尤其是高维 mediators 下的 efficient mediation estimator 理论。

18. 10.1093/aje/kwag048 — The relationship between psychological stress and SARS-CoV-2 nucleocapsid-antibody response following natural infection: longitudinal findings from the Aegis study

  • 作者: Erika T Beidelman, Ashley Judge, David B Allison, Stephanie Dickinson, Lilian Golzarri Arroyo, Anna L M Macagno et al.
  • 期刊/来源: American Journal of Epidemiology
  • 机构: Indiana University Bloomington · Columbia University · Texas Children's Hospital · Noblis · University of Iowa · MB Clinical Research and Consulting (United States)
  • 分类: vol 195 · issue 6 · pp 1624-1633
  • 相关性 2/10 · novelty: application
  • 摘要: 该文基于Aegis研究(2021–2022)的2178名参与者中507例实验室确诊SARS-CoV-2感染,探讨心理压力与感染后核衣壳抗体(N-antibody)应答的关系。使用线性混合效应模型估计基线感知压力与全因负荷对N-抗体轨迹的关联,并通过迭代后分层加权将样本标准化至美国成人总体。发现低压力组具有更高的抗体应答:低感知压力与感染后26天内的更高抗体水平相关(P=0.047),低全因负荷与24天内更高水平相关(P=0.049)。接种前感染状态对上述关系有修饰作用,在已接种个体中压力与抗体应答的关联消失(交互P=0.031)。文章结论认为高压力会削弱自然感染后的抗体应答,而疫苗接种可缩小高、低压力组间的抗体差距。总体而言,这是一项方法学标准、结果清晰的应用研究,展示了纵向数据中混合效应模型与标准化加权法的典型用法。
  • 关键技术: linear mixed effects models, iterative post-stratification weighting, longitudinal analysis, antibody absorbance measurement
  • 为什么对您有用: 本文属流行病学应用方向,以压力和免疫应答为研究问题,使用纵向数据与标准化加权,是传染病流行病学中标准分析流程的良好示例。武器库中的非参数统计与因果推断估计理论足以评估其标准化方法的合理性,且混合效应模型属于非常熟悉的工具,因此可立即模仿其分析框架应用于其他纵向流行病学研究。作为入门读物,它清晰呈现了数据收集、模型设定与结果解读,值得全文阅读以熟悉该领域的实证研究范式。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论