Evaluating the 2023 Mexican Dietary Guidelines for type 2 diabetes prevention: a target trial emulation in Mexican women¶
作者: Dalia Stern, M Arturo Aguilar-López, Liliana Gomez-Flores-Ramos, Sonia Rodriguez-Ramirez, Mildred Chávez-Cárdenas et al.
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 9/10
机构绿灯: Harvard University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/aje/kwag037
一、领域脉络与小综述¶
这个方向是什么:这个子方向要解决的根本科学问题是——当公共卫生政策(如国家膳食指南)已经发布,但我们不可能再做随机对照试验(RCT)去验证其长期预防效果时,如何从已有的观察性纵向队列数据中,可靠地估计若全员在基线时即遵循该指南(干预)与实际常规饮食(对照)相比,对慢性病(如2型糖尿病 T2D)发病风险的因果效应。当前成熟度:框架层面(target trial emulation + parametric g-formula)已有较成熟范式并在流行病学中被多次应用,但具体到每项政策评估时,基线依从率极低、干预定义需自适应调整、参数模型误设风险等操作与统计瓶颈仍普遍存在且缺乏系统性的半参数/非参数解决方案。
发展脉络(history): - 奠基工作:Hernán & Robins (2016) 提出 target trial emulation 框架,明确指出观察性因果研究的根本缺陷是缺乏明确的时间零点与干预协议,主张先写好"假想 RCT 的协议"再映射到观察性数据。这奠定了后续所有 longitudinal causal inference 在流行病学应用的逻辑起点。 - 主要进展:Robins (1986) 提出 g-formula(参数 g-formula),解决了纵向数据中随时间变化的混杂(time-varying confounding)受处理影响(treatment-confounder feedback)时,标准回归或 IPTW 无法正确识别因果效应的问题。随后,Hernán et al. (2018, 2019) 在护士健康研究等队列中,将 target trial emulation 与 parametric g-formula 结合,评估减肥、生活方式对心血管病与糖尿病的长期因果风险,形成了当前流行病学的标准应用范式。 - 当前 frontier:近年前沿开始关注基线依从率过低导致"假想干预"在真实队列中几乎无人满足(positivity 近乎破坏)的问题,以及如何在 parametric g-formula 的参数模型假设下处理多成分复合干预的联合分布模拟。本文即处于此 frontier:面对 2023 墨西哥膳食指南多项成分基线依从率 <10% 的现实,作者进行了"自适应阈值调整"以确保 positivity,并用 parametric g-formula 模拟 9 年反事实风险。 - 本文的位置:本文是 target trial + parametric g-formula 范式在拉美人群膳食指南评估上的首次应用,核心操作特征是对干预协议的自适应放宽(从"完全依从指南"退化为"至少 10% 人群满足的调整阈值")。
子线索聚类: 1. Target trial emulation 框架设计与协议制定:Hernán & Robins (2016) 及后续一系列论文(如 Hernán et al. 2018, 2019),聚焦于如何将观察性研究设计成"假想 RCT"的镜像,明确 eligibility criteria、treatment strategies、follow-up、outcome、causal contrast 与 analysis plan。这一簇解决的是"识别问题的逻辑骨架"。 2. Parametric g-formula 的纵向因果估计:Robins (1986) 奠基,后续由 Hernán 团队在多项真实队列中实证(如 2018 护士健康研究中的减肥策略评估、2019 的糖尿病预防)。这一簇解决的是"给定识别后,如何用参数模型模拟反事实轨迹并估计风险"。 3. Positivity 破坏与干预定义的自适应调整:本文及此前部分应用论文(如 Young et al. 2011 在多成分干预中的 g-formula 应用)触及:当假想干预在观察性数据中几乎无人自然满足时,如何调整干预定义以维持 positivity,以及这种调整对 estimand 语义的影响。这一簇目前文献较少,是操作与理论的双重瓶颈。
这个方向在追问的核心问题(2-4 个): 1. Estimand 的语义保真度:当基线依从率过低迫使研究者放宽干预阈值时,所估的因果对比(如"调整阈值干预 vs 常规饮食")是否仍能回答原政策问题("若全员依从原指南 vs 常规饮食")?放宽阈值改变了 estimand,其与原政策目标的距离如何量化? 2. Parametric g-formula 的模型误设风险:parametric g-formula 需对随时间变化的混杂变量与处理变量的联合分布逐层拟合参数模型(如 logistic 回归),模型误设会导致反事实风险估计偏离,尤其在多成分复合干预下联合分布的参数化极其脆弱。半参数/非参数替代(如 g-computation with machine learning)的可行性与效率如何? 3. Positivity 与 time-varying confounding 的交互:在纵向设定下,基线 positivity 破坏可通过调整干预定义缓解,但随时间演化的 positivity(某些混杂轨迹下干预概率趋零)仍可能破坏 g-formula 的识别,且参数模型会通过外推掩盖这一破坏。如何检测与应对?
⚠️ 作者的 framing(这是作者的说法): - 作者把缺口 frame 成:2023 墨西哥膳食指南刚修订,其对 T2D 预防的长期因果效果从未被评估,而 target trial emulation 是"显然的下一步"来填补这一政策评估空白。 - 被淡化或回避的竞争路线:作者未在 intro 中讨论 semiparametric / nonparametric g-formula(如基于机器学习的 g-computation 或 longitudinal doubly robust methods),也未讨论 IPTW / longitudinal TMLE 等可提供双重稳健性的替代估计方法。全文仅用 parametric g-formula,未对比其他估计路线的稳健性。 - 明显该被引 / 该存在却未出现的:半参数纵向因果推断的效率与稳健性理论(如 Robins & Rotnitzky 2001 on doubly robust estimation in longitudinal settings, 或近期 longitudinal TMLE / AIPTW 的工作);关于 positivity 破坏与 estimand 语义改变的理论讨论(如 Petersen et al. 2012 on positivity violations in causal inference)。这些缺失使得本文的估计策略缺乏方法学上的对照与理论自省——这是值得研究者去查的问题。
张力:未见明显对立引用。被引工作均在 target trial + parametric g-formula 范式内,结论方向一致(生活方式干预对 T2D 有潜在预防效果但精度不足),无彼此矛盾。但存在一个隐性张力:parametric g-formula 的参数外推倾向(在 positivity 薄弱区域依赖模型平滑性给出估计)与 target trial emulation 强调的"遵循 RCT 逻辑避免外推"之间存在方法论上的不一致——本文通过放宽干预阈值缓解了基线 positivity,但参数模型在纵向演化中的外推仍未被审视。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚
- 符号与指标:
- \(i = 1, \dots, n\):样本索引,\(n = 11307\)。
- \(k = 0, 1, \dots, K\):时间点,\(K = 9\) 年,\(k=0\) 为基线(2008-2010)。
- \(A_k\):时间 \(k\) 的处理变量(干预状态)。本文为多成分复合干预,设共有 \(J\) 个膳食指南成分(如蔬菜摄入、含糖饮料限制等),\(A_k = (A_k^{(1)}, \dots, A_k^{(J)})\),每个 \(A_k^{(j)}\) 为二值(1=满足该成分的调整阈值,0=不满足)。基线干预 \(A_0\) 为"在基线时同时满足所有 \(J\) 个成分的调整阈值"。
- \(L_k\):时间 \(k\) 的混杂变量向量(如年龄、BMI、家族史、其他饮食与生活方式变量),部分 \(L_k\) 受先前处理影响(time-varying confounding affected by prior treatment)。
- \(Y\):结局变量,\(Y=1\) 表示在 9 年内发生 T2D,\(Y=0\) 表示未发生。本文 estimand 为 9 年风险(9-year risk),即 \(P(Y=1)\) 在不同干预策略下的值。
-
\(Y^{a_0, a_1, \dots, a_K}\):潜在结局(counterfactual outcome),若个体从基线到时间 \(K\) 遵循干预轨迹 \((a_0, a_1, \dots, a_K)\) 下的 T2D 发生情况。
-
模型(数据生成机制): 观察性队列的纵向数据生成机制为:基线混杂 \(L_0\) → 基线处理 \(A_0\) → 随时间演化的混杂 \(L_1\)(受 \(L_0, A_0\) 影响)→ 时间 1 处理 \(A_1\) → … → \(L_K\) → \(Y\)。关键结构是 treatment-confounder feedback:\(A_k\) 影响 \(L_{k+1}\),而 \(L_{k+1}\) 又影响 \(A_{k+1}\) 与 \(Y\)。这使得标准回归或横断面 IPTW 无法正确识别因果效应,必须用 g-formula 等纵向方法。
-
可观测数据: 研究者实际观测到的是 \((L_0, A_0, L_1, A_1, \dots, L_K, Y)\) 的纵向轨迹样本,\(n=11307\) 条。其中 \(A_k\) 的各成分是膳食摄入的自报数据(食物频率问卷),\(L_k\) 包含 BMI、家族史、体力活动等自报数据,\(Y\) 通过自报 T2D 或行政数据链接识别。不可观测的是潜在结局 \(Y^{a_0, \dots, a_K}\)——若全员在基线即遵循指南并持续维持,9 年 T2D 风险会是什么?这只能靠因果假设与 g-formula 模拟去识别与估计。
-
Estimand(因果对比):
- 干预策略 \(\bar{a}_{\text{int}}\):基线时满足所有调整阈值(\(A_0^{(j)}=1\) for all \(j\)),且后续维持满足(\(A_k^{(j)}=1\) for all \(j, k \geq 1\))。
- 对照策略 \(\bar{a}_{\text{nat}}\):自然/常规饮食(即观察性数据中实际发生的 \(A_k\) 轨迹)。
- 目标 estimand:
- 风险差:\(P(Y^{\bar{a}_{\text{int}}}=1) - P(Y^{\bar{a}_{\text{nat}}}=1)\)
- 风险比:\(\frac{P(Y^{\bar{a}_{\text{int}}}=1)}{P(Y^{\bar{a}_{\text{nat}}}=1)}\)
第二步:最小内核——最简特例(单一成分、单一时间点)
剥掉多成分复合干预与纵向演化的复杂性,考虑最简特例:单一膳食成分(如含糖饮料 \(\leq 1\) 次/周)、单一时间点(基线干预 \(A_0\),无后续时间变化混杂,结局 \(Y\) 在固定时间后观测)。
-
在此特例下,treatment-confounder feedback 消失(无随时间变化的混杂),g-formula 退化为标准调整公式:
\[P(Y^{a_0}=1) = \sum_{l_0} P(Y=1 | A_0=a_0, L_0=l_0) P(L_0=l_0)\]这就是经典的 g-computation(参数化时即用回归预测反事实风险)。 -
估计步骤:
- 拟合参数模型 \(P(Y=1 | A_0, L_0)\)(如 logistic 回归)。
- 拟合 \(P(L_0)\) 的经验分布或参数模型。
- 对每个 \(l_0\) 值(或样本中每个个体的 \(l_0\)),用模型预测 \(A_0=1\) 下的 \(P(Y=1 | A_0=1, l_0)\)。
- 对所有个体预测值求平均,得 \(\hat{P}(Y^{a_0=1}=1)\)。
-
同理得 \(\hat{P}(Y^{a_0=0}=1)\) 或自然风险 \(\hat{P}(Y=1)\),计算风险差与风险比。
-
核心数学困难在此特例下退化成什么:此特例下无纵向混杂反馈,无 positivity 的纵向演化问题,估计退化为标准参数调整。真正的数学困难在纵向多成分情形:需要逐层拟合 \(P(A_k | \bar{A}_{k-1}, \bar{L}_k)\) 与 \(P(L_k | \bar{A}_{k-1}, \bar{L}_{k-1})\) 的联合参数模型,然后通过 Monte Carlo 模拟生成反事实轨迹,计算 \(P(Y^{\bar{a}}=1)\)。多成分联合分布的参数化(\(J\) 个二值成分的联合 logistic 模型)与 positivity 在纵向演化中的维持,是核心难点。
-
本文关键想法怎么破:面对基线 positivity 破坏(多项成分依从率 <10%),作者不修改估计方法,而是修改 estimand 的干预定义——将指南阈值放宽到"至少 10% 人群满足的调整阈值",使得 \(P(A_0^{(j)}=1) \geq 0.1\) 对所有 \(j\)。这保证了参数模型在基线层的外推不至于完全脱离数据支撑,但 estimand 语义从"依从原指南"变为"依从调整阈值",与原政策问题的距离未被量化。
三、这篇论文做了什么¶
三句话: ①研究了 2023 墨西哥膳食指南对 2 型糖尿病的 9 年预防因果效果,在墨西哥教师队列中用 target trial emulation 框架进行评估。 ②核心方法为 parametric g-formula,通过拟合纵向参数模型并 Monte Carlo 模拟反事实轨迹,估计干预与常规饮食下的 9 年 T2D 风险差与风险比;面对基线依从率过低,对干预阈值进行了自适应调整。 ③主要结论:9 年 T2D 风险在常规饮食下为 8.44%,干预下为 7.11%(风险差 −1.33 pp,95% CI 包含零),提示适度潜在收益但统计精度不足,数据与小收益、无效果或轻微风险增加均兼容。
关键设定与假设:
在第二节最小记号基础上补全完整设定:
- Target trial 协议:
- Eligibility:女性,年龄 \(\geq 40\),无基线 T2D、心血管病、癌症,有完整基线与至少一次随访数据(\(n=11307\))。
- Treatment strategies:干预策略为"基线满足所有调整阈值并持续维持";对照为"常规饮食"(自然轨迹)。
- Follow-up:9 年(2008-2010 基线至 2017-2019 末次随访)。
- Outcome:incident T2D(自报或行政数据链接)。
- Causal contrast:干预 vs 对照的 9 年风险差与风险比。
-
Analysis plan:parametric g-formula,意向性分析(intention-to-treat analog,一旦基线分配干预即视为干预组,不依从也保留)。
-
因果识别假设(g-formula 所需,本文隐含依赖但未显式检验):
- Consistency:观察到的 \((A_k, L_k, Y)\) 等于潜在值 \((A_k^{\bar{a}}, L_k^{\bar{a}}, Y^{\bar{a}})\) 当实际轨迹 \(\bar{a}\) 等于干预轨迹 \(\bar{a}_{\text{int}}\) 或 \(\bar{a}_{\text{nat}}\) 时。对于复合膳食干预,此假设要求干预成分的叠加效应无交互偏离(well-defined intervention)。
- Sequential exchangeability / No unmeasured confounding:\(Y^{\bar{a}} \perp A_k | \bar{A}_{k-1}, \bar{L}_k\) 对所有 \(k\)。即在每个时间点,给定历史处理与混杂,当前处理与潜在结局独立。本文依赖自报混杂(BMI、家族史、体力活动等),未测量混杂(如基因、精确饮食质量)可能破坏此假设。
-
Positivity:\(P(A_k = a_k | \bar{A}_{k-1}, \bar{L}_k) > 0\) 对所有 \(k\) 与支撑内的 \(l_k\)。基线 positivity 通过调整阈值缓解(每成分 \(\geq 10%\)),但纵向 positivity(某些混杂轨迹下维持干预的概率)未显式检验。
-
干预阈值调整(本文核心操作特征): 原指南 14 个成分中,基线依从率 <10% 的有多个(如蔬菜 \(\geq 400g/\) 天依从率仅 3%)。作者将阈值放宽至"至少 10% 人群满足"的水平(如蔬菜降至 \(\geq 200g/\) 天),使得 \(P(A_0^{(j)}=1) \geq 0.1\)。这改变了 estimand 的语义——评估的是"调整阈值干预"而非"原指南干预"。
-
相比已有文献的设定差异:
- Hernán et al. (2018, 2019) 的 target trial 应用中,干预定义通常为二值或简单连续阈值,且基线依从率足够高(如减肥 \(\geq 5%\) 体重在护士健康研究中约 15-20% 满足),无需大幅调整干预定义。本文因拉美人群基线饮食质量较差,首次系统性地对多成分干预进行了阈值放宽,这是设定上的新操作,但方法学上仍是 parametric g-formula 的直接套用。
主要结果:
- 核心量化结论:
- 9 年 T2D 风险(常规饮食):8.44%(95% CI: 7.84, 9.12)
- 9 年 T2D 风险(调整阈值干预):7.11%(95% CI: 5.05, 9.82)
- 风险差:−1.33 pp(95% CI: −3.21, 1.29)
- 风险比:0.84(95% CI: 0.61, 1.15)
-
95% CI 包含零,数据与小收益、无效果或轻微风险增加均兼容。
-
与 baseline 对比:本文无其他估计方法(如 IPTW、TMLE)的对比,baseline 是"常规饮食下的自然风险"(由 parametric g-formula 模拟得出,非直接观测发病率),干预风险也是 g-formula 模拟。方法学上无替代估计路线的稳健性对比。
-
稳健性:
- 作者做了敏感性分析:对基线自报 T2D 的误分类进行了修正(假设假阴性率 20%),修正后风险差方向一致但 CI 更宽。
- 对失访(censoring)进行了调整:在 g-formula 中纳入 censoring 模型,模拟无失访下的反事实风险。
- 未做未测量混杂的定量敏感性分析(如 E-value 或 Rosenbaum bounds),这是方法学上的缺失。
证明路线与技术技巧(应用型,重点拆方法设计与估计流程):
本文为应用型论文,无定理证明,但 parametric g-formula 的估计流程本身是一条"计算路线",需拆清楚:
- 整体路线(5 步):
- 数据准备与 target trial 协议制定:从墨西哥教师队列中筛选 eligible 个体,定义干预策略(调整阈值)、对照策略、随访与结局。
- 拟合纵向参数模型:对每个时间点 \(k\),拟合以下模型:
- \(P(L_k | \bar{A}_{k-1}, \bar{L}_{k-1})\):混杂变量的演化模型(如 BMI 的线性回归、家族史等固定变量的常数模型)。
- \(P(A_k | \bar{A}_{k-1}, \bar{L}_k)\):处理变量的模型(各膳食成分的 logistic 回归,多成分联合分布通过分别拟合边际模型再组合,假设成分间给定历史的条件独立或用联合模型)。
- \(P(Y=1 | \bar{A}_K, \bar{L}_K)\):结局模型(T2D 的 logistic 回归)。
- \(P(C_k | \bar{A}_{k-1}, \bar{L}_{k-1})\):失访模型(censoring 的 logistic 回归)。
- Monte Carlo 模拟反事实轨迹:
- 干干预策略下:从基线开始,强制设定 \(A_0^{(j)}=1\)(所有成分满足调整阈值),然后用拟合的 \(P(L_1 | A_0=1, L_0)\) 模拟 \(L_1\),再强制 \(A_1^{(j)}=1\),依此递推至 \(K\),最后用结局模型预测 \(Y\)。重复 \(m\) 次(如 \(m=10000\)),计算干预下 9 年风险 \(\hat{P}(Y^{\bar{a}_{\text{int}}}=1)\)。
- 在自然/对照策略下:从基线开始,用拟合的 \(P(A_0 | L_0)\) 模拟 \(A_0\)(即从模型随机抽样而非强制),然后用 \(P(L_1 | A_0, L_0)\) 模拟 \(L_1\),再用 \(P(A_1 | A_0, L_1)\) 模拟 \(A_1\),依此递推至 \(K\),计算自然风险 \(\hat{P}(Y^{\bar{a}_{\text{nat}}}=1)\)。
- 计算因果对比:风险差 = \(\hat{P}(Y^{\bar{a}_{\text{int}}}=1) - \hat{P}(Y^{\bar{a}_{\text{nat}}}=1)\),风险比 = \(\hat{P}(Y^{\bar{a}_{\text{int}}}=1) / \hat{P}(Y^{\bar{a}_{\text{nat}}}=1)\)。
-
置信区间:用 Bootstrap(如 500 次重抽样)重复步骤 2-4,得风险差与风险比的 95% CI。
-
关键跳跃点 / 难点:
- 多成分联合分布的参数化:\(J\) 个二值膳食成分在每个时间点的联合分布 \(P(A_k^{(1)}, \dots, A_k^{(J)} | \bar{A}_{k-1}, \bar{L}_k)\) 需要参数化。本文分别拟合每个成分的边际 logistic 模型,然后在模拟中独立抽样各成分——这隐含了给定历史下各成分条件独立的假设,若成分间有交互(如高蔬菜摄入者往往也低含糖饮料摄入),此假设导致联合分布误设,进而影响反事实风险估计。这是本文参数模型最脆弱的跳跃点。
-
Positivity 的纵向维持:基线 positivity 通过调整阈值缓解,但在纵向模拟中,某些混杂轨迹下(如高 BMI + 低体力活动)维持所有成分满足调整阈值的概率可能极低,参数模型会通过 logistic 的平滑外推给出非零但不可靠的预测。本文未检验纵向 positivity。
-
技术技巧点名:
- Parametric g-formula / g-computation:核心估计方法,用参数模型逐层拟合纵向分布,通过 Monte Carlo 模拟反事实轨迹。用在步骤 2-3,解决 treatment-confounder feedback 下的因果识别与估计。
- Monte Carlo simulation:用于步骤 3,从拟合的参数模型中抽样生成反事实轨迹,计算反事实风险。避免了 g-formula 直接求和的高维组合爆炸。
- Bootstrap:用于步骤 5,重抽样估计置信区间,应对 g-formula 估计的复杂非线性(模拟风险是模型参数的非线性函数,解析标准误不可得)。
- Intention-to-treat analog:分析策略,基线分配干预后不依从也保留在干预组,模拟中强制设定 \(A_0\) 为干预值但后续 \(A_k\) 可能偏离(本文假设持续维持,即 per-protocol analog,但声称用 ITT 思路——此处有轻微不一致,实际模拟是 per-protocol:强制所有 \(A_k=1\))。
真实例子与应用:
- 用的什么数据 / 场景:墨西哥教师队列(Mexican Teachers Cohort),2008-2010 基线至 2017-2019 随访,\(n=11307\) 名 40+ 岁女性,无基线 T2D/心血管病/癌症。膳食摄入通过自报食物频率问卷,T2D 通过自报或行政数据(IMSS 医疗记录链接)识别。
- 怎么把本文方法用上去:
- 定义 target trial 协议(eligibility, 干干预策略为调整阈值膳食指南, 对照为常规饮食, 9 年随访, T2D 结局)。
- 对 14 个膳食成分计算基线依从率,对 <10% 的成分放宽阈值至 \(\geq 10%\) 满足的水平。
- 拟合纵向参数模型(混杂演化、处理、结局、失访)。
- Monte Carlo 模拟干预与自然轨迹下的反事实 9 年 T2D 风险。
- Bootstrap 计算风险差与风险比的 95% CI。
- 得到什么结果:风险差 −1.33 pp(95% CI 包含零),风险比 0.84(95% CI 包含 1)。调整阈值干预下 9 年风险 7.11%,常规饮食下 8.44%。敏感性分析(基线 T2D 误分类修正、失访调整)方向一致但 CI 更宽。
- 这个例子想说明什么:验证 target trial + parametric g-formula 在拉美人群膳食指南评估中的可行性,展示调整阈值干预的潜在效果方向,但主要结论是统计精度不足(CI 宽且包含零),提示需要更大样本或更精确的估计方法。本文未展示相对 baseline 估计方法(如 IPTW / TMLE)的优势,仅展示了 parametric g-formula 的直接应用。
🔎 结论是否比证明窄:
- 本文在方法学部分声称使用了"intention-to-treat approach"(第 5 页),但实际模拟中强制所有时间点的 \(A_k^{(j)}=1\)(持续维持干预),这是 per-protocol analysis 而非 ITT。ITT 应允许后续不依从(模拟中 \(A_k\) 从模型抽样而非强制)。此不一致使得结论的 estimand 语义比声称的更窄(per-protocol effect 而非 ITT effect)。
- 作者在 Discussion 中承认"调整阈值干预不等于原指南干预",但未量化两者 estimand 的差异——结论声称"适度潜在收益",但这个收益是针对调整阈值干预的,对原指南的效果仍是外推。
- 作者未检验纵向 positivity 与多成分联合分布的条件独立假设,结论的可靠性比参数模型的表面拟合更窄——若这些假设违反,风险差估计可能偏离。
四、开放问题(点到为止,扎根具体语句)¶
-
Estimand 语义改变的量化:本文将干预阈值从原指南放宽至调整阈值(确保 \(\geq 10%\) 依从率),但 estimand 从"原指南效果"变为"调整阈值效果"。如何量化两者之间的差异?——扎根在 Discussion 第 7 页:"Our adapted thresholds may not reflect the full potential of the original Guidelines"。可追问:在半参数框架下,能否定义一个从调整阈值到原指南的"estimand sensitivity bound"?
-
Parametric g-formula 模型误设的稳健性替代:本文依赖多成分边际 logistic 模型的条件独立假设与混杂演化的参数模型,未与 semiparametric / nonparametric 替代(如 longitudinal TMLE / doubly robust estimation)对比。扎根在 Methods 第 4 页:"We used the parametric g-formula to estimate counterfactual risks",无其他估计路线讨论。可追问:在多成分复合干预下,longitudinal TMLE 或 AIPTW 能否提供双重稳健性,且如何处理 positivity 破坏?
-
纵向 positivity 的检测与应对:基线 positivity 通过调整阈值缓解,但纵向演化中某些混杂轨迹下维持干预的概率可能趋零。扎根在 Methods 第 4 页对 positivity 的隐含依赖(未显式检验)。可追问:如何在 parametric g-formula 的 Monte Carlo 模拟中检测纵向 positivity 破坏(如某些轨迹下干预概率的拟合值极低),并在 semiparametric 框架下用 positivity-restricted estimand 或 trimming 应对?
-
未测量混杂的定量敏感性分析:本文仅做了自报 T2D 误分类的敏感性分析,未做未测量混杂(如基因、精确饮食质量)的定量敏感性分析。扎根在 Discussion 第 7 页:"residual confounding cannot be ruled out",但无 E-value 或 Rosenbaum bounds 等定量分析。可追问:在 longitudinal causal inference 下,如何将未测量混杂的敏感性分析(如 E-value)扩展到 parametric g-formula 的反事实风险估计上?
(要确认某条是不是真 gap,去读同子领域近期约 5 篇的 intro——都指向它 = 共识(真 gap),互相打架 = 机会。)
Maintained by 陈星宇 · Homepage · Source on GitHub