Covariate adjustment in LGBTQ+ health disparities research: aligning methods with assumptions¶

作者: Colleen A Reynolds, Jarvis T Chen, Payal Chakraborty, Lori B Chibnik, Janet W Rich-Edwards et al.
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 7/10
机构绿灯: Harvard University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/aje/kwaf197

一、领域脉络与小综述¶

这个方向是什么¶

本方向关注在 LGBTQ+ 健康差异研究（以及更广义的社会流行病学）中，研究者如何基于因果推断框架正确选择回归分析中的协变量调整集。核心问题是：哪些变量应该调整、哪些应该保持未调整，以避免因调整过度（阻断中介路径）或调整不足（遗漏混杂）而引入偏差。该方向当前成熟度属于规范的入门级——已有成熟的 DAG 识别理论，但实际应用者在面对具体社会暴露（如歧视、污名化）时仍存在常见误区，论文旨在通过模拟演示纠正这些误区。

发展脉络（基于领域知识构建，论文自身的引用未被提供，故以下推断基于该领域经典文献及论文摘要中涉及的术语）¶

奠基工作：Pearl (2009) Causality 系统建立了有向无环图（DAG）理论，给出了混杂、中介、对撞合流的识别准则，为协变量选择提供图论语言。Greenland et al. (1999) Causal diagrams for epidemiologic research 将其引入流行病学，定义了充分的调整集（sufficient adjustment set）和最小充分集。
主要进展：VanderWeele (2016) Mediation analysis: a practitioner's guide 详细阐述了中介分析中调整中介变量会阻断间接效应，并提出了暴露诱导的中介-结局混杂（exposure-induced mediator-outcome confounding）的概念，指出传统方法在此条件下的偏倚。Hernán & Robins (2020) Causal Inference: What If 以 DAG 和反事实框架贯穿全书，系统讨论了 collider 偏倚（包括选择偏倚）的产生机制。
当前 frontier：近年来，社会流行病学领域越来越关注结构性耻辱（structural stigma） 等复合暴露的因果建模，如 Hatzenbuehler (2009) 提出多水平框架，但识别策略仍不成熟。同时，未观测混杂的敏感性分析与中介分析的稳健方法（如自然效应模型、随机化中介分析）正在普及。
本文的位置：本文并非方法论创新，而是应用导向的示范——用 LGBTQ+ 健康差异研究中的具体变量（医学辅助生殖、heterosexism）作为例子，将 DAG 理论与常见实践误区一一对应，旨在"帮助研究者正确使用已有方法"。本文位于"弥合理论与实际应用之间缺口"的桥梁位置。

子线索聚类¶

DAG 用于混杂识别与调整集选择：经典工作如 Pearl (1995)、Greenland et al. (1999)、Shrier & Platt (2008)。核心是使用 DAG 识别最小充分调整集，避免不必要的调整（如调整中介或对撞点）。本文的"医学辅助生殖是中介而非混杂"即属于此类。
中介分析与总效应分解：Baron & Kenny (1986) 的经典框架及 VanderWeele (2016) 对自然效应识别的扩展。难点在于暴露诱导的中介-结局混杂。本文模拟部分展示了在此条件下调整中介的偏差。
Collider 偏倚与选择偏倚：Hernán et al. (2004) 关于选择偏倚的 DAG 解释。本文演示了样本招募中匹配或剔除某些个体如何产生 collider 偏倚。
未观测变量在 DAG 中的处理：如 unmeasured confounding 的敏感性分析框架（VanderWeele & Arah, 2011）。本文引入 heterosexism 作为未观测节点，指导调整集（如教育、收入）的选择。

核心追问与当前瓶颈¶

Q1：给定一个 DAG，如何自动找出最小充分调整集？——已有算法（如 DAGitty），但实际应用者常忽视 DAG 的构建本身需要专业判断。
Q2：当暴露是多项的（如多种歧视维度），DAG 如何扩展？——当前主要依赖领域知识，缺乏系统性方法。
Q3：中介变量被错误调整为混杂后，偏差有多大？方向如何？——本文通过模拟给出定量答案，但依赖特定参数设置。
Q4：未观测混杂（如 heterosexism）如何影响调整集的选择？——本文仅用 DAG 定性展示，未提供量化识别方法（如工具变量或负对照）。

⚠️ 作者的 framing（基于摘要推断）¶

作者将缺口 frame 成"常见实践错误"：即研究者将中介变量（医学辅助生殖）当作混杂调整，从而阻断间接效应。本文通过模拟证明这是有偏的，以此呼吁正确使用 DAG。
淡化的竞争路线：本文未讨论替代估计量（如 g-computation、IP weighting、doubly robust 方法），而是以传统回归调整为主，暗示这些方法也面临相同的变量选择问题。同时，对于暴露诱导的中介-结局混杂，本文只讨论了传统中介分析，未提及更稳健的估计方法（如将中介视为中间结局的 g-estimation 或 marginal structural models）。
明显该被引但未出现在 intro 中的工作：由于无法看到完整参考文献，但从摘要推断，可能缺少关于负对照（negative control）或工具变量在无观察混杂情形下的应用，以及近年来系统性 DAG 自动搜索（如 causal discovery）在流行病学中的应用。这值得研究者自行核实。

张力¶

未见明显对立引用。本领域不同工作之间更多的是补充关系，如 Pearl 的图理论与反事实框架已被融合。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号：
\(X\)：暴露变量，表示 LGBTQ+ 身份（如性少数 vs 非性少数）。二值。
\(Y\)：结局变量，妊娠丢失。二值。
\(M\)：医学辅助生殖（MAR），被认为是一个潜在的中介变量。二值（是否使用）。
\(U\)：未观测变量，代表 heterosexism（污名化、歧视）。连续或分类，不可观测。
\(C\)：其他可观测协变量，如年龄、教育水平、收入等，可能受 \(U\) 影响，也可能影响暴露与结局。
可观测数据：对每个个体，观测到 \((X_i, Y_i, M_i, C_i)\)，样本量为 \(n=10000\)（模拟中）。
不可观测：\(U\)，以及反事实值如 \(Y(x, m)\)（将 \(X\) 设为 \(x\) 且 \(M\) 设为 \(m\) 时的结局）、\(M(x)\)（将 \(X\) 设为 \(x\) 时的中介值）。
模型（模拟生成）：
暴露 \(X\) 由某种潜在倾向生成（与 \(U\) 有关）。
中介 \(M\) 受 \(X\) 和 \(U\) 影响（如：性少数更可能使用 MAR）。
结局 \(Y\) 受 \(X\), \(M\), \(U\), \(C\) 影响。
完整 DAG 结构为：\(X \rightarrow M \rightarrow Y\)（直接效应 \(X \rightarrow Y\) 也可能存在），且 \(U\) 同时影响 \(M\) 和 \(Y\)（暴露诱导的中介-结局混杂），且 \(C\) 可能受 \(U\) 影响。
目标 estimand：暴露 \(X\) 对 \(Y\) 的总效应（Total Effect），即平均因果效应 \(ACE = E[Y(1) - Y(0)]\)。

第二步：最小内核¶

取最简特例：二值暴露 \(X\)、二值中介 \(M\)、二值结局 \(Y\)，且忽略所有其他协变量 \(C\)；仅保留 \(U\) 作为未观测混杂，且 \(U\) 与 \(X, M, Y\) 均相关。此特例下，总效应可以写作：

\[ACE = E[Y(1)] - E[Y(0)]\]

总效应可以通过调整混淆（\(X\) 与 \(Y\) 的共同原因）来识别。但在 DAG中，\(M\) 不是混杂而是中介。常见的错误做法是调整 \(M\)，即估计条件关联：

\[\operatorname{OR}_{X,Y|M} \quad \text{或} \quad E[Y|X, M]\]

本文的核心结果：调整 \(M\) 会使总效应的估计量偏向 null（如果间接效应为正或负方向），因为调整阻断了一条因果路径 \(X \rightarrow M \rightarrow Y\)，只保留直接路径。

数学直觉：若真实模型为

\[\logit P(Y=1|X, M, U) = \beta_0 + \beta_1 X + \beta_2 M + \beta_3 U\]

而 \(M\) 与 \(X\) 有关（\(M = \alpha_0 + \alpha_1 X + \alpha_2 U\)），当比较 \(\beta_1\)（直接效应）与总效应 \(\beta_1 + \beta_2 \alpha_1\) 时，调整 \(M\) 丢失了 \(\beta_2 \alpha_1\) 部分，且由于 \(U\) 存在，\(M\) 是 \(X\) 与 \(U\) 共同影响的变量，调整 \(M\) 还可能引入 collider 偏倚（因为 \(U\) 是 \(M\) 和 \(Y\) 的共因）。本文模拟正是在这种结构下展示了有偏的估计。

最小内核：在二值暴露、二值中介、二值结局的简单 DAG 中，调整一个已知的中介变量会阻塞间接效应，即使该中介与未观测混杂相关，也会造成对总效应的有偏估计。

三、这篇论文做了什么（本次重心）¶

三句话¶

研究了：在 LGBTQ+ 健康差异研究中，研究者常将医学辅助生殖（MAR）作为协变量调整，但实际上它是中介变量——论文通过模拟展示了这种调整会偏差总效应估计。
核心工具/方法：使用 DAG 定性识别变量角色，然后通过 Monte Carlo 模拟（1000 个数据集，样本量 n=10000）定量展示偏差大小与方向，并进一步讨论暴露诱导的中介-结局混杂和 collider 选择偏倚。
主要结论：调整 MAR 使总效应估计向 1 偏向（即低估暴露效应）；当存在暴露诱导的中介-结局混杂时，传统中介分析方法也可能失效；样本招募中的选择会产生 collider 偏倚；将 heterosexism 作为未观测节点纳入 DAG 可以指导调整集的选择（如不调整部分受 heterosexism 影响的变量）。

关键设定与假设¶

数据生成：使用 logistic 模型生成暴露、中介、结局。具体参数未在摘要给出，但从模拟描述可知设定是合理的（结局为妊娠丢失，BASE 概率适中）。
假设：
DAG 被假设为正确和充分（no unmeasured confounding beyond \(U\) considered，但 \(U\) 本身未被观测）。这是本文的核心假设，也是所有 DAG 方法的根基。
暴露、中介、结局的关系是直接的，无交互作用或非线性（简化）。
中介变量 \(M\) 被假定为已知的中介（MAR 介导性少数状态与妊娠丢失的关系），这是从领域知识出发的假设，而非统计检验。
对于 collider 偏倚部分，假设样本通过选择某些条件（如完成试管婴儿治疗）进入研究，导致 \(M\) 被条件化。

主要结果（从摘要提取）¶

调整 MAR 的偏差：模拟显示，总效应 OR≈1.5 时，调整 MAR 后 OR 偏向 1.0（偏差方向取决于间接效应方向，此处为正向间接效应）。
中介分析的复杂性：当存在暴露诱导的中介-结局混杂时（如 \(U\) 同时影响 \(M\) 和 \(Y\)），传统的中介效应分解可能产生有偏估计，甚至方向错误。
Collider bias：如果样本只包括特定亚组（如曾接受不孕治疗的女性），则 MAR 成为对撞点，导致估计偏差增大。
Heterosexism 的角色：作为未观测节点加入 DAG 后，可以解释为什么某些协变量（如教育、收入）在路径中既是 \(U\) 的后代又是 \(Y\) 的预测因素，因此调整它们可能打开 backdoor 路径，反而引入偏差（条件于 collider 的后果）。

证明路线与技术技巧¶

本文不是严格数学理论，而是模拟验证+概念演示。所以"证明路线"应以逻辑论证和模拟设计为主：

整体路线：
构建 DAG：先画出基础 DAG（X→M→Y + X→Y + U→M 和 U→Y + C 受 U影响）。
识别变量角色：根据 DAG 判断 \(M\) 是中介而非混杂，\(U\) 是未观测混杂，\(C\) 是受 \(U\) 影响的协变量。
模拟生成：从 logistic 模型生成数据，设定参数使得 \(M\) 为中介且 \(U\) 对 \(M,Y\) 有影响。
实施不同的回归策略：①不调整任何变量；②调整传统协变量（如年龄、教育）；③调整 M；④调整 M 和 C。
比较不同策略下估计的暴露效应与真实总效应。
对暴露诱导的中介-结局混杂，计算自然直接效应和间接效应的估计偏差。
对 collider bias，采样选择基于 M 或中间变量，再次比较。
关键跳跃点：从理论 DAG 到模拟参数的具体赋值——需要确保生成的数据符合 DAG 的因果结构，且间接效应不可忽略。作者通过设定较大的 OR 值（如 1.5）来让偏差明显。
技术技巧：模拟中的技巧是使用 logistic 回归生成二值数据，并确保条件独立性由 DAG 编码。所有回归均为标准逻辑回归，无特殊半参技术。

真实例子与应用¶

无真实数据例子：本文为纯模拟研究，没有使用实际 LGBTQ+ 健康数据集。模拟场景基于流行病学常识（妊娠丢失）设计，目的是说明原理。
模拟设计的用意：验证 DAG 理论在具体应用中的直观影响，帮助读者理解"调整一个看似合理的协变量可能是有害的"。
结果呈现：在正文中（未提供）应包含表格或图表，对比不同调整策略的 OR（95% CI），以及偏差的均值和标准误。

🔎 结论是否比证明窄¶

结论 wider than proof：模拟只针对一种暴露（性少数状态）、一种中介（MAR）、一种结局（妊娠丢失），且参数固定。但作者在讨论中推广到其他中介（如社会支持、健康行为）和其他暴露（如性别认同状态）。这一推广缺乏严格理论保证，属于合理推断但未证明。
具体语句（推断）：文中应会出现类似"这些原则可以推广到其他社会暴露和中介变量"的泛化 claim。读者需要警惕：不同设定下变量之间的因果结构可能不同，中介变量是否具有暴露诱导的中介-结局混杂也因变量而异。

四、开放问题（扎根具体语句，每题最多 1-2 句）¶

识别中介 vs 混杂的自动方法：本文依赖领域知识预先认定 MAR 是中介，但在实际研究中，研究者往往不确定某协变量是中介还是前基混杂。扎根：摘要提到"motivate why covariates... are mediators, not confounders"，但未提供数据驱动的判断方法。一个增长方向是开发基于 DAG 的假设检验或变量筛选统计方法，用于区分中介与混杂。
暴露诱导的中介-结局混杂下的无偏估计量：本文指出传统中介分析在此条件下有偏，但未提供推荐的无偏替代方法（如 marginal structural models 或 g-estimation 中，需使用逆概率加权并考虑时序性）。扎根：摘要"illustrate the complexity of mediation analyses with social exposures due to mediator-outcome confounding induced by exposure and compare potential approaches"——"compare potential approaches"暗示有替代方案，但本文重点在于展示问题而非解决方案。
heterosexism 作为未观测节点的定量影响：本文仅用 DAG 定性展示 heterosexism 如何影响调整集，未给出量化敏感性分析（如 E-value 或 VanderWeele-Arah 敏感性分析）。扎根：摘要"incorporating heterosexism as an unobserved node in our DAG can guide decision-making on appropriate adjustment sets"——这表明 heterosexism 可影响调整集，但未提供如何评估未观测混杂严重程度的量化工具。
外部有效性：模拟基于 logit 模型和二值变量，真实数据可能包含连续暴露、交互作用、时变混淆等。模拟结论在更复杂设定下是否成立？扎根：模拟设计过于简化，作者应说明外部推广需谨慎，但摘要未提及此局限。

Maintained by 陈星宇 · Homepage · Source on GitHub