The subtype-free average causal effect for heterogeneous disease etiology¶

作者: A Sasson, M Wang, S Ogino, D Nevo
来源: Biometrics
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本子方向关注的是 疾病异质性（disease heterogeneity）下的因果推断。核心科学问题是：当一种疾病可以根据分子病理特征（如结直肠癌的MSI状态）划分为多个亚型时，如何从观察数据中识别并估计暴露（如吸烟）对某特定亚型疾病发病的因果效应？该问题的难点在于，标准的多分logit回归（将不同亚型视为多元响应）会因一种称为“selection bias”的机制而产生偏差，即使所有混杂因子都被测量（Nevo et al., 2021）。当前方向处于一个方法活跃发展、但仍存在根本性识别困局的阶段：研究者们试图提出替代的因果 estimand（如主分层框架下的SACE）来规避选择偏差，但这些 estimand 本身又依赖于不可检验的假设。

发展脉络¶

从引用文献出发，该方向的发展可梳理为以下三步：

奠基工作：分子病理流行病学（MPE）的兴起与疾病异质性的实证发现（~2010-2016）。
- Wang et al. (2016) 系统综述了研究疾病亚型异质性的统计方法（尤其是多分logit回归），并指出了其适用场景。它奠定了方法论讨论的基础。
- Ogino et al. (2016) 界定了MPE的定义和范围，强调基于分子特征分类亚型能改进病因学理解。它为整个方向提供了生物医学领域的科学动机。
- Carr et al. (2018) 和 Amitay et al. (2020) 分别提供了流行病学证据：“吸烟已被发现是MSI-高亚型的强风险因素，而对非MSI-高亚型的关联较弱”。这暴露了标准综合分析中的问题：如果效应在各亚型间不同，一个单一的“总平均效应”就掩盖了这一异质性。
关键突破：识别“选择偏差”并引入因果框架（~2018-2021）。
- Nevo et al. (2021) 是关键的理论突破。它明确指出了传统多分logit回归的缺陷：“这可能无法恢复因果效应，即使所有混杂因子都被测量，原因是一种特殊类型的选择偏差”。它用DAG清晰地解释了这种偏差如何产生，并进行了模拟演示。这篇论文是本文的直接理论起点。
- Young et al. (2018) 提供了竞争风险事件下的因果框架，定义了“总效应”和“直接效应”。它提供了一个更严格的因果语言，与本文的问题场景（多重亚型被视为相互竞争的事件）密切相关。
当前Frontier：主分层（Principal Stratification）与替代Estimand的探索（~2006-2021）。
- Rubin (2006) 是主分层框架的开创性文献。它创造了“因死亡而删失”这一经典场景，并提出了 Survivor Average Causal Effect (SACE)。本文直接继承了SACE的思想（“our proposed approach is based on the same idea as the SACE”）。
- Ding & Lu (2016) 和 Zehavi & Nevo (2021) 推进了主分层的识别和估计方法。Ding & Lu提出了基于“主得分”（principal scores）的权重重估方法，Zehavi & Nevo则开发了匹配方法。这些工作为本文的估计部分提供了工具基础。
- Stensrud et al. (2019) 提出了竞争风险下的“可分离效应”（Separable Effects），这是一个与本文不相容但相关的替代概念，要求“暴露可以被概念性地分解为影响每个亚型疾病的组分”。本文隐晦地对比了可分离效应，指出自己的框架不需要这种假设。

子线索聚类¶

这些被引文献大致落在三条子线索上： - 线索A（关键引文）：基于传统多分logit回归的比较方法。 包括 Wang et al. (2016), Zabor & Begg (2017) 等。它们提供了一套成熟但受限于选择偏差的统计工具，是本文要挑战的基准。 - 线索B（核心方法）：主分层（Principal Stratification）框架下的因果效应估计。 包括 Rubin (2006), Ding & Lu (2016), Zehavi & Nevo (2021), Nevo & Gorfine (2020)。这是本文采用的框架，核心挑战在于不可检验的识别假设（如单调性）和对“死亡”或“未患其他亚型”这类问题的处理。 - 线索C（补充视角）：竞争风险（Competing Risks）与替代效应定义。 包括 Young et al. (2018), Stensrud et al. (2019)。它们从不同因果角度定义了效应，为本文的 estimand 提供了对比。

核心追问与已知瓶颈¶

核心问题1（科学问题）：在疾病亚型异质性的背景下，暴露的因果效应是什么？是针对特定亚型（如吸烟→MSI-高），还是针对一个“无其他亚型”的人群？
核心问题2（识别问题）：如何避免多分logit回归中的选择偏差？Nevo et al. (2021) 已经证明这种偏差在标准方法中普遍存在。
核心问题3（可识别性）：新提出的 estimand 是否能在非参数假设下从观测数据中识别？若不能，需要哪些（可验证/不可验证）的假设？已知瓶颈是几乎所有主分层 estimands（如SACE）都需要依赖不可检验的假设（如单调性）才能实现点识别。
核心问题4（敏感度分析）：因为识别依赖于不可检验假设，如何评估这些假设被违反时结果的稳健性？这是该领域研究的标配。

⚠️ 作者的Framing¶

这是作者的说法：作者将当前文献的缺口 frame 成“现有方法（多分logit）存在因果偏差”和“SACE-type的主分层效应虽然理想，但尚未被应用到疾病亚型异质性问题上”。作者以此论证自己提出的SF-ACE是这个问题的“显然的下一步”，并声称比可分离效应（Stensrud et al.）更“直接”。

被淡化或回避的竞争路线：作者只提到了Stensrud et al.的可分离效应作为一条替代路线，但没有详细比较两者在局限性上的不同——例如，可分离效应需要更强的假设（暴露可分解），而SF-ACE需要更细致的单调性假设。作者在文章中淡化了对识别假设的“脆弱性”的讨论：所有单调性假设都是不可检验的，且在实际应用中，很少能确信哪种假设成立。

明显该被引/该存在、却没出现在intro里的： - 关于高维/复杂数据的MPE方法：例如一些处理多个并行、相互作用生物标志物的半参数或机器学习方法。这可能是为了保持论文重点的清晰而主动省略的。 - 因果推断中关于“非典型因果效应”的文献：例如，有研究提出在存在“因死亡删失”时，关注“自然直接效应”或“总效应”而非SACE。本文可以与这些更广义的非典型因果效应文献连接，但作者没有这么做。

张力¶

未见明显对立引用。Nevo et al. (2021) 对传统方法的批评是清晰的，且得到了引用。不同学派（如主分层 vs. 可分离效应）之间的选择更多是哲学层面和假设层面的差异，而非彼此矛盾。作者通过引用明确了自己的立场。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号： - \(A\)：暴露或处理变量，二值（\(a \in \{0,1\}\)）。在例子中，\(A=1\)表示“曾吸烟者”，\(A=0\)表示“从未吸烟者”。 - \(Y\)：疾病状态指示变量，多类别。\(Y=0\)表示未患病（健康对照），\(Y=1, 2, \ldots, K\)分别表示患了第1种到第K种疾病亚型。在文章中，疾病是完全有序的：假设亚型按“严重程度”或“特异性”顺序排列（如SF-ACE关注的是MSI-高，\(Y=1\)；其他亚型非MSI-高为\(Y=2\)）。 - \(U\)：主分层变量（Principal Stratum），是一个潜在变量，定义了基于\(a\)下所有潜在结果\((Y^a)_a\)的类别。它是每个个体的固定属性，但不被直接观测到。例如，\(U = (Y^1, Y^0)\)，每个分量取值为\(0, 1, \ldots, K\)。 - \(\beta\)：需要估计的参数——子无平均因果效应（SF-ACE）。其定义基于一个特定的子总体。 - \(W\)：一组协变量（混杂因子）。 - \(n\)：样本量。

模型： - 数据生成机制：本文使用潜在结果（Potential Outcomes）框架，没有给出明确的参数模型。它假设一个非参数结构，其中潜在结果\(Y^a\)与暴露\(A\)和协变量\(W\)之间存在某种未知的联合分布。关键建模决策在于对主分层的假设。 - Estimation Model：对于估计，文章引入了倾向性得分模型 \(e(W) = P(A=1|W)\) 和结局回归模型 \(P(Y=k | A=a, W)\)。

可观测数据： - 实际能观测到的：对于每个个体\(i\)，我们能观测到 \((A_i, Y_i)\) 其中 \(Y_i\) 是实际患病的亚型；以及协变量\(W_i\)。 - 潜在/不可观测的：我们无法观测到个体在另一暴露水平下的潜在疾病状态 \(Y_i^{1-A_i}\)（即反事实结果）。这是因果推断的核心困难。在本文的SF-ACE定义中，我们甚至需要知道个体在所有暴露下的潜在状态（\(Y^1, Y^0\)），而永远只能观测到其中一个。

第二步：讲最小内核¶

最小例子：假设有两种疾病亚型（\(K=2\)），用一个符号表示：\(Y \in \{0, \text{MSI-high}, \text{non-MSI-high}\}\)。

SF-ACE到底是什么？ - 标准SACE（在因死亡删失问题中）：定义在“无论在哪种处理下都会存活”（即\(Y^{\text{treated}} \neq \text{death}\) 且 \(Y^{\text{control}} \neq \text{death}\)）的亚群上的因果效应。 - 本文的SF-ACE：定义在“无论在哪种暴露下都不会患其他亚型（即不会患Y=2）”的亚群上。这个亚群叫 "non-MSI-high-free" stratum。即，对于这个亚群中的个体，如果接受抽烟（\(A=1\)）他们要么不患结直肠癌（\(Y=0\)）要么患MSI-高（\(Y=1\)）；如果他们不抽烟（\(A=0\)）他们也只会在这些可能中。

那么，SF-ACE就是在这个特殊亚群上，比较吸烟与否导致的患MSI-高亚型的潜在结果的差异：

\[\text{SF-ACE} = E[Y^1 \mid U \in \text{“non-MSI-high-free”}] - E[Y^0 \mid U \in \text{“non-MSI-high-free”}]\]

其中 \(Y^1\) 和 \(Y^0\) 是二值指示变量，指示是否患MSI-高亚型（即\(Y=1\)）。

现在的问题：如何只用可观测数据估计这个核心参数？

核心思路（用单调性假设把不可观测的无害信息变为可观测）： 1. 定义主分层：我们可将人群划分为几个亚组（基于潜在结果\((Y^1, Y^0)\)）。例如，有一类人是“始终无其他亚型者”（\(U_1\)：不管吸烟与否，他们要么不得病，要么只患MSI高）。他们的潜在结果对是\((0,0)\)、\((0,1)\)、\((1,0)\)或\((1,1)\)。而另一类人是“仅在非吸烟时患非MSI高者”（\(U_2\)：\((Y^1=1, Y^0=2)\)）。 2. 标准化估计：如果我们知道哪些人属于\(U_1\)，我们可以直接用观测数据估计其上的因果效应——因为对于这些个体，我们观测到的\(Y\)和它们的潜在结果直接对应。 3. “信息缺失”与“单调性”：问题是我们不知道谁属于\(U_1\)。这里单调性假设登场了。一个标准的单调性假设是：\(\Pr(Y^a \preceq Y^{a'})\)（即在某一暴露水平下，更“严重”的状态不可能出现）。对于有序亚型（如按严重程度），一个很自然的假设是吸烟不会保护你不得某一特定亚型，但可能把你从一个较轻的类别推到一个更严重的类别。更具体地说，在有序疾病序列中（MSI高的患者中，有些子型是其他子型的前提），一个强的单调性假设是：\(Y^0 \preceq Y^1\) 几乎必然成立。这意味着吸烟者比不吸烟者，要么维持相同疾病状态，要么朝向更严重的疾病状态转移。它等价于不存在一个人在吸烟后得某种病，而在不吸烟时是不患该种病的。 4. 单调性如何解锁识别：在这个有序疾病场景下，假设\(Y^0 \preceq Y^1\)，那么对于那些我们观测到在吸烟状态下只患MSI-高（\((A=1, Y=1)\)）且在非吸烟状态下未患非MSI-高（\((A=0, Y=0 \text{ 或 } 1)\)）的个体，一旦我们接受了单调性，就自动知道他们在所有暴露下都不会患非MSI高。如果观测到吸烟者患了非MSI高，那他们肯定就不属于\(U_1\)（因为这一状态不可能被“保护”掉）。

SF-ACE的最小内核是什么？ 论文提出的最小内核是：在有序疾病亚型结构（“无病 < 目标亚型 < 其他亚型”）的背景下，利用单调性假设（吸烟不会使疾病状态变得更“轻”）来定义一个部分可识别的 estimand——SF-ACE，然后通过逻辑推断，将这个不可观测的主分层\(U_1\)与其可观测的个体表现联系起来。单调性将识别问题从一个纯粹不可观测的潜在分层的难题，部分转化成一个人群中某些子群可观测归属的问题。一旦子群确定，估计就变成了一个子组因果效应的标准问题。如果没有单调性，SF-ACE通常只是部分可识别（一个区间）。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在疾病亚型异质性的背景下，针对传统多分logit方法的选择偏差问题，提出了一个新的因果 estimand——Subtype-Free Average Causal Effect (SF-ACE)，定义为暴露对那些在任意暴露水平下都不会患其他亚型疾病的人群的因果效应。
核心工具/方法：使用主分层（Principal Stratification） 框架定义SF-ACE；通过更精细的统计单调性假设（有序亚型场景下）实现非参数点识别；对于无法满足单调性的情境，开发了敏感性分析方法来松弛识别假设。
主要结论：SF-ACE可以在特定的（可检验的？不，是不可检验的）单调性假设下被部分或完全识别。论文为SF-ACE构建了三种估计器：非参数估计器、基于模型（倾向性得分）的估计器，以及一个双稳健（Doubly Robust） 估计器。在两大队列的结直肠癌数据分析中，该估计揭示了吸烟对“在任何暴露下都只会患或不患MSI-高的人”的强因果效应，这与传统多分logit回归得出的“吸烟对非MSI-高亚型也有小但显著效应”的结论不一致，暗示了后者可能受选择偏差污染。

关键设定与假设¶

标记：在第二节最小记号基础上补全：设定疾病亚型按严重程度是有序的（例如：无病 < MSI-高 < 非MSI-高，或更一般地：\(0, 1, 2, \dots K\)）。SF-ACE关注的是“与目标亚型相比，更严重（或其他）亚型”这个概念。
假设1：SUTVA（标准）。
假设2：无混淆性（\(Y^a \perp A \mid W\)）。这是观察性研究的基础。
假设3：单调性（Monotonicity）。这是核心识别假设，比标准设置（如“是否存活”）更细致。它要求\(P(Y^0 \preceq Y^1) = 1\)。在有序疾病场景下，这意味着个体在\(A=1\)下的疾病状态不会比\(A=0\)下的“更好”（即更轻）。它避免了“吸烟者某亚型，不吸烟者其他亚型”这种交叉（defiers）。相比已有文献：将单调性从是否存活的二元问题推广到多类有序疾病状态，是本方法的关键创新。
假设4：可忽略的缺失亚型（Missing-At-Random for Subtypes）。论文假设缺失的亚型数据（如因无法获取肿瘤组织）是随机缺失的，并且通过对组织可用性进行逆概率加权来处理。相比已有文献：这是标准做法，引用了Liu et al. (2018)。
假设5（与敏感性分析相关）：放松单调性后，作者考虑了两种形式的敏感性参数：\(\delta = P(Y^1 \prec Y^0)\) 即允许违反单调性的个体比例，或 \(\gamma = E[Y^1 | \text{defier}] - E[Y^0 | \text{defier}]\) 即违反单调性者的效应差异。

主要结果¶

识别结果（定理1）：在单调性假设下，SF-ACE在非参数条件下被点识别。这是因为单调性将我们关心的亚群（始终不患其他亚型者）与其在某些暴露下的可观测行为完美对齐。例如，可观测到的“在\(A=1\)时患了非MSI高”或“在\(A=0\)时患了非MSI高”的个体，自动被排除在\(U_1\)之外。
部分识别结果（定理2）：当单调性假设不成立时（允许存在“defier”），SF-AC不再被点识别，但可以在一个紧的区间内被识别。这个区间的宽度取决于允许的defier比例的上界。解决的技术难点：难点在于在非单调场景下，无法确定以前被排除的个体是否真的违反假设。作者使用了一种基于舍弃策略的部分识别方法：假设最多有\(\alpha\)比例的人违反单调性，那么我们可以剔除相应比例的可疑个体（例如，那些观测到在\(A=1\)和\(A=0\)下患不同其他亚型的人），然后在高估和低估的边界进行估计。
敏感度分析（定理3）：提出了一种参数化的敏感度分析。将违反单调性的概率（\(\alpha\)）作为一个敏感性参数，考察\(\alpha\)从0变化到某一值（如0.2或0.4）时，SF-ACE的点估计值如何变化。技术亮点：它提供了一条曲线，而不是一个协变量调整后的点估计，可视化估计对不可验证假设的依赖程度。
估计结果（定理4-6）：
- 定理4：给出了一个非参数估计器（基于核或类密度估计）。
- 定理5：给出了一个基于模型的估计量（通过估计倾向性得分和结局回归）。
- 定理6（最重要的技术结果）：给出了一个双稳健估计量。它由倾向性得分模型（\(e(W)\)）和结局回归模型（\(P(Y=k|A=a,W)\)）构建，即使其中一个模型被错误设定，也能得到一致的估计。这是本文在估计层面的核心贡献，解决了的技术难点——如何在主分层框架下实现稳健估计。双稳健性是通过结合倾向性得分权重和回归预测构建一个估计方程实现的。

证明路线与技术技巧¶

整体路线：证明分为两大块。
1. 识别部分：从潜在结果模型开始，将SF-ACE表达为一个与主分层有关的期望。使用单调性假设将主分层（\(U_1\)）与可观测数据中的特定子集（如\(A=1, Y=1\)且\(A=0, Y=0\)的个体）建立联系。通过概率计算（如\(P(Y=1 | A=1, W)\)）来表达\(E[Y^a | U_1, W]\)，最终得到可识别的表达式。
2. 估计部分：对于双稳健估计器，采用标准的augmented inverse probability weighting (AIPW) 逻辑框架。因为SF-AC类似于一个子总体上的均值，所以可以构造一个“伪结局”（pseudo outcome），然后对这个伪结局进行AIPW估计。证明的关键是在估计这个伪结局时，使其在倾向性得分和结局回归之一正确时仍保持无偏。
关键跳跃点：从识别公式到构建双稳健估计量的跳跃。标准AIPW通常用于估计一个明确的子总体（如处理组）的平均处理效应。这里，子总体（\(U_1\)）本身是未知的。关键跳跃是证明：即使在不知道\(U_1\)成员的情况下，也可以构造一个仅基于可观测数据的AIPW估计量，且它的期望与真实的SF-ACE一致。这个构造涉及巧妙地加权每个个体，使权重之和在目标子总体上的期望等于1。
技术技巧点名：
- Inverse Probability Weighting (IPW) with Missing Subtypes：用于处理难以获得的肿瘤数据（引用 Liu et al. 2018）。
- 主得分（Principal Score）：用于对个体属于\(U_1\)的概率进行建模（延续 Ding & Lu 2016 的思路）。
- 双重稳健性（Doubly Robustness / AIPW）：构建了结合倾向性得分和结局回归模型，具有双重稳健性。这是从Robins等人的标准AIPW理论（AIPW estimator）派生出来的。
- 部分识别（Partial Identification）：通过假设一个未知的\(\alpha\)，并用它来排斥最可疑的个体，从而给出SF-ACE的区间估计。

真实例子与应用¶

数据：护士健康研究（NHS） 和 健康专业人员随访研究（HPFS）。共包含约 3,000 例结直肠癌病例，其中约 90% 有MSI状态信息。
怎么用：论文直接评估了吸烟对“在所有吸烟水平下都只会患或不患MSI-高的人”的因果效应。他们使用了三种估计量（非参数、基于模型、双稳健）来估计SF-ACE，并进行了标准敏感性分析。
结果：
- 传统多分logit回归显示：吸烟增加MSI-高风险（OR~1.6）和，更弱但显著，增加非MSI-高风险（OR~1.2）。
- SF-ACE的估计结果是：在始终不患非MSI-高的亚群中，吸烟对MSI-高的效应更大（RR ~ 1.8-2.0），而对非MSI-高的效应点估计在统计上不显著或接近于零。这表明，传统分析中观察到的吸烟对非MSI-高的效应，可能全部或部分是由选择偏差驱动的——即，那些在“吸烟”暴露下患非MSI-高的人，很可能在某些不吸烟的情况下也会患（或已患）MSI-高，因而被误归类。SF-ACE清晰地展示了效应只集中在一个特定方向上。
- 敏感度分析：当允许少量（10-20%）的单调性违反时，SF-ACE的估计仍然显著且保持方向不变，增强了结果的稳健性。但当违反比例超过30~40%时，区间估计变得十分宽泛不显著。
这个例子想说明什么：这个例子的价值在于它直接挑战了标准方法的结论。它利用一个因果模型清晰地揭示了标准估计的潜在偏差，并同时提出了一个替代解释。这是一个非常强的支持本文核心论证（标准方法存在偏差，SF-ACE是更好的替代）的实证证据。

🔎 结论是否比证明窄¶

是，部分结论比证明窄。 - 证明的SF-ACE识别是在一个非常精细的、有序的疾病序列设定下完成的（无病 < 目标亚型 < 其他亚型）。作者在介绍中提到的“我们讨论多种单调性假设”在证明部分主要只展开了这类“有序”假设。对于非有序、更一般的情况（多类别平行亚型），识别完全退化到了部分识别，且缺乏具体的、有效的构造性方法。因此，文章声称的“可扩展至其他异质性场景”是一项 conjecture，而不仅仅是被严格证明的泛化。 - 双稳健估计器虽然理论上具有双重稳健性，但其实际有限样本表现（特别是在罕见疾病/小亚型上）的模拟，只在特定参数组合下验证过。它可能在更复杂的模型误设下表现出较差的有限样本性质，这需要实证验证，但作者没有深入探讨。 - SF-ACE的效用依赖于假设\(U_1\)的存在且有意义。如果\(U_1\)在人群中非常小（比如，几乎所有吸烟者都会在某个水平患有其他亚型），那么这个estimand将被定义在一个极其稀疏的人群上，估计方差会非常大，其流行病学意义也可能存疑。文章没有证明在所有情况下SF-ACE都是比标准方法“更好”的 estimand，它只是提供了一个不同视角下的、可能更干净的因果效应。它的“优越性”是一个统计学上的偏倚与方差/解释性之间取舍的判断，而论文没有给出一个在所有情境下都能保证SF-ACE更好的理论。

四、开放问题（扎根具体语句）¶

一般亚型结构的可识别性：本文的识别证明主要依赖有序单调性（\(Y^0 \preceq Y^1\)）。对于平行的、非有序的疾病亚型（如某些癌症中的不同基因组分类），如何定义和识别对应的SF-ACE？扎根语句：文章引言提到“我们讨论多种单调性假设”，但对非有序情况只给出了部分识别的定理（定理2）。具体问题：为非有序亚型设计一个具体的、可操作的识别条件或更精细的敏感度分析模式，如假设亚型之间有一定条件独立性。
放松单调性后的高效估计：在允许违反单调性（\(\alpha > 0\)）的场景下，论文给出了部分识别的区间估计。如何为这种部分识别的SF-ACE构建一个高效、半参数的区间估计器？扎根语句：文章在敏感度分析部分“我们还可以将 \(\alpha\) 视为敏感性参数”，但没有给出相应条件下的半参数有效界。具体问题：在约束\(P(\text{defier}) \leq \alpha\)下，推导SF-ACE的半参数效率界，并设计一个达到这个界的自适应估计器。
高维/非线性协变量的处理：本文的估计依赖于标准的前提模型（倾向性得分、结局回归）。当协变量维度很高（如多组学数据）时，如何将本文的框架与现代非参数/机器学习方法（如DML，基于核的方法）结合起来，同时保证双稳健性？扎根语句：文章讨论的是低维\(W\)的标准M估计。他们尚未将双稳健性扩展到高维或无限维的协变量空间，也未引用Double/Debiased Machine Learning (DML) 相关文献。具体问题：在Double/Debiased ML框架下实现SF-ACE的估计，并给出其渐近论。
与“可分离效应”的深入比较：Stensrud et al. (2020) 的可分离效应是另一条竞争路线。在什么科学假设下，一个研究者会选择SF-ACE而非分离效应，反之亦然？能否设计一个模拟或准则，来指导在实际数据中选择哪一个 estimand？扎根语句：文章只在引言中简略对比了二者（“另一条替代路线考虑了可分离效应（Stensrud et al., 2020），其依赖于暴露的概念性分离”），没有深入讨论。具体问题：系统比较SF-ACE和分离效应在识别能力、假设强度、解释性以及实证表现上的差异，并提供一个选择流程图或决策规则。

Maintained by 陈星宇 · Homepage · Source on GitHub