Sensitivity analysis for unmeasured confounding in the estimation of marginal causal effects¶

作者: I Ciocănea-Teodorescu, E E Gabriel, A Sjölander
来源: Biometrika
主题: 因果推断
相关性: 9/10
机构绿灯: Karolinska Institutet（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomet/asac018

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向是因果推断中的敏感性分析（sensitivity analysis for unmeasured confounding）。核心问题是：在观察性研究中，当我们依靠“条件可交换性”（即给定观测协变量后，处理分配与潜在结果无关）作为识别假设来估计因果效应时，如果该假设因存在未测量混杂（unmeasured confounders）而可能不成立，如何量化这个偏差对因果效应估计结果的影响？敏感性分析方法不试图确定地识别因果效应，而是通过引入额外的偏倚参数，考察在不同程度的未测量混杂下，因果效应估计值会如何变化，从而评估结论对未测量混杂假设的“敏感度”。当前，这个子方向的成熟度是中等到高：存在大量方法，但没有一个方法能在所有设定下既处理高维测量混杂，又不依赖对未测量混杂分布的强简化假设。

发展脉络¶

将intro引用的工作串联成一条线，可以识别出几个关键阶段：

奠基工作：偏倚公式与隐变量模型。早期工作如 Cornfield et al. (1959) 提出了用“偏倚因子”或“E-值”的概念，将未测量混杂的强度与其对效应估计的影响联系起来。Rosenbaum (1987) 引入了基于敏感性参数 \(\Gamma\) 的框架，用于匹配设计，考察在不同程度的隐含偏差下，结论是否会被推翻。这些方法开创了敏感性分析的思路，但通常只适用于特定类型的设计或暴露水平，且难以吸收高维测量混杂。
主要进展：基于分布假设的方法。后续工作试图将未测量混杂 \(U\) 纳入一个具体的结构模型。例如，VanderWeele & Arah (2011) 和 VanderWeele & Ding (2017) 提出了基于偏倚公式的方法，该公式对 \(U\) 与处理 \(X\) 和结局 \(Y\) 的关系做出了参数化假设（如线性或对数线性）。这些方法为效应估计提供了闭式的偏差校正，但需要用户为未测量混杂指定一个具体的分布或效应形式，这在应用中是很难验证的强假设。
当前frontier：灵活性与计算可扩展性的权衡。近期方法试图放松对 \(U\) 的具体分布假设，例如通过假设 \(U\) 为隐变量并使用工具变量或其代理（如 proximate causal inference, Tchetgen Tchetgen et al., 2020）来讨论可识别性。然而，这些方法通常需要额外的数据（如代理变量），或者其计算在高维测量混杂下会变得繁琐。另一个前沿方向是“部分识别”（partial identification），在弱假设下将因果效应界定在一个区间内。但许多部分识别方法在二元结局下要么计算成本高，要么得到的区间结论对研究者获取直觉不够直观。
本文的位置：作者认为，现有方法在处理“高维且复杂的测量混杂”和“对未测量混杂做出强分布假设”之间，存在一个难以兼得的空白。本文的目标是填补这个空白：提出一个框架，要求最小假设（不假设 \(U\) 的分布），并且能与任意复杂度的测量混杂（如高维、非参数）一起被计算，同时结论易于应用到实践者（通过一个简单的两参数网格图）。

子线索聚类¶

被引文献大致落在以下几条子线索上：

线索一：基于偏倚因子/偏差公式的方法。如 Cornfield et al. (1959)、VanderWeele & Arah (2011)、VanderWeele & Ding (2017)。这一簇方法依赖于对未测量混杂 \(U\) 与 \(X\) 和 \(Y\) 之间关系进行强参数化建模（如系数）。优点是可直接计算，缺点是结论高度依赖于这些参数假设的正确性，且模型复杂度随测量混杂增加而迅速上升。
线索二：基于隐变量模型或结构方程的方法。如潜在的 Proximal causal inference 方法（如 Tchetgen Tchetgen et al., 2020）。这一簇方法通过引入额外的代理变量来识别未测量混杂的影响，从而放宽了对 \(U\) 分布的直接假设，但需要找到满足特定条件的代理变量，这在实际应用中并非总是可能。这类方法通常也隐含了 \(U\) 与 \(X, Y\) 之间的某种结构（如线性或可加性）。
线索三：基于偏倚网格的通用框架。本文属于这一簇，其核心思想是：不建模 \(U\) 的具体效应，而是直接对“条件可交换性”被破坏的程度（即 \(X\) 不再独立于潜在结果 \(\perp Y(x)\) 的条件）引入一个可量化的偏倚参数。 Robins, Rotnitzky & Scharfstein (2000) 是这一思路的早期重要代表，它使用“选择偏差函数”（selection bias function）来参数化偏差。本文是这一思想的直接延续，但针对 二元结局和二元暴露 做了具体化，并提出了更易用的估计方法。

这个方向在追问的核心问题¶

如何在不对未测量混杂 \(U\) 施加具体分布假设（如 \(U\) 是正态的，与 \(X\) 是线性的）的情况下，仍能进行敏感性分析？
如何使敏感性分析方法在测量混杂集 \(Z\) 很高维时仍是计算可行且结果可解释的？
对于一个给定的因果效应估计量（如ATE, OR），在不同的未测量混杂强度下，这个估计量可能的范围是什么？
如何确定那个“足够严重”以使估计结果不显著的偏倚阈值是多少？

当前主流方法（特别是基于偏倚公式和基于隐变量的）在核心问题1和2上遇到了瓶颈：要么假设太强，要么处理高维测量混杂时计算成本高昂。

⚠️ 作者的framing¶

作者的缺口叙事：作者将缺口定位在“方法的通用性与可操作性之权衡”上。具体来说，他们指出：现有方法要么为了可操作性而做了强分布假设（如对 \(U\) 效应的线性假设），要么为了通用性和弱假设而牺牲了处理高维测量混杂的能力和结果的可解释性。本文把自己定位为两者兼得的方案：“提出一个对未测量混杂类型不敏感、不依赖其分布、计算简便且结果直观的方法”，特别地，它声称“能适应任意复杂度的测量混杂”。
淡化或回避的路线：作者淡化了偏倚因子法（如E-值）的简单性。偏倚因子法也很容易应用，但它只报告一个单一阈值（即“要推翻结论，未测量混杂必须达到多强”），不像本文提供了一个2D网格，显示了整个偏倚范围内的效应变化。作者没有正面比较这种方法。他们也没有深入讨论那些使用工具变量或其他结构假设的部分识别方法，这些方法可以提供比本文网格更严格的界，但需要更复杂的数据结构。作者在introduction中明确说这些方法“不具备可比性”，从而巧妙地回避了直接竞争。
明显该被引/存在但缺席的：这是一个“值得研究者去查的问题”。从作者对“偏差因子”和“选择偏差函数”的引用和批评来看，本文的核心贡献在于将一个通用的选择偏差函数（Robins, Rotnitzky & Scharfstein）框架，在二元暴露-二元结局的设定下，转化成了一个具体的、仅有两个偏倚参数的可操作网格。那么，可能缺席或引用不足的文献包括：
- 该框架在高维设置下的另一种实现（例如，使用机器学习的方法来非参数化地估计偏倚函数）。
- 直接对比“两个参数的网格图”与“通过高斯copula或类似方法对U进行参数建模后做的MC敏感性分析”在计算效率和结果稳健性上的差异。
- 是否存在一个更早的文献，已经在模拟研究中对比过不同参数化偏倚函数的效果？
- 关于暴露为多分类时的敏感性分析工作，本文最后开放问题中也提到了，但introduction中可能没有给足相关工作的篇幅。
- 作者在描述“no matter how complex the measured confounding”时，是否充分考虑了当Z包含多个高相关高维变量时，在估计上可能出现的有限样本问题？这可能是潜在的gap。

张力¶

被引工作间未见明显对立结论，更多是不同假设下的不同工具。主要“张力”存在于对“应用便利性”和“假设强度”的权衡上，这通常由研究者自己根据数据特点来决定，而非由方法间的矛盾产生。作者巧妙地回避了这种争执，为他们的通用方法做了宣传。

二、最核心、最简单的例子 / 数学问题¶

在展开所有技术细节之前，先给出一个“一看就懂”的最小内核。

第一步：符号、模型、可观测数据¶

符号：
- \(X\)：暴露/处理变量，二元，\(X \in \{0, 1\}\)（例如，是否服药）。
- \(Y\)：结局变量，二元，\(Y \in \{0, 1\}\)（例如，是否康复）。
- \(Z\)：观测到的协变量向量，可以是高维的，甚至是非参数的（例如，年龄、性别、原有疾病等）。
- \(U\)：未观测到的混杂变量（例如，患者的健康意识、社会经济地位中的某些维度）。可以是任何类型（连续、离散等）。这是不可观测的。
- \(Y(x)\)：潜在结局（potential outcome），即当 \(X\) 被设置为 \(x\) 时 \(Y\) 会取的值。\(Y(x)\) 对于每个个体是潜在的（不可同时观测到）。
- \(\psi\)：目标因果估计量，这里是平均处理效应（ATE），定义为 \(\psi = \mathbb{E}[Y(1)] - \mathbb{E}[Y(0)]\)。
- \(p_x = \mathbb{E}[Y | X = x]\)：条件期望，是观测到的数据。
- \(p_{x|z} = \mathbb{E}[Y | X = x, Z = z]\)：在给定 \(Z=z\) 的条件下，\(X\) 组内的平均 \(Y\)。
- \(p_z = P(Z = z)\)：协变量 \(Z\) 的概率质量/密度。
- \(\theta_x\)：在给定 \(Z\) 的情况下，暴露水平 \(x\) 组内 \(Y\) 的真实条件均值，即 \(\theta_x(Z) = \mathbb{E}[Y(x) | Z]\)。
模型与可观测数据：
- 数据生成机制：观测数据是 \((X_i, Y_i, Z_i)_{i=1}^n\)，独立同分布采样自一个未知的联合分布 \(P\)。我们想要知道的是因果效应 \(\psi\)，但我们只能观测到 \((X, Y, Z)\)，无法观测到 \(U\) 和潜在结局 \(Y(x)\)。
- 核心识别假设（通常不可直接检验）条件可交换性：\(Y(x) \perp X \mid Z, U\)。即在同时给定观测到的协变量 \(Z\) 和未观测到的混杂 \(U\) 后，处理分配与潜在结果独立。由于 \(U\) 不可观测，我们不能假设这个条件成立。标准方法中，如果完全假设 \(Y(x) \perp X \mid Z\)（即忽略 \(U\)），那么 \(\psi\) 就可以被识别。
- 可观测数据的计算：
  1. 如果忽略 \(U\) 并假设条件可交换性成立，那么我们可以用标准化（G-formula）公式识别ATE： \(\psi^{std} = \sum_{z} p_z \left[ \mathbb{E}[Y|X=1, z] - \mathbb{E}[Y|X=0,z] \right]\)。这个估计量来自 随机化地 比较暴露和未暴露人群，但不分层 \(U\) 会导致偏差。
  2. 更一般地，我们可以用标准化 的条件平凡化（standardization within exposure levels）来表示真实的 \(\mathbb{E}[Y(x)]\)： \(\mathbb{E}[Y(x)] = \sum_{z} \mathbb{E}[Y(x) | Z=z] \cdot p_z = \sum_{z} \theta_x(z) \cdot p_z\)。这里的关键是：真实的 \(\theta_x(z)\) 与可观测的 \(\mathbb{E}[Y|X=x, Z=z]\) 不同，因为后者会受到未测量混杂的影响。

第二步：最小内核（最简特例）¶

本文的核心思想可以这样理解：在不假设任何关于 \(U\) 的具体信息时，我们如何从“观测到的”数据校正到“真实的”因果效应？

最简特例（一个极端例子，帮你理解偏倚参数的本质）：

设想一个极简情况：只有两群个体（\(Z=0\) 和 \(Z=1\)），且每群内部没有人有未测量混杂（即 \(U\) 与 \(X, Y\) 在 \(Z\) 的每层内均独立）。这当然不符合没有测量混杂的情况，但让我们把故事讲通。

如果不存在未测量混杂，我们有 \(\mathbb{E}[Y(x)|Z] = \mathbb{E}[Y|X=x, Z]\)，即给定Z后，暴露组中观察到的Y均值就是真实的潜在结局均值。

现在，让我们引入 一个未测量混杂\(U\) 的 最小影响。假设这个 \(U\) 只在 暴露者（\(X=1\)） 内起作用，使得 \(X=1\) 组的人比 \(X=0\) 组的人更容易（或更不容易）有较高的 \(Y\)。那么这个效应在给定 \(Z\) 的层内，可以简单地用一个 乘法因子 来量化偏差。

如果我们让： - \(p_{1|z, \text{obs}} = \mathbb{E}[Y|X=1, z]\) （观测到的暴露组的平均结局） - \(p_{0|z, \text{obs}} = \mathbb{E}[Y|X=0, z]\) （观测到的对照组平均结局） - 真实的 \(\theta_1(z) = \mathbb{E}[Y(1)|Z=z]\) （真实的在给定\(Z=z\)后，暴露组的潜在结局均值） - 真实的 \(\theta_0(z) = \mathbb{E}[Y(0)|Z=z]\) （真实的在给定\(Z=z\)后，对照组的潜在结局均值）

我们可以证明，在本文设定的二元结局下，有一个很简单的连接： \(p_{1|z, \text{obs}} = \theta_0(z) + \alpha(z) (\theta_1(z) - \theta_0(z)) + \text{偏差}\) 但实际上，作者不直接用这个。他们引入的是 对条件可交换性的偏离 的直接量化。具体来说，他们用了 Robins, Rotnitzky & Scharfstein (2000) 的选择偏差函数的想法，在二元结局下，设定的偏差可以参数化为两个参数的网格： - \(OR_{UX|Z}\)：未测量混杂\(U\)与暴露\(X\)之间在给定\(Z\)条件下的优势比。它量化了\(U\)对\(X\)的影响。 - \(OR_{UY|XZ}\)：未测量混杂\(U\)与结局\(Y\)之间在给定\(X, Z\)条件下的优势比。它量化了\(U\)对\(Y\)的影响。

核心洞察是：在二元结局下，而不管\(U\)的分布有多复杂，只要控制了这两个参数，就可以唯一地确定真实的\(\theta_x(z)\)与观测的\(\mathbb{E}[Y|X=x, Z=z]\)之间的关系。作者通过一个闭式公式（公式(7)在论文中）展示了这个关系。因此，敏感性分析只需遍历这两个偏倚参数构成的网格，计算每种组合下的ATE，看结论是否会发生质变。\(U\)的维度无关紧要，它被完全压缩进了这两个优势比参数的网格中。

这就是最小内核：在二元结局-二元暴露的设定下，由于\(U\)对\(X\)和\(Y\)的影响可以完全由两个条件优势比参数捕获，敏感性分析变得极为简洁，不依赖\(U\)的具体分布。 这个框架能直接扩展到高维\(Z\)，因为对每个 \(z\) 我们都做同样的计算。这个最小例子说明了作者如何用一个“两参数网格”就绕开了对 \(U\) 分布建模的难题。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：针对观察性研究中，由未测量混杂造成的条件可交换性破坏对二元结局、二元暴露的边际因果效应（如ATE）估计的影响，提出了一套通用、易用且假设少的敏感性分析方法。
核心工具/方法：通过将偏离条件可交换性量化为一组仅由两个偏倚参数（\(OR_{UX|Z}\) 和 \(OR_{UY|XZ}\) 的优势比乘积）决定的网格，并利用标准化公式，将偏差的计量从对未测量混杂的具体建模中解脱出来。作者提出了三种估计方法：完全标准化的（model-based）、基于逆概率加权的，和双重稳健的估计量。
主要结论：该方法能直接处理任意复杂度的测量混杂（高维/非参数 \(Z\)），对未测量混杂的具体类型和分布不敏感，并且只要遍历一组合理的偏倚参数网格，就能快速生成直观的敏感性图谱。模拟与实例分析表明，该方法在识别不同偏倚程度下ATE的变异方面是有效的，并且在易用性和结果的可解释性上具有优势。

关键设定与假设¶

基于第二节的符号，补全完整设定：

目标参数：\(ATE = \psi = \mathbb{E}[Y(1)] - \mathbb{E}[Y(0)]\)。
核心假设（不依赖未测量混杂的分布）：
1. 一致性：\(Y = Y(X)\)。这个假设是几乎所有因果推断的标准，即每个个体观察到的Y对应于其接受的处理。
2. 稳定性：没有个体处理状态依赖性或污染。通常也被视为标准。
3. 可压缩性：未测量混杂 \(U\) 不影响可观测数据与潜在结局之间的条件分布关系。这实际是本文方法的核心假设，假设未测量混杂对结局变量的影响（在给定\(X,Z\)后）与对暴露的影响（在给定\(Z\)后）可以被两个优势比的乘积完整描述。这在数学上等价于假设偏差可以被这个乘积参数化。这是一个比线性假设略弱的假设，但仍然是一个结构假设。
相对于已有文献的强化：与VanderWeele & Arah方法相比，本文不需要对\(U\)与\(X,Y\)的具体效应形式（如线性，对数线性）做假设。与需要使用多个代理变量的proximal inference方法相比，本文不需要额外的代理变量数据。与随机化试验后的敏感性分析更一致。
相对于已有文献的放宽：对于二元结局，本文的假设比“完全忽略U”要弱得多，它容许U的存在。它也比一般的选择偏差函数（Robins, Rotnitzky & Scharfstein）的工作更具体，因为它专门适应了二元结局，并给出了一个闭式的、只涉及两个参数的公式。

主要结果¶

结果1：偏倚量化公式（公式(7) 在原文中） ：
- 陈述：在给定 \(Z\) 和偏倚参数 \(a\) (对应 \(OR_{UX|Z} = e^{a}\)), \(b\) (对应 \(OR_{UY|XZ} = e^{b}\)) 后，真实的条件均值 \(\mathbb{E}[Y(x)|Z]\) 是观测数据条件均值的 确定函数。具体公式提供了一个从观测数据 \(p_{x|z}, p_z\) 以及 \(U\) 的边际分布初始值（如 \(P(U=1|Z)\)）出发的闭式解。最关键的是，这个公式表明，在给定二元结局下，虽然 \(U\) 可能很复杂，但只要设定 \(a, b\) 这两个标量，以及节点 \(Z\) 层面上的 \(U\) 的基线概率（\(P(U=1|Z)\)），就可以计算出偏差。
- 直觉：二元结局的信息量已经被充分利用——结局的均值是0和1之间的概率，这个概率在给定\(Z, X, U\)后可以写成一个logistic回归模型，该模型中的交互项只有两个系数（一个是U对X的影响，一个是U对Y的影响），当固定这两个优势比系数后，给定\(Z\)的完全条件分布就被确定了。
- 必要条件：必须指定 \(U\) 的基线概率 \(P(U=1|Z)\) 作为参考。文章通过一个“标准化”技巧绕过这个问题：当固定了 \(a\) 和 \(b\)后，通过求解一个方程，可以唯一确定每个 \(z\) 下的 \(P(U=1|Z=z)\)，从而消除对这个先验分布的需求。这是文章的一个关键技巧。
结果2：三种估计量：
- Model-based (标准化)：直接用观测数据估计出 \(p_{1|z}, p_{0|z}, p_z\)，代入偏倚公式得到每个 \(z\) 下矫正后的 \(\mathbb{E}[Y(x)|Z=z]\)，再对 \(Z\) 加权平均。这个方法对复杂 \(Z\) 的估计很直接，但需要指定 \(p_{x|z}\) 的正确模型。
- Inverse-Probability Weighting (IPW)：利用倾向得分 \(P(X=1|Z)\) 的倒数加权。通常侧重于重新平衡暴露和非暴露人群的 \(Z\) 分布，然后与偏倚参数结合给出ATE的估计。在假设的模型下，它是相合的。
- Doubly Robust (DR)：将模型标准化和IPW结合，获得一个估计量，只要其中一个模型（关于 \(Y\) 的回归或关于 \(X\) 的倾向得分）是正确的，该估计量就是相合的。这增加了方法的稳健性。作者给出了DR估计的闭式表达式。

证明路线与技术技巧¶

整体路线：
1. 步骤1：建立偏差公式。基于Robins et al. (2000)的选择偏差函数框架，作者将未测量混杂导致的偏差参数化为一个乘积。在二元结局的设定下，这个乘积可以简化为两个优势比参数的网格。
2. 步骤2：链接可观测数据与偏倚参数。作者证明了，从可观测数据 \((X, Y, Z)\) 和给定的两个偏倚参数 \((a, b)\) 出发，可以唯一地解出每个 \(Z\) 水平下的未测量混杂分布 \(P(U|Z)\)。这个解是关键的。
3. 步骤3：推导ATE的矫正公式。一旦得到每个 \(z\) 下的 \(P(U|Z=z)\)，代入 \(\mathbb{E}[Y|X=1, Z=z, U=u]\) 和 \(\mathbb{E}[Y|X=0, Z=z, U=u]\)，并结合对 \(Z\) 的标准化，就得到了真实的ATE。
4. 步骤4：提出三种估计量。将步骤3的公式用观测数据估计值代替（利用GLM，IPW，或DR），得到三种估计量。
关键跳跃点：
- 最关键的跳跃在于证明“给定偏倚参数 \((a,b)\) 后，未测量混杂的分布 \(P(U|Z)\) 可以从数据中唯一确定”。如果没有这个证明，每个 \(z\) 下的 \(U\) 分布都是待定的，敏感性分析无法收敛到一个点。作者的解法是：利用二元结局的性质，在给定 \(X\) 和 \(Z\) 下，\(\mathbb{E}[Y|X, Z]\) 是一个概率。将这个概率写成一个logistic回归模型：\(\text{logit}(\mathbb{E}[Y|X, Z, U]) = \beta_0 + \beta_X X + \beta_Z Z + \beta_U U + \beta_{U X} XU\) 。如果固定了交互项系数 \(\beta_{UX}=b\) 和 \(\beta_U U\) 对 \(X\) 的效应（等同于给定 \(a\)），那么方程就唯一可解了。这是“一个方程，一个未知数（每个 \(z\) 下的\(P(U=1|Z=z)\)）”的巧妙构造。
技术技巧点名：
- 选择偏差函数参数化：使用Robins et al. (2000)的选择偏差函数框架，并用点积形式简化到两个参数。
- 具备封闭形式的代数解法：在二元结局的特定有限域内，需要求解的方程（公式(7)）可以简化为关于 \(P(U=1|Z=z)\) 的二次方程，从而得到唯一解。这依赖于二元结局的logistic回归模型的数学结构。
- G-公式 / 标准化：计算ATE时的核心工具，通过利用\(Z\)的分布进行边际化。
- 双重稳健估计 (DR)：结合了基于模型的回归和逆概率加权，获得一个单一方程。这里DR的实现依赖于对模型化参数（如倾向得分、期望）的估计，与标准的DR公式一致。

真实例子与应用¶

模拟：
- 数据：模拟了一个二值暴露 \(X\)、一个二值结局 \(Y\)、一个包含连续、分类和多项的测量混杂集合 \(Z\)（模拟了多种复杂度，从3维到10维），并且引入了多种类型的未测量混杂 \(U\)（离散、连续、与 \(X\) 和 \(Y\) 有不同形式的交互作用）。
- 方法应用：作者对模拟数据应用了所有三种估计量（模型化、IPW、DR），在由 \((a,b)\) 构成的网格上计算矫正后的ATE。
- 结果：该方法在所有模拟设定下都正确地识别出了真实的ATE，表现出对 \(U\) 类型的低敏感性。三种估计量的性能在指定模型正确时一致，DR估计在模型错误时更加稳健。网格图的中心点（\(a=b=0\)）的估计值趋近于未校正的ATE，而当参数偏离0时，估计值趋近于真实ATE。
实例：
- 数据：使用了著名的瑞典的出生体重和心率研究数据集（通常会评估母亲吸烟对婴儿低出生体重风险的影响，存在很强的测量混杂）。
- 方法应用：作者重复了因果分析，假设存在一个未知的未测量混杂。他们遍历一个 \(a\) 和 \(b\) 的网格来考察不同的 \(U\) 的强度。
- 结果：该实证分析产生了一个敏感性图——在网格的不同坐标下，矫正后的ATE的优势比（OR）的值。作者展示，当两个偏倚参数很小时（弱未测量混杂），结论与原始分析一致（吸烟增加风险）。当两个参数超过某个正阈值时（例如，即使控制了所有可测混杂后，一个深刻的隐匿的未观察到的混杂因子仍会使暴露者更容易得病的可能性提高3倍且吸烟者更容易吸烟的可能性提高3倍），结果会变得不显著，甚至发生反转。这个例子清晰地向读者展示了结论对于未测量混杂的“敏感度阈值”。

🔎 结论是否比证明窄¶

是，结论的通用性被缩小了。文章声称“可以对任何类型的未测量混杂均有效”，但证明仅在二元结局下严格成立。虽然后面提到了该扩展的想法，但并未给出完整的推导或证明。在连续结局或多项式结局下，偏倚不再能被两个优势比参数完美捕获，需要依赖更复杂的模型（例如，作者在文末“讨论”部分提到，对于连续结局，需要假设 \(U\) 与 \(Y\) 之间为四参数模型等）。这意味着文章标题中“边际因果效应”的“边际”被很好地处理了，但对于非二元结局的“边际”，方法并不完全通用。
另一个是估计量的有限样本性质。虽然作者提出了DR估计量，并提到当其中一个模型无法正确指定时该估计量是稳健的，但他们并未在理论上刻画该方法在有限样本下（包括高维 \(Z\) 时）的渐近性质。严格来说，证明说的是“如果你的模型是正确的，估计量是相合的”，但对于一个高维 \(Z\) 的线性或逻辑回归模型，它的渐近方差和偏差在有限样本下是很难保证的。这也被作者在文中有所讨论。

四、开放问题¶

扩展到连续结局：正如作者在讨论部分指出的，扩展到连续结局意味着偏倚参数网格的维度会增加（因为二元结局的数学“降维”优势没有了）。要量化未测量混杂对连续结局的影响，需要引入更多的灵敏度参数（例如，U对Y的效应大小，U对X的效应大小以及交互项）。这扎根于原文“Discussion”段落对连续结局的扩展讨论。这是一个明显但重要的gap。
扩展到多值暴露：本文专注于二元暴露。对于有序或无序的多值暴露（例如，三种药物剂量），偏倚参数网格维度也会增长（因为每个暴露水平相对于参考水平都会产生一对可能的偏差参数）。这扎根于原文“Discussion”段落的结尾。这也是一个直接的延伸。
高维Z下的理论性质：本文的方法依赖于在给定 \(Z\) 的每个子集中很好地估计 \(p_{1|z}\) 或倾向得分 \(P(X=1|Z)\)。在高维 \(Z\) 下，这些估计会变得非常困难（维度灾难、多重共线性、模型选择偏差等）。虽然DR估计量在理论上对模型错误是稳健的，但在高维的有限样本中，其方差和偏差如何？是否可以用正则化方法（如LASSO, Ridge）用于处理其中的模型估计，以提升其在高维设定下的有限样本性能？这扎根于原文模拟部分对高维 \(Z\) 的需求和尝试。
与更复杂部分识别方法的比较：本文提供的是一个全范围的网格图。部分识别的方法可以给出一个更严格的界（区间）。那么，当使用本文的网格图时，能否推导出在给定一个特定的偏倚参数网格下的ATE的识别区间？也就是说，如何利用本文的框架进行更精细的部分识别，而不仅仅是提供一个点估计？这扎根于与现有部分识别文献的张力，是作者在Intro中回避的比较。

Maintained by 陈星宇 · Homepage · Source on GitHub