Instrumental variable approach to estimating individual causal effects in N-of-1 trials: application to ISTOP study¶
作者: Kexin Qu, Christopher H Schmid, Tao Liu
来源: Biostatistics
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: N-of-1 试验(单个体多次交叉随机试验)因果推断要解决的根本统计问题是:如何在单个个体的纵向观测时间序列中,定义并识别个体层面的因果效应,尤其是当存在不完美依从性(实际暴露偏离随机化分配)、二值结局带来的 odds ratio non-collapsibility(非折叠性,即边际 OR 不等于条件 OR 且混杂偏倚无法通过边际化消除),以及序列自相关(时间上的干扰)时。当前该方向的成熟度处于“框架基本成型,但特定设定(如二值结局+不依从+自相关)下的参数化与半参数化识别及估计仍有大量缺口”的阶段。
发展脉络: - 奠基工作:N-of-1 试验的统计学奠基主要在临床设计与贝叶斯自适应分析(Duan et al., 2013; Kravitz et al., 2004),确立了单个体多次交叉的试验范式。因果推断的潜在结果路径框架则由 Robins et al. (1999) 引入纵向设定,Bojinov and Shephard (2019) 将其正式定义为时间序列实验中的因果估计量,并基于完全随机化给出了精确随机化检验。 - 主要进展: 1. 依从性与 IV 引入:Neto et al. (2016) 提出在 mHealth 随机试验中利用随机化分配作为工具变量(IV)进行个性化因果推断,但主要聚焦于随机化检验而非效应估计。 2. 观测性 N-of-1 因果推断:Daza (2018, 2019, 2022) 提出观测性单个体时间序列的 counterfactual 框架,定义了 APTE(Average Period Treatment Effect),并使用 g-formula 与 IPW 进行估计;van der Laan and Malenica (2018, 2021) 发展了单时间序列的 TMLE 与自适应设计。 3. 二值结局 IV 的非折叠性挑战:Vansteelandt et al. (2011) 指出二值结局的 IV 估计面临非折叠性难题,边际因果 OR 与条件因果 OR 不一致,需要额外的参数化假设或结构模型假设;Didelez et al. (2010) 系统梳理了流行病学中 IV 的假设与局限,特别强调了未观测混杂对效应修饰的影响。 - 当前 frontier:如何在 N-of-1 设定下,同时处理不依从(需 IV)、二值结局(需处理 non-collapsibility 与识别问题)以及自相关(需处理时间干扰),且给出可计算的估计量。现有方法多在某一维度上止步:ITT/PP/AT 无法处理不依从与混杂;观测性 g-formula/IPW 无法处理不依从;现有二值 IV 方法(如 SMMs)在单个体小样本下难以稳定估计。 - 本文的位置:本文试图填补“单个体 + 不依从 + 二值结局 + 自相关”的交汇缺口,通过引入潜在处理选择路径与贝叶斯参数化 IV 结构模型,声称绕过了 non-collapsibility 与 non-consistency 问题。
子线索聚类: 1. N-of-1 因果框架与估计量定义:聚焦于如何在时间序列中定义潜在结果与因果估计量。代表工作:Bojinov and Shephard (2019, 潜在结果路径)、Daza (2018, APTE 与 g-formula)、Wang (2021, 时间干扰下的识别)。 2. 二值结局 IV 与非折叠性:聚焦于二值结局下 IV 估计的识别条件与 OR 的非折叠性。代表工作:Vansteelandt et al. (2011, 边际与条件因果 OR)、Didelez et al. (2010, IV 假设审视)、Clarke and Windmeijer (2012)。 3. 贝叶斯 IV 实现:聚焦于用参数化贝叶斯方法解决 IV 估计的计算与分布假设。代表工作:Li and Lu (2015, 双变量正态误差与 censored 结局)、McCulloch et al. (2021, BART + DP 混合的灵活贝叶斯 IV)。
这个方向在追问的核心问题: 1. 个体因果效应的定义:在存在不依从与时间干扰时,单个体的因果效应(如连续暴露效应 vs 观测行为效应)究竟应该锚定在哪个潜在结果路径上? 2. 二值结局的识别与估计:二值结局下,如何在不引入强参数化假设的前提下,识别并估计个体因果 OR,且避免 non-collapsibility 导致的偏倚? 3. 小样本下的推断稳定性:N-of-1 试验的样本量仅为时间点数 \(T\)(通常较小),传统频率学派 IV 方法(如 2SLS/2SRI/GMM)往往失效,何种推断机制(如贝叶斯)能在 \(T\) 较小时提供合理的覆盖率与偏差控制?
⚠️ 作者的 framing: - 作者的说法:作者将缺口 frame 为“现有 N-of-1 分析(ITT/PP/AT)在不完美依从下有偏且向零偏倚;二值结局 IV 估计面临 non-collapsibility 与 non-consistency;纵向观测存在自相关”,从而让自己的贝叶斯潜变量 IV 成为“显然的下一步”,声称通过建模混杂机制(潜变量结构模型)与贝叶斯后验推断功能参数,绕过了 non-collapsibility。 - 被淡化的竞争路线:作者在引言中提及了半参数结构均值模型(SMMs)与主分层方法,但未深入对比。SMMs 可以在较少参数化假设下识别边际因果 OR,但作者选择了完全参数化的贝叶斯 probit 模型,未讨论若分布假设失效时 SMMs 是否有鲁棒优势。van der Laan and Malenica (2018, 2021) 的 TMLE/双稳健路线也被提及,但被定性为“学习最优处理规则”,其估计效率与鲁棒性优势在本文的参数化框架下被回避。 - 明显该被引但缺失的:在讨论“贝叶斯 IV 绕过 non-collapsibility”时,缺乏对半参数效率界(semiparametric efficiency bounds)在 IV 模型下讨论的文献(如 Robins 的 SMMs 效率界);在讨论单个体纵向自相关时,缺乏状态空间模型(State-Space Models)与纵向数据中条件独立图(DAG)识别的一般性理论文献。
张力: - Vansteelandt et al. (2011) vs 本文:Vansteelandt 明确指出,二值结局 IV 估计需要关于数据生成过程或特定建模的额外假设,且边际因果 OR 与条件因果 OR 存在不可调和的非折叠性差异,所有 IV 方法在存在未观测混杂的效应修饰时都会遇到问题。本文声称通过“潜变量结构模型”绕过了 non-collapsibility,但这本质上是将 Vansteelandt 指出的“额外假设”完全具象化为“双变量正态分布与 probit 链接”的强参数化假设。这里的张力在于:本文的“绕过”是否只是把识别难题转移到了分布假设的脆弱性上? 若双变量正态假设不成立,本文的因果 OR 估计是否比 SMMs 的边际 OR 估计偏倚更大?这是一个值得研究者去查证的高价值信号。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚
- 符号:
- \(t = 1, \dots, T\):时间点指标(\(T\) 为总周期数)。
- \(Z_t\):随机化分配(工具变量),二值(0 或 1)。
- \(X_t\):实际暴露/处理,二值(0 或 1)。
- \(Y_t\):结局,二值(0 或 1)。
- \(U_t\):未观测混杂(潜变量),连续。
- \(\bar{Z}_t = (Z_1, \dots, Z_t)\),\(\bar{X}_t = (X_1, \dots, X_t)\):处理与暴露的历史路径。
- \(X_t(\bar{Z}_t)\):潜在处理选择路径(在分配路径 \(\bar{Z}_t\) 下的实际暴露)。
- \(Y_t(\bar{Z}_t, \bar{X}_t)\):潜在结局路径(在分配路径 \(\bar{Z}_t\) 与暴露路径 \(\bar{X}_t\) 下的结局)。
- \(\beta_1\):核心目标 estimand(条件因果 OR 的对数)。
-
\(\rho\):未观测混杂的关联参数(误差项的相关系数)。
-
模型: 数据生成机制由两个带潜变量的结构方程构成:
- 潜在暴露模型:\(X_t^* = \alpha_0 + \alpha_1 Z_t + U_t\),观测 \(X_t = \mathbb{I}(X_t^* > 0)\)。
-
潜在结局模型:\(Y_t^* = \beta_0 + \beta_1 X_t + \beta_2 U_t + \epsilon_t\),观测 \(Y_t = \mathbb{I}(Y_t^* > 0)\)。 其中,\((U_t, \epsilon_t)\) 服从联合正态分布,均值为 0,协方差矩阵由 \(\rho\) 决定(刻画未观测混杂)。\(Z_t\) 由外部随机化生成,独立于 \((U_t, \epsilon_t)\)。
-
可观测数据: 研究者实际能观测到的是单个个体的纵向三元组序列 \(\{(Z_t, X_t, Y_t)\}_{t=1}^T\)。 不可观测、只能靠假设去识别的量:潜变量 \(U_t\)(混杂路径)、潜在结果 \(Y_t(\bar{Z}_t, \bar{X}_t)\) 的反事实值(如 \(Z_t=0\) 但 \(X_t=1\) 时的 \(Y_t(Z_t=1, X_t=1)\))、以及误差项的联合分布参数 \(\rho\)。
第二步:讲最小内核
剥掉所有纵向自相关(设 \(\rho_{t,s} = 0\) for \(t \neq s\))、剥掉时间序列的路径依赖(只看单个时间点 \(t\)),这篇论文支撑整个推断的最小数学内核是:在单时间点、二值 IV、二值处理、二值结局下,如何利用双变量正态 probit 模型识别条件因果 OR。
-
最简特例:设 \(t=1\)(单时间点),模型退化为: \(X^* = \alpha_0 + \alpha_1 Z + U\) \(Y^* = \beta_0 + \beta_1 X + \beta_2 U + \epsilon\) 观测 \(X = \mathbb{I}(X^* > 0)\), \(Y = \mathbb{I}(Y^* > 0)\)。\((U, \epsilon) \sim \mathcal{N}(0, \Sigma)\),\(\text{Corr}(U, \epsilon) = \rho\)。
-
要证的命题退化成什么:目标 estimand 是条件因果 OR \(\exp(\beta_1)\),即在给定未观测混杂 \(U\) 下,\(X=1\) 相比 \(X=0\) 对 \(Y=1\) 的 OR。由于 \(Y\) 是二值,边际 OR(对 \(U\) 积分后)受 non-collapsibility 影响,不等于 \(\exp(\beta_1)\) 且混杂偏倚无法通过边际化消除。
-
证明怎么走、为什么成立:
- 识别困境:如果只观测 \((Z, X, Y)\),由于 \(U\) 不可测,直接回归 \(Y\) on \(X\) 会因 \(U\) 同时影响 \(X\) 与 \(Y\) 而产生混杂偏倚。传统频率学派 IV(如 2SLS)对二值结局无法直接应用,且即使应用 2SRI(两阶段残差插入),在 probit 非线性链接下,若不假设 \(U\) 与 \(\epsilon\) 的联合分布,\(\beta_1\) 与 \(\rho\) 无法分离识别。
- 本文的破局:强假设 \((U, \epsilon)\) 为双变量正态分布。在此假设下,给定 \(Z\),\((X^*, Y^*)\) 的联合分布完全由参数 \((\alpha_0, \alpha_1, \beta_0, \beta_1, \beta_2, \rho)\) 决定。
- 贝叶斯数据增广:引入潜变量 \((X^*, Y^*, U)\) 作为增广参数。在给定 \((X^*, Y^*, U)\) 时,观测 \((X, Y)\) 是确定性的阈值规则;在给定参数与 \((Z, X, Y)\) 时,\((X^*, Y^*, U)\) 的条件后验是截断正态分布,可由 Gibbs 采样高效抽取。
-
绕过 non-collapsibility:因为模型直接在 \(U\) 的条件下定义了 \(Y^*\) 的线性结构,\(\beta_1\) 天然就是条件因果 OR 的对数(控制了 \(U\))。贝叶斯后验直接推断 \(\beta_1\),无需对 \(U\) 进行边际化,从而在数学定义上避开了边际 OR 的非折叠性纠缠。
-
为什么这是“加壳”:论文的完整设定只是将这个单时间点内核扩展到了 \(T\) 个时间点,允许 \((U_t, \epsilon_t)\) 存在 AR(1) 自相关(协方差矩阵非对角线不为 0),并将潜在结果扩展为路径 \(\bar{Z}_t, \bar{X}_t\)。但识别与估计的核心逻辑——依赖双变量正态假设以分离 \(\rho\) 与 \(\beta_1\),依赖数据增广以计算后验,依赖条件 OR 定义以避开边际 non-collapsibility——完全蕴含在这个最简特例中。
三、这篇论文做了什么¶
三句话: ①研究了 N-of-1 试验中存在不完美依从、二值结局与纵向自相关时的个体因果效应估计问题; ②核心方法是构建以随机化分配为 IV 的双变量正态 probit 贝叶斯潜变量结构模型,并采用数据增广 MCMC 进行后验推断; ③主要结论是该方法在模拟中相比 ITT/PP/AT 大幅降低偏差并提升覆盖率,并在 I-STOP-AFib 数据中识别出酒精对房颤的个体异质性因果效应。
关键设定与假设: 在第二节最小记号基础上补全: - 潜在路径框架:定义了潜在处理选择路径 \(X_t(\bar{Z}_t)\) 与潜在结局路径 \(Y_t(\bar{Z}_t, \bar{X}_t)\),将个体因果效应锚定在路径对比上,而非单一时间点的对比。 - 两个估计量: 1. 连续暴露效应:\(E[Y_t(\bar{Z}_t, \bar{X}_t=1) - Y_t(\bar{Z}_t, \bar{X}_t=0) | U_t]\) 对应的 OR(\(\exp(\beta_1)\))。 2. 观测行为效应:基于个体实际依从路径的因果效应(类似 Complier Average Causal Effect 的个体版本,但本文通过参数模型直接推断)。 - IV 核心假设: 1. \(Z_t \rightarrow X_t\)(相关性,\(\alpha_1 \neq 0\))。 2. \(Z_t \perp U_t\)(独立性,随机化保证)。 3. \(Z_t \perp Y_t(\bar{z}_t, \bar{x}_t) | X_t, U_t\)(排除约束,分配只通过实际暴露影响结局)。 - 参数化结构假设(最关键且最强): 1. Probit 链接函数:\(X_t\) 与 \(Y_t\) 由潜变量阈值模型生成。 2. 双变量正态误差:\((U_t, \epsilon_t)\) 服从联合正态,这是识别 \(\rho\)(混杂关联)与 \(\beta_1\)(因果效应)分离的唯一抓手。 3. AR(1) 自相关:误差项在时间上的协方差结构为 AR(1),以处理纵向序列的 serial interference。 - 统计含义与放宽/强化: - 相比 Vansteelandt et al. (2011) 的半参数 SMMs,本文强化了分布假设(双变量正态),换取了条件因果 OR 的点识别与贝叶斯计算便利。 - 相比 Neto et al. (2016) 的随机化检验,本文强化了参数模型,换取了效应大小的估计。 - 相比传统 ITT/PP/AT,本文放宽了对依从性的要求(允许不完美依从),通过 IV 框架处理。
主要结果: - 理论结果(识别):在双变量正态 probit 假设下,条件因果 OR \(\exp(\beta_1)\) 与观测行为效应通过贝叶斯后验可识别。通过建模 \(U_t\),避免了边际 OR 的 non-collapsibility 偏倚;通过路径框架,避免了传统纵向 IV 中因不依从导致的 non-consistency。 - 模拟结果: - 场景:不同依从率(高/低)、不同自相关强度、不同混杂水平。 - 量化结论:在低依从性与强混杂下,ITT 向零偏倚严重,PP/AT 因混杂偏倚严重;本文贝叶斯 IV 方法偏差降至接近 0,覆盖率(Coverage probability)达到名义水平(如 95%)。 - 稳健性:当 \(\rho\) 设为 0(忽略混杂)时,覆盖率大幅下降;当自相关被忽略时,覆盖率亦有折损,但不如忽略混杂严重。
证明路线与技术技巧: - 整体路线: 1. 定义潜在路径估计量 -> 转化为参数化 probit 结构方程 -> 引入潜变量 \((X^*_t, Y^*_t, U_t)\) 构建联合正态模型 -> 设定弱信息先验 -> 构建数据增广 Gibbs 采样器 -> 抽取后验样本 -> 计算功能参数(条件因果 OR)的后验分布。 - 关键跳跃点: - 如何在二值结局下分离混杂关联 \(\rho\) 与因果效应 \(\beta_1\)?跳跃点在于强假设联合正态分布,这使得在给定参数下,潜变量的条件期望与方差有解析解,\(\rho\) 与 \(\beta_1\) 在似然函数中可分离。 - 如何处理 AR(1) 自相关下的截断正态采样?跳跃点在于利用Cholesky 分解将相关潜变量转化为独立正态的线性组合,再在独立空间中进行截断采样,避免了高维相关截断正态的直接采样困难。 - 技术技巧点名: - Data Augmentation (数据增广):源自 Albert & Chib (1993),将离散观测 \((X, Y)\) 增广为连续潜变量 \((X^*, Y^*, U)\),使满条件分布变为截断正态,实现 Gibbs 采样。 - Cholesky Decomposition (Cholesky 分解):用于处理 AR(1) 协方差矩阵 \(\Sigma\),将 \(\Sigma = LL^T\),在采样时先采独立标准正态 \(v\),再通过 \(Lv\) 生成相关潜变量,解决纵向自相关下的 MCMC 采样效率问题。 - Probit Link & Latent Structural Model (Probit 链接与潜变量结构模型):用于绕过 non-collapsibility。Probit 保证了条件 OR 的对数线性性(\(\beta_1\)),潜变量 \(U\) 的引入保证了混杂被条件化控制。
真实例子与应用: - 数据 / 场景:I-STOP-AFib 研究(Marcus et al., 2021),阵发性房颤患者测试自我选择触发物(如酒精)对房颤发生的影响。 - 怎么用上去:\(Z_t\) 为手机 App 的随机化指令(暴露或避免酒精),\(X_t\) 为患者实际是否饮酒,\(Y_t\) 为是否发生房颤。对单个患者,拟合贝叶斯 probit IV 模型,提取 \(\exp(\beta_1)\) 的后验分布。 - 得到什么结果:不同患者的个体因果 OR 存在异质性,部分患者酒精对房颤有显著正向因果效应(后验 95% CI > 1),部分无显著效应。ITT 分析因不依从性向零偏倚,未能检出这些异质性效应。 - 想说明什么:验证贝叶斯 IV 方法在真实 N-of-1 不依从数据下能检出 ITT 无法检出的个体因果效应,展示相对 baseline(ITT/PP)的优势。
🔎 结论是否比证明窄: - 作者在摘要与引言中泛泛 claim “got around the non-collapsibility and non-consistency”,但数学上这一结论严格依赖于双变量正态 probit 模型的正确设定。如果误差分布非正态,或链接函数非 probit,\(\rho\) 与 \(\beta_1\) 的分离识别即告失败,non-collapsibility 问题并未在一般意义上被“绕过”,而是被参数化假设“掩盖”了。这是一个典型的“条件 X 下严格证明,却被泛泛 claim”的案例。
四、开放问题(点到为止,扎根具体语句)¶
- 半参数化 IV 的个体推断:本文完全依赖双变量正态 probit 假设实现识别(见 Section 2.2 潜变量结构模型设定)。若假设失效,\(\beta_1\) 的识别是否崩塌?能否在 N-of-1 设定下,借鉴 Vansteelandt et al. (2011) 的半参数 SMMs 或 Robins 的 g-估计,在较弱分布假设下实现个体因果 OR 的鲁棒估计?(扎根:Vansteelandt et al., 2011 的引用句指出 IV 需额外假设,本文用参数化填补了这一缺口,但未讨论缺口的半参数填补方案)。
- 小样本下先验与似然的权衡:N-of-1 试验 \(T\) 通常极小(如 I-STOP-AFib 中 \(T=6\) 周)。在 \(T\) 极小时,后验推断的驱动力多大程度来自弱信息先验(Lemoine, 2019 引用句提及先验设定),多大程度来自 IV 似然?若先验主导,偏差降低是否仅为先验收缩的假象?(扎根:Section 4.3.3 先验设定与模拟中 \(T\) 的取值)。
- 时间干扰的非参数建模:本文用 AR(1) 参数化自相关处理 serial interference(Wang, 2021 引用句提及时间干扰)。若自相关结构非 AR(1) 或存在高阶滞后干扰,AR(1) 假设是否导致 \(\beta_1\) 估计偏倚?(扎根:Section 2.3 自相关假设与 Wang 2021 对未知干扰结构的讨论)。
提醒:要确认第 1 条是不是真 gap,去读近 5 篇半参数 IV 与 N-of-1 的 intro——若都指向“二值结局 IV 的半参数识别在单个体下不可行”,则是共识(真 gap:如何突破不可行);若已有单个体半参数 IV 工作,则是机会(本文忽略了竞争路线)。
Maintained by 陈星宇 · Homepage · Source on GitHub