Instrumental variable approach to estimating individual causal effects in N-of-1 trials: application to ISTOP study¶

作者: Kexin Qu, Christopher H Schmid, Tao Liu
来源: Biostatistics
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么： N-of-1 试验（单个体多次交叉随机试验）因果推断要解决的根本统计问题是：如何在单个个体的纵向观测时间序列中，定义并识别个体层面的因果效应，尤其是当存在不完美依从性（实际暴露偏离随机化分配）、二值结局带来的 odds ratio non-collapsibility（非折叠性，即边际 OR 不等于条件 OR 且混杂偏倚无法通过边际化消除），以及序列自相关（时间上的干扰）时。当前该方向的成熟度处于“框架基本成型，但特定设定（如二值结局+不依从+自相关）下的参数化与半参数化识别及估计仍有大量缺口”的阶段。

发展脉络： - 奠基工作：N-of-1 试验的统计学奠基主要在临床设计与贝叶斯自适应分析（Duan et al., 2013; Kravitz et al., 2004），确立了单个体多次交叉的试验范式。因果推断的潜在结果路径框架则由 Robins et al. (1999) 引入纵向设定，Bojinov and Shephard (2019) 将其正式定义为时间序列实验中的因果估计量，并基于完全随机化给出了精确随机化检验。 - 主要进展： 1. 依从性与 IV 引入：Neto et al. (2016) 提出在 mHealth 随机试验中利用随机化分配作为工具变量（IV）进行个性化因果推断，但主要聚焦于随机化检验而非效应估计。 2. 观测性 N-of-1 因果推断：Daza (2018, 2019, 2022) 提出观测性单个体时间序列的 counterfactual 框架，定义了 APTE（Average Period Treatment Effect），并使用 g-formula 与 IPW 进行估计；van der Laan and Malenica (2018, 2021) 发展了单时间序列的 TMLE 与自适应设计。 3. 二值结局 IV 的非折叠性挑战：Vansteelandt et al. (2011) 指出二值结局的 IV 估计面临非折叠性难题，边际因果 OR 与条件因果 OR 不一致，需要额外的参数化假设或结构模型假设；Didelez et al. (2010) 系统梳理了流行病学中 IV 的假设与局限，特别强调了未观测混杂对效应修饰的影响。 - 当前 frontier：如何在 N-of-1 设定下，同时处理不依从（需 IV）、二值结局（需处理 non-collapsibility 与识别问题）以及自相关（需处理时间干扰），且给出可计算的估计量。现有方法多在某一维度上止步：ITT/PP/AT 无法处理不依从与混杂；观测性 g-formula/IPW 无法处理不依从；现有二值 IV 方法（如 SMMs）在单个体小样本下难以稳定估计。 - 本文的位置：本文试图填补“单个体 + 不依从 + 二值结局 + 自相关”的交汇缺口，通过引入潜在处理选择路径与贝叶斯参数化 IV 结构模型，声称绕过了 non-collapsibility 与 non-consistency 问题。

子线索聚类： 1. N-of-1 因果框架与估计量定义：聚焦于如何在时间序列中定义潜在结果与因果估计量。代表工作：Bojinov and Shephard (2019, 潜在结果路径)、Daza (2018, APTE 与 g-formula)、Wang (2021, 时间干扰下的识别)。 2. 二值结局 IV 与非折叠性：聚焦于二值结局下 IV 估计的识别条件与 OR 的非折叠性。代表工作：Vansteelandt et al. (2011, 边际与条件因果 OR)、Didelez et al. (2010, IV 假设审视)、Clarke and Windmeijer (2012)。 3. 贝叶斯 IV 实现：聚焦于用参数化贝叶斯方法解决 IV 估计的计算与分布假设。代表工作：Li and Lu (2015, 双变量正态误差与 censored 结局)、McCulloch et al. (2021, BART + DP 混合的灵活贝叶斯 IV)。

这个方向在追问的核心问题： 1. 个体因果效应的定义：在存在不依从与时间干扰时，单个体的因果效应（如连续暴露效应 vs 观测行为效应）究竟应该锚定在哪个潜在结果路径上？ 2. 二值结局的识别与估计：二值结局下，如何在不引入强参数化假设的前提下，识别并估计个体因果 OR，且避免 non-collapsibility 导致的偏倚？ 3. 小样本下的推断稳定性：N-of-1 试验的样本量仅为时间点数 \(T\)（通常较小），传统频率学派 IV 方法（如 2SLS/2SRI/GMM）往往失效，何种推断机制（如贝叶斯）能在 \(T\) 较小时提供合理的覆盖率与偏差控制？

⚠️ 作者的 framing： - 作者的说法：作者将缺口 frame 为“现有 N-of-1 分析（ITT/PP/AT）在不完美依从下有偏且向零偏倚；二值结局 IV 估计面临 non-collapsibility 与 non-consistency；纵向观测存在自相关”，从而让自己的贝叶斯潜变量 IV 成为“显然的下一步”，声称通过建模混杂机制（潜变量结构模型）与贝叶斯后验推断功能参数，绕过了 non-collapsibility。 - 被淡化的竞争路线：作者在引言中提及了半参数结构均值模型（SMMs）与主分层方法，但未深入对比。SMMs 可以在较少参数化假设下识别边际因果 OR，但作者选择了完全参数化的贝叶斯 probit 模型，未讨论若分布假设失效时 SMMs 是否有鲁棒优势。van der Laan and Malenica (2018, 2021) 的 TMLE/双稳健路线也被提及，但被定性为“学习最优处理规则”，其估计效率与鲁棒性优势在本文的参数化框架下被回避。 - 明显该被引但缺失的：在讨论“贝叶斯 IV 绕过 non-collapsibility”时，缺乏对半参数效率界（semiparametric efficiency bounds）在 IV 模型下讨论的文献（如 Robins 的 SMMs 效率界）；在讨论单个体纵向自相关时，缺乏状态空间模型（State-Space Models）与纵向数据中条件独立图（DAG）识别的一般性理论文献。

张力： - Vansteelandt et al. (2011) vs 本文：Vansteelandt 明确指出，二值结局 IV 估计需要关于数据生成过程或特定建模的额外假设，且边际因果 OR 与条件因果 OR 存在不可调和的非折叠性差异，所有 IV 方法在存在未观测混杂的效应修饰时都会遇到问题。本文声称通过“潜变量结构模型”绕过了 non-collapsibility，但这本质上是将 Vansteelandt 指出的“额外假设”完全具象化为“双变量正态分布与 probit 链接”的强参数化假设。这里的张力在于：本文的“绕过”是否只是把识别难题转移到了分布假设的脆弱性上？ 若双变量正态假设不成立，本文的因果 OR 估计是否比 SMMs 的边际 OR 估计偏倚更大？这是一个值得研究者去查证的高价值信号。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚

符号：
\(t = 1, \dots, T\)：时间点指标（\(T\) 为总周期数）。
\(Z_t\)：随机化分配（工具变量），二值（0 或 1）。
\(X_t\)：实际暴露/处理，二值（0 或 1）。
\(Y_t\)：结局，二值（0 或 1）。
\(U_t\)：未观测混杂（潜变量），连续。
\(\bar{Z}_t = (Z_1, \dots, Z_t)\)，\(\bar{X}_t = (X_1, \dots, X_t)\)：处理与暴露的历史路径。
\(X_t(\bar{Z}_t)\)：潜在处理选择路径（在分配路径 \(\bar{Z}_t\) 下的实际暴露）。
\(Y_t(\bar{Z}_t, \bar{X}_t)\)：潜在结局路径（在分配路径 \(\bar{Z}_t\) 与暴露路径 \(\bar{X}_t\) 下的结局）。
\(\beta_1\)：核心目标 estimand（条件因果 OR 的对数）。
\(\rho\)：未观测混杂的关联参数（误差项的相关系数）。
模型：数据生成机制由两个带潜变量的结构方程构成：
潜在暴露模型：\(X_t^* = \alpha_0 + \alpha_1 Z_t + U_t\)，观测 \(X_t = \mathbb{I}(X_t^* > 0)\)。
潜在结局模型：\(Y_t^* = \beta_0 + \beta_1 X_t + \beta_2 U_t + \epsilon_t\)，观测 \(Y_t = \mathbb{I}(Y_t^* > 0)\)。其中，\((U_t, \epsilon_t)\) 服从联合正态分布，均值为 0，协方差矩阵由 \(\rho\) 决定（刻画未观测混杂）。\(Z_t\) 由外部随机化生成，独立于 \((U_t, \epsilon_t)\)。
可观测数据：研究者实际能观测到的是单个个体的纵向三元组序列 \(\{(Z_t, X_t, Y_t)\}_{t=1}^T\)。 不可观测、只能靠假设去识别的量：潜变量 \(U_t\)（混杂路径）、潜在结果 \(Y_t(\bar{Z}_t, \bar{X}_t)\) 的反事实值（如 \(Z_t=0\) 但 \(X_t=1\) 时的 \(Y_t(Z_t=1, X_t=1)\)）、以及误差项的联合分布参数 \(\rho\)。

第二步：讲最小内核

剥掉所有纵向自相关（设 \(\rho_{t,s} = 0\) for \(t \neq s\)）、剥掉时间序列的路径依赖（只看单个时间点 \(t\)），这篇论文支撑整个推断的最小数学内核是：在单时间点、二值 IV、二值处理、二值结局下，如何利用双变量正态 probit 模型识别条件因果 OR。

最简特例：设 \(t=1\)（单时间点），模型退化为： \(X^* = \alpha_0 + \alpha_1 Z + U\) \(Y^* = \beta_0 + \beta_1 X + \beta_2 U + \epsilon\) 观测 \(X = \mathbb{I}(X^* > 0)\), \(Y = \mathbb{I}(Y^* > 0)\)。\((U, \epsilon) \sim \mathcal{N}(0, \Sigma)\)，\(\text{Corr}(U, \epsilon) = \rho\)。
要证的命题退化成什么：目标 estimand 是条件因果 OR \(\exp(\beta_1)\)，即在给定未观测混杂 \(U\) 下，\(X=1\) 相比 \(X=0\) 对 \(Y=1\) 的 OR。由于 \(Y\) 是二值，边际 OR（对 \(U\) 积分后）受 non-collapsibility 影响，不等于 \(\exp(\beta_1)\) 且混杂偏倚无法通过边际化消除。
证明怎么走、为什么成立：
识别困境：如果只观测 \((Z, X, Y)\)，由于 \(U\) 不可测，直接回归 \(Y\) on \(X\) 会因 \(U\) 同时影响 \(X\) 与 \(Y\) 而产生混杂偏倚。传统频率学派 IV（如 2SLS）对二值结局无法直接应用，且即使应用 2SRI（两阶段残差插入），在 probit 非线性链接下，若不假设 \(U\) 与 \(\epsilon\) 的联合分布，\(\beta_1\) 与 \(\rho\) 无法分离识别。
本文的破局：强假设 \((U, \epsilon)\) 为双变量正态分布。在此假设下，给定 \(Z\)，\((X^*, Y^*)\) 的联合分布完全由参数 \((\alpha_0, \alpha_1, \beta_0, \beta_1, \beta_2, \rho)\) 决定。
贝叶斯数据增广：引入潜变量 \((X^*, Y^*, U)\) 作为增广参数。在给定 \((X^*, Y^*, U)\) 时，观测 \((X, Y)\) 是确定性的阈值规则；在给定参数与 \((Z, X, Y)\) 时，\((X^*, Y^*, U)\) 的条件后验是截断正态分布，可由 Gibbs 采样高效抽取。
绕过 non-collapsibility：因为模型直接在 \(U\) 的条件下定义了 \(Y^*\) 的线性结构，\(\beta_1\) 天然就是条件因果 OR 的对数（控制了 \(U\)）。贝叶斯后验直接推断 \(\beta_1\)，无需对 \(U\) 进行边际化，从而在数学定义上避开了边际 OR 的非折叠性纠缠。
为什么这是“加壳”：论文的完整设定只是将这个单时间点内核扩展到了 \(T\) 个时间点，允许 \((U_t, \epsilon_t)\) 存在 AR(1) 自相关（协方差矩阵非对角线不为 0），并将潜在结果扩展为路径 \(\bar{Z}_t, \bar{X}_t\)。但识别与估计的核心逻辑——依赖双变量正态假设以分离 \(\rho\) 与 \(\beta_1\)，依赖数据增广以计算后验，依赖条件 OR 定义以避开边际 non-collapsibility——完全蕴含在这个最简特例中。

三、这篇论文做了什么¶

三句话： ①研究了 N-of-1 试验中存在不完美依从、二值结局与纵向自相关时的个体因果效应估计问题； ②核心方法是构建以随机化分配为 IV 的双变量正态 probit 贝叶斯潜变量结构模型，并采用数据增广 MCMC 进行后验推断； ③主要结论是该方法在模拟中相比 ITT/PP/AT 大幅降低偏差并提升覆盖率，并在 I-STOP-AFib 数据中识别出酒精对房颤的个体异质性因果效应。

关键设定与假设：在第二节最小记号基础上补全： - 潜在路径框架：定义了潜在处理选择路径 \(X_t(\bar{Z}_t)\) 与潜在结局路径 \(Y_t(\bar{Z}_t, \bar{X}_t)\)，将个体因果效应锚定在路径对比上，而非单一时间点的对比。 - 两个估计量： 1. 连续暴露效应：\(E[Y_t(\bar{Z}_t, \bar{X}_t=1) - Y_t(\bar{Z}_t, \bar{X}_t=0) | U_t]\) 对应的 OR（\(\exp(\beta_1)\)）。 2. 观测行为效应：基于个体实际依从路径的因果效应（类似 Complier Average Causal Effect 的个体版本，但本文通过参数模型直接推断）。 - IV 核心假设： 1. \(Z_t \rightarrow X_t\)（相关性，\(\alpha_1 \neq 0\)）。 2. \(Z_t \perp U_t\)（独立性，随机化保证）。 3. \(Z_t \perp Y_t(\bar{z}_t, \bar{x}_t) | X_t, U_t\)（排除约束，分配只通过实际暴露影响结局）。 - 参数化结构假设（最关键且最强）： 1. Probit 链接函数：\(X_t\) 与 \(Y_t\) 由潜变量阈值模型生成。 2. 双变量正态误差：\((U_t, \epsilon_t)\) 服从联合正态，这是识别 \(\rho\)（混杂关联）与 \(\beta_1\)（因果效应）分离的唯一抓手。 3. AR(1) 自相关：误差项在时间上的协方差结构为 AR(1)，以处理纵向序列的 serial interference。 - 统计含义与放宽/强化： - 相比 Vansteelandt et al. (2011) 的半参数 SMMs，本文强化了分布假设（双变量正态），换取了条件因果 OR 的点识别与贝叶斯计算便利。 - 相比 Neto et al. (2016) 的随机化检验，本文强化了参数模型，换取了效应大小的估计。 - 相比传统 ITT/PP/AT，本文放宽了对依从性的要求（允许不完美依从），通过 IV 框架处理。

主要结果： - 理论结果（识别）：在双变量正态 probit 假设下，条件因果 OR \(\exp(\beta_1)\) 与观测行为效应通过贝叶斯后验可识别。通过建模 \(U_t\)，避免了边际 OR 的 non-collapsibility 偏倚；通过路径框架，避免了传统纵向 IV 中因不依从导致的 non-consistency。 - 模拟结果： - 场景：不同依从率（高/低）、不同自相关强度、不同混杂水平。 - 量化结论：在低依从性与强混杂下，ITT 向零偏倚严重，PP/AT 因混杂偏倚严重；本文贝叶斯 IV 方法偏差降至接近 0，覆盖率（Coverage probability）达到名义水平（如 95%）。 - 稳健性：当 \(\rho\) 设为 0（忽略混杂）时，覆盖率大幅下降；当自相关被忽略时，覆盖率亦有折损，但不如忽略混杂严重。

证明路线与技术技巧： - 整体路线： 1. 定义潜在路径估计量 -> 转化为参数化 probit 结构方程 -> 引入潜变量 \((X^*_t, Y^*_t, U_t)\) 构建联合正态模型 -> 设定弱信息先验 -> 构建数据增广 Gibbs 采样器 -> 抽取后验样本 -> 计算功能参数（条件因果 OR）的后验分布。 - 关键跳跃点： - 如何在二值结局下分离混杂关联 \(\rho\) 与因果效应 \(\beta_1\)？跳跃点在于强假设联合正态分布，这使得在给定参数下，潜变量的条件期望与方差有解析解，\(\rho\) 与 \(\beta_1\) 在似然函数中可分离。 - 如何处理 AR(1) 自相关下的截断正态采样？跳跃点在于利用Cholesky 分解将相关潜变量转化为独立正态的线性组合，再在独立空间中进行截断采样，避免了高维相关截断正态的直接采样困难。 - 技术技巧点名： - Data Augmentation (数据增广)：源自 Albert & Chib (1993)，将离散观测 \((X, Y)\) 增广为连续潜变量 \((X^*, Y^*, U)\)，使满条件分布变为截断正态，实现 Gibbs 采样。 - Cholesky Decomposition (Cholesky 分解)：用于处理 AR(1) 协方差矩阵 \(\Sigma\)，将 \(\Sigma = LL^T\)，在采样时先采独立标准正态 \(v\)，再通过 \(Lv\) 生成相关潜变量，解决纵向自相关下的 MCMC 采样效率问题。 - Probit Link & Latent Structural Model (Probit 链接与潜变量结构模型)：用于绕过 non-collapsibility。Probit 保证了条件 OR 的对数线性性（\(\beta_1\)），潜变量 \(U\) 的引入保证了混杂被条件化控制。

真实例子与应用： - 数据 / 场景：I-STOP-AFib 研究（Marcus et al., 2021），阵发性房颤患者测试自我选择触发物（如酒精）对房颤发生的影响。 - 怎么用上去：\(Z_t\) 为手机 App 的随机化指令（暴露或避免酒精），\(X_t\) 为患者实际是否饮酒，\(Y_t\) 为是否发生房颤。对单个患者，拟合贝叶斯 probit IV 模型，提取 \(\exp(\beta_1)\) 的后验分布。 - 得到什么结果：不同患者的个体因果 OR 存在异质性，部分患者酒精对房颤有显著正向因果效应（后验 95% CI > 1），部分无显著效应。ITT 分析因不依从性向零偏倚，未能检出这些异质性效应。 - 想说明什么：验证贝叶斯 IV 方法在真实 N-of-1 不依从数据下能检出 ITT 无法检出的个体因果效应，展示相对 baseline（ITT/PP）的优势。

🔎 结论是否比证明窄： - 作者在摘要与引言中泛泛 claim “got around the non-collapsibility and non-consistency”，但数学上这一结论严格依赖于双变量正态 probit 模型的正确设定。如果误差分布非正态，或链接函数非 probit，\(\rho\) 与 \(\beta_1\) 的分离识别即告失败，non-collapsibility 问题并未在一般意义上被“绕过”，而是被参数化假设“掩盖”了。这是一个典型的“条件 X 下严格证明，却被泛泛 claim”的案例。

四、开放问题（点到为止，扎根具体语句）¶

半参数化 IV 的个体推断：本文完全依赖双变量正态 probit 假设实现识别（见 Section 2.2 潜变量结构模型设定）。若假设失效，\(\beta_1\) 的识别是否崩塌？能否在 N-of-1 设定下，借鉴 Vansteelandt et al. (2011) 的半参数 SMMs 或 Robins 的 g-估计，在较弱分布假设下实现个体因果 OR 的鲁棒估计？（扎根：Vansteelandt et al., 2011 的引用句指出 IV 需额外假设，本文用参数化填补了这一缺口，但未讨论缺口的半参数填补方案）。
小样本下先验与似然的权衡：N-of-1 试验 \(T\) 通常极小（如 I-STOP-AFib 中 \(T=6\) 周）。在 \(T\) 极小时，后验推断的驱动力多大程度来自弱信息先验（Lemoine, 2019 引用句提及先验设定），多大程度来自 IV 似然？若先验主导，偏差降低是否仅为先验收缩的假象？（扎根：Section 4.3.3 先验设定与模拟中 \(T\) 的取值）。
时间干扰的非参数建模：本文用 AR(1) 参数化自相关处理 serial interference（Wang, 2021 引用句提及时间干扰）。若自相关结构非 AR(1) 或存在高阶滞后干扰，AR(1) 假设是否导致 \(\beta_1\) 估计偏倚？（扎根：Section 2.3 自相关假设与 Wang 2021 对未知干扰结构的讨论）。

提醒：要确认第 1 条是不是真 gap，去读近 5 篇半参数 IV 与 N-of-1 的 intro——若都指向“二值结局 IV 的半参数识别在单个体下不可行”，则是共识（真 gap：如何突破不可行）；若已有单个体半参数 IV 工作，则是机会（本文忽略了竞争路线）。

Maintained by 陈星宇 · Homepage · Source on GitHub

Instrumental variable approach to estimating individual causal effects in N-of-1 trials: application to ISTOP study¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论