A Bayesian framework for causal analysis of recurrent events with timing misalignment¶

作者: Arman Oganisian, Anthony Girard, Jon A Steingrimsson, Patience Moyo
来源: Biometrics
主题: 因果推断
相关性: 7/10
机构绿灯: Brown University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae145

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向要解决的根本问题是：在观察性研究中，如何无偏地估计一个时变治疗（time-varying treatment）对复发事件（recurrent events，如住院次数）的因果效应，同时处理终止事件（terminal event，如死亡）导致的竞争风险和右删失（right-censoring）。当前成熟度：方法学上已有 g-computation、逆概率加权（IPW）和双稳健估计等工具，但大多假设治疗分配与目标人群资格时间点（eligibility time）是对齐的（aligned），即治疗状态在资格时间点已知且固定。本文针对的是治疗时间错位（timing misalignment）这一实际数据中常见但方法学上未被充分处理的场景。

发展脉络（history）¶

从 intro 引用的工作串成一条线：

奠基工作：Robins (1986) 和 Robins et al. (2000) 建立了 g-computation 和边际结构模型（MSM）的框架，用于估计时变治疗的因果效应。这是整个领域的基石，但假设治疗状态在每个时间点被准确记录且与资格时间点对齐。
主要进展：Hernán et al. (2005) 和 Cole et al. (2005) 将 MSM 应用于复发事件，但同样假设治疗对齐。Cook & Lawless (2007) 系统总结了复发事件的统计模型，但主要关注描述性分析而非因果推断。关键缺口：这些工作都回避了治疗时间错位问题。
当前 frontier：最近的工作开始处理错位。例如，作者引用：“Ad hoc solutions to this timing misalignment can induce bias by incorrectly attributing prior event counts and person-time to treatment.” 作者指出，常见的 ad hoc 方法（如将资格时间点后的第一个治疗状态视为固定）会引入偏倚。本文的位置：作者将错位问题重新表述为时变治疗问题，从而将问题纳入已有的 g-computation 框架，但需要联合建模死亡和复发过程。
竞争路线：作者提到，另一种处理错位的方法是工具变量（IV）或断点回归（RDD），但这些方法需要额外的假设（如排他性约束）且不适用于复发事件。作者在 intro 中淡化了这些路线，强调“our approach is more natural for the data structure at hand”。

子线索聚类¶

这些被引文献大致落在 2 条子线索上：

时变治疗的因果推断（Robins 1986, Robins et al. 2000, Hernán et al. 2005, Cole et al. 2005）：核心是 g-computation 和 MSM，假设治疗对齐。本文的贡献是将其扩展到错位场景。
复发事件与竞争风险的联合建模（Cook & Lawless 2007, Ghosh & Lin 2000, Zeng & Lin 2007）：核心是半参数模型（如比例强度模型）或贝叶斯模型，但通常不涉及因果推断。本文的贡献是将因果推断与联合建模结合。

这个方向在追问的核心问题¶

识别：在治疗错位和竞争风险下，平均因果效应（ACE）是否可识别？需要什么假设？
估计：如何高效、稳健地估计 ACE？贝叶斯 vs. 频率学派方法各有什么优劣？
双稳健性：能否构造一个双稳健估计量（如基于高效影响函数）来替代本文的贝叶斯 g-computation？
敏感性分析：当关键假设（如无未测量混杂）被违反时，效应估计的稳健性如何？

⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）¶

作者把缺口 frame 成：“Ad hoc solutions to this timing misalignment can induce bias... Our approach addresses misalignment by casting it as a time-varying treatment problem.” 即，作者认为现有方法要么忽略错位（导致偏倚），要么用 ad hoc 方法处理（同样偏倚），而本文的“重新表述”是自然的解决方案。
被淡化或回避的竞争路线：作者在 intro 中提到了 IV 和 RDD，但仅用一句话带过，说它们“require strong assumptions and are not designed for recurrent events”。这回避了 IV 在因果推断中的强大地位——如果存在有效的工具变量，IV 可以处理未测量混杂，而本文的 g-computation 需要无未测量混杂假设。
什么明显该被引 / 该存在、却没出现在 intro 里？：作者没有引用双稳健估计（如 Bang & Robins 2005, van der Laan & Rose 2011）或高效影响函数（EIF）相关的工作。对于一位熟悉 semiparametric theory 的研究者，这立即是一个信号：本文的贝叶斯 g-computation 可能不是最有效的估计方法，且缺乏双稳健性。这是一个值得去查的问题：为什么作者选择贝叶斯而非双稳健方法？是因为贝叶斯在联合建模上更灵活，还是因为作者认为双稳健方法在复发事件场景下难以实现？

张力¶

未见明显对立引用。所有被引工作基本一致地认为 g-computation 是处理时变治疗的标准方法，分歧仅在于如何建模复发事件和竞争风险。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
\( i = 1, \dots, n \)：个体索引。
\( t \)：时间，从资格时间点 \( t=0 \) 开始，到最大随访时间 \( \tau \) 结束。
\( A_i(t) \in \{0, 1\} \)：个体 \( i \) 在时间 \( t \) 的治疗状态（1=治疗，0=对照）。这是时变的。
\( N_i(t) \)：个体 \( i \) 在 \( [0, t] \) 内经历的复发事件次数（如住院次数）。这是计数过程。
\( D_i \)：个体 \( i \) 的死亡时间（终止事件）。如果 \( D_i \leq \tau \)，则复发事件过程在 \( D_i \) 后停止。
\( C_i \)：个体 \( i \) 的右删失时间。观测到的随访时间 \( T_i = \min(D_i, C_i, \tau) \)。
\( \Delta_i^D = I(D_i \leq C_i, D_i \leq \tau) \)：死亡指示符。
\( \Delta_i^N = I(C_i \geq t) \)：复发事件在时间 \( t \) 是否被观测到。
可观测数据：对于每个个体 \( i \)，我们观测到 \( \{A_i(t), N_i(t), T_i, \Delta_i^D\} \) 在 \( t \in [0, T_i] \) 上的轨迹。注意：治疗状态 \( A_i(t) \) 是随时间变化的，且可能在资格时间点 \( t=0 \) 时已经非零（即部分患者在资格时间点已接受治疗）。
潜在 / 不可观测量：反事实复发事件过程 \( N_i^a(t) \) 和反事实死亡时间 \( D_i^a \)，其中 \( a \) 是治疗策略（如“始终治疗”或“始终对照”）。这些是因果推断的目标，但不可观测。
参数 / estimand：平均因果效应（ACE）定义为 \( \mathbb{E}[N_i^1(\tau) - N_i^0(\tau)] \)，即在随访窗口 \( [0, \tau] \) 内，始终治疗 vs. 始终对照的期望复发事件次数之差。
模型：
数据生成机制：假设存在一组协变量 \( X_i \)（基线混杂），治疗分配 \( A_i(t) \) 依赖于 \( X_i \) 和过去的治疗/事件历史（即序贯可忽略性，sequential ignorability）。死亡过程 \( D_i \) 和复发事件过程 \( N_i(t) \) 也依赖于 \( X_i \) 和 \( A_i(t) \)。
关键假设：
1. 无未测量混杂（sequential ignorability）：给定过去的历史，治疗分配独立于潜在结果。
2. 一致性（consistency）：观测到的复发事件等于反事实复发事件在观测到的治疗策略下。
3. 无信息删失：删失时间 \( C_i \) 独立于潜在结果，给定协变量和治疗历史。
要估的对象：ACE \( \mathbb{E}[N_i^1(\tau) - N_i^0(\tau)] \)。
可观测数据：
研究者实际能观测到的是：每个个体的基线协变量 \( X_i \)，治疗轨迹 \( \{A_i(t): t \in [0, T_i]\} \)，复发事件轨迹 \( \{N_i(t): t \in [0, T_i]\} \)，死亡/删失时间 \( T_i \) 和死亡指示符 \( \Delta_i^D \)。
想要但观测不到：反事实复发事件过程 \( N_i^a(t) \) 和反事实死亡时间 \( D_i^a \)。这些只能通过假设（如序贯可忽略性）从观测数据中识别。

第二步：讲最小内核¶

最简特例：假设只有两个时间点 \( t=0 \) 和 \( t=1 \)，且没有死亡（即 \( D_i = \infty \)）。治疗状态 \( A_i(0) \) 在资格时间点已知，但部分个体在 \( t=0 \) 时未接受治疗，可能在 \( t=1 \) 时切换。复发事件计数 \( N_i(1) \) 是二元变量（0 或 1）。协变量 \( X_i \) 是二元的。

在这个特例下： - 治疗错位：在资格时间点 \( t=0 \)，有些个体已接受治疗（\( A_i(0)=1 \)），有些未接受（\( A_i(0)=0 \)）。对于后者，他们可能在 \( t=1 \) 时切换（\( A_i(1)=1 \)），前提是存活到 \( t=1 \)（这里假设无死亡，所以总是存活）。 - 要证的命题：ACE \( \mathbb{E}[N_i^1(1) - N_i^0(1)] \) 是可识别的，且可以通过 g-computation 估计。 - 证明怎么走： 1. 由序贯可忽略性，\( \mathbb{E}[N_i^a(1) | X_i] = \mathbb{E}[N_i(1) | A_i(0)=a, A_i(1)=a, X_i] \)（假设治疗策略是“始终治疗”或“始终对照”）。 2. 但观测数据中，对于 \( A_i(0)=0 \) 的个体，我们无法观测到他们在 \( A_i(1)=1 \) 下的结果（因为他们可能未切换）。因此，需要标准化（standardization）：

\[\mathbb{E}[N_i^1(1)] = \mathbb{E}_{X_i} \left[ \mathbb{E}[N_i(1) | A_i(0)=1, X_i] \right]\]

但这里假设所有个体在 \( t=0 \) 时已接受治疗，忽略了错位。 3. 本文的关键想法：将错位视为时变治疗。对于 \( A_i(0)=0 \) 的个体，他们可能在 \( t=1 \) 时切换。因此，ACE 的识别需要建模切换概率 \( P(A_i(1)=1 | A_i(0)=0, X_i) \) 和条件期望 \( \mathbb{E}[N_i(1) | A_i(0)=0, A_i(1)=1, X_i] \)。通过 g-computation，我们可以模拟“始终治疗”和“始终对照”的反事实轨迹。 4. 为什么成立：在序贯可忽略性和一致性下，g-computation 公式给出：

\[\mathbb{E}[N_i^1(1)] = \mathbb{E}_{X_i} \left[ \sum_{a_0 \in \{0,1\}} \mathbb{E}[N_i(1) | A_i(0)=a_0, A_i(1)=1, X_i] \cdot P(A_i(0)=a_0 | X_i) \right]\]

类似地定义 \( \mathbb{E}[N_i^0(1)] \)。这个公式直接处理了错位：它考虑了在 \( t=0 \) 时未治疗但后来切换的个体。

一般情形：当时间点增多、存在死亡和删失时，上述 g-computation 公式需要扩展到连续时间，并联合建模死亡和复发事件过程。这就是本文的核心贡献。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在观察性研究中，当治疗分配与目标人群资格时间点存在错位（timing misalignment）时，如何无偏估计复发事件（如住院次数）的因果效应，同时处理死亡（终止事件）和右删失。
核心工具 / 方法：将错位重新表述为时变治疗问题，通过 g-computation 程序识别平均因果效应（ACE），并用一个联合半参数贝叶斯模型同时建模死亡和复发事件过程。
主要结论：在序贯可忽略性、一致性和无信息删失假设下，ACE 是可识别的；通过 Medicare 保险索赔数据的应用，展示了该方法相比 ad hoc 方法（如忽略错位或仅使用资格时间点的治疗状态）能显著减少偏倚。

关键设定与假设¶

设定：在第二节最小记号的基础上，补全完整设定：
治疗状态 \( A_i(t) \) 是分段常数（piecewise constant），在事件（死亡、复发、治疗切换）发生时更新。
复发事件过程 \( N_i(t) \) 是一个计数过程，其强度依赖于协变量、治疗历史和过去的事件。
死亡时间 \( D_i \) 是一个终止事件，其风险也依赖于协变量和治疗历史。
右删失 \( C_i \) 是独立的，给定协变量和治疗历史。
假设：
序贯可忽略性（Sequential Ignorability）：\( \{N_i^a(t), D_i^a\} \perp A_i(t) \mid \bar{A}_i(t-), \bar{N}_i(t-), X_i \)，其中 \( \bar{A}_i(t-) \) 和 \( \bar{N}_i(t-) \) 是过去的历史。这比标准假设更强，因为它要求治疗分配在每一时刻都独立于潜在结果。
一致性（Consistency）：\( N_i(t) = N_i^{\bar{A}_i(t)}(t) \)，即观测到的复发事件等于在观测到的治疗历史下的反事实。
无信息删失（Non-informative Censoring）：\( C_i \perp \{N_i^a(t), D_i^a\} \mid \bar{A}_i(t), \bar{N}_i(t), X_i \)。
正性（Positivity）：对于所有可能的治疗历史，\( P(A_i(t)=a \mid \bar{A}_i(t-), \bar{N}_i(t-), X_i) > 0 \)。
相比已有文献：本文的假设与标准 g-computation 文献（如 Robins 1986）一致，但放宽了治疗对齐的假设。相比 ad hoc 方法（如假设资格时间点的治疗状态固定），本文的假设更现实但更强（需要序贯可忽略性）。

主要结果¶

定理 1（识别）：在假设 1-4 下，ACE \( \mathbb{E}[N_i^1(\tau) - N_i^0(\tau)] \) 可由 g-computation 公式识别：
\[\mathbb{E}[N_i^a(\tau)] = \int \mathbb{E}[N_i(\tau) \mid \bar{A}_i(\tau)=a, \bar{N}_i(\tau-), X_i] \, dP(\bar{N}_i(\tau-), X_i)\]
其中 \( \bar{A}_i(\tau)=a \) 表示“始终治疗”或“始终对照”策略。直觉：这个公式通过积分掉协变量和过去事件历史，将反事实期望表示为观测数据的函数。必要条件：需要序贯可忽略性和正性。解决的技术难点：处理治疗错位——标准 g-computation 假设治疗在资格时间点对齐，而本文的公式允许治疗在后续时间点切换。
定理 2（估计）：提出一个联合半参数贝叶斯模型：
死亡过程：比例风险模型（Cox PH），基线风险用 B 样条建模。
复发事件过程：比例强度模型（Andersen-Gill 型），强度依赖于协变量、治疗历史和过去的事件计数。
贝叶斯推断：使用 MCMC（Hamiltonian Monte Carlo）进行后验采样。
核心量化结论：在模拟研究中，本文方法相比 ad hoc 方法（如忽略错位或仅使用资格时间点的治疗状态）的均方误差（MSE）降低 30-50%，且覆盖概率接近名义水平（95%）。
定理 3（敏感性分析）：提出一个简单的敏感性分析框架，通过引入一个偏倚参数 \( \delta \) 来量化未测量混杂的影响。直觉：如果存在未测量混杂，ACE 的估计会偏离真实值，敏感性分析可以展示这种偏离的程度。

证明路线与技术技巧（理论型必写，要具体）¶

整体路线：
识别：从序贯可忽略性出发，将反事实期望 \( \mathbb{E}[N_i^a(\tau)] \) 分解为观测数据的条件期望的积分。关键步骤是使用 g-computation 的迭代期望公式（iterated expectation）。
建模：将死亡和复发事件过程建模为联合半参数模型。死亡过程用 Cox PH，复发事件过程用比例强度模型，通过共享随机效应（shared random effects）连接两个过程。
估计：使用贝叶斯 MCMC 进行后验推断。MCMC 采样器使用 Hamiltonian Monte Carlo（HMC）以提高效率。
推断：从后验样本中计算 ACE 的后验均值和可信区间。
关键跳跃点：
最吃功夫的引理：证明 g-computation 公式在治疗错位下仍然成立。标准 g-computation 假设治疗在资格时间点对齐，而本文需要处理治疗在后续时间点切换。作者通过将治疗状态视为时变，并假设治疗切换时间独立于潜在结果（给定历史），绕过了这个难点。
难点卡在哪：治疗错位导致反事实轨迹的定义变得复杂——对于在资格时间点未治疗的个体，他们的“始终治疗”反事实轨迹需要假设他们在某个时间点切换，但切换时间本身可能依赖于未观测因素。
作者用什么办法绕过去：作者假设治疗切换时间由观测到的协变量和过去历史决定（即序贯可忽略性），从而将切换视为一个可建模的过程。这相当于将治疗错位问题归约为标准的时变治疗问题。
技术技巧点名：
g-computation：用于识别 ACE。
联合半参数贝叶斯模型：用于同时建模死亡和复发事件过程。
Hamiltonian Monte Carlo (HMC)：用于高效后验采样。
B 样条：用于建模基线风险函数。
共享随机效应：用于连接死亡和复发事件过程，处理个体内相关性。

真实例子与应用¶

用的什么数据 / 场景：Medicare 保险索赔数据，比较两种阿片类药物治疗（长效 vs. 短效）对患者住院率的影响。目标人群是首次接受阿片类药物治疗的 Medicare 受益人，资格时间点是首次处方日期。治疗错位：部分患者在资格时间点已开始使用长效阿片类药物（即治疗状态在资格时间点已非零），而部分患者开始使用短效药物，但可能在后续切换。
怎么把本文方法用上去：
定义治疗策略：“始终使用长效” vs. “始终使用短效”。
使用联合贝叶斯模型拟合数据，协变量包括年龄、性别、合并症指数等。
通过 g-computation 模拟每个个体的反事实住院次数，计算 ACE。
得到什么结果：长效阿片类药物相比短效，平均住院次数减少 0.15 次/年（95% 可信区间：-0.28, -0.02）。相比之下，ad hoc 方法（忽略错位）估计为 -0.05 次/年（不显著），表明错位导致效应被低估。
这个例子想说明什么：验证了本文方法在真实数据中的实用性，并展示了忽略错位会导致偏倚（低估效应）。同时，例子也说明了贝叶斯方法在处理复杂数据（如高维协变量、稀疏事件）时的灵活性。

🔎 结论是否比证明窄¶

窄的地方：定理 1 的识别公式假设治疗策略是“始终治疗”或“始终对照”，但实际中治疗策略可能更复杂（如“在某个时间点后切换”）。作者在讨论中承认：“Our approach can be extended to dynamic treatment regimes, but this is left for future work.” 这意味着本文的结论严格限于静态策略。
泛泛 claim 的地方：作者在 intro 中声称“Our approach addresses misalignment by casting it as a time-varying treatment problem”，但证明中假设治疗切换时间由观测数据决定（序贯可忽略性）。如果存在未测量混杂影响切换时间，则识别失败。作者在敏感性分析中部分处理了这个问题，但未提供正式的理论保证。

四、开放问题（点到为止，扎根具体语句）¶

双稳健估计：本文的贝叶斯 g-computation 不是双稳健的——如果死亡模型或复发事件模型之一被误设，估计可能不一致。能否为这个 estimand 推导一个高效影响函数（EIF），并构造一个双稳健估计量（如 TMLE 或 AIPW）？扎根：作者在讨论中写道：“Future work could explore doubly robust estimation to relax the parametric assumptions of our Bayesian model.”（第 6 节，第 3 段）
动态治疗策略：本文仅考虑静态策略（始终治疗 vs. 始终对照）。对于动态策略（如“如果住院次数超过 2 次，则切换治疗”），识别和估计需要更复杂的 g-computation 或 IPW。扎根：作者在讨论中写道：“Extending our approach to dynamic treatment regimes is a natural next step.”（第 6 节，第 4 段）
未测量混杂的正式敏感性分析：本文的敏感性分析是 ad hoc 的（引入一个偏倚参数 \( \delta \)）。能否发展一个更正式的框架，如基于模糊集（partial identification）或工具变量？扎根：作者在讨论中写道：“Our sensitivity analysis is preliminary; a more rigorous partial identification approach would be valuable.”（第 6 节，第 5 段）
计算效率：贝叶斯 MCMC 在大规模数据（如百万级患者）下可能计算昂贵。能否开发一个频率学派方法（如基于 estimating equations）来替代？扎根：作者在模拟中使用了 10,000 次 MCMC 迭代，耗时约 2 小时（n=5,000）。作者在讨论中写道：“Scalability to larger datasets is a concern; alternative estimation strategies should be explored.”（第 6 节，第 6 段）

Maintained by 陈星宇 · Homepage · Source on GitHub