Cost‐Effectiveness Analyses for Sequential Multiple Assignment Randomized Trials¶

作者: Lina M. Montoya, Elvin H. Geng, Harriet F. Adhiambo, Eliud Akama, Starley B. Shade et al.
来源: Statistics in Medicine
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么 这个子方向要解决的根本统计问题是：在纵向、多阶段干预的随机试验（SMART）中，如何对动态治疗策略（DTR）的复合经济-临床参数（如增量成本效益比 ICER）进行非参数估计与有效推断。当前该方向的成熟度处于“方法刚从单阶段 RCT 被移植到多阶段 SMART，且半参数有效推断框架刚刚建立”的阶段——已有大量 SMART 设计与 DTR 估计文献，也有大量单阶段成本效益分析文献，但两者的交叉点（SMART 下的 ICER 估计与推断）刚刚起步。

发展脉络 把 intro 引用的工作串成一条线：

奠基工作（SMART 设计与 DTR 估计）：Lavori & Dawson (2000) 与 Murphy (2005) 建立了 SMART 的设计框架与 DTR 的正式定义；Robins (1986) 的结构嵌套模型与 g-估计为纵向因果参数估计打下基石。这些工作留下了“如何把非参数有效估计推广到多阶段复合参数”的口子。
主要进展（半参数有效估计与 TMLE）：Bang & Robins (2005) 与 Robins et al. (2008) 提出了基于影响函数的 doubly robust 估计；van der Laan & Rubin (2006) 与 van der Laan & Gruber (2012) 建立了 TMLE 框架，为 DTR 估计提供了通用的 targeted learning 路线。这些工作留下了“DTR 的均值差可以有效估计，但成本效益比（比值型参数）的 TMLE 与推断尚未构造”的口子。
当前 frontier（比值型参数的 TMLE）：比值型参数（如风险比 RD、相对风险 RR）的 TMLE 构造是近年热点。作者引用了 Diaz & van der Laan (2011) 与 Lendle et al. (2017)——前者在单阶段下构造了比值参数的 TMLE，后者在纵向下构造了 DTR 风险比的 TMLE。这些工作留下了“成本效益比（ICER = 成本差 / 效益差）作为比值型参数，在 SMART 下如何构造 TMLE 并做基于影响曲线的推断”的口子。
本文的位置：本文填补了上述口子——在 SMART 设计下，把 ICER 视为两个 DTR 均值参数的比值，构造了 TMLE 估计器，并基于影响曲线的渐近正态性做区间估计。

子线索聚类 被引文献大致落在三条子线索上：

SMART 设计与 DTR 定义：Lavori & Dawson (2000), Murphy (2005), Robins (1986)。这一簇在定义纵向多阶段干预的随机化设计与动态策略的因果参数。
半参数有效估计与 TMLE 框架：Bang & Robins (2005), Robins et al. (2008), van der Laan & Gruber (2012)。这一簇在建立 doubly robust 与 TMLE 的通用理论，为 DTR 均值参数提供有效估计路线。
比值型参数的 TMLE 构造：Diaz & van der Laan (2011), Lendle et al. (2017)。这一簇在解决“比值型参数（非线性映射）的 TMLE 如何构造、影响函数如何推导”的技术问题。

这个方向在追问的核心问题 1. SMART 下嵌入的 DTR 的因果参数（均值、比值）如何被非参数识别？ 2. 比值型参数（如 ICER）的半参数有效影响函数是什么？如何据此构造 TMLE？ 3. TMLE 的渐近性质（一致性、双重稳健性、效率）在 SMART 的多阶段干扰下是否成立？ 4. 基于影响曲线的置信区间在有限样本下是否可靠（特别是当分母接近零时）？

当前主流方法与已知瓶颈：主流方法是 TMLE / doubly robust 估计；瓶颈在于比值型参数的分母趋零时渐近正态性破裂、以及多阶段纵向数据下干扰参数维数爆炸导致初始估计不稳定。

⚠️ 作者的 framing - 作者把缺口 frame 成：“SMART 的协议越来越多地提议做成本效益分析，但 ICER 的估计与推断方法尚未在 SMART 下正式建立”——这让本文成为“显然的下一步”。 - 被淡化的竞争路线：作者没有引用基于 M-估计或 g-估计的 ICER 推断路线，也没有讨论 Bayesian 决策分析路线（在卫生经济学中很常见）。此外，作者没有讨论 ICER 的 bootstrapping 推断路线（Fieller 方法等经典比值推断），这些是单阶段下的竞争方法，被回避了。 - 明显该被引却未出现的：Fieller (1954) 的比值参数置信区间经典方法；Heitjan (2000) 等关于成本效益分析统计推断的卫生经济学文献；以及最近在 SMART 下做 Bayesian DTR 估计的工作。这些是研究者值得去查的缺失引用。

张力未见明显对立引用。被引的 TMLE 路线与 doubly robust 路线在同一框架下互补，未出现彼此矛盾的结论。但存在一个隐性张力：Diaz & van der Laan (2011) 的比值 TMLE 在单阶段下成立，而 Lendle et al. (2017) 在纵向下构造了风险比 TMLE——本文把两者结合到 SMART 下的 ICER，但分母（效益差）趋零时的推断问题在纵向下是否比单阶段更严重，文中未正面讨论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(K\)：干预阶段数（SMART 的决策点数），本文核心设定 \(K=2\)。
\(L_k\)：第 \(k\) 阶段的基线 / 中间协变量向量（可观测），\(k=0,1,2\)。\(L_0\) 是初始基线，\(L_1\) 是第一阶段干预后的反应，\(L_2\) 是第二阶段干预后的反应。
\(A_k\)：第 \(k\) 阶段的干预分配（可观测，随机化），\(k=1,2\)。
\(\bar{L}_k = (L_0, L_1, \dots, L_k)\)：截至第 \(k\) 阶段的协变量历史；\(\bar{A}_k = (A_1, \dots, A_k)\) 类似。
\(d = (d_1, d_2)\)：一个动态治疗策略（DTR），其中 \(d_k\) 是从 \(\bar{L}_{k-1}, \bar{A}_{k-1}\) 到 \(A_k\) 的决策规则。
\(Y\)：最终临床结局（可观测，如病毒抑制成功与否，二值或连续）。
\(C\)：总成本（可观测，连续，非负）。
\(O = (L_0, A_1, L_1, A_2, L_2, Y, C)\)：一个个体的完整可观测数据向量。
\(L_{k,d}\)：在策略 \(d\) 下的潜在协变量（不可观测，需靠假设识别）。
\(Y_d, C_d\)：在策略 \(d\) 下的潜在结局与潜在成本（不可观测）。
\(E_d[Y], E_d[C]\)：策略 \(d\) 下的期望潜在结局与期望潜在成本（要估的 estimand）。
\(\Delta_d = E_d[Y] - E_{d'}[Y]\)：两策略 \(d\) 与 \(d'\) 的效益差（要估的 estimand 的分母）。
\(\Gamma_d = E_d[C] - E_{d'}[C]\)：两策略的成本差（要估的 estimand 的分子）。
\(\text{ICER} = \Gamma_d / \Delta_d\)：增量成本效益比（本文的核心 estimand）。

模型：数据生成机制是非参数的——\(O \sim P_0 \in \mathcal{M}\)，其中 \(\mathcal{M}\) 是所有满足 SMART 随机化概率已知（\(g_0(A_k | \bar{L}_{k-1}, \bar{A}_{k-1}) > 0\)）的概率分布的集合。没有对 \(P_0\) 的参数化假设（如线性、logistic 等），这是半参数模型。

可观测数据：研究者实际能观测到的是 \(n\) 个独立同分布的 \(O_i = (L_{0,i}, A_{1,i}, L_{1,i}, A_{2,i}, L_{2,i}, Y_i, C_i)\)。潜在量 \(Y_d, C_d\) 不可观测，只能靠随机化假设与 SUTVA 去识别 \(E_d[Y] = E[I(A_1=d_1) I(A_2=d_2) Y / \prod_{k=1}^2 g_0(A_k | \bar{L}_{k-1}, \bar{A}_{k-1})]\)（IPW 形式）。

第二步：最小内核

整篇论文的证明与方法本质上是比值型参数 TMLE 构造的一个特例——把 Diaz & van der Laan (2011) 的单阶段比值 TMLE 推广到 \(K=2\) 阶段 SMART 下的 ICER。最简特例是 \(K=1\)（单阶段 RCT），且 \(Y\) 为二值结局、\(C\) 为连续成本。

在这个最简特例下： - 可观测数据 \(O = (L_0, A_1, Y, C)\)，\(A_1 \in \{0,1\}\) 是单次随机化。 - 两个策略 \(d=1\) 与 \(d'=0\)（即始终给干预 vs 始终不给干预）。 - \(\Delta = E[Y | A_1=1] - E[Y | A_1=0]\)，\(\Gamma = E[C | A_1=1] - E[C | A_1=0]\)。 - \(\text{ICER} = \Gamma / \Delta\)。

要证的命题退化成：在单阶段下，ICER 的半参数有效影响函数是什么？如何据此构造 TMLE？

影响函数推导：ICER 是 \(\Psi(P) = \Psi_1(P) / \Psi_2(P)\)，其中 \(\Psi_1 = \Gamma\), \(\Psi_2 = \Delta\)。由 Delta 方法，ICER 的影响函数是 \(D(O) = (D_1(O) - \text{ICER} \cdot D_2(O)) / \Delta\)，其中 \(D_1\) 是 \(\Gamma\) 的影响函数，\(D_2\) 是 \(\Delta\) 的影响函数。在单阶段下，\(D_1(O) = I(A_1=1)(C - E[C|A_1=1]) / g_0(1|L_0) + E[C|A_1=1] - \Gamma\)（doubly robust 形式），\(D_2\) 类似。
TMLE 构造：先对 \(E[Y|A_1, L_0]\) 与 \(E[C|A_1, L_0]\) 做初始估计 \(\hat{Q}_Y^0, \hat{Q}_C^0\)；然后构造扰动模型 \(Q_Y(\epsilon_Y) = \hat{Q}_Y^0 + \epsilon_Y \cdot h_Y\) 与 \(Q_C(\epsilon_C) = \hat{Q}_C^0 + \epsilon_C \cdot h_C\)，其中 \(h_Y, h_C\) 是从影响函数中提取的 clever covariate；通过 MLE 更新 \(\epsilon_Y, \epsilon_C\)，使得更新后的估计 \(\hat{Q}_Y^*, \hat{Q}_C^*\) 满足 \(P_n D^*(\hat{Q}^*, \hat{g}) = 0\)（即经验均值残差为零），从而保证 TMLE 的渐近效率。
为什么成立：TMLE 的更新步骤本质上是沿影响函数方向做一步 Newton-Raphson，把初始估计向满足有效影响函数经验均值为零的方向扰动。一旦 \(P_n D^* = 0\) 成立，TMLE 的渐近方差就达到半参数效率界 \(\text{Var}(D^*)\)，置信区间 \(\hat{\Psi} \pm z_{\alpha/2} \sqrt{\text{Var}(D^*) / n}\) 就是有效的。

论文的一般情形（\(K=2\) SMART）只是这个特例的“加壳”——多阶段下 clever covariate \(h_Y, h_C\) 变成多阶段累积的 IPW 权重乘子，扰动模型需要分阶段更新，但核心逻辑（Delta 方法推导影响函数 + clever covariate 提取 + MLE 更新 + 残差为零条件）完全不变。

三、这篇论文做了什么¶

三句话 ①研究了 SMART 设计下嵌入动态治疗策略的增量成本效益比（ICER）的估计与推断问题；②核心工具是基于半参数有效影响函数构造的 TMLE 估计器与基于影响曲线的渐近推断；③主要结论是给出了 SMART 下 ICER 的 TMLE 估计器，证明了其双重稳健性与渐近效率，并提供了基于影响曲线的置信区间构造方法。

关键设定与假设 在第二节最小记号的基础上补全完整设定：

SMART 设计：\(K=2\) 阶段，每阶段有有限干预选项。随机化概率 \(g_0(A_k | \bar{L}_{k-1}, \bar{A}_{k-1})\) 已知且严格大于零（positivity 假设）。
非参数模型 \(\mathcal{M}\)：对 \(P_0\) 除随机化机制外无任何参数化限制。
SUTVA：潜在结局 \(Y_d, C_d\) 只依赖个体自身的策略 \(d\)，无干扰。
Ignorability / Sequential Randomization：\(A_k \perp (Y_d, C_d) | \bar{L}_{k-1}, \bar{A}_{k-1}\)，即随机化条件于历史协变量后独立于潜在结局。这是 SMART 下非参数识别的核心假设。
DTR 的因果参数：\(\Psi_d(P) = E_d[Y]\) 与 \(\Gamma_d(P) = E_d[C]\) 通过 IPW 或 g-formula 识别：\(E_d[Y] = E[I(\bar{A}=d(\bar{L})) Y / \prod_{k=1}^K g_0(A_k | \bar{L}_{k-1}, \bar{A}_{k-1})]\)。
ICER 参数：\(\Psi(P) = \Psi_1(P) / \Psi_2(P)\)，其中 \(\Psi_1 = \Gamma_d - \Gamma_{d'}\)（成本差），\(\Psi_2 = \Delta_d - \Delta_{d'}\)（效益差）。
假设放宽 / 强化：相比已有 DTR 均值 TMLE 文献（如 Lendle et al. 2017），本文把参数从均值差推广到比值型参数，需要额外的 Delta 方法推导与扰动模型构造；相比单阶段比值 TMLE（Diaz & van der Laan 2011），本文把设定推广到多阶段 SMART，clever covariate 的构造更复杂（涉及多阶段累积权重）。

主要结果

定理：ICER 的半参数有效影响函数。作者推导了 ICER 参数 \(\Psi(P) = \Psi_1 / \Psi_2\) 的有效影响函数 \(D^*(O) = (D_1^*(O) - \Psi \cdot D_2^*(O)) / \Psi_2\)，其中 \(D_1^*\) 是成本差 \(\Psi_1\) 的有效影响函数，\(D_2^*\) 是效益差 \(\Psi_2\) 的有效影响函数。直觉：这是比值参数的 Delta 方法标准结果——比值的影响函数 = (分子影响函数 - 比值 × 分母影响函数) / 分母。必要条件：\(\Psi_2 \neq 0\)（效益差不为零，否则 ICER 无定义且渐近正态性破裂）。技术难点：在多阶段 SMART 下，\(D_1^*\) 与 \(D_2^*\) 本身是 DTR 均值差的有效影响函数，需要把多阶段的 doubly robust 结构嵌入到比值的影响函数中。
定理：TMLE 的双重稳健性与渐近效率。作者构造了 ICER 的 TMLE 估计器 \(\hat{\Psi} = \hat{\Psi}_1 / \hat{\Psi}_2\)，其中 \(\hat{\Psi}_1, \hat{\Psi}_2\) 分别是成本差与效益差的 TMLE。证明：若初始结局模型 \(\hat{Q}_Y, \hat{Q}_C\) 正确或干预机制 \(\hat{g}\) 正确（两者之一），则 \(\hat{\Psi}\) 是一致的；若两者都正确，则 \(\hat{\Psi}\) 达到半参数效率界。必要条件：positivity（\(\hat{g} > 0\)）与效益差非零（\(\Psi_2 \neq 0\)）。技术难点：比值型参数的 TMLE 需要同时更新两个结局模型（\(Y\) 与 \(C\)），且更新方向要满足 \(P_n D^* = 0\) 的联合条件——这需要构造两个 clever covariate 并分阶段做 MLE 更新。
定理：基于影响曲线的置信区间。作者给出了置信区间 \(\hat{\Psi} \pm z_{\alpha/2} \sqrt{\hat{\sigma}^2 / n}\)，其中 \(\hat{\sigma}^2 = \text{Var}_n(D^*(\hat{Q}^*, \hat{g}))\) 是影响曲线经验方差。直觉：TMLE 满足 \(P_n D^* = 0\) 后，其渐近分布等于影响曲线的渐近分布，方差达到效率界。必要条件：\(\Psi_2\) 远离零（否则 Delta 方法的线性近似失效，置信区间覆盖率下降）。

证明路线与技术技巧

整体路线（5 步）：
识别：在 SMART 的 sequential randomization 与 positivity 下，把 \(E_d[Y], E_d[C]\) 用 g-formula 或 IPW 识别为可观测数据的函数。
影响函数推导：先推导 DTR 均值差 \(\Psi_1, \Psi_2\) 的有效影响函数 \(D_1^*, D_2^*\)（沿用 Robins 的 doubly robust 影响函数路线）；再用 Delta 方法把比值 \(\Psi = \Psi_1 / \Psi_2\) 的影响函数 \(D^*\) 表达为 \(D_1^*, D_2^*\) 的线性组合。
TMLE 构造：对结局模型 \(Q_Y, Q_C\) 构造扰动模型（logistic / 线性 fluctuation），提取 clever covariate \(h_Y = I(\bar{A}=d) / \prod g_0\) 与 \(h_C\) 类似；分阶段做 MLE 更新，得到 \(\hat{Q}_Y^*, \hat{Q}_C^*\)。
残差校验：证明更新后的 TMLE 满足 \(P_n D^*(\hat{Q}^*, \hat{g}) = 0\)（即影响曲线的经验均值为零），这是 TMLE 渐近效率的关键条件。
渐近展开：把 \(\hat{\Psi} - \Psi\) 展开为 \(P_n D^* + R_n\)，其中 \(R_n\) 是二阶残差；证明在双重稳健条件下 \(R_n = o_P(n^{-1/2})\)，从而 \(\hat{\Psi}\) 达到效率界。
关键跳跃点：
比值型参数的 clever covariate 构造：这是最吃功夫的地方。单参数（均值差）的 TMLE 只需要一个 clever covariate，但 ICER 是比值，需要同时更新 \(Y\) 与 \(C\) 的模型，且更新方向要满足 \(D^*\) 的联合条件。作者的办法是：把 \(D^*\) 分解为 \(Y\)-部分与 \(C\)-部分，分别构造扰动模型，然后分阶段更新——先更新 \(Y\) 模型，再更新 \(C\) 模型，确保两者的残差在联合条件下为零。
多阶段累积权重的稳定性：在 \(K=2\) 阶段下，clever covariate \(h = I(\bar{A}=d) / \prod_{k=1}^2 g_0(A_k | \bar{L}_{k-1}, \bar{A}_{k-1})\) 涉及两阶段 IPW 权重的乘积，若 \(g_0\) 估计不稳定（特别是连续协变量下），权重可能爆炸。作者用 stabilized weights 或截断处理，但未在理论上严格分析截断对效率的影响。
技术技巧点名：
Delta 方法（比值参数的影响函数）：用 Taylor 展开把 \(\Psi_1 / \Psi_2\) 的影响函数表达为 \(D_1^*, D_2^*\) 的线性组合，这是比值型参数 TMLE 的标准起点（Diaz & van der Laan 2011）。
Clever covariate 提取：从影响函数中提取 \(h_Y = (1/\Psi_2) I(\bar{A}=d) / \prod g_0\) 与 \(h_C = (-\Psi / \Psi_2) I(\bar{A}=d) / \prod g_0\)，作为扰动模型的协变量。
Logistic / 线性 fluctuation（扰动模型）：对二值结局 \(Y\) 用 logistic 扰动模型 \(Q_Y(\epsilon) = \expit(\text{logit}(\hat{Q}_Y^0) + \epsilon h_Y)\)；对连续成本 \(C\) 用线性扰动模型 \(Q_C(\epsilon) = \hat{Q}_C^0 + \epsilon h_C\)。这是 TMLE 的标准技巧（van der Laan & Rubin 2006）。
Doubly robust 影响函数：\(D^*\) 的结构保证若 \(Q\) 或 \(g\) 之一正确，估计一致；若两者都正确，达到效率。这是 Robins 的经典路线（Bang & Robins 2005）。
二阶残差控制：证明 \(R_n = (\hat{\Psi}_1 - \Psi_1)(\hat{\Psi}_2 - \Psi_2) / \Psi_2 + \dots\) 是二阶项，在双重稳健条件下为 \(o_P(n^{-1/2})\)。这需要初始估计 \(\hat{Q}, \hat{g}\) 的收敛率满足特定条件（如 \(||\hat{Q} - Q||_2 \cdot ||\hat{g} - g||_2 = o_P(n^{-1/2})\)）。

真实例子与应用

数据 / 场景：ADAPT-R 试验（Adaptive Strategies for Preventing and Treating Lapses of Retention in HIV Care，NCT02338739），一个 \(K=2\) 阶段的 SMART，目标是提高 HIV 护理依从性。第一阶段随机分配干预（短信提醒 vs 无），第二阶段对依从性 lapse 的患者再次随机分配强化干预（导航 vs 无）。
怎么用上去：作者把 ADAPT-R 的 4 个嵌入 DTR（如“始终给短信 + lapse 后给导航” vs “始终不给短信 + lapse 后不给导航”）的 ICER 用 TMLE 估计。结局 \(Y\) 是 12 个月护理依从性（二值），成本 \(C\) 是总干预成本（连续）。
得到什么结果：估计了 4 个 DTR 之间的 ICER（如“短信+导航” vs “无短信+无导航”的 ICER = \(X\) 美元 / 依从性改善比例），并给出了基于影响曲线的 95% 置信区间。具体数值在论文中给出，展示了某些 DTR 的 ICER 置信区间很宽（因为效益差 \(\Delta\) 较小，分母趋零导致方差爆炸）。
想说明什么：验证 TMLE 在真实 SMART 数据上的可行性，展示基于影响曲线的推断在实际中的表现（特别是分母趋零时置信区间的宽度问题），以及为 ADAPT-R 试验提供首个正式的成本效益分析结果。

🔎 结论是否比证明窄 - 作者在理论上严格证明了双重稳健性与渐近效率，但置信区间的覆盖率在分母 \(\Psi_2\) 趋零时没有严格保证——文中只说“当 \(\Psi_2\) 远离零时渐近正态性成立”，但“远离零”的定量条件（如 \(|\Psi_2| > c n^{-1/2}\)）未给出。这是一个泛泛 claim 而非严格证明的地方。 - 作者 claim TMLE 在有限样本下优于 IPW，但模拟只展示了少数场景，未做系统性的有限样本分析（如不同 \(n\)、不同 \(\Psi_2\) 大小下的覆盖率比较）。

四、开放问题（点到为止，扎根具体语句）¶

分母趋零时 ICER 的推断问题：当效益差 \(\Psi_2\) 趋零时，Delta 方法的线性近似失效，基于影响曲线的置信区间覆盖率下降。要证什么：在 \(\Psi_2 = o(1)\) 或 \(\Psi_2 = 0\) 的局部参数空间下，ICER 的推断应该怎么做（如 Fieller 方法、bootstrap、或重新参数化）？扎根在文中“当 \(\Psi_2\) 远离零时渐近正态性成立”这一条件——作者回避了 \(\Psi_2\) 趋零的情况。
多阶段 SMART 下 TMLE 的有限样本稳定性：在 \(K=2\) 或更高阶段下，clever covariate 涉及多阶段 IPW 权重的乘积，权重方差可能爆炸。要估什么：stabilized weights 或截断对 TMLE 效率与双重稳健性的定量影响？扎根在文中使用 stabilized weights 的描述——作者用了但未分析其对效率界的影响。
高维协变量下的 ICER 估计：当 \(L_0, L_1\) 维数很高时，初始估计 \(\hat{Q}, \hat{g}\) 需要用机器学习（如 Super Learner），但二阶残差条件 \(||\hat{Q} - Q||_2 \cdot ||\hat{g} - g||_2 = o_P(n^{-1/2})\) 在高维下可能不满足。要证什么：高维下 ICER 的 debiased / doubly robust 估计如何构造（如 One-step estimator 或 cross-fitted TMLE）？扎根在文中对二阶残差条件的讨论——作者假设初始估计收敛率足够快，但高维下这不一定成立。
缺失引用的竞争路线：文中未引用 Fieller 方法、Bayesian 成本效益分析、或 bootstrapping 推断——这些是单阶段下 ICER 推断的经典路线。要查什么：这些路线在 SMART 下是否可行、与 TMLE 路线的优劣比较？扎根在 intro 中缺失的卫生经济学推断文献——这是一个值得研究者去查的 gap。

Maintained by 陈星宇 · Homepage · Source on GitHub

Cost‐Effectiveness Analyses for Sequential Multiple Assignment Randomized Trials¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论