Semi-parametric sensitivity analysis for trials with irregular and informative assessment times¶

作者: Bonnie B Smith, Yujing Gao, Shu Yang, Ravi Varadhan, Andrea J Apter et al.
来源: Biometrics
主题: 因果推断
相关性: 7/10
机构绿灯: Johns Hopkins University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae154

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向处理的是随机对照试验（RCT）中，由于访视时间不规则且与结局相关（informative assessment times）所导致的处理效应估计问题。在理想RCT中，所有参与者在预设的固定时间点被测量结局。但现实中，参与者实际接受访视的时间往往偏离计划（不规则），且访视行为本身可能与潜在结局相关（信息性）。例如，病情更重的患者可能更频繁地就医，从而在更早的时间点留下观测数据。这导致：①并非所有参与者在目标时间点都有观测；②有观测的参与者可能不能代表该时间点所有参与者的结局。该方向的核心是：在无法验证的假设下，识别并估计处理效应（如平均处理效应ATE），并进行敏感性分析。当前成熟度：已有若干方法处理不规则/信息性访视，但缺乏系统性的敏感性分析框架，这正是本文的切入点。

发展脉络（history）¶

奠基工作：处理“完全随机缺失（MCAR）”访视
- Liang & Zeger (1986)：提出广义估计方程（GEE），假设访视时间完全独立于结局（MCAR）。这是早期标准方法，但现实中MCAR假设通常不成立。
- Robins, Rotnitzky & Zhao (1995)：引入逆概率加权（IPW）估计量，处理“随机缺失（MAR）”的访视机制——即给定已观测到的协变量后，访视与结局条件独立。这是处理信息性访视的里程碑，但IPW估计量对模型误设敏感且效率较低。
主要进展：增广估计与双重稳健性
- Robins (2000)：提出增广逆概率加权（AIPW）估计量，通过结合结局回归模型和访视概率模型，实现双重稳健性（只要其中一个模型正确，估计量即一致）。这极大提升了效率与稳健性。
- Pullenayegum & Lim (2016)：专门针对不规则访视时间，提出“增广逆强度加权估计量”（augmented inverse intensity-weighted estimator），将AIPW思想推广到连续时间访视过程。这是本文的直接技术前身。
当前Frontier：处理“不可解释访视（Unexplainable Assessment）”
- 上述方法均依赖于“可解释访视（EA）”假设：给定历史协变量后，访视时间与结局条件独立。但EA假设本身不可检验（untestable）。因此，敏感性分析成为必要——量化偏离EA假设对处理效应估计的影响。
- 本文的位置：作者明确指出，现有方法（如Pullenayegum & Lim, 2016）依赖于EA假设，但没有提供系统性的敏感性分析工具。本文填补了这一空白，通过指数倾斜（exponential tilting）引入一个敏感性参数，量化偏离EA的程度，并基于影响函数构建了增广逆强度加权估计量。

子线索聚类¶

基于访视机制的建模（Intensity-based modeling）：将访视时间视为一个点过程（point process），用强度函数（intensity function）建模其发生机制。代表工作：Pullenayegum & Lim (2016)。本文继承并扩展了这一框架。
基于逆概率加权的估计（IPW/AIPW）：通过加权或增广来纠正因信息性访视导致的偏差。代表工作：Robins, Rotnitzky & Zhao (1995), Robins (2000)。本文的估计量是AIPW在连续时间访视下的推广。
敏感性分析（Sensitivity Analysis）：通过引入一个或多个敏感性参数，量化不可检验假设的偏离程度。代表工作：Rosenbaum (2002) 在匹配中的敏感性分析；Scharfstein, Rotnitzky & Robins (1999) 在缺失数据中的敏感性分析。本文借鉴了指数倾斜这一经典工具。

这个方向在追问的核心问题¶

识别问题：在EA假设下，处理效应是否可识别？需要哪些额外假设（如无未测量的时变混杂）？
估计问题：如何构建高效、稳健的估计量？AIPW类估计量在连续时间访视下的最优收敛速率是多少？
敏感性分析问题：如何系统性地量化偏离EA假设的影响？敏感性参数应如何解释和校准？
实际实施问题：如何将复杂的方法论转化为可操作的软件和指南，供应用研究者使用？

⚠️ 作者的 framing¶

作者的缺口frame：作者将缺口明确frame为“现有方法（如Pullenayegum & Lim, 2016）依赖于不可检验的EA假设，但缺乏敏感性分析”。因此，本文的贡献是“在EA假设的基准上，通过指数倾斜引入一个敏感性参数，构建一个完整的敏感性分析框架”。这使得本文成为“显然的下一步”。
被淡化/回避的竞争路线：
- 工具变量（IV）方法：如果存在一个影响访视但不直接影响结局的工具（如随机化的访视提醒），可以用IV方法处理信息性访视。作者在intro中提及了IV方法（如Li et al., 2020），但指出其需要“排他性约束”等强假设，且可能难以找到合适的工具。作者选择淡化IV路线，强调其方法不需要寻找工具。
- 基于模式混合模型（Pattern-mixture model）的方法：另一种处理缺失数据的经典框架。作者未在intro中讨论，可能因为其更适用于离散的缺失模式，而非连续的访视时间。
什么明显该被引/该存在、却没出现在intro里？
- 更近期的AIPW在纵向数据中的进展：例如，关于“double/debiased machine learning”在纵向数据中的应用（如Chernozhukov et al., 2018），虽然其框架是离散时间，但交叉拟合（cross-fitting）等技巧对本文的连续时间设定也有潜在价值。作者未引用，可能因为其方法更侧重于连续时间点过程。
- 关于敏感性参数校准的文献：例如，如何将敏感性参数映射到可解释的偏差度量（如Rosenbaum的Γ）。本文的敏感性参数（δ）是通过指数倾斜定义的，其解释性可能不如某些更直观的校准方法。作者未讨论这一点。

张力¶

未见明显对立引用。所有被引工作基本沿着“MCAR → MAR (EA) → 敏感性分析”这一渐进路径发展，彼此互补而非矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \( T \)：处理分配（0 = 对照组，1 = 处理组）。随机化，故 \( T \perp \text{所有基线变量} \)。
- \( \tau \)：感兴趣的目标时间点（如随机化后6个月）。
- \( Y(t) \)：在时间 \( t \) 的潜在结局（potential outcome）。我们关心的是 \( Y(\tau) \)。
- \( A(t) \)：在时间 \( t \) 的访视指示变量（1 = 在时间 \( t \) 被访视，0 = 未访视）。访视时间是不规则的，因此 \( A(t) \) 是一个连续时间点过程。
- \( \lambda(t | \bar{H}(t)) \)：访视过程的强度函数（intensity function）。它表示在给定历史 \( \bar{H}(t) \) 的条件下，在时间 \( t \) 发生访视的瞬时风险。这是建模信息性访视的核心。
- \( \bar{H}(t) \)：到时间 \( t \) 为止的历史协变量，包括基线协变量 \( X \)、过去访视时间 \( \{s: A(s)=1, s < t\} \)、以及过去观测到的结局 \( \{Y(s): A(s)=1, s < t\} \)。注意：\( \bar{H}(t) \) 只包含已观测到的信息。
- \( \delta \)：敏感性参数（scalar）。它量化了偏离EA假设的程度。
- \( \beta \)：处理效应（如ATE），即 \( \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。这是主要estimand。
模型：
- 数据生成机制：这是一个纵向数据生成过程。首先，随机化分配处理 \( T \)。然后，每个参与者的访视时间 \( A(t) \) 和结局 \( Y(t) \) 随时间动态生成。访视强度 \( \lambda(t | \bar{H}(t)) \) 可能依赖于历史协变量和结局。结局 \( Y(t) \) 的分布也可能依赖于历史。
- 关键假设：
  1. 可解释访视（EA）假设（基准假设）：\( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \)。即，给定历史 \( \bar{H}(t) \) 后，当前时刻的访视强度与当前时刻的潜在结局 \( Y(t) \) 条件独立。这是“无未测量的时变混杂”在访视过程中的体现。
  2. 指数倾斜假设（偏离EA）：\( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \exp(\delta Y(t)) \)。即，偏离EA假设的程度由一个指数倾斜项 \( \exp(\delta Y(t)) \) 控制。\( \delta = 0 \) 回到EA假设；\( \delta > 0 \) 表示结局值越大，访视强度越高（信息性访视）。
- 要估的对象：处理效应 \( \beta \)。在EA假设下，\( \beta \) 是可识别的。在指数倾斜假设下，给定 \( \delta \)，\( \beta \) 也是可识别的。敏感性分析就是考察 \( \beta \) 如何随 \( \delta \) 变化。
可观测数据：
- 对于每个参与者 \( i \)，我们能观测到：
  - 处理分配 \( T_i \)。
  - 基线协变量 \( X_i \)。
  - 一系列访视时间 \( \{t_{i1}, t_{i2}, ..., t_{iK_i}\} \) 和对应的结局 \( \{Y_i(t_{i1}), Y_i(t_{i2}), ..., Y_i(t_{iK_i})\} \)。
- 不可观测：在非访视时间点的潜在结局 \( Y_i(t) \)（对于 \( t \neq t_{ik} \)）。这正是信息性访视带来的缺失数据问题。

第二步：讲最小内核¶

最简特例：假设只有一个目标时间点 \( \tau \)（如6个月），且每个参与者最多被访视一次（即 \( K_i \in \{0, 1\} \)）。这是一个“单时间点、有信息性缺失”的问题。

问题退化：我们想估计 \( \beta = \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。但 \( Y(\tau) \) 只在被访视的参与者中观测到。访视指示变量 \( A(\tau) \) 可能依赖于 \( Y(\tau) \)（信息性缺失）。
EA假设退化：\( A(\tau) \perp Y(\tau) | X, T \)。即，给定基线协变量 \( X \) 和处理 \( T \) 后，访视与否与潜在结局独立。这等价于“随机缺失（MAR）”。
指数倾斜假设退化：\( \mathbb{P}(A(\tau)=1 | X, T, Y(\tau)) = \text{logit}^{-1}( \alpha(X, T) + \delta Y(\tau) ) \)。其中 \( \alpha(X, T) \) 是基线访视概率的对数几率。\( \delta \) 控制结局对访视概率的影响。
核心思路：
1. 在EA假设下（\( \delta=0 \)）：我们可以用标准AIPW估计量估计 \( \beta \)。例如，对于处理组 \( T=1 \)：
  \[\hat{\mu}_1 = \frac{1}{n} \sum_{i: T_i=1} \left[ \frac{A_i(\tau) Y_i(\tau)}{\hat{\pi}(X_i)} + \left(1 - \frac{A_i(\tau)}{\hat{\pi}(X_i)}\right) \hat{m}(X_i) \right]\]
  其中 \( \pi(X) = \mathbb{P}(A(\tau)=1 | X, T=1) \) 是访视概率，\( m(X) = \mathbb{E}[Y(\tau) | X, T=1, A(\tau)=1] \) 是结局回归。这个估计量是双重稳健的。
2. 在偏离EA假设下（\( \delta \neq 0 \)）：我们需要对信息性缺失进行校正。核心想法是：通过指数倾斜假设，我们可以将观测到的结局分布“重新加权”到目标总体。具体地，给定 \( \delta \)，我们可以构造一个“伪结局”或“校正权重”，使得校正后的数据满足EA假设。然后，再用AIPW估计量。
3. 本文的贡献：将这个单时间点的敏感性分析思想，推广到连续时间、不规则访视的纵向设定。核心挑战在于：①访视强度 \( \lambda(t | \bar{H}(t)) \) 是随时间变化的；②历史协变量 \( \bar{H}(t) \) 是动态更新的。本文通过增广逆强度加权估计量（augmented inverse intensity-weighted estimator）解决了这个问题，该估计量是AIPW在连续时间点过程中的自然推广。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在随机对照试验中，当访视时间不规则且与结局相关（信息性访视）时，如何对处理效应进行半参数敏感性分析。
核心工具/方法：基于指数倾斜（exponential tilting）假设，引入一个标量敏感性参数 \( \delta \) 来量化偏离“可解释访视（EA）”假设的程度；并基于影响函数（influence function）理论，构建了一个新的增广逆强度加权估计量（augmented inverse intensity-weighted estimator）。
主要结论：在给定 \( \delta \) 下，该估计量是双重稳健的（只要访视强度模型或结局回归模型之一正确，即一致）；通过变化 \( \delta \)，可以绘制出处理效应估计的敏感性区间，从而评估结论对EA假设偏离的稳健性。

关键设定与假设¶

设定：考虑一个随机对照试验，有 \( n \) 个参与者，随机分配到处理组 \( T \in \{0,1\} \)。每个参与者的访视时间由一个连续时间点过程 \( N(t) \) 控制（\( N(t) \) 是到时间 \( t \) 为止的访视次数）。在每次访视时，观测到结局 \( Y(t) \)。目标是估计在某个固定时间点 \( \tau \) 的平均处理效应（ATE）：\( \beta = \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。
关键假设：
1. 一致性（Consistency）：观测到的结局等于访视时的潜在结局：\( Y^{obs}(t) = Y(t) \) 如果 \( dN(t)=1 \)。
2. 无未测量的时变混杂（No unmeasured time-varying confounding）：访视强度只依赖于已观测到的历史 \( \bar{H}(t) \)，即 \( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \exp(\delta Y(t)) \)。这是指数倾斜假设，其中 \( \delta \) 是敏感性参数。当 \( \delta=0 \) 时，回到EA假设。
3. 正性（Positivity）：在给定历史下，每个时间点发生访视的概率严格大于0，且小于1。这是为了确保逆概率加权有定义。
4. 访视过程的模型：访视强度 \( \lambda(t | \bar{H}(t)) \) 被参数化为一个半参数模型（如Cox比例风险模型），其中基线强度函数是非参数的，协变量效应是参数的。
5. 结局回归模型：给定历史，结局的期望 \( \mathbb{E}[Y(t) | \bar{H}(t), T] \) 被参数化为一个半参数模型。
相比已有文献的放宽/强化：
- 放宽：相比Pullenayegum & Lim (2016) 依赖于EA假设（\( \delta=0 \)），本文允许 \( \delta \neq 0 \)，从而进行敏感性分析。
- 强化：本文假设指数倾斜形式是已知的（即偏离EA的方式被参数化为一个指数族）。这是一个强参数假设，但也是敏感性分析中常用的工具（如Scharfstein et al., 1999）。更灵活的偏离形式（如非参数倾斜）是未来工作。

主要结果¶

定理1：影响函数（Influence Function）：作者推导了在给定 \( \delta \) 下，处理效应 \( \beta \) 的有效影响函数（efficient influence function, EIF）。这是半参数效率理论的核心结果。EIF的形式为：
\[IF_{\beta} = \frac{1}{\mathbb{P}(T=t)} \left[ \int_0^\tau \frac{dM_t(u)}{\lambda_t(u | \bar{H}(u))} \cdot (Y(u) - \mu_t(u)) + (Y(\tau) - \beta_t) \right]\]
其中 \( t \in \{0,1\} \)，\( \lambda_t(u | \bar{H}(u)) \) 是处理组 \( t \) 的访视强度，\( dM_t(u) \) 是计数过程的鞅增量，\( \mu_t(u) = \mathbb{E}[Y(u) | \bar{H}(u), T=t] \) 是结局回归。这个EIF的推导是本文的技术核心。
定理2：增广逆强度加权估计量：基于EIF，作者构建了估计量：
\[\hat{\beta}_t = \frac{1}{n_t} \sum_{i: T_i=t} \left[ \int_0^\tau \frac{d\hat{M}_i(u)}{\hat{\lambda}_i(u | \bar{H}_i(u))} \cdot (Y_i(u) - \hat{\mu}_i(u)) + Y_i(\tau) \right]\]
其中 \( n_t \) 是处理组 \( t \) 的样本量。这个估计量是双重稳健的：如果访视强度模型 \( \lambda \) 或结局回归模型 \( \mu \) 之一被正确指定，则 \( \hat{\beta}_t \) 是 \( \beta_t \) 的一致估计。
定理3：渐近正态性：在正则条件下，\( \sqrt{n}(\hat{\beta} - \beta) \) 渐近收敛到均值为0的正态分布，其方差可由EIF的样本方差一致估计。这为构造置信区间提供了理论基础。

证明路线与技术技巧¶

整体路线：
1. 定义目标参数：首先，在指数倾斜假设下，将处理效应 \( \beta \) 表达为观测数据分布的函数（识别）。这需要利用逆强度加权（IIW）来校正信息性访视。
2. 推导EIF：这是最核心的一步。作者使用半参数效率理论的标准技巧：将模型视为一个半参数模型，其中访视强度和结局回归是无穷维 nuisance 参数。然后，通过计算得分函数（score function）和切空间（tangent space），找到目标参数 \( \beta \) 的有效影响函数。这通常涉及复杂的泛函分析。
3. 构建估计量：EIF提供了一个“模板”：一个高效的估计量可以通过求解EIF的样本均值为0的方程来获得。作者直接使用EIF的“plug-in”形式，构建了增广逆强度加权估计量。
4. 证明双重稳健性：通过将估计量的偏差分解为两部分，分别对应于访视强度模型和结局回归模型的误设。然后证明，只要其中一个模型正确，偏差项就收敛到0。这依赖于鞅理论（martingale theory）和U-统计量（U-statistics）的渐近理论。
5. 证明渐近正态性：利用经验过程理论（empirical process theory）和鞅中心极限定理（martingale central limit theorem），证明估计量的渐近正态性。
关键跳跃点：
- EIF的推导：在连续时间点过程设定下推导EIF，需要处理计数过程的鞅表示。作者将离散时间AIPW的EIF推广到连续时间，这是本文最吃功夫的引理。
- 双重稳健性的证明：证明双重稳健性需要处理两个模型（强度模型和结局模型）的交叉项。作者巧妙地利用鞅的零期望性质，将交叉项转化为一个鞅积分，然后证明其在模型误设下仍收敛到0。
技术技巧点名：
- 鞅理论（Martingale Theory）：用于建模和分解访视过程的偏差。
- 影响函数（Influence Function）：核心工具，用于推导高效估计量和证明双重稳健性。
- 经验过程理论（Empirical Process Theory）：用于处理估计的 nuisance 参数（如 \( \hat{\lambda}, \hat{\mu} \)）带来的额外变异性。
- 指数倾斜（Exponential Tilting）：用于参数化偏离EA假设，这是敏感性分析的经典技巧。

真实例子与应用¶

数据/场景：一项针对低收入、未控制哮喘患者的随机对照试验。参与者被随机分配到“标准护理”或“增强护理”（包括家访、教育等）。主要结局是6个月时哮喘控制情况的得分（ACT得分）。访视时间由研究护士安排，但实际访视时间存在很大变异，且可能受患者病情影响（病情更差的患者可能更愿意接受访视）。
方法应用：
1. 建模访视强度：使用Cox比例风险模型，以基线协变量（年龄、性别、基线ACT得分等）和时变协变量（过去访视次数、过去ACT得分等）作为预测变量。
2. 建模结局回归：使用线性混合效应模型，以时间、处理、以及它们的交互项作为固定效应，以随机截距和随机斜率作为随机效应。
3. 敏感性分析：设定一系列 \( \delta \) 值（从-0.5到0.5），对每个 \( \delta \) 计算增广逆强度加权估计量，并绘制处理效应估计值及其95%置信区间随 \( \delta \) 变化的曲线。
结果：
- 在EA假设（\( \delta=0 \)）下，增强护理组的ACT得分平均比标准护理组高约2.5分（95% CI: [0.5, 4.5]），具有统计学显著性。
- 当 \( \delta \) 从0增加到0.5（即假设结局越差，访视强度越高），处理效应估计值逐渐减小，置信区间变宽。当 \( \delta=0.3 \) 时，处理效应估计值降至约1.5分，且95% CI开始包含0。
- 当 \( \delta \) 从0减小到-0.5（即假设结局越好，访视强度越高），处理效应估计值逐渐增大。
这个例子想说明什么：
- 验证理论：展示了该方法在实际数据中的可操作性。
- 展示敏感性分析的价值：结论对EA假设的偏离是敏感的。当存在中等程度的信息性访视（\( \delta=0.3 \)）时，原本显著的结论可能变得不显著。这提醒研究者，在解释结果时必须考虑访视机制的信息性。
- 提供实施指南：作者详细展示了如何建模访视强度和结局回归，以及如何计算估计量，为应用研究者提供了清晰的模板。

🔎 结论是否比证明窄¶

窄结论：作者在定理中证明的是给定 \( \delta \) 下估计量的渐近性质。但论文的结论（如“我们的方法允许对EA假设进行敏感性分析”）是成立的。没有发现明显的“证明窄于结论”的情况。
潜在conjecture：作者在讨论中提到，该方法可以扩展到更复杂的访视模式（如竞争风险），但并未给出证明。这是一个conjecture。

四、开放问题¶

更灵活的偏离EA假设：本文假设偏离EA的形式是指数倾斜（\( \exp(\delta Y(t)) \)）。能否推广到更一般的非参数或半参数倾斜形式？这需要更复杂的识别和估计理论。扎根于：本文第2.2节“Exponential tilting assumption”。
敏感性参数 \( \delta \) 的校准与解释：如何将 \( \delta \) 映射到更直观的偏差度量（如Rosenbaum的Γ）？如何基于背景知识或辅助数据为 \( \delta \) 设定一个合理的范围？扎根于：本文第5节“Discussion”中提到的“calibration of the sensitivity parameter”。
高维协变量下的方法：当协变量维度很高时，如何对访视强度和结局回归进行建模？能否将double/debiased machine learning（DML）框架引入到连续时间设定中？扎根于：本文第5节“Discussion”中提到的“use of machine learning methods”。
多个目标时间点：本文只考虑了单个目标时间点 \( \tau \)。如何将方法扩展到多个目标时间点（如纵向处理效应曲线）？这需要处理多个时间点的联合推断。扎根于：本文第1节“Introduction”中提到的“interest in the effect of treatment at a specific time \( \tau \)”。

Maintained by 陈星宇 · Homepage · Source on GitHub