Semi-parametric sensitivity analysis for trials with irregular and informative assessment times¶
作者: Bonnie B Smith, Yujing Gao, Shu Yang, Ravi Varadhan, Andrea J Apter et al.
来源: Biometrics
主题: 因果推断
相关性: 7/10
机构绿灯: Johns Hopkins University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujae154
一、领域脉络与小综述¶
这个方向是什么¶
这个子方向处理的是随机对照试验(RCT)中,由于访视时间不规则且与结局相关(informative assessment times)所导致的处理效应估计问题。在理想RCT中,所有参与者在预设的固定时间点被测量结局。但现实中,参与者实际接受访视的时间往往偏离计划(不规则),且访视行为本身可能与潜在结局相关(信息性)。例如,病情更重的患者可能更频繁地就医,从而在更早的时间点留下观测数据。这导致:①并非所有参与者在目标时间点都有观测;②有观测的参与者可能不能代表该时间点所有参与者的结局。该方向的核心是:在无法验证的假设下,识别并估计处理效应(如平均处理效应ATE),并进行敏感性分析。当前成熟度:已有若干方法处理不规则/信息性访视,但缺乏系统性的敏感性分析框架,这正是本文的切入点。
发展脉络(history)¶
-
奠基工作:处理“完全随机缺失(MCAR)”访视
- Liang & Zeger (1986):提出广义估计方程(GEE),假设访视时间完全独立于结局(MCAR)。这是早期标准方法,但现实中MCAR假设通常不成立。
- Robins, Rotnitzky & Zhao (1995):引入逆概率加权(IPW)估计量,处理“随机缺失(MAR)”的访视机制——即给定已观测到的协变量后,访视与结局条件独立。这是处理信息性访视的里程碑,但IPW估计量对模型误设敏感且效率较低。
-
主要进展:增广估计与双重稳健性
- Robins (2000):提出增广逆概率加权(AIPW)估计量,通过结合结局回归模型和访视概率模型,实现双重稳健性(只要其中一个模型正确,估计量即一致)。这极大提升了效率与稳健性。
- Pullenayegum & Lim (2016):专门针对不规则访视时间,提出“增广逆强度加权估计量”(augmented inverse intensity-weighted estimator),将AIPW思想推广到连续时间访视过程。这是本文的直接技术前身。
-
当前Frontier:处理“不可解释访视(Unexplainable Assessment)”
- 上述方法均依赖于“可解释访视(EA)”假设:给定历史协变量后,访视时间与结局条件独立。但EA假设本身不可检验(untestable)。因此,敏感性分析成为必要——量化偏离EA假设对处理效应估计的影响。
- 本文的位置:作者明确指出,现有方法(如Pullenayegum & Lim, 2016)依赖于EA假设,但没有提供系统性的敏感性分析工具。本文填补了这一空白,通过指数倾斜(exponential tilting)引入一个敏感性参数,量化偏离EA的程度,并基于影响函数构建了增广逆强度加权估计量。
子线索聚类¶
- 基于访视机制的建模(Intensity-based modeling):将访视时间视为一个点过程(point process),用强度函数(intensity function)建模其发生机制。代表工作:Pullenayegum & Lim (2016)。本文继承并扩展了这一框架。
- 基于逆概率加权的估计(IPW/AIPW):通过加权或增广来纠正因信息性访视导致的偏差。代表工作:Robins, Rotnitzky & Zhao (1995), Robins (2000)。本文的估计量是AIPW在连续时间访视下的推广。
- 敏感性分析(Sensitivity Analysis):通过引入一个或多个敏感性参数,量化不可检验假设的偏离程度。代表工作:Rosenbaum (2002) 在匹配中的敏感性分析;Scharfstein, Rotnitzky & Robins (1999) 在缺失数据中的敏感性分析。本文借鉴了指数倾斜这一经典工具。
这个方向在追问的核心问题¶
- 识别问题:在EA假设下,处理效应是否可识别?需要哪些额外假设(如无未测量的时变混杂)?
- 估计问题:如何构建高效、稳健的估计量?AIPW类估计量在连续时间访视下的最优收敛速率是多少?
- 敏感性分析问题:如何系统性地量化偏离EA假设的影响?敏感性参数应如何解释和校准?
- 实际实施问题:如何将复杂的方法论转化为可操作的软件和指南,供应用研究者使用?
⚠️ 作者的 framing¶
- 作者的缺口frame:作者将缺口明确frame为“现有方法(如Pullenayegum & Lim, 2016)依赖于不可检验的EA假设,但缺乏敏感性分析”。因此,本文的贡献是“在EA假设的基准上,通过指数倾斜引入一个敏感性参数,构建一个完整的敏感性分析框架”。这使得本文成为“显然的下一步”。
- 被淡化/回避的竞争路线:
- 工具变量(IV)方法:如果存在一个影响访视但不直接影响结局的工具(如随机化的访视提醒),可以用IV方法处理信息性访视。作者在intro中提及了IV方法(如Li et al., 2020),但指出其需要“排他性约束”等强假设,且可能难以找到合适的工具。作者选择淡化IV路线,强调其方法不需要寻找工具。
- 基于模式混合模型(Pattern-mixture model)的方法:另一种处理缺失数据的经典框架。作者未在intro中讨论,可能因为其更适用于离散的缺失模式,而非连续的访视时间。
- 什么明显该被引/该存在、却没出现在intro里?
- 更近期的AIPW在纵向数据中的进展:例如,关于“double/debiased machine learning”在纵向数据中的应用(如Chernozhukov et al., 2018),虽然其框架是离散时间,但交叉拟合(cross-fitting)等技巧对本文的连续时间设定也有潜在价值。作者未引用,可能因为其方法更侧重于连续时间点过程。
- 关于敏感性参数校准的文献:例如,如何将敏感性参数映射到可解释的偏差度量(如Rosenbaum的Γ)。本文的敏感性参数(δ)是通过指数倾斜定义的,其解释性可能不如某些更直观的校准方法。作者未讨论这一点。
张力¶
未见明显对立引用。所有被引工作基本沿着“MCAR → MAR (EA) → 敏感性分析”这一渐进路径发展,彼此互补而非矛盾。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
- 符号:
- \( T \):处理分配(0 = 对照组,1 = 处理组)。随机化,故 \( T \perp \text{所有基线变量} \)。
- \( \tau \):感兴趣的目标时间点(如随机化后6个月)。
- \( Y(t) \):在时间 \( t \) 的潜在结局(potential outcome)。我们关心的是 \( Y(\tau) \)。
- \( A(t) \):在时间 \( t \) 的访视指示变量(1 = 在时间 \( t \) 被访视,0 = 未访视)。访视时间是不规则的,因此 \( A(t) \) 是一个连续时间点过程。
- \( \lambda(t | \bar{H}(t)) \):访视过程的强度函数(intensity function)。它表示在给定历史 \( \bar{H}(t) \) 的条件下,在时间 \( t \) 发生访视的瞬时风险。这是建模信息性访视的核心。
- \( \bar{H}(t) \):到时间 \( t \) 为止的历史协变量,包括基线协变量 \( X \)、过去访视时间 \( \{s: A(s)=1, s < t\} \)、以及过去观测到的结局 \( \{Y(s): A(s)=1, s < t\} \)。注意:\( \bar{H}(t) \) 只包含已观测到的信息。
- \( \delta \):敏感性参数(scalar)。它量化了偏离EA假设的程度。
- \( \beta \):处理效应(如ATE),即 \( \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。这是主要estimand。
- 模型:
- 数据生成机制:这是一个纵向数据生成过程。首先,随机化分配处理 \( T \)。然后,每个参与者的访视时间 \( A(t) \) 和结局 \( Y(t) \) 随时间动态生成。访视强度 \( \lambda(t | \bar{H}(t)) \) 可能依赖于历史协变量和结局。结局 \( Y(t) \) 的分布也可能依赖于历史。
- 关键假设:
- 可解释访视(EA)假设(基准假设):\( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \)。即,给定历史 \( \bar{H}(t) \) 后,当前时刻的访视强度与当前时刻的潜在结局 \( Y(t) \) 条件独立。这是“无未测量的时变混杂”在访视过程中的体现。
- 指数倾斜假设(偏离EA):\( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \exp(\delta Y(t)) \)。即,偏离EA假设的程度由一个指数倾斜项 \( \exp(\delta Y(t)) \) 控制。\( \delta = 0 \) 回到EA假设;\( \delta > 0 \) 表示结局值越大,访视强度越高(信息性访视)。
- 要估的对象:处理效应 \( \beta \)。在EA假设下,\( \beta \) 是可识别的。在指数倾斜假设下,给定 \( \delta \),\( \beta \) 也是可识别的。敏感性分析就是考察 \( \beta \) 如何随 \( \delta \) 变化。
- 可观测数据:
- 对于每个参与者 \( i \),我们能观测到:
- 处理分配 \( T_i \)。
- 基线协变量 \( X_i \)。
- 一系列访视时间 \( \{t_{i1}, t_{i2}, ..., t_{iK_i}\} \) 和对应的结局 \( \{Y_i(t_{i1}), Y_i(t_{i2}), ..., Y_i(t_{iK_i})\} \)。
- 不可观测:在非访视时间点的潜在结局 \( Y_i(t) \)(对于 \( t \neq t_{ik} \))。这正是信息性访视带来的缺失数据问题。
- 对于每个参与者 \( i \),我们能观测到:
第二步:讲最小内核¶
最简特例:假设只有一个目标时间点 \( \tau \)(如6个月),且每个参与者最多被访视一次(即 \( K_i \in \{0, 1\} \))。这是一个“单时间点、有信息性缺失”的问题。
- 问题退化:我们想估计 \( \beta = \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。但 \( Y(\tau) \) 只在被访视的参与者中观测到。访视指示变量 \( A(\tau) \) 可能依赖于 \( Y(\tau) \)(信息性缺失)。
- EA假设退化:\( A(\tau) \perp Y(\tau) | X, T \)。即,给定基线协变量 \( X \) 和处理 \( T \) 后,访视与否与潜在结局独立。这等价于“随机缺失(MAR)”。
- 指数倾斜假设退化:\( \mathbb{P}(A(\tau)=1 | X, T, Y(\tau)) = \text{logit}^{-1}( \alpha(X, T) + \delta Y(\tau) ) \)。其中 \( \alpha(X, T) \) 是基线访视概率的对数几率。\( \delta \) 控制结局对访视概率的影响。
- 核心思路:
- 在EA假设下(\( \delta=0 \)):我们可以用标准AIPW估计量估计 \( \beta \)。例如,对于处理组 \( T=1 \):
\[\hat{\mu}_1 = \frac{1}{n} \sum_{i: T_i=1} \left[ \frac{A_i(\tau) Y_i(\tau)}{\hat{\pi}(X_i)} + \left(1 - \frac{A_i(\tau)}{\hat{\pi}(X_i)}\right) \hat{m}(X_i) \right]\]其中 \( \pi(X) = \mathbb{P}(A(\tau)=1 | X, T=1) \) 是访视概率,\( m(X) = \mathbb{E}[Y(\tau) | X, T=1, A(\tau)=1] \) 是结局回归。这个估计量是双重稳健的。
- 在偏离EA假设下(\( \delta \neq 0 \)):我们需要对信息性缺失进行校正。核心想法是:通过指数倾斜假设,我们可以将观测到的结局分布“重新加权”到目标总体。具体地,给定 \( \delta \),我们可以构造一个“伪结局”或“校正权重”,使得校正后的数据满足EA假设。然后,再用AIPW估计量。
- 本文的贡献:将这个单时间点的敏感性分析思想,推广到连续时间、不规则访视的纵向设定。核心挑战在于:①访视强度 \( \lambda(t | \bar{H}(t)) \) 是随时间变化的;②历史协变量 \( \bar{H}(t) \) 是动态更新的。本文通过增广逆强度加权估计量(augmented inverse intensity-weighted estimator)解决了这个问题,该估计量是AIPW在连续时间点过程中的自然推广。
- 在EA假设下(\( \delta=0 \)):我们可以用标准AIPW估计量估计 \( \beta \)。例如,对于处理组 \( T=1 \):
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在随机对照试验中,当访视时间不规则且与结局相关(信息性访视)时,如何对处理效应进行半参数敏感性分析。
- 核心工具/方法:基于指数倾斜(exponential tilting)假设,引入一个标量敏感性参数 \( \delta \) 来量化偏离“可解释访视(EA)”假设的程度;并基于影响函数(influence function)理论,构建了一个新的增广逆强度加权估计量(augmented inverse intensity-weighted estimator)。
- 主要结论:在给定 \( \delta \) 下,该估计量是双重稳健的(只要访视强度模型或结局回归模型之一正确,即一致);通过变化 \( \delta \),可以绘制出处理效应估计的敏感性区间,从而评估结论对EA假设偏离的稳健性。
关键设定与假设¶
- 设定:考虑一个随机对照试验,有 \( n \) 个参与者,随机分配到处理组 \( T \in \{0,1\} \)。每个参与者的访视时间由一个连续时间点过程 \( N(t) \) 控制(\( N(t) \) 是到时间 \( t \) 为止的访视次数)。在每次访视时,观测到结局 \( Y(t) \)。目标是估计在某个固定时间点 \( \tau \) 的平均处理效应(ATE):\( \beta = \mathbb{E}[Y(\tau) | T=1] - \mathbb{E}[Y(\tau) | T=0] \)。
- 关键假设:
- 一致性(Consistency):观测到的结局等于访视时的潜在结局:\( Y^{obs}(t) = Y(t) \) 如果 \( dN(t)=1 \)。
- 无未测量的时变混杂(No unmeasured time-varying confounding):访视强度只依赖于已观测到的历史 \( \bar{H}(t) \),即 \( \lambda(t | \bar{H}(t), Y(t)) = \lambda(t | \bar{H}(t)) \exp(\delta Y(t)) \)。这是指数倾斜假设,其中 \( \delta \) 是敏感性参数。当 \( \delta=0 \) 时,回到EA假设。
- 正性(Positivity):在给定历史下,每个时间点发生访视的概率严格大于0,且小于1。这是为了确保逆概率加权有定义。
- 访视过程的模型:访视强度 \( \lambda(t | \bar{H}(t)) \) 被参数化为一个半参数模型(如Cox比例风险模型),其中基线强度函数是非参数的,协变量效应是参数的。
- 结局回归模型:给定历史,结局的期望 \( \mathbb{E}[Y(t) | \bar{H}(t), T] \) 被参数化为一个半参数模型。
- 相比已有文献的放宽/强化:
- 放宽:相比Pullenayegum & Lim (2016) 依赖于EA假设(\( \delta=0 \)),本文允许 \( \delta \neq 0 \),从而进行敏感性分析。
- 强化:本文假设指数倾斜形式是已知的(即偏离EA的方式被参数化为一个指数族)。这是一个强参数假设,但也是敏感性分析中常用的工具(如Scharfstein et al., 1999)。更灵活的偏离形式(如非参数倾斜)是未来工作。
主要结果¶
- 定理1:影响函数(Influence Function):作者推导了在给定 \( \delta \) 下,处理效应 \( \beta \) 的有效影响函数(efficient influence function, EIF)。这是半参数效率理论的核心结果。EIF的形式为:
\[IF_{\beta} = \frac{1}{\mathbb{P}(T=t)} \left[ \int_0^\tau \frac{dM_t(u)}{\lambda_t(u | \bar{H}(u))} \cdot (Y(u) - \mu_t(u)) + (Y(\tau) - \beta_t) \right]\]其中 \( t \in \{0,1\} \),\( \lambda_t(u | \bar{H}(u)) \) 是处理组 \( t \) 的访视强度,\( dM_t(u) \) 是计数过程的鞅增量,\( \mu_t(u) = \mathbb{E}[Y(u) | \bar{H}(u), T=t] \) 是结局回归。这个EIF的推导是本文的技术核心。
- 定理2:增广逆强度加权估计量:基于EIF,作者构建了估计量:
\[\hat{\beta}_t = \frac{1}{n_t} \sum_{i: T_i=t} \left[ \int_0^\tau \frac{d\hat{M}_i(u)}{\hat{\lambda}_i(u | \bar{H}_i(u))} \cdot (Y_i(u) - \hat{\mu}_i(u)) + Y_i(\tau) \right]\]其中 \( n_t \) 是处理组 \( t \) 的样本量。这个估计量是双重稳健的:如果访视强度模型 \( \lambda \) 或结局回归模型 \( \mu \) 之一被正确指定,则 \( \hat{\beta}_t \) 是 \( \beta_t \) 的一致估计。
- 定理3:渐近正态性:在正则条件下,\( \sqrt{n}(\hat{\beta} - \beta) \) 渐近收敛到均值为0的正态分布,其方差可由EIF的样本方差一致估计。这为构造置信区间提供了理论基础。
证明路线与技术技巧¶
- 整体路线:
- 定义目标参数:首先,在指数倾斜假设下,将处理效应 \( \beta \) 表达为观测数据分布的函数(识别)。这需要利用逆强度加权(IIW)来校正信息性访视。
- 推导EIF:这是最核心的一步。作者使用半参数效率理论的标准技巧:将模型视为一个半参数模型,其中访视强度和结局回归是无穷维 nuisance 参数。然后,通过计算得分函数(score function)和切空间(tangent space),找到目标参数 \( \beta \) 的有效影响函数。这通常涉及复杂的泛函分析。
- 构建估计量:EIF提供了一个“模板”:一个高效的估计量可以通过求解EIF的样本均值为0的方程来获得。作者直接使用EIF的“plug-in”形式,构建了增广逆强度加权估计量。
- 证明双重稳健性:通过将估计量的偏差分解为两部分,分别对应于访视强度模型和结局回归模型的误设。然后证明,只要其中一个模型正确,偏差项就收敛到0。这依赖于鞅理论(martingale theory)和U-统计量(U-statistics)的渐近理论。
- 证明渐近正态性:利用经验过程理论(empirical process theory)和鞅中心极限定理(martingale central limit theorem),证明估计量的渐近正态性。
- 关键跳跃点:
- EIF的推导:在连续时间点过程设定下推导EIF,需要处理计数过程的鞅表示。作者将离散时间AIPW的EIF推广到连续时间,这是本文最吃功夫的引理。
- 双重稳健性的证明:证明双重稳健性需要处理两个模型(强度模型和结局模型)的交叉项。作者巧妙地利用鞅的零期望性质,将交叉项转化为一个鞅积分,然后证明其在模型误设下仍收敛到0。
- 技术技巧点名:
- 鞅理论(Martingale Theory):用于建模和分解访视过程的偏差。
- 影响函数(Influence Function):核心工具,用于推导高效估计量和证明双重稳健性。
- 经验过程理论(Empirical Process Theory):用于处理估计的 nuisance 参数(如 \( \hat{\lambda}, \hat{\mu} \))带来的额外变异性。
- 指数倾斜(Exponential Tilting):用于参数化偏离EA假设,这是敏感性分析的经典技巧。
真实例子与应用¶
- 数据/场景:一项针对低收入、未控制哮喘患者的随机对照试验。参与者被随机分配到“标准护理”或“增强护理”(包括家访、教育等)。主要结局是6个月时哮喘控制情况的得分(ACT得分)。访视时间由研究护士安排,但实际访视时间存在很大变异,且可能受患者病情影响(病情更差的患者可能更愿意接受访视)。
- 方法应用:
- 建模访视强度:使用Cox比例风险模型,以基线协变量(年龄、性别、基线ACT得分等)和时变协变量(过去访视次数、过去ACT得分等)作为预测变量。
- 建模结局回归:使用线性混合效应模型,以时间、处理、以及它们的交互项作为固定效应,以随机截距和随机斜率作为随机效应。
- 敏感性分析:设定一系列 \( \delta \) 值(从-0.5到0.5),对每个 \( \delta \) 计算增广逆强度加权估计量,并绘制处理效应估计值及其95%置信区间随 \( \delta \) 变化的曲线。
- 结果:
- 在EA假设(\( \delta=0 \))下,增强护理组的ACT得分平均比标准护理组高约2.5分(95% CI: [0.5, 4.5]),具有统计学显著性。
- 当 \( \delta \) 从0增加到0.5(即假设结局越差,访视强度越高),处理效应估计值逐渐减小,置信区间变宽。当 \( \delta=0.3 \) 时,处理效应估计值降至约1.5分,且95% CI开始包含0。
- 当 \( \delta \) 从0减小到-0.5(即假设结局越好,访视强度越高),处理效应估计值逐渐增大。
- 这个例子想说明什么:
- 验证理论:展示了该方法在实际数据中的可操作性。
- 展示敏感性分析的价值:结论对EA假设的偏离是敏感的。当存在中等程度的信息性访视(\( \delta=0.3 \))时,原本显著的结论可能变得不显著。这提醒研究者,在解释结果时必须考虑访视机制的信息性。
- 提供实施指南:作者详细展示了如何建模访视强度和结局回归,以及如何计算估计量,为应用研究者提供了清晰的模板。
🔎 结论是否比证明窄¶
- 窄结论:作者在定理中证明的是给定 \( \delta \) 下估计量的渐近性质。但论文的结论(如“我们的方法允许对EA假设进行敏感性分析”)是成立的。没有发现明显的“证明窄于结论”的情况。
- 潜在conjecture:作者在讨论中提到,该方法可以扩展到更复杂的访视模式(如竞争风险),但并未给出证明。这是一个conjecture。
四、开放问题¶
- 更灵活的偏离EA假设:本文假设偏离EA的形式是指数倾斜(\( \exp(\delta Y(t)) \))。能否推广到更一般的非参数或半参数倾斜形式?这需要更复杂的识别和估计理论。扎根于:本文第2.2节“Exponential tilting assumption”。
- 敏感性参数 \( \delta \) 的校准与解释:如何将 \( \delta \) 映射到更直观的偏差度量(如Rosenbaum的Γ)?如何基于背景知识或辅助数据为 \( \delta \) 设定一个合理的范围?扎根于:本文第5节“Discussion”中提到的“calibration of the sensitivity parameter”。
- 高维协变量下的方法:当协变量维度很高时,如何对访视强度和结局回归进行建模?能否将double/debiased machine learning(DML)框架引入到连续时间设定中?扎根于:本文第5节“Discussion”中提到的“use of machine learning methods”。
- 多个目标时间点:本文只考虑了单个目标时间点 \( \tau \)。如何将方法扩展到多个目标时间点(如纵向处理效应曲线)?这需要处理多个时间点的联合推断。扎根于:本文第1节“Introduction”中提到的“interest in the effect of treatment at a specific time \( \tau \)”。
Maintained by 陈星宇 · Homepage · Source on GitHub