Sample size and power calculations for causal inference with time-to-event outcomes¶
作者: Chengxin Yang, Bo Liu, Fan Li
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.10088
核心问题与动机¶
本文解决生存数据(time-to-event)因果推断中边际风险比的样本量与功效计算问题。重要性在于:1)经典基于log-rank检验的公式(Schoenfeld, Freedman)在零假设下推导,非零效应时系统性低估方差导致检验underpowered;2)观察性研究中,现有方法多需个体先验数据,且针对条件风险比,因HR的non-collapsibility丧失因果解释。本文旨在为边际结构Cox模型下的因果效应估计,提供仅需汇总统计量的解析样本量公式。
主要贡献¶
- 推导了加权边际Cox模型IPW估计量的稳健三明治渐近方差解析式,将经验影响函数转化为总体影响函数,扩展了Lin & Wei (1989)的理论。
- 提出适用于任意预设效应量的RCT样本量公式,仅需处理比例、效应量和事件率,从理论上严格量化并纠正了经典log-rank公式的低估问题。
- 针对观察性研究,引入重叠系数(overlap coefficient, $\phi$)及PS的Beta分布近似,仅需一个额外参数即可计算IPW所需样本量。
- 提出基于修正基线方差的方差膨胀因子(VIF)方法,适用于所有PS平衡权重(如overlap权重、匹配权重),无需个体数据。
方法框架¶
- 模型设定:边际结构Cox模型 $\lambda_1(t) = \lambda_0(t)\exp(\tau)$,目标因果估计量为边际风险比 $\exp(\tau)$。
- 关键假设:
- A1-A3:SUTVA、无混杂、重叠性;
- A4:组内独立删失(Arm-specific independent censoring);
- A5:比例风险集(Proportional risk-set):$\pi(\tau_0, t) \equiv \pi(\tau_0, 0)$,即加权风险集中处理组比例不随时间变化。锚定 $t=0$ 时刻,使方差仅依赖设计阶段已知的汇总量,且保证方差估计的保守性。
- 方法步骤:
- 构建IPW偏似然估计方程,得到估计量 $\hat{\tau}_n$;
- 利用M估计理论,将三明治方差 $V = A^{-2}B$ 中的经验量替换为总体期望 $\psi_i, \eta_i$;
- 在A5下化简方差,得到闭式解 $\tilde{V}_{IPW} + \epsilon$;
- RCT中 $\epsilon=0$ 直接计算;观察性研究中利用 $e(x) \sim \text{Beta}(a,b)$ 由 $(r, \phi)$ 决定参数,计算 $\tilde{V}_{obs}$;
- 对一般平衡权重,计算设计效应 $\kappa_{DE}$ 作为方差膨胀因子 $\kappa_w$ 的近似,样本量 $N = \kappa_w N_{RCT}$。
主要理论结果¶
- Theorem 1:$\sqrt{n}(\hat{\tau}_n - \tau_0) \xrightarrow{d} N(0, V)$,其中 $V = A(\tau_0)^{-2}B(\tau_0)$,给出了 $\psi_i, \eta_i$ 的解析形式,将非i.i.d.的风险集过程转化为i.i.d.的总体影响函数。
- Theorem 2:在A5下,$V_{IPW} = \tilde{V}{IPW} + \epsilon$,其中 $\tilde{V}{IPW} = \frac{(\lambda_1+\lambda_0)^2}{d^2} \left[ r^2\lambda_0^2 d_1 E[1/e_i] + (1-r)^2\lambda_1^2 d_0 E[1/(1-e_i)] \right]$,残差 $\epsilon$ 为协变量生存分布与权重协方差的线性泛函。
- Corollary 1 & Proposition 1:RCT下 $V_{RCT} = \tilde{V}{RCT}$(精确)。在平衡设计中,$\tilde{V}{RCT} \ge V_{Freedman} \ge V_{Schoenfeld}$,严格不等号当 $\tau_0 \neq 0$ 时成立,解析量化了经典公式的低估程度。
- Corollary 2:观察性研究下,若 $e(x) \sim \text{Beta}(a,b)$ 且 $a,b>1$,则 $E[1/e_i]$ 与 $E[1/(1-e_i)]$ 有闭式解,得到 $\tilde{V}_{obs}$,且 $\epsilon \to 0$ 当 $\phi \to 1$。
实验 / 数值仿真¶
- 实验设计:对比本文公式与Schoenfeld、Freedman公式在不同效应量(HR=0.4-1)、删失率、处理比例及PS分布下的表现;验证Beta近似与VIF方法在观察性设定下的准确性。
- 评估指标:经验Type-I error、经验Power、所需样本量/事件数。
- 主要发现:
- RCT中,当HR偏离1时(如HR=0.4),Schoenfeld公式所需事件数仅为本文公式的56%(严重underpowered),Freedman公式为64%。
- 观察性研究中,基于 $(r, \phi)$ 的Beta近似准确刻画了PS分布,所得样本量达到名义Power;忽略PS估计不确定性使得结果略保守。
- VIF方法对overlap权重的方差膨胀计算有效,且锚定修正基线方差避免了传统方法因基线方差错误导致的偏差。
与研究者兴趣的关联¶
- 直击因果推断(生存数据、边际结构模型、IPW与平衡权重、混杂调整)与数理统计/假设检验(非零效应下的功效计算、稳健方差推导)。
- 可借鉴的核心思路:1) 处理non-collapsibility时,通过总体影响函数推导加权部分似然稳健三明治方差的解析技巧;2) 在半参数效率/设计框架下,利用重叠系数 $\phi$ 与Beta近似参数化PS分布,将不可行的个体级先验转化为汇总统计量输入,这对其他复杂半参数因果估计量的功效分析具有推广价值。
局限性与开放问题¶
- A5(比例风险集)假设在长随访或强时效性干预下可能不成立,虽锚定 $t=0$ 保证保守性,但可能导致过度估计样本量。
- 设计阶段公式未纳入PS估计的不确定性,虽得出保守结论,但损失了统计效率,如何将PS估计的方差纳入设计阶段计算是开放问题。
- 仅考虑了右删失机制,未涉及竞争风险或时依混杂(longitudinal/time-varying confounding)下的样本量计算。
Maintained by 陈星宇 · Homepage · Source on GitHub