Sample size and power calculations for causal inference with time-to-event outcomes¶

作者: Chengxin Yang, Bo Liu, Fan Li
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2605.10088

核心问题与动机¶

本文解决生存数据（time-to-event）因果推断中边际风险比的样本量与功效计算问题。重要性在于：1）经典基于log-rank检验的公式（Schoenfeld, Freedman）在零假设下推导，非零效应时系统性低估方差导致检验underpowered；2）观察性研究中，现有方法多需个体先验数据，且针对条件风险比，因HR的non-collapsibility丧失因果解释。本文旨在为边际结构Cox模型下的因果效应估计，提供仅需汇总统计量的解析样本量公式。

主要贡献¶

推导了加权边际Cox模型IPW估计量的稳健三明治渐近方差解析式，将经验影响函数转化为总体影响函数，扩展了Lin & Wei (1989)的理论。
提出适用于任意预设效应量的RCT样本量公式，仅需处理比例、效应量和事件率，从理论上严格量化并纠正了经典log-rank公式的低估问题。
针对观察性研究，引入重叠系数（overlap coefficient, $\phi$）及PS的Beta分布近似，仅需一个额外参数即可计算IPW所需样本量。
提出基于修正基线方差的方差膨胀因子（VIF）方法，适用于所有PS平衡权重（如overlap权重、匹配权重），无需个体数据。

方法框架¶

模型设定：边际结构Cox模型 $\lambda_1(t) = \lambda_0(t)\exp(\tau)$，目标因果估计量为边际风险比 $\exp(\tau)$。
关键假设：
A1-A3：SUTVA、无混杂、重叠性；
A4：组内独立删失（Arm-specific independent censoring）；
A5：比例风险集（Proportional risk-set）：$\pi(\tau_0, t) \equiv \pi(\tau_0, 0)$，即加权风险集中处理组比例不随时间变化。锚定 $t=0$ 时刻，使方差仅依赖设计阶段已知的汇总量，且保证方差估计的保守性。
方法步骤：
构建IPW偏似然估计方程，得到估计量 $\hat{\tau}_n$；
利用M估计理论，将三明治方差 $V = A^{-2}B$ 中的经验量替换为总体期望 $\psi_i, \eta_i$；
在A5下化简方差，得到闭式解 $\tilde{V}_{IPW} + \epsilon$；
RCT中 $\epsilon=0$ 直接计算；观察性研究中利用 $e(x) \sim \text{Beta}(a,b)$ 由 $(r, \phi)$ 决定参数，计算 $\tilde{V}_{obs}$；
对一般平衡权重，计算设计效应 $\kappa_{DE}$ 作为方差膨胀因子 $\kappa_w$ 的近似，样本量 $N = \kappa_w N_{RCT}$。

主要理论结果¶

Theorem 1：$\sqrt{n}(\hat{\tau}_n - \tau_0) \xrightarrow{d} N(0, V)$，其中 $V = A(\tau_0)^{-2}B(\tau_0)$，给出了 $\psi_i, \eta_i$ 的解析形式，将非i.i.d.的风险集过程转化为i.i.d.的总体影响函数。
Theorem 2：在A5下，$V_{IPW} = \tilde{V}{IPW} + \epsilon$，其中 $\tilde{V}{IPW} = \frac{(\lambda_1+\lambda_0)^2}{d^2} \left[ r^2\lambda_0^2 d_1 E[1/e_i] + (1-r)^2\lambda_1^2 d_0 E[1/(1-e_i)] \right]$，残差 $\epsilon$ 为协变量生存分布与权重协方差的线性泛函。
Corollary 1 & Proposition 1：RCT下 $V_{RCT} = \tilde{V}{RCT}$（精确）。在平衡设计中，$\tilde{V}{RCT} \ge V_{Freedman} \ge V_{Schoenfeld}$，严格不等号当 $\tau_0 \neq 0$ 时成立，解析量化了经典公式的低估程度。
Corollary 2：观察性研究下，若 $e(x) \sim \text{Beta}(a,b)$ 且 $a,b>1$，则 $E[1/e_i]$ 与 $E[1/(1-e_i)]$ 有闭式解，得到 $\tilde{V}_{obs}$，且 $\epsilon \to 0$ 当 $\phi \to 1$。

实验 / 数值仿真¶

实验设计：对比本文公式与Schoenfeld、Freedman公式在不同效应量（HR=0.4-1）、删失率、处理比例及PS分布下的表现；验证Beta近似与VIF方法在观察性设定下的准确性。
评估指标：经验Type-I error、经验Power、所需样本量/事件数。
主要发现：
RCT中，当HR偏离1时（如HR=0.4），Schoenfeld公式所需事件数仅为本文公式的56%（严重underpowered），Freedman公式为64%。
观察性研究中，基于 $(r, \phi)$ 的Beta近似准确刻画了PS分布，所得样本量达到名义Power；忽略PS估计不确定性使得结果略保守。
VIF方法对overlap权重的方差膨胀计算有效，且锚定修正基线方差避免了传统方法因基线方差错误导致的偏差。

与研究者兴趣的关联¶

直击因果推断（生存数据、边际结构模型、IPW与平衡权重、混杂调整）与数理统计/假设检验（非零效应下的功效计算、稳健方差推导）。
可借鉴的核心思路：1) 处理non-collapsibility时，通过总体影响函数推导加权部分似然稳健三明治方差的解析技巧；2) 在半参数效率/设计框架下，利用重叠系数 $\phi$ 与Beta近似参数化PS分布，将不可行的个体级先验转化为汇总统计量输入，这对其他复杂半参数因果估计量的功效分析具有推广价值。

局限性与开放问题¶

A5（比例风险集）假设在长随访或强时效性干预下可能不成立，虽锚定 $t=0$ 保证保守性，但可能导致过度估计样本量。
设计阶段公式未纳入PS估计的不确定性，虽得出保守结论，但损失了统计效率，如何将PS估计的方差纳入设计阶段计算是开放问题。
仅考虑了右删失机制，未涉及竞争风险或时依混杂（longitudinal/time-varying confounding）下的样本量计算。

Maintained by 陈星宇 · Homepage · Source on GitHub