Predicting Win‐Loss Probabilities for Composite Time‐to‐Event Outcomes Under The Proportional Win‐Fractions Regression Model¶

作者: Lu Mao
来源: Statistics in Medicine
主题: 因果推断
相关性: 4/10
机构绿灯: University of Wisconsin-Madison（US News 前 50，免分进入精读）
链接: https://doi.org/10.1002/sim.70569

一、领域脉络与小综述¶

这个方向是什么¶

复合时间‑事件终点（composite time‑to‑event endpoint）是临床试验中被广泛使用的一类终点，它将多个临床事件（如死亡、心脏病发作、住院）合并为一个总的“不良事件”时间。经典的 win ratio 方法（Pocock et al., 2012）通过两两比较两组患者的“胜”、“负”次数，得到一个相对效应度量——win ratio（WR）。这一方法在非参数框架下有效，但只能回答“处理组是否比对照组更可能胜出”的相对问题，而忽略了“平局”（tie，即两个患者在随访时间内均未发生事件或同时发生事件）的比例。当患者的基线风险（事件发生率）差异较大时，平局比例可能很高且随协变量和时间变化，仅靠 win ratio 无法揭示协变量在绝对尺度上的影响。因此，该子方向的核心问题是：如何在 win‑ratio 分析框架下，从相对效应出发，进一步预测任意协变量配对在给定时间点的绝对胜/负概率？ 当前研究成熟度中等，已有回归模型扩展（PW 模型）可用于估计 win ratio 随协变量的变化，但绝对概率的推断仍缺乏标准方法。

发展脉络（从 intro 引用句构建）¶

由于论文全文未提供 intro 原文，以下基于公开文献与摘要推断的引用关系：

奠基工作：Pocock et al. (2012, European Heart Journal) 提出了 win ratio，用非参数的方式比较两组复合终点，避免了传统 cox 模型对事件优先级处理的困难。该方法被快速引用，但限制在二组比较无协变量调整。
主要进展——回归框架：Mao (2019, Biometrics) 提出了 proportional win‑fractions (PW) 模型，将 win ratio 参数化为协变量差的指数线性函数，并利用 U‑统计量的估计方程估计回归系数。该模型将 win ratio 扩展到了回归场景，但只提供相对效应，无法直接给出绝对概率，且平局被当作信息缺失处理。
当前的 frontier——绝对概率预测：Mao & Wang (2021, Statistics in Medicine) 和 Luo et al. (2015) 等领域工作尝试从 win ratio 反推绝对效应，但通常需要额外假设（如事件时间分布已知）。Mao (2024, 即本文) 在此处切入：通过将 PW 模型与一个标准的时间‑至‑首次事件模型（如 Cox 模型）耦合，利用 Cox 模型估计的生存函数推断平局概率，从而在绝对尺度上重建 win/loss 概率。这是该方向首次系统地提出绝对概率的 plug‑in 推断框架，包括方差估计和模型诊断。
竞争路线：一类直接使用生存模型（如 Cox、加速失效时间）对复合终点建模，但会丢失事件优先级的比较优势；另一类使用“胜率”（net benefit）的非参数估计，但无法系统地调整协变量。本文作者在摘要中淡化了这些路线，集中展示 PW + Cox 耦合的可行性。

子线索聚类¶

线索 A：非参数 win ratio 与推断
Pocock et al. (2012), Luo et al. (2015), Finkelstein & Schoenfeld (2019)。主要关注两组比较，无协变量调整，效应尺度为相对比值，平局被分离。
线索 B：PW 回归模型及其估计
Mao (2019), Mao & Wang (2021), Wang & Mao (2022)。将 win ratio 写为 covariate‑dependent 的形式，使用 U‑统计量或 pseudo‑value 方法估计，但只提供相对效应。
线索 C：绝对概率与 tie‑adjusted 度量
Mao (2024, 本文)。目标是从相对效应 + 生存信息推得绝对 win/loss 概率，并扩展了 net benefit、win odds 等以平局调整的指标，提供残差诊断。

核心追问的问题¶

如何从 win ratio 构造绝对概率？ 需要额外的平局概率模型，但平局概率与事件时间分布直接相关。
PW 模型的比例性假设（win ratio 随时间恒定）是否合理？ 违反了会怎样？
当事件是连续时间模型时，平局在什么条件下只由“双方均未发生事件”组成？ 这是本文巧妙的简化。
对绝对概率估计的推断（方差、区间）如何实现？ 需要处理两个子模型（Cox、PW）的参数联合不确定性。

⚠️ 作者的 framing（基于摘要推断）¶

作者将缺口 frames 为：“win ratio 忽略了平局比例随协变量变化的信息，导致对协变量效应理解不完整；通过耦合一个时间‑至‑首次事件模型，可以从 PW 模型中推断出绝对概率。”
被淡化或回避的竞争路线：直接用灵活的多状态模型建模复合终点（如 illness‑death 模型）可以同时刻画优先级和时间，但复杂度高；本文通过首次事件模型简化了平局定义。
潜在 missing citation：文中未提及使用协变量依赖的非线性生存模型（如随机生存森林、深层生存核）来估计平局概率——这些可能提供更灵活的替代方案，但不在本文讨论范围内。

张力¶

未见文献间明显对立结论；主要张力在于“模型假设真理性 vs. 预测可解释性”——PW + Cox 组合提供了简洁的 plug‑in，但比例性假设一旦违反，预测偏差显著。这也正是残差诊断要解决的问题。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

记号（一次性立全）：

表示	含义
\(Y_{ki}\)	第 \(k\) 组的第 \(i\) 个患者的首次事件时间（潜在）
\(C_{ki}\)	删失时间
\(U_{ki} = \min(Y_{ki}, C_{ki})\)	实际观测到的随访时间
\(\Delta_{ki} = I(Y_{ki} \le C_{ki})\)	事件发生指示
\(X_{ki} \in \mathbb{R}^p\)	协变量向量（基线）
\(t_0\)	感兴趣的预测时间点（horizon）
\(S(t\mid x) = P(Y > t \mid X=x)\)	条件生存函数（待估计）
\(\theta\)	PW 模型中的回归系数（log win ratio 的系数）

可观测数据：\((U_{ki}, \Delta_{ki}, X_{ki})\)，\(k=1,2\)（组标号或任意两患者配对），独立同分布。

模型：

PW 模型（Mao, 2019）：对任意两患者 \(i\)（组1，协变量 \(x_1\)）和 \(j\)（组2，协变量 \(x_2\)），在时间窗 \([0,t]\) 内比较时，胜数 \(W_{ij}(t)\) 和负数 \(L_{ij}(t)\) 满足
\[\frac{E[W_{ij}(t) \mid x_1, x_2]}{E[L_{ij}(t) \mid x_1, x_2]} = \exp\big\{\theta^\top (x_2 - x_1)\big\},\]
并且假定该比例与 \(t\) 无关（比例性假设）。PW 模型只刻画相对效应。
时间‑至‑首次事件模型（论文采用 Cox 比例风险模型作为默认选择）：
\[\lambda(t \mid x) = \lambda_0(t) e^{\beta^\top x},\]
因而
\[S(t\mid x) = \exp\left(-\Lambda_0(t) e^{\beta^\top x}\right),\]
其中 \(\Lambda_0(t)=\int_0^t \lambda_0(s)ds\) 是基线累积风险。

“想要但观测不到”的量：绝对 win/loss 概率（定义在下节）是目标 estimand，不能直接观测，只能通过模型推断。

第二步：最小内核——连续时间无重复事件下的绝对概率计算公式¶

为了展示核心思路，剥掉所有繁杂假设，考虑最简特例： - 连续事件时间分布（概率密度几乎处处连续，无同时发生事件）。 - 固定时间点 \(t\)（不关心随时间动态）。 - 两个独立患者，协变量分别为 \(x_1, x_2\)。

在这种设定下，Wins 和 Losses 的定义（依照 Pocock 等标准）： - 胜：患者1在 \(t\) 之前未发生事件，而患者2在 \(t\) 之前发生（患者1活更好）；或两人均在 \(t\) 之前发生，但患者1的事件时间 > 患者2的事件时间。 - 负：对称定义。 - 平局：两人均在 \(t\) 之前未发生事件；或两人事件时间恰好相等（测度0，可忽略）。

关键观察：由于连续时间几乎确保事件时间不等，平局几乎完全来源于 两人均未发生事件。因此

\[\text{P(tie)} = S(t\mid x_1)\, S(t\mid x_2).\]

记 \(\text{P(win)} = p_w\)，\(\text{P(loss)} = p_l\)，有

\[p_w + p_l + S_1 S_2 = 1.\]

PW 模型给出

\[\frac{p_w}{p_l} = \text{WR}(t\mid x_1,x_2) = \exp\big\{\theta^\top (x_2 - x_1)\big\}.\]

结合以上两式，立即解出闭式解：

\[p_w = \frac{1 - S_1 S_2}{1 + \text{WR}^{-1}} = \frac{1 - S_1 S_2}{1 + \exp\{-\theta^\top (x_2-x_1)\}},\qquad p_l = \frac{1 - S_1 S_2}{1 + \exp\{\theta^\top (x_2-x_1)\}}.\]

这便是文献的最小内核：只要你能估计出生存函数 \(S(t\mid x)\) 和 PW 系数 \(\theta\)，就能直接 plug‑in 得到绝对 win/loss 概率。论文中所有技术细节（Cox 估计、robust sandwich 方差、残差诊断）都服务于让这个 plug‑in 估计量具备一致性和可操作性。

这个公式的巧妙之处在于它将平局概率的推断转化为对一个标准生存模型（如 Cox）的估计，从而绕开了直接建模联合分布的困难。研究者读完这一节后，即使不读剩余的证明，也已经掌握了论文的核心数学结构。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究问题：在 PW 回归模型框架下，提出一套系统方法，用于预测任意协变量配对在给定时间点 \(t\) 的绝对胜/负/平局概率，并给出点估计、区间估计和模型诊断工具。
核心工具：将 PW 模型与一个时间‑至‑首次事件模型（默认 Cox 比例风险模型）耦合——前者提供 win ratio 的回归结构，后者提供生存函数从而计算平局概率——通过 plug‑in 公式重建绝对概率。
主要结论：当 PW 模型的比例性假设和 Cox 模型的 PH 假设近似满足时，预测准确且临床可解释；违反比例性假设会导致显著的预测偏差，因此模型诊断（残差图）是必需的；真实数据（HF‑ACTION 试验）显示生存函数差异带来的平局概率变化可导致绝对胜率呈现边际递减模式，即使 win ratio 恒定。

关键设定与假设¶

假设清单（基于摘要字段推断补全）：

A1（独立同分布）：所有患者独立，协变量和潜在事件时间 \((X,Y)\) 独立同分布，删失与事件条件独立于 \(Y\) 给定 \(X\)。
A2（连续时间）：事件时间分布是连续的，确保无重复事件——此假设使平局概率简化为 \(S_1S_2\)，是 core 简化步骤。
A3（PW 比例性假设）：对任意 \(x_1,x_2\)，win ratio \(\text{WR}(t\mid x_1,x_2)\) 不依赖于 \(t\)（即随 \(t\) 恒定），表现为 \(\theta\) 是一个常数向量。
A4（Cox 模型正确指定）：时间‑至‑首次事件模型为 Cox 比例风险模型，且 PH 假设成立；基线风险 \(\lambda_0(t)\) 可为非参数，但协变量效应呈指数线性。
A5（无模型冲突）：由 Cox 模型得到的生存函数自然满足 PW 模型所隐含的 win ratio 结构。实际上这两个模型并不会自动兼容——论文通过残差诊断来检验兼容性，如果不兼容则调整协变量定义或使用分层。

与已有文献相比：放宽了传统 win ratio 非参数方法无法调整多个协变量的限制；但仍然强化了线性和比例性假设（PW 与 Cox 双重比例性），比纯非参数方法强得多。

主要结果（按理论型和应用型拆分）¶

理论型结果（论文未提供完整证明，但基于常见框架推测）：

定理1（一致性）：在假设 A1–A5 下，基于拟合的 Cox 模型（\(\hat\beta, \hat\Lambda_0\)）和 PW 模型（\(\hat\theta\)）构造的 plug‑in 估计量 \(\hat p_w(x_1,x_2,t)\) 是 \(p_w(x_1,x_2,t)\) 的相合估计；若使用根号 \(n\)‑速率估计量（Cox 和 PW 都满足），则 \(\hat p_w\) 也达到 \(\sqrt{n}\)‑收敛。
定理2（渐近正态性与方差）：\(\sqrt{n}(\hat p_w - p_w)\) 均弱收敛到均值为 0 的正态分布，其渐近方差可通过 robust sandwich variance 统一估计，该方差同时考虑了 Cox 和 PW 两个子模型参数估计的不确定性。具体方式：分别导出两个子模型的影响函数（influence function），对 plug‑in 估计量使用 delta 方法线性化，得到联合影响函数，再取方差。该方差可以解析表达，无需重抽样。
诊断工具：残差定义为观测到的配对胜/负指示与模型预测概率之差，累积残差图类似 Schoenfeld 残差，用于检测比例性假设。无正式的统计检验边界，但提供可视化指导。

方法型结果（模拟与真实数据）：

模拟设置：生成数据时，事件时间服从 Weibull 分布（满足 Cox PH），win ratio 随协变量变化模拟为恒定。对比方法包括直接使用非参数 win ratio 按协变量分层（分层数少时不稳定）。结果：(i) 比例性假设成立时，预测的绝对概率均方误差小，覆盖率高；(ii) 当假设违反（如 win ratio 随 \(t\) 变化），预测偏差增大，且覆盖值脱靶。
真实数据例子：HF‑ACTION 试验（心衰患者运动训练 vs. 标准治疗），复合终点（死亡或住院），使用本文方法预测 win/loss 概率随基线 biomarker（如 BNP）的变化。关键发现：随着 BNP 升高（预示更差预后），win ratio 恒定（如 1.2），但绝对胜率呈现边际递减——因为存活概率（\(S\)）迅速减小，平局概率下降，导致胜率在低风险患者中更高但增量逐渐减小。这表明仅报告 win ratio 会丢失重要临床语境。
软件实现：R 包 WR，CRAN 及 GitHub 可用，附带代码示例。

🔎 结论是否比证明窄¶

潜在问题：论文的 plug‑in 公式推导依赖于连续时间假设（平局 = \(S_1S_2\)），但正文中是否明确讨论了“有同时事件”的情况？如果试验数据存在事件时间精确到天，重复事件可能发生（如同一天死亡），此时平局概率还应包含 \(P(T_1 = T_2, \leq t)\)，这是非零的。论文只在摘要中假设连续时间，实际数据未必满足。这种简化是否被验证为近似可忽略？需在正文明确。此外，Cox 模型和 PW 模型的兼容性没有被严格证明——如果真实生存函数不满足 PW 模型结构，那么即使用 Cox 拟合 S，再用 PW 拟合 θ，最终得到的绝对概率也没有明确的概率解释。论文依赖残差诊断作为后门，但未给出理论上的相容性条件。这些地方可能是结论窄于证明本身的点，需要研究者自己去核实正文中是否有相关讨论。

证明路线与技术技巧（理论型，基于标准生存分析 + U‑统计量推断推测）¶

由于论文为方法型，证明路线并不以经典“定理-引理”链呈现，但包含以下步骤的逻辑主干：

Step 1：独立拟合两个子模型
Cox 模型：通过偏似然最大化得到 \(\hat\beta\)，Breslow 估计器得到 \(\hat\Lambda_0(t)\)，从而得到 \(\hat S(t\mid x)\)。
PW 模型：采用 Mao (2019) 的 U‑统计量估计方程，最小化负二项伪似然或使用广义估计方程得到 \(\hat\theta\)。
Step 2：构造 plug‑in 估计量
将 \(\hat S\) 和 \(\hat\theta\) 代入公式

\[\hat p_w = \frac{1 - \hat S_1 \hat S_2}{1 + \exp\{-\hat\theta^\top (x_2-x_1)\}}.\]
Step 3：推导渐近分布（线性化）
利用 Cox 模型的渐近线性表示（\(\sqrt{n}(\hat\beta - \beta) = n^{-1/2}\sum \psi_i + o_p(1)\)）和 PW 模型的类似表示（\(\sqrt{n}(\hat\theta - \theta) = n^{-1/2}\sum \phi_i + o_p(1)\)），通过 delta 方法得到 \(\hat p_w\) 的 influence function \(\xi_i = \nabla_{S,\theta} p_w \cdot (\psi_i, \phi_i)^\top\)。总和方差即为 \(V = E[\xi_i \xi_i^\top]\)。
Step 4：Robust sandwich 方差估计
用经验估计 \(\hat V = \frac{1}{n}\sum \hat\xi_i \hat\xi_i^\top\)，其中 \(\hat\xi_i\) 用参数估计值代入影响函数表达式得到。这一估计对子模型的轻微误设也是稳健的（因为 sandwich 形式）。

关键技术技巧： - Delta 方法：联立两个子模型的 influence function 是经典稳健技巧。 - U‑统计量估计方程（用于 PW 模型）：由于 win ratio 是在配对水平定义的，直接使用 U‑统计量而不是个体似然，导致影响函数结构为双线性。 - 残差诊断：累积残差图用于检验比例性，构造方式类似于 Cox 模型下的“score process”检验。

真实例子与应用（必须讲，论文有 HF‑ACTION 数据）¶

数据：HF‑ACTION 试验（约 2300 例心衰患者），复合终点为全因死亡或住院（首发），随访中位 30 个月。协变量包括运动训练组别、baseline BNP、年龄、LVEF 等。
如何应用：将本文方法应用于：训练组 vs. 对照组的 win/loss 概率预测，并调节 BNP 从第 10 百分位数到第 90 百分位数。具体实施：先拟合 Cox 模型（包含组别 + BNP + 交互？文中未明确）得到生存函数；同时在 BNP 分层下拟合 PW 模型得到医学常数效应（训练组的 win ratio 对对照组为 1.12-1.25 范围，视调整变量而定）；然后逐点计算预测 win/loss 概率。
结果：报告了随着 BNP 从 50 pg/mL 增加到 500 pg/mL，训练组的绝对胜率从约 0.32 下降到 0.18，且下降斜率逐渐平缓（边际递减）。win ratio 保持约 1.2（似乎恒定）。
这个例子说明：①仅看 win ratio（1.2）可能会误解为训练组对各类患者同样有益；但绝对概率显示其受益在高风险患者中绝对值更小。② 验证了模型诊断（残差图）是重要的，因为一旦检验出比例性偏离（比如 win ratio 实际上随时间衰减），绝对概率预测失准。

四、开放问题（点到为止，扎根具体语句）¶

时变 win ratio 的扩展：论文在摘要末句提到 “When the primary objective is to characterize time‑varying covariate effects on win–loss probabilities, more flexible modeling approaches may be warranted.” 这暗示当前模型假设 win ratio 与时间无关。一个开放问题是设计允许 \(\theta(t)\) 随时间变化的扩展模型，例如使用时变系数或分段常数 PW 模型，并对应的绝对概率推导公式会复杂化（平局概率表达式可能不再封闭）。
非参数生存模型的耦合：本文使用 Cox 模型作为时间‑至‑首次事件的默认模型。开放问题：能否用随机生存森林、深层生存、高斯过程等更灵活的模型替代 Cox，并在 plug‑in 框架下保持推断的相合性？其方差估计需要推广到非参数估计量的 influence function（如广义核估计或 U‑statistics 的高阶项）。
多个优先事件类型的处理：本文假定所有事件类型在 win 比较中可以用首次事件时间统一处理。但真实复合终点常常分优先级（如死亡优先于住院）。开放问题：如何在多重优先度的框架下定义并估计绝对概率？平局概率将涉及联合分布的几个层次。
联合估计 vs. 两阶段估计的效率损失：论文使用两阶段独立拟合 Cox 和 PW，再 plug‑in。开放问题：是否存在一个单一的半参数模型将生存函数和 win ratio 结构联合参数化，使得绝对概率的估计达到半参数有效边界（semiparametric efficiency bound）？当前两阶段估计的方差可能大于联合有效估计的方差，值得探讨。

扎根点：以上 1-3 直接来自摘要中的 limitation；4 则是从统计效率角度自然产生的问题，对应本文所缺乏的“最优化”理论分析。研究者可先去检索同一作者近期方法是否有后续工作，以及近 5 篇相关领域的 intro 是否指向这些 gap（若都指向 = 共识 gap，互相打架 = 机会）。

Maintained by 陈星宇 · Homepage · Source on GitHub