Longitudinal Extension of the Win Odds for Ordinal Repeated Measurements¶

作者: Yongxi Long, Bart C. Jacobs, Ewout W. Steyerberg, Erik W. van Zwet
来源: Statistics in Medicine
主题: 非参数 / 半参数
相关性: 7/10
链接: https://doi.org/10.1002/sim.70536

一、领域脉络与小综述¶

这个方向是什么：这个子方向关注的是纵向/重复测量设计下的非参数或半参数效应量估计。其根本统计问题是：当结局变量是有序分类（ordinal，如"恶化/无变化/改善"）且同一受试者在多个时间点被测量时，如何在不对分布形状做强参数假设的前提下，构造一个有直观临床解释、能处理组间相关性、且可调整协变量的效应量与推断方法。当前该方向已从经典的横截面 Mann-Whitney U 检验发展到能处理纵向数据、协变量调整的半参数模型阶段，但关于效率界、最优加权、缺失数据等深层理论问题仍在完善中。

发展脉络：从 introduction 的引用梳理，这条线大致经历了如下演进：

奠基工作（横截面非参数比较）：经典的 Mann-Whitney U 检验与 Wilcoxon rank-sum test 奠定了两组比较的非参数框架。Win Odds（赢率）作为其自然推广，最初主要用于复合终点分析。作者引用了 Pocock (2012) 等工作，指出 Win Odds 定义为 \(P(X > Y) / P(X < Y)\)，即"一组随机抽取个体优于另一组的几率"与"劣于另一组的几率"之比。这比单纯的概率差 \(P(X > Y) - P(X < Y)\)（即 probabilistic index）在临床解释上更直观（类似 odds ratio）。
半参数化与协变量调整：为了在非参数框架下调整协变量，Thas et al. (2012) 提出了 Probabilistic Index Model (PIM)。这是一个半参数模型，将 \(P(X_i > X_j)\) 建模为协变量差的函数。作者在 intro 中明确指出，PIM 为 Win Odds 的协变量调整提供了理论基础，但原始 PIM 主要针对横截面独立数据。
纵向设置的初步探索：对于纵向数据，传统方法多基于广义估计方程（GEE）配合累积 logit 等参数模型（如 Liang & Zeger 1986 的 GEE 框架）。然而，这些方法对有序结局往往需要比例优势假设，且效应量（如 OR）解释不够直观。作者指出，虽然已有一些纵向秩方法，但缺乏一个像 PIM 那样既能调整协变量、又有清晰 Win Odds 解释的统一框架。
本文的位置：本文旨在填补"纵向设计 + 有序结局 + 协变量调整 + 非参数效应量"这一缺口。作者将 PIM 的估计方程改造为纵向版本，利用 GEE 思想处理组内相关，使得 Win Odds 这一效应量能直接应用于重复测量场景。

子线索聚类：被引文献大致落在三条子线索上： - 非参数效应量线索：Mann-Whitney U, Win Odds, Win Ratio。关注如何定义直观的比较量。 - 半参数建模线索：PIM (Thas et al.)。关注如何将非参数量与回归模型结合，实现协变量调整。 - 纵向相关结构线索：GEE (Liang & Zeger), 广义线性模型。关注如何处理重复测量带来的相关性。

这个方向在追问的核心问题： 1. 相关性建模：如何在保持非参数/半参数性质的同时，有效利用纵向数据的相关结构提高效率？ 2. 计算可行性：PIM 的估计方程涉及所有样本对，计算复杂度为 \(O(n^2)\)，在大样本下如何高效计算？ 3. 推断的有效性：Sandwich 方差估计量在小样本下表现如何？是否需要自由度校正？

⚠️ 作者的 framing：作者将缺口 frame 为：现有的 Win Odds 分析局限于横截面或单一时间点，而临床试验常有多时间点测量；虽然有 GEE 等参数方法，但缺乏针对纵向 Win Odds 的直接建模工具。作者通过引入"纵向 PIM"，将自己的工作定位为"显然的下一步"——既保留了 Win Odds 的临床解释性，又利用成熟的 GEE 软件生态实现了计算。

被淡化/回避的竞争路线： - 作者主要对比的是标准 GEE（累积 logit 模型），强调了 Win Odds 无需比例优势假设的优势。 - 未提及/淡化：基于加权秩和的纵向方法（如 Wei-Johnson 方法）、或多水平模型视角下的非参数方法。这些方法可能提供不同的效率-稳健性权衡，值得研究者去查证。

张力：未见明显对立引用。文献主要呈现为"功能叠加"式的演进（横截面 → 纵向；无协变量 → 有协变量），而非范式冲突。

二、最核心、最简单的例子 / 数学问题¶

在展开全文技术细节前，我们先建立一个最小内核。这有助于理解后续的估计方程与方差估计为何如此设计。

第一步：符号、模型与可观测数据¶

样本与设计：
- 共有 \(n\) 个受试者，第 \(i\) 个受试者有 \(n_i\) 次观测（纵向设计，允许不平衡）。
- \(Y_{it}\)：第 \(i\) 个受试者在时间 \(t\) 的结局变量（有序变量，如 1=恶化, 2=无变化, 3=改善）。
- \(X_{it}\)：第 \(i\) 个受试者在时间 \(t\) 的协变量向量（含组别指示变量 \(G_i\) 及其他调整变量）。
- 可观测数据：\(\{(Y_{it}, X_{it}) : i=1,\dots,n, t=1,\dots,n_i\}\)。
- 潜在/不可观测：我们关心的是"赢"的概率，这涉及潜在结果的比较，但在频率派框架下通过组间比较来识别。
核心参数：
- Win Odds (WO)：定义为 \(\text{WO} = \frac{P(Y_A > Y_B)}{P(Y_A < Y_B)}\)。其中 \(Y_A, Y_B\) 分别为处理组和对照组的潜在结局（或观测结局）。若 \(P(Y_A = Y_B)\) 较大，WO 比 Probabilistic Index \(P(Y_A > Y_B)\) 更敏感。
模型设定：
- 本文采用 Probabilistic Index Model (PIM) 作为半参数模型骨架。
- 模型形式：\(P(Y_i > Y_j \mid X_i, X_j) = g^{-1}(X_i - X_j)^T \beta\)。
- 通常取 Logit 连接函数：\(\text{logit}(P(Y_i > Y_j)) = (X_i - X_j)^T \beta\)。
- 注意：这里的"观测单位"变成了"样本对" \((i, j)\)。若 \(X_i\) 包含组别指示 \(G_i\)，则 \(\beta\) 中对应的系数即反映了调整其他协变量后的 Win Odds 对数值。

第二步：最小内核——从横截面到纵向的"伪样本对"构造¶

最简特例：假设只有 1 个时间点（退化为横截面），且无协变量，只有组别 \(G \in \{0, 1\}\)。 - 此时模型退化为：\(P(Y_i > Y_j) = \text{logit}^{-1}(\beta (G_i - G_j))\)。 - 若 \(i\) 在处理组 (\(G_i=1\))，\(j\) 在对照组 (\(G_j=0\))，则 \(P(Y_i > Y_j) = \text{logit}^{-1}(\beta)\)。 - 估计方程：\(\sum_{i,j} (G_i - G_j) [I(Y_i > Y_j) - \text{logit}^{-1}((G_i-G_j)\beta)] = 0\)。这等价于 Mann-Whitney U 统计量的某种参数化形式。

纵向扩展的核心困难与最小内核：现在假设有 2 个时间点 (\(t=1, 2\))。 - 困难：同一个受试者 \(i\) 的 \(Y_{i1}\) 和 \(Y_{i2}\) 是相关的。如果我们把所有时间点的数据拆开，构造"伪样本对" \(( (Y_{it}, X_{it}), (Y_{jk}, X_{jk}) )\)，那么当 \(i=j\) 但 \(t \neq k\) 时，这个"对"的两个成员是相关的；当 \(i \neq j\) 时，它们是独立的。 - 最小内核思路：本文的核心操作是将所有时间点的观测展开成一个长向量/长数据集，然后在这个扩展的数据集上定义 PIM。 - 定义扩展后的指标集 \(\mathcal{D} = \{ (it, jk) \}\)。 - 估计方程形式上仍类似 GEE：\(\sum_{(it, jk) \in \mathcal{D}} \nabla_\beta \mu_{it,jk} V_{it,jk}^{-1} (I(Y_{it} > Y_{jk}) - \mu_{it,jk}) = 0\)。 - 关键点：方差阵 \(V\) 不再是对角阵。因为 \((it, jk)\) 和 \((it', jk')\) 之间可能存在协方差（例如，如果它们共享同一个受试者 \(i\)）。 - 最简例子下的直觉：如果 \(i\) 在 \(t=1\) 时赢了 \(j\)，那么 \(i\) 在 \(t=2\) 时大概率也赢 \(j\)（因为 \(i\) 自身有正相关）。这种相关性必须被建模。本文利用 GEE 的"工作相关阵"思想，假设了某种相关结构（如 exchangeable），通过 Sandwich variance 保证稳健性。

三、这篇论文做了什么¶

三句话： 1. 研究了纵向设计下有序结局的 Win Odds 估计问题。 2. 核心工具是修改 Probabilistic Index Model (PIM) 的估计方程，引入广义估计方程 (GEE) 框架以处理同一受试者不同时间点观测间的相关性。 3. 主要结论是证明了该估计量的一致性，提供了 Sandwich 方差估计公式，并通过模拟与实例验证了方法的有效性，提供了 R 包 lwo。

关键设定与假设： - PIM 模型假设：\(P(Y_{it} > Y_{jk} \mid X_{it}, X_{jk}) = \text{logit}^{-1}((X_{it} - X_{jk})^T \beta)\)。这是一个半参数假设，只规定了比较概率与协变量差的关系，未规定 \(Y\) 的边缘分布。 - 纵向结构：允许每个受试者有不同观测次数 \(n_i\)。 - GEE 假设： - 使用"工作相关矩阵"（Working correlation matrix）来刻画不同时间点 Win 指示变量之间的相关性。 - 假设不同受试者之间独立。 - 相比已有文献的推进：相比标准 PIM（假设样本对独立），本文显式建模了"伪样本对"之间的相关性，这是处理纵向数据的关键。

主要结果： 1. 估计方程：构造了如下形式的估计方程：

\[U(\beta) = \sum_{i=1}^n \sum_{j=1}^n \sum_{t=1}^{n_i} \sum_{k=1}^{n_j} D_{it,jk}^T V_{it,jk}^{-1} (W_{it,jk} - \mu_{it,jk}) = 0\]

其中 \(W_{it,jk} = I(Y_{it} > Y_{jk}) + 0.5 I(Y_{it} = Y_{jk})\) 是 Win 指示变量（含结处理），\(\mu_{it,jk}\) 是模型预测值，\(D\) 是导数项，\(V\) 是工作方差阵。注意：这里求和包含了 \(i=j\) 的情况（受试者内部不同时间点的比较），这是纵向扩展的关键。

渐近性质：在标准正则条件下（独立同分布样本、参数空间紧致等），证明了 \(\hat{\beta}\) 的一致性。渐近正态性：\(\sqrt{n}(\hat{\beta} - \beta_0) \to N(0, \Sigma)\)。方差 \(\Sigma\) 由经典的 Sandwich 估计量给出：\(\Sigma = B^{-1} M B^{-1}\)，其中 \(B\) 是 Hessian 阵（或其期望），\(M\) 是得分函数的外积期望。这保证了即使工作相关阵设定错误，推断依然稳健。
计算实现：作者给出了一个巧妙的实现策略：将数据重组为"对"层面的数据集，然后直接调用 R 包 geepack 中的 geese 函数。这避免了从头编写优化算法，极大降低了使用门槛。

证明路线与技术技巧： - 整体路线：标准的 M-估计 / GEE 证明路线。 1. 写出目标函数（估计方程）。 2. 在真实参数处一阶 Taylor 展开。 3. 利用大数定律（LLN）证明 Hessian 阵收敛于非奇异矩阵。 4. 利用中心极限定理（CLT）证明得分函数收敛于正态分布。 5. 应用 Slutsky 定理得到渐近正态性。

关键跳跃点与技术技巧：
- 数据重组技巧：这是本文最实用的技术贡献。PIM 本质上处理的是"样本对"，样本量从 \(n\) 变为 \(O(n^2)\)。直接计算 \(O(n^2)\) 的方差阵在计算上是不可行的（内存爆炸）。
- 利用 GEE 的结构：作者没有显式计算巨大的 \(O(n^2) \times O(n^2)\) 矩阵，而是利用了 GEE 的块对角结构（受试者间独立）。虽然单个受试者内部涉及 \(O(n_i^2)\) 个"伪对"，但这些伪对只与该受试者有关，因此整个方差阵是块对角的。这允许使用标准 GEE 软件进行计算。
- U-统计量的影子：Win 指示变量 \(W_{it,jk}\) 本质上是 U-统计量的核（kernel）。本文的估计量可以看作是一个广义 U-统计量，但通过 GEE 框架处理了纵向依赖。对于熟悉 U-统计量的研究者，这里有一个有趣的视角：作者实际上是在对 U-统计量的核进行建模，并利用 GEE 解决了核内部的依赖结构。

真实例子与应用： - 数据：Guillain-Barré 综合征试验（SID-GBS trial）。这是一个神经系统疾病试验，结局变量是 GBS 功能量表（有序变量，0-6 分），在多个时间点测量（第 1, 2, 3, 4 周）。 - 应用方式：比较两种免疫球蛋白治疗方案。使用本文提出的纵向 Win Odds 模型，调整了年龄、性别等协变量。 - 结果：估计出的 Log Win Odds 为负值（置信区间不包含 0），表明其中一种治疗方案效果更差。这与原始试验结论一致，但本文方法利用了所有时间点的信息，提供了更稳健的结论。 - 说明什么：展示了方法在真实不平衡纵向数据上的可行性，且结果符合临床预期，验证了方法的实用性。

🔎 结论是否比证明窄：本文的理论部分较为标准，主要依赖 GEE 的经典假设。作者在讨论部分承认，对于小样本情况，Sandwich 方差估计可能有偏，需要 Bootstrap 或小样本校正（如 KC 校正），这一点在模拟中也有体现。结论与证明范围基本一致，没有过度宣称。

四、开放问题（点到为止）¶

高维协变量调整：本文方法依赖 geepack，本质上是固定维度的半参数模型。若协变量维度 \(p\) 随样本量 \(n\) 增长甚至 \(p \gg n\)，如何结合惩罚回归或机器学习方法进行 Win Odds 估计？（扎根点：Introduction 提到的 PIM 协变量调整，以及 Discussion 中对模型设定的讨论）。
缺失数据机制：纵向数据常伴随脱落。本文假设缺失是完全随机的或忽略缺失机制。若存在 Informative Dropout，Win Odds 的识别需要什么假设？（扎根点：Discussion 提到的局限性）。
效率最优性：本文使用 GEE 的工作相关阵，其效率取决于工作相关阵的设定。是否存在一个最优的工作相关阵设定，使得 Win Odds 估计量的渐近方差最小？这与您熟悉的半参数效率理论直接相关。（扎根点：Methodology 部分对 Working Correlation 的选择讨论）。
计算复杂度：虽然利用 geepack 解决了计算问题，但数据重组后的样本量仍为 \(O(n^2)\)。对于超大规模样本（如 \(n > 10^4\)），内存可能成为瓶颈。是否可以利用 U-统计量的结构（如 Hoeffding 分解）或随机采样近似来降低计算复杂度？（扎根点：Computational Method 部分）。

Maintained by 陈星宇 · Homepage · Source on GitHub