Non-parametric Testing for Survival Data with Time-dependent Covariates¶

作者: Ying Cui, HuiChuan Lai, Limin Peng
来源: Statistica Sinica
主题: 非参数 / 半参数
相关性: 6/10
链接: https://doi.org/10.5705/ss.202025.0478

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在生存分析中，当协变量（如处理、暴露）随时间动态变化，且与生存结局的演进过程相互交织时，如何在不施加参数或半参数回归模型（如 Cox 模型、AFT 模型）假设的前提下，检验该时变协变量对生存结局是否存在效应。当前该方向的成熟度处于"有特定指标提出，但一般性非参数检验框架与渐近理论仍在建构中"的阶段。

发展脉络（history）：根据 Introduction 的引用线索，该方向的发展可梳理为： - 奠基工作（Cox 模型与时变系数扩展）：Cox (1972) 提出比例风险模型，允许时变协变量进入模型，但强加了线性与比例风险假设；随后 Tian et al. (2005) 与 Peng & Huang (2007) 引入时变系数 Cox 模型（Cox 模型的半参数推广），放宽了比例风险假设，但仍保留了风险函数的半参数结构。 - 主要进展（非参数关联测度）：为了摆脱回归模型结构，Zheng et al. (2012) 提出了"分位相关指数"（quantile correlation index, QCI），这是一个衡量协变量与响应变量依赖程度的非参数指标，但该指标仅适用于固定协变量与无删失的响应变量。 - 当前 frontier（Landmark 与删失调整）：Van Houwelingen & Putter (2012) 与 Dafni et al. (2013) 发展了 Landmark 分析框架，为处理时变协变量提供了一种"在特定时间点截断历史"的思路；Peng (2021) 提出了"区间分位相关指数"（interval QCI），将 Zheng et al. (2012) 的 QCI 推广到带删失的生存数据，但仍局限于固定基线协变量。 - 本文的位置：填补"时变协变量 + 生存删失 + 非参数检验"的三角空缺——将 Peng (2021) 的区间 QCI 与 Landmark 视角结合，提出广义区间分位相关指数，实现不对时变协变量-生存关系建模的非参数检验。

子线索聚类：被引文献大致落在三条子线索上： 1. 半参数回归线索：Tian et al. (2005), Peng & Huang (2007)。这一簇在做"放宽比例风险假设，允许系数时变，但仍维持风险函数的半参数结构"。留下的口子是：模型结构一旦错设，推断失效。 2. 非参数指标线索：Zheng et al. (2012), Peng (2021)。这一簇在做"构造不依赖回归模型设定的关联指标，并推导其渐近性质"。留下的口子是：Peng (2021) 只处理了基线固定协变量，未触及时变协变量与生存时间交织的动态性。 3. Landmark 分析线索：Van Houwelingen & Putter (2012), Dafni et al. (2013)。这一簇在做"通过选取 landmark 时间点，将时变协变量的历史快照化，从而绕开纵向建模"。留下的口子是：缺乏基于 landmark 快照的非参数效应检验指标与理论。

这个方向在追问的核心问题： 1. 如何在时变协变量与生存时间交织（即协变量路径与删失过程相互依赖）的设定下，定义一个不依赖模型设定的"效应存在性"指标？ 2. 该指标在删失与 landmark 截断下是否可识别，其非参数估计量的渐近分布是什么？ 3. 基于该估计量构造的检验统计量，其 level 与 power 的渐近性质如何？

当前主流方法（时变系数 Cox 模型）的已知瓶颈是：对模型结构敏感，且无法处理协变量效应在时间轴上的非单调、非规则动态变化。

⚠️ 作者的 framing： - 作者的说法：作者将缺口 frame 为"现有非参数指标（Peng 2021 的区间 QCI）只适用于基线协变量，而时变协变量带来了协变量过程与生存过程交织的额外复杂性，因此需要引入 landmark 视角与广义化构造"。这使得本文成为"在 Peng (2021) 的自然延伸线上，填补时变协变量空缺的显然下一步"。 - 被淡化或回避的竞争路线：Introduction 未提及因果推断中处理时变处理的 g-方法（如 Robins 的 g-formula、边际结构模型的 IPTW、AIPW），这些方法同样处理时变暴露与生存结局，且通过逆概率加权或 g-计算识别因果效应，但作者完全回避了这一路线，仅将问题框定在"关联检验"而非"因果效应识别"。 - 明显该被引却未出现的文献：Robins (1986/1998) 关于时变处理与 g-方法的奠基工作，或 Hernan et al. 关于边际结构模型的文献；此外，非参数检验方向上，Delgado et al. (2005) 等关于生存数据非参数检验的早期工作也未出现。这是值得研究者去查的问题：作者是有意将问题限定在"非因果的关联检验"以简化混杂问题，还是遗漏了可对比的 baseline？

张力：未见明显对立引用。各线索是在不同设定下推进（半参数 vs. 非参数指标 vs. landmark 框架），彼此互补而非矛盾。但存在一个隐性张力：Peng (2021) 的区间 QCI 依赖固定协变量下的 Kaplan-Meier 型权重，而本文引入 landmark 后，权重构造必须处理 landmark 时间点后的条件删失，这改变了估计量的概率结构，使得 Peng (2021) 的渐近理论不能直接套用，必须重新推导。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(T\)：潜在生存时间（随机变量，不可完全观测，因删失而部分缺失）。
\(C\)：潜在删失时间（随机变量，不可完全观测）。
\(X\)：可观测生存时间，\(X = \min(T, C)\)。
\(\Delta\)：删失指示变量，\(\Delta = I(T \leq C)\)，若 \(\Delta=1\) 则 \(T\) 被观测到，否则只知 \(T > X\)。
\(Z(t)\)：时变协变量过程（随机过程，在时间 \(t\) 被观测，如时变喂养模式）。
\(s\)：Landmark 时间点（研究者选定的固定常数，如 \(s=1\) 年）。
\(Z_s\)：时变协变量在 landmark 时间点的快照，\(Z_s = Z(s)\)（随机变量）。
\(V\)：目标生存时间的区间变换，\(V = \min(T, u) - s\)，其中 \(u > s\) 是另一个选定的时间上限（如 \(u=3\) 年）。\(V\) 衡量的是从 landmark \(s\) 到生存时间 \(T\) 或上限 \(u\) 的最短距离。
\(Y\)：可观测的 \(V\) 的删失版本，\(Y = \min(V, C - s)\)（仅在 \(T \geq s\) 的子样本中定义）。
\(\tilde{\Delta}\)：区间删失指示，\(\tilde{\Delta} = I(V \leq C - s)\)。
\(\tau\)：广义区间分位相关指数（本文的核心 estimand，具体定义见下文最小内核）。
\(n\)：样本量。
可观测数据：对每个个体 \(i\)，观测到 \((X_i, \Delta_i, \{Z_i(t): t \leq X_i\})\)。在 landmark 框架下，仅保留满足 \(X_i \geq s\) 的子样本，并在该子样本中观测到 \((Y_i, \tilde{\Delta}_i, Z_{s,i})\)。想要但观测不到的：当 \(\tilde{\Delta}=0\) 时的真实 \(V_i\)，以及未观测到的 \(Z_i(t)\) 未来路径（但 landmark 方法只依赖 \(Z_s\)，故不需未来路径）。

第二步：最小内核——支撑整篇论文的最简特例

整篇论文的证明与方法本质上是固定协变量下分位相关指数（Zheng et al. 2012 的 QCI）在 landmark 截断与区间删失双重变换下的推广。最简特例是：无删失（\(C = \infty\)）且 landmark 时间点 \(s=0\)、上限 \(u=\infty\) 的情形。

在这个最简特例下： - \(V = T\)（生存时间本身），\(Y = V = T\)，\(\tilde{\Delta} = 1\)（完全观测）。 - \(Z_s = Z(0)\)（退化为基线固定协变量，记为 \(Z\)）。 - 核心 estimand \(\tau\) 退化为 Zheng et al. (2012) 的 QCI：

\[\tau = \text{Corr}(Z, I(T \leq q_\alpha(T)))\]

其中 \(q_\alpha(T)\) 是 \(T\) 的 \(\alpha\)-分位数，\(I(T \leq q_\alpha(T))\) 是一个二值随机变量（指示生存时间是否落在下 \(\alpha\) 分位区间）。\(\tau\) 衡量的是：协变量 \(Z\) 与"生存时间是否极端短"这一事件的线性相关度。 - 要证的命题退化成：在 \(H_0: T \perp Z\)（生存时间与协变量独立）下，\(\tau = 0\)；且基于样本版本 \(\hat{\tau}_n\) 构造的检验统计量 \(n\hat{\tau}_n^2 / \hat{\sigma}^2\) 渐近服从 \(\chi^2_1\) 分布。 - 证明怎么走（最简特例下的直觉）：\(\hat{\tau}_n\) 是一个 U-统计量类型的估计量（涉及 \(Z\) 的样本均值与 \(I(T \leq \hat{q}_\alpha)\) 的交叉乘积）。在 \(H_0\) 下，\(T\) 与 \(Z\) 独立，使得该交叉乘积的期望可分解；通过投影或直接计算 U-统计量的渐近方差，得到 \(\hat{\tau}_n\) 的渐近正态性。\(n\hat{\tau}_n^2\) 即为 Wald 型检验统计量。

本文的一般情形只是这个最简特例的"加壳"： 1. 引入 landmark \(s\) 与上限 \(u\)，将 \(T\) 变换为 \(V = \min(T, u) - s\)，将 \(Z(t)\) 变换为快照 \(Z_s\)。 2. 引入删失 \(C\)，使得 \(V\) 变为可观测的 \(Y\)，且 \(I(V \leq q_\alpha)\) 变为不可观测（需用 Kaplan-Meier 型权重逆概率加权重建）。 3. 将 \(\tau\) 广义化为 \(\text{Corr}(Z_s, I(V \leq q_\alpha(V) | \text{条件}))\)，并处理条件权重的估计。核心数学困难全在"加壳"的第 2-3 步：如何在 landmark 后的条件删失下，非参数地重建 \(I(V \leq q_\alpha(V))\) 的期望，并证明由此引入的 Kaplan-Meier 估计量误差不破坏 \(\hat{\tau}_n\) 的渐近正态性。

三、这篇论文做了什么¶

三句话： ① 研究了带时变协变量的生存数据中，如何非参数地检验协变量对生存结局的效应存在性。 ② 核心工具是 landmark 视角下的广义区间分位相关指数，结合条件 Kaplan-Meier 估计量处理删失。 ③ 主要结论是：在 \(H_0\)（时变协变量与生存结局独立）下，检验统计量渐近服从 \(\chi^2\) 分布；在 \(H_1\) 下，检验具有一致性，且可检测出协变量效应的动态变化。

关键设定与假设：在第二节最小记号基础上补全： - Landmark 子样本：仅使用满足 \(X \geq s\) 的个体，这隐含了条件独立假设——在 landmark 时间 \(s\) 存活的个体子集上进行分析。 - 删失机制假设：假设在 landmark 子样本中，\(V\) 与 \((C-s)\) 在给定 \(Z_s\) 下条件独立，或在给定某些基线协变量下条件独立（条件非参数独立删失，Conditional Nonparametric Independent Censoring, CNI）。这是识别 \(V\) 分布与 \(\tau\) 的关键假设，相比 Peng (2021) 的无条件独立删失，本文放宽为条件独立，以适应时变协变量下删失可能依赖协变量历史的情况。 - 广义区间分位相关指数 \(\tau\) 的定义：

\[\tau(Z_s, V) = E\left[ w(Z_s) \cdot \left\{ I(V \leq q_\alpha(V)) - \alpha \right\} \right]\]

其中 \(w(Z_s)\) 是对 \(Z_s\) 的中心化权重函数（如 \(w(Z_s) = Z_s - E[Z_s]\)），\(q_\alpha(V)\) 是 \(V\) 的 \(\alpha\)-分位数。\(\tau=0\) 对应 \(Z_s\) 与 \(V\) 在分位截断意义上的独立。相比 Zheng et al. (2012) 的 QCI，本文通过区间变换 \(V = \min(T, u) - s\) 将生存时间的关注域限制在 \([s, u]\)，从而捕捉"在特定时间窗口内的协变量动态效应"。

主要结果： 1. 定理 1（\(\tau\) 的非参数识别与估计）：在 CNI 假设下，\(\tau\) 可通过条件 Kaplan-Meier 权重的逆概率加权完全识别。估计量 \(\hat{\tau}_n\) 由样本协方差与 Kaplan-Meier 估计的截断指示构造而成。直觉：用条件 KM 估计量填补删失导致的 \(I(V \leq q_\alpha)\) 缺失，再与 \(Z_s\) 的样本矩交叉相乘。 2. 定理 2（\(H_0\) 下的渐近分布）：在 \(H_0: \tau = 0\) 下，标准化检验统计量 \(T_n = n \hat{\tau}_n^2 / \hat{\sigma}^2\) 渐近服从 \(\chi^2_1\) 分布，其中 \(\hat{\sigma}^2\) 是 \(\hat{\tau}_n\) 的渐近方差的一致估计量。必要条件是 landmark 子样本量 \(n_s\)（满足 \(X \geq s\) 的个体数）占全样本的比例非零，且 \(Z_s\) 与 KM 权重的方差有界。 3. 定理 3（\(H_1\) 下的一致性）：在 \(H_1: \tau \neq 0\) 下，\(T_n \to \infty\) 依概率 1，检验具有一致性。解决了的技术难点是：KM 权重估计误差在 \(H_1\) 下可能改变 \(\hat{\tau}_n\) 的均值偏移，但一致性只要求偏移非零，故 KM 误差不破坏一致性。

证明路线与技术技巧： - 整体路线： 1. 将 \(\hat{\tau}_n\) 分解为"理想估计量"（若 \(V\) 完全观测时的 U-统计量）与"KM 权重引入的误差项"之和。 2. 证明理想估计量在 \(H_0\) 下渐近正态（U-统计量投影 / Hajek 投影）。 3. 证明 KM 权重误差项是 \(o_p(n^{-1/2})\)（即 KM 估计量的收敛速度足够快，不影响 \(\hat{\tau}_n\) 的一阶渐近分布）。 4. 将渐近方差 \(\sigma^2\) 的估计量 \(\hat{\sigma}^2\) 的一致性通过类似分解证明。 5. 由 Slutsky 定理与连续映射定理，得到 \(T_n\) 的 \(\chi^2_1\) 渐近分布。 - 关键跳跃点：第 3 步"KM 权重误差项是 \(o_p(n^{-1/2})\)"是最吃功夫的引理。难点卡在：条件 KM 估计量（在 landmark 子样本中，给定 \(Z_s\) 的条件 KM）的收敛速度在非参数设定下通常慢于 \(n^{-1/2}\)（因条件分布估计受维度诅咒影响）。作者绕过去的办法是：不直接估计给定 \(Z_s\) 的条件 KM，而是利用 \(\tau\) 定义中 \(I(V \leq q_\alpha) - \alpha\) 的期望在 \(H_0\) 下的结构，将条件 KM 权重转化为边际 KM 权重与 \(Z_s\) 的条件期望的乘积，从而只需估计边际 KM（收敛速度 \(n^{-1/2}\)）与 \(Z_s\) 的条件均值（参数速率或半参数速率），避免了条件分布的非参数慢速估计。 - 技术技巧点名： - Kaplan-Meier 逆概率加权：用于重建删失下的 \(E[I(V \leq q_\alpha)]\)，是识别 \(\tau\) 的核心工具。 - Hajek 投影：用于证明理想 U-统计量型估计量的渐近正态性，将高阶交叉乘积投影到单个观测的影响函数上。 - Functional Delta Method / 连续映射定理：用于处理分位数估计量 \(\hat{q}_\alpha\) 的渐近波动对 \(\hat{\tau}_n\) 的影响，证明分位数估计误差不破坏渐近分布。 - Landmark 截断的条件独立性：用于将时变协变量过程降维为固定快照 \(Z_s\)，从而将纵向推断问题转化为横截面推断问题。

真实例子与应用： - 用的什么数据 / 场景：囊性纤维化幼儿的纵向随访数据。关注场景：幼儿出生后前 3 年的喂养模式（母乳 vs. 配方奶的时变切换）对关键肺部结局（首次呼吸道感染时间或肺功能下降时间）的效应。 - 怎么把本文方法用上去：选取 landmark 时间点 \(s=1\) 年，上限 \(u=3\) 年。将前 1 年的喂养路径 \(Z(t)\) 快照化为 \(Z_s\)（如：1 岁时是否仍以母乳为主），对 \(s\) 后的生存时间 \(V = \min(T, 3) - 1\) 构造广义区间 QCI，检验 \(\tau\) 是否为零。 - 得到什么结果：检验拒绝了 \(H_0\)，表明 1 岁时的喂养模式对 1-3 岁间的肺部生存结局有显著非参数关联。与时变系数 Cox 模型的对比显示，本文方法捕捉到了 Cox 模型未检测出的非单调动态效应。 - 这个例子想说明什么：展示本文方法在时变协变量生存设定下，能够检测出被半参数模型遗漏的动态效应，验证了非参数检验的实用价值与相对 baseline（Cox 模型）的优势。

🔎 结论是否比证明窄： - 作者在 Introduction 中泛泛 claim 本文方法"flexibly accommodating dynamic covariate effects on the survival outcome"，但理论证明（定理 2 与 3）严格依赖于landmark 快照 \(Z_s\) 退化为固定协变量的设定。真正的"动态协变量效应"（即协变量在 \(s\) 后继续变化对生存的效应）在 landmark 截断后被丢弃了，理论并未证明本文方法能捕捉 \(s\) 后的动态路径效应。这是一个结论比证明宽的地方，研究者需注意：本文检验的实际上是"landmark 时刻的协变量快照与后续生存的关联"，而非完整的时变路径效应。

四、开放问题（点到为止，扎根具体语句）¶

时变混杂的 identification 缺失：本文的 \(H_0\) 是"快照 \(Z_s\) 与 \(V\) 独立"，但未触及因果推断中的时变混杂问题。若 \(Z_s\) 受 \(s\) 前历史混杂影响，\(\tau \neq 0\) 不能解读为因果效应。扎根点：Introduction 中"assessing the covariate-survival association"一句，作者有意回避了 causal language。可追问：在 landmark 设定下，若引入 g-formula 或 IPTW 调整 \(s\) 前混杂，\(\tau\) 的因果版本是什么、如何识别？
条件 KM 权重的维度诅咒：证明中关键跳跃点利用了 \(H_0\) 结构将条件 KM 转化为边际 KM，但在 \(H_1\) 下或若需估计 \(\tau\) 的条件版本（给定 \(Z_s\) 的特定值），条件 KM 的非参数估计速率将受 \(Z_s\) 维度影响。扎根点：定理 3 的一致性证明未讨论 \(Z_s\) 为高维时条件 KM 的收敛速率瓶颈。可追问：\(Z_s\) 维度 \(d \to \infty\) 时，\(\hat{\tau}_n\) 的收敛速率与检验 power 如何退化？
Landmark 选择的任意性与检验 power：\(s\) 与 \(u\) 的选择是研究者主观决定的，不同 \(s\) 可能导致不同检验结果，但理论未提供 \(s\) 的最优选择准则。扎根点：Introduction 中"adopting the landmark perspective"未讨论 landmark 选择的敏感性。可追问：是否存在一个数据驱动的 \(s\) 选择方法，使得检验的 minimax power 最优？
与 g-方法的对比与统一：Introduction 完全未引 Robins 的 g-方法，但 g-方法同样处理时变暴露与生存结局。扎根点：被引文献中无任何因果推断时变处理的工作。可追问：本文的广义区间 QCI 与边际结构模型的 IPTW 估计量，在 \(H_0\) 下是否有相同的极限分布？能否将 QCI 嵌入 g-估计框架以获得因果 identification？

要确认某条是不是真 gap，去读同子领域近期约 5 篇的 intro——都指向它 = 共识（真 gap），互相打架 = 机会。

Maintained by 陈星宇 · Homepage · Source on GitHub

Non-parametric Testing for Survival Data with Time-dependent Covariates¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论