Conformal predictive intervals in survival analysis: a resampling approach¶

作者: Jing Qin, Jin Piao, Jing Ning, Yu Shen
来源: Biometrics
主题: 非参数 / 半参数
相关性: 3/10
机构绿灯: University of Southern California（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujaf063

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本问题是：在存在右删失的生存数据中，如何为个体的生存时间构建有限样本下、分布无关的预测区间，使得无论数据生成机制如何、无论所依赖的回归模型是否正确设定，预测区间都能保证名义覆盖率（如 95%）。当前该方向的成熟度处于"从标准无删失设定向复杂删失设定迁移的攻坚期"：标准 conformal prediction 在完整数据下已有成熟理论，但在右删失下因部分个体的真实生存时间永远不可观测，导致 conformal score 的计算与分位数提取产生根本性缺失，现有方法只能处理极特殊的删失机制且只能给出单侧下界，尚未形成一般性框架。

发展脉络（history）： - 奠基工作：Vovk et al. (2005) 建立了完整数据下的 conformal prediction 框架，保证了在 i.i.d. 假设下的有限样本分布无关覆盖率。Shafer & Vovk (2008) 进一步将其与博弈论/概率论联系，奠定了算法基础。 - 主要进展：Lei et al. (2018) 将 conformal prediction 引入统计学主流，提出了 split conformal 与 conditional conformal 方法，解决了高维回归下的计算效率与条件覆盖问题；Romano et al. (2020) 提出了 conformalized quantile regression (CQR)，使得预测区间宽度能自适应于局部变异。 - 当前 frontier：Candès et al. (2021) 首次将 conformal prediction 扩展至右删失生存数据。作者在 intro 中明确指出："Candès et al. extended this method to right-censored survival data, addressing right-censoring complexity by creating a covariate shift setting, extracting a subcohort of subjects with censoring times exceeding a fixed threshold." 但该工作留下了两个核心口子：1) 仅适用于 Type I 删失（所有个体的删失时间均可观测，不论是否发生事件）；2) 只能估计生存时间的下界，无法给出双侧区间。 - 本文的位置：本文针对 Candès et al. 留下的口子，提出在一般右删失设定下（只有 \(T \leq C\) 时才能观测到 \(T\)，反之只能观测到 \(C\)），利用 bootstrap 估计删失分布并进行 conformal score 的加权修正，从而构建单侧与双侧 conformal prediction interval。

子线索聚类：被引文献大致落在三条子线索上： 1. Conformal prediction 基础理论（Vovk 2005, Shafer 2008, Lei 2018, Romano 2020）：这一簇在无删失完整数据下，构建分布无关的预测区间，核心工具是经验分位数与 exchangeability。 2. 删失数据下的 conformal 扩展（Candès 2021）：这一簇首次尝试将 exchangeability 转化为 covariate shift 问题，通过提取子队列（subcohort）绕过删失导致的 score 缺失，但受限于 Type I 删失与单侧区间。 3. 生存分析中的回归与预测方法（Cox 1972, AFT 模型等传统 working model）：这一簇提供条件生存时间的估计基础，本文将其作为"working model"嵌入 conformal 框架，允许其误设但保证边际覆盖。

这个方向在追问的核心问题： 1. 删失机制如何破坏 exchangeability 与 score 的可计算性？ 右删失导致部分个体的真实生存时间 \(T\) 不可观测，其 conformal score 无法计算，直接破坏了标准 conformal prediction 所依赖的 i.i.d. / exchangeability 假设。 2. 在一般右删失下，如何利用可观测数据重构 score 的分布？ Candès et al. 通过提取子队列（\(C > t_0\)）将问题转化为 covariate shift，但这要求 \(C\) 总是可观测（Type I 删失）。一般右删失下，\(C\) 本身也可能缺失，需要新的重构机制。 3. 如何从单侧下界走向双侧预测区间？ 生存时间的上界在删失下更难估计，因为长生存时间个体最容易被删失，上界的经验分位数严重缺失。 4. Working model 误设时，覆盖率能否有保证？ 生存回归模型（如 Cox, AFT）几乎必然有误设风险，conformal 框架能否在误设下仍提供分布无关的覆盖率保证，是该方向走向实用的关键瓶颈。

⚠️ 作者的 framing（这是作者的说法）：作者将缺口 frame 为："Candès et al. 的方法仅适用于 Type I 删失且只能估计下界，而医学应用中更常见的是一般右删失，且需要双侧区间。" 这使得本文的 bootstrap 加权修正成为"显然的下一步"。 被淡化或回避的竞争路线：Intro 中未提及基于多重填补或Kaplan-Meier 分位数直接构造预测区间的方法（如基于生存函数置信带的方法），也未讨论半参数效率界下的区间估计——这些是传统生存分析中构造区间的主流路线，作者直接跳过了它们与 conformal 方法的对比。 明显该被引却未出现的：关于一般右删失下 covariate shift / missing data 的 IPW 理论（如 Robins et al. 的 inverse probability weighting，或 Bang & Robins 2005 的 IPW 估计量），本文的核心加权思路与 IPW 同源，但 intro 未引用因果推断/缺失数据领域的 IPW 基础文献，这可能是一个值得研究者去查的缺口：作者是否在回避将方法与因果推断 IPW 框架做正式对接？

张力：未见明显对立引用。Candès et al. 与本文在 Type I 删失下的结论是一致的（本文方法在 Type I 设定下退化为类似子队列方法），但在一般右删失下，本文的 bootstrap 加权与 Candès 的子队列提取在哲学上不同：前者是"估计缺失的删失分布并加权"，后者是"丢弃部分数据以恢复 exchangeability"。两者在极端删失比例下的表现差异未见讨论。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚

\(T\)：潜在生存时间，连续随机变量，是我们想要预测的 estimand（对个体 \(i\)，记为 \(T_i\)）。
\(C\)：潜在删失时间，连续随机变量，个体 \(i\) 的删失时间记为 \(C_i\)。
\(X\)：协变量向量，维度为 \(d\)，个体 \(i\) 的协变量记为 \(X_i\)，完全可观测。
\(Y\)：可观测时间，定义为 \(Y_i = \min(T_i, C_i)\)。
\(\Delta\)：删失指示变量，定义为 \(\Delta_i = I(T_i \leq C_i)\)。\(\Delta_i = 1\) 表示事件发生（未删失），\(\Delta_i = 0\) 表示删失。
\((X_i, Y_i, \Delta_i)\)：对每个个体 \(i\)，这是研究者实际能观测到的数据。当 \(\Delta_i = 1\) 时，\(T_i = Y_i\) 可观测，\(C_i\) 不可观测；当 \(\Delta_i = 0\) 时，\(C_i = Y_i\) 可观测，\(T_i\) 不可观测。
\(n\)：样本量。
\(t_0\)：预设的固定时间阈值，用于定义预测区间的参考点（如预测"生存时间是否超过 \(t_0\)"）。
\(\hat{S}(t|x)\)：working regression model 估计的条件生存函数，基于 \((X_i, Y_i, \Delta_i)\) 拟合（如 Cox 模型或 AFT 模型），允许误设。
\(\hat{G}(t|x)\)：条件删失生存函数的估计，本文通过 bootstrap 重抽样从可观测数据中估计，用于加权修正。
\(V_i\)：conformal score，定义为 \(V_i = \hat{S}(Y_i | X_i)\)（或其变体），用于衡量个体观测值与预测模型的偏离程度。
\(\alpha\)：名义显著性水平，如 \(\alpha = 0.1\) 对应 90% 覆盖率。
\(\hat{q}_{1-\alpha}\)：conformal score 的经验分位数，用于构造预测区间边界。

模型：数据生成机制为：\((X_i, T_i, C_i)\) i.i.d. 生成，\(T_i\) 与 \(C_i\) 在给定 \(X_i\) 下条件独立（标准右删失假设）。研究者无法观测完整的 \((T_i, C_i)\)，只能观测 \((X_i, Y_i, \Delta_i)\)。目标是基于校准集 \(\mathcal{D}_{cal} = \{(X_i, Y_i, \Delta_i)\}_{i=1}^n\) 与新个体 \(X_{n+1}\)，构造 \(T_{n+1}\) 的预测区间 \(C(X_{n+1})\)，使得 \(P(T_{n+1} \in C(X_{n+1})) \ge 1 - \alpha\)。

可观测数据与不可观测量的区分： - 可观测：\((X_i, Y_i, \Delta_i)\)，以及当 \(\Delta_i = 1\) 时的 \(T_i\)。 - 不可观测：当 \(\Delta_i = 0\) 时的 \(T_i\)（这是 conformal prediction 的核心困难：这些个体的 conformal score \(V_i\) 无法直接计算，因为 \(V_i\) 依赖于 \(T_i\)）。

第二步：讲最小内核

剥掉所有一般性设定、working model 选择与双侧区间构造，本文支撑整篇论文的最小内核是：在一般右删失下，如何利用 bootstrap 估计删失分布，对可观测的 conformal score 进行逆概率加权，从而恢复 score 分布的代表性，并提取分位数构造下界。

最简特例：单侧下界，d=1，固定 t_0：

目标：构造 \(T_{n+1}\) 的下界预测区间 \(C(X_{n+1}) = [\hat{T}_{lower}, \infty)\)，使得 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha\)。
标准 conformal 的困难：如果所有 \(T_i\) 可观测，标准 conformal prediction 的步骤是：
计算 score \(V_i = \hat{S}(T_i | X_i)\)（越小表示生存时间越短，偏离预测越远）。
取校准集 score 的经验分位数 \(\hat{q}_{1-\alpha} = \text{Quantile}_{1-\alpha}(\{V_i\}_{i=1}^n)\)。
对新个体 \(X_{n+1}\)，解 \(\hat{S}(T_{n+1} | X_{n+1}) \ge \hat{q}_{1-\alpha}\) 得到 \(\hat{T}_{lower}\)。
在 exchangeability 下，\(P(V_{n+1} \ge \hat{q}_{1-\alpha}) \ge 1 - \alpha\)，从而保证覆盖率。
但在右删失下，\(\Delta_i = 0\) 的个体的 \(T_i\) 不可观测，\(V_i\) 无法计算，score 集合不完整，exchangeability 被破坏。
本文的最小内核破法：
只保留 \(\Delta_i = 1\) 的个体（事件发生者），这些个体的 \(V_i = \hat{S}(T_i | X_i)\) 可计算。
但 \(\Delta_i = 1\) 的个体不是代表性样本：它们倾向于有较短的 \(T_i\)（因为 \(T_i \leq C_i\) 才会被观测到），即存在协变量偏移 / 选择偏差。
关键加权修正：对每个 \(\Delta_i = 1\) 的个体，赋予权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\)，其中 \(\hat{G}(Y_i | X_i)\) 是在时间 \(Y_i\) 处、给定协变量 \(X_i\) 下未被删失的概率估计。直觉：如果 \(\hat{G}(Y_i | X_i)\) 小（该个体在 \(Y_i\) 处很容易被删失，但居然幸存下来了），则该个体在完整样本中的代表性应被放大——这正是 IPW 的经典逻辑。
\(\hat{G}\) 的估计：在一般右删失下，\(C_i\) 在 \(\Delta_i = 1\) 时不可观测，无法直接拟合条件删失分布。本文用 bootstrap 重抽样：从可观测数据 \((X_i, Y_i, \Delta_i)\) 中重抽样，结合 working model（如 Cox 模型对删失时间拟合），估计 \(\hat{G}(t|x)\)。
加权分位数提取：在校准集的 \(\Delta_i = 1\) 子集上，计算加权经验分位数 \(\hat{q}_{1-\alpha}^{w} = \text{Weighted-Quantile}_{1-\alpha}(\{V_i, w_i\}_{\Delta_i=1})\)。
构造下界：对新个体 \(X_{n+1}\)，解 \(\hat{S}(T_{n+1} | X_{n+1}) \ge \hat{q}_{1-\alpha}^{w}\) 得到 \(\hat{T}_{lower}\)。
为什么成立：在条件独立假设与 working model 误设下，加权修正使得 \(\Delta_i = 1\) 子集的 score 分布恢复为完整样本 score 分布的无偏代表。具体地，对任意可测函数 \(f\)，有 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\)（在 \(T\) 与 \(C\) 给定 \(X\) 条件独立下）。因此，加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 收敛到完整样本分位数 \(q_{1-\alpha}\)，从而保证覆盖率 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha\) 在有限样本下近似成立（精确覆盖率依赖于 bootstrap 估计 \(\hat{G}\) 的质量，但作者证明即使 \(\hat{G}\) 有偏，覆盖率仍因 conformal 的分布无关性质而具有稳健性）。

这个最小内核揭示了本文的本质：将右删失下的 conformal prediction 转化为一个 IPW 加权的分位数估计问题，用 bootstrap 解决删失分布不可观测的估计困难。

三、这篇论文做了什么¶

三句话： ① 研究了在一般右删失生存数据下（只有 \(\Delta_i = 1\) 时 \(T_i\) 可观测），如何构建个体生存时间的分布无关 conformal 预测区间（单侧下界与双侧区间）。 ② 核心工具是 bootstrap 重抽样估计条件删失分布 \(\hat{G}(t|x)\)，并对可观测的 conformal score 进行逆概率加权（IPW），以修正删失导致的选择偏差。 ③ 主要结论是：在 working regression model（如 Cox, AFT）误设下，所提方法仍能保证单侧下界的平均覆盖率接近名义水平，双侧区间在中等删失比例下覆盖率合理，且方法可扩展至竞争风险与当前状态数据等医学应用场景。

关键设定与假设：

在第二节最小记号的基础上补全完整设定：

假设 1：条件独立：\(T\) 与 \(C\) 在给定 \(X\) 下条件独立，即 \(T \perp C | X\)。这是标准右删失生存分析的核心识别假设，也是 IPW 加权修正成立的基础。若此假设破坏，\(\hat{G}\) 的估计与加权修正均失效，覆盖率无保证。
假设 2：连续分布：\(T\) 与 \(C\) 的分布连续，无重合点，保证分位数的唯一性。
假设 3：Working model 的嵌入：本文不要求 \(\hat{S}(t|x)\) 或 \(\hat{G}(t|x)\) 的底层模型正确设定，只要求它们提供合理的排序与拟合。Cox 模型、AFT 模型、加速失效时间模型等均可作为 working model。相比已有文献（如 Lei 2018 要求模型用于条件覆盖，Candès 2021 要求 Type I 删失下 \(C\) 完全可观测），本文放宽了对删失机制可观测性的要求，但保留了条件独立假设。
定义：Conformal score 的变体：
单侧下界 score：\(V_i = \hat{S}(Y_i | X_i)\)（当 \(\Delta_i = 1\) 时可计算）。
双侧区间 score：本文引入了新的 score 定义以同时捕捉上下偏离，如 \(V_i = |\hat{S}(Y_i | X_i) - 0.5|\) 或基于残差的变体，具体形式依赖于 working model 的选择。

主要结果：

定理：单侧下界的覆盖率保证（对应 Theorem 1 / Proposition 1 类结果）：
陈述：在条件独立假设下，使用 bootstrap 估计的 \(\hat{G}\) 进行 IPW 加权，构造的下界预测区间 \([\hat{T}_{lower}, \infty)\) 满足 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha - \epsilon_n\)，其中 \(\epsilon_n\) 是由 \(\hat{G}\) 估计误差导致的有限样本偏差项，随 \(n \to \infty\) 衰减至 0。
直觉：IPW 加权使得 \(\Delta_i = 1\) 子集的 score 分布成为完整样本 score 分布的无偏代表，因此加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 在大样本下收敛到真实分位数 \(q_{1-\alpha}\)，覆盖率恢复。\(\epsilon_n\) 反映了 bootstrap 估计 \(\hat{G}\) 的有限样本误差。
必要条件：条件独立、\(\hat{G}\) 的估计一致性（bootstrap 在大样本下收敛到真实 \(G\)）、working model 提供连续的 \(\hat{S}\)。
解决的技术难点：在一般右删失下，\(\Delta_i = 0\) 的个体的 \(C_i\) 可观测但 \(T_i\) 不可观测，无法直接拟合 \(\hat{G}\)（因为 \(\Delta_i = 1\) 时 \(C_i\) 不可观测）。本文通过 bootstrap 重抽样，利用 \(\Delta_i = 0\) 子集的 \((X_i, C_i)\) 与 working model，外推估计 \(\Delta_i = 1\) 个体处的 \(\hat{G}(Y_i | X_i)\)。
定理：双侧区间的覆盖率保证（对应 Theorem 2 类结果）：
陈述：双侧预测区间 \([\hat{T}_{lower}, \hat{T}_{upper}]\) 的覆盖率 \(P(T_{n+1} \in [\hat{T}_{lower}, \hat{T}_{upper}]) \ge 1 - \alpha - \epsilon_n^{2-sided}\)，其中 \(\epsilon_n^{2-sided}\) 通常大于单侧的 \(\epsilon_n\)，因为上界估计需要更极端的分位数，受删失影响更严重。
直觉：双侧区间需要同时估计 score 的上下分位数。上界分位数对应于长生存时间个体，这些个体最容易被删失（\(\Delta_i = 0\)），IPW 加权虽能修正代表性，但极端分位数处的有效样本量更小，估计方差更大。
必要条件：同单侧，但要求删失比例不能过高（否则上界分位数的加权估计不稳定）。
模拟结果的核心量化结论：
在中等删失比例（30%-50%）下，单侧下界的平均覆盖率接近名义水平（如 90% 覆盖率在 88%-92% 之间），无论 working model 是否正确设定。
双侧区间的覆盖率在中等删失下合理（如 90% 覆盖率在 85%-90% 之间），但在高删失比例（>60%）下，上界覆盖率偏低，区间过宽。
与 Candès et al. 的子队列方法相比，本文在一般右删失下（非 Type I）的覆盖率更优，但在 Type I 删失下两者表现相近。

证明路线与技术技巧：

整体路线：
定义 conformal score 与加权方案：基于 working model 计算 \(\hat{S}\)，定义 score \(V_i\)，对 \(\Delta_i = 1\) 的个体赋予 IPW 权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\)。
证明 IPW 加权恢复 score 分布的代表性：利用条件独立假设，证明 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\)，从而加权经验分布收敛到完整样本分布。
Bootstrap 估计 \(\hat{G}\) 的一致性：证明在一般右删失下，通过 bootstrap 重抽样与 working model 拟合，\(\hat{G}\) 在大样本下一致估计真实 \(G\)，且有限样本误差可控。
加权分位数的覆盖率保证：结合 IPW 代表性恢复与 \(\hat{G}\) 的一致性，证明加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 满足覆盖率 \(1 - \alpha - \epsilon_n\)。
双侧区间的扩展：将单侧逻辑对称地扩展至上界分位数，但需额外处理极端分位数处的方差膨胀。
关键跳跃点：
从 \(\Delta_i = 0\) 时的 \(C_i\) 可观测性到 \(\hat{G}(Y_i | X_i)\) 的估计：这是最吃功夫的步骤。在一般右删失下，\(\Delta_i = 1\) 时 \(C_i\) 不可观测，无法直接在 \(Y_i = T_i\) 处估计 \(G(T_i | X_i)\)。本文的跳跃在于：利用 \(\Delta_i = 0\) 子集拟合 working model（如 Cox 模型对 \(C\) 的分布），然后外推至 \(\Delta_i = 1\) 个体处估计 \(\hat{G}(Y_i | X_i)\)。外推的合理性依赖于 working model 的平滑性与条件独立假设。
IPW 加权分位数的有限样本覆盖率：标准 conformal prediction 的覆盖率证明依赖 exchangeability 与精确分位数，但 IPW 加权破坏了 exchangeability（权重非随机但依赖于估计量 \(\hat{G}\)）。本文需证明：即使 \(\hat{G}\) 有估计误差，加权分位数的覆盖率仍仅偏差 \(\epsilon_n\)，且 \(\epsilon_n\) 衰减至 0。这需要将 \(\hat{G}\) 的估计误差与分位数偏差的传导关系严格量化。
技术技巧点名：
Bootstrap 重抽样：用于在一般右删失下估计条件删失分布 \(\hat{G}(t|x)\)，解决 \(\Delta_i = 1\) 时 \(C_i\) 不可观测的估计困难。起作用在于：通过重抽样生成伪完整数据集，拟合 working model 后外推估计。
Inverse Probability Weighting (IPW)：用于修正 \(\Delta_i = 1\) 子集的选择偏差，恢复 score 分布的代表性。起作用在于：利用 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\) 的无偏性，将加权经验分布作为完整样本分布的替代。
Covariate shift 修正：Candès et al. 将删失问题 frame 为 covariate shift（子队列的 \(X\) 分布与完整样本不同），本文的 IPW 加权本质上也是 covariate shift 修正，但实现方式不同（加权而非子队列提取）。
Working model 的鲁棒嵌入：允许 \(\hat{S}\) 与 \(\hat{G}\) 的底层模型误设，但保证覆盖率。起作用在于：conformal prediction 的覆盖率保证只依赖 score 的排序与分位数，不依赖 score 的绝对值，因此误设模型仍能提供合理的排序。

真实例子与应用：

用的什么数据 / 场景：乳腺癌患者的生存预测数据，包含肿瘤特征（如肿瘤大小、分级）与治疗方案（如化疗、放疗）作为协变量 \(X\)，生存时间 \(T\) 与删失时间 \(C\) 构成右删失生存数据。
怎么把本文方法用上去：
拟合 working model（如 Cox 模型或 AFT 模型）估计 \(\hat{S}(t|x)\) 与 \(\hat{G}(t|x)\)。
在校准集上计算 conformal score \(V_i = \hat{S}(Y_i | X_i)\)（对 \(\Delta_i = 1\) 个体）。
用 bootstrap 重抽样估计 \(\hat{G}\)，计算 IPW 权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\)。
提取加权分位数 \(\hat{q}_{1-\alpha}^{w}\)，构造新患者的单侧与双侧预测区间。
得到什么结果：对乳腺癌患者，基于肿瘤特征与治疗方案，构造了 90% 单侧下界预测区间（如"该患者至少生存 5 年的概率为 90%"）与 90% 双侧预测区间（如"该患者生存时间在 3-10 年之间的概率为 90%"）。双侧区间宽度在中等删失下合理，但在高删失亚组（如老年患者删失比例高）中上界偏宽。
这个例子想说明什么：验证本文方法在真实医学数据下的实用性，展示 working model（Cox 模型）即使可能误设，仍能提供合理的覆盖率；同时展示双侧区间在临床决策中的价值（不仅告诉患者"至少活多久"，还告诉"最可能活多久"）。

🔎 结论是否比证明窄：

本文在定理中严格证明了覆盖率 \(1 - \alpha - \epsilon_n\)，其中 \(\epsilon_n\) 依赖于 \(\hat{G}\) 的估计误差。但在 abstract 与 intro 中，作者泛泛 claim "excellent average coverage" 与 "good coverage"，未明确量化 \(\epsilon_n\) 的上界或衰减速率。研究者需注意："分布无关"的覆盖率保证在本文中并非精确 \(1-\alpha\)，而是 \(1-\alpha-\epsilon_n\)，\(\epsilon_n\) 的具体大小在定理证明中可能未给出显式界（只证明了大样本下 \(\epsilon_n \to 0\)），这是一个结论比证明窄的地方——作者在宣传时淡化了 \(\epsilon_n\) 的存在。
另一个泛泛 claim：方法可扩展至"竞争风险与当前状态数据"（intro 提到 "several directions in medical applications"），但正文可能只在标准右删失下严格证明，竞争风险的扩展可能只是模拟验证或启发式讨论，未给出严格覆盖率定理。研究者需核查正文是否真的有竞争风险下的定理证明。

四、开放问题（点到为止，扎根具体语句）¶

\(\epsilon_n\) 的显式界与衰减速率：定理证明了覆盖率 \(1 - \alpha - \epsilon_n\)，但 \(\epsilon_n\) 的显式上界（如 \(O(n^{-1/2})\) 或依赖于删失比例的常数）可能未给出。要证什么：给出 \(\epsilon_n\) 的非渐近界，明确在多大样本量与删失比例下 \(\epsilon_n\) 可忽略。扎根点：定理陈述中 \(\epsilon_n\) 的定义与 abstract 中 "excellent average coverage" 的泛泛 claim 之间的张力。
条件独立假设的破坏与敏感性分析：本文核心依赖 \(T \perp C | X\)，若此假设破坏（如删失与生存时间存在未观测的依赖），IPW 加权失效，覆盖率无保证。要估什么：在条件独立假设有微小破坏时，覆盖率的衰减速率（类似因果推断中的 sensitivity analysis）。扎根点：intro 中未提及条件独立假设的可检验性或破坏后果，且未引用因果推断 IPW 的 sensitivity analysis 文献。
高删失比例下双侧区间的上界估计稳定性：模拟显示高删失比例（>60%）下上界覆盖率偏低，区间过宽。要证什么：在删失比例趋于 1 时，双侧区间的 minimax 覆盖率下界或上界分位数的估计方差界。扎根点：模拟结果的 limitation 讨论中，高删失下双侧区间表现退化，但正文可能未给出理论解释。
与因果推断 IPW 框架的正式对接：本文的 IPW 加权与因果推断中处理 missing data / selection bias 的 IPW 同源，但 intro 未引用 Robins et al. 的 IPW 基础文献。要查什么：是否存在将 conformal prediction 与因果推断 IPW / doubly robust 估计结合的框架，使得 \(\hat{G}\) 的估计误差可通过 doubly robust 修正进一步降低 \(\epsilon_n\)。扎根点：intro 缺失的 IPW 文献引用，以及本文加权方案与 doubly robust 估计的逻辑相似性。

（要确认某条是不是真 gap，去读同子领域近期约 5 篇的 intro——都指向高删失下双侧区间的稳定性 = 共识（真 gap），互相打架 = 机会。）

Maintained by 陈星宇 · Homepage · Source on GitHub

Conformal predictive intervals in survival analysis: a resampling approach¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论