Conformal predictive intervals in survival analysis: a resampling approach¶
作者: Jing Qin, Jin Piao, Jing Ning, Yu Shen
来源: Biometrics
主题: 非参数 / 半参数
相关性: 3/10
机构绿灯: University of Southern California(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujaf063
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本问题是:在存在右删失的生存数据中,如何为个体的生存时间构建有限样本下、分布无关的预测区间,使得无论数据生成机制如何、无论所依赖的回归模型是否正确设定,预测区间都能保证名义覆盖率(如 95%)。当前该方向的成熟度处于"从标准无删失设定向复杂删失设定迁移的攻坚期":标准 conformal prediction 在完整数据下已有成熟理论,但在右删失下因部分个体的真实生存时间永远不可观测,导致 conformal score 的计算与分位数提取产生根本性缺失,现有方法只能处理极特殊的删失机制且只能给出单侧下界,尚未形成一般性框架。
发展脉络(history): - 奠基工作:Vovk et al. (2005) 建立了完整数据下的 conformal prediction 框架,保证了在 i.i.d. 假设下的有限样本分布无关覆盖率。Shafer & Vovk (2008) 进一步将其与博弈论/概率论联系,奠定了算法基础。 - 主要进展:Lei et al. (2018) 将 conformal prediction 引入统计学主流,提出了 split conformal 与 conditional conformal 方法,解决了高维回归下的计算效率与条件覆盖问题;Romano et al. (2020) 提出了 conformalized quantile regression (CQR),使得预测区间宽度能自适应于局部变异。 - 当前 frontier:Candès et al. (2021) 首次将 conformal prediction 扩展至右删失生存数据。作者在 intro 中明确指出:"Candès et al. extended this method to right-censored survival data, addressing right-censoring complexity by creating a covariate shift setting, extracting a subcohort of subjects with censoring times exceeding a fixed threshold." 但该工作留下了两个核心口子:1) 仅适用于 Type I 删失(所有个体的删失时间均可观测,不论是否发生事件);2) 只能估计生存时间的下界,无法给出双侧区间。 - 本文的位置:本文针对 Candès et al. 留下的口子,提出在一般右删失设定下(只有 \(T \leq C\) 时才能观测到 \(T\),反之只能观测到 \(C\)),利用 bootstrap 估计删失分布并进行 conformal score 的加权修正,从而构建单侧与双侧 conformal prediction interval。
子线索聚类: 被引文献大致落在三条子线索上: 1. Conformal prediction 基础理论(Vovk 2005, Shafer 2008, Lei 2018, Romano 2020):这一簇在无删失完整数据下,构建分布无关的预测区间,核心工具是经验分位数与 exchangeability。 2. 删失数据下的 conformal 扩展(Candès 2021):这一簇首次尝试将 exchangeability 转化为 covariate shift 问题,通过提取子队列(subcohort)绕过删失导致的 score 缺失,但受限于 Type I 删失与单侧区间。 3. 生存分析中的回归与预测方法(Cox 1972, AFT 模型等传统 working model):这一簇提供条件生存时间的估计基础,本文将其作为"working model"嵌入 conformal 框架,允许其误设但保证边际覆盖。
这个方向在追问的核心问题: 1. 删失机制如何破坏 exchangeability 与 score 的可计算性? 右删失导致部分个体的真实生存时间 \(T\) 不可观测,其 conformal score 无法计算,直接破坏了标准 conformal prediction 所依赖的 i.i.d. / exchangeability 假设。 2. 在一般右删失下,如何利用可观测数据重构 score 的分布? Candès et al. 通过提取子队列(\(C > t_0\))将问题转化为 covariate shift,但这要求 \(C\) 总是可观测(Type I 删失)。一般右删失下,\(C\) 本身也可能缺失,需要新的重构机制。 3. 如何从单侧下界走向双侧预测区间? 生存时间的上界在删失下更难估计,因为长生存时间个体最容易被删失,上界的经验分位数严重缺失。 4. Working model 误设时,覆盖率能否有保证? 生存回归模型(如 Cox, AFT)几乎必然有误设风险,conformal 框架能否在误设下仍提供分布无关的覆盖率保证,是该方向走向实用的关键瓶颈。
⚠️ 作者的 framing(这是作者的说法): 作者将缺口 frame 为:"Candès et al. 的方法仅适用于 Type I 删失且只能估计下界,而医学应用中更常见的是一般右删失,且需要双侧区间。" 这使得本文的 bootstrap 加权修正成为"显然的下一步"。 被淡化或回避的竞争路线:Intro 中未提及基于多重填补或Kaplan-Meier 分位数直接构造预测区间的方法(如基于生存函数置信带的方法),也未讨论半参数效率界下的区间估计——这些是传统生存分析中构造区间的主流路线,作者直接跳过了它们与 conformal 方法的对比。 明显该被引却未出现的:关于一般右删失下 covariate shift / missing data 的 IPW 理论(如 Robins et al. 的 inverse probability weighting,或 Bang & Robins 2005 的 IPW 估计量),本文的核心加权思路与 IPW 同源,但 intro 未引用因果推断/缺失数据领域的 IPW 基础文献,这可能是一个值得研究者去查的缺口:作者是否在回避将方法与因果推断 IPW 框架做正式对接?
张力: 未见明显对立引用。Candès et al. 与本文在 Type I 删失下的结论是一致的(本文方法在 Type I 设定下退化为类似子队列方法),但在一般右删失下,本文的 bootstrap 加权与 Candès 的子队列提取在哲学上不同:前者是"估计缺失的删失分布并加权",后者是"丢弃部分数据以恢复 exchangeability"。两者在极端删失比例下的表现差异未见讨论。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚
- \(T\):潜在生存时间,连续随机变量,是我们想要预测的 estimand(对个体 \(i\),记为 \(T_i\))。
- \(C\):潜在删失时间,连续随机变量,个体 \(i\) 的删失时间记为 \(C_i\)。
- \(X\):协变量向量,维度为 \(d\),个体 \(i\) 的协变量记为 \(X_i\),完全可观测。
- \(Y\):可观测时间,定义为 \(Y_i = \min(T_i, C_i)\)。
- \(\Delta\):删失指示变量,定义为 \(\Delta_i = I(T_i \leq C_i)\)。\(\Delta_i = 1\) 表示事件发生(未删失),\(\Delta_i = 0\) 表示删失。
- \((X_i, Y_i, \Delta_i)\):对每个个体 \(i\),这是研究者实际能观测到的数据。当 \(\Delta_i = 1\) 时,\(T_i = Y_i\) 可观测,\(C_i\) 不可观测;当 \(\Delta_i = 0\) 时,\(C_i = Y_i\) 可观测,\(T_i\) 不可观测。
- \(n\):样本量。
- \(t_0\):预设的固定时间阈值,用于定义预测区间的参考点(如预测"生存时间是否超过 \(t_0\)")。
- \(\hat{S}(t|x)\):working regression model 估计的条件生存函数,基于 \((X_i, Y_i, \Delta_i)\) 拟合(如 Cox 模型或 AFT 模型),允许误设。
- \(\hat{G}(t|x)\):条件删失生存函数的估计,本文通过 bootstrap 重抽样从可观测数据中估计,用于加权修正。
- \(V_i\):conformal score,定义为 \(V_i = \hat{S}(Y_i | X_i)\)(或其变体),用于衡量个体观测值与预测模型的偏离程度。
- \(\alpha\):名义显著性水平,如 \(\alpha = 0.1\) 对应 90% 覆盖率。
- \(\hat{q}_{1-\alpha}\):conformal score 的经验分位数,用于构造预测区间边界。
模型: 数据生成机制为:\((X_i, T_i, C_i)\) i.i.d. 生成,\(T_i\) 与 \(C_i\) 在给定 \(X_i\) 下条件独立(标准右删失假设)。研究者无法观测完整的 \((T_i, C_i)\),只能观测 \((X_i, Y_i, \Delta_i)\)。目标是基于校准集 \(\mathcal{D}_{cal} = \{(X_i, Y_i, \Delta_i)\}_{i=1}^n\) 与新个体 \(X_{n+1}\),构造 \(T_{n+1}\) 的预测区间 \(C(X_{n+1})\),使得 \(P(T_{n+1} \in C(X_{n+1})) \ge 1 - \alpha\)。
可观测数据与不可观测量的区分: - 可观测:\((X_i, Y_i, \Delta_i)\),以及当 \(\Delta_i = 1\) 时的 \(T_i\)。 - 不可观测:当 \(\Delta_i = 0\) 时的 \(T_i\)(这是 conformal prediction 的核心困难:这些个体的 conformal score \(V_i\) 无法直接计算,因为 \(V_i\) 依赖于 \(T_i\))。
第二步:讲最小内核
剥掉所有一般性设定、working model 选择与双侧区间构造,本文支撑整篇论文的最小内核是:在一般右删失下,如何利用 bootstrap 估计删失分布,对可观测的 conformal score 进行逆概率加权,从而恢复 score 分布的代表性,并提取分位数构造下界。
最简特例:单侧下界,d=1,固定 t_0:
-
目标:构造 \(T_{n+1}\) 的下界预测区间 \(C(X_{n+1}) = [\hat{T}_{lower}, \infty)\),使得 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha\)。
-
标准 conformal 的困难:如果所有 \(T_i\) 可观测,标准 conformal prediction 的步骤是:
- 计算 score \(V_i = \hat{S}(T_i | X_i)\)(越小表示生存时间越短,偏离预测越远)。
- 取校准集 score 的经验分位数 \(\hat{q}_{1-\alpha} = \text{Quantile}_{1-\alpha}(\{V_i\}_{i=1}^n)\)。
- 对新个体 \(X_{n+1}\),解 \(\hat{S}(T_{n+1} | X_{n+1}) \ge \hat{q}_{1-\alpha}\) 得到 \(\hat{T}_{lower}\)。
- 在 exchangeability 下,\(P(V_{n+1} \ge \hat{q}_{1-\alpha}) \ge 1 - \alpha\),从而保证覆盖率。
-
但在右删失下,\(\Delta_i = 0\) 的个体的 \(T_i\) 不可观测,\(V_i\) 无法计算,score 集合不完整,exchangeability 被破坏。
-
本文的最小内核破法:
- 只保留 \(\Delta_i = 1\) 的个体(事件发生者),这些个体的 \(V_i = \hat{S}(T_i | X_i)\) 可计算。
- 但 \(\Delta_i = 1\) 的个体不是代表性样本:它们倾向于有较短的 \(T_i\)(因为 \(T_i \leq C_i\) 才会被观测到),即存在协变量偏移 / 选择偏差。
- 关键加权修正:对每个 \(\Delta_i = 1\) 的个体,赋予权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\),其中 \(\hat{G}(Y_i | X_i)\) 是在时间 \(Y_i\) 处、给定协变量 \(X_i\) 下未被删失的概率估计。直觉:如果 \(\hat{G}(Y_i | X_i)\) 小(该个体在 \(Y_i\) 处很容易被删失,但居然幸存下来了),则该个体在完整样本中的代表性应被放大——这正是 IPW 的经典逻辑。
- \(\hat{G}\) 的估计:在一般右删失下,\(C_i\) 在 \(\Delta_i = 1\) 时不可观测,无法直接拟合条件删失分布。本文用 bootstrap 重抽样:从可观测数据 \((X_i, Y_i, \Delta_i)\) 中重抽样,结合 working model(如 Cox 模型对删失时间拟合),估计 \(\hat{G}(t|x)\)。
- 加权分位数提取:在校准集的 \(\Delta_i = 1\) 子集上,计算加权经验分位数 \(\hat{q}_{1-\alpha}^{w} = \text{Weighted-Quantile}_{1-\alpha}(\{V_i, w_i\}_{\Delta_i=1})\)。
-
构造下界:对新个体 \(X_{n+1}\),解 \(\hat{S}(T_{n+1} | X_{n+1}) \ge \hat{q}_{1-\alpha}^{w}\) 得到 \(\hat{T}_{lower}\)。
-
为什么成立:在条件独立假设与 working model 误设下,加权修正使得 \(\Delta_i = 1\) 子集的 score 分布恢复为完整样本 score 分布的无偏代表。具体地,对任意可测函数 \(f\),有 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\)(在 \(T\) 与 \(C\) 给定 \(X\) 条件独立下)。因此,加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 收敛到完整样本分位数 \(q_{1-\alpha}\),从而保证覆盖率 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha\) 在有限样本下近似成立(精确覆盖率依赖于 bootstrap 估计 \(\hat{G}\) 的质量,但作者证明即使 \(\hat{G}\) 有偏,覆盖率仍因 conformal 的分布无关性质而具有稳健性)。
这个最小内核揭示了本文的本质:将右删失下的 conformal prediction 转化为一个 IPW 加权的分位数估计问题,用 bootstrap 解决删失分布不可观测的估计困难。
三、这篇论文做了什么¶
三句话: ① 研究了在一般右删失生存数据下(只有 \(\Delta_i = 1\) 时 \(T_i\) 可观测),如何构建个体生存时间的分布无关 conformal 预测区间(单侧下界与双侧区间)。 ② 核心工具是 bootstrap 重抽样估计条件删失分布 \(\hat{G}(t|x)\),并对可观测的 conformal score 进行逆概率加权(IPW),以修正删失导致的选择偏差。 ③ 主要结论是:在 working regression model(如 Cox, AFT)误设下,所提方法仍能保证单侧下界的平均覆盖率接近名义水平,双侧区间在中等删失比例下覆盖率合理,且方法可扩展至竞争风险与当前状态数据等医学应用场景。
关键设定与假设:
在第二节最小记号的基础上补全完整设定:
- 假设 1:条件独立:\(T\) 与 \(C\) 在给定 \(X\) 下条件独立,即 \(T \perp C | X\)。这是标准右删失生存分析的核心识别假设,也是 IPW 加权修正成立的基础。若此假设破坏,\(\hat{G}\) 的估计与加权修正均失效,覆盖率无保证。
- 假设 2:连续分布:\(T\) 与 \(C\) 的分布连续,无重合点,保证分位数的唯一性。
- 假设 3:Working model 的嵌入:本文不要求 \(\hat{S}(t|x)\) 或 \(\hat{G}(t|x)\) 的底层模型正确设定,只要求它们提供合理的排序与拟合。Cox 模型、AFT 模型、加速失效时间模型等均可作为 working model。相比已有文献(如 Lei 2018 要求模型用于条件覆盖,Candès 2021 要求 Type I 删失下 \(C\) 完全可观测),本文放宽了对删失机制可观测性的要求,但保留了条件独立假设。
- 定义:Conformal score 的变体:
- 单侧下界 score:\(V_i = \hat{S}(Y_i | X_i)\)(当 \(\Delta_i = 1\) 时可计算)。
- 双侧区间 score:本文引入了新的 score 定义以同时捕捉上下偏离,如 \(V_i = |\hat{S}(Y_i | X_i) - 0.5|\) 或基于残差的变体,具体形式依赖于 working model 的选择。
主要结果:
- 定理:单侧下界的覆盖率保证(对应 Theorem 1 / Proposition 1 类结果):
- 陈述:在条件独立假设下,使用 bootstrap 估计的 \(\hat{G}\) 进行 IPW 加权,构造的下界预测区间 \([\hat{T}_{lower}, \infty)\) 满足 \(P(T_{n+1} \ge \hat{T}_{lower}) \ge 1 - \alpha - \epsilon_n\),其中 \(\epsilon_n\) 是由 \(\hat{G}\) 估计误差导致的有限样本偏差项,随 \(n \to \infty\) 衰减至 0。
- 直觉:IPW 加权使得 \(\Delta_i = 1\) 子集的 score 分布成为完整样本 score 分布的无偏代表,因此加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 在大样本下收敛到真实分位数 \(q_{1-\alpha}\),覆盖率恢复。\(\epsilon_n\) 反映了 bootstrap 估计 \(\hat{G}\) 的有限样本误差。
- 必要条件:条件独立、\(\hat{G}\) 的估计一致性(bootstrap 在大样本下收敛到真实 \(G\))、working model 提供连续的 \(\hat{S}\)。
-
解决的技术难点:在一般右删失下,\(\Delta_i = 0\) 的个体的 \(C_i\) 可观测但 \(T_i\) 不可观测,无法直接拟合 \(\hat{G}\)(因为 \(\Delta_i = 1\) 时 \(C_i\) 不可观测)。本文通过 bootstrap 重抽样,利用 \(\Delta_i = 0\) 子集的 \((X_i, C_i)\) 与 working model,外推估计 \(\Delta_i = 1\) 个体处的 \(\hat{G}(Y_i | X_i)\)。
-
定理:双侧区间的覆盖率保证(对应 Theorem 2 类结果):
- 陈述:双侧预测区间 \([\hat{T}_{lower}, \hat{T}_{upper}]\) 的覆盖率 \(P(T_{n+1} \in [\hat{T}_{lower}, \hat{T}_{upper}]) \ge 1 - \alpha - \epsilon_n^{2-sided}\),其中 \(\epsilon_n^{2-sided}\) 通常大于单侧的 \(\epsilon_n\),因为上界估计需要更极端的分位数,受删失影响更严重。
- 直觉:双侧区间需要同时估计 score 的上下分位数。上界分位数对应于长生存时间个体,这些个体最容易被删失(\(\Delta_i = 0\)),IPW 加权虽能修正代表性,但极端分位数处的有效样本量更小,估计方差更大。
-
必要条件:同单侧,但要求删失比例不能过高(否则上界分位数的加权估计不稳定)。
-
模拟结果的核心量化结论:
- 在中等删失比例(30%-50%)下,单侧下界的平均覆盖率接近名义水平(如 90% 覆盖率在 88%-92% 之间),无论 working model 是否正确设定。
- 双侧区间的覆盖率在中等删失下合理(如 90% 覆盖率在 85%-90% 之间),但在高删失比例(>60%)下,上界覆盖率偏低,区间过宽。
- 与 Candès et al. 的子队列方法相比,本文在一般右删失下(非 Type I)的覆盖率更优,但在 Type I 删失下两者表现相近。
证明路线与技术技巧:
- 整体路线:
- 定义 conformal score 与加权方案:基于 working model 计算 \(\hat{S}\),定义 score \(V_i\),对 \(\Delta_i = 1\) 的个体赋予 IPW 权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\)。
- 证明 IPW 加权恢复 score 分布的代表性:利用条件独立假设,证明 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\),从而加权经验分布收敛到完整样本分布。
- Bootstrap 估计 \(\hat{G}\) 的一致性:证明在一般右删失下,通过 bootstrap 重抽样与 working model 拟合,\(\hat{G}\) 在大样本下一致估计真实 \(G\),且有限样本误差可控。
- 加权分位数的覆盖率保证:结合 IPW 代表性恢复与 \(\hat{G}\) 的一致性,证明加权分位数 \(\hat{q}_{1-\alpha}^{w}\) 满足覆盖率 \(1 - \alpha - \epsilon_n\)。
-
双侧区间的扩展:将单侧逻辑对称地扩展至上界分位数,但需额外处理极端分位数处的方差膨胀。
-
关键跳跃点:
- 从 \(\Delta_i = 0\) 时的 \(C_i\) 可观测性到 \(\hat{G}(Y_i | X_i)\) 的估计:这是最吃功夫的步骤。在一般右删失下,\(\Delta_i = 1\) 时 \(C_i\) 不可观测,无法直接在 \(Y_i = T_i\) 处估计 \(G(T_i | X_i)\)。本文的跳跃在于:利用 \(\Delta_i = 0\) 子集拟合 working model(如 Cox 模型对 \(C\) 的分布),然后外推至 \(\Delta_i = 1\) 个体处估计 \(\hat{G}(Y_i | X_i)\)。外推的合理性依赖于 working model 的平滑性与条件独立假设。
-
IPW 加权分位数的有限样本覆盖率:标准 conformal prediction 的覆盖率证明依赖 exchangeability 与精确分位数,但 IPW 加权破坏了 exchangeability(权重非随机但依赖于估计量 \(\hat{G}\))。本文需证明:即使 \(\hat{G}\) 有估计误差,加权分位数的覆盖率仍仅偏差 \(\epsilon_n\),且 \(\epsilon_n\) 衰减至 0。这需要将 \(\hat{G}\) 的估计误差与分位数偏差的传导关系严格量化。
-
技术技巧点名:
- Bootstrap 重抽样:用于在一般右删失下估计条件删失分布 \(\hat{G}(t|x)\),解决 \(\Delta_i = 1\) 时 \(C_i\) 不可观测的估计困难。起作用在于:通过重抽样生成伪完整数据集,拟合 working model 后外推估计。
- Inverse Probability Weighting (IPW):用于修正 \(\Delta_i = 1\) 子集的选择偏差,恢复 score 分布的代表性。起作用在于:利用 \(E[f(V) \Delta / G(Y|X)] = E[f(V)]\) 的无偏性,将加权经验分布作为完整样本分布的替代。
- Covariate shift 修正:Candès et al. 将删失问题 frame 为 covariate shift(子队列的 \(X\) 分布与完整样本不同),本文的 IPW 加权本质上也是 covariate shift 修正,但实现方式不同(加权而非子队列提取)。
- Working model 的鲁棒嵌入:允许 \(\hat{S}\) 与 \(\hat{G}\) 的底层模型误设,但保证覆盖率。起作用在于:conformal prediction 的覆盖率保证只依赖 score 的排序与分位数,不依赖 score 的绝对值,因此误设模型仍能提供合理的排序。
真实例子与应用:
- 用的什么数据 / 场景:乳腺癌患者的生存预测数据,包含肿瘤特征(如肿瘤大小、分级)与治疗方案(如化疗、放疗)作为协变量 \(X\),生存时间 \(T\) 与删失时间 \(C\) 构成右删失生存数据。
- 怎么把本文方法用上去:
- 拟合 working model(如 Cox 模型或 AFT 模型)估计 \(\hat{S}(t|x)\) 与 \(\hat{G}(t|x)\)。
- 在校准集上计算 conformal score \(V_i = \hat{S}(Y_i | X_i)\)(对 \(\Delta_i = 1\) 个体)。
- 用 bootstrap 重抽样估计 \(\hat{G}\),计算 IPW 权重 \(w_i = 1 / \hat{G}(Y_i | X_i)\)。
- 提取加权分位数 \(\hat{q}_{1-\alpha}^{w}\),构造新患者的单侧与双侧预测区间。
- 得到什么结果:对乳腺癌患者,基于肿瘤特征与治疗方案,构造了 90% 单侧下界预测区间(如"该患者至少生存 5 年的概率为 90%")与 90% 双侧预测区间(如"该患者生存时间在 3-10 年之间的概率为 90%")。双侧区间宽度在中等删失下合理,但在高删失亚组(如老年患者删失比例高)中上界偏宽。
- 这个例子想说明什么:验证本文方法在真实医学数据下的实用性,展示 working model(Cox 模型)即使可能误设,仍能提供合理的覆盖率;同时展示双侧区间在临床决策中的价值(不仅告诉患者"至少活多久",还告诉"最可能活多久")。
🔎 结论是否比证明窄:
- 本文在定理中严格证明了覆盖率 \(1 - \alpha - \epsilon_n\),其中 \(\epsilon_n\) 依赖于 \(\hat{G}\) 的估计误差。但在 abstract 与 intro 中,作者泛泛 claim "excellent average coverage" 与 "good coverage",未明确量化 \(\epsilon_n\) 的上界或衰减速率。研究者需注意:"分布无关"的覆盖率保证在本文中并非精确 \(1-\alpha\),而是 \(1-\alpha-\epsilon_n\),\(\epsilon_n\) 的具体大小在定理证明中可能未给出显式界(只证明了大样本下 \(\epsilon_n \to 0\)),这是一个结论比证明窄的地方——作者在宣传时淡化了 \(\epsilon_n\) 的存在。
- 另一个泛泛 claim:方法可扩展至"竞争风险与当前状态数据"(intro 提到 "several directions in medical applications"),但正文可能只在标准右删失下严格证明,竞争风险的扩展可能只是模拟验证或启发式讨论,未给出严格覆盖率定理。研究者需核查正文是否真的有竞争风险下的定理证明。
四、开放问题(点到为止,扎根具体语句)¶
-
\(\epsilon_n\) 的显式界与衰减速率:定理证明了覆盖率 \(1 - \alpha - \epsilon_n\),但 \(\epsilon_n\) 的显式上界(如 \(O(n^{-1/2})\) 或依赖于删失比例的常数)可能未给出。要证什么:给出 \(\epsilon_n\) 的非渐近界,明确在多大样本量与删失比例下 \(\epsilon_n\) 可忽略。扎根点:定理陈述中 \(\epsilon_n\) 的定义与 abstract 中 "excellent average coverage" 的泛泛 claim 之间的张力。
-
条件独立假设的破坏与敏感性分析:本文核心依赖 \(T \perp C | X\),若此假设破坏(如删失与生存时间存在未观测的依赖),IPW 加权失效,覆盖率无保证。要估什么:在条件独立假设有微小破坏时,覆盖率的衰减速率(类似因果推断中的 sensitivity analysis)。扎根点:intro 中未提及条件独立假设的可检验性或破坏后果,且未引用因果推断 IPW 的 sensitivity analysis 文献。
-
高删失比例下双侧区间的上界估计稳定性:模拟显示高删失比例(>60%)下上界覆盖率偏低,区间过宽。要证什么:在删失比例趋于 1 时,双侧区间的 minimax 覆盖率下界或上界分位数的估计方差界。扎根点:模拟结果的 limitation 讨论中,高删失下双侧区间表现退化,但正文可能未给出理论解释。
-
与因果推断 IPW 框架的正式对接:本文的 IPW 加权与因果推断中处理 missing data / selection bias 的 IPW 同源,但 intro 未引用 Robins et al. 的 IPW 基础文献。要查什么:是否存在将 conformal prediction 与因果推断 IPW / doubly robust 估计结合的框架,使得 \(\hat{G}\) 的估计误差可通过 doubly robust 修正进一步降低 \(\epsilon_n\)。扎根点:intro 缺失的 IPW 文献引用,以及本文加权方案与 doubly robust 估计的逻辑相似性。
(要确认某条是不是真 gap,去读同子领域近期约 5 篇的 intro——都指向高删失下双侧区间的稳定性 = 共识(真 gap),互相打架 = 机会。)
Maintained by 陈星宇 · Homepage · Source on GitHub