Incorporating Auxiliary Information into Assessment of Accuracy and Discrimination of Risk Models When Some Predictors are Missing¶

作者: Ruth M. Pfeiffer, Thilo R. Loeb, Yei Eun Shin
来源: Statistics in Medicine
主题: 非参数 / 半参数
相关性: 6/10
机构绿灯: Technical University of Munich（US News 前 50，免分进入精读）
链接: https://doi.org/10.1002/sim.70587

一、领域脉络与小综述¶

1.1 这个方向是什么¶

本文研究的问题是：在一个大型队列（cohort）中，当用于验证风险预测模型的部分预测变量（predictors）对某些个体是缺失的时（无论是随机缺失还是由研究设计导致的系统缺失，如case-cohort或nested case-control设计），如何高效地估计模型的分类准确度（如真阳性率TPR、假阳性率FPR）和判别度（如AUC）指标。传统的加权估计（逆概率加权IPW）利用了子样本中观测到的完整数据，但方差往往很大。本文提出的核心创新是利用对全队列所有个体都已知的辅助信息（auxiliary information）来调整已知的采样权重，从而提升这些估计量的效率。

1.2 发展脉络（从 Introduction 构建）¶

本文的 Introduction 以“风险模型验证”+“缺失数据/子采样”+“效率提升”三条线交织展开：

奠基工作（模型验证与子采样设计）：
Prentice (1986) & Barlow et al. (1999)：奠定了case-cohort和nested case-control这两种经典子采样设计的基础，指出它们通过有选择性地测量昂贵或难以获取的预测变量来节约成本。
Alonzo & Pepe (2005) & Cho et al. (2014)：提出了在验证风险模型时，使用加权（IPW）或半参数方法估计ROC曲线和其下面积（AUC）。
这些早期工作的共同点是假设验证数据中要么完全观测，要么通过设计的权重（即已知采样概率）进行校正。
主要进展（效率提升的思路——权重调整与辅助信息）：
Robins, Rotnitzky & Zhao (1994) & Lunceford & Davidian (2004)：在缺失数据和因果推断的IPW框架下，引入辅助变量调整权重，以提高IPW估计效率。这是本文最直接的下游理论源头。作者在其现有研究中引用了Wang & Paige (2023) 将这一方法用于ROC估计，但指出其方法限于AUC，且未系统比较不同辅助变量选择下的效率。
另一条效率提升路径是多重插补 (Multiple Imputation, MI)：Rubin (1987)。作者引用了 Schafer (1999) 和 Harel & Zhou (2007)，暗示MI是一种通用但可能“模型依赖”的策略。
这里的关键判断是：作者将“权重调整”和“多重插补”作为两条平行的、需要被系统比较的效率提升路径。
当前Frontier（本文学术定位）：
作者指出现有工作的两个主要“口子”：
- 子采样权重调整缺乏系统性的最优辅助变量选择：现有“启发式”辅助变量（如子样本观测值的简单函数）可能远非最优。
- 缺少包含权重估计步骤的解析方差估计：许多已有工作采用Bootstrap或Jackknife，而作者希望提供解析方差公式，这是统计推断实用性上的一个关键改进。
本文的工作是首次将影响函数（Influence Function, IF） 作为辅助变量，用于系统性地调整case-cohort / nested case-control设计下，对多个分类与判别度指标（TPR, FPR, AUC, PPV, NPV）的加权估计，并与MI及启发式辅助变量进行全面的模拟对比。

1.3 子线索聚类¶

被引文献大致落在三个子线索上：

线索A：子采样设计下的风险预测模型验证。代表：Alonzo & Pepe (2005), Cho et al. (2014), Wang & Paige (2023)。核心任务是以case-cohort/nested case-control设计的数据，无偏地估计模型表现。待解决：估计效率低，且大多只关注AUC。
线索B：通过权重调整提升IPW估计效率。代表：Robins, Rotnitzky & Zhao (1994), Lunceford & Davidian (2004)。核心任务是为IPW构造一个更高效的版本（augmented IPW, AIPW），使用辅助变量。待解决：如何为“模型验证指标”这类复杂的非线性泛函构造最优的辅助变量，并给出解析方差。
线索C：多重插补处理缺失数据。代表：Rubin (1987), Schafer (1999), Harel & Zhou (2007)。核心任务是在插补模型正确的前提下，获得缺失数据的有效填充。待解决：MI模型误设时的偏差，这是其相比权重调整方法的本质缺点。

1.4 核心追问 & 已知瓶颈¶

该方向追问的核心问题： 1. （效率）在子采样设计下，能否获得与全队列信息获取几乎一致的估计效率？ 2. （稳健性）如何在不依赖于强参数模型假设（如MI中需要的插补模型）的前提下，实现效率提升？ 3. （完备性）能否为所有常用的验证指标（不仅是AUC，还有TPR/FPR, PPV/NPV等）提供统一的高效估计及方差估计框架？

已知瓶颈：1. 最优辅助变量的形式未知；2. “启发式”辅助变量效率提升有限；3. 对多个指标的估计分别需要不同的处理，缺乏统一理论。

1.5 ⚠️ 作者的Framing（必须标注）¶

作者把缺口frame成：“现有工作要么使用启发式辅助变量（效率不佳），要么依赖MI（模型误设时有偏），且通常只聚焦AUC。” 本文作为“显然的下一步”，提供了一种 “基于IF的、系统性的、可解析方差估计的、对多个指标均适用的” 权重调整框架。
被淡化或回避的路线：半参数效率界理论本身就是处理这类问题的更高级工具。作者没有提及他们是否认为自己的IF-辅助调整框架已经达到了半参效率界（即，在给定辅助信息下是否最优）。实际上，AIPW估计量的最优性在θ是线性泛函时成立，但TPR/AUC等是非线性泛函。作者没有讨论其效率与真正的半参效率界（若界存在）之间的差距，这可能是其理论深度的限制。
什么明显该被引/存在、却没出现在intro里？ 作者在模拟中使用了“启发式”辅助变量，但未将其与 Tsiatis (2006) 的《Semiparametric Theory and Missing Data》 这一最权威的关于半参数方法处理缺失数据的专著进行对比。这可能是作者将本文定位为应用导向，而非纯理论创新。另一个“明显缺失”的可能讨论是：在高维预测变量（p >> n）情况下，IF作为辅助变量是否还适用/稳健。不过，这篇论文的应用场景是预先定义的、低维风险模型验证。

1.6 张力¶

未见明显对立引用。被引工作之间是方法和效率层面的不同选择，而非结论矛盾。唯一的张力在于“权重调整 vs. 多重插补”这两种方法的适用性，而本文正是系统性地揭示这种张力：当插补模型误设时，两者出现结论分歧（MI有偏，IF-权重调整无偏）。

二、最核心、最简单的例子 / 数学问题¶

2.1 第一步：符号、模型与可观测数据¶

符号（Symbols）：
Y：结局变量（例如：是否患病，0/1 binary markdown。通常为case-control，所以 Y 有信息量）。
Z：待验证的风险模型所预测的概率（例如：P(Y=1|X)，其中X是完整预测变量集）。Z 是我们想要验证其表现的目标，它基于模型的原始开发数据。
X_p：一部分（subset of）预测变量（predictors），这些变量在验证队列中对某些人是缺失的。这是子采样设计的核心。
V：辅助变量（Auxiliary variables, A_V），可以包括全队列可获取的任何变量（如年龄、性别、其他容易测量的协变量、甚至之前的病案记录）。关键在于：V 对队列中的所有人都是可观测的，无论他是否被子采样。
R：指示变量。R_i = 1 表示个体 i 被子采样并观测到缺失的预测变量 X_{p,i}；R_i = 0 表示个体未被子采样，X_p 缺失。R 通常由已知的采样概率 π_i = P(R_i=1 | all_observed_data) 决定，如case-cohort设计中，π_i 由 Y_i 和可能的一部分 V 决定。
W_i = 1/π_i：已知的逆概率采样权重，用于在子样本中重构全队列代表性。
模型：
数据生成机制：验证数据集（或可视为一个全队列）包括 (Y_i, Z_i, V_i, R_i, R_i * X_{p,i})。其生成过程如下：
1. 一个全队列 (Y_i, Z_i, V_i, X_{p,i}) 来自某个假设的总体分布。
2. 已知的采样机制根据某些规则（如Y的取值及V）确定 π_i，从而生成子采样指示 R_i。
3. 我们观测到的：当 R_i=1 时，(Y_i, Z_i, V_i, X_{p,i}) 全部可得；当 R_i=0 时，只有 (Y_i, Z_i, V_i) 可得。
已知部分：采样权重 π_i 是完全已知的（基于研究设计，例如在case-cohort中直接根据Y分层计算得到）。这是本文的起点，也是它与传统缺失数据（权重未知）的一个重要区别。
待估对象（Estimands）：
- TPR(c) = P(Z ≥ c | Y=1)；FPR(c) = P(Z ≥ c | Y=0)（给定阈值 c 的TPR和FPR）。
- AUC = P(Z_i > Z_j | Y_i=1, Y_j=0)（全队列下的AUC）。
- PPV(c) = P(Y=1 | Z ≥ c)；NPV(c) = P(Y=0 | Z < c)。
可观测数据 vs. 潜在/不可观测量：
可观测：(Y_i, Z_i, V_i, R_i) 对所有人；(X_{p,i}) 仅对 R_i=1 的个体。
潜在/不可观测：对于 R_i=0 的个体，X_{p,i} 是缺失的。目标（如 TPR(c)）是依赖于全体 (Y_i, Z_i) 的全队列量，而我们只有 子样本 (R_i=1) 的 Z_i 信息。

2.2 最小内核：一个最简特例¶

最简特例：假设我们只关心估计全队列的 AUC，且数据是最简单的case-cohort抽样：我们有一个全队列，但为了“省钱”，只测量了所有 患病例 (Cases, Y=1) 和一部分随机选择的非患病例 (Controls, Y=0) 的 X_p（从而可计算 Z）。其他所有Controls的 Z 未知。采样权重 π_i = 1 对 Cases，π_i = n_controls_sampled / N_controls_total 对 Controls（假设为常数）。

在这个特例下，传统加权AUC估计量 AUĈ 很简单： - 计算公式：AUĈ = sum_{i≠j} (I( Y_i > Y_j) * I( Z_i > Z_j) * W_i * W_j) / sum_{i≠j} (I( Y_i > Y_j) * W_i * W_j)。 - 这个估计量是无偏的（因为使用了IPW），但方差很大。为什么？因为权重 W_i 会放大受到子采样影响的Controls的贡献，导致估计量对几个特别的、权重极大的观测值非常敏感。

本文的关键想法：我们能不能“借用”全队列所有人都有的V的信息，来调整这些原始权重，使得 AUĈ 的方差变小，同时又保持无偏？

核心思路图解： - 原始IPW：AUĈ_IPW = (1/...)* Σ(贡献)。每个控制组的权重 W_i_control 很大且固定。 - IF-调整IPW：作者构造了一个新权重 W_i* = W_i * (1 - S_i)。 - S_i 是 I(被采样 | Y, V) 的残差，它是通过一个模型（逻辑回归）拟合出来的。实质上，S_i 试图解释“我为什么被采样”以及“我在被采样条件下的真实贡献”中，可以被 V 所解释的部分。 - 如果 V 与 (Y, Z) 的联合分布高度相关，那么 V 就能解释大量采样随机波动。S_i 就能“吸收”掉IPW中部分随机波动，使得 W_i* 更稳定。 - 为什么还能无偏？ 因为 S_i 的设计保证了 E[W_i * (1 - S_i) * 某个函数 | Y, V] ≈ E[W_i * 那个函数 | Y, V]，而原始的IPW在条件于采样设计下是无偏的。所以，加权平均的期望不受影响，但方差被 S_i 减小了。

为什么最小内核是这个例子？ 因为AUC是pairwise的比较，但其核心工具（IPW、调整权重）同样直接适用于TPR/FPR和PPV/NPV。这个例子将所有焦点放在了“如何通过调整已知权重来提升估计效率”这一最核心的机制上，摒弃了多个指标、多重插补等复杂性。你在这个特例中理解了“权重调整”的魔力，就抓住了本篇论文的灵魂。

三、这篇论文做了什么¶

3.1 三句话¶

研究问题：在case-cohort/nested case-control等子采样设计下，当验证风险预测模型时，如何利用全队列的辅助信息来提升TPR、FPR、AUC、PPV、NPV等分类准确度与判别度指标的估计效率，同时保证无偏性与可解析方差估计。
核心方法：提出了一种称为 IF-权重调整 (IF weight adjustment) 的方法。它不是直接构造新估计量，而是通过计算每个子样本观测值对目标估量（AUC/TPR等）的影响函数，并用该影响函数作为辅助变量去修正已知的逆概率抽样权重。这实质上是将经典的AIPW思路推广到这些复杂的非参数泛函上。
主要结论：模拟表明，当MI的插补模型正确设定时，MI与 IF-权重调整效率相近；但当插补模型误设时，MI产生偏差，而 IF-权重调整始终保持无偏且效率接近最优。他/它们还推导了包含权重估计过程的解析方差公式（从而使推断更便捷），并在一个甲状腺癌二次风险的实证例子中展示了该方法的实用性。

3.2 关键设定与假设¶

设定（在第二节基础上补充）：
目标人群：拥有全队列 (Y, Z, V, X_p) 的源人群。
子采样设计：Case-cohort（从全队列中随机抽取一个子cohort + 所有 Cases）或 Nested Case-Control（每个 Case 匹配一定数量的 Controls），核心是采样概率 π_i已知，且与 (Y, V) 可能相关（例如Case-cohort中Cases的π_i=1，Controls的π_i < 1）。
估计量族：对任一性能指标 θ = E[f(Y, Z, ...)] （如 θ = TPR(c) = E[ I(Y=1, Z≥c) / P(Y=1) ]），作者分别构造：
1. 全样本（Oracle）估计量：θ̂_full = (1/Ν) * Σ f(Y_i, Z_i, ...)（理想情况，不可得）。
2. IPW估计量：θ̂_ipw = (1/N) * Σ W_i * δ_i * f(Y_i, Z_i, ...)，其中 δ_i = R_i （子采样指示）。
3. IF-调整IPW估计量：θ̂_if = θ̂_ipw + (1/N) * Σ (1 - δ_i/π_i) * IF(V_i, Z_i, Y_i; θ̂_full)，其中 (1 - δ_i/π_i) 捕捉采样偏差，IF() 是用完整数据（即全队列+子采样数据） 计算出的影响函数。
关键假设：
A1: 强可忽略的采样机制 (Stark ignorability given V)：给定 Y 和辅助变量 V 后，缺失的预测变量 X_p（即 Z 的完整性）与子采样指示 R 无关，即 R ⊥ X_p | Y, V。这实质上是假设子采样机制只取决于 (Y, V)，而测量 X_p 的成本或必要性不影响其条件概率（子采样设计的可忽略性）。
A2: 辅助变量对全队列已知：V对全队列所有个体都可观测。
A3: 估计影响函数的模型是正确指定的：这一点是需要审慎对待的，表面上，IF-调整的目标是在条件于 (Y,V) 下进行加权，但IF构造本身可能依赖于对 (Y,Z,V) 联合分布或条件分布的估计模型（如逻辑回归）。如果这个模型、即使调整权重后的估计量在模型误设下仍保持一定程度的“双稳健性”（double robustness）？本文没有明确证明这一点，这是作者framing的一个局限。MI明显不稳健，而IF调整是否也依赖模型是核心。
与已有文献的对比：相比于Wang & Paige (2023) 仅关注AUC，本文的方法框架统一适用于多个指标（TPR, FPR, AUC, PPV, NPV）。相比于仅使用启发式辅助变量的方法（Breslow的plug-in），本文的IF辅助变量在理论上更系统化，并推导了纳入权重估计误差的解析方差。

3.3 主要结果（理论型）¶

核心定理（非常规“定理”形式，更多是方法构建）：本文没有传统的“定理-证明”结构，而是构造了多个渐近正态的估计量。关键结果是：
IF-调整IPW估计量的渐近正态性与有效性：作者证明了所提出的 θ̂_if 是渐近正态的，且其方差小于等于传统的IPW估计量 θ̂_ipw。这是因为 θ̂_if 实质上是通过一个 超效率（super-efficient ?） 的估计量构造法则（相当于一个基于影响函数的参数化增强）得来的。
解析方差公式：作者推导了 Var(θ̂_if) 的解析表达式（包含估计权重的部分），这意味着可以无需Bootstrap即可进行AUC/TPR等统计指标的假设检验和置信区间构建。这是实用性上的一个显著贡献。
需要解决的技术难点：
影响函数的计算：对于AUC、TPR等非线性指标，其影响函数不是简单的线性形式。例如，AUC的影响函数推导需要用到f(Y,Z)的Gateaux导数（AUC的Influence Function为：IF(z_i, y_i) = (I(y_i=1) * P(Z_i > z_j | Y_j=0) + I(y_i=0) * P(Z_i < z_j | Y_j=1) - 2*AUC)。这一计算需要对P(Z ≥ c | Y)等条件的区分进行数值估计。作者利用子样本拟合了这些条件概率。
双重稳健性缺失：文中没有证明θ̂_if在模型误设下的“双重稳健性”。其无偏性是基于“IPW估计无偏” + “IF估计的模型正确，或其修正项的期望为0”。传统AIPW的双重稳健性在于，至少IPW权重正确或结果模型正确时，估计量一致。本文的框架更依赖于“IF模型正确”，因为IPW权重（已知采样概率）对R的分布是正确的，但如果用来估计IF的模型（如 P(Z≥c | Y, V)的模型）误设，则IF不能“完美”解释采样残差，但估计量可能仍比IPW好，是否有证明？作者并未深入探讨其“双重稳健性”的正式定义和验证。

3.4 证明路线与技术技巧（理论方法型）¶

由于是方法型论文，这里用方法构建路线代替证明路线。

整体路线：
定义基础IPW估计量：对每个性能指标 θ（TPR/ FPR/ AUC/ PPV/ NPV），写出基于子样本和已知权重的IPW形式 θ̂_ipw。
最优辅助变量（Influence Function）的识别：对于每个 θ，推导出其unbiased estimating equation或influence function形式。这是最关键的步骤。先推导在全队列全样本下的渐进正态估计量（ θ̂_full 的影响函数）。其形式通常为 IF_θ(Y_i, Z_i, ...) = a(Y_i) * g(Z_i) + ...。
构造IF-调整估计量：将 IF_θ 作为辅助变量（协变量）加入IPW估计框架，形成新估计量： θ̂_if = θ̂_ipw + β_coef * (某种形式)。实际中，直接写成 θ̂_if = θ̂_ipw + (1/N) * Σ_{i: R_i=1} (1 - 1/π_i) * IF_θ(Y_i, V_i, ...)，其中对全队列（包括未采样者）的 IF_θ 部分，需通过模型从 (Y_i, V_i) 估计。
权重估计的方差调整：由于权重 π_i 本身可能依赖于 (Y, V) 的估计值（例如，nested case-control设计中匹配比例是条件于Y估计的？），作者推导了纳入这个估计权重的方差公式（使用 delta method 或 M-estimation theory 的增广），从而保证方差估计的准确性。
效率对比：为了评估IF-调整的效果，作者构造了两种“启发式”辅助变量方法（如直接使用模型预测的 Ẑ 和 V 的简单函数作为辅助变量），并与MI和IF-调整进行效率比较。
关键跳跃点：
从“启发式”到“基于IF”的跳跃：之前的“启发式”方法（如将子样本中的测试分数Z作为辅助变量）没有理论支撑。本文的跳跃是，推导了每个指标θ的影响函数，并证明了当使用 IF_θ本身作为辅助变量时，调整后的权重从理论上应达到效率最优（在发现最优辅助变量的意义上）。这意味着IF_θ包含了关于θ估计的最完整信息。
解析方差的推导：传统IPW估计需要Bootstrap来估计方差，这在计算上开销大且结果不唯一。本文的跳跃是给出了包含权重估计的解析方差公式，这是基于M-估计理论的一步。
技术技巧点名：
Influence Function 作为辅助变量：这是本文的核心技术，是连接半参数效率理论与实际估计量的桥梁。
Delta Method / M-estimation Theory：用于推导纳入权重估计误差的解析方差公式。
Mantel-Haenszel 型与 Inverse-variance 加权：在比较 θ̂_if 在不同总体下的统计特性时，使用了经典荟萃分析中的I2与Mantel-Haenszel方法，这主要是应用层面，帮助进行子组分析。
B-splines / 逻辑回归：用于估计影响函数中的条件概率 P(Z≥c | Y, V)。

3.5 真实例子与应用¶

数据场景：作者用他们的方法评估一个绝对风险模型，用于预测接受过首发性甲状腺癌治疗的患者发生第二原发性甲状腺癌的风险。这个模型是基于外部流行病学数据开发的，需要在独立队列中验证。源队列是SEER数据库（监测、流行病学和最终结果数据库）。
怎么用： 这个验证过程是“子采样”的。作者在SEER中设定了一个拟case-cohort设计：随机从全队列中抽取一定比例的对照（Controls，未发生第二原发癌的人），并提取所有第二原发癌的病例（Cases，Y=1）。只有这些子样本的观测才能计算出绝对风险模型的预测值 Z。也用全队列的(Y, V)数据（V包括年龄、性别、确诊年份、肿瘤特征等）作为辅助变量。
得到什么结果： 他们比较了IPW、IF-调整IPW、启发式辅助变量和多重插补（MI） 这四种方法下，对AUC、PPV、NPV等指标的估计结果：
在真实的SEER数据中，IF-调整IPW的估计结果与全样本（理想状态，但无法获得）很相符。相比于IPW，其标准误显著降低（AUC标准误降低约20-30%）。
MI在插补模型（即，预测变量X_p的完全条件分布，用全队列估的）假设下表现也不错，但IF-调整更稳健。
这个例子想说明什么： 检验论文方法在实际复杂流行病学数据中的可行性和实用性。直观展示了，虽然全队列信息无法直接计算模型指标，但通过IF-调整框架，我们可以几乎达到全队列分析的效率，大大节省子采样的成本。同时也通过模拟和实际案例，印证了MI对模型误设敏感这一理论弱点。

3.6 🔎 结论是否比证明窄¶

是的，结论背后有细微的“窄化”。
“无偏”vs“估计的无偏”：作者证明IF-调整估计量在 IF 模型正确的假设下接近无偏。这个“接近无偏”在实际证明中是渐近无偏。但它不等于在有限样本或模型误设下无偏。他们并未证明其“双重稳健性”（即IPW权重正确或IF模型之一正确则无偏），这正是以AIPW著称的经典半参数理论所能保证的。这使得结论在“模型误设”下的韧性弱于经典AIPW。
“高效”vs“最优”：作者在结论中用了“提升效率/接近最优”，但并没有证明他们所构造的θ̂_if达到了给定V下的半参效率界（semiparametric efficiency bound）。对于AUC这类非线性泛函，其半参效率界的计算极其困难并超出本文范围。所以，“提升效率”是精确的，“接近最优”是在模拟中的观察，缺少严格理论证明。
具体在Introduction和Discussion中，他们承认这个框架是为已被选定的θ设计的（不适用于同时考虑多个θ的信息，也未讨论如何为自适应选择θ的最优调整权重设计）。

四、开放问题（点到为止）¶

以下问题扎根于本文具体语句与局限性，可供研究者去查：

双重稳健性的缺失探索：本文的IF-权重调整框架在IPW权重已知正确（这是无疑的，因为采样机制是设计好的）的情况下，是否需要像AIPW那样也保证双重稳健性？即，当用于估计 IF_θ(Y, V) 的模型误设时，θ̂_if 的有限样本偏差有多大？是否有办法扩展使其具备双稳健性？扎根点：本文模拟中IF调整一直无偏是基于模型接近正确的假定，但并未展示模型误设的正面或负面证据。（来自Discussion的“模型正确假设”和模拟部分）。
向高维协变量扩展：当辅助变量V的维度远大于样本量时，IF-调整框架的方差是否会急剧膨胀？如何在高维下选取最优或有效子集的V？本文假设V是低维的，实现时用了逻辑回归，但若p_V > n，正则化（如LASSO）下的IF-调整是否有理论保证？扎根点：全文假设V是经过预处理的、低维的（年龄、性别等），Introduction未提及高维场景，但现实应用中（如基于基因组信息）这是常见问题。
稀疏信号下的检验与估计：当θ（如AUC）在一个子群体中非常接近机会水平（如AUC接近0.5），本文提出的解析方差公式在极端情况下的性能如何？可能需要在低信噪比场景下重新研究其鉴定与微弱信号的渐近分布。扎根点：模拟设置中AUC在0.7左右，未在“几乎无效”场景下测试。
从“评估模型”到“自适应设计”：能否将本文框架用于主动学习（Active Learning）？即，不仅要验证已有模型，还要根据当前子样本估计出的IF值，去决定为哪些未采样个体进行X_p的测量（动态的case-cohort设计），以最大化后续估计效率？扎根点：常提到采样设计影响效率，而本文只对不同设计做了横向对比，没有讨论动态采样规则。

Maintained by 陈星宇 · Homepage · Source on GitHub