Pseudo-observations for bivariate survival data¶

作者: Yael Travis-Lumer, Micha Mandel, Rebecca A Betensky
来源: Biometrics
主题: 其他
相关性: 3/10
机构绿灯: Hebrew University of Jerusalem（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujaf006

一、领域脉络与小综述¶

这个方向是什么¶

本方向的核心问题是：在右删失的双变量生存数据中，如何估计协变量对联合失效时间分布（如联合生存概率）的影响？ 更具体地说，研究者观测到两个相关失效时间（如一对双胞胎的发病年龄、同一患者的疾病复发与死亡时间），但每个失效时间都可能被右删失（如研究结束、失访）。目标是建立一个回归模型，将协变量与联合生存函数 \( S(t_1, t_2) = P(T_1 > t_1, T_2 > t_2) \) 的某个泛函（如固定时间点的联合生存概率）联系起来。该方向当前成熟度中等：单变量生存数据的伪观测方法已相当成熟并被广泛应用，但双变量情形的推广尚处于早期发展阶段。

发展脉络（history）¶

奠基工作：伪观测方法的提出与单变量推广
- Andersen et al. (2003)：首次系统提出伪观测方法，用于估计协变量对多状态生存模型（如累积发生率）的影响。其核心思想是：先对删失数据做非参数估计（如 Kaplan-Meier 估计量），然后为每个个体构造一个“伪观测值”（即“留一法”估计量与非参数估计量的差值乘以样本量），最后将这些伪观测值作为响应变量拟合一个广义线性模型（GLM）。该方法的关键优势在于，它绕过了对删失数据直接建模的复杂性，将问题转化为一个标准的 GLM 问题。
- Andersen & Perme (2010)：对伪观测方法进行了全面的综述和推广，使其成为单变量生存分析中估计协变量效应的标准工具之一，广泛应用于生存概率、限制平均生存时间、累积发生率等泛函的回归建模。
主要进展：双变量生存函数的非参数估计
- Dabrowska (1988)：提出了一个非参数估计量，用于估计右删失双变量生存数据下的联合生存函数。该估计量基于双变量乘积限估计，是 Kaplan-Meier 估计量在双变量情形的自然推广，具有相合性和渐近正态性。作者引用句定位：本文将其作为两个候选非参数估计量之一。
- Lin & Ying (1993)：提出了另一个非参数估计量，同样用于估计右删失双变量生存数据下的联合生存函数。该估计量基于一个简单的加法结构，计算上比 Dabrowska 估计量更简便。作者引用句定位：本文将其作为另一个候选非参数估计量，并指出其“计算更简单”。
当前 Frontier：双变量伪观测方法的缺失
- 尽管单变量伪观测方法已非常成熟，且双变量生存函数的非参数估计量也已存在，但将两者结合——即将伪观测方法推广到双变量生存数据——这一“显然的下一步”在本文之前尚未被系统研究。本文填补了这一空白。
本文的位置：本文是第一个将伪观测方法系统性地推广到双变量生存数据的工作。它利用已有的两个非参数估计量（Dabrowska 和 Lin-Ying）作为基础，构建了双变量伪观测值，并证明了基于这些伪观测值的回归估计量的渐近性质。

子线索聚类¶

单变量伪观测方法：以 Andersen et al. (2003) 和 Andersen & Perme (2010) 为代表，专注于单变量删失数据下各种泛函的回归建模。这是本文的直接理论和方法论基础。
双变量生存函数的非参数估计：以 Dabrowska (1988) 和 Lin & Ying (1993) 为代表，专注于在右删失下估计联合生存函数本身，而不涉及协变量效应。本文将这些估计量作为构造伪观测值的“第一步”。
双变量生存数据的回归建模：这是一个更广泛的领域，包括使用 Copula 模型、脆弱模型（Frailty models）等方法。本文的伪观测方法提供了一种不同于这些参数/半参数模型的、基于非参数估计的回归建模途径。

这个方向在追问的核心问题¶

如何定义双变量伪观测值？ 单变量伪观测值基于 Kaplan-Meier 估计量，其“留一法”定义清晰。双变量情形下，由于联合生存函数的非参数估计量更复杂（如 Dabrowska 估计量涉及双重乘积限），如何定义“留一法”版本的估计量并构造伪观测值是一个核心问题。
基于不同非参数估计量的伪观测方法是否都有效？ 本文考虑了 Dabrowska 和 Lin-Ying 两种估计量，需要证明基于它们的伪观测回归估计量都具有相合性和渐近正态性。
如何同时估计多个时间点的联合生存概率？ 实际应用中，研究者可能关心多个 \( (t_1, t_2) \) 时间点的联合生存概率。本文的方法通过为每个时间点构造伪观测值，并利用广义估计方程（GEE）来处理多个时间点的相关性，从而解决了这一问题。
如何估计协变量调整的条件生存概率？ 从联合生存概率 \( S(t_1, t_2 | X) \) 出发，可以推导出给定一个失效时间条件下的条件生存概率，如 \( P(T_2 > t_2 | T_1 > t_1, X) \)。本文展示了如何利用其方法得到这些条件概率的估计。

⚠️ 作者的 framing¶

作者的缺口 frame：作者将缺口 frame 为“伪观测方法在双变量生存数据中的缺失”。他们指出，单变量伪观测方法已很流行，双变量生存函数的非参数估计量也已存在，但“据我们所知，尚未有研究将伪观测方法推广到双变量情形”。这使得本文成为“显然的下一步”。
被淡化或回避的竞争路线：作者淡化了其他双变量生存数据回归模型（如 Copula 模型、脆弱模型）的存在。这些模型通常需要指定参数形式或对相关性结构做假设，而本文的伪观测方法是非参数的，因此更灵活。作者在引言中仅简要提及这些方法，并指出它们“可能对模型误设敏感”，从而突出了本文方法的优势。
什么明显该被引 / 该存在、却没出现在 intro 里？ 从 intro 看，作者引用了伪观测方法的奠基性工作（Andersen et al. 2003）和综述（Andersen & Perme 2010），以及双变量生存函数估计的经典工作（Dabrowska 1988, Lin & Ying 1993）。未见明显缺失的关键引用。（值得研究者去查的问题）：可以检查是否有近期（2020年后）关于双变量生存数据回归建模的、使用类似“两步法”或“非参数+回归”思路的工作被遗漏。

张力¶

未见明显对立引用。Dabrowska (1988) 和 Lin & Ying (1993) 是两种不同的非参数估计方法，各有优劣（Dabrowska 更高效但计算复杂，Lin-Ying 更简单但可能效率稍低），本文将它们作为两种可选的“第一步”估计量，而非对立方法。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \( (T_1, T_2) \)：一对失效时间（随机变量），是研究的目标。例如，\( T_1 \) 是疾病复发时间，\( T_2 \) 是死亡时间。
- \( (C_1, C_2) \)：一对右删失时间（随机变量）。例如，\( C_1 \) 是 \( T_1 \) 的删失时间，\( C_2 \) 是 \( T_2 \) 的删失时间。通常假设 \( (C_1, C_2) \) 与 \( (T_1, T_2) \) 独立（条件于协变量）。
- \( (X_1, X_2) \)：一对观测到的失效时间，定义为 \( X_j = \min(T_j, C_j) \)，\( j = 1, 2 \)。这是研究者实际能观测到的。
- \( (\Delta_1, \Delta_2) \)：一对删失指示变量，定义为 \( \Delta_j = I(T_j \le C_j) \)，\( j = 1, 2 \)。\( \Delta_j = 1 \) 表示 \( T_j \) 被观测到（事件发生），\( \Delta_j = 0 \) 表示 \( T_j \) 被删失。
- 可观测数据：研究者实际能观测到的是 \( (X_1, X_2, \Delta_1, \Delta_2) \)，以及一个 \( p \) 维协变量向量 \( Z \)。想要但观测不到的是 \( (T_1, T_2) \) 本身，以及联合生存函数 \( S(t_1, t_2) = P(T_1 > t_1, T_2 > t_2) \)。
- \( n \)：样本量。
- \( i \)：个体索引，\( i = 1, \dots, n \)。
- \( \hat{S}(t_1, t_2) \)：基于所有 \( n \) 个样本的联合生存函数的非参数估计量（如 Dabrowska 或 Lin-Ying 估计量）。
- \( \hat{S}_{(-i)}(t_1, t_2) \)：去掉第 \( i \) 个个体后，基于剩余 \( n-1 \) 个样本的联合生存函数的非参数估计量（“留一法”估计量）。
- \( \theta \)：回归系数向量（\( p \times 1 \)），是本文要估计的参数。
- \( g(\cdot) \)：连接函数（如 logit 或 log 函数），用于将联合生存概率与协变量线性组合联系起来。
模型：
- 数据生成机制：每个个体 \( i \) 独立地来自一个未知的联合分布 \( (T_{1i}, T_{2i}, C_{1i}, C_{2i}, Z_i) \)。我们观测到 \( (X_{1i}, X_{2i}, \Delta_{1i}, \Delta_{2i}, Z_i) \)。
- 目标模型：我们假设一个广义线性模型（GLM）来描述协变量 \( Z \) 对联合生存概率 \( S(t_1, t_2 | Z) = P(T_1 > t_1, T_2 > t_2 | Z) \) 的影响：
  \[g(S(t_1, t_2 | Z)) = \alpha(t_1, t_2) + \beta^T Z\]
  其中 \( \alpha(t_1, t_2) \) 是一个与时间相关的截距项，\( \beta \) 是回归系数向量。注意，这个模型假设协变量效应是可加的（在连接函数尺度上），且不随时间变化（即比例优势或比例风险假设的类似物）。
- 已知/未知：\( g(\cdot) \) 是已知的（如 logit 函数），\( \alpha(t_1, t_2) \) 和 \( \beta \) 是未知的，需要估计。
可观测数据：
- 实际能观测到：\( n \) 个独立同分布的样本 \( \{ (X_{1i}, X_{2i}, \Delta_{1i}, \Delta_{2i}, Z_i) \}_{i=1}^n \)。
- 潜在/不可观测：真实的失效时间 \( (T_{1i}, T_{2i}) \)，以及真实的联合生存函数 \( S(t_1, t_2 | Z) \)。识别依赖于条件独立假设 \( (T_1, T_2) \perp (C_1, C_2) | Z \)。

第二步：讲最小内核¶

本文的核心思路可以浓缩为一个最简特例：假设我们只关心一个固定的双变量时间点 \( (t_1^*, t_2^*) \)，并且协变量 \( Z \) 是二值的（如处理组 vs 对照组）。那么，我们要估计的是：

\[\theta = g(S(t_1^*, t_2^* | Z=1)) - g(S(t_1^*, t_2^* | Z=0))\]

即协变量效应在连接函数尺度上的差异。

在这个特例下，本文的方法退化成以下步骤：

第一步：估计联合生存函数。使用 Dabrowska 或 Lin-Ying 估计量，基于所有 \( n \) 个样本，得到 \( \hat{S}(t_1^*, t_2^*) \)。这个估计量是 \( S(t_1^*, t_2^*) \) 的一个相合估计。
第二步：构造伪观测值。对于每个个体 \( i \)，构造其伪观测值：
\[\hat{\theta}_i = n \cdot \hat{S}(t_1^*, t_2^*) - (n-1) \cdot \hat{S}_{(-i)}(t_1^*, t_2^*)\]
其中 \( \hat{S}_{(-i)}(t_1^*, t_2^*) \) 是去掉第 \( i \) 个个体后，基于剩余 \( n-1 \) 个样本的联合生存函数估计量。这个伪观测值 \( \hat{\theta}_i \) 可以看作是对个体 \( i \) 的“潜在”联合生存指示变量 \( I(T_{1i} > t_1^*, T_{2i} > t_2^*) \) 的一个“近似”。由于删失，这个指示变量通常是不可观测的，但伪观测值提供了一个可计算的替代。
第三步：拟合 GLM。将伪观测值 \( \hat{\theta}_i \) 作为响应变量，协变量 \( Z_i \) 作为解释变量，拟合一个 GLM：
\[g(E[\hat{\theta}_i | Z_i]) = \alpha + \beta Z_i\]
由于 \( Z \) 是二值的，这等价于分别计算两组中伪观测值的均值，然后通过连接函数 \( g \) 变换后相减，得到 \( \hat{\beta} \)。

为什么这个特例能体现核心思路？ * 核心困难：我们想估计 \( S(t_1^*, t_2^* | Z) \)，但 \( I(T_1 > t_1^*, T_2 > t_2^*) \) 因删失而不可观测。 * 关键想法：伪观测方法通过“留一法”技巧，将不可观测的个体指示变量替换为一个可计算的、基于非参数估计量的“伪值”。这个伪值在期望上近似于目标量，从而允许我们使用标准的 GLM 工具进行回归分析。 * 证明的核心：证明 \( \hat{\beta} \) 的相合性和渐近正态性，本质上依赖于证明伪观测值 \( \hat{\theta}_i \) 是“渐近无偏的”且“渐近正态的”，并且其影响函数可以被推导出来。这需要用到非参数估计量的渐近理论（如影响函数展开）。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：本文研究了如何将伪观测方法推广到右删失双变量生存数据，以估计协变量对联合生存概率（以及条件生存概率）的影响。
核心工具/方法：核心工具是“两步法”：第一步，使用 Dabrowska (1988) 或 Lin & Ying (1993) 的非参数估计量估计联合生存函数；第二步，基于该估计量构造伪观测值，并将其作为响应变量拟合一个广义线性模型（GLM）或广义估计方程（GEE）。
主要结论：证明了基于两种非参数估计量的伪观测回归估计量都是相合且渐近正态的。通过模拟和两个真实数据集（艾滋病临床试验数据、双胞胎死亡数据）验证了方法的有限样本性能。

关键设定与假设¶

设定：在第二节最小记号的基础上，完整设定如下：
- 有 \( n \) 个独立同分布的个体。
- 每个个体 \( i \) 有潜在失效时间 \( (T_{1i}, T_{2i}) \)，删失时间 \( (C_{1i}, C_{2i}) \)，以及协变量向量 \( Z_i \)。
- 观测数据为 \( (X_{1i}, X_{2i}, \Delta_{1i}, \Delta_{2i}, Z_i) \)，其中 \( X_{ji} = \min(T_{ji}, C_{ji}) \)，\( \Delta_{ji} = I(T_{ji} \le C_{ji}) \)，\( j=1,2 \)。
- 目标泛函是联合生存概率 \( S(t_1, t_2 | Z) = P(T_1 > t_1, T_2 > t_2 | Z) \)。
假设：
1. 条件独立删失：\( (T_1, T_2) \perp (C_1, C_2) | Z \)。这是生存分析的标准假设，确保删失机制不依赖于失效时间（给定协变量后）。
2. 协变量的可加性：在连接函数 \( g \) 的尺度上，协变量效应是可加的且不随时间变化，即 \( g(S(t_1, t_2 | Z)) = \alpha(t_1, t_2) + \beta^T Z \)。这是 GLM 的核心模型假设。
3. 正则条件：为了保证非参数估计量和 M-估计量的渐近性质，需要一些标准正则条件，如：联合生存函数和删失分布是连续的，在某些时间点有正的概率质量，协变量有界，设计矩阵非奇异等。这些条件在论文的附录中详细列出。
4. 与已有文献的对比：相比单变量伪观测方法，本文的假设主要在于将条件独立删失假设从单变量扩展到双变量，并假设了双变量 GLM 模型。相比 Copula 模型，本文的模型假设更弱（不指定相关性结构），但代价是协变量效应被限制为可加且不随时间变化。

主要结果¶

本文的核心结果是两个定理，分别对应基于 Dabrowska 估计量和 Lin-Ying 估计量的伪观测方法。

定理 1（基于 Lin-Ying 估计量）：
- 陈述：在正则条件下，基于 Lin-Ying 估计量构造的伪观测值，通过求解 GEE 得到的回归系数估计量 \( \hat{\beta} \) 是相合的，且 \( \sqrt{n}(\hat{\beta} - \beta) \) 渐近服从均值为 0 的正态分布，其协方差矩阵可以通过一个“三明治”估计量一致地估计。
- 直觉：Lin-Ying 估计量具有一个简单的加法结构，其影响函数易于推导。因此，伪观测值的影响函数也可以显式写出，从而可以应用 M-估计量的标准渐近理论。
- 必要条件：需要 Lin-Ying 估计量本身的相合性和渐近正态性，这依赖于条件独立删失假设和一些正则条件。
- 解决的技术难点：主要难点在于推导伪观测值的影响函数，并证明 GEE 估计量的渐近性质。作者通过将伪观测值表示为 Lin-Ying 估计量的一个函数，并利用其影响函数的线性形式，巧妙地绕过了直接处理复杂“留一法”估计量的困难。
定理 2（基于 Dabrowska 估计量）：
- 陈述：在正则条件下，基于 Dabrowska 估计量构造的伪观测值，通过求解 GEE 得到的回归系数估计量 \( \hat{\beta} \) 是相合的，且 \( \sqrt{n}(\hat{\beta} - \beta) \) 渐近服从均值为 0 的正态分布，其协方差矩阵可以通过一个“三明治”估计量一致地估计。
- 直觉：Dabrowska 估计量比 Lin-Ying 估计量更复杂，其影响函数也更复杂。但作者证明，伪观测方法仍然有效，且渐近性质成立。
- 必要条件：与定理 1 类似，但需要 Dabrowska 估计量本身的渐近理论。
- 解决的技术难点：Dabrowska 估计量的影响函数涉及双重积分和复杂的计数过程。作者的主要技术贡献之一是推导了 Dabrowska 估计量的影响函数，并证明了基于它的伪观测值仍然具有所需的一阶性质。这比 Lin-Ying 情形要困难得多。

证明路线与技术技巧（理论型）¶

整体路线：
1. 定义伪观测值：对于每个个体 \( i \) 和每个感兴趣的时间点 \( (t_1, t_2) \)，定义伪观测值 \( \hat{\theta}_i(t_1, t_2) = n \hat{S}(t_1, t_2) - (n-1) \hat{S}_{(-i)}(t_1, t_2) \)。
2. 建立伪观测值与目标量的联系：证明 \( E[\hat{\theta}_i(t_1, t_2) | Z_i] \approx S(t_1, t_2 | Z_i) \)。更精确地说，证明 \( \hat{\theta}_i(t_1, t_2) \) 是 \( I(T_{1i} > t_1, T_{2i} > t_2) \) 的一个“渐近无偏”估计，其偏差是 \( o_p(1/\sqrt{n}) \) 阶的。这一步依赖于非参数估计量 \( \hat{S} \) 的影响函数展开。
3. 构造 GEE：将伪观测值 \( \hat{\theta}_i \) 视为响应变量，拟合 GLM。这等价于求解一个基于伪观测值的估计方程。
4. 应用 M-估计量理论：将 GEE 的解 \( \hat{\beta} \) 视为一个 M-估计量。证明其相合性和渐近正态性，关键在于证明估计方程是“渐近无偏的”且其“方差”可以被控制。这需要用到伪观测值的影响函数和 U-统计量理论。
5. 方差估计：推导“三明治”方差估计量，该估计量需要估计伪观测值的条件方差和 GEE 的“面包”矩阵。
关键跳跃点：
- 跳跃点 1：推导 Dabrowska 估计量的影响函数。Dabrowska 估计量基于双变量乘积限，其影响函数没有简单的封闭形式。作者通过复杂的计数过程推导，得到了其影响函数的一个显式表达式，这是本文最重要的技术贡献之一。
- 跳跃点 2：证明伪观测值的“渐近无偏性”。证明 \( E[\hat{\theta}_i(t_1, t_2) | Z_i] = S(t_1, t_2 | Z_i) + o(1/\sqrt{n}) \) 需要用到非参数估计量的“留一法”性质和高阶展开。作者通过将 \( \hat{S} \) 和 \( \hat{S}_{(-i)} \) 都表示为 \( S \) 加上一个影响函数项，然后巧妙地抵消了主要项，从而得到了所需的偏差阶数。
技术技巧点名：
- 影响函数展开：用于将非参数估计量 \( \hat{S} \) 近似为 \( S \) 加上一个独立同分布随机变量的和。这是整个证明的基石。
- 计数过程与鞅理论：用于推导 Dabrowska 和 Lin-Ying 估计量的渐近性质，特别是它们的影响函数。
- M-估计量理论：用于证明基于伪观测值的 GEE 估计量的相合性和渐近正态性。
- “三明治”方差估计：用于估计回归系数的渐近方差，该估计量对模型误设具有一定的稳健性。
- U-统计量：伪观测值本质上是一个 U-统计量（或 V-统计量）的变体，其渐近理论（如 Hoeffding 分解）在证明中可能被隐式使用。

真实例子与应用¶

本文包含两个真实数据例子：

艾滋病临床试验数据（ACTG 175）：
- 数据/场景：来自一项比较不同抗逆转录病毒疗法对艾滋病患者疗效的临床试验。两个失效时间分别是：\( T_1 \) = CD4 细胞计数下降到 200 以下的时间（疾病进展），\( T_2 \) = 死亡时间。协变量包括治疗组、年龄、基线 CD4 计数等。
- 方法应用：使用本文提出的双变量伪观测方法，估计协变量对在固定时间点（如 1 年）同时存活且 CD4 计数未下降的联合概率的影响。同时估计了条件生存概率 \( P(T_2 > t_2 | T_1 > t_1, Z) \)。
- 结果：发现某些治疗组能显著提高联合生存概率。结果与使用单变量伪观测方法分别分析 \( T_1 \) 和 \( T_2 \) 的结果一致，但本文的方法提供了对联合分布的更全面描述。
- 例子目的：验证方法在真实临床试验数据中的可行性，并展示其相比于单变量分析的附加价值（提供联合分布信息）。
双胞胎死亡数据（Danish Twin Registry）：
- 数据/场景：来自丹麦双胞胎登记处，记录了双胞胎的死亡时间。两个失效时间分别是：\( T_1 \) = 第一个双胞胎的死亡年龄，\( T_2 \) = 第二个双胞胎的死亡年龄。协变量包括性别、出生年份等。
- 方法应用：估计协变量对双胞胎在特定年龄（如 80 岁）同时存活的联合概率的影响。
- 结果：发现女性双胞胎的联合生存概率显著高于男性双胞胎，且出生年份较晚的双胞胎联合生存概率更高（反映了寿命的延长）。
- 例子目的：展示方法在分析相关失效时间数据（如家族聚集性数据）中的应用，并验证其能处理大规模、长随访期的数据。

🔎 结论是否比证明窄¶

窄结论 1：定理的证明依赖于条件独立删失假设 \( (T_1, T_2) \perp (C_1, C_2) | Z \)。在真实数据中，如果删失与失效时间相关（例如，病情更重的患者更容易失访），该假设可能不成立。论文在讨论部分承认了这一点，但并未提供敏感性分析或对违反该假设的稳健性证明。因此，“方法有效”的结论严格限制在该假设成立的情形下。
窄结论 2：定理的证明依赖于GLM 模型的正确设定，即 \( g(S(t_1, t_2 | Z)) = \alpha(t_1, t_2) + \beta^T Z \)。如果真实模型是非线性的或协变量效应随时间变化，估计量可能是有偏的。论文通过模拟研究了模型误设下的表现，但并未提供理论上的稳健性保证。因此，结论的适用范围受限于模型假设。
泛泛 claim：论文声称该方法可以“估计协变量调整的条件生存概率”。虽然从联合生存概率推导条件概率在数学上是直接的，但条件概率的估计精度和渐近性质并未被直接证明。它依赖于联合生存概率估计的精度，其方差可能更大。这是一个隐含的、未完全验证的 claim。

四、开放问题¶

更灵活的模型：本文假设协变量效应在连接函数尺度上是可加且不随时间变化的。一个开放问题是，如何将伪观测方法扩展到允许协变量效应随时间变化或具有更复杂非线性结构的模型（如时变系数模型、加性模型）。扎根点：论文在讨论部分提到“未来的工作可以探索更灵活的模型，如允许时变效应”。
其他双变量泛函：本文主要关注联合生存概率。一个自然的扩展是，将伪观测方法应用于其他双变量泛函，如双变量限制平均生存时间、双变量累积发生率函数等。扎根点：论文在引言中提到，单变量伪观测方法已应用于多种泛函，暗示了双变量情形的类似扩展。
高维协变量：本文假设协变量维数 \( p \) 固定且远小于样本量 \( n \)。在高维情形下（\( p \gg n \)），如何将伪观测方法与惩罚回归（如 Lasso）结合，是一个有挑战性的开放问题。扎根点：论文未讨论高维情形，这是一个明显的空白。
与其他双变量回归方法的比较：本文在模拟中与 Copula 模型进行了比较，但未进行全面的理论比较。一个开放问题是，在何种条件下，伪观测方法比 Copula 模型或脆弱模型更有效或更稳健？扎根点：论文在讨论部分提到“与参数模型相比，我们的方法对模型误设更稳健”，但未给出严格的理论证明。

Maintained by 陈星宇 · Homepage · Source on GitHub