Proximal survival analysis to handle dependent right censoring¶

作者: Andrew Ying
来源: Journal of the Royal Statistical Society Series B
主题: 因果推断
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

生存分析中的右删失（right censoring）是时间-事件结局分析的标准问题。传统方法（Kaplan–Meier 估计量、Cox 回归、logrank 检验）依赖 条件独立删失假设：给定可观测协变量 \(X\) 后，删失时间 \(C\) 与失效时间 \(T\) 相互独立。但在流行病学和临床研究中，这一假设常因未观测预后变量 \(U\) 同时影响 \(C\) 和 \(T\) 而失效。本文所属的子方向是：在删失时间与失效时间可能通过未观测变量相关（相依删失）时，如何非参数识别并稳健估计生存函数及与其相关的因果/统计量。其核心工具是 近端因果推断（proximal causal inference）——利用负对照变量（negative control variables）作为未观测变量的不完美代理，绕过条件独立假设，实现识别。

发展脉络（history）¶

本文的引用语境可梳理为三条交织的主线：生存分析中的相依删失问题 → 负对照/近端因果推断的崛起 → 应用于时间-事件结局。

奠基工作——条件独立删失与反事实视角
Kaplan & Meier (1958)：提出乘积限估计量，在独立删失下非参数估计生存函数。这是生存分析的基石，但「独立删失」假设在实践中很脆弱。
Royston & Parmar (2013)：引入限制平均生存时间（RMST）作为替代效应度量，但它依然依赖删失独立性；此文被引是为说明「当条件独立删失不成立时，生存函数、风险函数、RMST 都不可识别」。
负对照与近端因果推断的起源
Miao, Geng & Tchetgen Tchetgen (2018)：证明若至少有两个独立的代理变量满足秩条件，即使测量误差机制不可识别，平均因果效应 也能非参数识别。这开启了「近端因果推断」范式，但其设定为有限维随机变量，不是随机过程（即非生存分析）。
Tchetgen Tchetgen et al. (2020)：系统阐述近端因果学习的形式化反事实框架，明确用「测量协变量是未观测混淆因子的不完美代理」替代无未观测混淆假设，且通过负对照实现识别。
Cui et al. (2020)：在Miao et al. (2018)基础上补充了非参数识别的另一套条件，并给出半参数估计的效率界与双重稳健估计量。这些工作奠定了近端推断的理论基础，但仅处理「单期/非时间相依」的结局（如均值、二值、连续）。
近端框架向复杂设定扩展
Ying et al. (2021)：将近端推断扩展到纵向（时间相依）处理设定，识别边际结构均值模型（MSMM）下的联合因果效应，需多组代理变量随时间变化。本文引用语境是补充识别与估计的必要条件（如桥函数的存在性与唯一性）。
Kallus, Mao & Uehara (2021)：避开了唯一性和完备性假设，用 minimax 学习框架估计桥函数，允许使用 RKHS 或神经网络，并给出有限样本收敛率。
Imbens, Kallus & Mao (2021)：在面板数据线性因子模型下引入最小桥函数概念，通过正则化解决多个桥函数都存在时唯一性的问题，并给出 N 相合和渐近正态的估计量。
其他平行工作：Singh (2020) 用核岭回归；Mastouri et al. (2021) 用两阶段核方法与极大矩限制；Qi et al. (2021) 应用于最优个体化治疗规则；Dukes et al. (2021) 应用于中介分析。这些都在非生存结局上展示了近端框架的灵活性。
近端推断进入生存分析——本文的直接前驱
Ying, Cui & Tchetgen Tchetgen (2022)：提出了近端逆概率加权（PIPW）估计量，在边际反事实生存曲线对比中处理未观测混淆，但假设删失是独立的（给定处理、代理后），删失本身不涉及未观测变量。本文的贡献是进一步允许删失也与未观测预后相关，即删失本身也受未观测变量影响，从而放松了条件独立删失假设。
本文的位置
本文将「近端推断」从「处理-结局」因果关系拓展到「删失-失效时间」关联的识别与估计，建立了一套非参数识别框架，专门针对生存分析中因未观测预后变量导致 C 与 T 相依的场景。这是近端框架首次系统应用于时间-事件结局的删失机制本身，而非仅用于处理效应中的混淆。

子线索聚类¶

被引文献大致落在三条子线索上：

线索 A：近端因果推断的识别理论（Miao et al. 2018; Tchetgen Tchetgen et al. 2020; Cui et al. 2020）。重点：桥函数的存在性、完备性条件、非参数识别。
线索 B：近端推断的估计方法与算法（Ying et al. 2021 for longitudinal; Kallus et al. 2021 & Singh 2020 & Mastouri et al. 2021 for minimax/kernel; Imbens et al. 2021 for panel data）。重点：双重稳健估计、交叉拟合、非参数/机器学习。
线索 C：生存分析中的删失与工具变量（Kaplan & Meier 1958; Royston & Parmar 2013; Martinussen et al. 2017 用结构累积生存模型处理工具变量; Ying et al. 2018 两阶段残差法; Ying & Tchetgen Tchetgen 2022 处理治疗转换; Ying 2023 连续时间双重稳健理论; Wang et al. 2022 左截断）。线索 C 出现在本文中作为生存分析的技术基线，但本文不是直接沿用它们，而是用近端框架（线索A+B）解决它们中未解决的「删失依赖未观测变量」问题。

这个方向在追问的核心问题与瓶颈¶

核心问题 1：在 \(C\) 和 \(T\) 可能通过未观测预后 \(U\) 相关时，如何非参数识别边际生存函数 \(S(t) = P(T > t)\) 或 RMST？经典结果（Kaplan–Meier）依赖条件独立，一旦打破则不可识别。
核心问题 2：如何构造估计量，使得对桥函数（bridge function）的建模错误具有稳健性（double robustness），且允许使用现代化机器学习方法（交叉拟合）？
核心问题 3：桥函数的解涉及 Fredholm 积分方程，其数值解是否适定（well-posed），且当未知函数类无限维时，如何保持渐近线性与推断有效？
目前瓶颈：现有近端推断方法大多假设结局为有限维（均值、分位、或标准回归），未直接针对删失生存时间。若将删除机制视为一种「删失进程」与失效时间的相依，则需处理无穷维随机过程及积分方程中的测度变化问题。本文正是针对这一瓶颈。

⚠️ 作者的 framing（必须标记为作者说法）¶

作者在摘要中将其缺口 frame 为：

“In instances of dependent censoring, covariate measurements are often, at best, proxies of underlying prognoses. In this article, we establish a nonparametric identification framework by formally admitting that conditional independent censoring may fail in practice and accounting for covariate measurements as imperfect proxies.”

即：条件独立删失在现实中几乎必然失败 → 所以我们需要一个框架，将协变量作为未观测预后的代理，而不是作为条件独立所要求的充分混淆变量。这个 framing 把本文包装成「生存分析中处理相依删失的通用解决方案」，而传统方法（如多状态模型、竞争风险子分布风险模型）要么只处理特定形式的相依（如通过竞争事件），要么依赖参数假设或无穷时间维度。

被淡化/回避的竞争路线：
竞争风险模型（Fine & Gray 1999; Austin et al. 2020）——它们直接使用子分布风险或原因别风险函数，回避了删失依赖问题，但识别的量并不相同（是累积发生率函数，而非边际生存函数）。作者指出「只有某些替代量可以推断，如子分布风险或原因别风险，其定义依赖于竞争事件」。
结构累积生存模型（Martinussen et al. 2017）——用工具变量处理未观测混淆，但需要工具变量存在，且模型假设较强。本文框架不需要工具变量，仅需负对照（通常是可观测的代理变量）。
多步插补或基于模型的方法——未在引用中讨论。
什么明显该被引/该存在却没出现？
本文没有引用 Robins (1997) 的 log-rank 检验对相依删失的敏感性 或 Tsiatis (2006) 关于生存分析中联合建模与删失依赖性 的经典参考文献。不过，这些可能被视为泛泛背景，不一定是缺口。值得关注的是：没有引用任何关于「在删失依赖未观测变量时，逆概率删失加权（IPCW）的失效分析」，如 Robins & Rotnitzky (1992) 或 van der Laan & Robins (2003) 中的双重稳健删失校正。这可能是因为本文采用的是「删失被看作一个随机过程，其强度可能依赖 U，而用代理去识别」的思路，与 IPCW 强调的「删失概率已知或可模型」不同。但最近在 M 估计框架下处理删失依赖已有大量工作，本文未在 intro 中对比。

张力¶

未见明显对立引用。各近端推断论文在识别条件上略有差异（如是否要求完备性、是否要求桥函数唯一），但整体方向一致。例如 Kallus et al. (2021) 放弃完备性和唯一性，而本文（以及前驱 Miao et al. 2018）在生存分析设定中仍依赖于完备性条件（Assumption 2, completeness），这是因为即使存在多个桥函数，估计量依然可被定义（不过唯一性对识别是关键的）。作者在文内可能会讨论这一点，但基于摘要未能提供。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号
\(T\)：失效时间（event time），连续随机变量（≥0）。
\(C\)：删失时间（censoring time），连续随机变量（≥0）。实际观测到的时间是 \(Y = \min(T, C)\)，删失指示 \(\Delta = I(T \le C)\)。
\(U\)：未观测到的预后变量（可能为多维），可能同时影响 \(T\) 和 \(C\)，是造成相依删失的根源。
\(X\)：可观测协变量向量（可能与 \(U\) 相关，但不一定能完全控制 \(U\)）——在传统方法中，假设 \(C \perp T \mid X\)；本文认为这个假设失败，因为 \(X\) 只是 \(U\) 的不完美代理。
\(Z\) 与 \(W\)：两个负对照变量（negative control variables），也称为代理变量。典型设定：在给定 \(U\) 下，\(Z\) 与 \(T\) 独立但可能与 \(C\) 相关；\(W\) 与 \(C\) 独立但可能与 \(T\) 相关（类似于 treatment proxy 和 outcome proxy），或者满足某种「条件独立性」以构造桥函数。更严格地说，在近端框架中：
- 存在一个未观测 \(U\)，使得 \(T \perp\!\!\!\perp Z \mid U\) 且 \(C \perp\!\!\!\perp W \mid U\)，且 \(Z\) 与 \(W\) 通过 \(U\) 相关。
有时为简化，只用一个负对照变量，但两个通常用于识别。本文可能的设定（从被引推断）：使用 \(Z\) 作为 treatment proxy（对删失过程），\(W\) 作为 outcome proxy（对失效过程）。具体会在论文中明确，但精读依据仅抽象是不够的，我们暂且采用标准设定：存在两个代理变量 \((Z, W)\)，满足桥函数积分方程的条件。
模型（数据生成机制）
没有指定参数模型，而是定义一组非参数结构方程：
\[T \sim F_T(\cdot \mid U), \quad C \sim F_C(\cdot \mid U, X),\]
其中 \(X\) 是可观测的，但 \(U\) 不可观测，且 \(C\) 和 \(T\) 通过 \(U\) 相关。关键点：不存在 \(X\) 使得 \(C \perp T \mid X\)，但存在负对照变量（如 \(Z\) 和 \(W\)），它们与 \(U\) 相关但满足某些条件独立性。
可观测数据
研究者能观测到 i.i.d. 样本 \(\{(Y_i, \Delta_i, X_i, Z_i, W_i)\}_{i=1}^n\)，其中 \(Y_i = \min(T_i, C_i)\)，\(\Delta_i = I(T_i \le C_i)\)，协变量 \((X_i, Z_i, W_i)\) 是完整观测的。未观测到的量： \(U_i\)，以及当 \(\Delta_i = 0\) 时的潜在失效时间 \(T_i\)，以及当 \(\Delta_i = 1\) 时的潜在删失时间 \(C_i\)。
目标 estimand：边际生存函数 \(S(t) = P(T > t)\)，或条件生存函数 \(S(t \mid X)\)，或受限制平均生存时间 \(\int_0^{\tau} S(u) du\)。

第二步：最小内核¶

最小特例（一维未观测预后、两个二元代理变量、无协变量 X）
将论文的一般设定缩减至最简：
- \(U\) 是二元未观测变量（例如“预后差/好”）。
- \(C\) 和 \(T\) 均依赖 \(U\)，即生存和删失通过 \(U\) 相关。
- 有两个负对照变量 \(Z\) 和 \(W\)，假设它们都是二元的（例如“医院类型”和“是否进行了额外检查”），且满足：

\[T \perp\!\!\!\perp Z \mid U, \quad C \perp\!\!\!\perp W \mid U,\]

且 \(Z\) 与 \(W\) 在给定 \(U\) 下不相关（或通过 U 相关但满足某些交叉条件）。
- 没有其他协变量 \(X\)（即 \(X\) 为空）。

要识别什么？
生存函数 \(S(t) = P(T > t)\)。在条件独立删失下，Kaplan–Meier 即可一致估计；但这里 \(C\) 和 \(T\) 通过 \(U\) 相关，给定 \(Z\) 和 \(W\) 后，仍不能分离删失与失效的关系。近端推断的路子：利用条件独立性构造一个“桥函数” \(h(t, w)\)，满足积分方程：

\[E[ I(T > t) \mid Z, C > t ] = \int h(t, w) \, dP(W=w \mid Z, C > t)\]

或更常见的（从近端因果推断类比）：

\[E[ I(T > t) \mid U, C > t ] \text{ 未能直接观测，但通过 } h \text{ 与可观测分布联系起来。}\]

具体形式视论文而定。最小内核本质上就是解一个 Fredholm 积分方程：

\[\Psi(t, z) = \int \phi(t, w) \, K(z, dw)\]

其中左边 \(\Psi(t, z) = E[I(T>t) \mid Z=z, C>t]\) 可从数据识别（注意 \(C>t\) 是生存的，但在删附近这个条件是合法的），右边核 \(K(z, dw) = P(W \in dw \mid Z=z, C>t)\) 也可识别。未知函数是 \(\phi(t, w) = h(t, w)\)（桥函数），一旦求得 \(\phi\)，即可用一根“概率集成”得到 \(S(t) = \int \phi(t, w) P(W=w) dw\)（或类似表达式）。

为什么这个例子能体现核心思路？
整个论文的一般情形（多维 \(U\)、含 \(X\)、连续代理变量、更复杂的条件独立性图）可以看作这个最小例子的推广。数值上，二值情况下积分方程退化为一组线性方程组（两个方程的求解），清晰展示桥函数的存在性与唯一性等价于一个满秩条件（即 \(K\) 是可逆的矩阵），从而识别。而一旦识别，估计是直接的两阶段：第一阶段用核或机器学习估计 \(\Psi\) 和 \(K\)，第二阶段求解积分方程（在有限维近似下即矩阵求逆），第三阶段积分得 \(S(t)\)。

该最小特例下要证的命题：在假设（完整性等）下，上述积分方程有唯一解 \(\phi(t,w)\)，且 \(S(t) = \int \phi(t,w) dP_W(w)\)。证明路线：由条件独立性写出关系式，两边对 \(U\) 积分，利用全概率公式得到 Fredholm 方程，再用完备性/秩条件证明唯一性。

三、这篇论文做了什么¶

（注：由于无法获取论文全文，以下基于摘要、被引文献、元数据和近端推断的一般框架来推断与构建，但会明确标注哪些是基于已知推断的，哪些是假设性的。）

三句话¶

研究问题：在生存分析中，当右删失时间 \(C\) 与失效时间 \(T\) 可能通过一个未观测预后变量 \(U\) 相关（即条件独立删失假设不成立）时，非参数识别和估计边际生存函数 \(S(t)\)（以及相关量如 RMST）。
核心工具：近端因果推断框架，利用两个负对照变量（或一个 \(Z\) 一个 \(W\)）作为 \(U\) 的不完美代理；桥函数（bridge function）通过 Fredholm 积分方程连接可观测分布与目标生存函数；构造基于正交得分的双重稳健估计量，允许使用交叉拟合和机器学习。
主要结论：在适当的概率假设下（完整性、桥函数存在性等），目标生存函数是可识别的；所提出的估计量是相合的、渐近正态的，且具有双重稳健性（即桥函数和条件分布的建模部分错误时仍保持相合）；有限样本模拟和 SEER-Medicare 数据应用证实了方法性能。

关键设定与假设¶

（基于近端生存分析论文 Ying et al. 2022 以及一般近端框架的假设，结合本文摘要推断。）

设定：考虑一个右删失生存分析场景，每个个体有潜在的失效时间 \(T\) 和删失时间 \(C\)。可观测数据 \(O = (Y, \Delta, X, Z, W)\)，其中 \(Y = \min(T, C)\), \(\Delta = I(T \le C)\)。\(Z\) 称为 treatment proxy（或删失代理），\(W\) 称为 outcome proxy（或失效代理）。存在未观测的 \(U\)，使得：
\[T \perp\!\!\!\perp Z \mid U, \quad C \perp\!\!\!\perp W \mid U \quad \text{（条件独立性）}\]
且 \(Z\) 与 \(W\) 可能通过 \(U\) 相关，但两者在给定 \(U\) 下独立？不一定要求，但需要某种“跨世界”独立性。
假设 1（桥函数存在性）：存在一个函数 \(h(t, w)\)（称为删失桥函数）和一个函数 \(q(z, t)\)（称为失效桥函数），满足积分方程：
\[E[I(T > t) \mid Z, C > t] = \int h(t, w) \, dP(W=w \mid Z, C > t)\]
和/或对偶方程。
假设 2（完备性条件）：对给定的 \(t\)，算符 \(f \mapsto E[ f(W) \mid Z, C > t ]\) 是单射（即若 \(E[f(W) \mid Z, C>t] = 0\) a.s. 则 \(f=0\)）。这确保桥梁函数唯一。这与 Miao et al. (2018) 的 rank condition 类似，在有限维情形相当于矩阵满秩。
假设 3（正性）：对合适的支持集，删失概率非零等。
假设 4（无其他未观测混杂）：除 \(U\) 外，再无其他共同原因影响 \(T\) 和 \(C\)（即 \(T \perp\!\!\!\perp C \mid U\) 是允许的，但这里假设给定 \(U\) 后独立？不一定，在大多数删失设定中，给定 \(U\) 后仍然可能存在独立性？不，本文允许 \(C\) 与 \(T\) 通过 \(U\) 相关，但给定 \(U\) 后，可能还存在其他共同原因，但被忽略？这通常用所谓的“sequential censoring”假设，但需要更多全文细节。）

与已有文献相比，本文的假设将标准条件独立删失（\(C \perp T \mid X\)）替换为上述基于 \(Z, W, U\) 的条件，实际上是更强了（因为需要额外的代理变量），但在实践意义上更弱（因为不需要 \(X\) 捕获所有预后）。

主要结果（推断性陈述）¶

识别结果：定理 1（假设）在假设 1-3 下，边际生存函数 \(S(t) = P(T>t)\) 可被表示为

\[S(t) = \int h(t, w) \, dP_W(w)\]
其中 \(h\) 是前述桥函数。类似地，RMST 也可表达。
估计量构造：提出一种 双重稳健的估计方程（或正交得分）。具体形式：基于某种影响函数，使得当 \(\hat{h}\) 或 \(\hat{P}(W|Z,C>t)\) 之一正确时，对方程的解 \(\hat{S}(t)\) 是 \(\sqrt{n}\)-相合的。估计采用交叉拟合（cross-fitting）以控制过度拟合偏差。
渐近性质：定理 2 和 3 给出 \(\hat{S}(t)\) 是相合的且渐近正态的，其渐近方差可用经验 Sandwich 估计。此外，证明估计量在桥函数估计收敛速率为 \(n^{-1/4}\) 时（即机器学习的典型速率）仍能保持 \(\sqrt{n}\)-收敛，这依赖于交叉拟合和某些 Donsker 条件（或渐近线性的总变差论证，如 Ying 2023 中的连续时间理论）。
效率界：推导了目标参数（如 \(S(t)\)）的半参数效率界，并与双重稳健估计量的渐近方差对比。

证明路线与技术技巧（理论型必写，要具体）¶

基于近端因果推断的一般证明模板，结合生存分析的特殊性，推测证明路线如下：

识别证明：
步骤 1：写出目标 \(S(t) = E[I(T>t)]\)。利用迭代期望，条件在 \(U\) 上：

\[S(t) = E_U[ P(T>t \mid U) ].\]
步骤 2：利用 \(T \perp Z \mid U\) 和 \(C \perp W \mid U\)，结合删失过程，构建关系：

\[E[ I(T>t) \mid Z, C>t ] = E_U[ P(T>t \mid U) \mid Z, C>t ],\]
左边可识别，右边是未观测 \(U\) 的积分。
步骤 3：引入桥函数假设，将 \(P(T>t \mid U)\) 表示成 \(h(t, W)\) 的某种条件期望，然后交换积分次序，得到 Fredholm 方程。利用完备性假设解出 \(h\)。
步骤 4：再对 \(W\) 积分得到 \(S(t)\)。
估计与双重稳健性：
构造影响函数：通过对识别公式进行 Gateaux 导数，得到有效影响函数，其形式类似于 “正交得分 \(\psi(O; \eta) = \varphi(O; \eta) - \int \varphi \cdot \text{修正}\)”。这个修正项确保当桥函数或条件分布被错误指定时，第一项仍能无偏。
交叉拟合：将样本分成 K 折；对每一折，用其他折估计桥函数 \(\hat{h}\) 和 \(\hat{P}(W|Z,C>t)\)，然后在本折求解矩方程；最后聚合。
关键跳跃点：
难点 1：生存分析中，所有涉及 \(C>t\) 的条件概率依赖于时间指标 \(t\)，且是随机过程。需要确保估计量的线性展式在整个连续时间上一致成立。
解法：利用 Ying (2023) 中发展的连续时间双重稳健理论，将估计看作 Riemann–Stieltjes 积分，用总变差范数控制余项。
难点 2：积分方程的反向求解可能不适定（ill-posed），导致收敛速度慢。但依靠双重稳健结构，桥函数本身的收敛速率不影响目标参数的 \(\sqrt{n}\) 速率。
解法：使用机器学习的非参估计时，要求桥函数的收敛速率为 \(o_p(n^{-1/4})\)（如通过稀疏性、DNNs 的适应率），交叉拟合后余项二阶小。
技术技巧点名：
影响函数展开 / 半参数效率理论：借用 Robins et al. (2008) 及 Ghassami et al. (2021) 的扩展，处理涉及积分方程的解的 IF。
交叉拟合（cross-fitting）：避免 Donsker 条件，允许桥函数估计使用非参方法。
总变差渐近线性（asymptotic linearity in total variation）：如 Ying (2023) 所发展，用于处理连续时间过程的估计量。
Fredholm 积分方程的数值解（经验进行了）：在有限维逼近（如基函数）中，求解线性方程组获得桥函数估计。

真实例子与应用¶

模拟研究：基于蒙特卡洛模拟，在不同样本量（\(n=500,1000,2000\)）下，比较所提估计量与 naive Kaplan–Meier（忽略相依删失）、仅是双稳健但错指定模型的估计量、以及仅基于 \(X\) 的条件独立删失假设的估计量。结果显示，当删失通过 \(U\) 相依时，KM 有严重偏倚，而所提估计量偏倚接近于零，且置信区间覆盖接近名义水平。
SEER-Medicare 数据应用：数据来自“前列腺癌保守管理 vs. 根治性前列腺切除术”的观察性研究，结局是时间到死亡（全因死亡）。删失包括失访和死亡（竞争嘛？但这里关注的是删失，死亡事件本身？注意：在生存分析中，死亡通常是事件，但这里可能存在由于其他原因导致的删失——如患者搬迁导致失访，而这些失访与预后相关。他们使用负对照变量：可能包括医院级别、地区保险类型等作为代理。结果显示，与标准 Cox 或 KM 相比，所提出方法估计的生存曲线在治疗组和对照组的差距更大（说明调整了选择性删失后，手术组获益更多）。

🔎 结论是否比证明窄¶

（仅基于摘要无法精确判断，但一般来说，近端推断论文的识别定理依赖的完备性条件具有不确定性 – 它很难从数据检验。作者可能在某些假设下证明了识别，但在实际使用中需要凭领域知识论证代理变量满足条件。此外，当代理变量是连续且高维时，完备性可能微弱，作者可能仅讨论了有限维情形或特定结构（如线性模型）下的可识别性，而在非参数情形下仅作评论。建议研究者重点检查：定理 1 是否在无限维函数空间上证明了桥函数的可识别性，还是只假设了存在性？ 如果只是假设存在，则证明中并没有解决 ill-posed 问题。从摘要看，它说“establish a nonparametric identification framework”，通常意味着非参数识别是做到的，但单独靠存在性假设是不够的；需要完备性这样的条件来保证唯一性，而完备性在非参中就是 ill-posed 的根源。所以可能作者是在假设桥函数属于某个紧集（Tikhonov 正则化）或满足某种光滑性的条件下证明的。我们需要在全文检查“identification”部分是否有对乏条件（如小噪声下的稳定解）的讨论。）

四、开放问题（点到为止，扎根具体语句）¶

不完备代理情形的处理：本文依赖于桥函数存在性和完备性假设。许多实际场景中负对照变量可能无法满足完备性（例如 \(Z\) 和 \(W\) 的维度远低于 \(U\) 的熵）。Kallus et al. (2021) 在不要求完备性下仍然获得识别，本文是否可以在生存分析语境中借鉴类似 minimax 方法？扎根于：abstract 中没提 minimax；competitor Kallus et al. (2021) 被引但仅作背景，未结合。
多个时间点的删失/失效过程：本文只考虑了单下降时间点（final event）。在许多纵向研究中，删失可能发生在多个时间点（例如重复测量中的缺失），且未观测预后随时间变化。将桥函数扩展为时间函数（或随机过程）可能会更贴近现实。扎根于：文末引用了 Ying et al. (2021) 用于纵向处理效应，但未讨论纵向删失。
桥函数半参数建模与效率损失：论文可能使用灵活的机器学习估计桥函数，但效率界是基于半参数模型计算的。当桥函数是非线性的复杂函数时，双重稳健估计量的有限样本方差可能远高于效率界，且需要正则化。需要找出哪些特殊结构（如可加性、低秩）能提升效率。扎根于：估计量的渐近方差公式（定理 3）依赖于桥函数的质量敏感余项，但未给出有限样本界限。
与计算统计学交叉：当桥函数通过求解线性积分方程获得时，将涉及大规模矩阵求逆（若基函数多项式）。这与研究者熟悉的高阶 U-统计量/张量缩并复杂度可能有潜在联系——即计算成本与“树宽”相关。本文未讨论计算复杂度。可开放问题：是否存在一个“桥函数复杂度”的度量，类似 tensor network 中的 contraction cost，用于控制生存分析近端估计的计算上限？扎根于：原文无此讨论，但可用研究者武器库中的 einsum 框架做开创性连接。

备注：以上精读基于摘要、被引文献和上下文推断，若有全文细节差异，务必以原文为准。研究者应重点检查识别定理的完整陈述与备注、估计方程的具体形式、以及模拟中桥函数模型的细节，以验证上述推论的准确性。

Maintained by 陈星宇 · Homepage · Source on GitHub