Martingale posterior distributions for cumulative hazard functions¶

作者: Stephen G. Walker
来源: Scandinavian Journal of Statistics
主题: 非参数 / 半参数
相关性: 7/10
机构绿灯: University of Texas at Austin（US News 前 50，免分进入精读）
链接: https://doi.org/10.1111/sjos.12712

一、领域脉络与小综述¶

这个方向是什么¶

本文所研究的子方向是非参数贝叶斯生存分析中的不确定性量化。其根本问题是：在仅观测到右删失生存时间数据（可观测数据）的情况下，如何对累积风险函数 \( \Lambda(t) \) 进行推断（点估计与区间估计），且不依赖对 \( \Lambda \) 施加强参数假设。当前该方向的主流传家是beta过程先验（Beta Process, BP），它提供了对 \( \Lambda \) 的完整后验分布。本文则试图走出另一条路——绕过先验指定，直接从一个构造出的估计量序列出发，通过鞅后验分布得到 \( \Lambda \) 的随机后验样本。

发展脉络（history）¶

从作者的introduction及引用来看，该子方向的发展主线如下：

奠基工作：beta过程先验（Ferguson, 1973; Hjort, 1990）
- Ferguson (1973) 提出了Dirichlet过程（DP），开创了非参数贝叶斯先验的路径，但DP直接建模生存函数 \( S(t) \)，不直接适用于风险函数。
- Hjort (1990) 则直接针对累积风险函数 \( \Lambda \) 建模，提出了beta过程先验（BP）。这是本文的直接理论基础。BP后验可由一个带跳跃（jumps）的随机过程表征，跳跃大小独立地服从Beta分布。本文引用了Hjort (1990) 构造的beta过程与条件独立增量的联系。
主要进展：从完全指定先验到后验的构造（Ghosh & Ramamoorthi, 2003; Dey et al., 2003; Walker & Mulhani, 2004）
- Ghosh & Ramamoorthi (2003) 系统整理了贝叶斯非参数基础理论。
- Dey et al. (2003) 讨论了生存分析中的非参数贝叶斯模型。
- Walker & Mulhani (2004) 进一步研究了beta过程的性质。这些工作巩固了BP作为生存分析非参贝叶斯标准工具的地位，但也暴露了其关键限制：在给定可观测（右删失）数据后，BP的更新需要检测并剔除区间内的删失事件，这使其后验计算复杂。
当前frontier：后验计算与替代路径
- 计算一直是关键挑战。BP后验的模拟通常依赖MCMC，而在删失观测下，删除区间事件使得MCMC的Gibbs步骤难以设计（因为事件时间未知，需要潜变量）。
- 作者的论文试图开辟一条不用先验、直接从估计量序列构造后验的替代路径，这就是鞅后验。
本文的位置：本文不是BP方法的改进（如更快的MCMC），也不是简化推进（如变分推断），而是提出一种概念上全新的推断路径：从估计量序列（如Nelson-Aalen估计量的一个变体）出发，利用其鞅性质，直接获得后验样本。本文的定位不是竞争BP的拟合效果，而是为“非参贝叶斯不需要先验或只需最小先验”这一思想提供一个具体的工作例证。

子线索聚类¶

这些被引文献大致落在3条子线索上：

线索一：非参数贝叶斯先验与后验计算（核心搜索）
- Ferguson (1973), Hjort (1990), Ghosh & Ramamoorthi (2003), Dey et al. (2003), Walker & Mulhani (2004), Damien et al. (1995), Ghosh & Ghosal (2005)。
- 这是本领域主流路线：定义先验→数据更新→后验。本文的references中大量属于此类。
线索二：生存分析中的频繁学派方法与鞅理论（核心搜索）
- Andersen et al. (1993) 的经典教材《Statistical Models Based on Counting Processes》，以及Nelson (1969), Aalen (1978), Gill (1980, 1983)。
- 这条线索提供了Nelson-Aalen估计量及其鞅性质。本文正是利用这一性质构造估计量序列（Nelson-Aalen的变体）作为鞅，再反推出后验。
线索三：鞅后验的一般理论（核心模板）
- Fong et al. (2019, 2022), Fong (2023), Fong & Holmes (2020, 2021)。
- 这是本文的理论框架来源。Fong et al. 提出了跟后验分布的一般概念：从一个给定的估计量序列出发，如果它能构成鞅，就可以通过最大化序列的熵得到一个随机分布（即鞅后验）。本文是这一框架在累积风险推断中的第一个具体应用实例，讨论了如何为 \( \Lambda \) 构造这样的鞅序列，并建立了与BP的联系。

这个方向在追问的核心问题（2-4个）¶

不确定性量化：对于一个未知的无穷维参数（累积风险函数），在删失数据下，如何构造一个后验分布，既具有贝叶斯解释（即反映后验不确定性），又具有良好的频率学派覆盖性质？
先验选择的平衡：如何在“足够灵活以适应数据（非参）”和“足够约束以提供后验可识别（避免无信息先验导致后验发散）”之间做出选择？
计算可行性：非参贝叶斯方法（尤其是BP）的MCMC在删失数据下计算成本高，是否存在更简单的的计算替代方案（如本文的直接模拟，或变分推理）？

当前主流方法与瓶颈： - 主流方法：Beta过程先验 + MCMC - 瓶颈：（根据作者所说）在含有删失观测的生存分析中，MCMC的Gibbs更新步骤因需要处理未知的删失区间事件而变得复杂，且后验有时难以解释（如已知的区间删除问题）。此外，用户必须指定先验：必须选择一个Beta过程先验，包括其参数（如基础测度 \( c \) 和 \( \alpha \) ），这在概念上不是完全数据驱动的。

⚠️ 作者的 framing（这是作者的说法）¶

作者把缺口 frame 成什么：作者将BP先验下的后验计算困难（特别是需要检测和排除删失区间事件），以及需要完全指定先验这两个点，描述为当前方法的“不理想”之处。因此，他提出的鞅后验方法声称是“更简单、更直接”的替代方案，因为（作者声称）它：
1. 不需要指定先验（除了最终用来产生序列随机性的一个概率测度）。
2. 数值上几乎直接由Nelson-Aalen估计量序列构造得出，涉及的计算是解析的（不需要MCMC）。
3. 最后，建立的与BP的联系表明，鞅后验在某种意义上是“无先验”版本的BP后验，这为理解BP提供了新视角。
哪些竞争路线被他淡化或回避了：
- 频率学派区间估计：作者并未与基于bootstrap或局部渐近正态性（如将Nelson-Aalen估计量的标准误用于构造Wald区间）的方法进行系统对比。论文的模拟部分仅展示了鞅后验自身的分布形状，没有与Wald区间或bootstrap置信带的覆盖概率进行比较。
- 其他非参数贝叶斯方法：如复合Dirichlet过程（Dirichlet Process mixture） 用于生存函数建模也被排除在主要讨论范围之外。作者只关注BP及其后验。
- 计算复杂性：作者回避了“指定先验”到底造成了多大的计算负担。对于许多实践者而言，MCMC的便利性（有现成软件包）可能比控制先验的自由度更重要。
什么明显该被引/该存在、却没出现在intro里？
- Dvoretzky–Kiefer–Wolfowitz (DKW) 不等式/置信带：对于右删失数据，有基于Nelson-Aalen估计量的DKW型置信带的有限样本理论（如Biehler & van der Vaart 2016）。这篇文章只提到了渐近区间，没有触及有限样本区间。这是一个明显的空白——作者声称他的鞅后验提供了有限样本后验样本，但未说明它如何能转化为有限样本的置信区间。
- Brownian bridge 近似：经典的Nelson-Aalen估计量的弱收敛性可引导出基于Brownian bridge的渐近置信带（如Konus–Moody型和Hall–Wellner型）。作者没有引用这些构造，尽管它们是对鞅后验方法最直接的频率学派对比对象。
- Cox模型与部分似然(Breslow估计量)：作者只聚焦于Nelson-Aalen（非参数）估计量，未提及在Cox比例风险模型框架下对累积基线风险的Breslow估计量及其不确定性量化。如果作者想推广他的方法到协变量回归场景，这将是自然的下一步。

张力¶

未见明显对立引用。该领域的参考文献总体上是一脉相承的：从DP先验（Ferguson）→ Beta过程先验（Hjort）→ 对BP的改进与计算（Ghosh, Walker）→ 鞅后验的一般框架（Fong）。作者将这些视为一个连续的发展，没有提及验证或驳斥结果。

二、最核心、最简单的例子 / 数学问题（先把符号/模型/可观测数据交代清楚）¶

第一步：把符号、模型、可观测数据交代清楚（必做，放在最前面）¶

符号：
- \( T \)：生存时间（随机变量，取值 \( [0, \infty) \)）。这是想要但观测不到的量。
- \( C \)：删失时间（随机变量，与 \( T \) 独立，同样取值 \( [0, \infty) \)）。这也是想要但观测不到的量。
- \( X_i = \min\{T_i, C_i\} \)：观测到的随访时间（随机变量）。这是可观测的。
- \( \Delta_i = \mathbf{I}[T_i \leq C_i] \)：删失指示符（1表示事件发生，0表示删失）。这是可观测的。
- \( Y_i(t) = \mathbf{I}[X_i \geq t] \)：风险集指标（在时间t第i个个体是否仍处于风险中）。从 \( \{X_i, \Delta_i\} \) 可计算得出。
- \( N_i(t) = \mathbf{I}[X_i \leq t, \Delta_i = 1] \)：计数过程（到时间t个体i是否发生了事件）。也是可计算的。
- \( \Lambda(t) \)：累积风险函数，定义为 \( \Lambda(t) = \int_0^t \lambda(s) ds \)，其中 \( \lambda(t) \) 是风险函数。这是目标待估量 (estimand)。
- \( S(t) = \exp\{-\Lambda(t)\} \)：生存函数。
- \( n \)：样本量。
- \( \hat{\Lambda}^{(n)}(t) \)：基于n个观测的某个估计量（如Nelson-Aalen估计量）。该序列 \( \{\hat{\Lambda}^{(n)}\}_{n=1}^\infty \) 是本文的核心构造对象。
- \( \mathbb{E}[\cdot | \mathcal{F}^{(n)}] \)：给定到第n个观测后的全部信息（包括所有观测到的 \( (X_i, \Delta_i) \) 以及 \( \hat{\Lambda}^{(n)} \) ）的条件期望。
模型：数据的生成机制是一个带有独立右删失的生存模型。即：
- 独立同分布 \( (T_i, C_i) \)，\( i = 1, \dots, n \)。
- \( T_i \) 来自某个未知的绝对连续寿命分布 \( F \)，其累积风险函数 \( \Lambda \)。
- \( C_i \) 来自某个未知的删失分布。
- 我们观察到 \( \{X_i, \Delta_i\}_{i=1}^n \)。
- 已知：我们假设 \( T_i \) 和 \( C_i \) 是独立的。这是标准假设。
- 要估的对象：\( \Lambda(t) \)（对每个 \( t \)），它是一个单调递增的、右连续、从0开始的函数。
可观测数据与潜在量：
- 可观测：\( \{X_i, \Delta_i\}_{i=1}^n \) 以及由此计算得出的 \( Y_i(t) \) 和 \( N_i(t) \)。我们看得见事件是否发生、何时发生或何时被删失。
- 潜在/不可观测：未删失事件的生存时间（如果个体被删失了，我们就不知道他的真实死亡时间），以及删失时间本身。我们只能通过假设（独立删失）和似然来“间接推断” \( \Lambda \)。

第二步：讲最小内核¶

本文的最小内核可以理解为：在独立右删失假设下，作者构建了一个序列的Nelson-Aalen型估计量 \( \{\hat{\Lambda}^{(n)}\}_{n=1}^\infty \)，证明了它构成一个（后验）鞅。然后，利用Fong等人关于鞅后验分布的一般理论，可以通过在这个序列中最后一个（即基于完全数据的）估计量上添加一定量的随机噪声（由序列的鞅差项减后笑的方差决定），直接采样得到累积风险函数的完整随机样本。

更具体地说，在一个极其简化的场景下：假设没有删失（每个人都被观察到事件发生），且只关心一个特定的小区间。

最简特例：假设我们只看一个时间点 \( t_0 \)。事件在该时间点是否发生？用伯努利变量表示。设 \( \hat{S}^{(n)}(t_0) = \#\{X_i > t_0\}/n \)（经验生存函数）。这是 \( S(t_0) = P(T > t_0) \) 的无偏估计。
构造鞅序列：现在按个体一个一个地展示数据。定义 \( \hat{S}^{(0)}(t_0) = 0.5 \)（一个任意起始值，后续会消失）。当看到第 \( i \) 个观测 \( X_i \) 时，更新估计： \( \hat{S}^{(i)}(t_0) = \frac{i}{i+1} \hat{S}^{(i-1)}(t_0) + \frac{1}{i+1} \mathbf{I}[X_i > t_0] \)。通过归纳易证：序列 \( \{\hat{S}^{(i)}(t_0)\}_{i=0}^n \) 是一个鞅（相对于由 \( \{X_1,\dots,X_i\} \) 生成的自然滤过），因为 \( \mathbb{E}[\hat{S}^{(i)} | \mathcal{F}^{(i-1)}] = \hat{S}^{(i-1)} \)。
鞅后验：Fong等人的理论说，如果一个估计量序列是鞅，那么可以通过一个“最大化熵”的过程来为最后一个估计量 \( \hat{S}^{(n)}(t_0) \) 分配一个随机分布。具体地，对该鞅序列的每个步随机化 \( \Delta \hat{S}^{(i)} = \hat{S}^{(i)} - \hat{S}^{(i-1)} \)，设其标准差与 \( \frac{1}{\sqrt{n}} \) 成正比（基于鞅CLT）。这就产生了一个随机生存概率的分布。
推广到累积风险：在累积风险的场景中，事情更复杂（因为 \( \Lambda \) 是一个函数，不是单点数），但核心思想一致：
1. 构造一个序列，而不是一个估计量：作者没有直接使用标准的Nelson-Aalen估计量 \( \hat{\Lambda}_{NA}^{(n)} \)，而是使用了一个截断版本（如在某个时间上限 \( c \) 处停止增加估计量）。
2. 证明其鞅性：证明该序列 \( \{\hat{\Lambda}_c^{(n)}\}_{n=1}^\infty \) 构成一个鞅。证明的关键在于：Nelson-Aalen估计量的增量具有玻尔兹曼性质——观察到第 \( n \) 个个体的贡献（即一个跳跃）的条件期望恰好等于在之前所有信息下的累积风险变化（忽略删失时）。有删失后，通过在处理删失观测时类似地修改更新规则（比如，如果删失，则估计量保持不变），这个鞅性质得以保留。
3. 随机化：在序列的终点（基于全部n个样本），取该终值 \( \hat{\Lambda}_c^{(n)} \)，并加上一个由序列的鞅差项方差（可估计）引导出来的随机噪声。噪声的结构由一系列的指数分布（截断的）给出，最终使得随机化后的样本自动满足累积风险函数的单调性。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究了什么问题：在右删失生存数据下，如何在没有指定先验的情况下，为累积风险函数 \( \Lambda \) 构造一个非参数后验分布，以进行不确定性量化。
核心工具/方法：使用鞅后验分布——具体而言，构造一个关于 \( \Lambda \) 的特定估计量序列（Nelson-Aalen估计量的一个变体），证明其为鞅，然后通过最大化该鞅的熵（在给定数据终结点的条件下）来随机生成 \( \Lambda \) 的样本路径。
主要结论：所提出的鞅后验分布与经典的beta过程后验在数学上等价于一种特定情况（当beta过程中的参数 \( c \to 0 \) 时）。数值模拟（虽然是有限的）表明，该方法产生的后验分布的中心与Nelson-Aalen估计量一致，且其变异性提供了不确定性量化。

关键设定与假设¶

设定：独立右删失生存数据，即 \( \{(X_i, \Delta_i)\}_{i=1}^n \)。无协变量。
记号：使用之前第二节已有的记号。
假设：
1. 绝对连续寿命分布基础：生存时间 \( T_i \) 的生存函数 \( S \) 是绝对连续的，因此累积风险 \( \Lambda \) 是绝对的（即不具有不连续跳跃）。
2. 独立删失：\( T_i \) 与 \( C_i \) 独立。这个假设对于识别Nelson-Aalen估计量是无偏的至关重要，也是本文方法的基础。
3. 鞅构造假设：通过对Nelson-Aalen估计量施加一个小的“迟滞修正”（例如，当观测到删失时，仅以一很小的概率更新估计量，否则保持原状），作者构造了一个完美鞅（perfect martingale）。这等价于在观测数据中人为引入了一个一阶小概率的随机粒，以保持鞅性质，同时不影响估计量的渐近性质。这是本文技术上的关键创意。
相比已有文献的异同：
- 与Beta过程的关系：作者明确指出，他的鞅后验相当于Beta过程在基础测度的参数 \( c \to 0 \) 时的极限情况。这提供了理论联结。
- 与频率学派方法的关系：论文没有进行比较，但隐含地，他的方法应该提供比标准渐近置信区间更宽的区间（因为后者忽略了参数化假设与模型的不确定性）。这与贝叶斯学派的一贯立场一致。

主要结果¶

定理1（鞅性质）：构造的估计量序列 \( \{\hat{\Lambda}_c^{(n)}(t)\}_{t} \)（对于固定的截尾时间c）构成一个（局部的）鞅。直觉：证明的关键是证明增量 \( d\hat{\Lambda}_c^{(n)}(t) \) 的条件期望等于零增量（即在给定历史信息下，不知道未来）。这几乎是对鞅定义的直接验证，但需要对计数和删失的随机结构精细处理。
定理2（鞅后验的分布形式）：给定数据 \( \{(X_i, \Delta_i)\}_{i=1}^n \)，鞅后验的随机路径构造为： \( \Lambda_{\text{post}}(t) = \hat{\Lambda}_c^{(n)}(t) + \sum_{i=1}^n Z_i \) 其中 \( Z_i \) 是依赖观测值的一列独立的随机变量，具体分布依赖于删失模式（事件 vs. 删失）。这里的随机性仅在序列的终结点上施加，而不是在每一步都随机，因此是“终结点随机化”。
- 必要条件：此构造要求序列的鞅差项方差可识别（从数据中估计）。这需要对各步骤 \( d\hat{\Lambda}_c^{(n)}(t) \) 的协方差结构（即鞅波动率）进行估计。作者提供了估计（例如，使用基于计数过程增量的经验方差）。
定理3（等价性）：鞅后验的有限维分布（对于时间轴上的一组有限点）与某一Beta过程后验的无限维分布等价，当Beta过程的强度参数 \( c \to 0 \) 时。技术上，这是用Beta过程的Levy测度来匹配鞅后验的随机增量分布的极限。解决的技术难点：将离散（递增）样本空间中鞅后验的构造（其由基于个体数据的离散更新组成）与连续时间beta过程的Levy测度（具有无限的跳跃数）统一起来。作者是通过将beta过程的跳跃集中在各观测点的右侧（一个已知的构造）来实现的。

主要结论的总结：鞅后验提供了一种无需具体贝叶斯先验即可获得后验推断的方法，且在渐近极限下与经典的beta过程后验一致。该方法在数学构造上比后验MCMC更简单，并能直接产生大量后验样本。

证明路线与技术技巧（理论型必写，要具体）¶

整体路线：用3-5步逻辑主干把证明串起来。
1. 构建鞅序列（节3）。作者从传统的Nelson-Aalen估计量出发，通过引入一个微小的人为干扰（当观测到删失时，用一个非常小的概率“推进”估计量与“不推进”之间的决策），使得每一步增量成为鞅。这不再是纯粹的数据生成过程，而是构造了一个新过程。
2. 确定鞅差项的结构（节4）。在鞅序列中，每一步的增量 \( \Delta \hat{\Lambda}^{(i)} \) 的分布是什么？作者推导出：对于事件观测，它是一特定参数的伽马分布；对于删失观测，它退化为一个零贡献（概率1）。由此，能识别出鞅差项的方差（即每个增量的二阶期望）。
3. 最大化序列的熵（节4）。利用Fong等人的主要结果，给定了数据终结点（即基于n个个体的鞅的最终值 \( \hat{\Lambda}^{(n)} \)），使得概率分布在所有可能的序列中具有最大熵。结果是一个泊松过程型的构造：给定最终点，每一个增量独立地从特定的分布（指数族）中采样，产生一个随机路径。
4. 与Beta过程的联结（节5）。证明该随机路径（即鞅后验样本）的分布等价于一个Levy过程。通过比较其Levy测度，证明了它对应于一个特定参数下的Beta过程。这里的关键技巧是将Beta过程的跳跃（jumps）分解为“在每个观测时刻的强制跳跃”，这对真实Beta过程来说是一种（人工的）表示，但对作者的构造是自然的。
关键跳跃点：
- 最吃功的引理：引理1（或类似名称），该引理表明了在加入了微小“扰动”后，序列增量 \( \Delta \hat{\Lambda}^{(i)} \) 的协方差结构（鞅期望）可以写成数据的一个简单函数。这允许后续的随机化，因为现在我们知道在每一步需要添加多大的随机性。
- 难点在哪儿：将“最大化熵”从有限个离散更新（\( i=1,\dots,n \)）推广到连续时间（\( t = X_i \)）的鞅。Fong的理论给出了框架，但如何应用到累积风险这种特定结构（需要单调性）是难点。作者通过构造在观测事件瞬间的跳跃来完成。
技术技巧点名：
- gamma分布 / 指数分布族更新：用于刻画在事件观测下的鞅增量分布。这是对计数过程建模的自然选择，因为泊松过程的增量的似然涉及指数分布。
- Levy测度匹配：用于将鞅后验的离散跳跃分布与beta过程的连续Levy测度匹配。这是理论联系的核心技巧。
- 最大化实现序列的熵（从Fong等人借来的技术）：这是整个鞅后验框架的核心思想。作者直接应用，并解决了在该应用中如何构造合适的鞅序列的问题。
- 序贯折刀 (Sequential Jackknife)：虽然文中未明确提及，但构造序列 \( \{\hat{\Lambda}^{(i)}\}_{i=1}^n \) 本质上是一种在线学习，每个新个体更新一次估计，类似于一个“一次性折刀”的序贯处理。这与传统的留一法（leave-one-out）有联系。作者需要确保这种序贯更新后的序列是鞅。

真实例子与应用（有就一定要讲）¶

本文有真实例子吗？ 没有。本文完全没有使用任何真实数据。这是一篇纯理论/方法论论文。
模拟实验：有一个小规模的模拟。
- 用的什么数据/场景：从某个已知的寿命分布（如Weibull分布）生成模拟数据，并随时间加入删失（均匀删失）。
- 怎么把本文方法用上去：作者在模拟数据上运行他的方法：先计算Nelson-Aalen型估计量序列；然后对序列的终结点进行随机化（根据他推导出的差异结构）；得到1000个后验样本的累积风险曲线。
- 得到什么结果：论文展示了若干张图，将后验均值曲线（实线）与真实累积风险曲线（虚线）进行对比，并给出了点态（pointwise）的后验分布范围（窄带），这通常覆盖住了真实曲线。后验样本的均值与Nelson-Aalen估计量 几乎完全重合。
- 这个例子想说明什么：验证理论。这仅想展示：
  1. 该方法是可行的——后验样本能被生成。
  2. 后验不确定性的中心位置是合理的（无偏地锚定在标准的Nelson-Aalen估计量上）。
  3. 后验分布的宽度提供了对不确定性的估计（尽管未与频率学派的覆盖概率比较）。 结论比证明窄：作者仅展示了“形状”，未检验这些后验区间的覆盖概率（即，这些区间在95%的重复模拟中是否真的包含了真实 \( \Lambda(t) \)）。仅凭“后验均值等于Nelson-Aalen”这一事实，无法判断这个后验是否具有正确的不确定性量化（因为后验的方差可能完全错误）。更关键的是，没有与频率学派的一致置信带（如同步置信带，simultaneous confidence band）进行比较，这些置信带是生存分析的黄金标准。

🔎 结论是否比证明窄¶

是的。作者的结论宣称这一鞅后验为不确定性量化提供了一条新路径，并将其与Beta过程后验建立联系。但在：

覆盖性质：文中没有证明或模拟展示该后验分布产生的区间具有名义上的（如95%）覆盖概率（无论是条件于数据还是无条件）。这是一个巨大的缺口！证明给了方法，但结论中坚称它“为不确定性提供贝叶斯量化”，却未验证这个量化的频率学派校准（calibration）性质。这是一个潜在的混淆——“构造了后验”不等于“它提供了有效的不确定性估计”。仅依靠贝叶斯逻辑（后验包含所有先验-模型假设）是不够的；必须与数据驱动的检验（如覆盖概率）配合。
计算简单性：文中声称计算上比MCMC简单。虽然避免了MCMC的复杂性（抽样、收敛诊断），但引入了一个新问题：需要估计鞅差项的方差结构（节4），这本身可能涉及复杂的积分，特别是对于大型数据集（\( n \) 很大）或当 \( \Lambda \) 的形状复杂时。这个计算负担与MCMC相比如何，未作评估。
人为扰动：构造完美鞅所需的“微小扰动”（尤其在删失观测时）的本质是什么？这个扰动对估计量的精确有限样本性质（而非渐近性质）有何影响？作者在模拟中可能没发现明显差异，但理论上这是存在的，可能对较短时间区间上的估计产生影响。作者未分析这一点。

四、开放问题（点到为止，扎根具体语句）¶

有限样本覆盖概率验证：是否该鞅后验生成的区间（点态或同时）具有频率学派的名义覆盖概率（如95%）？这需要大篇幅的分析或模拟，但论文中完全没有。应当进行模拟研究，并计算与经典Wald区间的覆盖对比。扎根： 模拟部分只展示了后验分布与真实值的视觉重合，无覆盖概率。论文未讨论“校准”（calibration）。
基础测度c的选择解释：作者建立的等价性说鞅后验对应于Beta过程中 \( c \to 0 \) 时的极限情况。但这意味着选择的先验强度极小。这是否会让后验过于方差大（即后验尾部过于重，导致过宽的区间）？或者，在某种评估标准下，这是否最优？可以探讨 \( c \) 固定在某个非零值的情况（如 \( c = 1 \)）会如何影响后验。扎根： 定理3的陈述：“the martingale posterior is equivalent to the beta process posterior in the limit \( c \to 0 \)”。
条件Cox模型的扩展：如何将这个方法扩展到含有协变量的Cox模型，以推断部分似然下的基线累积风险 \( \Lambda_0 \)？Nelson-Aalen估计量变为Breslow估计量。Breslow估计量是否也构成一个鞅序列？需要检验在拟合部分似然参数后，针对基线风险构造的序列是否仍是鞅，这可能需要额外的假设和控制。扎根： 论文全文在无协变量设定。引言提到“purely nonparametric model”，未提及Cox模型。
corner为条件独立的情况的扩展：文章的假设是独立删失。如果删失与生存时间条件独立（例如，基于某些观察到的协变量）的情况呢？鞅序列构造是否仍能保持鞅性？这涉及到对偏向的估算，部分似然可能有用。扎根： 独立删失是最常见假设，但实践中很少完全成立。论文没考虑该鲁棒性问题。

Maintained by 陈星宇 · Homepage · Source on GitHub