Mediation Analysis With Bayesian Nonlinear Joint Models: Evaluation of the Treatment Causal Pathways Between Tumor Growth Kinetics and Overall Survival¶

作者: Georgios Kazantzidis, Francois Mercier, Virginie Rondeau
来源: Statistics in Medicine
主题: 因果推断
相关性: 7/10
链接: https://doi.org/10.1002/sim.70574

一、领域脉络与小综述¶

这个方向是什么¶

本文处理的核心问题是纵向中介分析：在一个线性或非线性纵向过程中，一个连续测量的中介变量（如肿瘤大小）随时间变化，研究者希望将处理变量（如抗癌药物）对终点变量（如总生存期，OS）的因果效应分解为“通过中介变量路径的间接效应”和“不通过中介变量的直接效应”。这种分解在医学临床试验中被用于评估中介变量是否可以作为终点的替代终点（surrogate endpoint）。本论文的特殊定位在于，中介变量是非线性的（由肿瘤生长抑制模型TGI刻画），并且以联合模型的方式将纵向子模型与生存模型链接。

发展脉络（从introduction + 被引文献构建）¶

奠基工作——因果中介分析的基本框架（Causal mediation without longitudinal mediator）: 经典中介分析源于Baron & Kenny (1986) 的线性路径框架，但它的识别依赖于线性性与无交互假设。Imai, Keele & Yamamoto (2010) 以及 Pearl (2001, 2014) 将天然直接效应(NDE)与天然间接效应(NIE)建立在反事实框架上，提出非参数识别条件（序贯可忽略性, sequential ignorability），并在参数/半参数模型下给出估计。这部分工作是本文formally使用的定义基础。
纵向生物标志物作为中介变量（Longitudinal mediator as a time-varying variable）: 当中介变量是时间依赖的且被重复测量，标准中介分解需要小心时间次序与并发性。已有工作包括 Lin et al. (1997) 在联合模型框架下将中间生物标志物作为时变协变量引入Cox模型（但未做中介分解）；Albert (2008, 2012) 提出在纵向中介中通过随机效应共享来捕获中介变量与结局的相关性。这是本文直接继承的方法论来源——特别是其采用贝叶斯层级模型共享随机效应的做法。
处理效应比例(PTE)的应用与争议: PTE最初由Freedman, Graubard & Schatzkin (1992) 提出，后由Wang & Taylor (2002) 在纵向中介设定下推广。关键争议在于：当PTE在某一时间点接近1或0时，是否切实支持替换终点？本文引用Simon (2001), Burzykowski et al. (2005), 以及Buyse et al. (2007) 来表明PTE在肿瘤学中作为中介量已被大量应用，但其如何随时间变化以及在非线性中介模型下如何定义，仍然不清楚。因此本文的framing：将PTE放入随时间变化的非线性TGI纵向模型来解决这个开放问题。
当前frontier与本文位置: 近年来，纵向中介分析已有若干进展（如Burgess et al., 2015, 用工具变量处理时变中介；VanderWeele & Tchetgen Tchetgen, 2017, 用边际结构模型），但将这些工具直接整合到肿瘤生长动力学的非线性模型中并以贝叶斯方式实现的研究很少。本文的独特位置是：在一个具体的、生物学驱动的非线性TGI模型下给出NDE/NIE/PTE的估计与不确定性评估，并将纵向子模型、参数生存模型、多种链接函数、处理效应不同参数化统一到一个贝叶斯框架。

子线索聚类¶

子线索	代表性工作	做的事情	留下什么口子?
自然直接/间接效应(NDE/NIE)框架的识别与估计	Imai et al. (2010), Pearl (2014), VanderWeele (2015)	确立了基于反事实和序贯可忽略性的识别条件，给出参数/半参数估计。	这些方法局限在单时点、线性或参数化的中介变量，对纵向连续测量且非线性的中介变量几乎没有处理。
纵向与生存联合模型的参数化方法（Joint models for longitudinal and survival data）	Rizopoulos (2012), Crowther et al. (2012), Ibrahim et al. (2010)	将纵向模型与Cox或参数生存模型通过随机效应/链接函数连接，处理内生性。	联合模型不涉及中介分解，只做纵向协变量对生存的因果效应估计，不区分直接与间接路径。
处理效应比例在肿瘤学中的应用 (PTE as surrogate endpoint)	Wang & Taylor (2002), Buyse et al. (2007); 以及在实际临床试验(TRIANGLE, IMBrave150)中的使用	将肿瘤大小变化视为对总生存的中介，通过比例效应评估替代潜力。	PTE只在某些假设（线性Y-M关系、固定处理效应参数化）下可解释，没有讨论随时间变化的PTE，也未充分考虑肿瘤再生长动力学的非线性结构。

这个方向在追问的核心问题¶

纵向中介的识别条件(Sequential ignorability是否合理？在动态治疗与非随机删失下如何调整？)
中介变量是连续观测到的还是离散（纵向测量是稀疏的，如何在两个观测点之间插值介质？）
中介效应是否随时间变化（如肿瘤在早期缩小、后期再生长，PTE在哪些时间窗口最强？）
中介量是否要求病人在该时间点存活(以死亡为终点的中介分析，遇到竞争风险或介导终点的同时存活定义问题——即复合结局假说)。

⚠️ 作者的framing¶

作者将缺口框架化为：在非线性肿瘤生长动力学（TGI）下，如何对处理通过肿瘤大小到达生存的因果路径进行中介分析，并让NDE/NIE/PTE可以随时间变化，从而使PTE能够真实反映治疗机制的动态特性。

被淡化/回避的竞争路线: 作者mention了“非参数识别”可能更理想，却立即选择了一个高度参数化的贝叶斯层级模型。他们没有与不依赖于贝叶斯规格的边际结构模型或双重稳健估计进行比较（这些是当前零模型半参数中介分析的强竞争者）。
值得研究者去查的问题:
- 为什么本文没有采用g-formula或IPW方法来处理纵向中介中的时变混淆？作者在Introduction中完全没有讨论对时间依赖性混淆的处理（如treatment → confounder → mediator → outcome中的后门路径）。
- 关于序贯可忽略性：作者假定肿瘤大小缺失是随机的？没有讨论测量时间依赖的肿瘤删失（如因死亡/病情进展停止测量）带来的非随机缺失问题。这是纵向生存联合模型中的一个经典问题（Rizopoulos 2012专门有章节处理“dropout”），但本文未在Introduction中提及。
- 未见明显对立引用：整体引用网络一致性强，主要是应用导向，理论争辩不多。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据交代清楚¶

符号（核心记号）¶

A: 处理变量（二值：treatment vs. control）。通常随机化。
M(t): 在时间t时测量到的肿瘤大小（以肿瘤直径之和sum of longest diameter, SLD表示）。关键注意：M(t)是随时间连续变化的潜在过程，但只在离散时间点（例如每6周）观测到。
Y: 总生存时间（OS，从随机化到死亡事件的时间）。可能右删失。
δ: 事件指示变量（1=死亡已观测，0=删失）。
U_i: 个体水平随机效应向量（例如基础水平截距、处理对肿瘤缩小的影响、再生长速率等）。U_i捕获个体之间_tumor growth kinetics_的异质性。
X: 基线协变量（如年龄、性别、ECOG评分）。
t_ij: 第i个个体第j次观测的测量时间。
η_i(t): 在时间t的线性预测项，在TGI模型中定义为处理效应的函数（见下）。

模型（本文采用的数据生成机制）¶

纵向子模型（非线性的肿瘤生长抑制模型，TGI）：
\[M_i(t) = f_i(t) + ε_i(t)\]
其中\(f_i(t)\)来自一个华氏方程型模型(Pinheiro et al., 2016)：
\[f_i(t) = \pi_0 + \pi_1 \cdot \frac{1 - e^{-\beta t}}{1 + e^{(\gamma - t)/\delta}} \cdot \text{[处理效应项]}\]
这是高度参数化的非线性函数——它包含了肿瘤缩小速率(~1 - e^{-β t})与再生长速率(由一个logistic函数1 / (1 + e^{-(γ - t)/δ})刻画)的组合。处理效应项可以指定为调节缩小速率或再生长速率，详见本文的主要参数化（appendix）。为了理解最小内核，我们可设想一个更简单的特例。
生存子模型（参数生存）：
\[h(t \mid U_i, M_i(t), A_i) = h_0(t) \exp\left[α_1 A_i + α_2 M_i(t) + α_3 U_i\right]\]
这是标准的时变协变量Cox型生存模型，但用一个链接函数\(l(\cdot)\)将纵向预测值\(f_i(t)\)与基线的随机效应\(U_i\)一起作为线性预测。
链接函数\(l(\cdot)\): 本文测试了多种链接函数，如\(l(M_i(t)) = M_i(t)\)（线性链接），或\(l(M_i(t)) = \log(M_i(t))\)（对数链接），以及\(l(M_i(t), U_i) = f_i(t) + U_{i,\text{slope}}\)等更复杂的版本。
处理效应参数化：处理效应被参数化为\(A_i\)对TGI子模型参数（如缩小速率\(\beta\)或再生长速率\(\gamma\)）的线性影响。

可观测数据 vs. 潜在/不可观测量¶

可观测: \((A_i, X_i, \{M_{i1},...,M_{in_i}\}, Y_i, \delta_i, \{t_{i1},...,t_{in_i}\})\)
不可观测量:
反事实的纵向过程\(M_i(t; A=0)\)和\(M_i(t; A=1)\)——即如果一个人接受了不同的处理，他的肿瘤如何在每个时间点变化。
反事实生存时间\(Y_i(a, m(t))\) ——如果在处理水平\(a\)且迫使\(M_i(t)=m(t)\)时的生存时间。
个体水平的随机效应\(U_i\)——只能通过贝叶斯后验推断。

关键识别假设（唯一性）：识别NDE/NIE必须假设无未观测混淆（ignorability）：给定基线X，处理效应与反事实纵向过程独立（即\(A \perp M(0), M(1)\)）给定X；且给定处理A和纵向过程历史，未来死亡与反事实纵构过程独立（时序无混淆）。这是因为本文没有使用工具变量或邻近因果工具来处理内生的M(t)。

第二步：最小内核¶

最简特例：“单测量点肿瘤大小作为中介” vs “TGI非线性中介”¶

让我们从单测量点、线性中介的经典设定退一步，然后加上非线性的盐，就可以看清本文增加的层。

标准Baron-Kenny线性中介（无纵向、无非线性）： - 总效应TE = c（处理A对Y的回归） - 路径1: a（A→M的系数）, 路径2: b（M→Y, 控制A后的系数） - 直接效应DE = c'（控制M后A对Y的系数） - 间接效应IE = a × b

【本文的关键非线性扩展】：当M(t)是用非线性TGI模型生成的（具有收缩速率可受处理调节，而再生长速率也受处理调节），则a不是简单线性系数——它是处理对TGI参数（如收缩速率β）的影响。因此a × b的线性分解不再是正确的间接效应。

最小可理解例子：假设只有一个时间点t=1的肿瘤大小M_1可观测。我们使用一个朴素TGI模型：

\[M_i(1) = π_0 + β_{A_i} \cdot (1 - e^{-t}) + ε_i\]

其中处理效应只作用于斜率项β（因此如果A=1，β较大，肿瘤缩小更快），而不是简化成线性回归项。这时NDE/NIE的分解变成： - NIE = E[M(1; A=1) - M(1; A=0)] × (M→Y的效应当M固定为M(1; A=1)时的值) ——其实不可直接计算，因为M是连续路径，不是单点。本文做的事情就是将这个概念扩展到全时间轴（t=0到最大随访），然后通过参数生存模型计算每个t的PTE。

核心数学困难：由于M(1)是非线性函数，而Y是生存时间，两者的“乘积”（即a×b型间接效应）在非线性下破碎。本文的解决方式很直接：用贝叶斯层级模型估计完整数据生成机制，然后通过后验预测计算边际NDE/NIE，用抽样的方式来积分掉随机效应，从而避免对非线性模型进行直接的参数分解。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在抗癌治疗对总生存的因果路径中，肿瘤大小的非线性生长动力学（TGI）作为中介变量，处理效应通过缩小前速度与再生长速率的调整（两种参数化方案）传递到生存结果，这条路径的中介效应如何被量化（NDE、NIE、PTE），以及它们是否随时间变化。
核心工具/方法：一个贝叶斯层级联合模型，包含一个非线性纵向肿瘤抑制子模型（TGI）和一个参数生存子模型，由多种生物学驱动的链接函数（线性/对数/联合随机效应）连接，通过MCMC进行后验推断，并从后验分布计算边际的NDE/NIE/PTE。
主要结论：在第一波IMBrave150 III期试验的应用中，肿瘤动力学仅部分中介处理效果（PTE在治疗期约30-40%），PTE随时间变化——早期治疗效应主要通过肿瘤缩小中介，后期可能与肿瘤重新生长同步。

关键设定与假设¶

在第二节最小记号基础上，补全完整设定：

纵向子模型（TGI）的具体形式（来自Pinheiro et al. 2016）：
\[M_i(t) = π_0 + π_1 \cdot A_i^{\text{effect}} \cdot \frac{1 - e^{-θ t}}{1 + e^{(γ - t)/δ}} + ε_{i}(t)\]
其中\(A_i^{\text{effect}}\)是处理对肿瘤缩小的调节，设定为：
参数化1（Parameterization A）：\(A_i^{\text{effect}} = \exp(β_1 A_i)\)，处理仅影响缩小幅度。
参数化2（Parameterization B）：\(A_i^{\text{effect}} = (1 + β_2 A_i) \cdot \left[ 1 + β_3 A_i \cdot \frac{1 - e^{-θ t}}{1 + e^{(γ - t)/δ}} \right]\)，处理同时影响缩小幅度与再生长拐点。关键：与标准联合模型不同，处理效应不是作为线性项加入生存子模型，而是通过参数化TGI模型的结构性非线性体现。
生存子模型（如Weibull或Gompertz）：
\[h_i(t \mid U_i, A_i) = λ \cdot ρ \cdot t^{ρ-1} \cdot \exp[η_i(t)]\]
其中线性预测量\(η_i(t)\)包括：
\[η_i(t) = α_1 A_i + α_2 f_i(t) + α_3 U_{i,\text{intercept}}\]
\(f_i(t)\)是随机效应部分的纵向预测值。
贝叶斯先验设定：
固定效应（α, β, π, θ, γ, δ）用宽松的正常先验（Normal(0, 100)）。
随机效应协方差矩阵用逆Wishart先验（自由度=4）。
观测误差用Inverse Gamma先验。注意：选择贝叶斯而非频率主义极大似然，主要为了更容易从后验抽样计算边际NDE/NIE/PTE（不需要复杂的Delta方法）。
识别假设（P.4-5原文）：
序贯可忽略性：处理分配独立于潜在结果给定基线协变量（这在随机化试验中通常成立）。
无删失与非随机缺失：假定肿瘤缺失是随机的，且删失是非信息性的。
比例风险或参数形式：生存模型被假定为参数形式（Weibull/Gompertz），未与Cox部分线性竞争。
未对M(t)的测量精度做假设：假定观测的M(t)无测量误差。

主要结果（理论+模拟+实证）¶

模拟研究（Table 1-2, P.10-11）：
在中等程度的中介效应下（PTE≈0.6），模拟样本量n=200时的NDE/NIE覆盖概率对between 85-92%（低于名义95%，但可接受），PTE覆盖较差(60-70%)。
当中介效应很弱(PTE≈0.1)时，PTE可识别性变差——PTE的后验区间跨0且覆盖比例低(chapter in simulation)。这符合直觉：弱下游机制很难精确估计中介比例。
随样本量增加（n=400→800），所有中介量的偏差与覆盖概率改善，但PTE改善最慢（仍低于90%覆盖在n=800）。
参数化B（处理影响再生长） 比参数化A（仅影响缩小）产生更大的NIE，这与肿瘤再生长对总生存的直接负面影响一致。
IMBrave150实例应用（P.12-14）：
使用的数据是来自III期试验的363名（治疗组）+ 178名（对照组）肝细胞癌患者，肿瘤测量每6-8周一次，中位随访约20个月。
结果：
- 治疗组（Atezolizumab+Bevacizumab vs. 安慰剂）明显降低死亡风险（HR=0.58）。
- 通过TGI模型，治疗组的肿瘤在初始缩小显著（缩小速率快），但在约6个月后开始再生长。
- PTE在治疗早期（前3个月）约30%，在6个月后上升至约50-60%，而后逐渐回落，这与肿瘤再生长速率逐渐显现的分析吻合：早期患者的肿瘤缩小解释了较多生存获益，后期非肿瘤机制（如免疫记忆、抗血管生成）的额外效应增加。
- 重要论断：PTE中位数在治疗期约40%，即肿瘤动力学解释了大约40%的处理总效应，60%由肿瘤非直接路径（如免疫调节、肿瘤微环境变化）引起。这说明仅用肿瘤动态作为替代终点会高估治疗的真实效果——此刻是本文的核心发现了。

证明路线与技术技巧（理论型论文特点—但本文更多是方法型/推断型，所以不用拆证明跳跃点）¶

由于该文是贝叶斯应用而非理论证明，不涉及严格的大样本效率界或最小最大率。其方法依托以下逻辑链：

步骤1：设定贝叶斯联合模型。指定参数先验、似然（纵向TGI+生存+链接）。
步骤2：MCMC采样。用Hamiltonian Monte Carlo (HMC) 对后验分布采样。
步骤3：从后验定义NTM。利用已经采样的参数，加上每个个体的随机效应后验，能够模拟每个个体的反事实纵构过程：设定A=0重新运行TGI，模拟M^{(0)}，以及在给定M^{(0)}下的生存时间Y^{(0, m^{(0)})}。
步骤4：计算边际NDE/NIE：
NDE(t) = E[Y(A=1, M(0)) > t] - E[Y(A=0, M(0)) > t] (在时间t的生存率差异，其中的M(0)代表的是让中介变量保持对照水平的纵向过程)
NIE(t) = E[Y(A=1, M(1)) > t] - E[Y(A=1, M(0)) > t]
具体如何计算：后验抽一次样就产生一条M(0)与一条M(1)过程，接着把M(0)带入生存模型求生存函数，再在给定M(1)下同样计算。跨多次后验求平均。
步骤5：PTE(t) = NIE(t) / [NDE(t) + NIE(t)]。这个比例可以随时间变化。

技术技巧点名： - 贝叶斯层级模型架构以及HMC（用于非线性的高维随机效应后验采样）。 - 递减函数（华氏模型中的logistic函数形式）来捕捉TGI的反弹拐点。 - 链接函数的多种参数化对中介效应的敏感性测试（这本身是贝叶斯稳健性的一种形式）。

真实例子¶

IMBrave150 III期试验（肝细胞癌）： - 数据：541名患者（治疗组Atezolizumab+Bevacizumab vs. Sorafenib）。每位者在治疗开始时、每6-8周、以及在停止治疗或死亡时有一次肿瘤大小测量（总长度，SLD）。 - 纵向建模：用TGI模型拟合每个患者的SLD轨迹，允许个体随机效应来描述基础肿瘤负荷、缩小速率和再生长拐点。 - 生存结局：OS（总生存时间），信息右删失。 - 链接选择：在贝叶斯模型比较（DIC）中选择链接函数f_i(t) + U_{intercept}作为从纵向到生存的最佳链接。 - 结果输：PTE的随时间变化（如上所述）是主要事实发现——这是一个本质上无法从标准Baron-Kenny或单测量点中介分析中获得的东西。

🔎 结论是否比证明窄¶

是。作者的主要claim是“肿瘤动力学部分中介处理效应，PTE随时间变化”。但是：

结论窄于证明的版本：本文只在一个III期试验（IMBrave150）中演示了方法，没有做交叉验证或跨试验复制。所以“部分中介”即使用了很多稳健、精细的分析，其可推广性也受限于这个特定癌症、特定单抗检验组合。
PTE随时间变化的模式没有被拒绝但与某些假设绑定：这个结果高度依赖于TGI模型的参数化B（处理影响再生长速率）。如果用一个只影响缩的参数化A，PTE会显著不同（输出稳定？作者在讨论中承认：“The choice of parameterization influences the estimated PTE”，P.15）。结论还没有完全分清算方法的非辨识度——即随模型设定不同，PTE不仅估计量会有差异，连模式的定性走势（如PTE先升后降 vs. 一直下降）也可能翻转。
纯理论缺失：本文完全没有提供任何大样本性质的论证（一致性、效率、双稳健属性），因此无法排除在特定数据设置下贝叶斯后验均值会系统性偏离真值（misspecified prior的影响没有检查）。

四、开放问题（点到为止）¶

基于本文的限制，以下打开的问题扎根于论文的具体语句：

非参数/半参数效率界与双稳健估计——本文所用的完全参数贝叶斯联合模型使得效率与双稳健性未被探索。参见作者在第3节末尾的future work（“拓展至更灵活的半参数生存模型”）。可从这一句延伸，尝试对NDE/NIE/PTE在时变中介设定下导出半参数有效影响函数，并建立cross-fitting estimator。
处理效应时变属性与设备致死性——作者承认PTE随时间变化，但没有测试在非比例风险生存模型下这些指针是否仍然会计量出一个干预的“比例”。未来工作必要证明：当生存曲线交叉时（治疗晚期效果大增），NDE/NIE分解的识别是否破碎，以及如何用Aalen加性模型替代比例Cox模型进行中介。
非随机缺失与处理切换——本文假设肿瘤缺失为随机删失（MCAR），但实际中更常见为MAR或MNAR（因进展/死亡停止测量）。可扩展的方向包括：用模式混合物或共享随机效应处理“non-ignorable dropout”，使结果更稳健。
计算效率: 在TGI模型中对每个个体采样随机效应，MCMC在n>500时已经“intensive”(P.16)。考虑使用变分贝叶斯或ADVI降速，同时保留后验的不确定性量化——这可以与您的计算背景（软件开发、高效推理）对接。

提示：要确认（1）是否确实是开放问题，需阅读与本文相同领域最近5篇关于纵向中介的非参数识别的论文（如VanderWeele & Tchetgen Tchetgen 2017, Lindquist 2012**s补充）。如果所有在最近的涌入中都指向同一缺口，那它就是一个真正的open problem。

Maintained by 陈星宇 · Homepage · Source on GitHub