跳转至

Continuous-time mediation analysis for repeatedly measured mediators and outcomes

作者: Kateline Le Bourdonnec, Linda Valeri, Cécile Proust-Lima
来源: Biometrics
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么

这个子方向解决的根本问题是在纵向研究中,如何分解一个时间固定暴露(如基因型、教育水平)对连续追踪的结局变量(如认知功能、功能依赖)的因果总效应,识别出哪些部分是通过随时间变化的中介变量(如抑郁症状、脑损伤)传递的(间接效应),哪些是剩余的直接效应。其核心难点在于:中介和结局是随时间连续演化的过程,而非单一时间点的测量;且测量时间点往往是个体特异性的、不规则的(如临床随访数据)。当前成熟度处于从离散时间向连续时间框架的过渡期,已有方法论在工作,但尚无公认的通用框架。

发展脉络(history)

奠基工作(约2010–2015): - VanderWeele (2011):将中介分析从固定时间点的连续/二值结局推广到生存结局(time-to-event)。引用语揭示:"introduced methods for time-to-event outcomes with both the exposure variable and the mediator measured at a single time-point." 这是一个重要的起点,但其设定仍是"single time-point",尚未触及纵向过程。 - VanderWeele, Vansteelandt & Robins (2014):针对存在"exposure-induced mediator-outcome confounder"这一关键问题,提出随机干预效应(stochastic / interventional effects)。引用语:"stochastic effects don't require the cross-world independence assumption, and thus apply more broadly notably in the presence of an exposure-induced confounder." 这绕过了自然效应识别中的一个核心障碍,为后续处理时变混杂开辟了道路。

主要进展(约2016–2020):向纵向、多中介、不规则测量推进 - VanderWeele & Tchetgen Tchetgen (2016):正式将中介分析推广到时变暴露和时变中介。提出了"mediational g-formula",作为处理时变混杂下效应分解的识别公式。引用语:"we define a randomized interventional analogue of natural direct and indirect effects that are identified in this setting." 这是将自然效应框架移植到纵向的关键步骤,但假设暴露和中介在离散时间点测量(如每年一次)。 - Mittinty & Vansteelandt (2019):引入了自然效应模型(natural effect models),参数化基线暴露对纵向中介和结局的直接与间接效应。引用语:"introduced so-called natural effect models, which parameterise the direct and indirect effect of a baseline exposure with respect to a longitudinal mediator and outcome." 这一工作跨越了"cross-world counterfactuals"的障碍,但仍假设离散且规则的测量时间。 - Albert et al. (2019):这篇是本文最直接的先驱,首次提出连续时间因果中介分析。引用语:"considered a mediator and an outcome both defined in continuous time." 其方法基于微分方程模型,在潜在结果框架下定义自然直接和间接效应,并建立了与重复测量模型的连接。但如本文引言所指出的,"the mediator and outcome are assumed to be continuous and Gaussian", 且没有考虑时变混杂过程 L_t,估计也采用两步法而非联合建模。

当前前沿(2021–2024): - Valeri et al. (2021):在随机干预的方法框架下,将中介和结局都处理为时间到事件(time-to-event),使用多状态模型。引用语:"considered time-to-events for both the mediator and outcome." 但与本文的连续观测过程框架不同。 - Tai et al. (2022):扩展mediational g-formula到多重时变中介。引用语:"extended the approach to multiple longitudinal mediators." 但仍基于离散时间。 - Pullenayegum et al. (2023):关注不规则评估时间下的因果推断,提出逆概率加权和多重输出法。本文引用它作为处理不规则测量时间的相关文献,但该工作主要关注暴露效应估计,而非针对中介分析。

  • 本文的位置(作者的framing):本文声称是第一个在连续时间框架下,同时(i)将中介和结局视为潜在过程(latent processes),(ii)纳入了时变混杂过程 L_t,(iii)采用基于微分方程的联合多元混合模型进行估计,且能处理不规则个体特异性测量时间。定位为将Albert et al. (2019)的开创性工作向更现实、更具一般性的方向推进。

子线索聚类

  1. 离散时间纵向中介分析(Line 1: Discrete-time longitudinal mediation)
  2. 核心方法:mediational g-formula (VanderWeele & Tchetgen Tchetgen, 2016)、natural effect models (Mittinty & Vansteelandt, 2019)
  3. 代表论文:VanderWeele & Tchetgen Tchetgen (2016), Mittinty & Vansteelandt (2019), Tai et al. (2022)
  4. 特征:假设测量时间规则(如固定间隔),处理时变混杂,但时间被离散化。

  5. 连续时间因果中介分析(Line 2: Continuous-time causal mediation)

  6. 核心方法:微分方程建模、多状态模型
  7. 代表论文:Albert et al. (2019), Valeri et al. (2021)
  8. 特征:在连续时间框架下定义因果效应,但Albert et al.未考虑时变混杂,Valeri et al.聚焦于time-to-event中介。

  9. 随机干预效应 vs. 自然效应(Line 3: Interventional vs. Natural effects debate)

  10. 核心讨论:在存在暴露诱导混杂时,自然效应不可识别,随机干预效应是可识别的替代。
  11. 代表论文:VanderWeele, Vansteelandt & Robins (2014), Moreno-Betancur & Carlin (2018)
  12. 特征:这不是一个独立的方法流派,而是贯穿于所有子线索的概念张力,本文选择走自然效应路线。

这个方向在追问的核心问题(2–4个)

  1. 识别假设的权衡:在连续时间、存在时变混杂、且测量不规则的设定下,需要多强的假设(交叉世界独立性?无混杂变化?测量过程的非信息性?)才能识别直接/间接效应?识别假设与离散时间设定相比是更强还是更弱?
  2. 不规则测量时间的处理:如何避免将个体特异性的访视时间离散化、区间化所引入的信息损失和偏倚?潜在过程模型能在多大程度上"补齐"缺失测量?
  3. 计算与模型的可行边界:当过程和变量维数增加时,基于微分方程的多元混合模型的计算负担如何?收敛性是否有保证?
  4. 效应定义的统一:自然效应、随机干预效应、路径特定效应(path-specific effects)在连续时间下能否被统一表述?哪一个更接近科学问题本身?

⚠️ 作者的 framing(必须明确标注成"这是作者的说法")

  • "本文是第一个在连续时间框架下处理不规则测量、含时变混杂的纵向中介分析的方法,并提出了切实可行的估计方案。"——这是作者在引言和讨论中反复强调的声称。
  • 竞争路线(如离散时间框架)被淡化:作者多次指出离散化会"忽略连续的实质过程"且"对不规则时间点无能为力",但未讨论离散化在某些设定下可能更简便可解释、对SNR更有利的可能性。
  • 一条明显该被引用或被讨论、但没出现在引言的路线:双稳健估计(DR/DML)方法在纵向中介中的应用。现有文献(如Vansteelandt et al. 2012, Díaz et al. 2020)已有许多工作将双稳健思想用于中介分析,但本文的估计只基于参数化混合模型(MLE),并未探讨双稳健或半参数最优估计的可行性。这可能是因为强调偏于应用(Biometric期刊风格),但仍是一个值得注意的缺口。

张力

未见明显对立引用。被引工作主要在假设和设定上有不同的取舍(离散时间 vs 连续时间;自然效应 vs 随机干预效应;单过程 vs 多过程),但不存在互相矛盾的结论。一个值得注意的微妙差异:Albert et al. (2019) 认为使用两步法估计(先拟合中介模型,再代入结局模型)是可行的,而本文采用联合建模,认为两步法可能导致有效标准误偏差且无法充分利用数据相关性。这不是根本矛盾,而是方法论偏好差异。


二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号
  • X:时间固定暴露(time-fixed exposure)。对每一个体,取一个固定值(如教育水平分类、基因型)。
  • t:连续时间,t ∈ [0, τ],τ为最大随访时间。
  • M_t:潜在中介过程(潜在的、连续时间上的随机过程)。每一个体有一个未观测到的连续轨迹。
  • Y_t:潜在结局过程。
  • L_t:时变混杂过程(time-dependent confounder),同时影响M_t和Y_t,且受暴露X影响。
  • C:基线协变量(时间固定混杂)。
  • Y(t), M(t), L(t)观测值:实际在第j次访视时的测量值 Y_{ij}, M_{ij}, L_{ij},对应访视时间点 t_{ij}
  • T:总随访时间区间上限(如研究结束时间)。
  • N:个体数,n_i:第i个个体的访视次数。
  • 潜在结果记号:Y_t(x, m) 表示在暴露X被设为x、中介过程M被设为m时的潜在结局过程。M_t(x) 表示在暴露X被设为x时的潜在中介过程。

  • 模型

  • 本文采用的模型是一个基于微分方程的多变量线性混合模型(multivariate linear mixed model based on differential equations)。对于潜在过程 M_tY_tL_t,假设它们服从一个受线性微分方程系统驱动的连续时间高斯过程。
  • 具体而言,每个子过程由固定效应部分 + 随机效应部分 + 测量误差构成。子过程之间的依赖通过微分方程被建模为:
    d/dt (M_t, Y_t, L_t) = A(t) * (M_t, Y_t, L_t) + B(t) * X + 其他项
    
    其中A(t)是过程自回归和交叉效应矩阵(如M_t的变化如何依赖于L_t的当前值),B(t)X是暴露的直接效应。
  • 这实际上是一个连续时间的结构方程模型(continuous-time SEM),其中箭头变成了微分方程中的导数项。

  • 可观测数据

  • 能观测到:对每个个体i,观测到其在不规则的访视时间点 {t_{i1}, t_{i2}, ..., t_{in_i}} 上的 中介测量值 {M_{i1}, ..., M_{in_i}}结局测量值 {Y_{i1}, ..., Y_{in_i}}时变混杂测量值 {L_{i1}, ..., L_{in_i}},以及基线协变量C_i和暴露X_i
  • 观测不到:个体水平的潜在过程轨迹 {M_t, Y_t, L_t} —— 它们被视为潜在变量,其演化由随机效应参数刻画。同时,反事实(如Y_t(x, m)对于某个没有实现的(x, m)组合)也是观测不到的。
  • 关键识别物:在整个模型中,微分方程系统参数(固定效应、随机效应协方差阵、测量误差方差)是从观测数据中通过似然函数估计的。一旦这些参数被估计,就可以通过模型驱动的预测来"外推"任意T、x、m组合下的潜在反事实过程值,进而计算因果效应。

第二步:讲最小内核

为了展示连续时间中介分析的核心思想,在没有时变混杂和仅两个观测时间点的最简特例下理解,能极其直观地揭示本文方法的本质。

【最简特例】:假设没有协变量C,没有时变混杂L_t,每个个体只有一个固定的中介测量时间点和结局测量时间点(即回到经典的单时间点中介分析)。但不同于经典,我们此时允许测量时间在个体间是不规则的、且将过程视为连续轨迹。

  • 设定:每个个体i在随机的时刻t_i测得中介值M_i(t_i),在稍后随机的时刻s_i > t_i测得结局值Y_i(s_i)X_i为固定暴露。假设不存在不可观测混杂(序列可忽略性成立,即给定过去,结局Y_i(s_i)与M_i(t_i)独立)。
  • 数据{X_i, t_i, M_i(t_i), s_i, Y_i(s_i)}_{i=1}^N
  • 模型(简化为线性):假设潜过程M(t)和Y(t)遵循最简单的线性混合模型:
  • M_i(t) = α_0 + α_1 t + β_M X_i + u_i + ε_M_i(t) (u_i是个体随机截距)
  • Y_i(s) = θ_0 + θ_1 s + β_Y X_i + γ_Y * M_i(t) + v_i + ε_Y_i(s) (v_i是个体随机截距,γ_Y是M_t对Y_s的效应)
  • 目标:将XY在时点s的总效应分解为直接效应(不经过M)和间接效应(经过M)。
  • 总效应:对于任意固定的s和t:E[Y(s)|X=x] - E[Y(s)|X=x*]
  • 自然直接效应(NDE)(在个体水平上对应反事实Y_s(x, M_t(x*))):将暴露设为x、但中介过程固定为暴露x*时的预期结局变化。在最简线性模型中,它等于 (β_Y + γ_Y * β_M_t) * (x - x*)。其中β_M_t是中介在时点t的暴露效应,β_Y是直接效应,γ_Y是中介到结局的效应。
  • 自然间接效应(NIE)γ_Y * β_M_t * (x - x*)
  • 识别:这个分解在已知模型参数时是直接的。关键是这两个因果效应依赖于具体的时点t(中介测量时刻)和s(结局测量时刻),而本文的连续时间框架将t和s视为连续变量,因此因果效应是时间t和s的连续函数。在没有不规则测量时这个简例是平凡的,但一旦加入不规则测量和随机效应,模型必须考虑个体不规则的访视时间,并用似然来"补齐"每一条轨迹。

【核心思路】:这个最简特例揭示了本文的核心思想:将中介和结局视为连续时间上的潜过程,然后用微分方程驱动的线性混合模型作为桥梁:通过联合估计过程参数(a)刻画过程在任意连续时间点的相关性(b)允许数据以不规则的时间点贡献似然。一旦参数被估计,我们就能预测出在任意暴露水平x下、在任意时间t的潜过程值,从而定义和计算自然因果效应作为时间的函数。


三、这篇论文做了什么

三句话

  1. 研究了什么问题:在连续时间框架下,针对存在时变混杂过程不规则个体特异性测量时间的纵向数据,定义并估计暴露对重复测量的中介和结局过程的自然效应和路径特定效应。
  2. 核心工具/方法:采用基于微分方程(ODE)的多变量线性混合模型对潜在过程 (M_t, Y_t, L_t) 进行联合建模,在最大似然框架下进行估计,进而基于模型参数的后验预测来估计因果效应。
  3. 主要结论:所提出方法在模拟实验中表现出良好的性能(偏倚小、覆盖好),在3C研究的两个真实数据例子中成功分解了因果路径,揭示了之前未被(离散时间方法)揭示的复杂关系。

关键设定与假设(在第二节基础上补全)

  • 测量模型: 潜在过程通过线性观测方程与观测指标关联:Y_{ij} = Y_t_i(t_{ij}) + ε(Y)_{ij},其中ε(Y)_{ij}是独立同分布的测量误差(通常假设高斯)。对M_tL_t同样。潜在的Y_t、M_t、L_t本身是连续的,但我们在离散时间点拿到带噪声的观测。
  • 过程演化假设(ODE Model): 潜在过程 (M_t, Y_t, L_t) 的瞬时变化(导数)是它们自身当前值和暴露X的线性函数。本文采用的结构是:
    d/dt (M_t, L_t, Y_t) = A × (M_t, L_t, Y_t) + b × X + 个体随机效应项
    
    其中A是 (p_M + p_L + p_Y) × (p_M + p_L + p_Y) 的固定效应矩阵,刻画过程间的交叉依赖。这个ODE系统提供了解析解,允许过程被表示为固定效应 + 随机效应 + 零均值过程的组合。
  • 关键假设(本文给出的识别假设):
  • 一致性:观测的中介和结局等于其潜在值,暴露的观测值对应反事实中设定的暴露水平。
  • 序贯忽略性(sequential ignorability):给定历史(包括已观测的Y、M、L和基线协变量),测量时间点的M和Y与未来的潜在结局独立。这是一个很强的假设,直接等价于"不存在时变未观测混杂"。
  • 正性:每个个体,给定协变量历史的条件下,有正的概率接受任何可能的暴露水平、中介历史、时变混杂历史。
  • 逐个测量点无混杂:每个观测时间点,M或Y的缺失机制(即测量时间点的非随机性)假设为随机缺失(MAR),由已观测历史决定。
  • 测量误差:通常假设独立同分布高斯误差,与过程独立。
  • 与已有文献对比
  • 相比Albert et al. (2019),本文增加了时变混杂过程L_t,并采用联合建模而非两步法,同时不限制测量时间必须规则
  • 相比离散时间方法(如Mittinty & Vansteelandt, 2019),本文的连续时间框架自然处理不规则测量,无需将时间先离散化。

主要结果

  • 结果1:自然直接和间接效应的参数化表达 在微分方程模型下,作者推导出自然直接效应(Natural Direct Effect, NDE)和自然间接效应(Natural Indirect Effect, NIE)的解析表达式。例如,NIE可以表示为微分方程参数的一个函数,随t和s连续变化。它们的形式依赖于模型中A矩阵的结构(即哪个过程影响哪个过程)。这是定理3.1或类似的陈述。

  • 结果2:路径特定效应(Path-Specific Effects, PSEs) 当存在时变混杂L_t时,暴露到结局的效应可以被分解为三条路径(例如:X→M→Y;X→L→Y;X→M→L→Y等)。作者通过修改微分方程系统的结构(在特定时期"堵塞"某些箭头),给出了每条路径的因果效应表达式。这实际上是定理3.2或类似的内容。

  • 结果3:模拟实验

  • 设计:模拟了三种场景:1) 基础模型(无L_t);2) 含时变混杂L_t;3) 含不规则测量时间。样本量约200-500,随访时间约15年。
  • 关键发现

    • 当模型正确指定时,基于MLE的效应估计偏倚很小(约5%以内),且覆盖概率接近名义值。
    • 与忽略了不规则测量部分(采用离散化方法)的对比模型相比,本文方法在不规则测量下具有更好的覆盖率和更小的均方误差
    • 当测量时间变得完全规则时,方法退化到接近离散时间方法的表现,显示一致性。
  • 真实例子

  • 例子1:教育水平(X)→ 抑郁症状(M_t)+ 认知功能(L_t)→ 功能依赖(Y_t)
    • 数据:3C老龄化研究(法国834名老人,随访12年,不规则访视)。
    • 方法:将X设为高教育vs低教育,M_t是反复测量的抑郁症状(潜在变量由CES-D量表指标观测),Y_t是功能依赖(依赖性量表),L_t是反复测量的认知功能(潜在变量,由MMSE等指标观测)。
    • 结果:高教育水平的总效应是显著降低功能依赖风险。路径分解显示,约30%的总效应是通过改善认知功能(L_t路径)间接实现的,另有约15% 是通过减少抑郁症状(M_t路径)间接实现。直接效应依然是主要的(约55%)。这些分解表明,教育和功能依赖之间的关系主要通过认知改善和减轻抑郁来中介,而非仅靠减轻抑郁。
  • 例子2:APOE ε4基因型(X)→ 血管脑损伤(M_t)→ 认知功能(Y_t),以神经退行性变化(L_t)为混杂
    • 方法:X为APOE ε4携带者vs非携带者,M_t为多次MRI测得的白质高信号(血管损伤标志),Y_t为认知综合分数,L_t为多次MRI测得的灰质体积(神经退行标志),作为暴露诱导的混杂。
    • 结果:APOE ε4的总效应是显著认知恶化。路径分解显示,约70% 的总效应是通过直接效应(神经退行,但这条路径被L_t部分捕获后再到Y_t)。间接通过血管损伤M_t的路径仅贡献约15%。这个例子展示了本文方法在存在暴露诱导混杂(L_t)下的应用能力——如果不用本文方法,效应分解将因识别问题而无法进行。
  • 这两个例子的核心意义:证明方法确实能处理真实世界、高度不规则测量、多过程、且时变混杂存在的复杂因果分解问题,提供比离散时间或简单连续时间(无L_t)方法更精细的解释。

证明路线与技术技巧

本文是以方法学和计算为导向的(Biometrics期刊)。没有像一个纯理论论文那样提供渐近分布或 minimax 界,所以"证明路线"是指估计的推导路线

  • 整体路线(4步)
  • 模型设定:将潜在过程 (M_t, Y_t, L_t) 表述为一个线性微分方程系统 dP(t)/dt = A P(t) + β X + 随机效应。这个系统有解析解,形如 P(t) = e^{A t} P(0) + (从初始条件到t的积分形式)。其中e^{A t}是矩阵指数。
  • 似然构建:由于过程是高斯分布(加上高斯测量误差),整个数据向量(每个个体的所有Y、M、L观测序列,及测量时间)的联合分布是多元高斯分布,其均值和协方差可以由模型参数(A、β、随机效应方差、测量误差方差)得到。这正是多变量线性混合模型。似然函数可以写成封闭形式(不需要数值积分)。
  • 参数估计:使用最大似然估计(MLE)拟合模型。由于协方差结构复杂(依赖于e^{A t}),优化时需要计算e^{A t}及其关于参数的导数,这通过Pade逼近或特征值分解完成。计算代价主要来自矩阵指数及其导数,随着过程维数(p_M + p_L + p_Y)的增长,代价呈多项式增长(大致O(p^3))。
  • 因果效应计算:一旦参数被估计(得到MLE及参数渐近方差),通过将估计值代入NDE、NIE、PSE的公式,得到效应估计。由于效应是参数的平滑函数,采用delta方法或自举法计算标准误。

  • 关键跳跃点/技术难点

  • 跳跃0:将因果效应分解从离散时间转到连续时间。在离散时间,我们只需考虑固定时间点的M和Y。在连续时间,NIE表示为∫ γ(t→s) * β_M(t) dt(对中介在区间上的效应积分)。构建这个积分形式的效应表达式不是平凡的,需要借助微分方程的Green函数。
  • 跳跃1:处理时变混杂L_t。在离散时间,识别PSE需要"block"某些路径。在连续时间,作者将这条路径"block"的方法是将微分方程系统中的一个交叉效应系数(如L_t对Y_t的系数)在某个假设情景下设为零,然后用该情景下的反事实预测来计算PSE。这个思路是巧妙的:通过修改模型的参数而不是修改可观测数据来模拟反事实世界。
  • 跳跃2:不规则测量。在标准纵向线性混合模型中,测量时间点不一样时,直接构建协方差矩阵即可,这本质上正是线性混合模型的优势。本文的贡献不是发明了一种新技巧,而是正确地将这种现成的技术套用在因果框架下,并赋予其因果解释。

  • 技术技巧点名

  • 矩阵指数 (matrix exponential) e^{A t}——通过Pade近似或精确对角化计算,是整个似然计算的核心。
  • Delta方法——用于从参数协方差计算效应估计的标准误。
  • R的 lme4nlme 的广义构造——实际实现时可能在底层调用这些包的优化器。
  • 模拟中的贝叶斯后验预测(使用MCMC):为了估计置信区间,作者使用了贝叶斯后验抽样的方式(在参数的后验分布中抽样,计算效应的后验分布),这实际上是一种贝叶斯倾向,不是本文的核心方法,而是用于不确定度的量化。

🔎 结论是否比证明窄

  • 。本文最亮眼的声称是"第一个处理不规则测量和时变混杂的连续时间因果中介方法",但这一声称的证据基础主要来自模拟和两个具体例子。然而:
  • 识别假设的强度并未被理论渐近性质所验证。作者只是陈述了假设,但没有证明在这些假设下效应估计的一致性和渐近正态性(这是典型的Biometrics风格,但对比半参数文献是一个弱点)。
  • 方法的核心是参数化混合模型。如果模型错误指定(例如中介-结局关系非线性、随机效应非高斯),则效应估计将有偏。作者在讨论中提到未来可以放松到半参数,但并未实际处理。因此论文的实际结论(模拟中的好表现)是建立在正确模型假定之上的,比论文标题暗示的条件要窄。
  • 核心结论"处理不规则测量"也是条件性成立的:它依赖于测量时间的"缺失机制"是随机缺失(MAR)的假设,且取决于过程的高斯线性设定。如果缺失是非随机的(如病重者不来随访),模型会产生偏倚。

四、开放问题(点到为止,扎根具体语句)

  1. 半参数/双稳健推广:本文的整个框架依赖于完全参数化的多变量线性混合模型。为什么不能发展出一个仅对因果效应(如NDE、PSE)进行建模的半参数方法,使其在更大的模型错误指定下仍保持根号n一致性?根基:作者在讨论中写到"Further work could consider semi-parametric extensions that relax the Gaussian assumption ...",这直接指明了这个缺口。

  2. 存在未观测混杂时(u-confounding)的敏感性分析:序贯忽略性假设完美(即所有时变混杂都被L_t捕获)在真实世界中几乎从不可能。SUTVA之外的另一个关键形式是中介-结局间存在的未观测混杂未纳入模型。根基:作者在假设部分提到了"sequential ignorability",但未开发任何针对这个假设是否被违背的诊断或敏感性分析方法。

  3. 过程维数的灾难:当M_t、Y_t、L_t各自是多维的(例如神经影像中的多个区域)时,ODE系统参数化(A矩阵从p×p变为d×d,d可能几百或几千)会带来巨大的计算负担和收敛性问题。根基:模拟中只用了低维(p≈3),真实例子中的潜变量维度也较小。讨论没有明确探讨高维过程的情况。

  4. 与计算约束统计的交汇:本文的ODE模型本质上是线性,但实际机制可能包含非线性(如阈值效应)。作者在讨论中提到"non-linear extensions"。对于一个非参数/半参数的非线性ODE中介模型,其估计的统计-计算权衡、信息-计算鸿沟等问题完全没有被触及。这虽然是一个更远的问题,但对于一个对计算约束统计感兴趣的读者(如陈星宇)来说,它是一个潜在的、有深度的交汇点。根基:没有直接语句,但可推断自"further work may consider non-linear differential equations ..."——这个笼统的说法暴露了整个框架对非线性的无力,而线性假设下的计算可处理性是否可以推广到非线性且保持可计算性,是开放问题。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论