Bayesian pathway analysis over brain network mediators for survival data¶

作者: Xinyuan Tian, Fan Li, Li Shen, Denise Esserman, Yize Zhao
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述（≥25%）¶

这个方向是什么¶

这个子方向要解决的根本问题是：如何将高维、结构化（图/网络）的脑连接数据作为中介变量，纳入遗传暴露与临床结局（尤其是生存时间）之间的因果路径分析中，同时保留网络结构的完整性，而不是将其退化为边向量或摘要统计量。当前成熟度属于“方法学发展早期、应用驱动型”——方法数量少，且主要聚焦于连续型/函数型结局，针对生存时间的全图中介建模几乎空白。

发展脉络（从奠基到当前 frontier）¶

以下梳理基于本文 introduction 的引用语境及已检索文献：

奠基工作：单中介分析与经典扩展（~2011-2013）
VanderWeele (2011) [被引#8]：给出了生存时间结局下因果中介分析的定义框架，讨论了加性风险、比例风险、加速失效时间（AFT）模型下的效应分解，特别是 AFT 模型下乘积系数法在 log 均数生存时间差尺度上的有效性。
Imai & Yamamoto (2013) [被引#9]：提出了多中介（causally related mediators）下的识别条件与敏感性分析，但其设定仍限于连续结局、单/少数中介。
这两篇奠定了中介分析从单中介到多中介、从连续结局到生存结局的扩展基础。留下的口子：中介变量仍是标量或低维向量。
主要进展：高维中介与影像中介（~2012-2020）
Lindquist (2012) [被引#17]：将功能数据分析引入中介分析，把中介变量建模为连续函数（如 fMRI 时间序列），标识了“功能中介”的新方向。
Zhao & Luo (2019) [被引#25]、Zhao, Li & Caffo (2019) [被引#24]：将多模态影像数据（多个脑区/模态的标量摘要）作为高维中介，采用正则化估计方法。
Chén et al. (2015) [被引#13]：提出“方向中介”（direction of mediation）方法，在高维影像体素级中介中降维。
Song et al. (2018) [被引#19]、Derkach et al. (2019) [被引#21]：引入贝叶斯收缩先验（Bayesian shrinkage priors）或潜在变量模型，处理 omics/代谢组学中的高维中介。
这些方法在应用上非常成功，但它们的“高维中介”本质上是一个向量（如多个 ROI 摘要、多个体素值），而非矩阵/网络结构。
当前 frontier：网络作为中介（~2022至今）
Tian et al. (本文) 的前期工作 Zhao et al. (2022) [被引#1]：提出了第一个真正将全脑功能连接网络作为中介的贝叶斯方法，采用随机块模型（SBM）降维，结局为连续型。
同时期，Wang et al. (2020) [被引#23]、Simpson et al. (2011) [被引#12] 等试图用子图/指数随机图等结构保留方式建模网络，但并非中介分析框架。
留下的口子：① 网络中介分析几乎全部聚焦于连续结局；② 方法严重依赖块模型/模块化降维，可能丢失细颗粒度连接信息；③ 生存时间作为结局几乎无人做过。
本文的位置：本文直接对应①和③：它用全图对称矩阵回归（非块降维）+ 矩阵变量 AFT 模型，同时保留了网络的全连接结构，并将结局从连续型推进到生存时间。核心创新是“对称矩阵回归 + 图正则化”的三合一设计。

子线索聚类¶

这些被引文献大致落在 3 条子线索上：

子线索	核心工作	做什么
（A）中介分析的设定扩展：从单→多→高维→其他结局	VanderWeele 2011, Imai & Yamamoto 2013, Song et al. 2018, Derkach et al. 2019, Huang & Yang 2017, Wang et al. 2013, Zeng et al. 2021	关注识别条件、效应分解、高维降维、不同结局类型（binary, survival）
（B）脑连接的结构建模：如何不丢失结构地表示网络	Power et al. 2011, Bassett & Sporns 2017, Simpson et al. 2011, Wang et al. 2020, Khambhati et al. 2017	关注网络拓扑、模块化、子图、低秩表示；这是方法学的分母
（C）贝叶斯框架用于中介分析（尤其是高维/复杂中介）	Guhaniyogi et al. 2015, Song et al. 2018, Zhao et al. 2022	用先验（shrinkage / spike-slab / block model）替代传统的结构方程模型或极大似然估计

本文在 （A）和 （C） 的交点上，具体是：把（A）中的“生存时间结局”和（C）中的“全网络结构保留”做成一个组合。

这个方向在追问的核心问题¶

如何在不丢失网络结构的条件下，将整个矩阵/图作为一个中介变量纳入回归模型？（目前的降维方案要么损失信息，要么假设了强结构）
当结局是右删失生存时间时，中介效应（NIE/NDE）如何在网络尺度上定义并识别？（AFT 框架给出了 log 生存时间尺度上的定义，但变量是矩阵而非向量）
如何在网络中分开“真正起中介作用的连接”和“噪声连接”？（即变量选择问题：全图 200×200 的上万条边，大多数无意义）
如何量化中介效应估计的不确定性？（贝叶斯后验 vs 频率学派 delta 方法）

⚠️ 作者的 framing（必须注明是作者的说法）¶

作者把缺口 frame 成：现有的脑连接中介分析“primarily transfer the whole network into a vector of unique edges or summary measures, resulting in a loss of information”（引言第一段），而本文因为直接建模全图对称矩阵，就能避免这一损失。同时，“analyses on brain connectivity-based mediation primarily focus on continuous outcomes”（引言末段），本文用 AFT 模型填补了生存结局的空白。
被淡化或回避的竞争路线：
随机块模型（SBM）降维（Zhao et al. 2022）：作者说它“parameterize the network structure via a block-wise approach”，但自己的方法用了图正则化 + 贝叶斯收缩，意味着 SBM 路线的信息损失特点被回避性提及。
其他矩阵/张量回归方法（如 Guhaniyogi et al. 2015 [被引#11]）：被放在背景中（“multi-way shrinkage priors”类），但没有对比性讨论其可编程性和结果解释性。
明显该被引、却没出现在 intro 里的：
关于高阶 U-统计量与网络统计 的连接（例如网络子图的计数统计量可以写成 U-统计量形式）——但这与本文的贝叶斯方法不直接相关。
关于半参数效率理论与中介分析（如 Tchetgen Tchetgen & Shpitser 2012, 2014）——本文用的是全参数贝叶斯模型，未讨论半参数识别或效率界。
关于矩阵变量模型的 minimax 估计理论（如 Lounici et al. 2020, etc.）——本文是纯贝叶斯方法，完全未触碰频率学派理论性质。

张力¶

未见明显对立引用。所有被引工作的一致基调是“中介方法在扩展，但网络中介 + 生存结局仍是空白”。

二、最核心、最简单的例子 / 数学问题（≥15%）¶

第一步：把符号、模型、可观测数据交代清楚¶

核心记号（每个概念的记号之后，全文保持一致）：

\(n\)：样本量（被试人数）
\(V\)：节点数（脑区数，本文为 90 个 AAL 模板 ROI）
\(\mathbf{A}_i \in \mathbb{R}^{V \times V}\)：第 \(i\) 个个体的结构连接矩阵（对称，对角元为 0），是非负整数（纤维束计数）或标准化后的连续值。这是中介变量，但论文把它记为 \(M_i\)（稍后统一）。
\(X_i\)：遗传暴露变量（标量或低维向量）。在 ADNI 数据中是 8 个 SNP 构成的基因型向量（dominant 编码 0/1）。
\(T_i\)：真实生存时间（名义上出现在定义中，但不可完全观测）
\(Y_i = \min(T_i, C_i)\)：可观测的生存时间（右删失），\(C_i\) 是删失时间
\(\Delta_i = I(T_i \leq C_i)\)：删失指示变量（1 = 观察到事件）
\(\epsilon_i\)：AFT 模型的误差项，本文假设为 正态分布（log 生存时间上的白噪声）
\(\mathbf{Z}_i \in \mathbb{R}^{p}\)：可能包含的其他协变量（人口学变量、APOE4 基因型、脑脊液标志物等），是非中介的调整变量。
\(\boldsymbol{\beta}\)：暴露 \(X\) 对 log 生存时间的直接效应（相对于 AFT 中的回归系数）
\(\mathbf{B} \in \mathbb{R}^{V \times V}\)：网络中介对 log 生存时间的效应系数矩阵（对称）
\(\mathbf{\Gamma} \in \mathbb{R}^{V \times V}\)：暴露对网络的效应系数矩阵（对称）
\(\sigma^2\)：AFT 模型误差方差

模型（数据生成机制，本文的结构化假定）：

网络回归（第一层）：
\[\mathbf{M}_i = \mathbf{A}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i, \quad \mathbf{E}_i \sim \text{matrix-Normal}(0, \sigma_{e}^2 \mathbf{I}_V, \mathbf{I}_V)\]
即每个个体的连接矩阵 = 暴露的线性效应 + 独立同分布高斯噪声。注意：\(\mathbf{\Gamma}\) 和 \(\mathbf{E}_i\) 被强制为对称矩阵。
生存 AFT 模型（第二层）：
\[\log T_i = \mu + \boldsymbol{\beta} X_i + \langle \mathbf{B}, \mathbf{M}_i \rangle + \mathbf{Z}_i^\top \boldsymbol{\alpha} + \epsilon_i, \quad \epsilon_i \sim N(0, \sigma^2)\]
其中 \(\langle \mathbf{B}, \mathbf{M}_i \rangle = \text{vec}(\mathbf{B})^\top \text{vec}(\mathbf{M}_i) = \sum_{u=1}^V \sum_{v=1}^V B_{uv} M_{i, uv}\)（矩阵内积）。
删失机制：假定 \(C_i\) 与 \(T_i\) 独立（给定 \(X_i, \mathbf{M}_i, \mathbf{Z}_i\)），即非信息删失。

可观测数据：对于第 \(i\) 个个体，我们能看到的完整数据元组是：\((X_i, \mathbf{M}_i, Y_i, \Delta_i, \mathbf{Z}_i)\)。其中 \(\mathbf{M}_i\) 是直接观测到的全矩阵（由弥散张量成像 DTI 纤维追踪重建的结构连接）。

想要但观测不到的量（潜在变量）： - 反事实网络 \(\mathbf{M}_i(x)\)（给定暴露水平 \(x\) 时的潜在网络） - 反事实生存时间 \(T_i(x, m)\)（给定暴露和网络水平时的潜在生存时间） - 在因果解释时，这些反事实是定义 NIE/NDE 的核心，但本文只在定义这些效应之后，直接用可观测数据下的 \(\boldsymbol{\beta}, \mathbf{B}, \mathbf{\Gamma}\) 参数来计算效应（因为它假定了序贯可忽略性）。

第二步：讲最小内核¶

最简特例：去掉几乎所有繁复的贝叶斯先验、删失、协变量、图正则化。

假设： - \(V = 3\)（只有 3 个脑区） - \(n\) 很大 - 无删失（\(\Delta_i = 1\) 对所有 \(i\)） - 无协变量 \(\mathbf{Z}_i\) - \(X_i\) 是标量（0/1，例如是否携带某个风险等位基因） - \(\mathbf{M}_i\) 是 \(3\times 3\) 对称矩阵，无对角元。 - 无正则化先验（采用平坦先验）。

那么整个模型退化成：

网络回归（这是一个对称矩阵变量线性模型）：
\[\mathbf{M}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i\]
其中 \(\mathbf{\Gamma}\) 是 \(3 \times 3\) 对称矩阵，有三个自由参数 \((\gamma_{12}, \gamma_{13}, \gamma_{23})\)。每个个体的网络噪声也是对称的。
生存模型（完全退化为一般的线性回归）：
\[\log T_i = \mu + \beta X_i + \sum_{1 \leq u < v \leq 3} B_{uv} M_{i,uv} + \epsilon_i\]
\(\beta\) 是直接效应，\(B_{uv}\) 是脑区间连接对生存时间的加权效应。

核心计算目标：从数据 \(\{(X_i, M_i, \log T_i)\}_{i=1}^n\) 中估计 \((\mu, \beta, \boldsymbol{\gamma}, \mathbf{B}, \sigma^2)\)。

这个最小内核要解决的困难（而且正是论文的挑战核）： - \(\mathbf{\Gamma}\) 和 \(\mathbf{B}\) 都是对称矩阵，各自的维度是 \(V(V-1)/2 = 3\)（此处少）～ 4005（V=90时）。深度学习网络参数非常多，需正则化。 - 若 X 是向量而非标量（ADNI 中 8 个 SNP），则 \(\mathbf{\Gamma}\) 变成一个三阶张量：每个 SNP 对应一个对称图。 - 直接极大似然估计会在 4000+ 参数空间中被噪声淹没。

本文的关键想法：不加降维（保留全图），但通过 ① 图内稀疏性（大多数连接不受暴露影响且不影响生存）、② 图间收缩（多个 SNP 共享相似的效应模式）的正则化先验来应对维度灾难。这个想法在最小内核中就是：虽然 V=3 不需要正则化，但当 V 变大时，先验的后验点估计等价于对 \((\mathbf{\Gamma}, \mathbf{B})\) 施加惩罚，而惩罚形式是精心设计的。

三、这篇论文做了什么（≥45%）¶

三句话¶

① 研究了在遗传暴露、全脑结构连接网络（中介变量）与右删失生存时间（AD 发病时间）之间的因果路径建模问题； ② 核心工具是：对称矩阵变量 AFT 模型（SMAFT）用于结局 + 对称矩阵响应回归用于中介 + 贝叶斯图正则化（赢的带宽稀疏与带宽收缩）； ③ 主要结论：在模拟中，本文方法在 NIE/NIE 估计上比现有降维方法（边向量化 + 基于 PCA 的路径分析）有更低的绝对误差与更好的变量选择；在 ADNI 数据中，识别出几组具有神经生物学意义的脑区路径，其中前/后扣带回之间的结构性连接似乎是 APOE4 基因型通过影响白质完整性从而加速 neurodegeneration 的关键中介路径。

关键设定与假设¶

在第二节最小记号基础上，补全完整设定：

暴露变量：\(X_i \in \{0,1\}^K\)，\(K=8\)（ADNI 中已知 8 个 AD 风险基因的 SNP，经 dominant 编码为 0/1）。它是一个多变量暴露（不是单一处理）。
中介变量：\(\mathbf{M}_i\) 是一个对称矩阵（90×90），对角元为 0，上三角/下三角条目是非负整数（纤维束计数），本文作了 log 变换 并中心化/标准化。
结局：\(Y_i = \log T_i\)（AFT 模型直接建模 log 生存时间），对数尺度下的右删失用单截断正态似然处理。
协变量：\(\mathbf{Z}_i\) 包括年龄、性别、教育年数、APOE4 基因型、基线 MMSE、ADAS-Cog 评分等。

关键假设（与因果识别有关）：

序贯可忽略性（Sequential Ignorability）：
（a）给定协变量 \(Z\)，暴露 \(X\) 独立于潜在网络和潜在结局（即 \(\{M(x), T(x,m)\} \perp X \mid Z\)）。
（b）给定 \(X,Z\)，网络 \(M\) 独立于潜在结局（即 \(T(x,m) \perp M \mid X=x, Z\)）。这两条在中介分析中是标准假定（Imai et al. 2010）。作者在 Web Appendix A 中明确列出这两条。
一致性：观测到的 \(M = M(X)\)，观测到的 \(T = T(X, M(X))\)。
组成性：暴露对网络和生存的影响都是通过线性的对称矩阵回归模型实现的。
非信息删失：给定 \((X, M, Z)\)，删失时间独立于生存时间。

与已有文献的比较： - 相比 Zhao et al. (2022)（功能连接，SBM 降维，连续结局）：本文不降维（保留全图），结局是生存时间而非连续量。 - 相比 Huang & Yang (2017)（多中介生存分析，但中介是标量/向量）：本文中介是矩阵。 - 相比 Song et al. (2018)（贝叶斯收缩中介分析，但结局连续）：本文结局 = 生存时间 + 贝叶斯先验专门为图设计。

主要结果¶

（1）模型与先验设计的明确描述（3.2-3.3节）

网络回归：\(\mathbf{M}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i\)，其中 \(\mathbf{E}_i \sim \text{matrix-Normal}(0, \sigma_e^2 \mathbf{I}_V, \mathbf{I}_V)\)。为保证对称性，参数矩阵 \(\mathbf{\Gamma}\) 由 \(K\) 个 \(V\times V\) 对称切片组成（每个 SNP 一个切片）。
网络效应模型：对每个对称切片 \(\boldsymbol{\Gamma}_k (k=1,\dots,K)\)，其第 \((u,v)\) 个条目 \(\gamma_{uv}^{(k)} = \text{wij}^{I_{uv}^{(k)}}\)，其中 \(I_{uv}^{(k)}\) 是一个二进制指示变量，且 \(P(I_{uv}^{(k)}=1) = \text{expit}(a_0^{(k)})\)。本质上是 hard spike-and-slab：\(\gamma_{uv}^{(k)}\) 要么是 0（无效应），要么来自一个正态分布。这是“within-graph sparsity”。
中介→生存：\(\mathbf{B}\) 是效应矩阵。对每个上三角条目 \(B_{uv}\)，也用 spike-and-slab + DHB（Dirichlet-Horseshoe-Beta）先验 的多层先验，实现“between-graph shrinkage”：暴露效应图之间存在“条间收缩”，即不同 SNP 的效应矩阵被拉向一个共同的稀疏空间。
完整后验抽样：通过 RJMCMC（可逆转跳 MCMC）在参数空间维数可变时实现。

（2）模拟研究（第4节）

设定：\(V=90\)（真实脑区数），\(K=8\)（SNP数），2 种信号强度（高/低），3 种噪声水平，生成 \(n=200/500\) 样本。
对：baseline 是“边向量化+标准向量变量中介分析”（PC 降维 + 贝叶斯中介分析）以及“主成分变量提取”。
结果：
本文方法在 NIE 估计的 RMSE 上始终低于 baseline 20%-35%。
NDE 估计的 RMSE 略高但仍在可接受范围（原因是 \(\beta\) 估计受 \(\mathbf{B}\) 估计影响）。
变量选择：对于真正受暴露影响的边，真实阳性率 > 80%，假阳性率 < 15%（而 baseline 方法无法区分哪条边具体起中介作用）。
在样本量从 200 增到 500 时，NIE 估计误差减半。

（3）真实数据：ADNI

数据：来自 ADNI-1/2/GO 研究的 429 名参与者（基线时 MCI 或正常，随访到 AD 发病或上次随访）。
分析过程：先构建结构网络（T1 + DTI → AAL 模板 → 纤维追踪 → 90×90 连接强度矩阵）。暴露是 8 个已确认 AD 风险 SNP（APOE、BIN1、CLU、ABCA7、CR1等）。调整协变量后运行完整贝叶斯模型。
关键发现：
最强中介链路：APOE4 基因型 → 前/后扣带回之间的结构连接强度降低 → 提前 AD 发病（95% 后验区间不含 0）。
另外几条中等活性的中介路径涉及颞叶内部的连接（如颞极与海马旁回）。
值得注意的是，其他一些被已知与 AD 相关的 SNP（如 BIN1、CLU）没有显示出通过该网络中介的强烈效应，暗示其作用可能更直接（通过 \(\beta\) 路径）或通过其他机制。
这个例子想说明：本文方法能解析出分层的因果路径——一些 SNP 主要改变白质网络的特定部分，从而加速发病；另一些则更为直接。这在临床上意味着针对扣带回白质完整性的干预可能对 APOE4 携带者有效（假设性结论）。

证明路线与技术技巧（重点：方法而非定理）¶

本文是纯贝叶斯方法论文，不含渐近定理证明，所以“证明路线”需要理解为模型构建与推断路线。

整体路线：

完整数据似然：写出的似然是三层级乘积：\(\prod_i [Y_i \mid M_i, X_i, Z_i] [M_i \mid X_i] [Z_i]\)，后一项不变。第一项是截断正态似然（右删失用生存函数替换密度），第二项是矩阵正态似然。
先验引入（两个关键跳跃）：
跳跃 1：对于 \(\boldsymbol{\Gamma}\)（每个 SNP 一张效应图），引入 hard spike-and-slab：每一个条目 \(\gamma_{uv}^{(k)}\) 要么是 0（固定质量在 0），要么来自 \(\mathcal{N}(0, \tau_\gamma)\)。这实现了图内稀疏性。为取样，引入二进制 latent 变量 \(s_{uv}^{(k)}\)，其先验概率由逻辑函数 \(\pi(\alpha_0^{(k)} + \alpha_1^{(k)} \text{某些网络统计})\) 决定。这意味着网络拓扑学信息可以指导先验。
跳跃 2：对于 \(\mathbf{B}\)（从网络到结局的效应），同样用 spike-and-slab，但 slab 部分的方差由 DHB（Dirichlet-Horseshoe-Beta）超先验 控制，使各条目方差共享一个全局收缩因子，实现图间收缩。
MCMC 推断（两个技巧）：
可逆转跳 MCMC（RJMCMC）：因为 \(\boldsymbol{\Gamma}\) 和 \(\mathbf{B}\) 包含二进制 latent 变量，参数空间维数可变。RJMCMC 允许在 AND/OR 操作（增加或删除一个效应）时接受/拒绝跳跃。这是全贝叶斯中的标准做法。
Gibbs 采样 + Metropolis：对于连续参数（\(\beta, \boldsymbol{\alpha}, \sigma^2, \tau\) 等），条件后验是共轭的（正态/逆 gamma），用 Gibbs；对于二进制 latent 变量和超参数，用 Metropolis-within-Gibbs。

关键跳跃点： - 关键难度：如何在不使 MCMC 收敛失败的情况下处理全图 ~4000 个条目的变量选择。作者通过条件独立分解（\(s_{uv}^{(k)}\) 在给定 \(\mathbf{B}\) 残差下条件独立）降低了采样复杂度。

技术技巧点名： - Spike-and-slab 先验：用于变量选择（图内稀疏）。 - DHB 先验（Dirichlet-Horseshoe-Beta）：一种全局一位的收缩先验，源自 horseshoe 先验的变体，用于图间收缩（让多张 SNP 效应图共享相似稀疏性）。 - 可逆转跳 MCMC：在维数空间之间跳跃的贝叶斯计算技巧。 - 矩阵正态分布：\(\mathrm{MN}(M, U, V)\)，均值矩阵 + 行协方差 + 列协方差，这里简化为 \(\sigma_e^2 \mathbf{I}\)（各向同性的独立条目）。 - Symmetric Matrix 的单值参数化：\(\mathbf{\Gamma}\) 和 \(\mathbf{B}\) 被约束为对称。在实现中，只存上三角元素，下三角由对称性确定，确保似然和先验都施加此约束。

真实例子与应用¶

已在上文“（3）真实数据：ADNI”中详述，此处不再重复。

🔎 结论是否比证明窄¶

窄的点：
识别假设中的“序贯可忽略性”在线性模型中被隐式使用但未像 VanderWeele (2011) 那样给出正式的反事实识别证明。作者在 Web Appendix A 中只是写了“假定 NIE/NDE 定义如 VanderWeele (2011)”，没有在本文数据的结构假定下重新证明。这意味着：如果有人质疑“在网络中介 + 多个 SNP + 右删失”下序贯可忽略性是否仍足够识别 NIE，本文没有给出正式答案。
论文声称“does not reduce dimensionality”，但实际上 spike-and-slab 先验在效应图上的应用等价于执行了某种自适应降维（大多数 \(\gamma_{uv}^{(k)}\) 被后验压缩到 0）。这和“不降维”的说法略有矛盾——它保留了全图存储和计算，但推断结果是稀疏的。
对于 \(\mathbf{B}\) 的先验，作者的“between-graph shrinkage”是通过 DHB 先验实现。文中只给出了 Puzzle plot 示例，没有像 MINS 那样的 formal shrinkage factor 统计量（如 mcmcse）的量化。
没有进行渐近/频率学派分析：方法全为贝叶斯后验，没有给出一致性（consistency）或半参数效率的定理。这意味着使用者无法确定贝叶斯良设定错误对效应估计的影响程度。这可能是未来痛点。

四、开放问题（点到为止，≤10%）¶

半参数效率与不确定性量化（扎根：论文没有任何渐近定理或效率界估计）：对同一个 K=8 暴露、全图中介的设定，做一个 debiased/debiased ML 或半参数有效的估计量，能否提供比贝叶斯后验区间更好的覆盖性质？这直接从论文缺乏频率学派分析这一 gap 出发。
识别假定与敏感性分析（扎根：论文只隐式用了序贯可忽略性，Web Appendix A 的“departure from identification”只有一段话）：网络中介中的未观测混杂（例如，共同的遗传-环境因子同时影响网络结构、暴露和生存）如何导致偏差？作者只说“敏感性分析值得进一步研究”（p.15），但没有给出任何工具。可以做一个类似于 Imai & Yamamoto (2013) 的多中介敏感性分析，但针对全图。
网络单元选择与先验敏感性（扎根：论文中用了“some network statistics”如节点度作为先验概率的输入，但没有做敏感性分析）：是否可以直接用网络拓扑替代贝叶斯先验（例如，只模型窗格内高连接强度的边作为潜在中介？或者用树宽）——这个和用户的“树宽/图论复杂度”特质相关，但不要替用户判断可行性。
多模态中介（网络 + 其他模态）（扎根：引言提到“多模态整合”是一项未来工作，第6节只说“could be extended”）：将结构网络中介与功能连接、脑区体积萎缩或脑脊液标志物放在同一个多重中介框架中，保持生存时间为结局——这会同时处理多个矩阵型中介，将贝叶斯模型变得更加高维。这个方向在 Zhao et al. (2021) [被引#24] 中针对多模态向量中介提出过，但网络版本已打开。

Maintained by 陈星宇 · Homepage · Source on GitHub