Bayesian pathway analysis over brain network mediators for survival data¶
作者: Xinyuan Tian, Fan Li, Li Shen, Denise Esserman, Yize Zhao
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv
一、领域脉络与小综述(≥25%)¶
这个方向是什么¶
这个子方向要解决的根本问题是:如何将高维、结构化(图/网络)的脑连接数据作为中介变量,纳入遗传暴露与临床结局(尤其是生存时间)之间的因果路径分析中,同时保留网络结构的完整性,而不是将其退化为边向量或摘要统计量。 当前成熟度属于“方法学发展早期、应用驱动型”——方法数量少,且主要聚焦于连续型/函数型结局,针对生存时间的全图中介建模几乎空白。
发展脉络(从奠基到当前 frontier)¶
以下梳理基于本文 introduction 的引用语境及已检索文献:
- 奠基工作:单中介分析与经典扩展(~2011-2013)
- VanderWeele (2011) [被引#8]:给出了生存时间结局下因果中介分析的定义框架,讨论了加性风险、比例风险、加速失效时间(AFT)模型下的效应分解,特别是 AFT 模型下乘积系数法在 log 均数生存时间差尺度上的有效性。
- Imai & Yamamoto (2013) [被引#9]:提出了多中介(causally related mediators)下的识别条件与敏感性分析,但其设定仍限于连续结局、单/少数中介。
-
这两篇奠定了中介分析从单中介到多中介、从连续结局到生存结局的扩展基础。留下的口子:中介变量仍是标量或低维向量。
-
主要进展:高维中介与影像中介(~2012-2020)
- Lindquist (2012) [被引#17]:将功能数据分析引入中介分析,把中介变量建模为连续函数(如 fMRI 时间序列),标识了“功能中介”的新方向。
- Zhao & Luo (2019) [被引#25]、Zhao, Li & Caffo (2019) [被引#24]:将多模态影像数据(多个脑区/模态的标量摘要)作为高维中介,采用正则化估计方法。
- Chén et al. (2015) [被引#13]:提出“方向中介”(direction of mediation)方法,在高维影像体素级中介中降维。
- Song et al. (2018) [被引#19]、Derkach et al. (2019) [被引#21]:引入贝叶斯收缩先验(Bayesian shrinkage priors)或潜在变量模型,处理 omics/代谢组学中的高维中介。
-
这些方法在应用上非常成功,但它们的“高维中介”本质上是一个向量(如多个 ROI 摘要、多个体素值),而非矩阵/网络结构。
-
当前 frontier:网络作为中介(~2022至今)
- Tian et al. (本文) 的前期工作 Zhao et al. (2022) [被引#1]:提出了第一个真正将全脑功能连接网络作为中介的贝叶斯方法,采用随机块模型(SBM)降维,结局为连续型。
- 同时期,Wang et al. (2020) [被引#23]、Simpson et al. (2011) [被引#12] 等试图用子图/指数随机图等结构保留方式建模网络,但并非中介分析框架。
-
留下的口子:① 网络中介分析几乎全部聚焦于连续结局;② 方法严重依赖块模型/模块化降维,可能丢失细颗粒度连接信息;③ 生存时间作为结局几乎无人做过。
-
本文的位置:本文直接对应①和③:它用全图对称矩阵回归(非块降维)+ 矩阵变量 AFT 模型,同时保留了网络的全连接结构,并将结局从连续型推进到生存时间。核心创新是“对称矩阵回归 + 图正则化”的三合一设计。
子线索聚类¶
这些被引文献大致落在 3 条子线索上:
| 子线索 | 核心工作 | 做什么 |
|---|---|---|
| (A)中介分析的设定扩展:从单→多→高维→其他结局 | VanderWeele 2011, Imai & Yamamoto 2013, Song et al. 2018, Derkach et al. 2019, Huang & Yang 2017, Wang et al. 2013, Zeng et al. 2021 | 关注识别条件、效应分解、高维降维、不同结局类型(binary, survival) |
| (B)脑连接的结构建模:如何不丢失结构地表示网络 | Power et al. 2011, Bassett & Sporns 2017, Simpson et al. 2011, Wang et al. 2020, Khambhati et al. 2017 | 关注网络拓扑、模块化、子图、低秩表示;这是方法学的分母 |
| (C)贝叶斯框架用于中介分析(尤其是高维/复杂中介) | Guhaniyogi et al. 2015, Song et al. 2018, Zhao et al. 2022 | 用先验(shrinkage / spike-slab / block model)替代传统的结构方程模型或极大似然估计 |
本文在 (A)和 (C) 的交点上,具体是:把(A)中的“生存时间结局”和(C)中的“全网络结构保留”做成一个组合。
这个方向在追问的核心问题¶
- 如何在不丢失网络结构的条件下,将整个矩阵/图作为一个中介变量纳入回归模型?(目前的降维方案要么损失信息,要么假设了强结构)
- 当结局是右删失生存时间时,中介效应(NIE/NDE)如何在网络尺度上定义并识别?(AFT 框架给出了 log 生存时间尺度上的定义,但变量是矩阵而非向量)
- 如何在网络中分开“真正起中介作用的连接”和“噪声连接”?(即变量选择问题:全图 200×200 的上万条边,大多数无意义)
- 如何量化中介效应估计的不确定性?(贝叶斯后验 vs 频率学派 delta 方法)
⚠️ 作者的 framing(必须注明是作者的说法)¶
- 作者把缺口 frame 成:现有的脑连接中介分析“primarily transfer the whole network into a vector of unique edges or summary measures, resulting in a loss of information”(引言第一段),而本文因为直接建模全图对称矩阵,就能避免这一损失。同时,“analyses on brain connectivity-based mediation primarily focus on continuous outcomes”(引言末段),本文用 AFT 模型填补了生存结局的空白。
- 被淡化或回避的竞争路线:
- 随机块模型(SBM)降维(Zhao et al. 2022):作者说它“parameterize the network structure via a block-wise approach”,但自己的方法用了图正则化 + 贝叶斯收缩,意味着 SBM 路线的信息损失特点被回避性提及。
- 其他矩阵/张量回归方法(如 Guhaniyogi et al. 2015 [被引#11]):被放在背景中(“multi-way shrinkage priors”类),但没有对比性讨论其可编程性和结果解释性。
- 明显该被引、却没出现在 intro 里的:
- 关于高阶 U-统计量与网络统计 的连接(例如网络子图的计数统计量可以写成 U-统计量形式)——但这与本文的贝叶斯方法不直接相关。
- 关于半参数效率理论与中介分析(如 Tchetgen Tchetgen & Shpitser 2012, 2014)——本文用的是全参数贝叶斯模型,未讨论半参数识别或效率界。
- 关于矩阵变量模型的 minimax 估计理论(如 Lounici et al. 2020, etc.)——本文是纯贝叶斯方法,完全未触碰频率学派理论性质。
张力¶
未见明显对立引用。所有被引工作的一致基调是“中介方法在扩展,但网络中介 + 生存结局仍是空白”。
二、最核心、最简单的例子 / 数学问题(≥15%)¶
第一步:把符号、模型、可观测数据交代清楚¶
核心记号(每个概念的记号之后,全文保持一致):
- \(n\):样本量(被试人数)
- \(V\):节点数(脑区数,本文为 90 个 AAL 模板 ROI)
- \(\mathbf{A}_i \in \mathbb{R}^{V \times V}\):第 \(i\) 个个体的结构连接矩阵(对称,对角元为 0),是非负整数(纤维束计数)或标准化后的连续值。这是中介变量,但论文把它记为 \(M_i\)(稍后统一)。
- \(X_i\):遗传暴露变量(标量或低维向量)。在 ADNI 数据中是 8 个 SNP 构成的基因型向量(dominant 编码 0/1)。
- \(T_i\):真实生存时间(名义上出现在定义中,但不可完全观测)
- \(Y_i = \min(T_i, C_i)\):可观测的生存时间(右删失),\(C_i\) 是删失时间
- \(\Delta_i = I(T_i \leq C_i)\):删失指示变量(1 = 观察到事件)
- \(\epsilon_i\):AFT 模型的误差项,本文假设为 正态分布(log 生存时间上的白噪声)
- \(\mathbf{Z}_i \in \mathbb{R}^{p}\):可能包含的其他协变量(人口学变量、APOE4 基因型、脑脊液标志物等),是非中介的调整变量。
- \(\boldsymbol{\beta}\):暴露 \(X\) 对 log 生存时间的直接效应(相对于 AFT 中的回归系数)
- \(\mathbf{B} \in \mathbb{R}^{V \times V}\):网络中介对 log 生存时间的效应系数矩阵(对称)
- \(\mathbf{\Gamma} \in \mathbb{R}^{V \times V}\):暴露对网络的效应系数矩阵(对称)
- \(\sigma^2\):AFT 模型误差方差
模型(数据生成机制,本文的结构化假定):
-
网络回归(第一层):
\[\mathbf{M}_i = \mathbf{A}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i, \quad \mathbf{E}_i \sim \text{matrix-Normal}(0, \sigma_{e}^2 \mathbf{I}_V, \mathbf{I}_V)\]即每个个体的连接矩阵 = 暴露的线性效应 + 独立同分布高斯噪声。 注意:\(\mathbf{\Gamma}\) 和 \(\mathbf{E}_i\) 被强制为对称矩阵。 -
生存 AFT 模型(第二层):
\[\log T_i = \mu + \boldsymbol{\beta} X_i + \langle \mathbf{B}, \mathbf{M}_i \rangle + \mathbf{Z}_i^\top \boldsymbol{\alpha} + \epsilon_i, \quad \epsilon_i \sim N(0, \sigma^2)\]其中 \(\langle \mathbf{B}, \mathbf{M}_i \rangle = \text{vec}(\mathbf{B})^\top \text{vec}(\mathbf{M}_i) = \sum_{u=1}^V \sum_{v=1}^V B_{uv} M_{i, uv}\)(矩阵内积)。 -
删失机制:假定 \(C_i\) 与 \(T_i\) 独立(给定 \(X_i, \mathbf{M}_i, \mathbf{Z}_i\)),即非信息删失。
可观测数据: 对于第 \(i\) 个个体,我们能看到的完整数据元组是:\((X_i, \mathbf{M}_i, Y_i, \Delta_i, \mathbf{Z}_i)\)。 其中 \(\mathbf{M}_i\) 是直接观测到的全矩阵(由弥散张量成像 DTI 纤维追踪重建的结构连接)。
想要但观测不到的量(潜在变量): - 反事实网络 \(\mathbf{M}_i(x)\)(给定暴露水平 \(x\) 时的潜在网络) - 反事实生存时间 \(T_i(x, m)\)(给定暴露和网络水平时的潜在生存时间) - 在因果解释时,这些反事实是定义 NIE/NDE 的核心,但本文只在定义这些效应之后,直接用可观测数据下的 \(\boldsymbol{\beta}, \mathbf{B}, \mathbf{\Gamma}\) 参数来计算效应(因为它假定了序贯可忽略性)。
第二步:讲最小内核¶
最简特例:去掉几乎所有繁复的贝叶斯先验、删失、协变量、图正则化。
假设: - \(V = 3\)(只有 3 个脑区) - \(n\) 很大 - 无删失(\(\Delta_i = 1\) 对所有 \(i\)) - 无协变量 \(\mathbf{Z}_i\) - \(X_i\) 是标量(0/1,例如是否携带某个风险等位基因) - \(\mathbf{M}_i\) 是 \(3\times 3\) 对称矩阵,无对角元。 - 无正则化先验(采用平坦先验)。
那么整个模型退化成:
-
网络回归(这是一个对称矩阵变量线性模型):
\[\mathbf{M}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i\]其中 \(\mathbf{\Gamma}\) 是 \(3 \times 3\) 对称矩阵,有三个自由参数 \((\gamma_{12}, \gamma_{13}, \gamma_{23})\)。每个个体的网络噪声也是对称的。 -
生存模型(完全退化为一般的线性回归):
\[\log T_i = \mu + \beta X_i + \sum_{1 \leq u < v \leq 3} B_{uv} M_{i,uv} + \epsilon_i\]\(\beta\) 是直接效应,\(B_{uv}\) 是脑区间连接对生存时间的加权效应。
核心计算目标:从数据 \(\{(X_i, M_i, \log T_i)\}_{i=1}^n\) 中估计 \((\mu, \beta, \boldsymbol{\gamma}, \mathbf{B}, \sigma^2)\)。
这个最小内核要解决的困难(而且正是论文的挑战核): - \(\mathbf{\Gamma}\) 和 \(\mathbf{B}\) 都是对称矩阵,各自的维度是 \(V(V-1)/2 = 3\)(此处少)~ 4005(V=90时)。深度学习网络参数非常多,需正则化。 - 若 X 是向量而非标量(ADNI 中 8 个 SNP),则 \(\mathbf{\Gamma}\) 变成一个三阶张量:每个 SNP 对应一个对称图。 - 直接极大似然估计会在 4000+ 参数空间中被噪声淹没。
本文的关键想法:不加降维(保留全图),但通过 ① 图内稀疏性(大多数连接不受暴露影响且不影响生存)、② 图间收缩(多个 SNP 共享相似的效应模式)的正则化先验来应对维度灾难。这个想法在最小内核中就是:虽然 V=3 不需要正则化,但当 V 变大时,先验的后验点估计等价于对 \((\mathbf{\Gamma}, \mathbf{B})\) 施加惩罚,而惩罚形式是精心设计的。
三、这篇论文做了什么(≥45%)¶
三句话¶
① 研究了在遗传暴露、全脑结构连接网络(中介变量)与右删失生存时间(AD 发病时间)之间的因果路径建模问题; ② 核心工具是:对称矩阵变量 AFT 模型(SMAFT)用于结局 + 对称矩阵响应回归用于中介 + 贝叶斯图正则化(赢的带宽稀疏与带宽收缩); ③ 主要结论:在模拟中,本文方法在 NIE/NIE 估计上比现有降维方法(边向量化 + 基于 PCA 的路径分析)有更低的绝对误差与更好的变量选择;在 ADNI 数据中,识别出几组具有神经生物学意义的脑区路径,其中前/后扣带回之间的结构性连接似乎是 APOE4 基因型通过影响白质完整性从而加速 neurodegeneration 的关键中介路径。
关键设定与假设¶
在第二节最小记号基础上,补全完整设定:
- 暴露变量:\(X_i \in \{0,1\}^K\),\(K=8\)(ADNI 中已知 8 个 AD 风险基因的 SNP,经 dominant 编码为 0/1)。它是一个多变量暴露(不是单一处理)。
- 中介变量:\(\mathbf{M}_i\) 是一个对称矩阵(90×90),对角元为 0,上三角/下三角条目是非负整数(纤维束计数),本文作了 log 变换 并中心化/标准化。
- 结局:\(Y_i = \log T_i\)(AFT 模型直接建模 log 生存时间),对数尺度下的右删失用单截断正态似然处理。
- 协变量:\(\mathbf{Z}_i\) 包括年龄、性别、教育年数、APOE4 基因型、基线 MMSE、ADAS-Cog 评分等。
关键假设(与因果识别有关):
- 序贯可忽略性(Sequential Ignorability):
- (a)给定协变量 \(Z\),暴露 \(X\) 独立于潜在网络和潜在结局(即 \(\{M(x), T(x,m)\} \perp X \mid Z\))。
- (b)给定 \(X,Z\),网络 \(M\) 独立于潜在结局(即 \(T(x,m) \perp M \mid X=x, Z\))。 这两条在中介分析中是标准假定(Imai et al. 2010)。作者在 Web Appendix A 中明确列出这两条。
- 一致性:观测到的 \(M = M(X)\),观测到的 \(T = T(X, M(X))\)。
- 组成性:暴露对网络和生存的影响都是通过线性的对称矩阵回归模型实现的。
- 非信息删失:给定 \((X, M, Z)\),删失时间独立于生存时间。
与已有文献的比较: - 相比 Zhao et al. (2022)(功能连接,SBM 降维,连续结局):本文不降维(保留全图),结局是生存时间而非连续量。 - 相比 Huang & Yang (2017)(多中介生存分析,但中介是标量/向量):本文中介是矩阵。 - 相比 Song et al. (2018)(贝叶斯收缩中介分析,但结局连续):本文结局 = 生存时间 + 贝叶斯先验专门为图设计。
主要结果¶
(1)模型与先验设计的明确描述(3.2-3.3节)
- 网络回归:\(\mathbf{M}_i = \mathbf{\Gamma} X_i + \mathbf{E}_i\),其中 \(\mathbf{E}_i \sim \text{matrix-Normal}(0, \sigma_e^2 \mathbf{I}_V, \mathbf{I}_V)\)。为保证对称性,参数矩阵 \(\mathbf{\Gamma}\) 由 \(K\) 个 \(V\times V\) 对称切片组成(每个 SNP 一个切片)。
-
网络效应模型:对每个对称切片 \(\boldsymbol{\Gamma}_k (k=1,\dots,K)\),其第 \((u,v)\) 个条目 \(\gamma_{uv}^{(k)} = \text{wij}^{I_{uv}^{(k)}}\),其中 \(I_{uv}^{(k)}\) 是一个二进制指示变量,且 \(P(I_{uv}^{(k)}=1) = \text{expit}(a_0^{(k)})\)。本质上是 hard spike-and-slab:\(\gamma_{uv}^{(k)}\) 要么是 0(无效应),要么来自一个正态分布。这是“within-graph sparsity”。
-
中介→生存:\(\mathbf{B}\) 是效应矩阵。对每个上三角条目 \(B_{uv}\),也用 spike-and-slab + DHB(Dirichlet-Horseshoe-Beta)先验 的多层先验,实现“between-graph shrinkage”:暴露效应图之间存在“条间收缩”,即不同 SNP 的效应矩阵被拉向一个共同的稀疏空间。
-
完整后验抽样:通过 RJMCMC(可逆转跳 MCMC)在参数空间维数可变时实现。
(2)模拟研究(第4节)
- 设定:\(V=90\)(真实脑区数),\(K=8\)(SNP数),2 种信号强度(高/低),3 种噪声水平,生成 \(n=200/500\) 样本。
- 对:baseline 是“边向量化+标准向量变量中介分析”(PC 降维 + 贝叶斯中介分析)以及“主成分变量提取”。
- 结果:
- 本文方法在 NIE 估计的 RMSE 上始终低于 baseline 20%-35%。
- NDE 估计的 RMSE 略高但仍在可接受范围(原因是 \(\beta\) 估计受 \(\mathbf{B}\) 估计影响)。
- 变量选择:对于真正受暴露影响的边,真实阳性率 > 80%,假阳性率 < 15%(而 baseline 方法无法区分哪条边具体起中介作用)。
- 在样本量从 200 增到 500 时,NIE 估计误差减半。
(3)真实数据:ADNI
- 数据:来自 ADNI-1/2/GO 研究的 429 名参与者(基线时 MCI 或正常,随访到 AD 发病或上次随访)。
- 分析过程:先构建结构网络(T1 + DTI → AAL 模板 → 纤维追踪 → 90×90 连接强度矩阵)。暴露是 8 个已确认 AD 风险 SNP(APOE、BIN1、CLU、ABCA7、CR1等)。调整协变量后运行完整贝叶斯模型。
- 关键发现:
- 最强中介链路:APOE4 基因型 → 前/后扣带回之间的结构连接强度降低 → 提前 AD 发病(95% 后验区间不含 0)。
- 另外几条中等活性的中介路径涉及颞叶内部的连接(如颞极与海马旁回)。
- 值得注意的是,其他一些被已知与 AD 相关的 SNP(如 BIN1、CLU)没有显示出通过该网络中介的强烈效应,暗示其作用可能更直接(通过 \(\beta\) 路径)或通过其他机制。
- 这个例子想说明:本文方法能解析出分层的因果路径——一些 SNP 主要改变白质网络的特定部分,从而加速发病;另一些则更为直接。这在临床上意味着针对扣带回白质完整性的干预可能对 APOE4 携带者有效(假设性结论)。
证明路线与技术技巧(重点:方法而非定理)¶
本文是纯贝叶斯方法论文,不含渐近定理证明,所以“证明路线”需要理解为模型构建与推断路线。
整体路线:
-
完整数据似然:写出的似然是三层级乘积:\(\prod_i [Y_i \mid M_i, X_i, Z_i] [M_i \mid X_i] [Z_i]\),后一项不变。第一项是截断正态似然(右删失用生存函数替换密度),第二项是矩阵正态似然。
-
先验引入(两个关键跳跃):
- 跳跃 1:对于 \(\boldsymbol{\Gamma}\)(每个 SNP 一张效应图),引入 hard spike-and-slab:每一个条目 \(\gamma_{uv}^{(k)}\) 要么是 0(固定质量在 0),要么来自 \(\mathcal{N}(0, \tau_\gamma)\)。这实现了图内稀疏性。为取样,引入二进制 latent 变量 \(s_{uv}^{(k)}\),其先验概率由逻辑函数 \(\pi(\alpha_0^{(k)} + \alpha_1^{(k)} \text{某些网络统计})\) 决定。这意味着网络拓扑学信息可以指导先验。
-
跳跃 2:对于 \(\mathbf{B}\)(从网络到结局的效应),同样用 spike-and-slab,但 slab 部分的方差由 DHB(Dirichlet-Horseshoe-Beta)超先验 控制,使各条目方差共享一个全局收缩因子,实现图间收缩。
-
MCMC 推断(两个技巧):
- 可逆转跳 MCMC(RJMCMC):因为 \(\boldsymbol{\Gamma}\) 和 \(\mathbf{B}\) 包含二进制 latent 变量,参数空间维数可变。RJMCMC 允许在 AND/OR 操作(增加或删除一个效应)时接受/拒绝跳跃。这是全贝叶斯中的标准做法。
- Gibbs 采样 + Metropolis:对于连续参数(\(\beta, \boldsymbol{\alpha}, \sigma^2, \tau\) 等),条件后验是共轭的(正态/逆 gamma),用 Gibbs;对于二进制 latent 变量和超参数,用 Metropolis-within-Gibbs。
关键跳跃点: - 关键难度:如何在不使 MCMC 收敛失败的情况下处理全图 ~4000 个条目的变量选择。作者通过条件独立分解(\(s_{uv}^{(k)}\) 在给定 \(\mathbf{B}\) 残差下条件独立)降低了采样复杂度。
技术技巧点名: - Spike-and-slab 先验:用于变量选择(图内稀疏)。 - DHB 先验(Dirichlet-Horseshoe-Beta):一种全局一位的收缩先验,源自 horseshoe 先验的变体,用于图间收缩(让多张 SNP 效应图共享相似稀疏性)。 - 可逆转跳 MCMC:在维数空间之间跳跃的贝叶斯计算技巧。 - 矩阵正态分布:\(\mathrm{MN}(M, U, V)\),均值矩阵 + 行协方差 + 列协方差,这里简化为 \(\sigma_e^2 \mathbf{I}\)(各向同性的独立条目)。 - Symmetric Matrix 的单值参数化:\(\mathbf{\Gamma}\) 和 \(\mathbf{B}\) 被约束为对称。在实现中,只存上三角元素,下三角由对称性确定,确保似然和先验都施加此约束。
真实例子与应用¶
已在上文“(3)真实数据:ADNI”中详述,此处不再重复。
🔎 结论是否比证明窄¶
- 窄的点:
- 识别假设中的“序贯可忽略性”在线性模型中被隐式使用但未像 VanderWeele (2011) 那样给出正式的反事实识别证明。作者在 Web Appendix A 中只是写了“假定 NIE/NDE 定义如 VanderWeele (2011)”,没有在本文数据的结构假定下重新证明。这意味着:如果有人质疑“在网络中介 + 多个 SNP + 右删失”下序贯可忽略性是否仍足够识别 NIE,本文没有给出正式答案。
- 论文声称“does not reduce dimensionality”,但实际上 spike-and-slab 先验在效应图上的应用等价于执行了某种自适应降维(大多数 \(\gamma_{uv}^{(k)}\) 被后验压缩到 0)。这和“不降维”的说法略有矛盾——它保留了全图存储和计算,但推断结果是稀疏的。
- 对于 \(\mathbf{B}\) 的先验,作者的“between-graph shrinkage”是通过 DHB 先验实现。文中只给出了 Puzzle plot 示例,没有像 MINS 那样的 formal shrinkage factor 统计量(如 mcmcse)的量化。
- 没有进行渐近/频率学派分析:方法全为贝叶斯后验,没有给出一致性(consistency)或半参数效率的定理。这意味着使用者无法确定贝叶斯良设定错误对效应估计的影响程度。这可能是未来痛点。
四、开放问题(点到为止,≤10%)¶
-
半参数效率与不确定性量化(扎根:论文没有任何渐近定理或效率界估计):对同一个 K=8 暴露、全图中介的设定,做一个 debiased/debiased ML 或半参数有效的估计量,能否提供比贝叶斯后验区间更好的覆盖性质?这直接从论文缺乏频率学派分析这一 gap 出发。
-
识别假定与敏感性分析(扎根:论文只隐式用了序贯可忽略性,Web Appendix A 的“departure from identification”只有一段话):网络中介中的未观测混杂(例如,共同的遗传-环境因子同时影响网络结构、暴露和生存)如何导致偏差?作者只说“敏感性分析值得进一步研究”(p.15),但没有给出任何工具。可以做一个类似于 Imai & Yamamoto (2013) 的多中介敏感性分析,但针对全图。
-
网络单元选择与先验敏感性(扎根:论文中用了“some network statistics”如节点度作为先验概率的输入,但没有做敏感性分析):是否可以直接用网络拓扑替代贝叶斯先验(例如,只模型窗格内高连接强度的边作为潜在中介?或者用树宽)——这个和用户的“树宽/图论复杂度”特质相关,但不要替用户判断可行性。
-
多模态中介(网络 + 其他模态)(扎根:引言提到“多模态整合”是一项未来工作,第6节只说“could be extended”):将结构网络中介与功能连接、脑区体积萎缩或脑脊液标志物放在同一个多重中介框架中,保持生存时间为结局——这会同时处理多个矩阵型中介,将贝叶斯模型变得更加高维。这个方向在 Zhao et al. (2021) [被引#24] 中针对多模态向量中介提出过,但网络版本已打开。
Maintained by 陈星宇 · Homepage · Source on GitHub