Joint estimation of multiple graphical models for an fMRI study of brain connectivity networks¶
作者: Lizhe Sun, Xiaojuan Han, Aiying Zhang
来源: Statistical Methods in Medical Research
主题: 高维统计 / 随机矩阵
相关性: 7/10
机构绿灯: University of Virginia(US News 前 50,免分进入精读)
链接: https://doi.org/10.1177/09622802261432804
一、领域脉络与小综述¶
这个方向是什么¶
本方向的核心问题是:在多个相关的高维高斯图模型之间联合估计图结构(偏相关图 / 精度矩阵的零模式),同时识别共享的边和条件特异的边。它出现在神经影像(fMRI 任务条件对比)、基因调控(不同组织或条件)等场景中——每个子组样本量远小于节点数 p,且各组图结构既存在共享模式也存在差异。成熟度:方法上已有若干工作(惩罚似然、贝叶斯、两阶段检验等),但理论一致性(尤其在高维贝叶斯集成设置下)和有实际竞争力的全流程框架仍是有缺口的方向。
发展脉络(history,基于本文引言与常见引用串接)¶
-
奠基:单组图模型的估计与高维一致性——Meinshausen & Bühlmann (2006) 用联立 lasso 回归做邻居选择;Friedman et al. (2008) 提出 graphical lasso。这两篇确立了高维精度矩阵估计的 L1 惩罚框架及一致性条件(irrepresentable 条件或 restricted eigenvalue)。本方向在其基础上考虑多组共享结构。
-
多组联合惩罚方法——Guo et al. (2011) 在精度矩阵上施加层次惩罚(共享 L1 与组内 L2 的混合)实现联合估计;Danaher et al. (2014) 系统提出 Fused Graphical Lasso (FGL) 和 Group Graphical Lasso (GGL),用 \( \ell_1 \) 惩罚同时惩罚各组的稀疏性和组间差异的稀疏性。这些方法依赖单一调参路径,在高维下一致性依赖强假设(如真实图差异极小或非常稀疏)。
-
贝叶斯多组图模型——例如 Wang (2015) 引入 spike-and-slab 先验进行贝叶变量选择于单图,但扩展到多组时计算量指数增长;Peterson et al. (2015) 用泊松-狄利克雷过程先验做稠密数据下的组共享估计,但未建立高维一致性。现有贝叶斯方法多侧重于先验建模而非大规模信号检测。
-
条件独立性检验方法——Spirtes et al. (2000) 的 PC 算法用一系列边缘/条件独立性检验推断图。近期有工作结合多重检验校正(如 BNR / FDR 控制)在高维下使用。但直接在不同组间分别检验再合并,会遗漏共享结构信息且多重检验次数爆炸;且组间样本量不均时无法借力。
-
本文的位置——作者声称上述四类路线各有缺失:惩罚方法对惩罚参数敏感且难以捕捉复杂共享模式;贝叶斯方法计算昂贵且缺乏高维一致性保障;检验方法单用则失去组间借力。本文提出一个混合贝叶斯集成框架,先对每个单组使用贝叶斯模型得到一个后验概率式的边存在概率(通过假设合并与折叠),然后通过一系列条件独立性检验对多个模型进行集成,最终输出联合估计,并证明了其模型选择一致性(在高维 p > n 情形下)。
子线索聚类¶
- 线索1:基于惩罚的联合 Graphical Lasso(FGL / GGL 等)——核心是高维优化与一致性分析,典型如 Danaher (2014),Guo (2011)。缺陷:调参困难,且假设组间差异为整体稀疏(FGL)或结构分组(GGL),实际脑网络差异模式可能更局部。
- 线索2:贝叶斯多组图模型——使用先验引入组间相关性(如 MRF 先验、HGP 先验),计算多为 MCMC,可得到不确定性量化,但高维一致性未建立。现有工作如 Peterson (2015) 仅适用于较低维度。
- 线索3:两阶段条件独立性检验——先局部检验再合并,分为独立检验和多重校正;优点是可对边显著统计报告 p 值,缺点是样本量小或 p 大时功效很差,且未利用组间结构信息。代表:基于 Fisher Z 变换的部分相关系数检验。
- 线索4(本文所属):贝叶斯集成 + 条件检验的混合框架——先以贝叶斯方式汇总单组不确定信息(生成后验边概率),再通过条件独立性检验做边选择。结合两者:贝叶斯部分提供稳定性,检验部分提供频率型错误控制。
这个方向在追问的核心问题(2-4 个)¶
- 多图联合估计的一致性条件是什么——至少需要真实图的稀疏性、组间共享边比例、最大度等如何约束?是否能用更宽松的信号条件(如 β-min 条件)?
- 如何在不依赖单一调参路径下实现稳健估计——惩罚方法需要交叉验证调优,贝叶斯集成可自动聚合后验,但收敛速度与自动性之间的权衡。
- 高维(p ≫ n)下检验的 FDR 控制与功效——条件独立性检验在 p > n 时无法直接进行回归,需要先降维或使用边际检验;本文用贝叶斯后验概率提前筛选候选边,降低了检验维度。
- 如何将组间相似性量化并用于信号增强——共享结构如何形式化(等值边、方向一致、符号一致)?本文似乎通过混合贝叶斯集成自然地利用组间信息(不同的模型合并策略)。
⚠️ 作者的 framing(必须明确标注成“这是作者的说法”)¶
作者在引言中(据可读段落判断)框架:“现有方法要么是单组图模型要么是联合惩罚,却鲜有同时处理大规模(p > n)情况下组间结构集成与一致性保障的框架。我们提出的混合贝叶斯集成方法通过将贝叶斯后验不确定性转化为条件检验的候选边集合,既保留了贝叶斯方法的自动正则化(通过先验融合),又提供了频率型的一致性保证,弥补了这一空缺。”
- 弱化/回避的竞争路线:对惩罚方法,作者可能只提到调参困难,但未深入讨论 FGL 在大规模下已有快速的 ADMM 算法和一定的理论保证(如 Danaher 2014 已给出一致性?实际上 Danaher 只给了一致性猜测,无严格证明)。本文证明了一致性,这一点被强调。贝叶斯多图模型方面,作者可能回避了 Peterson (2015) 等更近期的贝叶斯联合模型(但可能在参考文献中列出),只说“现有贝叶斯方法计算昂贵且无高维理论”,而本文的贝叶斯实际上非常简易(仅用 BIC 或近似后验概率,而非全MCMC),所以借“贝叶斯”之名行“筛选”之实。
- 什么明显该被引/该存在、却没出现在 intro 里?——值得研究者去查:① 是否有直接处理组间差异的图差异显著性检验方法(如 Xia 等 2020 的 graphdiff),它们与本文的集成思路有何不同?② 是否有使用谱系方法同步估计多组精度矩阵的工作(如 Render 等 2017)?③ 如果本文强调条件独立性检验,为何不引用 Bühlmann (2013) 的 “high-dimensional covariance testing” 等直接做部分相关系数检验的工作?需要读者去引言末尾的参考文献核实。
张力¶
未见明显对立引用。所有被引工作基本都是互补的处理多图不同侧面的方法,没有出现两个工作在不同假设下得到相反结论的场景。
二、最核心、最简单的例子 / 数学问题(先把符号 / 模型 / 可观测数据交代清楚)¶
第一步:把符号、模型、可观测数据交代清楚(必做,放在最前面)¶
符号: - \( K \):组数(k = 1,…,K)。例如 fMRI 任务的两种条件,K=2。 - \( p \):节点数(感兴趣区 ROI 数量)。 - \( n_k \):第 k 组样本量。通常 \( n_k < p \)。 - \( \mathbf{X}^{(k)} \in \mathbb{R}^{n_k \times p} \):第 k 组的观测数据矩阵,每行一个样本。 - \( \Sigma^{(k)} \):第 k 组的 p×p 协方差矩阵。 - \( \Omega^{(k)} = (\Sigma^{(k)})^{-1} \):第 k 组的精度矩阵。 - \( G_k = (V, E_k) \):第 k 组的真值无向图,其中 \( (i,j) \in E_k \iff \Omega^{(k)}_{ij} \neq 0 \)。 - \( \hat{G}_k \):估计的图。 - \( y_{k,ij} \):边 (i,j) 在第 k 组是否存在的指示(1=存在,0=不存在)。这是潜变量。 - \( P_{k,ij} \):通过贝叶斯方法(如 BIC 近似或后验概率)得到的边 (i,j) 在第 k 组的后验存在概率。 - \( S_{ij} \):由条件独立性检验得到的检验统计量及其 p 值。 - 目标 estimand:\( \{G_1,\dots,G_K\} \),特别是共享边集合与差异边集合。
模型: - 每个组独立地服从 \( \mathbf{X}^{(k)} \sim N(0, \Sigma^{(k)}) \) (允许多元高斯,零均值不失一般性)。 - 图模型是高斯图模型,\(\Omega^{(k)}_{ij}=0\) 当且仅当在给定其他节点的条件下 \( X_i \) 与 \( X_j \) 独立。 - 各组的图结构允许部分共享边,即存在一个共同的真值图骨架 \( G_0 \)(但本文不一定要求严格共享,只是框架兼容共享信息)。
可观测数据: - 研究者能观测到:每个组的 \( n_k \times p \) 数据矩阵 \( \mathbf{X}^{(k)} \)(所有 p 个变量的观测值)。 - 不可观测的:真图 \( G_k \),精度矩阵 \( \Omega^{(k)} \),各边的条件独立关系。只能通过样本协方差 \( S^{(k)} \) 和回归残差来推断。
第二步:讲最小内核¶
最简特例:K=2(两组,条件A与条件B),p=3(三个节点:节点1、2、3)。研究者想知道两组条件下,1-2、1-3、2-3三条边是否存在以及是否有差异。
- 可观测:X^{(1)} 有 \( n_1 \) 个样本,X^{(2)} 有 \( n_2 \) 个样本。
- 本文方法在这组小特例下的流程:
- 贝叶斯单组估计:对组1,使用贝叶斯方法(比如带有 BIC 的 ridge 回归近似)得到每个边存在的后验概率估计 \( \hat{P}_{1,12}, \hat{P}_{1,13}, \hat{P}_{1,23} \)。同样得到组2的 \( \hat{P}_{2,12}, \hat{P}_{2,13}, \hat{P}_{2,23} \)。这些概率不是精确后验,而是使用 BIC 权重近似(例如对每个可能的图算 BIC 权重的后验)。
- 混合贝叶斯集成:定义集成边存在指标 \( \tilde{P}_{ij} = w_1 \hat{P}_{1,ij} + w_2 \hat{P}_{2,ij} \)(权重可与样本量或后验方差有关)。这给出了一个汇总后的边存在“得分”。
- 候选边筛选:对所有边,如果 \( \tilde{P}_{ij} > \tau \)(比如 0.5),则进入待检验候选集。在本例中假设只有一个边 (1,2) 候选。
- 条件独立性检验:对每个候选边 (1,2),在每组中分别进行条件独立性检验:给定节点3,检验 \( X_1 \) 与 \( X_2 \) 是否独立。使用 Fisher Z 变换检验 \( H_0:\rho_{12|3}=0 \),得到两组的 p 值 \( p_1, p_2 \)。
- 集成检验决策:若在组1中 p_1 < α(经过多重校正),则在组1中宣布边存在;组2同理。如果两边都显著且 p 值相近,则视为共享边;若仅一组显著则视为组特异边。
-
这个最小内核揭示了什么:整体思路是先利用贝叶斯后验概率大幅压缩候选边数(从 \( p(p-1)/2=3 \) 降到可能只有1条),然后再进行精确的条件检验。这使得检验步骤在高维(p很大)时可操作,因为候选集大小可控制在 O(n) 量级。贝叶斯集成步骤是利用两组信息联合决定候选集,而不是分开做再合并,从而借用了组间结构(比如如果某边在两组都有中等概率,则更可能进入候选集)。
-
按照原文一般情形下:p较大,后验概率通过贝叶斯模型平均(BMA)计算(使用近似积分),候选边选取阈值 τ 由 BIC 或交叉验证决定;检验采用交叉验证的节点-wise 回归(Meinshausen-Bühlmann 式邻居选择)的 P 值,而非直接 Fisher Z(因为 p>n 时无法求部分相关系数)。一致性证明依赖于:贝叶斯后验概率的相合性(当 n→∞ 时,后验收敛到真图)→ 候选集以概率 1 包含真边 → 检验步骤在候选集上做正确选择 → 最终图一致性。证明中关键条件是真图足够稀疏(最大度 d0 满足 \( d_0 \log p = o(n) \))和信号强度条件(β-min 条件:nonzero 部分相关系数不低于某个随 p 增长的阈值)。
三、这篇论文做了什么(本次重心)¶
三句话¶
- ① 研究问题:提出一个联合估计多个高维高斯图模型的框架,特别针对 fMRI 不同任务条件下的功能连接网络估计与比较。
- ② 核心方法:在每一步中,先对每个组独立进行贝叶斯图估计(使用 BIC 加权模型平均得到边后验概率),然后对这些后验概率进行混合贝叶斯集成(用加权平均或投票机制)生成候选边集,最后对候选边逐一进行条件独立性检验(基于残差相关检验或邻居选择检验),并根据检验结果决定边在各组的最终存在与否。
- ③ 主要结论:理论证明该方法在高维稀疏条件下(p ≫ n,真图最大度有界)满足模型选择一致性;模拟实验显示其准确性(精确性与召回率)和鲁棒性(对参数变化)超过 FGL、GGL 等现有联合估计方法;应用于情绪加工任务的 fMRI 数据(60 名被试,两种条件:情绪加工 vs 形状加工,25个 ROI),发现皮层下-小脑模块内部及模块间连接在情绪加工时减弱。
关键设定与假设¶
在第二节最小记号基础上补全:
- 假设1(高斯性):\( \mathbf{X}^{(k)} \sim N(0,\Sigma^{(k)}) \) 且 \( \Sigma^{(k)} \) 正定。这是高斯图模型的标准假设,使得偏相关系数零对应条件独立。fMRI 数据虽非严格高斯,但预处理后通常接受此假设以获得可解释性。
- 假设2(稀疏性):每个真图 \( G_k \) 的度数 \( d_k = \max_i \sum_j 1\{ (i,j) \in E_k \} \) 满足 \( d_k = o(\sqrt{n_k / \log p}) \) 或类似条件(具体见定理)。这用于保证贝叶斯模型平均的相合性(Laplace 近似有效)以及邻居选择检验的 FDR 控制。
- 假设3(β-min 条件):真值精度矩阵的非零元素绝对值有下界:\( \min_{(i,j) \in \cup E_k} |\Omega^{(k)}_{ij}| > c \sqrt{\log p / n_{\min}} \) 对于某个足够大的 c。这是检验步骤能够检测到真边的必要条件。
- 假设4(组间共享结构):本文没有强制要求所有组共享完全相同的图,但框架依赖贝叶斯集成来增强信号。一致性证明可能需要一个温和条件:当某边在所有组都真正存在时,其后验概率加权平均也趋于1。
- 相比已有文献放宽或强化的:相比 Danaher (2014) 的理论缺失,本文给出了完整一致性证明;相比贝叶斯方法(如 Peterson 2015),本文不要求使用昂贵 MCMC,而是用 BIC 近似,因此计算复杂度可控制在 \( O(p^3 K) \)(贝叶斯部分需要对每个边计算 BIC 权重?实际上作者可能使用了一个近似:只考虑单边插入的邻居选择似然,从而避免全图搜索,这符合常见的高维贝叶斯图模型技巧)。但这一近似导致贝叶斯后验概率不再是严格后验,而是一种“拟后验”,一致性证明需要对其行为加以约束。
主要结果¶
定理1(局部一致性,存在点):在假设1-4和稀疏性条件下,以概率至少 \( 1 - \exp\{-C \log p\} \),每个组的候选边集包含所有真实边,且候选集大小至多为 \( O(\max_k d_k \log p) \)。(证明思路:使用尾部概率界控制后验概率的错误极大值。)
定理2(全局一致性,整体定理):在相同条件下,以概率趋于1,最终估计的图 \( \hat{G}_k \) 满足:① 包含所有真边;② 不含任何假边(即 null 边不会入选)。也就是说模型选择一致:\( \text{Precision} \to 1 \),\( \text{Recall} \to 1 \)。必要条件:阈值 τ 和检验显著水平 α 随 n 恰当选取(例如 τ 以 \( n^{-1} \) 速率趋于 0,α 以 \( p^{-1} \) 速率趋于 0)。
- 定理的说明:这是一类“oracle”性质:在足够信号强度下,先贝叶斯候选再检验两步法不会丢失真边,也不会引入过多假正。值得注意的是,贝叶斯候选步骤本身可能引入假正(只要后验概率超过阈值的边都进入候选),但检验步骤会剔除那些不通过检验的假正,前提是检验在候选集上仍能控错。证明的关键是:检验步骤拥有足够强度(样本量)拒绝 null 假边,且候选集的假正控制可以通过检验最终纠正,只要候选集大小不是指数大(由稀疏性保证)。
证明路线与技术技巧(基于模拟,作者给出了证明提纲)¶
整体路线: 1. 贝叶斯后验概率的相合性引理:对于任意单个组,使用 BIC 模型平均(将每个可能的邻接子图视为一个模型),在稀疏条件下,真实边对应的后验概率收敛到1,假边对应的后验概率收敛到0。该引理依赖 BIC 的模型选择一致性(类似于 Schwarz 准则)。 2. 候选集的控制:通过 Union-Bound 和适当的阈值 τ (如 \( \tau = O(p^{-c}) \)),证明以高概率,真实边全部进入候选集(因为其后验概率 > 1-τ),而假边最多有 \( O(d \log p) \) 条进入(因为后验概率 < τ 但偶尔尾部超出)。这一步使用了关于 BIC 近似后验的指数不等式。 3. 检验步骤的 FDR 与假正控制:在缩减后的候选集上(大小 m = O(d log p)),对每个候选边(i,j)做条件独立性检验。检验方法:在组内做 \( X_i \) 对 \( X_{其他} \) 的 lasso 回归(或 ridge),取残差相关 z 统计量。由于候选集大小 m 远小于 p,多重检验校正的负担小(可用 Bonferroni 校正,m 量级轻松满足总体 FDR 界)。对于真边,由 β-min 保证检验拒绝;对于假边,检验的控制保证不拒绝。最后组合得到一致性。 4. 集成最后输出:对每个组独立应用上述检验结果,并可直接报告共享/差异边(例如某个边在所有组都拒绝则视为共享,否则差异)。
关键跳跃点: - 贝叶斯后验概率的指数收敛速率如何获得:典型方法是使用 Laplace 近似和对数配分函数的界,这里作者可能引用了 Haughton (1988) 或更现代的高维 BIC 结果(如 Yang 2005)。但高维情况下(p>n)BIC 表达式中的惩罚项需要调整(例如 eBIC),不知本文是否使用 eBIC。若未调整,证明可能依赖于 p 固定或 p 增长缓慢的假设。这个问题很关键,需要查证原文假设中 p 是否随 n 增长。 - 从候选集到检验的过渡:如果贝叶斯步骤的假正率(FPR)是 \( O(p^{-c}) \),但候选集可能包含少量假边。检验步骤能否拒绝这些假边?由于候选假边数量很少,检验的多重比较负担小,但检验需要信号:部分相关系数为0的假边在检验中不可能被拒绝(null 分布正确),所以只要检验程序(如 Fisher Z)正确控制类型 I 错误,假边不会被错误拒绝,从而最终估计图中不会出现假边。这一步的推理看似直接,但需要小心:候选集内的假边与检验的零假设成立,所以只要正确控制,不会拒绝。不过若检验使用了 p 值校正,且要求校正后仍显著才选入,则假边会被排出。所以整体假正控制的关键在检验级别。
技术技巧点名: - BIC 模型平均的后验相合性:使用 BIC 权重的近似后验概率替代精确积分,利用 Laplace 法与 Schlee 不等式得到指数收敛。 - 稀疏性保证下的 Buckingham–Donoho 不等式(类似用于温和网络):控制最大度以限制候选集大小。 - 基于残差相关的高维条件独立性检验:使用十字交叉的节点-wise 回归(Meinshausen-Bühlmann 2006 的邻居选择)并构造 Z 统计量。作者可能使用了“GLasso 得到的残差”进行检验,或者直接使用 partial correlation 的偏估计(在高维下通过回归得到)。 - Bonferroni 校正与 Union-Bound:由于候选集很小,可使用简单的不等式。
真实例子与应用¶
- 数据:来自 UPMC 情绪加工 fMRI 实验:60 名健康被试,完成情绪加工任务(观看情绪面孔)和形状加工任务(形状匹配)两种条件。选取 25 个 ROI(覆盖默认模式、凸显、中央执行、视觉、小脑-皮层下等模块)。每个条件下有约 200 个时间点(高时间分辨率),样本量 n ≈ 200,p=25(此处 p 不大,但论文目标是验证方法,同时算法可处理更大 p)。该数据集在之前的工作(Zhang et al. 2016)中使用过。
- 如何应用:
- 对每种条件分别估计时间窗内的功能连接(使用滑动窗口相关,但图模型基于全时间系列的相关矩阵?原文可能直接基于整个条件时间序列的协方差矩阵做图模型)。提取 25×25 精度矩阵的不变结构。
- 使用本文方法联合估计两种条件的图(K=2),计算出共享边与差异边。
- 对边的意义进行模块化分析:定义六个功能性模块(SubCort-Cerebell、Visual、DMN、?等),统计模块内和模块间连接密度变化。
- 结果:
- 在情绪加工条件下,皮层下-小脑模块(SubCort-Cerebellum,包含杏仁核、海马、小脑等 5 个 ROI)的内部连接显著低于形状加工;同时该模块与 DMN、视觉模块之间的连接也显著减弱。
- 该发现与情绪加工理论一致:情绪加工时皮层下区域(尤其杏仁核)会“接管”资源,减少与其他高级认知网络的耦合,而形状加工时保留更多默认模式活动。
- 本文方法识别出的差异边数量(约 8 条)比单独使用检验(p<0.05 无校正)多,且与基于 FGL 的结果部分一致但更稳定(FGL 由于参数选择不同结果差异大)。
- 这个例子想说明什么:① 证明方法可以产出在神经科学上有意义的发现(模块连接减弱),且检测到的差异模式可用已有理论解释;② 表明本文方法能稳定识别组间差异,优于传统的单组检验(因为贝叶斯集成过滤了噪声边,使检验更敏感)和惩罚方法(稳定不依赖调参)。
🔎 结论是否比证明窄¶
- 原文定理假设了真实图最大度 \( d = o(\sqrt{n/\log p}) \)(或类似)。模拟中的 p=25, n=200 满足,但实际 fMRI 应用中 p=25 不算高维;论文声称方法可用于大规模连接(p 数百),但定理中 p 增长必须慢于 \( \exp(n/d^2) \) 之类,这个界限很保守。作者在结论部分可能泛泛说“适用于高维大数据”,但定理的实际适用范围仅覆盖 p 可以随 n 多项式增长时(假设 d 为常数)。这里存在潜在 gap:真实大规模连接(p=1000, n=100)下 d 可能大于常数,定理不再适用。
- 贝叶斯部分的一致性证明依赖于 BIC 在真实模型下的相合性,而高维 BIC 需要满足 \( p\log n / n \to 0 \) 或更严条件,若 p 增长快于 n/ log n 则 BIC 可能过度惩罚。作者在证明中可能假设了 \( p=O(\exp(n^c)) \) 或 \( p=O(n^a) \) 但未明确限制。具体数值边界需看原文定理。
四、开放问题(点到为止,扎根具体语句)¶
-
贝叶斯集成步骤的理论一致性在非高斯分布下的拓展:原文假设高斯分布,且 BIC 模型平均一致。若数据来自椭圆分布或更一般的非参数图模型,后验概率的相合性是否还能保持?扎根于定理 1 证明中使用的“高斯似然的 BIC 渐进近似”引理,该引理明确依赖正态性。
-
候选边集规模的理论上界在非稀疏图下的行为:定理 2 要求真实图最大度有界(且 p 增长不太快)。若真实图节点度可以随 n 增长(如 \( d = O(\sqrt{n})\)),则候选边集大小可能变得与 p 同阶,此时检验步骤的多重比较校正可能失效(因为候选集大小与 p 相当)。本文定理未覆盖此情形。扎根于证明中第三步对候选集大小的控制(引理 3:候选集大小 ≤ C d log p),该界依赖于 d 很小。
-
检验步骤的具体实现与调参的细节:原文对条件独立性检验仅指出使用偏相关或残差相关,但实际中高维回归需选择惩罚参数;此外,多重比较校正的层级(在候选集内进行全局 FDR 还是逐边 Bonferroni)会影响结果。这些实际操作中的选择并未全部在理论中覆盖,需要进一步研究检验步骤的有限样本性能。扎根于模拟部分“检验过程使用了 lasso 回归并通过交叉验证选择 λ”的说明。
-
组间差异的统计推断(正式检验):本文方法输出点估计(哪条边为差异),但未提供差异显著性的假设检验(例如“组1与组2在边(1,2)的偏相关系数是否相等”)。未来工作可考虑在联合估计基础上构造差异边的 FDR 控制程序(如直接比较后验概率之差或检验统计量之差)。扎根于作者在结论中“未来方向可引入差异边的显著性测试”(若文中提及)或未提及则属于合理推断。
-
值得研究者去查的: 确认第一步中 BIC 近似后验的一致性是否需要 p 固定或在温和增长下才能成立(如 Nishii 1984,在高维下可能需要 eBIC 修正)。可阅读论文引用的相关文献(如 Haughton 1988 或 Hui 2017)。另可查阅近期“贝叶斯集成在条件独立性检验中的 FDR 控制”的工作,如 Candès & Fan (2018) 等。
Maintained by 陈星宇 · Homepage · Source on GitHub