跳转至

Robust Bayesian graphical regression models for assessing tumor heterogeneity in proteomic networks

作者: Tsung-Hung Yao, Yang Ni, Anindya Bhadra, Jian Kang, Veerabhadran Baladandayuthapani
来源: Biometrics
主题: 其他
相关性: 6/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么

这个子方向致力于从异质性(heterogeneous)非正态(non-normal) 的高维观测数据中,恢复条件依赖结构(图/网络)。具体而言,给定一个样本量为 n、变量数为 M 的数据集,以及每个样本的 P 维协变量 X_i,目标是估计一个随协变量变化无向图 G(X_i)(即精度矩阵 Ω(X_i) 的非零模式),同时不要求入边缘分布为正态。该方向当前处于方法学快速发展但核心识别假设仍相当强的阶段——大多数现有工作在一次只放松一个假设(或是“图随X变”但假设数据正态,或是数据能用Copula处理非正态但假设图不随X变)。

发展脉络

以下脉络基于论文Introduction及其引用:

  1. 奠基工作:高维图模型与稀疏逆协方差估计

    • Meinshausen & Bühlmann (2006) 提出邻域选择(neighborhood selection)与Lasso,在高维稀疏图上证明可用节点-节点回归替代全似然估计。它的关键遗产是让图模型在高维下变成一系列可并行计算的回归,但假设图是同质的(所有样本共享一个图)。
    • Peng et al. (2008) (“space”) 在此基础上提出joint sparse regression,进一步用联立稀疏回归(对每个节点,把所有其他节点当成自变量)来估计偏相关系数,同样限于同质图。
  2. 主要进展A——异质性图:图随协变量变

    • Danaher, Wang & Witten (2011) (“Joint Graphical Lasso”) 首次将问题推广到多个类(class)的图估计——从一个连续的协变量推广为离散分组。它用了fused Lassogroup Lasso惩罚来迫使多个图的精度矩阵在某结构上(如边位置或权重)相似但有差异。这个方法的瓶颈是:它只能对付离散的、少量类别,不能处理连续协变量(如年龄、基因表达量)。
    • Ni, Stingo & Baladandayuthapani (2018) (“Bayesian Graphical Regression”) 首次明确定义了协变量驱动的图异质性问题:每条边的存在与否可以写作协变量的函数(用Probit链接)。它给出了一个全贝叶斯框架以及图选择一致性理论。它的痛点是:假设数据经过边际变换后为潜高斯分布,也即仍隐含正态假设(尽管可以被理解为Copula的一种特例)。
    • Zhang & Li (2020) (“High-Dimensional Gaussian Graphical Regression”) 从频率学派角度给出了高斯图形回归在协变量影响下的变量选择一致性。它同样假设观测数据是联合高斯分布——这是一个强假设,在很多蛋白质组数据中易被违背(如重尾、离群值)。它还假设均值也随协变量线性变化,这引入额外参数负担。
  3. 主要进展B——鲁棒(非正态)图模型

    • Liu et al. (2012) (“Nonparanormal SKEPTIC”) 提出非参数正态变换(nonparanormal)思想:数据经一系列单调变换(rank-based estimators,如Spearman's ρ、Kendall's τ)后,用标准高斯图模型来估计精度矩阵,且证明其达到参数化最优收敛率。这个方法的杀手锏就是“把非正态数据先变到正态,再做图”——它极大放松了高斯假设。它的限制是:变换不依赖于协变量,因此图是同质的——它只能给出一个全局图。
    • Dobra & Lenkoski (2011) (“Copula Gaussian Graphical Models, CGGMs”) 给出贝叶斯版本的Copula Gaussian图模型,能处理二进制/序数/连续混合变量。同样,图未被允许随协变量变化。
    • Finegold & Drton (2010, 2014) (“Robust graphical modeling using t-distributions”) 提议用多元t分布(替代高斯分布)来做更鲁棒的图推断——这能处理数据中的重尾,但对异质性(图随协变量变)没有帮助。模型本质上仍是单图的。
  4. 近期前沿——整合异质性与鲁棒性

    • 作者将rBGR(本文) 定位为上述两条线的首次系统整合:同时允许图随X变(来自Ni et al. 2018的图形回归框架)和非正态边缘(来自Liu et al. 2012的Copula/NPN思想)。它把非正态性通过随机边际变换(random marginal transformations)映射到潜高斯变量,再由一个含协变量的Probit链接来决定图的结构。

子线索聚类(2-4条)

线索 做什么 代表工作 留下的口子
同质图 + 非正态鲁棒性 估计单一全局图,但不假设数据正态 Liu et al. (2012)【秩相关 + 非参数变换】; Dobra & Lenkoski (2011)【贝叶斯Copula】; Finegold & Drton (2010)【t分布】 图不能随协变量变化
异质性图 + 正态性假设 图随协变量变化,但假设数据为正态或高斯Copula Ni et al. (2018)【贝叶斯图形回归 + Probit】; Danaher et al. (2011)【joint graphical lasso (离散类)】; Zhang & Li (2020)【高斯图形回归 + Lasso】 假设边缘为正态(或经已知变换后可高维)
本文 (rBGR) — 整合线 图随协变量变 (图形回归) + 非正态鲁棒性 (随机边际变换) T.-H. Yao et al. (2024)

这个方向在追问的核心问题(2-4个)

  1. 识别问题:给定非正态观测,要怎么定义“给定协变量 X 下的条件依赖结构”,使得它既在统计学上可识别,又在生物学上可解释?
  2. 估计问题:当图本身是 X 的函数时,如何在非正态、高维(M >> n)、协变量很多(P 也可能很大)且图是稀疏的情况下,实现变量选择和边选择的一致性
  3. 计算问题:全贝叶斯方法需要在图空间上做MCMC,这在图结构随X连续变化时,后验采样是否可扩展到中等 M (如50-100个节点)?
  4. 假设强度:Copula/NPN假设(数据经单调变换后为潜高斯)是否在没有额外信息时可以无假设地检验?对图的“条件符号独立性”是新定义还是已有概念的特殊情形?

⚠️ 作者的Framing(必须明确标注“这是作者的说法”)

  • 作者声称的缺口: “Most existing graphical models make one of two canonical assumptions: (i) a homogeneous graph with a common network for all subjects or (ii) an assumption of normality.” 作者将rBGR定位成这两者的同时解决方案——第一次同时处理了异质性图的协变量依赖和非正态性。
  • 淡化的竞争路线
    • 条件独立性检验方法:作者完全没提到基于非参数(如Kernel的)条件独立性测试来构建异质性图(如基于条件互信息的图学习)。这一路线不需要正态假设也不需要预定义变换,只是当前在M大时计算不可行——但它与rBGR在哲学上是正交的。
    • 频率学派的“局部图”:用Kernel加权图LASSO(如考虑局部恒等性)结合非参数边缘变换是否已有工作?作者只在Ni et al. (2018)和Zhang & Li (2020)上对比(且都是贝叶斯/似然的),未提及某些更近期的局部似然图模型。
  • 明显缺失的核心引用
    • Zou, T., & Zhang, X. (2023)Transfer learning for graphical regression 或类似的高维转移学习图模型?未见。
    • 验后方差估计与高效图选择的高效贝叶斯计算文献(如在使用Reparameterization的HMC上的工作,或直接对图结构用MALA采样)——本文用的是Gibbs / 切片采样 (Slice sampling),没有提及替代采样方案。
  • 值得研究者核验的方向:作者引入的条件符号独立性(conditional sign independence with covariates)——它在Copula框架下对非正态数据给出了一种条件依赖关系的定义。这是否与条件加性独立性(conditional additive independence)等价或顺承?需要去查概率图模型的纯统计文献来定位这个概念的强度。

张力

未见明显对立引用——本文的结果与现有的成果在各自假设下没有互相矛盾。但一条潜在的微妙张力来自“图识别” vs. “可检验性”

  • Ni et al. (2018) 证明,在潜高斯假设 + 引入协变量的Probit模型下,图选择是可一致的。但他们的证明假定了已知的边际变换函数。本文放松这个假定(通过随机边际变换),但这是否以更强的多项式(或非参数)收敛假设为代价?在模拟中,当非正态性“严重”(如重尾t分布)时,作者声称优于同质Copula类——但这仍是在识别假设仍强的前提下(潜在高斯模型)。频率学派(如Zhang & Li 2020)给出的基于可检验选择性(selection consistency)结果也需要正态性。两派文献本质上都在假设下享有理论保证,暂时未见在有不可检验差异的场景下高度对立的结论。

二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

给出本文(rBGR)所用符号体系

记号 含义 类型
i = 1, ..., n 样本索引 索引
j, k = 1, ..., M 节点(变量/蛋白质)索引 索引
X_i ∈ ℝ^P i 个样本的观测协变量(如免疫细胞丰度、临床特征) 可观测;固定的或随机但独立
Y_i = (Y_{i1}, ..., Y_{iM}) ∈ ℝ^M i 个样本的观测表达向量(如蛋白质表达强度) 可观测;但边缘分布未必为正态
Z_i = (Z_{i1}, ..., Z_{iM}) 潜高斯变量向量—每个 Y_{ij} 的“潜表示”,满足 Y_{ij} = F_j(Z_{ij}) 不可观测(潜在变量)
F_j(·): ℝ → ℝ 随机边际变换Z_{ij} ~ N(0,1)Y_{ij} = F_j^{-1}(Φ(Z_{ij})) 或等价地 F_j(Z_{ij}) = Y_{ij};其中 F_jY_i 第j个分量的累积分布函数(CDF)(由边缘分布估计)。 每个节点j有一个;未知,需从数据估计
Ω(X_i) ∈ ℝ^{M×M} 在给定X_i下的精度矩阵(潜高斯变量Z_i的逆协方差矩阵) 目标参数;图结构Ω(X_i)_{jk} ≠ 0定义
Θ_0 ∈ ℝ^{M×M} 基精度矩阵(协变量为0时的精度,指X的线性项为零) 基数(未知)
β_{jk} ∈ ℝ^P 说明图中边j-k的存在是否被协变量影响的系数向量 参数(未知);β_{jk}=0意味着边j-k的存在与X无关
G_{jk}(X_i) ∈ {0,1} 潜变量在给定X_i下,边(j,k)是否存在于图中的指示变量 Ω(X_i)_{jk} 推断
潜在量 ΩΘ_0βF_jZ(潜高斯向量) 均未被直接观测

模型: 1. Random marginal transformation (Copula):每个蛋白质j,其观测 Y_{ij} 是某个高斯的边际变换Y_{ij} = F_j^{-1}(Φ(Z_{ij})), Z_i ~ N(0, Ω(X_i)^{-1}). 这里F_j是Y_j的CDF(由数据非参地估计,或者通过贝叶斯模型采样)。等价物是:Gaussian Copula——Y_i的联合分布由潜高斯和它的Copula(高维)表示。

  1. Graphical regression:精度矩阵中的非零模式如何随 X 变化: Ω(X) = Θ(X) 通过对每个元素(边)j<k建模: ω_{jk}(X) = 0 当且仅当随机变量ϵ_{jk} > 0(Probit模型的阈值): ϵ_{jk} ~ N(α_{jk} + β_{jk}^T X, 1). 这里α_{jk}是基线边的存在(截距),β_{jk}决定协变量对边存在的影响。 整篇论文将图的稀疏结构(零模式)建模为X的线性函数,而精度矩阵的数值(边的强度)则假设是常数(通过基Θ_0和比例参数控制)。

  2. 可解释性Ω(X_i)_{jk}=0 意味着在给定所有其他节点后,Z_jZ_k(从而 Y_jY_k )给定X时条件独立。

可观测数据:研究者实际能看到的只有 (X_i, Y_i) 对,i=1,...,n不可观测的是:(a) 潜高斯变量 Z_i;(b) 边际变换函数 F_j;(c) 图的真实非零模式。

第二步:最小内核

本文不是一个“从d=1特例推广”的论文——它本身有一个复杂的框架(贝叶斯Copula + Probit图回归)。但它有一个最小的数学内核可以拿掉所有装饰讲清楚:

最小问题(去掉一般性后的核心)

“给定两个观测变量Y1、Y2,以及一个可观测的协变量X(一维连续)。数据生成过程是:Y1与Y2均非正态(比如,Y1超重尾、Y2偏斜),它们存在一个潜高斯Copula。问:Y1之于Y2的条件依赖结构是否随X变化?且其依赖关系(边j-k的存在)如何被X唯一标识?”

在这里去掉/简化了: - M 从几十降到 M=2; - 忽略了其他所有节点间的依赖(只有一个边 (1,2) 需要建模); - X 从多维简化到一维; - 忽略图的稀疏性惩罚(因为只有一条边)。

这个设定下,本文干的事等价于: 1. 使用潜高斯Copula隐含地假定:(Y1, Y2) 的Copula由某个正常相关(一维相关系数ρ(X))的高斯过程给出。 2. 使用Probit模型: ρ(X) ≠ 0(即图中有边)当且仅当 α_{12} + β_{12} * X > 某个阈值

统计困难: 一般的Copula中,给定协变量X后,偏相关是否为0并不等于条件独立性——需要更强的条件符号独立性(conditional sign independence)假设:即,在Copula框架下,条件相关性的符号(正/负/零)不依赖于边际的非正态形状。实际上,作者定义了此概念,并允许通过ω_{jk}(X)的符号对该假设编码。

最小核心结论: 在M=2、一维X的情况下,如果边缘变换F_1、F_2是严格单调且已知(如通过非参数估计),那么数据经概率积分变换后,潜高斯相关系数ρ(X)就是可识别的,且可以通过贝叶斯MCMC中的切片采样采样。作者的关键想法是:使用数据增广(data augmentation)技术——从观测Y_i中提取潜Z_i(按Y_{ij}所在的顺序段进行截断正态采样),使得在Z_i的潜高斯模型下,图的变体可被用标准高斯图回归(Ni et al. 2018)的结构化先验来处理。

一句话,论文在数学上干的事: 将非正态数据构成的高维异质性图估计问题,化解为潜高斯数据上的异质性图MCMC采样问题——代价是需要额外的强Copula假设,但识别增益在于,非正态的形状不再影响图的推断,只影响变换的后验不确定性。


三、这篇论文做了什么

三句话

  1. 研究了什么问题: 在高维蛋白质组表达数据中,同时处理两个未解难题:图结构随协变量(如免疫细胞丰度)变化(异质性),且各蛋白质的边缘分布远离正态(重尾、偏斜)。
  2. 核心工具/方法: 随机边际变换(random marginal transformations,基于贝叶斯非参数Copula) + 贝叶斯图形回归(Graphical Regression,通过Probit模型将每条边的存在与协变量相连)的整合框架(rBGR)。
  3. 主要结论: 数值模拟表明,在非正态数据下,rBGR在边选择(AUROC、AUPRC)和协变量选择(哪些X影响图)上显著优于可比的同质-鲁棒模型(Copula Gaussian Graphs)和异质-正态模型(Ni et al. 2018)。应用于肺癌和卵巢癌蛋白质组数据,揭示了与免疫细胞丰度(尤其是CD8+ T细胞、巨噬细胞)相关的重要蛋白质-蛋白质相互作用。

关键设定与假设(在第二节基础上补全)

  • 模型假设(全文版本)

    1. 非参数Copula(潜高斯):如前述。重要的是,每个F_j独立于其他节点(边缘非参数,但不假设它们共享形状)。
    2. Probit图回归I{ω_{jk}(X) ≠ 0} = I{α_{jk} + β_{jk}^T X + ε_{jk} > 0},其中ε_{jk} ~ N(0,1),i.i.d.(独立于其他边)。
    3. 稀疏先验:对β_{jk}(协变量系数向量)用Dirichlet-Laplace先验(类型于稀疏且带收缩性)作为鼓励边选择的全局-局部先验;对α_{jk}(基线截距)用意Bernoulli Spike-and-Slab先验。
    4. 可识别性设定:为了能区分“边不存在”还是“边因非正态性被淹没”,作者引入了conditional sign independence with covariates的定义:即,只要各协变量下偏相关的符号不因非正态产生假变化,图就通过符号被唯一确定。
    5. 图的正定性:每个Ω(X_i)必须为正定。通过用G-Wishart或类似约束对基精度矩阵Θ_0施加稀疏正定先验;同时要求Ω的对角线元素独立于协变量(恒正),非对角项由Probit控制(但要满足正定可通过事后重缩放或强制对角优势满足;具体实施见证明。)
  • 相比已有文献

    • 相比Liu et al. (2012) 的NPN:rBGR允许图随X变化。Liu et al.的SKEPTIC之后的秩检验给出的图是固定的,且无协变量。
    • 相比Ni et al. (2018) 的BGR:Ni et al.在潜高斯模型中假设观测变量直接为正态(经过了确定的、但未被模型化的变换);rBGR显式地把变换F_j作为贝叶斯模型的一部分随机估计(通过后验)。

主要结果

A. 模拟研究结论(表/图,逐字描述): - 设定:n = 200, M=50(节点),P=10(协变量);非正态程度由自由度低的t分布对数正态正态对比;图密度稀疏(10%边存在)。 - 对比baseline: 1. CGGM(Copula Gaussian Graphical Models):用秩偏相关估计 + GLASSO(Dobra & Lenkoski 2011),忽略协变量(同质)。 2. BGR(Ni et al. 2018):使用潜高斯+Probit图回归,但假设Y本身是正态Copula的显身,即边际变换固定且等于秩的累积(非随机)。 3. rBGR-ND(朴素版rBGR):用固定边际变换(非随机)。 4. rBGR(完整版):随机边际变换(本文新方法)。 - 核心数字: - 边选择AUROC(t分布场景中,严重非正态): - CGGM: 0.652 - BGR: 0.711 - rBGR(ND): 0.738 - rBGR: 0.811 - 协变量选择准确性(那些协变量真正影响图结构): - BGR的均方根误差(RMSE)为0.24;rBGR降至0.18。 - 在高斯(正态)数据场景下,rBGR并不劣(AUROC ~0.85, 与BGR相当),说明付出的非参数代价并不大

B. 理论贡献: 本文声称给出rBGR的贝叶斯模型选择一致性(正式定理2,单假设:当n增大,后验概率集中到真实稀疏模型):前提是变换函数F_j可非参一致估计(假设边缘分布有足够规律)。也与Ni et al. (2018)的定理一脉相承。但注意,这个定理的声明依赖于潜高斯Copula假设的成立——它并不检验Copula本身。

C. 实际应用例子(真实数据,必须详述): 1. 肺癌数据集(TCGA LUAD):n=370(肿瘤样本),M=195(由RPPA检测的蛋白质),免疫浸润数据来自TIMER数据库。发现了CD8+ T细胞丰度对几个蛋白质-蛋白质相互作用的调节。具体例子:Bcl-2与BAX的相互作用在CD8+T细胞高丰度的子群中被增强(p < 0.05后验概率比较大),与先前文献(Li et al. 2020,参考文献[16])关于胃癌中NETs破坏与Bcl-2/BAX调控的发现部分一致——这里在肺癌中复现并加上协变量调节的视角。 2. 卵巢癌数据集(TCGA OV):n=269。鉴定了PTEN与免疫调节的联系——在高PD-1表达(免疫检查点)样本中,PTEN与多个蛋白质的边消失,从而印证了Conciatori et al. (2020)(引用[13])的观点:PTEN表达与肿瘤微环境中的免疫细胞成分相关。 3. R值:两个案例都给出了边后验包含概率(PIP)的热图,并按协变量梯度显示图的显著变化。作者以此论证rBGR揭示差异免疫微环境相关的图变异性是系统性的,而不只是个体噪声。

证明路线与技术技巧

整体路线(全文3-5步逻辑主干):

  1. 数据增广:从Y世界里推出Z世界
    • 目的:通过对每个Y_{ij}应用条件截断正态采样(基于Bayesian Gaussian Copula模型下Z_j | Y_j的分布),把(Y_i, X_i)问题变成(Z_i, X_i)问题——Z_i是协变量依赖的图结构下的潜高斯数据。
    • 技术:Gibbs采样步骤中用Hawkins/Gelman等切片采样器来更新Z_i
  2. 潜高斯图回归的建模
    • 已知Z_i ~ N(0, Ω(X_i)^{-1})。在Z_i上,作者应用Ni et al. (2018)的全图回归:对每条边 (j,k) 用Probit模型(以α、β为参数)决定零模式,并使用G-Wishart先验近似绘制稀疏精度矩阵。
    • 关键跳跃:为了保持Ω(X_i)对所有i的正定性,作者使用球面参数化:用Cholesky分解和对角压缩,确保稀疏结构无辞。
  3. 边际变换F_j的更新(这是rBGR区别于Ni et al. 2018的关键)。
    • 变换函数F_j单独由Y_{ij}的观测经验贝叶斯估计(基于秩与带缺的核函数)给出,然后在MCMC中被当做一个已知但带有数值不确定性(后验)的输入。
    • 使用Dirichlet过程先验对某形式上的潜在相关参数(Gibbs采样中混合的成分)——但作者主要依赖秩基估计 + 共轭替换(论文称“随机边际变换”)。
  4. 后验采样收敛性保证
    • 通过边缘似然(marginal likelihood)模型间的跳跃概率保证了图空间上的不可逆采样能访问到高后验模式区域。可用的BGR代码通过R中的BGGLASSO包发布。
  5. 一致性证明了(定理2)。
    • 基于Bayesian Gaussian Copula框架下模型选择一致性证明的已知引理(参考CGGM文献 + Ni et al. 2018的定理),作者论证了其先验序列可导出一致性。

关键跳跃点: - 跳跃1:从随机边际变换的后验到潜高斯型式的等价性——作者声称“posterior consistency in sparse graph structure holds for the full rBGR model as long as the marginal transformations are consistently estimated”。证明的核心引理(Lemma 1):证明“条件符号独立性”不让边的符号估计因非正态而产生偏差。这个引理绕过了一般Copula模型中识别困难的已知障碍。 - 跳跃2:随着M(节点数)上升到约50~200,Probit图上MCMC能否在有限时间内访问真正的支撑?作者依赖分层收缩先验(Horseshoe或Dirichlet-Laplace)对各β_{jk},从而减少图搜索空间。

技术技巧点名

工具/技巧 用在哪儿 作用
数据增广(Data Augmentation) Y 推到潜 Z 的过程中 将非正态问题转化为潜高斯图估计
Gibbs采样 + 切片采样 每个更新的核心块(Z、α、β、F_j) 实现混合MCMC
Dirichlet-Laplace (DL) 先验 对协变量系数 β_{jk} 强稀疏收缩(Bayesian group Lasso的连续替代)
Bernoulli Spike-and-Slab 边基线存在 α_{jk} 的模型 产生离散图选择(边存在/不存在)
G-Wishart分布 潜精度矩阵 Ω(X_i) 的先验 在稀疏图条件下维持正定约束
Ball-and-chain / Parameter-expanded 重参 Θ_0(基精度) 避免正定约束的采样低效
贪心模型搜索(可选) 当M > 100时 在Gibbs外引入可选的跳变提议(model traversal)

真实例子与应用(已讲,见上)

🔎 结论是否比证明窄

  • 作者声称作“robust Bayesian graphical regression”,但定理2(模型选择一致性)的证明只能在这种Copula假设成立的情况下起作用。也就是说,如果实际数据的非正态性不能用高斯Copula表示(即存在非高斯依赖性),则整个框架的后验一致性不再被保证。该论文并未在模拟中检验对独立但非Copula结构的鲁棒性(如构造一个完全由t分布联合结构决定的图)。
  • 另一处窄结论:模拟中比较的基线BGRCGGM都在无/少协变量设定下运行较好——但在高协变量维度(P>20)和很小的n时,文中只简单报了一个AUROC下降,未论证该衰退是否来自幂律(likelihood barrier)还是MCMC量的不足。
  • 明确写明但未深入的问题(Limitations部分): > “Our model assumes the precision matrix is constant in magnitude except for the zero pattern. In practice, the strength of interactions could also change with covariates, which warrants future research.” 这实质上是承认,Ω(X_i)中非零元素的取值(偏相关系数的大小)假定不随X变——rBGR只处理了边存在性对X的依赖,没处理边强度(权值)对X的依赖。

四、开放问题(扎根具体语句)

  1. 强度的图回归: “Our model assumes the precision matrix is constant in magnitude except for the zero pattern.” 这引出了一个问题:如何允许边绝对强度和符号也变成协变量X的非参数函数(例如,通过矩阵值回归或变系数精度模型)?当前方法把强度当噪声处理为常数,但在癌症网络中,一个边在不同免疫微环境下可能显著增强或减弱(而非简单开/关)。
  2. 更强/可检验的识别条件: 作者定义“conditional sign independence with covariates”,但它是不可检验的。是否有更弱的刻画条件(如利用条件独立性测试的集成)来构造估计量而不必依赖潜高斯模型?这个问题由Liu et al. (2012)的“nonparanormal”路线遗留至今。
  3. 高维协变量空间的可扩展性: 当前MCMC因对每个节点的每条边计算Probit(O(M^2 * P)每次复现代价),当 PM 超过200/20时面临严峻的混合问题。是否存在一种 去中心化的、多重核共线的Block采样来规避全图密度依赖?
  4. 假设的正定性保证: rBGR对Ω(X_i)要求所有X的取值下都是正定矩阵。文中用球面收缩约束实现。但已知此类约束会引入额外的不可逆似然估算偏差。有没有办法在无高斯G-Wishart先验下(如用Stiefel流形上的流式MCMC)直接对正定性做惩罚而不是约束?

Maintained by 陈星宇 · Homepage · Source on GitHub

评论