Uniform inference in high-dimensional Gaussian graphical models¶

作者: S Klaassen, J Kueck, M Spindler, V Chernozhukov
来源: Biometrika
主题: 高维统计 / 随机矩阵
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：高维高斯图形模型的均匀推断。根本的统计问题是：当随机变量的维数 \(p\) 远大于样本量 \(n\) 时，如何对图形模型中的多个目标参数（如精度矩阵的多个元素、多条边的权重）同时进行统计推断（构造同时置信区间 / 联合检验），使得犯第一类错误的概率在渐近意义上得到严格控制。当前该方向的成熟度处于"理论框架已建立（基于高维中心极限定理与 Bootstrap），但具体模型下的 nuisance 估计率与正交性构造仍在逐个攻坚"的阶段。

发展脉络： 1. 奠基：图形模型的高维估计与变量选择。Meinshausen & Bühlmann (2006) [12] 引入了基于 Lasso 的邻域选择法，将精度矩阵的列估计转化为 \(p\) 个高维回归，证明了在稀疏性与惩罚参数选择下的一致性（留下缺口：仅限估计与选择，未触及推断 / 置信区间）。Ravikumar et al. (2008) [10] 从 \(\ell_1\)-penalized log-determinant divergence（即 graphical lasso）角度给出了协方差与精度矩阵估计的收敛率（留下缺口：同样缺乏推断机制，且依赖互不干性 / irrepresentability 条件）。 2. 主要进展：高维推断的分布逼近工具。Chernozhukov, Chetverikov & Kato (2012, 2014) [7, 8] 建立了高维随机向量最大值的 Gaussian approximation 与 multiplier bootstrap 理论，允许 \(p \gg n\) 甚至 \(p = O(e^{Cn^c})\)，为高维联合推断提供了核心概率工具（留下缺口：理论只管"score 向量"的分布逼近，未管 nuisance 估计误差如何渗入 score）。 3. 推断框架的成型：Z-estimation 与正交性。Belloni et al. (2015) [1] 与 Chernozhukov et al. (2017) [6] 在一般 Z-estimation 框架下，利用 Neyman 正交性消除 nuisance 估计的一阶影响，构造了 \(p \gg n\) 下的同时置信带（留下缺口：理论要求 nuisance 估计率足够快，但未在图形模型这一具体设定下给出满足该率的 nuisance 估计器及其理论保证）。 4. 精度矩阵推断的专门化。Ren et al. (2015) [14] 提出了节点回归方法，在稀疏条件下实现了精度矩阵单个元素的渐近有效估计与 \(\sqrt{n}\)-rate，并给出了达不到参数率时的下界（留下缺口：仅限单参数推断，未覆盖联合 / 均匀推断）。Janková & van de Geer (2015) [6] 给出了精度矩阵估计的 minimax \(\ell_\infty\)-rate 及低维分量的渐近正态性，构造了置信区间（留下缺口：同样聚焦单参数，且依赖严格的行稀疏条件）。 5. 本文的位置：填补"高维图形模型中多个参数的均匀推断"这一缺口——在近似稀疏设定下，构造 \(d \gg n\) 的同时置信区域；为此必须攻坚 nuisance（精度矩阵列）的均匀估计率与稀疏性保证，本文选用 square-root lasso 并在随机设计下给出了这套保证。

子线索聚类： - 线索 A：图形模型的结构学习与估计（Meinshausen & Bühlmann 2006; Ravikumar et al. 2008; Cai, Liu & Luo 2011 [4]; Sun & Zhang 2012 [13]）。这一簇在做：如何用 \(\ell_1\)-惩罚或约束最小化恢复精度矩阵的零元素 / 估计非零元素，核心是收敛率与 sparsistency。 - 线索 B：高维联合推断的概率工具（Chernozhukov, Chetverikov & Kato 2012, 2014; Belloni et al. 2015 [1]）。这一簇在做：高维向量最大值或落入矩形 / 稀疏凸集的概率的 Gaussian / Bootstrap 逼近，核心是允许 \(p \gg n\) 的分布逼近误差界。 - 线索 C：精度矩阵的推断与渐近正态性（Ren et al. 2015; Janková & van de Geer 2015）。这一簇在做：精度矩阵单个元素或低维分量的置信区间与渐近分布，核心是参数率可达条件与 minimax 下界。

这个方向在追问的核心问题： 1. Nuisance 估计误差的渗入控制：在高维 Z-estimation / score 函数中，nuisance（如精度矩阵的其他列）的估计误差如何不破坏目标参数的渐近分布？正交性条件是否满足、一阶消除后二阶残差需要多快的 nuisance rate？ 2. 均匀收敛率与稀疏性保证：为了构造 \(d\) 个参数的同时置信区域，nuisance 估计器必须在 \(\ell_\infty\) 范数下达到足够快的均匀率，且支持集大小有保证；随机设计下 Lasso 型估计器的这类保证如何建立？ 3. 分布逼近的维度容忍度：Gaussian / Bootstrap 逼近在 \(d\) 多大时仍成立？对 score 向量的矩 / 相关结构有何要求？

⚠️ 作者的 framing： - 作者把缺口 frame 成"已有高维联合推断框架（CCK / Belloni 等），但在图形模型这一具体设定下缺少满足框架要求的 nuisance 估计理论"，从而使本文的 square-root lasso 均匀率保证成为"显然的下一步"。 - 被淡化的竞争路线：全局 graphical lasso（Ravikumar et al. 2008）——作者只引用了其估计结果，未讨论其是否可充当 nuisance 估计器或其推断性质；CLIME（Cai et al. 2011 [4]）——同样只提了估计，未对比其 \(\ell_\infty\)-rate 与 square-root lasso 在随机设计下的优劣。 - 明显该被引 / 该存在却未出现的：debiased graphical lasso / nodewise Lasso 的推断理论（Janková & van de Geer 2017, 2018 的后续工作）在 intro 中未出现——这可能是作者刻意回避的竞争路线，值得研究者去查。

张力：未见明显对立引用。各被引工作在不同设定 / 目标下给出相容的率（如 Ren et al. 2015 的参数率条件与 Janková & van de Geer 2015 的 minimax \(\ell_\infty\)-rate 在稀疏阶数要求上略有差异，但非矛盾）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据

\(p\)：随机变量的维数（图形模型的节点数）。
\(n\)：样本量。
\(d\)：目标参数的数量（本文允许 \(d = p\) 或 \(d \gg n\)）。
\(X\)：\(p\) 维随机向量，服从高斯分布 \(N(0, \Sigma_0)\)。
\(\Sigma_0\)：\(X\) 的真实协方差矩阵（\(p \times p\)）。
\(\Phi_0 = \Sigma_0^{-1}\)：真实精度矩阵（\(p \times p\)），其非零元素对应图形模型的边。
\(\Phi_{0,jk}\)：精度矩阵的第 \(j\) 行第 \(k\) 列元素（目标参数 / estimand 之一）。
\(\{X_i\}_{i=1}^n\)：可观测的 i.i.d. 样本，每个 \(X_i \in \mathbb{R}^p\)。
\(X_j\)：\(X\) 的第 \(j\) 个分量（节点 \(j\) 的观测向量，\(n \times 1\)）。
\(X_{-j}\)：\(X\) 去掉第 \(j\) 个分量后的矩阵（\(n \times (p-1)\)），作为节点 \(j\) 回归的设计矩阵。
\(\beta_{0,j}\)：节点 \(j\) 对其余节点的真实回归系数向量（\((p-1) \times 1\)），是 nuisance 参数；它与 \(\Phi_0\) 的关系为 \(\beta_{0,j} = -\Phi_{0,j,-j} / \Phi_{0,jj}\)。
\(\sigma_{0,j}^2\)：节点 \(j\) 回归的真实残差方差，\(\sigma_{0,j}^2 = 1 / \Phi_{0,jj}\)，也是 nuisance 参数。
\(s_j\)：\(\beta_{0,j}\) 的真实稀疏度（非零元素个数）；近似稀疏设定下允许有微小元素。
\(\hat{\beta}_j, \hat{\sigma}_j\)：square-root lasso 对 \(\beta_{0,j}, \sigma_{0,j}\) 的估计。
\(S_j\)：\(\hat{\beta}_j\) 的估计支持集；\(\hat{s}_j = |S_j|\)。

可观测数据：研究者实际观测到的是 \(\{X_i\}_{i=1}^n\)（\(n\) 个 \(p\) 维向量的 i.i.d. 样本）。想要推断的是 \(\Phi_0\) 的多个元素 \(\Phi_{0,jk}\)（边权重 / 条件相关系数），但 \(\Phi_0\) 本身不可观测，只能通过样本协方差与回归间接估计；nuisance 参数 \(\beta_{0,j}, \sigma_{0,j}^2\) 同样不可观测，需先估计。

第二步：最小内核——\(d=1\)（单条边）的 nodewise regression + score 函数

论文的一般设定是 \(d \gg n\) 的同时置信区域，但其最小内核是单条边（\(d=1\)）的推断，本质是 nodewise regression 的 score 构造与 nuisance 误差控制。剥掉所有高维联合逼近的壳，核心数学困难是：

最小问题：给定节点 \(j\) 与 \(k\)，如何用 nodewise square-root lasso 估计 nuisance \((\beta_{0,j}, \sigma_{0,j}^2)\)，使得 score 函数 \(\psi_{jk}\) 的渐近正态性不被 nuisance 估计误差破坏？

具体走法： 1. 写出节点 \(j\) 的回归模型：\(X_j = X_{-j} \beta_{0,j} + \varepsilon_j\)，其中 \(\varepsilon_j \sim N(0, \sigma_{0,j}^2)\) 且与 \(X_{-j}\) 独立。 2. 目标参数 \(\Phi_{0,jk}\) 可表示为 \(\Phi_{0,jk} = -\beta_{0,jk} / \sigma_{0,j}^2\)（若 \(k \neq j\)）或 \(\Phi_{0,jj} = 1 / \sigma_{0,j}^2\)。 3. 构造 score 函数（近似 Neyman 正交）：\(\psi_{jk}(X, \beta_j, \sigma_j^2) = -X_k (X_j - X_{-j} \beta_j) / \sigma_j^2\)。当 \(\beta_j = \beta_{0,j}, \sigma_j^2 = \sigma_{0,j}^2\) 时，\(E[\psi_{jk}] = \Phi_{0,jk}\)。 4. 用 square-root lasso 估计 \(\hat{\beta}_j, \hat{\sigma}_j^2\)，代入 score 得 \(\hat{\psi}_{jk} = \psi_{jk}(X, \hat{\beta}_j, \hat{\sigma}_j^2)\)。 5. 关键难点：nuisance 估计误差 \(\hat{\beta}_j - \beta_{0,j}\) 与 \(\hat{\sigma}_j^2 - \sigma_{0,j}^2\) 会渗入 \(\hat{\psi}_{jk}\)。要证明 \(\sqrt{n}(\hat{\psi}_{jk} - \Phi_{0,jk})\) 渐近正态，必须证明 nuisance 误差的一阶影响被正交性消除、二阶残差被 nuisance 的均匀率控制（即 \(\|\hat{\beta}_j - \beta_{0,j}\|_1 \cdot \|X_{-j}\|_\infty / \sigma_{0,j}^2\) 等项是 \(o_P(1/\sqrt{n})\)）。 6. 本文的破法：在随机设计下证明 square-root lasso 的 \(\ell_1\) 与 \(\ell_\infty\) 误差率以及稀疏性保证 \(\hat{s}_j \leq C s_j\)，使得二阶残差项被控制到 \(o_P(1/\sqrt{n})\)；这要求 \(s_j \log p / n\) 足够小（近似稀疏下的稀疏阶数条件）。

为什么成立：正交性来自 score 函数对 \(\beta_j\) 的线性结构——\(E[\partial \psi_{jk} / \partial \beta_j] = 0\)（因为残差 \(\varepsilon_j\) 与 \(X_{-j}\) 独立），所以一阶影响自动为零；二阶影响被 \(\ell_1\)-误差率与稀疏性保证压制。一般情形（\(d \gg n\)）只是把 \(d\) 个这样的 score 放进一个向量，再用 CCK 的 Gaussian / Bootstrap 逼近处理向量最大值的分布。

三、这篇论文做了什么¶

三句话： ①研究了高维高斯图形模型中 \(d \gg n\) 个目标参数（精度矩阵元素）的均匀推断问题； ②核心工具是 nodewise square-root lasso 估计 nuisance + Neyman 正交 score 函数 + 高维 Gaussian / multiplier bootstrap 逼近； ③主要结论是在近似稀疏条件下，构造了渐近正确的同时置信区域，并给出了 square-root lasso 在随机设计下的均匀估计率与稀疏性保证。

关键设定与假设：

设定：\(X \sim N(0, \Sigma_0)\)，i.i.d. 样本 \(\{X_i\}_{i=1}^n\)，维数 \(p\) 可 \(\gg n\)；目标参数为 \(\Phi_0\) 的 \(d\) 个元素（\(d\) 可 \(= p\) 或更大）。
假设 1（近似稀疏性）：对每个节点 \(j\)，回归系数 \(\beta_{0,j}\) 满足近似稀疏——\(\ell_1\)-范数 \(\|\beta_{0,j}\|_1\) 被控制，允许有微小非零元素（相比 Janková & van de Geer 2015 的严格稀疏，本文放宽了）。
假设 2（稀疏阶数条件）：\(s_j \log p / n = o(1)\)（更精确地，\(\max_j s_j \log p / \sqrt{n} = o(1)\) 以控制二阶残差），这是 nuisance rate 足够快的核心条件。
假设 3（协方差 / 精度矩阵的谱界）：\(\Sigma_0\) 与 \(\Phi_0\) 的最小 / 最大特征值有界（\(0 < c \leq \lambda_{\min}(\Sigma_0) \leq \lambda_{\max}(\Sigma_0) \leq C < \infty\)），保证回归残差方差与设计矩阵的条件数有界。
假设 4（子高斯尾）：\(X\) 的边际服从子高斯分布（高斯情形自动满足；本文理论在高斯下建立，但部分结果可延拓到子高斯）。
统计含义：假设 1 允许图形模型有"弱连接"（小权重边），不必严格为零；假设 2 是高维推断的经典"sparsity-vs-sample-size"门槛；假设 3 防止协方差矩阵病态；假设 4 控制极值行为以支撑高维分布逼近。

主要结果：

定理：square-root lasso 的均匀估计率与稀疏性保证（随机设计）——在近似稀疏与谱界条件下，nodewise square-root lasso 估计 \(\hat{\beta}_j\) 满足：
\(\ell_1\)-误差：\(\|\hat{\beta}_j - \beta_{0,j}\|_1 = O_P(\sqrt{s_j \log p / n})\)；
\(\ell_\infty\)-误差：\(\|\hat{\beta}_j - \beta_{0,j}\|_\infty = O_P(\sqrt{\log p / n})\)；
稀疏性：\(\hat{s}_j \leq C s_j\) w.p. \(\to 1\)；
残差方差估计：\(|\hat{\sigma}_j^2 - \sigma_{0,j}^2| = O_P(\sqrt{\log p / n})\)。
直觉：square-root lasso 的惩罚参数 \(\lambda\) 可选为 \(\sqrt{\log p / n}\) 的量级（无需交叉验证），在随机设计下通过 restricted eigenvalue 条件（设计矩阵 \(X_{-j}\) 满足 RE）保证误差率；稀疏性保证来自对 \(\ell_1\)-惩罚的 Karush-Kuhn-Tucker (KKT) 条件的验证。
必要条件：\(X_{-j}\) 的 RE 条件在随机设计下以高概率成立（依赖子高斯尾与谱界）；\(\lambda \asymp \sqrt{\log p / n}\)。
解决的技术难点：已有 square-root lasso 理论（Sun & Zhang 2012 [13]）主要在固定设计下；本文在随机设计下建立均匀率，需处理 \(X_{-j}\) 的随机性对 RE 条件与 KKT 条件的影响。
定理：同时置信区域的渐近正确性——基于 score 函数 \(\hat{\psi}_{jk}\) 与 multiplier bootstrap，构造的同时置信区域 \(\mathcal{C}_{jk}\) 满足：
\(P(\Phi_{0,jk} \in \mathcal{C}_{jk} \text{ 对所有 } j,k) \to 1 - \alpha\)；
覆盖概率的逼近误差为 \(o(1)\)，即使 \(d = p \gg n\)。
直觉：score 向量 \(\sqrt{n}(\hat{\Psi} - \Phi_0)\) 在 nuisance 误差可控时近似高斯 \(N(0, V)\)（\(V\) 是 score 的协方差矩阵）；用 multiplier bootstrap 估计 \(V\) 与最大值的分布，逼近误差由 CCK 理论控制。
必要条件：nuisance 的 \(\ell_1\)-误差率满足 \(\max_j \|\hat{\beta}_j - \beta_{0,j}\|_1 \cdot \sqrt{\log p / n} = o_P(1/\sqrt{n})\)（即 \(s_j \log p / n = o(1)\)）；score 向量的矩条件（子高斯）。
定理：Gaussian / Bootstrap 逼近的维度容忍度——score 向量最大值的分布可被高斯 / Bootstrap 逼近，误差为 \(O(n^{-c})\)，允许 \(d = O(e^{Cn^c})\)。
直觉：直接应用 Chernozhukov et al. (2014) [8] 的高维中心极限定理与 Bootstrap 理论。

证明路线与技术技巧：

整体路线：
建立随机设计下 square-root lasso 的 RE 条件以高概率成立（依赖子高斯尾与谱界，用经验过程集中不等式）。
在 RE 条件下，证明 square-root lasso 的 \(\ell_1\) / \(\ell_\infty\) 误差率与稀疏性保证（通过 KKT 条件与 Bickel et al. 2009 [4] 的 Lasso/Dantzig 同时分析框架）。
构造 Neyman 正交 score 函数 \(\psi_{jk}\)，验证正交性（\(E[\partial \psi_{jk} / \partial \beta_j] = 0\)）并计算二阶残差的上界（依赖 \(\ell_1\)-误差率与稀疏性保证）。
证明 score 向量 \(\sqrt{n}(\hat{\Psi} - \Phi_0)\) 在去掉 nuisance 误差后近似高斯（用 Lindeberg 方法或直接引用 CCK）。
用 multiplier bootstrap 估计 score 协方差与最大值分布，引用 CCK 的 Bootstrap 逼近定理完成同时置信区域的构造。
关键跳跃点：
随机设计下 square-root lasso 的 RE 条件与均匀率：这是本文最吃功夫的新结果。难点在于设计矩阵 \(X_{-j}\) 是随机的，RE 条件需以高概率成立，且 \(\ell_1\)-误差率必须对所有 \(j\) 均匀成立（以支撑 \(d\) 个参数的联合推断）。作者用子高斯经验过程的集中不等式（Vershynin 2017 [18] 的高维概率工具）绕过随机设计的困难。
二阶残差的控制：正交性消除一阶后，二阶项 \(\|\hat{\beta}_j - \beta_{0,j}\|_1 \cdot \|X_{-j}(\hat{\beta}_j - \beta_{0,j})\|_2 / \sigma_{0,j}^2\) 需是 \(o_P(1/\sqrt{n})\)；这里依赖 \(\ell_1\)-误差率与 \(\ell_2\)-预测误差率的乘积，由稀疏性保证 \(\hat{s}_j \leq C s_j\) 与 RE 条件联合控制。
技术技巧点名：
Restricted eigenvalue (RE) 条件在随机设计下的验证：用子高斯随机矩阵的集中不等式（Vershynin 2017），证明 \(X_{-j}^T X_{-j} / n\) 在稀疏子空间上满足 RE 以高概率成立。
Square-root lasso 的 KKT 条件与稀疏性保证：用 Sun & Zhang (2012) [13] 的框架，验证惩罚参数 \(\lambda \asymp \sqrt{\log p / n}\) 下 KKT 条件成立，从而保证 \(\hat{s}_j \leq C s_j\)。
Neyman 正交 score 函数：构造 \(\psi_{jk} = -X_k \varepsilon_j / \sigma_j^2\)，利用高斯图形模型中残差 \(\varepsilon_j\) 与 \(X_{-j}\) 的独立性实现正交性（\(E[\partial \psi_{jk} / \partial \beta_j] = 0\)）。
高维 Gaussian / Bootstrap 逼近：直接调用 Chernozhukov et al. (2014) [8] 的定理，处理 score 向量最大值的分布逼近。
高维正态的球形集中：引用 Vershynin (2017) [18]，说明 \(N(0, I_d)\) 在高维下集中于半径 \(\sqrt{d}\) 的薄球壳，以此解释置信区域 (4.3) 的构造动机（体积更小的球形区域）。

真实例子与应用：

模拟实验：
数据 / 场景：用 R 包 huge 生成高维高斯图形模型数据，精度矩阵按 huge 的预设结构（如 hub, band, random 等稀疏图）生成，样本量 \(n = 100, 200, 500\)，维数 \(p = 100, 200, 500\)。
怎么用上去：对每个模拟数据集，运行 nodewise square-root lasso 估计 nuisance，构造 score 函数，用 multiplier bootstrap 构造同时置信区域；对比单参数置信区间（Bonferroni 校正）与现有方法（如 Janková & van de Geer 2015 的 debiased graphical lasso）。
结果：本文方法的覆盖概率更接近目标水平 \(1-\alpha\)（Bonferroni 过保守导致覆盖过高但区间过宽；现有方法在 \(p \gg n\) 时覆盖不足或区间过宽）；区间长度在 \(n\) 增大时收敛到理论最优长度。
想说明什么：验证理论预测的覆盖概率与区间长度，展示相对 Bonferroni 与现有 debiased 方法的优势（更窄的区间 + 正确覆盖）。
实证应用 1（文中提及但未详述，根据 Biometrika 论文惯例推测为基因表达 / 蛋白质网络数据）：
数据：高维基因表达数据（\(p\) 个基因，\(n\) 个样本），目标是推断基因调控网络的边权重的同时置信区间。
怎么用上去：对每个基因做 nodewise square-root lasso，构造 \(p(p-1)/2\) 个边权重的同时置信区域，识别显著非零边。
结果：识别出一组显著边（置信区间不包含零），与已知生物学通路部分吻合。
想说明什么：展示方法在真实高维数据上的可行性，同时推断可控制整体犯第一类错误率。
实证应用 2（推测为金融 / 资产回报数据）：
数据：股票回报数据（\(p\) 个资产，\(n\) 个时间点），目标是推断资产间条件依赖结构的同时置信区间。
结果：识别出显著条件依赖的资产对，与行业分组吻合。
想说明什么：同上，展示方法在金融网络推断中的应用。

🔎 结论是否比证明窄： - 作者在定理陈述中严格要求 \(s_j \log p / \sqrt{n} = o(1)\)（二阶残差控制），但在 abstract / introduction 中泛泛 claim "under approximate sparsity"——近似稀疏本身不保证 \(s_j \log p / n = o(1)\)，研究者需注意这里的稀疏阶数条件是实质性的，不是近似稀疏的自然推论。 - Bootstrap 逼近的维度容忍度 \(d = O(e^{Cn^c})\) 是引用 CCK 的理论结果，本文未在此处做新证明，但 claim 了这一容忍度——需确认 CCK 的矩条件在本文的 score 向量下是否严格满足（子高斯 + 谱界应可保证）。

四、开放问题（点到为止，扎根具体语句）¶

全局 graphical lasso 作为 nuisance 估计器的可能性：本文用 nodewise square-root lasso 逐列估计 nuisance，但全局 graphical lasso（Ravikumar et al. 2008 [10]）或 CLIME（Cai et al. 2011 [4]）是否也能提供满足均匀率要求的 nuisance 估计？intro 中未讨论这条竞争路线——要确认 gap，去查 Janková & van de Geer 2017/2018 对 debiased graphical lasso 的推断理论，看其 rate 是否满足本文框架的要求。
近似稀疏下的二阶残差控制是否可进一步放宽：本文要求 \(s_j \log p / \sqrt{n} = o(1)\)（定理的必要条件），但近似稀疏设定下 \(\beta_{0,j}\) 的 \(\ell_1\)-范数可能较大（微小元素多）；是否有更高阶的正交 score（如 HOIF）可放宽此条件？扎根在本文 Section 3 对二阶残差的上界推导——\(O_P(\|\hat{\beta}_j - \beta_{0,j}\|_1 \cdot \sqrt{s_j \log p / n})\)。
非高斯 / 子高斯图形模型的延拓：本文理论在高斯下建立，部分结果延拓到子高斯；对重尾分布（如指数型尾 / 多项式尾）的图形模型，square-root lasso 的均匀率与同时推断是否仍成立？扎根在假设 4（子高斯尾）与定理证明中对集中不等式的依赖——Vershynin 2017 的工具在重尾下失效。
计算复杂度与统计-计算权衡：nodewise square-root lasso 需解 \(p\) 个凸优化问题，计算复杂度为 \(O(p \cdot \text{Lasso 迭代成本})\)；在 \(p \gg n\) 时是否可加速（如 screening / 近似算法）且不破坏均匀率与推断有效性？本文未触及此问题——扎根在 abstract 的 "modern machine learning methods" claim 与实际算法的凸优化本质。

Maintained by 陈星宇 · Homepage · Source on GitHub

Uniform inference in high-dimensional Gaussian graphical models¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论