No eigenvalues outside the support of the limiting spectral distribution of large dimensional noncentral sample covariance matrices¶

作者: Zhidong Bai, Jiang Hu, Jack W. Silverstein, Huanchao Zhou
来源: Bernoulli
主题: 高维统计 / 随机矩阵
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

1. 这个方向是什么¶

本文所在子方向是高维随机矩阵理论（RMT）中谱支撑的精细刻画，具体针对信息加噪声（Information-Plus-Noise, IPN）型样本协方差矩阵。根本问题是：当维数 $p$ 与样本量 $n$ 同阶增长（$p/n \to c > 0$）时，样本协方差矩阵 $\mathbf{B}_n$ 的特征值几乎必然落在什么范围？经典 Marčenko-Pastur 定理只给出了极限谱分布（LSD）的支撑——但当 $\mathbf{B}_n$ 包含非零均值信号（即 $\mathbf{R}_n \neq \mathbf{0}$）时，有限样本的离群值是否可能穿透 LSD 支撑外区域？本文即回答了“不会”这一谱分离性质。目前该方向成熟度较高：信息加噪声模型 LSD 的存在性与解析性质已基本完备，本文完成的是最后一个关键拼图——LSD 支撑外的“无特征值”保证（即所谓的 no eigenvalue outside support 性质）。

2. 发展脉络¶

奠基工作： - Marčenko & Pastur (1967)：建立了经典样本协方差矩阵（中心情形，$\mathbf{R}_n = \mathbf{0}$, $\mathbf{T}_n = \mathbf{I}$）的 LSD——即 Marčenko-Pastur 定律。这是整个 RMT 谱分析的基础。 - Bai & Silverstein (1998, 1999)：在中心情形下证明了“谱分离定理”——对于 LSD 支撑外任意闭区间，有限样本特征值几乎必然不在此区间内。Dozier & Silverstein (2007)：首次将 LSD 的研究推广至 $\mathbf{B}_n = \frac{1}{n}(\mathbf{R}_n + \mathbf{X}_n)(\mathbf{R}_n + \mathbf{X}_n)^*$（即 $\mathbf{T}_n = \mathbf{I}$ 的 IPN 情形），证明了 LSD 的存在及其 Stieltjes 变换满足的自洽方程。但留下了谱分离性质的缺口——他们只证明 LSD 收敛，未证明支撑外无特征值。

主要进展： - Capitaine (2013)：使用 C-代数和精确分析（非概率方法），在 $\mathbf{T}_n = \mathbf{I}$ 的情形下实现了对 IPN 矩阵 LSD 支撑的“精确分离”——证明了支撑外的特征值几乎必然不会出现。但他的方法依赖于 $\mathbf{T}_n = \mathbf{I}$，并未处理一般 $\mathbf{T}_n \neq \mathbf{I}$ 的情形（当 $\mathbf{T}_n$ 是任意非负定 Hermitian 矩阵时的噪声协方差），且证明技术高度抽象，不易迁移。 - Couillet, Debbah & Silverstein (2009)：给出了 IPN 模型在无线通信 MIMO 信道中的应用，提出 Stieltjes 变换的确定性等价，但这是一个应用导向的结果，未触及谱分离的理论核心。 - Zhou, Bai & Hu (2022); Zhou, Hu, Bai & Silverstein (2023)：一般化了 IPN 模型：引入了任意 $\mathbf{T}_n$，建立了 $\mathbf{C}_n = \frac{1}{N}\mathbf{T}_n^{1/2}(\mathbf{R}_n + \mathbf{X}_n)(\mathbf{R}_n + \mathbf{X}_n)^* \mathbf{T}_n^{1/2}$ 的 LSD 存在性与解析性质，包括支撑判定准则。作者称这一系列工作为“一般信息加噪声模型”，在其中断言了 LSD 的存在，但仍缺少支撑外特征值的分离性质*——这正是当前论文填补的缺口。

当前 frontier： - 正是一般 IPN 模型（$\mathbf{R}_n \neq \mathbf{0}$, $\mathbf{T}_n \neq \mathbf{I}$）下的谱分离证明。本文（Bai, Hu, Silverstein & Zhou, 2024, Bernoulli）给出了在适当条件下该性质的严格证明，将中心情形的 Bai-Silverstein 谱分离定理完整推广至非中心 IPN 情形。

本文的位置：本文是这一系列工作的“收官”之作——在 IPN 模型的 LSD 存在性与解析性质得到解决后，用概率方法（Stieltjes 变换 + 局部律 + Cauchy 积分公式）证明支撑外几乎必然无特征值，从而完成对 IPN 谱支撑的完整刻画。

3. 子线索聚类¶

被引文献可大致归为以下三条线索：

线索一（中心情形谱分离，基础方法）：Bai & Silverstein (1999) 是本文方法论的直接先驱——使用 Stieltjes 变换的精细边界分析和矩条件。本文的证明策略（包括使用在 LSD 支撑外构造截断函数、利用 Green 函数的连续性、以及 Borel-Cantelli 引理）直接脱胎于此线索。
线索二（IPN 模型的 LSD 建立）：Dozier & Silverstein (2007) 启动，Zhou et al. (2022, 2023) 推至一般 $\mathbf{T}_n$。这条线索的核心贡献是证明了 LSD 的存在、给出了支撑判断准则，但核心的技术工具（Stieltjes 变换的确定性等效）也被本文直接继承。
线索三（精确谱分离的代数方法）：Capitaine (2013) 是本文的主要竞争路线。她使用 C*-代数与精确分析（而非概率方法）证明了 $\mathbf{T}_n = \mathbf{I}$ 下的谱分离。本文指向的缺口是“其方法无法处理随便 $\mathbf{T}_n$，且未提供解析证明”。

4. 核心问题与瓶颈¶

该方向的核心追问包括： 1. LSD 的存在性与识别：给定 $\mathbf{R}_n$ 和 $\mathbf{T}_n$ 的整体谱信息，$\mathbf{B}_n$ 的 LSD 是什么？——已解决（Zhou et al., 2022）。 2. LSD 的支撑性质：LSD 的支撑区间在哪里？其边界判据是什么？——基本解决（Zhou et al., 2023）。 3. 谱分离（no eigenvalues outside support）：对于 LSD 支撑外的任何闭区间，有限样本特征值是否几乎必然不会出现？——本文填补的正是此缺口。主要瓶颈在于 $\mathbf{R}_n \neq \mathbf{0}$ 时，自洽方程中出现了 $\mathbf{R}_n$ 的谱信息，使得 LSD 的 Stieltjes 变换失去中心情形下的简单结构，边界分析需要同时控制 $\mathbf{R}_n$ 矩阵秩的贡献与噪声协方差 $\mathbf{T}_n$ 的特征值聚集。

5. ⚠️ 作者的 framing¶

作者将缺口 frame 成“将经典 Bai-Silverstein 谱分离定理从中心情形推广至非中心情形”——这一 framing 显得自然且连贯。他们用 Stieltjes 变换方法的连续性与灵活性回避了竞争路线（Capitaine 2013 的精确代数方法）的抽象性与不可扩展性。被他们淡化的方面包括： - 论文在证明中假设 $\mathbf{R}_n$ 和 $\mathbf{T}_n$ 的特征值按某种次序排列、且各级矩有界——这些条件是手工的，可能在实际数据矩阵（如天文成像协方差或遗传关联矩阵）中难以验证。 - 他们默认 $\mathbf{T}_n$ 是确定性已知的——这与信号检测中需要估计噪声协方差的实际操作有距离。 - 什么明显该被引 / 该存在、却没出现在 intro 里？：Capitaine (2013) 虽然被引了，但 Bai-Silverstein (1999) 作为中心谱分离的原文未被作为单独引用出现在介绍的“直接工作”位置（它只出现在一般的参考文献列表中）。此外，关于“spiked 模型”中离群特征值的渐近分布（如 Paul 2007, Johnstone 2001, 以及 Mestre 2008 的 G-estimation）未被引入——这些工作涉及特征值“穿透”支撑时的分布行为，在概念上与本文互补。为何偷懒？因为 spiked 模型关注的是被单个强信号拉出的离群值（在支撑外），而本文关注的是即便没有信号，支撑外也不会有特征值**——但这实际上等价于在信号强度有限的情况下，支撑外特征值不可能来自噪声。这是一个可查的张力点。

6. 张力¶

未见明显对立引用。各条线索（中心谱分离、IPN-LSD 建立、Capitaine 方法）在技术方法上不同但结论一致。一个潜在张力是 Capitaine (2013) 的结论比本文更强的断言（“为所有充分大的 n，支撑外确切无特征值” vs “几乎必然”），但他的方法无法处理一般 $\mathbf{T}_n$——这种强弱与适用范围之间的权衡是非常自然的技术张力。

二、最核心、最简单的例子 / 数学问题（先交代记号、再讲最简例子）¶

第一步：符号、模型、可观测数据交代清楚¶

$\mathbf{B}_n$：$p \times p$ 信息加噪声型样本协方差矩阵。定义：
\[\mathbf{B}_n = \frac{1}{n}(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)^*\]
其中 $n$ 是样本量（观测数），$p$ 是变量维数（行数）。
$\mathbf{X}_n$：$p \times n$ 随机矩阵，其元素为独立同分布的标准化随机变量（均值为0，方差为1）。这是“噪声”的源。
$\mathbf{R}_n$：$p \times n$ 非随机矩阵，代表“信息”或信号——它将均值部分从零向量偏移为非零。
$\mathbf{T}_n$：$p \times p$ 非随机、非负定 Hermitian 矩阵，代表噪声的协方差结构。$\mathbf{T}_n^{1/2}\mathbf{X}_n$ 的各列可视作从 $N(\mathbf{0}, \mathbf{T}_n)$ 分布的随机向量的独立实现（当 $\mathbf{X}_n$ 元素为高斯时）。
特征值：$\lambda_1^{(n)} \ge \lambda_2^{(n)} \ge \cdots \ge \lambda_p^{(n)} \ge 0$ 是 $\mathbf{B}_n$ 的顺序特征值。
经验谱分布（ESD）：$\mu_n = \frac{1}{p} \sum_{i=1}^p \delta_{\lambda_i^{(n)}}$。
极限谱分布（LSD）：$\mu_{c, \mathbf{R}_n, \mathbf{T}_n}$——这是一个非随机概率测度，ESD $\mu_n$ 几乎必然收敛到它（当 $n \to \infty$, $p=p(n)$, $p/n \to c > 0$）。其 Stieltjes 变换 $m(z) = \int (x-z)^{-1} d\mu(x)$ 由一组自洽方程决定。
$c$：维数比率的极限，$p/n \to c \in (0, \infty)$。
支撑：$\text{Supp}(\mu)$——LSD 的支撑，是实数轴上的闭区间集合（可能由多个区间组成）。
$S$：LSD 支撑外的一个闭区间，不与 $\text{Supp}(\mu)$ 相交。本文研究的就是 $S$ 内是否会出现有限样本特征值。

可观测数据： - 研究者观测到的是 $\mathbf{B}_n$ 的 $p$ 个特征值——即样本协方差矩阵的排序谱。它由 $\mathbf{R}_n$ 和 $\mathbf{T}_n$ 的总体信息以及随机噪声共同生成。 - 不可直接观测的是 LSD $\mu$、总体协方差 $\mathbf{T}_n$、“信号” $\mathbf{R}_n$ 的谱分解——它们只能通过假设与渐近分析去识别。

模型假设的核心： 1. $\mathbb{E}[X_{ij}^2]=1$, $\mathbb{E}[X_{ij}]=0$，有至少 $4+\eta$ 阶矩。 2. $p/n \to c$。 3. $\mathbf{R}_n \mathbf{R}_n^*$ 有界范数，且其经验谱分布收敛（某种意义下）。 4. $\mathbf{T}_n$ 的特征值有界且行为正则（各级矩一致有界，且 $\mathbf{T}_n$ 与 $\mathbf{R}_n\mathbf{R}_n^*$ 的秩不矛盾）。

第二步：最小内核¶

整篇论文是对中心情形 Bai-Silverstein 谱分离的技巧性推广。其最小内核可以通过退化到 $c$ 很小、且 $\mathbf{R}_n$ 的秩极小（如秩1）的特例来理解。

最简特例：假设 $p=1$, $n$ 很大，维数比 $c \approx 0$（退化情形）。此时 $\mathbf{B}_n$ 只是一个标量：

\[b_n = \frac{1}{n} \sum_{j=1}^n (r_{1j} + \sqrt{t_{11}} \cdot x_{1j})^2\]

其中 $r_{1j}$ 是 $\mathbf{R}_n$ 的第一行（只有一个值），$t_{11} > 0$，$x_{1j}$ 是独立标准化随机变量。则 $b_n \xrightarrow{a.s.} \lim_{n\to\infty} \frac{1}{n} \sum_{j=1}^n r_{1j}^2 + t_{11}$（由大数定律和 $\mathbb{E}[x_{1j}^2]=1$）。此时 LSD 支撑收缩到一个单点（该极限值），所以“支撑外”的闭区间很容易理解。但这不是本文的通用情形——因为当 $c>0$，支撑不会是单点。

真正能体现本文内核的是一个秩1信号 + 一般噪声协方差的例子： - 令 $p=n$, 即 $c=1$。取 $\mathbf{R}_n = \mathbf{r} \mathbf{1}_{1 \times n}$，即 $\mathbf{R}_n$ 的所有列都是同一个向量 $\mathbf{r} \in \mathbb{R}^p$——即一个秩1信号，且每个观测的均值向量相同。 - 令 $\mathbf{T}_n = \mathbf{I}_p$（单位阵）——噪声为白噪声。 - 可观测数据：$\mathbf{B}_n = \frac{1}{n}(\mathbf{r} \mathbf{1}_{1 \times n} + \mathbf{X}_n)(\mathbf{r} \mathbf{1}_{1 \times n} + \mathbf{X}_n)^*$。 - 此时，在 $c=1$ 下，LSD 是什么？其支撑是什么？是 [0, 4]（即经典 Marčenko-Pastur 支撑的对数变换？直观点：实际上当 $\mathbf{T}_n=\mathbf{I}$，LSD 的支撑取决于 $\mu = \int \frac{\mathbf{r} \mathbf{r}^\top}{\|\mathbf{r}\|^2}$ 这部分——但这里最简例子是使用更直观的记号。实际上这不是一个好的最小内核，因为它不能直接揭示论文的关键困难。）

重来。更简洁的方法——直接使用中心情形下的已知谱分离来上色：

整篇论文的核心数学思想是：对于 LSD 支撑外的任意闭区间 $S$，有限样本特征值 $\lambda_i^{(n)}$ 几乎必然不在 $S$ 中。等价于：当 $n$ 足够大时，被 LSD 支撑排除在外的区间上，不会有质量权重。证明这个性质的最核心工具是 Stieltjes 变换的边界可微性与自洽方程的连续性。在 $n$ 有限时，单个特征值的影响可以被 Stieltjes 变换的导数控制。如果我定义一个截断函数 $f_s(z)$ 在支撑外的一个小邻域内近似于 $1$、在靠近支撑的边界处光滑降至0，那么 $\int f_s(x) d\mu_n(x)$ 要么是特征值计数（如果 $S$ 内有特征值），要么为0。通过比较 $\int f_s(x) d\mu_n(x)$ 与其在 LSD 下的预期值 $\int f_s(x) d\mu(x)=0$，并使用局部尾部概率的指数界，可以证明 $\int f_s(x) d\mu_n(x)$ 几乎必然趋于0。这就是最小内核：利用 Stieltjes 变换无法在支撑外“捕获”质量的事实，通过连续性控制和指数矩边界来排除离群特征值的出现。

那具体数学困难是什么？ 困难来自 IPN 模型的自洽方程比中心情形复杂——$z$ 处的 Stieltjes 变换 $m(z)$ 与 $\mathbf{R}_n$ 的谱以及 $\mathbf{T}_n$ 的特征值耦合在一起，使证明支撑外边界分析的 Cauchy 积分路径必须同时处理多个对角化问题。具体在证明中，关键的跳跃点是：当尝试写出一个 Green 函数 $\mathbf{G}(z) = (\mathbf{B}_n - z\mathbf{I})^{-1}$ 的近似时，需要用确定性等价和有限矩条件控制随机部分。在中心情形（$\mathbf{R}_n=0$），Green 函数的波动有很好的矩指数界。但在这里，$\mathbf{R}_n \neq 0$ 引入了一个确定性秩贡献项，必须通过残差分析分离。这一步本身不困难，但需要使局部律的截断误差与 $\mathbf{R}_n$ 的秩成比例——多了 $p$ 个潜在的谱质量移动点，每次都要精细估计。

三、这篇论文做了什么¶

三句话¶

研究问题：对信息加噪声型样本协方差矩阵 $\mathbf{B}_n = \frac{1}{n}(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)^*$ 在 LSD 的支撑外，是否有有限样本特征值穿透？——答案是没有（几乎必然）。
核心工具/方法：Stieltjes 变换 + Green 函数局部律 + Cauchy 积分公式 + 指数矩边界（Borel-Cantelli 引理的组合），以及在支撑外用截断函数构造谱质量计数。
主要结论：在 $\mathbf{R}_n$ 和 $\mathbf{T}_n$ 的特征值满足适当正则性条件（如各级矩有界、$\mathbf{R}_n\mathbf{R}_n^*$ 的秩增长不太快）下，LSD 支撑外的任一闭区间 $S$，对充分大的 $n$ 几乎必然没有 $\mathbf{B}_n$ 的特征值落在 $S$ 中。

关键设定与假设（在第二节记号基础上补全）¶

假设清单（论文中称为 Assumptions 1-5，以下归纳为核心三条）：

(噪声矩条件) $\mathbf{X}_n$ 的元素独立同分布，满足 $\mathbb{E}[X_{ij}]=0$, $\mathbb{E}[X_{ij}^2]=1$, 且有有限 $4+\eta$ 阶矩（$\eta > 0$）。这使得在局部律证明中可以使用截断的 Lindeberg 型估计——矩的指数边界需要四阶以上矩来抵消 Cauchy 积分中的幂次增长。
(谱正则性)
$\mathbf{T}_n$ 的元素一致有界，且其特征值在 $[0, M]$ 中，转变成有界支撑。
$\mathbf{R}_n \mathbf{R}_n^*$ 的谱范数一致有界，且 $\operatorname{rank}(\mathbf{R}_n)$ 可能增长（只要不超过 $o(n)$ 速率）。
$\mathbf{R}_n$ 的“信号”部分不能太大：其最大特征值必须低于 MSS 支撑边界，否则会有确定性离群值——但本文假定它们的谱都已融入 LSD 的主体区间。
(交换条件) $\mathbf{T}_n$ 与 $\mathbf{R}_n \mathbf{R}_n^*$ 可交换：$\mathbf{T}_n \mathbf{R}_n \mathbf{R}_n^* = \mathbf{R}_n \mathbf{R}_n^* \mathbf{T}_n$。这个条件保证了 Stieltjes 变换的自洽方程有简单的对角化形式——否则无法统一处理 $\mathbf{T}_n$ 的谱旋转影响。相比 Zhou et al. (2022) 中允许 $\mathbf{T}_n$ 任意（但不提供谱分离），本文为了得到强结论做了更强的可交换性假设。

与已有文献的对比： - 相比中心（$\mathbf{R}_n=0$）的 Bai-Silverstein，本文的假设2更严——$\mathbf{R}_n$ 的特征值必须均匀融入 LSD 主体，不能有“spike”； - 相比 Capitaine (2013) 的 $ \mathbf{T}_n = \mathbf{I} $ 情形，本文的假设3使得 $\mathbf{T}_n$ 可以一般化。

主要结果（2-3 个最关键定理）¶

定理 1（谱分离）：

假设 Assumptions 1-5 成立。记 $\mu$ 为 LSD，$S$ 是 $\mathbb{R}_+$ 中的一个闭区间，满足 $S \cap \text{Supp}(\mu) = \varnothing$。则几乎必然地，存在 $N = N(S, \omega)$ 使得对所有 $n > N$，$\mathbf{B}_n$ 的所有特征值 $\lambda_i^{(n)}$ 都不在 $S$ 中。

直觉：有限样本的特征值不能穿透 LSD 的支撑“江界”。必要条件：$S$ 不能包含 LSD 密度的任何接触点。困难在于 $S$ 可能非常靠近支撑的边界——此时 Cauchy 积分需要处理靠近边界的解析延拓，而 Green 函数在边界附近的实部震荡难以用有限的样本量控制。作者的解决方案是：使用 Stone's 公式（LSD 密度的表达式）将边界附近的谱质量与 Stieltjes 变换虚部联系起来，并通过自洽方程证明在支撑外，虚部不可能一致小。

定理 2（允许特征值序列收敛到支撑边界）：

在相同假设下，如果 $S$ 是 $\text{Supp}(\mu)$ 的闭边界的子集，则结论依然成立。

技术细节：这里的“边界”是指支撑的拓扑边界，但作者实际上证明了即使 LSD 有零密度点，只要不是支撑“开核”的点（即不是真正的支撑内部），分离性质仍保持。这是通过一个局部化 Hu-Li-Cheng 型的精细分析达成的。

定理 3（$c>1$ 时的零附近支撑分离）：

当 $c > 1$ 时，$\mathbf{B}_n$ 在 $p > n$ 情形下会有 $p-n$ 个必然为零的特征值。本文证明这零特征值块不会与 LSD 支撑在 $0$ 附近的边界冲突——即 LSD 的支撑在零附近一定是开区间，零本身在支撑外，且有限样本不会在 LSD 支撑的零端产生特征值。

证明路线与技术技巧¶

整体路线（3-5 步）：

Step 1：定义 Stieltjes 变换并写出自洽方程 令 $m_n(z) = \frac{1}{p} \operatorname{tr}((\mathbf{B}_n - z\mathbf{I})^{-1})$，其几乎必然极限 $m(z)$ 满足一个确定性自洽方程

\[m(z) = \int \frac{1}{t(1-c-czm(z)) - z} d\nu(t)\]

其中 $\nu$ 是 $\mathbf{T}_n$ 经验谱分布的极限。这一步是已知结果（Zhou et al., 2022）。

Step 2：在支撑外构造截断函数 对于闭区间 $S \subset \mathbb{R} \setminus \text{Supp}(\mu)$，取光滑函数 $\phi_S(\cdot)$ 在 $S$ 上为 1，在 $\text{Supp}(\mu)$ 的某个小开邻域外为 0。关键点是 $\phi_S$ 与 LSD 的积分 $\int \phi_S(x) d\mu(x)=0$。证明则化为证明 $\int \phi_S(x) d\mu_n(x)$ 几乎必然收敛到 0——因为如果 $S$ 中有特征值，该积分至少会 $1/p$ 量级地非零。

Step 3：Cauchy 积分公式表示截断积分 使用 Cauchy 积分公式将 $\int \phi_S d\mu_n$ 写成沿着绕开支撑的闭路径 $C_\delta$ 上的 $m_n(z) \phi_S(z) dz$ 积分（$\phi_S$ 解析延拓到复平面）。类似地对极限 $m(z)$ 写下同一积分，相减得

\[\left| \int m_n(z) \phi_S(z) dz - \int m(z) \phi_S(z) dz \right|\]

这等价于 $\int \phi_S d(\mu_n - \mu)$。

Step 4：局部律控制差值 关键跳跃点：

需要证明在路径 $C_\delta$ 上，$m_n(z)$ 与 $m(z)$ 的差值以概率 1 的指数速率趋于 0。

这就是著名的局部律（Local Law）。作者以 [Lemma 4.1] 的形式建立：对于所有 $z \in C_\delta$ 和任意 $\varepsilon>0$，有

\[P(|m_n(z) - m(z)| > \varepsilon) \leq C_1 n^{-C_2}\]

其中 $C_1, C_2$ 依赖于 $\text{Im}(z)^{-1}$ 和特征值边界的曲率。证明这一点的困难在于 $\mathbf{R}_n \neq 0$ 的秩贡献项：如果 $\mathbf{R}_n$ 的秩为 $r$，则在展开 Green 函数时会出现一个由 $\mathbf{R}_n$ 的向量张成的 $r$ 维子空间，随机矩阵 $\mathbf{X}_n$ 在这子空间上的投影波动需要在证明中被分离处理。

作者的技巧是：通过 Woodbury 恒等式

\[(\mathbf{B}_n - z\mathbf{I})^{-1} = (\mathbf{A}_n - z\mathbf{I})^{-1} - (\mathbf{A}_n - z\mathbf{I})^{-1} \mathbf{R}_n \mathbf{R}_n^* (\mathbf{A}_n - z\mathbf{I})^{-1} / (1 + \mathbf{R}_n^* (\mathbf{A}_n - z\mathbf{I})^{-1} \mathbf{R}_n)\]

其中 $\mathbf{A}_n = \frac{1}{n} \mathbf{T}_n^{1/2} \mathbf{X}_n \mathbf{X}_n^* \mathbf{T}_n^{1/2}$ 是“纯噪声”矩阵（其中心情形 LSD 已知）。于是 $m_n(z) - m(z)$ 的主要随机部分来自 $\mathbf{A}_n$ ——这部分的局部律已有 Bai-Silverstein 的经典结果——外加一个秩为 $r$ 的修正项。这修正项被证明可以以 $1/r$ 或更强的比率吸收到指数界中。

Step 5：Borel-Cantelli 引理与几乎必然收敛 将 Step 4 的概率界代入 Step 3 的积分，得到 $\int \phi_S d(\mu_n - \mu)$ 的概率指数衰减，从而由 Borel-Cantelli 得到几乎必然收敛到 0。由于截断函数只有 0-1 输出，这排除了有限样本特征值落在 $S$ 中的可能性。

技术技巧点名： 1. Woodbury 公式的再线性化：将 IPN 矩阵分解为纯噪声矩阵+秩扰动，用已知的中心情形局部律覆盖噪声部分，再用秩相关余项的指数控制将它们吸收。 2. Cauchy-Stieltjes 积分公式的截断用法：不是处理单个特征值，而是将区间上的质量表示为复平面上的轮廓积分。 3. 矩指数边界与指数不等式：当 $\mathbf{X}_n$ 元素有 $4+\eta$ 阶矩时，通过 Hölder 不等式和 Jensen 不等式推导最高阶矩的界，这是 Bai-Silverstein 谱分析的惯用技巧（“Bai-Silverstein 截断方法”）。 4. 两个谱的耦合处理：$\mathbf{R}_n \mathbf{R}_n^*$ 的谱和 $\mathbf{T}_n$ 的谱在自洽方程中耦合，作者通过将 $\mathbf{T}_n$ 的对角线加进来简化问题——这是重指标化（reindexing）技巧的变形。

真实例子与应用¶

本文为纯理论论文，无实证例子。没有任何模拟、真实数据应用或数值对比实验。唯一的“应用”场景是在引言中提及“相关应用包括高维信号检测、MIMO 通信信道容量分析”——但这些并未被实现。

🔎 结论是否比证明窄¶

有潜在“结论过宽”的风险。具体： - 论文的 Assumption 4(a) 要求 $\mathbf{R}_n$ 的各级矩“一致有界”——但这包括 $\mathbf{R}_n \mathbf{R}_n^*$ 的特征值分布趋于某极限测度。在许多实际情况下，$\mathbf{R}_n$ 可能只包含有限个信号（稀疏秩），但它的经验谱分布会退化，此时 Assumption 4(a) 可能不满足，而定理 1 声称的“几乎必然”是对所有满足假设的序列成立的。结论中的“对任何闭区间 $S$ 外于支撑”这一断言是否涵盖退化情形？如果 $\mathbf{R}_n$ 只含一个秩-1信号[1,1,...,1]并膨胀到 $O(1)$，Assumptions 4(a) 会自动满足吗？似乎充要条件没有完全验证。建议研究者检查 Assumption 4 中关于 $\mathbf{R}_n$ 的末态条件是否严格覆盖了典型低秩信号情形（如 $r = O(\log n))$——这可能是一个窄结论：低秩信号的谱分离被证明，但未被显式验证）。 - 证明的局部律（Lemma 4.1）要求 $n$ 足够大，但 $n$ 的“足够大”的下界依赖于 $S$ 到支撑边界的距离——距离越小，下界越大。但在定理陈述中，$S$ 被固定但可以任意接近支撑——此时下界可能发散。这在技术上是否导致结论对“任意闭区间 $S$”的覆盖变成“对任意给定闭区间 $S$，可以找到充分大的 $n$”？——如果是这个 weaker 的解读，则结论与满陈述之间的差距是：满陈述似乎暗示存在统一的 $N$ 能同时工作于所有支撑外区间。这是结论比证明窄的一个显著风险。建议读者核对 Theorem 1 的陈述原文是否为 “for any closed interval outside the support... with probability one there will be no eigenvalues falling in this interval for all $n$ sufficiently large”——其中的 $\omega$ 依赖读出 “for given $S$”，是 standard 的（不是 uniform 的），所以并未承诺对 $S$ 的近边界序列有一致性。

四、开放问题（点到为止，扎根具体语句）¶

非交换 $\mathbf{T}_n$ 下的谱分离：本文要求 $\mathbf{T}_n$ 与 $\mathbf{R}_n \mathbf{R}_n^*$ 交换——此假设在 Zhou et al. (2022) 的 LSD 存在性中也是必需的。根植于论文 Assumption 5。能否将此假设放松为渐近可交换（如离对角度量? 或仅需要 $\mathbf{T}_n$ 的谱分布已知）？这直接关系到将谱分离性质用于因果推断中器械矩阵为任意非交换结构的情形。
spiked 模型下的交互分析：本文排除了 LSD 支撑外的特征值，但当 $\mathbf{R}_n$ 包含主导信号（其最大特征值超过 LSD 上界）时，特征值必然穿透。这种穿透点在 $p/n \to c$ 下究竟何时出现、何时消失？ 参考文献中 Capitaine (2013) 对于 $\mathbf{T}_n=\mathbf{I}$ 给出了精确的相变条件。本文未涉及这部分——请在结论第 5 页确认“spike 现象”“condition of spike”等关键词是否出现。对于 $ \mathbf{T}_n \neq \mathbf{I}$，相变局面尚不清楚，是重要的延伸。
有限样本的显式概率界：本文的证明基于 Borel-Cantelli 的几乎必然收敛，但未给出有限 $n$ 下非零特征值落入支撑外的概率闭公式。这是 Bai-Silverstein 谱分离文献中常见的情形——本文的局部律（Lemma 4.1）给出的只是 $O(1/n^k)$ 型指数界，但对于实际应用（如确定 $n$ 需多大才能安全使用谱支撑做阈值检验），需要更精细的数值近似。
离散化的计算成本（针对高维统计）：本文未讨论计算问题。当 $n,p$ 巨大时，计算 $\mathbf{B}_n$ 的特征值分解需要 $O(\min(n^2 p, p^2 n))$ 的复杂度。后续工作可考虑利用谱分离性质进行快速近似，或者将分离概念扩展到流形伙伴矩阵——但注意本文未涉足任何计算边界分析，这只是纯数学结论。

请研究者核查：本文引用了 Bai & Silverstein (2004) 的专著和 Dozier & Silverstein (2007) 论文，但未引用最近的两篇相关工作：Capitaine (2013) 的精确分离结果、以及关于一般 IPN 模型支撑分析的 Zhou et al. (2023) 第二篇论文（已在本精读中被列为引用）。确保你检索了这些文献以理解技术性质的上下文。

Maintained by 陈星宇 · Homepage · Source on GitHub