Asymptotic distributions of largest Pearson correlation coefficients under dependent structures¶

作者: Tiefeng Jiang, Tuan Pham
来源: Annals of Statistics
主题: 高维统计 / 随机矩阵
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向研究的是高维数据（维数 \(p\) 远大于或随样本量 \(n\) 趋于无穷）中，样本相关矩阵最大非对角元（即 coherence / 最大 Pearson 相关系数）的极值渐近分布。根本统计问题在于：当 \(p\) 极大时，随机向量各分量间哪怕在总体上相互独立或仅有微弱依赖，样本相关系数的极大值也会以不可忽略的概率偏离 0；若要基于此极大值做假设检验（如检验协方差阵是否为单位阵、是否具有某种带状/Toeplitz结构），必须精确刻画其渐近分布与相变规律。当前该方向在独立/球面分布设定下已相当成熟，但在总体协方差具有特定依赖结构（如等相关、Toeplitz、AR序列）时，极值分布如何偏离经典 Gumbel 律、相变阈值在哪，正处于被精确刻画的前沿期。

发展脉络： 1. 奠基工作：Jiang (2004) 与 Zhou (2007) 首次在 \(p/n \to \gamma > 0\) 且总体独立或球面分布的设定下，证明样本相关矩阵最大非对角元经适当标准化后弱收敛于 Gumbel 分布（极值分布类型 I），工具为 Chen-Stein Poisson 近似与中偏差；Li, Qi, Rosalsky (2010) 与 Shao, Zhou (2014) 进一步给出该 Gumbel 极限成立的必要与充分条件，将 \(p\) 的增长速率精确到 \(\log p = o(n^\beta)\) 的各类情形。 2. 主要进展（超高维与相变）：Cai & Jiang (2011) 将 \(p\) 推至超高维（\(p \gg n\)，甚至 \(p = O(e^{n^c})\)），完整刻画了 \(\log p / n\) 从趋于 0 到趋于 \(\infty\) 三段相变下 coherence 的渐近分布；同年 Cai & Jiang 另一篇将此用于检验协方差带状结构与压缩感知矩阵构造。Liu, Lin, Shao (2008) 给出收敛到极值分布的 Berry-Esseen 速率 \(O((\log n)^{5/2}/\sqrt{n})\)，远快于典型 \(O(1/\log n)\)。 3. 当前 frontier（依赖结构下的极值）：Fan & Jiang (2019) 首次切入非独立总体——等相关（equi-correlated）正态总体，发现当共同相关系数 \(\rho > 0\) 时，最大样本相关系数的极限分布从 Gumbel 律突变为正态律；当 \(\rho\) 落在随 \(n\) 衰减至 0 的阈值附近时，极限为正态与 Gumbel 的卷积。本文（Jiang & Pham 2024）将此推进至更一般的 Toeplitz 协方差（特别是 AR(1) 结构），在超高维下得到正态与 Gumbel 加权和的极限，并精确刻画 AR(1) 参数 \(\rho\) 的相变阈值。 4. 本文的位置：在“独立设定 Gumbel 律 → 等相关设定正态律”之间，本文填补了“衰减相关（Toeplitz/AR）设定下极值如何渐近”的缺口，给出相变阈值与临界分布的具体表达式，并将超高维设定下的极限形式统一为“正态 + Gumbel 加权和”。

子线索聚类： - 线索 A：极值渐近分布的精确刻画与速率（Jiang 2004; Zhou 2007; Liu et al. 2008; Li et al. 2010; Shao & Zhou 2014; Cai & Jiang 2011b）：在总体独立或球面分布下，追求 Gumbel 极限的必要/充分条件与最优收敛速率。 - 线索 B：依赖结构下的相变与极限形式（Fan & Jiang 2019; 本文）：当总体协方差非单位阵（等相关、AR、Toeplitz）时，极值分布偏离 Gumbel，出现正态分量或卷积/加权和，核心是找相变阈值。 - 线索 C：高维中心极限定理与 Gaussian 近似（Chernozhukov et al. 2012, 2013, 2014, 2019; Koike 2019, 2020; Bentkus; Götze; Portnoy）：为高维随机向量最大值的分布提供 Gaussian 近似与 multiplier bootstrap，误差界在 \(\log^3(p)/n\) 级别，是本文证明中替换极值概率的关键工具。 - 线索 D：高维协方差检验与 power enhancement（Cai & Jiang 2011a; Cai & Ma 2012; Cai & Zhang 2014; Yu et al. 2020, 2021; Feng et al. 2020）：将极值分布理论用于构造检验（max-type vs sum-type vs max-sum/Fisher 组合），追求对稀疏/稠密备择的 power 最优性。

这个方向在追问的核心问题： 1. 相变阈值的 sharpness：总体依赖强度（如 AR 参数 \(\rho\)、等相关系数）在哪个精确阈值上，使极值分布从 Gumbel 型突变为含正态分量的型？阈值是否随 \(n, p\) 衰减？ 2. 超高维下极限分布的结构：当 \(\log p / n \to \infty\)（超高维）且总体有衰减依赖时，极值的极限分布是否总是正态与 Gumbel 的某种混合？权重如何由协方差结构决定？ 3. 非高斯总体下的鲁棒性：上述相变与极限形式在非高斯（如有限矩、重尾）设定下是否成立？需要何种矩条件？ 4. 检验的 size 与 power：基于这些极限分布构造的协方差检验，在依赖结构备择下是否仍能控制 size、并在稀疏/稠密备择下达到 minimax power？

⚠️ 作者的 framing： - 作者将缺口 frame 为：Fan & Jiang (2019) 证明了等相关（所有非对角元同为 \(\rho\)）下的相变，但“等相关太特殊，自然推广是 Toeplitz 协方差（特别是 AR(1)），其中相关系数随距离衰减；此时极值分布如何、相变阈值在哪，完全未知”。这让本文成为“从等相关到衰减相关”的显然下一步。 - 被淡化的竞争路线：基于 U-统计量的 sum-type 检验（Cai & Ma 2012; Yu et al. 2020, 2021）在稠密备择下更有 power，但本文只在应用部分提了一句 max-type 检验，未对比 sum-type 或 max-sum 的 power 优势；高维 Gaussian 近似（Chernozhukov et al. 系列）被当作技术工具引用，未讨论其 bootstrap 方法是否可直接替代本文的极限分布用于检验。 - 缺失的引用：半参数/无分布检验（如 Han et al. 2014 基于 Kendall's tau/Spearman's rho 的 Gumbel 极限）未在 intro 出现——若要推广到非参数依赖结构，这些工作是自然对照；随机矩阵谱方法（如 Heiny & Mikosch 2017 关注最大特征值而非最大非对角元）也未引，虽问题不同但同属高维相关矩阵极值。

张力：未见明显对立引用。各工作在不同设定（独立 vs 等相关 vs AR vs 超高维）下得不同极限形式，彼此互补而非矛盾；唯一“张力”是 Fan & Jiang (2019) 的等相关阈值 \(\rho_n^* \sim \sqrt{\log p / n}\) 与本文 AR(1) 阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\) 的衰减速率不同，这反映依赖结构衰减方式对相变位置的实质性影响，是高价值信号。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据

\(n\)：样本量（独立观测次数）。
\(p\)：随机向量的维数；本文允许 \(p \to \infty\)，重点在超高维设定 \(\log p / n \to \infty\)。
\(\mathbf{x}_1, \dots, \mathbf{x}_n\)：\(p\) 维独立同分布观测样本，每个 \(\mathbf{x}_k = (x_{k1}, \dots, x_{kp})^\top\)。
\(\Sigma\)：\(p \times p\) 总体协方差矩阵；本文核心设定为 Toeplitz 矩阵 \(\Sigma = (\sigma_{ij})\)，其中 \(\sigma_{ij} = a_{|i-j|}\)（仅依赖坐标距离），特别关注 AR(1) 结构 \(\sigma_{ij} = \rho^{|i-j|}\)，\(|\rho| < 1\)。
\(\hat{\Sigma}\)：样本协方差矩阵 \(\hat{\Sigma} = \frac{1}{n-1} \sum_{k=1}^n (\mathbf{x}_k - \bar{\mathbf{x}})(\mathbf{x}_k - \bar{\mathbf{x}})^\top\)。
\(\hat{R} = (\hat{r}_{ij})\)：样本相关矩阵，\(\hat{r}_{ij} = \hat{\sigma}_{ij} / \sqrt{\hat{\sigma}_{ii} \hat{\sigma}_{jj}}\)；对角元 \(\hat{r}_{ii} = 1\)。
\(L_n\)：样本相关矩阵最大非对角元，\(L_n = \max_{1 \le i < j \le p} \hat{r}_{ij}\)——这是本文的核心研究对象（estimand / 极值统计量）。
\(\rho\)：AR(1) 序列的自回归参数，\(|\rho| < 1\)；控制总体依赖强度，是相变的关键参数。
\(a_k\)：一般 Toeplitz 协方差中距离为 \(k\) 的总体协方差/相关系数，\(a_0 = 1\)；本文要求 \(a_k\) 满足一定衰减条件。
\(Z, G\)：极限分布中的随机变量：\(Z\) 为标准正态，\(G\) 为 Gumbel 型随机变量（具体参数由标准化序列决定）。
可观测数据：研究者实际观测到的是 \(n\) 个 \(p\) 维独立样本 \(\mathbf{x}_1, \dots, \mathbf{x}_n\)（来自 \(N(0, \Sigma)\)，\(\Sigma\) 为 Toeplitz/AR(1)），由此可计算 \(\hat{R}\) 与 \(L_n\)；总体协方差 \(\Sigma\) 的结构（Toeplitz 形式及参数 \(\rho\) 或 \(a_k\)）是未知的、需靠假设或检验去识别。

第二步：最小内核——AR(1) 结构下最大相关系数的相变

剥掉一般 Toeplitz 与超高维的技术外壳，支撑整篇论文的最小内核是：当总体协方差为 AR(1)（\(\sigma_{ij} = \rho^{|i-j|}\)）且 \(p\) 与 \(n\) 同比例增长（\(p/n \to \gamma > 0\)）时，\(L_n\) 的渐近分布如何随 \(\rho\) 发生相变？

独立情形（\(\rho = 0\)）的已知结果：此时 \(\Sigma = I_p\)，Jiang (2004) 已证
\[n L_n^2 - 4\log p + \log\log p \xrightarrow{d} \text{Gumbel}(2),\]
即极值服从经典 Gumbel 律（参数 2，CDF 为 \(\exp(-(8\pi)^{-1/2} e^{-t/2})\)）。直觉：\(p(p-1)/2\) 个独立相关系数近似独立，最大值落入极值理论的 Gumbel 域。
AR(1) 情形的相变（本文最小内核）：设 \(\Sigma\) 为 AR(1)，\(|\rho| < 1\)。关键观察：相邻坐标 \((i, i+1)\) 的总体相关为 \(\rho\)，距离越远衰减越快。当 \(|\rho|\) 小时，绝大多数非对角总体相关接近 0，样本最大相关仍由“大量微弱依赖中的随机极值”主导，极限应接近 Gumbel；当 \(|\rho|\) 大时，相邻坐标的样本相关被总体 \(\rho\) 强力拉向 \(\rho\)，最大值主要由这些“强依赖对”的随机波动主导，波动近似正态，极限应含正态分量。
相变阈值与三种极限：本文证明存在阈值 \(\rho_n^* = c (\log p / n)^{1/4}\)（\(c\) 为常数），使得：
\(|\rho| < \rho_n^*\)（弱依赖）：\(L_n\) 经与独立情形相同的标准化后，极限仍为 Gumbel 分布（参数随 \(\rho\) 微调）——总体依赖太弱，不足以改变极值的 Gumbel 性质。
\(|\rho| > \rho_n^*\)（强依赖）：\(L_n\) 的极限突变为另一个 Gumbel 分布（参数不同）——此时最大值主要由相邻强依赖对的波动主导，但经适当标准化后仍呈极值型（因相邻对数量为 \(p-1\)，仍足够多使最大波动落入 Gumbel 域）。
\(|\rho| = \rho_n^*\)（临界）：极限为两个独立 Gumbel 变量的最大值——弱依赖极值与强依赖极值恰好竞争，谁都不占优，极限取两者之 max。
为什么相变阈值是 \((\log p / n)^{1/4}\)？：直觉来自相邻对样本相关 \(\hat{r}_{i,i+1}\) 的波动尺度。\(\hat{r}_{i,i+1}\) 围绕 \(\rho\) 的波动标准差约为 \((1-\rho^2)/\sqrt{n}\)；要使此波动能超越大量弱依赖对的极值水平（约 \(\sqrt{(\log p)/n}\)），需 \(\rho\) 使得 \(\rho + O(1/\sqrt{n})\) 的上尾能与 \(O(\sqrt{(\log p)/n})\) 竞争。临界条件 \(\rho \sim \sqrt{(\log p)/n}\) 给出 Fan & Jiang (2019) 等相关的阈值；但 AR(1) 中相邻对仅 \(p-1\) 个（而非 \(p(p-1)/2\) 个），极值水平降为 \(\sqrt{(\log p)/(n \cdot p)}\) 的量级，与 \(\rho\) 的波动 \(O(1/\sqrt{n})\) 竞争时，阈值降为 \((\log p / n)^{1/4}\)——这正是本文阈值与等相关阈值不同的根源。

三、这篇论文做了什么¶

三句话： ①研究了总体协方差为 Toeplitz 矩阵（特别是 AR(1) 结构）时，样本相关矩阵最大非对角元的渐近分布与相变。 ②核心工具是高维 Gaussian 近似（Chernozhukov et al. 系列）与极值概率的精确分解，将最大值的分布替换为 Gaussian 向量最大值的分布再加修正。 ③主要结论：AR(1) 下存在相变阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\)，阈值两侧极限为不同参数的 Gumbel 分布，临界情形为两个独立 Gumbel 之 max；一般 Toeplitz 在超高维下，极限为正态与 Gumbel 型变量的加权和。

关键设定与假设： - 设定 1（AR(1) 相变）：\(\mathbf{x}_k \sim N(0, \Sigma)\)，\(\Sigma\) 为 AR(1)（\(\sigma_{ij} = \rho^{|i-j|}\)，\(|\rho| < 1\)）；\(p/n \to \gamma > 0\)（中等高维）或 \(\log p = o(n^{1/3})\)（允许更高维）。假设总体正态；样本独立。 - 设定 2（一般 Toeplitz，超高维）：\(\Sigma\) 为一般 Toeplitz（\(\sigma_{ij} = a_{|i-j|}\)），要求 \(a_k\) 满足衰减条件（如 \(|a_k| \le C \rho^k\) 对某 \(\rho < 1\)，或更弱的可和性条件）；超高维设定 \(\log p / n \to \infty\)（\(p\) 可远大于 \(n\)）。 - 设定 3（非高斯）：\(\mathbf{x}_k\) 非正态但独立、各分量线性依赖结构同 AR(1)/Toeplitz，要求矩条件（如 \(E|x_{ij}|^{30+\epsilon} < \infty\)，沿袭 Jiang 2004 的条件）。 - 统计含义：AR(1) 假设对应时间序列/空间数据的衰减依赖；Toeplitz 假设对应平稳过程的协方差结构；超高维设定对应基因数据、金融数据等 \(p \gg n\) 场景。相比 Fan & Jiang (2019) 的等相关假设，本文的衰减相关更贴近实际依赖结构，但要求协方差可由距离参数化。

主要结果：

定理 1（AR(1) 相变）：设 \(\Sigma\) 为 AR(1)，\(p/n \to \gamma > 0\)，定义阈值 \(\rho_n^* = (\log p / n)^{1/4}\)（精确常数由标准化序列决定）。
当 \(|\rho| < \rho_n^*\)：\(n L_n^2 - 4\log p + \log\log p \xrightarrow{d} \text{Gumbel}(\alpha_\rho)\)，参数 \(\alpha_\rho\) 随 \(\rho\) 连续变化，\(\rho \to 0\) 时退化为经典 Gumbel(2)。
当 \(|\rho| > \rho_n^*\)：经不同标准化后，\(L_n\) 的极限为另一 Gumbel 分布（参数由 \(\rho\) 与 \(n\) 决定）。
当 \(|\rho| = \rho_n^*\)：极限为 \(\max(G_1, G_2)\)，\(G_1, G_2\) 为独立 Gumbel 变量（分别来自弱依赖极值与强依赖极值）。
直觉：弱依赖时，最大值由 \(O(p^2)\) 个微弱对中的随机极值主导（Gumbel 域）；强依赖时，由 \(O(p)\) 个相邻对的波动极值主导（仍落入 Gumbel 域，因 \(p\) 仍大）；临界时两者竞争取 max。
定理 2（一般 Toeplitz，超高维）：设 \(\Sigma\) 为一般 Toeplitz，\(\log p / n \to \infty\)，\(a_k\) 满足衰减条件。则经适当标准化后，
\[L_n \xrightarrow{d} w_1 Z + w_2 H,\]
其中 \(Z\) 为正态随机变量，\(H\) 为 Gumbel 型随机变量，\(w_1, w_2\) 为权重（由 \(a_k\) 的衰减速率与 \(\log p / n\) 的相对大小决定）；\(Z\) 与 \(H\) 独立。
直觉：超高维下，弱依赖对的极值水平因 \(p^2\) 巨大而升至正态尺度（大量微弱相关的最大值经标准化后呈正态波动，而非 Gumbel——因 \(p^2\) 过大使极值进入正态域），强依赖对的极值仍呈 Gumbel 型（因强依赖对数量 \(O(p)\) 远小于 \(p^2\)），两者线性叠加形成加权和。
定理 3（非高斯对应）：在非高斯设定与矩条件下，定理 1/2 的极限形式仍成立，标准化序列相同。

证明路线与技术技巧：

整体路线（5 步）：
分解最大值：将 \(L_n = \max_{i<j} \hat{r}_{ij}\) 的候选集分为“强依赖对”（距离 \(|i-j| \le K\)，\(K\) 为阈值）与“弱依赖对”（距离 \(> K\)），分别记为 \(M_{\text{strong}} = \max_{|i-j| \le K} \hat{r}_{ij}\) 与 \(M_{\text{weak}} = \max_{|i-j| > K} \hat{r}_{ij}\)，则 \(L_n = \max(M_{\text{strong}}, M_{\text{weak}})\)。
Gaussian 近似替换：对 \(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的分布，用 Chernozhukov et al. (2012, 2013, 2014, 2019) 的高维 CLT 与 Gaussian 近似，将样本相关系数向量的最大值分布替换为对应 Gaussian 向量最大值的分布，误差控制在 Kolmogorov 距离 \(O(\log^3(p)/n)\) 级别。
Gaussian 向量极值的精确计算：对替换后的 Gaussian 向量（协方差由总体 \(\Sigma\) 与样本量 \(n\) 决定），利用 Gaussian 极值理论（Sudakov-Fernique 比较、anti-concentration inequality）精确计算其最大值的渐近分布——弱依赖部分退化为 Gumbel（因有效独立对数仍大），强依赖部分退化为另一 Gumbel 或正态（因对数少、波动尺度不同）。
临界情形的耦合：当 \(\rho = \rho_n^*\) 时，\(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的 Gaussian 替换版本近似独立（因强依赖对与弱依赖对在总体协方差下近似无关），故极限为两个独立 Gumbel 之 max。
超高维加权和的形成：一般 Toeplitz 下，弱依赖对数量 \(O(p^2)\) 在超高维时使 \(M_{\text{weak}}\) 的波动尺度升至正态级别（经标准化后呈正态），强依赖对数量 \(O(p)\) 使 \(M_{\text{strong}}\) 仍呈 Gumbel 型；两者因近似独立而线性叠加为加权和。
关键跳跃点：
跳跃 1：Gaussian 近似误差在极值处的控制：Chernozhukov et al. 的 Gaussian 近似界 \(O(\log^3(p)/n)\) 对整个分布函数成立，但极值分布的尾部概率极小（\(O(1/\log p)\) 级别），需确认近似误差不吞没尾部概率。本文利用 anti-concentration inequality（Chernozhukov et al. 2013）证明 Gaussian 最大值的 Lévy 浓度函数有上界 \(O(\log p / \sqrt{n})\)，从而误差 \(O(\log^3(p)/n)\) 相对尾部概率仍可控——这是将高维 CLT 用于极值分布的关键卡点，本文成功绕过。
跳跃 2：强依赖对与弱依赖对的近似独立性：在 AR(1) 下，距离近的对与距离远的对在总体协方差下相关微弱（因 \(\rho^{|i-j|}\) 衰减），样本相关系数间的依赖也微弱；本文通过计算样本相关系数间的协方差（公式涉及 \(\rho\) 与距离），证明在适当 \(K\) 选择下，\(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的 Gaussian 替换版本近似独立，从而极限可分解为 max 或加权和。
技术技巧点名：
高维 Gaussian 近似 / CLT over rectangles（Chernozhukov et al. 2012, 2014, 2019; Koike 2019, 2020）：用于将样本相关系数向量的最大值分布替换为 Gaussian 向量最大值分布，误差界 \(O(\log^3(p)/n)\) 或更优。
Anti-concentration inequality for Gaussian maxima（Chernozhukov et al. 2013）：控制 Gaussian 最大值的 Lévy 浓度函数，确保 Gaussian 近似误差在极值尾部不失控。
Sudakov-Fernique / Slepian 比较：比较不同协方差结构下 Gaussian 向量最大值的分布，用于将复杂协方差（Toeplitz）的最大值简化为已知极限形式。
Chen-Stein Poisson 近似（沿袭 Jiang 2004; Zhou 2007）：在弱依赖部分，用于证明大量微弱相关系数中超过阈值的个数近似 Poisson，从而极值呈 Gumbel——本文在 Gaussian 替换后仍用此法。
Lipschitz 浓度性质 of Gaussian distributions：用于控制样本相关系数（作为样本向量的函数）偏离其 Gaussian 替换的概率，确保替换误差在尾部可控。

真实例子与应用： - 应用场景：高维协方差检验——检验 \(H_0: \Sigma = I_p\)（或更一般地，\(\Sigma\) 为某已知 Toeplitz）vs \(H_1: \Sigma \ne I_p\)（依赖结构存在）。 - 方法：基于 \(L_n\) 构造 max-type 检验统计量，利用本文的极限分布（Gumbel / 正态+Gumbel 加权和）计算临界值。 - 结果：在 AR(1) 备择下，当 \(|\rho| > \rho_n^*\) 时，基于正态+Gumbel 极限的检验能控制 size 并对依赖结构有 power；当 \(|\rho| < \rho_n^*\) 时，基于经典 Gumbel 极限的检验仍有效（因极限未变）。 - 想说明什么：验证本文极限分布的实用性——若用经典 Gumbel 临界值检验强依赖备择，size 会失控（因极限已突变）；必须用本文给出的新极限分布才能正确控制 size。文中未给模拟或真实数据数值结果，仅理论构造检验并指出临界值依赖相变区间。

🔎 结论是否比证明窄： - 本文在 AR(1) 相变定理中，阈值 \(\rho_n^*\) 的精确常数（而非仅衰减速率 \((\log p / n)^{1/4}\)）在正文中未显式给出，仅在 supplement (Jiang and Pham [22]) 中有详细推导与启发式论证——正文 claim 了相变存在性与极限形式，但精确常数的严格证明在补充材料，读者需核查 supplement 才能确认常数是否 sharp。 - 一般 Toeplitz 超高维定理中，权重 \(w_1, w_2\) 的显式公式依赖 \(a_k\) 的衰减速率与 \(\log p / n\) 的相对阶，正文给出特例（如 \(a_k = \rho^k\)）的权重，一般情形的权重公式较隐式，claim 为“加权和”但未对所有衰减速率给出闭合形式——这是条件 X 下严格证明、泛泛 claim 为“加权和结构”的地方。

四、开放问题（点到为止，扎根具体语句）¶

相变阈值的 sharpness 与 minimax 检验：本文阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\) 是否为 minimax 相变阈值？即，是否存在检验能在 \(|\rho| < c (\log p / n)^{1/4}\) 时对 AR(1) 备择有一致 power，而在 \(|\rho| < c' (\log p / n)^{1/4}\)（\(c' < c\)）时任何检验 power 都受限于 0？——扎根在本文 Theorem 1 的相变三段论与 Cai & Ma (2012) 的 minimax 检验框架。
非参数依赖结构下的极值分布：当总体依赖由 Kendall's tau / Spearman's rho 刻画（而非 Pearson 相关系数与 Toeplitz 参数化）时，极值分布是否仍有类似相变？——扎根在 Han et al. (2014) 的 distribution-free Gumbel 极限与本文非高斯部分的矩条件限制。
一般 Toeplitz 权重的闭合公式：对任意衰减序列 \(a_k\)（不限于指数衰减），正态与 Gumbel 权重 \(w_1, w_2\) 是否有闭合公式或渐近展开？——扎根在本文 Theorem 2 的权重依赖 \(a_k\) 衰减速率的隐式表达。
max-type 与 sum-type 检验的 power 比较：在 AR(1) / Toeplitz 备择下，基于本文极限的 max-type 检验与 Cai & Ma (2012) 的 U-统计量 sum-type 检验，在稀疏 vs 稠密备择下的 power 区域如何划分？——扎根在 Yu et al. (2020, 2021) 的 power-enhanced 组合检验与本文应用部分仅提 max-type 的局限。

要确认某条是否真 gap，建议读高维协方差检验近 5 篇 intro（Cai & Ma 2012; Yu et al. 2020, 2021; Feng et al. 2020; Han et al. 2014）——若都指向“依赖结构下极值分布与检验 power”则属共识真 gap，若互相打架（如 max vs sum 之争）则属机会。

Maintained by 陈星宇 · Homepage · Source on GitHub

Asymptotic distributions of largest Pearson correlation coefficients under dependent structures¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论