Asymptotic distributions of largest Pearson correlation coefficients under dependent structures¶
作者: Tiefeng Jiang, Tuan Pham
来源: Annals of Statistics
主题: 高维统计 / 随机矩阵
相关性: 8/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: 这个子方向研究的是高维数据(维数 \(p\) 远大于或随样本量 \(n\) 趋于无穷)中,样本相关矩阵最大非对角元(即 coherence / 最大 Pearson 相关系数)的极值渐近分布。根本统计问题在于:当 \(p\) 极大时,随机向量各分量间哪怕在总体上相互独立或仅有微弱依赖,样本相关系数的极大值也会以不可忽略的概率偏离 0;若要基于此极大值做假设检验(如检验协方差阵是否为单位阵、是否具有某种带状/Toeplitz结构),必须精确刻画其渐近分布与相变规律。当前该方向在独立/球面分布设定下已相当成熟,但在总体协方差具有特定依赖结构(如等相关、Toeplitz、AR序列)时,极值分布如何偏离经典 Gumbel 律、相变阈值在哪,正处于被精确刻画的前沿期。
发展脉络: 1. 奠基工作:Jiang (2004) 与 Zhou (2007) 首次在 \(p/n \to \gamma > 0\) 且总体独立或球面分布的设定下,证明样本相关矩阵最大非对角元经适当标准化后弱收敛于 Gumbel 分布(极值分布类型 I),工具为 Chen-Stein Poisson 近似与中偏差;Li, Qi, Rosalsky (2010) 与 Shao, Zhou (2014) 进一步给出该 Gumbel 极限成立的必要与充分条件,将 \(p\) 的增长速率精确到 \(\log p = o(n^\beta)\) 的各类情形。 2. 主要进展(超高维与相变):Cai & Jiang (2011) 将 \(p\) 推至超高维(\(p \gg n\),甚至 \(p = O(e^{n^c})\)),完整刻画了 \(\log p / n\) 从趋于 0 到趋于 \(\infty\) 三段相变下 coherence 的渐近分布;同年 Cai & Jiang 另一篇将此用于检验协方差带状结构与压缩感知矩阵构造。Liu, Lin, Shao (2008) 给出收敛到极值分布的 Berry-Esseen 速率 \(O((\log n)^{5/2}/\sqrt{n})\),远快于典型 \(O(1/\log n)\)。 3. 当前 frontier(依赖结构下的极值):Fan & Jiang (2019) 首次切入非独立总体——等相关(equi-correlated)正态总体,发现当共同相关系数 \(\rho > 0\) 时,最大样本相关系数的极限分布从 Gumbel 律突变为正态律;当 \(\rho\) 落在随 \(n\) 衰减至 0 的阈值附近时,极限为正态与 Gumbel 的卷积。本文(Jiang & Pham 2024)将此推进至更一般的 Toeplitz 协方差(特别是 AR(1) 结构),在超高维下得到正态与 Gumbel 加权和的极限,并精确刻画 AR(1) 参数 \(\rho\) 的相变阈值。 4. 本文的位置:在“独立设定 Gumbel 律 → 等相关设定正态律”之间,本文填补了“衰减相关(Toeplitz/AR)设定下极值如何渐近”的缺口,给出相变阈值与临界分布的具体表达式,并将超高维设定下的极限形式统一为“正态 + Gumbel 加权和”。
子线索聚类: - 线索 A:极值渐近分布的精确刻画与速率(Jiang 2004; Zhou 2007; Liu et al. 2008; Li et al. 2010; Shao & Zhou 2014; Cai & Jiang 2011b):在总体独立或球面分布下,追求 Gumbel 极限的必要/充分条件与最优收敛速率。 - 线索 B:依赖结构下的相变与极限形式(Fan & Jiang 2019; 本文):当总体协方差非单位阵(等相关、AR、Toeplitz)时,极值分布偏离 Gumbel,出现正态分量或卷积/加权和,核心是找相变阈值。 - 线索 C:高维中心极限定理与 Gaussian 近似(Chernozhukov et al. 2012, 2013, 2014, 2019; Koike 2019, 2020; Bentkus; Götze; Portnoy):为高维随机向量最大值的分布提供 Gaussian 近似与 multiplier bootstrap,误差界在 \(\log^3(p)/n\) 级别,是本文证明中替换极值概率的关键工具。 - 线索 D:高维协方差检验与 power enhancement(Cai & Jiang 2011a; Cai & Ma 2012; Cai & Zhang 2014; Yu et al. 2020, 2021; Feng et al. 2020):将极值分布理论用于构造检验(max-type vs sum-type vs max-sum/Fisher 组合),追求对稀疏/稠密备择的 power 最优性。
这个方向在追问的核心问题: 1. 相变阈值的 sharpness:总体依赖强度(如 AR 参数 \(\rho\)、等相关系数)在哪个精确阈值上,使极值分布从 Gumbel 型突变为含正态分量的型?阈值是否随 \(n, p\) 衰减? 2. 超高维下极限分布的结构:当 \(\log p / n \to \infty\)(超高维)且总体有衰减依赖时,极值的极限分布是否总是正态与 Gumbel 的某种混合?权重如何由协方差结构决定? 3. 非高斯总体下的鲁棒性:上述相变与极限形式在非高斯(如有限矩、重尾)设定下是否成立?需要何种矩条件? 4. 检验的 size 与 power:基于这些极限分布构造的协方差检验,在依赖结构备择下是否仍能控制 size、并在稀疏/稠密备择下达到 minimax power?
⚠️ 作者的 framing: - 作者将缺口 frame 为:Fan & Jiang (2019) 证明了等相关(所有非对角元同为 \(\rho\))下的相变,但“等相关太特殊,自然推广是 Toeplitz 协方差(特别是 AR(1)),其中相关系数随距离衰减;此时极值分布如何、相变阈值在哪,完全未知”。这让本文成为“从等相关到衰减相关”的显然下一步。 - 被淡化的竞争路线:基于 U-统计量的 sum-type 检验(Cai & Ma 2012; Yu et al. 2020, 2021)在稠密备择下更有 power,但本文只在应用部分提了一句 max-type 检验,未对比 sum-type 或 max-sum 的 power 优势;高维 Gaussian 近似(Chernozhukov et al. 系列)被当作技术工具引用,未讨论其 bootstrap 方法是否可直接替代本文的极限分布用于检验。 - 缺失的引用:半参数/无分布检验(如 Han et al. 2014 基于 Kendall's tau/Spearman's rho 的 Gumbel 极限)未在 intro 出现——若要推广到非参数依赖结构,这些工作是自然对照;随机矩阵谱方法(如 Heiny & Mikosch 2017 关注最大特征值而非最大非对角元)也未引,虽问题不同但同属高维相关矩阵极值。
张力: 未见明显对立引用。各工作在不同设定(独立 vs 等相关 vs AR vs 超高维)下得不同极限形式,彼此互补而非矛盾;唯一“张力”是 Fan & Jiang (2019) 的等相关阈值 \(\rho_n^* \sim \sqrt{\log p / n}\) 与本文 AR(1) 阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\) 的衰减速率不同,这反映依赖结构衰减方式对相变位置的实质性影响,是高价值信号。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据
- \(n\):样本量(独立观测次数)。
- \(p\):随机向量的维数;本文允许 \(p \to \infty\),重点在超高维设定 \(\log p / n \to \infty\)。
- \(\mathbf{x}_1, \dots, \mathbf{x}_n\):\(p\) 维独立同分布观测样本,每个 \(\mathbf{x}_k = (x_{k1}, \dots, x_{kp})^\top\)。
- \(\Sigma\):\(p \times p\) 总体协方差矩阵;本文核心设定为 Toeplitz 矩阵 \(\Sigma = (\sigma_{ij})\),其中 \(\sigma_{ij} = a_{|i-j|}\)(仅依赖坐标距离),特别关注 AR(1) 结构 \(\sigma_{ij} = \rho^{|i-j|}\),\(|\rho| < 1\)。
- \(\hat{\Sigma}\):样本协方差矩阵 \(\hat{\Sigma} = \frac{1}{n-1} \sum_{k=1}^n (\mathbf{x}_k - \bar{\mathbf{x}})(\mathbf{x}_k - \bar{\mathbf{x}})^\top\)。
- \(\hat{R} = (\hat{r}_{ij})\):样本相关矩阵,\(\hat{r}_{ij} = \hat{\sigma}_{ij} / \sqrt{\hat{\sigma}_{ii} \hat{\sigma}_{jj}}\);对角元 \(\hat{r}_{ii} = 1\)。
- \(L_n\):样本相关矩阵最大非对角元,\(L_n = \max_{1 \le i < j \le p} \hat{r}_{ij}\)——这是本文的核心研究对象(estimand / 极值统计量)。
- \(\rho\):AR(1) 序列的自回归参数,\(|\rho| < 1\);控制总体依赖强度,是相变的关键参数。
- \(a_k\):一般 Toeplitz 协方差中距离为 \(k\) 的总体协方差/相关系数,\(a_0 = 1\);本文要求 \(a_k\) 满足一定衰减条件。
- \(Z, G\):极限分布中的随机变量:\(Z\) 为标准正态,\(G\) 为 Gumbel 型随机变量(具体参数由标准化序列决定)。
- 可观测数据:研究者实际观测到的是 \(n\) 个 \(p\) 维独立样本 \(\mathbf{x}_1, \dots, \mathbf{x}_n\)(来自 \(N(0, \Sigma)\),\(\Sigma\) 为 Toeplitz/AR(1)),由此可计算 \(\hat{R}\) 与 \(L_n\);总体协方差 \(\Sigma\) 的结构(Toeplitz 形式及参数 \(\rho\) 或 \(a_k\))是未知的、需靠假设或检验去识别。
第二步:最小内核——AR(1) 结构下最大相关系数的相变
剥掉一般 Toeplitz 与超高维的技术外壳,支撑整篇论文的最小内核是:当总体协方差为 AR(1)(\(\sigma_{ij} = \rho^{|i-j|}\))且 \(p\) 与 \(n\) 同比例增长(\(p/n \to \gamma > 0\))时,\(L_n\) 的渐近分布如何随 \(\rho\) 发生相变?
-
独立情形(\(\rho = 0\))的已知结果:此时 \(\Sigma = I_p\),Jiang (2004) 已证
\[n L_n^2 - 4\log p + \log\log p \xrightarrow{d} \text{Gumbel}(2),\]即极值服从经典 Gumbel 律(参数 2,CDF 为 \(\exp(-(8\pi)^{-1/2} e^{-t/2})\))。直觉:\(p(p-1)/2\) 个独立相关系数近似独立,最大值落入极值理论的 Gumbel 域。 -
AR(1) 情形的相变(本文最小内核):设 \(\Sigma\) 为 AR(1),\(|\rho| < 1\)。关键观察:相邻坐标 \((i, i+1)\) 的总体相关为 \(\rho\),距离越远衰减越快。当 \(|\rho|\) 小时,绝大多数非对角总体相关接近 0,样本最大相关仍由“大量微弱依赖中的随机极值”主导,极限应接近 Gumbel;当 \(|\rho|\) 大时,相邻坐标的样本相关被总体 \(\rho\) 强力拉向 \(\rho\),最大值主要由这些“强依赖对”的随机波动主导,波动近似正态,极限应含正态分量。
-
相变阈值与三种极限:本文证明存在阈值 \(\rho_n^* = c (\log p / n)^{1/4}\)(\(c\) 为常数),使得:
- \(|\rho| < \rho_n^*\)(弱依赖):\(L_n\) 经与独立情形相同的标准化后,极限仍为 Gumbel 分布(参数随 \(\rho\) 微调)——总体依赖太弱,不足以改变极值的 Gumbel 性质。
- \(|\rho| > \rho_n^*\)(强依赖):\(L_n\) 的极限突变为另一个 Gumbel 分布(参数不同)——此时最大值主要由相邻强依赖对的波动主导,但经适当标准化后仍呈极值型(因相邻对数量为 \(p-1\),仍足够多使最大波动落入 Gumbel 域)。
-
\(|\rho| = \rho_n^*\)(临界):极限为两个独立 Gumbel 变量的最大值——弱依赖极值与强依赖极值恰好竞争,谁都不占优,极限取两者之 max。
-
为什么相变阈值是 \((\log p / n)^{1/4}\)?:直觉来自相邻对样本相关 \(\hat{r}_{i,i+1}\) 的波动尺度。\(\hat{r}_{i,i+1}\) 围绕 \(\rho\) 的波动标准差约为 \((1-\rho^2)/\sqrt{n}\);要使此波动能超越大量弱依赖对的极值水平(约 \(\sqrt{(\log p)/n}\)),需 \(\rho\) 使得 \(\rho + O(1/\sqrt{n})\) 的上尾能与 \(O(\sqrt{(\log p)/n})\) 竞争。临界条件 \(\rho \sim \sqrt{(\log p)/n}\) 给出 Fan & Jiang (2019) 等相关的阈值;但 AR(1) 中相邻对仅 \(p-1\) 个(而非 \(p(p-1)/2\) 个),极值水平降为 \(\sqrt{(\log p)/(n \cdot p)}\) 的量级,与 \(\rho\) 的波动 \(O(1/\sqrt{n})\) 竞争时,阈值降为 \((\log p / n)^{1/4}\)——这正是本文阈值与等相关阈值不同的根源。
三、这篇论文做了什么¶
三句话: ①研究了总体协方差为 Toeplitz 矩阵(特别是 AR(1) 结构)时,样本相关矩阵最大非对角元的渐近分布与相变。 ②核心工具是高维 Gaussian 近似(Chernozhukov et al. 系列)与极值概率的精确分解,将最大值的分布替换为 Gaussian 向量最大值的分布再加修正。 ③主要结论:AR(1) 下存在相变阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\),阈值两侧极限为不同参数的 Gumbel 分布,临界情形为两个独立 Gumbel 之 max;一般 Toeplitz 在超高维下,极限为正态与 Gumbel 型变量的加权和。
关键设定与假设: - 设定 1(AR(1) 相变):\(\mathbf{x}_k \sim N(0, \Sigma)\),\(\Sigma\) 为 AR(1)(\(\sigma_{ij} = \rho^{|i-j|}\),\(|\rho| < 1\));\(p/n \to \gamma > 0\)(中等高维)或 \(\log p = o(n^{1/3})\)(允许更高维)。假设总体正态;样本独立。 - 设定 2(一般 Toeplitz,超高维):\(\Sigma\) 为一般 Toeplitz(\(\sigma_{ij} = a_{|i-j|}\)),要求 \(a_k\) 满足衰减条件(如 \(|a_k| \le C \rho^k\) 对某 \(\rho < 1\),或更弱的可和性条件);超高维设定 \(\log p / n \to \infty\)(\(p\) 可远大于 \(n\))。 - 设定 3(非高斯):\(\mathbf{x}_k\) 非正态但独立、各分量线性依赖结构同 AR(1)/Toeplitz,要求矩条件(如 \(E|x_{ij}|^{30+\epsilon} < \infty\),沿袭 Jiang 2004 的条件)。 - 统计含义:AR(1) 假设对应时间序列/空间数据的衰减依赖;Toeplitz 假设对应平稳过程的协方差结构;超高维设定对应基因数据、金融数据等 \(p \gg n\) 场景。相比 Fan & Jiang (2019) 的等相关假设,本文的衰减相关更贴近实际依赖结构,但要求协方差可由距离参数化。
主要结果:
- 定理 1(AR(1) 相变):设 \(\Sigma\) 为 AR(1),\(p/n \to \gamma > 0\),定义阈值 \(\rho_n^* = (\log p / n)^{1/4}\)(精确常数由标准化序列决定)。
- 当 \(|\rho| < \rho_n^*\):\(n L_n^2 - 4\log p + \log\log p \xrightarrow{d} \text{Gumbel}(\alpha_\rho)\),参数 \(\alpha_\rho\) 随 \(\rho\) 连续变化,\(\rho \to 0\) 时退化为经典 Gumbel(2)。
- 当 \(|\rho| > \rho_n^*\):经不同标准化后,\(L_n\) 的极限为另一 Gumbel 分布(参数由 \(\rho\) 与 \(n\) 决定)。
- 当 \(|\rho| = \rho_n^*\):极限为 \(\max(G_1, G_2)\),\(G_1, G_2\) 为独立 Gumbel 变量(分别来自弱依赖极值与强依赖极值)。
-
直觉:弱依赖时,最大值由 \(O(p^2)\) 个微弱对中的随机极值主导(Gumbel 域);强依赖时,由 \(O(p)\) 个相邻对的波动极值主导(仍落入 Gumbel 域,因 \(p\) 仍大);临界时两者竞争取 max。
-
定理 2(一般 Toeplitz,超高维):设 \(\Sigma\) 为一般 Toeplitz,\(\log p / n \to \infty\),\(a_k\) 满足衰减条件。则经适当标准化后,
\[L_n \xrightarrow{d} w_1 Z + w_2 H,\]其中 \(Z\) 为正态随机变量,\(H\) 为 Gumbel 型随机变量,\(w_1, w_2\) 为权重(由 \(a_k\) 的衰减速率与 \(\log p / n\) 的相对大小决定);\(Z\) 与 \(H\) 独立。 -
直觉:超高维下,弱依赖对的极值水平因 \(p^2\) 巨大而升至正态尺度(大量微弱相关的最大值经标准化后呈正态波动,而非 Gumbel——因 \(p^2\) 过大使极值进入正态域),强依赖对的极值仍呈 Gumbel 型(因强依赖对数量 \(O(p)\) 远小于 \(p^2\)),两者线性叠加形成加权和。
-
定理 3(非高斯对应):在非高斯设定与矩条件下,定理 1/2 的极限形式仍成立,标准化序列相同。
证明路线与技术技巧:
- 整体路线(5 步):
- 分解最大值:将 \(L_n = \max_{i<j} \hat{r}_{ij}\) 的候选集分为“强依赖对”(距离 \(|i-j| \le K\),\(K\) 为阈值)与“弱依赖对”(距离 \(> K\)),分别记为 \(M_{\text{strong}} = \max_{|i-j| \le K} \hat{r}_{ij}\) 与 \(M_{\text{weak}} = \max_{|i-j| > K} \hat{r}_{ij}\),则 \(L_n = \max(M_{\text{strong}}, M_{\text{weak}})\)。
- Gaussian 近似替换:对 \(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的分布,用 Chernozhukov et al. (2012, 2013, 2014, 2019) 的高维 CLT 与 Gaussian 近似,将样本相关系数向量的最大值分布替换为对应 Gaussian 向量最大值的分布,误差控制在 Kolmogorov 距离 \(O(\log^3(p)/n)\) 级别。
- Gaussian 向量极值的精确计算:对替换后的 Gaussian 向量(协方差由总体 \(\Sigma\) 与样本量 \(n\) 决定),利用 Gaussian 极值理论(Sudakov-Fernique 比较、anti-concentration inequality)精确计算其最大值的渐近分布——弱依赖部分退化为 Gumbel(因有效独立对数仍大),强依赖部分退化为另一 Gumbel 或正态(因对数少、波动尺度不同)。
- 临界情形的耦合:当 \(\rho = \rho_n^*\) 时,\(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的 Gaussian 替换版本近似独立(因强依赖对与弱依赖对在总体协方差下近似无关),故极限为两个独立 Gumbel 之 max。
-
超高维加权和的形成:一般 Toeplitz 下,弱依赖对数量 \(O(p^2)\) 在超高维时使 \(M_{\text{weak}}\) 的波动尺度升至正态级别(经标准化后呈正态),强依赖对数量 \(O(p)\) 使 \(M_{\text{strong}}\) 仍呈 Gumbel 型;两者因近似独立而线性叠加为加权和。
-
关键跳跃点:
- 跳跃 1:Gaussian 近似误差在极值处的控制:Chernozhukov et al. 的 Gaussian 近似界 \(O(\log^3(p)/n)\) 对整个分布函数成立,但极值分布的尾部概率极小(\(O(1/\log p)\) 级别),需确认近似误差不吞没尾部概率。本文利用 anti-concentration inequality(Chernozhukov et al. 2013)证明 Gaussian 最大值的 Lévy 浓度函数有上界 \(O(\log p / \sqrt{n})\),从而误差 \(O(\log^3(p)/n)\) 相对尾部概率仍可控——这是将高维 CLT 用于极值分布的关键卡点,本文成功绕过。
-
跳跃 2:强依赖对与弱依赖对的近似独立性:在 AR(1) 下,距离近的对与距离远的对在总体协方差下相关微弱(因 \(\rho^{|i-j|}\) 衰减),样本相关系数间的依赖也微弱;本文通过计算样本相关系数间的协方差(公式涉及 \(\rho\) 与距离),证明在适当 \(K\) 选择下,\(M_{\text{strong}}\) 与 \(M_{\text{weak}}\) 的 Gaussian 替换版本近似独立,从而极限可分解为 max 或加权和。
-
技术技巧点名:
- 高维 Gaussian 近似 / CLT over rectangles(Chernozhukov et al. 2012, 2014, 2019; Koike 2019, 2020):用于将样本相关系数向量的最大值分布替换为 Gaussian 向量最大值分布,误差界 \(O(\log^3(p)/n)\) 或更优。
- Anti-concentration inequality for Gaussian maxima(Chernozhukov et al. 2013):控制 Gaussian 最大值的 Lévy 浓度函数,确保 Gaussian 近似误差在极值尾部不失控。
- Sudakov-Fernique / Slepian 比较:比较不同协方差结构下 Gaussian 向量最大值的分布,用于将复杂协方差(Toeplitz)的最大值简化为已知极限形式。
- Chen-Stein Poisson 近似(沿袭 Jiang 2004; Zhou 2007):在弱依赖部分,用于证明大量微弱相关系数中超过阈值的个数近似 Poisson,从而极值呈 Gumbel——本文在 Gaussian 替换后仍用此法。
- Lipschitz 浓度性质 of Gaussian distributions:用于控制样本相关系数(作为样本向量的函数)偏离其 Gaussian 替换的概率,确保替换误差在尾部可控。
真实例子与应用: - 应用场景:高维协方差检验——检验 \(H_0: \Sigma = I_p\)(或更一般地,\(\Sigma\) 为某已知 Toeplitz)vs \(H_1: \Sigma \ne I_p\)(依赖结构存在)。 - 方法:基于 \(L_n\) 构造 max-type 检验统计量,利用本文的极限分布(Gumbel / 正态+Gumbel 加权和)计算临界值。 - 结果:在 AR(1) 备择下,当 \(|\rho| > \rho_n^*\) 时,基于正态+Gumbel 极限的检验能控制 size 并对依赖结构有 power;当 \(|\rho| < \rho_n^*\) 时,基于经典 Gumbel 极限的检验仍有效(因极限未变)。 - 想说明什么:验证本文极限分布的实用性——若用经典 Gumbel 临界值检验强依赖备择,size 会失控(因极限已突变);必须用本文给出的新极限分布才能正确控制 size。文中未给模拟或真实数据数值结果,仅理论构造检验并指出临界值依赖相变区间。
🔎 结论是否比证明窄: - 本文在 AR(1) 相变定理中,阈值 \(\rho_n^*\) 的精确常数(而非仅衰减速率 \((\log p / n)^{1/4}\))在正文中未显式给出,仅在 supplement (Jiang and Pham [22]) 中有详细推导与启发式论证——正文 claim 了相变存在性与极限形式,但精确常数的严格证明在补充材料,读者需核查 supplement 才能确认常数是否 sharp。 - 一般 Toeplitz 超高维定理中,权重 \(w_1, w_2\) 的显式公式依赖 \(a_k\) 的衰减速率与 \(\log p / n\) 的相对阶,正文给出特例(如 \(a_k = \rho^k\))的权重,一般情形的权重公式较隐式,claim 为“加权和”但未对所有衰减速率给出闭合形式——这是条件 X 下严格证明、泛泛 claim 为“加权和结构”的地方。
四、开放问题(点到为止,扎根具体语句)¶
- 相变阈值的 sharpness 与 minimax 检验:本文阈值 \(\rho_n^* \sim (\log p / n)^{1/4}\) 是否为 minimax 相变阈值?即,是否存在检验能在 \(|\rho| < c (\log p / n)^{1/4}\) 时对 AR(1) 备择有一致 power,而在 \(|\rho| < c' (\log p / n)^{1/4}\)(\(c' < c\))时任何检验 power 都受限于 0?——扎根在本文 Theorem 1 的相变三段论与 Cai & Ma (2012) 的 minimax 检验框架。
- 非参数依赖结构下的极值分布:当总体依赖由 Kendall's tau / Spearman's rho 刻画(而非 Pearson 相关系数与 Toeplitz 参数化)时,极值分布是否仍有类似相变?——扎根在 Han et al. (2014) 的 distribution-free Gumbel 极限与本文非高斯部分的矩条件限制。
- 一般 Toeplitz 权重的闭合公式:对任意衰减序列 \(a_k\)(不限于指数衰减),正态与 Gumbel 权重 \(w_1, w_2\) 是否有闭合公式或渐近展开?——扎根在本文 Theorem 2 的权重依赖 \(a_k\) 衰减速率的隐式表达。
- max-type 与 sum-type 检验的 power 比较:在 AR(1) / Toeplitz 备择下,基于本文极限的 max-type 检验与 Cai & Ma (2012) 的 U-统计量 sum-type 检验,在稀疏 vs 稠密备择下的 power 区域如何划分?——扎根在 Yu et al. (2020, 2021) 的 power-enhanced 组合检验与本文应用部分仅提 max-type 的局限。
要确认某条是否真 gap,建议读高维协方差检验近 5 篇 intro(Cai & Ma 2012; Yu et al. 2020, 2021; Feng et al. 2020; Han et al. 2014)——若都指向“依赖结构下极值分布与检验 power”则属共识真 gap,若互相打架(如 max vs sum 之争)则属机会。
Maintained by 陈星宇 · Homepage · Source on GitHub