Adaptable High-Dimensional Change Point Detection via Ridge Regularization¶
作者: Haoran Li, Haotian Xu
主题: 数理统计 / 假设检验
相关性: 8/10
链接: https://arxiv.org/abs/2605.24838
一、核心问题与贡献¶
①研究了高维观测序列(\(p/n \to \gamma \in (0,\infty)\))均值向量存在未知个数变点时的检测问题,特别是针对稠密替代假设。②提出一族基于 Ridge 正则化的 CUSUM 统计量,通过 \((S_n + \lambda I_p)^{-1/2}\) 对数据进行归一化,并利用随机矩阵理论(RMT)推导其渐近分布与功效。③在温和条件下证明了统计量在零假设与局部替代下具有 pivotal 的极限分布,且通过最大化渐近功效(ASNR)建立了选择正则化参数 \(\lambda\) 的原则性框架,证明了在信号与协方差线性相关的先验下,minimax 最优的 \(\lambda\) 取小值。
二、基础设定¶
- 核心概念与符号:
- \(S_n\): 汇合样本协方差矩阵;\(\gamma_n = p/(n-1)\): 维度与样本量之比。
- \(C_\lambda(t_1, t_2, t_3)\): Ridge-CUSUM 向量,即经 \((S_n + \lambda I_p)^{-1/2}\) 归一化后的相邻段均值差。
- \(V_\lambda, D_\lambda\): 未标准化与标准化的统计量,\(D_\lambda\) 通过 RMT 迹统计量 \(\hat{\Theta}(\lambda), \hat{\Gamma}(\lambda)\) 消除对 \(\Sigma_p\) 的依赖。
- \(\phi_n(-\lambda)\): 样本协方差矩阵的 Stieltjes 变换(Marčenko-Pastur 方程的解);\(D_n(\lambda)\): 确定性等价矩阵。
- \(q_p(\lambda, \delta_p)\) / \(q_p(\lambda, B)\): 渐近信噪比(ASNR)的核心度量,形式为 \(\sqrt{p} \delta_p^T D_p(\lambda) \delta_p\) 或 \(p^{-1} \text{tr}(D_p(\lambda) B B^T)\)。
- 关键假设:
- C1 (有限四阶矩): 保证 RMT 极限定理的成立,比正态假设放宽,但比子高斯/指数矩更强。
- C2 (高维渐近): \(p/n \to \gamma \in (0,\infty)\),标准 RMT 设定,排除了 \(p \gg n\) 的超高维与 \(p\) 固定的低维。
- C3 (变点位置): 变点位置比例 \(\tilde{t}_j \in (0,1)\) 且固定,排除了边界变点(需 trimming \(\epsilon\))。
- C4 (谱范数有界): \(\limsup \tau_{1,p} < \infty\),标准 RMT 条件,排除了谱无界增长的重尾协方差。
- C5 (谱分布稳定): \(H_p \xrightarrow{w} H\) 且非退化,保证 M-P 方程解的稳定性。
- PA-SC / PA-MC: 概率局部替代先验,信号强度缩放为 \(p^{-3/4}\) 使得 \(\sqrt{n}\|\delta_p\|_2^2 = O_p(1)\),允许信号稀疏或稠密。
- 问题背景:现有高维变点检测方法(如 \(\ell_2^2\)-CUSUM 或 \(\ell_\infty\)-CUSUM)要么忽略协方差归一化导致对 \(\Sigma_p\) 敏感,要么因 \(S_n\) 奇异而无法使用 Hotelling \(T^2\) 形式。最相关的文献是 Li et al. (2020) 的两样本 Ridge Hotelling's \(T^2\) 检验,本文将其推广至变点扫描框架,但关键区别在于:变点位置未知导致不能使用段内中心化的协方差(会引入偏差且计算昂贵),必须使用全局中心化的 \(S_n\),这带来了完全不同的渐近均值/方差公式与偏差分析。
三、主要定理 / 核心结果¶
- Theorem 3.1 & 3.2 (零假设极限分布):
- 原文陈述:在 \(H_0\) 下,\(T_{sc}(\epsilon, \lambda) \xrightarrow{d} \sup_{t \in [\epsilon, 1-\epsilon]} G(0, t, 1)\),$T_{mc}(\epsilon, \lambda) \xrightarrow{d} \sup_{\mathcal{T}(\epsilon)} G
Maintained by 陈星宇 · Homepage · Source on GitHub