跳转至

Adaptable High-Dimensional Change Point Detection via Ridge Regularization

作者: Haoran Li, Haotian Xu
主题: 数理统计 / 假设检验
相关性: 8/10
链接: https://arxiv.org/abs/2605.24838


一、核心问题与贡献

①研究了高维观测序列(\(p/n \to \gamma \in (0,\infty)\))均值向量存在未知个数变点时的检测问题,特别是针对稠密替代假设。②提出一族基于 Ridge 正则化的 CUSUM 统计量,通过 \((S_n + \lambda I_p)^{-1/2}\) 对数据进行归一化,并利用随机矩阵理论(RMT)推导其渐近分布与功效。③在温和条件下证明了统计量在零假设与局部替代下具有 pivotal 的极限分布,且通过最大化渐近功效(ASNR)建立了选择正则化参数 \(\lambda\) 的原则性框架,证明了在信号与协方差线性相关的先验下,minimax 最优的 \(\lambda\) 取小值。

二、基础设定

  • 核心概念与符号
  • \(S_n\): 汇合样本协方差矩阵;\(\gamma_n = p/(n-1)\): 维度与样本量之比。
  • \(C_\lambda(t_1, t_2, t_3)\): Ridge-CUSUM 向量,即经 \((S_n + \lambda I_p)^{-1/2}\) 归一化后的相邻段均值差。
  • \(V_\lambda, D_\lambda\): 未标准化与标准化的统计量,\(D_\lambda\) 通过 RMT 迹统计量 \(\hat{\Theta}(\lambda), \hat{\Gamma}(\lambda)\) 消除对 \(\Sigma_p\) 的依赖。
  • \(\phi_n(-\lambda)\): 样本协方差矩阵的 Stieltjes 变换(Marčenko-Pastur 方程的解);\(D_n(\lambda)\): 确定性等价矩阵。
  • \(q_p(\lambda, \delta_p)\) / \(q_p(\lambda, B)\): 渐近信噪比(ASNR)的核心度量,形式为 \(\sqrt{p} \delta_p^T D_p(\lambda) \delta_p\)\(p^{-1} \text{tr}(D_p(\lambda) B B^T)\)
  • 关键假设
  • C1 (有限四阶矩): 保证 RMT 极限定理的成立,比正态假设放宽,但比子高斯/指数矩更强。
  • C2 (高维渐近): \(p/n \to \gamma \in (0,\infty)\),标准 RMT 设定,排除了 \(p \gg n\) 的超高维与 \(p\) 固定的低维。
  • C3 (变点位置): 变点位置比例 \(\tilde{t}_j \in (0,1)\) 且固定,排除了边界变点(需 trimming \(\epsilon\))。
  • C4 (谱范数有界): \(\limsup \tau_{1,p} < \infty\),标准 RMT 条件,排除了谱无界增长的重尾协方差。
  • C5 (谱分布稳定): \(H_p \xrightarrow{w} H\) 且非退化,保证 M-P 方程解的稳定性。
  • PA-SC / PA-MC: 概率局部替代先验,信号强度缩放为 \(p^{-3/4}\) 使得 \(\sqrt{n}\|\delta_p\|_2^2 = O_p(1)\),允许信号稀疏或稠密。
  • 问题背景:现有高维变点检测方法(如 \(\ell_2^2\)-CUSUM 或 \(\ell_\infty\)-CUSUM)要么忽略协方差归一化导致对 \(\Sigma_p\) 敏感,要么因 \(S_n\) 奇异而无法使用 Hotelling \(T^2\) 形式。最相关的文献是 Li et al. (2020) 的两样本 Ridge Hotelling's \(T^2\) 检验,本文将其推广至变点扫描框架,但关键区别在于:变点位置未知导致不能使用段内中心化的协方差(会引入偏差且计算昂贵),必须使用全局中心化的 \(S_n\),这带来了完全不同的渐近均值/方差公式与偏差分析。

三、主要定理 / 核心结果

  1. Theorem 3.1 & 3.2 (零假设极限分布)
  2. 原文陈述:在 \(H_0\) 下,\(T_{sc}(\epsilon, \lambda) \xrightarrow{d} \sup_{t \in [\epsilon, 1-\epsilon]} G(0, t, 1)\),$T_{mc}(\epsilon, \lambda) \xrightarrow{d} \sup_{\mathcal{T}(\epsilon)} G

Maintained by 陈星宇 · Homepage · Source on GitHub

评论