Cauchy Aggregation of Ridge-Regularized Hotelling Tests for High-Dimensional Change-Point Detection¶

作者: Ping Zhao, Le Zhou, Long Feng
主题: 数理统计 / 假设检验
相关性: 8/10
链接: https://arxiv.org/abs/2606.14092

好的，陈星宇。我是你的统计学导师。我们开始精读这篇论文。

请注意，我的角色是“从文献里挖掘 + 梳理结构 + 生成候选”，而判断（问题值不值得做、论文强不强） 完全留给你自己。我不会给评分，只会为你提供供你亲自核验的材料与结构。凡涉及判断的话，我都会落实到论文的具体句、假设或引用上。

一、领域脉络与小综述¶

这个方向是什么：这个子方向研究的是高维均值变点检测（High-dimensional change-point detection）的假设检验问题。核心挑战是，当维度p与样本量n可比时，传统的Hotelling \(T^2\) 检验因样本协方差矩阵不可逆而失效。一个成熟的技术路线是用ridge正则化来稳定协方差的逆，从而构造出可用的检验统计量（RHT统计量）。当前这个方向的成熟度较高，已有明确的 pivotal 极限分布结果，但一个悬而未决的实践难题是：ridge参数 \(\lambda\) 如何选择才能最大化检验功效？
发展脉络（history）：作者将这篇论文定位为RHT变点检测方向的“下一步”，其发展脉络如下：
- 奠基工作：Tikhonov [1] 和 Hoerl & Kennard [2] 的经典 ridge 回归，奠定了用正数倍单位阵稳定病态逆问题的基本思路（引用句：“Ridge regularization has long been used to stabilize inverse problems and covariance-based multivariate procedures.”）。Craven & Wahba [3] 的广义交叉验证（GCV）为 tuning parameter 的选择提供了风险导向的估计视角。
- 主要进展：
  - 高维测试中的RHT：Chen et al. [6] 和 Li et al. [7] 将 ridge 正则化思路引入高维均值检验，用 \((S_n + \lambda I_p)^{-1}\) 代替不可逆的 \(S_n^{-1}\)，构造出稳定的 Hotelling 型统计量。这依赖于随机矩阵理论（RMT）中的确定性等价（deterministic equivalent）论证，见 Bai & Silverstein [8]。
  - RHT变点检测：Li & Xu [11] 是这篇论文的直接前驱，他们引入了 ridge-regularized CUSUM 统计量，并证明了对每个固定的 \(\lambda > 0\)，其扫描统计量具有 pivotal 的高斯过程零假设极限（引用句原文：“for each fixed deterministic \(\lambda >0\), the resulting RHT scan statistic has a pivotal Gaussian-process null limit.”）。
  - p值聚合方法：Liu & Xie [12] 提出的 Cauchy 组合检验（Cauchy combination test, CCT），提供了一种在任意依赖结构下，基于 p 值的、有解析 p 值的组合方法。这在本文中被用来聚合不同 \(\lambda\) 下的 p 值。
- 当前 frontier 与本文的位置：在上述进展下，唯一遗留的“困难”（引用句原文：“The remaining difficulty is the choice of \(\lambda\).”）是 \(\lambda\) 的选择。最优 \(\lambda\) 依赖于未知的协方差结构和均值漂移方向，这在变点问题中是事先不可知的。选择一个单一的 \(\lambda\) 可能导致严重的功效损失。本文的定位就是直接解决这个实际问题：不选择一个最优 \(\lambda\)，而是用一个确定性的有限网格 \(\Lambda_n\) 计算每个 \(\lambda\) 的 p 值，然后用 CCT 组合起来。在理论上，这一步需要将“固定 \(\lambda\) 的边际极限”推广到“有限网格的联合极限”，本文完成了这项工作。
子线索聚类：这篇论文的被引文献主要落在一条主线上，辅以两条旁支：
- 主线：以 RMT 为基础的高维 RHT 检验。这包括了 Chen et al. [6], Li et al. [7], Li & Xu [11]。他们共同的特点是借助 RMT 的确定性等价理论，推导出 pivotal 的极限分布。Li & Xu [11] 是本文的“前一步”，本文是它的“显然的下一步”。
- 方法旁支：CCT 聚合方法。Liu & Xie [12] 是本文的“工具”，用来实现 p 值的聚合。
- 对手/旁支：无需协方差矩阵估的方法。Zhang & Lavitas [9], Wang et al. [10] 提出了“self-normalized”和“covariance-free”方法。作者在简介中提到“也已提出了”（ “self-normalized and covariance-free methods have also been proposed” ），但没有深入比较。这暗示作者认为 RHT 路线（利用协方差信息）仍是主流，而 self-normalized 是另一种竞争路线。
这个方向在追问的核心问题：
1. 如何自动选择ridge参数 \(\lambda\) 以保证高功效？ —— 这是本文直接回答的问题。
2. RHT 统计量的联合极限（在不同 \(\lambda\) 下）是什么？ —— 这是进行固定水平联合校准的理论前提，也是本文的“核心理论贡献”。
3. 聚合多个 p 值的方法（如 CCT）在 RHT 背景下是否有效且稳定？ —— 本文通过模拟回答了这一实践问题。
⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）：
- 作者把缺口 frame 成什么：作者把核心缺口 frame 成“ridge 参数选择难题”（ “The remaining difficulty is the choice of \(\lambda\).”）。他们把自己的方法定位为“聚合方法” (aggregation approach)，用以“避免选择一个单一的 ridge 值”（“This paper takes an aggregation approach... avoids estimating a power-optimal ridge value.”）。这样，这篇论文就成为 Li & Xu [11] 的“显然的下一步”——既然有了固定 \(\lambda\) 的极限，接下来自然就可以考虑聚合多个 \(\lambda\) 的结果。
- 哪些竞争路线被他淡化或回避了：作者淡化了 Self-normalized / covariance-free 这条竞争路线。他们只在一句话中提到，但全文没有与 RHT 方法进行正面、系统的理论或模拟比较。这是一个值得你通过去读 Zhang & Lavitas [9] 和 Wang et al. [10] 来仔细核验的潜在张力。
- 什么明显该被引 / 该存在、却没出现在 intro 里？：没有。简介虽然短，但引用很精准地覆盖了研究主线（RMT+RHT）、方法论（CCT）以及一条明确的竞争路线（Self-normalized）。作为一个方法论文，它是相当完整的。
张力：被引的 RHT 系内部工作（Chen/Li/Li & Xu）之间未发现矛盾。它们是递进关系：从单点测试到变点检测。与竞争路线（self-normalized）没有正面“碰撞”。因此，在本文的引文视野内，未见明显对立引用。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚
- 符号：
  - \(X_j \in \mathbb{R}^p\)：在时间点 \(j\) 观测到的高维数据列向量；\(j=1,...,n\)。
  - \(\mu_j \in \mathbb{R}^p\)：时间点 \(j\) 的未知均值向量（要推断的对象）。
  - \(\Sigma_p\)：对所有时间点共同、未知的 \(p \times p\) 协方差矩阵。
  - \(Z_j \in \mathbb{R}^p\)：白噪声向量，其元素独立，均值为0，方差为1。数据通过模型 \(X_j = \mu_j + \Sigma_p^{1/2} Z_j\) 生成。
  - \(S_n\)：样本协方差矩阵，\(S_n = n^{-1} \sum_{j=1}^n (X_j - \bar{X})(X_j - \bar{X})^\top\)。
  - \(\lambda\)：ridge 正则化参数，\(\lambda > 0\)。是待选择的关键 hyperparameter。
  - \(V_\lambda(s)\)：在扫描位置 \(s = (t_1, t_2, t_3)\) 上的 RHT 扫描统计量。\(V_\lambda(s) = N(s) \Delta(s)^\top (S_n + \lambda I_p)^{-1} \Delta(s)\)。其中 \(\Delta(s)\) 是两段样本的均值差。
  - \(D_\lambda(s)\)：标准化后的局部统计量。\(D_\lambda(s) = \sqrt{p} \{p^{-1}V_\lambda(s) - \hat{\Theta}_\lambda\} / \hat{\Gamma}_\lambda^{1/2}\)。
  - \(T_\lambda\)：最终的全局检验统计量，是扫描集 \(S\) 上所有 \(D_\lambda(s)\) 的上确界。\(T_\lambda = \sup_{s \in S} D_\lambda(s)\)。
  - \(P_\lambda\)：基于 \(T_\lambda\) 的边际 p 值。\(P_\lambda = 1 - F_S(T_\lambda)\)，其中 \(F_S\) 是极限分布函数。
- 模型：数据生成机制是 高维时序独立高斯随机向量（或更一般的四阶矩有限的分布）。零假设 \(H_0\) 是均值序列无变化：\(\mu_1 = ... = \mu_n\)。备择假设 \(H_1\) 是均值序列在未知时刻发生一次或多次突变。协方差结构 \(\Sigma_p\) 是完全未知的、高维的（\(p \sim n\)），但研究者假设其谱分布是一个“良好”的、紧支撑的极限分布。
- 可观测数据：研究者能观测到的是时间序列 \(\{X_j\}_{j=1}^n\)。这是你唯一拿到手里的东西。有很多东西是不可观测的：
  - 未知参数：\(\mu_j\), \(\Sigma_p\), \(\Sigma_p^{1/2}\)。
  - 潜在噪声：\(Z_j\)。
  - 最关键的一点：在备择假设 \(H_1\) 下，使检验功效最大的“最优” ridge 参数 \(\lambda\) 是未知的，因为它依赖于 \(\Sigma_p\) 和漂移方向，而这些全是不可观测的。
第二步：讲最小内核

这篇论文的核心思路可以抽象成一个非常简单的特例：忽略时间扫描，只看单个固定位置的“两样本检验”。这样做虽然失去了变点检测的“扫描”特性，但完全保留下“如何聚合多个 RHT 统计量”的核心问题。
- 最简特例：
  - 设定：假设我只需要检验一个已知的单一变点位置（如 \(k_0 = n/2\)）。那么，\(S\) 退化成一个点 \(s_0 = (0, 0.5, 1)\)。问题变成一个高维两样本均值检验（对比第一半和第二半数据）。
  - 问题：在这种情况下，\(T_\lambda\) 就退化为一个标量 \(D_\lambda(s_0)\)。Li & Xu [11] 已经证明，对任意固定的 \(\lambda > 0\)，有 \(D_\lambda(s_0) \xrightarrow{d} N(0, 1)\)。
  - 核心难题：我们手上有两个 RHT 统计量，比如一个用 \(\lambda = 0.1\)，另一个用 \(\lambda = 0.5\)。它们的极限分布都是 \(N(0,1)\)，但它们是联合相关的。我们不知道哪个 \(\lambda\) 更有效。我们不想放弃任何一个。
  - 核心思路（这篇论文干的）：
    1. 计算两个 p 值：\(P_{0.1} = 1 - \Phi(D_{0.1}(s_0))\)，\(P_{0.5} = 1 - \Phi(D_{0.5}(s_0))\)。
    2. 使用 CCT 规则将它们组合成一个统计量：\(C = \frac{1}{2} \tan\{\pi(1/2 - P_{0.1})\} + \frac{1}{2} \tan\{\pi(1/2 - P_{0.5})\}\)。如果信号很强，其中一个 p 值会很接近 0，对应的 \(\tan()\) 项会变得非常大，从而主导组合统计量 \(C\)。
    3. 理论保证：为了证明上述做法有效，论文需要回答一个问题：“In distribution under \(H_0\), what is the joint limit of \((D_{0.1}(s_0), D_{0.5}(s_0))\)?” 答案不再是简单的标准正态，而是一个二维零均值高斯向量，其 协方差 为 \(\rho\)，而 \(\rho\) 由两个 ridge 参数和 \(\Sigma_p\) 的极限谱所决定。
    4. 推论：知道了这个联合极限，就可以计算临界值实现“固定水平校准”。另外，由于 CCT 的“小尾性质”，即便不知道 \(\rho\)，也能用解析 p 值 \(P_{CCT}\) 近似地进行检验。
  - 为什么这个特例抓住了内核：它摒弃了“时间扫描”带来的过程极限的复杂性，将核心数学困难简化成：在给定协方差矩阵但未知的情况下，如何推得两个不同 ridge 参数的 RHT 统计量的联合极限分布？ 本文所有的附录证明（Lemma A.2, A.3, A.4, A.5）都是在解决这个多 \(\lambda\) 联合极限的问题，其论证的核心是对不同 resolvent \(R_{\lambda}\) 和 \(R_{\lambda'}\) 的迹进行确定性等价。从这个角度看，整篇论文的证明就是这个两样本特例的“加壳”推广。

三、这篇论文做了什么¶

三句话：
1. 研究了什么问题：在高维均值变点检测问题中，针对 ridge-regularized Hotelling (RHT) 检验对 ridge 参数 \(\lambda\) 高度敏感、且最优 \(\lambda\) 未知的问题，提出了一种基于确定性有限网格的 p 值聚合方法以避免参数选择。
2. 核心工具 / 方法：采用Cauchy 组合规则（CCT） 聚合在有限确定性网格上计算的固定 \(\lambda\) RHT 检验 p 值，而不是选择一个最优的单一 \(\lambda\)。
3. 主要结论：在标准的 RMT 条件下，建立了不同 \(\lambda\) 下 RHT 统计量的有限网格联合弱收敛定理（Theorem 1），并由此证明了固定水平的联合极限校准的有效性（Theorem 2前半部分）和 CCT 解析 p 值的小尾有效性（Theorem 2后半部分）。模拟表明该方法尺寸可控，功效接近理论上的最优固定 \(\lambda\) 选择。
关键设定与假设：
- Assumption 1 (RHT Regularity)：这是论文最核心的统计假设，也是进行所有理论证明的基础。它包括：
  - 数据假设：\(Z_j\) 的元素独立、均值为0、方差为1、且具有有限四阶矩。这比高斯假设弱，但限制了尾部行为。
  - RMT 假设：\(p/(n-1) \to \gamma \in (0,\infty)\)，且 \(\Sigma_p\) 的谱分布弱收敛到一个非退化的、紧支撑的极限。这意味着样本协方差矩阵的谱行为可以由一个极限谱分布来描述，这是使用 Marčenko-Pastur 定律和确定性等价的前提。
  - Ridge 网格假设：网格 \(\Lambda_n\) 是固定的、确定性的，且包含 \(L\) 个点（\(L\) 固定）。每个 \(\lambda_{\ell,n}\) 都有正下界和有限上界，且各自收敛到不同的正值。这个假设避免了使用数据相关或无限趋近于0的 \(\lambda\)，是定理成立的基石。
- 与已有文献的对比：这些假设与 Li & Xu [11] 中“固定 \(\lambda\)”部分所用假设几乎完全一致。本文的推进不在于“放宽”这些假设，而在于“在同样的假设集下，证明了更强的联合极限结果”。
主要结果：
- Theorem 1 (Finite-grid joint RHT null limit)：
  - 陈述：在 Assumption 1 下，标准化后的 RHT 统计量 \(\{D_{\lambda_{\ell,n}}(s): s \in \mathcal{S}, \ell=1,...,L\}\) 在 \(\ell^\infty(\mathcal{S})^L\) 中弱收敛到一个 L 维的高斯向量过程 \(\mathbf{G}_\Lambda(s)\)。其协方差结构为 \(\text{Cov}\{G_\ell(s), G_m(r)\} = \rho_{\ell m} K_0(s, r)\)。其中 \(\rho_{\ell \ell}=1\)；当 \(\ell \neq m\) 时，\(\rho_{\ell m}\) 由两个 resolvent 的迹确定；\(K_0(s, r)\) 是仅与扫描位置相关的、pivotal 的函数。
  - 解决的技术难点：最关键的是，证明不仅仅是对 \(L\) 个独立边际极限的简单堆叠，而是必须计算出跨 \(\lambda\) 的协方差 \(\rho_{\ell m}\)。这需要处理两个不同 resolvent \(R_{\lambda_\ell}\) 和 \(R_{\lambda_m}\) 的乘积（如 \(\text{tr}\{R_{\lambda_\ell} \Sigma_p R_{\lambda_m} \Sigma_p\}\)），这是 RMT 中一个非平凡的二阶问题（Hachem et al. [13, 14] 提供了理论工具）。
- Theorem 2 (Size validity)：
  - 第一部分（Joint-limit calibration）：如果我知道精确的联合极限分布，那么我能计算出 \(C(P_n)\) 的渐近临界值 \(c_{\alpha, L}\)，从而得到一个渐近精确水平的检验。但这需要估计 \(\rho_{\ell m}\)，在实操中很困难。
  - 第二部分（Analytic CCT p-value）：如果不估计 \(\rho_{\ell m}\)，只用 CCT 的解析 p 值公式 \(P_{CCT}\)，这个检验只在 \(\alpha\) 极小时（小尾行为）才是精确的，对于固定有限的 \(\alpha\)（如0.05）不一定精确。这是一个非常重要且诚实的区分。它明确了 CCT 的使用限制。
  - 解决的技术难点：证明了 \(C(P_n)\) 这个组合统计量的弱收敛性（Theorem 1 的连续映射定理推论），从而可以讨论其尾部行为。
证明路线与技术技巧（理论型）：
- 整体路线（简化版）：
  1. 第一步：简化问题。利用 Lemma A.5 证明，基于中心化样本协方差矩阵 \(S_n\) 的 RHT 统计量 \(D_{\lambda}(s)\)，去掉中心化和标准化误差后，在 \(O_p(p^{-1/2})\) 的误差下等价于一个基于 未中心化协方差矩阵 \(\Omega_n = n^{-1} X X^\top\) 且使用 确定性标准化 的过程 \(Z_{\ell}^\Omega(s)\)。这里是典型的“中心化替换”技术。
  2. 第二步：建立多λ联合 CLT。这是核心。Lemma A.3 是最关键的引理。它建立了一个一般的 CLT：
    - 将过程 \(Z^\Omega_\ell(s)\) 写成一系列“正则向量配对的双线性型” \(u^\top X^\top R_{\lambda} X v\) 的和。
    - 对每个样本 \(j\)，利用 leave-one-out 技巧，写出 鞅差序列 (martingale difference sequence)。
    - 证明条件方差收敛到一个确定性矩阵，其元素是不同 \(\lambda\) 下 resolvent 迹的确定性等价（Lemma A.2 的技术结果）。
    - 应用 鞅中心极限定理（Hall & Heyde [17]）得到有限维分布的联合正态性。
  3. 第三步：建立紧致性 (tightness)。Lemma A.4 证明了过程的 Increment bound（矩不等式），从而在 \(\ell^\infty(\mathcal{S})\) 中建立了紧致性，将有限维分布泛化到过程极限。
  4. 第四步：擦除误差。将第一步和第三步结合，利用连续映射定理，得到 \(P_n\) 的联合弱收敛（Theorem 1）。
- 关键跳跃点：
  - Lemma A.2 (Finite-grid cross-resolvent deterministic equivalents)：这是整个证明的“信息瓶颈”。RHT 问题之前的难点在于单一 resolvent \(R_\lambda\) 的迹的确定性等价（\(\text{tr}(R_\lambda \Sigma_p)\)）。本文需要突破到交叉 resolvent 的迹：\(\text{tr}(R_{\lambda_a} \Sigma_p R_{\lambda_b} \Sigma_p)\) 和 \(\text{tr}(R_{\lambda_a} R_{\lambda_b})\)。作者明确指出了这个常数 \(\rho_{\ell m}\) 由这些迹确定，并且通过引用 Hachem et al. [13, 14] 差分公式和光滑性论证，承认了其存在性和有界性，但并没有在附录中重新完整推导。对于不熟悉这些工具的读者（如我，和可能对你），这是一个“黑箱”。这一点的证明细节是值得去挖掘的“真金”。
- 技术技巧点名：
  - 鞅中心极限定理 / 鞅差序列 / 鞅CLT：处理相关的、非独立同分布的数据的一种标准强力工具，用于证明联合 CLT。
  - Leave-one-out 技巧：在鞅分解步骤中，将全样本的 resolvent \(R_\lambda\) 替换为排除第 \(j\) 个样本后的 resolvent \(R_{j,\lambda}\)，这使得 \(R_{j,\lambda}\) 与 \(X_j\) 独立，简化了条件期望和方差的计算。
  - Woodbury 恒等式 / 矩阵求逆引理：用于联系全样本 resolvent 与 loo resolvent，是 leave-one-out 技巧的核心。
  - 归纳法 / 连续映射定理：用于将过程极限推广到 \(P_n\) 的收敛。
  - 确定性等价：利用 RMT 确定性的极限代替随机迹，从而建立垂死的协方差结构。
真实例子与应用：有，非常详尽。
- 数据/场景：模拟数据。协方差 \(\Sigma\) 被设计成6种（ID, Toeplitz(.3)/.6, Poly Decay, Exp Decay, CS(.6)）。信号分为3种（独立高斯密实、协方差对齐高斯密实、稀疏）。样本量 \(n \in \{200,400\}\)，维数 \(p \in \{100,200,400\}\)。
- 怎么用：在零假设下计算各RHT p值的尺寸（Table 1/2）；在备择假设下对比 CCT 聚合与两个固定 \(\lambda\) （0.1, 0.2）及 oracle 最优固定 \(\lambda\) 的功效（Figure 1, Table 3）。
- 结果：
  1. 尺寸：CCT 聚合在大多数条件下尺寸稳定在5%附近，尤其当网格不包含过小的 ridge 值（如 \(\lambda\) > 0.05）时。当 \(p\) 相对 \(n\) 很大（如 \(n=200, p=400\)）时，CCT 在某些协方差下尺寸会轻微地膨胀到6-8%，但比最小 \(\lambda\) (0.05) 的膨胀小。
  2. 功效：在图1和表3中，CCT 聚合（红线）始终接近或超过两个固定 \(\lambda\) 中的较优者（黑、蓝线），并且非常接近 oracle 最优固定 \(\lambda\)（灰线）的功效。其累计损失（\(\Delta_{CCT}\)）在任何协方差-信号组合下都是最小的。
- 这个例子的目的：通过详尽、系统化的模拟，清晰地验证了论文的核心论点：
  1. CCT 聚合是实际可行的，尺寸能得到基本控制。
  2. CCT 聚合成功地“对冲”了 ridge 参数选择风险，能够在各种未知的协方差和信号结构下，稳定地达到接近最优的检验功效，这比选择一个错误的固定 \(\lambda\) 要好得多。
  3. 强力证据表明，这种方法在复杂的现实应用中（协方差和信号都未知）是稳健的。
🔎 结论是否比证明窄：
- 是，这是一个重要的点。Theorem 2 的 第二部分（Analytic CCT p-value） 只被严格证明在 小尾（\(\alpha \to 0\)） 下有效（\(\lim_{\alpha \downarrow 0} \frac{P(P_{CCT} \le \alpha)}{\alpha} = 1\)）。然而，在模拟中，作者直接在所有固定的 \(\alpha = 0.05\) 水平上使用了解析 p 值 \(P_{CCT}\)，没有去做它声称的“联合极限校准”。作者没有在模拟中提供任何 empirical evidence 来证明 \(P_{CCT}\) 在 \(\alpha = 0.05\) 下的确切性。这意味着，模拟中的尺寸验证（Table 1/2 “CCT”列）只是对“小尾近似”在一个有限水平上的 empirical 验证，并未被理论证明所严格覆盖。这是一个值得你注意的潜在“承诺与兑现”之间的差距。

四、开放问题（点到为止，扎根具体语句）¶

固定水平校准：Theorem 2 明确指出，联合极限校准能给出渐近精确的尺寸，但它需要估计跨 \(\lambda\) 的协方差 \(\rho_{\ell m}\)。如何开发一个实用且有效的方法（如一个解析公式、或一个 bootstrap 程序）来实现“固定水平校准”的 CCT 检验，使其在传统显著性水平（如 \(\alpha = 0.05\)）下保持渐近精确，而不是仅仅依靠小尾近似？扎根语句：论文第5节 Discussion 中，作者自己提到：“First, one could develop fixed-level calibration for the analytic Cauchy statistic by estimating the finite-grid joint limit or by constructing a valid bootstrap for the cross-ridge p-value vector.”
数据自适应或无穷扩展网格：本文的“有限确定性网格”是理论分析的关键。但实践中，最优 \(\lambda\) 可能位于网格点之外，或者网格大小 \(L\) 可能随 \(p\)、\(n\) 增长而增长。如何将这套理论推广到网格点随 \(n\) 增长，或网格点由数据自适应选择的场景？ 这需要更强的技术工具（如 uniform stochastic equicontinuity in \(\lambda\)）来处理过程极限在无限维上的收敛。扎根语句：论文第5节 Discussion 中，作者自己提到：“Second, the deterministic finite-grid theory could be extended to growing or data-adaptive ridge grids, where uniform stochastic equicontinuity in \(\lambda\) becomes essential.”
理论上确切的功率界：Theorem 3 关于功率的结论比较“软”且是“条件性”的（它假设了漂移的存在和主导项存在，并且没有抵消）。与 minimax 框架相比，这种测试的可检测性阈值（detection boundary）是什么？能否推导出该 CCT 聚合检验在某种稀疏性/信号强度下的 精确 minimax 速率。这是一个更宏大的理论问题，作者绕开了。你可以把它看作一个本质的 gap：这篇论文是 §“设计方法”+§“模拟展示”，而不是 §“理论最优性”。这与你的研究兴趣高度相关。

Maintained by 陈星宇 · Homepage · Source on GitHub

Cauchy Aggregation of Ridge-Regularized Hotelling Tests for High-Dimensional Change-Point Detection¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论