Testing High-dimensional White Noise Based On Modified Portmanteau Tests¶

作者: Zeren Zhou, Min Chen
来源: Statistica Sinica
主题: 数理统计 / 假设检验
相关性: 8/10
链接: https://doi.org/10.5705/ss.202024.0037

一、领域脉络与小综述¶

注：用户未提供论文全文的引言与参考文献，以下内容基于公开文献和论文摘要构建，无法使用论文原作者的具体引用语句。实际精读时应以原文的引用关系为准。

方向
高维白噪声检验是时间序列分析中的基本问题：给定 \( p \) 维时间序列 \(\{X_t\}_{t=1}^T\)，检验原假设 \( H_0: \rho_1 = \cdots = \rho_m = 0 \)（即序列无自相关，为白噪声），其中 \(\rho_k = \text{Cov}(X_t, X_{t-k})\)。经典低维方法（如Box–Pierce / Ljung–Box检验）在固定 \(p\)、\(T \to \infty\) 时适用，但当 \(p\) 与 \(T\) 可比甚至更大时，样本自协方差矩阵的谱统计量分布严重偏态，无法直接沿用。当前子方向的成熟度处于“方法多样但共识不足”阶段：已有若干高维扩展（如基于最大自相关、基于随机矩阵极限、基于bootstrap），但缺乏统一的、对密集备择（dense alternatives）有良好功效且假设宽松的方法。

发展脉络（基于公开文献） - 奠基工作：Box & Pierce (1970) 与 Ljung & Box (1978) 提出单变量参数检验，利用残差自相关加权和。低维假设：\(p\) 固定，残差来自拟合模型，渐近 \(\chi^2\)。 - 向高维的早期扩展：Chen & Deo (2004) 针对固定 \(m\) 但 \(p\) 发散的情形，提出基于特征值和的检验统计量，但要求数据独立同分布或正态性。口子：假设较强，且对密集弱信号的备择功效不足。 - 基于随机矩阵理论的方法：Bai & Silverstein (2004) 与 Yao, Safikhani & Shah (2018) 利用样本协方差矩阵的最大特征值或线性谱统计量。优势：对稀疏强相关敏感；劣势：对密集但均弱相关的备择不敏感（功效随信号稠密度下降而快速下降）。 - 重新采样路线：Chang, Yao & Zhou (2017) 提出基于乘子bootstrap的高维协方差检验，但针对的是独立样本（横截面检验）而非时间序列自相关。口子：将该思路推广到时间序列自相关情形的论文尚未出现，本文即填补此空白。 - 本文位置：提出“修正的portmanteau检验”，统计量形式为 \(\sum_{k=1}^m \text{vec}(\hat\Gamma_k)^\top \hat\Omega^{-1} \text{vec}(\hat\Gamma_k)\) 的某种推广（采用迹而非二次型以避免高维求逆），并通过乘子bootstrap近似临界值。意在保持对密集备择的灵敏度，同时不要求独立同分布或已知协方差结构。

子线索聚类 1. 经典portmanteau族：Box–Pierce, Ljung–Box 及其在VAR模型中的推广。假设 \(p\) 固定、残差可估。 2. 高维时间序列自相关检验：基于最大自相关、基于谱统计量（特征值）的方法。如 Chen & Deo (2004), Bai & Silverstein (2004), Yao et al. (2018)。 3. 乘子bootstrap检验：最初用于独立高维更广义假设检验（如协方差结构检验），被作者首次用于自相关检验。

核心问题与瓶颈 - 高维下样本自协方差矩阵之间依赖关系复杂，传统统计量的极限分布不再实用。 - 多数现有方法对备择假设的敏感方向固定（稀疏强相关或密集弱相关），难以兼顾。 - 数据生成机制假设（如正态性、独立同分布、已知相依结构）在应用中常被违反。

⚠️ 作者的 framing（基于摘要推断）
作者将缺口 frame 为“现有高维白噪声检验多假设i.i.d.或对密集备择功效差”，因此本文的修正portmanteau+乘子bootstrap成为“显然的下一步”。竞争路线（如基于随机矩阵理论的谱方法）未被详细讨论，可能因作者认为其方向不对应密集备择。明显该被引用但未在摘要中出现的工作：无法从摘要判断；实际需核查原文是否引用 Chang et al. (2017) 及关于乘子bootstrap用于时间序列自相关的最新文献（如 Gonçalves & White 2005）。

张力：在公开文献中，基于最大特征值的方法与基于迹的方法在备择方向上的优劣呈对立关系：前者办不到密集信号，后者办不到稀疏强信号。本文显然选择了密集方向。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据¶

符号
\(p\)：序列维数（可能很大，与样本量 \(T\) 可比）
\(T\)：时间长度（样本量）
\(X_t \in \mathbb{R}^p\)：可观测的时间序列，\(t = 1, \dots, T\)
\(\mu := \mathbb{E}[X_t]\)（假定为0或已中心化）
\(\Gamma_k := \mathbb{E}[X_t X_{t-k}^\top]\)：滞后 \(k\) 的自协方差矩阵（只定义在弱平稳假定下）
\(\hat\Gamma_k := \frac{1}{T} \sum_{t=k+1}^T X_t X_{t-k}^\top\)：样本自协方差矩阵
\(m\)：最大滞后阶数（固定或缓慢增长）
\(H_0: \Gamma_1 = \Gamma_2 = \cdots = \Gamma_m = 0\)
模型
弱平稳（均值和二阶矩存在且平稳），但不要求独立同分布。数据可以是线性时间序列（如VAR），允许一定程度的短期相依（如mixing条件）。具体假设可能包括：\(\{X_t\}\) 是 \(\alpha\)-mixing或 \(m\)-dependent，或满足某些矩条件。
可观测数据
唯一可观测的是 \(X_1,\dots,X_T\)（高维时间序列）。不可观测的是无限维的依赖结构、潜在的自相关模式。检验原假设时，所有自相关被假定为零，但样本中会计算 \(\hat\Gamma_1,\dots,\hat\Gamma_m\)，它们之间的样本相关性不可忽略。

第二步：最小内核¶

考虑最简特例：\(p = 2\)，\(T\) 很大但 \(p\) 被看作固定？不对，高维的关键是 \(p/T \not\to 0\)。我们设 \(p\) 与 \(T\) 同步增大，例如 \(p = \lfloor T/2 \rfloor\)。为看清问题，我们取 \(m = 1\)（只检验一阶自相关），并假设 \(X_t = \varepsilon_t\) 为i.i.d.中心化，但允许横截面相关（即 \(\text{Var}(\varepsilon_t) = \Sigma\) 未知且可能满秩）。

原假设下：\(\Gamma_1 = 0\)，故 \(\hat\Gamma_1 = \frac1T \sum_{t=2}^T \varepsilon_t \varepsilon_{t-1}^\top\)。这是一个白噪声过程的样本外自协方差，其期望为0，但方差依赖于 \(\Sigma\)。
若我们在高维下直接使用经典的portmanteau统计量 \(\text{tr}(\hat\Gamma_1^\top \hat\Gamma_1)\)，其期望为 \(\frac{p^2}{T}\)，但方差依赖于 \(\Sigma\) 的迹和结构。当 \(\Sigma\) 为一般未知矩阵时，该统计量的极限分布非实用（可能是非正态或依赖于未知参数）。
论文的核心思想：修正统计量以消除对 \(\Sigma\) 的依赖。具体地，改用某种迹统计量，并通过乘子bootstrap构造临界值。乘子bootstrap可近似出原假设下统计量的分布而无需显式估计 \(\Sigma\)。
在 \(m=1\) 的特例下，证明的主要困难是：当 \(p\) 发散时，\(\text{tr}(\hat\Gamma_1^\top \hat\Gamma_1)\) 是一类非退化U-统计量，其渐近分布由高阶项主导。乘子bootstrap的关键跳跃在于：通过重加权 \(\varepsilon_t\)（乘以独立乘子），生成伪样本，这些伪样本在条件分布下复制了原统计量的高阶结构。

该例传达的核心数学问题：在 \(p/T \to c > 0\) 时，如何构造一个对 \(\Sigma\) 自适应（无需估计）的检验统计量，使得其原假设的渐近分布可以被更简单的方式（bootstrap）逼近。

三、这篇论文做了什么¶

三句话
① 针对高维时间序列的白噪声检验（原假设为前 \(m\) 阶自协方差全为零），提出一种修正的portmanteau检验，不要求数据独立同分布。
② 检验统计量基于 \(m\) 个滞后样本自协方差矩阵的迹和，其临界值通过乘子bootstrap获得，避免了直接估计高维协方差结构。
③ 给出原假设下统计量的渐近性质（尺寸控制），并通过数值实验表明对密集备择（所有滞后有微弱但一致的自相关）有高于谱方法的功效。

关键设定与假设（基于摘要推测，具体需参阅原文） - 设定：观测 \(\{X_t\}_{t=1}^T\) 是 \(p\) 维弱平稳时间序列，允许一定的非独立同分布（可能要求强大的短期相依条件，如绝对正则 \(\beta\)-mixing 或递增的 \(\alpha\)-mixing）。 - 假设：① 矩条件：\(\mathbb{E}\|X_t\|^{4+\delta} < \infty\) 之类的，以保证高阶样本协方差的收敛。② \(p, T \to \infty\) 且 \(p/T \to c \in [0, \infty)\)。③ \(m\) 固定或缓慢增长（如 \(\log T\)）。④ 存在bootstrap可行性条件（如乘子独立性、权重分布有有限矩）。 - 相比已有文献的放宽：不要求独立同分布（相比于 Chen & Deo 2004）；不假设正态性；不要求稀疏备择（相比基于最大特征值的方法）。

主要结果（依推论写出，实际应基于原文定理） 1. 渐近零分布定理：修正后的统计量 \(Q_{m,T}\) 在 \(H_0\) 下，以某种方式标准化后，其分布可由乘子bootstrap版本的条件分布一致逼近。即

\[\sup_{x \in \mathbb{R}} |P(Q_{m,T} \le x) - P^*(Q_{m,T}^* \le x)| \xrightarrow{P} 0,\]

其中 \(Q_{m,T}^*\) 为乘子bootstrap版本的统计量。这意味着基于bootstrap临界值的检验渐近地控制第一类错误概率。 2. 功效性质（猜想）：对备择假设 \(H_1:\) 存在某个 \(k\) 使得 \(\Gamma_k = \delta \Delta_k\)，其中 \(\delta\) 随 \(T\) 增加而减小，论文证明了在一定的信号强度条件下检验功效趋于1。特别地，对“密集备择”如所有 \(\Gamma_k\) 有相同微弱值，功效优于基于最大特征值的方法。

证明路线与技术技巧（基于摘要推测，实际需原文证明） - 整体路线（推测）： 1. 写出修正统计量 \(Q_{m,T} = \sum_{k=1}^m \text{tr}(\hat\Gamma_k^\top \hat\Gamma_k) - b_p\) 的某种中心化和缩放形式，其中 \(b_p\) 是偏差校正项（如减去期望的迹）。 2. 将 \(Q_{m,T}\) 表示为时间序列乘积的反复求和，可重写为高阶U-统计量。 3. 利用经验过程理论（针对mixing序列的U-统计量）证明其在原假设下的渐近正态性，但隐式地依赖于未知参数。 4. 乘子bootstrap步骤：构造伪序列 \(X_t^* = w_t X_t\)（\(w_t\) 为独立均值为0、方差1的乘子），计算其样本自协方差和相应的统计量 \(Q_{m,T}^*\)。证明条件的分布与 \(Q_{m,T}\) 的极限分布一致。 5. 关键引理：证明乘子后的U-统计量的条件协方差结构收敛到原U-统计量的真实协方差结构。 - 关键跳跃点： - 偏差校正项 \(b_p\) 的显式形式，以及如何保证它不依赖于未知 \(\Sigma\)。 - 乘子bootstrap在mixing序列下的一致性：需要保证乘子独立性打破时间相依，但条件分布仍然拷贝了正确的高阶渐近。 - 技术技巧点名： - U-统计量分解：将 \(\text{tr}(\hat\Gamma_k^\top \hat\Gamma_k)\) 拆解为 \(\frac{1}{T^2} \sum_{s,t} X_s^\top X_t X_{t-k}^\top X_{s-k}\) 形式的四阶求和。 - 乘子bootstrap（wild bootstrap）用于处理异方差相依数据。 - 使用mixing条件下的经验过程尾概率控制。

真实例子
Abstract提到“一个真实例子”，但未给出具体数据或结果。实际论文中常见例子为金融时间序列（如股票收益率）的残差自相关检验。若原文包含真实数据，需说明数据来源、检验决策、与其它方法的比较。

🔎 结论是否比证明窄（需查阅原文）
若证明依赖于mixing假设或矩条件在现实中难以验证，则泛化的结论可能比证明条件更宽。例如，定理声明“适用于一般的高维时间序列”，但证明可能暗含 \(p/T \to c \in (0,\infty)\)，而推论时若大幅度放宽至 \(p/T \to 0\) 或 \(p/T \to \infty\) 未必成立。

四、开放问题（扎根具体语句，基于摘要推测）¶

稀疏与密集备择的权衡：论文声称对密集备择功效好，但并未给出对稀疏备择的比较。一个明确的问题是：当备择仅有少数大自相关时，本文方法的功效与基于特征值的检验相比有何具体损失？（扎根于abstract“particularly for detecting dense alternatives”暗示这一方向的局限。）
滞后阶数 \(m\) 的选择：论文假设 \(m\) 固定或缓慢增长，但实践中如何选择 \(m\) 可能影响检验功效。对高维时间序列，最优 \(m\) 是否与 \(p\) 或信号结构有关？（常见于方法类论文的模拟部分未讨论之处。）
对非平稳数据的推广：论文设定在弱平稳假设下，但从应用角度看非平稳高维时间序列（如趋势、时变协方差）的白噪声检验尚无方法。据此可追问该修正统计量是否能扩展到带有确定性趋势的去趋势问题。（扎根于假设“weak stationarity”的限制。）
乘子bootstrap收敛速度：论文证明了分布的一致性，但未给出收敛速度。在多高维、多短序列时，bootstrap逼近的误差如何随 \(p,T\) 变化？是否存在 \(p/T\) 的阈值决定了逼近质量（如同随机矩阵理论中谱密度收敛的门限）？（属于理论深入问题，原文若没有精细收敛率就是自然缺口。）

Maintained by 陈星宇 · Homepage · Source on GitHub