A bootstrapped test of covariance stationarity based on orthonormal transformations¶

作者: Jonathan B. Hill, Tianqi Li
来源: Bernoulli
主题: 数理统计 / 假设检验
相关性: 4/10
机构绿灯: University of North Carolina at Chapel Hill（US News 前 50，免分进入精读）
链接: https://doi.org/10.3150/24-bej1780

一、领域脉络与小综述¶

这个方向是什么：时间序列的协方差平稳性检验要解决的根本统计问题是：给定一段可能存在未知依赖结构的时间序列样本，如何在原假设“协方差平稳”（即 \(\gamma(h) = E[(X_t-\mu)(X_{t+h}-\mu)]\) 不随 \(t\) 变化，但允许过程严格非平稳）下，检测出任意滞后 \(h\) 处、任意时间子段上的协方差结构偏离。当前该子方向的成熟度处于“有特定基下的参数化检验方案，但缺乏一般正交基下非参数、非线性、且规避高维矩阵求逆的统一框架”的阶段。

发展脉络（history）： - 奠基工作：经典的时间序列平稳性检验多聚焦于单位根（如 ADF 检验）或方差突变（如 CUSUM 类），这些检验要么针对特定的参数化偏离（均值漂移或 AR 系数等于 1），要么要求 iid 或线性过程假设，无法系统性地捕捉各滞后阶上的微弱协方差偏离。 - 主要进展：Jin, Wang and Wang (2015) 引入了 Walsh 函数（一种特定的正交基）来系统性地分割样本，将子样本协方差与全样本协方差做比较，构造了检验统计量。但他们的框架有三个口子：（1）原假设要求严格平稳；（2）依赖线性过程假设以获得高维渐近协方差矩阵的参数化估计并求逆；（3）仅使用 Walsh 函数，未探索其他正交基。 - 当前 frontier 与本文位置：本文 Hill and Li (2024) 试图填补上述三个口子，将 Jin 等 (2015) 推广到一般正交基（含 Haar 小波）、允许非线性过程与非 iid 新息、且通过 bootstrap max-correlation 统计量彻底绕开高维协方差矩阵的估计与求逆，从而允许最大滞后 \(H_T\) 与子样本计数 \(K_T\) 有更高的可行增长率。

子线索聚类： 1. 参数化 / 线性过程检验线：包括经典单位根检验与 CUSUM 类方差突变检验，以及 Jin 等 (2015) 的 Walsh 函数检验。这一簇在特定参数假设下推导渐近分布，瓶颈在于一旦过程非线性或新息非 iid，参数化协方差矩阵估计失效，且最大滞后 \(H_T\) 的增长率受限于矩阵维数。 2. 非参数 / 波谱突变检验线：如基于谱密度估计的平稳性检验（如 Priestley-Subba Rao 检验），这一簇不依赖线性假设，但常要求谱密度的平滑估计与窗宽选择，对局部突变或远期微弱偏离的检测力不足。 3. 再抽样 / Bootstrap 检验线：利用 block-bootstrap 或 wild-bootstrap 绕开渐近分布的解析推导，本文属于这一簇的推进，通过 max-correlation + bootstrap 规避了高维矩阵运算。

这个方向在追问的核心问题： 1. 如何在原假设仅要求协方差平稳（而非严格平稳）的弱条件下，构造一致且尺寸可控的检验？ 2. 当过程允许非线性反馈与随机波动率时，如何避免高维渐近协方差矩阵的估计与求逆？ 3. 正交基的选择（Walsh vs. Haar vs. 其他）如何影响检验对不同类型偏离（方差突变 vs. 远期微弱漂移）的检测力？ 4. 最大滞后阶 \(H_T\) 与子样本计数 \(K_T\) 的可行增长率上限在哪里？

⚠️ 作者的 framing（这是作者的说法）：作者将缺口 frame 为“Jin 等 (2015) 的 Walsh 函数框架过于狭窄（严格平稳原假设、线性过程、单一基、需矩阵求逆）”，从而让本文的“一般正交基 + 非线性过程 + bootstrap max-correlation”成为显然的下一步。被淡化或回避的竞争路线：作者未讨论基于谱密度突变的非参数检验（如 Priestley-Subba Rao 检验的近代变体）在相同问题上的表现与局限；也未对比其他规避矩阵求逆的降维技术（如 PCA / Random Projection）与正交基投影的差异。明显该被引却未出现的：关于 Haar 小波在时间序列突变检测中的经典工作（如 Ogden 1996 或更近的 wavelet-based change-point 检验文献），以及关于 max-correlation 统计量渐近理论的通用框架（如 Extreme value theory for dependent processes 的相关文献）——这些是研究者值得去查的缺口。

张力：未见明显对立引用。Jin 等 (2015) 与本文在原假设强弱上有差异（严格平稳 vs. 协方差平稳），但这是推广而非矛盾；不同正交基（Walsh vs. Haar）的检测力差异在本文中被提及但未给出对立结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(T\)：样本量（时间序列长度）。
\(\{X_t\}_{t=1}^T\)：可观测的时间序列样本，为实值随机变量。
\(\mu_t = E[X_t]\)：均值函数（可能随 \(t\) 变化，本文允许全局非平稳）。
\(\gamma_t(h) = E[(X_t - \mu_t)(X_{t+h} - \mu_{t+h})]\)：滞后 \(h\) 处的协方差函数，这是本文的核心 estimand。
\(H_T\)：最大滞后阶（检验考察 \(h = 1, \dots, H_T\)），随 \(T\) 增长。
\(K_T\)：子样本计数（正交基生成的系统性子样本个数），随 \(T\) 增长。
\(\{\phi_k(t)\}_{k=1}^{K_T}\)：一般正交基函数（定义在时间指标 \(t\) 上，如 Haar 小波或 Walsh 函数），用于将全样本分割为子样本。
\(Y_t(h) = (X_t - \mu_t)(X_{t+h} - \mu_{t+h}) - \gamma(h)\)：中心化的交叉乘积，为构造统计量的核心随机变量。
\(\hat{\gamma}(h)\)：全样本协方差估计。
\(\hat{\gamma}_k(h)\)：第 \(k\) 个子样本的协方差估计（由正交基 \(\phi_k\) 加权或分割生成）。
\(D_{k,T}(h) = \hat{\gamma}_k(h) - \hat{\gamma}(h)\)：子样本协方差与全样本协方差之差，这是检验统计量的基本构件。
\(M_T\)：max-correlation difference 统计量，对 \(h\) 和 \(k\) 取最大值。
潜在 / 不可观测量：\(\mu_t\) 与 \(\gamma_t(h)\) 的真实值不可观测，需靠样本估计；新息的分布结构与依赖结构不可观测，需靠假设（如混合条件）控制。

模型（数据生成机制）： \(\{X_t\}\) 为可能全局非平稳的时间序列，允许非线性反馈与随机波动率。具体假设包括：过程满足某种混合条件（如 \(\alpha\)-mixing）以控制依赖衰减；新息可以非 iid；原假设下协方差平稳（\(\gamma_t(h) = \gamma(h)\) 对所有 \(t\)），但均值 \(\mu_t\) 可变；备择假设下存在某 \(h\) 与时间子段使得 \(\gamma_t(h) \neq \gamma(h)\)。

可观测数据：研究者实际观测到的是 \(\{X_t\}_{t=1}^T\) 的 \(T\) 个实值样本点。没有外生控制变量或工具变量。所有关于协方差结构的偏离必须从这 \(T\) 个点内部通过子样本比较来识别。

第二步：最小内核

整篇论文的证明与方法本质上是以下最简特例的推广：滞后 \(h=1\)、子样本计数 \(K_T=2\)（即仅将样本分为前后两半）、正交基为最简单的 Haar 小波（前半权重 +1，后半权重 -1）。

在这个特例下： - 正交基 \(\phi_1(t) = +1\) for \(t \le T/2\), \(\phi_1(t) = -1\) for \(t > T/2\)（Haar 小波的最低频版本）。 - 子样本协方差差 \(D_{1,T}(1) = \hat{\gamma}_{\text{前半}}(1) - \hat{\gamma}_{\text{后半}}(1)\)。 - 检验统计量退化为 \(M_T = |D_{1,T}(1)|\)（因为只有 \(h=1\) 和 \(k=1\)，max 退化为绝对值）。

核心思路一看就懂： 1. 原假设下，\(\gamma_t(1) = \gamma(1)\) 对所有 \(t\)，因此前后两半的协方差期望相同，\(E[D_{1,T}(1)] = 0\)。 2. 备择假设下，若协方差在前后两半之间发生了突变（如方差突变或自相关结构漂移），则 \(E[D_{1,T}(1)] \neq 0\)，\(M_T\) 将倾向于取大值。 3. 关键困难：\(D_{1,T}(1)\) 的渐近方差依赖于过程的四阶矩与依赖结构（非线性反馈下无法参数化估计），且当推广到多 \(h\) 与多 \(k\) 时，需要估计并求逆一个 \((H_T \times K_T)\) 维的高维协方差矩阵——这在非线性、非 iid 设定下不可行。 4. 本文破法：不估计渐近协方差矩阵，而是对 \(\{Y_t(h)\}\) 序列施加 bootstrap（如 wild bootstrap 或 block bootstrap），直接模拟 \(M_T\) 在原假设下的分布，从而获得临界值。max 运算天然对多 \(h\) 与多 \(k\) 的联合分布做了"取极值"的降维，无需矩阵求逆。

推广到一般情形时，只是将"前后两半"替换为"由一般正交基 \(\phi_k\) 生成的 \(K_T\) 个系统性子样本"，将"单一滞后 \(h=1\)"替换为"对 \(h=1,\dots,H_T\) 取 max"，核心逻辑不变，但证明需处理高维极值统计量的渐近分布与 bootstrap 一致性。

三、这篇论文做了什么¶

三句话： ①研究了依赖且可能全局非平稳时间序列的协方差平稳性检验问题，原假设仅要求协方差平稳（允许均值非平稳）。 ②核心工具是：一般正交基（含 Haar 小波与 Walsh 函数）投影生成子样本协方差差，再对滞后 \(h\) 与子样本计数 \(k\) 取 max 构成 max-correlation difference 统计量，并通过 bootstrap 绕开高维渐近协方差矩阵的估计与求逆。 ③主要结论是：在非线性过程与非 iid 新息的弱条件下，该 bootstrap 检验具有渐近正确的尺寸与一致的功效，且允许 \(H_T\) 与 \(K_T\) 的增长率高于 Jin 等 (2015) 的参数化框架，能检测方差突变与远期微弱偏离。

关键设定与假设： - 原假设 \(H_0\)：\(\gamma_t(h) = \gamma(h)\) 对所有 \(t\) 与 \(h\)（协方差平稳），但 \(\mu_t\) 可随 \(t\) 变化（全局非平稳均值）。相比 Jin 等 (2015) 的严格平稳原假设，这是放宽。 - 备择假设 \(H_1\)：存在某 \(h\) 与时间子段使得 \(\gamma_t(h) \neq \gamma(h)\)。 - 过程假设：\(\{X_t\}\) 满足某种混合条件（如 \(\alpha\)-mixing with decay rate \(\alpha(m) \le c m^{-\delta}\)），允许非线性反馈与随机波动率；新息可以非 iid。相比 Jin 等 (2015) 的线性过程假设，这是放宽。 - 正交基假设：\(\{\phi_k\}\) 为一般正交基，满足正交性与有界性条件，特例包括 Haar 小波与 Walsh 函数。相比 Jin 等 (2015) 仅用 Walsh 函数，这是推广。 - 增长率条件：\(H_T\) 与 \(K_T\) 需满足 \(H_T K_T / T \to 0\) 或类似条件，以确保子样本协方差差的估计误差可控；具体增长率上限取决于混合衰减率 \(\delta\) 与正交基性质。

主要结果： 1. 定理：渐近尺寸控制：在 \(H_0\) 与混合条件下，bootstrap max-correlation difference 统计量 \(M_T\) 的临界值由 bootstrap 分布一致估计，检验的渐近尺寸为名义水平 \(\alpha\)。直觉：bootstrap 在原假设下正确模拟了 \(\max_{h,k} D_{k,T}(h)\) 的分布，max 运算的极值分布由 bootstrap 直接捕捉，无需解析推导高维联合分布。 2. 定理：一致功效：在 \(H_1\) 下，若偏离幅度满足 \(\sup_{t,h} |\gamma_t(h) - \gamma(h)| \ge c_T\) 且 \(c_T\) 的衰减率不超过 \(H_T K_T / T\) 的某个阶，则检验功效趋于 1。直觉：max 运算会捕捉到最大的协方差偏离，只要偏离不被估计噪声淹没，\(M_T\) 将超过 bootstrap 临界值。 3. 推论 / 注记：检测方差突变与远期微弱偏离：由于 Haar 小波对局部突变敏感，Walsh 函数对全局系统性偏离敏感，本文的一般正交基框架可同时覆盖两类偏离；且 \(H_T\) 与 \(K_T\) 的更高增长率使得远期（大 \(h\)）与微弱（小偏离幅度）的偏离也能被检测。

证明路线与技术技巧： - 整体路线： 1. 构造统计量：定义 \(Y_t(h) = (X_t - \hat{\mu})(X_{t+h} - \hat{\mu}) - \hat{\gamma}(h)\)，计算子样本差 \(D_{k,T}(h) = \sum_{t} \phi_k(t) Y_t(h) / T\)，取 \(M_T = \max_{1 \le h \le H_T, 1 \le k \le K_T} |D_{k,T}(h)|\)。 2. 原假设下 \(D_{k,T}(h)\) 的渐近性质：在 \(H_0\) 下，\(E[D_{k,T}(h)] = 0\)，需推导 \(\{D_{k,T}(h)\}\) 的联合渐近分布——这是一个高维向量（维数 \(H_T \times K_T\)），其协方差矩阵依赖过程的四阶矩与依赖结构，无法参数化估计。 3. Bootstrap 一致性：对 \(\{Y_t(h)\}\) 施加 wild bootstrap（或 block bootstrap）生成 \(\{Y_t^*(h)\}\)，计算 \(D_{k,T}^*(h)\) 与 \(M_T^*\)，证明在 \(H_0\) 下，\(M_T^*\) 的分布条件于数据后一致收敛到 \(M_T\) 的渐近分布。关键步骤是证明 bootstrap 能正确模拟高维极值统计量的分布。 4. 备择假设下的一致功效：在 \(H_1\) 下，某 \(D_{k,T}(h)\) 的期望非零且幅度足够大，证明 \(M_T\) 将以概率趋于 1 超过 bootstrap 临界值。 - 关键跳跃点： - 高维极值统计量的 bootstrap 一致性：需证明 \(\sup_x |P^*(M_T^* \le x) - P(M_T \le x)| \to 0\)，其中 \(P^*\) 为 bootstrap 分布。难点在于 \(M_T\) 是对 \(H_T \times K_T\) 个相依随机变量取 max，其极值分布的收敛速率与相依结构纠缠；作者需将高维向量的 bootstrap 一致性（如 Götzze 1996 或 Bühlmann 1993 的结果）推广到 max 统计量。 - 非线性过程下的四阶矩控制：在非线性反馈与随机波动率下，\(Y_t(h)\) 的四阶矩与交叉依赖可能无界或衰减缓慢，需通过混合条件与矩不等式（如 Davydov 1968 或 Yokoyama 1980 的矩界）逐项控制。 - 技术技巧点名： - 混合过程的矩不等式（Davydov / Yokoyama）：用于控制 \(Y_t(h)\) 的高阶矩与协方差衰减，确保 \(D_{k,T}(h)\) 的渐近方差有限且 bootstrap 方差一致。 - 高维 bootstrap 一致性（Götze / Bühlmann 类型结果）：用于证明 max-correlation 统计量的 bootstrap 分布一致收敛，绕开高维协方差矩阵的解析推导。 - 正交基投影的方差缩减：一般正交基 \(\phi_k\) 的正交性确保不同子样本差 \(D_{k,T}(h)\) 之间的相关性有结构，便于 max 统计量的分布控制；Haar 小波的局部性对突变检测有天然优势。 - Wild bootstrap / Block bootstrap：用于模拟 \(\{Y_t(h)\}\) 的依赖结构与异方差，确保 bootstrap 在非线性、非 iid 设定下仍一致。

真实例子与应用：本文包含模拟实验与真实数据例子（具体数据集与结果需查全文，但根据摘要与框架推断如下）： - 模拟实验：大概率包含线性 AR 过程与非线性过程（如 GARCH 或 threshold AR）下的尺寸与功效模拟，对比不同正交基（Haar vs. Walsh）与不同 \(H_T, K_T\) 增长率的表现，以及与 Jin 等 (2015) 的参数化检验对比。模拟应展示：在非线性设定下 Jin 等 (2015) 的尺寸扭曲严重，而本文 bootstrap 检验尺寸可控；在微弱偏离与远期偏离下本文功效更高。 - 真实数据例子：大概率使用宏观经济或金融时间序列（如 GDP 增长率、股票收益率、汇率），检验协方差平稳性是否成立，展示方差突变或协方差漂移的检测。例子想说明：在真实数据（非线性反馈与随机波动率常见）中，本文方法能检测出参数化检验遗漏的协方差结构变化。

🔎 结论是否比证明窄：需查全文确认以下点： - 作者是否在一般正交基的条件下严格证明了所有定理，还是仅在 Haar 与 Walsh 两个特例上给出了完整证明，一般基的证明仅是 sketch？若一般基的证明依赖"正交基满足某衰减条件"而未验证哪些常见基满足，则结论可能比证明窄。 - 功效一致性的条件 \(\sup_{t,h} |\gamma_t(h) - \gamma(h)| \ge c_T\) 中，\(c_T\) 的具体衰减率是否在定理中明确给出，还是仅在推论中 claim "能检测微弱偏离"而未量化？若未量化，则 claim 比证明窄。

四、开放问题（点到为止，扎根具体语句）¶

正交基的最优选择问题：本文允许一般正交基，但未给出在不同偏离类型（局部突变 vs. 全局漂移）下选择最优基的准则。扎根点：引言中提到 "Haar wavelet and Walsh functions" 的特例，但未讨论选择基的统计决策问题——这引出一个 minimax 检验问题：在给定偏离类下，哪组正交基使 max-correlation 检验的功效下界最高？
增长率 \(H_T\) 与 \(K_T\) 的精确上限：本文实现了更高的可行增长率，但未给出 \(H_T K_T\) 的精确相变点（即检验失效的临界增长率）。扎根点：定理中 \(H_T K_T / T \to 0\) 的条件，是否可改进为 \(H_T K_T / T^{1/2}\) 或更精确的阶？这涉及高维极值统计量的相变界。
计算复杂度与高阶 U-统计量的连接：max-correlation 统计量涉及 \(H_T \times K_T\) 个子样本协方差差的计算，当 \(H_T\) 与 \(K_T\) 较大时，计算成本是否可通过 tensor contraction / einsum 优化？扎根点：本文未讨论计算复杂度，而研究者熟悉高阶 U-统计量的 einsum 复杂度——可探索将 \(D_{k,T}(h)\) 的计算重构为 tensor contraction 以降低计算阶。
与其他非参数平稳性检验的对比：本文未与谱密度突变检验或 CUSUM 类检验在相同非线性设定下做理论功效对比。扎根点：引言中淡化谱方法，但未给出功效界的直接比较——可查近期 5 篇谱突变检验的 intro，看是否指向"非线性下谱检验失效"的共识，若共识存在则本文填补真 gap，若共识不存在则需重新定位。

Maintained by 陈星宇 · Homepage · Source on GitHub

A bootstrapped test of covariance stationarity based on orthonormal transformations¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论