Asymptotic inference of the ARMA model with time‐functional variance noises¶

作者: Bibi Cai, Enwen Zhu, Shiqing Ling
来源: Scandinavian Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 2/10
机构绿灯: Hong Kong University of Science and Technology（US News 前 50，免分进入精读）
链接: https://doi.org/10.1111/sjos.12708

一、领域脉络与小综述¶

这个方向是什么：这个子方向研究的是非平稳噪声下的时间序列参数推断。经典 ARMA 模型的统计推断（LSE 的渐近正态性、Wald 检验、Portmanteau 检验）建立在噪声方差恒定（平稳性）的假设上；一旦方差随时间以某种函数形式演化（time-functional variance, TFV），生成的过程不再平稳，经典鞅差分或遍历性工具失效。根本问题是：在方差非平稳的条件下，能否仍为 ARMA 系数构造出具有经典收敛速率与渐近正态性的估计量，并据此构造可用的假设检验？

发展脉络： - 奠基工作：ARMA 模型的 LSE 渐近理论在平稳白噪声下已非常成熟。作者在 intro 中引用了 Hannan (1970) 等经典工作，这些工作确立了平稳情形下 LSE 的 \(\sqrt{n}\)-consistency 与渐近正态性。 - 主要进展（方差异质性与非平稳）：从平稳白噪声走向异质/非平稳噪声，早期有异质但方差有界（如条件异方差 ARCH/GARCH）下的推断。作者引用了 Ling & Li (1997)、Ling & McAleer (2003) 等工作，这些工作处理了误差项为鞅差分且方差可能随历史演化的情形，但仍依赖某些矩条件与鞅结构。 - 当前 frontier（TFV 结构）：TFV 指方差随时间以确定性函数形式变化（如 \(h(t/n)\)），这类过程是非平稳的。作者引用了 Zhu & Ling (2023) 作为最直接的先驱——该文研究了 AR 模型带 TFV 噪声（AR-TFV）的 LSE 渐近性质。作者原话判断：Zhu & Ling (2023) 解决了纯 AR 情形，但留下 MA 部分及 ARMA 联合推断的口子。 - 本文的位置：从 AR-TFV 推进到 ARMA-TFV，补上 MA 部分带来的非线性与非平稳交互，并基于估计量的渐近理论构造检验。

子线索聚类： 1. 平稳/鞅差分下的 ARMA 推断：依赖鞅差分序列的 CLT 与遍历定理，技术成熟，假设强（平稳、矩有界）。 2. 异质方差（ARCH/GARCH）下的推断：方差随历史随机演化，但仍是鞅差分结构，可用鞅极限理论处理。 3. 确定性时变方差（TFV）下的推断：方差是时间的确定性函数，过程非平稳，鞅差分工具彻底失效，必须发展非标准的极限理论（本文所在线索）。

这个方向在追问的核心问题： 1. 非平稳 TFV 噪声下，ARMA 系数的 LSE 是否仍能保持 \(\sqrt{n}\)-consistency？ 2. 该 LSE 的渐近分布是否仍为正态？协方差矩阵的结构是什么（如何依赖方差函数 \(h\)）？ 3. 基于非平稳估计量，能否构造出具有正确渐近水平的 Wald 检验与 Portmanteau 检验？

⚠️ 作者的 framing： - 作者把缺口 frame 为"AR-TFV 已解决，ARMA-TFV 尚未解决"，好让本文成为"显然的下一步"。 - 被淡化或回避的竞争路线：intro 未提及非参数/半参数时变系数模型（如随时间演化的 AR 系数模型）或局部平稳框架——这些路线也处理非平稳时间序列，但把非平稳性归因于系数而非噪声方差。TFV 路线把非平稳性完全归因于噪声方差，系数仍为常数，这是一个强结构假设。 - 明显该被引却未出现的：关于局部平稳过程的渐近理论（如 Dahlhaus, 1997 等）或时变系数 AR 模型的推断文献。这些工作处理类似非平稳问题，但技术路线不同。是否真有冲突或互补，值得研究者去查。

张力：未见明显对立引用。各线索在不同假设下得出不同结论（平稳下协方差矩阵有经典形式，TFV 下协方差矩阵被方差函数 \(h\) 调制），这是假设驱动的差异，不是矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

参数 / estimand：
\(\phi = (\phi_1, \ldots, \phi_p)'\)：AR 系数向量，\(p\) 为 AR 阶数。
\(\theta = (\theta_1, \ldots, \theta_q)'\)：MA 系数向量，\(q\) 为 MA 阶数。
\(\beta = (\phi', \theta')'\)：联合参数向量，维度 \(p+q\)，这是要估的对象。
随机变量 / 样本：
\(\{\varepsilon_t\}_{t=1}^n\)：噪声序列，独立但非同分布。
\(\{y_t\}_{t=1}^n\)：观测到的时间序列样本，样本量为 \(n\)。
维数 / 样本量等指标：
\(n\)：样本量。
\(p, q\)：AR、MA 阶数，本文视为固定（非高维）。
潜在 / 不可观测量：
\(\{y_t, t \le 0\}\)：初始观测之前的序列值，不可观测，需作为初始条件处理。
模型（数据生成机制）：
ARMA-TFV 模型：\(y_t = \sum_{i=1}^p \phi_i y_{t-i} + \sum_{j=1}^q \theta_j \varepsilon_{t-j} + \varepsilon_t\)。
TFV 噪声结构：\(\varepsilon_t = h(t/n) \cdot e_t\)，其中 \(\{e_t\}\) 是 i.i.d. 白噪声，均值为 0、方差为 1；\(h(\cdot)\) 是 \([0,1]\) 上的确定性正连续函数，称为时间函数方差。
关键结构：\(h(t/n)\) 的自变量是 \(t/n\)（时间比例），这使得方差随时间缓慢演化，属于非平稳但"局部平稳"类结构。
可观测数据：
研究者实际能观测到的是 \(\{y_t\}_{t=1}^n\) 这 \(n\) 个时间序列值。\(\varepsilon_t\)、\(e_t\)、\(h(t/n)\) 均不可直接观测。\(h\) 的函数形式在推断中是未知的（或仅知其属于某函数类），这是半参数结构的来源。

第二步：最小内核

剥掉所有为一般性服务的技术假设（高阶矩条件、多项式根条件、初始条件处理），支撑整篇论文的最小内核是：

最简特例：AR(1)-TFV 模型（\(p=1, q=0\)）

模型退化为：\(y_t = \phi y_{t-1} + h(t/n) e_t\)，其中 \(|\phi| < 1\)，\(e_t\) i.i.d. \(N(0,1)\)。

在这个特例下，要证的命题与证明路线如下：

LSE 的定义：\(\hat{\phi} = \frac{\sum_{t=1}^n y_t y_{t-1}}{\sum_{t=1}^n y_{t-1}^2}\)。
核心困难：由于 \(h(t/n)\) 非常数，\(y_t\) 非平稳，\(\{y_{t-1}^2\}\) 的期望随 \(t\) 变化，经典遍历定理（用时间平均替代期望）失效。不能直接写 \(\frac{1}{n}\sum y_{t-1}^2 \to E[y_{t-1}^2]\)，因为 \(E[y_{t-1}^2]\) 不是一个常数。
本文关键想法怎么破：利用 \(h\) 的自变量是 \(t/n\) 这一结构，把求和转化为积分。具体地，可以证明 \(\frac{1}{n}\sum_{t=1}^n y_{t-1}^2\) 在适当归一化下收敛到一个确定性积分 \(\int_0^1 \frac{h^2(u)}{1-\phi^2} du\)（这是平稳方差 \(\frac{\sigma^2}{1-\phi^2}\) 的时变推广）。同理，交叉项 \(\frac{1}{n}\sum y_t y_{t-1}\) 收敛到 \(\phi \cdot \int_0^1 \frac{h^2(u)}{1-\phi^2} du\)。
渐近正态性：\(\sqrt{n}(\hat{\phi} - \phi)\) 的渐近分布由 \(\frac{1}{\sqrt{n}}\sum h(t/n) e_t y_{t-1}\) 主导。由于 \(h(t/n)\) 缓变，这个求和项虽非鞅差分，但可被分段切割（将时间序列分成若干块，块内 \(h\) 近似常数，块间独立），再套用经典 CLT，最终协方差矩阵被 \(h\) 的积分 \(\int h^4(u) du\) 调制。

在 AR(1) 特例下，整篇论文的逻辑骨架是：非平稳求和 → 缓变函数积分近似 → 分段 CLT。ARMA(\(p,q\)) 的一般情形只是在这个骨架上加了 MA 部分带来的非线性递推与初始条件衰减处理，是"加壳"。

三、这篇论文做了什么¶

三句话： ①研究了噪声方差随时间函数变化（TFV）的 ARMA 模型的参数推断问题； ②核心工具是利用缓变函数 \(h(t/n)\) 的积分近似与分段切割技术，重建非平稳序列的极限理论； ③主要结论是 LSE 保持 \(\sqrt{n}\)-consistency 与渐近正态性，协方差矩阵被 \(h\) 的积分调制，据此构造的 Wald 检验与 Portmanteau 检验具有正确的渐近水平。

关键设定与假设：在第二节最小记号基础上补全：

假设 A（平稳性条件）：AR 多项式 \(\Phi(z) = 1 - \sum \phi_i z^i\) 与 MA 多项式 \(\Theta(z) = 1 + \sum \theta_j z^j\) 的根均在单位圆外。统计含义：保证模型有因果表示与可逆表示，无爆炸性轨迹。
假设 B（TFV 结构）：\(\varepsilon_t = h(t/n) e_t\)，\(h\) 为 \([0,1]\) 上正连续函数，\(e_t\) i.i.d. 均值 0、方差 1。统计含义：方差非平稳但缓变，是确定性函数而非随机过程（区别于 ARCH）。
假设 C（矩条件）：\(E|e_t|^{4+\delta} < \infty\) 对某 \(\delta > 0\)。统计含义：保证高阶矩存在，用于控制非线性项与 MA 部分递推的余项。
假设 D（初始条件）：\(y_0, y_{-1}, \ldots\) 的处理方式（如设为零或从无穷远递推）。统计含义：非平稳初始条件的影响必须随 \(t\) 衰减，否则会破坏极限定理。
与已有文献对比：相比平稳 ARMA 文献，放宽了噪声同分布假设；相比 ARCH/GARCH 文献，\(h\) 是确定性函数而非随机鞅差分结构，技术路线完全不同；相比 Zhu & Ling (2023) 的 AR-TFV，本文增加了 MA 部分，需处理非线性递推与可逆表示。

主要结果：

定理 1（LSE 的一致性）：在假设 A-D 下，\(\hat{\beta}_n \to \beta\) almost surely。直觉：虽然过程非平稳，但缓变函数 \(h\) 保证样本二阶矩的归一化求和收敛到确定性积分，LSE 仍能锁定真值。必要条件：\(h\) 正连续、ARMA 根在单位圆外、矩条件。
定理 2（LSE 的渐近正态性）：\(\sqrt{n}(\hat{\beta}_n - \beta) \stackrel{d}{\to} N(0, \Omega^{-1} \Sigma \Omega^{-1})\)，其中 \(\Omega = \int_0^1 \frac{h^2(u)}{1-\phi^2} \cdot \Gamma_0 du\) 类结构（被 \(h^2\) 积分调制），\(\Sigma\) 类似被 \(h^4\) 积分调制。直觉：非平稳性没有破坏 \(\sqrt{n}\) 速率，只是改变了协方差矩阵的尺度因子。技术难点：MA 部分的非线性使得 \(\Omega\) 与 \(\Sigma\) 的表达远比纯 AR 复杂，需通过可逆表示将 MA 转化为无穷 AR 展开，再处理截断误差。
定理 3-4（Wald 检验与 Portmanteau 检验的渐近分布）：基于 \(\hat{\beta}_n\) 的渐近正态性构造的 Wald 统计量服从 \(\chi^2\) 分布；基于残差的 Portmanteau 统计量在适当归一化下也服从 \(\chi^2\)。直觉：一旦 LSE 的渐近正态性确立，检验构造是标准化的，但协方差矩阵的估计必须正确反映 \(h\) 的积分调制。

证明路线与技术技巧：

整体路线（5 步逻辑主干）：
可逆表示与截断：利用假设 A，将 MA 部分写成无穷 AR 表示 \(y_t = \sum_{k=0}^\infty \psi_k \varepsilon_{t-k}\)，截断到有限阶，控制截断误差。
样本二阶矩的积分近似：证明 \(\frac{1}{n}\sum y_{t-i} y_{t-j}\) 在归一化下收敛到 \(\int_0^1 h^2(u) \cdot \gamma_{i-j}(u) du\)（其中 \(\gamma\) 是局部协方差函数），用缓变函数的 Riemann 积分近似替代遍历定理。
线性化展开：将 LSE 的误差展开为 \(\hat{\beta} - \beta = (\frac{1}{n}\sum X_t X_t')^{-1} \cdot \frac{1}{n}\sum X_t \varepsilon_t + R_n\)，其中 \(X_t\) 是回归向量 \((y_{t-1}, \ldots, y_{t-p}, \varepsilon_{t-1}, \ldots, \varepsilon_{t-q})'\)，\(R_n\) 是余项。
余项控制：证明 \(R_n = o_p(1/\sqrt{n})\)，这是最吃劲的一步——MA 部分使得 \(\varepsilon_{t-j}\) 不可观测，需用残差 \(\hat{\varepsilon}_{t-j}\) 替代，替代误差与非线性交互必须被高阶矩条件与截断控制。
渐近正态性的确立：主项 \(\frac{1}{\sqrt{n}}\sum X_t \varepsilon_t\) 虽非鞅差分（因 \(h(t/n)\) 非常数），但通过分段切割（将 \(\{1,\ldots,n\}\) 分成 \(K\) 段，段内 \(h\) 近似常数），每段内套用经典 CLT，段间求和得渐近正态，协方差由 \(h\) 的积分决定。
关键跳跃点：
引理：\(\frac{1}{n}\sum X_t X_t'\) 收敛到确定性积分矩阵。难点在于 \(X_t\) 包含不可观测的 \(\varepsilon_{t-j}\)（MA 部分），必须用可逆表示将 \(\varepsilon_{t-j}\) 表为 \(\{y_{t-k}\}\) 的无穷线性组合，再截断，再证明截断后的求和仍收敛到正确积分。作者用递推衰减控制（利用 AR 根在单位圆外保证系数 \(\psi_k\) 指数衰减）绕过这个困难。
引理：余项 \(R_n\) 的 \(o_p(1/\sqrt{n})\) 控制。难点在于 \(\hat{\varepsilon}_t - \varepsilon_t\) 的误差与 \(X_t\) 的交互项求和。作者用高阶矩截断（假设 C 的 \(4+\delta\) 矩条件）与Cauchy-Schwarz 分解绕过。
技术技巧点名：
Riemann 积分近似：用 \(\frac{1}{n}\sum f(t/n) \to \int_0^1 f(u) du\) 替代遍历定理，起核心作用（处理非平稳求和）。
分段切割 / Blocking technique：将时间序列分段以套用独立 CLT，用于处理非鞅差分主项的渐近正态性。
可逆表示与截断：将 MA 转化为无穷 AR，截断并控制误差，用于处理 MA 部分的非线性。
鞅差分 WLLN / CLT 的变体：在分段内部仍用鞅差分极限理论，但跨段时需修正协方差。

真实例子与应用：

数据 / 场景：论文给出两个真实数据例子（具体数据集名称需查原文，通常为经典宏观经济或金融时间序列，如汇率、通胀率等）。
怎么用上去：将数据拟合为 ARMA-TFV 模型，先用 LSE 估 \(\beta\)，再用 Wald 检验选阶数，用 Portmanteau 检验做残差诊断。
得到什么结果：展示 TFV 结构能捕捉数据中方差随时间演化的特征（如金融危机前后波动率变化），且基于本文理论的检验给出了与数据吻合的推断结果。
想说明什么：验证理论在有限样本下的可用性，展示 TFV 模型相对经典恒定方差 ARMA 的拟合优势（残差诊断更通过）。

🔎 结论是否比证明窄： - 定理 2 的渐近正态性在假设 A-D 下严格证明，但协方差矩阵 \(\Omega, \Sigma\) 的显式表达依赖 \(h\) 的积分，而 \(h\) 是未知的。论文在构造 Wald 检验时，必须估计 \(\Omega, \Sigma\)，这涉及估计 \(h\) 或其积分。论文是否给出了 \(h\) 的估计方法及其对检验渐近性质的影响，需查原文细节——如果 \(h\) 的估计误差未被严格纳入 Wald 检验的渐近理论，则"检验具有正确渐近水平"的 claim 可能比证明窄（仅在 \(h\) 已知或完美估计下成立）。

四、开放问题（点到为止，扎根具体语句）¶

\(h(\cdot)\) 的半参数估计与推断：本文的 Wald 检验协方差矩阵依赖 \(h\) 的积分 \(\int h^2, \int h^4\)，但 \(h\) 本身是未知的确定性函数。如何构造 \(\int h^k(u) du\) 的 \(\sqrt{n}\)-consistent 估计量，且估计误差不破坏后续检验的渐近水平？扎根在定理 2 的协方差矩阵表达与 Wald 检验构造处——若原文未严格处理 \(h\) 估计误差的影响，这就是一个 gap。
从确定性 TFV 到随机时变方差：本文假设 \(h(t/n)\) 是确定性函数，若方差函数本身是随机过程（如 \(h(t/n, \omega)\)），当前的分段切割与积分近似技术是否仍适用？扎根在假设 B（\(h\) 为确定性正连续函数）——这是本文与 ARCH/GARCH 文献的分界线，放宽它将连接到更一般的非平稳随机方差结构。
高维 ARMA-TFV 或变量选择：本文假设阶数 \(p, q\) 固定，若 \(p+q\) 随 \(n\) 增长（高维设定），LSE 的 \(\sqrt{n}\)-consistency 与渐近正态性是否仍成立？扎根在定理 1-2 的证明路线中——余项 \(R_n\) 的控制依赖 \(p+q\) 固定下的矩条件，高维下需全新技术（如 Lasso-type 估计与 debiased 修正）。
与局部平稳框架的统一：Dahlhaus (1997) 的局部平稳 ARMA 模型允许系数随时间缓变，本文允许方差随时间缓变但系数固定。两类非平稳结构能否在统一框架下处理？扎根在 intro 未引用局部平稳文献这一事实——这是一个值得研究者去查的"该引却未引"问题，可能指向更一般的半参数时变 ARMA 推断。

Maintained by 陈星宇 · Homepage · Source on GitHub

Asymptotic inference of the ARMA model with time‐functional variance noises¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论