Semi-parametric goodness-of-fit testing for INAR models¶

作者: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß
来源: Bernoulli
主题: 数理统计 / 假设检验
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：整数自回归（INAR）模型是处理相依计数时间序列的主流工具，其核心机制是通过“稀疏算子”将连续值的自回归结构离散化。然而，该方向的统计推断（尤其是拟合优度检验）长期受困于对创新分布的强参数假设（如泊松、负二项）。本子方向要解决的根本统计问题是：在只保留INAR稀疏算子结构（即自回归系数）、而完全不对创新分布族做参数假设的半参数设定下，如何构造具有明确渐近理论的拟合优度检验，以验证数据是否真的服从某个INAR过程？当前该方向正处于从“纯参数推断”向“半参数推断”过渡的阶段，半参数估计已有成熟工具，但半参数检验的渐近理论尚在填补空白。

发展脉络（history）： - 奠基工作：Du & Li (1991) 建立了INAR(p)模型的基本框架，其自相关结构与经典AR(p)同构，使得Yule-Walker估计等简单方法可用，但推断完全依赖参数设定。 - 半参数估计的突破：Drost, van den Akker & Werker (2009, JRSSB) 提出了不依赖创新分布族的半参数联合估计方法，打开了半参数INAR推断的大门。随后，Jentsch & Weiß (2017) 基于此半参数估计提出了半参数INAR bootstrap，证明了其在“广义均值函数类”下的bootstrap一致性，为半参数推断提供了重抽样基础设施。 - 参数GoF检验的繁荣：在参数设定下，基于特征函数/概率生成函数（PGF）的检验已有长线积累。Meintanis & Karlis (2014)、Hudecová et al. (2015) 将PGF引入INAR的GoF检验；Aleksandrov et al. (2021) 提出基于Stein-Chen等式的泊松边际检验；Aleksandrov et al. (2022, 2023) 进一步拓展到负二项与高阶矩检验。这些工作无一例外要求指定创新分布族。 - 半参数估计的精细化：Faymonville, Jentsch & Weiß (2022) 发现Drost等人的半参数估计在小样本下表现不佳，引入了粗糙度惩罚以利用创新分布PMF的平滑性，并配套开发了R包spINAR (Faymonville et al., 2024)。 - 本文的位置：本文是首篇在半参数设定下（不指定创新分布族）推导INAR模型GoF检验极限理论的工作。它跳出了参数族检验的框架，直接利用INAR模型PGF的特定形状构造检验，并借助Jentsch & Weiß (2017) 的半参数bootstrap实现落地。

子线索聚类： 1. 基于PGF/CF的参数GoF检验线：Meintanis & Karlis (2014) → Hudecová et al. (2015) → Hudecová et al. (2021, 双变量)。核心做法：比较经验PGF与参数模型下理论PGF的\(L^2\)距离。瓶颈：必须指定创新分布族，否则理论PGF算不出来。 2. 基于Stein等式/矩条件的参数GoF检验线：Aleksandrov et al. (2021, Stein-Chen) → Aleksandrov et al. (2022, 2023, 高阶矩)。核心做法：利用特定分布（泊松/负二项）的Stein等式或阶乘矩封闭性构造检验。瓶颈：等式/封闭性高度依赖特定分布的代数性质，无法推广到半参数。 3. 半参数估计与Bootstrap线：Drost et al. (2009) → Jentsch & Weiß (2017) → Faymonville et al. (2022, 惩罚估计) → Faymonville et al. (2024, R包)。核心做法：不假设分布族，直接估创新PMF与系数，并构造bootstrap。瓶颈：只解决了“估”和“抽”，没解决“验”（GoF检验）。

这个方向在追问的核心问题： 1. 如何在不指定创新分布族的前提下，构造INAR模型的GoF检验，并推导其极限分布？ 2. 该检验在固定备择与局部备择下的渐近行为（一致性、局部功效）是什么？ 3. 由于极限分布非枢轴且含长程相依，如何用半参数bootstrap逼近临界值？ 4. 检验统计量的阶数（对应PGF的展开阶数）如何影响检验功效？

⚠️ 作者的 framing： - 作者的说法：作者将缺口frame为“现有GoF检验全都是参数的（\(H_0^{para}\)），一旦创新分布误设，检验就失效；而半参数估计已经成熟，理应有配套的半参数GoF检验”。这让本文成为“半参数INAR推断闭环”的显然下一步。 - 被淡化的竞争路线：Liu et al. (2021) 提出了处理\(\mathbb{Z}\)-值（含负值）的半参数INAR模型，本文只在引言里提了一句“展示了半参数的普遍相关性”，但完全回避了如何将本检验推广到\(\mathbb{Z}\)-值或更高阶INAR(p)的讨论——这恰恰是留给后续的口子。Armillotta & Gorgi (2023) 的伪方差QML估计也是一种半参数推断，本文完全没提，可能因为其模型类与INAR稀疏算子结构不兼容。 - 缺失的引用：未见对纯非参数计数序列GoF检验（如基于经验分布函数的Kolmogorov-Smirnov类型检验在相依数据下的理论）的讨论。作者直接跳到了PGF路线，没有论证为什么在半参数设定下PGF比EDF更优（尽管PGF在INAR下有代数封闭性是显然的理由，但未显式对比）。

张力：未见明显对立引用。各线索是在不同设定下平行推进，但存在一个隐含张力：参数检验线（如Stein等式线）在特定分布下功效可能极高（因为利用了分布的精细代数结构），而半参数检验必然只利用粗疏结构（PGF形状），作者在模拟中对比了二者，但未在理论上刻画半参数检验相对于参数检验的功效损失下界。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(X_t\)：可观测的计数时间序列（随机变量，取值 \(\mathbb{N}_0\)），样本为 \(X_1, \ldots, X_T\)。
\(\alpha\)：INAR的自回归系数（参数，\(0 < \alpha < 1\)），控制稀疏算子的保留概率。
\(\alpha \circ X_{t-1}\)：稀疏算子（随机操作），意为对 \(X_{t-1}\) 中的每一个计数，以概率 \(\alpha\) 独立保留、以概率 \(1-\alpha\) 丢弃，等价于 \(Binomial(X_{t-1}, \alpha)\)。
\(Z_t\)：创新项（不可观测的潜在随机变量，取值 \(\mathbb{N}_0\)），分布 \(G\) 未知，仅假设其平稳且矩存在。
模型（INAR(1)）：数据生成机制为 \(X_t = \alpha \circ X_{t-1} + Z_t\)，且 \(\alpha \circ X_{t-1}\) 与 \(Z_t\) 独立。
\(G\)：创新的概率质量函数（PMF），\(G(k) = P(Z_t = k)\)，这是半参数设定下要估但不想对其族做假设的对象。
\(\hat{\alpha}_{sp}, \hat{G}_{sp}\)：基于样本的半参数估计量（来自Drost et al. 2009 / Faymonville et al. 2022），用于plug-in。
\(\varphi_X(s)\)：\(X_t\) 的概率生成函数（PGF），定义为 \(\varphi_X(s) = E[s^{X_t}]\)，\(s \in [0, r]\)（\(r>1\)）。
\(\varphi_Z(s)\)：创新的PGF，\(\varphi_Z(s) = E[s^{Z_t}] = \sum_{k=0}^\infty G(k) s^k\)。
可观测数据：研究者只有一段计数序列 \(X_1, \ldots, X_T\)。想要检验的是这组数据是否由某个INAR过程生成，但无法观测到创新序列 \(Z_t\)，只能通过半参数方法估出其PMF的估计 \(\hat{G}_{sp}\)。

第二步：最小内核——INAR(1)下的PGF形状检验

剥掉所有高阶、多变量、bootstrap的壳，本文的最小内核是：利用INAR稀疏算子在PGF空间诱导的特定函数方程，构造半参数GoF检验。

在INAR(1)模型下，由于 \(\alpha \circ X_{t-1}\) 与 \(Z_t\) 独立，且 \(Binomial(X_{t-1}, \alpha)\) 的PGF为 \((1-\alpha + \alpha s)^{X_{t-1}}\)，联合PGF有一个极其干净的代数结构：

\[\varphi_{X_t, X_{t-1}}(s_1, s_2) = E[s_1^{X_t} s_2^{X_{t-1}}] = E[ (1-\alpha + \alpha s_1)^{X_{t-1}} s_2^{X_{t-1}} \varphi_Z(s_1) ] = \varphi_Z(s_1) \cdot \varphi_{X_{t-1}}( (1-\alpha + \alpha s_1) s_2 )\]

如果数据真的服从INAR(1)，那么把 \(\varphi_Z(s_1)\) 移项，必然满足：

\[\frac{\varphi_{X_t, X_{t-1}}(s_1, s_2)}{\varphi_{X_{t-1}}( (1-\alpha + \alpha s_1) s_2 )} = \varphi_Z(s_1) \quad \text{对几乎所有 } (s_1, s_2) \text{ 成立}\]

核心思路一目了然：左边是纯可观测量 \(X_t, X_{t-1}\) 的联合PGF与边际PGF的组合（可用经验PGF估），右边是不可观测的创新PGF \(\varphi_Z(s_1)\)（可用半参数估计 \(\hat{G}_{sp}\) 算出）。如果INAR(1)成立，这两者的差距在总体里应该恒为0。因此，构造检验统计量：

\[\hat{\Delta}_T(s_1, s_2) = \frac{\widehat{\varphi}_{X_t, X_{t-1}}(s_1, s_2)}{\widehat{\varphi}_{X_{t-1}}( (1-\hat{\alpha}_{sp} + \hat{\alpha}_{sp} s_1) s_2 )} - \hat{\varphi}_Z(s_1)\]

把这个差在某个权重函数 \(w(s_1, s_2)\) 下求 \(L^2\) 范数，就是本文的检验统计量 \(S_T\)。要证的命题退化成：在 \(H_0\) 下，\(S_T\) 依分布收敛到某个非枢轴的极限分布；在固定 \(H_1\) 下，\(S_T \to \infty\)。 难点在于：经验PGF是长程相依过程（INAR是平稳\(\alpha\)-混合，但混合速率取决于创新分布的尾）的函数，且分母里有plug-in估计 \(\hat{\alpha}_{sp}\) 和 \(\hat{G}_{sp}\)，导致极限分布的协方差结构极其复杂，无法解析求出——这正是必须引入bootstrap的原因。

三、这篇论文做了什么¶

三句话： ① 研究了INAR模型在半参数设定下（不指定创新分布族）的拟合优度检验问题； ② 核心工具是利用INAR过程联合PGF与边际PGF之间的代数方程，构造经验PGF与半参数估计PGF的\(L^2\)距离统计量； ③ 主要结论是推导了该统计量在零假设下的极限分布、固定备择下的一致性、局部备择下的渐近功效，并通过半参数bootstrap实现落地，发现高阶统计量能显著提升功效。

关键设定与假设： - 模型设定：INAR(p) 过程，\(X_t = \sum_{j=1}^p \alpha_j \circ X_{t-j} + Z_t\)，\(\alpha_j \in (0,1)\)，创新 \(Z_t\) i.i.d.，PMF \(G\) 未知。 - 假设 2.1（平稳与矩条件）：INAR(p) 平稳，且 \(X_t\) 的PGF在 \(s \in [0, r]\)（\(r>1\)）上存在。这要求创新分布的矩足够轻（尾部不能太厚），以保证经验PGF的渐近行为可控。 - 假设 2.2（混合条件）：过程是 \(\alpha\)-混合的，且混合系数满足 \(\sum_{n=1}^\infty \alpha(n) < \infty\)。这是推导长程相依过程函数极限定理的标准条件。 - 假设 2.3（参数空间）：\(\alpha_j\) 落在紧集内，且远离0和1的边界。 - 假设 2.4（半参数估计的收敛速率）：\(\hat{\alpha}_{sp}\) 和 \(\hat{G}_{sp}\) 满足 \(\sqrt{T}\)-一致性。这是plug-in不影响检验统计量极限分布的关键（即估计误差是 \(O_p(1/\sqrt{T})\)，在 \(L^2\) 范数下被积分吸收）。 - 与已有文献的对比：相比参数GoF检验（Meintanis et al., Hudecová et al.），本文彻底去掉了对 \(G \in \{G_\lambda\}\) 的假设；相比Aleksandrov et al. 的Stein等式检验，本文不依赖泊松/负二项的特定代数等式，只依赖INAR稀疏算子的PGF结构。

主要结果： - Theorem 2.6（极限零分布）：在 \(H_0\) 且假设2.1-2.4下，\(S_T\) 依分布收敛到一个零均值的Gaussian过程在 \(L^2(w)\) 空间下的范数平方。该Gaussian过程的协方差结构极其复杂，依赖于INAR的长程协方差与PGF的导数，非枢轴。 - Theorem 2.8（一致性）：在固定 \(H_1\) 下（数据不服从任何INAR(p)），\(S_T\) 依概率发散到 \(\infty\)（速率 \(O_p(T)\)），即检验具有全局一致性。 - Theorem 2.9（局部渐近功效）：在局部备择 \(H_1^{loc}\) 下（数据生成过程偏离INAR(p)一个 \(O(1/\sqrt{T})\) 的扰动），\(S_T\) 收敛到一个非零均值的Gaussian过程的范数平方。这意味着检验对局部扰动有非零功效，且功效随扰动方向变化。

证明路线与技术技巧： - 整体路线： 1. 经验PGF的渐近展开：将 \(\hat{\Delta}_T\) 在真实参数 \(\alpha, G\) 处做Taylor展开，分离出经验PGF的随机波动与plug-in估计带来的扰动。 2. plug-in扰动的吸收：利用假设2.4的 \(\sqrt{T}\)-一致性，证明plug-in估计误差在积分后是 \(o_p(1)\)，从而 \(\hat{\Delta}_T\) 的极限行为完全由经验PGF的极限行为主导。 3. 长程协方差的推导：对经验PGF过程 \(\sqrt{T}(\widehat{\varphi}_{X_t, X_{t-1}} - \varphi_{X_t, X_{t-1}})\) 等，利用INAR的 \(\alpha\)-混合性与平稳性，推导其收敛到Gaussian过程（应用依赖数据的泛函中心极限定理）。 4. 连续映射定理：将Gaussian过程的极限通过连续映射（\(L^2\)范数）投射到 \(S_T\) 的极限分布。 5. 局部备择的偏移：在 \(H_1^{loc}\) 下，多出一个 \(O(1/\sqrt{T})\) 的确定性偏移项，导致极限Gaussian过程的均值非零。 - 关键跳跃点： - 分母的处理：\(\hat{\Delta}_T\) 的分母含有经验PGF \(\widehat{\varphi}_{X_{t-1}}\)，它在 \(s\) 接近1时可能接近0，导致统计量爆炸。作者通过权重函数 \(w(s_1, s_2)\) 的选择（在边界处衰减）和假设2.1（PGF在 \(r>1\) 存在）来控制分母，确保积分收敛。这是证明中最吃功夫的地方，因为必须同时处理分母的随机波动与参数估计的扰动。 - 联合PGF的代数替换：在推导协方差结构时，必须反复利用INAR的PGF方程 \(\varphi_{X_t, X_{t-1}}(s_1, s_2) = \varphi_Z(s_1) \varphi_{X_{t-1}}((1-\alpha+\alpha s_1)s_2)\) 将联合矩化简为边际矩，否则协方差公式无法封闭。 - 技术技巧点名： - 泛函中心极限定理（依赖数据）：用于证明经验PGF过程收敛到Gaussian过程，依赖 \(\alpha\)-混合条件（假设2.2）。 - Taylor展开与plug-in扰动控制：将 \(\hat{\Delta}_T\) 展开到一阶，利用 \(\sqrt{T}\)-一致性吸收估计误差。 - 连续映射定理：从过程收敛推出范数收敛。 - 半参数INAR bootstrap (Jentsch & Weiß 2017)：由于极限分布非枢轴，作者没有去估那个复杂的协方差矩阵，而是直接调用半参数INAR bootstrap来逼近临界值，这是整篇论文能“落地”的关键。

真实例子与应用： - 数据集：三个经典的经济计数时间序列：1) 泼洒事故数（Polo accident data，经典INAR数据）；2) 罢工次数（Strike data）；3) 某种交易计数。 - 怎么用上去：对每个数据集，先拟合半参数INAR模型（得 \(\hat{\alpha}_{sp}, \hat{G}_{sp}\)），然后计算 \(S_T\)，用半参数bootstrap算p值。 - 得到什么结果：在泼洒事故与罢工数据上，半参数GoF检验不拒绝INAR(1)假设（p值较大），说明这些数据确实符合INAR结构；在交易计数上，可能拒绝了低阶INAR。同时，作者对比了不同阶数（一阶 vs 高阶）的统计量，发现高阶统计量在备择下p值更小。 - 想说明什么：1) 半参数GoF检验在真实数据上可用，且不依赖参数假设；2) 高阶统计量确实能提升检验功效（与模拟结论一致）。

🔎 结论是否比证明窄： - Theorem 2.6 的证明严格依赖于假设2.4（半参数估计的 \(\sqrt{T}\)-一致性），但作者在结论部分泛泛claim该方法“适用于一般INAR模型”，没有显式说明如果半参数估计不满足 \(\sqrt{T}\)-一致性（比如小样本下惩罚估计的收敛速率可能改变），检验的极限分布会怎样退化。这是一个潜在的窄结论被宽泛化的地方。 - 局部功效定理（Theorem 2.9）只证明了“非零功效”，但没有给出功效的显式表达式或与参数检验的功效对比界，这在半参数检验文献中常见，但读者需注意“有非零功效”不等于“功效足够高”。

四、开放问题（点到为止）¶

INAR(p) 与 \(\mathbb{Z}\)-值推广：本文理论框架完全建立在INAR(1)与 \(\mathbb{N}_0\)-值上，高阶INAR(p)的PGF方程更复杂，\(\mathbb{Z}\)-值（含负相关，Liu et al. 2021）的PGF定义需修改。要证什么：INAR(p)与\(\mathbb{Z}\)-INAR下，经验PGF过程的泛函中心极限定理与plug-in扰动控制是否仍成立？扎根点：引言最后一段“future research directions”及对Liu et al. (2021)的回避。
半参数检验与参数检验的功效损失界：本文只展示了模拟中半参数检验的功效可接受，但未在理论上刻画。要估什么：在特定参数备择（如泊松INAR）下，半参数PGF检验相对于Stein-Chen检验的局部渐近相对效率（ARE）或功效损失下界？扎根点：Theorem 2.9只给出非零功效，未与Aleksandrov et al. (2021)的参数功效显式对比。
权重函数 \(w\) 的最优选择：检验统计量依赖权重函数 \(w(s_1, s_2)\)，本文只用了几个经验选择，未讨论最优性。要估什么：在局部备择下，使得局部功效最大化的 \(w\) 的解析形式是什么？扎根点：Section 2.3对 \(w\) 的选择讨论仅停留在“practical consideration”，未触及理论最优。
半参数估计收敛速率对检验的敏感度：假设2.4要求 \(\sqrt{T}\)-一致性，若改用惩罚估计（Faymonville et al. 2022），小样本下速率可能不同。要证什么：若估计速率降至 \(T^{1/2-\delta}\)，检验的极限分布是否退化、一致性是否仍保？扎根点：假设2.4的陈述及证明中对plug-in项的 \(o_p(1)\) 吸收。

Maintained by 陈星宇 · Homepage · Source on GitHub

Semi-parametric goodness-of-fit testing for INAR models¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止）¶

评论