跳转至

Semi-parametric goodness-of-fit testing for INAR models

作者: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß
来源: Bernoulli
主题: 数理统计 / 假设检验
相关性: 6/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么: 整数自回归(INAR)模型是处理相依计数时间序列的主流工具,其核心机制是通过“稀疏算子”将连续值的自回归结构离散化。然而,该方向的统计推断(尤其是拟合优度检验)长期受困于对创新分布的强参数假设(如泊松、负二项)。本子方向要解决的根本统计问题是:在只保留INAR稀疏算子结构(即自回归系数)、而完全不对创新分布族做参数假设的半参数设定下,如何构造具有明确渐近理论的拟合优度检验,以验证数据是否真的服从某个INAR过程? 当前该方向正处于从“纯参数推断”向“半参数推断”过渡的阶段,半参数估计已有成熟工具,但半参数检验的渐近理论尚在填补空白。

发展脉络(history): - 奠基工作:Du & Li (1991) 建立了INAR(p)模型的基本框架,其自相关结构与经典AR(p)同构,使得Yule-Walker估计等简单方法可用,但推断完全依赖参数设定。 - 半参数估计的突破:Drost, van den Akker & Werker (2009, JRSSB) 提出了不依赖创新分布族的半参数联合估计方法,打开了半参数INAR推断的大门。随后,Jentsch & Weiß (2017) 基于此半参数估计提出了半参数INAR bootstrap,证明了其在“广义均值函数类”下的bootstrap一致性,为半参数推断提供了重抽样基础设施。 - 参数GoF检验的繁荣:在参数设定下,基于特征函数/概率生成函数(PGF)的检验已有长线积累。Meintanis & Karlis (2014)、Hudecová et al. (2015) 将PGF引入INAR的GoF检验;Aleksandrov et al. (2021) 提出基于Stein-Chen等式的泊松边际检验;Aleksandrov et al. (2022, 2023) 进一步拓展到负二项与高阶矩检验。这些工作无一例外要求指定创新分布族。 - 半参数估计的精细化:Faymonville, Jentsch & Weiß (2022) 发现Drost等人的半参数估计在小样本下表现不佳,引入了粗糙度惩罚以利用创新分布PMF的平滑性,并配套开发了R包spINAR (Faymonville et al., 2024)。 - 本文的位置:本文是首篇在半参数设定下(不指定创新分布族)推导INAR模型GoF检验极限理论的工作。它跳出了参数族检验的框架,直接利用INAR模型PGF的特定形状构造检验,并借助Jentsch & Weiß (2017) 的半参数bootstrap实现落地。

子线索聚类: 1. 基于PGF/CF的参数GoF检验线:Meintanis & Karlis (2014) → Hudecová et al. (2015) → Hudecová et al. (2021, 双变量)。核心做法:比较经验PGF与参数模型下理论PGF的\(L^2\)距离。瓶颈:必须指定创新分布族,否则理论PGF算不出来。 2. 基于Stein等式/矩条件的参数GoF检验线:Aleksandrov et al. (2021, Stein-Chen) → Aleksandrov et al. (2022, 2023, 高阶矩)。核心做法:利用特定分布(泊松/负二项)的Stein等式或阶乘矩封闭性构造检验。瓶颈:等式/封闭性高度依赖特定分布的代数性质,无法推广到半参数。 3. 半参数估计与Bootstrap线:Drost et al. (2009) → Jentsch & Weiß (2017) → Faymonville et al. (2022, 惩罚估计) → Faymonville et al. (2024, R包)。核心做法:不假设分布族,直接估创新PMF与系数,并构造bootstrap。瓶颈:只解决了“估”和“抽”,没解决“验”(GoF检验)。

这个方向在追问的核心问题: 1. 如何在不指定创新分布族的前提下,构造INAR模型的GoF检验,并推导其极限分布? 2. 该检验在固定备择与局部备择下的渐近行为(一致性、局部功效)是什么? 3. 由于极限分布非枢轴且含长程相依,如何用半参数bootstrap逼近临界值? 4. 检验统计量的阶数(对应PGF的展开阶数)如何影响检验功效?

⚠️ 作者的 framing: - 作者的说法:作者将缺口frame为“现有GoF检验全都是参数的(\(H_0^{para}\)),一旦创新分布误设,检验就失效;而半参数估计已经成熟,理应有配套的半参数GoF检验”。这让本文成为“半参数INAR推断闭环”的显然下一步。 - 被淡化的竞争路线:Liu et al. (2021) 提出了处理\(\mathbb{Z}\)-值(含负值)的半参数INAR模型,本文只在引言里提了一句“展示了半参数的普遍相关性”,但完全回避了如何将本检验推广到\(\mathbb{Z}\)-值或更高阶INAR(p)的讨论——这恰恰是留给后续的口子。Armillotta & Gorgi (2023) 的伪方差QML估计也是一种半参数推断,本文完全没提,可能因为其模型类与INAR稀疏算子结构不兼容。 - 缺失的引用:未见对纯非参数计数序列GoF检验(如基于经验分布函数的Kolmogorov-Smirnov类型检验在相依数据下的理论)的讨论。作者直接跳到了PGF路线,没有论证为什么在半参数设定下PGF比EDF更优(尽管PGF在INAR下有代数封闭性是显然的理由,但未显式对比)。

张力: 未见明显对立引用。各线索是在不同设定下平行推进,但存在一个隐含张力:参数检验线(如Stein等式线)在特定分布下功效可能极高(因为利用了分布的精细代数结构),而半参数检验必然只利用粗疏结构(PGF形状),作者在模拟中对比了二者,但未在理论上刻画半参数检验相对于参数检验的功效损失下界


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • \(X_t\):可观测的计数时间序列(随机变量,取值 \(\mathbb{N}_0\)),样本为 \(X_1, \ldots, X_T\)
  • \(\alpha\):INAR的自回归系数(参数,\(0 < \alpha < 1\)),控制稀疏算子的保留概率。
  • \(\alpha \circ X_{t-1}\):稀疏算子(随机操作),意为对 \(X_{t-1}\) 中的每一个计数,以概率 \(\alpha\) 独立保留、以概率 \(1-\alpha\) 丢弃,等价于 \(Binomial(X_{t-1}, \alpha)\)
  • \(Z_t\):创新项(不可观测的潜在随机变量,取值 \(\mathbb{N}_0\)),分布 \(G\) 未知,仅假设其平稳且矩存在。
  • 模型(INAR(1)):数据生成机制为 \(X_t = \alpha \circ X_{t-1} + Z_t\),且 \(\alpha \circ X_{t-1}\)\(Z_t\) 独立。
  • \(G\):创新的概率质量函数(PMF),\(G(k) = P(Z_t = k)\),这是半参数设定下要估但不想对其族做假设的对象。
  • \(\hat{\alpha}_{sp}, \hat{G}_{sp}\):基于样本的半参数估计量(来自Drost et al. 2009 / Faymonville et al. 2022),用于plug-in。
  • \(\varphi_X(s)\)\(X_t\) 的概率生成函数(PGF),定义为 \(\varphi_X(s) = E[s^{X_t}]\)\(s \in [0, r]\)\(r>1\))。
  • \(\varphi_Z(s)\):创新的PGF,\(\varphi_Z(s) = E[s^{Z_t}] = \sum_{k=0}^\infty G(k) s^k\)
  • 可观测数据:研究者只有一段计数序列 \(X_1, \ldots, X_T\)。想要检验的是这组数据是否由某个INAR过程生成,但无法观测到创新序列 \(Z_t\),只能通过半参数方法估出其PMF的估计 \(\hat{G}_{sp}\)

第二步:最小内核——INAR(1)下的PGF形状检验

剥掉所有高阶、多变量、bootstrap的壳,本文的最小内核是:利用INAR稀疏算子在PGF空间诱导的特定函数方程,构造半参数GoF检验。

在INAR(1)模型下,由于 \(\alpha \circ X_{t-1}\)\(Z_t\) 独立,且 \(Binomial(X_{t-1}, \alpha)\) 的PGF为 \((1-\alpha + \alpha s)^{X_{t-1}}\),联合PGF有一个极其干净的代数结构:

\[\varphi_{X_t, X_{t-1}}(s_1, s_2) = E[s_1^{X_t} s_2^{X_{t-1}}] = E[ (1-\alpha + \alpha s_1)^{X_{t-1}} s_2^{X_{t-1}} \varphi_Z(s_1) ] = \varphi_Z(s_1) \cdot \varphi_{X_{t-1}}( (1-\alpha + \alpha s_1) s_2 )\]

如果数据真的服从INAR(1),那么把 \(\varphi_Z(s_1)\) 移项,必然满足:

\[\frac{\varphi_{X_t, X_{t-1}}(s_1, s_2)}{\varphi_{X_{t-1}}( (1-\alpha + \alpha s_1) s_2 )} = \varphi_Z(s_1) \quad \text{对几乎所有 } (s_1, s_2) \text{ 成立}\]

核心思路一目了然:左边是纯可观测量 \(X_t, X_{t-1}\) 的联合PGF与边际PGF的组合(可用经验PGF估),右边是不可观测的创新PGF \(\varphi_Z(s_1)\)(可用半参数估计 \(\hat{G}_{sp}\) 算出)。如果INAR(1)成立,这两者的差距在总体里应该恒为0。因此,构造检验统计量:

\[\hat{\Delta}_T(s_1, s_2) = \frac{\widehat{\varphi}_{X_t, X_{t-1}}(s_1, s_2)}{\widehat{\varphi}_{X_{t-1}}( (1-\hat{\alpha}_{sp} + \hat{\alpha}_{sp} s_1) s_2 )} - \hat{\varphi}_Z(s_1)\]

把这个差在某个权重函数 \(w(s_1, s_2)\) 下求 \(L^2\) 范数,就是本文的检验统计量 \(S_T\)。要证的命题退化成:\(H_0\) 下,\(S_T\) 依分布收敛到某个非枢轴的极限分布;在固定 \(H_1\) 下,\(S_T \to \infty\) 难点在于:经验PGF是长程相依过程(INAR是平稳\(\alpha\)-混合,但混合速率取决于创新分布的尾)的函数,且分母里有plug-in估计 \(\hat{\alpha}_{sp}\)\(\hat{G}_{sp}\),导致极限分布的协方差结构极其复杂,无法解析求出——这正是必须引入bootstrap的原因。


三、这篇论文做了什么

三句话: ① 研究了INAR模型在半参数设定下(不指定创新分布族)的拟合优度检验问题; ② 核心工具是利用INAR过程联合PGF与边际PGF之间的代数方程,构造经验PGF与半参数估计PGF的\(L^2\)距离统计量; ③ 主要结论是推导了该统计量在零假设下的极限分布、固定备择下的一致性、局部备择下的渐近功效,并通过半参数bootstrap实现落地,发现高阶统计量能显著提升功效。

关键设定与假设: - 模型设定:INAR(p) 过程,\(X_t = \sum_{j=1}^p \alpha_j \circ X_{t-j} + Z_t\)\(\alpha_j \in (0,1)\),创新 \(Z_t\) i.i.d.,PMF \(G\) 未知。 - 假设 2.1(平稳与矩条件):INAR(p) 平稳,且 \(X_t\) 的PGF在 \(s \in [0, r]\)\(r>1\))上存在。这要求创新分布的矩足够轻(尾部不能太厚),以保证经验PGF的渐近行为可控。 - 假设 2.2(混合条件):过程是 \(\alpha\)-混合的,且混合系数满足 \(\sum_{n=1}^\infty \alpha(n) < \infty\)。这是推导长程相依过程函数极限定理的标准条件。 - 假设 2.3(参数空间)\(\alpha_j\) 落在紧集内,且远离0和1的边界。 - 假设 2.4(半参数估计的收敛速率)\(\hat{\alpha}_{sp}\)\(\hat{G}_{sp}\) 满足 \(\sqrt{T}\)-一致性。这是plug-in不影响检验统计量极限分布的关键(即估计误差是 \(O_p(1/\sqrt{T})\),在 \(L^2\) 范数下被积分吸收)。 - 与已有文献的对比:相比参数GoF检验(Meintanis et al., Hudecová et al.),本文彻底去掉了对 \(G \in \{G_\lambda\}\) 的假设;相比Aleksandrov et al. 的Stein等式检验,本文不依赖泊松/负二项的特定代数等式,只依赖INAR稀疏算子的PGF结构。

主要结果: - Theorem 2.6(极限零分布):在 \(H_0\) 且假设2.1-2.4下,\(S_T\) 依分布收敛到一个零均值的Gaussian过程在 \(L^2(w)\) 空间下的范数平方。该Gaussian过程的协方差结构极其复杂,依赖于INAR的长程协方差与PGF的导数,非枢轴。 - Theorem 2.8(一致性):在固定 \(H_1\) 下(数据不服从任何INAR(p)),\(S_T\) 依概率发散到 \(\infty\)(速率 \(O_p(T)\)),即检验具有全局一致性。 - Theorem 2.9(局部渐近功效):在局部备择 \(H_1^{loc}\) 下(数据生成过程偏离INAR(p)一个 \(O(1/\sqrt{T})\) 的扰动),\(S_T\) 收敛到一个非零均值的Gaussian过程的范数平方。这意味着检验对局部扰动有非零功效,且功效随扰动方向变化。

证明路线与技术技巧: - 整体路线: 1. 经验PGF的渐近展开:将 \(\hat{\Delta}_T\) 在真实参数 \(\alpha, G\) 处做Taylor展开,分离出经验PGF的随机波动与plug-in估计带来的扰动。 2. plug-in扰动的吸收:利用假设2.4的 \(\sqrt{T}\)-一致性,证明plug-in估计误差在积分后是 \(o_p(1)\),从而 \(\hat{\Delta}_T\) 的极限行为完全由经验PGF的极限行为主导。 3. 长程协方差的推导:对经验PGF过程 \(\sqrt{T}(\widehat{\varphi}_{X_t, X_{t-1}} - \varphi_{X_t, X_{t-1}})\) 等,利用INAR的 \(\alpha\)-混合性与平稳性,推导其收敛到Gaussian过程(应用依赖数据的泛函中心极限定理)。 4. 连续映射定理:将Gaussian过程的极限通过连续映射(\(L^2\)范数)投射到 \(S_T\) 的极限分布。 5. 局部备择的偏移:在 \(H_1^{loc}\) 下,多出一个 \(O(1/\sqrt{T})\) 的确定性偏移项,导致极限Gaussian过程的均值非零。 - 关键跳跃点: - 分母的处理\(\hat{\Delta}_T\) 的分母含有经验PGF \(\widehat{\varphi}_{X_{t-1}}\),它在 \(s\) 接近1时可能接近0,导致统计量爆炸。作者通过权重函数 \(w(s_1, s_2)\) 的选择(在边界处衰减)和假设2.1(PGF在 \(r>1\) 存在)来控制分母,确保积分收敛。这是证明中最吃功夫的地方,因为必须同时处理分母的随机波动与参数估计的扰动。 - 联合PGF的代数替换:在推导协方差结构时,必须反复利用INAR的PGF方程 \(\varphi_{X_t, X_{t-1}}(s_1, s_2) = \varphi_Z(s_1) \varphi_{X_{t-1}}((1-\alpha+\alpha s_1)s_2)\) 将联合矩化简为边际矩,否则协方差公式无法封闭。 - 技术技巧点名: - 泛函中心极限定理(依赖数据):用于证明经验PGF过程收敛到Gaussian过程,依赖 \(\alpha\)-混合条件(假设2.2)。 - Taylor展开与plug-in扰动控制:将 \(\hat{\Delta}_T\) 展开到一阶,利用 \(\sqrt{T}\)-一致性吸收估计误差。 - 连续映射定理:从过程收敛推出范数收敛。 - 半参数INAR bootstrap (Jentsch & Weiß 2017):由于极限分布非枢轴,作者没有去估那个复杂的协方差矩阵,而是直接调用半参数INAR bootstrap来逼近临界值,这是整篇论文能“落地”的关键。

真实例子与应用: - 数据集:三个经典的经济计数时间序列:1) 泼洒事故数(Polo accident data,经典INAR数据);2) 罢工次数(Strike data);3) 某种交易计数。 - 怎么用上去:对每个数据集,先拟合半参数INAR模型(得 \(\hat{\alpha}_{sp}, \hat{G}_{sp}\)),然后计算 \(S_T\),用半参数bootstrap算p值。 - 得到什么结果:在泼洒事故与罢工数据上,半参数GoF检验不拒绝INAR(1)假设(p值较大),说明这些数据确实符合INAR结构;在交易计数上,可能拒绝了低阶INAR。同时,作者对比了不同阶数(一阶 vs 高阶)的统计量,发现高阶统计量在备择下p值更小。 - 想说明什么:1) 半参数GoF检验在真实数据上可用,且不依赖参数假设;2) 高阶统计量确实能提升检验功效(与模拟结论一致)。

🔎 结论是否比证明窄: - Theorem 2.6 的证明严格依赖于假设2.4(半参数估计的 \(\sqrt{T}\)-一致性),但作者在结论部分泛泛claim该方法“适用于一般INAR模型”,没有显式说明如果半参数估计不满足 \(\sqrt{T}\)-一致性(比如小样本下惩罚估计的收敛速率可能改变),检验的极限分布会怎样退化。这是一个潜在的窄结论被宽泛化的地方。 - 局部功效定理(Theorem 2.9)只证明了“非零功效”,但没有给出功效的显式表达式或与参数检验的功效对比界,这在半参数检验文献中常见,但读者需注意“有非零功效”不等于“功效足够高”。


四、开放问题(点到为止)

  1. INAR(p) 与 \(\mathbb{Z}\)-值推广:本文理论框架完全建立在INAR(1)与 \(\mathbb{N}_0\)-值上,高阶INAR(p)的PGF方程更复杂,\(\mathbb{Z}\)-值(含负相关,Liu et al. 2021)的PGF定义需修改。要证什么:INAR(p)与\(\mathbb{Z}\)-INAR下,经验PGF过程的泛函中心极限定理与plug-in扰动控制是否仍成立?扎根点:引言最后一段“future research directions”及对Liu et al. (2021)的回避。

  2. 半参数检验与参数检验的功效损失界:本文只展示了模拟中半参数检验的功效可接受,但未在理论上刻画。要估什么:在特定参数备择(如泊松INAR)下,半参数PGF检验相对于Stein-Chen检验的局部渐近相对效率(ARE)或功效损失下界?扎根点:Theorem 2.9只给出非零功效,未与Aleksandrov et al. (2021)的参数功效显式对比。

  3. 权重函数 \(w\) 的最优选择:检验统计量依赖权重函数 \(w(s_1, s_2)\),本文只用了几个经验选择,未讨论最优性。要估什么:在局部备择下,使得局部功效最大化的 \(w\) 的解析形式是什么?扎根点:Section 2.3对 \(w\) 的选择讨论仅停留在“practical consideration”,未触及理论最优。

  4. 半参数估计收敛速率对检验的敏感度:假设2.4要求 \(\sqrt{T}\)-一致性,若改用惩罚估计(Faymonville et al. 2022),小样本下速率可能不同。要证什么:若估计速率降至 \(T^{1/2-\delta}\),检验的极限分布是否退化、一致性是否仍保?扎根点:假设2.4的陈述及证明中对plug-in项的 \(o_p(1)\) 吸收。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论