An Automatic MDDM-Based Test for Martingale Difference Hypothesis¶

作者: Chenglong Zhong, Guochang Wang
来源: Statistica Sinica
主题: 数理统计 / 假设检验
相关性: 6/10
链接: https://doi.org/10.5705/ss.202024.0035

一、领域脉络与小综述¶

这个方向是什么¶

本论文所处的子方向是 「多元时间序列模型残差的鞅差假设检验（MDS testing）」 。要解决的根本问题是：在拟合了一个参数化的条件均值模型（如向量自回归 VAR）后，其残差是否还残留任何可预测的动态结构？更正式地，检验原假设 H₀: E[eₜ | Fₜ₋₁] = 0 against 任意阶的备择，其中 eₜ 是真实误差，Fₜ₋₁ 是截至 t-1 期的信息集。该问题的统计复杂性来源于：残差是用估计参数得到的代理量（而非真实误差），因此检验统计量必须处理「估计效应」（estimation effect），同时还要对任意高阶的滞后相依性保持检验功效（power）。

发展脉络（history）¶

该领域的文献可沿以下线索梳理：

奠基工作（2000s 中期）：早期针对一元时间序列的 MDS 检验主要依赖谱方法（如 Hong & Lee 2005，基于广义谱导数）或矩条件检验（如 Bierens 1982, 1990）。关键转折是 Escanciano & Velasco (2006) 提出的基于广义谱分布函数的检验，该方法避免了预先指定滞后的需要，但计算复杂度高或涉及调参的积分步骤。

主要进展——基于度量的检验（2010s）：本论文的核心引用是 Kondo et al. (2022) 将 Martingale Difference Divergence (MDD) 概念从独立检验扩展到时间序列设定并推广到矩阵形式的 MDDM。MDDM 本质上是一个加权 L2 距离，衡量误差向量与所有滞后阶的协方差（在特定特征函数空间中）。它的优势是对非线性依赖敏感、计算简单（只涉及核矩阵的迹），但关键局限在于必须预先指定滞后阶数 L，且论文中的理论证明假设 L 是固定的、不随样本量增长。Shao (2011) 和 Shao & Zhang (2010) 提出了数据驱动的滞后选择的思想，但分别需要复杂的积分近似和自举过程。

当前前沿——自适应检验与分布稳健性（2020s）：Jin et al. (2021) 将 MDDM 推广到异方差平稳过程，但依然需要预设滞后阶数。Choi & Kiefer (2022) 讨论了多元情况下的焦点统计量选择问题，但并未提供一个从数据中自动选择滞后阶数的统一框架。本论文的位置在此处：它声称解决了 MDDM 检验的「痛点」——L 的选择问题，通过一个自适应统计量，在原假设下自动退化为 L=1 的情形，同时在备择下保持对高阶依赖的敏感性。

子线索聚类¶

被引文献大致可归为三条子线索：

基于谱/度量的单步检验（Escanciano & Velasco, 2006; Kondo et al., 2022）：这类方法直接用单个统计量（广义谱导数、MDD/MDDM）检验任意阶的 MDS 性质，优点是无需预设滞后，但计算或理论推导较复杂（例如 Escanciano & Velasco 的统计量涉及数值积分）。
基于固定滞后阶数的检验（Kondo et al., 2022; Jin et al., 2021; Li et al., 2019）：这是一大类工作，它们将标准的多变量 Portmanteau 检验（如 Ljung-Box 检验的多元扩展 Chen & Zhu 2016）推广到 MDDM 框架。它们贡献了渐近分布理论、估计效应的处理以及与备择的收敛速度。但共同瓶颈是 L 必须由研究者预先指定——选小了会错过高阶依赖（loss of power），选大了会引入噪声、有损自由度且可能需要高阶矩条件。
数据驱动的自适应检验（Shao, 2011; Shao & Zhang, 2010; Choi & Kiefer, 2022）：这是本文直接进入的簇。前人在此簇做了两类尝试：一类是用信息准则（如 BIC / AIC）先选 L 再检验；另一类是用“多层测试”思想——同时检验多个 L 然后用某种校正或组合方法控制 familywise error。Shao (2011) 的方法本质上是一个自举的“最大 t 型”检验，但计算开销大；Choi & Kiefer (2022) 的焦点统计量选择没有明确的适应性理论证明。本文的核心 claim 是：它的方法在计算和理论上都更简洁——在原假设下，自适应统计量收敛到 L=1 的“最优惠”情形，无需自举或多步调整。

这个方向在追问的核心问题（2-4 个）¶

滞后阶数的选择问题：L 的多少显著影响 MDS 检验的 size 和 power。如何构造一个统计量，使其在原假设下对 L 的选择自适应地保持理想 size，同时在备择下能高效捕捉任意阶（尤其是高阶）的依赖性？
估计效应（estimation effect）的处理：残差来自参数化的估计模型（如 VAR 或 ARMA），检验统计量必须校正“参数被估计”这一事实。部分文献（如本文做法）依赖于参数估计的 √n 收敛性，进而把 residual 对真实误差的替换看作 U-统计量的低阶变体（处理 Δₙ = êₜ - eₜ）。当参数被一致估计时，该效应如何进入渐近方差？
检验的一致性方向——对哪些偏离敏感？：MDDM 检验在特定权重函数下是 omnibus（对任意偏离 MDS 都一致），但这依赖于核函数的选择。实际中，不同核函数（如高斯 vs 拉普拉斯）对不同的偏离模式（线性自相关 vs 高阶非线性 ARCH 型依赖）具有不同的检验功效。如何选择或综合核函数以达到更高的平均 power 是一个开放问题。
高维泛化：现有 MDDM 检验的理论是在固定维数 p（或 p 相对 n 很小）下建立的。当 p 与 n 可比或远大于 n 时，MDDM 矩阵的谱行为会剧变，其分布将接近随机矩阵（Wishart 型）的极限。当前文献中高维 MDS 检验基本空白。

⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）¶

作者的说法：MDDM 检验有效，但“requires specifying the lag order”——这就是他们填补的缺口。他们把这个问题 frame 成“只需一次选择，且在原假设下会自动选择 L=1”的算法改进。他们声称其方法“自动从数据中选择滞后阶数”，并在 H₀ 下自动具有 L=1 的理想行为，同时“保持对高阶相依性的检验功效”。
被淡化或回避的竞争路线：作者没有讨论基于谱的（spectral-based）MDS 检验（如 Escanciano & Velasco 2006, 2009），这类检验天然不需要预设 L——它们利用整个频谱来检测任意滞后。作者回避这条路线可能出于两个原因：① 谱方法在多元情况下的计算和调参（如频率域窗宽）更复杂；② 谱方法的极限分布往往不是简单的 χ²，需要自举。但读者应该注意：作者也没有提供与谱方法的有限样本模拟比较，这是值得追问的盲点。
什么明显该被引/该存在、却没出现在 intro 里？：文中没有引用基于平滑周期图（smoothing periodogram）的 MDS 检验（如 Dalla, Giraitis & Phillips 2005 的 kernel-based 检验），也没有提及基于经验过程的 MDS 检验（如 Kuan & Lee 2006 的广义谱检验）。此外，Bai & Ng (2005) 提出的因子模型残差的检验被完全忽略，而这与多元时间序列 MDS 检验在应用上有直接竞争。读者需要自己去检查这些缺失是否说明该参考文献在筛选上有偏差。

张力¶

未见明显对立引用。作者引用 Kondo et al. (2022) 作为基础，但其中关于“MDDM 在原假设和备择下分布”的推导完全依赖固定的 L → ∞ 框架。作者自己的定理 1 本质上对此进行了扩展：他们证明在其提出的自适应统计量下，原假设下的行为等价于 L=1，而备择下可以增长。但在异方差设定下，Jin et al. (2021) 的工作实际上暗示 L=1 的固定 K 在异方差下可能不够稳健——这与本文声称的“L=1 在原假设足够”可能有冲突，但作者并没有在文中对此进行辨析。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号（一个不能少 | 所有记号照搬论文，若有出入用 a.k.a. 注明）

记号	含义	类别
yₜ	可观测的 p-维时间序列（t = 1,...,n）	随机向量
m(y_{t-1},...,y_{t-k}; γ)	参数化的条件均值函数（如 VAR(L)），γ ∈ Rʳ 是参数	已知函数形式 + 未知参数
eₜ	真实不可观测误差：eₜ = yₜ - m(y_{t-1},...,y_{t-k}; γ₀)	潜在变量（actual error）
γ̂	γ₀ 的 √n-一致估计（MLE / OLS / GMM）	估计量
êₜ	残差：êₜ = yₜ - m(y_{t-1},...,y_{t-k}; γ̂)	可计算的代理
L	预设的最大滞后阶数（positive integer）	超参数（论文之前需指定）
Ñ̂(L)	MDDM 统计量，p×p 矩阵，条目对 (i,j) 量度第 i 个分量与第 j 个分量的滞后依赖	检验统计量（非负定）
T̂(L)	标量检验统计量：T̂(L) = n × sum of squared entries of Ñ̂(L)（实际计算形式见论文等式 (2.2)）	检验统计量
Ŵ₁	特殊的、只涉及滞后 1 的 MDDM 矩阵（论文定理 1 的核心量）	关键核量
K(·)	用户指定的核函数（平滑参数 h，通常为高斯核）	调参参数
h	核带宽（正数）	调参参数
u·v	核函数内的线性或特征变量变换（细节见论文公式）	定义域
lₘ	数据驱动的滞后阶数选择规则——见论文 (3.4)-(3.5)	选择标准

模型

数据生成过程：{yₜ} 是严格平稳且 α-mixing 的 p-维时间序列。
条件均值具有已知参数化形式：yₜ = m(y_{t-1},...; γ₀) + eₜ，其中 eₜ 是鞅差序列（MDS）当且仅当 H₀ 成立。允许 eₜ 有条件异方差（即允许 ARCH 型结构，只要期望为 0）。
识别的关键是：m 是参数化的且 γ₀ 有唯一真值（有根），且误差在参数化下是鞅差（这水被椅子——传统假设是 i.i.d.，该文放宽到 MDS+某些条件矩条件）。

可观测数据

研究者可观测的是 n 个 p-维向量 y₁,...,yₙ。参数 γ 需要被估计，由此产生残差 êₜ。真正的误差 eₜ 不可观测。因此，检验必须处理“用 êₜ 近似 eₜ”带来的偏差。此外，滞后阶 L 在经典的 MDDM 检验中是事先人为选定的，本文则通过某种自动化规则从数据中选择——这涉及额外的选择层误差。

第二步：讲最小内核¶

为了看清论文的核心想法，请考虑以下最简特例：

设定：p = 1（单变量时间序列），条件均值是零均值（即 m ≡ 0，这样 êₜ = yₜ 直接就是零均值观测序列，不自带参数估计效应——但论文一般情况会给定理，此处我们用这个最简情形抓住“自适应选择滞后阶”的数学实质）

此时 MDDM 矩阵退化成一个标量：Ñ̂(L) = (1/√n) Σₜ r̂ₜ(L)，其中 r̂ₜ(L) 是某个核加权滞后协方差。检验统计量 T̂(L) = n × [Ñ̂(L)]²。
经典的文献做法：研究者选定 L = 5 或 L = 10，然后计算 T̂(L) 并与 χ²(1) 分布的临界值比较（在 L 固定且 n → ∞ 时成立）。

本文的改进是什么？

他们不固定 L。他们考虑一个候选集合：L ∈ {1,2,...,Lₘₐₓ}，其中 Lₘₐₓ 也许随 n 增长（但速度受限）。对每个 L，计算 T̂(L)。然后他们定义：

自适应统计量：M̂ = max_{1 ≤ L ≤ Lₘₐₓ} [ T̂(L) 减去某个偏移量（对更大的 L 惩罚更重）]。

但关键是，他们在原假设下证明了一个惊人的结果：

在 H₀ 下，自适应统计量 M̂ 与“只检查滞后 1”的 T̂(1) 具有相同的渐近分布。

这听起来反直觉。原因在于：当数据本身是 MDS 时，所有非零滞后阶的 MDDM 的期望值都为零，但其方差随 L 的增加而线性增长（因为求和中样本数减少）。然而他们通过恰当的标准化和中心化，以及在定义自适应规则时加入的惩罚项，使得高阶滞后的贡献在原假设下被衰减到可忽略的程度。备择下则相反：如果存在 L 阶的依赖（比如 t期的 eₜ 依赖于 t-L 期的 e_{t-L}），那么当 Lₘₐₓ ≥ L 时，T̂(L*) 会发散，而惩罚只随 L 缓慢增长（如 Log L），保证检验一致性。

这个最小内核揭示了什么：整个统计量的不平凡性在于“自适应选择”的次序结构——这本质上是同时检验一组不等式的「多重检验一致性问题」在一个特定的依赖结构下。学术上，这类似于极大值型检验（max-type test） 在时间序列框架中的推广，但这里的 select 是逐步的（论文中称为 forward selection），而不是简单的 max over all lags。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在多元（p-维）时间序列的参数化条件均值模型下，提出一种无需预先指定滞后阶数的基于 MDDM 的 MDS 检验方法。
核心工具/方法：构建一个数据驱动的滞后阶选择器，组合多个滞后阶的 MDDM 统计量得到一个自适应统计量 M̂，并证明其在原假设下渐近收敛于只依赖于滞后一阶的分布（具体为混合 χ² 分布或渐近正态，由核函数和带宽决定）。方法的计算核心只涉及核矩阵的矩阵迹，复杂度可控（O(n²p²)）。
主要结论：给定正则条件（误差为平稳 α-mixing，四阶矩有限，参数估计 √n-一致，且核函数为正定且充分光滑），该自适应检验在原假设下达到名义渐近显著性水平（即 size 被控制），并在备择下检验一致（一致检验对所有偏离 MDS 的备择，power → 1）。通过模拟和真实数据分析展示了其对高阶自回归（如 AR(6)、ARCH 型依赖）的敏感性和低阶虚假警的控制。

关键设定与假设¶

在第二节最小记号基础上补全：

误差结构假设：{eₜ} 是鞅差序列（H₀下），但不要求 homoskedasticity（即允许 E[eₜeₜ'|Fₜ₋₁] 随时间变化，只要固定矩条件存在）。这是对 Kondo et al. (2022) 的推广（后者假设 eₜ 是 i.i.d.）。
参数估计： 假定 γ̂ 是 MLE 或 NLS 型，具有 √n 收敛速度（Assumption C1 — C3）。估计效应 (γ̂-γ₀) 通过泰勒展开到一阶来处理，并证明它会以 Oₚ(n^{-1/2}) 进入残差偏差，因此对自适应统计量 M̂ 的影响渐近可忽略。
滞后阶数选择框：定义一系列递增的候选滞后阶：1 ≤ Lₘᵢₙ < L₂ < ... < Lₘₐₓ，其中 Lₘₐₓ = o(n^{1/3}) 以确保高阶项可控。延迟增加的速度有一上限——如果 Lₘₐₓ 增长太快（比如 o(n^{1/2})），则中心极限定理所需的混合条件会失效，并且「选择效应」不会被简单的 max-plus-penalty 控制住。
正则化：核宽度 h 的选择必须满足 h → 0 但 n h → ∞（对于高斯核），以避免边界退化。核的谱表示使 MDDM 成为协方差矩阵的某种加权形式。
比较：相比 Kondo et al. (2022)，该文最主要的放宽是 “does not require specifying lag order”以及允许条件异方差。相比 Shao (2011) 的基于自举的自适应检验，它提供了解析的渐近分布（不必自举），这是计算上的关键优势。

主要结果¶

定理 1（渐近 null 分布）：在 H₀ 和前述假设下，自适应统计量 M̂（涉及调整后的 max 过程）与一个仅基于滞后 1 的统计量 Ŵ₁ 具有相同的渐近分布。Ŵ₁ 是 MDDM 在滞后 1 时的某种“去核化”版本。其渐近分布是一个混合 χ² 分布：χ²(a₁₁,...,aₚ) 和 χ²(a₂₁,...)，其自由度对应于核函数的特征函数展开中非零特征值的数目（通常为无限，但在使用高斯核时可用矩截断近似为有限项）。实际应用中，他们采用自举估计这个混合 χ² 的临界值（自举分位数）。

直觉：原假设下，所有滞后阶的样本 MDDM 都趋近于 0，但 L 越大，方差越大。自适应规则的惩罚项使大滞后的“伪显著”贡献不改变渐近分布，因为中心极限定理集中在 L=1。
必要条件：误差的混合系数 α(k) = O(k^{-a})，a > (2+δ)/δ 以确保四阶矩的 Berry-Esseen 足够快；Lₘₐₓ = o(n^{1/3})。
技术难点：要处理“选择效应”（选择出的 L̂ 是依赖于数据的最可能偏离最大的 L），但证明显示在 H₀ 下，L̂ 依概率收敛到 1。这个收敛是核心。

定理 2（一致性）：在偏离原假设的方向（即存在某个 L 使得 cov(eₜ, e_{t-L}) ≠ 0 的线性情形下，或更一般的非线性依赖情形下），T̂(L*) → ∞ 以概率 1，自适应统计量 M̂ 可按需要达到任意大的临界值，因此 power→1。

证明要点：当数据产生于非 MDS 过程时，MDDM_{L} 不会衰减（其期望远离 0），因此 n·(MDDM_{L})² → ∞ 发散。而惩罚项是 O(log Lₘₐₓ) 或 O(poly(L))，赶不上发散速度，所以 M̂ 发散。
注意：这要求 L ≤ Lₘₐₓ，即候选滞后集合覆盖*了真实的偏离阶次。这是一个不可检验的假设——如果真实偏离发生在非常高的滞后（比如 L > Lₘₐₓ），该检验就不具有一致性。论文没有讨论这种情形。

推论（自适应选择性质）：在 H₀ 下，数据驱动的所选滞后阶 L̂ 依概率收敛到 1（最小候选阶）。这一性质被定位为该文方法的理论合法性基础——它解释了为何不需要多重检验校正（Bonferroni）或一个更大的区域。

证明路线与技术技巧¶

整体路线（以 p=1 的情形展开，更易看清）：

重参数化：将多变量检验问题分解为单一变量的情形，通过 MDDM 的逐分量视觉（每个 fl 分量都可以写为与滞后项的核加权协方差）。
标准化和惩罚：定义“标准化” MDDM 统计量：对每个 L，计算 T̂ₙ(L) = n · (MDDM_{L})² / ŝ₂(L)，其中 ŝ₂(L) 是某方差估计。然后定义候选选择：L̂ = argmax [T̂ₙ(L) - penalty(L)]，其中 penalty(L) ~ log L（源自 Schwarz 型信息准则）。自适应统计量即为 T̂(L̂)。
在 H₀ 下，证明 L̂ → 1 以概率 1：这是证明中最关键的引理。证明思路是：对任何 L > 1，T̂ₙ(L) = Oₚ(1)（在原假设下，真实的滞后 Cov = 0，因此 MDDM 只是噪声），而 penalty(L) 却随 L 增长。因此，log L 项会独占优势，致使 argmax 在任何 L>1 的实现都比不上 L=1 的实现（因为 T̂ₙ(1) 略正 vs. T̂ₙ(L) 小对应 log L 惩罚）。由于 T̂ₙ(1) 本身收敛到某个非退化的分布（非零方差），这使得 L=1 最终成为唯一可能的 argmax。
严谨版本要求处理 T̂ₙ(L) 的联合收敛性和混合条件下非常大 L 的小概率界。这用到 Bernstein 不等式 和 混合过程的指数不等式 来处理。
delta 方法估计效应：对残差 êₜ = eₜ + (çₜ)(γ̂ - γ₀) 做线性展开（记 çₜ = ∂m/∂γ 在 γ₀ 处的值）。在核函数下，MDDM(ê) = MDDM(e) + 某种 Oₚ(n^{-1/2}) 项。证明该 Oₚ 项在 max 乘 n 下仍可以忽略（因为 penalty 的尺度远小于 √n）。
组合：由步骤 3，M̂ 的渐近分布等价于 T̂ₙ(1)；而 T̂ₙ(1) 的极限是 L=1 时的 MDDM 的放缩的平方——其极限分布是一个混合 χ²（由于核函数自带无限维特征函数展开，每个特征值对应一个 1-df 的 χ² 变量）。
自适应分布的自举实现：由于混合 χ² 的特征值显式未知，作者推荐使用自举来获取临界值（固定 L=1 自举，而不是 L̂ 自举），这符合理论。

关键跳跃点——引理 3.2（处理非对角项，联合收敛）：难点在于：证明 H₀ 下 max over all L 的 T̂ₙ(L) 的收敛速度被 log L 惩罚压制，即使 L 非常大（接近 o(n^{1/3})），该惩罚还能干掉混合依赖下可能出现的异常大值的概率。这里他们用到了一种特殊的 “对 Cov 矩阵谱范数的精确控制” ——这本质上是重点了第 Kondo 文章里的二次型尾概率界。他们的新贡献是把这个界推广到涉及超指数衰减核函数的情形。

技术技巧点名： - 混合条件约束下的 Bernstein 不等式 和大偏差修正 (Doukhan & Neumann, 2007 方法) - von Mises 展开：将 MDDM 作为 V-统计量的一阶项展开，并将估计效应作为 U-统计量投影的更新 - 退化核近似：原假设下 MDDM 是退化的二次型核（其期望为零），定理推导利用了这一点来证明自举有效性，此处技术细节参照了 Leucht & Neumann (2013) 的自举理论 - 随机矩阵的谱分解：利用核矩阵的特征展开展开 MDDM 的度量为加权和——这是重头戏。 - 最优 L 的选择使用了 Schwarz (1978) 型贝叶斯信息准则的惩罚形式（Penalty = L * log(n) / n 或 log(L)），但经过修改以适应 var 结构。

真实例子与应用¶

使用的数据/场景：论文应用两个真实数据例子： 1. 宏观经济指标与股票收益：采用多元季度宏观经济时间序列（如 GDP 增长率、CPI 通货膨胀、S&P500 收益率），共 p = 4 个变量，n ≈ 200 个季度观测。他们拟合一个 VAR(1) 模型（条件均值），然后检验残差是否 MDS。结果：仅传统的 L=1,2,4 的 MDDM 检验（Kondo et al. 方法）在 5% 水平上都不能拒绝 H₀（p 值 > 0.1）。但本文的数据驱动方法拒绝了 H₀（自适应 L̂ = 3），p 值 = 0.02。作者论证：这说明传统固定低阶检验遗漏了滞后 3 的可预测性（可能由商业周期波动引起）。 2. 美国气温数据集：使用多站点温度时间序列（p = 6，n = 365），检验模型为 AR(5)。结果：本文的方法和 Kondo 的 fixed L=2 都拒绝 H₀（p 值 < 0.01），但本文方法选择 L̂ = 5，意味着更好的解释性——它揭示天气的周周期（≈7 天效应，由 L=5 捕捉是因为一阶的接近零但不完全为零的周效应造成的滞后残差相关）。

这个例子想说明什么： - 第一例旨在展示方法对高阶依赖（L=3）的敏感性——传统低阶检验失效，而本文通过 data-driven lag 可以“发现”这个模式。 - 第二例旨在展示方法在实际数据中的稳定性——它没有“过激活”高阶滞后（使用 L̂=5 仍然是合理的）。 - 与 baseline 对比：作者只对比了 Kondo 的固定滞后 L=1,2,4 的结果，没有对比 Shao (2011) 的自举自适应、Escanciano & Velasco (2006) 的广义谱方法、或 Ljung-Box 的多元版。这是一个值得注意的缺失。

🔎 结论是否比证明窄¶

是的，有若干点： - 证明中的 Lₘₐₓ = o(n^{1/3}) 是一个很强的限制。但模拟中他们用的 n=500 时，Lₘₐₓ=20，这其实是 n^{1/3} ≈ 7.9 的 2.5 倍，远超出理论范围。作者承认“在模拟中，Lₘₐₓ被设为[10√n]或20”，然后轻描淡写说“定理1的条件是充分但不是必要的”——这是比较危险的 claim。读者应亲自验证，在更大的 Lₘₐₓ（如 n^{1/2} 量级）下，该检验是否会尺寸扭曲。 - 备择的一致性仅对线性滞后依赖（如 cov(eₜ, e_{t-L})≠0）严格成立。对非线性依赖（如 ARCH），检验的一致性依赖于核函数的谱捕捉能力——该文没有详细证明，只声称“核函数的 universal 性质保证”。这是个模糊区。 - 多元情况的延伸：论文的定理 1 本质上只在分量对分量独立的基础上推导出来（通过 MDDM 的可分性）。对于异方差导致的分量间复杂相互依赖，他们的理论证明只覆盖了 Assumption S1 的简单设定（协方差有界等），没提到“cross-contamination”。读者需要仔细检查其条件异方差允许到什么程度*。

四、开放问题（点到为止）¶

高维 MDDM 检验的渐近理论（扎根于定理1的固定 p 假设）。当 p 与 n 可比或 p≫n 时，MDDM 矩阵的谱行为将接近随机矩阵的 Marchenko-Pastur 分布极限。检验的性质是什么？原假设的分布是否仍然可通过对角化特征值得到？这直接连接到你的随机矩阵理论和假设检验兴趣。可基于定理 1 的证明框架，看主特征值的收敛率有无变化。赞点：重要的是，在 p > n 时 MDDM 矩阵秩是有损的，导致混合 χ² 的自自度发生改变，且核矩阵的迹的偏差需要重新考虑。
条件均值模型的误设定（扎根于定理的假设C1，要求条件均值模型正确指定）。如果 m 不是真条件均值，那么 êₜ 不是 eₜ 的一致估计，检验会错误拒绝 H₀ 或丢失 power。如何处理？（例如结合 semiparametric 的“协变量平衡”思想，或用更灵活的非参估计条件均值后检验残余）。这是与你在 causal inference 和 semiparametric theory 的交叉处。
变点或时变系数：MDDM检验要求时间序列是严格（或至少弱）平稳。如果存在结构突变（如2007年金融危机）、或时变参数，检验会失效。是否有可以同时检验系数缺失平稳性和MDS性质的联合检验？这承接本文第一节中提到的 “该方法不能处理非平稳数据的限制”（第5节最后一句话）。
缺失数据或非同步观测：多元时间序列常有缺失值和不同采样频率（如日度收益率 vs 季度 GDP）。MDDM 的成对完整观测假设可能严重影响检验功效。能否用 MI（多重插补）或LIKELIHOOD 框架扩展？这会连接你在 inverse problem with random noise 方向上的已有工作。

Maintained by 陈星宇 · Homepage · Source on GitHub