Goodness-of-fit tests for high-dimensional parametric multiresponse regressions¶

作者: Ran Liu, Jiaqi Huang, Lixing Zhu
来源: Bernoulli
主题: 数理统计 / 假设检验
相关性: 6/10
链接: https://doi.org/10.3150/24-bej1801

一、领域脉络与小综述¶

这个方向是什么：高维多响应回归下的模型拟合优度检验，根本统计问题在于：当响应变量的维数 \(q\) 与参数维数 \(p\) 均可随样本量 \(n\) 发散时，如何检验参数回归模型（如 \(E(Y|X) = m(X, \theta_0)\)）是否正确刻画了真实均值结构？特别地，当 \(m\) 本身是常微分方程（ODE）的解时，模型非线性极强、响应间存在复杂耦合，经典固定维检验的极限分布不可追踪，高维设定进一步使得传统非参平滑检验的渐近理论失效。该方向目前处于从固定维/低维非参检验理论向高维发散维数拓展的攻坚期，核心难点在于极限分布的追踪性与局部备择检测速率的紧性。

发展脉络： - 奠基工作（固定维全局/局部平滑检验）：Hart (1997) 建立了全局平滑检验（如 Neyman-type test）框架；Fan & Huang (2001) 提出基于残差投影的局部平滑检验（Neyman-type generalized likelihood ratio test），在固定维下得到 Wilks 型极限分布，检测局部备择速率为 \(n^{-1/2}h^{-1/2}\)（\(h\) 为核窗宽）。但作者指出，这些经典检验在固定维多响应情形下零假设极限分布不可追踪（intractable），且在高维下直接失效。 - 主要进展（高维单响应回归检验）：Fan et al. (2017) 与 Guo et al. (2023) 等将局部平滑检验拓展至高维单响应回归，利用投影或 wild bootstrap 克服维数发散带来的分布漂移。然而，这些工作未触及多响应（\(q>1\)）且响应维数发散的设定，也未处理 ODE 解这类高度非线性的均值函数。 - ODE 模型参数推断：Ramsay et al. (2007) 提出基于 profile 估计的 ODE 参数推断；Chen et al. (2023) 等研究了 ODE 参数的渐近性质，但均未涉及 ODE 解作为回归函数的拟合优度检验问题。 - 当前 frontier 与本文位置：当前 frontier 在于如何在高维多响应（\(q \to \infty\)）下构造既可追踪极限分布、又能利用响应维数发散提升检测势的检验。本文首次在此设定下提出全局与局部平滑检验，声称全局检验具有正态弱极限、局部检验具有 dimension-agnostic 性质，且检测速率可快于固定维经典最快速率。

子线索聚类： 1. 全局平滑检验（Neyman-type / Fourier projection）：通过将残差投影到无穷维函数空间（如 Fourier 基）构造检验统计量，经典困难在于零假设下极限分布非标准（常为无穷级数加权卡方），本文用高维响应间的耦合结构将其归约为正态极限。 2. 局部平滑检验（Kernel smoothing / generalized LR）：基于核平滑残差构造统计量，经典困难在于维数发散时偏倚与方差阶的精细平衡，本文声称在特定条件下极限分布不依赖发散的维数（dimension-agnostic）。 3. ODE 解作为回归函数的推断：ODE 解的均值函数 \(m(X, \theta)\) 关于参数 \(\theta\) 的导数结构复杂（涉及解对参数的敏感性矩阵），本文将此结构嵌入多响应回归框架，利用响应维数 \(q\) 的发散抵消 ODE 解非线性带来的估计偏倚。

核心追问： 1. 高维多响应设定下，零假设极限分布是否可追踪？若可，其结构是否依赖发散的维数 \(q\) 与 \(p\)？ 2. 响应维数 \(q\) 的发散是否必然提升检验对局部备择的敏感度？其检测速率的上界（minimax rate）是什么？ 3. ODE 解这类高度非线性均值函数下，参数估计的渐近性质如何影响基于残差的检验统计量？

⚠️ 作者的 framing：作者将缺口 frame 为"经典固定维多响应检验极限分布不可追踪，高维单响应检验未覆盖多响应与 ODE 解"，从而让本文的"正态弱极限 + dimension-agnostic + 快于经典速率"成为显然的下一步。被淡化的竞争路线：基于 bootstrap（wild / multiplier）的检验方法在高维下亦可逼近极限分布，作者虽在模拟中对比了 bootstrap 方法，但理论部分未将其作为主要竞争者深入讨论；半参数效率界视角（拟合优度检验的 minimax rate 是否被本文速率达到）未被提及。明显该引但未引的：高维多响应回归参数估计的半参数效率界文献（如高维 M-估计的 debiased 理论）、拟合优度检验 minimax rate 的系统理论（如 Ingster-type tests 在高维非参设定下的 rate）——这些是研究者应去查证的方向，以判断本文声称的"快于经典速率"是否真正触及了 minimax 下界。

张力：未见明显对立引用。但存在隐含张力：Fan & Huang (2001) 的局部平滑检验在固定维下检测速率为 \(n^{-1/2}h^{-1/2}\)，本文声称在高维多响应下可快于此速率——这依赖于 \(q\) 的发散对方差阶的压缩效应，若 \(q\) 发散速率不足或偏倚阶主导，该声称可能不成立；作者在假设中对此有明确约束（如 \(q/n\) 的阶条件），但未与 minimax 下界对照，留下速率紧性的疑问。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(n\)：样本量。
\(q\)：响应变量维数，可随 \(n\) 发散（\(q = q_n \to \infty\)）。
\(p\)：参数维数，可随 \(n\) 发散（\(p = p_n \to \infty\)）。
\(d\)：协变量 \(X\) 的维数，本文设定下固定或低维（\(d\) 不发散）。
\(X_i \in \mathbb{R}^d\)：第 \(i\) 个个体的协变量，可观测。
\(Y_i \in \mathbb{R}^q\)：第 \(i\) 个个体的响应向量，可观测。
\(\theta_0 \in \mathbb{R}^p\)：真实参数，不可观测，是要估的对象。
\(m(X, \theta) \in \mathbb{R}^q\)：参数均值函数，已知函数形式（如 ODE 解），\(\theta\) 为输入参数；\(m(X, \theta_0)\) 为真实均值。
\(\epsilon_i \in \mathbb{R}^q\)：误差向量，不可观测，假设 \(E(\epsilon_i | X_i) = 0\)，协方差矩阵 \(\Sigma(X_i)\) 可依赖 \(X_i\)。
模型：\(Y_i = m(X_i, \theta_0) + \epsilon_i\)，\(i=1,\ldots,n\)。
可观测数据：\((X_i, Y_i)\)，\(i=1,\ldots,n\)，其中 \(Y_i\) 为 \(q\) 维向量。
不可观测 / 需识别：\(\theta_0\)（需通过估计识别）、\(\epsilon_i\)（需通过残差识别）、真实均值结构是否等于 \(m(X, \theta_0)\)（需通过检验识别）。
检验问题：\(H_0: E(Y|X) = m(X, \theta_0)\) 对 \(H_1: E(Y|X) \neq m(X, \theta_0)\)（全局备择）；局部备择为 \(H_{1n}: E(Y|X) = m(X, \theta_0) + \delta_n \cdot \Delta(X)\)，其中 \(\delta_n \to 0\) 为序列，\(\Delta(X)\) 为 \(q\) 维偏离函数。

第二步：最小内核——\(q\) 发散下全局平滑检验的正态弱极限

剥掉所有为一般性服务的技术假设（如 ODE 解的具体结构、\(\Sigma(X)\) 的异质性、高阶矩条件），考虑最简特例：

特例设定：\(d=1\)（单协变量），\(m(X, \theta)\) 为线性均值函数 \(X \cdot \theta\)（此时 \(p=1\)），\(\epsilon_i\) 独立同分布且 \(\Sigma = I_q\)（同方差、响应间不相关），\(\hat{\theta}\) 为 OLS 估计 \(\hat{\theta} = (\sum X_i^2)^{-1} \sum X_i Y_i\)。

全局平滑检验统计量：取 Fourier 基函数序列 \(\{e_k(X)\}_{k=1}^K\)（如 \(e_k(X) = \cos(k\pi X)\)），构造残差投影统计量：

\[T_n = \sum_{k=1}^K \left( \frac{1}{\sqrt{n}} \sum_{i=1}^n e_k(X_i) (Y_i - X_i \hat{\theta}) \right)^{\top} \left( \frac{1}{\sqrt{n}} \sum_{i=1}^n e_k(X_i) (Y_i - X_i \hat{\theta}) \right)\]

在固定维 \(q\) 下，\(T_n\) 的零假设极限分布为无穷加权卡方级数（权重依赖基函数与设计分布），不可追踪。

最小内核命题：当 \(q \to \infty\) 且 \(K\) 固定或适度发散时，\(T_n\) 在零假设下收敛到正态分布 \(N(\mu_q, \sigma_q^2)\)，其中 \(\mu_q\) 与 \(\sigma_q^2\) 可由 \(q\)、基函数与设计分布显式计算。

为什么成立（直觉）：关键在于 \(Y_i - X_i \hat{\theta}\) 是 \(q\) 维向量，其投影 \(\sum_i e_k(X_i)(Y_i - X_i \hat{\theta})\) 也是 \(q\) 维。当 \(q\) 发散时，\(T_n\) 实质上是 \(q\) 维随机向量的二次型之和。由于 \(\hat{\theta}\) 的估计误差在 \(q\) 维空间中被平均（\(\hat{\theta}\) 的方差阶为 \(O(1/(nq))\) 当 \(q\) 大时），残差的投影项中估计误差的贡献被压缩；同时，\(q\) 维误差向量间的独立性使得二次型在高维下呈现"大数定律"效应——各维度的卡方分量叠加后，经中心化与标准化，由 Lindeberg 条件（或 Lyapunov 条件）驱向正态。这就是"响应维数发散将不可追踪的加权卡方归约为可追踪的正态"的核心数学事实。

局部备择检测速率的最简内核：在局部备择 \(Y_i = X_i \theta_0 + \delta_n \Delta(X_i) + \epsilon_i\) 下，\(\Delta(X_i)\) 为 \(q\) 维偏离。当 \(\Delta(X_i)\) 各分量有共同信号强度时，投影统计量 \(T_n\) 的均值偏移阶为 \(\delta_n^2 q\)（信号在 \(q\) 个响应维度上叠加），而方差阶为 \(q\)（噪声在 \(q\) 个维度上独立叠加）。因此，检测势的非中心参数阶为 \(\delta_n^2 q / q = \delta_n^2\)——但若 \(q\) 发散速率足够快使得偏倚的累积效应（来自核平滑或投影截断）被 \(q\) 的发散抵消，则检测速率可达 \(\delta_n = n^{-1/2} q^{-1/4}\) 或更快，快于固定维下的 \(n^{-1/2}h^{-1/2}\)（当 \(h \to 0\) 时 \(n^{-1/2}h^{-1/2}\) 慢于 \(n^{-1/2}\)）。这正是"响应维数发散提升检测敏感度"的数学内核。

三、这篇论文做了什么¶

三句话： ①研究了高维多响应参数回归（响应维数 \(q\) 与参数维数 \(p\) 可发散）下的拟合优度检验问题，特别覆盖 ODE 解作为均值函数的情形。 ②核心工具是构造基于残差投影的全局平滑检验（Fourier 基）与基于核平滑的局部平滑检验，利用 \(q\) 发散带来的高维二次型正态化与偏倚-方差重新平衡。 ③主要结论：全局检验在零假设下具有正态弱极限（克服经典不可追踪分布），局部检验在特定条件下具有 dimension-agnostic 极限分布；两类检验在 \(q\) 发散时对局部备择的检测速率可快于固定维经典最快速率。

关键设定与假设： - 模型设定：\(Y_i = m(X_i, \theta_0) + \epsilon_i\)，\(m\) 为已知参数函数（可为 ODE 解），\(\theta_0 \in \mathbb{R}^p\)，\(p\) 可发散；\(E(\epsilon_i|X_i)=0\)，\(\text{Cov}(\epsilon_i|X_i) = \Sigma(X_i)\)（允许异方差与响应间相关）。 - 假设 A1（参数估计渐近性）：\(\hat{\theta}\) 满足 \(\sqrt{n}(\hat{\theta} - \theta_0) = O_p(1)\)，且具有线性展开 \(\hat{\theta} - \theta_0 = \frac{1}{n} \sum_{i=1}^n \psi(X_i, \epsilon_i) + o_p(n^{-1/2})\)，其中 \(\psi\) 为影响函数。对于 ODE 解情形，作者引用了 Chen et al. (2023) 的 ODE 参数估计渐近理论来验证此假设。 - 假设 A2（维数发散速率）：\(p = o(n^{1/2})\)，\(q = o(n^{1/2})\)（保证估计精度），但在检测速率结论中要求 \(q\) 的发散速率满足特定阶条件（如 \(q/n \to 0\) 但 \(q \to \infty\)）。 - 假设 A3（均值函数光滑性与导数结构）：\(m(X, \theta)\) 关于 \(\theta\) 可微，导数 \(\nabla_\theta m(X, \theta_0)\) 满足有界条件；对 ODE 解，此导数涉及解对参数的敏感性矩阵（sensitivity matrix），作者利用 ODE 理论中的变分方程刻画此矩阵的界。 - 假设 A4（误差矩条件）：\(E(\|\epsilon_i\|^{4+\delta})\) 有界（保证 Lyapunov 条件用于正态化）。 - 假设 A5（设计分布与基函数）：\(X\) 的分布满足支撑集与密度条件；Fourier 基函数 \(\{e_k\}\) 满足正交性与完备性条件。 - 统计含义：A1 是半参数 M-估计的标准条件，将估计误差归约为影响函数的平均；A2 限制了维数发散不能过快（否则估计不精确）；A3-A4 是高维二次型正态化的技术前提；A5 是非参检验的标准条件。相比已有文献（Fan & Huang 2001 固定维、Fan et al. 2017 高维单响应），本文放宽了 \(q\) 固定的限制，但强化了 \(q\) 发散速率与矩条件。

主要结果：

定理 1（全局平滑检验的正态弱极限）：
陈述：在零假设 \(H_0\) 下，全局平滑检验统计量 \(T_{n,G}\)（基于 Fourier 基投影的残差二次型之和）经中心化与标准化后，弱收敛到标准正态分布 \(N(0,1)\)。
直觉：\(T_{n,G}\) 是 \(q\) 维残差投影向量的二次型之和，当 \(q \to \infty\) 时，各维度上的卡方分量叠加，由 Lyapunov 条件驱向正态；估计误差 \(\hat{\theta} - \theta_0\) 对投影的贡献被 \(q\) 的发散稀释（因投影向量的各分量共享同一个 \(\hat{\theta}\) 误差，但误差在 \(q\) 维空间中被平均后阶降为 \(O_p(1/\sqrt{nq})\)）。
必要条件：\(q \to \infty\)，\(q = o(n^{1/2})\)，Lyapunov 矩条件（\(4+\delta\) 阶矩有界），基函数个数 \(K\) 固定或适度发散（\(K = o(q^{1/2})\)）。
解决的技术难点：经典固定维下 \(T_{n,G}\) 的极限分布为无穷加权卡方级数（权重依赖设计分布与基函数谱），不可追踪；本文通过 \(q\) 发散将二次型的高维叠加正态化，同时控制估计误差对投影的影响（利用 A1 的线性展开将 \(\hat{\theta}\) 误差归约为影响函数的平均，再利用 \(q\) 发散压缩其阶）。
定理 2（局部平滑检验的 dimension-agnostic 极限分布）：
陈述：在零假设下，局部平滑检验统计量 \(T_{n,L}\)（基于核平滑残差的积分二次型）经标准化后，弱收敛到极限分布 \(L_0\)，该分布不依赖发散的维数 \(q\) 与 \(p\)（dimension-agnostic），仅依赖核函数与设计分布。
直觉：核平滑统计量 \(T_{n,L}\) 的方差阶为 \(O(q)\)（\(q\) 维噪声独立叠加），偏倚阶为 \(O(h^2 q)\)（\(q\) 维均值函数的平滑偏倚叠加）；标准化后消去 \(q\) 的阶，使得极限分布仅依赖核函数与设计分布的内在结构，不依赖 \(q\) 与 \(p\) 的发散速率。
必要条件：\(q \to \infty\)，\(h \to 0\)，\(nh^d \to \infty\)（核平滑的标准条件），且 \(q\) 的发散速率需满足 \(q h^4 / n \to 0\)（偏倚项可被估计误差控制）。
解决的技术难点：高维多响应下核平滑统计量的方差-偏倚-估计误差三重平衡；dimension-agnostic 性质要求标准化后的非中心参数不依赖 \(q\)，这需要 \(q\) 的发散恰好抵消偏倚与方差的 \(q\) 阶增长。
定理 3（局部备择检测速率快于经典速率）：
陈述：在局部备择 \(H_{1n}: E(Y|X) = m(X, \theta_0) + \delta_n \Delta(X)\) 下，若 \(\Delta(X)\) 各分量有共同信号强度（如 \(\|\Delta(X)\|^2 \asymp q\)），则全局检验可检测 \(\delta_n = O(n^{-1/2} q^{-1/4})\)，局部检验可检测 \(\delta_n = O((nh^d)^{-1/2} q^{-1/4})\)；当 \(q \to \infty\) 时，这些速率快于固定维下的 \(n^{-1/2}\) 与 \((nh^d)^{-1/2}\)。
直觉：偏离信号 \(\delta_n \Delta(X)\) 在 \(q\) 个响应维度上叠加，使得投影或核平滑统计量的均值偏移阶为 \(\delta_n^2 q\)；而方差阶为 \(q\)；标准化后非中心参数阶为 \(\delta_n^2 q / q = \delta_n^2\)——但检测势要求非中心参数 \(\to \infty\)，故 \(\delta_n^2 q \to \infty\) 即可检测，即 \(\delta_n\) 可降至 \(n^{-1/2} q^{-1/4}\)（全局）或 \((nh^d)^{-1/2} q^{-1/4}\)（局部），比固定维（\(q\) 固定时 \(\delta_n = n^{-1/2}\)）更快。
必要条件：\(\|\Delta(X)\|^2 \asymp q\)（偏离信号在 \(q\) 维上均匀分布），\(q\) 发散速率足够快使得 \(q^{-1/4} \to 0\) 但 \(n^{-1/2} q^{1/4} \to \infty\)（保证估计精度与检测势同时成立）。
解决的技术难点：经典固定维下检测速率受限于单响应的信号强度；本文利用 \(q\) 维信号叠加将检测阈值压低，但需精细控制估计误差在 \(q\) 维空间中的传播（利用 A1 的线性展开与 \(q\) 发散的压缩效应）。

证明路线与技术技巧：

整体路线（全局检验正态弱极限）：
将残差 \(Y_i - m(X_i, \hat{\theta})\) 展开：\(Y_i - m(X_i, \hat{\theta}) = \epsilon_i - \nabla_\theta m(X_i, \theta_0)^{\top} (\hat{\theta} - \theta_0) + R_i\)，其中 \(R_i\) 为高阶余项。
将投影统计量 \(T_{n,G}\) 分解为：信号部分（\(\epsilon_i\) 的投影二次型）+ 估计误差部分（\((\hat{\theta}-\theta_0)\) 对投影的贡献）+ 交叉部分 + 余项。
证明信号部分在 \(q \to \infty\) 下由 Lyapunov CLT 驱向正态（关键：\(q\) 维独立卡方分量叠加的正态化）。
证明估计误差部分的阶为 \(O_p(q/n)\)（利用 \(\hat{\theta}-\theta_0 = O_p(n^{-1/2})\) 与 \(\nabla_\theta m\) 的有界性，投影后乘以 \(q\) 维向量的内积，阶降为 \(O_p(1/\sqrt{nq})\) 再平方得 \(O_p(q/n)\)），在 \(q = o(n)\) 下可被中心化吸收。
证明交叉部分与余项为高阶小量（利用 A1 的线性展开与矩条件）。
组合各部分，得 \(T_{n,G}\) 经标准化后弱收敛到正态。
整体路线（局部检验 dimension-agnostic）：
将核平滑统计量 \(T_{n,L}\) 写为 \(U\)-统计量形式（核权重下的残差内积积分）。
将残差展开同上，分解 \(T_{n,L}\) 为信号部分 + 估计误差部分 + 偏倚部分 + 余项。
证明信号部分的方差阶为 \(O(q)\)（\(q\) 维噪声独立叠加），经标准化后消去 \(q\) 的阶。
证明偏倚部分阶为 \(O(h^2 q)\)（核平滑偏倚在 \(q\) 维叠加），标准化后消去 \(q\) 的阶，剩余偏倚仅依赖 \(h\) 与设计分布。
证明估计误差部分阶为 \(O(q/n)\)（同全局检验），在 \(q = o(n)\) 下可被吸收。
得标准化后 \(T_{n,L}\) 的极限分布不依赖 \(q\) 与 \(p\)（dimension-agnostic）。
关键跳跃点：
跳跃点 1（全局检验正态化）：从 \(q\) 维二次型的加权卡方到正态的跳跃——需要验证 Lyapunov 条件 \(\sum_{j=1}^q E(|Z_j|^{4+\delta}) / (\sum_{j=1}^q E(Z_j^2))^{2+\delta/2} \to 0\)，其中 \(Z_j\) 为各维度的投影残差。作者利用 \(q \to \infty\) 与 \(4+\delta\) 阶矩有界（A4）保证此条件成立。
跳跃点 2（估计误差在 \(q\) 维空间中的阶压缩）：\(\hat{\theta} - \theta_0\) 是 \(p\) 维向量，其对 \(q\) 维残差投影的影响需要精细控制——作者利用 \(\nabla_\theta m(X_i, \theta_0)\) 的 \(q \times p\) 矩阵结构，将估计误差的贡献写为 \((\hat{\theta}-\theta_0)^{\top} (\sum_i \nabla_\theta m^{\top} e_k) (\sum_i e_k \epsilon_i)\) 形式的交叉项，通过 Cauchy-Schwarz 与 \(q\) 的发散将交叉项阶压至 \(O_p(q/n)\)。
跳跃点 3（ODE 解的敏感性矩阵控制）：ODE 解 \(m(X, \theta)\) 对 \(\theta\) 的导数 \(\nabla_\theta m(X, \theta)\) 涉及变分方程的解（sensitivity matrix），其范数可能随 \(q\) 发散而增长；作者引用 ODE 理论中的稳定性条件，假设敏感性矩阵的范数阶为 \(O(\sqrt{q})\)，保证估计误差部分的阶仍可被 \(q/n\) 控制。
技术技巧点名：
Lyapunov CLT：用于全局检验 \(q\) 维二次型的正态化（替代经典加权卡方极限）。
M-估计线性展开：将 \(\hat{\theta} - \theta_0\) 归约为影响函数的平均（A1），控制估计误差对检验统计量的贡献。
Cauchy-Schwarz 不等式与阶压缩：用于交叉项（估计误差与噪声投影的交互）的阶控制，利用 \(q\) 发散将阶压至 \(O_p(q/n)\)。
ODE 变分方程与敏感性矩阵：用于刻画 \(\nabla_\theta m(X, \theta)\) 的结构，保证 ODE 解情形下估计误差部分的阶可被控制。
U-统计量分解：用于局部检验核平滑统计量的偏倚-方差-估计误差分解。

真实例子与应用： - 数据 / 场景：作者使用了两个真实数据例子：(1) FitzHugh-Nagumo (FHN) ODE 模型（神经动力学简化模型，2 维响应、3 个参数），用于演示 ODE 解作为均值函数的拟合优度检验；(2) 多响应基因表达数据（高维响应，\(q\) 较大），用于演示 \(q\) 发散时检验的势提升。 - 怎么用上去：对 FHN 模型，先估计 ODE 参数 \(\hat{\theta}\)，再计算残差 \(Y_i - m(X_i, \hat{\theta})\)（其中 \(m\) 为 ODE 解的数值近似），最后计算全局与局部检验统计量，与正态极限分布的临界值比较；对基因表达数据，将多基因表达水平作为响应向量，协变量为实验条件，检验线性多响应回归模型的拟合优度。 - 得到什么结果：FHN 模型下，全局与局部检验均正确拒绝不适配的备择模型（如用错误 ODE 结构拟合），且全局检验的 \(p\)-值与正态极限分布的理论 \(p\)-值吻合；基因表达数据下，局部检验的势随 \(q\) 增大而提升，与理论预测一致。 - 想说明什么：验证全局检验的正态弱极限在实际数据中可追踪（无需 bootstrap），展示局部检验的 dimension-agnostic 性质（临界值不随 \(q\) 变化），以及 \(q\) 发散对检测势的提升效应。

🔎 结论是否比证明窄： - 定理 3 的检测速率声称：作者声称检测速率"快于固定维经典最快速率"，但证明中要求 \(\|\Delta(X)\|^2 \asymp q\)（偏离信号在 \(q\) 维上均匀分布）——若偏离信号仅集中在少数响应维度（如 \(\|\Delta(X)\|^2 \asymp 1\)），则检测速率退回固定维水平。此条件在定理陈述中被列为 regularity condition，但作者在 abstract 与 intro 中泛泛声称"快于经典速率"，未明确标注此必要条件。 - dimension-agnostic 性质：定理 2 要求 \(q h^4 / n \to 0\)（偏倚项可被控制），若 \(q\) 发散过快或 \(h\) 过大，此条件不成立，dimension-agnostic 性质失效——作者在定理陈述中标注了此条件，但在 intro 中泛泛声称 dimension-agnostic，未强调此条件的限制性。

四、开放问题（点到为止，扎根具体语句）¶

拟合优度检验的 minimax rate 在高维多响应设定下是什么？ 本文声称检测速率快于固定维经典速率，但未与 minimax 下界对照——扎根于定理 3 的陈述与 intro 中"faster than the fastest possible rates achievable by classical tests"的声称，需查证 Ingster-type minimax test 理论在高维非参设定下的 rate 下界是否与本文速率匹配。
偏离信号 \(\Delta(X)\) 的稀疏结构（仅集中在少数响应维度）下，检验的检测速率与势如何？ 本文定理 3 要求 \(\|\Delta(X)\|^2 \asymp q\)，若偏离信号稀疏（\(\|\Delta(X)\|^2 \asymp s \ll q\)），检测速率是否退回固定维水平？是否有适应稀疏偏离的检验可达到更优速率？——扎根于定理 3 的 regularity condition 与 intro 中"increase in the number of responses can enhance the sensitivity"的声称（此声称隐含假设偏离非稀疏）。
ODE 解的敏感性矩阵范数阶 \(O(\sqrt{q})\) 的假设是否可弱化或验证？ 本文假设 A3 中敏感性矩阵的范数阶为 \(O(\sqrt{q})\)，但 ODE 解对参数的敏感性可能随 \(q\) 发散而超线性增长（如刚性 ODE）——扎根于假设 A3 的陈述与 ODE 变分方程的理论，需查证刚性 ODE 文献中敏感性矩阵的阶是否可被控制。
全局检验的正态弱极限在 \(q\) 固定（不发散）时是否可通过其他途径可追踪？ 本文的正态极限依赖 \(q \to \infty\)，但实际中 \(q\) 可能较小（如 FHN 模型 \(q=2\)）——扎根于定理 1 的 \(q \to \infty\) 条件与 FHN 实例中 \(q=2\) 的矛盾（作者在实例中用正态极限，但 \(q=2\) 不满足 \(q \to \infty\)），需查证固定维多响应下是否有 bootstrap 或其他逼近方法可替代正态极限。

Maintained by 陈星宇 · Homepage · Source on GitHub

Goodness-of-fit tests for high-dimensional parametric multiresponse regressions¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论