Testing relevant hypotheses in functional variance function via self‐normalization¶

作者: Qirui Hu
来源: Scandinavian Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 6/10
机构绿灯: Tsinghua University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1111/sjos.12788

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在污染函数型数据（contaminated functional data，即观测到的是真实潜在轨迹加上异方差测量误差的过程）中，如何对方差函数（variance function，测量误差的方差随时间/指标变化的函数）进行假设检验。当前该方向的成熟度处于方法成型期：非参数方差函数估计已有较成熟的样条与核方法，但针对方差函数的检验长期受困于“精确相等假设过度敏感”与“污染数据下误差不可观测”两个瓶颈，近年开始向“relevant hypothesis（相关假设/容忍微小偏差的假设）”与“oracle efficiency（基于不可观测轨迹的渐近效率）”转移。

发展脉络： - 奠基工作（方差函数估计与检验的起步）：早期对函数型数据方差/协方差结构的估计与检验，如 Rice & Silverman (1991) 与 Diggle & Verbyla (1998)，建立了用核或样条平滑方差函数的基础，但主要关注点估计或精确相等检验，未触及“relevant deviation”概念。 - 主要进展（relevant hypothesis 概念的引入与函数型检验）：Dette & Staude (2012) 等工作在非参数回归与方差分析中引入了“relevant hypothesis”（原假设为偏差小于某阈值 \(\epsilon\)，而非严格等于0），解决了经典精确相等检验对微小偏离过度敏感的问题；随后 Dette et al. (2020) 等将其推广至函数型均值与协方差检验，但留下的口子是：这些检验多假设潜在轨迹已知或直接可观测，未处理污染数据（测量误差与轨迹混杂）的情形。 - 当前 frontier（污染数据下的方差函数推断）：近年对污染函数型数据的方差函数估计，如 Cai & Yuan (2011) 与 Shen et al. (2020)，发展了 spline-backfitted kernel smoothing（SBK）等方法，先估轨迹再估方差，证明了在一定条件下可达到 oracle 性质（即基于估出轨迹的方差估计，渐近等价于基于真实轨迹的估计）。但推断（检验）层面，如何在污染数据下构造方差函数的检验统计量并保持 oracle 效率，仍是未解问题。 - 本文的位置：本文填补了“relevant hypothesis”与“污染函数型数据推断”的交汇口——首次在污染数据下，用 SBK 估计方差函数，并用 self-normalization（自归一化）构造检验统计量，证明其具备 oracle efficiency。

子线索聚类： 1. Relevant hypothesis 检验线：Dette & Staude (2012), Dette et al. (2020) 等。这一簇在做：将传统 \(H_0: \theta = 0\) 改为 \(H_0: \|\theta\| \leq \epsilon\)（relevant deviation），避免过度拒绝，主要在回归与函数型均值/协方差中实现，尚未进入方差函数与污染数据设定。 2. 污染函数型数据方差估计线：Cai & Yuan (2011), Shen et al. (2020) 等。这一簇在做：在 \(Y(t) = X(t) + \epsilon(t)\) 模型下，用 SBK 或类似两步法估计 \(\text{Var}(\epsilon(t))\)，证明 oracle 估计性质，但只做估计、未做检验。 3. Self-normalization 在非参数检验中的应用线：Shao (2010), Dette et al. (2020) 等。这一簇在做：用自归一化（统计量除以其自身长期方差的自估）消除非参数检验中对长期方差估计的依赖，提升稳健性，已在均值变点与回归检验中成功，本文首次将其与 SBK 结合用于方差函数检验。

这个方向在追问的核心问题： 1. 如何避免精确相等检验的过度敏感性？——当前主流是 relevant hypothesis（容忍阈值 \(\epsilon\)），已知瓶颈在于阈值 \(\epsilon\) 的选择与检验统计量在边界 \(\|\theta\| = \epsilon\) 处的渐近分布控制。 2. 在污染数据下，如何从观测过程 \(Y(t)\) 推断不可观测的误差方差函数？——当前主流是 SBK 两步法（先估轨迹 \(X(t)\) 再估方差），已知瓶颈在于第一步估计误差如何传导至第二步检验统计量，以及是否能消除该误差影响达到 oracle efficiency。 3. 非参数检验统计量的长期方差估计难题如何绕过？——当前主流是 self-normalization，已知瓶颈在于自归一化统计量的分布非标准（需特殊临界值表），且在 relevant hypothesis 边界处的自归一化行为需专门分析。

⚠️ 作者的 framing（这是作者的说法）： - 作者把缺口 frame 成：“现有 relevant hypothesis 检验未覆盖污染函数型数据的方差函数，且缺乏 oracle efficiency 保证”，从而使本文“在污染数据下用 SBK + self-normalization 构造具备 oracle efficiency 的方差函数 relevant hypothesis 检验”成为显然的下一步。 - 被淡化或回避的竞争路线：作者未讨论基于局部多项式或小波的方差函数检验（这些方法在非参数方差估计中是 SBK 的竞争者），也未讨论基于 bootstrap 或 subsampling 的检验临界值获取（这些是 self-normalization 的替代方案，尤其在 relevant hypothesis 边界处可能更灵活）。 - 明显该被引却未出现的：关于 relevant hypothesis 检验在变点问题中的近期进展（如 Dette & Gösmann 2020 关于 relevant change-point 的论文，作者虽做了变点检验但引用中未见该具体工作），以及函数型数据方差检验的 bootstrap 方法（如 Fremdt et al. 2014 等）。这值得研究者去查：是作者刻意回避了竞争路线，还是这些工作与本文设定不兼容？

张力：未见明显对立引用。被引的 SBK 估计工作（证明 oracle 估计性质）与 self-normalization 检验工作（证明无需长期方差估计的稳健性）在本文中是互补关系，无矛盾。但存在一个隐性张力：SBK 的 oracle 估计性质要求测量误差满足特定矩条件与光滑性，而 self-normalization 在 relevant hypothesis 边界处的渐近分布要求偏差项可控——本文假设两者兼容，但若 SBK 的矩条件与 self-normalization 的偏差控制条件有冲突（例如 SBK 要求误差四阶矩有界，而 self-normalization 在边界处要求更高阶矩以控制尾部），则可能存在条件过强的问题，值得研究者核验本文 Assumption 列表。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚

符号与参数：
\(t\)：连续指标（如时间），\(t \in [0, 1]\)。
\(X_i(t)\)：第 \(i\) 个个体的潜在轨迹（latent trajectory），不可直接观测。
\(\epsilon_i(t)\)：第 \(i\) 个个体的测量误差（measurement error），不可观测，假设与 \(X_i(t)\) 独立，且 \(\mathbb{E}[\epsilon_i(t)] = 0\)。
\(\sigma^2(t) := \text{Var}(\epsilon_i(t)) = \mathbb{E}[\epsilon_i(t)^2]\)：方差函数（variance function），本文的核心推断对象，是 \(t\) 的未知非参数函数。
\(\epsilon\)：relevant hypothesis 的容忍阈值（tolerance parameter），由研究者预设，代表“可忽略的偏差大小”。
\(d(\sigma_1^2, \sigma_2^2)\)：两方差函数间的距离度量（如 \(L^2\) 距离 \(d = \int (\sigma_1^2 - \sigma_2^2)^2 dt\)）。
\(n\)：样本量（个体数）。
\(m\)：每个个体在 \([0,1]\) 上的观测点数（离散化密度）。
\(T_{i,j}\)：第 \(i\) 个个体在第 \(j\) 个观测点的时间，\(j=1,\dots,m\)。
\(K\)：核函数（如 Epanechnikov 核）。
\(h\)：核平滑的带宽。
\(SN_n\)：self-normalization 统计量（具体定义见下文最小内核）。
模型（数据生成机制）：
污染函数型数据模型：\(Y_i(t) = X_i(t) + \epsilon_i(t)\)。
\(X_i(t)\) 是独立同分布的随机过程，均值函数 \(\mu(t) = \mathbb{E}[X_i(t)]\)，协方差函数 \(C_X(t,s) = \text{Cov}(X_i(t), X_i(s))\)。
\(\epsilon_i(t)\) 是独立同分布的白噪声过程（对不同 \(i\) 独立，对同一 \(i\) 在不同 \(t\) 可能独立或弱相关，本文假设 \(\epsilon_i(t)\) 在 \(t\) 上独立或满足特定光滑性）。
\(\sigma^2(t)\) 是 \(t\) 的光滑函数（满足一定 Hölder 或 Sobolev 条件）。
观测设计：\(T_{i,j}\) 可以是固定设计（等距）或随机设计（均匀分布），本文主要处理固定设计。
可观测数据：
研究者实际能观测到的是：离散采样带噪过程 \(\{Y_i(T_{i,j}) : i=1,\dots,n; j=1,\dots,m\}\)。
不可观测、只能靠假设与估计去识别的：潜在轨迹 \(X_i(t)\)、测量误差 \(\epsilon_i(t)\)、方差函数 \(\sigma^2(t)\)（需从 \(Y_i\) 中剥离 \(X_i\) 后才能估 \(\sigma^2\)）。

第二步：讲最小内核

整篇论文的证明与方法本质上是单样本 relevant hypothesis 检验这一特例的推广（两样本、变点等都是在此内核上叠加距离度量与样本划分）。最小内核如下：

最简特例：单样本方差函数的 relevant hypothesis 检验（\(d=1\) 维指标 \(t\)，无变点，单组样本）

要检验的命题：
原假设 \(H_0: d(\sigma^2, \sigma_0^2) \leq \epsilon\)（方差函数 \(\sigma^2(t)\) 与某参考函数 \(\sigma_0^2(t)\) 的 \(L^2\) 距离不超过容忍阈值 \(\epsilon\)，即“无相关偏离”）。
备择假设 \(H_1: d(\sigma^2, \sigma_0^2) > \epsilon\)（存在相关偏离）。
其中 \(\sigma_0^2(t)\) 可以是常数函数（检验方差是否几乎齐性）或其他指定函数。
核心困难：\(\sigma^2(t)\) 不可直接观测，需从 \(Y_i(T_{i,j})\) 中估。传统两步法（先估 \(X_i(t)\) 得残差 \(\hat{\epsilon}_i(t) = Y_i(t) - \hat{X}_i(t)\)，再用残差估 \(\hat{\sigma}^2(t)\)）会引入第一步估计误差，导致基于 \(\hat{\sigma}^2(t)\) 的检验统计量与基于真实 \(\sigma^2(t)\) 的统计量渐近不等价（非 oracle）。此外，非参数检验统计量的长期方差估计 notoriously 困难。
本文关键想法怎么破：
SBK 估计方差函数：用样条回扣核平滑（spline-backfitted kernel smoothing）估 \(\hat{X}_i(t)\)（样条全局估均值与协方差结构，核局部回扣残差），再构造 \(\hat{\sigma}^2(t)\)。SBK 的关键性质是：在 \(m \to \infty\)（密集采样）与 \(n \to \infty\) 下，\(\hat{\sigma}^2(t)\) 与基于真实 \(X_i(t)\) 的 oracle 估计 \(\sigma^{2,*}(t)\) 的差以 \(O_P\) 速率可忽略，即 \(\|\hat{\sigma}^2 - \sigma^{2,*}\| = o_P(1/\sqrt{n})\)。
Self-normalization 消除长期方差估计：构造检验统计量 \(T_n = n \cdot d(\hat{\sigma}^2, \sigma_0^2)\)，但不用传统 \(\chi^2\) 临界值（需估长期方差），而是构造自归一化统计量：
\[SN_n = \frac{T_n}{V_n} = \frac{n \cdot d(\hat{\sigma}^2, \sigma_0^2)}{\int_0^1 \int_0^1 \hat{\Gamma}(t,s) dW(t) dW(s)}\]
其中 \(\hat{\Gamma}(t,s)\) 是基于 \(\hat{\sigma}^2(t)\) 的长期方差估计，\(W(t)\) 是权重过程（如 Brownian bridge 或确定性权重）。自归一化使得 \(SN_n\) 的渐近分布不依赖未知长期方差参数，只需查自归一化临界值表。
Oracle efficiency 的成立逻辑：由于 SBK 使得 \(\hat{\sigma}^2(t)\) 与 \(\sigma^{2,*}(t)\) 渐近不可区分（差为 \(o_P(1/\sqrt{n})\)），而 \(T_n\) 与 \(SN_n\) 都是 \(\hat{\sigma}^2(t)\) 的连续泛函，因此基于 \(\hat{\sigma}^2\) 的 \(SN_n\) 与基于 \(\sigma^{2,*}\) 的 \(SN_n^*\) 渐近等价（差为 \(o_P(1)\)），即基于观测数据的检验与基于真实轨迹的检验渐近不可区分——这就是 oracle efficiency。
在这个特例下，要证的命题退化成什么：
在 \(H_0\) 边界（\(d(\sigma^2, \sigma_0^2) = \epsilon\)）下，\(SN_n\) 收敛到某已知分布（如 self-normalized Gaussian limit），从而可计算临界值。
在 \(H_1\) 下（\(d(\sigma^2, \sigma_0^2) > \epsilon\)），\(SN_n \to \infty\)，检验一致拒绝。
Oracle efficiency：\(\|SN_n - SN_n^*\| = o_P(1)\)，其中 \(SN_n^*\) 是基于真实轨迹的 oracle 统计量。
为什么成立（证明直觉）：
SBK 的 oracle 估计性质（Shen et al. 2020 已证）保证了 \(\hat{\sigma}^2 - \sigma^{2,*}\) 的高阶余项可忽略。
Self-normalization 的分母 \(V_n\) 与分子 \(T_n\) 在 \(H_0\) 边界处同阶增长（都是 \(O_P(1)\)），使得 \(SN_n\) 比值稳定；在 \(H_1\) 下分子主导（\(O_P(n)\)），分母为 \(O_P(1)\)，比值发散。
连续映射定理 + Slutsky 定理传递 oracle 性质：\(\hat{\sigma}^2 \approx \sigma^{2,*}\) ⇒ \(T_n \approx T_n^*\), \(V_n \approx V_n^*\) ⇒ \(SN_n \approx SN_n^*\)。

三、这篇论文做了什么¶

三句话： ①研究了污染函数型数据中方差函数的 relevant hypothesis 检验问题（单样本、两样本、变点）。 ②核心工具是 spline-backfitted kernel smoothing（SBK）估计方差函数 + self-normalization（自归一化）构造检验统计量。 ③主要结论是：所提检验统计量具备 oracle efficiency（基于观测数据的检验与基于真实轨迹的检验渐近不可区分），且自归一化避免了长期方差估计的难题。

关键设定与假设：在第二节最小记号基础上补全完整设定：

设定：
模型：\(Y_i(T_{i,j}) = X_i(T_{i,j}) + \epsilon_i(T_{i,j})\)，\(i=1,\dots,n\), \(j=1,\dots,m\)。
潜在轨迹 \(X_i(t)\) 的均值 \(\mu(t)\) 与协方差 \(C_X(t,s)\) 用样条估计（全局平滑）。
方差函数 \(\sigma^2(t)\) 用核平滑残差估计（局部平滑），带宽 \(h\)。
Relevant hypothesis 的距离度量：\(L^2\) 距离 \(d(f, g) = \int_0^1 (f(t) - g(t))^2 dt\)。
假设（逐条说明统计含义与放宽/强化）：
Assumption 1（轨迹光滑性）：\(\mu(t)\), \(C_X(t,s)\), \(\sigma^2(t)\) 满足二阶或更高阶 Hölder 连续条件。统计含义：保证样条与核估计的偏差收敛速率足够快（\(O(h^2)\) 或更高），使得 SBK 的 oracle 性质成立。相比已有 SBK 估计文献（如 Shen et al. 2020），本文对 \(\sigma^2(t)\) 的光滑性要求可能更高（需控制检验统计量的偏差项），这是强化。
Assumption 2（测量误差结构）：\(\epsilon_i(t)\) 对不同 \(i\) 独立，对同一 \(i\) 在不同 \(t\) 独立（白噪声）或满足弱相关条件；\(\mathbb{E}[\epsilon_i(t)^4] < \infty\)（四阶矩有界）。统计含义：四阶矩有界是构造方差估计的方差（即方差估计的长期方差）所必需的，也是 self-normalization 分母收敛的必要条件。相比 SBK 估计文献（通常只需二阶矩），这是强化。
Assumption 3（采样设计）：\(T_{i,j}\) 为固定等距设计或随机均匀设计，\(m \to \infty\) 且 \(m\) 相对 \(n\) 足够大（\(m \gg n^{1/2}\) 或类似条件）。统计含义：密集采样是 SBK oracle 性质的关键——只有 \(m\) 足够大，样条估计轨迹的误差才能被核平滑充分吸收。与 SBK 估计文献一致，未放宽。
Assumption 4（带宽条件）：核带宽 \(h\) 满足 \(n h^2 \to 0\)（欠平滑）与 \(n h^4 \to \infty\)（不过度平滑）。统计含义：欠平滑保证偏差项不主导检验统计量（偏差 \(o_P(1/\sqrt{n})\)），不过度平滑保证方差项可估。这是非参数检验中的标准条件，与 relevant hypothesis 检验文献（Dette et al. 2020）一致，未放宽。

主要结果：

Theorem 1（单样本 relevant hypothesis 检验的 oracle efficiency 与渐近分布）：
陈述：在 \(H_0\) 边界（\(d(\sigma^2, \sigma_0^2) = \epsilon\)）下，自归一化统计量 \(SN_n\) 收敛到分布 \(\mathcal{L}\)（具体分布由权重过程 \(W\) 决定，如 self-normalized Brownian bridge 泛函）；在 \(H_1\) 下，\(SN_n \to_P \infty\)。且 \(\|SN_n - SN_n^*\| = o_P(1)\)，其中 \(SN_n^*\) 是基于真实轨迹的 oracle 统计量。
直觉：SBK 使得 \(\hat{\sigma}^2\) 与 \(\sigma^{2,*}\) 渐近不可区分，连续映射传递至 \(SN_n\)；self-normalization 在边界处稳定化比值，在备择处放大信号。
必要条件：Assumption 1-4 全部需要，尤其 \(m \gg n^{1/2}\)（密集采样）与 \(n h^2 \to 0\)（欠平滑带宽）是 oracle efficiency 的核心必要条件。
解决的技术难点：①在污染数据下，证明 SBK 方差估计的余项 \(\hat{\sigma}^2 - \sigma^{2,*}\) 在 \(L^2\) 范数下为 \(o_P(1/\sqrt{n})\)（需控制样条估计误差的核平滑传导）；②在 relevant hypothesis 边界处，证明自归一化统计量的渐近分布不受偏差项干扰（需偏差项为 \(o_P(1/\sqrt{n})\)，由欠平滑带宽保证）。
Theorem 2（两样本 relevant hypothesis 检验）：
陈述：对两独立组 \(Y_i^{(1)}(t) = X_i^{(1)}(t) + \epsilon_i^{(1)}(t)\) 与 \(Y_i^{(2)}(t) = X_i^{(2)}(t) + \epsilon_i^{(2)}(t)\)，检验 \(H_0: d(\sigma_1^2, \sigma_2^2) \leq \epsilon\)，构造的 \(SN_n^{(2)}\) 同样具备 oracle efficiency 与相同的渐近分布 \(\mathcal{L}\)。
直觉：两样本统计量是单样本的差分版本，两组 SBK 估计误差独立且都可忽略，差分的 oracle 性质由单样本传递。
必要条件：两组均满足 Assumption 1-4，且样本量 \(n_1, n_2 \to \infty\) 满足 \(n_1/n_2 \to c \in (0, \infty)\)（平衡增长）。
Theorem 3（变点 relevant hypothesis 检验）：
陈述：对存在潜在变点 \(\tau\) 的单组数据，检验 \(H_0: d(\sigma^2_{[0,\tau]}, \sigma^2_{[\tau,1]}) \leq \epsilon\)（变点前后方差函数无相关偏离），构造的自归一化变点统计量 \(SN_n^{(cp)}\) 具备 oracle efficiency，渐近分布为变点版 self-normalized 分布。
直觉：变点检验是两样本检验的时变版本，用扫描统计量（对候选变点 \(\tau\) 逐点计算两样本 \(SN\)）取 supremum，oracle 性质由逐点传递至 supremum（需连续性保证）。

证明路线与技术技巧：

整体路线（3-5 步逻辑主干）：
SBK 方差估计的 oracle 余项控制：证明 \(\|\hat{\sigma}^2 - \sigma^{2,*}\|_{L^2} = o_P(1/\sqrt{n})\)，即基于观测数据的方差估计与基于真实轨迹的 oracle 估计渐近不可区分。这一步是全文地基，依赖样条估计误差的核平滑衰减分析。
检验统计量的 oracle 传递：证明 \(|T_n - T_n^*| = o_P(1)\) 与 \(|V_n - V_n^*| = o_P(1)\)，即分子与分母的 oracle 性质。由步骤 1 + 连续映射定理（\(L^2\) 范数的连续性）直接得到。
Self-normalization 统计量的渐近分布：在 \(H_0\) 边界处，证明 \(SN_n^*\)（oracle 统计量）收敛到 \(\mathcal{L}\)。这一步依赖长期方差估计的收敛性 + 权重过程的泛函极限定理（类似 Shao 2010 的 self-normalization 理论）。
Oracle efficiency 的合成：由步骤 2 + 3，\(SN_n = SN_n^* + o_P(1)\)，且 \(SN_n^* \to \mathcal{L}\)，故 \(SN_n \to \mathcal{L}\)（Slutsky 定理）。
备择假设下的一致拒绝：在 \(H_1\) 下，\(T_n = O_P(n)\)（信号主导），\(V_n = O_P(1)\)（方差稳定），故 \(SN_n \to_P \infty\)。
关键跳跃点：
Lemma 1（SBK 方差估计的 oracle 余项展开）：这是最吃功夫的引理。需将 \(\hat{\sigma}^2(t) - \sigma^{2,*}(t)\) 展开为样条估计误差的核平滑积分 + 测量误差的核平滑余项，并证明两项分别为 \(o_P(1/\sqrt{n})\)。难点卡在：样条估计误差是全局的（依赖所有观测点），核平滑是局部的，需控制全局误差在局部积分下的衰减速率；作者用样条基函数的局部支撑性质 + 核平滑的偏差-方差分解绕过去。
Lemma 2（self-normalization 分母的长期方差估计收敛）：需证明 \(\hat{\Gamma}(t,s)\)（基于 \(\hat{\sigma}^2\) 的长期方差估计）收敛到真实 \(\Gamma(t,s)\)，且收敛速率足够快（\(o_P(1)\)）。难点卡在：\(\hat{\Gamma}\) 是 \(\hat{\sigma}^2\) 的二次泛函，需控制 \(\hat{\sigma}^2\) 误差在二次泛函下的传导；作者用delta 方法 + 二阶泰勒展开绕过去，余项由 Lemma 1 的 \(o_P(1/\sqrt{n})\) 保证。
技术技巧点名：
Spline-backfitted kernel smoothing (SBK)：用样条全局估轨迹均值与协方差，核局部回扣残差估方差。用在步骤 1，起作用是：样条全局捕捉低频结构，核局部捕捉高频方差变化，两者结合使方差估计的偏差与方差同时可控，达到 oracle 速率。
Self-normalization (SN)：统计量除以其自身长期方差的自估。用在步骤 3-4，起作用是：消除对长期方差参数的依赖，避免非参数长期方差估计的偏差与慢收敛问题，使检验临界值只依赖已知分布 \(\mathcal{L}\)。
连续映射定理 + Slutsky 定理传递 oracle 性质：用在步骤 2-4，起作用是：将估计层面的 oracle 性质（\(\hat{\sigma}^2 \approx \sigma^{2,*}\)）传递至检验统计量层面（\(SN_n \approx SN_n^*\)），无需重新分析 \(SN_n\) 的渐近分布。
欠平滑带宽选择：带宽 \(h\) 满足 \(n h^2 \to 0\)。用在步骤 1-3，起作用是：使核估计的偏差项为 \(o_P(1/\sqrt{n})\)，不主导检验统计量，保证 relevant hypothesis 边界处的分布收敛。
Delta 方法 + 二阶泰勒展开：用在 Lemma 2，起作用是：将 \(\hat{\sigma}^2\) 的误差传导至长期方差估计 \(\hat{\Gamma}\)（二次泛函），控制余项。

真实例子与应用：

模拟实验：
用的什么数据/场景：模拟污染函数型数据，潜在轨迹 \(X_i(t)\) 用 Fourier 基生成（均值与协方差已知），测量误差 \(\epsilon_i(t)\) 用高斯白噪声（方差函数 \(\sigma^2(t)\) 设为常数、线性、或非线性函数），样本量 \(n=50, 100, 200\)，观测点数 \(m=50, 100, 200\)。
怎么把本文方法用上去：对单样本、两样本、变点三种设定，分别构造 relevant hypothesis（设容忍阈值 \(\epsilon\)），用 SBK + SN 计算检验统计量，与 oracle 检验（基于真实轨迹）和传统精确相等检验对比。
得到什么结果：①本文检验的经验水平在 \(H_0\) 边界处接近名义水平（5%），而传统精确相等检验过度拒绝（水平远超 5%）；②本文检验的幂函数在 \(H_1\) 下随偏离量 \(\Delta\) 增长迅速，且与 oracle 检验的幂几乎重合（验证 oracle efficiency）；③对带宽 \(h\) 的选择在一定范围内稳健（欠平滑范围内水平与幂稳定）。
这个例子想说明什么：验证理论预言的 oracle efficiency 与 relevant hypothesis 的实用性（避免过度敏感），展示相对传统精确相等检验的优势。
EEG 数据分析：
用的什么数据/场景：真实 EEG（脑电图）数据，来自某酒精ism 研究实验，包含对照组与治疗组各 \(n=77\) 个个体的多通道 EEG 时间序列（每个个体约 256 个时间点）。
怎么把本文方法用上去：将 EEG 信号视为污染函数型数据（潜在脑电活动轨迹 + 测量噪声），对两样本设定检验两组方差函数的 relevant hypothesis（\(H_0: d(\sigma_1^2, \sigma_2^2) \leq \epsilon\)，即两组测量误差方差几乎无差异），对变点设定检验单个个体 EEG 方差函数是否存在 relevant 变点（如刺激响应前后）。
得到什么结果：①两样本检验：对某些通道，传统精确相等检验拒绝 \(H_0\)（认为两组方差不同），但本文 relevant 检验不拒绝（偏离量小于阈值 \(\epsilon\)），说明差异虽统计显著但实际可忽略；②变点检验：检测到部分个体在刺激时刻存在方差函数的 relevant 变点（方差变化量超过阈值）。
这个例子想说明什么：展示 relevant hypothesis 在真实数据中的实际价值——区分“统计显著但实际无意义”与“实际有意义”的偏离，以及本文方法在污染数据（EEG 带噪）下的可行性。

🔎 结论是否比证明窄： - 本文在 Theorem 1-3 的陈述中，oracle efficiency 的结论是在 Assumption 1-4 下严格证明的（\(\|SN_n - SN_n^*\| = o_P(1)\)），但作者在 introduction 与 abstract 中泛泛 claim “developed procedures are asymptotically indistinguishable from those with true trajectories”，未明确强调这仅在密集采样（\(m \gg n^{1/2}\)）与欠平滑带宽（\(n h^2 \to 0\)）条件下成立。若 \(m\) 与 \(n\) 同阶增长（稀疏采样），SBK 的 oracle 性质可能不成立，此时结论是否仍成立未证明——这是一个条件 X 下严格证明、却被泛泛 claim 的地方，研究者需核验作者是否在 discussion 中承认此限制。 - 此外，自归一化统计量的渐近分布 \(\mathcal{L}\) 的具体形式在定理陈述中给出，但临界值需通过模拟或查表获取，作者未给出 \(\mathcal{L}\) 的解析表达式——这是 self-normalization 文献的常态，但严格来说，定理只证明了收敛到 \(\mathcal{L}\)，而“检验水平可控”依赖 \(\mathcal{L}\) 临界值的可获取性，这一点在证明中未涉及，属于证明窄于实践使用的缝隙。

四、开放问题（点到为止，扎根具体语句）¶

稀疏采样下的方差函数 relevant hypothesis 检验：本文 oracle efficiency 依赖密集采样（\(m \gg n^{1/2}\)，Assumption 3），若 \(m\) 有界或 \(m = O(n^{1/2})\)（稀疏函数型数据），SBK 的 oracle 性质不成立，此时如何构造方差函数检验？需证什么：在 \(m\) 有界下，方差函数检验统计量的渐近分布与效率界。扎根在：作者在 Section 2 假设 \(m \to \infty\) 且 \(m\) 相对 \(n\) 足够大，未讨论 \(m\) 有界情形。
容忍阈值 \(\epsilon\) 的数据驱动选择：本文 relevant hypothesis 的阈值 \(\epsilon\) 由研究者预设，未提供数据驱动选择方法。需估什么：基于数据的 \(\epsilon\) 选择准则（如基于方差函数估计的置信带或效应量准则），使得检验水平与幂有保证。扎根在：作者在 introduction 提到“tolerance parameter \(\epsilon\) is pre-specified”，未讨论如何从数据中选 \(\epsilon\)。
非白噪声测量误差下的检验：本文假设 \(\epsilon_i(t)\) 在 \(t\) 上独立（白噪声，Assumption 2），若测量误差存在自相关（如 EEG 中的仪器噪声可能有色），长期方差估计与 self-normalization 分母的结构会改变。需证什么：在 \(\epsilon_i(t)\) 弱相关下，SBK + SN 检验的 oracle efficiency 与渐近分布。扎根在：Assumption 2 假设 \(\epsilon_i(t)\) 独立，作者未讨论弱相关情形。
与 bootstrap/subsampling 临界值方法的比较：本文用 self-normalization 获取临界值，但 bootstrap 或 subsampling 是非参数检验中获取临界值的竞争方法，尤其在 relevant hypothesis 边界处可能更灵活。需算什么：在 relevant hypothesis 边界处，bootstrap 临界值的渐近正确性与幂函数，与 self-normalization 的对比。扎根在：作者在 introduction 只引用 self-normalization 文献（Shao 2010），未提及 bootstrap 检验文献（如 Fremdt et al. 2014），这条也是第一节中“明显该被引却未出现”的线索。

（要确认某条是不是真 gap，去读同子领域近期约 5 篇的 intro——都指向稀疏采样或 \(\epsilon\) 选择 = 共识真 gap；互相打架 = 机会。）

Maintained by 陈星宇 · Homepage · Source on GitHub

Testing relevant hypotheses in functional variance function via self‐normalization¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论