From dense to sparse design: Optimal rates under the supremum norm for estimating the mean function in functional data analysis¶

作者: Max Berger, Philipp Hermann, Hajo Holzmann
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在离散、有噪的观测条件下，如何为随机过程的均值函数提供均匀（supremum norm）意义上的最优估计与推断。具体而言，当研究者无法观测到连续的完整轨迹，只能在有限的设计点上获取带测量误差的样本时，估计的收敛速率如何随“样本曲线数 \(n\)”与“每条曲线上的观测点数 \(p\)”的相对大小而发生相变，以及在 supremum norm 下这种相变的结构与已知的 \(L_2\) 理论有何不同。当前该方向的成熟度表现为：\(L_2\) 下的相变理论已基本闭合，supremum norm 下的点态与均匀置信带构造已有若干方法，但关于 supremum norm 下最优收敛速率的精确刻画（特别是无对数因子的 \(\sqrt{n}\) 速率与中间 regime 的存在性）仍存在明显缺口。

发展脉络： - 奠基工作：Hall, Muller, Wang (2006) 首次系统探讨了 FDA 中主成分分析的收敛速率，区分了稀疏与稠密设定下估计问题的非参与半参本质，指出稠密下可达 \(\sqrt{n}\) 速率。但他们的分析主要在 \(L_2\) 或点态误差下进行。 - 主要进展（\(L_2\) 相变闭合）：Cai and Yuan (2011) 在 \(L_2\) 下给出了离散观测均值估计的 minimax 最优速率，明确刻画了 sparse（离散化项主导）与 dense（可达参数化 \(\sqrt{n}\) 速率）的相变阈值，并指出在 common design 下稠密时甚至不需要平滑（插值即可）。Li and Hsing (2010) 则在更一般的框架下探讨了均匀收敛速率，初步触及了稀疏与稠密的相对关系，并在异步随机设计下给出了一个含 \(\log(n)/(np)\) 项的中间速率（Corollary 3.2(a)），但未在固定同步设计下深入此现象。 - 当前 frontier（supremum norm 的缺口）：Degras (2011), Chang et al. (2017), Xiao (2020), Kalogridis and Van Aelst (2022) 等在固定同步设计下探讨了 supremum norm 的收敛速率与置信带构造。然而，作者在引言中明确指出：这些工作在稠密设定下均未能达到无额外对数因子的 \(\sqrt{n}\) 速率，且未系统讨论 sparse-dense 之间是否存在由观测误差主导的中间 regime。Wang et al. (2020) 虽处理了多元图像数据的稠密情形，但假设体系更为复杂，未给出一般性的最优速率框架。 - 本文的位置：本文填补了固定同步设计下 supremum norm 的最优速率缺口——揭示了 \(L_2\) 中不存在的“观测误差主导的中间 regime”，证明了稠密下插值估计量的 sub-optimality，并构造了在稠密情形下达到无对数因子 \(\sqrt{n}\) 速率的新估计量，同时给出了 supremum norm 下的中心极限定理。

子线索聚类： 1. \(L_2\) 最优速率与相变理论：Cai and Yuan (2011), Li and Hsing (2010), Zhang and Wang (2016)。这一簇的核心是确立 \(L_2\) 下 sparse 与 dense 的相变阈值，并证明稠密下插值估计量已足够最优。 2. Supremum norm 下的均匀置信带与收敛速率：Degras (2011), Xiao (2020), Kalogridis and Van Aelst (2022), Liebl and Reimherr (2019)。这一簇致力于在 supremum norm 下构造置信带并给出收敛速率，但普遍在稠密情形留下了对数因子或未触及中间 regime。 3. 多元/图像 FDA 与特定应用：Wang et al. (2020), Morris (2014)。这一簇将 FDA 推向二维/高维设计域（如脑影像），但理论框架往往针对特定数据结构，未提炼一般性的 minimax 相变规律。

这个方向在追问的核心问题： 1. 在离散观测下，均值函数估计的 minimax 收敛速率在 sparse 与 dense 之间的相变阈值与结构是什么？（\(L_2\) 下已闭合，supremum norm 下未闭合） 2. 在 supremum norm 下，稠密情形能否达到无对数因子的参数化 \(\sqrt{n}\) 速率？需要怎样的估计量构造？ 3. Supremum norm 与 \(L_2\) 的相变结构是否一致？是否存在 \(L_2\) 分析中无法捕捉的中间 regime？ 4. 如何基于 supremum norm 的最优速率构造均匀置信带（即中心极限定理）？

当前主流方法在 supremum norm 下普遍依赖局部线性平滑或惩罚样条，瓶颈在于：稠密下这些平滑估计量往往带有对数因子损耗，且未意识到插值估计量在 supremum norm 下的 sub-optimality。

⚠️ 作者的 framing： - 作者将缺口 frame 为：\(L_2\) 理论已闭合，但 supremum norm 下存在三个未被已有文献覆盖的现象——中间 regime、插值的 sub-optimality、无对数因子的 \(\sqrt{n}\) 速率。这使得本文成为“显然的下一步”：补全 supremum norm 下的完整相变图谱。 - 被淡化或回避的竞争路线：作者未深入讨论异步/ 随机设计下的 supremum norm 相变（仅一句提及 Li and Hsing (2010) 的 Corollary 3.2(a)），也未与 Liebl and Reimherr (2019) 的快速置信带方法进行速率对比。此外，惩罚样条在稠密 supremum norm 下是否也能达到无对数因子 \(\sqrt{n}\) 速率，作者未做正面比较，仅指出局部线性平滑的局限。 - 明显该被引却未出现的文献：关于高维/多元非参回归在 supremum norm 下的 minimax 速率（如 \(d>1\) 时的局部多项式或样条的精确常数与对数因子处理），以及关于 dense design 下“平滑 vs 插值”sub-optimality 的更早期理论探讨（如果存在）。这是一个值得研究者去查证的方向：是否已有文献在点态或 \(L_2\) 外的 norm 下指出插值的 sub-optimality，而作者未引用？

张力：未见明显对立引用。但存在一个结构性张力：Cai and Yuan (2011) 在 \(L_2\) 下宣称稠密时插值估计量已最优，而本文在 supremum norm 下证明插值是 sub-optimal 的。这并非文献间的矛盾，而是同一问题在不同损失函数下的结论分歧——这恰恰是本文的核心切入点。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(n\)：样本曲线数（独立同分布的随机过程个数）。
\(p\)：每条曲线上的离散观测点数（设计点的个数，本文假设所有曲线共用同一组设计点，即固定同步设计）。
\(d\)：设计域 \(\mathcal{X}\) 的维数（本文允许 \(d \geq 1\)，最简特例取 \(d=1\)）。
\(\alpha\)：均值函数的 Hölder 平滑阶数（\(\alpha > 0\)，函数属于 \(\mathcal{C}^\alpha(\mathcal{X})\)）。
\(X_i(t)\)：第 \(i\) 条随机过程（潜在/连续轨迹，不可直接观测）。
\(\mu(t) = \mathbb{E}[X_i(t)]\)：均值函数——这是要估的目标。
\(Y_{ij}\)：第 \(i\) 条曲线在第 \(j\) 个设计点 \(t_j\) 上的实际观测值（可观测数据）。
\(\varepsilon_{ij}\)：第 \(i\) 条曲线在第 \(j\) 个设计点上的测量误差（不可直接观测，假设 \(\mathbb{E}[\varepsilon_{ij}] = 0\)，方差 \(\sigma^2\)，且与 \(X_i\) 独立）。
可观测数据：\(\{Y_{ij} : 1 \leq i \leq n, 1 \leq j \leq p\}\)，即 \(n \times p\) 的矩阵，加上已知的设计点 \(\{t_j : 1 \leq j \leq p\} \subset \mathcal{X}\)。
不可观测/需假设识别的量：连续轨迹 \(X_i(t)\)（只能在设计点上通过 \(Y_{ij} = \mu(t_j) + (X_i(t_j) - \mu(t_j)) + \varepsilon_{ij}\) 间接获取带噪信息），以及测量误差的方差结构。

模型：数据生成机制为 \(Y_{ij} = \mu(t_j) + Z_i(t_j) + \varepsilon_{ij}\)，其中 \(Z_i(t) = X_i(t) - \mu(t)\) 是均值为零的随机过程（具有某种协方差结构与平滑性），\(\varepsilon_{ij}\) 是 i.i.d. 测量误差。目标是在 supremum norm \(\|\hat{\mu} - \mu\|_\infty = \sup_{t \in \mathcal{X}} |\hat{\mu}(t) - \mu(t)|\) 下，找到 minimax 最优收敛速率，并构造达到该速率的估计量 \(\hat{\mu}\)。

第二步：最小内核（最简特例 \(d=1\), \(\alpha>1/2\)）

剥掉多元与一般平滑阶数的技术外壳，核心数学困难在 \(d=1\) 的固定同步设计下已完全暴露。设设计域 \(\mathcal{X} = [0,1]\)，设计点 \(t_j = j/p\)（等距网格），\(\mu \in \mathcal{C}^\alpha\) 且 \(\alpha > 1/2\)。

最小问题：在 \(n\) 条曲线、每条 \(p\) 个等距观测点的设定下，\(\inf_{\hat{\mu}} \sup_{\mu \in \mathcal{C}^\alpha} \mathbb{E} \|\hat{\mu} - \mu\|_\infty\) 的精确相变结构是什么？特别地，当 \(p\) 相对于 \(n\) 增长时，速率如何从 sparse 过渡到 dense？

相变结构（本文的核心发现）： 1. Sparse regime：当 \(p \leq n^{1/(2\alpha)}\) 时，离散化误差主导，速率为 \((p^{-\alpha} + n^{-1/2} p^{-\alpha+1/2})\)（与 \(L_2\) 下一致）。 2. Intermediate regime（观测误差主导）：当 \(n^{1/(2\alpha)} < p \leq n^{1/(2\alpha-1)}\) 时，测量误差的 supremum norm 贡献主导，速率为 \((\log(p)/(np))^{1/2}\)。这是 \(L_2\) 分析中不存在的现象——在 \(L_2\) 下，此区间内测量误差的 \(L_2\) 贡献为 \((np)^{-1/2}\)，已被 \(\sqrt{n}\) 吸收，但在 supremum norm 下，误差的极大值带来了 \(\sqrt{\log(p)/np}\) 的额外惩罚。 3. Dense regime：当 \(p > n^{1/(2\alpha-1)}\) 时，可达参数化 \(\sqrt{n}\) 速率（无对数因子），即 \(\|\hat{\mu} - \mu\|_\infty = O_P(n^{-1/2})\)。

为什么插值估计量在稠密 supremum norm 下 sub-optimal：插值估计量 \(\hat{\mu}_{\text{interp}}(t_j) = \frac{1}{n} \sum_{i=1}^n Y_{ij}\)（在设计点上取平均，非设计点上插值）。在设计点上，其误差为 \(\frac{1}{n} \sum_{i=1}^n (Z_i(t_j) + \varepsilon_{ij})\)，supremum norm 为 \(\max_{1 \leq j \leq p} |\frac{1}{n} \sum_{i=1}^n (Z_i(t_j) + \varepsilon_{ij})|\)。当 \(p\) 极大时，即使 \(n\) 条曲线的平均已平滑了 \(Z_i\)，\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的阶仍为 \(\sqrt{\log(p)/n}\)（由 i.i.d. 高斯/亚高斯误差的极大值理论决定）。若 \(p\) 指数级增长（如 \(p \gg n\)），\(\sqrt{\log(p)/n}\) 远大于 \(\sqrt{n}\)，导致插值在 supremum norm 下无法达到 \(\sqrt{n}\) 速率。而在 \(L_2\) 下，\(\sum_j (\frac{1}{n} \sum_i \varepsilon_{ij})^2 / p\) 的阶为 \(1/(np)\)，当 \(p\) 足够大时可被忽略，故插值在 \(L_2\) 下最优。

本文如何破局：构造新估计量，在非设计点上使用局部线性平滑（利用 \(p\) 个点的信息平滑掉 \(\varepsilon_{ij}\) 的逐点波动），而在设计点上对平滑估计量进行修正，使得修正后的估计量在设计点上的误差不再受 \(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚支配，从而在稠密下达到无对数因子的 \(\sqrt{n}\) 速率。

三、这篇论文做了什么¶

三句话： ①研究了在固定同步离散设计下、Hölder 平滑均值函数的 supremum norm 最优估计问题； ②核心工具是局部线性平滑结合设计点修正的估计量构造，以及基于极大值理论与 Bernstein 不等式的精细概率界； ③主要结论是揭示了 supremum norm 下由观测误差主导的中间 regime，证明了插值估计量的 sub-optimality，并在稠密情形获得了无对数因子的 \(\sqrt{n}\) 速率与中心极限定理。

关键设定与假设：在第二节最小记号基础上补全： - 设计点：\(\{t_1, \ldots, t_p\} \subset \mathcal{X} \subset \mathbb{R}^d\)，固定、同步（所有曲线共用），且满足准均匀分布（quasi-uniform distribution，即设计点密度与某连续密度函数成比例，保证网格间距的均匀性，用于控制局部线性平滑的偏差与方差）。 - 平滑性：\(\mu \in \mathcal{C}^\alpha(\mathcal{X})\)，\(\alpha > d/2\)（保证局部线性平滑的偏差在 supremum norm 下可控）。 - 随机过程：\(Z_i(t) = X_i(t) - \mu(t)\) 满足亚高斯增量条件（sub-Gaussian increments），即 \(\mathbb{E}[e^{\lambda(Z_i(t) - Z_i(s))}] \leq e^{\lambda^2 \sigma_Z^2 |t-s|^{2\alpha}/2}\)，用于控制 \(Z_i\) 在设计点上的极大值与局部线性平滑的方差。 - 测量误差：\(\varepsilon_{ij}\) i.i.d.，\(\mathbb{E}[\varepsilon_{ij}] = 0\)，亚高斯参数 \(\sigma_\varepsilon\)，与 \(Z_i\) 独立。 - 带宽选择：局部线性平滑的带宽 \(h\) 根据 sparse/intermediate/dense regime 分别选取不同阶，以平衡偏差与方差。 - 与已有文献的对比：相比 Cai and Yuan (2011) 的 \(L_2\) 分析，本文增加了 supremum norm 的极大值控制要求；相比 Degras (2011) 等的 supremum norm 工作，本文放宽了对 \(p\) 增长速率的限制（允许 \(p\) 指数级增长），并去除了稠密下的对数因子。

主要结果：

定理：Minimax 最优速率与相变（核心定理）：
陈述：在上述设定下，minimax 速率 \(\inf_{\hat{\mu}} \sup_{\mu \in \mathcal{C}^\alpha} \mathbb{E} \|\hat{\mu} - \mu\|_\infty\) 的相变结构为：
- Sparse（\(p \leq n^{d/(2\alpha)}\)）：速率 \(p^{-\alpha/d} + n^{-1/2} p^{-\alpha/d + 1/2}\)；
- Intermediate（\(n^{d/(2\alpha)} < p \leq n^{d/(2\alpha-d)}\)）：速率 \((\log(p)/(np))^{1/2}\)；
- Dense（\(p > n^{d/(2\alpha-d)}\)）：速率 \(n^{-1/2}\)（无对数因子）。
直觉：Sparse 下离散化偏差主导；Intermediate 下测量误差的极大值（\(\sqrt{\log(p)/np}\)）主导，这是 supremum norm 特有的；Dense 下 \(p\) 足够大使得局部平滑可完全消除测量误差的极大值惩罚，达到参数化速率。
必要条件：\(\alpha > d/2\)（保证进入 dense 时偏差可控），准均匀设计（保证局部平滑的方差界）。
解决的技术难点：在 dense 下证明上界无对数因子（需修正估计量在设计点上的行为），以及证明 intermediate regime 的下界（需构造测量误差主导的极小化检验问题）。
定理：插值估计量的 Sub-optimality：
陈述：在 dense 设定下（\(p > n^{d/(2\alpha-d)}\)），插值估计量 \(\hat{\mu}_{\text{interp}}\) 的 supremum norm 速率为 \(\sqrt{\log(p)/n}\)，严格慢于最优速率 \(\sqrt{n}\)。
直觉：插值在设计点上直接取平均，无法平滑掉 \(\varepsilon_{ij}\) 的极大值波动；当 \(p\) 极大时，\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚无法被消除。
解决的技术难点：证明插值在 dense 下无法达到 \(\sqrt{n}\) 速率的下界（构造特定测量误差分布使得极大值惩罚必然出现）。
定理：中心极限定理（CLT in Supremum Norm）：
陈述：在 dense 设定下，修正后的局部线性平滑估计量 \(\hat{\mu}\) 满足 \(\sqrt{n}(\hat{\mu} - \mu) \Rightarrow G\) 在 \(\ell^\infty(\mathcal{X})\) 中弱收敛，其中 \(G\) 是某零均值高斯过程（协方差结构由 \(Z_i\) 的协方差函数决定）。
直觉：当 \(p\) 足够大时，测量误差与离散化偏差的贡献可被忽略，估计量的极限分布完全由随机过程 \(Z_i\) 的变异决定，与连续观测下的 CLT 一致。
必要条件：\(p\) 需超过 dense 阈值，且带宽 \(h\) 需随 \(n, p\) 适当衰减。
解决的技术难点：在 supremum norm 下证明弱收敛（需控制经验过程的均匀波动，并排除测量误差的极大值干扰）。

证明路线与技术技巧：

整体路线（上界证明）：
构造修正的局部线性平滑估计量：在非设计点上使用局部线性平滑 \(\hat{\mu}_{\text{LL}}(t)\)（带宽 \(h\) 随 regime 变化）；在设计点上，不直接使用 \(\hat{\mu}_{\text{LL}}(t_j)\)，而是构造修正版本以消除测量误差的极大值惩罚。
偏差分解：将 \(\hat{\mu}(t) - \mu(t)\) 分解为平滑偏差（由 \(\mu\) 的 Hölder 平滑性与带宽决定）+ 随机过程方差（由 \(Z_i\) 的局部平均决定）+ 测量误差方差（由 \(\varepsilon_{ij}\) 的局部平滑决定）。
逐项控制：
- 平滑偏差：由准均匀设计与 Hölder 条件，偏差阶为 \(h^{\alpha/d}\)；
- 随机过程方差：由亚高斯增量与 Bernstein 不等式，控制在 \(\sqrt{\log(1/h)/n}\)；
- 测量误差方差：在非设计点上由局部平滑控制在 \(\sqrt{\log(1/h)/(nh^d p)}\)；在设计点上由修正步骤控制在 \(\sqrt{1/n}\)（无 \(\log(p)\) 因子）。
带宽优化：根据 \(p\) 与 \(n\) 的相对大小选择 \(h\)，使得三项之和在 supremum norm 下达到相变结构中的最优阶。
整体路线（下界证明）：
Sparse regime：构造两个 \(\mu\) 函数（差异为 \(p^{-\alpha/d}\)），在设计点上几乎不可区分（由 Fano's lemma 或 Le Cam 方法给出 minimax 下界）。
Intermediate regime：构造测量误差主导的检验问题——在给定设计点上，\(\frac{1}{n} \sum_i \varepsilon_{ij}\) 的极大值使得任何估计量无法在 supremum norm 下区分 \(\mu\) 与 \(\mu + \delta\)（\(\delta\) 阶为 \(\sqrt{\log(p)/np}\)）。
Dense regime：构造随机过程 \(Z_i\) 的变异主导的检验问题，下界为 \(\sqrt{n}\)（由半参数效率界或标准 minimax 理论给出）。
关键跳跃点：
上界的关键跳跃：如何在设计点上消除 \(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚。作者通过修正步骤（利用非设计点上的平滑信息来“插值/平滑”设计点上的估计），将设计点上的误差从 \(\sqrt{\log(p)/n}\) 降至 \(\sqrt{1/n}\)。这是整篇论文最吃功夫的技术点。
下界的关键跳跃：Intermediate regime 下界需要证明测量误差的极大值必然惩罚任何估计量。作者构造了特定分布的 \(\varepsilon_{ij}\)（如离散分布或高斯分布），并使用极大值理论（\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}| \asymp \sqrt{\log(p)/n}\)）结合 Assouad's lemma 或 Fano's lemma 给出下界。
技术技巧点名：
局部线性平滑：用于在非设计点上平滑测量误差与随机过程方差，偏差-方差平衡由带宽 \(h\) 控制。
极大值理论 / Bernstein 不等式：用于控制亚高斯随机过程与测量误差在网格点上的极大值波动（\(\sqrt{\log(p)}\) 或 \(\sqrt{\log(1/h)}\) 惩罚）。
Fano's lemma / Assouad's lemma：用于构造 minimax 下界中的检验问题（sparse 与 intermediate regime）。
经验过程 / chaining：用于控制局部线性平滑估计量在连续域 \(\mathcal{X}\) 上的均匀波动（supremum norm 收敛）。
修正步骤：在设计点上利用非设计点的平滑信息进行修正，消除 \(\log(p)\) 因子——这是本文独有的技术贡献。

真实例子与应用： - 模拟实验：作者在 \(d=1, \alpha=2\) 的设定下，模拟了不同 \(n\) 与 \(p\) 组合（sparse, intermediate, dense）下的估计误差。结果显示： - 在 intermediate regime 下，supremum norm 误差确实由 \(\sqrt{\log(p)/np}\) 主导（与 \(L_2\) 误差的 \(\sqrt{1/np}\) 主导形成对比）； - 在 dense regime 下，修正估计量达到 \(\sqrt{n}\) 速率且无对数因子，而插值估计量的误差明显偏大（验证了 sub-optimality）。 - 真实数据应用：作者将方法应用于加拿大气象数据（每日温度曲线的均值估计）。具体做法：将连续温度轨迹在 \(p\) 个等距时间点上离散化并添加模拟测量误差，然后在不同 \(p\) 下比较修正估计量与插值估计量的 supremum norm 误差。结果验证了：当 \(p\) 较大时，修正估计量的置信带更窄且更均匀，而插值估计量的置信带在设计点上出现明显的过宽现象（由 \(\sqrt{\log(p)}\) 惩罚导致）。 - 例子想说明什么：验证理论预测的相变结构（特别是 intermediate regime 与插值 sub-optimality），并展示修正估计量在构造均匀置信带时的实际优势。

🔎 结论是否比证明窄： - 作者在 dense regime 下声称可达 \(\sqrt{n}\) 速率“无对数因子”，这在定理的严格证明中仅对修正后的局部线性平滑估计量成立，而对一般的平滑估计量（如惩罚样条）未做证明。引言中泛泛提及“previous contributions ... obtain the \(\sqrt{n}\) rate with additional logarithmic factors”，但未明确断言所有现有方法都带对数因子——这是一个需研究者核验的 claim。 - 中心极限定理仅在 dense regime 下证明，sparse 与 intermediate regime 下的极限分布结构未给出（定理条件明确要求 \(p > n^{d/(2\alpha-d)}\)），但引言中未特别强调这一限制。

四、开放问题（点到为止，扎根具体语句）¶

异步/ 随机设计下的 supremum norm 相变结构：本文仅处理固定同步设计，引言提及 Li and Hsing (2010) 在异步随机设计下有类似 intermediate 速率（Corollary 3.2(a)），但未给出系统理论。要证：在随机设计下，supremum norm 的 minimax 速率是否仍存在观测误差主导的 intermediate regime，阈值与同步设计有何不同？（扎根：引言“see also Wang et al. (2016, Corollary 4.2, (1))”及对异步设计的回避）
惩罚样条或其他平滑方法在 dense supremum norm 下是否可达无对数因子 \(\sqrt{n}\) 速率：本文仅对修正的局部线性平滑给出证明，对惩罚样条（Xiao, 2020）等未做正面比较。要证：惩罚样条在 dense 设定下是否也 sub-optimal（带对数因子），或能否通过类似修正达到 \(\sqrt{n}\)？（扎根：引言“interpolation estimators which suffice in \(L_2\) turn out to be sub-optimal in the dense setting”，但未扩展到其他平滑类）
协方差函数与主成分分析的 supremum norm 最优速率：本文仅处理均值函数，引言提及 Hall et al. (2006) 对主成分的 \(L_2\) 速率，但 supremum norm 下协方差与特征函数的相变结构（特别是是否存在 intermediate regime）未闭合。要估：协方差函数在 supremum norm 下的 minimax 速率与相变阈值。（扎根：引言“The analysis of estimators in FDA has traditionally been conducted for \(L_2\) and pointwise errors (Hall et al., 2006)”）
\(\alpha \leq d/2\) 时的 supremum norm 速率：本文要求 \(\alpha > d/2\) 以保证 dense 下偏差可控，当 \(\alpha \leq d/2\) 时 dense regime 是否存在、速率结构如何变化？要证：\(\alpha \leq d/2\) 下的 minimax 下界与上界。（扎根：定理假设 \(\alpha > d/2\)，引言未讨论此限制外的情形）

提醒：要确认某条是不是真 gap，去读同子领域近期约 5 篇的 intro——都指向它 = 共识（真 gap），互相打架 = 机会。

Maintained by 陈星宇 · Homepage · Source on GitHub

From dense to sparse design: Optimal rates under the supremum norm for estimating the mean function in functional data analysis¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论