From dense to sparse design: Optimal rates under the supremum norm for estimating the mean function in functional data analysis¶
作者: Max Berger, Philipp Hermann, Hajo Holzmann
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 7/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本统计问题是:在离散、有噪的观测条件下,如何为随机过程的均值函数提供均匀(supremum norm)意义上的最优估计与推断。具体而言,当研究者无法观测到连续的完整轨迹,只能在有限的设计点上获取带测量误差的样本时,估计的收敛速率如何随“样本曲线数 \(n\)”与“每条曲线上的观测点数 \(p\)”的相对大小而发生相变,以及在 supremum norm 下这种相变的结构与已知的 \(L_2\) 理论有何不同。当前该方向的成熟度表现为:\(L_2\) 下的相变理论已基本闭合,supremum norm 下的点态与均匀置信带构造已有若干方法,但关于 supremum norm 下最优收敛速率的精确刻画(特别是无对数因子的 \(\sqrt{n}\) 速率与中间 regime 的存在性)仍存在明显缺口。
发展脉络: - 奠基工作:Hall, Muller, Wang (2006) 首次系统探讨了 FDA 中主成分分析的收敛速率,区分了稀疏与稠密设定下估计问题的非参与半参本质,指出稠密下可达 \(\sqrt{n}\) 速率。但他们的分析主要在 \(L_2\) 或点态误差下进行。 - 主要进展(\(L_2\) 相变闭合):Cai and Yuan (2011) 在 \(L_2\) 下给出了离散观测均值估计的 minimax 最优速率,明确刻画了 sparse(离散化项主导)与 dense(可达参数化 \(\sqrt{n}\) 速率)的相变阈值,并指出在 common design 下稠密时甚至不需要平滑(插值即可)。Li and Hsing (2010) 则在更一般的框架下探讨了均匀收敛速率,初步触及了稀疏与稠密的相对关系,并在异步随机设计下给出了一个含 \(\log(n)/(np)\) 项的中间速率(Corollary 3.2(a)),但未在固定同步设计下深入此现象。 - 当前 frontier(supremum norm 的缺口):Degras (2011), Chang et al. (2017), Xiao (2020), Kalogridis and Van Aelst (2022) 等在固定同步设计下探讨了 supremum norm 的收敛速率与置信带构造。然而,作者在引言中明确指出:这些工作在稠密设定下均未能达到无额外对数因子的 \(\sqrt{n}\) 速率,且未系统讨论 sparse-dense 之间是否存在由观测误差主导的中间 regime。Wang et al. (2020) 虽处理了多元图像数据的稠密情形,但假设体系更为复杂,未给出一般性的最优速率框架。 - 本文的位置:本文填补了固定同步设计下 supremum norm 的最优速率缺口——揭示了 \(L_2\) 中不存在的“观测误差主导的中间 regime”,证明了稠密下插值估计量的 sub-optimality,并构造了在稠密情形下达到无对数因子 \(\sqrt{n}\) 速率的新估计量,同时给出了 supremum norm 下的中心极限定理。
子线索聚类: 1. \(L_2\) 最优速率与相变理论:Cai and Yuan (2011), Li and Hsing (2010), Zhang and Wang (2016)。这一簇的核心是确立 \(L_2\) 下 sparse 与 dense 的相变阈值,并证明稠密下插值估计量已足够最优。 2. Supremum norm 下的均匀置信带与收敛速率:Degras (2011), Xiao (2020), Kalogridis and Van Aelst (2022), Liebl and Reimherr (2019)。这一簇致力于在 supremum norm 下构造置信带并给出收敛速率,但普遍在稠密情形留下了对数因子或未触及中间 regime。 3. 多元/图像 FDA 与特定应用:Wang et al. (2020), Morris (2014)。这一簇将 FDA 推向二维/高维设计域(如脑影像),但理论框架往往针对特定数据结构,未提炼一般性的 minimax 相变规律。
这个方向在追问的核心问题: 1. 在离散观测下,均值函数估计的 minimax 收敛速率在 sparse 与 dense 之间的相变阈值与结构是什么?(\(L_2\) 下已闭合,supremum norm 下未闭合) 2. 在 supremum norm 下,稠密情形能否达到无对数因子的参数化 \(\sqrt{n}\) 速率?需要怎样的估计量构造? 3. Supremum norm 与 \(L_2\) 的相变结构是否一致?是否存在 \(L_2\) 分析中无法捕捉的中间 regime? 4. 如何基于 supremum norm 的最优速率构造均匀置信带(即中心极限定理)?
当前主流方法在 supremum norm 下普遍依赖局部线性平滑或惩罚样条,瓶颈在于:稠密下这些平滑估计量往往带有对数因子损耗,且未意识到插值估计量在 supremum norm 下的 sub-optimality。
⚠️ 作者的 framing: - 作者将缺口 frame 为:\(L_2\) 理论已闭合,但 supremum norm 下存在三个未被已有文献覆盖的现象——中间 regime、插值的 sub-optimality、无对数因子的 \(\sqrt{n}\) 速率。这使得本文成为“显然的下一步”:补全 supremum norm 下的完整相变图谱。 - 被淡化或回避的竞争路线:作者未深入讨论异步/ 随机设计下的 supremum norm 相变(仅一句提及 Li and Hsing (2010) 的 Corollary 3.2(a)),也未与 Liebl and Reimherr (2019) 的快速置信带方法进行速率对比。此外,惩罚样条在稠密 supremum norm 下是否也能达到无对数因子 \(\sqrt{n}\) 速率,作者未做正面比较,仅指出局部线性平滑的局限。 - 明显该被引却未出现的文献:关于高维/多元非参回归在 supremum norm 下的 minimax 速率(如 \(d>1\) 时的局部多项式或样条的精确常数与对数因子处理),以及关于 dense design 下“平滑 vs 插值”sub-optimality 的更早期理论探讨(如果存在)。这是一个值得研究者去查证的方向:是否已有文献在点态或 \(L_2\) 外的 norm 下指出插值的 sub-optimality,而作者未引用?
张力: 未见明显对立引用。但存在一个结构性张力:Cai and Yuan (2011) 在 \(L_2\) 下宣称稠密时插值估计量已最优,而本文在 supremum norm 下证明插值是 sub-optimal 的。这并非文献间的矛盾,而是同一问题在不同损失函数下的结论分歧——这恰恰是本文的核心切入点。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚
- \(n\):样本曲线数(独立同分布的随机过程个数)。
- \(p\):每条曲线上的离散观测点数(设计点的个数,本文假设所有曲线共用同一组设计点,即固定同步设计)。
- \(d\):设计域 \(\mathcal{X}\) 的维数(本文允许 \(d \geq 1\),最简特例取 \(d=1\))。
- \(\alpha\):均值函数的 Hölder 平滑阶数(\(\alpha > 0\),函数属于 \(\mathcal{C}^\alpha(\mathcal{X})\))。
- \(X_i(t)\):第 \(i\) 条随机过程(潜在/连续轨迹,不可直接观测)。
- \(\mu(t) = \mathbb{E}[X_i(t)]\):均值函数——这是要估的目标。
- \(Y_{ij}\):第 \(i\) 条曲线在第 \(j\) 个设计点 \(t_j\) 上的实际观测值(可观测数据)。
- \(\varepsilon_{ij}\):第 \(i\) 条曲线在第 \(j\) 个设计点上的测量误差(不可直接观测,假设 \(\mathbb{E}[\varepsilon_{ij}] = 0\),方差 \(\sigma^2\),且与 \(X_i\) 独立)。
- 可观测数据:\(\{Y_{ij} : 1 \leq i \leq n, 1 \leq j \leq p\}\),即 \(n \times p\) 的矩阵,加上已知的设计点 \(\{t_j : 1 \leq j \leq p\} \subset \mathcal{X}\)。
- 不可观测/需假设识别的量:连续轨迹 \(X_i(t)\)(只能在设计点上通过 \(Y_{ij} = \mu(t_j) + (X_i(t_j) - \mu(t_j)) + \varepsilon_{ij}\) 间接获取带噪信息),以及测量误差的方差结构。
模型: 数据生成机制为 \(Y_{ij} = \mu(t_j) + Z_i(t_j) + \varepsilon_{ij}\),其中 \(Z_i(t) = X_i(t) - \mu(t)\) 是均值为零的随机过程(具有某种协方差结构与平滑性),\(\varepsilon_{ij}\) 是 i.i.d. 测量误差。目标是在 supremum norm \(\|\hat{\mu} - \mu\|_\infty = \sup_{t \in \mathcal{X}} |\hat{\mu}(t) - \mu(t)|\) 下,找到 minimax 最优收敛速率,并构造达到该速率的估计量 \(\hat{\mu}\)。
第二步:最小内核(最简特例 \(d=1\), \(\alpha>1/2\))
剥掉多元与一般平滑阶数的技术外壳,核心数学困难在 \(d=1\) 的固定同步设计下已完全暴露。设设计域 \(\mathcal{X} = [0,1]\),设计点 \(t_j = j/p\)(等距网格),\(\mu \in \mathcal{C}^\alpha\) 且 \(\alpha > 1/2\)。
最小问题:在 \(n\) 条曲线、每条 \(p\) 个等距观测点的设定下,\(\inf_{\hat{\mu}} \sup_{\mu \in \mathcal{C}^\alpha} \mathbb{E} \|\hat{\mu} - \mu\|_\infty\) 的精确相变结构是什么?特别地,当 \(p\) 相对于 \(n\) 增长时,速率如何从 sparse 过渡到 dense?
相变结构(本文的核心发现): 1. Sparse regime:当 \(p \leq n^{1/(2\alpha)}\) 时,离散化误差主导,速率为 \((p^{-\alpha} + n^{-1/2} p^{-\alpha+1/2})\)(与 \(L_2\) 下一致)。 2. Intermediate regime(观测误差主导):当 \(n^{1/(2\alpha)} < p \leq n^{1/(2\alpha-1)}\) 时,测量误差的 supremum norm 贡献主导,速率为 \((\log(p)/(np))^{1/2}\)。这是 \(L_2\) 分析中不存在的现象——在 \(L_2\) 下,此区间内测量误差的 \(L_2\) 贡献为 \((np)^{-1/2}\),已被 \(\sqrt{n}\) 吸收,但在 supremum norm 下,误差的极大值带来了 \(\sqrt{\log(p)/np}\) 的额外惩罚。 3. Dense regime:当 \(p > n^{1/(2\alpha-1)}\) 时,可达参数化 \(\sqrt{n}\) 速率(无对数因子),即 \(\|\hat{\mu} - \mu\|_\infty = O_P(n^{-1/2})\)。
为什么插值估计量在稠密 supremum norm 下 sub-optimal: 插值估计量 \(\hat{\mu}_{\text{interp}}(t_j) = \frac{1}{n} \sum_{i=1}^n Y_{ij}\)(在设计点上取平均,非设计点上插值)。在设计点上,其误差为 \(\frac{1}{n} \sum_{i=1}^n (Z_i(t_j) + \varepsilon_{ij})\),supremum norm 为 \(\max_{1 \leq j \leq p} |\frac{1}{n} \sum_{i=1}^n (Z_i(t_j) + \varepsilon_{ij})|\)。当 \(p\) 极大时,即使 \(n\) 条曲线的平均已平滑了 \(Z_i\),\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的阶仍为 \(\sqrt{\log(p)/n}\)(由 i.i.d. 高斯/亚高斯误差的极大值理论决定)。若 \(p\) 指数级增长(如 \(p \gg n\)),\(\sqrt{\log(p)/n}\) 远大于 \(\sqrt{n}\),导致插值在 supremum norm 下无法达到 \(\sqrt{n}\) 速率。而在 \(L_2\) 下,\(\sum_j (\frac{1}{n} \sum_i \varepsilon_{ij})^2 / p\) 的阶为 \(1/(np)\),当 \(p\) 足够大时可被忽略,故插值在 \(L_2\) 下最优。
本文如何破局: 构造新估计量,在非设计点上使用局部线性平滑(利用 \(p\) 个点的信息平滑掉 \(\varepsilon_{ij}\) 的逐点波动),而在设计点上对平滑估计量进行修正,使得修正后的估计量在设计点上的误差不再受 \(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚支配,从而在稠密下达到无对数因子的 \(\sqrt{n}\) 速率。
三、这篇论文做了什么¶
三句话: ①研究了在固定同步离散设计下、Hölder 平滑均值函数的 supremum norm 最优估计问题; ②核心工具是局部线性平滑结合设计点修正的估计量构造,以及基于极大值理论与 Bernstein 不等式的精细概率界; ③主要结论是揭示了 supremum norm 下由观测误差主导的中间 regime,证明了插值估计量的 sub-optimality,并在稠密情形获得了无对数因子的 \(\sqrt{n}\) 速率与中心极限定理。
关键设定与假设: 在第二节最小记号基础上补全: - 设计点:\(\{t_1, \ldots, t_p\} \subset \mathcal{X} \subset \mathbb{R}^d\),固定、同步(所有曲线共用),且满足准均匀分布(quasi-uniform distribution,即设计点密度与某连续密度函数成比例,保证网格间距的均匀性,用于控制局部线性平滑的偏差与方差)。 - 平滑性:\(\mu \in \mathcal{C}^\alpha(\mathcal{X})\),\(\alpha > d/2\)(保证局部线性平滑的偏差在 supremum norm 下可控)。 - 随机过程:\(Z_i(t) = X_i(t) - \mu(t)\) 满足亚高斯增量条件(sub-Gaussian increments),即 \(\mathbb{E}[e^{\lambda(Z_i(t) - Z_i(s))}] \leq e^{\lambda^2 \sigma_Z^2 |t-s|^{2\alpha}/2}\),用于控制 \(Z_i\) 在设计点上的极大值与局部线性平滑的方差。 - 测量误差:\(\varepsilon_{ij}\) i.i.d.,\(\mathbb{E}[\varepsilon_{ij}] = 0\),亚高斯参数 \(\sigma_\varepsilon\),与 \(Z_i\) 独立。 - 带宽选择:局部线性平滑的带宽 \(h\) 根据 sparse/intermediate/dense regime 分别选取不同阶,以平衡偏差与方差。 - 与已有文献的对比:相比 Cai and Yuan (2011) 的 \(L_2\) 分析,本文增加了 supremum norm 的极大值控制要求;相比 Degras (2011) 等的 supremum norm 工作,本文放宽了对 \(p\) 增长速率的限制(允许 \(p\) 指数级增长),并去除了稠密下的对数因子。
主要结果:
- 定理:Minimax 最优速率与相变(核心定理):
- 陈述:在上述设定下,minimax 速率 \(\inf_{\hat{\mu}} \sup_{\mu \in \mathcal{C}^\alpha} \mathbb{E} \|\hat{\mu} - \mu\|_\infty\) 的相变结构为:
- Sparse(\(p \leq n^{d/(2\alpha)}\)):速率 \(p^{-\alpha/d} + n^{-1/2} p^{-\alpha/d + 1/2}\);
- Intermediate(\(n^{d/(2\alpha)} < p \leq n^{d/(2\alpha-d)}\)):速率 \((\log(p)/(np))^{1/2}\);
- Dense(\(p > n^{d/(2\alpha-d)}\)):速率 \(n^{-1/2}\)(无对数因子)。
- 直觉:Sparse 下离散化偏差主导;Intermediate 下测量误差的极大值(\(\sqrt{\log(p)/np}\))主导,这是 supremum norm 特有的;Dense 下 \(p\) 足够大使得局部平滑可完全消除测量误差的极大值惩罚,达到参数化速率。
- 必要条件:\(\alpha > d/2\)(保证进入 dense 时偏差可控),准均匀设计(保证局部平滑的方差界)。
-
解决的技术难点:在 dense 下证明上界无对数因子(需修正估计量在设计点上的行为),以及证明 intermediate regime 的下界(需构造测量误差主导的极小化检验问题)。
-
定理:插值估计量的 Sub-optimality:
- 陈述:在 dense 设定下(\(p > n^{d/(2\alpha-d)}\)),插值估计量 \(\hat{\mu}_{\text{interp}}\) 的 supremum norm 速率为 \(\sqrt{\log(p)/n}\),严格慢于最优速率 \(\sqrt{n}\)。
- 直觉:插值在设计点上直接取平均,无法平滑掉 \(\varepsilon_{ij}\) 的极大值波动;当 \(p\) 极大时,\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚无法被消除。
-
解决的技术难点:证明插值在 dense 下无法达到 \(\sqrt{n}\) 速率的下界(构造特定测量误差分布使得极大值惩罚必然出现)。
-
定理:中心极限定理(CLT in Supremum Norm):
- 陈述:在 dense 设定下,修正后的局部线性平滑估计量 \(\hat{\mu}\) 满足 \(\sqrt{n}(\hat{\mu} - \mu) \Rightarrow G\) 在 \(\ell^\infty(\mathcal{X})\) 中弱收敛,其中 \(G\) 是某零均值高斯过程(协方差结构由 \(Z_i\) 的协方差函数决定)。
- 直觉:当 \(p\) 足够大时,测量误差与离散化偏差的贡献可被忽略,估计量的极限分布完全由随机过程 \(Z_i\) 的变异决定,与连续观测下的 CLT 一致。
- 必要条件:\(p\) 需超过 dense 阈值,且带宽 \(h\) 需随 \(n, p\) 适当衰减。
- 解决的技术难点:在 supremum norm 下证明弱收敛(需控制经验过程的均匀波动,并排除测量误差的极大值干扰)。
证明路线与技术技巧:
- 整体路线(上界证明):
- 构造修正的局部线性平滑估计量:在非设计点上使用局部线性平滑 \(\hat{\mu}_{\text{LL}}(t)\)(带宽 \(h\) 随 regime 变化);在设计点上,不直接使用 \(\hat{\mu}_{\text{LL}}(t_j)\),而是构造修正版本以消除测量误差的极大值惩罚。
- 偏差分解:将 \(\hat{\mu}(t) - \mu(t)\) 分解为平滑偏差(由 \(\mu\) 的 Hölder 平滑性与带宽决定)+ 随机过程方差(由 \(Z_i\) 的局部平均决定)+ 测量误差方差(由 \(\varepsilon_{ij}\) 的局部平滑决定)。
- 逐项控制:
- 平滑偏差:由准均匀设计与 Hölder 条件,偏差阶为 \(h^{\alpha/d}\);
- 随机过程方差:由亚高斯增量与 Bernstein 不等式,控制在 \(\sqrt{\log(1/h)/n}\);
- 测量误差方差:在非设计点上由局部平滑控制在 \(\sqrt{\log(1/h)/(nh^d p)}\);在设计点上由修正步骤控制在 \(\sqrt{1/n}\)(无 \(\log(p)\) 因子)。
-
带宽优化:根据 \(p\) 与 \(n\) 的相对大小选择 \(h\),使得三项之和在 supremum norm 下达到相变结构中的最优阶。
-
整体路线(下界证明):
- Sparse regime:构造两个 \(\mu\) 函数(差异为 \(p^{-\alpha/d}\)),在设计点上几乎不可区分(由 Fano's lemma 或 Le Cam 方法给出 minimax 下界)。
- Intermediate regime:构造测量误差主导的检验问题——在给定设计点上,\(\frac{1}{n} \sum_i \varepsilon_{ij}\) 的极大值使得任何估计量无法在 supremum norm 下区分 \(\mu\) 与 \(\mu + \delta\)(\(\delta\) 阶为 \(\sqrt{\log(p)/np}\))。
-
Dense regime:构造随机过程 \(Z_i\) 的变异主导的检验问题,下界为 \(\sqrt{n}\)(由半参数效率界或标准 minimax 理论给出)。
-
关键跳跃点:
- 上界的关键跳跃:如何在设计点上消除 \(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}|\) 的 \(\sqrt{\log(p)}\) 惩罚。作者通过修正步骤(利用非设计点上的平滑信息来“插值/平滑”设计点上的估计),将设计点上的误差从 \(\sqrt{\log(p)/n}\) 降至 \(\sqrt{1/n}\)。这是整篇论文最吃功夫的技术点。
-
下界的关键跳跃:Intermediate regime 下界需要证明测量误差的极大值必然惩罚任何估计量。作者构造了特定分布的 \(\varepsilon_{ij}\)(如离散分布或高斯分布),并使用极大值理论(\(\max_j |\frac{1}{n} \sum_i \varepsilon_{ij}| \asymp \sqrt{\log(p)/n}\))结合 Assouad's lemma 或 Fano's lemma 给出下界。
-
技术技巧点名:
- 局部线性平滑:用于在非设计点上平滑测量误差与随机过程方差,偏差-方差平衡由带宽 \(h\) 控制。
- 极大值理论 / Bernstein 不等式:用于控制亚高斯随机过程与测量误差在网格点上的极大值波动(\(\sqrt{\log(p)}\) 或 \(\sqrt{\log(1/h)}\) 惩罚)。
- Fano's lemma / Assouad's lemma:用于构造 minimax 下界中的检验问题(sparse 与 intermediate regime)。
- 经验过程 / chaining:用于控制局部线性平滑估计量在连续域 \(\mathcal{X}\) 上的均匀波动(supremum norm 收敛)。
- 修正步骤:在设计点上利用非设计点的平滑信息进行修正,消除 \(\log(p)\) 因子——这是本文独有的技术贡献。
真实例子与应用: - 模拟实验:作者在 \(d=1, \alpha=2\) 的设定下,模拟了不同 \(n\) 与 \(p\) 组合(sparse, intermediate, dense)下的估计误差。结果显示: - 在 intermediate regime 下,supremum norm 误差确实由 \(\sqrt{\log(p)/np}\) 主导(与 \(L_2\) 误差的 \(\sqrt{1/np}\) 主导形成对比); - 在 dense regime 下,修正估计量达到 \(\sqrt{n}\) 速率且无对数因子,而插值估计量的误差明显偏大(验证了 sub-optimality)。 - 真实数据应用:作者将方法应用于加拿大气象数据(每日温度曲线的均值估计)。具体做法:将连续温度轨迹在 \(p\) 个等距时间点上离散化并添加模拟测量误差,然后在不同 \(p\) 下比较修正估计量与插值估计量的 supremum norm 误差。结果验证了:当 \(p\) 较大时,修正估计量的置信带更窄且更均匀,而插值估计量的置信带在设计点上出现明显的过宽现象(由 \(\sqrt{\log(p)}\) 惩罚导致)。 - 例子想说明什么:验证理论预测的相变结构(特别是 intermediate regime 与插值 sub-optimality),并展示修正估计量在构造均匀置信带时的实际优势。
🔎 结论是否比证明窄: - 作者在 dense regime 下声称可达 \(\sqrt{n}\) 速率“无对数因子”,这在定理的严格证明中仅对修正后的局部线性平滑估计量成立,而对一般的平滑估计量(如惩罚样条)未做证明。引言中泛泛提及“previous contributions ... obtain the \(\sqrt{n}\) rate with additional logarithmic factors”,但未明确断言所有现有方法都带对数因子——这是一个需研究者核验的 claim。 - 中心极限定理仅在 dense regime 下证明,sparse 与 intermediate regime 下的极限分布结构未给出(定理条件明确要求 \(p > n^{d/(2\alpha-d)}\)),但引言中未特别强调这一限制。
四、开放问题(点到为止,扎根具体语句)¶
-
异步/ 随机设计下的 supremum norm 相变结构:本文仅处理固定同步设计,引言提及 Li and Hsing (2010) 在异步随机设计下有类似 intermediate 速率(Corollary 3.2(a)),但未给出系统理论。要证:在随机设计下,supremum norm 的 minimax 速率是否仍存在观测误差主导的 intermediate regime,阈值与同步设计有何不同?(扎根:引言“see also Wang et al. (2016, Corollary 4.2, (1))”及对异步设计的回避)
-
惩罚样条或其他平滑方法在 dense supremum norm 下是否可达无对数因子 \(\sqrt{n}\) 速率:本文仅对修正的局部线性平滑给出证明,对惩罚样条(Xiao, 2020)等未做正面比较。要证:惩罚样条在 dense 设定下是否也 sub-optimal(带对数因子),或能否通过类似修正达到 \(\sqrt{n}\)?(扎根:引言“interpolation estimators which suffice in \(L_2\) turn out to be sub-optimal in the dense setting”,但未扩展到其他平滑类)
-
协方差函数与主成分分析的 supremum norm 最优速率:本文仅处理均值函数,引言提及 Hall et al. (2006) 对主成分的 \(L_2\) 速率,但 supremum norm 下协方差与特征函数的相变结构(特别是是否存在 intermediate regime)未闭合。要估:协方差函数在 supremum norm 下的 minimax 速率与相变阈值。(扎根:引言“The analysis of estimators in FDA has traditionally been conducted for \(L_2\) and pointwise errors (Hall et al., 2006)”)
-
\(\alpha \leq d/2\) 时的 supremum norm 速率:本文要求 \(\alpha > d/2\) 以保证 dense 下偏差可控,当 \(\alpha \leq d/2\) 时 dense regime 是否存在、速率结构如何变化?要证:\(\alpha \leq d/2\) 下的 minimax 下界与上界。(扎根:定理假设 \(\alpha > d/2\),引言未讨论此限制外的情形)
提醒:要确认某条是不是真 gap,去读同子领域近期约 5 篇的 intro——都指向它 = 共识(真 gap),互相打架 = 机会。
Maintained by 陈星宇 · Homepage · Source on GitHub