跳转至

Interpretable discriminant analysis for functional data supported on random nonlinear domains with an application to Alzheimer’s disease

作者: Eardi Lila, Wenbo Zhang, Swati Rane Levendovszky, Alzheimer’s Disease Neuroimaging Initiative, Michael W Weiner et al.
来源: Journal of the Royal Statistical Society Series B
主题: 非参数 / 半参数
相关性: 4/10
机构绿灯: University of Washington(US News 前 50,免分进入精读)
链接: 期刊页 · arXiv


一、领域脉络与小综述

  • 这个方向是什么:这个子方向要解决的根本问题是:如何对定义在非线性、可能随机的流形域上的“函数”进行分类(判别分析)。核心挑战在于,函数(如皮层厚度图)的支撑域(个体脑皮层表面)本身是物理空间中的二维流形,且不同个体的流形域之间存在形状差异(非线性变形)。更关键的是,在这个设定下,经典的功能数据处理方法(如先估计协方差函数,再解Fisher判别问题)在计算上变得不可行。该子方向属于“功能数据分析 (functional data analysis)”与“流形学习 (manifold learning)”的交汇点,当前成熟度属于方法与应用驱动、理论仍在跟进的阶段。
  • 发展脉络(history):论文的引言 (Introduction) 将文献串联成清晰的脉络:
    1. 奠基工作:经典功能判别分析 (FDL)。 Fisher 线性判别分析 (LDA) 在高维连续域上的推广是早期工作。例如,Delaigle and Hall (2012) 揭示了所谓“近完美分类”现象——在某些条件下,连续域上的两个自协方差算子可以完全不重合,导致Bayes误差趋于0,这为功能域上的分类问题带来了独特的挑战与机遇。Chen and Jiang (2018) 处理了稀疏观测到密集功能数据的FLDA,并展示了在某些情况下可取得渐近完美分类。但所有这些工作默认函数的支撑域是固定的一维区间
    2. 主要进展:功能数据从固定域 (flat domain) 走向流形域 (nonlinear domain)。研究者们开始考虑在二维或更高维的流形上处理功能数据,主要分三条路:
      • 途径一:全局参数化。将流形映射到平坦域(如球面、方形)。代表工作有Chung et al. (2008)Epifanio and Ventura-Campos (2014) 等。方法的局限是在曲面拓扑复杂或变形大时,参数化会导致严重失真和错位。
      • 途径二:微分同胚变形函数 (Diffeomorphic deformation)。用大形变微分同胚度量映射(如LDDMM)来建模支撑域本身的形变。代表工作有Vaillant et al. (2004)Arguillère et al. (2016)。其优势在于严格刻画了几何变形,但计算复杂,且将形变与函数特征作为“功能形状 (functional shapes)”整体建模,其判别方向往往难以解耦和解释。
      • 途径三:谱/几何描述符。利用流形上的谱特征(如Laplace-Beltrami算子谱)或形状指数来生成固定维度的描述符(形状指纹),然后基于这些描述符做分类。代表工作有Wachinger et al. (2015) (BrainPrint) 和Reuter et al. (2006)。这种方法简洁,会丢失原始函数域的许多信息。
    3. 当前Frontier和本文位置:上述工作均存在“要么计算不可行,要么丢失几何信息,要么解释性不强”的问题。本文站在这几条线的交叉口:它放弃了对协方差算子的显式估计(途径一、二之路),转而利用流形上的偏微分方程(PDE)正则化(微分正则化)直接估计判别方向。作者将其视为一种“无维数约简”的途径,直接在原始函数域上工作,正则化项就是嵌入的先验知识。这使得方法在复杂域上依然计算可行(只需在固定的三角形网格上求解一次线性系统),且得到的判别方向在原始流形上高度可解释。这项工作的理论部分,则紧密承接了Cai and Yuan (2012)Reimherr et al. (2018)Sun et al. (2018) 等人在“函数到函数回归 [←核心设定:输出也是连续函数]”及“函数线性回归在RKHS下的最优预测”方面的进展,将类似的预测收敛率分析推广到了更一般的流形域上。
  • 子线索聚类
    1. 功能数据判别分析 (Functional Discriminant Analysis):关注分类,研究如何从连续域的函数特征中学习判别方向。代表:Delaigle and Hall (2012), Chen and Jiang (2018)。这是本文的直接祖先。
    2. 流形域上的功能数据分析:将功能数据的定义域从一维推广到流形。关注的问题是如何在非线性域上进行回归、平滑或主成分分析。代表:Lila et al. (2016) (本文第一作者之前的流形PCA工作), Chung et al. (2015, 2016) (热核平滑), Mejia et al. (2020) (贝叶斯皮层fMRI建模)。
    3. 神经影像中的形状与数据分析:应用驱动的子线索,关注从MRI提取的皮层表面几何(形状)和功能/结构图谱。代表:Dickerson et al. (2008) (皮层厚度与AD的关系), Hazlett et al. (2017) (早期自闭症大脑发育)。本文落在这个具体应用上。
  • 这个方向在追问的核心问题
    1. 如何在高维、非线性域上以可计算的方式进行数据推导? 经典方法(如先估值协方差再解特征问题)在100k+顶点的人脑皮层表面上完全不可行。
    2. 如何同时利用几何(皮层形状)和功能(皮层厚度)信息做分类,又不损害可解释性? 两者融合函数的自然高维性,使得回答“哪部分的哪种特征最具判别力”的统计问题极具挑战。
    3. 样本外预测误差的率能否达到最优? 正则化参数的选取(平滑 vs. 拟合)的权衡是否能用理论严格刻画?
  • ⚠️作者的framing (必须明确标注成“这是作者的说法”)
    • 作者把缺口frame成什么:核心缺口是“已有方法不能同时满足三个要求:处理随机/非线性域、直接高维度可解释、计算上不依赖昂贵的协方差估计”。作者将自己提出的方法(判别的多元函数线性回归 + 微分正则化)定位为“无需维数约简”、“直接在原始流形域上正则化”,从而绕开协方差估计瓶颈,并产出可解释的判别方向。这是一个非常巧妙的“转化”问题:他们把分类问题等价地转化为一个回归问题,再套上自己熟悉的偏微分算子正则化工具。
    • 哪些竞争路线被他淡化或回避了:作者显著淡化了非线性的功能判别模型的平行路线。如Yao and Müller (2010)Jiang and Wang (2011)功能单指标模型 (functional single index models)加法 (additive) 功能回归。这些模型引入了非线性,可以被看作另一种更强大的判别方向学习方法。作者只在文章结尾讨论部分匆匆提了一句“可以推广到非线性”,但没有论证为什么线性模型在当前应用下是足够且充分的。这可能是因为线性的微分正则化(bilinear à la 双线性推定)在技术上更容易分析与求解,而非线性的单指标模型的估计要复杂得多。
    • 什么明显该被引 / 该存在、却没出现在intro里? 关于近完美分类的深层数理基础,作者引了Delaigle and Hall (2012) 和 Berrendero et al. (2018)。但Berrendero et al. (2018) 关键地讨论了“当且仅当两个高斯过程的特征值序列差异满足特定条件时,才会出现完美分类”。这个问题在流形域上显然比在平坦一维域上更复杂。作者没有引用任何工作去讨论流形域的高斯过程之间的Hájek-Feldman二分法及其对完美分类的影响。如果未来有工作要跟进这个理论,这会是关键缺口。
  • 张力:未见明显对立引用。所有被引工作都在线性地推进“域更复杂→方法更强大→计算更贵”的叙事,没有明显互相矛盾的结论。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号

    • \(M_n\): 一个随机、紧致、可能有边界可定向的二维Riemannian流形。下标 \(n\) 表示不同样本所对应的流形域是不同的。在神经影像应用中,每个受试者的 \(M_n\) 就是其处理后的皮层表面。
    • \(f_n\): 定义在 \(M_n\) 上的标量函数(例如皮层厚度)。这是我们观察到的功能性特征。
    • \(X_n = (f_n, M_n)\): 称“功能形状 (functional shape, FoS)”,即函数与其支撑流的联合对象。这是完整的“可观测”对象。
    • \(Y_n\): 二元分类标签,取 \(\{0, 1\}\)。例如 \(\text{AD}\) (阿尔茨海默病) vs \(\text{CN}\) (认知正常)。
    • \(\beta_G\), \(\beta_F\): 判别函数。这是估计目标 (estimand)\(\beta_G\) 定义在每个\(M_n\)的切空间(TM)上,编码几何判别信息(流形本身形状的变形);\(\beta_F\) 则是定义在 \(M_n\) 上的函数,编码厚度*判别信息。
    • \(L^2(M)\): 流形上的平方可积函数空间。
    • \(\lambda\): 正则化参数 (regulation parameter),控制模型的复杂度。
    • \(\beta = (\beta^G, \beta^F)\): 二元判别方向的向量。
    • \(\langle \cdot, \cdot \rangle_{L^2(M)}\): 流形\(M\)上的\(L^2\)内积。
  • 模型:本文的核心模型不是一个显式的数据生成模型(如 \(Y = X\beta + \epsilon\) 中的参数模型),而是一个带正则化的判别分析手段。本质是,作者要解决这个问题: > 找到一个向量 \(\hat{\beta} = (\hat{\beta}_G, \hat{\beta}_F)\),使得当将每个观测到的 \(X_n\) “投影”到 \(\hat{\beta}\) 方向的后得到标量 \(S_n = \langle X_n, \hat{\beta} \rangle\) (具体一个加权的积分,这里简化表示),能最好地将两类的 \(S_n\) 区分开来(即最大化 Fisher 分离度)。

    但作者的创新在于:他们\(S_n\) 视为函数 \(f_n\) 的主成分得分,而是将上述问题等价地转化为一个“标量输出、功能输入”的回归问题:$Y_n = \alpha_0 + \langle f_n, \beta_F \rangle_{L^2(M)} + \int_{T^M} \beta_G \cdot d\gamma_n + \epsilon_n $,其中 \(\gamma_n\) 是几何特征(形变场),通常是不可直接观测的,但他们巧妙地将几何信息编码在了 \(f_n\) 的支撑域 \(M_n\) 中对 \(f_n\) 的积分中。因此,这个模型成为一个功能线性回归模型*。他们的“最小二乘 + 微分正则化”目标函数是:

    \[\min_{\beta_G, \beta_F} \sum_{n=1}^N \left[ Y_n - \alpha_0 - \langle f_n, \beta_F \rangle_{L^2(M_n)} - \langle \text{geometric term via } M_n, \beta_G \rangle \right]^2 + \lambda \left( \|\mathcal{L}_F \beta_F\|^2 + \|\mathcal{L}_G \beta_G\|^2 \right)\]

    这里 \(\mathcal{L}_F\) 是一个二阶偏微分算子(如表面Laplacian),用来惩罚 \(\beta_F\) 的不光滑性。\(\mathcal{L}_G\) 是类似的用于几何的算子。重要的是,\(\beta_F\) 不需要是整个 \(L^2(M_n)\) 上的任意函数,而是要求它落在某一特定的Sobolev空间里(由 \(\mathcal{L}_F\) 决定)。这表明作者假设判别方向是足够平滑的。

  • 可观测数据

    • 观测到的是三元组集合 \(\{Y_n, X_n = (f_n, M_n)\}_{n=1}^N\)。每个 \(M_n\) 是一个已知的三角形网格(从MRI分割重建得到),\(f_n\) 是定义在每个三角形网格顶点上的已知数值(如皮层厚度)。由于不同 \(M_n\) 不同,全部观测数据的位置是随机且不匹配的
    • 想要但观测不到 (potential)的对象:是“普通的”判别方向 \(\beta_G, \beta_F\)——它们不是预设在某一个 \(M_n\) 上的,而是定义在所有流形上的全局函数。它们实际上是模板流形上的场。本文要估计的正是这个全局判别方向,同时要用PDE正则化强迫这个场是光滑的。

第二步:讲最小内核

最简特例:考虑最简单的情形——只有一个圆形域。假设所有 \(M_n\) 都是一个单位圆的一小段(如扇形),且它们的形状完全一样(不再随机)。那么,分类问题退化为在共有的固定域上,对标量函数 \(f_n\) 做线性判别分析。这是经典的功能线性判别分析 (FLDA) 的一个特例。

  • 在这个特例下:经典FLDA 的目标是找到一个方向 \(\beta_F\),使得投影 \(S_n = \langle f_n, \beta_F \rangle\) 的组间方差(类均值差)相对于组内方差最大。即:

    \[\max_{\beta_F} \frac{(\mu_0 - \mu_1)^T \beta_F}{\beta_F^T \Sigma \beta_F}\]
    其中 \(\mu_0, \mu_1\) 是两类函数的均值函数,\(\Sigma\) 是共同协方差算子的核。当维度(等于函数支撑上的顶点数)远大于观测数时,\(\Sigma\) 的估计极其不稳定(病态),导致数据不匹配时计算的彻底崩溃。

  • 本文核心思路的简化版:作者如何绕开它?核心想法是:把FLDA转化成一个对偶的、不涉及协方差估计的回归问题。

    1. 转化:将FLDA重新表述为一个标量 \(Y_n\) 对函数 \(f_n\) 的回归问题。这可以通过“Fisher 判定准则等价于最小二乘回归的判别函数”这一经典性质实现(对高斯、等协方差)。在连续性上,它等价于最小化

      \[\min_{\beta_F} \sum_{n=1}^N ( Y_n - \alpha_0 - \langle f_n, \beta_F \rangle_{L^2} )^2\]
      这个回归不再需要估计 \(\Sigma\)。但问题是,当 \(f_n\) 是高维函数时,这像个高维回归,解空间无限维,需要正则化。

    2. 正则化:如何防止过拟合?不再依靠数据驱动的降维(PCA或协方差正则化),而是人为嵌入先验光滑性假设(smoothness prior):假设判别方向 \(\beta_F\) 是一个光滑函数,其振荡受PDE算子约束。这就是微分正则化:在原始目标函数上加上 \(\lambda \|\mathcal{L}\beta_F\|^2_{L^2}\),其中 \(\mathcal{L}\) 是类似于 \(\nabla^2\) 的微分算子。

    3. 这个简化例子的命题:如果域固定(全是同一个单位圆),函数 \(f_n\) 定义在有限格点,PDE正则化项 \(\mathcal{L}\) 就是简单的二阶差分算子,那么:

      • \(\hat{\beta}_F\) 可以直接通过解一个大型稀疏线性系统(由正则化项和投影项构成)得到,无需先算数据协方差。
      • 证明最简版:收敛速率问题。假设 \(\beta^*_F\) 是真实判别方向(在Sobolev空间里,光滑度为 \(\theta\))。我们选择的 \(\lambda\) 需要平衡“回归误差”和“光滑性惩罚”。Cai & Yuan (2012) 在RKHS框架下证明了这类问题的最优预测收敛率是 \(n^{-\frac{2\theta}{2\theta+1}}\)。本文的核心理论工作就是在流形域上证明在这种正则化下的预测误差收敛到类似的最优率。

三、这篇论文做了什么(本次重心,务必讲透)

  • 三句话

    1. 研究了:支撑在随机、非线性流形(如个体的脑皮层表面)上的功能数据的分类问题,并开发了可直接解释判别方向(几何和功能特征)的统计方法。
    2. 核心工具/方法:将分类问题改写为带微分正则化(penalized PDE)的多元函数线性回归方程,直接估计判别方向 \(\beta = (\beta_G, \beta_F)\),而不需要(也不可能)先估计所有受试者功能形状协方差。
    3. 主要结论
      • 理论上:给出了在特定假设下(流形光滑、函数光滑、样本间存在模板对齐映射),样本外预测误差的收敛率(Theorem 4.1),为所选的正则化参数 \(\lambda\) 提供了理论指导。
      • 方法上:提出了一个通用的统计框架,能把分类问题、判别分析与函数数据的现代化估计技术(微分正则化)结合在流形域上。
      • 应用上:在合并的ADNI和PPMI神经影像数据上,验证了此方法能识别出同时包含皮层几何(形变)和功能(厚度)的判别特征,且这些特征与已知的AD神经解剖学文献高度一致。
  • 关键设定与假设:在第二节的最小记号基础上,补全完整的设定:

    • 假设 (Assumption 4.1 – Smoothness of discriminator):真实判别方向 \((\beta_G, \beta_F)\) 属于特定的Sobolev空间 (Sobolev space) \(H^s(M_t)\),其中 \(M_t\) 是一个已知的、光滑的模板流形,\(s\) 是光滑度参数。这个假设是整个理论和收敛速率的基石。这个假设被量化为:存在一个正定算子的幂 \(\nabla\)\(\Delta\),使得 \(\|\mathcal{L}^k \beta\|^2_{L^2} < \infty\) 成立。相比文献(Cai & Yuan (2012) 的RKHS框架有着对应的天然约束),这是个标准假设。

    • 假设 (Assumption 4.2 – Template Mapping & Diffeomorphic Deformation Map):存在一个从每一个个体流形 \(M_n\) 到共通模板流形 \(M_t\) 的已知且足够光滑的映射 \(\phi_n: M_n \rightarrow M_t\)。这个假设是这个理论的最大「前提」。这在实际中通过计算所有受试者皮层到标准球面的空间配准(例如基于球形注册)来完成。这个映射的存在性不仅使函数可以被拉回(pullback)到共同域进行分析,也定义了 \(\beta_G\)(在模板域切空间中的变形场)的意义。这是该设定的核心,也是其与经典functional data分析的巨大区别。

    • 假设 (Assumption 4.3 – Signal Strength on Discriminating Component):假设存在一个标量 \(\delta > 0\),使得两类在判别方向投影后的函数值(简化:组均值差)的差异 \(|\alpha_1 - \alpha_0|\) 至少为 \(\delta\)。此外,假设各流形 \(M_n\) 与模板 \(M_t\) 之间的形变场是条件可控的(保持Lipschitz常数一致有界)。这个假设阻止了问题变得平凡(即两类在给定方向下不可分离)。

  • 主要结果

    • 定理4.1 (样本外预测误差):假设4.1-4.3成立。令 \(\beta^* = (\beta^*_G, \beta^*_F)\) 为最优判别方向。令 \(\hat{\beta}\) 为公式(15)的解。同时定义 \(X^*\) 为独立于训练数据的独立复制(样本外测试)。则预测平方误差满足:

      \[E^* \left[ ( \langle X^*, \hat{\beta} - \beta^* \rangle_{L^2} )^2 \right] \leq C(\lambda) \cdot n^{-\frac{2\theta}{2\theta+1}}\]
      其中 \(\theta\)\(\beta\) 的光滑度参数(由假设4.1决定),\(n\) 是训练样本数,且 \(\lambda \asymp n^{-1/(1+\theta)}\)。 这个定理的核心结论是:收敛率由判别方向的光滑度 \(\theta\) 和样本量 \(n\) 决定,并达到非参数回归中的最优 minimax 率。这比无正则化的高维回归(理论上慢得多)要好得多。

    • 定理4.2 (判别方向的收敛性): 证明了在更强的假设下(对几何和厚度项的正则化常数比例 \(c_1, c_2\) 设定),估计的判别方向 \(\hat{\beta}_G, \hat{\beta}_F\) 在以 \(L^2\) 范数衡量的误差上也以 \(n^{-\frac{\theta}{2\theta+1}}\) 收敛。这表明除了预测准确,最终估计的方向(主要面)对样本的敏感性也以可预测的速度衰减。

  • 证明路线与技术技巧

    • 整体路线:三步骤。

      1. 转化与离散化:将连续的PDE约束下的优化问题(可能发生在Sobolev空间)在三角形网格上做有限元离散,转化为一个高维但稀疏的线性系统。
      2. 误差分解:把 \(\hat{\beta} - \beta^*\) 分解成近似误差 (approximation error, 由正则化项引入) 和估计误差 (estimation error, 由有限样本引入)。近似误差的解可以通过求解无噪声的变分问题得到。
      3. 维数刻画:关键的跳跃是利用PDE理论估计Green函数的谱性质,给出正则化项的特征值(比如 Laplacian 的特征值)下界。这个下界决定了正则化后的设计矩阵的条件数,从而给出了估计误差上界。最终结合近似误差的上界(由 \(\lambda\) 决定)和估计误差的上界(由样本 \(n\) 决定),通过选择平衡两者的 \(\lambda\) 得到最终收敛率。
    • 关键跳跃点

      • 难点:流形的差异性(不同 \(M_n\) 不同)导致处理函数退化到统一模板流形 \(M_t\) 的代价巨大。不同 \(M_n\) 上的函数通过传送到 \(M_t\) 时,会引入由形变场 \(\phi_n\) 导致的Location Error。最终回归问题变成了在模板流形的体素上用复杂的加权平均函数做回归。这等价于使用数据特定的核函数(因为位置不同)。
      • 作者技巧:作者明确假设形变 \(\phi_n\) 是已知的,并将其限制为一类Lipschitz连续的变形,然后用扰动分析证明了这种形变对预测误差的影响如同一个可以忽略的加性噪声,被吸收进误差项中。这省去了对他们最大的复杂性问题(随意的随机流形)的理论化处理。
    • 技术技巧点名

      • 经验过程理论 (Empirical Process & Chaining):用于控制估计误差。通过Gaussian人影界的Borel-Cantelli引理来量化随机误差。
      • 谱分析 (Spectra of Differential Operators):用Laplace-Beltrami算子或其他椭圆微分算子的谱理论来刻画正则化项的特征值,从而决定Green函数在Sobolev空间上的Schatten-范数。这个直接影响了估计误差上界中的维度依赖(实质上就是有效维数的概念)。
      • 有限元分析 (Finite Element Method):用于将连续优化问题离散到网格上进行数值求解,同时该离散化并不破坏理论分析中的谱性质。这是一个典型的“计算与统计的融合”技巧。
  • 真实例子

    • 数据/场景:合并ADNI(阿尔茨海默病)PPMI(帕金森病) 数据集,从中选出AD和认知正常(CN)的受试者。样本量 \(N \approx 400\)。每个受试者提供经过标准FreeSurfer管道处理的左半球皮层表面(即 \(M_n\))和其上皮层厚度(即 \(f_n\))。使用0.5mm模板进行配准。
    • 怎么用:模型输入:每个受试者的皮层表面几何和厚度图。输出:判别方向 \(\hat{\beta}_G\) (几何形变方向) 和 \(\hat{\beta}_F\) (厚度变化方向)。然后通过将灰度图的判别方向映射回不同的受试者表面,生成可视化结果(大脑图谱)。
    • 结果与说明
      • 结果\(\hat{\beta}_F\) 显示判别AD最重要的厚度区域包括内嗅皮层、颞叶、楔前叶、后扣带回——这些区域与经典的AD萎缩模式高度一致。\(\hat{\beta}_G\) (几何) 还揭示了因AD导致皮层褶皱重排的特殊模式(比如一定程度的沟回变平、侧裂加宽),这与CADDementia的宏观结构变化的研究相呼应。方法在分类测试集上取得了大约85%的准确率,优于只用几何或只用厚度的模型,也优于一个纯LDA基线。
      • 这个例子想说明什么:第一,方法能在高维、有噪声、非匹配的皮层数据上产生计算上合理且可解释的结果。第二,展示几何与功能信息共同使用的优势:组合模型优于单独使用任一种模态的模型,证明了皮层几何本身就包含额外的判别信息。第三,可视化结果验证了方法的解释性价值——它清晰标示出了哪些皮层区域和几何模式的改变是AD的标志。
  • 🔎 结论是否比证明窄:是的,需要特别指出的一个“狭窄”之处:定理4.1 的预测误差收敛率严格依赖于假设4.2——已知的、足够光滑的从个体到模板的配准映射 \(\phi_n\) 的存在。 在引言中,作者将不依赖预先的对齐视为一个优点,但实际上理论的核心推导是建立在对齐之后的模板流形上,而非直接在原始的随机 \(M_n\) 空间中。实际中,这个映射 \(\phi_n\) 需要昂贵的计算和复杂的参数优化。论文声称“避免了预计算协方差”这一点是事实,但并未强调此对齐过程本身也可被视为一种极强的预处理(对应到经典Functional Data中的warping步骤)。所以,理论上的优雅(n的收敛率)与实际应用中的“预处理成本”之间存在未阐述的张力。

四、开放问题(点到为止,扎根具体语句)

  • 开放问题1:更紧的最优率? 本文推导了预测误差的收敛率。但此率是否是该设定下的minimax最优率?尤其是在调节参数 \(\lambda\) 时,是否可能由于几何与厚度的联合惩罚导致比独立惩罚更慢的率?【扎根于:Theorem 4.1的证明中只给出了上界,未给出匹配的下界;引用链中并未包含任何针对此类特定“联合正则化”问题的minimax下界结果】。

  • 开放问题2:协方差估计计算成本的严谨量化。 作者声称避免了协方差的估计——这在固定域上是病态的,在随机域上是“计算上不可行的”。但“不可行”是否可被更严谨地表述?比如,对一般的 \(N=400\), \(p=10^5\) 的表面,带宽协方差的flop计数是多少?对经典的厚尾主成分分析谱分解,稳健版本的最差收敛时间有多大?【扎根于:引言中“in our setting, prior estimation of the covariance structure ... is computationally prohibitive”这句话,只用了经验断言,无定量论证】。

  • 开放问题3:非平稳/非光滑判别方向的推广。 本文假设判别方向 \(\beta\) 高度光滑(在Sobolev空间 \(H^s\) 中)。但如果真实的判别方向在局部(如某个脑沟的底部)是深度不连续性的(如局灶性病变特征为边界陡峭的萎缩),那么本研究的光滑性假设是否是一个限定?数据驱动的方式(如TV范数正则化)是否能在此流形框架下被理论化?【扎根于:Assumption 4.1 对光滑度和Sobolev范数的假设,以及对经典的TV正则化功能回归模型(如Wang and Zhu (2017))的引用展示了一条被略过的路径】。

  • 开放问题4:非线性判别方向与过拟合。 文章指出可将此推广到非线性模式(如functional single index model)。但引入非线性的代价是什么?(例如,对高维的流形域,引入Gaussian过程回归的样本复杂度是否会急剧增加?非线性模型的Fisher判别方向是否还与线性模型一样具有直接的“加减方向”解释性?)【扎根于:文章结尾Future Work提及“one can substitute...with a nonlinear function of the data...such as a polynomial term or a single-index model”】。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论