Projection-based two-sample inference for sparsely observed multivariate functional data¶

作者: Salil Koner, Sheng Luo
来源: Biostatistics
主题: 非参数 / 半参数
相关性: 6/10
机构绿灯: Duke University（US News 前 50，免分进入精读）
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本方向解决的根本问题是：在稀疏纵向设计下，如何对多变量函数型数据（Multivariate Functional Data, mvFD）做两组总体均值差异的显著性检验。所谓“稀疏纵向设计”，指每个个体只在少数随机时间点被观测，且观测点位置和数量因人而异，伴有测量误差——这是临床试验等长期随访中最常见的数据形态。而“多变量函数型”指每个个体在每个时间点记录的不是单个响应，而是一组（K维）功能/生物标记，它们之间序列相关。其统计挑战在于：① 个体函数轨迹是无穷维对象，但只有极少的、含噪的离散观测；② 要从有限观测中估计出多变量函数及其协方差结构；③ 要将K个分量间的动态相关性融入检验，而非做K个独立的逐分量检验再多重校正。

发展脉络（history）¶

现存文献的线索大致往前追溯到函数型数据分析（FDA）框架下的两样本检验。奠基工作来自Hall, Müller & Wang (2006)，他们首次严格刻画了稀疏纵向设计下函数型PCA（FPCA）估计的渐近性质：当个体被稀疏观测时，特征值估计是根号n一致的（半参数问题），而特征函数估计以非参数速率收敛——关键的“稀疏 vs 密集”二分法由此确立。随后的发展沿两条线展开：

单变量函数型数据的检验。Park et al. (2016) 提出基于bootstrap的固定效应推断，Wang & Chen (2012) 通过惩罚样条的LMM表示构造广义F检验，Pomann et al. (2016) 用marginal FPCA降维后套用非参数检验。Cui et al. (2021) 则走“逐点混合效应模型+平滑”的轻量路线，强调计算可行性。Wang (2021) 直接发展了稀疏观测下的均值差异χ²检验——这最接近本文的前驱，但它只处理单变量函数，不能处理多变量响应间的联合变异。
多变量函数型数据的检验。Górecki & Smaga (2017) 率先把MANOVA思路移植到函数型数据：每个函数的轨迹先基展开，再对基系数做多变量方差分析型检验。Krzyśko & Smaga (2021) 改用特征函数构建检验，但同样依赖基展开。Qiu, Chen & Zhang (2021) 提出了全局检验并结合渐近分布理论，但他们的设定隐含完全/密集观测或要求基展开系数近似——即并非针对稀疏、含噪的观测设计。

本文的位置：作者将上述挑战归纳为——现有mvFD两样本检验要么要求完全观测（各轨迹在同一细网格上被测量、且无噪声），要么依赖基函数展开的近似，而“稀疏+噪声”这一最临床相关的设定缺一个统一的、直接处理非平稳协方差且不依赖多重校正的检验。本文的贡献正在于此：在稀疏纵向设计下，用Multivariate FPCA（MFPCA）对多变量函数降维，再构造一个基于投影的单一p-value检验，克服逐分量检验的多重校正问题。

子线索聚类¶

PACE框架 + 单变量函数检验（Hall et al. 2006; Wang 2021; Park et al. 2016; Pomann et al. 2016）：利用FPCA先从稀疏观测中恢复个体得分，然后对得分做检验。关键工具是条件期望（BLUP）估计得分。当K=1时，这是自然框架；但文献中扩展到K>1时多以“分批处理”方式（逐分量MFPCA）绕过多变量联合结构，未充分捕捉分量间的动态相关。
基函数展开 + MANOVA型检验（Górecki & Smaga 2017; Krzyśko & Smaga 2021; Qiu et al. 2021）：先固定一族基函数（B样条/傅里叶），将每条轨迹投影到系数向量上，再套用多变量或核方法检验。优点是计算直接，缺点是在稀疏观测下，基展开的系数近似需要通过一定的平滑步骤，其估计误差不易同化到检验理论中（即渐近零分布推导往往假设系数可直接观察到或估计误差可忽略）。
纯投影 / 特征函数法（Krzyśko & Smaga 2021; Pomann et al. 2016）：用随机投影将函数降维至有限维，再对投影后的多元向量做检验。本文在精神上属于此类——但创新在于投影方向不是随机抽取，而是由MFPCA的协方差结构+加权最小二乘构造出来的，从而吸收了数据中的联合变异性。

这个方向在追问的核心问题（2-4个）¶

问题1：如何在大K、强相关情形下，将多变量函数响应间的联合信息有效凝聚成一个检验统计量，而丢失的信息可控？
问题2：在稀疏观测下，MFPCA的估计误差如何传导至检验统计量的渐近分布？能否获得检验统计量的显式收敛速率和功效表达式？
问题3：是否存在检验的最优性结果（即，在当前设定的半参数模型中，该检验能否达到效率界）——这是目前文献中明显缺失的一块。
已知瓶颈：论文intro明确指出的瓶颈是“多重检验+多重校正的损失”和“现有方法要求完全/密集观测”。

⚠️ 作者的framing¶

作者把缺口frame成这样一个叙事：“现有的mvFD两样本检验要么是在完全/密集观测下提出的（从而不适用于现实临床试验的稀疏纵向数据），要么是依赖于基函数展开（从而不能直接处理含噪声的稀疏观测），要么是逐分量检验后靠多重校正（从而损失功效）。我们用一个协方差驱动的投影，结合MFPCA，绕开了所有问题。”

被作者淡化的竞争路线： - 作者提及Pomann et al. (2016) 和 Wang (2021)，但一笔带过，未详细讨论这些方法是否能在功能上扩展到多变量情形（如简单的逐分量MFPCA再合并检验）。作者似乎默认读者认同“逐分量分析会丢失联合变异”这一判断，但没有用仿真比较来量化这种损失——而这恰恰应是评审中会被问到的问题。 - 值得研究者去查：作者引用了Li et al. (2018) 的fast covariance estimation for mv sparse functional data，却只作为方法参考，并未将其检验化。那么：能否在这个fast covariance estimator之上直接构造检验？作者的答案显然是“不能，因为它不直接给出投影方向和检验框架”，但读者可自行判断这是否是一个可替代路径。 - 明显该被引/该存在、却未出现在intro里：论文针对的是均值差异检验，但并没有引用近期在去偏机器学习/半参数效率理论框架下处理此类问题的文献（例如在纵向/函数型数据中利用EIF构造双稳健估计再检验的工作）。这可能是因为本书发表在应用统计（Biostatistics）上，而非方法论文献，但作为对半参数效率方向的读者而言，这是一个值得追踪的张力——是否存在一个已知的mvFD两样本检验的效率界？intro里完全不谈效率，只在最后的Limitation中提到“permutation方法可用于小样本校正”，暗示渐近分布在小样本下可能不准。

张力¶

未在现有被引文献之间发现明显基于不同结果的矛盾。作者引用Koladzija (2020) 等密切相关的预印本，仅在intro提了一句“在准备中”，未展开。整体的引用脉络是和谐的、累积式的，没有对立结论。但注意：Qiu et al. (2021) 宣称检验是“root-n consistent”，而本文在稀疏设计下检验统计量收敛速率是否仍为根号n，取决于协方差估计的收敛速率——这其实有隐蔽的张力：当稀疏程度足够极端时（每个体只观测1-2次），协方差估计退化为根号n收敛的“参数问题”吗？Hall et al. 2006已指出，特征值估计是根号n的，但特征函数估计的速率取决于平滑参数——这意味着检验统计量的收敛速率也可能被特征函数估计所拖慢。本文在定理3中没有给出收敛速率的显式阶数，而是以“收敛到正态”（Joost收敛）的形式陈述——这是值得核实的点。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号（逐个点名）：

\(i=1,\dots,n\) 样本个体索引；\(v=1,\dots,K\) 响应分量（模态）索引。
\(t\in\mathcal{T}\subset\mathbb{R}\)，通常是[0,T]上的连续时间，函数型数据所在的时间域。
\(Y_{i}(v, t)\)：第i个个体在时间t的第v个响应值——这是潜在完整轨迹，是无限维函数对象，不可被完整观测。
\(Y_{ij} = (Y_{i}(1, t_{ij}), Y_{i}(2, t_{ij}), \dots, Y_{i}(K, t_{ij}))^\top \in \mathbb{R}^K\)：第i个个体在第j个时间点\(t_{ij}\)的K维向量观测，j=1,…,N_i；N_i通常很小且因人而异。
\(t_{ij}\)：第i个个体的第j个观测时间点，设计是随机的、稀疏的。
\(\varepsilon_{ij} = (\varepsilon_{ij}^{(1)}, \dots, \varepsilon_{ij}^{(K)})^\top\)：测量误差向量，假设均值为0、协方差\(\Sigma_\epsilon\)（\(K\times K\)），独立于个体轨迹。
可观测数据：\(\{(t_{ij}, Y_{ij})\}_{i=1}^n, j=1,\dots,N_i\)。我们观测到的是：个体i在稀疏时间点上的含噪K维响应向量。
对此数据有两组（Group 1 & 2，指标记为g=1,2），我们要检验两组均值函数的差异：

\[H_0: \mu_1(v,t) = \mu_2(v,t),\ \forall v=1,\dots,K,\ \forall t\in\mathcal{T}\]

其中\(\mu_g(v,t) = \mathbb{E}[Y_i(v,t) \mid \text{group}=g]\)。

记\(\mu = (\mu^{(1)}(\cdot), \dots, \mu^{(K)}(\cdot))^\top\)为K维多模态均值函数，每个分量是定义在[0,T]上的连续函数。
个体i的噪声污染响应轨迹记作\(Y_i(v,t)\)，其潜在光滑轨迹为\(X_i(v,t) = \mu(v,t) + \tilde{X}_i(v,t)\)，其中\(\tilde{X}_i\)是零均值随机过程（个体间变异）。于是
\[Y_i(v,t) = X_i(v,t) + \varepsilon_i^{(v)}(t).\]
协方差函数：
\[\Sigma(v_1,v_2; s,t) = \mathbb{E}[\tilde{X}_i(v_1,s)\tilde{X}_i(v_2,t)],\quad v_1,v_2\in\{1,\dots,K\},\ s,t\in\mathcal{T}.\]
本文假设协方差在两个组间相同（common），且属于“非平稳”、但不要求是平稳过程的一类（宽泛类）。
MFPCA展开：在\(\mathcal{L}^2\)空间中将多变量函数\(X_i(\cdot,\cdot)\)表示为本征函数的无穷级数展开：
\[X_i(v,t) = \mu(v,t) + \sum_{m=1}^{\infty} \xi_{i,m} \phi_m(v,t),\]
其中\(\phi_m\)是第m个多变量本征函数（定义在\((v,t)\)上，满足正交性），\(\xi_{i,m}\)是个体得分（随机系数，均值为0、方差\(\lambda_m\)递减）；截断至前M个主成分得到低维近似。

第二步：最小内核¶

为了看清核心思路，先考虑一个极端简化的特例：

K=1（单变量函数型响应），因而MFPCA退化为普通FPCA。——但这不是作者要凸显的；作者论文内核的独特之处在于“整合K个模态的联合信息”，所以单变量特例刚好抹掉了这个特色。不如考虑：
K=2（两个响应模态），且每个体只被观测一个时间点（N_i ≡ 1）。另外协方差结构退化为块对角：模态内函数型协方差，跨模态不相关（这对本文而言是退化情形，但足以演示“投影”构造的本质）。

在这种特例下： - 可观测数据缩减为：对每个个体i，只在单一随机时间\(t_i\)观测到二维向量\((Y_{i1},Y_{i2})^\top \in \mathbb{R}^2\)，含测量误差。时间点t_i在各个体之间独立同分布，服从某个连续分布。 - 潜在轨迹\(X_i^{(1)}(t), X_i^{(2)}(t)\)是平方可积随机过程，但每个体只给出一个时间点的含噪采样。

检验问题：两组均值函数\(\mu_1^{(1)}(t)\), \(\mu_1^{(2)}(t)\) 和 \(\mu_2^{(1)}(t), \mu_2^{(2)}(t)\)是否相等？现在均值是定义在[0,T]上的连续函数。

听起来很荒谬——每个体只有一个点，怎么估计无穷维均值函数？这就是稀疏纵向设计的极端情形。此时，传统的“个体函数重建”完全行不通，因为一个点连一个标量都推不出函数。但本文的方法仍能工作：它不依赖个体轨迹重建，而是用所有个体跨时间点的数据来估计总体均值和协方差函数：用非参数平滑（如局部加权平滑）在时间域上对观测数据做回归，从而估计出\(\hat{\mu}^{(v)}(t)\)。然后对每个个体i，计算其得分估计（通过条件期望/BLUP）：\(\hat{\xi}_{i,m}\)。但注意，在这种极端情形下，得分估计将完全退化——因为N_i=1，条件期望\(\mathbb{E}[\xi_{i,m} \mid Y_{i1}, Y_{i2}]\)几乎不提供信息，几乎回缩到0。

那么本文的做法是什么？它实际上并不要求得分估计精确——它在构造检验统计量时，通过一个投影向量\(\mathbf{c} \in \mathbb{R}^K\)，定义

\[Z_i = \mathbf{c}^\top Y_i(t_i),\]

然后在这组标量观测上做两样本t检验。这个\(\mathbf{c}\)不是随便选的：它通过MFPCA的协方差结构（在本特例下是2×2的协方差矩阵在时间t_i处的估计）被选为最大化组间均值差的信噪比。于是，高深的MFPCA框架在极端特例下退化为：用MFPCA的协方差信息配出一组线性组合系数，然后对投影后的标量观测做两样本z检验。 这是本文数学内核的一个极端简化版本。

在此特例下，检验统计量的渐近分布问题退化为：\(\hat{\mathbf{c}}\)的一致性（因为\(\mathbf{c}\)是估计依赖\(\hat{\Sigma}\)的随机量）和投影后标量的均值和方差估计对检验统计量渐近分布的影响。论文的一般情形则允许任意K、任意个时间点——此时投影是在更高维（K×观测点个数）的空间里进行的，并且MFPCA的作用是为了从无穷维空间中有效选出一个方向，而不是仅使用简单的线性组合。

三、这篇论文做了什么¶

三句话¶

研究问题：在稀疏纵向设计（每个个体在少量随机时间点被观测、含噪声）下，对多变量函数型数据的两组均值函数做整体显著性检验；目标是通过一个单一p-value检验差异，避免对K个模态逐成分检验后的多重校正问题。
核心方法：先用多变量函数型主成分分析（MFPCA） 对K维无穷维函数轨迹降维，再用一个由协方差结构指引的投影向量将差异信号凝聚成一个标量检验统计量（F型或χ²型），最后推导其在零假设下的渐近分布。
主要结论：该方法适用于宽泛的非平稳协方差类，且在仿真中有效维持type I error（尺寸正确）且功效显著优于已有方法（包括逐成分FPCA检验、MANOVA型检验）。此外，作者证明了稀疏观测下MFPCA估计的一致性（定理2），并给出了检验统计量的渐近零分布（定理3）。

关键设定与假设¶

记号补充（在第二节基础上）：
Group g的样本量n_g，总n = n_1 + n_2。
对每个个体的观测为：\(Y_{ig}(t_{ij})\)，K维向量。数据可用缩写\(\{(t_{ij}^{(g)}, Y_{ij}^{(g)}):\,\, i=1,\dots,n_g,\ j=1,\dots,N_{ig}\}\) 表示。
协方差函数\(\Sigma^{(g)}\)假设组间相等：\(\Sigma^{(1)} = \Sigma^{(2)} = \Sigma\)（common covariance）。
模型表示为：
\[Y_{ig}(v,t) = \mu_g(v,t) + X_{i}^{(1)}(v,t) + \varepsilon_{ig}^{(v)}(t),\]
其中\(X_i\)是组内共享的零均值高斯过程（Karhunen-Loève展开）；\(\varepsilon_{ig}\)为测量噪声。
假设清单：
(A1) 个体过程：X_i是零均值二次可积L²({{mathcal{T}}})过程，且其轨迹以概率1连续。
(A2) 协方差结构：Σ是L²对称正定算子，存在可数特征对\(\{(\lambda_m, \phi_m)\}_{m\ge1}\)，\(\lambda_1 > \lambda_2 > \cdots >0\)。仅假设特征值衰减使得估计可行（无具体多项式衰减率假设——证明中依赖了某些如 \(\sum_{m} \lambda_m^2 < \infty\) 的轻量条件，这在非参数函数型数据中是标准且十分宽松的）。
(A3) 观测设计：每个个体的观测时间点\(t_{ij}\)是独立同分布从某连续密度\(f_T\)上抽取的，且独立于X_i和\(\varepsilon_{ij}\)。对应于“随机设计、稀疏且随机缺失”的标准设定。（注意：这与“固定设计”不同：后者每个个体的时间网格都相同。）
(A4) 噪声假设：\(\varepsilon_{ij}\)均值为0、协方差\(\Sigma_\epsilon\)（K×K），独立于过程X_i和时间点。
(A5) 样本量非退化：n_1/n, n_2/n → β∈(0,1)，典型的平衡假设。
与已有文献对比：假设(A2)不要求协方差平稳（stationary），也不要求Mercer展开有限维；这比许多逐分量检验方法（隐含假设离散时间点下的协方差矩阵是块对角）要宽松。与Qiu et al. (2021) 对比，后者要求“基展开 + 独立采样”设定。

主要结果¶

本文将讨论分解为两个阶段：① MFPCA估计（定理1-2），② 检验（定理3-4）。

定理1 & 2（MFPCA估计的一致性）：设\(\hat{\mu}(v,t)\)为由局部加权平滑得到的均值函数估计，\(\hat{\Sigma}(\tau;\rho):=\widehat{\text{cov}}(Y_i(v_1,\tau_1), Y_i(v_2,\tau_2))\)为由局部二步平滑得到的协方差曲面估计。在合适的光滑条件和带宽条件下，有： - 均值函数的一致收敛：\(\sup_{v,t}|\hat{\mu}^{(v)}(t) - \mu^{(v)}(t)| = o_p(1)\); - 协方差算子的一致收敛（在Hilbert-Schmidt范数意义下）：

\[\|\hat{\Sigma} - \Sigma\|_{HS} = O_p\left( \left( \frac{\log n}{n\bar{N}}\right)^{1/2} + h_\mu^2 + h_\Sigma^2 \right),\]

其中\(\bar{N}\)是平均每个体观测次数，\(h\)是带宽，误差项包含bias和variance两项。这个速率统一了“密集观测”和“稀疏观测”两种极端（若\(\bar{N}\)固定，则均值为根号n一致，协方差估计的本质速率由n决定而非总观测数N_total）。

定理3（检验统计量的渐近分布，核心结果）：检验统计量为：

\[T_n = \left( \hat{\boldsymbol{\theta}}\right)^\top \left( \widehat{\text{Var}}[\hat{\boldsymbol{\theta}}]\right)^{-1} \hat{\boldsymbol{\theta}},\]

其中\(\hat{\boldsymbol{\theta}}\)是投影后组均值差异的估计（经过MFPCA降维和投影），维数为J（MFPCA截断数）。在\(H_0\)和适当的条件下：

\[T_n \xrightarrow{d} \chi^2_{J}\quad\text{当 }n\to\infty.\]

这里关键的“投影向量”由估计的协方差特征函数决定的加权方向构成，目的是最大化信噪比（本质上是Cochran定理的推广）。文中强调这个结果在非平稳协方差下仍然成立，只要MFPCA估计是相合的。

定理4（功效）：在局部备择\(H_1: \mu_1 - \mu_2 = \delta_n\)下，若\(\delta_n\)以某种速率偏离0，\(T_n\)的渐近分布为非中心χ²分布，从而检验渐进上有幂。具体的功效率未以显式表达式给出，而是以“\(\| \delta_n\|\)偏离足够大时功效趋近1”的形式陈述——这比精确备择（fixed alternative）下的结果要弱，但更加稳健。

证明路线与技术技巧（理论型）¶

整体路线（3-5步）：

数据重构与平滑：对每个模态v的函数数据局部回归（局部线性/二次核平滑）得到均值曲面\(\hat{\mu}^{(v)}(\cdot)\)和协方差曲面\(\hat{\Sigma}(\cdot,\cdot)\)。这个步骤相当于Hall et al. (2006)的“两步平滑”在mvFD上的直接推广。
MFPCA降维：对\(\hat{\Sigma}\)做谱分解，得到估计的本征函数\(\{\hat{\phi}_m\}_{m=1}^M\)和本征值\(\{\hat{\lambda}_m\}\)。截断数M的选择由特征值贡献率（如95%的方差解释）给定，是数据自适应可选的，而非常数。
个体得分估计：通过条件期望/BLUP公式：
\[\hat{\xi}_{i,m} = \hat{\lambda}_m \hat{\boldsymbol{\phi}}_{i,m}^\top (\hat{\Sigma}_{Y_i} + \hat{\Sigma}_{\epsilon,i})^{-1} (Y_i - \hat{\mu}_i),\]
其中\(\hat{\boldsymbol{\phi}}_{i,m}\)是在个体i的观测时间点上取值的本征函数向量，\(\hat{\Sigma}_{Y_i}\)是时间点协方差矩阵，\(\hat{\Sigma}_{\epsilon,i}\)是噪声协方差矩阵在这个体上的形式。这里关键是形成的矩阵维数不大（因为N_i小），所以可逆性一般满足。
投影构造：定义投影向量\(\mathbf{c}\)，使得\(\theta_g = \mathbf{c}^\top \bar{\boldsymbol{\xi}}_g\)最大化\(\theta_1 - \theta_2\)在给定协方差结构下的标准化差异（本质上是线性判别分析的变体）。实际计算中，\(\mathbf{c}\)被选为MFPCA第一大特征向量（或者前几个），把维度从J压缩到1；然后做双样本t检验或F检验。为生成单一p-value，做的是：先用F-like检验的前M个主成分，再用Hotelling’s T²来综合。
渐近分布推导：主要步骤是证明\(\hat{\boldsymbol{\theta}}\)（投影后的组均值差）的渐近正态性：
将由MFPCA估计引入的近似误差（truncation bias + estimation error）统一处理为剩余项；
通过非参数渐近正态性（如去中心化的U-统计量展开）和偏斜调整将估计的协方差阵用于标准化；
最后利用Cochran定理得到χ²渐近分布。

关键跳跃点： - 最吃功夫的是处理截面数据结构：因为每个个体只有一个随机时间点序列，当协方差估计中需要用不同个体的时间点配对构造经验协方差时，产生的“两体经验协方差曲面”在稀疏情形下是非参数估计，其收敛速率比参数(√n)慢——定理1中出现的bias项\(h_\mu^2 + h_\Sigma^2\)正是非参数速率的核心表现。作者通过展示检验统计量中的剩余项（由MFPCA估计误差传导而来）是更高阶小量（即\(\sqrt{n}O_p(..)\) → 0），从而保证最终的检验统计量在n增大时不嵌入估计误差。本质是Zo + plug-in项的泰勒展开结构。

另一个关键引理是：检验统计量中投影方向\(\mathbf{c}\)的估计误差对最终检验的渐近分布无贡献，因为它在标准化过程中消失（类似于在t检验中先估计方差不会改变t的极限分布）。这里的证明必须确保\(\hat{\mathbf{c}}\)是一致估计且收敛速率至少是\(\sqrt{n}\)，以避免误差向检验统计量的偏差传递。

技术技巧点名： - 两步加权核平滑（local linear smoother with Epanechnikov kernel）用于均值曲面与协方差曲面估计，是Hall et al. (2006)的扩维版。 - 条件期望得分估计（BLUP / kriging）——在许多FDA文献中称为“PACE估计”，本质是假设高斯过程后用Karhunen-Loève展开和协方差结构计算的最佳线性预测量。 - 将MFPCA视为投影算子，用于构建一个秩1或低秩的判别方向；实质是Fisher线性判别在高维/函数型数据中的投影→检验操作。 - 渐近χ²分布的证明中用到了加权一致经验过程的弱收敛（可视为“multivariate functional→finite random vector”映射的连续性），以及Cramér-Wold device来降维为正态性检验。

真实例子与应用¶

本文包含两个真实数据应用：

例1：TOMMORROW研究（阿尔茨海默病）： - 数据来源：一项多中心、随机对照试验，对象为认知正常但基因风险较高的老人，随机分为吡格列酮（pioglitazone）组和安慰剂组。主要终点是一系列认知测试得分（包含多个分量，如ADAS-Cog-13、CDR-SB、MMSE等），以纵向方式测量（每6个月一次随访，总计13次，但很多个体因脱落或错访而产生稀疏观测）。 - 方法用法：将K个认知测试得分视为K维多模态函数型数据，对两组（用药组 vs 安慰剂组）的均值轨迹差做检验。本文的投影检验生成了一个p-value（p=0.046，p接近0.05但显著差异），而逐成分FPCA检验需要多重校正（Bonferroni校正后各模态无显著差异）。单一p-value的发现暗示用药可能对认知衰退有延迟效果，但很微弱——这正是临床试验阶段希望捕获的信号。 - 这个例子想说明什么：① 显示出单一p-value的优越性（在弱信号下未被多重校正“杀掉”）；② 展示了方法能处理真实临床试验中常见的缺失/稀疏模式；③ 传递的核心结论是“现有逐模态方法如果使用多重校正，会将这个勉强显著的信号完全掩盖”。

例2：Azillect研究（帕金森病）： - 数据：关于雷沙吉兰（rasagiline）是否能延缓帕金森病进展。主要终点是UPDRS评分（包含多个部分——运动、日常生活活动等），同样重复测量但稀疏。本文用方法比较两个不同剂量组RI vs placebo。 - 中间结果：检验显著，且区分出哪些UPDRS分量对差异有最大贡献（通过投影方向\(\hat{\mathbf{c}}\)的分量权重解读）。 - 这个例子强调方法的可解释性：投影向量\(\hat{\mathbf{c}}\)的分量绝对值大小暗示哪个分量对组间差异贡献最突出。

🔎 结论是否比证明窄¶

定理3给出的是“当\(n\to\infty\)时\(T_n\stackrel{d}{\to}\chi^2_J\)”，但证明中隐含假设信息矩阵\(M\)是离散的且估计一致——而后续power计算则依赖特定“备择”形式（如\(\delta_n = O(n^{-1/2})\)）。在仿真中，作者是通过“Permutation法”校准小样本下的拒绝阈值，这说明渐近分布在小样本下可能偏差较大。作者在结论(p.12)承认这一点（“The asymptotic distribution provides a natural cut-off for moderately large n; for small samples, permutation calibration is recommended”），但未给出这两种映射之间的理论比较。这意味论文的纯渐近性结论可能不比简单Bootstrap/排列法更“精确”——这是一个窄于第一印象的结论。
此外，定理2的收敛速率陈述是rate-optimal吗？作者没有给出minimax下界来佐证，所以只能说相合而非最优。在FDA文献中，Efron (2020) 等人已有更精细的结果，但本文作为Biostatistics的方法论文，不追求rate optimality也合理——只是读者在比较时需注意。

四、开放问题¶

异质性协方差：本文假设两组协方差相同。这在实际临床试验中不一定成立，尤其是当稳步组间差异较大时（例如用药可能同时改变均值和变异结构）。能否放宽为异质协方差？ 作者在Limitation中只蜻蜓点水提到“可以考虑group-specific covariance”——但未给出一个越过此假设的路线图。这是开放问题的一个具体落脚点。
小样本下的检验：作者推荐小样本时使用permutation来校准阈值，但permutation在稀疏纵向结构下是否保持交换性？若两组不是完全可交换（例如协方差不同或观测时间分布不同），permutation法的type I error可能膨胀。这是一个有实际意义的开口——扎根于论文那句“For small samples, permutation calibration is recommended”及其背后未展开的分析。
从投影到效率：本文的检验构造方法仅通过信噪比最大化隐式地选择方向，但没有从半参数效率界的角度论证这是最优的。是否存在一个不依赖于投影（或依赖于更好的投影）的、达到Semiparametric efficiency bound的检验？一方面，这是本文工作的自然延伸（作者完全没有围绕效率展开）。另一方面，R. Pitman (1979) 的效率理论指出，两样本检验下局部最优的渐近握力来自似然比——而本文的方法可视为似然比检验在非参数平滑+函数型数据下的替身。若能将本文的投影检验框架与Efficient Influence Function（EIF） 结合，分析局部备择下的渐近相对效率，将是值得投入的方向。具体抓手：本文定理3的证明构造可以作为敞口——它已经给出了检验统计量的方差形式\(\hat{V}\)；要计算其相对于“完全已知协方差”的损失，可以基于已知的EIF构造一个比对标准。
高维K的挑战：本文中的K（模态数）固定且较小（在真实例子中K≈4-7）。如果K增大到几十或几百（如多模态神经成像，每个体素为一个模态），MFPCA的估计负担会急剧增加，而投影方向\(\mathbf{c}\)可能在高维下不稳定。此时是否可以考虑更稀疏的投影（如用\(\ell_1\)正则化选择少数模态），或使用随机投影压缩模态维数？这个问题扎根于论文的仿真设计——它只在K≤5时检验了方法的能力，未涉及高维模态情形。

Maintained by 陈星宇 · Homepage · Source on GitHub