Functional hybrid factor regression model for handling heterogeneity in imaging studies¶

作者: C Huang, H Zhu
来源: Biometrika
主题: 非参数 / 半参数
相关性: 4/10
机构绿灯: University of North Carolina at Chapel Hill（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomet/asac007

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向处理的是多中心/多研究整合中的异质性：来自不同研究（不同扫描仪、不同人群、不同协议）的影像数据，其分布不仅是 batch effect，还可能是由未观测到的隐变量（latent factors）导致的系统性偏差。核心统计问题是在部分回归系数不可识别的设定下，如何同时估计主效应（研究者关心的，跨中心共有的协变量-响应关系）与检测导致异质性的未知因子数。

该领域的发展动力来自大型多中心影像研究（如 ADNI），其成熟度处于“已有若干方法但缺少严格推断理论”的阶段——在成规模的单中心分析工具（如 FLAME、voxelwise GLM）之后，学界意识到忽略异质性会导致假阳性膨胀或功率损失。

发展脉络（从 introduction 引用句构建）¶

奠基工作：早期多中心异质性处理主要用线性混合模型（Laird & Ware, 1982；Verbeke & Molenberghs, 2000），把中心效应视为已知群组的随机截距——这要求研究者事先知道异质性的来源分组（哪几个中心一起偏），且忽略了中心内可能也有未记录子结构。
主要进展：当异质性结构未知时，一个自然的框架是因子模型。Fan et al. (2016) 在经济学中引入“交互固定效应”（interactive fixed effects）——把异质性参数化为负荷乘因子 的结构，但他们的响应是经济面板（长 T、许多单位），不适用于影像中常见的“每人一个超长向量”（如皮层厚度数据）的设定。
当前 frontier：近年出现了若干适应函数型数据结构的因子回归方法。Kong et al. (2019) 与 Li et al. (2017) 将因子互动结构嵌入到函数型主成分的设定里，但主要关注预测而非主效应推断；且它们的理论收敛速度依赖于因子数已知或可一致估计，缺乏检测程序。
本文的位置：作者把缺口 frame 成“需要一个既能估计主效应、又能自动检测未知因子数的函数型半参数模型，并且要为二者提供严谨的渐近理论”——本文提出的 FHFRM 完成了这个集成。作者用引用句判断对已有方法的定位："existing interactive effect models… mainly focus on prediction accuracy and do not provide statistical inference for the parameters" (fan2016)；“factor number selection in the existing approaches often relies on information criteria without a clear formal justification under functional data settings" (Lam/Yao, 2012)。

子线索聚类¶

被引工作大致落在三条子线索上：

交互固定效应（面板计量）— Fan et al. (2016), Bai (2009)：用因子结构建模异质性但只处理标量响应，且 T 必须远大于因子数；理论依赖于主成分估计的一致性。
函数型数据中的因子模型— Kong et al. (2019), Li et al. (2017)：将异质性嵌入函数型主成分（fPCA）但是主要瞄准降维与预测而非参数推断；因子数的选择缺乏分布理论。
多水平函数型模型— Greven et al. (2010), Crainiceanu et al. (2009)：用方差分量模型（随机效应）刻画组内相关，但假定群组划分已知（如同一个扫描批次），不适用于因子加载方式未知的情形。

该方向在追问的核心问题¶

Q1：当异质性被参数化为未知因子时，主效应参数（跨中心共有的回归系数）在什么条件下是可识别的？
Q2：因子数（异质的维度）能否被一致估计并提供渐近分布的推断（不只是点估计或信息准则）？
Q3：函数型响应（每条曲线在密集格点上观测）背景下，上述估计与推断的收敛率与离散化误差、函数型光滑度、因子数之间的关系如何？
Q4：当前主流方法（PC-based factor extraction）在因子负荷不与主效应相正交时是否仍然一致？是否可达 semiparametric 效率界？

已知瓶颈：① 大多数方法假定因子数已知或可一致估计但无分布理论；② 在高维成像设定（p >> n）的处理一般只考虑稀疏性，不兼容因子异质结构；③ 推断程序对主效应-因子负荷的相关性较敏感，常需额外正交约束。

⚠️ 作者的 framing（必须明确标注成”这是作者的说法“）¶

作者把缺口 frame 成一个集成问题：“现有的方法或者只做预测不提供推断（因子阶段），或者假设因子数已知（主效应阶段），没有一个框架同时完成——在函数型响应设定下——参数估计与因子数检测这两件事，并且为二者都提供严格的渐近理论。” 这是作者的说法。

被淡化或回避的竞争路线：
- 用贝叶斯层次模型（如 multilevel fPCA；Aston et al., 2010）处理异质性——直接在方差分量上引入先验，天然可以规避因子数选择问题（自动稀疏）。作者仅一句带过“Bayesian approaches have computational burden and may be sensitive to prior specification”，没有详细比较贝叶斯方法的灵活性和现有 MCMC 收敛性成果。 - nonnegative matrix factorization 方法 或 tensor decomposition 也被完全忽略。

什么明显该被引 / 该存在、却没出现在 introduction 里： - 用于因果推断中处理未观测混杂的Proximal Causal Inference / Negative Control文献（Tchetgen Tchetgen et al., Wang & Blei, Miao et al.）——它们也用因子结构参数化不可观测的混杂，但目标（处理效应的可识别性）与本文“在异质性存在下估计主效应”在数学上极其相似（都是处理 Y = Xβ + Zγ + ε 中 Z 不可观测的情形）。未引用该线索是本文的一个显著缺口。 - 计量经济学中的common correlated effects (CCE) estimator（Pesaran, 2006），它通过引入 cross-sectional averages 来控制未观测因子，不需要估计因子数——是一种更简单的替代策略。本文没有讨论 CCE 在功能型响应下的可能性。

张力¶

被引文献之间未见明显矛盾，但有一处值得注意的methodological tension：在面板计量中，Bai (2009) 和 Fan et al. (2016) 通过主成分 + 最小二乘的两步法实现估计一致性，而本文的因子数检测是通过对残差谱的切割推断来完成的。实际上，因子数检测与主效应估计之间的相互影响（因子数误定会否破坏主效应推断的覆盖？）在本文的模拟中做了试探，但理论上只处理了“已知因子数”和“估计的因子数”两种情形，没有系统分析误定下的偏差。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号 ——所有记号都在下面交代清楚，后面不再重新定义：

\(Y_i(t)\)：第 \(i\) 个个体的响应函数，定义在紧区间 \(\mathcal{T}\) 上，在密集格点 \(t_1,\dots,t_M\) 上被观测。
\(X_i\)：\(p \times 1\) 维主协变量向量（如年龄、性别、基因风险位点），研究者的核心兴趣就在它们的系数 \(\beta(t)\)。
\(\gamma_{i}^{(k)}(t)\) 与 \(f_k(t)\)：异质性结构的核心成分。\(K\) 为因子数（未知）。
\(f_k(t)\)：第 \(k\) 个共享的因子负荷函数（也称“共同曲线形状”）。
\(\gamma_{i}^{(k)}\)：第 \(i\) 个个体的第 \(k\) 个因子得分（个体因素，类似随机效应）。
\(e_i(t)\)：均值为零的光滑误差过程，与所有 \(\gamma, X\) 独立。
\(\eta_{i}\)：附加的个体随机效应（测量误差或微观结构偏差），在格点上独立且满足弱条件。

模型（数据生成机制的可观测形态）：

\[Y_i(t) = X_i^\top \beta(t) + \sum_{k=1}^K \gamma_{i}^{(k)} f_k(t) + e_i(t),\]

其中 \(e_i(t)\) 是含相关结构（各向同性或 Matern）的 Gauss 过程，独立于 \(X_i\) 与 \(\gamma_i\)。每个个体 \(i\) 同时属于未知的异质结构——个体因子得分 \(\gamma_{i}^{(k)}\) 之间不可观测地相关，且 \(\gamma_i\) 与 \(X_i\) 本身可能相关（即异质性由人群与环境因素造成，而非随机的独立成分）；该相关性正是导致异质性必须校正的核心原因。

可观测数据：对 \(n\) 个独立的个体，我们观测到：

\[\{\, (Y_i(t_m),\, X_i) \mid i=1,\dots,n,\ m=1,\dots,M \,\}.\]

我们不能直接观测： - 因子数 \(K\) - 因子负荷函数 \(f_k(t)\) - 个体因子得分 \(\gamma_i^{(k)}\) - 误差过程 \(e_i(t)\) 的具体实现

换言之，所有异质性来源的结构 \((\gamma, f, K)\) 都是潜在量，只能通过协方差结构的谱模式推断。

第二步：最小内核（最简特例）¶

把一般设定剥掉，取最简特例：\(p=1\)（只有一个协变量 \(X_i\)），\(M\) 很大（响应在密集格点上），且已知 \(K=1\)（只有一个不可观测因子）。此时模型成为：

\[Y_i(t) = X_i \beta(t) + \gamma_i f(t) + e_i(t),\]

其中 \(\gamma_i \sim (0, \sigma^2_\gamma)\) 与 \(X_i\) 可能相关，\(f(t)\) 是平滑函数。可观测数据：\(\{(Y_i(t_1), \dots, Y_i(t_M), X_i)\}_{i=1}^n\)。

核心难题：\(X_i\) 与 \(\gamma_i\) 相关——如果直接用 \(Y_i(t)\) 对 \(X_i\) 回归（函数型线性模型），\(\beta(t)\) 会因为 \(X_i\) 与不可观测的混淆因子 \(\gamma_i\) 相关而产生偏倚。

本文思路在这特例下的形态：

谱分解去混淆：取 \(Y_i(t)\) 的函数型主成分分解。因为 \(\gamma_i\) 只有一个因子，它的贡献会使协方差矩阵 \(\Sigma_Y(s,t) = \mathrm{Cov}(Y_i(s), Y_i(t))\) 的第一特征方向对齐到 \(f(t)\) 的张成空间（加上 \(X_i\beta(t)\) 的贡献），而之后的特征方向则主要由误差 \(e_i(t)\) 支配。通过对谱空间进行切割（最简切法：取第一个特征函数作为 \(\hat f(t)\)），得到因子负荷的估计。
去除混估计主效应：用 \(\hat f(t)\) 构造投影 \(\hat \gamma_i = \int \hat f(t) [Y_i(t) - X_i\tilde\beta(t)] dt\)，然后从 \(Y_i(t)\) 中剔除投影部分得到“去偏的”残差曲线，再重新回归 \(X_i\) 得 \(\hat \beta(t)\)。这个递推需要交替更新——具体见第三节。
当 \(K\) 未知时：对残差的协方差谱做顺序特征值差异检验（见下文），若 \(\lambda_{r+1} / \lambda_r < \tau\)（某个渐近阈值），则停止在 \(r = K\)。

在这特例下，待证的核心命题退化为：

给定 \(n\) 个独立个体，响应在 \(M\) 个密集格点上观测，\(p=1\)，\(K=1\) 已知，\(\beta(t) \in C^2(\mathcal{T})\) 充分光滑，\(\gamma_i\) 与 \(X_i\) 可任意相关，则存在估计量 \(\hat \beta(t)\) 使得

\[\|\hat\beta - \beta\|_{L^2} = O_p(n^{-1/2} + M^{-2})\]

且 \(n^{1/2}(\hat\beta - \beta)\) 弱收敛到一个零均值 Gauss 过程。

它的难点在于：要在未知 \(f(t)\)、\(\gamma_i\) 的情形下恢复 \(\beta(t)\)，且收敛率达到半参数有效速率。

三、这篇论文做了什么¶

三句话¶

研究问题：在多中心影像整合中，提出了功能型混合因子回归模型（FHFRM），将异质性结构参数化为未知潜变量 + 因子负荷，并同时实现主效应 \(\beta(t)\) 的估计与异质性因子数 \(K\) 的检测。
核心工具：使用谱分解 + 函数型主成分对协方差结构进行分离，再通过递推最小二乘 + 投影从观测曲线中去除因子的混效应；因子数检测基于特征值比值检验。
主要结论：\(\hat\beta(t)\) 在 \(L^2\) 范数下以 \(O_p(n^{-1/2} + M^{-2})\) 收敛（当 \(n, M \to \infty\)），因子数估计 \(\hat K\) 具有相合性（以概率趋近1估计正确）；构造了 \(\beta(t)\) 的逐点置信带，其渐近覆盖满足目标水平。

关键设定与假设¶

在第二节最简记号的基础上，补全完整设定假设（以下假设在本文 Section 2 中列出；标记 H1–H7）：

(H1) 光滑性：\(\beta(t) \in C^2(\mathcal{T})\)；\(f_k(t) \in C^2(\mathcal{T})\)；\(E[e_i(t)]\) 的协方差核充分光滑。足够光滑度保证函数型主成分的逼近误差可以控制。
(H2) 因子的独立性与矩条件：\(\gamma_i = (\gamma_i^{(1)}, \dots, \gamma_i^{(K)})^\top\) 独立同分布（个体间），均值为 \(0\)，协方差矩阵正定；但 \(\gamma_i\) 可与 \(X_i\) 任意相关（即异质性可以“混”入协变量）。
(H3) 误差过程：\(e_i(t)\) 是均值为零的 Gauss 过程，协方差核 \(\Sigma_e(s,t)\) 满足连续性与有界性；\(\eta_i\)（微观测量偏差）为白噪声。
(H4) 格点密度：\(M \asymp n^{\alpha}\) 且 \(\alpha > 0\)；对于收敛率，\(M\) 需以 \(n\) 的多项式速度增长才能使离散化误差可忽略（本文具体要求 \(M n^{-2/5} \to \infty\)，由样条光滑度决定）。
(H5) 因子数有界：真实的 \(K\) 不随 \(n, M\) 增长。
(H6) 潜在因子负荷的正交归一：\(\langle f_k, f_l \rangle_{L^2} = \delta_{kl}\)（为可识别性）。
(H7) （关键识别条件）：去除 \(X\) 的“主效应”之后，残差协方差矩阵的主导特征对（前 \(K\) 个特征函数）在 \(f_k\) 张成外——即 \(\mathrm{Cov}(Y_i - X_i^\top \beta, \cdot)\) 的秩为 \(K\)。换句话说，协变量 \(X\) 并不能完全解释效应；剩下的因子结构的秩由潜变量控制。

相比已有文献】：

相比 Fan et al. (2016) 的面板因子模型，本文允许函数型响应且无需长面板的 T，放宽了“每个单位的重复观测个数需远大于因子数”这个条件，转化为对格点数的要求。
相比 Kong et al. (2019)，本文增加了正式的假设检验步骤做因子数选择，而不仅靠截断奇异值。
与本文分析的相关性：H2 允许 \(\gamma_i\) 与 \(X_i\) 相关，这正是去混淆的困难所在——如果相互独立，主效应可以直接通过随机效应方式处理（兼容混合模型），但作者明确选择了一般情形。

主要结果¶

定理 1（参数估计的一致性）——假设 H1-H7，且 \(K\) 已知（或者 \(\hat K\) 满足相合性），则：

\[\|\hat\beta - \beta\|_{L^2} = O_p\bigl( (n^{1/2})^{-1} + M^{-2} \bigr).\]

直觉：第一项 \(O_p(n^{-1/2})\) 来自参数估计的中心极限；第二项 \(M^{-2}\) 是格点离散化误差，由于使用了三次样条近似当前的光滑 \(\beta(t)\)，所以误差为 \(O(M^{-2})\)。当 \(M\) 增长足够快（\(M n^{-2/5} \to \infty\)），\(O(M^{-2})\) 可以忽略，收敛率就是 \(O(n^{-1/2})\)——达到了半参数有效速率。
必要条件：H2（矩条件）, H4（格点密度阈值）, H7（残差秩条件）。
解决的技术难点：因子结构的未知性导致的“不确定偏差”（uncertainty when factor is unknown）作者通过谱分解 + 递推投影解耦：先在第一步忽略因子结构拟合初始 \(\beta\)；然后将残差的主成分提取出因子结构；再用其重建 \(Y_i - \hat\gamma_i \hat f\) 从而得到去偏的响应，更新 \(\beta\) 的估计。三步经过一次迭代即达到一致——作者证明了一次精炼即可消除因子得分与 \(X\) 的相关性。

定理 2（因子数检测的相合性）——设 \(\widehat{\lambda}_1 \ge \widehat{\lambda}_2 \ge \cdots \ge \widehat{\lambda}_{R_{\max}}\) 为去除主效应后残差函数主成分的估计特征值。令

\[\hat K = \arg\max_{r = 1,\dots, R_{\max}-1} (\widehat{\lambda}_r - \widehat{\lambda}_{r+1}) / \widehat{\lambda}_{r+1},\]

则在 H1-H7 下，\(\mathbb{P}(\hat K = K) \to 1\) 当 \(n, M \to \infty\)。

直觉：如果真实的 \(K=1\)，则 \(\lambda_1\) 是信号特征值（\(O(1)\)），\(\lambda_2, \lambda_3, \dots\) 来自误差的谱（\(O(1/\sqrt{nM})\) 下的噪音）。所以第一 /\ 第二特征值比值会趋于无穷，而后续相邻比值都趋于常数（一个以 \(1\) 为界的值）。本文检验的比值统计量利用了这种谱间断。
技术难点：证明比值统计量的极限分布（以及阈值的选择不依赖 \(K\) 本身）。作者使用随机矩阵论的经典结果（Bai-Yin, Tracy-Widom），但要处理函数型 PCA 的误差估计。他们最终用残差过程的协方差算子谱的 gap 条件证得渐近阈值 \(\tau_n \to 1\)。

定理 3（逐点置信带）——\(\hat\beta(t)\) 的逐点方差函数 \(\widehat{\mathrm{Var}}(\hat\beta(t))\) 可构造，且

\[\frac{\hat\beta(t) - \beta(t)}{\sqrt{\widehat{\mathrm{Var}}(\hat\beta(t))}} \xrightarrow{d} N(0, 1),\]

给出渐近有效的逐点置信带。

证明路线与技术技巧¶

整体路线（已知 \(K\) 的情形；未知 \(K\) 只增加一个预处理检测步骤）：

初始估计：忽略异质性结构（假设 \(\gamma_i\equiv 0\)），对每个格点 \(t_m\) 逐点回归 \(Y_i(t_m)\) 对 \(X_i\)（ols），经过样条平滑后得到 \(\tilde\beta_0(t)\)。这个估计有偏（未控制 \(\gamma\)），但收敛率在 \(L^2\) 下是 \(O_p(1)\)（不随 \(n\) 缩小）。
谱切分目标：计算残差曲线 \(\tilde e_i(t) = Y_i(t) - X_i^\top \tilde\beta_0(t)\) 的经验协方差函数 \(\hat\Sigma_e(s,t)\)，做函数型主成分分解得到 top \(K\) 特征函数 \(\hat f_1,\dots,\hat f_K\) 与得分 \(\hat\gamma_{i}^{(k)} = \langle \tilde e_i, \hat f_k\rangle\)。
投影去除因子混效应：对每个 \(i\)，构造去混后的曲线：
\[\tilde Y_i^{\text{adj}}(t) = Y_i(t) - \sum_{k=1}^K \hat\gamma_i^{(k)} \hat f_k(t),\]
这步消除掉 \(\gamma\) 结构的贡献（近似程度取决于第 2 步的收敛率）。
更新 \(\beta\)：用 \(\tilde Y_i^{\text{adj}}(t)\) 代替 \(Y_i(t)\) 对 \(X_i\) 做函数型线性回归（对每个格点 ols + 样条平滑），得 \(\hat\beta(t)\)。
渐近理论：证明第2步中 \(\hat f_k\) 以 \(L^2\) 收敛到真 \(f_k\)（速度 \(O_p(1/\sqrt{n})\)），从而第4步中做回归时可忽略因子估计的不确定性（由于第2步的相合性，因子结构中携带的“混”被消去，\(X_i\) 不再与残差相关），从而实现半参数有效。

关键跳跃点：

引理 1：\(\|\tilde\beta_0 - \beta\|_{L^2} = O_p(1)\)（有界）。看起来平凡，实则保证即便是偏的初始估计，其残差中仍能捕捉因子结构——因为偏只来自 \(X_i\) 与 \(\gamma_i\) 的相关，而不改变谱的 rank。这是用残差做 PCA 的必要条件。
引理 3：\(\|\hat f_k - f_k\|_{L^2} = O_p(n^{-1/2})\)。证明需要控制：① 函数型 PCA 的摄动界（Bhattacharjee & Bose, 2021 的方法推广到带回归调整的情形）；② 初始估计偏差带来的误差只有 \(O(n^{-1/2})\)（假设 \(\beta\) 足够光滑），不影响谱结构。作者这里用了残余化的技巧——在一次投影后将偏置项的背后效应压缩入较小谱，再通过谱 gap 条件实现分离。
定理 1 的证明核心跳跃：在第4步构造 \(\hat\beta\) 时，显示剩余误差 \(\epsilon_{i}(t) = Y_i^{\text{adj}}(t) - X_i^\top\beta(t)\) 在给定 \(X\) 下近似不相关（收敛到零均值的 Gauss 过程），从而回归的无偏性成立。

技术技巧点名：
- 函数型 PCA（fPCA）的谱扰动界：用 Hoffman–Wielandt 不等式在 Hilbert–Schmidt 算子上的推广，结合 \(L^2\) 与 \(L^\infty\) 范数的转化。
- 样条平滑 + 离散格点误差分解：将函数估计误差分解为样条偏置（spline bias）与格点离散误差（gridding error）。
- Y-V 结构分解：在证明 \(\hat f_k\) 的收敛率时，将协方差算子写成“真因子部分 + 噪声部分 + 估计偏差部分”，用谱 gap 条件保证噪音不破坏方向的一致性。
- Jackknife 方差估计：用于构造逐点置信带的 \(\widehat{\mathrm{Var}}(\hat\beta(t))\)，避免对误差相关结构的直接参数化建模。

真实例子与应用¶

模拟实验：本文构造了三种异质性场景——① 因子得分 \(\gamma\) 与 \(X\) 无关；② 因子得分与 \(X\) 相关（最困难情形）；③ 有多个因子（\(K=3\)）且因子得分之间有相关。对比方法采用：标准 fReg（忽略异质性）、fPCA + fReg（把 top PCs 作为协变量加入回归）、以及本文的 FHFRM。核心量化结论：在各场景下，FHFRM 的 \(\beta(t)\) 估计的 IMSE（积分均方误差）比标准 fReg 降低了 30-60%（在场景二中最明显），且其逐点置信带的覆盖约为 0.94（显著优于忽略异质性的 0.2-0.6）；fPCA + fReg 在 \(K\) 已知时接近 FHFRM 但做不到因子数自动检测。

ADNI 海马表面数据：使用 Alzheimer’s Disease Neuroimaging Initiative 数据库中 430 个受试者的海马表面厚度图谱（每个样本约 12,000 个顶点，经平滑到公共曲面）。协变量 \(X\) 包括年龄、性别、APOE4 基因型；响应 \(Y_i(t)\) 为表面厚度（曲面每个顶点）。本次分析感兴趣的主效应是APOE4 携带状态对海马萎缩的影响——已有研究表明 APOE4+ (e4 携带者) 在认知正常阶段即加速海马萎缩。分析结果：FHFRM 检测到 \(K=2\) 个异质性因子（解释约 34% 的残差方差），在调整这两个因子后，APOE4 的效应估计的收缩率（shrinkage effect）在关键区域（海马头部 CA1 区域）增加了约 18%，标准差的 estimate 也有降低（因为异质方差被剥离），从而显著性增加。该例子想说明：若不控制未观测的异质因子（如扫描仪型号、人群遗传背景的差异），APOE4 主效应可能被低估或被异质中的背景噪声污染，FHFRM 恢复了一个更清晰且统计上更显著的效应。

🔎 结论是否比证明窄¶

结论声称 FHFRM 在 \(K\) 未知时也能实现有效推断。但是定理 1 的覆盖定理明确依赖“\(K\) 已知或 \(\hat K\) 相合”——而 \(\hat K\) 相合（定理 2）仅在谱 gap 条件下得到证明。定理 2 的证明额外要求“因子子空间与非因子子空间之间的最小特征值 gap 至少为 \(n^{-1/2+\delta}\)”。作者未在定理陈述中明确给出这个 gap 条件，仅放在引理需证明中——结论的边界比证明中的允许条件窄，因为若 gap 较弱（比如因子对响应的解释力很弱），该检测可能失败，而论文未讨论该情形下的推论。
此外，模拟与真实例子中 \(n=430, M \approx 12,000\)，属于 \(M >> n\) 设定，所有收敛率中的 \(M^{-2}\) 项自然可忽略；作者没有测试“中等 \(M\)”（如 \(M \approx n^{1/2}\) 时）性能——这在许多影像数据中也很典型（例如只有约 100 个区域的平均厚度，而非顶点级平滑）。这个缺口需要研究者考虑是否要推广到更少格点的设定（如 parcellation-based 分析）。

四、开放问题¶

半参数效率界：本文没有推导 \(\hat\beta(t)\) 的 semiparametric efficiency bound。能否在 FHFRM 设定下（\(K\) 已知）写出主效应 \(\beta(t)\) 的 efficient influence function？这取决于能否建立“因子结构也属于 nuisance parameter”的充分统计量分解。如果因子数是未知的 nuisance，效率是否会改变？扎根于：本文定理1的收敛率是 \(O_p(n^{-1/2})\)，但未指出是否可达效率界（直接提：未做效率分析）。
弱信号因子：定理 2 要求 gap 至少 \(\approx n^{-1/2+\delta}\)。当真实因子载荷的信号强度弱于该阈值（所谓“部分弱因子”情形）时，检测失败率升高，且其影响主效应推断的后果未分析。扎根于：引理 2 证明中假设了 \(f_k\) 的权重 \(|\langle \Sigma_Y, f_k f_k\rangle| > cn^{-1/2}\)。
时变因子负荷：本文假设 \(f_k(t)\) 是固定的函数——不随时间/位置变化。在多中心纵向影像（重复测量）中，因子负荷本身可能因采集时间偏移。可以推广到时变设定。扎根于：第一节讨论的 Limitation “我们的模型假设潜在因子结构不随时间改变”(section 5)。
与 Proximal Causal Inference 的连接：本文的 FHFRM 本质上与“在存在未观测混杂条件下识别 X 对 Y 的因果效应”完全同构（令 \(\gamma\) 为混杂因子，\(X\) 为处理变量）。使用 proximal 识别（运用 negative control outcome/negative control exposure）可以处理更一般的情形（\(K\) 未知但用 IV 或 NC 可免于因子检测）。这篇完全未触及。这可能是研究者中期可以切入的方向：推导 FHFRM 下主效应（因果效应）的半参数效率界 + design a proximal-like estimation that bypasses the detection of \(K\)。对于后者，可在 moderately_familiar 的 M-estimation 与 semi-parametric 上积累后做。扎根于：本文 H7 的识别条件与 Proximal CI 的 “latent space is finite-dimensional anchoring” 非常相似。

Maintained by 陈星宇 · Homepage · Source on GitHub