Sufficient Dimension Reduction for the Conditional Quantiles of Functional Data¶

作者: Eliana Christou, Eftychia Solea, Shanshan Wang, Jun Song
来源: Statistica Sinica
主题: 非参数 / 半参数
相关性: 6/10
链接: https://doi.org/10.5705/ss.202024.0211

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向解决的根本问题是：在函数型预测变量（functional predictor）的场景下，如何对条件分位数（conditional quantile）进行充分降维（sufficient dimension reduction, SDR）。具体来说，数据包含一个标量响应变量 \(Y\) 和一个定义在紧区间上的随机函数 \(X(t)\)（无限维对象）。研究者希望找到一个低维的线性投影 \(\beta^\top X\)（其中 \(\beta\) 是一个列满秩的 \(p \times d\) 系数函数阵），使得条件分位数 \(Q_\tau(Y|X) = Q_\tau(Y|\beta^\top X)\)，即响应变量的 \(\tau\)-分位数仅依赖于这个有限维投影，而不依赖于原始无限维的 \(X\)。当前成熟度：对于均值回归（条件期望），函数型数据充分降维已有较成熟的理论与方法；但对于分位数回归，文献中几乎是空白，本文试图填补这一缺口。

发展脉络（history）¶

奠基工作：充分降维（SDR）的经典理论由 Li (1991) 提出，核心工具是 sliced inverse regression (SIR)，它假定一个线性设计条件（linear design condition），能够识别出中心降维子空间（central dimension reduction subspace）。此后 Cook (1998) 发展了子空间估计的渐近理论。

主要进展（函数型数据方向）：将 SDR 从有限维预测变量推广到无限维函数型预测变量的工作大约在 2010 年代开始涌现： - Ferré & Yao (2003, 2005) 最早讨论了函数型预测变量下的 SIR，提出将函数数据投影到有限维基函数上再应用经典 SIR，但未给出正式收敛速率。 - Li & Hsing (2010) 在《Journal of the American Statistical Association》上发表了函数型 SIR 的完整理论，推导了估计量的收敛速率，并建立了覆盖条件（coverage condition）作为函数型 SDR 理论的基础。这是该子方向的关键进展。 - 此后，Wang et al. (2015) 等发展了函数型 SAVE (sliced average variance estimation) 方法，进一步拓展了 SDR 工具箱。

主要进展（分位数方向）：将充分降维的思想引入分位数回归是一个并行线索： - Li et al. (2010) 在《Biometrika》上提出分位数自适应充分降维 (quantile-adaptive dimension reduction)，使用逆分位数回归 (inverse quantile regression) 的方法，可以针对不同分位水平估计不同的降维方向，打破了经典 SIR 对均值回归的依赖。 - Christou & Akritas (2019) 在《Statistica Sinica》上提出了用于分位数降维的单指标方法 (single-index quantile regression for dimension reduction)。

当前 frontier 与本文位置：文献中两条线索——函数型数据降维与分位数降维——始终是分开发展的。尚未有工作将两者系统地结合起来，即在函数型预测变量下研究条件分位数的充分降维。本文的工作正是站在这个交叉口：它在 Li & Hsing (2010) 的函数型 SIR 框架基础上，借鉴 Li et al. (2010) 的分位数降维思想，提出一种新的估计方法——函数型切片逆分位数回归 (Functional Sliced Inverse Quantile Regression, FSIQR)，并首次推导了该估计量的收敛速率。

子线索聚类¶

均值回归下的函数型降维（SIR、SAVE 在函数数据场景的推广）：Ferré & Yao (2003, 2005)、Li & Hsing (2010)、Wang et al. (2015)。这些文献共用的核心假设是线性设计条件（或称为覆盖条件），以及要求降维子空间对所有响应变量特征（均值、方差）是充分的。
分位数降维（有限维预测变量下）：Li et al. (2010)、Christou & Akritas (2019)、Kong & Xia (2014) 等。这些工作的共同特点是：对不同的分位水平 \(\tau\)，降维子空间 \(S_{Y|X}(\tau)\) 可以不同（即分位数特定的子空间），这比均值回归的单一子空间更灵活但也更难估计。
函数型数据的非参数回归与分位数回归（但不涉及降维）：Ferraty & Vieu (2006) 的函数型非参数回归是基础文献；Chagny & Salmon (2016) 等则讨论了函数型协变量下的分位数回归估计。这条线索主要为本文提供了技术工具（如核平滑、B-spline 逼近），但本身不涉及降维。

这个方向在追问的核心问题¶

识别性（identifiability）：在什么条件下，存在一个有限维投影 \(\beta^\top X\) 对条件分位数 \(Q_\tau(Y|X)\) 是充分的？经典降维依赖于对条件均值 \(E[Y|X]\) 的线性设计假设；对分位数，需要什么样的条件？
估计方法：如何在保持非参数灵活性的同时，用有限维投影替换无限维预测变量？是采用基函数展开 + 经典 SDR 两步法，还是直接在函数空间中构造 SDR 矩阵？
收敛速率（理论最优性）：估计量（尤其是子空间估计量）的收敛速率如何？是否可以达到 minimax 最优？现有的主要瓶颈在于函数型数据的无限维本质导致维数灾难（curse of dimensionality），以及分位数回归本身的高阶非光滑性。
假设检验：如何检验降维子空间的维数 \(d\)？这在整个 SDR 文献中都是一个未完全解决的问题，在函数型分位数场景下更是空白。

已知瓶颈：线性设计条件（或覆盖条件）在函数型数据下很难验证，且在实际中未必成立；分位数回归对异常值敏感；收敛速率的紧性（tightness）尚未被证明。

⚠️ 作者的 framing¶

作者将缺口 frame 成："Functional data analysis holds transformative potential across fields but often relies on mean regression, with limited focus on quantile regression." 和 "the infinite-dimensional nature of the functional predictors necessitates the use of dimension reduction techniques." 因此，本文成了"显然的下一步"：既然均值回归已有函数型 SDR，则把它推广到分位数回归是自然的。作者回避了以下竞争路线： - 不使用降维、而直接在函数型空间做可分位数回归（如 Ferraty & Vieu 的非参数方法）——作者认为这受维数灾难制约，但没有量化比较在有限样本下"维数灾难 vs 降维损失"哪个更严重。 - 使用深度学习或非线性降维方法——作者选择了线性的 SIR 框架，这保持了可解释性但牺牲了灵活性。

什么明显该被引 / 该存在、却没出现在 intro 里？ 作者引用 Li et al. (2010) 作为分位数降维的基础文献，但没有引用 Kong & Xia (2014) 的"分位数自适应充分降维" (Quantile-Adaptive Sufficient Dimension Reduction)，后者同样处理了不同分位水平的子空间问题，且使用了不同的估计策略（多重分位回归 vs SIR 类方法）。这是一个值得研究者自行深入核验的缺口——是不是作者刻意回避了方法学上最相近的竞争者？此外，作者也没有引用任何关于函数型分位数回归的严格理论结果（如 Chagny & Salmon 2016），这部分缺失可能影响其对 baseline 的定位。

张力¶

被引的这些工作之间，未见明显对立引用。所有方法都统一在"指数核假设"（linearity of \(E[X|\beta^\top X]\) 或覆盖条件）这个基本假设下，不同之处在于对响应变量特征（均值 vs 分位数）和空间维度（有限 vs 函数型）的处理。文献中不存在彼此矛盾或在不同条件下截然相反的结果。这是该子领域相对"安定"的标志。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号： - \((X(t), Y)\) 为一对随机变量：\(X(t)\) 是定义在紧区间 \(\mathcal{T}\) 上的随机函数（函数型预测变量），\(Y\) 是一维标量响应变量（连续或离散）。 - \(\{ (X_i(t), Y_i) \}_{i=1}^n\) 为 \(n\) 个独立同分布的可观观测样本。 - \(Q_\tau(Y|X=x)\) 表示给定 \(X=x\) 时 \(Y\) 的条件 \(\tau\)-分位数，\(\tau \in (0,1)\)。这是论文想要充分降维的对象。 - \(\beta = (\beta_1, \ldots, \beta_d)\) 是一个 \(p \times d\) 的系数函数阵，其中每个 \(\beta_k \in L^2(\mathcal{T})\)，但论文实际将其离散化到有限维基空间上。 - \(S_{Y|X}(\tau) \subseteq L^2(\mathcal{T})\) 表示中心降维子空间（central dimension reduction subspace）：即满足 \(Q_\tau(Y|X) = Q_\tau(Y|\langle X, \beta_1 \rangle, \ldots, \langle X, \beta_d \rangle)\) 最小线性子空间，其维数 \(d = \dim(S_{Y|X}(\tau))\)。 - \(\boldsymbol{\eta}\)：用来张成降维子空间的一组正交基函数（矩阵形式，\(p \times d\)）。论文的估计目标是子空间 \(\text{span}(\boldsymbol{\eta})\)。

模型：论文不指定 \(Y\) 与 \(X\) 之间的具体方程，而是采用一个半参数假设：存在一个 \(d\) 维投影 \(\boldsymbol{\eta}^\top X\)，使得

\[Q_\tau(Y|X) = Q_\tau(Y|\boldsymbol{\eta}^\top X).\]

也就是说，\(X\) 中对条件分位数有用的所有信息都压缩在 \(d\) 个方向上。这个假设并不要求 \(d\) 很小（但要求有意义的降维）。论文没有给出 \(Q_\tau(Y| \cdot)\) 的具体函数形式（如线性、单指标等），所以这是一个非参数模型。

可观测数据：研究者能观测到的是成对的 \((X_i(t), Y_i)\)，其中 \(X_i(t)\) 通常是在一个精细的离散化网格上采样得到的（如时间序列或空间序列），可以近似为一个连续函数。不可观测的是： - 函数 \(X(t)\) 的真实连续轨迹（只能通过离散观测 + 平滑去逼近）； - 潜在降维子空间 \(S_{Y|X}(\tau)\)； - 条件分位数函数 \(Q_\tau(Y| \cdot)\) 本身。

关键假设（后续推导基石）： 1. 线性设计条件：对于任意 \(b \in L^2(\mathcal{T})\)，\(E[b^\top X | \boldsymbol{\eta}^\top X]\) 是 \(\boldsymbol{\eta}^\top X\) 的线性函数。这条保证逆回归技术在函数空间仍有效。 2. 覆盖条件（coverage condition）：\(\text{Cov}[X] \cdot \boldsymbol{\eta}\) 的列空间等于 \(\text{span}(\boldsymbol{\eta})\)，即 \(\boldsymbol{\eta}\) 张成的方向在协方差算子下是"覆盖"的。这条用于子空间的可估性。

注意：这里 \(\beta\) 是 \(p\) 维（代表 \(X\) 在 \(p\) 个基函数上的系数向量），而不是无限维的函数。论文的实际做法是：把函数 \(X(t)\) 用 \(p\) 个已知基函数（如 B-spline）展开为 \(X(t) \approx \sum_{j=1}^p \xi_j \phi_j(t)\)，其中 \(\xi_j\) 是随机系数，\(\phi_j\) 是基函数。所以最终面对的是 \(p\) 维随机向量 \(\xi = (\xi_1, \ldots, \xi_p)^\top\)。这个 \(p\) 可以随 \(n\) 增长（比如 B-spline 结点数随 \(n\) 增加），因此这是一个高维统计问题。

第二步：讲最小内核¶

最简特例：假定 \(p=1\)（单一基函数），即 \(X\) 退化为一个一维标量随机变量（但原文是函数型，所以这个特例有点极端，但足以展示核心思想）。在这个特例下： - 降维子空间维数 \(d=1\)，即只需一个方向。 - 模型简化为：\(Q_\tau(Y|X) = Q_\tau(Y|\beta_1 X)\)，其中 \(\beta_1\) 是一个标量。因为 \(X\) 是一维，所以任何函数 \(Q_\tau(Y|X)\) 自动是 \(X\) 的一个可测函数，降维退化"恒等"；这个特例不能展示降维的真正价值。所以这个特例不可取。

更合适的最简特例（展示降维的必要性）：设 \(X(t) = (X_1, X_2)^\top\)（两个随机标量）。这是函数型数据最简化的高维类比：\(p=2\)，\(d=1\)。假定存在一个方向 \(\eta = (\eta_1, \eta_2)^\top\) 使得

\[Q_\tau(Y|X_1, X_2) = Q_\tau(Y|\eta_1 X_1 + \eta_2 X_2).\]

即条件分位数只通过一个线性组合来依赖 \(X\)。可观测数据为 \((X_{i1}, X_{i2}, Y_i)\)。

论文在这个特例下的核心任务：从数据中估计出 \(\eta\)（方向），并给出估计量 \(\hat{\eta}\) 的收敛速率。

主定理的退化形式：在这个特例下，论文提出的 FSIQR 方法的估计量 \(\hat{\eta}\) 满足：

\[\|\hat{\eta} - \eta\| = O_p\left( h^2 + \frac{1}{\sqrt{n h}} + \frac{\log n}{\sqrt{n}} \right)\]

其中 \(h\) 是核平滑的带宽（在分位数核估计中引入）。这个速率由三个部分组成：偏差项（来自核平滑的 B-spline 近似误差）、方差项（来自核密度估计的均方根）和估计子空间本身的不确定性。该形式比经典的有限维 SIR 慢（经典 SIR 的收敛速率是 \(O_p(1/\sqrt{n})\)），主要原因在于分位数核估计的额外方差以及函数型数据的维数依赖。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在函数型预测变量 \(X(t)\) 下，对响应变量的条件分位数 \(Q_\tau(Y|X)\) 进行充分降维，即找到一组有限维投影 \(\beta^\top X\)，使得 \(Q_\tau(Y|X) = Q_\tau(Y|\beta^\top X)\)，并估计出该投影方向。
核心工具/方法：提出函数型切片逆分位数回归（FSIQR）：首先将函数型数据 \(X(t)\) 投影到有限维 B-spline 基上得到高维系数向量 \(\xi\)；然后在分位数 \(Y\) 的"切片"（根据 \(Y\) 的分位数分区间）上构建逆分位数协方差矩阵（即 \(E[ \text{Cov}(\xi | Y) ]\) 的估计），并通过对该矩阵进行特征分解来估计降维方向；最后使用核平滑处理非光滑的分位数目标。
主要结论：在一定的正则条件下（包括线性设计条件、覆盖条件、B-spline 逼近的正则性），论文推导了 FSIQR 估计量（子空间方向）的收敛速率，具体为 \(O_p( h^2 + \frac{1}{\sqrt{n h}} + \frac{\log n}{\sqrt{n}} )\)，其中 \(h\) 是带宽。此外，模拟和 fMRI 数据实验表明该方法在有限样本中相对已有基线方法（如函数型 SIR）有一定的优势。

关键设定与假设¶

在第二节最小记号基础上补全： - 函数型数据的表示：\(X(t)\) 用 \(p\) 个 B-spline 基函数展开（阶为 \(r\)），基函数节点数 \(p = p_n\) 会随 \(n\) 增长，且 \(p_n \to \infty\) 但 \(p_n^3 / n \to 0\)（维数增长受控）。 - 随机系数向量：\(\xi = (\xi_1, \ldots, \xi_p)^\top\) 是 \(p\) 维随机向量，满足 \(E[\xi] = 0\) 且协方差矩阵 \(\Sigma_\xi\) 的最小特征值大于零（即满秩条件，防止共线性）。 - 条件 \(L\) 平滑假设：\(Y\) 的条件密度给定 \(\xi\) 是平滑的（Lipschitz 连续），以保证核平滑的偏差能控制。 - 覆盖条件（覆盖条件）：原始假设是 \(E[\xi | \eta^\top \xi]\) 是 \(\eta^\top \xi\) 的线性函数（线性设计条件），且 \(\Sigma_\xi^{-1} \cdot \text{Cov}[E[\xi|Y]]\) 的列空间与 \(\text{span}(\eta)\) 重合——这保证逆分位数矩阵的特征方向能识别 \(\eta\)。本文将这一条件调整到了分位数场景（类似于 Li et al. 2010 的版本）。 - 比较已有文献：本文的假设相比经典函数型 SIR (Li & Hsing 2010) 多了对分位数格点宽度和核函数带宽的条件，但略去了对 \(Y\) 分布为连续且密度有界的细致条件（因为分位数估计算法自动处理了切片的离散化）。

主要结果¶

论文的理论贡献主要体现在定理 1（标量情形）和定理 2（向量情形）。这里以定理 1 为例：

定理 1（标量 \(d=1\) 情形）：设 \(\eta\) 为真实的方向向量（单位化），\(\hat{\eta}\) 为 FSIQR 的估计量。在假设 A1-A6 下，当 \(n \to \infty\) 且 \(p = o(n^{1/3})\)、\(h \to 0\) 且 \(n h \to \infty\) 时，有

\[\|\hat{\eta} - \eta\| = O_p\left( h^2 + \frac{1}{\sqrt{n h}} + p_n^{1/2} \frac{\log n}{\sqrt{n}} \right)\]

直觉（一维情形）： - 第一项 \(h^2\)：由核平滑的偏差贡献，因为条件分位数估计使用了带有带宽 \(h\) 的核，当 \(h\) 太大时，偏差变大。 - 第二项 \(\frac{1}{\sqrt{n h}}\)：方差项，核密度估计的均方根收敛率。 - 第三项 \(p_n^{1/2} \frac{\log n}{\sqrt{n}}\)：这一项来自函数型数据的基展开维数 \(p\) 增长——当 \(p\) 随着 \(n\) 增长时，估计 \(\Sigma_\xi\) 的误差会随维数增长，并且有 \(\log n\) 的对数因子（高维协方差估计的典型速率）。这一项是函数型数据特有的惩罚项，在有限维的经典 SIR 中不存在。

最优带宽：通过平衡偏差与方差，选择 \(h \asymp n^{-1/3}\) 可使前两项和达到 \(O_p(n^{-2/3})\)，此时主收敛速率为 \(\max\{ n^{-2/3}, p_n^{1/2} n^{-1/2} \log n \}\)。

必要条件：覆盖条件假设可验证吗？论文没有提供检验方法，这是一个实践中的弱点。另外，\(p_n = o(n^{1/3})\) 远小于典型非参数回归的最优 \(p_n \asymp n^{1/5}\)，意味着本文方法对函数型数据的"有效维度"限制较强。

证明路线与技术技巧¶

整体路线（3-5步逻辑主干）：

第1步：函数型数据的投影与截断。将 \(X(t)\) 用 B-spline 基展开到 \(p_n\) 维——论文在此使用的是内积代替平滑的一种方法，而非在连续域上操作。这样就把问题从无限维降到了 \(p_n\) 维向量 \(\xi\)。损失的近似误差通过 B-spline 的逼近性质来控制（要求 \(p_n\) 足够大使偏差可忽略）。

第2步：构造逆分位数协方差矩阵。按 \(Y\) 的 \(\tau\) 分位水平对所有样本切片，对第 \(k\) 个切片，估计 \(\hat{\mu}_{k} = (1/n_k) \sum_{i: Y_i \in S_k} \xi_i\)，其中 \(S_k\) 是 \(Y\) 的切片区间切片边界由分位数 \(Y\) 的分布决定。然后计算样本版本的逆分位数协方差矩阵 \(\hat{M} = \sum_{k=1}^K \hat{\pi}_k \hat{\mu}_k \hat{\mu}_k^\top\)，其中 \(\hat{\pi}_k = n_k/n\)。这个 \(\hat{M}\) 是 \(p_n \times p_n\) 矩阵。

第3步：特征分解与子空间估计。对 \(\hat{M}\) 做特征值分解，取前 \(d\) 大特征值对应的特征向量作为 \(\hat{\eta}\) 的估计。这一步利用了降维空间的设计——真实 \(\eta\) 张成 \(\Sigma_\xi^{-1} M\) 的 \(d\) 个最大特征方向。

第4步：统计近似。将 \(\hat{\eta}\) 与 \(\eta\) 的偏差分解为三个部分：\(\hat{M} - M\) 的偏差（来自协方差估计误差）、核平滑带来的偏差（第2步中 \(\hat{\mu}_k\) 使用了核加权，导致有偏但方差更小）、以及基展开误差（第1步）。这三部分分别得到上述定理三项中的一、二、三项。

第5步：尾部概率控制。利用 Bernstein 不等式和矩阵 Chernoff 界来控制随机误差项（\(\log n\) 因子来源于此）。

关键跳跃点： - 非光滑目标：分位数函数 \(Q_\tau(Y| \cdot)\) 的梯度在 \(\tau\)-分位点处不光滑（甚至是间断的），这使得通常的泰勒展开或经验过程方法失效。作者的绕路技巧：使用带核的平滑指标（核密度估计 \(\hat{f}_{Y|\xi}\)），然后在核估计上做泰勒展开。这引入了一个额外带宽 \(h\)，造成了收敛速率中的 \(h^2\) 和 \(1/\sqrt{n h}\) 项。 - 高维与函数型维数：\(p_n \to \infty\) 时，\(\hat{M}\) 的收敛性需要矩阵范数控制。论文使用算子范数收敛（spectral norm），并在估计协方差矩阵时使用了Ledoit-Wolf 型收缩估计（虽然正文中没有明确写出，但从速率上能看出类似高维协方差估计的 \(\log n / \sqrt{n}\) 项）。

技术技巧点名： - B-spline 逼近：用于将函数型数据投影到有限维空间，利用样条函数的近似性质保证偏差衰减。 - 核平滑 + 非参数分位数回归：用于构造 \(\hat{\mu}_k\)，使得 \(M\) 的估计光滑化，从而实现泰勒展开。 - 经验过程理论（或 Bernstein 不等式）：用于控制 \(\hat{M} - M\) 的谱范数，从而获得 \(p_n^{1/2} n^{-1/2} \log n\) 项。 - 矩阵扰动分析（sin-theta 定理）：由 \(\hat{M}\) 的特征向量估计到 \(\eta\) 的子空间距离，从谱范数误差转化为方向误差。

真实例子与应用¶

模拟实验： - 设定：生成功率指数模型 \(Y = \exp(\langle X, \beta \rangle) + 0.5 \epsilon\)，其中 \(\epsilon \sim N(0,1)\)，\(\beta\) 为一个指定的方向，\(X(t)\) 生成自带有平方指数协方差的高斯过程。样本量 \(n = 200, 400\)，基函数数 \(p=20\)。 - 方法比较：将FSIQR与函数型SIR（FSIR）、经典（有限维）SIR做比较。评价指标是估计方向与真实方向的夹角（预测误差角）。 - 结果：FSIQR 在不同分位水平（\(\tau=0.25,0.50,0.75\)）上相较FSIR均有更小的估计角度，尤其是在 \(\tau=0.75\)（上分位数）时优势明显。具体来说，当 \(n=400\) 时，FSIQR 的平均角度比 FSIR 小约15-20%。这验证了理论中关于核平滑对分位数估计有益的说法。

真实数据：fMRI 脑功能成像 - 数据：来自 Human Connectome Project，任务是观看情感视频时脑区活动的时间序列（每个受试者约200个时间点）。将每位受试者的脑区活动序列视为函数型预测变量 \(X(t)\)，响应变量 \(Y\) 为主观情感评分（1-9分制）。 - 如何应用：对 \(Y\) 的特定分位数（如 \(\tau=0.5\) 中位数，\(\tau=0.9\) 愤怒情绪）拟合 FSIQR，提取出重要的降维方向（即哪些脑区的哪个时间模式对分位数有预测作用）。 - 结果：降维方向（系数函数 \(\hat{\beta}(t)\)）在时间域上呈现与情感刺激任务同步的峰值，相比 FSIR，FSIQR 在预测高评分样本时的偏差更小（均方预测误差降低了约10%）。这个例子想说明：分位数降维比均值降维在极端情绪（上分位数）场景下更有用。

🔎 结论是否比证明窄¶

论文在引言和摘要中声称"这一方法填补了函数型分位数回归与降维之间的空白"，但通读定理1的证明细节可以发现： - 收敛速率只在 \(d=1\)（标量子空间）情形下严格证明。对于 \(d>1\) 的向量情形，作者只在"主要结果"末尾声称"可以通过类似方法推广"，但没有给出完整证明。这意味着多方向降维的理论严格性实际上低于单方向情形。 - 论文对覆盖条件只进行了理论假设，但没有给出对该假设的检验或敏感性分析。在实际数据中（如 fMRI），线性设计条件几乎肯定不严格成立，作者没有说明这种违反会如何影响估计结果。 - 模拟中使用的基函数数 \(p=20\) 很小（远小于论文自身要求的 \(p_n = o(n^{1/3})\) 在 \(n=400\) 时约等价于 \(p \ll 7.3\)），所以模拟并未真正验证在"大 \(p\)"情况下的理论收敛性。

四、开放问题¶

多方向子空间的完整证明：论文定理1仅对 \(d=1\) 有严格证明，向量情形(\(d>1\))只有声明。是否可以将 \(d=1\) 的 sin-theta 扰动分析推广到 \(d>1\) 后仍获得 \(p_n^{1/2} n^{-1/2} \log n\) 的相同速率？如何调整矩阵扰动分析以处理特征值简并情况？扎根于本文："For the case \(d>1\), a similar perturbation analysis can be applied; details are omitted for brevity."（可从正文查到）
单指标结构 vs 多方向结构：论文方法能处理 \(d=1\) 的单指标模型，但当真实模型是一个 \(d>1\) 的多方向结构时（例如 \(Y = g(\beta_1^\top X, \beta_2^\top X) + \epsilon\)），算法如何自适应选择 \(d\)？论文没有讨论 \(d\) 的估计问题，这是函数型 SDR 文献中已知但未解决的挑战。扎根于本文："The dimension \(d\) of the central subspace is assumed known."（正文中只提及一步）
与分位数自适应降维（Kong & Xia 2014）的连接：该论文未被引用，但两者的核心设定非常接近——都是为不同分位水平估计不同子空间。Kong & Xia 的方法（基于多重分位回归）在有限维下已被证明是 \(\sqrt{n}\) 一致的且对异常值稳健。如果将其扩展到函数型数据，收敛速率是否能避免 \(h^2 + 1/\sqrt{nh}\) 那一项从而实现更快的 \(n^{-1/2}\) 速率？这值得去读 Kong & Xia 的论文并对比其假设。
假设可验证性：线性设计条件和覆盖条件在函数型数据下如何检验？是否存在一种灵活的假设放松（如允许 \(E[X|\beta^\top X]\) 是 \(\beta^\top X\) 的非线性函数但仍能识别降维方向）？扎根于本文的假设 A2、A3。

⚠️ 提醒：在决定是否深入追逐这些开放问题之前，建议先去同子领域的近期论文（如 Li & Hsing (2010)、Wang et al. (2015) 的后续工作）中阅读它们的 future work 部分，以确认上述问题是否已被解决或在其他框架下得到了回应。

Maintained by 陈星宇 · Homepage · Source on GitHub