Testing conditional quantile independence with functional covariate¶

作者: Yongzhen Feng, Jie Li, Xiaojun Song
来源: Biometrics
主题: 数理统计 / 假设检验
相关性: 7/10
机构绿灯: Tsinghua University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujae036

一、领域脉络与小综述¶

这个方向是什么¶

本方向关注的是函数型数据下的条件独立性检验。具体而言，研究者观测到一个标量响应变量 \(Y \in \mathbb{R}\)、一个函数型协变量 \(X(t)\)（定义在紧集 \(\mathcal{T}\) 上的随机过程）、以及一个标量或低维协变量 \(Z \in \mathbb{R}^d\)。核心问题是：在给定 \(Z\) 的条件下，\(Y\) 是否在所有分位数水平上都与 \(X\) 条件独立？即检验原假设：

\[H_0: Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau) \quad \text{对所有} \ \tau \in (0,1) \ \text{几乎必然成立},\]

其中 \(Q_{Y|X,Z}(\tau)\) 是给定 \((X,Z)\) 时 \(Y\) 的 \(\tau\)-条件分位数。这个检验比传统的条件均值独立性检验（即检验 \(\mathbb{E}[Y|X,Z] = \mathbb{E}[Y|Z]\)）更全面，因为它覆盖了整个条件分布。该方向当前处于方法快速发展但理论尚不完整的阶段：已有工作多聚焦于标量或低维协变量，函数型协变量带来的“维数灾难”使得直接推广极为困难。

发展脉络（history）¶

本文的introduction将相关文献串成一条清晰的线索：

奠基工作：条件分位数独立性检验的提出
Qu and Yoon (2015)：首次提出检验“\(Y\) 与 \(X\) 在给定 \(Z\) 下对所有分位数水平条件独立”的框架。他们基于分位数回归过程构建检验统计量，但协变量 \(X\) 必须是有限维的（标量或向量）。这是本文的直接出发点——作者在引言中明确说“Qu and Yoon (2015) considered the case where the covariate is a scalar or a finite-dimensional vector”，留下“函数型协变量”这个口子。
主要进展：函数型数据下的条件均值独立性检验
Cuesta-Albertos et al. (2019)：针对函数型协变量 \(X\)，提出检验“\(\mathbb{E}[Y|X,Z] = \mathbb{E}[Y|Z]\)”的方法。他们采用随机投影策略——将函数型协变量投影到随机方向上，把无限维问题转化为有限维问题，并证明“投影后的条件均值独立性几乎必然等价于原假设”。这是本文的核心技术灵感来源。作者在引言中明确说“Cuesta-Albertos et al. (2019) proposed a test for conditional mean independence with functional covariate”，并指出其局限是只检验均值，不检验分位数。
Escanciano (2006)：提出基于随机投影的条件均值检验（标量协变量情形），其经验过程理论为后续投影方法提供了渐近分析模板。
当前frontier：函数型数据下的条件分位数检验
本文是第一个将“随机投影”策略用于条件分位数独立性检验的工作。作者在引言中明确说“To the best of our knowledge, no existing work has considered testing conditional quantile independence with functional covariates”，并指出“the main challenge is that the functional covariate is infinite-dimensional, making direct nonparametric estimation infeasible”。
本文的位置：填补了“函数型协变量 + 条件分位数独立性检验”这一空白。它把Cuesta-Albertos et al. (2019)的随机投影思想从均值推广到分位数，同时把Qu and Yoon (2015)的分位数检验从有限维协变量推广到函数型协变量。

子线索聚类¶

这些被引文献大致落在两条子线索上：

线索A：条件分位数独立性检验（有限维协变量）
代表：Qu and Yoon (2015)、He and Zhu (2003)、Zheng (1998)。这些工作聚焦于标量/向量协变量下的分位数检验，理论成熟（渐近分布、局部功效），但无法处理函数型数据。本文的“分位数过程”和“全局备择假设”概念继承自此线索。
线索B：函数型数据下的条件均值检验（随机投影方法）
代表：Cuesta-Albertos et al. (2019)、Escanciano (2006)、Lavergne and Patilea (2008)。这些工作用随机投影将无限维问题降维，并证明投影假设与原假设的等价性。本文的“投影假设”和“经验过程索引于随机投影”技术继承自此线索。

这个方向在追问的核心问题¶

如何避免函数型数据的“维数灾难”？
函数型协变量是无限维的，直接非参数估计（如核平滑）需要指数级样本量。随机投影是当前主流解法，但投影后的检验统计量是否仍能检测所有偏离原假设的方向？本文通过“投影假设几乎必然等价于原假设”回答了这个问题。
检验统计量的渐近分布是什么？
由于投影是随机的，统计量是随机投影上的经验过程，其极限分布通常是非标准的（如高斯过程的泛函）。本文推导了零分布，并推荐乘子bootstrap。
检验能检测多“弱”的备择假设？
即局部功效分析。本文证明其统计量能以参数速率（\(n^{-1/2}\)）检测趋近于零的备择假设，这是很强的性质（许多非参数检验只能达到 \(n^{-1/4}\) 或更慢的速率）。

⚠️ 作者的 framing¶

作者把缺口 frame 成什么：作者说“no existing work has considered testing conditional quantile independence with functional covariates”，因此本文是“显然的下一步”——把两个成熟线索（分位数检验 + 随机投影）结合起来。这个framing很合理，因为两条线索各自的理论都已完备，组合的技术难度主要在于经验过程理论在投影分位数过程上的应用，而非全新的数学创造。
哪些竞争路线被他淡化或回避了：
作者淡化了“直接对函数型协变量做分位数回归”的可能性（如用B样条基展开 + 惩罚）。这种路线在文献中存在（如Cardot et al., 2003），但作者没有讨论。原因是：直接回归需要选择基函数和惩罚参数，且检验的渐近理论更复杂；随机投影方法则更“无参数选择”。
作者回避了“是否可以用深度学习方法做条件分位数检验”这一路线。这可能是合理的，因为深度学习缺乏本文所需的清晰渐近理论。
什么明显该被引 / 该存在、却没出现在 intro 里？
Cardot et al. (2003) “Testing hypotheses in the functional linear model”：这篇是函数型数据假设检验的早期经典，但作者没有引用。可能因为Cardot et al.检验的是线性模型中的参数假设，而非条件独立性。但作为函数型数据检验的奠基工作，它值得被提及。
Kokoszka and Reimherr (2017) “Introduction to Functional Data Analysis”：这本教材系统总结了函数型数据检验的框架，但作者没有引用。可能因为本文更聚焦于分位数检验这一特定子问题。
Lei (2014) “Classification of functional data”：这篇涉及函数型数据的分类检验，与本文的“条件独立性”问题不同，但随机投影策略有相似性。不引用是合理的。

张力¶

未见明显对立引用。所有被引工作都支持“随机投影是处理函数型数据检验的有效策略”这一共识。唯一的张力是：Qu and Yoon (2015) 的分位数检验基于分位数回归过程（需要估计条件分位数），而Cuesta-Albertos et al. (2019)的均值检验基于经验分布函数（不需要估计）。本文选择了后者的框架（经验过程），而非前者。这意味着本文的检验统计量不依赖于分位数回归的估计误差，简化了渐近理论。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
\(Y \in \mathbb{R}\)：标量响应变量（可观测）。
\(X \in L^2(\mathcal{T})\)：函数型协变量，定义在紧集 \(\mathcal{T} \subset \mathbb{R}\) 上的平方可积随机过程（可观测）。例如，\(\mathcal{T} = [0,1]\)，\(X(t)\) 是时间 \(t\) 上的曲线。
\(Z \in \mathbb{R}^d\)：标量或低维协变量（可观测）。本文允许 \(Z\) 为空（即无条件检验），但一般设定包含 \(Z\)。
\(\tau \in (0,1)\)：分位数水平（连续参数）。
\(Q_{Y|X,Z}(\tau)\)：给定 \((X,Z)\) 时 \(Y\) 的 \(\tau\)-条件分位数（潜在量，不可直接观测，需估计或通过分布函数定义）。
\(F_{Y|X,Z}(y)\)：给定 \((X,Z)\) 时 \(Y\) 的条件累积分布函数（CDF）。分位数是其逆函数。
\(v \in \mathbb{S}^\infty\)：函数空间 \(L^2(\mathcal{T})\) 中的单位向量（随机投影方向）。\(\mathbb{S}^\infty\) 是单位球面。
\(\langle X, v \rangle = \int_{\mathcal{T}} X(t) v(t) dt\)：函数型协变量 \(X\) 在方向 \(v\) 上的投影（标量随机变量）。
\(n\)：样本量。
\(\{(Y_i, X_i, Z_i)\}_{i=1}^n\)：独立同分布样本（可观测数据）。
模型：
无参数模型。不假设 \(Y\) 与 \((X,Z)\) 之间的具体函数形式。唯一的结构假设是：\((Y,X,Z)\) 的联合分布存在，且条件分布 \(F_{Y|X,Z}\) 是良定义的。
检验原假设 \(H_0\)：对所有 \(\tau \in (0,1)\)，\(Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau)\) 几乎必然成立。等价地，\(Y\) 与 \(X\) 在给定 \(Z\) 下条件独立（对所有分位数水平）。
备择假设 \(H_1\)：存在某个 \(\tau\) 使得 \(Q_{Y|X,Z}(\tau) \neq Q_{Y|Z}(\tau)\) 以正概率成立。
可观测数据：
研究者观测到 \(n\) 个独立同分布三元组 \(\{(Y_i, X_i, Z_i)\}_{i=1}^n\)。每个 \(X_i\) 是一条函数曲线（通常离散采样，但本文假设连续观测以简化理论）。
想要但观测不到的量：条件分位数 \(Q_{Y|X,Z}(\tau)\) 和 \(Q_{Y|Z}(\tau)\)。它们只能通过样本估计，但本文的检验统计量不直接估计它们，而是通过条件分布函数的泛函来构建。

第二步：讲最小内核¶

最简特例：假设 \(Z\) 不存在（无条件检验），且函数型协变量 \(X\) 是一维的（即 \(X \in \mathbb{R}\)，但为了体现“函数型”本质，我们考虑 \(X\) 是定义在 \([0,1]\) 上的随机过程，但只取一个随机投影方向 \(v\)）。在这个特例下，原假设退化为：

\[H_0: Y \perp\!\!\!\perp X \quad \text{（对所有分位数水平）},\]

即 \(Y\) 与 \(X\) 无条件独立。备择假设是 \(Y\) 与 \(X\) 不独立。

核心思路：检验 \(Y\) 与 \(X\) 的独立性，等价于检验条件分布 \(F_{Y|X}(y)\) 是否等于边际分布 \(F_Y(y)\) 对所有 \(y\) 成立。一个经典方法是基于经验分布函数的泛函：

\[T = \int \left[ \hat{F}_{Y|X}(y) - \hat{F}_Y(y) \right]^2 d\hat{F}_X(x) d\hat{F}_Y(y),\]

其中 \(\hat{F}\) 是经验分布。但这里 \(X\) 是函数型的，无法直接计算 \(\hat{F}_{Y|X}\)。

随机投影解法：随机抽取一个方向 \(v \in \mathbb{S}^\infty\)，计算投影 \(\langle X, v \rangle \in \mathbb{R}\)。然后检验原假设：

\[H_0^{(v)}: Y \perp\!\!\!\perp \langle X, v \rangle \quad \text{（对所有分位数水平）}.\]

关键引理（来自Cuesta-Albertos et al., 2019的推广）：如果 \(Y\) 与 \(X\) 独立，那么对几乎所有 \(v\)，\(Y\) 与 \(\langle X, v \rangle\) 独立；反之，如果 \(Y\) 与 \(X\) 不独立，那么对几乎所有 \(v\)，\(Y\) 与 \(\langle X, v \rangle\) 也不独立。因此，检验 \(H_0^{(v)}\) 几乎必然等价于检验原假设 \(H_0\)。

在这个特例下，检验统计量退化成什么：

\[S_n(v) = \frac{1}{n} \sum_{i=1}^n \sum_{j=1}^n \left[ \mathbf{1}\{Y_j \leq Y_i\} - \frac{1}{n} \sum_{k=1}^n \mathbf{1}\{Y_k \leq Y_i\} \right] \cdot \mathbf{1}\{\langle X_j, v \rangle \leq \langle X_i, v \rangle\}.\]

这个统计量是Cramér–von Mises型的：它比较了给定 \(\langle X, v \rangle\) 时 \(Y\) 的条件分布与边际分布。如果 \(H_0^{(v)}\) 成立，\(S_n(v)\) 应接近0；否则应偏离0。

为什么这个特例抓住了核心：本文的一般设定只是把这个特例推广到： 1. 存在协变量 \(Z\)（需要条件化）； 2. 对多个随机投影 \(v_1, \ldots, v_M\) 取平均（提高功效）； 3. 对分位数水平 \(\tau\) 积分（覆盖所有分位数）。

但核心数学困难——经验过程在随机投影上的渐近理论——已经在这个特例中完全体现。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：提出一种检验“标量响应 \(Y\) 与函数型协变量 \(X\) 在给定 \(Z\) 下对所有分位数水平条件独立”的非参数方法。
核心工具/方法：基于随机投影的Cramér–von Mises型检验统计量，该统计量是经验过程在随机投影方向上的泛函，通过乘子bootstrap估计临界值。
主要结论：在温和假设下推导了零分布（高斯过程），证明了检验能以参数速率 \(n^{-1/2}\) 检测局部备择假设，并通过模拟和EEG数据验证了有限样本性能。

关键设定与假设¶

在第二节记号基础上，补全完整设定：

定义：
检验统计量：
\[T_n = \frac{1}{n} \sum_{i=1}^n \sum_{j=1}^n \int_0^1 \int_{\mathbb{S}^\infty} K_h(\tau, \tau') \cdot \left[ \mathbf{1}\{Y_j \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \left[ \mathbf{1}\{Y_i \leq Q_{Y|Z}(\tau')\} - \tau' \right] \cdot \mathbf{1}\{\langle X_j, v \rangle \leq \langle X_i, v \rangle\} \, d\mu(v) \, d\tau \, d\tau',\]
其中 \(K_h\) 是核函数（用于平滑分位数水平），\(\mu\) 是单位球面上的概率测度（通常取均匀分布）。实际计算中，用样本分位数 \(\hat{Q}_{Y|Z}(\tau)\) 代替 \(Q_{Y|Z}(\tau)\)，并用随机抽取的 \(M\) 个投影方向 \(v_1, \ldots, v_M\) 近似积分。
乘子bootstrap：生成独立标准正态乘子 \(\{e_i\}_{i=1}^n\)，构造bootstrap统计量 \(T_n^*\)，重复多次得到临界值。
假设（本文第2节）：
A1（光滑性）：条件分布 \(F_{Y|X,Z}(y)\) 和 \(F_{Y|Z}(y)\) 关于 \(y\) 连续可微，且分位数函数 \(Q_{Y|Z}(\tau)\) 关于 \(\tau\) 连续可微。这是为了确保经验过程的弱收敛。
A2（投影测度）：随机投影方向 \(v\) 的分布 \(\mu\) 是绝对连续的（相对于球面勒贝格测度）。这是为了确保“投影假设等价于原假设”这一引理成立。
A3（矩条件）：\(\mathbb{E}[|Y|^p] < \infty\) 对某个 \(p>2\)，且 \(\mathbb{E}[\|X\|^2] < \infty\)。这是经验过程理论的标准条件。
A4（核函数）：核函数 \(K_h\) 是光滑的、对称的、且带宽 \(h \to 0\) 满足 \(nh \to \infty\)。这是为了确保分位数水平的平滑积分有良好渐近性质。
相比已有文献：相比Qu and Yoon (2015)（有限维协变量），本文放宽了“协变量维数有限”这一假设；相比Cuesta-Albertos et al. (2019)（均值检验），本文强化了“对所有分位数水平检验”这一要求。

主要结果¶

定理1（零分布）：在 \(H_0\) 下，\(T_n\) 弱收敛到一个高斯过程 \(G\) 的泛函，其中 \(G\) 是均值为零、协方差函数由数据分布决定的连续高斯过程。直觉：\(T_n\) 是U-统计量型的经验过程，其极限是高斯过程在投影方向上的积分。必要条件：假设A1-A4成立。解决的技术难点：需要处理“分位数估计误差”与“投影随机性”的交互——作者通过经验过程理论中的“Donsker类”论证解决了这一点。
定理2（全局功效）：在固定备择假设 \(H_1\) 下，\(T_n \to \infty\) 依概率，即检验是相合的（power → 1）。直觉：如果 \(Y\) 与 \(X\) 在某个分位数水平上不独立，那么 \(T_n\) 的期望非零，且随 \(n\) 发散。
定理3（局部功效）：考虑局部备择假设序列 \(H_{1n}: Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau) + n^{-1/2} \delta(\tau, X, Z)\)，其中 \(\delta\) 是某个非零函数。则 \(T_n\) 的极限分布是非中心卡方型，非中心参数由 \(\delta\) 决定。关键结论：检验能以参数速率 \(n^{-1/2}\) 检测局部备择假设。为什么重要：许多非参数检验（如基于核平滑的检验）只能达到 \(n^{-1/4}\) 或更慢的速率。参数速率意味着检验在局部备择下具有与参数检验相当的效率。

证明路线与技术技巧¶

整体路线（3-5步逻辑主干）：
第一步：将 \(T_n\) 表示为经验过程。定义过程：
\[\mathbb{G}_n(\tau, v) = \frac{1}{\sqrt{n}} \sum_{i=1}^n \left[ \mathbf{1}\{Y_i \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \mathbf{1}\{\langle X_i, v \rangle \leq x\},\]
其中 \(x\) 是某个阈值。则 \(T_n\) 是 \(\mathbb{G}_n\) 的二次型泛函。
第二步：证明 \(\mathbb{G}_n\) 的弱收敛。使用经验过程理论中的“Donsker定理”：证明指标类 \(\mathcal{F} = \{ (\tau, v, x) \mapsto \left[ \mathbf{1}\{Y \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \mathbf{1}\{\langle X, v \rangle \leq x\} \}\) 是Donsker类（即满足一致覆盖数条件）。这需要假设A1-A3来确保函数类的熵条件。
第三步：处理分位数估计误差。实际中 \(Q_{Y|Z}(\tau)\) 未知，需用样本分位数 \(\hat{Q}_{Y|Z}(\tau)\) 代替。作者证明这个替换的误差是 \(o_p(1)\)，因为分位数估计的收敛速率是 \(n^{-1/2}\)，且经验过程对参数估计是“连续”的（通过“分位数过程”的随机等度连续性）。
第四步：推导 \(T_n\) 的极限分布。由连续映射定理，\(T_n\) 弱收敛到 \(\mathbb{G}\) 的二次型泛函，其中 \(\mathbb{G}\) 是 \(\mathbb{G}_n\) 的极限高斯过程。这个泛函的分布是混合卡方（权重由协方差算子的特征值决定）。
第五步：局部功效分析。在局部备择 \(H_{1n}\) 下，\(\mathbb{G}_n\) 的均值漂移为 \(n^{-1/2} \times\) 某个非零函数，因此 \(T_n\) 的极限分布变为非中心卡方。漂移项的计算需要泰勒展开和分位数回归的渐近线性表示。
关键跳跃点：
最吃劲的引理：引理1（投影等价性）——证明“对所有 \(v\) 几乎必然，\(Y \perp\!\!\!\perp \langle X, v \rangle | Z\) 等价于 \(Y \perp\!\!\!\perp X | Z\)”。这个引理是Cuesta-Albertos et al. (2019)的推广，但需要从均值推广到分位数。难点在于：分位数条件独立性比均值条件独立性更强，因此等价性的证明需要更精细的测度论论证。作者通过“条件分布函数由其在所有投影上的条件分布函数唯一确定”这一事实绕过了这个难点。
另一个难点：经验过程 \(\mathbb{G}_n\) 的指标集包含三个参数 \((\tau, v, x)\)，其中 \(v\) 是无限维的。作者通过将 \(v\) 限制在单位球面上（紧集）并假设 \(\mu\) 是概率测度，将指标集转化为紧集上的函数类，从而应用标准Donsker定理。
技术技巧点名：
经验过程理论（Donsker类）：用于证明 \(\mathbb{G}_n\) 的弱收敛。具体用到了“覆盖数”和“熵积分”条件。
随机投影：将无限维问题降维到一维，避免维数灾难。
乘子bootstrap：用于估计临界值，避免直接计算极限分布的复杂特征值。
分位数过程的随机等度连续性：用于处理分位数估计误差。
U-统计量分解：\(T_n\) 本质上是二阶U-统计量，其渐近理论需要Hájek投影或 Hoeffding分解。作者通过经验过程框架绕过了显式U-统计量分解，但本质相同。

真实例子与应用¶

数据：EEG（脑电图）数据集，包含 \(n=122\) 个受试者的脑电信号。每个受试者有一条函数型协变量 \(X(t)\)（时间 \(t\) 上的脑电波曲线），一个标量响应 \(Y\)（某种认知测试得分），以及一个标量协变量 \(Z\)（年龄）。
怎么用：检验原假设“在给定年龄 \(Z\) 的条件下，脑电波曲线 \(X\) 与认知得分 \(Y\) 在所有分位数水平上条件独立”。作者用本文提出的检验统计量，基于 \(M=100\) 个随机投影和乘子bootstrap（\(B=500\) 次重复）计算p值。
结果：p值 < 0.05，拒绝原假设，表明脑电波曲线与认知得分在给定年龄下存在条件分位数依赖关系。
这个例子想说明什么：验证本文方法在真实数据上的可行性，并展示其能检测到传统均值检验可能遗漏的依赖关系（因为依赖可能只出现在高分位数或低分位数上）。作者没有与baseline方法对比（因为本文是第一个做这件事的），但通过模拟实验展示了与“忽略函数型结构”的朴素方法的对比。

🔎 结论是否比证明窄¶

窄的地方：定理1的零分布推导假设了 \(Q_{Y|Z}(\tau)\) 已知（或用样本分位数代替后误差可忽略）。但作者在证明中只处理了“\(Z\) 是有限维”的情形。如果 \(Z\) 也是函数型的（如另一条曲线），则分位数估计的收敛速率会变慢，定理1的结论可能不成立。作者在引言中明确说“we assume \(Z\) is a finite-dimensional vector”，但没有讨论 \(Z\) 为函数型时的推广。
泛泛claim的地方：作者在摘要中说“the statistic is able to detect a broad class of local alternatives”，但定理3只证明了“形如 \(n^{-1/2} \delta\) 的局部备择”可检测。这个“broad class”实际上只覆盖了以参数速率趋近于零的备择假设，不覆盖更慢速率（如 \(n^{-1/4}\)）的备择。后者可能无法被检测，但作者没有讨论。
conjecture：作者在结论中说“the multiplier bootstrap provides valid critical values”，但只通过模拟验证了有限样本表现，没有给出bootstrap一致性的严格证明（即证明bootstrap分布弱收敛到极限分布）。这在经验过程文献中是标准做法（通常需要额外的“bootstrap Donsker定理”假设），但作者没有明确列出这些假设。

四、开放问题¶

函数型协变量 \(Z\) 的推广：本文假设 \(Z\) 是有限维的。如果 \(Z\) 也是函数型的（如另一条曲线），如何检验条件分位数独立性？需要处理“双函数型”数据的投影策略。扎根点：引言中“we assume \(Z\) is a finite-dimensional vector”这一限制。
bootstrap一致性的严格证明：本文推荐乘子bootstrap，但没有给出其渐近一致性的理论证明（即证明bootstrap分布弱收敛到极限分布）。这在经验过程文献中通常需要“bootstrap Donsker定理”条件。扎根点：第3节“we recommend a simple multiplier bootstrap approach”之后没有定理陈述。
更慢速率的局部备择：定理3只覆盖了 \(n^{-1/2}\) 速率的局部备择。对于更慢速率（如 \(n^{-1/4}\)）的备择，检验是否仍能检测？如果不能，是否存在其他检验能检测这些备择？扎根点：定理3的陈述“detect local alternatives converging at the parametric rate”。
投影方向的选择：本文使用均匀随机投影。是否存在更优的投影分布（如基于数据自适应选择的投影）能提高功效？扎根点：第4节模拟中“we use \(M=100\) random projections”这一具体选择，但没有讨论最优性。
与直接分位数回归方法的对比：本文回避了“用B样条基展开 + 惩罚分位数回归”这一竞争路线。在有限样本下，哪种方法更优？扎根点：引言中未讨论Cardot et al. (2003)等直接回归方法。

Maintained by 陈星宇 · Homepage · Source on GitHub