跳转至

Testing conditional quantile independence with functional covariate

作者: Yongzhen Feng, Jie Li, Xiaojun Song
来源: Biometrics
主题: 数理统计 / 假设检验
相关性: 7/10
机构绿灯: Tsinghua University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomtc/ujae036


一、领域脉络与小综述

这个方向是什么

本方向关注的是函数型数据下的条件独立性检验。具体而言,研究者观测到一个标量响应变量 \(Y \in \mathbb{R}\)、一个函数型协变量 \(X(t)\)(定义在紧集 \(\mathcal{T}\) 上的随机过程)、以及一个标量或低维协变量 \(Z \in \mathbb{R}^d\)。核心问题是:在给定 \(Z\) 的条件下,\(Y\) 是否在所有分位数水平上都与 \(X\) 条件独立?即检验原假设:

\[H_0: Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau) \quad \text{对所有} \ \tau \in (0,1) \ \text{几乎必然成立},\]
其中 \(Q_{Y|X,Z}(\tau)\) 是给定 \((X,Z)\)\(Y\)\(\tau\)-条件分位数。这个检验比传统的条件均值独立性检验(即检验 \(\mathbb{E}[Y|X,Z] = \mathbb{E}[Y|Z]\))更全面,因为它覆盖了整个条件分布。该方向当前处于方法快速发展但理论尚不完整的阶段:已有工作多聚焦于标量或低维协变量,函数型协变量带来的“维数灾难”使得直接推广极为困难。

发展脉络(history)

本文的introduction将相关文献串成一条清晰的线索:

  1. 奠基工作:条件分位数独立性检验的提出
  2. Qu and Yoon (2015):首次提出检验“\(Y\)\(X\) 在给定 \(Z\) 下对所有分位数水平条件独立”的框架。他们基于分位数回归过程构建检验统计量,但协变量 \(X\) 必须是有限维的(标量或向量)。这是本文的直接出发点——作者在引言中明确说“Qu and Yoon (2015) considered the case where the covariate is a scalar or a finite-dimensional vector”,留下“函数型协变量”这个口子。

  3. 主要进展:函数型数据下的条件均值独立性检验

  4. Cuesta-Albertos et al. (2019):针对函数型协变量 \(X\),提出检验“\(\mathbb{E}[Y|X,Z] = \mathbb{E}[Y|Z]\)”的方法。他们采用随机投影策略——将函数型协变量投影到随机方向上,把无限维问题转化为有限维问题,并证明“投影后的条件均值独立性几乎必然等价于原假设”。这是本文的核心技术灵感来源。作者在引言中明确说“Cuesta-Albertos et al. (2019) proposed a test for conditional mean independence with functional covariate”,并指出其局限是只检验均值,不检验分位数
  5. Escanciano (2006):提出基于随机投影的条件均值检验(标量协变量情形),其经验过程理论为后续投影方法提供了渐近分析模板。

  6. 当前frontier:函数型数据下的条件分位数检验

  7. 本文是第一个将“随机投影”策略用于条件分位数独立性检验的工作。作者在引言中明确说“To the best of our knowledge, no existing work has considered testing conditional quantile independence with functional covariates”,并指出“the main challenge is that the functional covariate is infinite-dimensional, making direct nonparametric estimation infeasible”。

  8. 本文的位置:填补了“函数型协变量 + 条件分位数独立性检验”这一空白。它把Cuesta-Albertos et al. (2019)的随机投影思想从均值推广到分位数,同时把Qu and Yoon (2015)的分位数检验从有限维协变量推广到函数型协变量。

子线索聚类

这些被引文献大致落在两条子线索上:

  • 线索A:条件分位数独立性检验(有限维协变量)
    代表:Qu and Yoon (2015)、He and Zhu (2003)、Zheng (1998)。这些工作聚焦于标量/向量协变量下的分位数检验,理论成熟(渐近分布、局部功效),但无法处理函数型数据。本文的“分位数过程”和“全局备择假设”概念继承自此线索。

  • 线索B:函数型数据下的条件均值检验(随机投影方法)
    代表:Cuesta-Albertos et al. (2019)、Escanciano (2006)、Lavergne and Patilea (2008)。这些工作用随机投影将无限维问题降维,并证明投影假设与原假设的等价性。本文的“投影假设”和“经验过程索引于随机投影”技术继承自此线索。

这个方向在追问的核心问题

  1. 如何避免函数型数据的“维数灾难”?
    函数型协变量是无限维的,直接非参数估计(如核平滑)需要指数级样本量。随机投影是当前主流解法,但投影后的检验统计量是否仍能检测所有偏离原假设的方向?本文通过“投影假设几乎必然等价于原假设”回答了这个问题。

  2. 检验统计量的渐近分布是什么?
    由于投影是随机的,统计量是随机投影上的经验过程,其极限分布通常是非标准的(如高斯过程的泛函)。本文推导了零分布,并推荐乘子bootstrap。

  3. 检验能检测多“弱”的备择假设?
    即局部功效分析。本文证明其统计量能以参数速率(\(n^{-1/2}\))检测趋近于零的备择假设,这是很强的性质(许多非参数检验只能达到 \(n^{-1/4}\) 或更慢的速率)。

⚠️ 作者的 framing

  • 作者把缺口 frame 成什么:作者说“no existing work has considered testing conditional quantile independence with functional covariates”,因此本文是“显然的下一步”——把两个成熟线索(分位数检验 + 随机投影)结合起来。这个framing很合理,因为两条线索各自的理论都已完备,组合的技术难度主要在于经验过程理论在投影分位数过程上的应用,而非全新的数学创造。

  • 哪些竞争路线被他淡化或回避了

  • 作者淡化了“直接对函数型协变量做分位数回归”的可能性(如用B样条基展开 + 惩罚)。这种路线在文献中存在(如Cardot et al., 2003),但作者没有讨论。原因是:直接回归需要选择基函数和惩罚参数,且检验的渐近理论更复杂;随机投影方法则更“无参数选择”。
  • 作者回避了“是否可以用深度学习方法做条件分位数检验”这一路线。这可能是合理的,因为深度学习缺乏本文所需的清晰渐近理论。

  • 什么明显该被引 / 该存在、却没出现在 intro 里?

  • Cardot et al. (2003) “Testing hypotheses in the functional linear model”:这篇是函数型数据假设检验的早期经典,但作者没有引用。可能因为Cardot et al.检验的是线性模型中的参数假设,而非条件独立性。但作为函数型数据检验的奠基工作,它值得被提及。
  • Kokoszka and Reimherr (2017) “Introduction to Functional Data Analysis”:这本教材系统总结了函数型数据检验的框架,但作者没有引用。可能因为本文更聚焦于分位数检验这一特定子问题。
  • Lei (2014) “Classification of functional data”:这篇涉及函数型数据的分类检验,与本文的“条件独立性”问题不同,但随机投影策略有相似性。不引用是合理的。

张力

未见明显对立引用。所有被引工作都支持“随机投影是处理函数型数据检验的有效策略”这一共识。唯一的张力是:Qu and Yoon (2015) 的分位数检验基于分位数回归过程(需要估计条件分位数),而Cuesta-Albertos et al. (2019)的均值检验基于经验分布函数(不需要估计)。本文选择了后者的框架(经验过程),而非前者。这意味着本文的检验统计量不依赖于分位数回归的估计误差,简化了渐近理论。


二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号
  • \(Y \in \mathbb{R}\):标量响应变量(可观测)。
  • \(X \in L^2(\mathcal{T})\):函数型协变量,定义在紧集 \(\mathcal{T} \subset \mathbb{R}\) 上的平方可积随机过程(可观测)。例如,\(\mathcal{T} = [0,1]\)\(X(t)\) 是时间 \(t\) 上的曲线。
  • \(Z \in \mathbb{R}^d\):标量或低维协变量(可观测)。本文允许 \(Z\) 为空(即无条件检验),但一般设定包含 \(Z\)
  • \(\tau \in (0,1)\):分位数水平(连续参数)。
  • \(Q_{Y|X,Z}(\tau)\):给定 \((X,Z)\)\(Y\)\(\tau\)-条件分位数(潜在量,不可直接观测,需估计或通过分布函数定义)。
  • \(F_{Y|X,Z}(y)\):给定 \((X,Z)\)\(Y\) 的条件累积分布函数(CDF)。分位数是其逆函数。
  • \(v \in \mathbb{S}^\infty\):函数空间 \(L^2(\mathcal{T})\) 中的单位向量(随机投影方向)。\(\mathbb{S}^\infty\) 是单位球面。
  • \(\langle X, v \rangle = \int_{\mathcal{T}} X(t) v(t) dt\):函数型协变量 \(X\) 在方向 \(v\) 上的投影(标量随机变量)。
  • \(n\):样本量。
  • \(\{(Y_i, X_i, Z_i)\}_{i=1}^n\):独立同分布样本(可观测数据)。

  • 模型

  • 无参数模型。不假设 \(Y\)\((X,Z)\) 之间的具体函数形式。唯一的结构假设是:\((Y,X,Z)\) 的联合分布存在,且条件分布 \(F_{Y|X,Z}\) 是良定义的。
  • 检验原假设 \(H_0\):对所有 \(\tau \in (0,1)\)\(Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau)\) 几乎必然成立。等价地,\(Y\)\(X\) 在给定 \(Z\) 下条件独立(对所有分位数水平)。
  • 备择假设 \(H_1\):存在某个 \(\tau\) 使得 \(Q_{Y|X,Z}(\tau) \neq Q_{Y|Z}(\tau)\) 以正概率成立。

  • 可观测数据

  • 研究者观测到 \(n\) 个独立同分布三元组 \(\{(Y_i, X_i, Z_i)\}_{i=1}^n\)。每个 \(X_i\) 是一条函数曲线(通常离散采样,但本文假设连续观测以简化理论)。
  • 想要但观测不到的量:条件分位数 \(Q_{Y|X,Z}(\tau)\)\(Q_{Y|Z}(\tau)\)。它们只能通过样本估计,但本文的检验统计量不直接估计它们,而是通过条件分布函数的泛函来构建。

第二步:讲最小内核

最简特例:假设 \(Z\) 不存在(无条件检验),且函数型协变量 \(X\) 是一维的(即 \(X \in \mathbb{R}\),但为了体现“函数型”本质,我们考虑 \(X\) 是定义在 \([0,1]\) 上的随机过程,但只取一个随机投影方向 \(v\))。在这个特例下,原假设退化为:

\[H_0: Y \perp\!\!\!\perp X \quad \text{(对所有分位数水平)},\]
\(Y\)\(X\) 无条件独立。备择假设是 \(Y\)\(X\) 不独立。

核心思路:检验 \(Y\)\(X\) 的独立性,等价于检验条件分布 \(F_{Y|X}(y)\) 是否等于边际分布 \(F_Y(y)\) 对所有 \(y\) 成立。一个经典方法是基于经验分布函数的泛函

\[T = \int \left[ \hat{F}_{Y|X}(y) - \hat{F}_Y(y) \right]^2 d\hat{F}_X(x) d\hat{F}_Y(y),\]
其中 \(\hat{F}\) 是经验分布。但这里 \(X\) 是函数型的,无法直接计算 \(\hat{F}_{Y|X}\)

随机投影解法:随机抽取一个方向 \(v \in \mathbb{S}^\infty\),计算投影 \(\langle X, v \rangle \in \mathbb{R}\)。然后检验原假设:

\[H_0^{(v)}: Y \perp\!\!\!\perp \langle X, v \rangle \quad \text{(对所有分位数水平)}.\]
关键引理(来自Cuesta-Albertos et al., 2019的推广):如果 \(Y\)\(X\) 独立,那么对几乎所有 \(v\)\(Y\)\(\langle X, v \rangle\) 独立;反之,如果 \(Y\)\(X\) 不独立,那么对几乎所有 \(v\)\(Y\)\(\langle X, v \rangle\) 也不独立。因此,检验 \(H_0^{(v)}\) 几乎必然等价于检验原假设 \(H_0\)

在这个特例下,检验统计量退化成什么

\[S_n(v) = \frac{1}{n} \sum_{i=1}^n \sum_{j=1}^n \left[ \mathbf{1}\{Y_j \leq Y_i\} - \frac{1}{n} \sum_{k=1}^n \mathbf{1}\{Y_k \leq Y_i\} \right] \cdot \mathbf{1}\{\langle X_j, v \rangle \leq \langle X_i, v \rangle\}.\]
这个统计量是Cramér–von Mises型的:它比较了给定 \(\langle X, v \rangle\)\(Y\) 的条件分布与边际分布。如果 \(H_0^{(v)}\) 成立,\(S_n(v)\) 应接近0;否则应偏离0。

为什么这个特例抓住了核心:本文的一般设定只是把这个特例推广到: 1. 存在协变量 \(Z\)(需要条件化); 2. 对多个随机投影 \(v_1, \ldots, v_M\) 取平均(提高功效); 3. 对分位数水平 \(\tau\) 积分(覆盖所有分位数)。

但核心数学困难——经验过程在随机投影上的渐近理论——已经在这个特例中完全体现。


三、这篇论文做了什么

三句话

  1. 研究了什么问题:提出一种检验“标量响应 \(Y\) 与函数型协变量 \(X\) 在给定 \(Z\) 下对所有分位数水平条件独立”的非参数方法。
  2. 核心工具/方法:基于随机投影的Cramér–von Mises型检验统计量,该统计量是经验过程在随机投影方向上的泛函,通过乘子bootstrap估计临界值。
  3. 主要结论:在温和假设下推导了零分布(高斯过程),证明了检验能以参数速率 \(n^{-1/2}\) 检测局部备择假设,并通过模拟和EEG数据验证了有限样本性能。

关键设定与假设

在第二节记号基础上,补全完整设定:

  • 定义
  • 检验统计量:
    \[T_n = \frac{1}{n} \sum_{i=1}^n \sum_{j=1}^n \int_0^1 \int_{\mathbb{S}^\infty} K_h(\tau, \tau') \cdot \left[ \mathbf{1}\{Y_j \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \left[ \mathbf{1}\{Y_i \leq Q_{Y|Z}(\tau')\} - \tau' \right] \cdot \mathbf{1}\{\langle X_j, v \rangle \leq \langle X_i, v \rangle\} \, d\mu(v) \, d\tau \, d\tau',\]
    其中 \(K_h\) 是核函数(用于平滑分位数水平),\(\mu\) 是单位球面上的概率测度(通常取均匀分布)。实际计算中,用样本分位数 \(\hat{Q}_{Y|Z}(\tau)\) 代替 \(Q_{Y|Z}(\tau)\),并用随机抽取的 \(M\) 个投影方向 \(v_1, \ldots, v_M\) 近似积分。
  • 乘子bootstrap:生成独立标准正态乘子 \(\{e_i\}_{i=1}^n\),构造bootstrap统计量 \(T_n^*\),重复多次得到临界值。

  • 假设(本文第2节):

  • A1(光滑性):条件分布 \(F_{Y|X,Z}(y)\)\(F_{Y|Z}(y)\) 关于 \(y\) 连续可微,且分位数函数 \(Q_{Y|Z}(\tau)\) 关于 \(\tau\) 连续可微。这是为了确保经验过程的弱收敛。
  • A2(投影测度):随机投影方向 \(v\) 的分布 \(\mu\) 是绝对连续的(相对于球面勒贝格测度)。这是为了确保“投影假设等价于原假设”这一引理成立。
  • A3(矩条件)\(\mathbb{E}[|Y|^p] < \infty\) 对某个 \(p>2\),且 \(\mathbb{E}[\|X\|^2] < \infty\)。这是经验过程理论的标准条件。
  • A4(核函数):核函数 \(K_h\) 是光滑的、对称的、且带宽 \(h \to 0\) 满足 \(nh \to \infty\)。这是为了确保分位数水平的平滑积分有良好渐近性质。
  • 相比已有文献:相比Qu and Yoon (2015)(有限维协变量),本文放宽了“协变量维数有限”这一假设;相比Cuesta-Albertos et al. (2019)(均值检验),本文强化了“对所有分位数水平检验”这一要求。

主要结果

  • 定理1(零分布):在 \(H_0\) 下,\(T_n\) 弱收敛到一个高斯过程 \(G\) 的泛函,其中 \(G\) 是均值为零、协方差函数由数据分布决定的连续高斯过程。直觉\(T_n\) 是U-统计量型的经验过程,其极限是高斯过程在投影方向上的积分。必要条件:假设A1-A4成立。解决的技术难点:需要处理“分位数估计误差”与“投影随机性”的交互——作者通过经验过程理论中的“Donsker类”论证解决了这一点。

  • 定理2(全局功效):在固定备择假设 \(H_1\) 下,\(T_n \to \infty\) 依概率,即检验是相合的(power → 1)。直觉:如果 \(Y\)\(X\) 在某个分位数水平上不独立,那么 \(T_n\) 的期望非零,且随 \(n\) 发散。

  • 定理3(局部功效):考虑局部备择假设序列 \(H_{1n}: Q_{Y|X,Z}(\tau) = Q_{Y|Z}(\tau) + n^{-1/2} \delta(\tau, X, Z)\),其中 \(\delta\) 是某个非零函数。则 \(T_n\) 的极限分布是非中心卡方型,非中心参数由 \(\delta\) 决定。关键结论:检验能以参数速率 \(n^{-1/2}\) 检测局部备择假设。为什么重要:许多非参数检验(如基于核平滑的检验)只能达到 \(n^{-1/4}\) 或更慢的速率。参数速率意味着检验在局部备择下具有与参数检验相当的效率。

证明路线与技术技巧

  • 整体路线(3-5步逻辑主干):
  • 第一步:将 \(T_n\) 表示为经验过程。定义过程:
    \[\mathbb{G}_n(\tau, v) = \frac{1}{\sqrt{n}} \sum_{i=1}^n \left[ \mathbf{1}\{Y_i \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \mathbf{1}\{\langle X_i, v \rangle \leq x\},\]
    其中 \(x\) 是某个阈值。则 \(T_n\)\(\mathbb{G}_n\) 的二次型泛函。
  • 第二步:证明 \(\mathbb{G}_n\) 的弱收敛。使用经验过程理论中的“Donsker定理”:证明指标类 \(\mathcal{F} = \{ (\tau, v, x) \mapsto \left[ \mathbf{1}\{Y \leq Q_{Y|Z}(\tau)\} - \tau \right] \cdot \mathbf{1}\{\langle X, v \rangle \leq x\} \}\) 是Donsker类(即满足一致覆盖数条件)。这需要假设A1-A3来确保函数类的熵条件。
  • 第三步:处理分位数估计误差。实际中 \(Q_{Y|Z}(\tau)\) 未知,需用样本分位数 \(\hat{Q}_{Y|Z}(\tau)\) 代替。作者证明这个替换的误差是 \(o_p(1)\),因为分位数估计的收敛速率是 \(n^{-1/2}\),且经验过程对参数估计是“连续”的(通过“分位数过程”的随机等度连续性)。
  • 第四步:推导 \(T_n\) 的极限分布。由连续映射定理,\(T_n\) 弱收敛到 \(\mathbb{G}\) 的二次型泛函,其中 \(\mathbb{G}\)\(\mathbb{G}_n\) 的极限高斯过程。这个泛函的分布是混合卡方(权重由协方差算子的特征值决定)。
  • 第五步:局部功效分析。在局部备择 \(H_{1n}\) 下,\(\mathbb{G}_n\) 的均值漂移为 \(n^{-1/2} \times\) 某个非零函数,因此 \(T_n\) 的极限分布变为非中心卡方。漂移项的计算需要泰勒展开和分位数回归的渐近线性表示。

  • 关键跳跃点

  • 最吃劲的引理:引理1(投影等价性)——证明“对所有 \(v\) 几乎必然,\(Y \perp\!\!\!\perp \langle X, v \rangle | Z\) 等价于 \(Y \perp\!\!\!\perp X | Z\)”。这个引理是Cuesta-Albertos et al. (2019)的推广,但需要从均值推广到分位数。难点在于:分位数条件独立性比均值条件独立性更强,因此等价性的证明需要更精细的测度论论证。作者通过“条件分布函数由其在所有投影上的条件分布函数唯一确定”这一事实绕过了这个难点。
  • 另一个难点:经验过程 \(\mathbb{G}_n\) 的指标集包含三个参数 \((\tau, v, x)\),其中 \(v\) 是无限维的。作者通过将 \(v\) 限制在单位球面上(紧集)并假设 \(\mu\) 是概率测度,将指标集转化为紧集上的函数类,从而应用标准Donsker定理。

  • 技术技巧点名

  • 经验过程理论(Donsker类):用于证明 \(\mathbb{G}_n\) 的弱收敛。具体用到了“覆盖数”和“熵积分”条件。
  • 随机投影:将无限维问题降维到一维,避免维数灾难。
  • 乘子bootstrap:用于估计临界值,避免直接计算极限分布的复杂特征值。
  • 分位数过程的随机等度连续性:用于处理分位数估计误差。
  • U-统计量分解\(T_n\) 本质上是二阶U-统计量,其渐近理论需要Hájek投影或 Hoeffding分解。作者通过经验过程框架绕过了显式U-统计量分解,但本质相同。

真实例子与应用

  • 数据:EEG(脑电图)数据集,包含 \(n=122\) 个受试者的脑电信号。每个受试者有一条函数型协变量 \(X(t)\)(时间 \(t\) 上的脑电波曲线),一个标量响应 \(Y\)(某种认知测试得分),以及一个标量协变量 \(Z\)(年龄)。
  • 怎么用:检验原假设“在给定年龄 \(Z\) 的条件下,脑电波曲线 \(X\) 与认知得分 \(Y\) 在所有分位数水平上条件独立”。作者用本文提出的检验统计量,基于 \(M=100\) 个随机投影和乘子bootstrap(\(B=500\) 次重复)计算p值。
  • 结果:p值 < 0.05,拒绝原假设,表明脑电波曲线与认知得分在给定年龄下存在条件分位数依赖关系。
  • 这个例子想说明什么:验证本文方法在真实数据上的可行性,并展示其能检测到传统均值检验可能遗漏的依赖关系(因为依赖可能只出现在高分位数或低分位数上)。作者没有与baseline方法对比(因为本文是第一个做这件事的),但通过模拟实验展示了与“忽略函数型结构”的朴素方法的对比。

🔎 结论是否比证明窄

  • 窄的地方:定理1的零分布推导假设了 \(Q_{Y|Z}(\tau)\) 已知(或用样本分位数代替后误差可忽略)。但作者在证明中只处理了“\(Z\) 是有限维”的情形。如果 \(Z\) 也是函数型的(如另一条曲线),则分位数估计的收敛速率会变慢,定理1的结论可能不成立。作者在引言中明确说“we assume \(Z\) is a finite-dimensional vector”,但没有讨论 \(Z\) 为函数型时的推广。
  • 泛泛claim的地方:作者在摘要中说“the statistic is able to detect a broad class of local alternatives”,但定理3只证明了“形如 \(n^{-1/2} \delta\) 的局部备择”可检测。这个“broad class”实际上只覆盖了以参数速率趋近于零的备择假设,不覆盖更慢速率(如 \(n^{-1/4}\))的备择。后者可能无法被检测,但作者没有讨论。
  • conjecture:作者在结论中说“the multiplier bootstrap provides valid critical values”,但只通过模拟验证了有限样本表现,没有给出bootstrap一致性的严格证明(即证明bootstrap分布弱收敛到极限分布)。这在经验过程文献中是标准做法(通常需要额外的“bootstrap Donsker定理”假设),但作者没有明确列出这些假设。

四、开放问题

  1. 函数型协变量 \(Z\) 的推广:本文假设 \(Z\) 是有限维的。如果 \(Z\) 也是函数型的(如另一条曲线),如何检验条件分位数独立性?需要处理“双函数型”数据的投影策略。扎根点:引言中“we assume \(Z\) is a finite-dimensional vector”这一限制。

  2. bootstrap一致性的严格证明:本文推荐乘子bootstrap,但没有给出其渐近一致性的理论证明(即证明bootstrap分布弱收敛到极限分布)。这在经验过程文献中通常需要“bootstrap Donsker定理”条件。扎根点:第3节“we recommend a simple multiplier bootstrap approach”之后没有定理陈述。

  3. 更慢速率的局部备择:定理3只覆盖了 \(n^{-1/2}\) 速率的局部备择。对于更慢速率(如 \(n^{-1/4}\))的备择,检验是否仍能检测?如果不能,是否存在其他检验能检测这些备择?扎根点:定理3的陈述“detect local alternatives converging at the parametric rate”。

  4. 投影方向的选择:本文使用均匀随机投影。是否存在更优的投影分布(如基于数据自适应选择的投影)能提高功效?扎根点:第4节模拟中“we use \(M=100\) random projections”这一具体选择,但没有讨论最优性。

  5. 与直接分位数回归方法的对比:本文回避了“用B样条基展开 + 惩罚分位数回归”这一竞争路线。在有限样本下,哪种方法更优?扎根点:引言中未讨论Cardot et al. (2003)等直接回归方法。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论