Simplex quantile regression without crossing¶

作者: Tomohiro Ando, Ker-Chau Li
来源: Annals of Statistics
主题: 非参数 / 半参数
相关性: 7/10
机构绿灯: University of Melbourne（US News 前 50，免分进入精读）
链接: https://doi.org/10.1214/24-aos2458

一、领域脉络与小综述¶

这个方向是什么¶

分位数回归（Quantile Regression, QR）是用于刻画给定协变量 \(X\) 下，响应变量 \(Y\) 的条件分位数函数的统计方法。该方向当前面临一个经典瓶颈：分位数交叉——即对不同的分位数水平 \(\tau_1 < \tau_2\)，所估计的条件分位数函数可能违背单调性，使得估计的分位数曲线在某个 \(x\) 处交叉（例如，第0.25分位数预测值大于第0.5分位数预测值）。本子方向根本问题是：如何构造一个同时估计多个条件分位数函数的模型，使它们天然或强制地满足单调性约束，同时尽可能不牺牲估计效率、不引入额外的参数冗余，并能在模型误设下保持统计有效性。当前，大量非交叉方法建立在模型正确设定的假设上，而模型误设与外推（extrapolation）下的交叉问题被广泛忽略。

发展脉络 (history)¶

基于作者在 intro 中引用的文献（及相关被引论文摘要），可将该子方向的发展梳理为：

奠基工作：分位数回归的提出与交叉问题。
- Koenker & Bassett (1978) 提出了传统的独立分位数回归（对每个 \(\tau\) 分别线性回归），并迅速被发现当同时估计多个分位数时，曲线可能交叉。这是该问题的经典起点。
- Koenker (2005) 的专著《Quantile Regression》全面总结了方法并指出了交叉问题。
主要进展：强制非交叉的约束方法。
- Bondell et al. (2010) 开发了一种受约束的多元分位数回归，对规范形式进行重参数化以保证非交叉。该工作假设模型正确指定。
- Dette & Volgushev (2008) 提出了通过重新排列核估计（noncrossing by rearrangement）来强制单调性。这是非参数方法中的一条线索，但同样假设模型结构正确。
- Takeuchi et al. (2006) 和 Schnabel & Eilers (2013) 在样条框架下整合非交叉约束。前者通过约束分位数系数，后者通过P-样条。
- 这些“强制约束”路线都有共同特征：在模型欠拟合（过平滑）时，即使加了约束也可能在部分区域失效；且当模型是错误指定的时（即真实分位数函数不属于该函数类），强制非交叉会引入系统偏差（biased estimation）。
当前前沿：误设下的分析与非交叉的表示形式。
- Shibata (1981)、Li (1987) 和 Zhang (1993) 是研究模型选择与交叉验证渐近最优性的经典理论，但未聚焦于分位数回归。本文在此基础上，将交叉验证最优性拓展到了误设下的非交叉分位数回归。
- 作者之前的 Ando & Li (2014) 提出了“最大有效区域”（Maximum Effective Region, MER）的概念，用于在混合线性模型中定义外推区域。本文将该概念用作定义误设下非交叉外推区域的基石。
本文的位置：本文是第一条同时处理“模型误设”和“非交叉”两个问题的系统路线。它不通过强制约束来避免交叉，而是通过单纯形嵌入（simplex embedding）与重心坐标系（Barycentric coordinate system） 使单调性成为模型的内在表示性质（即平凡满足，无需显式约束）。同时，它在理论上建立了误设下伪真参数的存在性与渐近性质，并对基于交叉验证的模型选择和模型平均给出了渐近最优性证明。

子线索聚类¶

被引文献大致落在以下2-3条子线索：

子线索 A：基于约束的非交叉方法 —— 代表工作：Bondell et al. (2010), Dette & Volgushev (2008), Takeuchi et al. (2006), Schnabel & Eilers (2013)。核心思路：对系数或估计量引入显式单调性约束（线性不等式约束、单调变换、重新排列等）。局限：这些方法通常在参数/非参数模型正确设定的前提下保证不交叉，在模型误设时可能失效或因过度约束而引入偏差。
子线索 B：模型误设下的渐近理论（非分位数回归特定） —— 代表工作：Shibata (1981), Li (1987), Zhang (1993), White (1982)。核心思路：研究当模型是“错误的”时，参数估计的目标（pseudo-true parameter）是什么，以及信息矩阵、模型选择准则（如交叉验证）是否仍然有效。局限：这些工作不直接处理分位数回归的非交叉问题。
子线索 C：有信息分量分析与最大有效区域 —— 代表工作：Ando & Li (2014)（作者的前期工作）。该线索引入“最大有效区域”给出线性模型中可外推而不违反VIP（定性性相）的区域。本文将这一概念从均值回归/分类拓展到了分位数回归，成为其理论框架的一部分。
子线索 D：分位数回归的表示/参数化（背景） —— 代表工作：Koenker & Bassett (1978), 线性规划算法。本文提出的单纯形嵌入本质上是分位数函数的一种新参数化表示，而非常规的约束，因此可视为一条独立的表示子线索。

这个方向在追问的核心问题¶

如何在不牺牲模型灵活性的前提下，对多个分位数函数施加联合的形状约束（单调性、凸性等）？
在模型设定错误（misspecified）时，非交叉分位数回归的估计目标是什么（伪真参数是否存在）？分布理论是什么？
误设下的模型选择（如选择多少个分位数、何种复杂度）的最优性是否仍然成立？
非交叉方法在外推时（即超出数据支撑的区域）的表现如何？有无理论保证？

当前主流方法的已知瓶颈: 对问题1的答案集合为“显式约束”或“重新排列”，均有计算或统计损失的潜在问题；对问题2和3的回答几乎空白；对问题4的回答几乎是“无”。

⚠️ 作者的 framing¶

作者对gap的frame：“Model misspecification and extrapolation are two issues rarely considered in the literature...while many sophisticated methods have been developed under the assumption of correct model specification。” 作者将缺口定义为：(1) 模型误设下的非交叉，(2) 定义允许外推而不发生交叉的区域。因此，本文将自己定位为打破“正确设定”这一强假设的标准路线，并创新性地以单纯形嵌入作为“免交叉”的表示，而非约束。
被淡化的其他路线：作者在引言中明确承认“noncrossing by rearrangement”等方法，但指出它们“assume the model is correctly specified”，或“require additional smoothing”（强调自己的工作不需要调参）。作者同时也暗示，基于约束的方法（如多重不等式）在外推时极易崩溃。这些看似批评实则是在为自己的方法铺路。
值得查的缺失：论文未引用任何基于神经网络的深度分位数回归非交叉方法（如近年来DNN分位数回归与非交叉正则化的工作）。可能是因为该领域方法与论文的理论深度（渐近理论、伪真参数）不匹配，但这可以作为一条“作者故意回避”的线索去核实。
引用无明显矛盾的张力：未见明显的条件对立。Shibata (1981)与Li (1987)之间的模型选择最优性条件微调不一致，但不属于本文的关注范围。

二、最核心、最简单的例子 / 数学问题（先把符号 / 模型 / 可观测数据交代清楚）¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \( Y \in \mathbb{R} \): 响应变量。
- \( X \in \mathbb{R}^d \): 协变量（列向量）。
- \( \tau \in (0, 1) \): 分位数水平（quantile index）。
- \( q_\tau(x) \): 给定 \( X = x \) 下 \( Y \) 的条件 \( \tau \)-分位数，是本论文要估计的量。
- \( \beta(\tau) \in \mathbb{R}^d \): 线性分位数回归系数。传统方法对每个 \( \tau \) 有一个参数向量 \( \beta(\tau) \)，但本文不直接使用这个。
- \( \theta \in \Theta \): 模型参数向量。在 SQR 中，它是重心坐标系下的坐标。
- \( \tau_1 < \tau_2 < \dots < \tau_K \): 研究者感兴趣的 \( K \) 个分位数水平，通常是等间距的（但理论上可任意）。“全连续分位数”情况对应 \( K \to \infty \)。
- \( \alpha(\theta, \tau) \): 一个光滑且严格单调递增的函数（从 \( \tau \) 到0和1之间），其值依赖于 \( x \)?
模型：论文不考虑单一的分位数线性模型 \( q_\tau(x) = x^\top \beta(\tau) \)（它会导致交叉），而是考虑一个同时包含所有感兴趣分位数（\(\tau_1, \dots, \tau_K\)）的连续分位数曲线族，由以下表示给出：对于给定的协变量 \( x \) 条件下的分布，SQR 将 \( q_\tau(x) \) 表示为如下形式：
\[q_\tau(x) = \mu(x)^\top \boldsymbol{\phi}(\tau)\]
其中 \( \boldsymbol{\phi}(\tau) \in \mathbb{R}^K \) 是单纯形上的重心坐标向量（即 \( \phi_i(\tau) \ge 0, \sum_i \phi_i(\tau) = 1 \)），而 \( \mu(x) \in \mathbb{R}^K \) 是协变量空间上的函数，\( \mu_k(x) \) 是标量函数。重心坐标是按照分位数点 \(\tau\) 的单调嵌入到单纯形的组件。论文还采用一个光滑的基底函数（如B样条）来表示 \( \mu_k(x) \)，使得模型在 \( x \) 上也是光滑的。
可观测数据：研究者有来自总体分布的随机样本：\( \{(X_i, Y_i)\}_{i=1}^n \)，独立同分布。此外，研究者指定了 \( K \) 个分位数水平 \( \tau_1, \dots, \tau_K \)（等间距或不等间距）。想要但观测不到的是：条件分位数函数 \( q_\tau(x) \) —— 这是个无限维对象，需要通过有限维参数模型逼近。关键在于：逼近年不同分位数曲线时必须不交叉，且要在模型可能错误指定（real \( q_\tau(x) \) 不一定属于这个参数族）的情况下仍然能得到有用的估计。

第二步：讲最小内核¶

最小内核例子：我们去掉了所有协变量（\( X \) 是单变量且 \( d=1 \)），只考虑两个分位数水平 \( \tau_L < \tau_H \)。

传统线性分位数回归设定：
\[q_{\tau_L}(x) = \beta_0^{(L)} + x \beta_1^{(L)}, \quad q_{\tau_H}(x) = \beta_0^{(H)} + x \beta_1^{(H)}\]
独立估计 \( \beta^{(L)} \) 和 \( \beta^{(H)} \) 通常导致两者相交（交叉）。
现在用SQR：假设我们用 \( K=2 \) 个点。那么最大化两个分位数的表示，需要构建重心坐标。最简单的情况：取两个分位数水平 \( \tau_1 = \tau_L, \tau_2 = \tau_H \)。那么重心坐标向量 \( \boldsymbol{\phi}(\tau) \) 是：
\[\phi_1(\tau) = \frac{\tau_H - \tau}{\tau_H - \tau_L}, \quad \phi_2(\tau) = \frac{\tau - \tau_L}{\tau_H - \tau_L}\]
这里显然 \( \phi_1(\tau), \phi_2(\tau) \ge 0 \) 且和为1。于是模型的表示变为：
\[q_\tau(x) = \mu_1(x) \phi_1(\tau) + \mu_2(x) \phi_2(\tau)\]
一个特别简单的选择：\( \mu_1(x) = a_1 + x b_1, \mu_2(x) = a_2 + x b_2 \)。展开后：
\[q_\tau(x) = (a_1 + x b_1)\phi_1(\tau) + (a_2 + x b_2)\phi_2(\tau)\]
重点来了：对于每个 \( x \)，在 \( \tau \) 从 \( \tau_L \) 到 \( \tau_H \) 变化时，\( q_\tau(x) \) 是 \( \mu_1(x) \) 到 \( \mu_2(x) \) 之间的线性插值（因为重心坐标在 \( \tau \) 上线性）。由于 \( \mu_1(x) \) 和 \( \mu_2(x) \) 都是固定的数（取决于 \( x \)），且 \( \phi_1(\tau) \) 和 \( \phi_2(\tau) \) 是 \( \tau \) 的连续单调递减/增函数，所以当 \( \mu_1(x) \le \mu_2(x) \) 时，这个线性插值就是 \( \tau \) 的单调递增函数（自然保证分位数不交叉）。如果反过来 \( \mu_1(x) > \mu_2(x) \)，则函数是递减的（交叉了）。因此为了避免交叉，SQR模型必须满足一个简单的质点排序条件：\( \mu_1(x) \le \mu_2(x) \)，即最下分位数（点1）对应的截距函数 \( \mu_1(x) \) 必须始终小于等于上一分位数的截距函数 \( \mu_2(x) \)。在最大化问题中，这一条件可以通过参数化线性不等式的约束（如 \( b_1 = b_2 \)? 其实只是）来保证。但本文证明了，如果我们将 \( \mu_k(x) \) 设计成适当的分布（如核平滑或B样条），这可以自然发生。

核心思路总结：SQR用重心坐标将分位数函数的生产方式变成在几个固定的“分位数点”函数之间的平滑插值，这使得单调性变成对 \( \mu_k(x) \) 之间的排序，而不是对 \( x \) 的约束。在协变量很多时，这个排序可以简化为对有限个函数的约束，比传统的非交叉约束简单。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：本文对模型误设下的非交叉分位数回归进行了系统研究，定义了在单纯形嵌入下的分位数回归模型（SQR），它天然满足非交叉性。
核心工具/方法：通过单纯形嵌入与重心坐标系重新参数化分位数函数族。引入最大有效区域（Maximum Effective Region, MER）概念，定义并刻画了在模型误设下允许外推而不发生分位数交叉的区域。使用交叉验证进行模型选择和模型平均。
主要结论：在模型误设下，SQR的伪真分位数回归参数存在且唯一；SQR估计量是渐近正态的；基于交叉验证的模型选择和模型平均具有渐近最优性；在大/小样本模拟和U.S.金融数据中，SQR方法优于传统独立估计和简单的约束估计。

关键设定与假设¶

数据：\( (X_i, Y_i) \) 是来自分布 \( P_0 \) 的独立同分布样本。
模型（SQR的表示形式）：
- 对 \( K \) 个离散分位数点 \( \tau_1 < ... < \tau_K \)（通常等间距，但理论允许任意），记 \( \boldsymbol{\tau} = (\tau_1, ..., \tau_K) \)。定义重心坐标为向量 \( \boldsymbol{\phi}(\tau; \boldsymbol{\tau}) \)，其元素为单调递增/递减的分段线性函数（或更一般的光滑严格单调函数，满足组合和=1）。作者采用特定的默认形式：\( \phi_1(\tau) = 1 - \frac{\tau - \tau_1}{\tau_K - \tau_1} \)，\( \phi_K(\tau) = ... \)，中间为线性插值。那么 \( q_\tau(x) = \phi^\top(\tau) \boldsymbol{\mu}(x) \)，其中 \( \boldsymbol{\mu}(x) = (\mu_1(x), ..., \mu_K(x))^\top \) 是需要估计的光滑函数。
- \( \mu_k(x) \) 通过基函数展开表达（如B样条）：\( \mu_k(x) = f_k(x)^\top \boldsymbol{\beta}_k \)。于是模型参数是 \( \boldsymbol{\beta} = (\boldsymbol{\beta}_1^\top, ..., \boldsymbol{\beta}_K^\top)^\top \)，而核参数是基函数的个数、分位数点 \( K \) 等。
假设：
- （A1）分位数函数 \( q_\tau(x) \) 在 \( \tau \in (0,1) \) 上关于 \( \tau \) 是严格单调递增的（事实定义）。SQR模型通过表示法，无条件满足此条件，无需额外假设。
- （A2）存在一个未指定的真实数据生成机制（不一定属于SQR类）。这就是模型误设。
- （A3）正则性条件：对 \( (\boldsymbol{\beta}, x) \)，\( \mu_k(x) \) 连续且可微，加上关于基函数、核函数、设计矩阵游走条件的常规假设（如 Lipschitz 条件， \( n^{-1}\sum_i \|X_i\|^2 \) 边界等）。这些在定理尾部逐步列出。
- （A4）最大有效区域（MER） 定义：\( \mathcal{R}_{\text{MER}} = \{x: \max_k \mu_k(x) \to ... \} \) 这是确保在某个点 \( x \) 外推时不发生交叉的区域的边界。其实质是：保证在x处所有 \( \mu_k(x) \) 关于 \( k \) 是严格单增的（即在SQR中，底层的 \( \mu_1(x) < \mu_2(x) < ... < \mu_K(x) \)）。超出MER则外推无定义。
相比已有文献的强化/放宽：相比于 Bondell et al. (2010) 等人，本文的模型设定更弱（不要求正确模型）；但相比于 Takeuchi et al. (2006) 等非参数方法，SQR引入了 \( K \) 个基函数，相当于对分位数曲线族施加了一个特殊参数结构。SQR的一个优势是对所有 \( X \)（不仅是支撑集内）都可能外推，只要 \( x \) 在MER内。

主要结果¶

定理1（伪真参数的存在性与唯一性）：在正则条件下，SQR的参数 \( \boldsymbol{\beta} \) 有唯一的伪真值 \( \boldsymbol{\beta}^* \)（全局最小化期望的分位数损失）。证明用到：损失函数关于 \( \boldsymbol{\beta} \) 是非二次的凸函数，但由于SQR的表示是充分参数化的，只要系数关于 \( k \) 的单调性成立（由此得到每个 \( \tau \) 的损失联合凸性），全局最小值存在且唯一。直觉：SQR的伪真参数 \( \boldsymbol{\beta}^* \) 使得拟合的分位数函数族 \( \{ \hat{q}_\tau(\cdot; \boldsymbol{\beta}^*) \}_{\tau \in (\tau_1, \tau_K)} \) 在Kullback-Leibler相对熵意义上（通过分位数损失）最为接近真实分位数族。
定理2（SQR估计量的渐近正态性）：在弱于常规的条件（包括MER条件）下，\( \sqrt{n}(\hat{\boldsymbol{\beta}} - \boldsymbol{\beta}^*) \to N(0, \Sigma) \)。这里关键的难点是：SQR的目标函数不是通常的M估计（它涉及通过 \( \tau \) 求和/积分，且重心坐标使影响函数复杂）。证明通过将估计量表示为经验过程的Z-估计量，并使用关于分位数损失影响函数的Donsker类理论。
定理3（交叉验证的渐近最优性）：当对不同基函数数或不同 \( K \) 进行模型选择时，用交叉验证（CV）选出的模型与最优理论模型（如用小样本损失最小的模型）之间有渐近为1的比率。证法：利用 Li (1987) 的框架，但将分位数损失与SQR的特殊结构（\( a \) 到 \( K \) 分位数同作为参数）耦合，证明CV的Bias-variance tradeoff在渐近上一致。

证明路线与技术技巧¶

整体路线（以定理1（伪真）与定理2（渐近正态）为例）： 1. 步骤1: 将SQR模型写为最优近似问题。定义 \( L(\boldsymbol{\beta}) = \mathbb{E}_{P_0} \left[ \sum_{k=1}^{K} \int_{\tau_{k-1}}^{\tau_k} \rho_\tau( Y - q_\tau(X; \boldsymbol{\beta}) ) d\tau \right] \)，其中 \( \rho_\tau \)是分位数损失函数。这是一个凸函数。证明其全局极小点存在且唯一可通过Fréchet derivative限制在 \( \boldsymbol{\beta} \) 被视为紧集的元素并显示严格凸性（通过与真实分位数函数的距离比较）。 2. 步骤2: 显示SQR估计的M-估计量性质。定义 \( \hat{L}_n(\boldsymbol{\beta}) = n^{-1} \sum_i \left[ \sum_{k} \int_{\tau_{k-1}}^{\tau_k} \rho_\tau(...) d\tau \right] \)。由于损失函数在 \( \boldsymbol{\beta} \) 上非光滑（但在τ的积分使之在 \( \boldsymbol{\beta} \) 上可微？），使用经验过程理论进行一致性证明。关键：在参数空间中统一逼近 \( L_n \) 与 \( L \)，要处理函数类的度量熵（通过在B样条表示下的线性参数结构，可以控制）。 3. 步骤3: 渐近正态性。使用标准的Z-估计量框架：\( \sqrt{n}(\hat{\boldsymbol{\beta}} - \boldsymbol{\beta}^*) \approx -[H(\boldsymbol{\beta}^*)]^{-1} \frac{1}{\sqrt{n}} \sum_i \psi(X_i, Y_i; \boldsymbol{\beta}^*) \)，其中 \( H \) 是期望Hessian（实际上是梯度的影响函数协方差）。需要计算影响函数并显示其是Donsker的。这里用到了对分位数函数的光滑近似：使用光滑的核（而不是原阶梯函数）近似损失函数，以论证影响函数是可线性化的。

关键跳跃点： - 外推区域（MER）的明确定义：如果 \( x \) 的 \( \mu_k(x) \) 不单调（即 \( \mu_1(x) > \mu_2(x) \) 等），则SQR在 \( x \) 处会发生交叉。作者通过定义一个容许区域来外推，这在一个假定的正确模型的线性插值下，保证了非交叉。这是理论分析的关键几何构件，原作者在Ando & Li (2014) 中已有基础。 - 交叉验证最优性：通过留下一个样本 \( (X_i, Y_i) \)，在它不在的样本中拟合，并预测。由于SQR的参数大小（基函数数）随着样本量增加，最优性的证明需要证明选择模型的CV离差是渐近等价的（用U-统计量的去一留一技巧）。

技术技巧点名： - 经验过程 / Donsker类理论：用于处理M-估计量的一致性与渐近正态性。 - 分位数损失的光滑核逼近：用于将非可微的影响函数替换为可微的，以便于泰勒展开。 - 去一留一 (leave-one-out) 技巧（在交叉验证理论中）：用于显示CV估计量的偏差可忽略。

真实例子与应用¶

论文有明显的真实数据例子：美国金融数据。具体来说，作者分析了从1987年10月（黑色星期一崩盘）到2020年2月（COVID-19大流行）期间五个时期（包括2008年金融危机、2010年闪崩等）的股市数据。目标是将SQR用于资产定价分析（调整市场风险后的收益率分位数族）。操作如下： - 数据：CRSP每日股票回报数据，使用Fama & French三个因子作为协变量（市场超额回报、规模因子SMB、价值因子HML）。 - 把方法用上去：用SQR模型估计不同协变量水平下收益率条件分位数（如 \( \tau = 0.05, 0.25, 0.50, 0.75, 0.95 \)）。估计出的系数在不同时期之间比较，由于SQR天然不允许交叉，使系数在不同分位数间横向对比成为可能（这是本文的主要卖点“head-to-head transparent comparisons”）。 - 得到的结果：在不同的市场状态下（如高波动期 vs 低波动期），因子载荷在尾部（\( \tau \) 接近0或1的变化）如何变化。例如，在金融危机期间，小盘股（SMB载荷）在左尾部（熊市）暴露比在右尾部大得多。作者展示，传统独立分位数回归由于存在交叉，无法进行这种清晰的比较。 - 这个例子想说明：在实证应用中，研究者希望在整个感兴趣的分位数区间上进行跨分位数的透明推断，交叉是致命的。SQR通过提供一组无交叉的曲线，使得这种“head-to-head”比较在统计上有效且解释力强。

🔎 结论是否比证明窄¶

论文的 claim：“Naturally immune to quantile crossing。” 在严格意义上，这是正确的——只要对 \( x \) 处的 \( \mu_k \) 排序（或者按照重心坐标的单调插值属性）。但是，当 \( x \) 超出“最大有效区域”（MER）时，排序失效，交叉仍可能出现。作者在论文中明确承认了这一点（外推区域定义）。不过，在多数标准应用中，我们不会对远超出数据支撑的区域做推断。
论文的 claim：“Asymptotic optimality of cross-validation”被证明是针对模型选择和模型平均的，但条件是：模型族嵌套且模型复杂度增长速率满足某些条件（通常相当宽松）。然而，作者并未证明SQR在所有模型选择准则中是最优的（比如AICc或BIC对于非嵌套族的性质未涉及）。
此外，定理假设\( K \)（分位数点数）固定，但实证中作者使用了 \( K = 5 \) 和 \( K = 19 \) 等不同值。在交叉验证最优性中，\( K \) 被当作模型选择的另一个超参数。虽然这大致正确，但若 \( K \to \infty \)，理论是否一致收敛到真实连续分位数曲线？作者未严格证明，但推测是可能的。

四、开放问题（点到为止，扎根具体语句）¶

模型选择最优性的普适性：交叉验证对SQR的模型（基函数数、\( K \) 值的选择）是渐近最优的，但这一点是否对所有的模型选择准则（如BIC、AICc、杠杆等）都成立？扎根点：定理3专门证明CV最优性，但未讨论信息准则。论文在“6. Discussion”中承认“本框架下BIC等其他准则的性质尚未研究。” (这是具体句子)。
非线性 / 维数灾难问题：当前SQR假设 \( \mu_k(x) \) 随 \( x \) 线性参数化（通过B样条）。当协变量进入高维（如 \( d=100 \)）时，基函数数激增，SQR的表示(带有 \( K \) 个分量的向量)是否仍然有效？扎根点：作者在固定维数设定下给出所有证明，在“未来工作”中提到“扩展到高维协变量空间...是一个有趣而重要的挑战。” 具体是哪句话需要读者去原文“Discussion”节确认。
非交叉与因果推断的接口：该文展示了SQR在金融领域的应用（资产定价），但能否被直接用于因果推断中的分位数处理效应（QTE）的估计？具体说，如果使用倾向性得分与分位数回归的IPW组合，SQR是否能确保加权后的处理组和控制组的分位数曲线没有交叉？这是因果推断（研究者的主要兴趣）本方向的下一个问题。扎根点：论文没有提到因果推断。研究者可自行判断缺口。
MER的样本内推断：MER在理论上是确定性的（基于总体参数），但实际中需要用一个估计 \( \hat{\mu}_k(x) \) 来近似。那么MER本身的估计和推断问题（置信带、假设检验）是什么？扎根点：论文提出了MER的概念和定义，但没有给出其估计的分布理论。

建议：想确认第2条是真gap还是已被害羞地处理，去读该子领域近期5篇论文的引言（特别是关于分位数回归与高维数据结合的最新AoS文章，检查它们是否提及SQR与lasso/SCAD的结合）。

Maintained by 陈星宇 · Homepage · Source on GitHub