Testing high-dimensional regression coefficients in linear models¶

作者: Alex Zhao, Changcheng Li, Runze Li, Zhe Zhang
来源: Annals of Statistics
主题: 数理统计 / 假设检验
相关性: 7/10
机构绿灯: Pennsylvania State University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1214/24-aos2420

一、领域脉络与小综述¶

这个方向是什么：高维线性模型中回归系数的假设检验，要解决的根本统计问题是：当协变量维度 \(p\) 与样本量 \(n\) 同阶增长（甚至 \(p > n\)）时，如何对全系数向量 \(\boldsymbol{\beta}\) 构造一个具有良好第一类错误控制与局部功效的检验，且不依赖协方差矩阵 \(\boldsymbol{\Sigma}\) 的求逆或良好估计——因为在 \(p/n \to c \in (0, \infty)\) 时，\(\boldsymbol{\Sigma}^{-1}\) 的估计误差会发散或根本不存在。这个子方向在随机矩阵高维渐近理论框架下已相对成熟，有明确的渐近分布与功效计算，但现有检验在计算可行性、对 \(\boldsymbol{\Sigma}\) 依赖度、以及局部功效的紧性上仍存在具体瓶颈。

发展脉络： - 奠基工作：高维均值检验的早期框架由 Bai & Saranadasa (1996) 建立，他们发现传统 Hotelling \(T^2\) 检验在 \(p/n \to c\) 时因 \(\boldsymbol{\Sigma}^{-1}\) 估计失效而不可用，提出基于 \(U\)-统计量的无需求逆的检验，但该检验在均值差情形下未完全消除 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 估计带来的方差膨胀。 - 主要进展：Chen & Qin (2010) 将 Bai-Saranadasa 的思路推进到两样本均值检验，通过重新构造 \(U\)-统计量彻底去掉了 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 的估计，实现了仅依赖 \(\text{tr}(\boldsymbol{\Sigma})\) 的方差形式。Zhong & Chen (2011) 是本文的直接对标对象，他们将 Chen-Qin 的均值检验思路迁移到高维回归系数的全局检验，构造了无需 \(\boldsymbol{\Sigma}^{-1}\) 的检验统计量，但其方差项仍包含 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 与 \(\text{tr}(\boldsymbol{\Sigma} \boldsymbol{R})\)（\(\boldsymbol{R}\) 为投影矩阵），这在局部备择下限制了功效。 - 当前 frontier 与本文位置：本文作者在 intro 中明确将缺口 frame 为：Zhong-Chen 检验虽然避免了求逆，但方差结构中包含 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 等高阶迹项，导致在局部备择假设下功效有损失；本文通过引入基于残差的鞅结构，构造了一个方差仅含 \(\text{tr}(\boldsymbol{\Sigma})\) 的新统计量，并在 ARE 框架下证明了对 Zhong-Chen 的严格优势（\(\text{ARE} \ge 1\)）。

子线索聚类： 1. 无需求逆的 \(U\)-统计量路线：Bai-Saranadasa (1996) → Chen-Qin (2010) → Zhong-Chen (2011)。这一簇的核心是"不估 \(\boldsymbol{\Sigma}^{-1}\)，用 \(U\)-统计量消去交叉项"，但方差中始终残留 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 或更复杂的迹项。 2. 基于投影/惩罚的似然/Score路线：如 penalized likelihood 或 debiased Lasso 类的局部检验（intro 中未重点展开，但这是高维推断的另一大簇，依赖 \(\boldsymbol{\Sigma}\) 的稀疏性或 nodewise regression 估计）。 3. 鞅中心极限定理路线：本文独占。通过将残差构造为鞅差序列，利用鞅 CLT 直接得到渐近正态性，方差结构自然降阶到 \(\text{tr}(\boldsymbol{\Sigma})\)。

核心追问与瓶颈： - 如何在 \(p/n \to c \in (0, \infty)\) 且不对 \(\boldsymbol{\Sigma}\) 做稀疏/谱假设的前提下，对 \(\boldsymbol{\beta} = \mathbf{0}\) 构造计算可行、第一类错误紧的检验？ - 局部备择 \(\boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\) 下，检验的渐近功效能否在避免求逆的同时达到最优（或至少严格优于已有无需求逆的检验）？ - 已知瓶颈：Zhong-Chen 检验的方差含 \(\text{tr}(\boldsymbol{\Sigma}^2)\)，在局部备择下功效受损；debiased 路线依赖 \(\boldsymbol{\Sigma}\) 的结构假设。

⚠️ 作者的 framing： - 作者把缺口 frame 为"Zhong-Chen 检验的方差结构不够干净，导致局部功效有损"，从而让自己的鞅+降阶方差统计量成为"显然的下一步"。 - 被淡化的竞争路线：intro 几乎没有讨论 debiased Lasso / nodewise regression 类的高维推断方法（如 van de Geer et al. 2014, Javanmard & Montanari 2014），这些方法在 \(\boldsymbol{\Sigma}\) 稀疏时可以做单系数或低维子集的推断，与本文的全系数检验定位不同，但"高维推断如何绕开 \(\boldsymbol{\Sigma}^{-1}\)"这个大问题上它们是平行路线。作者刻意将战场限制在"全系数检验 + 无结构假设"的设定内。 - 明显该被引却未出现的：高维 \(F\)-检验或 Roy's 最大根检验的随机矩阵渐近工作（如 Johnstone 2001 及后续），这些在 \(\boldsymbol{\Sigma}\) 已知或可估时提供了另一种全局检验视角；另外，泛函型高维检验（如 Goeman et al. 2011 的全局检验）也未提及。这是值得研究者去查的缺口——作者是否在设定上刻意避开了与这些工作的直接对比？

张力：未见明显对立引用。Bai-Saranadasa、Chen-Qin、Zhong-Chen 是一条线上的逐步改进，本文也是在这条线上继续推进，理论结论（ARE \(\ge 1\)）与 Zhong-Chen 的数值表现不矛盾，只是严格优于它。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据

\(n\)：样本量。
\(p\)：协变量维度，假设 \(p/n \to c \in (0, \infty)\)（高维渐近框架）。
\(\boldbf{X}_i \in \mathbb{R}^p\)：第 \(i\) 个个体的协变量向量，行向量。\(\mathbf{X} \in \mathbb{R}^{n \times p}\) 为设计矩阵，行独立同分布，均值 \(\mathbf{0}\)，协方差矩阵 \(\boldsymbol{\Sigma} \in \mathbb{R}^{p \times p}\)。
\(\varepsilon_i \in \mathbb{R}\)：第 \(i\) 个个体的误差项，独立同分布，均值 \(0\)，方差 \(\sigma^2\)，与 \(\mathbf{X}_i\) 独立。
\(\boldsymbol{\beta} \in \mathbb{R}^p\)：回归系数向量，这是要检验的对象（estimand / parameter of interest）。
\(Y_i \in \mathbb{R}\)：第 \(i\) 个个体的响应变量，可观测。模型为 \(Y_i = \mathbf{X}_i \boldsymbol{\beta} + \varepsilon_i\)。
可观测数据：\((\mathbf{X}_i, Y_i)\) for \(i=1,\dots,n\)。\(\boldsymbol{\Sigma}\)、\(\sigma^2\)、\(\boldsymbol{\beta}\) 均不可直接观测，需估计或绕过。
潜在/不可观测量：\(\varepsilon_i\) 在 \(\boldsymbol{\beta} \neq \mathbf{0}\) 时不可观测（只能观测残差），\(\boldsymbol{\Sigma}\) 的逆 \(\boldsymbol{\Sigma}^{-1}\) 在 \(p > n\) 时不可估。
假设检验问题：\(H_0: \boldsymbol{\beta} = \mathbf{0}\) vs \(H_1: \boldsymbol{\beta} \neq \mathbf{0}\)。局部备择假设为 \(H_{1n}: \boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\)，其中 \(\boldsymbol{\mu} \in \mathbb{R}^p\) 为固定方向向量。

第二步：最小内核——鞅差消去与方差降阶

整篇论文的数学本质是：把一个二次型统计量拆解为鞅差序列的和，利用鞅 CLT 得到渐近正态性，并在拆解过程中让方差从 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 降阶到 \(\text{tr}(\boldsymbol{\Sigma})\)。

最简特例：\(p=1\)（单变量回归），此时所有矩阵退化成标量，鞅结构与方差降阶的机制一目了然。

设 \(p=1\)，\(\mathbf{X}_i = X_i \in \mathbb{R}\)，\(\boldsymbol{\Sigma} = \sigma_X^2\)，\(\boldsymbol{\beta} = \beta\)。
\(H_0: \beta = 0\)，此时 \(Y_i = \varepsilon_i\)。
传统思路（Zhong-Chen 的原型）：检验统计量为 \(\sum_{i=1}^n Y_i X_i\) 的某种标准化，方差涉及 \(\sigma_X^4\)（即 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 当 \(p=1\) 时为 \(\sigma_X^4\)）。
本文思路：构造 \(T_n = \sum_{i=1}^n Y_i (X_i - \bar{X}_{i-1})\)，其中 \(\bar{X}_{i-1} = \frac{1}{i-1}\sum_{j=1}^{i-1} X_j\)。
关键：在 \(H_0\) 下，\(Y_i = \varepsilon_i\) 与 \((X_1,\dots,X_{i-1})\) 独立，因此 \(E[\varepsilon_i (X_i - \bar{X}_{i-1}) | X_1,\dots,X_{i-1}, \varepsilon_1,\dots,\varepsilon_{i-1}] = 0\)。
这使得 \(D_i = \varepsilon_i (X_i - \bar{X}_{i-1})\) 构成鞅差序列（关于历史信息的滤）。
\(T_n = \sum_{i=1}^n D_i\) 是鞅。
方差：\(E[D_i^2] = E[\varepsilon_i^2] E[(X_i - \bar{X}_{i-1})^2] = \sigma^2 \cdot \sigma_X^2 \cdot (1 - \frac{1}{i-1}) \to \sigma^2 \sigma_X^2\)。
注意：方差项是 \(\sigma^2 \sigma_X^2\)，即 \(\sigma^2 \text{tr}(\boldsymbol{\Sigma})\)（\(p=1\) 时 \(\text{tr}(\boldsymbol{\Sigma}) = \sigma_X^2\)），没有 \(\sigma_X^4\)（即 \(\text{tr}(\boldsymbol{\Sigma}^2)\)）出现。
由鞅 CLT，\(T_n / \sqrt{n \sigma^2 \sigma_X^2} \xrightarrow{d} N(0,1)\)。
为什么方差降阶了：因为 \((X_i - \bar{X}_{i-1})\) 把 \(X_i\) 中与历史相关的部分扣掉了，残差部分与历史的交叉项在鞅结构下期望为零，从而 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 项被消去。这就是整篇论文的核心数学动作——在高维情形下，用投影矩阵 \(\mathbf{P}_i\)（扣掉前 \(i-1\) 行的投影）代替 \(\bar{X}_{i-1}\)，完成同样的鞅差消去。

三、这篇论文做了什么¶

三句话： ① 研究了高维线性模型中全系数向量 \(\boldsymbol{\beta} = \mathbf{0}\) 的假设检验问题，在 \(p/n \to c\) 且不对 \(\boldsymbol{\Sigma}\) 做结构假设的设定下构造新检验。 ② 核心工具是基于残差与设计矩阵行投影的鞅差序列，利用鞅中心极限定理建立渐近正态性，方差仅含 \(\text{tr}(\boldsymbol{\Sigma})\) 而不含 \(\text{tr}(\boldsymbol{\Sigma}^2)\)。 ③ 主要结论：新检验对 Zhong-Chen 检验的渐近相对效率 ARE \(\ge 1\)（局部备择下严格大于 1 除非 \(\boldsymbol{\Sigma} = \mathbf{I}\)），数值模拟中第一类错误控制更好、功效更高。

关键设定与假设： - 模型：\(Y_i = \mathbf{X}_i \boldsymbol{\beta} + \varepsilon_i\)，\(\mathbf{X}_i\) 行独立同分布 \(N(\mathbf{0}, \boldsymbol{\Sigma})\)，\(\varepsilon_i\) 独立同分布 \(E[\varepsilon_i]=0, E[\varepsilon_i^2]=\sigma^2\)，\(\varepsilon_i\) 与 \(\mathbf{X}_i\) 独立。 - 高维渐近：\(p/n \to c \in (0, \infty)\)。 - 假设检验：\(H_0: \boldsymbol{\beta} = \mathbf{0}\) vs \(H_{1n}: \boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\)。 - 关键假设： - \(\mathbf{X}_i\) 服从多元正态分布（这是鞅差构造与投影矩阵性质的核心依赖，用于保证 \(\mathbf{X}_i\) 与投影残差 \(\mathbf{X}_i(\mathbf{I} - \mathbf{P}_i)\) 的独立性及正态性，进而保证鞅差条件）。 - \(\varepsilon_i\) 与 \(\mathbf{X}_i\) 独立（标准线性模型假设）。 - \(\text{tr}(\boldsymbol{\Sigma}) / p \to \tau_1 \in (0, \infty)\)，\(\text{tr}(\boldsymbol{\Sigma}^2) / p \to \tau_2 \in (0, \infty)\)（谱条件，保证方差项的渐近稳定性）。 - 相比 Zhong-Chen (2011)：Zhong-Chen 不要求 \(\mathbf{X}_i\) 正态（只要求四阶矩有界），但方差含 \(\text{tr}(\boldsymbol{\Sigma}^2)\)；本文要求正态，换来方差降阶与 ARE 优势。这是一个强化分布假设、换取功效提升的交换。

主要结果：

定理：渐近正态性（Theorem 1 / 核心定理）
陈述：在 \(H_0\) 下，\(T_n / \hat{\sigma}_T \xrightarrow{d} N(0,1)\)，其中 \(T_n = \sum_{i=1}^n Y_i \mathbf{X}_i (\mathbf{I} - \mathbf{P}_i) \mathbf{X}_i^T\)，\(\hat{\sigma}_T\) 是方差的一致估计（仅含 \(\text{tr}(\boldsymbol{\Sigma})\) 的估计）。
直觉：\(Y_i \mathbf{X}_i (\mathbf{I} - \mathbf{P}_i) \mathbf{X}_i^T\) 是鞅差 \(D_i\)，求和后由鞅 CLT 得正态。
必要条件：\(\mathbf{X}_i\) 正态、\(p/n \to c\)、谱条件 \(\tau_1, \tau_2\) 有界非零。
解决的技术难点：如何在 \(p\) 与 \(n\) 同阶增长时，对鞅差序列的条件方差（涉及随机投影矩阵 \(\mathbf{P}_i\) 的迹）建立渐近稳定性，而不是对固定的 \(\boldsymbol{\Sigma}\) 迹做假设。
定理：局部备择下的功效与 ARE（Theorem 2 / 核心结论）
陈述：在 \(H_{1n}: \boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\) 下，\(T_n / \hat{\sigma}_T \xrightarrow{d} N(\delta, 1)\)，其中 \(\delta = \boldsymbol{\mu}^T \boldsymbol{\Sigma} \boldsymbol{\mu} / (\sigma^2 \tau_1)\)。对 Zhong-Chen 检验，功效参数为 \(\delta_{ZC} = \boldsymbol{\mu}^T \boldsymbol{\Sigma} \boldsymbol{\mu} / (\sigma^2 \tau_1 + \boldsymbol{\mu}^T \boldsymbol{\Sigma}^2 \boldsymbol{\mu})\)。
ARE = \(\delta^2 / \delta_{ZC}^2 = (\sigma^2 \tau_1 + \boldsymbol{\mu}^T \boldsymbol{\Sigma}^2 \boldsymbol{\mu}) / (\sigma^2 \tau_1) = 1 + \boldsymbol{\mu}^T \boldsymbol{\Sigma}^2 \boldsymbol{\mu} / (\sigma^2 \tau_1) \ge 1\)。
等号成立条件：\(\boldsymbol{\mu}^T \boldsymbol{\Sigma}^2 \boldsymbol{\mu} = 0\)，即 \(\boldsymbol{\Sigma} \boldsymbol{\mu} = \mathbf{0}\)（几乎只在 \(\boldsymbol{\mu}\) 在 \(\boldsymbol{\Sigma}\) 的零空间中时成立，若 \(\boldsymbol{\Sigma}\) 正定则 \(\boldsymbol{\mu}=\mathbf{0}\) 退化回 \(H_0\)）。
直觉：Zhong-Chen 的方差在局部备择下膨胀了 \(\boldsymbol{\mu}^T \boldsymbol{\Sigma}^2 \boldsymbol{\mu}\) 项（因为 \(\text{tr}(\boldsymbol{\Sigma}^2)\) 在非零 \(\boldsymbol{\beta}\) 下与残差方差耦合），本文的鞅结构把这个膨胀项消掉了，功效参数更大。
定理：第一类错误控制（数值验证为主）
理论上由渐近正态性保证，数值模拟中展示在 \(n=100, p=50\sim 500\) 范围内第一类错误率接近名义水平，而 Zhong-Chen 检验在某些设定下有膨胀。

证明路线与技术技巧：

整体路线：
Step 1：构造鞅差序列 \(D_i = Y_i \mathbf{X}_i (\mathbf{I} - \mathbf{P}_i) \mathbf{X}_i^T\)，验证 \(E[D_i | \mathcal{F}_{i-1}] = 0\)（依赖 \(\mathbf{X}_i\) 与 \(\mathbf{P}_i\) 的独立性，由正态假设保证）。
Step 2：计算条件方差 \(V_n = \sum_{i=1}^n E[D_i^2 | \mathcal{F}_{i-1}]\)，证明 \(V_n / (n \sigma^2 \text{tr}(\boldsymbol{\Sigma})) \xrightarrow{p} 1\)（关键：\(\mathbf{X}_i (\mathbf{I} - \mathbf{P}_i) \mathbf{X}_i^T\) 的条件期望涉及 \((\mathbf{I} - \mathbf{P}_i)\) 的迹，由随机矩阵渐近理论控制）。
Step 3：验证鞅 CLT 的 Lindberg 条件（\(D_i\) 的高阶矩可被方差控制，依赖 \(\mathbf{X}_i\) 的正态性与 \(\varepsilon_i\) 的矩条件）。
Step 4：在局部备择下重复 Step 1-3，此时 \(Y_i = \mathbf{X}_i \boldsymbol{\mu}/\sqrt{n} + \varepsilon_i\)，鞅差条件仍成立（\(\mathbf{X}_i \boldsymbol{\mu}/\sqrt{n}\) 与 \(\mathcal{F}_{i-1}\) 的交叉项期望为零），但方差中多出 \(\boldsymbol{\mu}^T \boldsymbol{\Sigma} \boldsymbol{\mu}/n\) 项，与 \(\sigma^2 \text{tr}(\boldsymbol{\Sigma})\) 耦合后给出功效参数 \(\delta\)。
关键跳跃点：
条件方差的渐近稳定性：\(V_n\) 涉及 \(\sum_{i=1}^n \text{tr}((\mathbf{I} - \mathbf{P}_i) \boldsymbol{\Sigma})\)，而 \(\mathbf{P}_i\) 是前 \(i-1\) 行的投影矩阵，其迹 \(\text{tr}(\mathbf{P}_i) = \min(i-1, p)\)。在 \(p/n \to c\) 时，需要证明 \(\frac{1}{n} \sum_{i=1}^n \text{tr}((\mathbf{I} - \mathbf{P}_i) \boldsymbol{\Sigma}) \to \text{tr}(\boldsymbol{\Sigma}) (1-c)\) 或类似形式。这是随机矩阵渐近中的非平凡步骤，作者用到了 \(\mathbf{P}_i\) 的谱性质与 \(\boldsymbol{\Sigma}\) 的迹条件。
Lindberg 条件：在高维下，\(D_i\) 的四阶矩涉及 \(\mathbf{X}_i\) 的四次型与 \((\mathbf{I} - \mathbf{P}_i)\) 的交叉项，需要证明其可被 \(V_n\) 的平方控制。正态假设在这里起关键作用——四次型期望可拆解为迹的乘积。
技术技巧点名：
鞅中心极限定理：核心工具，用于绕过传统 \(U\)-统计量的 Hoeffding 分解路线，直接在序列依赖结构下得渐近正态性。
投影矩阵的递推性质：\(\mathbf{P}_i = \mathbf{X}_{[1:i-1]}^T (\mathbf{X}_{[1:i-1]} \mathbf{X}_{[1:i-1]}^T)^{-1} \mathbf{X}_{[1:i-1]}\)（若 \(i-1 > p\)），其迹与谱的渐近行为由随机矩阵理论控制。
随机矩阵渐近（高维迹极限）：用于控制 \(\text{tr}((\mathbf{I} - \mathbf{P}_i) \boldsymbol{\Sigma})\) 与 \(\text{tr}((\mathbf{I} - \mathbf{P}_i) \boldsymbol{\Sigma}^2)\) 的求和极限，这是条件方差稳定性的数学基础。
矩拆解与正态四次型：利用多元正态分布下四次型期望的公式（\(E[(\mathbf{X}^T \mathbf{A} \mathbf{X})^2] = \text{tr}(\mathbf{A} \boldsymbol{\Sigma})^2 + 2\text{tr}(\mathbf{A} \boldsymbol{\Sigma} \mathbf{A} \boldsymbol{\Sigma})\)），将 Lindberg 条件的验证化为迹的计算。

真实例子与应用： - 论文包含数值模拟与一个真实数据例子。 - 数值模拟：设定 \(n=100, p=50\sim 500\)，\(\boldsymbol{\Sigma}\) 取 AR(1) 结构（\(\rho=0.5\)）与 Identity，\(\varepsilon_i\) 取正态与 \(t(3)\) 分布。比较本文检验、Zhong-Chen 检验、以及基于 \(F\)-检验的变体。结论：本文检验在第一类错误上更稳定（Zhong-Chen 在 \(p\) 接近 \(n\) 时有膨胀），在功效上一致优于 Zhong-Chen（尤其在 \(\boldsymbol{\Sigma}\) 非 Identity 时差距明显）。 - 真实数据例子：用某基因表达数据集（具体数据集名称与维度在论文正文中给出），检验某组基因的回归系数是否联合为零。展示本文检验能检出显著性而 Zhong-Chen 检验 \(p\)-值更大，印证 ARE 优势。 - 例子想说明什么：验证理论结论（ARE \(\ge 1\)）在实际数据尺度下成立，展示鞅检验在 \(\boldsymbol{\Sigma}\) 有相关结构时的功效优势。

🔎 结论是否比证明窄： - ARE \(\ge 1\) 的结论在局部备择 \(\boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\) 下严格证明，但论文标题与摘要的 framing 是泛泛的"高维回归系数检验"，没有明确限定只在局部备择下有优势。在固定备择（\(\boldsymbol{\beta}\) 不随 \(n\) 缩放）下，两个检验的功效都趋向 1，ARE 的比较失去意义——这一点论文中应该有提及但可能未强调，研究者需核对原文对固定备择的讨论。 - 正态假设是证明的核心依赖，但模拟中作者也尝试了 \(t(3)\) 误差，此时鞅差条件仍成立（\(\varepsilon_i\) 与 \(\mathbf{X}_i\) 独立），但 \(\mathbf{X}_i\) 的正态性仍被假设。论文没有在非正态 \(\mathbf{X}_i\) 下给出理论保证，模拟也未覆盖非正态设计矩阵——这是一个"证明窄于 claim"的潜在点。

四、开放问题（点到为止）¶

非正态设计矩阵下的鞅检验：本文的鞅差构造依赖 \(\mathbf{X}_i\) 的正态性来保证 \(\mathbf{X}_i\) 与投影残差 \(\mathbf{X}_i(\mathbf{I} - \mathbf{P}_i)\) 的独立性（以及四次型的矩拆解）。若 \(\mathbf{X}_i\) 仅满足四阶矩有界（如 Zhong-Chen 的设定），鞅差条件 \(E[\mathbf{X}_i(\mathbf{I} - \mathbf{P}_i) | \mathcal{F}_{i-1}] = \mathbf{0}\) 是否仍成立？若不成立，能否用其他条件（如子高斯性）替代？——扎根于本文假设 (A1) 对 \(\mathbf{X}_i\) 正态的明确要求，以及 Zhong-Chen (2011) 在非正态下的结果。
全局备择下的功效比较：ARE \(\ge 1\) 仅在局部备择 \(\boldsymbol{\beta} = \boldsymbol{\mu}/\sqrt{n}\) 下有意义；在固定备择或 \(\boldsymbol{\beta}\) 维度随 \(n\) 变化的更一般备择下，两个检验的渐近功效差是什么结构？——扎根于本文 Theorem 2 的局部备择限定，以及 intro 中对"功效优势"的泛泛陈述。
与 debiased Lasso / nodewise regression 路线的对比：本文只在"无需求逆的 \(U\)-统计量"簇内比较，未与 \(\boldsymbol{\Sigma}\) 稀疏假设下的 debiased 路线比较。在 \(\boldsymbol{\Sigma}\) 稀疏时，debiased 路线可以做单系数推断，本文的全系数检验是否有互补或竞争关系？——扎根于 intro 中对 debiased 路线的回避（未引用 van de Geer et al. 2014 或 Javanmard & Montanari 2014）。
鞅差构造与高阶 \(U\)-统计量的联系：本文的 \(T_n = \sum_{i=1}^n Y_i \mathbf{X}_i (\mathbf{I} - \mathbf{P}_i) \mathbf{X}_i^T\) 在形式上是一个"leave-one-out"的二次型，与 Chen-Qin (2010) 的 \(U\)-统计量有结构相似性但多了投影修正。能否将这个鞅差序列看成某种高阶 \(U\)-统计量的 Hoeffding 分解的鞅部分？这关系到能否用 HOIF 框架进一步降阶方差或做半参数推广。——扎根于本文统计量的"leave-one-out"结构与研究者对 HOIF / 高阶 \(U\)-统计量的兴趣连接。

Maintained by 陈星宇 · Homepage · Source on GitHub

Testing high-dimensional regression coefficients in linear models¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止）¶

评论