An approximate randomization test for the high-dimensional two-sample Behrens–Fisher problem under arbitrary covariances¶

作者: Rui Wang, Wangli Xu
来源: Biometrika
主题: 数理统计 / 假设检验
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么 高维两样本 Behrens–Fisher 问题要解决的根本统计问题是：在数据维数 \(p\) 远大于或与样本量 \(n\) 同阶（\(p \to \infty, n \to \infty\)）时，如何检验两组独立观测的均值向量是否相等（\(H_0: \mu_1 = \mu_2\)），且不假定两组协方差矩阵相等（\(\Sigma_1 \neq \Sigma_2\)）。经典低维情形下的 Hotelling \(T^2\) 检验因需要求逆样本协方差矩阵，在 \(p > n\) 时完全失效；而高维修正版本的核心困难在于：检验统计量（通常是某种二次型）的渐近分布极度依赖协方差矩阵的谱结构（特征值的分布与散布），若谱结构未知或极端（如存在强因子导致少数特征值极大），基于正态或 \(\chi^2\) 近似的临界值计算会严重偏离，导致第一类错误失控。该方向当前已积累大量渐近理论结果，但在"不施加任何谱条件且样本不平衡"下如何构造自适应所有可能渐近分布的检验程序，一直是一个开放瓶颈。

发展脉络 - 奠基工作：Bai & Saranadasa (1996) 首次提出高维两样本均值检验的 \(L^2\) 范数统计量，但要求 \(\Sigma_1 = \Sigma_2\) 且对谱结构有严格条件。Srivastava & Du (2008) 放宽了等协方差假设，但仍依赖谱条件以保证渐近正态性。Chen & Qin (2010) 是本方向的里程碑，作者在文中明确指出："If the condition (2) is violated, the test procedures of Bai & Saranadasa (1996) and Chen & Qin (2010) may have incorrect test level"，这里的 condition (2) 即是对协方差谱结构的限制（如 \(\text{tr}(\Sigma^4)/\text{tr}(\Sigma^2)^2 \to 0\)），这为后续工作留下了明确的口子。 - 主要进展（放宽谱条件）：为绕开谱条件，路线开始分化。Zhang et al. (2020) 与 Zhang et al. (2021) 采用 Welch–Satterthwaite \(\chi^2\) 近似，作者指出其"requires strong regularity conditions on the underlying covariance matrices to guarantee that their test statistics are asymptotically normally distributed"，并在谱极端时用 \(\chi^2\) 混合分布替代正态。Chang et al. (2017) 与 Xue & Yao (2020) 转向极值型统计量与 Bootstrap/随机化，作者点明其"based on recent results about high-dimensional bootstrap methods developed by Chernozhukov et al. (2013) and Chernozhukov et al. (2017)"，但这类方法主要针对最大值统计量，对 \(L^2\) 范数统计量不适用。 - 当前 frontier（非同分布与谱自适应）：Wang & Xu (2019) 首次在高维设定下研究随机化检验，作者指出其"can only be applied to identically distributed observations"，即组内观测必须同分布，且未完全刻画所有可能的渐近分布形态。Xu et al. (2019) 与 Dobler & Peccati (2017) 尝试用 Stein 方法与 de Jong 定理处理二次型渐近分布，但作者明确指出："the results in Mossel et al. (2010); Nourdin et al. (2010) can not be readily applied to \(T_{CQ}(Y_1, Y_2)\) while the result in Xu et al. (2019) can only be applied to identically distributed observations"。 - 本文的位置：本文填补了上述所有口子的交汇处——在"组内非同分布 + 无谱条件 + 不平衡样本量"的最一般设定下，基于 Chen & Qin (2010) 统计量构造近似随机化检验，并完整刻画了统计量的所有可能渐近分布（而非只看正态或单一 \(\chi^2\) 混合），证明随机化程序能自适应这些分布。

子线索聚类 1. \(L^2\) 范数统计量 + 分布近似：Bai & Saranadasa (1996) → Chen & Qin (2010) → Zhang et al. (2020, 2021)。核心是构造去偏的二次型统计量，难点在于其渐近分布可能是正态、也可能是 \(\chi^2\) 混合，取决于谱结构。这一簇依赖谱条件来"选择"近似方式。 2. 极值型统计量 + Bootstrap：Chang et al. (2017) → Xue & Yao (2020) → Chernozhukov et al. (2013, 2017)。针对稀疏信号（sparse alternatives），用最大值统计量，通过高维 Bootstrap/Gaussian multiplier 决定临界值，绕开谱条件，但只对极值型有效。 3. 二次型渐近分布的纯数学刻画：de Jong (1987) → Dobler & Peccati (2017) → Xu et al. (2019)。用 Stein 方法、U 统计量展开、Wiener chaos 理论严格证明二次型的 CLT 与非 CLT，但通常要求同分布或特定退化结构，难以直接套用两样本非同分布情形。 4. 随机化/置换检验：Chung & Romano (2013) → Hemerik & Goeman (2014) → Wang & Xu (2019)。在低维下已有渐近相合理论，高维下仅有 Wang & Xu (2019) 尝试，但受限于同分布假设。

这个方向在追问的核心问题 1. 谱依赖性如何彻底消除：能否构造一个检验，其第一类错误在 \(\Sigma_1, \Sigma_2\) 的特征值任意散布（如少数特征值极大、因子结构）下仍渐近等于名义水平 \(\alpha\)？ 2. 渐近分布的形态完备性：二次型统计量在无谱条件下，渐近分布是否只有正态和 \(\chi^2\) 混合两种？是否存在更复杂的混合形态？如何统一刻画？ 3. 非同分布与不平衡样本的兼容：组内观测异质（如不同时间点、不同子群体）且 \(n_1 \neq n_2\) 时，检验统计量的中心化与方差估计如何构造，才能避免偏倚？ 4. 随机化的自适应能力：随机化统计量能否在不知道真实渐近分布形态（正态 vs. \(\chi^2\) 混合 vs. 其他）的前提下，自动"追踪"原统计量的分布，从而保证水平控制？

⚠️ 作者的 framing - 作者的 framing：作者将缺口 frame 为"现有方法要么依赖谱条件（条件 (2)），要么只适用于同分布观测，要么只处理极值型统计量"，从而让"在无谱条件、非同分布、不平衡样本下，为 \(L^2\) 范数统计量构造自适应随机化检验"成为显然的下一步。 - 淡化的竞争路线：作者未深入讨论基于特征值/谱估计的校正方法（如 Kong & Valiant (2017) 估计谱后直接构造临界值），只在引用中提了一句"estimation of the eigenvalues of high-dimensional covariance matrices may be a highly nontrivial task"便搁置。这条路线如果谱估计足够好，可能比随机化更直接，但作者未对比其可行性。 - 缺失的引用：Intro 中未出现基于随机矩阵理论（RMT）的精确渐近分布刻画（如 Bai-Silverstein 定律下的线性谱统计量），也未提及高维 M-estimation 的稳健检验（如 score test 的高维修正）。这些是潜在应被引但缺席的工作，值得研究者去查。

张力未见明显对立引用。各路线更多是"互补"而非"矛盾"：\(L^2\) 范数路线对 dense alternatives 好，极值路线对 sparse alternatives 好；分布近似路线依赖谱条件，随机化路线试图绕开。真正的张力在于：随机化路线是否在所有谱结构下都优于分布近似路线？ 作者的理论与模拟倾向于"是"，但这需要更多实证验证（特别是谱极端且 \(n_1, n_2\) 极不平衡时）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据 - 参数 / estimand：\(\mu_1, \mu_2\)（两组的 \(p\) 维均值向量）；\(\Sigma_1, \Sigma_2\)（两组的 \(p \times p\) 协方差矩阵）。检验问题 \(H_0: \mu_1 = \mu_2\) vs. \(H_1: \mu_1 \neq \mu_2\)。 - 随机变量 / 样本：\(X_{i,k}\)（第 \(k\) 组的第 \(i\) 个观测，\(k=1,2\)；\(i=1,\dots,n_k\)）。\(Y_{i,k} = X_{i,k} - \mu_k\)（中心化后的观测）。 - 维数 / 样本量：\(p\)（维数，\(p \to \infty\)）；\(n_1, n_2\)（两组样本量，\(n_1, n_2 \to \infty\)，允许 \(n_1 \neq n_2\)）；\(N = n_1 + n_2\)。 - 潜在量：\(\mu_1, \mu_2\) 不可直接观测，需通过样本均值估计；\(\Sigma_1, \Sigma_2\) 不可观测，其谱结构（特征值 \(\lambda_{1,j}, \lambda_{2,j}\)）完全未知。 - 模型：一般多元模型（General multivariate model, 公式 (4)）：\(X_{i,k} = \mu_k + \Gamma_k Z_{i,k}\)，其中 \(\Gamma_k\) 为 \(p \times m_k\) 矩阵（\(\Sigma_k = \Gamma_k \Gamma_k^\top\)），\(Z_{i,k}\) 为 \(m_k\) 维随机向量，组内观测不要求同分布（\(Z_{i,k}\) 可有不同的分布，只要 \(E[Z_{i,k}] = 0, \text{Cov}(Z_{i,k}) = I_{m_k}\)），且组间独立。 - 可观测数据：研究者实际观测到的是 \(\{X_{i,1}\}_{i=1}^{n_1}\) 和 \(\{X_{i,2}\}_{i=1}^{n_2}\)，两组独立，维数 \(p\) 可远大于 \(n_1, n_2\)。不可观测的是 \(\mu_k, \Gamma_k, Z_{i,k}\)，只能靠假设去识别。

第二步：最小内核 整篇论文的证明与方法本质上是以下最简特例的推广：\(p=1\)（一维）、两组观测同分布、平衡样本量 \(n_1 = n_2 = n\)。

在这个特例下： - 模型退化为一维：\(X_{i,1} \sim (\mu_1, \sigma_1^2)\)，\(X_{i,2} \sim (\mu_2, \sigma_2^2)\)，\(H_0: \mu_1 = \mu_2\)。 - Chen & Qin (2010) 统计量 \(T_{CQ}\) 退化为：

\[T_{CQ} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\hat{\sigma}_1^2/n + \hat{\sigma}_2^2/n}}\]

其中 \(\hat{\sigma}_k^2\) 是去偏的样本方差（leave-one-out 估计）。 - 核心数学困难：在 \(H_0\) 下，\(T_{CQ}\) 的渐近分布不一定是正态。它取决于 \(\sigma_1^2\) 与 \(\sigma_2^2\) 的相对大小： - 若 \(\sigma_1^2 = \sigma_2^2\)，\(T_{CQ} \to N(0,1)\)（经典 Behrens–Fisher 退化）。 - 若 \(\sigma_1^2 \neq \sigma_2^2\) 且差距显著，\(T_{CQ}\) 的渐近分布是正态与 \(\chi^2\) 混合的加权和（因为去偏方差估计引入了二次型，其渐近展开中四阶矩项不消失）。 - 本文的关键想法：构造一个近似随机化统计量 \(T_{CQ}^*\)： 1. 将两组样本合并为 \(\{X_i\}_{i=1}^{2n}\)。 2. 随机打乱标签（permutation），分成伪组 \(G_1^*, G_2^*\)。 3. 在伪组上计算 \(T_{CQ}^*\)。 4. 重复 \(B\) 次，用 \(T_{CQ}^*\) 的经验分布决定 \(T_{CQ}\) 的临界值。 - 为什么成立：在一维特例中，\(T_{CQ}^*\) 的渐近分布自动追踪 \(T_{CQ}\) 的分布——无论 \(\sigma_1^2/\sigma_2^2\) 是什么比例，\(T_{CQ}^*\) 的渐近分布与 \(T_{CQ}\) 在 \(H_0\) 下的渐近分布相同（因为随机化破坏了组间均值差，但保留了协方差结构的影响）。证明的关键跳跃点是：随机化统计量的渐近展开与原统计量的渐近展开，在 \(H_0\) 下有相同的混合系数（\(\kappa_i\) 项），从而分布形态一致。

一般情形（\(p \to \infty\), 非同分布, \(n_1 \neq n_2\)）只是这个一维想法的"加壳"：维数升高使得混合系数 \(\kappa_i\) 变为谱结构的泛函（\(\kappa_i = \text{tr}(\Sigma_1^i + \Sigma_2^i) / \text{tr}(\Sigma_1^2 + \Sigma_2^2)^{i/2}\)），非同分布使得中心化与方差估计更复杂，不平衡样本量使得随机化权重需调整。但核心机制仍是：随机化统计量自适应原统计量的混合分布形态。

三、这篇论文做了什么¶

三句话 ①研究了高维两样本 Behrens–Fisher 问题在组内非同分布、无谱条件、不平衡样本量下的检验程序构造与渐近理论。②核心工具是基于 Chen & Qin (2010) 统计量的近似随机化检验，结合广义 Lindeberg 原理与随机化耦合技术。③主要结论是：在一般条件下，原统计量与随机化统计量的所有可能渐近分布被完整刻画（正态、\(\chi^2\) 混合、或更复杂的加权和），且随机化检验能自适应这些分布，始终具有正确的渐近水平与良好的局部功效。

关键设定与假设 在第二节最小记号基础上补全： - 一般多元模型 (4)：\(X_{i,k} = \mu_k + \Gamma_k Z_{i,k}\)，\(Z_{i,k}\) 独立（组间），组内可非同分布，\(E[Z_{i,k}] = 0, \text{Cov}(Z_{i,k}) = I_{m_k}\)，且 \(E[Z_{i,k,j}^4] \leq M\)（四阶矩有界）。相比 Chen & Qin (2010) 放宽了组内同分布假设；相比 Wang & Xu (2019) 放宽了同分布与谱条件。 - 维数与样本量关系：\(p/(n_k \text{tr}(\Sigma_k^2)) \to 0\)（保证方差估计可估），\(n_1/n_2 \to \kappa \in (0, \infty)\)（允许不平衡但不极端）。相比 Zhang et al. (2021) 的谱条件（如 \(\text{tr}(\Sigma^4)/\text{tr}(\Sigma^2)^2 \to 0\)），本文完全不施加谱条件。 - 混合系数定义：\(\kappa_i = \frac{\text{tr}(\tilde{\Sigma}_1^i) + \text{tr}(\tilde{\Sigma}_2^i)}{(\text{tr}(\tilde{\Sigma}_1^2) + \text{tr}(\tilde{\Sigma}_2^2))^{i/2}}\)，其中 \(\tilde{\Sigma}_k = \Sigma_k / n_k\)。这是渐近分布形态的关键参数：\(\kappa_2 = 0\) 时退化为正态，\(\kappa_2 > 0\) 时为 \(\chi^2\) 混合。 - 近似随机化程序：合并两组样本，随机置换标签 \(B\) 次，每次计算伪组统计量 \(T_{CQ}^*\)，用其经验分布的 \(\alpha\) 分位数作为临界值。与经典置换检验的区别是：不要求两组在 \(H_0\) 下同分布（只要求均值相等），因此是"近似"而非"精确"随机化。

主要结果 1. 定理 1（原统计量的渐近分布刻画）：在 \(H_0\) 与一般条件下，\(T_{CQ}\) 的渐近分布是以下形态之一： - 若 \(\sum_{i=3}^\infty \kappa_i^2 = 0\)（谱极度集中，如 \(\Sigma_k\) 只有少数非零特征值），\(T_{CQ} \to N(0,1)\)。 - 若 \(\sum_{i=3}^\infty \kappa_i^2 > 0\)，\(T_{CQ}\) 的渐近分布是正态与 \(\chi^2\) 混合的加权和：\(2^{-1/2} \kappa_1 \xi_1^2 + \zeta\)，其中 \(\xi_1 \sim N(0,1)\)，\(\zeta\) 是独立于 \(\xi_1\) 的正态与高阶 \(\chi^2\) 混合。 - 直觉：二次型统计量的展开中，四阶矩项（\(\kappa_2\)）决定是否偏离正态；更高阶矩项（\(\kappa_i, i \geq 3\)）决定混合的复杂度。无谱条件意味着 \(\kappa_i\) 可以任意，因此分布形态是连续谱而非离散分类。 - 必要条件：\(p \to \infty, n_k \to \infty, p/(n_k \text{tr}(\Sigma_k^2)) \to 0\)，四阶矩有界。 - 解决的技术难点：在非同分布下，二次型的渐近展开需要处理组内异质性与组间异质性的交互，传统 Martingale CLT 或 Stein 方法难以直接套用。

定理 2（随机化统计量的渐近分布追踪）：在 \(H_0\) 下，\(T_{CQ}^*\) 的渐近分布与 \(T_{CQ}\) 的渐近分布相同（在分布意义上收敛到同一极限）。这意味着随机化程序自适应了所有可能的渐近分布形态，无需知道 \(\kappa_i\) 的具体值。
直觉：随机化破坏了组间均值差，但保留了协方差结构的影响（因为合并样本的协方差是 \(\tilde{\Sigma}_1 + \tilde{\Sigma}_2\) 的混合，随机化后的伪组协方差仍追踪这个混合结构）。
解决的技术难点：随机化统计量的展开中，需要证明随机化引入的噪声与原统计量的高阶矩项在渐近意义上抵消，使得混合系数 \(\kappa_i\) 在随机化下不变。
定理 3（渐近水平与局部功效）：近似随机化检验的渐近水平为 \(\alpha\)（在 \(H_0\) 下，\(P(T_{CQ} > c_\alpha^*) \to \alpha\)，\(c_\alpha^*\) 是随机化临界值）。在局部替代 \(H_1: \mu_1 - \mu_2 = \delta / \sqrt{\text{tr}(\tilde{\Sigma}_1^2 + \tilde{\Sigma}_2^2)}\) 下，功效趋于 \(P(T_{CQ}^{H_1} > c_\alpha^{H_0})\)，其中 \(c_\alpha^{H_0}\) 是 \(H_0\) 下随机化临界值，\(T_{CQ}^{H_1}\) 是 \(H_1\) 下原统计量（分布发生漂移）。
直觉：随机化临界值追踪了 \(H_0\) 下的分布形态，而 \(H_1\) 下统计量发生均值漂移，因此功效由漂移量与分布形态共同决定。
解决的技术难点：在局部替代下，随机化统计量的分布仍追踪 \(H_0\) 分布（因为随机化抹平了均值差），但原统计量的分布漂移，需要证明两者在不同分布形态下的功效计算仍有效。

证明路线与技术技巧 - 整体路线： 1. 展开 \(T_{CQ}\)：将 Chen & Qin 统计量分解为中心化二次型 + 交叉项 + 偏倚修正项，在非同分布下写出其 Hoeffding 分解。 2. 刻画渐近分布：用广义 Lindeberg 原理（Chatterjee, 2005），将二次型中的 \(Z_{i,k}\) 逐步替换为高斯变量，证明分布形态由 \(\kappa_i\) 决定；处理非同分布时，需对每组分别替换再合并。 3. 展开 \(T_{CQ}^*\)：对随机化统计量做类似分解，但标签是随机的；写出随机化下的条件期望与方差，证明其混合系数与原统计量相同。 4. 耦合 \(T_{CQ}\) 与 \(T_{CQ}^*\)：用随机化耦合技术（Chung & Romano, 2013 的思路），证明两者在 \(H_0\) 下渐近等价（分布收敛到同一极限）。 5. 计算局部功效：在局部替代下，\(T_{CQ}\) 发生均值漂移，\(T_{CQ}^*\) 仍追踪 \(H_0\) 分布；用漂移-分布形态联合计算功效。

关键跳跃点：
引理 2（非同分布下的广义 Lindeberg 替换）：这是最吃功夫的引理。难点在于：组内观测非同分布时，二次型中的 \(Z_{i,k}\) 有不同的分布，传统 Lindeberg 只能逐个替换，但这里需要同时替换整组且保证混合系数不变。作者通过构造条件高斯近似（给定其他组的 \(Z\)，替换当前组），并利用四阶矩有界条件控制替换误差。
引理 4（随机化统计量的混合系数追踪）：难点在于：随机化后，伪组的协方差结构是 \(\tilde{\Sigma}_1 + \tilde{\Sigma}_2\) 的随机混合，其特征值与原组不同；需要证明这种随机混合不影响 \(\kappa_i\) 的渐近值。作者通过计算随机化下二次型的条件矩，证明 \(\kappa_i\) 在随机化下不变（因为 \(\text{tr}(\tilde{\Sigma}_1^i + \tilde{\Sigma}_2^i)\) 在随机化下是常数）。
技术技巧点名：
广义 Lindeberg 原理（Chatterjee, 2005）：用于将非高斯 \(Z_{i,k}\) 替换为高斯，刻画二次型的渐近分布形态。起作用：绕开 Stein 方法对同分布的要求，允许组内异质。
Hoeffding 分解 / U 统计量展开：将 \(T_{CQ}\) 分解为线性项 + 二次退化项 + 高阶项，分离出 \(\kappa_i\) 决定的混合成分。起作用：在非同分布下精确计算二次型的渐近方差与高阶矩。
随机化耦合（Chung & Romano, 2013）：构造 \(T_{CQ}\) 与 \(T_{CQ}^*\) 的联合分布，证明两者在 \(H_0\) 下渐近等价。起作用：保证随机化临界值追踪原统计量分布。
测度论支撑（Cohn, 2013）：在证明分布形态的完备性时，需要用到支撑集的性质（如 \(\zeta\) 的支撑集包含点 \(c\)，则 \(P(\zeta \in (c-\delta, c+\delta)) > 0\)），用于证明混合分布的连续性。起作用：保证 \(\kappa_i\) 的所有可能取值都有对应的分布形态，没有"空洞"。

真实例子与应用 - 数值实验：论文包含大量模拟实验（无真实数据例子），对比本文随机化检验与以下替代方法： - Chen & Qin (2010) 的正态近似检验。 - Zhang et al. (2020, 2021) 的 \(\chi^2\) 近似检验。 - Chang et al. (2017) 的极值型 Bootstrap 检验。 - Xue & Yao (2020) 的分布无关检验。 - 场景设计： - 协方差结构：独立（谱集中）、因子模型（少数大特征值，谱极端）、AR(1)（谱中等散布）。 - 样本量：平衡 (\(n_1 = n_2\)) 与不平衡 (\(n_1 \ll n_2\))。 - 分布：正态、非正态（重尾、偏态）。 - 替代：dense（所有坐标微小偏移）与 sparse（少数坐标大偏移）。 - 结果： - 水平控制：在谱极端（因子模型）与不平衡样本下，Chen & Qin (2010) 与 Zhang et al. (2020, 2021) 的水平严重偏离（远大于 \(\alpha\)），本文随机化检验的水平始终接近 \(\alpha\)。 - 功效：在 dense 替代下，本文功效与 Chen & Qin 相当（因为统计量相同，只是临界值不同）；在 sparse 替代下，本文功效低于极值型检验（这是 \(L^2\) 范数统计量的固有劣势，非随机化的问题）。 - 这个例子想说明什么：验证理论预测——随机化检验在谱极端与不平衡下仍控制水平，而基于分布近似的方法失控；同时展示 \(L^2\) 范数统计量对 dense 替代的优势与对 sparse 替代的劣势。

🔎 结论是否比证明窄 - 定理 1 的陈述是"所有可能渐近分布"，但证明中实际只处理了 \(\sum_{i=3}^\infty \kappa_i^2 = 0\)（正态）与 \(\sum_{i=3}^\infty \kappa_i^2 > 0\)（混合）两种情况，未给出混合分布的具体形态分类（如 \(\kappa_3\) 主导 vs. \(\kappa_4\) 主导的区别）。作者在结论中泛泛 claim "all possible asymptotic distributions"，但证明只保证分布收敛到某个由 \(\kappa_i\) 决定的极限，未显式构造这个极限的闭式表达。 - 定理 3 的局部功效只计算了 dense 替代（\(\delta\) 是 \(p\) 维向量，所有坐标同阶偏移），未计算 sparse 替代（少数坐标大偏移）。作者在结论中 claim "good power behaviour"，但证明只覆盖 dense 情形，sparse 情形是模拟验证的，无理论保证。

四、开放问题（点到为止，扎根具体语句）¶

局部功效在 sparse 替代下的理论刻画：定理 3 只证明 dense 替代下的功效，sparse 替代（\(\delta\) 只有少数非零坐标）下随机化检验的功效是否有理论下界？扎根点：定理 3 的陈述只覆盖 \(\delta = O(1/\sqrt{\text{tr}(\tilde{\Sigma}^2)})\) 的 dense 替代，模拟中 sparse 替代的功效低于极值型检验，但无理论分析。
混合分布极限的闭式表达：定理 1 证明分布收敛到某个由 \(\kappa_i\) 决定的极限，但未给出这个极限的闭式表达（如 \(\kappa_3\) 主导时极限是什么分布）。能否用 Wiener chaos 理论或随机矩阵定律给出闭式？扎根点：定理 1 的证明只保证分布收敛，未显式构造极限分布；引用 Nourdin et al. (2010) 时指出其"can not be readily applied"，暗示闭式构造是未解决的难点。
谱估计路线的可行性对比：作者搁置了基于谱估计的校正路线（Kong & Valiant, 2017），只提"estimation may be highly nontrivial"。能否在谱极端但样本量足够大时，用谱估计直接构造临界值，与随机化检验对比水平与功效？扎根点：Intro 中对 Kong & Valiant (2017) 的引用只一句带过，未深入讨论其可行性，这是被淡化的竞争路线。
随机化检验的计算复杂度与高维 M-estimation 的推广：本文随机化需重复 \(B\) 次（通常 \(B = 1000\)），每次计算 \(T_{CQ}^*\)，计算量为 \(O(B p^2 n)\)。能否用随机化思想推广到高维 M-estimation 的检验（如 score test）？扎根点：本文只处理均值检验，Intro 中未提及 M-estimation 或 score test 的引用，但随机化自适应分布的思路可能迁移。

提醒：要确认第 2 条是否真 gap，去读 Dobler & Peccati (2017) 与 Xu et al. (2019) 的近期 5 篇 intro——若都指向"二次型极限分布闭式表达未解决"，则是共识（真 gap）；若已有闭式结果，则是本文遗漏。

Maintained by 陈星宇 · Homepage · Source on GitHub

An approximate randomization test for the high-dimensional two-sample Behrens–Fisher problem under arbitrary covariances¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论