Randomization tests for conditional group symmetry¶

作者: Kenny Chiu, Alex Sharp, Benjamin Bloem-Reddy
来源: Electronic Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的根本问题是：如何检验一个条件分布是否关于某个群的作用具有对称性（不变性或等变性）。具体来说，给定协变量 \(X\)，我们需要检验响应变量 \(Y\) 的条件分布 \(P_{Y|X}\) 是否在指定局部紧群 \(G\) 的变换下不变（即 \(Y\) 的分布与对 \(Y\) 施加群变换后 \(Y^g\) 的分布相同）或等变（即 \(Y\) 的分布随变换以某种协变方式改变）。这是一个假设检验问题，且要求检验方法在有限样本下能精确控制第一类错误率（Type I error）。该方向目前属于一个相对未充分发展的子领域：经典的非参数对称性检验（如检验分布关于原点的球对称性）已有很长历史，但条件对称性（给定协变量 \(X\) 下 \(Y\) 的对称性）的检验在本文之前鲜有系统研究。

发展脉络（history）¶

根据作者在引言中的引用与定位，可以将相关工作串联如下：

奠基工作：经典非参数对称性检验与随机化检验。
- Hájek 等人 (1999, Theory of Rank Tests) 与 Lehmann & Romano (2022, Testing Statistical Hypotheses): 这是随机化检验（permutation tests / randomization tests）的经典理论框架。它们确立了在可交换性假设下、利用样本的群作用构造精确有限样本 \(p\) 值的核心思想。这是本文方法的基础。
- Eaton (1989, Group Invariance Applications in Statistics): 将群论与统计推断相联系，系统讨论了群不变性在统计中的角色，特别是通过群作用产生最优不变检验。这是本文关于群对称性（不变性/等变性）形式化定义的基石。
主要进展：核方法用于非参数假设检验与对称性检验。
- Gretton 等人 (2012, A Kernel Two-Sample Test): 提出了基于核最大均值差异（MMD）的双样本检验，使得在再生核希尔伯特空间（RKHS）中进行非参数分布比较成为可能。这是构建本文检验统计量的三种候选方法之一。
- Borgwardt 等人 (2006, Integrating Structured Biological Data by Kernel Maximum Mean Discrepancy): 将MMD扩展到结构化数据，展示了其灵活性。
- Chwialkowski 等人 (2015, Fast Kernel Based Independence Testing with Permutations) 与 Gretton 等人 (2007, A Kernel Statistical Test of Independence): 将核方法与排列检验结合，用于独立性检验（Hilbert-Schmidt Independence Criterion, HSIC）。这为本文“核量化 + 随机化检验”的技术路线提供了直接的前驱范例。
当前 frontier 与本文位置：条件对称性检验的缺口。
- Dharamshi 等人 (p2023, Randomization Tests for Pairwise Symmetry): 该文检验成对交换对称性（一种条件对称性的特例）。作者引用时指出，该方法依赖于“对称性只能在 \(Y\) 的某一种具体排列下成立”这一特殊结构，无法处理一般的局部紧群作用下的条件对称性检验。这是本文明确指出并要填补的缺口之一。
- Kallenberg (200 | | 2, Monotone and Unbiased Tests for Multivariate Symmetry): 该文处理的是无条件（边缘）分布的对称性检验。作者引用时指出，它“不能直接应用于条件对称性检验”，因为这个检验需要将对称性假设与未知的条件分布 \(P_{Y|X}\) 区分开。这是本文工作的核心缺口。

子线索聚类¶

这些被引文献大致落在以下四条子线索上：

线索一：群论与统计推断（理论基础）。以 Eaton (1989) 为中心，涵盖群作用、不变性原理、最优不变检验。这条线索提供了本文的形式化语言和理论基础。
线索二：随机化检验的经典理论（方法论基础）。以 Hájek et al. (1999) 和 Lehmann & Romano (2022) 为中心。这条线索提供了有限样本第一类错误控制的框架。
线索三：核方法用于分布比较与独立性检验（统计工具）。以 Gretton et al. (2012, 2007)、Borgwardt et al. (2006)、Chwialkowski et al. (2015) 为中心。这条线索提供了构建具体检验统计量的工具：MMD 和 HSIC 框架。
线索四：特定条件下的对称性检验（直接前驱与缺口）。以 Dharamshi et al. (p2023)、Kallenberg (2012) 为中心。这条线索直接展示了现有方法无法处理一般条件对称性，是本文的直接对手和定位基础。

这个方向在追问的核心问题¶

如何检验条件分布 \(P_{Y|X}\) 在有限样本下关于群作用 \(G\) 的精确对称性（不变性或等变性）？ 这是本文要解决的根本问题。
如何在不依赖强参数模型假设的前提下，构建一个对任意分布有效的检验？ 这是非参数方法的核心诉求。
如何实现有限样本精确的 Type I error 控制，并提供非平凡的检验功效下界？ 随机化检验提供了有限样本 Type I error 控制，但功效的分析通常需要渐近理论。本文试图在有限样本下给出一个“最不利”的下界。
如何将群作用的对称性条件转化为可实际计算的检验统计量？ 这需要一种能衡量“经过群作用后的分布与原始分布差异”的度量，核方法（MMD、核协方差）提供了这种度量。

⚠️ 作者的 framing（必须明确标注成"这是作者的说法"）¶

这是作者的说法：作者将缺口 frame 为“对所有群作用下的条件对称性检验的缺失”。他们指出，现有工作要么处理无条件对称性（Kallenberg 2012），要么处理非常特殊的一类条件对称性（Dharamshi et al. p2023），而他们提出的通用框架是“显然的下一步”。

竞争路线被淡化/回避：
- 参数模型方法：直接对 \(P_{Y|X}\) 施加一个参数化假设（如高斯过程、广义线性模型），然后检验其结构。这类方法更强但假设也更严格。作者在文中将其归类为“错设模型”或“对 \(Y\) 的分布进行了强假设”，并隐含地认为非参数方法在稳健性上更优（引入部分）。
- 基于条件矩的检验：例如检验 \(E[Y | X]\) 或 \(Var[Y | X]\) 在群作用下的对称性，而非整个分布。这类方法更简单，但只能检测分布对称性的“平均”特征，无法检验整个分布。作者可能在模拟中会与这类简单的检验方法对比，但在 intro 中没有直接提及。
什么明显该被引 / 该存在、却没出现在 intro 里？
- 关于“等变性”的定义与检验。引言中主要讨论了“不变性”（\(P_{Y|X} = P_{Y^g|X}\)），对于“等变性”（\(P_{Y|X} = P_{Y^g|X_g}\)）的定义只出现在一处。没有迹象表明存在一个被广泛认可的“条件等变性检验”的现有文献基础。这意味着作者可能认为这是他们完全开创的领域。
- 现代高维数据下的对称性检验。论文应用的例子（高能物理）的数据维度不低，但引言没有引用高维统计（如随机矩阵理论、稀疏模型）中对对称性检验的现有工作。这可能是因为当前高维领域主要关注均值、协方差等低阶结构，而不是全分布对称性。

张力¶

未见明显对立引用。所有被引文献都呼应了“对称性是重要结构，现有方法有缺口”这一共识，没有表现出在不同条件下得出相反结论的矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \(X \in \mathcal{X}\)：协变量（随机变量）。观测到的特征。
- \(Y \in \mathcal{Y}\)：响应变量（随机变量）。我们要检验其条件分布的对称性。
- \(G\)：一个局部紧群，它对 \(\mathcal{Y}\) 有一个作用（action）。例如，旋转群 \(SO(3)\) 对三维空间向量 \(\mathcal{Y} = \mathbb{R}^3\) 的作用是旋转。
- \(\phi: G \times \mathcal{Y} \mapsto \mathcal{Y}\)：群作用函数，记作 \(g \cdot y = \phi(g, y)\)。对于群中的每个元素 \(g\)，它是一个从 \(\mathcal{Y}\) 到自身的可测双射。
- \((X_i, Y_i)_{i=1}^n\)：可观测数据。我们观测到一个独立同分布（i.i.d.）样本，共有 \(n\) 对 \((X_i, Y_i) \in \mathcal{X} \times \mathcal{Y}\)。这是研究者实际能观测到的全部。
- 假设（模型）：我们假设数据来自某个未知的联合分布 \(P_{X,Y}\)。我们感兴趣的潜在量是条件分布 \(P_{Y|X}\)。
- 零假设 \(H_0\)：条件分布 \(P_{Y|X}\) 关于群 \(G\) 的作用是不变的（本文主要处理不变性，等变性可类似转化）。
  - 不变性的正式定义：对于所有 \(g \in G\)，\(P_{Y|X} = P_{Y^g|X}\)。其中 \(Y^g = g \cdot Y\)。这意味着，在给定 \(X\) 的条件下，对 \(Y\) 施加任何群变换不会改变其分布。
- 校验统计量 \(T(D)\)：基于样本数据 \(D = \{(X_1, Y_1), ..., (X_n, Y_n)\}\) 计算的一个实数值，用于度量数据与零假设的偏离程度。\(T\) 越大，越不支持 \(H_0\)。

第二步：讲最小内核¶

最简特例：假设 \(G\) 是只有两个元素的有限群：\(G = \{e, g\}\)，其中 \(e\) 是单位元（不改变），\(g\) 是一个“翻转”（如 \(y \mapsto -y\)，或交换两个坐标）。
- 协变量 \(X\) 是离散的，只有两个取值，记为 \(x_a\) 和 \(x_b\)。
- 假设：对于 \(X = x_a\)，我们有 2 个观测，记为 \(Y_1, Y_2\)；对于 \(X = x_b\)，我们有 2 个观测，记为 \(Y_3, Y_4\)。
- 在零假设 \(H_0\) 下：对于 \(X = x_a\)，\(Y_1\) 和 \(Y_2\) 都是从同一个分布 \(P_{Y|X=x_a}\) 中采样，且这个分布关于“翻转” \(g\) 是不变的。这意味着 \(W_1 = Y_1\) 和 \(W_2 = g \cdot Y_2\) 的分布与 \(Z_1 = g \cdot Y_1\) 和 \(Z_2 = Y_2\) 的分布是相同的。
  - 更直接地，在 \(H_0\) 下，对于 \(X = x_a\)，我们可以对每个观测 \(Y_i\) 独立地应用随机均匀选择是的 \(g\) 变换还是不变，或者等价地说，样本 \(\{(Y_1, Y_2)\}\) 与 \(\{(g \cdot Y_1, g \cdot Y_2)\}\) 的联合分布是相同的（由于 \(H_0\) 保证）
  - 更关键的是：如果我们对 \(X = x_a\) 下的样本进行“随机翻转”，即对每个观测 \(Y_i\)，以 1/2 的概率应用 \(g\)，得到的“变换后的样本”与原始样本 \((Y_1, Y_2)\) 具有相同的联合分布。
核心思路（基于这个特例）：
1. 构建一个“群作用的轨道”：对于单个观测 \((X_i, Y_i)\)，在给定 \(X_i\) 的条件下，由 \(G\) 生成的“轨道”是 \(\{(X_i, g \cdot Y_i): g \in G\}\)。在这个特例下，轨道就是 \(\{(X_i, Y_i), (X_i, g \cdot Y_i)\}\)。
2. 执行随机化检验：
  - 计算原始检验统计量 \(T_0 = T(D)\)。例如，可以选择基于 MMD 的统计量来度量 \(Y\) 的分布与其在 \(G\) 作用下的“平均”分布之间的差异：\(T(D) = ||\mathbf{E}[k(Y, \cdot)] - \mathbf{E}[k(g \cdot Y, \cdot)]||_{\mathcal{H}}\)，其中 \(k\) 是一个复正定核，\(\mathcal{H}\) 是 RKHS。
  - 条件于协变量 \(X_i\) 的排列：在 \(H_0\) 下，对于每个 \(i\)，我们可以独立地从群 \(G\) 中随机选择一个元素 \(g_i\)（均匀分布，如果群是有限的），并将其作用于 \(Y_i\)，形成“变换数据” \(D^\pi = \{(X_i, g_i \cdot Y_i)\}\)。由于在 \(H_0\) 下，原始数据的条件分布与进行这种变换后的条件分布相同，因此 \(T_0\) 与 \(T(D^\pi)\) 具有相同的边际分布，条件于 \(\{X_i\}\)。
  - 计算 \(p\)-值：重复上述随机变换 \(B\) 次，得到 \(T^{(1)}, ..., T^{(B)}\)。p-值为 \( \frac{1}{B+1} (1 + \sum_{b=1}^B I(T^{(b)} \ge T_0))\)。在有限样本下，这个 p-值是精确的（在 \(H_0\) 下，以概率 \(p\) 拒绝 \(H_0\)）。对于无限群（如旋转群），我们采用一个局部紧群的 Haar 测度来随机选择 g，确保这种均匀性。
3. 为什么可行：
  - 关键一步在于，在零假设 \(H_0\)（条件不变性）下，给定 \(X\)，对 \(Y\) 随机施加群变换不会改变其分布。因此，由原始数据和变换数据计算出的检验统计量在条件于给定 \(X\) 下是可交换的（exchangeable）。Lehmann & Romano (2022) 的经典理论保证了，基于这种可交换性构造的随机化检验具有有限样本的准确第一类错误控制。
一般化：这个特例直接推广到一般的局部紧群 \(G\) 和任意协变量 \(X\)。只要在零假设下，对于每个 \(X_i\)，群变换作用于 \(Y_i\) 后，其条件分布不变，那么对每个观测独立地随机抽取一个群元素并作用于 \(Y\)，得到的变换样本与原始数据在给定 \(X\) 下是可交换的。因此，我们可以用同样步骤构造随机化检验。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究了什么问题：本文提出一个通用框架，用于非参数地检验 条件分布 \(P_{Y|X}\) 关于一个指定局部紧群 \(G\) 作用的对称性（不变性或等变性）。
核心工具 / 方法：基于随机化检验（Randomization Tests），利用核方法（MMD、核协方差）构建检验统计量，并利用群结构在有限样本下实现第一类错误控制，同时给出有限样本功效的下界。
主要结论：该方法在任意群作用下，对任意样本量 \(n\)，都能实现有限样本的精确 Type I error 控制。对于大规模数据，作者提出了近似版本并证明了其渐近一致性。模拟实验和两个高能物理实例验证了方法的有效性。

关键设定与假设¶

在第二节最小记号的基础上，补全完整设定：

定义 1（条件不变性/等变性）：定义得清晰。对于不变性，对于 \(a.e. x\)，\(P_{Y|X}(y|x) = P_{Y|X}(g^{-1} \cdot y | x)\) 对于所有 \(g \in G\) 成立。这是核心假设。作者还定义了条件（给定 \(X\) 的）随机化分布，即 \(P_{Y|X}^\pi(y|x) = \int_{G} P_{Y|X}(g^{-1} \cdot y | x) d\mu(g)\)，其中 \(\mu\) 是 Haar 测度。在 \(H_0\) 下，\(P_{Y|X}^\pi = P_{Y|X}\)。关于等变性，作者通过将 \(Y\) 与一个额外的“结构变量”配对，用不变性框架来表述等变性。具体地，等变性定义表述为：存在一个群 \(G\) 对 \(Y\) 和 \(X\) 的共同作用，使得 \(P_{Y|X}\) 满足 \(P_{Y|X}(y|x) = P_{Y|X}(g \cdot y | g \cdot x)\)。这可以纳入不变性框架，只需定义一个新的响应变量 \(Z = (X, Y)\)，并检验 \(P_{Z|X}\) 关于群对的联合不变性。
假设 1（数据的可测性与群作用的可测性）：标准可测性假设，保证群的 Haar 测度存在以及随机化步骤的合法性。
假设 2（群作用是可移的? / 轨道可遍历?）：文中没有特别强硬的假设。关键点是在零假设下，协变量 \(X\) 必须不被群作用影响（对于不变性检验）或者被正确纳入（对于等变性检验），这样才能保证条件于 \(X\) 的随机化有效。否则，群作用会破坏\(X\)的结构，导致随机化无效。
相比已有文献放宽或强化：
- 强化（相比 Dharamshi et al. p2023）：本文方法不依赖特定排列结构，能处理任意局部紧群，包括连续群（如旋转群）。
- 放宽（相比参数检验）：不需要对 \(P_{Y|X}\) 进行任何参数化假设。

主要结果¶

理论结果 1（定理 1：条件随机化检验的有限样本 Type I error 控制）：
- 陈述：对于任意样本量 \(n\)、任意群 \(G\)、以及基于数据 \(D\) 和群作用构造的随机化检验，在零假设 \(H_0\)（条件不变性）下，检验的 \(p\)-值满足 \(P(p \le \alpha) \le \alpha\)，其中 \(\alpha \in [0,1]\)。这意味着第一类错误率被精准控制。
- 直觉：这是随机化检验的基本性质，直接源于 Lehmann & Romano (2022) 的经典结果。
- 必要条件：群 \(G\) 必须有一个 Haar 测度，以便能够“均匀地”从群中采样元素。这就是假设2的作用。
- 解决的技术难点：主要是将经典的随机化检验原理推广到一般的、可能无限的群上，并确保条件于 \(X\) 的随机化策略在无限群下仍然成立。作者通过形式化的 Haar 测度积分巧妙地解决了这个问题。
理论结果 2（定理 2：检验功效的有限样本下界）：
- 陈述：对于任意一个备择假设（非条件不变性），检验的 \(p\)-值至少满足 \( p \ge \frac{1 + B \cdot Pr(T(D^\pi) \ge T(D))}{B+1} \)，其中 \(D^\pi\) 是随机化后的数据。这给出了基于 MMD 检验统计量下，检验功效的一个通解形式的有限样本下界。
- 直觉：这个下界依赖于原始统计量 \(T(D)\) 与随机化统计量 \(T(D^\pi)\) 的比较。如果备择假设使 \(T(D)\) “异常大”，那么它大于随机化统计量的概率就高，导致 \(p\)-值小。下界量化了这个行为。
- 必要条件：检验统计量必须是在某种意义上对称的，即 \(T(D) = T(D^\pi)\) 在 \(H_0\) 下以高概率成立；在备择假设下，\(T(D)\) 倾向于更大。
- 解决的技术难点：证明这个有限样本下界不平凡，因为通常功效分析是渐近的。作者利用了对秩统计量的概率不等式推导出一个通用的有限样本公式。
理论结果 3（定理 3：近似随机化检验的渐近一致性）：
- 陈述：对于大规模数据，直接对所有 \(n\) 个观测进行随机化检验是计算密集型的。作者提出一种近似版本：只对部分观测（例如，随机选择 \(m << n\) 个观测）进行随机化，并证明该近似检验是渐近一致的：当 \(n \to \infty\) 和 \(m \to \infty\) 时，检验的功效收敛到1（在备择假设下）。此外，第一类错误率收敛到名义水平 \(\alpha\)。
- 直觉：如果原始统计量 \(T(D)\) 在备择假设下趋于无穷大（因为样本量增加），那么即使只用部分观测的随机化分布去校准，也能区分出这个统计量。关键是，随机化分布的极限是 \(H_0\) 下的分布，而原始统计量在备择假设下发散。
- 必要条件：检验统计量在备择假设下必须能以 \(\sqrt{n}\) 速率发散。
- 解决的技术难点：需要将随机化检验的渐近理论推广到随机化只发生在部分数据上的场景。

证明路线与技术技巧（理论型必写，要具体）¶

整体路线（基于定理1 的证明思路）：
1. 形式化随机化分布：定义 \(T_{group}\) 为对原始数据 \(D\) 计算出的检验统计量。定义 \(T_{rand}\) 为对独立随机抽样 \(g_i \sim \text{Haar}(G)\) 并作用于每个 \(Y_i\) 后得到 \(D^\pi\) 计算出的检验统计量。
2. 建立可交换性：在 \(H_0\) 下，证明 \((T_{group}, T_{rand}^{(1)})\) 的联合分布与任意排列后的分布相同（其中 \(T_{rand}^{(1)}\) 是第一次随机化后的统计量）。这个可交换性源于条件于给定协变量 \(X_i\) 时，对 \(Y_i\) 施加 Haar 测度采样的群变换不会改变其分布。
3. 使用经典引理：利用 Lehmann & Romano (2022) 的引理（关于可交换性的秩检验），可以推出 \(p\)-值的精确均匀性。
4. 关键跳跃点：核心跳跃在于将 \(G\) 的 Haar 测度引入到证明中，使得“随机化”对于连续群也是合法的。这需要证明在条件于 \(X\) 下，通过 Haar 采样得到的变换数据与原始数据在统计上是可互换的。
5. 技术技巧：
  - Haar 测度积分：用于定义在无限连续群上的均匀随机化。例如，旋转群 \(SO(3)\) 上的均匀采样是通过其 Haar 测度实现的。
  - 可交换性论证：这是随机化检验的经典论证，但作者把它推广到了涉及无限群的场景。

真实例子与应用（有就一定要讲）¶

本文包含两个来自高能粒子物理（HEP）的真实数据例子：

例子 1：LHC 喷注重建中的群对称性。
- 数据 / 场景：在大型强子对撞机（LHC）实验中，物理学家重建粒子喷注（jet）。喷注的物理性质（如能量、动量）与探测器的几何特征（方位角、伪快度）有关。这里 \(X\) 是探测器的几何信息（比如喷注的方位角 \(\phi\)），\(Y\) 是粒子的某个物理观测量（如能量）。物理定律暗示，在某些物理过程中，给定相对相位等特征，喷注的能量分布应该是方位角旋转不变的（即关于 \(SO(2)\) 群作用的不变性）。
- 方法应用：作者使用论文中的条件随机化检验，检验 \(E[Y|X]\) 是否在 \(G=SO(2)\) 的旋转下不变。他们用 MMD 作为检验统计量。
- 得到的结果：对于模拟的背景噪声样本，检验没有拒绝 \(H_0\)（\(p\)-值不显著）。但对于模拟的信号样本（含有某种方向性特征的过程），检验显著拒绝了 \(H_0\)（\(p\)-值非常小，如 \(p < 0.001\)）。
- 想说明什么：
  - 验证理论：证明了方法在物理简化的背景下工作：能正确识别背景噪声（无方向性）和信号（有方向性）。
  - 展示优势：展示了方法可以检测到由群对称性定义的“物理对称结构”，这对HEP中的异常搜索至关重要。这是对理论结果的直接实体验证。
例子 2：Top 夸克对衰变中的宇称不对称性。
- 数据 / 场景：在 \(t\bar{t}\) 对（顶夸克对）的衰变中，物理学家关心衰变产物（如 \(e^+\)、\(\mu^-\)、\(b\)-jet）的分布是否相对于某个群（如螺旋度旋转群）是等变的（或更准确地，在理论模型下是不变的，但实验数据可能显示不对称）。
- 方法应用：这里 \(X\) 是顶夸克的特定螺旋度（或偏向），\(Y\) 是衰变产物的方向。作者检验条件分布 \(P_{Y|X}\) 是否关于 \(SO(2)\) 作用等变（即如果旋转顶夸克，衰变产物方向应该跟随旋转）。
- 得到的结果：对于模拟的“标准模型”背景（没有新物理），检验接受 \(H_0\)。对于模拟的某种“新物理”信号（来自某种超对称模型，产生不对称性），检验拒绝了 \(H_0\)。
- 想说明什么：
  - 证明方法对等变性的适用性：展示了框架可以扩展到等变性检验。
  - 实际意义：在HEP中，这种群对称性是区分标准模型（假定不变性）和新物理（产生不对称性）的强大探测工具。论文证明该检验能有效发现“意外”的对称性破坏。

🔎 结论是否比证明窄¶

是的，存在明显的放宽。定理 1 对第一类错误提供了严格的有限样本控制。然而，定理 2 对功效给出的只是一个有限样本下界。作者在定理 2 的表述中说，这个下界“可能非常松”，并且功效的真实表现需要依靠模拟来评估。这意味着作者无法提供像第一类错误那样严格的、对于所有备择假设都紧的下界。所以，结论中说“实现了有限样本检验功效的下界”是准确的，但作者自己在文中承认这个下界可能很松，因此不宜过度解读。作者的核心贡献在于 Type I error 的精确控制，而非功效的紧界。这个下界在数学上非平凡，但实际应用时模拟仍然是评估功效的主要手段。

四、开放问题（点到为止，扎根具体语句）¶

功效分析与紧界刻画：定理 2 中的功效下界被作者自己承认可能“非常松”。能否为这类条件对称性检验，针对特定的群和特定的备择假设，推导出更紧（甚至最优）的有限样本功效界？这扎根于论文的定理 2 及其讨论。
高维数据的计算与性质：当协变量 \(X\) 或响应变量 \(Y\) 的维度 \(d\) 很大时，核方法的计算复杂度（特别是计算 MMD 或协方差矩阵）和统计性质（如收敛速度）会如何变化？作者在模拟中使用了中等维度数据，但在高维（甚至 \(d > n\)）场景下的理论（如渐近分布的高斯近似、随机化检验的近似一致性）和计算成本（核矩阵求逆）没有被讨论。这扎根于模拟部分（维度设定）和未来工作的讨论。
对非对称协变量依赖的稳健性：本文的零假设是条件不变性/等变性。如果协变量 \(X\) 本身与群作用 \(G\) 相关（例如，\(X\) 的分布也随群作用变化），那么该检验可能会错误地拒绝 \(H_0\)（即产生过多的第一类错误）。如何将检验扩展到对协变量与群作用之间的依赖性更稳健的设定？这扎根于假设 2（群作用不影响 \(X\) 的分布）和文章讨论（作者承认了这一点）。
与其他检验的比较：本文与基于条件矩的检验（如只检验均值或方差的对称性）相比，优势在哪里？更具体地，当 \(P_{Y|X}\) 的分布对称性仅体现在高阶矩（如偏度、峰度）上，而低阶矩不受影响时，基于 MMD 的检验是否仍然有效？如果有效，其对比其他检验的收益是什么？这扎根于引言中对“参数化假设”和“仅检验均值”等竞争路线的回避。

Maintained by 陈星宇 · Homepage · Source on GitHub