Studentized tests of independence: Random-lifter approach¶

作者: Zhe Gao, Roulin Wang, Xueqin Wang, Heping Zhang
来源: Annals of Statistics
主题: 数理统计 / 假设检验
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本子方向处理的根本问题是：在非参数设定下，如何对两个随机对象（向量、流形数据、图结构等）是否统计独立做假设检验。核心挑战在于：大多数流行的关联度量（如距离协方差、HSIC）的样本统计量是退化U-统计量，其渐近零分布落在二阶Wiener chaos（一个无穷维、非标准分布），导致实际中必须依赖permutation或Gamma近似来构建拒绝域，计算代价高且难以理论分析最优性。本文试图逆向设计：先要求零分布是标准正态，再通过合适的关联度量构造，使得检验统计量studentized后自然收敛到N(0,1)，无需样本分裂或permutation。

发展脉络（history）¶

奠基工作（2007-2012）： - Szőkely et al. (2007)（被引[5]）: 提出距离协方差 (dCov) 和距离相关，证明其“独立性-零等价”性质（即等于0当且仅当独立）。这是整个领域的基石：把依赖检测问题嵌入到欧氏距离对应的能量框架中。 - Gretton et al. (2007) / Sriperumbudur et al. (2009)（被引[6]）: 提出HSIC（Hilbert-Schmidt Independence Criterion），把dCov的框架一般化到任意再生核希尔伯特空间（RKHS），并给出了“特征核”（characteristic kernel）的充分条件，正式确立了核方法在独立性检验中的通用性。本文指出这两类方法共享一个核心“劣势”：检验统计量的渐近零分布是二阶Wiener chaos，无法直接获取p值。

主要进展（2016-2020）：minimax最优性与计算瓶颈： - Kim, Balakrishnan & Wasserman (2020)（被引[2]）: 首次建立了permutation检验在独立性设定下的非渐近minimax理论框架，证明了基于U-统计量的permutation检验可以达到最优分离率（separation rate）。但代价是：计算需重复二次时间统计量（n^2）数百次，无法规避。 - Li & Yuan (2019)（被引[15]）: 证明了高斯核下的检验（包括HSIC及同类方法）在极大极小意义下对平滑备择是最优的，关键条件是缩放参数需随样本量趋近无穷。这给出了“HSIC是最优的”理论支撑，但同时强化了：要逼近这个最优率，必须让核参数发散，而这使得二阶Wiener chaos的近似更复杂（缺乏闭式累积量公式）。 - Meynaoui et al. (2019)（被引[3]）: 引入aggregation技术，避免单核选择带来的非自适应性问题，但检验统计量依然是退化的，null分布仍需permutation或Gamma近似。

当前Frontier（2021-2023）：避免permutation、实现studentization： - Gao & Shao (2021)（被引[4]）: 在两个样本MMD设定下，通过高维渐近（p→∞同时n→∞）实现了studentized MMD的渐近正态性。这是第一次在“高维+退化U”下获得直接正态null，但依赖高维渐近框架（p/n → c > 0或p→∞），该结论不适用于固定维、仅n→∞的经典设定。 - Shekhar, Kim & Ramdas (2022)（被引[18]）: 提出xHSIC / xdCov——通过对样本进行随机分裂（cross U-statistics），使统计量不再退化从而得到渐近正态null，代价是样本利用率减半（需要hold-out部分数据做studentization）。文中明确说这是“首次在非退化条件下获得正态null”，但分裂降低了有效样本量。 - Gao et al. (2019)（被引[16]）: 对高维距离协方差建立了中心极限定理，证明“维度越高，正态近似越准确”（blessing of dimensionality），但同Gao & Shao一样依赖于高维渐近。

本文的位置：本文提出Random-Lifter方法，这是一种与上述所有工作正交的策略——不依赖高维、不依赖分裂，而是在构造统计量的源头做逆向工程，通过加入随机权重的“升维”直接迫使退化U-统计量的主导项变为正态可studentizable。本文声称其方法是第一个在经典固定维、n→∞设定下实现零分布为标准正态、无需permutation的独立性检验，且同时具有minimax最优性。

子线索聚类¶

基于距离/核的关联度量（dCov / HSIC / Ball Cov）（被引[5][6][11][17]）：
共同特点：构造某种双中心（double-centered）距离或核矩阵的内积作为关联度量，具有“独立性-零等价”性质。
当前瓶颈：样本版本总是退化U-统计量，零点附近泰勒展开的第一非零项是二阶项，null分布是加权χ^2（Wiener chaos）。
非permutation的学生化检验（xHSIC / cross-MDD）（被引[18][4][16]）：
通过样本分裂（cross U-statistics）或高维渐近来绕过退化性，得到正态null。
代价：交叉统计量损失样本效率；高维渐近不适用于低维且需要额外假设（协方差结构、矩条件等）。
minimax最优性分析（被引[15][2][3]）：
研究在不同平滑性假设（Sobolev球、Nikol'skii球）下的最优分离率，证明HSIC/dCov等可以最优。
元件：都是假设检验的minimax理论，但不涉及如何用简单null分布实现这些最优率。

核心追问与已知瓶颈¶

Q1：能否在不牺牲样本效率（不样本分裂）、不依赖高维渐近的条件下，使独立性检验统计量的渐近零分布是标准正态？
瓶颈：退化U-统计量的主导项是二阶，其渐近分布由核的特征值谱决定，不可能是正态。
Q2：现有方法的计算复杂度（至少O(n^2)）在高维/大数据下是否可接受？permutation进一步提升到O(n^2 · B)，B≥100。
瓶颈：即使有快速核逼近（Nyström / Random Fourier Features，见被引[10]），permutation的额外B倍乘子依然存在。
Q3：minimax最优性是否只能在特定核参数选择下实现？能否构造一个始终渐近正态且同时最优的检验？
瓶颈：Li & Yuan (2019)证明高斯核的最优性依赖于核参数的适定发散速度，但该参数也影响Wiener chaos近似精度。

⚠️ 作者的framing¶

作者把缺口frame成：

“现有的独立性检验方法都受困于复杂的渐近零分布（二阶Wiener chaos），只能用permutation或近似；本文通过逆向工程（先要求零分布为正态，再构造对应的统计量）一举解决了这个问题，且不损失minimax最优性。”

被淡化的竞争路线： - Shekhar et al. (2022)的xHSIC：作者承认xHSIC也实现了正态null，但强调其需要样本分裂导致效率损失（cross U-statistics只有~n/2个有效对），而本文的Random-Lifter无需分裂。然而，xHSIC的方法论更为简单（直接在交叉U-统计量上做studentization），且有现成的理论支持（Kim & Ramdas 2020的cross U-statistics理论）；本文的构造更复杂（需要额外生成随机权重矩阵）。

值得研究者去查的问题： - 本文没有引用Gao & Shao (2021)在MMD上的高维studentization工作（虽然引了同组在距离协方差上的高维工作）。为什么？是认为高维渐近不是一个公平的baseline，还是单纯的引用遗漏？ - 本文没有讨论Li & Yuan (2019)中提到的“自适应带宽选择”方法能在多大程度上缩小与正态null的距离。如果Li & Yuan的检验已经可以通过数据驱动带宽逼近minimax率且实际中permutation效果良好，那么本文带来的收益是否主要是理论上的（简化null分布），而非实际统计效能的提升？

张力¶

未见明显对立引用。所有被引工作都同意“退化U-统计量的渐近零分布是二阶Wiener chaos”这个基本事实，差异在于如何处理这个事实（permutation、分裂、高维近似、还是本文的逆向设计）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号（逐个点名）：

记号	含义
\((X_i, Y_i) \in \mathbb{R}^{d_X} \times \mathbb{R}^{d_Y}, i=1,\dots,n\)	i.i.d.可观测样本。\(X_i\)与\(Y_i\)的联合分布是\(P_{XY}\)，边际\(P_X, P_Y\)
\(n\)	样本量
\(H_0: X \perp Y\)	独立性检验的零假设
\(H_1: X \not\perp Y\)	备择假设
\(\theta : \mathbb{R}^{d_X} \times \mathbb{R}^{d_Y} \to \mathbb{R}\)	某个关联度量函数（待构造），满足\(\theta(X,Y) = 0\)当且仅当\(X \perp Y\)
\(w_{ij} \in \mathbb{R}\)	随机权重，对每个样本对\((i,j)\)独立生成，用于构造“随机升维”后的统计量。是本文的核心技巧
\(T_n\)	检验统计量，是\(w_{ij}\)和\(\theta\)的某种双线性形式
\(U_n\)	辅助统计量（通常是退化U-统计量），用于studentization
\(\sigma_n^2\)	\(T_n\)的渐近方差的可估量
\(\ell( \cdot )\)	损失函数或核函数，用于定义\(\theta\)。本文使用形如\(\ell(x, x'; y, y') = k_X(x,x') k_Y(y,y')\)的乘积核

模型与假设（在第二节最小内核中，我们使用最简单的设定）： - 数据生成：\( (X_i, Y_i) \) i.i.d. from \(P_{XY}\)，且矩条件：\(E[\|X\|^2]<\infty, E[\|Y\|^2]<\infty\)（确保核嵌入存在）。 - 关联度量\(\theta\)形式：假设\(\theta\)可以写成双中心乘积核：

\[\theta_{ij} = \tilde{k}_X(X_i, X_j) \tilde{k}_Y(Y_i, Y_j)\]

其中\(\tilde{k}_X, \tilde{k}_Y\)是经过中心化的核（即\(E[\tilde{k}_X(X_i, \cdot)]=0\)，等）。这是HSIC等标准构造。 - 核心假设：在零假设\(H_0\)下，\( \tilde{k}_X \)与\(\tilde{k}_Y\)的期望各自为零，且以各自核的特征函数正交，导致样本版本的U-统计量是退化的（degenerate）。

可观测数据 vs 不可观测量： - 可观测：样本对\((X_i, Y_i), i=1\dots n\)，以及人为独立生成的随机权重\(w_{ij}\)。 - 不可观测：联合分布\(P_{XY}\)，核特征函数、特征值谱。在\(H_0\)下，边际分布\(P_X, P_Y\)可以未知。 - 要识别的量：检验的拒绝域（依赖于\(T_n\)在\(H_0\)下的分布）。我们不需要估计某个具体的参数，只需要判断\(T_n\)是否显著偏离其零分布。

第二步：最小内核¶

将本文的许多一般性假设简化，取最简特例：

设定：
\(X_i, Y_i\)均为一维实标量（\(d_X=d_Y=1\)）。
核函数取高斯核：\(k_X(x,x') = \exp(-(x-x')^2/(2\sigma_X^2))\)，且核带宽固定为某个常数（不随n增大而散逸）。
在\(H_0\)下，\(X_i \perp Y_i\)，且\(X_i, Y_i\)均服从标准正态分布（这比一般分布更具体，但能简化核特征值分析）。
随机升维参数：设Random-Lifter方法是把每个观测\((X_i)\)“升高”到一个\(k\)维随机空间，本文取最简单的\(k=2\)。
权重构造：设\(w_{ij} = \xi_i \eta_j\)，其中\(\xi_i, \eta_i\)是均值为0、方差为1的独立随机变量（如i.i.d. Rademacher ±1），对每个\(i\)独立生成，与数据独立。

核心思路——逆向工程：

传统HSIC统计量是：

\[\text{HSIC}_n = \frac{1}{n^2} \sum_{i,j} \tilde{k}_X(X_i, X_j) \tilde{k}_Y(Y_i, Y_j)\]

在\(H_0\)下它是退化的，渐近分布是加权\(\chi^2\)（正项与负项混合），无法直接正态化。

Random-Lifter的做法：不是直接使用\(\text{HSIC}_n\)，而是构造：

\[T_n = \frac{1}{n^2} \sum_{i,j} w_{ij} \, \tilde{k}_X(X_i, X_j) \tilde{k}_Y(Y_i, Y_j)\]

其中\(w_{ij}\)是独立的随机权重矩阵（与数据独立生成，可视为在统计量“加入随机性”）。

为什么能变成正态？ 1. 在\(H_0\)下，\(E[T_n] = 0\)。 2. \(T_n\)是条件于数据下\(w_{ij}\)的线性组合，条件于数据时\(T_n\)是正态（\(w_{ij}\)是独立同分布且影响是线性，根据Lindeberg）。 3. 欲得到边缘分布（即integrate out权重之后）的正态性，需满足：对\(w_{ij}\)的无条件分布做CLT。但关键点是： - 退化的部分来自于\(\tilde{k}_X \tilde{k}_Y\)的非对称性在\(H_0\)下消失：因为\(\tilde{k}_X, \tilde{k}_Y\)各自具有零均值，乘积的双中心效应导致U-统计量退化。但加入随机权重\(w_{ij}\)打破了退化——因为\(w_{ij}\)的引入使得统计量不再是单纯的“对称核U-统计量”，而变成了一个“加权U-统计量”，其主导项变成一阶非退化，从而CLT直接适用。 4. 学生化：构造的方差估计\(\widehat{\text{Var}}(T_n)\)可以仅用对角化方法求出（不需要样本分裂），且其收敛速度正好使得：

\[\frac{T_n}{\sqrt{\widehat{\text{Var}}(T_n)}} \xrightarrow{d} N(0,1)\]

而核心操作在于对权重\(w_{ij}\)的分布做显式计算，方差估计是闭合形式。

在这个最简特例（d=1, 高斯数据, k=2, Rademacher权重）下： - \(T_n\)的双线性形式退化到：

\[T_n = \frac{1}{n^2} \sum_{i,j} \xi_i \eta_j \cdot \exp(-(X_i - X_j)^2/(2)) \cdot \exp(-(Y_i - Y_j)^2/(2))\]

其中\(\xi_i, \eta_j\)独立Rademacher。 - 在\(H_0\)下，中心化核\(\tilde{k}\)就是对\(k\)减去行均值，但最后的主导项是： - 条件于\(\{X_i, Y_i\}\)，\(T_n\)是\(\xi_i, \eta_j\)的双线性型，直接是正态（2-indices CLT）。 - 边缘（marginal over \(\xi,\eta\)）时，因权重是外生随机，不需要处理Wiener chaos的谱分解，退化性自然消失。 - 证明的关键跳跃是：权重使得统计量的Hájek投影不再是零（传统HSIC投影恒为零），而是一个一阶非退化的U-统计量，可用经典U-统计量CLT处理。

总结：这个最小内核就是——用独立于数据的随机权重给退化U-统计量“去退化”，使零分布直接变为正态，这是本文数学本质的全部。 一般设定只是把一维标量推广到多维、核从高斯推广到任意特征核、权重从二元Rademacher推广到更灵活的独立分量，但核心思想相同。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在非参数独立性检验（HSIC / dCov等框架）中，传统检验统计量的渐近零分布落入二阶Wiener chaos，需用permutation或近似，计算开销大。本文提出Random-Lifter方法，一种逆向工程策略——先要求零分布是标准正态，再通过引入随机权重构造适当的关联统计量，使得学生化后的检验统计量自然收敛到N(0,1)。
核心工具/方法：① 退化U-统计量的CLT在随机权重加持下的非退化版本（证明\(T_n\)的Hájek投影不再为零）；② 随机权重构造的专门设计——权重矩阵由独立随机变量生成，使得该矩阵的随机性可以用于关闭退化路径，同时计算方差估计时有闭合形式；③ 学生化无需样本分裂，方差估计可直接从数据结构推导。
主要结论：① 在H_0下，Random-Lifter统计量\(T_n\)经学生化后以rate \(O(n^{-1/2})\)收敛到标准正态；② 在H_1下，检验具有一致性；③ Random-Lifter检验具有minimax最优性——对Sobolev球内的平滑备择能达到最优分离率（仅损失常数因子）；④ 模拟与真实数据验证了检验的type-I error控制和与baseline相当的统计效能。

关键设定与假设（在第二节最小记号基础上补充）¶

定义： - 关联度量：设\(K_X, K_Y\)是\(\mathbb{R}^{d_X}, \mathbb{R}^{d_Y}\)上的正定核。中心化版本：

\[\tilde{K}_X(x,x') = K_X(x,x') - \frac{1}{n}\sum_{i}K_X(x,X_i) - \frac{1}{n}\sum_{j}K_X(X_j,x') + \frac{1}{n^2}\sum_{i,j}K_X(X_i,X_j)\]

（同理\(\tilde{K}_Y\)） - 权重矩阵：\(W = (w_{ij})_{i,j=1}^n\)，要求\(w_{ij}\)是i.i.d.随机变量，均值为0，方差为\(\sigma_w^2\)，且四阶矩有限。独立性条件：\(W \perp (X_i, Y_i)_{i=1}^n\)。本文建议取\(w_{ij} = \xi_i \eta_j\)（乘积结构），其中\(\xi_i,\eta_i\)独立且均值为0方差1。 - 统计量：

\[T_n = \frac{1}{n^2} \sum_{i,j} w_{ij} \tilde{K}_X(X_i,X_j) \tilde{K}_Y(Y_i,Y_j)\]

- 方差估计：

\[\hat{\sigma}_n^2 = \frac{1}{n^4} \sum_{i,j} w_{ij}^2 (\tilde{K}_X(X_i,X_j) \tilde{K}_Y(Y_i,Y_j))^2 + \text{交叉项（涉及不同的(i,j)组合）}\]

具体形式见文中Lemma 3.1。

假设（相比已有文献的放宽/强化）： - A1（矩条件）：核函数\(K_X, K_Y\)有界（这稍强于通常的finite second moment，但涵盖高斯/Laplacian核）。本文之处在于：这个假设是可以放松到有限二阶矩的，但为简化技术细节而保留。 - A2（核的非退化性）：核是特征核（characteristic），这是HSIC/dCov的常规要求。不强于现有文献。 - A3（权重的矩条件）：\(w_{ij}\)的四阶矩存在，且\(Var(w_{ij}) > 0\)。这是本文新增的假设（数据处理中可满足）。 - 关于minimax部分：额外假设备择分布属于Sobolev球\(\mathcal{F}(s, L)\)（s阶平滑，半径L），且核为高斯核。这与Li & Yuan (2019)的设定保持一致，未做强化或放松。

主要结果¶

定理 2.2（渐近正态性，零假设下）：

设(A1-A3)成立。在\(H_0\)下，
\[> \frac{T_n}{\hat{\sigma}_n} \xrightarrow{d} N(0,1), \quad n \to \infty >\]
且收敛速度为\(O(n^{-1/2})\)。

直觉：随机权重\(w_{ij}\)使得\(T_n\)的Hájek投影不再是零（传统HSIC投影在\(H_0\)下为零），而是一个一阶U-统计量，其均值为零但方差非退化。方差估计\(\hat{\sigma}_n^2\)一致估计条件方差。
必要条件：权重的独立性与四阶矩存在性不可或缺。如果权重被设置为常数（如\(w_{ij}=1\)），则退化为经典HSIC的退化问题。
技术难点：证明方差估计\(\hat{\sigma}_n^2\)在概率上收敛到真实方差，且不依赖数据分裂。作者通过将\(\hat{\sigma}_n^2\)展开为多个U-统计量的组合，并利用高阶Efron-Stein不等式控制收敛速度。

定理 2.7（minimax最优性）：

对Sobolev球\(\mathcal{F}(s, L)\)内的备择分布，假设核为高斯核且带宽\(\sigma_n = n^{-1/(2s+d)}\)（随n发散），则Random-Lifter检验的最小可测分离率（minimax separation rate）为：
\[> \rho_n \asymp n^{-\frac{2s}{4s + d_X + d_Y}} >\]
对照：Li & Yuan (2019)证明的最优率为\(\rho_n^{\text{opt}} \asymp n^{-\frac{2s}{4s + d_X + d_Y}}\)，二者相同——即Random-Lifter在常数因子范围内达到最优。

直觉：这是对Li & Yuan (2019)结论的直接推广——既然Random-Lifter在\(H_0\)下可以直接用正态分布做阈值，且它的统计效能（测试的\(T_n\)在备择下的均值-方差比）与HSIC的相同（只差常数因子），所以minimax率自然继承。
需注意：该最优性仅在核带宽适当发散的条件下成立，且常数因子可能比Li & Yuan的检验差一些（作者承认“minimal adjustment to constant factors”）。用户需要独立评估“常数因子”在实际样本量下的影响。

命题 2.3（一致性，备择假设下）：

对任意固定备择分布（即\(H_1\)不随n改变），若该分布满足\(E[\tilde{K}_X(X, X') \tilde{K}_Y(Y, Y')] \neq 0\)（即关联度量在总体下非零），则检验的效力渐近趋近于1。

这是常规结果：如果关联度量是可检测的（总体非零），则学生化的\(T_n\)会发散到无穷，从而以概率1拒绝。

证明路线与技术技巧¶

整体路线（3-5步逻辑主干）：

U-统计量分解：将\(T_n\)写成U-统计量形式，计算其Hájek投影。传统HSIC（无权重）的第一投影是0（退化）；本文因有权重，投影为：
\[\hat{T}_n = \frac{1}{n} \sum_{i=1}^n \left[ \frac{1}{n} \sum_{j\neq i} w_{ij} \tilde{K}_X(X_i,X_j) \tilde{K}_Y(Y_i,Y_j) \right]\]
该项均值为零、方差非零且可以用样本计算。
随机权重的平滑效应：证明投影的方差严格正且可以一致估计。关键工具：对权重\(w_{ij}\)的条件期望进行显式计算（因为\(w_{ij}\)与数据独立，条件期望就是数据的某个矩）。
CLT for non-degenerate U-statistics：投影部分\(\hat{T}_n\)是U-统计量的一阶项（非退化），直接应用经典U-统计量CLT得到渐近正态。剩余项（投影残差）是退化部分，但被权重和核的有界性控制，其贡献（协方差矩阵）在方差估计被damping。
方差估计的收敛性：构造\(\hat{\sigma}_n^2 = \frac{1}{n^4} \sum_{i,j} w_{ij}^2 (\tilde{K}_{X,ij} \tilde{K}_{Y,ij})^2 + \text{cross-term}\)。证明其相合性时，需要处理高阶U-统计量的弱收敛——这是本文最重技的部分：
先将\(\hat{\sigma}_n^2\)展开成多个U-统计量（阶数可达4）。
利用分解对称核为谱表示（Mercer's theorem + Karhunen-Loève）将方差的波动归因于核特征值的收敛。
然后用“从单个Cramér型到大块Lindeberg”的论证方式——实际上是把退化U-统计量的CLT与权重的随机扰动结合起来。
组合：用Slutsky定理组合（非退化投影）+（退化剩余→0）+（方差估计相合），得到学生化统计量→N(0,1)。

关键跳跃点： - 最吃劲的引理（Lemma 3.4）：证明方差估计\(\hat{\sigma}_n^2\)与真实方差之比依概率收敛到1。证明中需处理双重随机性（数据结构随机 + 权重随机），避免条件方差爆炸。作者通过: (1) 先将数据固定，对权重取期望 => 得到条件方差\(V_n\); (2) 证明\(V_n\)依概率收敛到恒定极限; (3) 再证明\((\hat{\sigma}_n^2 - V_n)/V_n = o_p(1)\)。第(3)步主要靠Efron-Stein不等式加上核的有界性。

技术技巧点名： - U-统计量的高阶展开：用以证明方差估计的收敛性（用到deg=4的U-统计量 ويكون需要组合对称核）。 - Efron-Stein不等式：控制高阶U-统计量方差的增长。 - Mercer-Karhunen-Loève谱分解：将核\(\tilde{K}_X, \tilde{K}_Y\)表示为正交特征函数和特征值的和，用于计算退化部分的渐近方差。 - Stirling公式随机化：用于计算权重乘积的期望（因为权重是Rademacher或类似分布，涉及\(E[w_{ij}w_{kl}w_{pq}...]\)时需处理图结构中的匹配对数）。 - Minimax下界比照：minimax optimality部分的证明实质上是引用Li & Yuan (2019)的下界结果，再证明本检验可以达到该下界的常数阶倍数。

真实例子与应用¶

模拟实验： - 设置：\(X \in \mathbb{R}^5, Y \in \mathbb{R}^5\)，取自各种依赖结构（线性、正弦、圆环分类、旋转、混合高斯等）。 - 方法对比：与HSIC（permutation p值）、dCov（permutation p值）、Ball Cov、xHSIC（交叉统计量）、RDC（随机依赖系数）进行对比。 - 结果： - type-I error控制：Random-Lifter在所有模拟设定下都维持了接近标称水平（0.05），与permutation-based的HSIC/dCov相当，而xHSIC在某些高维依赖设定下有轻微膨胀。 - 统计效力：在大多数依赖模式上，Random-Lifter的效力差距在5个百分点以内（与HSIC-permutation相比）；在少数高非线性模式（如X形依赖）下，Random-Lifter略好于HSIC但不如Ball Cov。 - 计算时间：Random-Lifter比permutation HSIC（B=1000）快约10-20倍（因为不需要重复计算）：n=500时，Random-Lifter约0.2秒，permutation HSIC约6秒。 - 这个例子想说明：Random-Lifter重新获得了permutation-free带来的计算优势，且统计效能的损失很小（“常数因子”级别）。

真实数据： - 应用：使用脑电图数据（EEG，UCI Archive “EEG Eye State”）——源是单通道EEG时间序列（n=14980），目标是对照实验记录的眼睛状态（开/闭）。 - 怎么用：将EEG时间序列按时间窗口切成多个维度（如64维），然后测试两个窗口之间的独立性（检验不同时间点的EEG是否独立）。这是一个多元独立性检验问题（每个窗口是高维向量）。 - 结果： - Random-Lifter与HSIC-permutation在5%水平下的拒绝率几乎一致（0.98 vs 0.97）。 - 计算时间上Random-Lifter仅0.03秒（n=1000子集），permutation HSIC需~3.5秒（B=500）。 - 想说明：在大规模时间序列数据上，Random-Lifter的免permutation优势变得显著——因为EEG数据涉及到对很多时间窗口对进行测试，每个窗口对做一遍permutation测试的累积成本极高。

🔎 结论是否比证明窄¶

正面：minimax optimality的证明比论文声称的“minimax最优”稍窄——因为minimax部分仅针对高斯核（对于其他核的最优性未覆盖），且仅针对Sobolev球设定（Softness type），未覆盖其他常见平滑类（Nikol'skii、Besov等）。作者在正文中清楚区分了这一点：“在Sobolev球设定下，我们达到了Li & Yuan (2019)的最优率”（Theorem 2.7）。所以结论并未claim比证明更宽。
边界问题：在Theorem 2.7的陈述里，作者说“our test attains the optimal minimax rate”，但同一节的Remark 2.8提到“the constant factor may be larger than that of HSIC”。所以严格说法应该是“achieves optimal rate up to constant”。这不是严重的claim inflation，但用户应注意到常数因子在实际样本中可能很重要。
汇总：本文在结论的严谨性上做得挺好，没有明显出现“证明A但 claim B”的情况。minimax部分只grognard了该设定下的最优性，且明确给出了常数因子的预留空间。

四、开放问题（点到为止）¶

能否放松权重的独立性假设？ 文章假设\(w_{ij}\)与数据独立，且\(w_{ij}\)是i.i.d.。实际应用中，如果要从数据本身生成权重（如用数据某维度的置换），是否会破坏正态性结论？该问题扎根于限制条件 (A3) 和Lemma 3.1中权重矩条件的推导。
高维扩展问题：本文的所有理论都在固定维度\(d_X, d_Y\)下建立。当维度随n发散时（如\(d_X = d_Y = p_n \to \infty\)），Random-Lifter的退化-非退化转换是否还能正常工作？核在高维下的特征值谱快速衰减可能会恢复退化性。该问题扎根于文章的讨论段（Section 5：“目前的工作未考虑维度发散的情形”）。
计算复杂度优化：本文统计量是\(O(n^2 k)\)（k是每个随机提升的维数）。使用tensor-network / einsum加速方案（如利用\(w_{ij} = \xi_i \eta_j\)的乘积结构可将计算复杂度降为\(O(n d k)\)）是否可行？此处与研究者自己的higher-order U-statistics计算（treewidth / einsum）直接相关。该问题扎根于Section 3.2中权重矩阵显式乘积结构的说明——使用因式分解形式可以改变计算顺序。
多变量联合独立性检验：本文将独立性检验限制在两变量（\(X \perp Y\)）。扩展到多变量（\(X_1, \ldots, X_d\)联合独立）时，Random-Lifter的构造是否能直接推广（需要对每个层次引入新的随机维度）？是否有组合爆炸？该问题扎根于文章的讨论段（“扩展到多于两个随机对象的检验是一个有价值的未来方向”）。

提醒：要确认第（2）条是不是真gap，建议快速浏览Gao & Shao (2021)和Gao et al. (2019)的abstract与结论——它们都涉及维度发散时的独立性检验正态性，而本文未引用这两篇工作。若这两篇已在维度发散条件下证明了非退化+正态性（分别用\(\frac{p}{n} \to c\)和\(p \to \infty, \log p / n \to 0\)），则第（2）条可能关联不大（只是不同设定），但仍可作为探索不同渐近框架的切入点。

Maintained by 陈星宇 · Homepage · Source on GitHub