跨篇综合 · 数理统计 / 假设检验¶

子方向: 数理统计 / 假设检验
期刊范围: core
聚合期刊论文数: 11
生成日期: 2026-06-02

本页由跨篇综合自动生成：从近期期刊精读里归纳反复出现的开放问题、张力与迁移空位。不打分、不排名，每条点名来源论文 [k]，供你自己判断。

一、这个子方向的全景¶

这批论文共同追问的核心是：在复杂结构（高维、非稀疏、相依、误设定、对抗污染）下，如何突破传统独立/稀疏/正确模型假设，构造具有理论保证（渐近分布、minimax率、大偏差界）且计算可行的检验与决策规则。主流路线有三条：一是基于Neyman正交/高阶影响函数（HOIF）+交叉拟合的半参数去偏推断（[3][6][11]）；二是基于局部熵/大偏差/低次多项式刻画信息与计算的极限相变（[1][2][4]）；三是利用矩约束/秩条件/群代数结构重构检验统计量的代数与几何形状（[5][9][10]）。整体停滞点在于：当结构复杂度超出传统假设时，正交框架的偏差控制失效、计算相变间隙缺乏可达算法、高阶矩/张量检验的计算复杂度爆炸，且三者之间尚未形成统一理论。

二、反复出现的开放问题¶

① 高阶矩/张量检验的计算复杂度爆炸与优化空位：[5][6][9][11]均指出，当检验统计量涉及高阶U-统计量、子行列式或张量外积时，直接计算不可行。需证/估：如何通过incomplete U-统计量设计、treewidth优化或tensor contraction（einsum）寻找最优收缩顺序，以将计算复杂度从指数级降至多项式级甚至线性级。卡在：高阶矩检验的代数结构（如累积量张量秩）与计算图最优收缩顺序的映射关系尚未建立。 ② Neyman正交/双重稳健对nuisance估计误差容忍度的极限与高阶推广：[3][6][11]均指出，一阶正交/双重稳健要求nuisance误差乘积或收敛速率达到\(O(n^{-1/2})\)，在复杂非参数/高维设定下过强。需证/估：引入HOIF（高阶影响函数）能否将容忍度从\(n^{-1/2}\)提升至\(n^{-\alpha}(\alpha<1/2)\)，以及高阶正交CI检验统计量的具体形式与偏差拆解。卡在：HOIF的K-th order正交性与条件分布乘积/拟似然交叉项的代数结合缺乏显式构造，且方差控制框架未推广至高阶。 ③ 相依/非稀疏/误设定结构下检验的minimax最优性与相变刻画：[1][2][4][7][11]均指出，传统检验在相关假设、非稀疏差分或方差误设定下失效。需估/算：在相关compound decision（[1]）、星形约束污染（[2]）、非稀疏变点（[7]）、超高维误设定GLM（[11]）下的minimax检测率下界，以及信息-计算间隙的精确位置。卡在：局部熵/大偏差率函数与minimax下界的Fano论证在相依/非稀疏/误设定下的统一隐式方程尚未解出。 ④ 复合零假设/弱重叠性下的尺寸控制与偏差爆炸：[3][5][10]均指出，当零假设复合（如MCAR兼容性、复合CI）或存在弱重叠性（倾向性得分趋0/1）时，nuisance估计的二阶偏差不可忽略，导致size偏离。需证/算：如何通过截断/正则化/样本分割在非渐近层面控制误差，且不损失过多功效。卡在：正交得分函数在边界/奇异点处的非渐近展开缺乏精确的Hoeffding/Edgeworth控制。

三、张力 / 矛盾¶

① FDR框架下separable rule的最优性分歧：[1]指出在真实FDR约束下separable rule（如BH）渐近严格次优，必须用compound rule；而已有文献（Storey 2002等）在mFDR框架下证明separable rule可达最优。两者对同一权衡问题的最优决策机制刻画矛盾，调和需证真实FDP的高概率控制与mFDR期望控制的渐近等价/退化条件。 ② 样本分裂的必要性分歧：[3]宣称通过更强光滑性假设与Neyman正交可完全避免sample splitting获得渐近分布；而[6][11]及DML框架依赖cross-fitting控制nuisance偏差。两者在处理nuisance偏差的技术路线上矛盾，调和需证正交构造在何种光滑度/误差条件下可免除样本分裂，以及交叉拟合在弱光滑下的不可替代性。 ③ 置换检验群大小的势与有效性分歧：[10]证明子群置换（如符号翻转）因保留信号方向一致性而势远优于全置换，且计算更省；传统信条及部分文献认为全置换提供最精确的null分布。调和需在极值理论与群代数结构下，量化“信号稀释”与“null分布精确度”之间的权衡。 ④ 线性后悔与非线性后悔下随机化规则的完备性分歧：[8]证明对严格凸后悔（如均方后悔），单点规则不再本质完备，推翻Manski (2004)在线性后悔下的经典结论。调和需证后悔函数的凸性如何改变决策类的拓扑与风险极值，并给出有限随机化类成为本质完备类的充要条件。

四、迁移空位（接研究者武器库）¶

① 高阶U-统计量/tensor contraction优化高阶矩检验计算：空位在[5]的SDP对偶矩阵运算、[6]的GNN乘积误差U-统计量、[9]的子行列式U-统计量。武器：高阶U-统计量的einsum/tensor contraction/treewidth计算。第一步：将[9]的子行列式核函数表示为张量网络，计算其treewidth，寻找最优einsum收缩顺序以替代显式高阶矩遍历；对[5]的缺失模式超图，将SDP对偶最优性条件转化为矩阵乘法序列的contraction cost问题。 ② HOIF提升半参数检验的nuisance容忍度：空位在[3]的CATE异质性检验（容忍度\(n^{-1/4}\)）与[6]的CI检验（容忍度乘积\(o(n^{-1/2})\)）。武器：高阶影响函数（HOIF）与minimax下界。第一步：为[3]的influence function得分检验构造二阶正交HOIF，将nuisance误差容忍度从\(n^{-1/4}\)放松至\(n^{-1/6}\)，并用einsum表示二阶HOIF核的方差控制；对[6]，推导K阶GNN误差乘积条件\(\varepsilon_X \varepsilon_Y = O(n^{-\alpha})\)下的HOIF-CI检验统计量，并用minimax下界证明\(\alpha\)的紧性。 ③ minimax下界刻画非稀疏/相依/误设定的检测极限：空位在[1]的相依compound oracle间隙、[2]的星形约束污染率、[7]的非稀疏变点检测率、[11]的误设定GLM检验功效。武器：minimax下界与高维渐近。第一步：对[7]的LCS检测量，将信号强度参数化为\(\|\Sigma^{1/2}\delta\|_2\)，利用Fano引理+局部pack构造推导非稀疏差分下的minimax检测率下界，并与LCS的扫描率比较证匹配；对[1]，将相关结构引入大偏差率函数，推导从compound oracle到MLE-插件曲线的间隙渐近界。 ④ 大偏差/局部熵统一计算-统计相变：空位在[4]的low-degree检测间隙与[2]的局部熵隐式方程。武器：高维渐近与大偏差理论。第一步：将[2]的局部熵隐式方程\(N\eta^2/\sigma^2 = \log M_K^{loc}(\eta,c)\)推广至[4]的CSBM设定，计算相关子图计数统计量的局部pack数，试图用局部熵统一解释low-degree barrier与KS阈值的计算相变。

本页聚合的论文¶

[1] Large-scale multiple testing: Fundamental limits of false discovery rate control and compound oracle — Annals of Statistics (2026-05-26)
[2] Information theoretic limits of robust sub-Gaussian mean estimation under star-shaped constraints — Annals of Statistics (2026-05-26)
[3] Nonparametric tests of treatment effect homogeneity for policy-makers — Journal of the American Statistical Association (2026-05-26)
[4] A computational transition for detecting correlated stochastic block models by low-degree polynomials — Annals of Statistics (2026-05-26)
[5] Tests of missing completely at random based on sample covariance matrices — Annals of Statistics (2026-05-26)
[6] Doubly robust conditional independence testing with generative neural networks — Journal of the Royal Statistical Society Series B (2026-05-26)
[7] Detection and inference of changes in high-dimensional linear regression with nonsparse structures — Journal of the Royal Statistical Society Series B (2026-05-26)
[8] Treatment choice with nonlinear regret — Biometrika (2026-05-26)
[9] Goodness-of-fit tests for linear non-Gaussian structural equation models — Biometrika (2026-05-26)
[10] More power by using fewer permutations — Biometrika (2026-05-26)
[11] Inference for possibly misspecified generalized linear models with nonpolynomial-dimensional nuisance parameters — Biometrika (2026-05-26)

Maintained by 陈星宇 · Homepage · Source