AoS — Vol 52 Issue 4 · 2026-06-20¶

共 23 篇 · Annals of Statistics
目录核对 ✅ 23 篇全部抓到（对照 OpenAlex 23 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

这一期《AoS》第52卷第4号共23篇论文，整体上围绕因果推断与半参数效率、非参数与非光滑估计的理论与方法、高维随机矩阵与矩阵结构推断、假设检验的新框架与精度分析四条主线展开。因果推断方向的三篇工作分别从连续处理效应的非参数双稳健检验、希尔伯特值参数的一步估计（涵盖剂量反应函数、CATE等因果量）、以及迁移学习下的多重稳健风险估计入手，在半参数效率与因果识别上各有推进。非参数方向覆盖了SPDE系数估计、重尾贝叶斯自适应、粗糙波动率minimax理论、单调函数推断的bootstrap修正、深度ReLU网络在重尾噪声下的稳定性、非光滑随机逼近的渐近正态性、高斯混合的Wasserstein–Fisher–Rao梯度流、去卷积模型的Wasserstein收敛、高维加性回归的函数型Lasso、以及非线性PDE数据同化的后验一致性，方法工具涵盖RKHS、经验过程、切线空间、最优传输等。高维随机矩阵方面集中在矩阵Schatten范数的minimax估计、发散维度比下低秩矩阵估计的信息论极限、以及矩阵值时间序列双向因子变点在线检测。假设检验部分则覆盖稀疏序列的sharp minimax边界、群不变e-statistics的anytime-valid检验、batching方法的高阶Edgeworth展开、高维函数时间序列均值断点检测与估计（CUSUM+功率增强）、以及分布式差分隐私下的符号选择（多数投票+指数机制）。此外还有一篇专门讨论高斯变分推断的逼近精度上界。

因果推断与半参数效率是本期最集中的方法学贡献线。A nonparametric doubly robust test for a continuous treatment effect 针对连续处理变量构造了局部双稳健估计量的加权积分检验统计量，利用U-和V-过程渐近理论并给出wild bootstrap程序，填补了该领域非参数推断空白。One-step estimation of differentiable Hilbert-valued parameters 将交叉拟合一步估计量推广到取值于希尔伯特空间的参数（如反事实密度、剂量反应函数），在RKHS情况下达到半参数有效，并在无RKHS时提出正则化方案。Efficient and multiply robust risk estimation under general forms of dataset shift 在迁移学习框架下推导目标风险的高效影响函数，构建多重稳健估计量并给出模型误设下的鲁棒性保证，直接连接半参数效率理论与实际偏移模式。

高维随机矩阵与矩阵推断是另一条突出的计算与理论交织的线索。Optimal estimation of Schatten norms of a rectangular matrix 针对偶数阶Schatten范数构造多项式时间估计器达到minimax最优率，非偶数情形用多项式逼近得到紧界，副产品刻画了奇异值序列的估计率。Fundamental limits of low-rank matrix estimation with diverging aspect ratios 突破固定维度比设定，在发散维度比下刻画Bayes最优误差的渐近性质，发现信号强度区间内左右奇异向量可恢复性不一致的现象，工具涉及随机矩阵理论与AMP。Online change-point detection for matrix-valued time series with latent two-way factor structure 利用变点导致spiked eigenvalue数量增加这一观察，构造基于部分和与极值的监测程序，理论保证consistency和size control。

与因果推断/半参数效率最贴近的：A nonparametric doubly robust test for a continuous treatment effect（连续处理效应推断）、One-step estimation of differentiable Hilbert-valued parameters（函数值因果参数的有效估计）、Efficient and multiply robust risk estimation under general forms of dataset shift（迁移学习下半参数效率界）。与高维/随机矩阵最贴近的：Optimal estimation of Schatten norms of a rectangular matrix、Fundamental limits of low-rank matrix estimation with diverging aspect ratios、Online change-point detection for matrix-valued time series with latent two-way factor structure。

因果推断 (causal_inference, 2 篇)¶

1. 10.1214/24-aos2405 · arXiv — A nonparametric doubly robust test for a continuous treatment effect¶

作者: Charles R. Doss, Guangwei Weng, Lan Wang, Ira Moscovice, Tongtan Chantarat
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 9/10 · novelty: new_method
摘要: 本文针对连续型处理变量在观察性研究中的推断问题，提出了完全非参数的双稳健检验方法，目标是对处理效应曲线进行假设检验而非仅估计。估计采用局部双稳健估计量（doubly robust），同时校正倾向性函数和条件结局均值；检验统计量基于该估计量的局部加权积分构造。利用局部U-过程和V-过程的经验过程理论建立了检验统计量的渐近分布，并提出了wild bootstrap程序进行有限样本推断。作者将方法实现在R包DRDRtest中，通过模拟和护士工时对医院绩效的实例验证了有效性。该工作填补了连续处理效应非参数推断的空白，是方法学上的重要贡献。
关键技术: doubly robust estimation, local U-processes, local V-processes, wild bootstrap, empirical process theory, nonparametric kernel estimation
为什么对您有用: 本文直接涉及因果推断中连续处理效应推断这一具体子方向，且是非参数双稳健假设检验，与您的主要兴趣（因果推断、假设检验、非参数理论）高度吻合。论文使用的局部U-过程经验过程理论，您可以凭借已有的'非参数统计'和'因果推断估计理论'（very_familiar）深入理解其渐近论证；同时，您对'高阶U-统计量'（moderately_familiar）的了解有助于审视其与经典U-统计量理论的联系与创新。立即可做：该论文的核心非参数技术已在您的武器库中，您可以立即阅读并考虑将其思想迁移至proximal causal inference或敏感性分析中的连续处理情形。

2. 10.1214/24-aos2403 · arXiv — One-step estimation of differentiable Hilbert-valued parameters¶

作者: Alex Luedtke, Incheoul Chung
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 9/10 · novelty: new_method
摘要: 本文针对路径可微的光滑希尔伯特值参数提出估计方法。目标是在非参数或半参数模型下估计一个取值于希尔伯特空间的参数（如函数），并利用路径可微条件刻画光滑性。核心方法是推广交叉拟合一步估计量，其构建基于希尔伯特值有效影响函数。当参数空间为再生核希尔伯特空间（RKHS）时，该估计量达到 n^{-1/2} 收敛速率且半参数有效，并可以构造相应的置信集。对于没有再生核的希尔伯特空间，作者发现许多路径可微的参数并不存在有效影响函数，为此提出正则化的一步估计量并给出置信集。文中给出多个因果推断中常见的例子：反事实密度函数、剂量反应函数、条件平均处理效应函数、以及反事实核均值嵌入。这些例子直接连接因果推断中的函数参数估计问题，对您在因果推断框架下处理连续处理变量或条件效应的识别与估计有参考价值。
关键技术: cross-fitted one-step estimator, Hilbert-valued efficient influence function, pathwise differentiability, reproducing kernel Hilbert space, regularized one-step estimator
为什么对您有用: 本文直接针对因果推断中的函数参数（如剂量反应函数、CATE）提出理论严谨的估计框架，属于因果推断中估计理论的核心子方向。您可以用'very_familiar'中的'estimation theory in causal inference'和'high-dimensional asymptotics'快速理解其一步估计量的收敛性和正则化条件；用'moderately_familiar'中的'semiparametric theory'来分析其有效影响函数的推导。该框架可立即应用于您目前处理的因果推断问题（如连续处理变量的剂量反应或条件效应），属于'立即可做'的范畴。

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)¶

1. 10.1214/24-aos2374 · arXiv — Optimal estimation of Schatten norms of a rectangular matrix¶

作者: Solène Thépaut, Nicolas Verzelen
期刊/来源: Annals of Statistics
机构: Laboratoire de Mathématiques d'Orsay · Université de Montpellier · Institut National de Recherche pour l'Agriculture, l'Alimentation et l'Environnement
分类: vol 52 · issue 4
相关性 9/10 · novelty: new_method
摘要: 本文研究从噪声观测中估计矩形矩阵 Schatten 范数和有效秩的 minimax 最优率。当 s 为偶数时，构造了多项式时间估计器，达到与矩阵秩无关的 minimax 率 (pq)^{1/4}。当 s 非偶数时，简单的奇异值阈值估计器达到 (q∧p)(pq)^{1/4} 率（乘对数因子后最优）；更精细的多项式逼近方法得到紧的 minimax 率。作为副产品，还刻画了奇异值序列的 minimax 估计率。该工作与您关注的高维统计与随机矩阵理论直接相连，其中 minimax 界的推导可借助您熟悉的 minimax bounds 技术分析，奇异值渐近性质也匹配 high-dimensional asymptotics 的武器。
关键技术: Minimax optimal estimation, Schatten norm estimation, Singular value thresholding, Polynomial approximation, Effective rank estimation
为什么对您有用: 论文属于高维统计与随机矩阵理论，是您 primary interest 中矩阵函数 minimax 估计的经典问题。您 very_familiar 中的 minimax bounds for estimation problems 可直接用于检查本文下界构造的紧性；high-dimensional asymptotics 可用于分析估计量的渐近分布。立即可做：您对 minimax 界和高维渐近已足够熟练，可快速理解全文并考虑将偶数次 Schatten 范数与更高阶 U 统计量的张量网络复杂度相联系。

2. 10.1214/24-aos2400 · arXiv — Fundamental limits of low-rank matrix estimation with diverging aspect ratios¶

作者: Andrea Montanari, Yuchen Wu
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 8/10 · novelty: new_theory
摘要: 本文研究低秩矩阵估计在加性高斯噪声下的因子估计问题，重点处理维度比发散（\(d/n \to \infty\) 或 \(d/n \to 0\)）的高维情形，推广了此前仅针对比例渐近（\(d/n \to \delta \in (0, \infty)\)）的结果。作者在已知因子条目分布的条件下，刻画了最小估计误差的渐近性质，并给出了一个有趣的信号强度区间：左奇异向量可部分恢复，而右奇异向量完全无法恢复。技术工具依赖于随机矩阵理论与Bayes最优估计的渐近等价性，可能涉及旋转不变模型和AMP（近似消息传递）框架。数值部分以高斯混合聚类为例验证理论，并应用于基因组学数据。该结果为高维PCA与谱方法的极限性能提供了精确刻画，对理解高维统计中的非对称信噪比效应有重要意义。对您而言，本文直接关联高维统计与随机矩阵理论中的发散维度比设定，是RMT在估计问题中的前沿进展。
关键技术: Bayes-optimal estimation, asymptotic analysis of singular vectors, diverging aspect ratio regime, spiked covariance model, rotationally invariant model, Gaussian mixture clustering
为什么对您有用: 直接连接到高维统计与随机矩阵理论中发散维度比（\(d/n \to \infty\)）的核心子方向，恰好是您primary interest中RMT部分的前沿课题。您对高维渐近和minimax界非常熟悉（very_familiar），可立即用于验证本文声称的渐近最优误差是否在经典minimax框架下达到下界，也可尝试将结果推广到更一般的噪声分布或稀疏因子结构。此外，本文与统计-计算权衡有隐秘关联（信号强度区域的分界可能对应计算阈值），可作为进入该方向的门户文献——您的RMT基础足以理解渐近部分，但若想深入计算下界（如低度多项式屏障），需在moderately_familiar的SoS工具上补课。总体而言，立即可做：用您已有的高维渐近与随机矩阵工具箱复现核心结论并探索推广。

3. 10.1214/24-aos2410 · arXiv — Online change-point detection for matrix-valued time series with latent two-way factor structure¶

作者: Yong He, Xinbing Kong, Lorenzo Trapani, Long Yu
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 8/10 · novelty: new_method
摘要: 在矩阵值时间序列的双向因子模型设定下，本文研究因子结构变点的在线检测问题。核心观察是：存在变点时，因子模型可重写为具有更多公共因子的模型，导致数据二阶矩矩阵的 spiked eigenvalue 数量增加。基于此，作者提出两类监测程序——基于部分和波动与基于极值理论——监控第一个非 spiked eigenvalue 是否在监测窗口内发散。方法仅依赖收敛速率：在每个时间点对估计的 eigenvalue 进行随机化，构造出零假设下 i.i.d. 正态分布、变点存在时发散至正无穷的监测序列。理论证明了监测程序的 consistency 与 size control，模拟与实证分析支持了方法有效性。对您有用：将 RMT 的 spiked eigenvalue 机制直接用于在线变点检测，为高维因子模型的序列监测提供了新视角。
关键技术: matrix-valued factor model, spiked eigenvalue monitoring, online change-point detection, partial sum fluctuation test, extreme value theory threshold, eigenvalue randomisation
为什么对您有用: 直接连接到 primary interest 中的高维统计与随机矩阵理论（RMT），将 spiked eigenvalue 的数量变化作为因子结构变点的识别信号，是 RMT 在序列监测中的具体应用。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来审视其 eigenvalue 速率论证的紧性，moderately_familiar 的 M-estimation theory 可用于思考该随机化监测序列的极限分布推导。follow-up 判断：立即可做——用您熟悉的 RMT spiked model 知识验证其非 spiked eigenvalue 发散速率的 minimax 紧性，并可探索将此在线监测框架移植到更高阶 tensor factor 模型。

非参数 / 半参数 (nonparam_semipara, 11 篇)¶

1. 10.1214/24-aos2364 · arXiv — Optimal parameter estimation for linear SPDEs from multiple measurements¶

作者: Randolf Altmeyer, Anton Tiepner, Martin Wahl
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 9/10 · novelty: new_theory
摘要: 本文研究从多个空间局域测量中估计线性SPDE的系数，假设空间分辨率趋于零且测量数非减。目标是推导各系数估计的收敛速率并建立极小化最优性，同时刻画一致估计的充要条件。作者基于对一般随机演化方程再生核希尔伯特空间（RKHS）的显式分析，引入了一种Gaussian下界方案，从而获得速率下界。结果表明，各系数的收敛速率依赖于其微分阶数，高阶系数的速率更快，且该速率是极小化最优的。技术工具包括RKHS结构、Gaussian信息不等式等。该文的研究问题本质上属于带随机噪声的逆问题参数估计，与您的“逆问题（带随机噪声）”和“极小化界”方向高度契合；其中的Gaussian下界方案可作为新工具，用于其他非参估计问题的下界推导。
关键技术: Gaussian lower bound scheme, reproducing kernel Hilbert space, minimax optimal rate, stochastic evolution equation, multiple localised measurements
为什么对您有用: 该文处理的线性SPDE系数估计正好对应您技术工具中“逆问题（带随机噪声）”这一方向，且全文围绕极小化最优速率展开，直接使用您非常熟悉的minimax下界技术。文中提出的Gaussian下界方案是一个系统性的分析方法，可能迁移到其他非参估计问题（如函数型数据、反卷积）的下界证明中，属于中期可做的方向——您只需在“高维渐近”工具上稍作延伸即可。

2. 10.1214/24-aos2397 · arXiv — Heavy-tailed Bayesian nonparametric adaptation¶

作者: Sergios Agapiou, Ismaël Castillo
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 8/10 · novelty: new_method
摘要: 本文在非参数贝叶斯框架下提出一种基于重尾级数先验的新策略，以实现对未知光滑度的自适应估计。该方法无需像传统贝叶斯方法那样采样或选择超参数，而是通过先验的‘软选择’机制自动适应模型复杂度。在高斯回归模型中，后验分布在L2和L∞范数下均达到（对数因子内的）最优minimax收缩率。文章还将结果推广到线性逆问题、各向异性Besov类以及通过调整后验的更一般损失函数情形。数值模拟验证了理论方法的有效性。对您而言，本文为非参数自适应收缩提供了一种新的贝叶斯视角，其‘软选择’思想与您熟悉的minimax bound和非参数估计理论形成有益对照，或许可迁移至半参数或因果推断中的模型选择问题。
关键技术: heavy-tailed series priors, Bayesian nonparametric adaptation, minimax rates of contraction, tempered posterior, anisotropic Besov classes
为什么对您有用: 本文直接关联您primary interests中的非参数统计与minimax估计理论。文中利用重尾先验实现自适应收缩，其理论分析（收缩率、Besov光滑度）可借助您熟悉的非参数minimax工具进行验证和扩展；对于您熟悉的‘逆问题’设定，本文的线性逆问题结果也值得关注。目前您的武器库中的非参数minimax技术足以深入理解本文核心理论，属于立即可做的范畴。

3. 10.1214/23-aos2343 · arXiv — Statistical inference for rough volatility: Minimax theory¶

作者: Carsten H. Chong, Marc Hoffmann, Yanghui Liu, Mathieu Rosenbaum, Grégoire Szymansky
期刊/来源: Annals of Statistics
机构: Columbia University · Centre de Recherche en Mathématiques de la Décision · Baruch College · École Polytechnique · Centre de Mathématiques Appliquées de l'École polytechnique
分类: vol 52 · issue 4
相关性 8/10 · novelty: new_theory
摘要: 本文在粗糙波动率模型（fractional Brownian motion with H<1/2）下，首次对潜在一阶过程（波动率）的Hurst指数H进行严格的统计推断。目标是基于n个等距价格观测点，估计H，使得对latent volatility的regularity进行推断。方法上采用自适应小波估计技术，通过估计二次泛函（quadratic functional）来构造H的估计量，并建立minimax lower bound。主要理论结果是：当n→∞时，估计H的最优收敛速率为n^{-1/(4H+2)}，这一速率在H接近0时甚至接近n-consistent，打破了以往仅对H>1/2成立的局限。证明中综合运用了小波多分辨率分析、非参数minimax理论以及二次泛函估计的标准工具。对您而言，本文提供了一个非参数minimax理论在latent process推断中的新实例，与您非常熟悉的minimax bounds for estimation problems工具箱高度对接，立即可读并理解其下界构造和自适应策略。
关键技术: minimax lower bounds, adaptive wavelet estimation, quadratic functional estimation, fractional Brownian motion, optimal rate of convergence
为什么对您有用: 本文的核心方法是nonparametric minimax theory在latent parameter估计中的应用，恰好对接您primary interest中的nonparametric statistics与minimax bounds方向。您非常熟悉的minimax bounds for estimation problems可以直接用来解析其下界构造的紧致性，并将类似的自适应小波策略迁移到其他高维或因果推断中的二次泛函估计问题。立即可做：无需额外训练，凭现有的非参数和minimax工具箱即可深入这篇论文的方法学细节并做follow-up分析。

4. 10.1214/24-aos2402 · arXiv — Bootstrap-assisted inference for generalized Grenander-type estimators¶

作者: Matias D. Cattaneo, Michael Jansson, Kenichi Nagasawa
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_method
摘要: 在单调函数非参估计设定下，研究广义 Grenander 型估计量（如单调密度/回归的凸最小化估计）的大样本分布推断问题；目标 estimand 为未知平坦度（monomial order）的单调函数，关键假设为 i.i.d. 抽样与函数局部多项式平坦性。标准 nonparametric bootstrap 无法一致逼近该估计量的极限分布（即便已知 monomial order），因为极限分布是均值具未知阶数的 Gaussian process 凸最小化左导数。本文提出一种基于精心构造的自动变换的 bootstrap 辅助推断程序，通过变换使 bootstrap 分布一致逼近；该方法可做到 flatness-robust，即自适应函数未知的局部平坦度。推断仅需一致估计一个标量（平坦度阶数），作者给出了基于数值导数与 generalized jackknife 的自动估计程序，并在随机抽样下用 exchangeable bootstrap 实现。对您可能有用：本文的 generalized jackknife + 数值导数自动标量估计思路，可直接迁移到您 higher-order U-statistics / HOIF 中涉及未知收敛阶的推断问题。
关键技术: generalized Grenander-type estimator, greatest convex minorant, exchangeable bootstrap, generalized jackknife, flatness-robust transformation, numerical derivative estimation
为什么对您有用: 直接连接非参理论中单调函数推断这一经典子方向，其极限分布的 non-standard 性（Gaussian process GCM 左导数）与您熟悉的 higher-order U-statistics / HOIF 中非标准极限分布问题结构相似。技术口子：您 very_familiar 的 higher-order U-statistics 计算与 moderately_familiar 的 HOIF 理论可用来分析该变换估计量的更高阶展开，验证其 flatness-robust 自适应性是否达到 minimax sharp。Follow-up 粗判：立即可做——用 very_familiar 的 generalized jackknife 与数值导数工具即可复现并拓展其标量估计程序。

5. 10.1214/24-aos2428 · arXiv — How do noise tails impact on deep ReLU networks?¶

作者: Jianqing Fan, Yihong Gu, Wen-Xin Zhou
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: sharper_rate
摘要: 在非参数回归设定下，研究噪声仅具有有限 p 阶矩时深度 ReLU 神经网络的稳定性，目标 estimand 为具有层次复合结构的回归函数。核心发现是：普通最小二乘无法达到最优收敛率，而自适应 Huber loss 通过调节参数（随样本量、光滑度与矩参数适配）配合深度 ReLU 网络可达到该最优率，且最优率显式依赖于 p、光滑度与内在维度。同时给出了允许优化误差的 adaptive Huber ReLU 网络估计量的 concentration inequality。下界证明采用非传统路线：构造一个经验损失优于真实函数的深度 ReLU 网络，利用两者差异给出下界，此步关键依赖 ReLU 网络的逼近能力与 Huberization bias。作为副产品，本文也贡献了深度 ReLU 网络逼近理论的若干新结果。对您可能有用：本文将 heavy-tailed noise 与非参数 minimax rate 精确挂钩，直接丰富了您在非参数 minimax bound 与 M-estimation theory 上的技术储备。
关键技术: adaptive Huber loss, deep ReLU neural network approximation, minimax rate under finite moment, concentration inequality with optimization error, hierarchical composition structure
为什么对您有用: 本文直接连接到您 primary interest 中的非参数 minimax bound 与 semiparametric theory：它给出了 heavy-tail 下非参数估计的精确 minimax rate，并显式刻画了 p-th moment 对收敛率的影响。您武器库中 very_familiar 的 minimax bounds for estimation problems 与 moderately_familiar 的 M-estimation theory 可以直接攻入本文的 rate 表达式与下界构造策略（特别是其非传统下界证明路线）。立即可做：用您熟悉的 minimax 工具验证其声称的 rate 是否紧，并尝试将 adaptive Huber + ReLU 的思路迁移到您关心的 causal inference semiparametric 估计中的 heavy-tail 场景。

6. 10.1214/24-aos2401 · arXiv — Asymptotic normality and optimality in nonsmooth stochastic approximation¶

作者: Damek Davis, Dmitriy Drusvyatskiy, Liwei Jiang
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_theory
摘要: 在随机逼近（SA）框架下，目标是求解非光滑方程（如随机非线性规划、随机变分不等式）的根，核心假设为路径稳定性（path stability）与局部强凸性。本文证明，针对此类非光滑问题，Polyak-Juditsky 平均化 SA 算法仍满足渐近正态性。进一步，作者证明了该平均化估计量的渐近协方差矩阵在 Hájek-Le Cam 局部 minimax 意义下达到最优，即与光滑情形共享相同的效率下界。关键技术工具包括非光滑函数的微分稳定性分析、差分方程的稳定性理论以及局部渐近 minimax 理论。对您可能有用：本文为非光滑 M-estimator 的渐近效率提供了完整理论，直接连接到 semiparametric efficiency 与 M-estimation theory 这两个子方向。
关键技术: Polyak-Juditsky averaging, nonsmooth stochastic approximation, Hajek-Le Cam local minimax efficiency, path stability of differential inclusions, semigradient / differential stability
为什么对您有用: 本文直接连接到 semiparametric efficiency bounds 与 M-estimation theory 子方向，将经典的 Hájek-Le Cam 效率理论从光滑 SA 推广到非光滑变分不等式设定。用您 very_familiar 的 minimax bounds for estimation problems 可以直接验证其局部 minimax 下界的紧性，用 moderately_familiar 的 M-estimation theory 可以审视其非光滑路径稳定性假设与经典 M-estimator 一致性条件的对应关系。Follow-up 判断：立即可做——用现有 minimax 与 M-estimation 武器即可展开阅读与验证。

7. 10.1214/24-aos2416 · arXiv — Learning Gaussian mixtures using the Wasserstein–Fisher–Rao gradient flow¶

作者: Yuling Yan, Kaizheng Wang, Philippe Rigollet
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_method
摘要: 在 Gaussian mixture model (GMM) 设定下，目标是计算非参数极大似然估计 (NPMLE)，克服 EM 算法在简单例子中已知会失败的计算瓶颈。本文提出基于 Wasserstein–Fisher–Rao (WFR) 几何的梯度下降算法，在概率测度空间上同时优化粒子的位置与权重，并建立了收敛保证。核心机制是交替更新 interacting particle system 的权重与位置，相比仅优化位置的 Wasserstein 梯度下降，WFR 几何允许测度在位置与质量两个维度上同时演化。数值实验表明该方法在收敛速度与稳定性上优于经典 EM 及基于纯 Wasserstein 几何的梯度流。对您而言，该工作将 M-estimation 的计算与测度空间上的梯度流结合，为 semiparametric M-estimator 的非凸优化提供了新的计算视角。
关键技术: Wasserstein-Fisher-Rao gradient flow, nonparametric maximum likelihood estimation, interacting particle system, measure-valued gradient descent, Gaussian mixture model
为什么对您有用: 本文直接连接到 semiparametric theory 中的 NPMLE 计算难题，属于 M-estimation 在测度空间上的优化方法。您武器库中 M-estimation theory 与 software development 可以直接攻入该算法的实现与理论分析口子（如粒子数离散化误差的 minimax rate）。属于立即可做：用 very_familiar 的 minimax bounds 与 high-dimensional asymptotics 工具即可着手分析该 WFR gradient flow 在高维或 misspecified 设定下的收敛率。

8. 10.1214/24-aos2413 · arXiv — Wasserstein convergence in Bayesian and frequentist deconvolution models¶

作者: Judith Rousseau, Catia Scricciolo
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_theory
摘要: 在多变量去卷积（deconvolution）设定下，目标是从已知误差分布的加性污染观测中恢复信号分布，误差分布属于 ordinary smooth 类。核心机制是利用 L1-Wasserstein 距离与 max-sliced L1-Wasserstein 距离的等价性，将多维问题降维为一维，并建立新的 inversion inequality：将信号分布间的 L1-Wasserstein 距离与观测混合密度间的 L1 距离直接关联，该不等式优于现有结果。基于此，推导了信号分布的 L1-Wasserstein 收敛速率；在贝叶斯框架下，对一维 Laplace 噪声使用 Dirichlet process mixture of normals 先验，证明了后验分布以近乎 minimax-optimal 速率（仅差 log 因子）收缩，且自动适应混合密度的未知 Sobolev 正则性；在频率派框架下，构造了 minimum distance estimator 并证明其在任意维度 d≥1 下均达到 L1-Wasserstein 去卷积的 minimax 速率。对您可能有用：本文的 inversion inequality 与 max-sliced Wasserstein 降维技术为非参数逆问题中的 minimax 界提供了新工具，可直接连接到您熟悉的 inverse problems with random noise 与 minimax bounds 方向。
关键技术: max-sliced Wasserstein distance, inversion inequality, Dirichlet process mixture prior, posterior contraction rate, minimum distance estimator, ordinary smooth deconvolution
为什么对您有用: 本文直接推进了非参数去卷积与逆问题中的 minimax 理论，属于您 primary interest 中的 nonparametric theory 与 minimax bounds 子方向。您武器库中 very_familiar 的 inverse problems with random noise 与 minimax bounds for estimation problems 可直接用来审视本文的 inversion inequality 是否能推广到其他误差结构或 semiparametric 设定。follow-up 粗判：立即可做——用 minimax bound 技术验证该 inversion inequality 在部分 semiparametric 模型中的 sharpness，或尝试将 max-sliced 降维嵌入您熟悉的更高阶 U-statistic / HOIF 框架。

9. 10.1214/24-aos2415 — Efficient functional Lasso kernel smoothing for high-dimensional additive regression¶

作者: Eun Ryung Lee, Seyoung Park, Enno Mammen, Byeong U. Park
期刊/来源: Annals of Statistics
机构: Sungkyunkwan University · Yonsei University · Heidelberg University · Applied Mathematics (United States) · Seoul National University
分类: vol 52 · issue 4
相关性 6/10 · novelty: new_method
摘要: 本文针对高维加性回归模型（协变量数远大于样本量），提出一种结合函数型 Lasso 与核光滑后向拟合（smooth backfitting）的非参数估计方法。该方法通过在光滑后向迭代中引入截断投影算子实现变量选择，同时保持非参数分量的光滑性。理论部分证明了估计量的收敛速率和 oracle 性质，并在较弱的稀疏性条件下成立。进一步构造了去偏版本，实现分量函数的逐点置信区间和假设检验。算法仅比标准光滑后向拟合多一步阈值操作，计算高效。该工作直接连接您的高维统计与非参数理论兴趣，其中关于去偏推断的讨论也可与半参数效率理论交互。
关键技术: Smooth backfitting, Functional Lasso, Kernel smoothing, Truncated projection operator, Debiased estimation
为什么对您有用: 本文属于高维非参数回归这一核心兴趣方向，具体涉及非参数理论与高维统计的交叉。您的 very_familiar 武器库中 'nonparametric statistics' 和 'high-dimensional asymptotics' 足以直接理解其光滑后向估计与惩罚机制的理论分析，'minimax bounds' 可用于评估其收敛速率的紧性。立即可做：可尝试将函数型 Lasso 思想迁移到您熟悉的 U-统计量或因果推断中的非参数分量估计，或对比其去偏推断与您熟悉的半参数效率界方法。

10. 10.1214/24-aos2427 · arXiv — On posterior consistency of data assimilation with Gaussian process priors: The 2D-Navier–Stokes equations¶

作者: Richard Nickl, Edriss S. Titi
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 5/10 · novelty: new_theory
摘要: 在周期性二维 Navier–Stokes 方程的非线性贝叶斯数据同化设定下，目标是对初始条件进行统计推断与恢复，初始条件由 Gaussian process (GP) 先验建模，观测为带噪的速度场离散测量。核心机制基于 GP 先验的 Bayesian 非参数推断，利用二维 NS 方程解的 backward uniqueness 的显式定量估计，证明后验分布随样本量增加在真实解附近集中，且后验均值向量场一致恢复初始条件。收敛速率方面，一般情形下速率至多为逆对数率 (inverse logarithmic)，但在初始条件满足特定条件时可获得更快速率。对您可能有用：本文将非线性 PDE 的定量 backward uniqueness 与非参数 Bayesian 收敛率结合，为 inverse problems with random noise 方向提供了 PDE 先验约束下的 rate 界定范式。
关键技术: Bayesian nonparametric posterior consistency, Gaussian process prior, backward uniqueness of PDE solutions, inverse logarithmic convergence rate, 2D Navier-Stokes data assimilation
为什么对您有用: 本文直接连接 primary interest 中的 inverse problems with random noise 与 nonparametric theory，将 PDE 解的定量 backward uniqueness 作为先验约束推导 Bayesian 收敛率，是典型的非参数 Bayesian minimax 范式在非线性 PDE 上的应用。用 very_familiar 的 minimax bounds for estimation problems 与 inverse problems with random noise 武器，可以审视其逆对数率是否与 minimax lower bound 匹配，或探讨特定初始条件下的 faster rate 与 semiparametric efficiency 的关系。立即可做：用 minimax bound 工具验证其声称的速率界是否紧，并对比 classical linear inverse problem 的速率结构。

11. 10.1214/24-aos2406 · arXiv — Gromov–Wasserstein distances: Entropic regularization, duality and sample complexity¶

作者: Zhengxin Zhang, Ziv Goldfeld, Youssef Mroueh, Bharath K. Sriperumbudur
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 0/10 · novelty: new_theory
摘要: 本文研究 Gromov-Wasserstein (GW) 距离的对偶表示及其经验收敛速率，GW距离衡量两个度量空间之间的差异，常用于异质数据集的对齐。作者针对欧氏空间中不同维度 d_x、d_y 的二次 GW 距离，推导了标准 GW 和熵正则化 GW (EGW) 的对偶形式，将其转化为经典最优传输（OT）和熵正则化最优传输（EOT）问题。基于对偶表示，利用经验过程理论和势函数的正则性分析，首次建立了 GW 距离的经验收敛速率：标准 GW 为 n^{-2/\max{\min{d_x,d_y},4}}（对数因子当 min=4 时），EGW 为 n^{-1/2} 的参量速率，后者与 OT 和 EOT 的速率匹配并证明最优。此外，证明了标准 GW 的下界与上界匹配，以及 EGW 关于正则化参数的稳定性。本文的统计理论结果填补了 GW 距离在大样本方面的空白，且对偶形式为后续计算改进提供了新视角。对于您，本文的非参数收敛速率分析可直接利用您熟悉的 minimax 界工具进行验证，同时 GW 距离在异质性数据匹配中的应用（如因果推断中的匹配方法）可能成为您因果推断兴趣的扩展点。
关键技术: Gromov-Wasserstein distance, Entropic regularization, Empirical process theory, Convergence rates, Duality in optimal transport, Minimax lower bounds
为什么对您有用: 本文属于非参数统计与最优传输的交汇点，与您的主要兴趣（非参数理论、最小化界）直接对口。您熟悉的 minimax bounds 技术（very_familiar）可用于验证本文上界的紧性，或者延伸至其他度量空间的 GW 变体。此外，GW 距离的统计计算复杂性（如 tensor-contraction 视角）可能为您在统计计算（einsum 树宽）方向提供新问题——但本文不涉及计算，仅理论，属于暂不可做，因为核心机器（GW 对偶与经验过程）并非您的常用武器，但可中期通过学习 empirical process 用于运输问题的分析来弥补。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1214/24-aos2422 · arXiv — Efficient and multiply robust risk estimation under general forms of dataset shift¶

作者: Hongxiang Qiu, Eric Tchetgen Tchetgen, Edgar Dobriban
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 9/10 · novelty: new_method
摘要: 本文在迁移学习框架下研究目标群体风险的高效估计问题，目标群体数据有限，需要利用一个或多个辅助源群体数据。考虑广义的数据集偏移条件，涵盖协变量偏移、标签偏移、概念偏移等常见情形，并允许源目标支持部分非重叠。基于半参数效率理论，推导了目标风险的高效影响函数，构造了多重稳健估计量，该估计量在部分偏移条件误设时仍保持一致性。采用样本分割和交叉拟合技术实现高效推断，并开发了偏移条件的规范检验。在参数化/半参数模型框架下给出了半参数效率界，并证明了所提估计量达到该界。额外推导了后验漂移和位置尺度漂移两种偏移条件的效率界。模拟验证了利用偏移条件可获得显著效率增益，且多重稳健性在模型误设下表现良好。对您有用：本文方法可直接类比因果推断中的双重稳健估计，且效率界的推导与您的半参数效率理论兴趣高度契合，可利用您对 minimax bounds 和 nonparametric statistics 的熟悉程度来理解和扩展该框架。
关键技术: multiply robust estimation, semiparametric efficiency bound, efficient influence function, cross-fitting, domain adaptation, dataset shift conditions
为什么对您有用: 本文研究迁移学习中的风险估计效率问题，直接连接到您的效率理论与半参数推断兴趣，尤其是多重稳健估计量自身的效率性质。技术核心（半参数效率界、影响函数、交叉拟合）属于您 moderately_familiar 的 semiparametric theory 范畴，可在此方向深耕后转化为自身武器。同时，方法可类比因果推断中的双稳健和 proxmial 估计，您 very_familiar 的 nonparametric statistics 和 minimax bounds 可用于检验本文效率界的紧性。中期可做：需要先系统提升 semiparametric theory 熟练度，然后可尝试将本文的 multiply robust 框架推广至因果推断中的复杂识别设定（如 negative control 或纵向数据）或结合 higher-order U-statistics 构造更高阶的收敛速率。

数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶

1. 10.1214/24-aos2404 · arXiv — Sharp multiple testing boundary for sparse sequences¶

作者: Kweku Abraham, Ismaël Castillo, Étienne Roquain
期刊/来源: Annals of Statistics
机构: University of Cambridge · Sorbonne Université · Laboratoire de Probabilités et Modèles Aléatoires · Laboratoire de Probabilités, Statistique et Modélisation
分类: vol 52 · issue 4
相关性 8/10 · novelty: new_theory
摘要: 在稀疏序列多重检验问题中，本文以 FDR+FNR 为总检验风险，在 beta-min 分离条件下确定了渐近 sharp minimax 风险边界，从而精确刻画了从“可达到 vanishing risk”到“不可达到”的过渡。作者提出两种自适应程序——适当调节阈值的 Benjamini-Hochberg 过程与经验贝叶斯 l-value（局部 FDR）过程——均达到该最优边界。理论分析表明，最优程序下 FDR 与 FNR 对总风险的贡献非对称，在边界处 FNR 占主导地位。进一步地，文章将结果推广到任意稀疏信号类与分类损失，并讨论了强信号情形下的收敛速率。本工作为多重检验的 minimax 理论提供了精确的速率和切换点，与你关注的假设检验问题高度契合，且其推导框架（如风险分解、自适应阈值）可直接迁移至更一般的多重比较或稀疏恢复场景。
关键技术: minimax separation rates, beta-min separation condition, Benjamini-Hochberg procedure, empirical Bayes l-value (local FDR), FDR+FNR risk analysis
为什么对您有用: (1) 直接对应你 primary interest 中的“数学统计与假设检验”，属于多重检验的 minimax 理论前沿，且工具性强；(2) 你非常熟悉的“minimax bounds for estimation problems”可用来平行理解其检验风险边界，并可尝试将 estimation 与 testing 的 minimax 框架进行对比或融合；(3) 立即可做——你已掌握的 minimax 和非参数统计武器足以深入阅读本文并提出后续问题，例如将稀疏序列模型推广到相关噪声或 U-统计量背景下的多重检验。

2. 10.1214/24-aos2394 · arXiv — E-statistics, group invariance and anytime-valid testing¶

作者: Muriel Felipe Pérez-Ortiz, Tyron Lardy, Rianne de Heide, Peter D. Grünwald
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_theory
摘要: 在 anytime-valid testing 框架下，研究两个群模型之间假设检验的最坏情形增长率最优（GROW）e-statistic。设定中数据由群 G 作用，在群满足 amenability 条件（如 scale-location 族）下，存在极大不变统计量。本文证明在所有 e-statistic（含非不变量）中，极大不变统计量的似然比既是绝对 GROW 也是相对 GROW，且可据此构造 anytime-valid test；该 GROW e-statistic 等价于以右 Haar 先验构造的 Bayes factor，同时避免了该先验在贝叶斯语境中的非唯一性问题。结果也适用于有限维线性回归。对您有用：将群不变性与 e-value / anytime-valid testing 结合，为数学统计中的假设检验提供了一个新的最优性框架。
关键技术: e-statistics, GROW (worst-case growth-rate-optimal), group invariance, maximally invariant statistic, right Haar prior, amenability
为什么对您有用: 直接连接 primary interest 的 hypothesis testing 子方向，将群不变性与 e-value/anytime-valid testing 的最优性（GROW）统一，给出了似然比在极大不变统计量下的最优性证明。用 very_familiar 的 nonparametric statistics 与 minimax bounds 工具可以审视其 GROW 最优性界是否可进一步推广到半参数/非参数群模型；当前对 amenability 群论工具不熟，属于中期可做——需先在 moderately_familiar 的 M-estimation theory 或群不变性文献上长肌肉。

3. 10.1214/24-aos2377 · arXiv — Higher-order coverage errors of batching methods via Edgeworth expansions on t-statistics¶

作者: Shengyi He, Henry Lam
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 6/10 · novelty: new_theory
摘要: 在 batching/sectioning 方法框架下，研究基于 t-statistic 的置信区间的高阶覆盖误差（O(n^{-1})），关键假设为样本独立同分布且存在有限矩条件。核心机制是对 batching 方法构造的 t-statistic 建立 Edgeworth 展开，解析系数虽复杂，但作者给出了通过 Monte Carlo 估计 n^{-1} 阶误差项系数的算法。理论结果显示，batch 数量 k 对覆盖误差的影响呈非单调关系；不同 batching 变体（sectioning, batched mean, sectioned jackknife）在覆盖精度上无一致优劣，但当 k 较大时 sectioned jackknife 覆盖最优。对您可能有用：此文的 Edgeworth 展开技术可直接对接您对 higher-order U-statistics 高阶展开的兴趣，为评估 U-statistic batching 策略的覆盖误差提供模板。
关键技术: Edgeworth expansion, t-statistic batching, higher-order coverage error, Monte Carlo coefficient estimation, sectioned jackknife, non-monotonic batch number effect
为什么对您有用: 本文直接连接 hypothesis testing 与 higher-order U-statistics 两个 primary interest 子方向：用 Edgeworth 展开刻画 t-statistic batching 的 O(n^{-1}) 覆盖误差，技术路线与您熟悉的 U-statistic 高阶投影/展开高度同构。用 very_familiar 的 higher-order U-statistic 计算工具（treewidth / einsum）可以攻击一个具体口子：将本文的 Edgeworth 系数 Monte Carlo 估计算法推广到高阶 U-statistic batching 场景，分析其计算复杂度与系数估计精度。立即可做。

4. 10.1214/24-aos2414 · arXiv — Detection and estimation of structural breaks in high-dimensional functional time series¶

作者: Degui Li, Runze Li, Han Lin Shang
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 4/10 · novelty: new_method
摘要: 本文考虑高维函数时间序列中均值函数结构断点的检测与估计问题，允许截面相关和时间相依。提出一个结合函数CUSUM统计量和功率增强成分的新检验统计量，在零假设下渐近分布与单变量函数时间序列的经典CUSUM理论相当。功率增强成分在备择假设下（断点稀疏时）显著扩大检验有功效的区域，稳定地提升功效。进一步对具有异质性断点的个体施加潜在群组结构，引入基于信息准则的聚类算法一致估计群组数和成员，并利用估计的群组结构改善后聚类断点估计的收敛速度。蒙特卡洛模拟和实证应用显示有限样本性能良好。本文的高维假设检验方法（CUSUM+功率增强）与您在高维统计和假设检验方面的兴趣直接相关，其中的聚类和信息准则思路也可迁移至其他断点检测问题。
关键技术: CUSUM statistic, power enhancement component, functional time series, high-dimensional testing, clustering algorithm, information criterion
为什么对您有用: 本文涉及高维函数时间序列的结构断点检测，属于高维假设检验的一个具体应用场景，与您primary interests中的‘数学统计（假设检验）’和‘高维统计’直接关联。您熟悉的‘high-dimensional asymptotics’可以用于理解检验统计量的极限分布，‘nonparametric statistics’可帮助分析函数型数据建模。鉴于方法基于成熟CUSUM框架且功率增强组件具有清晰理论，您可以立即利用这些工具复现或扩展检验过程，属于‘立即可做’的follow-up类型。

5. 10.1214/24-aos2411 · arXiv — Majority vote for distributed differentially private sign selection¶

作者: Weidong Liu, Jiyuan Tu, Xiaojun Mao, Xi Chen
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 3/10 · novelty: new_method
摘要: 在分布式差分隐私（DP）框架下，针对高维均值估计和线性回归中的符号选择问题（即决定系数为正、负或零），提出了一种基于局部雄主投票与指数机制（exponential mechanism）的组隐私方法。该方法通过迭代剥离（iterative peeling）稳定性函数，结合多数投票聚合分布式节点的私有信号，从而恢复支撑集与符号。理论结果表明，所提机制达到了与非隐私设定相同的最优信噪比（optimal SNR），优于现有私有变量选择工作，并且符号选择一致性（sign selection consistency）得到了严格保证。模拟实验证实了方法的有效性。该工作将分布式隐私保护与高维假设检验结合，为您熟悉的 minimax 边界分析与高维渐近理论提供了可直接试用的检验案例。
关键技术: iterative peeling, exponential mechanism, group differential privacy, majority vote, distributed sign selection
为什么对您有用: 本文聚焦于高维统计中的符号选择问题，本质上是系数方向的假设检验，直接关联您的 primary interest 中‘高维统计’与‘假设检验’两个子方向。您非常熟悉的 minimax 下界与 high-dimensional asymptotics 工具可直接用于验证文中所称的 optimal SNR 是否为紧，并评估其收敛速度。立即可做：运用您已有的高维渐近理论储备，即可在新模型（例如 logistic 回归）中设计或扩展类似隐私机制。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1214/24-aos2393 · arXiv — On the approximation accuracy of Gaussian variational inference¶

作者: Anya Katsevich, Philippe Rigollet
期刊/来源: Annals of Statistics
分类: vol 52 · issue 4
相关性 7/10 · novelty: new_theory
摘要: 该论文针对高维贝叶斯推断中变分推断（VI）的近似精度问题，首次给出了高斯变分近似（Gaussian VI）在总变差距离（TV）以及均值与协方差估计误差上的显式上界。作者利用对数后验的Hermite级数展开，将VI的一阶最优性条件与展开式前几项的消去相联系，从而将误差分解为截断余项与优化偏差两部分。推导得到的边界同时依赖于维度d和样本量n，揭示了在高维情形下Gaussian VI可能产生非渐近有偏估计的条件。主要技术工具包括Hermite多项式的正交性质、谱范数分析与概率集中不等式。数值实验验证了理论边界的合理性。该工作填补了VI理论分析中关于逼近误差的空白，对统计计算领域的实践者具有直接参考价值，尤其对希望理解变分逼近在高维设定下可靠性的研究者而言是重要入门读物。
关键技术: Hermite series expansion, Gaussian variational inference, total variation distance bound, moment error bounds, first-order optimality conditions, spectral norm analysis
为什么对您有用: 本文直接关联您的主要兴趣“统计计算（数值方法、算法）”，是高斯变分推断的理论精度分析。您的武器库中“非参数统计”和“最小最大边界”可用于理解其误差分解与维度依赖关系，但核心的Hermite展开与优化条件消去机制可能需要适度学习。该论文作为统计计算领域的理论进展，为后续开发更优VI算法提供了基础，值得认真研读。中期可做：先熟悉变分推断的最优性条件与Hermite展开技巧（属统计计算子方向），即可尝试将此边界推广至非高斯变分族或与非参数贝叶斯方法结合。

Maintained by 陈星宇 · Homepage · Source on GitHub