跳转至

AoS — Vol 53 Issue 3 · 2026-06-20

  • 共 18 篇 · Annals of Statistics
  • 目录核对 ✅ 18 篇全部抓到(对照 OpenAlex 18 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

这一期的论文可归结为四条主线:半参数与非参数推断工具(Semiparametric inference based on adaptively collected data, Strong approximations for empirical processes, A duality framework for random feature networks, Optimal transport map estimation, BELIEF, Conformal inference for random objects, Adaptive estimation of L2-norm I & II)、假设检验的新理论(Numeraire e-variable, Testing stationarity in RL, Self-normalized Cramér type moderate deviation)、高维相关结构与稀疏性(Asymptotic distributions of largest Pearson correlations under dependent structures, Sparsity meets correlation in Gaussian sequence model),以及计算方法与渐近理论(Convergence of coordinate ascent variational inference, PDE approach for low-frequency diffusion, MLE in crossed random effects GLMM, Semiparametric adaptive estimation under informative sampling)。

假设检验这条主线集合了三篇方法差异明显的工作。Numeraire e-variable 在无任何条件假设下给出了复合零假设对点备择的最优 e-variable 存在性,并以此自然定义了逆向信息投影,解决了该概念在一般情形下的理论基础。Self-normalized Cramér type moderate deviation 将高斯近似的有效范围从次高斯假设大幅放松至仅需三阶矩有限,直接服务于高维重尾数据的 t 检验。Testing stationarity in RL 则将 CUSUM 型统计量与离线强化学习结合,从历史数据中检验策略环境的非平稳性并估计变点位置,为因果推断中时间结构的变化提供了新工具。三篇分别从 e-value 框架、中偏差技巧、序贯检验切入,共同推进了假设检验在无参数假设、重尾、复杂依赖场景下的理论边界。

高维相关结构与稀疏性的两篇集中探讨协方差依赖对极值统计和信号估计的影响。Asymptotic distributions of largest Pearson correlations 展示在 Toeplitz 协方差(如 AR(1))下,样本最大相关系数的极限分布随自回归系数发生相变,从 Gumbel 到双 Gumbel 再到正态混合,并应用于协方差检验。Sparsity meets correlation 则在等相关高斯序列模型中刻画了 s-稀疏信号估计的 minimax 率,揭示出强相关性反而降低估计难度(“blessing”)以及率关于 p-2s 的缩放与相变。两篇共同揭示了相关结构在高维推断中既可能成为障碍也可转化为机遇的复杂角色,对理解稀疏性与依赖性的相互作用有直接参考价值。

其余论文各有亮点。Adaptive estimation of L2-norm 上下两篇联合证明了密度范数自适应估计的不可实现性并给出紧上界,其中第二部分建立的新 U-统计量集中不等式对非参数泛函理论有独立意义。Semiparametric inference based on adaptively collected data 通过加权估计方程恢复渐近正态性,其“explorability”条件直接关联因果推断中的自适应实验设计。Semiparametric adaptive estimation under informative sampling 给出了有信息抽样下半参效率界与自适应估计量,框架可迁移至因果效应的加权估计。MLE in crossed random effects GLMM 借助二阶 Laplace 近似攻克了长期开放的正态性难题,对纵向数据因果推断中的随机效应模型有指导意义。Convergence of CAVI 与 PDE approach for low-frequency diffusion 分别从算法收敛性和逆问题数值求解两个角度丰富了统计计算的理论工具。

与因果推断、半参数效率最贴合的论文包括:Semiparametric inference based on adaptively collected data(实验设计与因果效应推断)、Semiparametric adaptive estimation under informative sampling(加权估计的效率理论)、Testing stationarity in RL(策略评估中的非平稳性检验)、以及 MLE in crossed random effects GLMM(结构模型中的渐近推断)。

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)

1. 10.1214/24-aos2462 · arXiv — Asymptotic distributions of largest Pearson correlation coefficients under dependent structures

  • 作者: Tiefeng Jiang, Tuan Pham
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究多元正态分布样本中,当协方差矩阵为Toeplitz矩阵(尤其是自回归AR结构)时,样本相关矩阵最大非对角元的渐近分布。假设观测独立但协方差具有AR(1)结构,文中发现极限分布发生相变:当AR系数ρ的绝对值小于某个阈值时,最大相关系数经标准化后依分布收敛到Gumbel分布(参数与ρ相关);当ρ大于该阈值时收敛到另一Gumbel分布;临界情形下极限为两个独立Gumbel变量的最大值。对于一般Toeplitz协方差矩阵,在超高维(p/n→∞)设定下,极限分布是正态随机变量与Gumbel型分布的加权和。此外,文中还讨论了非高斯情形下的对应结果。作为应用,作者构造了一个高维协方差检验问题,并基于上述极限分布给出了检验的临界值。该工作将经典独立同分布情形下的极值理论拓展至依赖结构,为高维统计推断提供了新的理论工具。
  • 关键技术: Gumbel distribution, phase transition, Toeplitz covariance, auto-regressive sequence, ultra-high dimensional setting, weighted sum of normal and Gumbel
  • 为什么对您有用: 本文直接切入您的主要兴趣:高维统计中的随机矩阵理论,特别是相关矩阵极值分布在依赖结构下的相变行为,以及高维协方差假设检验的应用。您武器库中‘high-dimensional asymptotics’和‘minimax bounds’可以直接用来检验相变阈值的sharpness,或基于此设计更高效的检验统计量。该方向属‘立即可做’:您对高维渐近和极值分布已十分熟悉,可立即评估本文结果并探索扩展。

2. 10.1214/25-aos2494 · arXiv — Sparsity meets correlation in Gaussian sequence model

  • 作者: Subhodh Kotekal, Chao Gao
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究等相关高斯序列模型中s-稀疏信号的估计问题,推导了最小化极大风险率(minimax rate)。发现新现象:率关于p-2s缩放,并在p-2s与sqrt(p)同阶时出现相变;强相关性反而有利于估计(blessing)。该风险率由两个子问题驱动:估计信号均值(线性泛函)和利用稀疏回归估计(p-1)维正交投影。现有鲁棒估计器次优,作者提出一种带宽增宽的核模式估计器,利用数据高斯性质实现最优估计率。理论结果刻画了相关性与稀疏性之间的微妙相互作用。对您有用:直接对应您非常熟悉的minimax界和高维渐近分析,可立即理解本文的率推导和相变现象。
  • 关键技术: minimax rate, sparse regression, kernel mode estimator, robust location estimation, phase transition, equicorrelated Gaussian model
  • 为什么对您有用: 本文直接契合您在高维稀疏估计和minimax界方面的主要兴趣。论文揭示了相关性如何改变稀疏信号估计的最小化极大率,并发现相变现象——这正是您非常熟悉的minimax bounds与高维渐近分析工具可以直接驾驭的问题。具体而言,您可以用very_familiar中的'minimax bounds for estimation problems'和'high-dimensional asymptotics'快速验证其率推导和相变条件。follow-up粗判:立即可做——本文结果本身就是一个可直接吸收的理论成果,无需额外工具。

非参数 / 半参数 (nonparam_semipara, 8 篇)

1. 10.1214/24-aos2485 — Semiparametric inference based on adaptively collected data

  • 作者: Licong Lin, Koulik Khamaru, Martin J. Wainwright
  • 期刊/来源: Annals of Statistics
  • 机构: University of California, Berkeley · Rutgers Sexual and Reproductive Health and Rights · Massachusetts Institute of Technology
  • 分类: vol 53 · issue 3
  • 相关性 9/10 · novelty: new_method
  • 摘要: 本文研究在自适应收集的数据(如 bandit 实验)下,如何对受非参 nuisance 项污染的广义线性模型中的参数向量进行有效推断。传统估计量在自适应数据下常失去渐近正态性,导致置信区间构造困难。作者构造了一类加权估计方程,通过自适应设计的权重修正,使估计量恢复渐近正态性,并给出了所需“探索性”(explorability)的精确条件。对于线性泛函这一简化问题,在更弱的条件下得到了相同保证。理论结果在标准线性 bandit 和稀疏广义 bandit 等场景中得到验证,并与现有方法进行了模拟比较。本文的加权半参推断框架与您的 semiparametric 效率理论兴趣高度吻合,其引入的“explorability”概念可启发因果推断中自适应设计的识别策略。
  • 关键技术: weighted estimating equations, explorability measure, asymptotic normality under adaptivity, generalized linear model with nuisance component, linear bandits
  • 为什么对您有用: 本文直接对应您 primary interests 中的 semiparametric and nonparametric theory 和 efficiency theory:在自适应数据这一现代统计推断挑战下,发展了加权估计方程与渐近正态性理论。您武器库中的 nonparametric statistics(very_familiar)可用于分析本文 nuisance 估计的收敛性,semiparametric theory(moderately_familiar)可帮助检验其正交估计量是否达到效率界。立即可做:基于您熟悉的 nonparametric 和 asymptotic 工具,可立即将本文的 steady-state 加权思想推广至因果推断中的 adaptive treatment assignment 问题,或探讨 higher-order U-statistics 在自适应数据下的加权版本。

2. 10.1214/25-aos2497 · arXiv — Minimax rate for multivariate data under componentwise local differential privacy constraints

  • 作者: Chiara Amorino, Arnaud Gloter
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在 componentwise local differential privacy (CLDP) 设定下,研究 d 维多元数据的 minimax 估计率,其中各分量由独立隐私通道发布且具有不同隐私参数 α_1,…,α_d。核心机制是建立以 (α_1,…,α_d) 为函数的 minimax 下界与上界技术,并证明非参数密度估计与协方差估计的 rate 在常数因子内匹配,同时给出数据驱动的自适应估计程序。进一步量化了跨分量信息泄露:即使某分量隐私保护较强,其敏感信息仍可被通过与之相关但隐私保护较弱的分量提取。对您可能有用:本文将 minimax bound 技术拓展至异质隐私约束下的非参数估计,直接连接您非常熟悉的 minimax bounds 与非参数统计工具。
  • 关键技术: componentwise local differential privacy, minimax lower bounds under privacy constraints, nonparametric density estimation, covariance estimation, data-driven adaptive procedure, cross-component information leakage quantification
  • 为什么对您有用: 直接连接您 primary interest 中的 nonparametric theory 与 minimax bounds:本文在异质隐私约束下推导非参数密度/协方差估计的 minimax rate,技术框架与您 very_familiar 的 minimax bounds for estimation problems 完全对接。用您 very_familiar 的 minimax bound 武器即可验证其声称的 sharper rate 是否紧,并可将 CLDP 框架下的信息泄露量化问题推广至高维/半参数设定。立即可做:用 very_familiar 的 minimax bound 与非参数统计工具即可动手复现并拓展其下界技术。

3. 10.1214/25-aos2500 · arXiv — Strong approximations for empirical processes indexed by Lipschitz functions

  • 作者: Matias D. Cattaneo, Ruiqi Rae Yu
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 6/10 · novelty: sharper_rate
  • 摘要: 在 d 维随机向量的经验过程框架下,本文研究 Lipschitz 函数类索引的均匀 Gauss 强逼近(strong approximation)的收敛速率。核心改进在于:对 Rio (1994) 考虑的 Lipschitz 函数类,将逼近速率从 n^{-1/(2d)} 提升至 n^{-1/max{d,2}}(含 polylog 项);特别地,d=2 时达到 n^{-1/2}log n,此前该速率仅对 d=1(KMT 构造)已知成立。进一步,对乘积可分(multiplicative separable)经验过程建立了均匀 Gauss 强逼近,解决了 CCK (2014) 遗留的公开问题;还给出了基于拟均匀划分的 Haar 基函数类的强逼近结果。应用覆盖非参密度与回归估计的 uniform inference。对您有用:此结果直接改进非参估计 uniform inference 的理论工具,为 semiparametric / nonparametric 理论中依赖 empirical process 的 inference(如 CCK 系列)提供更紧的逼近界。
  • 关键技术: uniform Gaussian strong approximation, KMT construction, Lipschitz function class indexing, multiplicative separable empirical process, Haar basis quasi-uniform partition, nonparametric uniform inference
  • 为什么对您有用: 本文直接推进 nonparametric statistics 与 semiparametric theory 中 uniform inference 的核心工具(CCK 类 empirical process 逼近),属于您 very_familiar 的 nonparametric statistics 与 minimax bounds 领域。 sharper rate(d=2 时达 n^{-1/2}log n)可用 minimax bound 验证其紧性,且乘积可分结构的结果与您 moderately_familiar 的 HOIF / higher-order U-statistics 的投影结构有潜在对接口子。立即可做:用 very_familiar 的 minimax 理论审视新速率是否紧;若想延伸到 HOIF 的 uniform inference,需先在 moderately_familiar 的 HOIF 上长肌肉。

4. 10.1214/25-aos2492 · arXiv — A duality framework for analyzing random feature and two-layer neural networks

  • 作者: Hongrui Chen, Jihao Long, Lei Wu
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文提出一个对偶框架,将函数空间(F_{p,π} 和 Barron 空间)的近似问题与估计问题联系起来,借助信息复杂度(I-complexity)实现等价转换。在随机特征模型(RFM)中,该框架导出了超越核机制的学习误差sharp界:当 p>1 时,学习效率无维数灾难,且该类空间严格大于对应的 RKHS(p=2)。对于 RKHS 的 L∞ 学习,框架给出了谱依赖的收敛刻画,并证明即使核岭回归最小化平方损失,也能在 L∞ 范数下达到近乎最优性能。技术核心是引入 I-complexity 度量函数类大小,它能紧刻画无噪声学习并给出类似 Le Cam 的下界。该对偶框架可推广至更多学习场景。对您而言,该工作展示了一种将非参数收敛速率分析与函数空间复杂度度量结合的新范式,与您熟悉的非参数统计和极小极大界武器库直接对接。
  • 关键技术: information-based complexity (I-complexity), duality between approximation and estimation, F_{p,π} and Barron spaces, random feature models, kernel ridge regression, L∞ learning error
  • 为什么对您有用: 1) 论文研究非参数回归中函数空间的学习速率,直接链接到您的 primary interest “nonparametric statistics” 和 “minimax bounds for estimation problems”,尤其提供了对 RFM 超越核视角的新界。2) 您的武器库中“nonparametric statistics” 和 “inverse problems with random noise” 可直接用于理解 I-complexity 的构造及对偶推导,并可尝试将该框架移植到因果推断中的非参数函数估计(如 ATE 的收敛速率)。3) 粗判:立即可做 —— 您对非参数极小极大界非常熟悉,可以立即用 I-complexity 分析您已有问题中的函数类(如因果推断中的 nuisance 函数空间),无需新工具。

5. 10.1214/25-aos2495 · arXiv — Conformal inference for random objects

  • 作者: Hang Zhou, Hans-Georg Müller
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文在 conformal prediction 框架下,研究一般度量空间中随机对象的条件预测集构造问题,estimand 为给定 Euclidean 预测变量下度量空间响应的条件分布预测集。核心方法引入 distance profile(将对象映射为随半径递增的球内概率质量分布)与 conditional profile average transport cost,以此作为 conformity score,再通过 split conformal 算法生成预测集。理论方面,作者证明了 conformity score 估计量的 uniform convergence rate,并建立了预测集的 asymptotic conditional validity。模拟与实证(纽约出租车网络数据、美国能源构成数据)显示该方法在覆盖率和预测集大小上均优于现有方法,即便在传统 Euclidean 响应的特例下也是如此。对您可能有用:本文将 optimal transport 与 conformal inference 结合处理非 Euclidean 数据的思路,为 semiparametric / nonparametric 理论在度量空间上的推广提供了新视角。
  • 关键技术: conformal prediction, optimal transport cost, distance profile, split conformal algorithm, uniform convergence rate, conditional validity
  • 为什么对您有用: 本文连接到 nonparametric theory 与 statistical computing 两个子方向:在度量空间上用 optimal transport 定义 conformity score 并证明 uniform convergence rate,属于非参数估计在非标准空间上的拓展。(2) 您的 technical_arsenal 中 minimax bounds for estimation problems 与 nonparametric statistics 可直接用于审视本文声称的 uniform convergence rate 是否紧、是否达到 minimax optimal。(3) 立即可做:用 very_familiar 的 minimax / nonparametric 工具验证其 rate 的紧性;若想深入 optimal transport 在统计推断中的理论,需先在 moderately_familiar 的 M-estimation theory 上补充 metric space 上的 M-estimator 收敛理论。

6. 10.1214/24-aos2482 · arXiv — Optimal transport map estimation in general function spaces

  • 作者: Vincent Divol, Jonathan Niles-Weed, Aram-Alexandre Pooladian
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 在给定源分布 P 与推前分布 T♯P 的独立样本下,研究最优传输映射 T=∇φ₀(凸函数梯度)的估计问题,核心 estimand 为 Brenier 极映射。先前工作假设 T 属于 Hölder 类,本文提出在一般函数空间中获取估计收敛率的统一框架,仅需 P 满足 Poincaré 不等式且 ∇φ₀ 属于可控制度量熵的函数空间。通过最小化凸势函数的 M-estimation 思路,结合经验过程与度量熵控制,推导出 minimax 收敛率;作为特例恢复 Hölder 类已知结果,并首次给出 P 为正态分布、映射由无限宽浅层神经网络给出时的近紧估计率。对您有用:本文将非参数 M-estimation 与度量熵工具系统化地用于 OT 映射估计,与您 primary interest 中的非参数理论及 minimax bound 直接对接。
  • 关键技术: optimal transport map estimation, Brenier map, metric entropy control, Poincaré inequality, minimax rate, M-estimation of convex potential
  • 为什么对您有用: 本文直接推进您 primary interest 中的非参数 minimax 理论:在一般函数空间(而非仅 Hölder)下给出 OT 映射估计的 minimax rate,且条件弱化至 Poincaré 不等式。您武器库中 very_familiar 的 minimax bounds for estimation problems 与 nonparametric statistics 完全对口本文的度量熵+经验过程论证,可直接用来审视其声称的 rate 是否紧或推广至其他函数空间。立即可做:用 minimax bound 与非参数 M-estimation 工具验证其 Poincaré 条件能否进一步弱化,或将其框架迁移至您熟悉的 inverse problems with random noise 设定。

7. 10.1214/25-aos2493 · arXiv — BELIEF in dependence: Leveraging atomic linearity in data bits for rethinking generalized linear models

  • 作者: Benjamin Brown, Kai Zhang, Xiao-Li Meng
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在二元响应变量的设定下,本文利用二元变量间线性不相关即等价于独立这一原子性质,构建了名为 BELIEF(Binary Expansion Linear Effect)的框架,将任意复杂关联转化为二元展开后的线性模型语言。核心机制是将连续/高维协变量通过二元展开(Walsh 函数/Rademacher 展开)映射为比特向量,从而用线性系数精确刻画非线性依赖,并建立与高斯线性模型的平行理论。BELIEF 揭示了 GLM 中 link 函数的选择如何扭曲交互效应的语义(例如 GLM 交互系数为零并不等价于线性模型的无交互假设),并在完全分离情形下指出 MLE 因参数趋于无穷而失效,而 BELIEF 的估计能自动识别出导致完全分离的完美预测变量。主要理论结果包括 BELIEF 估计的相合性与完全分离下的稳健表现,以及对 GLM 结构假设的重新解读。对您有用:BELIEF 的二元展开与线性化视角为 semiparametric theory 中处理离散/混合数据提供了新工具,且其完美预测变量的识别机制与因果推断中 positivity 假设失效的诊断直接相关。
  • 关键技术: binary expansion (Walsh/Rademacher functions), linear effect for binary variables, generalized linear model link function critique, complete separation diagnosis, maximum likelihood failure under separation, Gaussian parallels for binary data
  • 为什么对您有用: 本文直接连接 semiparametric theory 与因果推断中 positivity 假设的诊断:BELIEF 框架在完全分离(即完美预测)时自动识别预测变量,这为因果推断中处理 positivity violation 和 near-positivity violation 提供了新的理论视角与估计工具。研究者可用 very_familiar 中的 nonparametric statistics 与 minimax bounds 工具分析 BELIEF 估计在部分二元展开截断下的收敛率与效率损失,这是一个立即可做的 follow-up 方向。
  • 作者: G. Cleanthous, A. G. Georgiadis, O. V. Lepski
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 在独立同分布观测下,研究 \(\mathbb{R}^d\) 上概率密度 \(L_2\)-范数的自适应估计问题,目标泛函为 \(\|f\|_2^2\),密度假设为一致有界且属于各向同性/各向异性 Nikolskii 空间球的并集。本文证明:在所考虑的函数类集合上,最优自适应估计器不存在(即不存在单一估计器能在所有尺度上同时达到 minimax 收敛速率而无额外代价)。进一步在抽象密度模型框架下,提出密度任意泛函自适应估计的通用下界(generic lower bounds),这些下界结果在现有文献中无类似版本。主要理论结果精确刻画了自适应估计的不可实现性及惩罚下界,对您在非参数 minimax 理论与泛函估计效率边界方面的研究有直接参考价值。
  • 关键技术: adaptive estimation, minimax lower bounds, Nikolskii space, L2-norm functional estimation, nonparametric density estimation
  • 为什么对您有用: 直接连接到 primary interest 中的非参数 minimax 理论与效率理论:本文的“最优自适应估计器不存在”与泛函自适应下界,为泛函估计的 minimax rate 与 semiparametric efficiency bound 提供了更底层的不可行性刻画。用 very_familiar 中的 minimax bounds for estimation problems 可直接审视其下界构造是否紧;若后续想将此 L2-norm 下界逻辑迁移到因果推断泛函(如 ATE 的非参数自适应下界),需先在 moderately_familiar 的 semiparametric theory 上长肌肉以桥接两种框架。立即可做:用 minimax 下界工具验证其下界紧性。

效率理论 / Debiased ML (efficiency_dml, 1 篇)

1. 10.1214/25-aos2509 · arXiv — Semiparametric adaptive estimation under informative sampling

  • 作者: Kosuke Morikawa, Yoshikazu Terada, Jae Kwang Kim
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文研究有信息抽样下目标参数的半参数有效估计问题,将调查权重视为随机变量而非固定设计变量。在设定中,Horvitz-Thompson估计量无偏但非有效,作者首先推导了目标参数(如总体均值)的半参数效率界,明确了在权重信息可用的最优性能下界。基于调查权重的working model,构造了半参数自适应估计量,该估计量在正则渐近线性(RAL)估计类中达到相合、渐近正态且有效。关键技术包括影响函数、半参数效率界、以及基于权重的工作模型构造。模拟研究验证了有限样本性能,并应用于1999年加拿大工作场所与雇员调查数据。对您而言,本文展示了半参数效率理论在抽样调查中的直接应用,其框架可自然迁移至因果推断中的选择偏差调整(如倾向得分加权或缺失数据处理)——您熟悉的效率理论与半参数工具能轻松消化并扩展此方法。
  • 关键技术: semiparametric efficiency bound, influence function, adaptive estimation, informative sampling, Horvitz-Thompson estimator, working model
  • 为什么对您有用: 直接对应您primary interest中的效率理论(semiparametric efficiency bounds)与半参数理论,且方法可迁移至因果推断中的选择偏差调整(如倾向得分加权)。您的武器库中“semiparametric theory”和“efficiency theory”均为very_familiar,因此立即可做:您能评估本文效率界的紧性,并考虑将其扩展至proximal causal inference或IV下的类似设定。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 10.1214/24-aos2487 · arXiv — The numeraire e-variable and reverse information projection

  • 作者: Martin Larsson, Aaditya Ramdas, Johannes Ruf
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文考虑复合零假设 P 对点备择 Q 的假设检验,使用 e-variable(非负随机变量 X 满足对每个 P∈P 有 E_P[X]≤1)。核心理论贡献:在不对 P 或 Q 施加任何条件的前提下,始终存在一个特殊的 numeraire e-variable X^,它严格为正,且对任意其他 e-variable X 满足 E_Q[X/X^]≤1。X^ 是对数最优的,即 E_Q[log(X/X^)]≤0。通过密度 dP^/dQ=1/X^,X^ 定义了一个子概率测度 P^;当额外存在性条件成立时,P^* 恰好是逆向信息投影(RIPr),因此本文给出了 RIPr 无需任何假设的自然定义。此外,文章还提供了在具体情形下求解 numeraire 和 RIPr 的工具,包括多个非参数例子(即使无参考测度也能识别)。最后推广到幂效用函数,得到始终存在的逆向 Rényi 投影。该工作统一了 e-variable 的最优性理论,对非参数假设检验和信息论交叉领域有重要影响。
  • 关键技术: e-variable, reverse information projection (RIPr), numeraire, log-optimality, Kelly betting, power utility
  • 为什么对您有用: 本文直接联系您的主要兴趣——假设检验,特别是复合零假设下的 e-variable 方法(安全检验领域)。您的‘非参数统计’武器库可用于分析文中非参数例子的构造,或推导非参数设定下 e-variable 的 minimax 最优性。立即可做:您可以用经验过程理论为非参数复合假设构造具体的 e-variable,或将其与您的 higher-order U-statistics 结合,开发基于 U-统计量的 e-variable。

2. 10.1214/25-aos2501 · arXiv — Testing stationarity and change point detection in reinforcement learning

  • 作者: Mengbing Li, Chengchun Shi, Zhenke Wu, Piotr Fryzlewicz
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在离线强化学习(RL)设定下,目标是基于预收集的历史数据检验最优 Q 函数的非平稳性(即 transition/reward 是否随时间变化),无需额外在线数据收集。核心方法是将 Q 函数估计的残差序列构造为 CUSUM 型统计量,通过累积残差偏离来检验平稳性零假设;检验一致后,进一步提出序贯变点检测方法,可与现有 RL 算法耦合以实现非平稳环境下的策略优化。理论贡献包括检验的一致性证明与变点检测的收敛速率分析,实证通过模拟与 2018 Intern Health Study 数据验证。对您有用:该文将 CUSUM 检验与离线 RL 结合,其序贯检验与变点估计的理论分析直接连接到 hypothesis testing 与 longitudinal causal inference 的交叉地带。
  • 关键技术: CUSUM test, offline reinforcement learning, sequential change point detection, optimal Q-function estimation, nonstationarity test
  • 为什么对您有用: 直接连接到 hypothesis testing 子方向(CUSUM 序贯检验在 RL 中的理论化),同时触及 longitudinal causal inference(mobile health 等非平稳纵向数据的策略评估)。用 very_familiar 的 minimax bounds 与 M-estimation theory 可以审视其变点检测收敛速率是否达到最优;检验一致性证明的 empirical process 工具也在武器库内。立即可做:可用 minimax 理论验证其变点检测速率的 sharpness,或用 higher-order U-stat 视角分析 CUSUM 统计量在高维状态空间下的计算与理论性质。

3. 10.1214/25-aos2507 — Self-normalized Cramér type moderate deviation theorem for Gaussian approximation

  • 作者: Jingkun Qiu, Song Xi Chen, Qi-Man Shao
  • 期刊/来源: Annals of Statistics
  • 机构: Peking University · Tsinghua University · Southern University of Science and Technology
  • 分类: vol 53 · issue 3
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 本文在仅需三阶矩有限的条件下,建立了自标准化和的最大分量的Cramér型中偏差定理,从而将高斯近似的有效性从常见的次高斯假设拓展到重尾分布。具体而言,对独立同分布的p维随机向量,当相关矩阵为单位阵时,证明自标准化和的最大值与独立标准正态最大值之比的概率一致趋于1,对x=o(n^{1/6})一致成立且p可任意大;对一般相关矩阵的大x情形也给出类似结论。证明核心是基于一个针对多个自标准化和的最小值的新Cramér中偏差定理,通过精细的截断和自标准化技巧控制偏差。作为应用,提出高维单样本t检验,允许p指数增长且无需次高斯假设。此工作极大放松了高维假设检验的理论条件,尤其适用于金融、基因组等重尾数据。对研究者而言,本文直接关联到假设检验与高维渐近两大主要兴趣方向,可借助自标准化与概率不等式技术发展更复杂的检验程序或推广到U-统计量框架。
  • 关键技术: self-normalized sum, Cramér type moderate deviation, Gaussian approximation, high-dimensional t-test, finite moment conditions, maxima of self-normalized sums
  • 为什么对您有用: 本文属于高维假设检验与概率不等式交叉方向,直接对接研究者“mathematical statistics (hypothesis testing)”和“high-dimensional statistics”两项主要兴趣,特别提供重尾分布下自标准化和的理论保证。技术武器库中“high-dimensional asymptotics”(very_familiar)可直接用于理解并验证该定理的最优性(如x的范围是否可进一步扩展),而“nonparametric statistics”可用于评估检验的稳健性。立即可做:用已有高维渐近工具即可将本文结果融入自己的检验程序或应用于实证;中期可做:若将自标准化思想与更高阶U统计量结合,需先提升对“higher-order U-statistics”的熟悉度(moderately_familiar)。

统计计算 / 算法 (stat_computing, 2 篇)

1. 10.1214/24-aos2481 · arXiv — On the convergence of coordinate ascent variational inference

  • 作者: Anirban Bhattacharya, Debdeep Pati, Yun Yang
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 该论文研究坐标上升变分推断(CAVI)算法的收敛性,专注于两区块的均场变分推断设定,优化目标是Kullback–Leibler散度。作者引入了一种新的“广义相关性”概念,用于刻画两个区块之间的交互对变分目标函数的影响。利用泛函分析和优化的工具,给出了CAVI全局或局部指数收敛的充分条件,并证明收敛速度由广义相关性量化的收缩率决定。在多个经典例子(如线性回归、高斯混合模型)中推导出显式的问题相关上界。该工作填补了变分推断算法理论中收敛性分析的空白,为理解CAVI的收敛行为提供了严格的理论框架。对您而言,本文直接对应统计计算中的算法收敛性分析兴趣,其泛函分析手法可与您熟悉的非参数统计和最小最大界技术形成互补,中期内可尝试将广义相关性扩展到多区块设定或与其他变分框架(如非均场)结合。
  • 关键技术: coordinate ascent variational inference, mean-field variational inference, Kullback–Leibler divergence, generalized correlation, contraction rate, functional analysis
  • 为什么对您有用: 这是统计计算算法收敛性分析的纯理论工作,直接对接您的“statistical computing”兴趣子方向。您的技术武库中有“非参数统计”和“高维渐近”工具,可用于分析广义相关性在更复杂模型中的表现,而“软件开发”经验则有助于将理论收敛率转化为实际诊断工具。目前该方向属于中期可做——需要先熟悉变分推断的基本框架(不在当前武库中),但理解后即可用您擅长的极小极大和泛函分析技能推进。

2. 10.1214/25-aos2496 · arXiv — Statistical algorithms for low-frequency diffusion data: A PDE approach

  • 作者: Matteo Giordano, Sven Wang
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文针对低频观测的多维扩散过程,提出一套基于PDE理论的新计算框架,用于非参数推断扩散系数。传统方法因似然函数及其梯度难以解析处理,而依赖计算密集的模拟技术。作者利用过渡密度是Fokker-Planck方程解这一事实,结合抛物型PDE的最优正则性结果,证明了似然梯度的新表征。进而将恢复扩散系数的非线性逆问题转化为标准椭圆特征值问题,可用有限元方法高效求解。该框架支持多种流行统计算法:预条件Crank-Nicolson和Langevin型后验采样法、梯度下降优化求MLE/MAP。在非参数贝叶斯模型(高斯过程先验)下通过大量仿真验证了数值复原效果。对于关注统计计算(特别是逆问题数值方法)的研究者,本文展示了一条避免模拟、直接离散PDE的路径,且代码开源可复现。
  • 关键技术: Fokker-Planck equation, finite element method, preconditioned Crank-Nicolson, Langevin-type methods, elliptic eigenvalue problem, Gaussian process priors
  • 为什么对您有用: 本文直接针对统计计算这一primary interest,提出基于PDE的新数值策略,替代传统模拟密集型推断,与研究者very_familiar的“逆问题+数值方法”工具箱高度吻合。文中将扩散系数估计转化为椭圆特征值问题,正是研究者擅长的“inverse problems with random noise”的具体应用场景。开源代码可立即运行、验证和扩展,属于立即可做:用very_familiar的逆问题数值方法就能动手复现或改进。

其他 (other, 2 篇)

  • 作者: G. Cleanthous, A.G. Georgiadis, O.V. Lepski
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究 Rd 上概率密度 L2 范数的自适应估计问题,密度均匀有界且未知,属于各向同性/各向异性 Nikolskii 空间的球并集。在第一部分已证明最优自适应估计量不存在并给出多个自适应风险下界,本文证明这些下界是紧的。估计量通过数据驱动从一族核估计量中选取,其风险分析依赖于新建的二阶解耦 U-统计量集中不等式,该不等式对 U-统计量理论有独立价值。所有上界结果源于一个统一的 oracle 不等式,可推广至其他泛函自适应估计。本文直接利用了更高阶 U-统计量的集中性质,是 U-统计量理论在非参数泛函估计中的经典应用,与您对 higher-order U-statistics 和非参数 minimax 理论的研究高度契合。
  • 关键技术: decoupled U-statistics of order two, concentration inequalities, kernel-based adaptive estimation, oracle inequality, Nikolskii spaces, adaptive minimax lower bounds
  • 为什么对您有用: 本文直接属于 higher-order U-statistics 理论在非参数估计中的前沿应用,与您的 primary interest 中的更高阶 U 统计量方向精确匹配。技术武器库中您对 U-statistics 的 treewidth/tensor contraction 计算视角以及 minimax 界工具完全可以用于验证或扩展本文提出的集中不等式,分析不同核族选取的计算代价。由于您对非参数统计和 U 统计量均 very_familiar,这一问题是立即可做的,无需先学新工具。

2. 10.1214/25-aos2504 — Asymptotic distribution of maximum likelihood estimator in generalized linear mixed models with crossed random effects

  • 作者: Jiming Jiang
  • 期刊/来源: Annals of Statistics
  • 机构: University of California, Davis
  • 分类: vol 53 · issue 3
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文针对具有交叉随机效应的广义线性混合模型(GLMM),研究了最大似然估计(MLE)的渐近分布问题。此前该模型的MLE仅被证明具有相合性,但渐近分布长期未知。作者引入基于二阶拉普拉斯近似的新技术,精心计算条件期望展开的系数,将其转化为一个大型方程组,并通过渐近求逆得到条件期望的显式近似。这一框架绕过了似然函数难处理的核心障碍,最终严格证明了MLE的渐近正态性,回答了一个困扰学界数十年的开放问题。对您而言,该工作展示了处理复杂似然函数下渐近分析的新思路,可与您熟悉的高维渐近及逆问题技术形成互补,尤其适用于纵向数据因果推断中随机效应模型的理论分析。
  • 关键技术: second-order Laplace approximation, conditional expectation expansion, asymptotic inversion of large system, maximum likelihood estimation, crossed random effects
  • 为什么对您有用: 本文研究的是GLMM中MLE的渐近分布,直接关联您'数理统计与假设检验'的兴趣子方向,尤其是复杂模型下估计量的极限理论。您的武器库中'高维渐近'和'逆问题'两项very_familiar技术可用于理解和评估该二阶拉普拉斯方法在更大类问题上的推广。立即可做:运用您已掌握的渐近分析工具即可复现并理解该方法的理论脉络。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论