跳转至

AoS — Vol 53 Issue 5 · 2026-05-26

  • 共 16 篇 · Annals of Statistics

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

这一期共16篇论文,整体上可归纳为四条主线:因果推断与强化学习中的统计效率高维统计与随机矩阵理论半参数/非参数方法与函数数据分析、以及假设检验与多重比较。因果推断主线集中在策略评估与在线决策的鲁棒性和推断效率,高维主线则关注检测下界、结构化矩阵学习及遗传学应用,半参数/非参数主线覆盖鞅耦合、函数图模型、主成分分析、鲁棒估计与谱密度估计,假设检验主线涉及缺失机制检验与knockoff改进。此外,还有一篇非参数回归中的对称性结构框架。

在因果推断与强化学习方向,有两篇论文聚焦于策略评估的统计效率与鲁棒性。Online estimation and inference for robust policy evaluation in reinforcement learning 针对重尾奖励分布,提出鲁棒时序差分算法,利用中位数均值等鲁棒M-估计实现全在线推断,并证明其渐近方差逼近半参数效率界。Estimation and inference in distributional reinforcement learning 则在tabular MDP设定下,研究完整回报分布的估计,给出不同距离度量下的样本复杂度,并建立经验过程集中不等式。这两篇分别从鲁棒性和分布角度推进了序列因果推断的效率理论。另一篇Online statistical inference in decision-making with matrix context 将去偏机器学习推广至低秩矩阵参数与自适应数据收集场景,同时消除低秩偏倚与自适应偏倚,实现渐近正态推断,直接连接效率理论与高维低秩推断。

高维统计与随机矩阵理论主线包含三篇。Low-degree hardness of detection for correlated Erdős–Rényi graphs 利用低阶多项式框架,证明相关图检测问题在稀疏区域的计算下界,与Otter常数相关。Structured matrix learning under arbitrary entrywise dependence and estimation of Markov transition kernel 在噪声任意依赖下,基于低秩incoherent矩阵差的结构性质,实现minimax最优的矩阵恢复,并应用于Markov转移核估计。High-dimensional statistical inference for linkage disequilibrium score regression and its cross-ancestry extensions 则在高维依赖结构下,建立LDSC估计量的渐近正态性,并扩展到跨血统推断,直接连接高维统计与遗传学应用。这三篇分别从计算下界、任意依赖噪声下的最优率、以及实际遗传数据推断角度,展示了高维与随机矩阵工具的不同应用。

半参数/非参数方法主线涵盖多篇。Yurinskii’s coupling for martingales 将经典耦合推广至鞅的ℓ_p-norm,提供更紧的Gaussian近似。The functional graphical lasso 将高维稀疏图模型推广至函数数据,无需截断即可实现模型选择一致性。Theory of functional principal component analysis for discretely observed data 在离散观测下给出发散指标特征函数的minimax最优矩界。Trimmed sample means for robust uniform mean estimation and regression 在对抗污染与重尾设定下,实现minimax最优的鲁棒估计。Spectral density estimation of function-valued spatial processes 处理不规则空间采样的算子值谱密度估计。Deep horseshoe Gaussian processes 通过Horseshoe先验实现深度高斯过程后验的自适应minimax收缩率。这些论文共同推进了非参数方法的鲁棒性、函数数据适应性及高维扩展。

假设检验主线有两篇。Tests of missing completely at random based on sample covariance matrices 将MCAR检验转化为协方差矩阵兼容性检验,利用半定规划刻画不兼容度量,并实现minimax最优。Improving knockoffs with conditional calibration 通过条件校准框架统一提升knockoff程序的检验功效,同时保持FDR控制。此外,Symmetry: A general structure in nonparametric regression 提出对称性作为非参数回归的一般结构,将稀疏性归为特例,并给出已知或未知对称性下的收敛率。

对于因果推断方向的研究者,建议优先阅读Online estimation and inference for robust policy evaluation in reinforcement learningEstimation and inference in distributional reinforcement learningOnline statistical inference in decision-making with matrix context,它们分别涉及鲁棒策略评估、分布策略评估和去偏在线推断。对于半参数效率方向,Online estimation and inference for robust policy evaluation in reinforcement learning 中的效率界分析以及A unified analysis of likelihood-based estimators in the Plackett–Luce model 中的效率-计算权衡值得关注。对于高维方向,Structured matrix learning under arbitrary entrywise dependence and estimation of Markov transition kernelHigh-dimensional statistical inference for linkage disequilibrium score regression and its cross-ancestry extensions 提供了不同视角的高维推断结果。

因果推断 (causal_inference, 1 篇)

1. 10.1214/25-aos2533 — Online estimation and inference for robust policy evaluation in reinforcement learning

  • 作者: Weidong Liu, Jiyuan Tu, Xi Chen, Yichen Zhang
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 3/10 · novelty: new_method
  • 摘要: 在马尔可夫决策过程(MDP)设定下,本文研究目标策略价值估计(policy evaluation,本质为序列因果推断的 estimand),并应对异常值与重尾奖励分布的干扰。核心提出一种鲁棒时序差分(robust TD)算法,利用鲁棒 M-估计(如 median-of-means)抵抗重尾,并开发全在线推断方法避免离线 bootstrap 的计算开销。理论上证明该方法比经典 TD 学习更快逼近最小渐近方差(即 semiparametric efficiency bound),且免去了步长选择的敏感性。数值实验在真实 RL 数据上验证了算法的效率与鲁棒性。对您可能有用:将 RL policy evaluation 视为 longitudinal causal inference 的特例,本文的在线效率推断与鲁棒化框架为序列因果效应的 debiased/robust 估计提供了直接参照。
  • 关键技术: robust temporal difference learning, median-of-means estimator, online statistical inference, minimum asymptotic variance, policy evaluation in MDP, heavy-tailed robustification
  • 为什么对您有用: 直接关联 causal inference 中的 longitudinal policy evaluation 与 efficiency theory 中的最小渐近方差逼近。您可以用 moderately_familiar 的 M-estimation theory 与 semiparametric theory 来审视其鲁棒估计器的 influence function 与效率界是否紧,或将 MDP 价值估计映射到 very_familiar 的 causal estimation theory 框架。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以推导该在线鲁棒估计器的 influence function 并验证其效率宣称。

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)

1. 10.1214/25-aos2517 — Low-degree hardness of detection for correlated Erdős–Rényi graphs

  • 作者: Jian Ding, Hang Du, Zhangsong Li
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究相关 Erdős–Rényi 图的关联检测问题在低阶多项式算法类下的计算复杂度下界。设定为两个 n 节点 ER 图,边通过潜在顶点对应产生相关系数 ρ,目标是在 null(独立图)与 planted(相关图)之间做检测。作者证明:任何阶数 ≤ O(ρ⁻¹) 的多项式算法无法在适当成功定义下完成检测;在稀疏 regime q = n⁻¹⁺ᵒ⁽¹⁾ 下,只要阶数 d = exp(o(log n · log(nq) ∧ log n)) 且 ρ < α ≈ 0.338(Otter 常数),低阶多项式同样无法检测。核心工具是低阶多项式框架(计算 null 与 planted 下低阶矩的比值),结合 combinatorial counting 与 Otter 常数对子图密度的约束。结果暗示现有基于 tree-counting / spectral 的算法可能已触及多项式时间可达到的极限。对您而言,这是低阶多项式 barrier 在图匹配/检测问题上的典型应用,可作为 stat-computational tradeoff 方向的 gateway reading。
  • 关键技术: low-degree polynomial barrier, correlated Erdős–Rényi graph, Otter's constant, combinatorial subgraph counting, planted vs null detection
  • 为什么对您有用: 直接连接 stat-computational tradeoff 方向的低阶多项式 barrier 工具,本文将信号阈值(ρ vs Otter 常数 α)与计算阈值(多项式阶数上限)的 gap 显式写出,且 combinatorial counting 与您 very_familiar 的 higher-order U-statistics treewidth / tensor contraction 视角有天然对应(子图计数本质是高阶多项式统计量的 einsum 复杂度问题)。立即可做:用您熟悉的 treewidth / einsum 复杂度框架重新审视本文的 combinatorial counting 部分,看是否能给出更紧的阶数-复杂度刻画。

2. 10.1214/25-aos2525 — Structured matrix learning under arbitrary entrywise dependence and estimation of Markov transition kernel

  • 作者: Jinhang Chai, Jianqing Fan
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 7/10 · novelty: weaker_assumption
  • 摘要: 在低秩加稀疏矩阵恢复设定下,本文研究噪声矩阵具有任意逐元素依赖时的结构化矩阵估计,目标 estimand 为低秩信号矩阵。提出基于 incoherent 约束的最小二乘估计器,核心理论贡献是证明任意两个低秩 incoherent 矩阵之差的能量必然分散在各元素上(即差矩阵不能太稀疏)。基于此结构性质,在确定性下界和 minimax 风险上均达到紧致匹配,且不依赖噪声的独立或弱依赖假设。该框架应用于 Markov 转移核估计及条件均值算子(强化学习关键组件)时达到 minimax 最优,并拓展至多任务回归与结构化协方差估计;算法上采用交替最小化求解。对您有用:将任意依赖噪声下的 minimax 理论与 Markov 转移核估计结合,直接关联您的高维 minimax bound 与纵向因果/RL 中的条件均值估计兴趣。
  • 关键技术: low-rank-plus-sparse matrix recovery, incoherent-constrained least squares, minimax risk under arbitrary dependence, Markov transition kernel estimation, conditional mean operator, alternating minimization
  • 为什么对您有用: 本文直接关联您的高维统计 minimax bound 兴趣,并在 Markov 转移核与条件均值算子估计上触及纵向因果/RL 的估计理论。您可用 very_familiar 的 minimax bounds for estimation problems 审视其任意依赖噪声下的 minimax 界是否可推广至您关注的 inverse problems with random noise 设定,或用 moderately_familiar 的 M-estimation theory 检视其 incoherent 约束下估计器的理论性质。判断为立即可做:用 minimax 武器直接审视其确定性下界的紧致性,并探索该 incoherent 矩阵差能量分散性质在您熟悉的逆问题中的潜在应用。

3. 10.1214/25-aos2523 — High-dimensional statistical inference for linkage disequilibrium score regression and its cross-ancestry extensions

  • 作者: Fei Xue, Bingxin Zhao
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 本文在固定效应数据整合框架下研究连锁不平衡评分回归(LDSC)的高维统计推断,目标参数为遗传方差/协方差及分割遗传力。核心设定考虑 GWAS 汇总统计量的全基因组依赖结构及参考面板 LD 评分的块对角依赖模式,揭示决定 LDSC 性能的原始 GWAS 与参考面板关键因素。理论证明:在全基因组变体上 LDSC 估计量可达渐近正态(n^{-1/2}-CAN),但在小子集变体(分割遗传力)上渐近正态性极具挑战;跨血统扩展通过建模不同人群 LD 模式差异实现多源数据推断。数值验证基于 UK Biobank 真实遗传数据。对您可能有用:高维依赖结构下汇总统计量推断的渐近理论直接连接高维统计与 RMT 视角。
  • 关键技术: LD score regression, high-dimensional summary statistics, block-diagonal dependence, asymptotic normality, cross-ancestry GWAS integration, partitioned heritability
  • 为什么对您有用: 本文连接高维统计与 RMT 方向,处理 GWAS 汇总统计量的全基因组依赖结构及块对角 LD 评分模式,属于高维推断在基因组学中的具体应用。武器库中 high-dimensional asymptotics 可直接切入其渐近正态性证明的细节,评估块对角近似与全依赖建模的 gap。立即可做:用 very_familiar 的高维渐近工具复现/检验其 CAN 条件;中期可做:若想深入跨血统 LD 差异建模,需在 moderately_familiar 的 M-estimation 理论上补充随机矩阵谱分析的长肌肉。

非参数 / 半参数 (nonparam_semipara, 7 篇)

1. 10.1214/25-aos2538 — Yurinskii’s coupling for martingales

  • 作者: Matias D. Cattaneo, Ricardo P. Masini, William G. Underwood
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 研究问题是将 Yurinskii coupling 从独立随机向量的 ℓ₂-norm 推广到近似鞅的 ℓ_p-norm(1≤p≤∞),并在显著弱化的条件下给出 Gaussian strong approximation 的显式误差界。核心方法提出了一种新的三阶 coupling 方法,允许耦合变量服从更一般的 Gaussian mixture 分布,在某些设定下获得比二阶 coupling 更紧的近似。技术工具包括鞅经验过程的 uniform Gaussian mixture strong approximation、ℓ_p-norm 分布近似界的构造,以及对 mixingale / 鞅 / 独立数据的专门化。应用覆盖非参数 partitioning-based 回归与局部多项式回归的推断,以及高维鞅向量的 CLT。对您有用:弱化条件下的 ℓ_p-norm Yurinskii coupling 与三阶 coupling 是非参数/半参数推断中非渐近分布分析的基础工具,直接支撑您在 nonparametric statistics 和 high-dimensional asymptotics 方向的理论工作。
  • 关键技术: Yurinskii coupling, third-order coupling, Gaussian mixture strong approximation, ℓ_p-norm distributional approximation, martingale empirical process, non-asymptotic distributional analysis
  • 为什么对您有用: 本文直接连接到您 primary interest 中的 nonparametric theory 与 high-dimensional asymptotics——弱化条件的 ℓ_p-norm Yurinskii coupling 是 semiparametric inference 非渐近分析的核心工具,三阶 coupling 的思路与您 moderately_familiar 的 HOIF(Higher-Order Influence Functions)有天然的结构对应(都是通过更高阶修正收紧近似)。您 very_familiar 的 nonparametric statistics 与 minimax bounds 武器足以立即消化本文定理并检验其声称的 tighter approximation 是否在您关心的 estimation / testing 问题上确实带来 sharper rate。立即可做:将本文的三阶 coupling 应用于您熟悉的非参数/半参数 estimator 的非渐近分布分析,对比二阶 coupling 在具体 estimand 下的实际改进幅度。

2. 10.1214/25-aos2521 — The functional graphical lasso

  • 作者: Kartik G. Waghmare, Tomas Masak, Victor M. Panaretos
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 本文研究在 n≪p 的稀疏高维设定下,从 n 个观测中恢复 p 个联合分布的 Hilbert 空间随机元素之间的条件独立性关系,假设每个元素最多与 d≪p 个其他元素相关。作者提出了 graphical lasso 的无穷维推广(functional graphical lasso),无需有限截断或额外结构限制即可直接操作。证明了在自然假设下的模型选择一致性,并将经典有限维结果(如一致性、MLE 诠释)扩展到无穷维。方法具有 plug-in 性质,适用于稀疏或密集观测及序列依赖场景。对您有用:该工作将高维稀疏图模型推广至函数数据,其无穷维 MLE 与模型选择一致性的证明路径可为您在 semiparametric / nonparametric 理论中处理无穷维参数的 estimation 与 inference 提供参考。
  • 关键技术: functional graphical lasso, Hilbertian random elements, model selection consistency, sparse high-dimensional graph recovery, maximum likelihood in infinite dimensions, plug-in estimation
  • 为什么对您有用: 直接连接到 nonparametric / semiparametric 理论中无穷维参数的 estimation 与 inference 问题;您熟悉的 minimax bounds 与 high-dimensional asymptotics 可用于审视其模型选择一致性 rate 是否紧,或探索其无穷维 MLE 的 semiparametric efficiency bound。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以深入分析其无穷维 MLE 的 efficiency 性质。

3. 10.1214/25-aos2531 — Theory of functional principal component analysis for discretely observed data

  • 作者: Hang Zhou, Dongyi Wei, Fang Yao
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 5/10 · novelty: sharper_rate
  • 摘要: 本文研究离散观测函数数据下具有发散指标(diverging index)的 eigenfunction 估计问题,目标是在 mild regularity 假设(采样率范围与协方差核光滑条件)下获得 minimax-optimal 的 moment bound。作者提出新方法逐项处理 perturbation series 中的估计偏差,克服偏差累积导致的 summability 问题,对 eigenvalue 与 eigenfunction 给出统一的 moment bound。核心理论结果:在较宽采样率范围内,发散指标 eigenfunction 的 moment bound 达到 minimax-optimal rate,这是离散观测函数数据下该问题的首次最优速率结果。该结果填补了全观测理想情形与离散噪声观测现实之间的理论空白,且与 inverse problem 模型有内在联系。对您可能有用:perturbation-series 逐项控制与 minimax rate 论证可直接迁移到您熟悉的 inverse-problems-with-random-noise 框架,也可为 semiparametric efficiency bound 中涉及协方差谱分解的设定提供 sharper rate 参考。
  • 关键技术: functional principal component analysis, perturbation series, minimax rate, moment bounds, inverse problem with random noise, discretely observed functional data
  • 为什么对您有用: 本文直接推进了 nonparametric theory 中函数数据谱分解的 minimax rate 理论,属于您 primary interest 的 nonparametric/semiparametric 子方向。您 very_familiar 的 inverse problems with random noise 工具可直接切入本文 perturbation-series 逐项偏差控制的口子,验证其 minimax bound 是否紧。Follow-up 判断:立即可做——用 minimax bound 与 inverse-problem 经验审视其 rate 是否可进一步 sharpen 或推广到 semiparametric efficiency bound 框架。

4. 10.1214/25-aos2536 — Trimmed sample means for robust uniform mean estimation and regression

  • 作者: Roberto I. Oliveira, Lucas Resende
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 在 adversarial contamination(ε 比例污染)与 heavy-tailed data 设定下,本文研究 trimmed sample means 用于两类问题的鲁棒估计:一是函数族期望的均匀估计(等价于一般范数下随机向量均值估计),二是 quadratic loss 回归。trimmed mean estimator 在 contamination level ε 下首次达到 minimax-optimal 依赖(误差 O(ε)),同时在 heavy-tail 设定下 match 或 sharpen 已知 minimax rate;回归情形提出 trimmed mean linear regression,同样达到 ε 的最优依赖。核心工具是 trimmed mean 的截断机制配合 empirical process / uniform convergence 分析,在函数族上控制 sup-error。合成数据实验显示 trimmed mean regression 常优于 OLS 与 median-of-means 方法。对您有用:uniform mean estimation over function classes 是 minimax 理论经典问题,本文的 adversarial-contamination minimax rate 可直接用您的 minimax bound 武器验证其紧性。
  • 关键技术: trimmed sample means, adversarial contamination minimax rate, uniform estimation over function class, norm-constrained random vector mean estimation, trimmed mean linear regression, median-of-means comparison
  • 为什么对您有用: 直接连接 minimax bounds for estimation problems(very_familiar)——adversarial contamination 下的 minimax rate 是您能立即用经典 minimax 工具验证的对象;uniform estimation over function classes 桥接 nonparametric statistics(very_familiar)与 empirical process 理论。M-estimation theory(moderately_familiar)覆盖 regression 部分。判断:立即可做——用 minimax lower bound 技术检验其 ε-optimal dependence 是否紧,或拓展到您熟悉的 inverse-problem / high-dim 设定。

5. 10.1214/25-aos2542 — Spectral density estimation of function-valued spatial processes

  • 作者: Rafail Kartsioukas, Stilian Stoev, Tailen Hsing
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 本文研究取值于可分 Hilbert 空间的连续时间空间过程的谱密度函数的非参数估计问题,estimand 为 operator-valued spectral density,关键假设为 stationarity 与 covariance 的 power-law 衰减。提出基于 kernel smoothing 的估计量,适用于不规则空间采样(irregular locations),在 mixed-domain 渐近框架下给出 bias 与 variance 的显式速率。当数据在正则网格上观测时,估计量的最优速率与 operator-covariance power-law 衰减类的 minimax rate 精确匹配。对 Gaussian Hilbert-space valued 过程建立了谱密度估计量的渐近正态性,并将理论专门化到离散采样 functional data 在 RKHS 中的情形。对您有用:本文的 minimax rate 匹配结果与 RKHS 特化直接对接您在 nonparametric theory 与 minimax bounds 方面的核心兴趣。
  • 关键技术: kernel smoothing spectral density estimation, mixed-domain asymptotics, minimax rate for operator-covariance power-law decay, asymptotic normality in Hilbert space, RKHS discretely-sampled functional data, irregular spatial sampling
  • 为什么对您有用: 本文直接对接您 primary interest 中的 nonparametric theory 与 minimax bounds:谱密度估计的 minimax rate 匹配结果可用您 very_familiar 的 minimax bounds 工具审视其紧性(如验证 power-law 衰减类下常数因子是否可改进)。RKHS 特化部分与您 moderately_familiar 的 semiparametric theory 有交集,可考虑将 HOIF 视角引入以改善 irregular sampling 下的效率。follow-up 判断:立即可做——minimax rate 验证与 mixed-domain 渐近分析均在现有武器库范围内。

6. 10.1214/25-aos2522 — Deep horseshoe Gaussian processes

  • 作者: Ismaël Castillo, Thibault Randrianarisoa
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在随机设计非参数回归设定下,目标是利用深度高斯过程(Deep-GP)作为先验对具有复合结构的未知回归函数进行贝叶斯推断,关键模型假设为平方指数核与 Horseshoe 长度尺度先验。本文提出 Deep-HGP 先验,通过 Horseshoe 先验实现长度尺度参数的数据驱动自适应选择。理论证明,在二次损失下,相应后验分布的收缩速率达到 minimax 最优(至多相差对数因子),且同时自适应于回归函数的平滑度与复合结构深度。维度依赖关系显式给出,允许输入空间维度随样本量增加而增长。主要理论结果为 Deep-GP 后验在复合结构模型中的自适应 minimax 收缩率,对您有用:此文的复合结构自适应率分析直接连接到您 very_familiar 的非参数 minimax 界工具,为理解深度模型的统计极限提供了贝叶斯视角的对照。
  • 关键技术: deep Gaussian processes, horseshoe prior, adaptive posterior contraction rates, compositional structure adaptation, minimax optimality (up to log factor), squared-exponential kernel
  • 为什么对您有用: 本文连接到非参数理论中的自适应 minimax 估计与复合结构收敛率问题。您可以用 very_familiar 的 minimax bounds 工具审视其对数因子是否可去,或对比深度模型与经典非参数估计的极限界。中期可做——需先在 moderately_familiar 的 Bayesian nonparametrics 收缩率理论(如 Ghosal/van der Vaart 体系)上长肌肉,才能深入其复合结构自适应的证明细节。

7. 10.1214/25-aos2527 — Estimation and inference in distributional reinforcement learning

  • 作者: Liangyu Zhang, Yang Peng, Jiadong Liang, Wenhao Yang, Zhihua Zhang
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 本文在分布强化学习(distributional RL)框架下研究策略评估的统计效率问题,目标是估计给定策略 π 下完整回报分布 η^π,设定为有生成模型(generative model)的 tabular MDP。作者采用确定性等价(certainty-equivalence)方法构造估计量 η̂^π,证明在 p-Wasserstein 距离下样本复杂度为 Õ(|S||A| / ε^{2p}(1-γ)^{2p+2}),而在 Kolmogorov 与 total variation 距离下仅需 Õ(|S||A| / ε^2(1-γ)^4),表明分布策略评估具有样本效率。进一步,作者建立经验过程 √n(η̂^π − η^π) 在 ℓ^∞(F_W)、ℓ^∞(F_KS) 和 ℓ^∞(F_TV) 三类函数空间上向 Gauss 过程的弱收敛,从而为 η^π 的一大类统计泛函提供统一的推断框架。对您有用:该文的 empirical process 弱收敛与 minimax 样本复杂度分析直接对接您在 semiparametric efficiency 与 nonparametric minimax bound 方向的武器库。
  • 关键技术: distributional reinforcement learning, certainty-equivalence estimator, Wasserstein metric sample complexity, empirical process weak convergence, functional inference on return distribution, Kolmogorov and total variation metric bounds
  • 为什么对您有用: 本文核心落在 semiparametric / nonparametric theory 与 efficiency theory 的交叉:对回报分布(一个无穷维参数)做估计与推断,并用 empirical process 证明 √n-rate 弱收敛到 Gauss 过程,这正是 semiparametric efficiency bound 与 functional inference 的经典范式在 RL 场景的移植。您可用 very_familiar 的 minimax bound 工具审视其 Wasserstein 样本复杂度是否已达 minimax optimal,并用 moderately_familiar 的 semiparametric theory 判断其 Gauss 过程极限是否对应某个 influence function / efficient estimator 结构——这是立即可做的 follow-up。

效率理论 / Debiased ML (efficiency_dml, 2 篇)

1. 10.1214/25-aos2526 — Online statistical inference in decision-making with matrix context

  • 作者: Qiyu Han, Will Wei Sun, Yichen Zhang
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究带有矩阵上下文的在线决策问题,目标参数具有低秩结构,在自适应收集数据下进行统计推断。核心难点在于标准低秩估计量有偏且无法在线顺序计算,而现有顺序决策推断方法忽略低秩性且同样有偏。作者提出新的在线去偏程序,同时消除低秩估计偏倚与自适应数据收集偏倚,覆盖参数推断与最优策略值推断两个任务。理论上,基于新提出的低秩随机梯度下降估计量及其收敛结果,证明了在线去偏估计量的渐近正态性及置信区间有效性。对您而言,该文将 debiased ML 推广至矩阵低秩参数与自适应数据设定,直接连接 efficiency theory 与高维统计中的低秩推断。
  • 关键技术: online debiasing, low-rank stochastic gradient descent, adaptive data collection, matrix context bandit, asymptotic normality, low-rank estimation
  • 为什么对您有用: 直接连接 efficiency theory(debiased ML)与高维统计中的低秩推断,在自适应数据收集下给出渐近正态去偏估计量。可用 very_familiar 的高维渐近工具审视其 low-rank SGD 收敛率是否紧;moderately_familiar 的 semiparametric theory 可用于检验其去偏 score 构造是否达到 semiparametric efficiency bound。立即可做:用 minimax bound 验证其声称的收敛率是否最优。

2. 10.1214/25-aos2530 — A unified analysis of likelihood-based estimators in the Plackett–Luce model

  • 作者: Ruijian Han, Yiming Xu
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在 Plackett–Luce 排序聚合模型下,研究效用向量的 full/marginal/quasi-likelihood 估计量的渐近理论,设定为比较对象数 n→∞、图结构由确定性超图序列决定。通过重新解读各类估计方程获得初始洞察,在适当图拓扑条件下建立估计量的 uniform consistency 与渐近正态性。核心贡献是明确刻画了统计效率与计算复杂度之间的 trade-off:full likelihood 渐近有效但计算代价随超图结构增长,quasi-likelihood 计算轻便但效率有损。图拓扑条件被验证适用于非均匀随机超图模型与超图随机块模型等常见采样场景。主要理论结果给出了三类估计量的渐近分布与效率比较,对您有用在于:效率-计算 trade-off 的分析框架可类比到您关注的 statistical-computational tradeoff 问题,而超图上的似然计算复杂度与您 higher-order U-statistics 的 treewidth/tensor contraction 视角有结构相似性。
  • 关键技术: maximum likelihood estimation, asymptotic normality, uniform consistency, efficiency-computation tradeoff, hypergraph topology conditions, quasi-likelihood
  • 为什么对您有用: 直接连接到 efficiency theory(统计效率与计算复杂度 trade-off 的显式刻画)和 stat_computing(似然计算在超图上的代价分析)。用 technical_arsenal 中 'computation of higher-order U-statistics (treewidth / tensor contraction / einsum)' 可以攻一个具体口子:Plackett–Luce quasi-likelihood 在超图上的求值本质上是一组 tensor contraction,treewidth 视角可直接迁移来精确刻画其计算代价,甚至可能给出比本文更细的复杂度界。中期可做:需先在 moderately_familiar 的 'semiparametric theory' 上长肌肉,将本文 parametric efficiency bound 分析推广到带 nuisance parameter 的半参数排序模型设定。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)

1. 10.1214/25-aos2540 — Tests of missing completely at random based on sample covariance matrices

  • 作者: Alberto Bordino, Thomas B. Berrett
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在高维设定下研究缺失值是否完全随机(MCAR)的检验问题,将MCAR检验松弛为协方差矩阵集合的兼容性检验,使得维度可随样本量增长。核心贡献是定义了相关矩阵集合不兼容度的自然度量,并证明其可表征为半定规划(SDP)问题的最优值,同时建立关键对偶性结果以实现计算与解释。通过分析该度量自然plug-in估计量的集中性质,提出基于bootstrap校准的新检验,对任何具有不兼容协方差矩阵的分布均有功效。在典型缺失结构下证明了方法的minimax rate最优性;数值模拟显示重尾数据下仍有效。该方法亦可检验噪声观测下正半定矩阵补问题的可行性,对您在假设检验与高维统计交叉方向有直接参考价值。
  • 关键技术: MCAR hypothesis testing, covariance matrix compatibility, semi-definite programming (SDP), duality theory, bootstrap calibration, minimax rate optimality
  • 为什么对您有用: 直接连接假设检验与高维统计两个primary interest子方向,将MCAR检验转化为协方差矩阵兼容性的SDP优化问题,minimax rate最优性分析可被您熟悉的minimax bounds工具直接审视。用您very_familiar的高维渐近与inverse problems with random noise经验可立即审视其plug-in估计量集中性证明与矩阵补可行性检验的拓展;立即可做。

2. 10.1214/25-aos2543 — Improving knockoffs with conditional calibration

  • 作者: Yixiang Luo, William Fithian, Lihua Lei
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在 knockoff filter 多重检验框架下,目标是构造一个在 fixed-X 和 model-X 设定中 uniformly 提升 power 同时仍控制 FDR 的 procedure。作者利用 Fithian & Lei 的 conditional calibration 框架,提出 calibrated knockoff procedure:对任意给定 knockoff procedure 的 rejection set,通过条件校准重新分配 threshold,实现 power 的 uniform improvement。理论证明该改进在两类 knockoff 近乎 powerless 的场景尤为显著——rejection set 很小时(低 signal 密度)以及 fixed-X 设计矩阵结构限制 knockoff 质量时。在这些困难场景下,calibrated knockoffs 甚至在许多设定中超越了 dependence-adjusted BH 等 competing FDR 方法。对您可能有用:conditional calibration 的 selective inference 思路与您 hypothesis testing 方向直接相关,且 knockoff power 分析涉及的高维设计矩阵条件可连接到您的高维渐近理论武器。
  • 关键技术: conditional calibration, knockoff filter, FDR control, selective inference, multiple testing power improvement, fixed-X and model-X knockoffs
  • 为什么对您有用: 直接连接您 hypothesis testing 子方向中的多重检验/FDR 控制;conditional calibration 框架本质是 selective inference 下的条件推断,您可用 minimax bound 工具分析其 power improvement 的 rate 是否紧,或用高维渐近理论审视 design matrix 结构对 knockoff 质量的影响。中期可做:需先在 moderately_familiar 的 M-estimation theory 上补一下 selective inference / post-selection inference 的标准处理,再可尝试用 minimax 视角刻画 calibrated knockoff 在高维 sparse 设定下的 power lower bound。

其他 (other, 1 篇)

1. 10.1214/25-aos2529 — Symmetry: A general structure in nonparametric regression

  • 作者: Louis Goldwater Christie, John A. D. Aston
  • 期刊/来源: Annals of Statistics
  • 分类: vol 53 · issue 5
  • 相关性 8/10
  • 摘要: 在非参数回归设定下,本文提出"对称性"作为一般性结构框架,将协变量稀疏性(回归函数仅依赖 s<d 个协变量)归为"平移对称+线性轨道"的特例,目标是在 Lipschitz action 假设下利用已知或未知对称性获得更快收敛率。作者构造了"部分对称化算子",将其作用于常规非参数估计器,证明已知对称性可将有效维度从 d 降至轨道维度,从而获得与低维问题同阶的 minimax rate;对于未知对称性,提出两步 M-estimator 先估计最大对称群再对称化,证明在 Lipschitz action 条件下估计对称群的代价不破坏最终收敛率。主要理论结果是:无论对称性已知或未知(Lipschitz action),均可达到与已知结构等价的 rate improvement。对您有用之处在于,这为非参数效率理论提供了一个比 covariate sparsity 更一般的结构性减维视角,可与 minimax bound 和 M-estimation 理论直接对接。
  • 关键技术: partial symmetrisation operator

Maintained by 陈星宇 · Homepage · Source on GitHub

评论