AoS — Vol 54 Issue 1 · 2026-05-26¶

共 19 篇 · Annals of Statistics

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

这一期共 19 篇论文，整体上围绕三条主线展开：因果推断与识别（3 篇）、半参数/非参数方法与效率（6 篇）、高维/随机矩阵与计算（5 篇），其余分散在假设检验、统计计算与 SPDE 变点估计等方向。因果推断主线中，Berry-Esseen bounds 与 confounder selection 分别从估计理论（高维处理水平下的正态逼近）和识别策略（无需完整因果图的迭代图扩展）切入；半参数/非参数主线覆盖了泛函估计的凸对偶理论、SIR 的结构维度困境、Wicksell 问题的贝叶斯推断、多维匹配估计量的无平滑参数构造、矩阵/张量正态模型的测地凸性以及函数线性回归的流式推断；高维/随机矩阵主线则聚焦于 spiked matrix 模型的 AMP 最优性、随机图伪似然估计的相变、以及分布式分位数回归的通信高效算法。

在因果推断方向，Berry-Esseen bounds for design-based causal inference 将 Stein 方法与置换统计量结合，为处理水平数和因果效应维度同时发散时的正态逼近提供了非渐近速率，直接服务于高维因果推断的假设检验。Confounder selection via iterative graph expansion 则从识别角度出发，通过逐步扩展因果图来寻找满足 back-door 凸性的调整集，每一步仅需用户提供 primary adjustment set 的结构信息，避免了完整因果图指定的难题。这两篇分别从估计和识别两个侧面推进了因果推断的理论基础。

半参数/非参数主线中，Dualizing Le Cam’s method for functional estimation 通过凸对偶重新诠释 Le Cam 两点方法，去掉了 Donoho–Liu 对 modulus of continuity 的 Hölderian 假设，并推广到高维可分泛函估计。On the structural dimension of sliced inverse regression 则从 minimax 下界角度解释了 SIR 在结构维度 d>4 时性能崩溃的根本原因——信号随 d 指数衰减导致 minimax rate 爆炸。Multivariate root-n-consistent smoothing parameter-free matching estimators 通过 Voronoi 胞元上的多项式拟合，构造了无需带宽选择的 √n-consistent 估计量，适用于 ATE 等逆密度加权期望。Near optimal sample complexity for matrix and tensor normal models 利用 Fisher 信息度量下的测地凸性，证明了 MLE 在矩阵和张量正态模型中的近乎最优样本复杂度。Scalable inference in functional linear regression with streaming data 则首次为流式函数线性回归提供了 online bootstrap 推断的理论保证。

高维/随机矩阵方向，Optimality of approximate message passing for spiked matrix models 在旋转不变噪声下给出了 AMP 算法的状态演化与最优降噪器选择，实质上刻画了多项式时间可达的下界。Pseudo-likelihood-based M-estimation of random graphs 在依赖边随机图模型中建立了伪似然 M-估计的收敛率，并揭示了相变与近退化对收敛率的负面影响。Communication-efficient and distributed-oracle estimation for high-dimensional quantile regression 通过 IMSA 算法实现了非凸惩罚估计量的分布式估计，并引入 distributed-oracle 概念，相比 ℓ1 惩罚方法具有更优的收敛率。

对于因果推断方向的研究者，Berry-Esseen bounds for design-based causal inference 和 Confounder selection via iterative graph expansion 最值得优先阅读；半参数/效率方向，Dualizing Le Cam’s method for functional estimation 和 Multivariate root-n-consistent smoothing parameter-free matching estimators 提供了新的理论工具；高维方向，Optimality of approximate message passing for spiked matrix models 和 Near optimal sample complexity for matrix and tensor normal models 在随机矩阵与张量模型上给出了深刻的理论结果。

因果推断 (causal_inference, 2 篇)¶

1. 10.1214/25-aos2569 — Berry–Esseen bounds for design-based causal inference with possibly diverging treatment levels and varying group sizes¶

作者: Lei Shi, Peng Ding
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 在 Neyman 随机化框架下，本文研究处理水平数可能发散且各组样本量不等的实验中因果效应的 design-based 推断问题。作者将因果效应估计量表述为线性置换统计量，利用 Stein 方法推导出估计量线性及二次函数的 Berry-Esseen 界，给出了正态逼近的显式收敛速率。针对无重复观测的多处理水平实验，提出了新的方差估计量填补了理论空白。这些非渐近界为处理水平数和因果效应维度同时发散时的推断提供了严格保证。对您有用：本文将置换统计量与 Stein 方法结合的 Berry-Esseen 界推导，直接连接到您对因果推断估计理论及高维假设检验的兴趣。
关键技术: design-based causal inference, linear permutational statistic, Stein's method, Berry-Esseen bound, variance estimation without replications
为什么对您有用: 本文直接连接到因果推断中的 design-based 估计理论以及数学统计中的假设检验（Berry-Esseen 正态逼近）。您的 very_familiar 武器库中“高维渐近理论”与“因果推断估计理论”可直接审视本文在处理水平发散时的方差估计量构造与收敛界紧性；moderately_familiar 中的“高阶 U 统计量理论”可用来对比本文的置换统计量视角与 U 统计量 Hoeffding 分解视角的异同。立即可做：用您熟悉的 U 统计量投影工具，可尝试将本文的线性置换统计量框架推广到高阶因果效应（如交互效应），或验证其 Berry-Esseen 界在更一般高维设定下的紧性。

2. 10.1214/25-aos2577 — Confounder selection via iterative graph expansion¶

作者: F. Richard Guo, Qingyuan Zhao
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文研究观测研究中混杂因素选择（confounder selection）的 identification 问题，目标是在不预先指定完整因果图的情况下找到满足 back-door 凸性的调整集。作者提出迭代图扩展（iterative graph expansion）交互式程序：从待调整的处理-结局对出发，逐步寻找所谓“primary adjustment sets”，将因果图逐步扩展，视作对底层因果图一系列 marginalization 的逆操作。每一步仅向用户索取 primary adjustment set 的结构信息，无需用户提供混杂因素之间的因果关系；若用户每步正确指定，程序保证 soundness 和 completeness——要么找到有效调整集，要么判定不存在。该方法将因果图 discovery 与 identification 融合，避免了传统 back-door 凸性对完整图的依赖，对您在因果推断 identification 理论方向有直接参考价值。
关键技术: back-door criterion, primary adjustment set, iterative graph expansion, soundness and completeness, causal graph marginalization inversion
为什么对您有用: 直接连接因果推断 identification 子方向：本文将 back-door 凸性从“已知全图”前提解放到“逐步交互式发现 primary adjustment set”，是 identification 理论的新框架。您 very_familiar 的 identification theory in causal inference 可直接用来审视其 soundness/completeness 证明是否可推广至 latent variable 或 longitudinal 设定；moderately_familiar 的 semiparametric theory 可用于后续将此 identification 程序与 semiparametric efficiency bound 结合，研究调整集选择对 estimator efficiency 的影响。立即可做：用现有 identification theory 工具验证该框架在您关心的 proximal/IV/longitudinal 设定下的适用性。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶

1. 10.1214/25-aos2575 — Optimality of approximate message passing for spiked matrix models with rotationally invariant noise¶

作者: Rishabh Dudeja, Songbin Liu, Junjie Ma
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 在旋转不变噪声干扰的 spiked matrix model 设定下，目标是估计秩一信号矩阵，核心假设为噪声谱分布已知或可估。作者提出一类新的 approximate message passing (AMP) 算法，并在高维极限下给出其状态演化的简洁刻画。算法每步迭代利用非线性矩阵降噪器处理观测矩阵特征值（利用噪声结构），并用非线性迭代降噪器处理前一步迭代（利用信号先验）。作者推导了这两类降噪器的最优选择，证明所得算法在固定迭代预算下，于广泛的一类迭代算法中达到最低的渐近估计误差。这一结果实质上给出了旋转不变噪声下 spiked model 的多项式时间可达下界。对您而言，本文是连接您熟悉的高维 RMT 背景与 stat-computational tradeoff 领域的绝佳 gateway reading。
关键技术: approximate message passing (AMP), spiked matrix model, rotationally invariant noise, state evolution, optimal matrix denoiser, polynomial-time achievability
为什么对您有用: (1) 直接连接到 primary interest 中的 high-dimensional statistics (RMT) 以及 stat-computational tradeoff (多项式时间可达性/算法极限)。(2) 研究者的 "high-dimensional asymptotics" 和 "inverse problems with random noise" 武器可直接用来理解其 state evolution 刻画与谱方法极限的对比；AMP 的迭代结构为研究者进入 stat-computational tradeoff 提供了最标准的算法切入点。(3) 中期可做：需先在 moderately_familiar 的 AMP state evolution 与低阶多项式方法上长肌肉，但已有的 RMT 背景使得读懂 state evolution 的门槛很低。

非参数 / 半参数 (nonparam_semipara, 8 篇)¶

1. 10.1214/25-aos2498 — Dualizing Le Cam’s method for functional estimation I: General theory¶

作者: Yury Polyanskiy, Yihong Wu
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 9/10 · novelty: sharper_rate
摘要: 本文从凸对偶视角重新解释 Le Cam 两点方法在泛函估计中的紧性问题：寻找最优两点下界的最大化问题，经对偶化后变为在一族估计器上最小化二次风险上界的最小化问题；由 minimax 定理两问题值相同，该值（至多相差通用常数因子）刻画最优估计速率。对线性泛函估计，本文去掉了 Donoho–Liu (1991) 对 modulus of continuity 的 Hölderian 假设，强化了先前结果；对指数族，在更弱假设下刻画二次损失的 minimax risk，扩展了 Juditsky–Nemirovski (2009) 的结论；并给出高维设定下可分泛函估计的推广。对您有用：凸对偶–minimax 定理框架为 semiparametric efficiency bound 与 minimax rate 的关系提供了统一视角，直接连接到您的 efficiency theory 与 minimax bound 兴趣。
关键技术: Le Cam two-point method, convex duality, minimax theorem, modulus of continuity, linear functional estimation, exponential family minimax risk
为什么对您有用: 本文直接连接到您的 efficiency theory（semiparametric efficiency bounds 与 minimax rate）与 nonparametric minimax bound 兴趣：凸对偶框架将两点下界与估计器上界统一，为理解 semiparametric functional estimation 的 minimax risk 提供了更锐利的工具。用您 very_familiar 的 minimax bounds for estimation problems 可直接跟进 Donoho–Liu 型 modulus of continuity 去 Hölderian 假设后的具体构造；若想在高维可分泛函方向延伸，需在 moderately_familiar 的 semiparametric theory 上稍作增补。判断：立即可做。

2. 10.1214/25-aos2505 — On the structural dimension of sliced inverse regression¶

作者: Dongming Huang, Songtao Tian, Qian Lin
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 本文研究切片逆回归(SIR)在结构维度 d>4 时性能长期不佳的理论原因。设定为多指标模型 Y=f(PX)+ε，X 为 p 维标准正态，P 为投影到 d 维中心空间的算子，f 服从 GP 律。首先证明在高概率下 Cov[E(X|Y)] 的第 d 大特征值 λ_d ≤ C e^{-θ d}，即信号随 d 指数衰减。然后在低信号区域(λ_d ≤ d^{-8.1})，证明估计中心空间的 minimax risk 下界为 d p / (n λ_d)。两结果结合解释了 SIR 在大 d 下近 30 年的经验困境：信号指数衰减使 minimax rate 爆炸。对您有用：minimax 下界推导与 GP 先验下的特征值衰减分析，直接连接 semiparametric/nonparametric minimax 理论与 sufficient dimension reduction。
关键技术: sliced inverse regression, sufficient dimension reduction, minimax lower bound, Gaussian process prior on link function, eigenvalue decay of conditional covariance, multiple index model
为什么对您有用: 直接连接 nonparametric minimax 理论（very_familiar）与 sufficient dimension reduction 的经典问题；minimax 下界 dp/(nλ_d) 的构造可由您熟悉的 minimax bound 工具直接审视其紧性。立即可做：用 very_familiar 的 minimax 工具验证下界是否可达、是否可推广到非正态 X 设定。

3. 10.1214/25-aos2571 — Semiparametric Bernstein–von Mises phenomenon via Isotonized Posterior in Wicksell’s problem¶

作者: Francesco Gili, Geurt Jongbloed, Aad van der Vaart
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 本文研究 Wicksell 逆问题（从 2D 投影恢复 3D 分布）中的半参数贝叶斯推断，目标 estimand 为不可观测分布的 cdf F(t) 在点 x 的值。作者放弃对不可观测分布直接放 DP prior 的经典路线，转而对可观测分布放 DP prior，利用共轭性获得计算便利，再将后验投影到 L₂ 单调右连续子空间，得到 Isotonized Inverse Posterior (IIP)。IIP 满足半参数 Bernstein–von Mises 现象，其渐近方差达到 minimax 速率 g₀(x)/2γ（γ>1/2 为真实 cdf 在 x 处的 Hölder 连续度），且自动提供不确定性量化而无需估计 γ。这是首个在逆问题中基于投影后验与 DP prior 的半参数 BvM 定理。对您而言，本文将逆问题随机噪声下的 minimax 理论与半参数 BvM 结合，直接触及非参数效率理论子方向。
关键技术: Dirichlet Process prior, isotonized projection, semiparametric Bernstein-von Mises, Wicksell's inverse problem, minimax asymptotic variance, Hölder continuity
为什么对您有用: 本文连接半参数效率理论（BvM 现象与 minimax variance）与逆问题随机噪声，正是您 very_familiar 的 minimax bounds 与 inverse problems with random noise 交汇处。您可用 minimax bound 工具验证其声称的 minimax 速率是否紧，或用 HOIF 视角审视投影后验与 influence function 的关系。立即可做：用 very_familiar 的 minimax 与逆问题工具复现/检验其速率。

4. 10.1214/25-aos2568 — Multivariate root-n-consistent smoothing parameter-free matching estimators and estimators of inverse density weighted expectations¶

作者: Hajo Holzmann, Alexander Meister
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: weaker_assumption
摘要: 在多维逆密度加权期望（等价于回归函数 Lebesgue 积分）的设定下，目标是构造无需平滑参数的 √n-consistent 估计量，estimand 涵盖 ATE、随机系数回归中的非参估计量及 Berkson 误差模型的去卷积估计量。传统 nearest-neighbor / matching 估计量在多维下受偏差困扰；作者在 K-th order Voronoi tessellation 的每个胞元上做多项式最小二乘拟合，对足够大的 K 修正偏差，仅需回归函数 mild smoothness、对协变量密度无任何 smoothness 要求，且不依赖随 n 变化的 bandwidth。补充信息论下界（Fano 型论证）表明回归函数的某种 smoothness 是达到参数速率的必要条件，确认了假设的不可削弱性。模拟验证了方法的实际可行性。对您在因果推断 matching/ATE 估计的效率理论以及用 higher-order U-statistics / tensor contraction 分析 Voronoi 胞元组合结构的计算成本有直接参考价值。
关键技术: K-th order Voronoi tessellation, polynomial least squares on Voronoi cells, smoothing-parameter-free √n-consistent estimation, inverse density weighted expectations, information-theoretic lower bounds, matching estimator bias correction
为什么对您有用: 直接连接因果推断中 matching/ATE 估计的效率理论（primary: causal inference estimation theory）与半参效率问题——本文在无密度 smoothness、无 bandwidth 条件下实现 √n-consistency，是比传统 debiased ML / IPW 更弱的假设设定。您武器库中 minimax bounds（very_familiar）可直接审视其信息论下界是否紧；higher-order U-statistics 的 treewidth / tensor contraction 视角（very_familiar）可分析 K-th order Voronoi 胞元上多项式拟合的组合计算成本。进一步追问该估计量是否达到 semiparametric efficiency bound 则需先在 semiparametric theory（moderately_familiar）上长肌肉。立即可做：用 minimax / U-stat 计算复杂度框架切入；中期可做：效率 bound 比较需补半参理论。

5. 10.1214/25-aos2539 — Near optimal sample complexity for matrix and tensor normal models via geodesic convexity¶

作者: Cole Franks, Rafael Oliveira, Akshay Ramachandran, Michael Walter
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 6/10 · novelty: new_theory
摘要: 本文研究矩阵正态模型与张量正态模型中协方差矩阵 Kronecker 因子的估计问题，目标 estimand 为各因子矩阵，无需 well-conditioned 或稀疏假设。核心发现是：在足够样本下，负对数似然函数在 Fisher 信息度量诱导的黎曼几何下具有强 geodesic convexity，该凸性由随机量子通道的扩张系数决定。基于此，MLE 在 Fisher-Rao 与 Thompson 距离下达到近乎最优的非渐近样本复杂度与误差率；矩阵情形 minimax optimal（至 log 因子），张量情形最大因子与整体协方差 minimax optimal（至常数因子）。同时证明广泛使用的 flip-flop 算法以高概率线性收敛。对您有用：geodesic convexity + Kronecker 结构的分析为高维协方差估计提供了新几何视角，与您的高维渐近理论及张量计算（einsum/contraction）兴趣直接相连。
关键技术: geodesic convexity on PD manifold, Fisher-Rao metric, random quantum channel expansion, Kronecker product covariance, minimax sample complexity, flip-flop algorithm linear convergence
为什么对您有用: 直接连接高维统计与张量计算两个 primary interest 子方向：Kronecker 因子估计是高维协方差结构估计的经典问题，而 geodesic convexity 的量子通道刻画提供了新的几何-概率工具。您武器库中 tensor contraction / einsum 的熟悉度可直接用于理解张量正态模型中 MLE 的计算结构；高维渐近理论可用来审视其 minimax 界是否可进一步 sharpen。立即可做：用 very_familiar 的高维渐近与 minimax bound 工具验证其声称的 minimax optimality 是否在更精细的损失函数下仍紧。

6. 10.1214/25-aos2549 — Scalable inference in functional linear regression with streaming data¶

作者: Jinhan Xie, Enze Shi, Peijun Sang, Zuofeng Shang, Bei Jiang, Linglong Kong
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 5/10 · novelty: new_method
摘要: 在函数线性回归设定下，目标是解决流式数据场景中系数函数的估计与推断问题，核心假设是数据逐批到达且内存受限。作者提出 functional stochastic gradient descent（FSGD）算法，仅需单遍扫描数据即可更新系数函数估计，并构造 online bootstrap perturbation 方案以实现逐点置信带构建。理论上证明了 FSGD 估计量的收敛速率与渐近正态性，且 perturbed 估计量具有相同的渐近分布，从而为 online bootstrap 提供严格理论依据。这是首个针对流式函数线性回归的推断结果。对您有用：将 SGD 与函数数据推断结合，为 streaming semiparametric 推断提供了新范式，与您在 semiparametric efficiency 和 statistical computing 的兴趣直接相关。
关键技术: functional stochastic gradient descent, online bootstrap resampling, functional linear regression, asymptotic distribution of SGD estimator, streaming data inference
为什么对您有用: 直接连接 semiparametric & nonparametric theory 与 statistical computing 两个 primary interest 子方向：函数线性回归是经典 nonparametric/semiparametric 模型，而 streaming SGD + online bootstrap 属于 statistical computing 中的数值方法与算法设计。您 very_familiar 的 nonparametric statistics 和 minimax bounds 可用于审视其收敛速率是否达到 minimax optimal；moderately_familiar 的 M-estimation theory 可用于分析 FSGD 的渐近性质是否可纳入 M-estimator 框架。follow-up 判断：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将 FSGD 的渐近理论纳入更一般的 online M-estimation 框架，进而探索 semiparametric efficiency bound 在 streaming 设定下是否可达。

7. 10.1214/25-aos2535 — Pseudo-likelihood-based M-estimation of random graphs with dependent edges and parameter vectors of increasing dimension¶

作者: Jonathan R. Stewart, Michael Schweinberger
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 在单观测（single-observation）随机图设定下，本文研究依赖边（dependent edges）离散无向图模型中伪似然 M-估计的收敛率，参数维度随样本量增长。核心 estimand 为指数族参数化图模型的参数向量；关键 regularity 假设涉及依赖结构与近退化（near-degeneracy）控制。方法采用伪似然替代不可达全似然，通过 M-估计框架在 dense/sparse 图下建立收敛率，并显式揭示相变（phase transition）与模型近退化对收敛率的负面影响。技术工具包括依赖数据的经验过程界、伪似然一致性证明及广义 β-模型中重叠子群结构对依赖的分解。主要理论结果给出伪似然 M-估计在参数维度增长下的收敛率，并展示广义 β-模型在 dense/sparse 设定下的具体率。对您而言，本文将 M-估计理论与依赖数据经验过程结合，且参数维度增长设定与高维/半参数理论直接相关。
关键技术: pseudo-likelihood M-estimation, exponential-family graphical models, dependent-edge random graphs, phase transitions in convergence rates, model near-degeneracy, generalized beta-models
为什么对您有用: 本文连接到 semiparametric / nonparametric theory 与 high-dimensional statistics 子方向：参数维度随 n 增长的 M-估计收敛率分析是您 very_familiar 的 minimax bounds 与 moderately_familiar 的 M-estimation theory 的直接交汇口。用您熟悉的 M-估计理论可以审视其伪似然替代全似然带来的效率损失与收敛率是否可进一步 sharpen（如用 HOIF 或 minimax bound 验证）。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，特别是依赖数据经验过程界的细节，再可攻伪似然效率界。

8. 10.1214/25-aos2570 — Neural networks generalize on low complexity data¶

作者: Sourav Chatterjee, Timothy Sudijono
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 3/10 · novelty: new_theory
摘要: 本文研究前馈 ReLU 神经网络在低复杂度数据上的泛化性，核心 estimand 是插值 MDL 网络在未见数据上的预测误差。设定为一类简单编程语言生成的 i.i.d. 数据，关键假设是数据生成机制的 Kolmogorov 式描述长度有限。作者定义了神经网络的描述长度（MDL），证明对插值数据的 MDL 最小网络以高概率泛化；具体地，在素性检测示例中，从 {1,…,N} 均匀抽取 n 个样本，MDL 插值网络对新数的预测误差为 O((ln N)/n)。技术核心是将泛化界与数据及网络的描述长度直接挂钩，绕过传统 Lipschitz / 覆盖数路径，得到一种基于算法复杂度的 PAC 式界。对噪声数据的扩展暗示 MDL 插值呈现 tempered overfitting。对您有用：此文的 MDL-泛化界为非参数统计中 sieve / M-estimation 的复杂度惩罚提供了算法信息论视角，可与 minimax rate 和 higher-order U-stat 的复杂度刻画做对比。
关键技术: minimum description length (MDL), ReLU feedforward neural network, algorithmic complexity / Kolmogorov complexity, interpolating estimator generalization, tempered overfitting, PAC-style bound with description length
为什么对您有用: 直接连接非参数统计与效率理论中的 sieve M-estimation 复杂度惩罚问题，用算法描述长度替代传统覆盖数/VC维来控制泛化，这对 minimax bound 和 semiparametric efficiency 的复杂度假设有启发。您可以用 very_familiar 的 minimax bounds 工具审视此界是否紧，以及用 moderately_familiar 的 M-estimation theory 探索 MDL 复杂度与 sieve 复杂度的等价/不等价关系。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，将 MDL 界嵌入 sieve M-estimator 的收敛分析框架。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1214/25-aos2563 — Average partial effect estimation using double machine learning¶

作者: Harvey Klyne, Rajen D. Shah
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 9/10
摘要: 本文研究回归设定下变量平均偏效应（APE）的估计问题，APE定义为回归函数对目标变量斜率的均值，是部分线性模型偏效应的非参数推广。传统双稳健估计需同时估计条件均值导数与目标变量给定其余变量的条件得分，在高维下极具挑战且不兼容基于决策树的非可微ML方法。作者提出新DML流程：对第一阶段回归估计做再平滑使其可微，并对目标变量的条件分布施加位置–尺度模型；在此假设下，条件得分估计误差可分解为条件均值误差、条件标准差误差与一维得分估计误差之和，大幅降低难度。理论贡献包括Lipschitz得分函数次高斯性新结果，并证明估计量在交叉拟合下达到n^{-1/2}-CAN与半参数有效界。对您有用：本文将DML/双稳健框架拓展至非可微ML场景下的APE估计，直接关联efficiency theory与debiased ML方向。
关键技术: double machine learning, doubly robust estimation, resmoothing non-differentiable estimators, location–scale conditional distribution model, sub-Gaussianity of Lipschitz score functions, cross-fitting
为什么对您有用: 直接连接efficiency theory / debiased ML方向：本文将DML框架拓展到非可微ML估计器（如树方法）下的APE估计，给出n^{-1/2}-CAN与半参数有效界。用very_familiar中的minimax bounds与estimation theory in causal inference可验证其声称的效率界是否紧；moderately_familiar中的semiparametric theory可用来审视location–scale假设对半参数有效界的影响。立即可做：用very_familiar武器检查resmoothing步骤对influence function的影响，并验证次高斯性结果在更高阶U-stat设定下的推广可能性。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶

1. 10.1214/25-aos2576 — Information theoretic limits of robust sub-Gaussian mean estimation under star-shaped constraints¶

作者: Akshay Prasadan, Matey Neykov
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 9/10 · novelty: sharper_rate
摘要: 本文研究在星形约束集 K⊆ℝ^n 下、含 ε 比例对抗性污染的子高斯均值估计的 minimax rate。设定为 N 个观测中未知比例 ε≤1/2−κ 被任意篡改，噪声为高斯或子高斯，损失为平方 ℓ₂ 距离。核心结果是：已知/对称子高斯噪声下 minimax risk 为 max(η², σ²ε²)∧d²，其中 η 由局部熵 log M_K^loc(η,c) 与样本量、方差的关系隐式定义；未知子高斯噪声下 rate 退化为 max(η*², σ²ε²log(1/ε))∧d²。算法基于局部熵的 packing/covering 结构与 robust filtering 思想，将集合几何与污染比例统一进一个 rate 表达式。结果对您有用：它将 minimax bound 与局部度量熵直接挂钩，与您熟悉的 nonparametric minimax 理论高度同构，且星形约束下的 rate 表达式可类比高维/半参数效率界中的 entropy-sieve 交互。
关键技术: minimax rate under adversarial corruption, local metric entropy, star-shaped constraint set, robust sub-Gaussian mean estimation, breakdown point analysis, filtering algorithm
为什么对您有用: 本文直接连接到您 primary interest 中的 minimax bounds for estimation problems 与 mathematical statistics：星形约束下的局部熵–rate 关系是经典 nonparametric minimax（如 sieve M-estimation rate）在 robust 设定下的自然推广，技术语言完全在您 very_familiar 武器库内。用您熟悉的 minimax bound 工具可立即验证其 η* 定义是否紧、并尝试将局部熵条件转化为更具体的 sieve / RKHS entropy 条件以获得显式 rate——这是立即可做的 follow-up。

2. 10.1214/25-aos2565 — A computational transition for detecting correlated stochastic block models by low-degree polynomials¶

作者: Guanyi Chen, Jian Ding, Shuyang Gong, Zhangsong Li
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 在 correlated stochastic block model 框架下，研究从同一 parent SBM 子采样生成的两个相关稀疏图与两个独立 Erdős–Rényi 图的检测问题，关键参数为子采样概率 s、平均度 λ=O(1)、community divergence ϵ。考虑 low-degree polynomial 类检验，确定计算可行与计算困难的精确阈值：s > min{α, 1/(λϵ²)} 时 low-degree 检验可区分两模型，否则不可，其中 α≈0.338 为 Otter's constant（树计数常数），1/(λϵ²) 为 Kesten-Stigum threshold。当 α < 1/(λϵ²) 时存在统计可检测但 low-degree 计算不可行的信息-计算间隙。Hardness 证明基于 conditional low-degree likelihood calculation 变体，并通过 reduction 蕴含 partial recovery 与 detection（对独立 block model）的 low-degree hardness。本文揭示了 correlated graph detection 中由 Otter's constant 与 Kesten-Stigum threshold 共同控制的计算相变，对您在 stat-computational tradeoff 方向理解 low-degree barrier 如何给出精确 impossibility 界非常有用。
关键技术: low-degree polynomial tests, conditional low-degree likelihood calculation, Otter's constant, Kesten-Stigum threshold, correlated stochastic block model, information-computation gap
为什么对您有用: 直接连接 stat-computational tradeoff 方向的 low-degree polynomial barrier 子方向，给出了检测问题中统计阈值与计算阈值的精确间隙。研究者 very_familiar 的 minimax bounds 可用来对比本文检测阈值与经典统计最优阈值，而 Otter's constant 的树枚举/图计数组合性质与研究者 higher-order U-stat 的 treewidth 视角有弱连接（树结构复杂度 vs 统计量计算代价）。中期可做：需先在 low-degree likelihood ratio 机制上长肌肉（本文 conditional variant 是标准 LDLR 的推广），之后可探索 correlated SBM 中更高阶 polynomial statistic 的计算代价与检测力的关系。

统计计算 / 算法 (stat_computing, 2 篇)¶

1. 10.1214/25-aos2573 — Communication-efficient and distributed-oracle estimation for high-dimensional quantile regression¶

作者: Songshan Yang, Yifan Gu, Hanfang Yang, Xuming He
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 7/10 · novelty: new_method
摘要: 在分布式高维分位数回归设定下，目标是 folded-concave 惩罚估计量的 communication-efficient 估计，关键假设包括局部稀疏性条件与有限通信轮数约束。提出 Iterative Multi-Step Algorithm (IMSA) 处理非凸目标函数，并引入 distributed-oracle estimator 新概念；证明 IMSA 估计量以高概率收敛至 distributed-oracle 估计量，相比 ℓ1 惩罚方法具有更快收敛率且支持恢复所需条件更弱。进一步将框架扩展至高维模型中预指定低维成分的分布式推断，推导了检验统计量在 null 与 local alternatives 下的极限分布；另设计 feature-splitting 算法以适应分布式系统中的高维数据结构。对您有用：分布式推断部分直接连接 hypothesis testing 子方向，而 IMSA 与 feature-splitting 的算法设计落入 statistical computing 的核心关注区。
关键技术: folded-concave penalty, distributed-oracle estimator, communication-efficient distributed estimation, feature-splitting algorithm, high-dimensional quantile regression, local alternative hypothesis testing
为什么对您有用: 本文同时连接 statistical computing（分布式通信效率与算法设计）和 hypothesis testing（高维模型中低维成分的分布式检验、local alternatives 极限分布）两个 primary interest 子方向。technical_arsenal 中 high-dimensional asymptotics 可用于审视其收敛率与 oracle property 的理论声称，software development 经验可直接复现 IMSA 与 feature-splitting 算法。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以深入理解 folded-concave 惩罚下 oracle property 的局部凸性论证细节。

2. 10.1214/25-aos2564 — Solving the Poisson equation using coupled Markov chains¶

作者: Randal Douc, Pierre E. Jacob, Anthony Lee, Dootika Vats
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 6/10 · novelty: new_method
摘要: 本文研究如何利用耦合 Markov chain（在随机迭代次数后精确相遇）来构造 Poisson 方程解的无偏估计量。通过这一联系，重新推导了针对 Markov chain 平稳分布期望的已知无偏估计量，并给出了其矩有限的条件。进一步构造了 Markov chain 遍历平均的渐近方差的无偏估计量，并证明在二阶矩有限条件下，独立副本的平均以 Monte Carlo n^{-1/2} 速率收敛至渐近方差，优于 batch means 和谱方差估计器的已知收敛速率。对您可能有用：本文的无偏渐近方差估计器为 MCMC 输出的误差评估提供了计算上更高效的替代方案，直接连接到统计计算与数值方法方向。
关键技术: coupled Markov chains, Poisson equation, unbiased estimation, asymptotic variance estimation, Monte Carlo rate, moment finiteness conditions
为什么对您有用: 本文直接连接到统计计算（数值方法与算法）方向，提供了 MCMC 渐近方差的无偏估计方法，优于传统 batch means / spectral 方法。研究者武器库中 software development 与 high-dimensional asymptotics 可直接用于实现和验证该估计器在具体模型中的表现。属于立即可做：用 very_familiar 的软件开发能力即可复现数值实验并探索在高维目标分布中的适用性。

其他 (other, 3 篇)¶

1. 10.1214/25-aos2567 — Change point estimation for a stochastic heat equation¶

作者: Markus Reiß, Claudia Strauch, Lukas Trottner
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 8/10
摘要: 本文研究基于随机热方程（SPDE）的变点估计问题，设定为空间依赖扩散系数 \(\vartheta(x)\) 在未知点 \(\tau\) 处有分段常数跳跃，观测为空间分辨率 \(\delta\) 下的局部测量。核心方法是构造同时估计扩散系数值与变点的 M-estimator，利用对二次泛函的紧集中界与经典 M-estimator 的推广完成分析。理论结果表明：变点估计收敛速率为 \(\delta\)，扩散常数收敛速率为 \(\delta^{3/2}\)；当扩散参数已知且跳跃高度随分辨率趋于零时，变点估计量有极限分布定理。对您可能有用：该文的紧集中界与 M-estimator 推广技术可迁移到您熟悉的 inverse problems with random noise 与 minimax bounds 分析中。
关键技术: stochastic partial differential equation, M-estimation, concentration inequality for quadratic functionals, change point estimation

2. 10.1214/25-aos2572 — Optimal convex M-estimation via score matching¶

作者: Oliver Y. Feng, Yu-Chun Kao, Min Xu, Richard J. Samworth
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 7/10
摘要: 在线性回归设定下，本文构造数据驱动的凸损失函数，使经验风险最小化在回归系数估计中达到最优渐近方差。在总体层面，最优凸损失的负导数是噪声分布 log-density 导数的最佳递减逼近，这催生了基于 score matching 非参数扩展的拟合过程，对应于噪声分布关于 Fisher 散度的 log-concave 投影。样本层面的半参数估计器计算高效，作者证明其在所有凸 M-估计器中达到最小渐近协方差。以 Cauchy 误差为例，最优凸损失呈 Huber-like 形态，相对于已知噪声分布的 MLE，渐近效率超过 0.87，兼顾鲁棒性与计算可行性而不显著牺牲统计效率。对您有用：本文将 semiparametric efficiency 与 convex M-estimation 结合，其 log-concave projection + score matching 技术路线可迁移至您关注的 semiparametric efficiency bound 与 M-estimation theory 子方向。
关键技术: convex M-estimation, score matching

3. 10.1214/25-aos2566 — Pseudo-Labeling for kernel ridge regression under covariate shift¶

作者: Kaizheng Wang
期刊/来源: Annals of Statistics
分类: vol 54 · issue 1
相关性 5/10
摘要: 在协变量偏移（covariate shift）设定下，目标是基于目标分布的无标签数据和来源分布的有标签数据，估计目标分布上的回归函数并最小化 MSE。方法将来源有标签数据拆为两子集，分别做 kernel ridge regression 得到候选模型集合与插补模型；后者为目标无标签数据生成 pseudo-label，再据此选择最优候选。非渐近超额风险界证明估计量自适应目标分布结构与协变量偏移程度，并通过"有效样本量"概念量化来源标签数据对目标任务的贡献。估计量达到 minimax 最优速率（仅差 polylog 因子），且 pseudo-label 用于模型选择不会显著损害性能。对您有用：协变量偏移下的 minimax 最优率与有效样本量概念，可直接桥接到因果推断中 transportability / generalizability 的非参数估计理论。
关键技术: kernel ridge regression, pseudo-labeling for model selection, covariate shift adaptation, minimax optimal rate

Maintained by 陈星宇 · Homepage · Source on GitHub