AoS — Vol 54 Issue 1 · 2026-05-18¶
- 共 19 篇 · Annals of Statistics
因果推断 (causal_inference, 2 篇)¶
1. 10.1214/25-aos2569 — Berry–Esseen bounds for design-based causal inference with possibly diverging treatment levels and varying group sizes¶
- 作者: Lei Shi, Peng Ding
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 9/10 · novelty:
new_theory - 摘要: 在 Neyman 随机化模型下,研究处理水平数可能发散且各组样本量不等的实验中因果效应的设计推断问题,estimator 为线性排列统计量形式。核心方法是将估计量表述为线性 permutational statistic,利用 Stein's method 推导出估计量线性和二次函数的 Berry–Esseen 界,覆盖发散处理水平数与发散因果效应维度的情形。此外,针对无重复的多处理水平实验,提出新的方差估计量,填补了该设定下方差估计的理论空白。所得 Berry–Esseen 界为设计推断的正态逼近提供了非渐近的有限样本保证,优于传统 CLB 的渐近结果。对您有用:该工作将 Stein's method 与排列统计量结合的技巧可迁移至高维因果效应的假设检验,且发散维数下的 Berry–Esseen 界直接关联您对 mathematical statistics 与 hypothesis testing 的兴趣。
- 关键技术:
Stein's method,Berry-Esseen bound,linear permutational statistic,design-based inference,variance estimation without replications - 为什么对您有用: 直接推进设计因果推断的有限样本理论,Berry–Esseen 界与发散维数设定连接您 primary interest 中的 hypothesis testing 与高维因果效应推断;Stein's method 技巧对您研究 higher-order U-statistics 的逼近问题亦有方法论借鉴价值。
2. 10.1214/25-aos2577 — Confounder selection via iterative graph expansion¶
- 作者: F. Richard Guo, Qingyuan Zhao
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 在观测研究的混杂因素选择问题中,目标是找到控制处理与结果间混杂的协变量集,而传统方法(如后门准则)通常需要预先指定完整的因果图。本文提出一种无需预先指定因果图或观测变量集的交互式混杂因素选择程序。该方法通过寻找“主要调整集”迭代地扩展因果图,这可视为对底层因果图一系列边际化的逆操作。程序逐步从用户处获取主要调整集的结构信息,直到找到合适的调整集或判定其不存在,且不需要混杂因素之间的因果关系信息。理论证明,在用户每步正确指定主要调整集的条件下,该程序具有可靠性与完备性。该工作为因果推断中识别步骤提供了一个无需全图的图扩展新视角,直接关联您 primary interest 中的因果推断(identification)与图模型设定。
- 关键技术:
back-door criterion,primary adjustment set,iterative graph expansion,graph marginalization inversion,soundness and completeness - 为什么对您有用: 直接关联您 primary interest 中的因果推断(identification),为无需预知全图的混杂因素选择提供了可靠且完备的交互式图扩展方法,对放松传统图模型假设有重要参考价值。
高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)¶
1. 10.1214/25-aos2575 — Optimality of approximate message passing for spiked matrix models with rotationally invariant noise¶
- 作者: Rishabh Dudeja, Songbin Liu, Junjie Ma
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 9/10 · novelty:
new_theory - 摘要: 本文研究在加性旋转不变噪声污染下,从观测矩阵中估计秩一信号矩阵的高维估计问题。作者提出了一类新的近似消息传递(AMP)算法,并在高维极限下给出了其状态演化的简洁刻画。该算法在每步迭代中,通过对观测矩阵特征值施加非线性矩阵去噪器来利用噪声结构,同时对前一步迭代施加非线性迭代去噪器以利用信号先验。作者推导了这两类去噪器的最优选择,并证明在固定迭代预算下,所得算法在一大类迭代算法中达到了最低的渐近估计误差。对您有用:直接推进了高维统计与随机矩阵理论(spiked model + 旋转不变噪声)中的最优算法设计,其 AMP 动力学刻画与渐近最优性证明对您研究高维推断和统计计算有直接参考价值。
- 关键技术:
approximate message passing (AMP),spiked matrix model,rotationally invariant noise,nonlinear matrix denoiser,state evolution,asymptotic optimality - 为什么对您有用: 直接推进了您 primary interest 中高维统计与随机矩阵理论(spiked model + 旋转不变噪声)的最优算法设计,其 AMP 动力学刻画与渐近最优性证明对高维推断和统计计算有直接参考价值。
2. 10.1214/25-aos2573 — Communication-efficient and distributed-oracle estimation for high-dimensional quantile regression¶
- 作者: Songshan Yang, Yifan Gu, Hanfang Yang, Xuming He
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 在分布式计算框架下,研究带折叠凹惩罚的高维分位数回归的通信高效估计与推断问题,目标是在有限通信轮次下达到与全局估计量同等的统计精度。提出迭代多步算法(IMSA)解决目标函数非凸问题,并引入“分布式神谕估计量”(distributed-oracle estimator)概念,证明所提估计量以高概率收敛至该神谕估计量。相比 ℓ1 惩罚方法,IMSA 估计量具有更快的收敛速率,且在更弱的条件下即可实现支持恢复。进一步将框架扩展至高维模型中低维分量的分布式推断,推导了检验统计量在原假设与局部备择假设下的极限分布。针对分布式系统中的高维数据,还设计了特征分割算法以适应 p > n 的场景。该文对您有用:结合了高维统计的收敛率优化与假设检验的极限分布推导,且其分布式通信算法与特征分割计算方案直接契合您对高维推断、假设检验及统计计算的兴趣。
- 关键技术:
distributed high-dimensional quantile regression,folded-concave penalty,distributed-oracle estimator,communication-efficient algorithm (IMSA),feature-splitting algorithm,distributed inference for low-dimensional components - 为什么对您有用: 直接推进高维统计中折叠凹惩罚的收敛率与支持恢复理论,并在分布式设定下推导了低维分量的假设检验极限分布,契合您对高维推断、假设检验及统计计算算法的兴趣。
3. 10.1214/25-aos2505 — On the structural dimension of sliced inverse regression¶
- 作者: Dongming Huang, Songtao Tian, Qian Lin
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 6/10 · novelty:
new_theory - 摘要: 在多指标模型 Y=f(PX)+ε 的充分降维设定下,研究切片逆回归(SIR)在结构维度 d>4 时表现不佳的长期谜题。首先证明若联系函数 f 服从高斯过程定律,则 Cov[E(X|Y)] 的第 d 大特征值 λ_d 以高概率满足 λ_d ≤ C exp(-θd),即信号随 d 指数衰减。随后针对 λ_d ≤ d^{-8.1} 的低信号区间,证明了估计中心空间的极小极大风险下界为 dp / (nλ_d)。结合上述两结果,从信号衰减与极小极大风险的角度严格解释了 SIR 在大 d 下失效的近三十年现象。对您有用:该文对协方差阵特征值衰减的精确刻画与极小极大下界推导,直接契合您对高维统计特征值行为与半参数极小极大率的理论兴趣。
- 关键技术:
Sliced Inverse Regression,multiple index model,minimax lower bound,Gaussian process prior,eigenvalue decay rate - 为什么对您有用: 直接契合您对高维统计中特征值行为与半参数极小极大率的理论兴趣;其极小极大下界与信号衰减的推导思路可迁移至高维因果推断或 RMT 中的特征值间隙分析。
4. 10.1214/25-aos2539 — Near optimal sample complexity for matrix and tensor normal models via geodesic convexity¶
- 作者: Cole Franks, Rafael Oliveira, Akshay Ramachandran, Michael Walter
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 本文研究矩阵与张量正态模型中协方差矩阵 Kronecker 因子的估计问题,目标是在无需因子 well-conditioned 或稀疏假设下获得近最优非渐近样本复杂度。作者证明了 MLE 在 Fisher-Rao 和 Thompson 度量下达到近紧误差率,且在矩阵情形下 minimax 最优(至多对数因子),张量情形下在常数因子内最优。核心理论洞察是:在正定矩阵的 Fisher 信息度量几何下,给定足够样本,负对数似然函数具有强测地凸性,该凸性由随机量子通道的膨胀决定。在相同样本复杂度条件下,证明了计算 MLE 的实用 flip-flop 迭代算法以高概率线性收敛。对您有用:该文将测地凸性与随机量子通道引入高维矩阵/张量协方差估计,为高维统计与统计计算(flip-flop 算法收敛性)提供了非渐近极小极大最优的新理论工具。
- 关键技术:
Kronecker product covariance,geodesic convexity,Fisher-Rao metric,minimax sample complexity,flip-flop algorithm,random quantum channels - 为什么对您有用: 直接关联您的高维统计与随机矩阵理论兴趣(Kronecker 协方差结构),同时为统计计算兴趣提供了 flip-flop 算法的非渐近线性收敛保证;测地凸性与 Fisher-Rao 度量的结合对研究高维 MLE 极小极大下界有方法论启发。
非参数 / 半参数 (nonparam_semipara, 7 篇)¶
1. 10.1214/25-aos2498 — Dualizing Le Cam’s method for functional estimation I: General theory¶
- 作者: Yury Polyanskiy, Yihong Wu
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 9/10 · novelty:
new_theory - 摘要: 本文研究泛函估计中的统计下界问题,旨在从凸对偶视角解释并给出 Le Cam 两点法下界紧确的条件。通过对偶化,寻找最佳两点下界的最大化问题转化为在一族估计量上最小化二次风险上界的最小化问题。由极小极大定理,这两者具有相同值,从而在普适常数因子内刻画了最优估计率。对于分布的线性泛函估计,本文去除了 Donoho-Liu (1991) 中关于连续模的 Hölderian 假设;对于指数族,在更弱假设下刻画了二次损失下的极小极大风险。此外,理论还扩展至高维可分泛函估计设定。该凸对偶框架为泛函估计的极小极大率提供了更锐利且更一般的理论刻画,对您在 semiparametric efficiency bounds 与 nonparametric theory 方面的研究具有直接的基础性启发价值。
- 关键技术:
Le Cam's two-point method,convex duality,minimax theorem,modulus of continuity,functional estimation - 为什么对您有用: 直接推进了泛函估计的极小极大下界理论,去除了经典 Donoho-Liu 程序的 Hölderian 假设,对您研究 semiparametric efficiency bounds 和 nonparametric theory 中的最优收敛率与下界构造具有核心参考价值。
2. 10.1214/25-aos2571 — Semiparametric Bernstein–von Mises phenomenon via Isotonized Posterior in Wicksell’s problem¶
- 作者: Francesco Gili, Geurt Jongbloed, Aad van der Vaart
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 在 Wicksell 逆问题(由2D截面投影估计3D累积分布函数)的非参数估计设定下,目标是实现渐近有效推断与自动不确定性量化。作者避开对不可观测分布直接放 Dirichlet Process (DP) 先验的传统贝叶斯非参数做法,转而对可观测分布放 DP 先验以利用共轭性简化计算,随后将后验投影到单调右连续函数的 L2 子空间,得到 Isotonized Inverse Posterior (IIP)。理论上,IIP 满足半参数 Bernstein–von Mises (BvM) 现象,其渐近方差达到极小化速率 g_0(x)/2γ(其中 γ>1/2 反映真实 cdf 在 x 处的 Hölder 连续度)。该方法无需估计光滑度参数 γ 即可提供自动的不确定性量化,这是首个针对逆问题中基于投影的 DP 先验的半参数 BvM 定理。对您而言,该文不仅在天文统计(星系投影推断)的经典数据结构上有应用价值,其基于投影实现半参数 BvM 与极小化方差的技巧也对非参数/效率理论有直接启发。
- 关键技术:
Dirichlet Process prior,isotonized posterior projection,semiparametric Bernstein-von Mises,Wicksell's inverse problem,minimax asymptotic variance - 为什么对您有用: 直击您的 primary interest 中的非参数/半参数理论与效率理论(半参数 BvM 与极小化方差),同时完美契合 secondary interest 中的 astrostatistics(Wicksell 问题在天文星系投影推断中的经典应用),且提供了计算简化的贝叶斯方案。
3. 10.1214/25-aos2568 — Multivariate root-n-consistent smoothing parameter-free matching estimators and estimators of inverse density weighted expectations¶
- 作者: Hajo Holzmann, Alexander Meister
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 在多变量设定下,本文研究逆密度加权期望(等价于回归函数的 Lebesgue 积分)的估计,目标 estimand 涵盖 ATE、随机系数回归中的非参数量及 Berkson 测量误差去卷积估计量。传统最近邻与匹配估计量在多维情形下存在严重的偏差问题,作者提出基于 K 阶 Voronoi 剖分单元上的多项式最小二乘拟合,构造了新的匹配估计量修正方案。该方法在回归函数温和光滑性假设及对协变量密度无任何光滑性假设下,实现了 √n-CAN 收敛。与现有纠正匹配偏差的方法不同,该估计量完全避免了非参数函数估计,无需依赖随样本量变化的平滑参数(如带宽选择)。此外,基于信息论的下界证明表明,要达到参数速率确实需要对回归函数施加一定的光滑性条件。这对您在因果推断中处理多维匹配估计量的偏差问题,以及在半参数/非参数理论中探索无平滑参数的 √n-相合估计具有直接参考价值。
- 关键技术:
matching estimators,Voronoi tessellation,polynomial least squares,inverse density weighting,root-n-consistency,information-theoretic lower bounds - 为什么对您有用: 直接关联您 primary interest 中的因果推断(多维匹配估计 ATE 的去偏)与半参数/非参数理论(无平滑参数下达到 √n-CAN 速率),为克服传统匹配方法的多维偏差提供了无需调参的新理论工具。
4. 10.1214/25-aos2576 — Information theoretic limits of robust sub-Gaussian mean estimation under star-shaped constraints¶
- 作者: Akshay Prasadan, Matey Neykov
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究在均值的星形约束集 K 下,存在对抗性污染(Huber epsilon-contamination)与高斯噪声时的均值估计极小化极大风险。作者推导出在平方 l2 损失下的极小化极大速率为 max(eta^2, sigma^2epsilon^2) wedge d^2,其中临界值 eta 由集合 K 的局部熵 log M_K^loc(eta, c) 唯一确定。对于已知或对称的次高斯噪声,所提算法在较小但仍为常数阶的崩溃点下达到相同速率;而在未知次高斯噪声设定下,速率略慢,变为 max(eta^2, sigma^2epsilon^2log(1/epsilon)) wedge d^2。该结果还进一步推广至无界星形约束集的情形。这项工作完整刻画了星形约束下鲁棒均值估计的信息论极限,对您理解非参数理论中局部熵与极小化极大速率的映射关系极具价值,且为高维结构约束下的鲁棒推断提供了理论基准。
- 关键技术:
minimax rate,local metric entropy,Huber contamination model,star-shaped constraint,robust sub-Gaussian estimation - 为什么对您有用: 直接关联您 primary interest 中的非参数理论与数学统计,利用局部熵刻画极小化极大速率的技巧可迁移至高维统计中结构约束下的推断与效率界问题。
5. 10.1214/25-aos2566 — Pseudo-Labeling for kernel ridge regression under covariate shift¶
- 作者: Kaizheng Wang
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 5/10 · novelty:
sharper_rate - 摘要: 本文研究协变量偏移下核岭回归的估计问题,目标是在目标分布下最小化均方误差,假设源分布与目标分布的特征分布不同但标签条件分布不变。方法将标注数据分为两份,分别训练候选模型集合与插补模型,后者为无标签目标数据生成伪标签,进而完成模型选择。非渐近超额风险界表明,估计量能自适应目标分布结构与协变量偏移程度,其适应度由反映源域数据价值的有效样本量刻画。估计量达到极小极大最优误差率(至多相差 polylog 因子),且伪标签用于模型选择不会显著降低性能。该非渐近自适应理论对您在半参数效率与核方法下的协变量偏移/因果推断泛化研究有直接借鉴价值。
- 关键技术:
kernel ridge regression,covariate shift,pseudo-labeling,nonasymptotic excess risk bound,minimax optimal rate,effective sample size - 为什么对您有用: 非渐近超额风险界与极小极大最优率直接关联您对半参数/非参数效率理论的兴趣;协变量偏移下的自适应分析对因果推断中分布偏移与可迁移性研究有方法迁移价值。
6. 10.1214/25-aos2567 — Change point estimation for a stochastic heat equation¶
- 作者: Markus Reiß, Claudia Strauch, Lukas Trottner
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 在随机偏微分方程 (SPDE) 框架下,研究具有空间依赖扩散系数的热方程的变点估计问题,设定扩散系数在未知点 τ 处分段常数且存在跳跃。基于空间分辨率为 δ 的局部测量,构造了扩散系数值与变点的联合 M-estimator;变点估计量收敛速率为 δ,扩散系数常数的收敛速率为 δ^{3/2}。在扩散系数已知且跳跃高度随空间分辨率趋于零而消失的设定下,推导了变点估计量的极限分布。关键技术工具包括:不连续系数 SPDE 的精确分析、解的二次泛函的紧集中不等式 以及经典 M-estimator 的推广。理论上给出了变点与参数的不同收敛速率及极限分布定理。对您而言,其二次泛函的紧集中不等式与 M-estimator 的极限理论分析,可为非参数/半参数理论及数学统计中的收敛速率推导提供方法借鉴。
- 关键技术:
M-estimation,stochastic partial differential equations (SPDE),concentration inequalities for quadratic functionals,change point estimation,convergence rate analysis - 为什么对您有用: 本文属于纯数学统计范畴,其推导二次泛函集中不等式与 M-estimator 极限分布的技巧,对您在非参数/半参数理论及数学统计(特别是收敛速率与极限定理)方面的研究有直接的方法论借鉴价值。
7. 10.1214/25-aos2570 — Neural networks generalize on low complexity data¶
- 作者: Sourav Chatterjee, Timothy Sudijono
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 1/10 · novelty:
new_theory - 摘要: 在非参数分类设定下,本文研究前馈 ReLU 神经网络在低复杂度数据上的泛化能力,核心假设是数据生成机制可用低最小描述长度(MDL)的程序表达。作者定义了一种简单编程语言及对应网络的描述长度,证明了插值数据的 MDL 最小网络以高概率泛化。以素性检测为例,从 1 到 N 均匀抽取 n 个样本,MDL 插值网络对新样本正确分类的概率为 1−O((lnN)/n)。该网络并非专为素数设计,而是最小描述学习自动发现其结构;对含噪数据的扩展表明 MDL 插值器呈现温和过拟合(tempered overfitting)。本文为过参数化插值网络提供了基于 MDL 的有限样本概率界,属于非参数学习理论的新进展。对您而言,若关注非参数理论中插值估计的泛化界或过拟合现象,此文的 MDL 框架与概率界推导提供了严谨的数学统计工具借鉴。
- 关键技术:
minimum description length (MDL),ReLU neural networks,interpolating estimators,generalization bounds,tempered overfitting - 为什么对您有用: 虽然不是您最核心的半参数效率或高维推断,但作为 AoS 上的非参数理论文章,它对插值估计泛化界和温和过拟合的严格刻画,可为非参数理论方向的思考提供基于 MDL 的新视角。
效率理论 / Debiased ML (efficiency_dml, 2 篇)¶
1. 10.1214/25-aos2563 — Average partial effect estimation using double machine learning¶
- 作者: Harvey Klyne, Rajen D. Shah
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 10/10 · novelty:
new_method - 摘要: 在非参数回归设定下,目标是估计给定预测变量的平均偏效应(APE,即回归函数对该变量的平均斜率),传统 doubly robust 方法需估计条件均值导数与条件得分(密度比),在高维下极具挑战且不兼容树类 ML 方法。本文提出一种基于 Double Machine Learning 的 APE 估计框架,通过对初始 ML 回归估计进行再平滑以获得可微性,并利用 location-scale 模型对目标预测变量的条件分布建模。在此假设下,条件得分的估计误差被控制为条件均值误差、条件标准差误差与一元得分误差之和,从而避免了直接的高维密度比估计。理论部分证明了该估计量的 n^{-1/2}-CAN 性质,并给出了关于 Lipschitz 得分函数次高斯性的独立理论结果。模拟显示该方法在包含模型误设的多种设定下数值表现优异。对您研究 debiased ML 和半参数效率理论很有启发,其通过再平滑与 location-scale 分解绕过高维条件密度估计的技巧,可迁移至连续处理效应或 proximal CI 的 nuisance 估计中。
- 关键技术:
double machine learning,average partial effect,resmoothing regression estimator,location-scale model,conditional score estimation,sub-Gaussianity of Lipschitz scores - 为什么对您有用: 直接推进了您 primary interest 中的 debiased ML 与半参数效率理论;其通过再平滑与 location-scale 分解放松 nuisance 估计可微性要求的技巧,对连续处理效应、proximal CI 等涉及高维条件密度/得分估计的因果推断场景具有直接的方法迁移价值。
2. 10.1214/25-aos2572 — Optimal convex M-estimation via score matching¶
- 作者: Oliver Y. Feng, Yu-Chun Kao, Min Xu, Richard J. Samworth
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 在线性回归设定下,本文研究如何构造数据驱动的凸损失函数,使得经验风险最小化在估计回归系数时达到最优渐近方差。总体层面上,最优凸损失函数的负导数是噪声分布对数密度导数的最佳递减近似;样本层面上,通过非参数扩展的得分匹配(score matching)来拟合该损失,等价于在 Fisher 散度下对噪声分布做对数凹投影。所提半参数估计量计算高效,且被证明在所有凸 M-估计量中达到了最小的渐近协方差。以非对数凹的 Cauchy 误差为例,最优凸损失呈现类 Huber 形式,相对于已知误差分布的 MLE 达到了超过 0.87 的渐近相对效率,兼顾了鲁棒性、计算与统计效率。对您有用:该工作将 Fisher 散度与对数凹投影结合寻找最优凸 M-估计,为您的效率理论(最优渐近方差)与半参数理论(非参数得分匹配)交叉研究提供了极佳的理论与计算(R包asm)参考。
- 关键技术:
convex M-estimation,score matching,log-concave projection,Fisher divergence,asymptotic relative efficiency,semiparametric estimator - 为什么对您有用: 直接契合您的效率理论(最优渐近方差/协方差)与半参数理论兴趣,展示了如何通过非参数得分匹配与对数凹投影在凸约束下达到效率下界,并提供了可复现的 R 包计算实现。
数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶
1. 10.1214/25-aos2565 — A computational transition for detecting correlated stochastic block models by low-degree polynomials¶
- 作者: Guanyi Chen, Jian Ding, Shuyang Gong, Zhangsong Li
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 0/10 · novelty:
new_theory - 摘要: 在一对相关稀疏随机块模型(SBM)的设定下,研究区分该相关模型与一对独立Erdős-Rényi图的假设检验问题,关键参数为子采样概率s与散度ϵ。聚焦于基于邻接矩阵元素的低阶多项式检验,确定了区分计算“易”与“难”区域的相变阈值。证明此类检验有效当且仅当s > min{α, 1/(λϵ²)},其中α≈0.338为Otter常数,1/(λϵ²)为Kesten-Stigum阈值。结合归约论证,当s低于该阈值时,推导出部分恢复与检测的低阶计算硬度。证明核心依赖于低阶似然计算的条件变体。对您有用:该文将低阶多项式方法应用于高维图假设检验的计算相变,为您在hypothesis testing与high-dimensional statistics交叉领域的计算硬度与阈值研究提供了直接的理论参考。
- 关键技术:
low-degree polynomials,stochastic block model,low-degree likelihood calculation,Kesten-Stigum threshold,computational hardness,graph hypothesis testing - 为什么对您有用: 直接涉及高维/网络数据下的假设检验(检测问题)与计算相变,为您在hypothesis testing和high-dimensional statistics交叉方向(特别是低阶多项式方法与计算硬度)提供前沿理论参考。
统计计算 / 算法 (stat_computing, 3 篇)¶
1. 10.1214/25-aos2549 — Scalable inference in functional linear regression with streaming data¶
- 作者: Jinhan Xie, Enze Shi, Peijun Sang, Zuofeng Shang, Bei Jiang, Linglong Kong
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 在函数线性回归设定下,针对数据流(streaming data)场景,目标是仅通过单次数据遍历(one pass)实现斜率函数的估计与推断。核心提出函数随机梯度下降(functional SGD)算法,并构造在线自助法(online bootstrap)重抽样过程以解决推断问题。理论上证明了该 SGD 估计量的收敛速率与渐近正态性,并证明自助法扰动估计量具有相同的渐近分布,为在线推断提供了理论依据。这是首个针对流数据下函数线性回归的推断结果,对您在统计计算(在线算法与自助法)与非参数理论(函数数据渐近性质)的交叉研究具有直接的方法论借鉴价值。
- 关键技术:
functional stochastic gradient descent,online bootstrap resampling,functional linear regression,asymptotic normality,one-pass algorithm - 为什么对您有用: 直接契合您在 statistical computing (numerical methods, algorithm) 方向的兴趣,提供了函数数据在线推断的 SGD 算法与渐近理论;同时涉及 nonparametric theory 中的函数型回归推断,方法可迁移至其他流数据下的半/非参模型。
2. 10.1214/25-aos2564 — Solving the Poisson equation using coupled Markov chains¶
- 作者: Randal Douc, Pierre E. Jacob, Anthony Lee, Dootika Vats
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 在马尔可夫链蒙特卡洛(MCMC)设定下,本文研究如何利用在随机迭代次数后精确相遇的耦合马尔可夫链,对泊松方程的解构造无偏估计量。基于此联系,作者重新推导了马尔可夫链平稳分布期望的已知无偏估计量,并给出了其矩有限的充分条件。进一步地,文章构造了马尔可夫链遍历平均渐近方差的无偏估计量,并证明了其任意阶矩有限的条件。若二阶矩有限,独立同分布估计量样本均值以蒙特卡洛率(n^{-1/2})收敛至渐近方差,收敛速度优于传统的批均值和谱方差估计量。数值实验验证了理论结果。该工作直接对应您在“统计计算(数值方法与算法)”方向的兴趣,提供了MCMC渐近方差的无偏估计新算法,对评估MCMC计算效率与收敛诊断具有直接收益。
- 关键技术:
coupled Markov chains,Poisson equation,unbiased estimation,asymptotic variance,MCMC ergodic averages,Monte Carlo rate - 为什么对您有用: 直接对应您在“统计计算(数值方法与算法)”方向的兴趣,提供了MCMC渐近方差的无偏估计新算法,收敛率达到蒙特卡洛率(n^{-1/2}),对评估MCMC计算效率与收敛诊断具有直接收益。
3. 10.1214/25-aos2535 — Pseudo-likelihood-based M-estimation of random graphs with dependent edges and parameter vectors of increasing dimension¶
- 作者: Jonathan R. Stewart, Michael Schweinberger
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 在单观测(single-observation)且参数维度随样本量增加的设定下,本文研究具有依赖边和不可达似然函数的离散无向图模型的估计问题。作者采用基于伪似然的 M-estimator,针对指数族参数化模型建立其收敛速率,并重点揭示了相变和模型近乎退化这两个复杂现象对收敛速率的负面影响。为展示收敛速率,文中引入了一类利用重叠子群结构来控制依赖关系的新型广义 β-模型,并在稠密和稀疏图设定下证明了该估计器的收敛速率。主要理论结果为依赖网络数据的伪似然估计提供了可扩展的计算方案与高维理论保证。对您有用:该文处理不可达似然的高维 M-estimation 理论与收敛率分析,对您在统计计算(伪似然算法可扩展性)与高维统计(增维参数下的收敛率)方面的兴趣有直接参考价值。
- 关键技术:
pseudo-likelihood M-estimation,exponential family random graph models,increasing dimension convergence rates,phase transitions,model near-degeneracy,generalized beta-model - 为什么对您有用: 该文在参数维度增加的设定下建立伪似然 M-估计的收敛速率,直接关联您的高维统计(增维参数理论)与统计计算(不可达似然的计算可扩展性)兴趣,提供了处理相变与近乎退化现象的理论工具。
Maintained by 陈星宇 · Homepage · Source on GitHub