AoS — Vol 54 Issue 2 · 2026-05-18¶
- 共 20 篇 · Annals of Statistics
因果推断 (causal_inference, 1 篇)¶
1. 10.1214/25-aos2597 — Parameter identification in linear non-Gaussian causal models under general confounding¶
- 作者: Daniele Tramontano, Mathias Drton, Jalal Etesami
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 9/10 · novelty:
new_theory - 摘要: 在线性非高斯因果模型(LiNGAM)的 DAG 设定下,研究存在潜在变量时直接因果效应的参数识别问题,允许潜在混淆项对观测变量产生任意非线性影响。突破了以往基于过完备独立成分分析(overcomplete ICA)要求潜变量线性依赖的局限,将非线性混淆视为无穷维干扰参数。核心理论贡献是提出了一项图准则,并证明该准则是直接因果效应具备一般可识别性(generic identifiability)的充要条件。基于此准则给出了多项式时间复杂度的算法实现,并探讨了相应的估计启发式方法及向含反馈环模型的推广。对您有用:该文在非线性混淆下给出了严密的识别理论,直接推进您关注的因果推断 identification 方向,且其将非线性混淆视为 nuisance 的思路与半参数理论有内在契合。
- 关键技术:
linear non-Gaussian causal models,generic identifiability,graphical criterion,overcomplete independent component analysis,non-linear latent confounding,direct causal effects - 为什么对您有用: 直接推进您 primary interest 中的因果推断 identification 方向;在允许任意非线性混淆的设定下给出了充要的图识别准则,放松了传统 LiNGAM 对潜变量线性的假设,对处理一般混淆下的因果识别极具参考价值。
高维统计 / 随机矩阵 (high_dim_rmt, 7 篇)¶
1. 10.1214/25-aos2591 — Finite- and large sample inference for model and coefficients in high-dimensional linear regression with repro samples¶
- 作者: Peng Wang, Min-ge Xie, Linjun Zhang
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 8/10 · novelty:
new_theory - 摘要: 在高维线性回归设定下,本文旨在对真实稀疏模型及回归系数进行有限样本与大样本推断,克服传统方法在模型选择不确定性及有限样本保证上的不足。基于 repro samples 框架(通过模拟数据生成机制构造人工样本),作者构建了针对真实模型、单个/多个系数及模型与系数联合的置信集。为克服高维模型搜索的计算困难,提出创新的 Fisher inversion 技术构建模型候选集,在 Gaussian 与非 Gaussian 误差下均能以接近 1 的概率覆盖真实稀疏模型。理论上给出了有限样本与渐近性能保证;数值实验表明,相比 debiasing 和 bootstrap 等现有方法,该方法在保证覆盖率的同时具有更小的置信集体积。对您有用:该工作为高维推断提供了区别于 debiased ML 的有限样本推断新路径,其 Fisher inversion 与模型候选集技术对处理高维假设检验与模型选择不确定性具有直接参考价值。
- 关键技术:
repro samples framework,Fisher inversion technique,high-dimensional confidence sets,model candidate set,finite-sample inference - 为什么对您有用: 直接推进高维统计推断方向,提供了区别于 debiased ML 的有限样本推断路径;其 Fisher inversion 与模型候选集构建技术对您研究高维假设检验与模型选择不确定性有直接参考价值。
2. 10.1214/25-aos2582 — Analysis of singular subspaces under random perturbations¶
- 作者: Ke Wang
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 8/10 · novelty:
sharper_rate - 摘要: 本文研究低秩信号加高斯噪声矩阵模型下的奇异向量与奇异子空间扰动问题,旨在给出比经典谱范数更精细的逐元素与行向扰动界。作者将 Davis–Kahan–Wedin 定理推广至任意酉不变矩阵范数,建立了奇异向量的 ℓ∞ 界与奇异子空间的 ℓ2,∞ 界,并推导了奇异向量线性和双线性形式的扰动结果。进一步,文章考虑了奇异值的权重效应,推导了按对应奇异值加权的扰动奇异向量 ℓ2,∞ 界。理论结果被应用于高斯混合模型和子矩阵定位问题,展示了精细界在高维推断中的实用性。对您有用:直接推进您关注的随机矩阵理论(RMT),其 ℓ∞ 和 ℓ2,∞ 精细界对高维推断(如 debiased ML 中的残差矩阵控制)和潜在的高阶 U 统计量投影分析具有直接的理论价值。
- 关键技术:
singular subspace perturbation,Davis-Kahan-Wedin theorem,unitarily invariant norm,entrywise max norm bounds,signal-plus-noise model - 为什么对您有用: 直接推进您 primary interest 中的随机矩阵理论(RMT),提供了比传统谱范数更精细的逐元素(ℓ∞)和行向(ℓ2,∞)扰动界,对高维推断和 debiased ML 中的随机矩阵余项控制有直接理论价值。
3. 10.1214/25-aos2602 — Reviving pseudo-inverses: Asymptotic properties of large dimensional Moore–Penrose and ridge-type inverses with applications¶
- 作者: Taras Bodnar, Nestor Parolya
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 8/10 · novelty:
new_theory - 摘要: 在高维渐近框架(p/n→c>0)下,本文研究样本协方差矩阵的Moore-Penrose逆及岭型逆的渐近性质,放松了总体协方差矩阵为单位阵倍数及正态性假设。利用偏指数贝尔多项式,推导了广义逆矩阵加权样本迹矩的解析表达式,提供了易于计算的显式公式。理论证明Moore-Penrose逆在高维设定下渐近地充当真实协方差矩阵的正则化项。基于此,构建了纯数据驱动的精度矩阵改进收缩估计量。实证与理论均表明,该收缩变换在计算时间极小的前提下,表现与现有基准相当甚至更优。对您研究高维统计中的RMT理论及统计计算中的快速矩阵求逆算法有直接参考价值。
- 关键技术:
Moore-Penrose inverse,high-dimensional asymptotics,partial exponential Bell polynomials,random matrix theory,shrinkage estimation,precision matrix estimation - 为什么对您有用: 直接推进您 primary interest 中的高维统计与随机矩阵理论(RMT),放松了经典RMT中的正态性与球形假设;同时其基于贝尔多项式的快速计算方法对统计计算(矩阵求逆与精度矩阵估计)具有极高的迁移价值。
4. 10.1214/25-aos2584 — Optimal eigenvalue shrinkage in the semicircle limit¶
- 作者: David L. Donoho, Michael J. Feldman
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 7/10 · novelty:
new_theory - 摘要: 在非比例增长渐近框架($p/n \to 0$ 或 $\infty$)下的 spiked covariance model 中,目标是针对 15 种损失函数推导协方差矩阵低秩扰动估计的最优特征值收缩与阈值规则。传统比例增长框架($p/n \to \gamma>0$)下的收缩规则在此失效,作者发现当 $\gamma_n \to 0$ 时,spiked covariance model 与 spiked Wigner model 存在深刻联系,后者噪声服从半圆律而非 Marchenko-Pastur 律。利用此联系,推导出半圆极限下的闭式最优收缩规则;同时提出仅依赖当前 aspect ratio $\gamma_n$ 的统一收缩公式,在比例或非比例框架下均达到渐近最优。新规则要求更大幅度的特征值收缩,相比经验协方差估计量有显著性能提升。对您有用:直接推进了 RMT 在高维推断中的应用边界,提供了超越 Marchenko-Pastur 比例设定的新理论(半圆律极限)和闭式收缩公式,对处理维度与样本量极不对称的数据集极具计算与理论价值。
- 关键技术:
spiked covariance model,eigenvalue shrinkage,spiked Wigner model,semicircle law,disproportional-growth asymptotics,minimax optimality - 为什么对您有用: 直接推进了您 primary interest 中高维统计与随机矩阵理论(RMT)的应用边界,提供了超越经典 Marchenko-Pastur 比例设定的新理论(半圆律极限)与闭式收缩公式,对处理维度与样本量极不对称的数据集极具计算与理论价值。
5. 10.1214/25-aos2592 — Inferring the dependence graph density of binary graphical models in high dimension¶
- 作者: Julien Chevallier, Eva Löcherbach, Guilherme Ost
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 4/10 · novelty:
new_theory - 摘要: 在 N 维二元交互图模型(含 excitatory/inhibitory 两种群体)下,底层依赖结构为有向 Erdős–Rényi 随机图,目标是仅基于 T 个时间点的观测推断连接概率 p。本文提出一个易于计算的估计器,并证明其收敛速率为 N^{-1/2} + N^{1/2}/T + (log(T)/T)^{1/2}。核心分析工具是利用 coalescing random walks 构建系统的 backward regeneration representation,以此精确刻画交互链时空相关性的衰减。此外,该表示方法还实现了在给定图实现下从平稳分布的完美采样。对您的高维统计与数学统计兴趣有直接参考价值,特别是其通过概率表示精确刻画高维时空相关性衰减并推导收敛速率的技巧,可迁移至高维网络或点过程的推断。
- 关键技术:
Erdos-Renyi random graph,interacting particle systems,coalescing random walks,backward regeneration representation,spatiotemporal correlation decay,convergence rate analysis - 为什么对您有用: 属于高维数学统计范畴,虽然非 RMT,但其对高维随机图参数推断的精确收敛率分析及利用概率表示控制相关性的技巧,对您研究高维统计与数学统计中的率收敛和依赖结构刻画有方法论迁移价值。
6. 10.1214/25-aos2579 — Trace test for high-dimensional cointegration¶
- 作者: Alexei Onatski, Chen Wang
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10 · novelty:
new_theory - 摘要: 在高维协整框架下,当截面维度 p 与时间维度 T 成比例趋向无穷时,研究 Johansen trace test 的渐近性质。证明经平移与缩放的修正 trace 统计量收敛于高斯分布,并给出平移/缩放参数及高斯极限均值与方差的显式公式。核心技术依赖 p/T → 常数设定下的随机矩阵谱分析,将高维特征根分布转化为可操作的极限定理。Monte Carlo 表明该渐近检验的 size 性质优于 Bartlett 校正版本,尤其在 p/T 较大时优势明显;同时揭示并解释了检验功效的非单调性现象。对您有用:该文将 RMT 谱分析工具系统性地应用于高维假设检验(协整检验),其 p/T 成比例的高维极限技术可直接迁移至您关注的高维 inference 与假设检验问题,且协整检验本身是经济理论的核心工具。
- 关键技术:
random matrix theory,high-dimensional cointegration,Johansen trace test,Gaussian limit under proportional asymptotics,spectral analysis of eigenvalue distribution,Bartlett correction comparison - 为什么对您有用: 直接连接您 primary interest 中的高维统计(RMT)与假设检验:p/T 成比例设定下的谱分析技术可迁移至其他高维检验问题;同时协整检验是经济理论(secondary interest)的核心方法,兼具方法学与领域价值。
7. 10.1214/25-aos2586 — Spectrum-aware debiasing: A modern inference framework with applications to principal components regression¶
- 作者: Yufan Li, Pragya Sur
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10 · novelty:
new_theory - 摘要: 在高维线性回归中,针对现有 debiasing 方法局限于 iid 和 sub-Gaussian 假设的问题,本文提出 Spectrum-Aware Debiasing 框架,处理具有行列依赖、重尾和潜在低秩结构的协变量。核心机制是通过重标度梯度下降步实现去偏,重标度因子源自样本协方差矩阵的谱性质。在特征与样本成比例增长的机制下,当协变量满足右旋转不变性时,证明了去偏估计量的渐近正态性,并建立谱普适性将保证扩展至更广分布。该方法还导出了高维主成分回归(PCR)的首个去偏估计量,并提出了渐近方差的一致估计。此外,提出了一种检验信号与样本协方差矩阵特征向量是否对齐的假设检验,对基于 AMP 或 RMT 的方法具有独立价值。该工作将 RMT 谱分析与高维推断深度结合,对您研究高维统计中的 RMT 应用及放松假设的 debiased ML 理论极具参考价值。
- 关键技术:
Spectrum-Aware Debiasing,right-rotationally invariant,spectral universality,rescaled gradient descent,debiased principal components regression,signal-eigenvector alignment test - 为什么对您有用: 直接推进了您 primary interest 中的高维统计(RMT)与效率理论(debiased ML),通过谱分析放松了传统去偏推断的 iid/sub-Gaussian 假设,并提供了新的高维假设检验方法。
非参数 / 半参数 (nonparam_semipara, 7 篇)¶
1. 10.1214/25-aos2587 — Scalable inference for nonparametric stochastic approximation in reproducing kernel Hilbert spaces¶
- 作者: Meimei Liu, Zuofeng Shang, Yun Yang
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 8/10 · novelty:
new_theory - 摘要: 本文研究 RKHS 中非参数最小二乘的随机逼近(SA)问题,目标是在流数据设定下对非参数回归函数进行在线统计推断。作者基于泛函随机梯度下降(SGD)算法,利用在线乘子 Bootstrap(multiplier bootstrap)构建了回归函数的逐点置信区间与同时置信带。理论核心在于推导泛函 SGD 估计量在 supremum 范数下的高阶展开,并建立非独立同分布加权经验过程上确界的高斯逼近。该框架刻画了泛函 SGD 的非渐近行为,证明了乘子 Bootstrap 的一致性,并揭示了 SGD 步长调节对估计与不确定性量化的双重影响。对您有用:本文的泛函高阶展开技术与经验过程高斯逼近直接契合您对 higher-order expansion 与 nonparametric theory 的兴趣,同时其在线推断算法对 statistical computing 方向有迁移价值。
- 关键技术:
stochastic approximation,reproducing kernel Hilbert space,functional stochastic gradient descent,online multiplier bootstrap,higher-order expansion,Gaussian approximation of empirical process - 为什么对您有用: 本文结合了您关注的 nonparametric theory (RKHS) 与 statistical computing (SGD在线算法),其核心证明技术——泛函 SGD 的高阶展开——直接呼应您对 higher-order expansion 的兴趣,为非参数在线推断提供了新视角。
2. 10.1214/25-aos2605 — Adaptive Bayesian regression on data with low intrinsic dimensionality¶
- 作者: Tao Tang, Nan Wu, Xiuyuan Cheng, David Dunson
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 5/10 · novelty:
new_theory - 摘要: 本文研究在预测变量具有低内在维度时,高斯过程(GP)先验下的后验收缩率如何依赖于内在维度和回归函数的光滑性。证明了无需显式引入低维结构先验知识的通用GP先验,即可根据数据域的覆盖数(Minkowski维数)自适应调整后验收缩率(至多相差对数因子)。在紧流形设定下,通过新颖的RKHS逼近分析,证明了RKHS对流形上任意阶光滑的内在Hölder函数的逼近能力,从而获得最优自适应后验收缩率。此外,提出一种基于核亲和度和k近邻统计量的经验贝叶斯先验来选择核带宽,避免了直接估计内在维度。理论结果将GP先验的适应性从欧氏空间推广到一般低维流形结构;对您研究非参数理论中的自适应收敛率与RKHS逼近工具有直接参考价值。
- 关键技术:
Gaussian process prior,posterior contraction rate,intrinsic dimension,RKHS approximation,empirical Bayes,compact manifold - 为什么对您有用: 直接关联您 primary interest 中的非参数理论,特别是关于后验收缩率、RKHS逼近与自适应性的最新进展,提供了流形上GP先验的最优收敛率证明及带宽选择算法。
3. 10.1214/25-aos2583 — Versatile differentially private learning for general loss functions¶
- 作者: Qilong Lu, Song Xi Chen, Yumou Qiu
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 3/10 · novelty:
new_method - 摘要: 在差分隐私(DP)约束下的 M-estimation 框架中,本文目标是针对一般损失函数(含非光滑的 check loss 与 hinge loss)实现参数的一致估计与渐近正态推断。作者提出基于零膨胀对称多元 Laplace 噪声的 ZIL 隐私机制,并推导了其 trade-off 函数以刻画隐私保护水平。针对 DP 噪声导致的偏差,构建了 doubly random corrected loss (DRCL),该修正损失无需对噪声数据进行数值积分或微分,计算简便。在极小正则条件下,证明了 DRCL 估计量具有一致性与渐近正态性,且不限制分析次数并适用于在线数据增长场景。模拟(logistic/分位数回归)验证了方法有效性。对您有用:虽然 DP 非您核心方向,但其对非光滑损失 M-estimation 的渐近理论推导及避免数值积分的修正算法,对您在半参数理论与统计计算方面的研究有方法学借鉴价值。
- 关键技术:
differential privacy,M-estimation,zero-inflated Laplace noise,doubly random corrected loss,asymptotic normality,non-smooth loss function - 为什么对您有用: 本文对非光滑损失 M-estimation 的渐近正态性推导及避免数值积分的修正算法设计,对您在半参数理论与统计计算(数值方法)方面的研究有直接的方法学借鉴价值。
4. 10.1214/25-aos2580 — Estimation of grouped time-varying network vector autoregressive models¶
- 作者: Degui Li, Bin Peng, Songqiao Tang, Weibiao Wu
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 3/10 · novelty:
new_method - 摘要: 在大规模时间序列的网络向量自回归(VAR)模型中,目标是估计节点异质且时变的动量与网络溢出效应,通过假设时变系数具有潜在分组结构以大幅降低待估参数维度。方法上,结合基于非参数估计距离矩阵的层次聚类算法与比率准则,一致地估计潜在组数与组员身份;进而提出 post-grouping 局部线性平滑方法估计组特定时变系数,显著提升了忽略潜在结构的初步估计的收敛速率。理论进一步扩展至组员身份、组数或组特定系数函数存在结构突变的情形。理论证明了聚类与估计的一致性及 post-grouping 估计的更快收敛速率,模拟与实证验证了有限样本表现。对您研究非参数理论中的分组降维及网络溢出效应估计有直接参考价值。
- 关键技术:
network vector autoregression,local linear smoothing,agglomerative clustering,latent group structure,post-grouping estimation,structural breaks - 为什么对您有用: 连接到您 primary interest 中的 semiparametric and nonparametric theory,post-grouping 局部线性平滑带来的收敛速率提升对高维时间序列非参数估计有方法学借鉴意义。
5. 10.1214/25-aos2578 — Distributionally robust learning for multisource unsupervised domain adaptation¶
- 作者: Zhenyu Wang, Peter Bühlmann, Zijian Guo
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 2/10 · novelty:
new_method - 摘要: 在多源无监督域适应设定下,针对源域与目标域分布偏移导致经验风险最小化失效的问题,目标是构建对目标域分布具有鲁棒性的条件期望模型。提出一种分布鲁棒模型,通过在目标分布类上优化基于解释方差的对抗奖励来实现泛化。理论证明该鲁棒模型等价于源域条件模型的加权平均,从而允许通过聚合源模型(可使用RF、Boosting或DNN等ML算法)进行计算。引入了偏差校正步骤以获得更精确的聚合权重,有效消除各类机器学习算法带来的估计偏差。该方法可解释为分布鲁棒联邦学习,并在模拟与真实数据上验证了有效性。对您有用:其偏差校正步骤与 debiased ML 思想一致,且多源域适应框架与因果推断中的可移植性高度相关,为跨域因果效应估计提供了方法学参考。
- 关键技术:
distributionally robust optimization,unsupervised domain adaptation,bias-correction,model aggregation,explained variance,transportability - 为什么对您有用: 该论文的偏差校正步骤与您关注的 debiased ML 紧密相关,且多源域适应框架直接对应因果推断中的可移植性与外推性,为跨域因果效应估计提供了鲁棒聚合与去偏的新视角。
6. 10.1214/25-aos2596 — PCA for point processes¶
- 作者: Franck Picard, Vincent Rivoirard, Angelina Roche, Victor M. Panaretos
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文在重复点过程的非参数框架下,将点过程实现视为随机测度,提出了一种基于累积质量函数的泛函主成分分析(fPCA)方法。核心理论贡献包括为随机测度建立了 Karhunen-Loève 展开和为协方差测度证明了 Mercer 定理,并引入了可视为潜在过程的“主测度”(principal measures)概念。估计策略易于实现,且特征元素的估计量达到了参数速率(parametric rates)收敛。方法在 Poisson 和 Hawkes 过程下得到了完整的解析刻画。实证和模拟验证了方法在地震学、单细胞生物学和神经科学中的有效性,并提供了 R 包 pppca。对您而言,该文将 fPCA 与随机测度结合的理论框架及参数速率收敛证明,为非参数理论中的特征提取与降维提供了新颖的数学工具,可借鉴其 Karhunen-Loève 展开与 Mercer 定理的推导技巧。
- 关键技术:
functional PCA,random measures,Karhunen-Loève expansion,Mercer theorem for covariance measures,parametric convergence rates,Hawkes processes - 为什么对您有用: 本文属于非参数理论范畴,其将 Karhunen-Loève 展开与 Mercer 定理推广至随机测度并证明参数速率收敛的数学技巧,对您在非参数理论与效率理论方面的研究具有理论推导上的借鉴价值。
7. 10.1214/25-aos2598 — Generalized multilinear models for sufficient dimension reduction on tensor-valued predictors¶
- 作者: Daniel Kapla, Efstathia Bura
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10 · novelty:
new_method - 摘要: 本文研究张量值预测变量下的充分降维(SDR)问题,通过将给定响应时预测变量的条件分布建模为二次指数族成员,推导出多线性充分降维。针对连续和二元张量预测变量分别提出估计程序,并利用流形理论证明估计量的一致性与渐近正态性。连续情形下的估计算法具有高计算效率,且在降维维度超过样本量时仍适用。模拟与实际数据均展示方法优势。对您而言,该文将张量结构与半参数 SDR 框架结合的思路,以及流形理论下的渐近正态性证明,可直接迁移至您关注的张量计算与半参数效率理论交叉研究中。
- 关键技术:
sufficient dimension reduction,quadratic exponential family,manifold theory,multilinear models,tensor-valued predictors,asymptotic normality on manifolds - 为什么对您有用: 张量结构降维与您 primary interest 中的统计计算(tensor)和半参数理论直接交叉;流形上的渐近正态性证明技术可借鉴至半参数效率界与 debiased ML 的理论分析。
数理统计 / 假设检验 (hypothesis_testing, 3 篇)¶
1. 10.1214/25-aos2581 — Large-scale multiple testing: Fundamental limits of false discovery rate control and compound oracle¶
- 作者: Yutong Nie, Yihong Wu
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 9/10 · novelty:
new_theory - 摘要: 在大尺度多重检验的两群随机混合模型下,本文研究错误发现率(FDR)与错误非发现率(FNR)之间的渐近最优权衡问题。区别于边际FDR(mFDR)与边际FNR(mFNR)的最优权衡可由可分决策规则(separable rules)达到,本文证明FDR-FNR的最优权衡即使在简单高斯位置模型下也必须依赖复合决策规则(compound rules)。为克服FDR仅控制期望而不控制FDP波动的问题,进一步证明了在大概率控制FDP条件下的最优权衡与mFDR-mFNR一致。主要理论结果给出了FDR-FNR权衡的基本极限,揭示了复合规则在严格FDR控制下的不可或缺性。对您有用:该文直接推进您关注的数学统计假设检验方向,其复合决策规则与基本极限的分析思路对理解高维多重检验的效率边界具有重要价值。
- 关键技术:
compound decision rules,FDR-FNR tradeoff,two-group mixture model,asymptotic optimality,separable rules - 为什么对您有用: 直接推进您关注的数学统计假设检验方向,其关于复合决策规则与基本极限的分析为理解高维多重检验的效率边界提供了新理论。
2. 10.1214/25-aos2552 — Rank tests for PCA under weak identifiability¶
- 作者: Davy Paindaveine, Laura Peralvo Maroto, Thomas Verdebout
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10 · novelty:
new_theory - 摘要: 在三角阵列框架下,研究 p 维椭圆分布形状矩阵 V_n 的主特征向量 θ 的假设检验 H0: θ=θ0,允许前两大特征值之比趋于1的弱可识别性(weak identifiability)设定。突破以往仅限高斯分布的局限,在任意椭圆分布下刻画了相应的极限实验(LAN 或非 LAN),并给出了三角阵列二次均值可微族的原创性结果。基于 Le Cam 第一与第三引理,系统分析了非参数多元秩检验在非标准场景下的渐近零分布与非零分布性质。理论证明这些秩检验在弱可识别性下既能保持名义水平,又维持了出色的均匀有效性;高斯得分秩检验在渐近相对效率上仍一致优于参数伪高斯竞争者。对您有用:该文将 Le Cam 理论与秩检验拓展至弱可识别性三角阵列,为您在假设检验与效率理论方向提供了处理非 LAN 实验与特征值相近(高维 PCA 常见)设定的严谨理论工具。
- 关键技术:
Le Cam's lemmas,weak identifiability,LAN and non-LAN experiments,multivariate rank tests,asymptotic relative efficiency,quadratic mean differentiability - 为什么对您有用: 直接契合您在假设检验与效率理论方向的兴趣;文中对弱可识别性(特征值接近)下非 LAN 极限实验与渐近相对效率的分析,为高维 PCA 推断及半参数理论提供了重要的理论借鉴。
3. 10.1214/25-aos2595 — Object detection under the linear subspace model with application to cryo-EM images¶
- 作者: Keren Mor Waknin, Amitay Eldar, Samuel Davenport, Tamir Bendory, Armin Schwartzman, Yoel Shkolnisky
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10 · novelty:
new_method - 摘要: 本文研究在加性噪声下检测多个未知目标的问题,假设目标信号可由已知基(如傅里叶基)张成的线性子空间模型表示。提出了一种基于该子空间模型的目标检测算法,通过信号投影构造检验统计量,并在多重检验框架下严格控制族错误率(FWER)或错误发现率(FDR)。理论上证明了该算法在渐近意义下能检测出所有存在的目标且保证错误率受控;数值模拟表明其在非渐近的高难度情形下仍具高功效。将算法应用于冷冻电镜数据集,表现优于现有标准软件。对您有用:该文将多重假设检验(FWER/FDR)与线性子空间模型结合,其渐近检验保证的推导对您在数学统计(假设检验)方向的研究有方法论参考价值。
- 关键技术:
multiple testing,family-wise error rate (FWER),false discovery rate (FDR),linear subspace model,asymptotic detection guarantee,cryo-EM image analysis - 为什么对您有用: 涉及多重假设检验(FWER/FDR)的渐近理论保证,属于您 primary interest 中的数学统计与假设检验方向;其算法实现也涉及统计计算。
其他 (other, 2 篇)¶
1. 10.1214/25-aos2601 — Generalized linear spectral statistics of high-dimensional sample covariance matrices and its applications¶
- 作者: Yanlin Hu, Qing Yang, Xiao Han
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 10/10
- 摘要: { "topic": "high_dim_rmt", "summary_zh": "在高维设定下($n/N \to c>0$),本文研究样本协方差矩阵 $\bm{S}_n$ 的广义线性谱统计量(GLSS)$\operatorname{tr}f(\bm{S}_n)\bm{B}_n$,引入辅助矩阵 $\bm{B}_n$ 与测试函数 $f$ 以捕捉不同谱特征。针对不同测试函数对应的 GLSS,本文在温和假设下建立了其联合渐近正态性,并确定其收敛速率为 $\sqrt{N/\operatorname{rank}(\bm{B}_n)}$。基于该理论,作者提出了一种新的泛函投影方法,用于对"总体尖刺"协方差矩阵的特征空间进行假设检验,并揭示了尖刺幅值上的普适性(universality)现象。数值模拟验证了 GLSS 的渐近性质及新检验程序的有限样本优势。对您有用:直接推进了您关注的 RMT 与高维假设检验方向,提供了带辅助矩阵的谱统计量联合渐近理论及新的特征空间检验框架。", "key_techniques": [ "Generalized Linear Spectral Statistics (GLSS)", "Random Matrix Theory (RMT)", "joint asymptotic normality", "
2. 10.1214/25-aos2590 — Precise asymptotics of bagging regularized M-estimators¶
- 作者: Takuya Koriyama, Pratik Patil, Jin-Hong Du, Kai Tan, Pierre C. Bellec
- 期刊/来源: Annals of Statistics
- 分类: vol 54 · issue 2
- 相关性 0/10
- 摘要: { "topic": "high_dim_rmt", "summary_zh": "在比例渐近(proportional asymptotics, $n/p \to \phi$)设定下,研究子样本聚合正则化 M-estimator 的平方预测风险精确渐近行为,并构建风险的一致估计量。考虑 $M \ge 1$ 个异质正则化 M-estimator(允许不同子样本量 $k_m$、凸损失与凸正则化),核心工具是建立重叠子样本上估计量与残差误差相关性的联合渐近行为,由一个可证压缩的非线性方程组刻画。顺带证明了非集成设定下与自由度相关的迹泛函的收敛性,将已有 ridge/lasso 平方损失的结果推广至一般凸损失正则化 M-estimator。在同质集成中,风险刻画揭示了子样本量 $k$ 与集成规模 $M$ 带来的隐式正则化效应;全集成($M \to \infty$)的最优 $k^*$ 落在过参数化区域,且联合优化 $(M, k)$ 显著优于仅在全数据上优化正则化参数。对您有用:该文在比例渐近下对高维 M-estimator 集成风险的精确刻画与非线性方程组工具,直接推进了您关注的 high-dimensional statistics 与 RMT 方向的理论边界,且其自由度迹泛函的推广对高维推断与效率理论有参考价值。", "key_techniques": [ "
Maintained by 陈星宇 · Homepage · Source on GitHub