跳转至

Bernoulli — Vol 32 Issue 3 · 2026-05-18

  • 共 33 篇 · Bernoulli

高维统计 / 随机矩阵 (high_dim_rmt, 6 篇)

1. 10.3150/25-bej1954 — Liberating dimension and spectral norm: A universal approach to spectral properties of sample covariance matrices

  • 作者: Yanqing Yin
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 9/10 · novelty: weaker_assumption
  • 摘要: 本文研究高维样本协方差矩阵的谱性质,在维度 p 与样本量 n 同时趋于无穷且无 p/n 速率约束的设定下探讨其极限行为。作者通过对原始样本协方差矩阵引入适当的归一化技术,提出了一种普适的约束原则,统一了不同极限框架下的谱性质。在此基础上,建立了线性谱统计量(LSS)的调和中心极限定理。该结果免去了对总体协方差矩阵谱范数有界的传统要求,并放宽了对 p 与 n 相对增长速率的限制。作为应用,文章构造了高维下无 p/n 速率约束的协方差结构检验方法。这对您在随机矩阵理论和高维假设检验方面的研究极具价值,特别是放松谱范数有界假设的理论突破,可直接迁移至更一般的高维推断场景。
  • 关键技术: linear spectral statistics, harmonic central limit theorem, sample covariance matrix, unbounded spectral norm, high-dimensional hypothesis testing, normalization technique
  • 为什么对您有用: 直接推进您 primary interest 中的高维统计与随机矩阵理论(RMT),通过放松谱范数有界和 p/n 速率假设,为高维协方差检验提供了更普适的理论工具,对高维假设检验子方向有直接的方法论迁移价值。

2. 10.3150/25-bej1957 — Limiting laws for spiked eigenvalues and largest non-spiked eigenvalues of sample covariance matrices in elliptical distributions

  • 作者: Jiahui Xie, Long Yu, Wang Zhou
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 在椭圆分布与发散尖峰特征值设定下,研究样本协方差矩阵的尖峰特征值及最大非尖峰特征值的渐近分布。建立了尖峰样本特征值的中心极限定理,其渐近均值同时依赖总体尖峰与非尖峰、方差依赖总体特征向量;同时推导了最大非尖峰特征值的 Tracy-Widom 极限律。该结果允许尖峰数量发散,并基于一个新发展的关于相依随机向量与矩阵的随机二次型 CLT 作为核心技术工具。此外还讨论了尖峰数量估计与主特征向量收敛性。对您研究高维统计中的 RMT 理论极具价值,尤其是相依二次型 CLT 工具和发散尖峰设定下的精细渐近结果可迁移至高维假设检验。
  • 关键技术: spiked covariance model, elliptical distributions, Tracy-Widom law, random quadratic forms CLT, diverging spikes, sample covariance matrix
  • 为什么对您有用: 直接推进您在 primary interest 中的高维统计与随机矩阵理论(RMT)方向,特别是发散尖峰数设定下的特征值极限律与相依二次型 CLT 工具,可为高维假设检验或主成分分析提供更精细的理论基础。

3. 10.3150/25-bej1941 — Universality of estimators for high-dimensional linear models with block dependency

  • 作者: Toshiki Tsuda, Masaaki Imaizumi
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 8/10 · novelty: weaker_assumption
  • 摘要: 在高维线性模型设定下,研究估计量的普适性(universality),即估计量的分布是否独立于协变量的高斯性,并放松了传统协变量元素间独立性假设至块内依赖(block dependence)设定。现有高维推断常依赖高斯协变量假设,而已有普适性证明严格要求协变量元素独立。本文针对具有块依赖结构的协变量,证明了在矩匹配条件下,非高斯协变量下估计量的分布可由高斯协变量下的分布近似。核心技术是发展了处理块依赖的广义 Lindeberg 原理,并推导了相关协变量元素的新误差界。该文进一步在多种高维估计量上验证了此普适性结果。对您有用:直接推进您 primary interest 中的高维统计与 RMT 普适性理论,通过放松独立性假设,为依赖结构下的高维推断提供了更广的理论保证。
  • 关键技术: universality of estimators, generalized Lindeberg principle, block dependence, moment matching, high-dimensional linear model
  • 为什么对您有用: 直接推进您 primary interest 中的高维统计与 RMT 普适性理论,通过放松协变量独立性假设至块依赖,为高维推断在相关结构下的渐近性质提供了新的理论工具。

4. 10.3150/25-bej1933 — Strong convergence for tensor GUE random matrices

  • 作者: Benoît Collins, Wangjun Yuan
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究张量GUE随机矩阵的强收敛问题,设定为作用在多体状态空间上的iid GUE,其中部分位点为混合分量其余为单位阵。在对子系统维度的适当假设下,证明了这些张量GUE矩阵仍满足强渐近自由性,即算子范数收敛到自由半圆元。证明核心依赖于Bandeira, Boedihardjo和van Handel近期提出的插值技术。该技术将强收敛问题转化为对解析矩函数的估计,从而绕过传统的组合图论方法。主要理论结果将经典的Haagerup-Thorbjørnsen定理从独立GUE推广到了具有张量积结构的量子相互作用系统。对您有用:直接推进您关注的随机矩阵理论(RMT)在张量/高维算子范数收敛方向的前沿,插值技术也可为高维统计中的谱分析提供新工具。
  • 关键技术: strong asymptotic freeness, tensor GUE, interpolation method, operator norm convergence, free semicircular elements
  • 为什么对您有用: 直接推进您 primary interest 中的随机矩阵理论(RMT),特别是张量结构下算子范数强收敛的新结果,Bandeira-van Handel 的插值技术对高维统计中的谱分析有方法论启发。

5. 10.3150/25-bej1931 — Dimension-free uniform concentration bound for logistic regression

  • 作者: Shogo Nakakita
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 6/10 · novelty: sharper_rate
  • 摘要: 本文研究约束逻辑回归经验风险函数的 dimension-free 一致集中界,目标是在高维参数空间下建立比现有条件更温和的一致大数定律充分条件。核心方法基于 PAC-Bayes 路径:对经验风险做二阶展开,主项通过 PAC-Bayes 论证获得 dimension-free 界,残差项则用 Rademacher complexity 控制。相比传统 Rademacher complexity + McDiarmid 不等式路线,所得充分条件更温和,避免了维度对集中界的直接依赖。主要理论结果为约束逻辑回归提供了一致收敛的 sharper sufficient condition。对您有用之处在于:dimension-free 集中界的技术(PAC-Bayes + 二阶展开)可迁移至高维 M-估计的一致性分析,与您关注的高维统计及半参数理论中经验过程控制有方法论交叉。
  • 关键技术: PAC-Bayes bound, second-order expansion, Rademacher complexity, uniform law of large numbers, dimension-free concentration, constrained logistic regression
  • 为什么对您有用: dimension-free 集中界直接服务于高维统计中 M-估计的一致性论证,PAC-Bayes + 二阶展开的组合技术对您在半参数效率理论和高维 inference 中的经验过程控制有方法迁移价值。

6. 10.3150/25-bej1929 — Identifiability of overcomplete independent component analysis

  • 作者: Kexin Wang, Anna Seigal
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 本文研究超定独立成分分析(overcomplete ICA)的可识别性,设定为潜变量源数量严格大于观测数量。作者给出了该设定下混合矩阵可被唯一恢复的充分必要条件,证明核心基于秩一对称矩阵线性空间的代数性质。对于一般混合矩阵,推导了仅依赖于源数量与观测数量维度的可识别性判据。基于上述理论,作者设计了混合矩阵恢复算法并在合成与真实数据上进行了验证。对您有用之处:该文将 ICA 可识别性推广至高维超定情形,其秩一矩阵空间的代数证明技巧对高维统计与矩阵理论中的可识别性研究具有借鉴意义。
  • 关键技术: overcomplete ICA, identifiability characterization, rank one symmetric matrices, matrix recovery algorithm, generic mixing
  • 为什么对您有用: 超定 ICA 的可识别性刻画属于高维统计与数学统计的交叉,其利用秩一矩阵线性空间的证明思路对您研究高维矩阵恢复与可识别性理论有直接的方法论启发。

非参数 / 半参数 (nonparam_semipara, 11 篇)

1. 10.3150/25-bej1944 — On some geometric identities involving the sample covariance matrix and its adjugate

  • 作者: Alexander Dürre, Davy Paindaveine
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在椭圆分布及一般分布框架下,本文研究样本协方差阵 S 及其伴随矩阵 adj(S) 的几何恒等式,目标是对涉及 adj(S) 和样本均值 X̄ 的矩阵泛函构造 UMRU 估计量。核心方法是将基于数据单纯形/平行体 Lebesgue 测度的几何恒等式从标量泛函(如 Wilks 广义方差 det(S))推广到矩阵泛函,利用 adj(S)=det(S)S⁻¹ 的结构导出 E[adj(S)] 等显式表达式。关键技术工具包括高阶 U-统计量(单纯形体积即 p+1 阶 U-统计量)、几何概率论、以及仅要求有限二阶矩的矩计算。主要理论结果是在有限二阶矩条件下给出 adj(S) 相关泛函的精确期望与 UMRU 估计,并将条件独立性推广为偏不相关与偏中位数不相关概念。对您研究高阶 U-统计量的矩阵推广及样本协方差阵有限样本性质有直接参考价值。
  • 关键技术: adjugate matrix of sample covariance, UMRU estimation, geometric identities for simplices, higher-order U-statistics, partial uncorrelatedness, elliptical distributions
  • 为什么对您有用: 直接连接您的高阶 U-统计量兴趣(单纯形体积本质是 U-统计量,本文将其从标量推广到矩阵泛函),同时涉及样本协方差阵的有限样本精确结果,可为高维/随机矩阵渐近理论提供有限样本对照。

2. 10.3150/25-bej1940 — Misspecified Bernstein–von Mises theorem for hierarchical models

  • 作者: Geerten Koers, Botond Szabó, Aad van der Vaart
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在模型误设且非独立同分布的层次模型下,针对有限维兴趣参数推导 Bernstein–von Mises (BvM) 定理,假设层次模型包含非线性算子(如平方积分算子)或 PDE 约束。核心机制是证明在误设情况下,后验分布仍具有渐近正态性,其中心位于伪真实参数的 MLE,方差与频率派渐近方差匹配,关键技术涉及无穷维参数的半参数效率理论、后验收缩率分析以及非线性算子的 Fréchet 导数处理。理论结果应用于平方积分算子和 Schrödinger 方程/抛物型 PDE 约束的逆问题,数值分析验证了有限样本表现。对您可能有用:该文在非独立同分布和误设框架下拓展了 BvM 定理,为半参数效率界与贝叶斯推断的桥梁提供了新理论,直接关联您对 semiparametric efficiency bounds 和 mathematical statistics 的核心兴趣。
  • 关键技术: misspecified Bernstein-von Mises theorem, hierarchical models, PDE-constrained inverse problems, semiparametric efficiency, posterior contraction rate
  • 为什么对您有用: 关联您对 semiparametric efficiency bounds 和 mathematical statistics 的兴趣;在误设与非独立同分布设定下证明 BvM 定理,为半参数贝叶斯-频率派桥梁提供新理论,放松了传统 BvM 的正确模型指定假设。

3. 10.3150/25-bej1938 — Asymptotic bias reduction of maximum likelihood estimates via penalized likelihoods with differential geometry

  • 作者: Masayo Y. Hirose, Shuhei Mano
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在正则参数模型下,本文研究极大似然估计(MLE)的 O(n^{-1}) 阶渐近偏差修正问题。核心方法是通过极大化惩罚似然构造 plug-in 估计量,其惩罚函数需满足一阶拟线性偏微分方程(PDE)。借助微分几何(信息几何)工具,作者将 PDE 的求解转化为沿测地线的积分,从而显式构造出所需的惩罚项。该框架被成功应用于广义线性模型、线性混合效应模型及位置-尺度族。理论结果实现了 MLE 的一阶偏差消除,提升了估计的高阶渐近性质。对您有用:该工作将微分几何与高阶渐近理论深度结合,对您在 semiparametric efficiency 及 higher-order U-statistics/asymptotics 方向的研究提供了重要的几何视角与数学工具借鉴。
  • 关键技术: penalized likelihood, asymptotic bias reduction, differential geometry, quasi-linear PDE, information geometry, higher-order asymptotics
  • 为什么对您有用: 本文利用微分几何处理高阶渐近偏差,与您关注的 semiparametric/nonparametric theory 及 efficiency theory 中的高阶有效性(higher-order efficiency)和流形上的统计推断直接相关,可提供几何视角的数学工具借鉴。

4. 10.3150/25-bej1936 — Nonparametric estimation of ordinary differential equations: Snake and stubble

  • 作者: Christof Schötz
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 研究常微分方程 (ODE) $\dot{u}(t) = f(u(t))$ 中未知漂移函数 $f$ 的非参数估计,设定为带加性噪声的离散时间观测。针对 ODE 估计中观测位置依赖 $f$ 的固有困难,提出 Stubble 模型(多条短轨迹覆盖定义域)和 Snake 模型(少数长轨迹穿越定义域)。Stubble 模型采用多元局部多项式回归与一元多项式插值,Snake 模型则结合一元局部多项式估计与多元多项式插值。在 Hölder 型无限维函数类下,对 $\beta$-光滑函数 $f$ 建立了 $n^{-\beta/(2(\beta+1)+d)}$ 的误差界,并证明了 Stubble 及部分条件下 Snake 模型的极小极大最优性。对您有用:该工作给出了 ODE 漂移函数估计的极小极大最优率,直接丰富了非参数理论储备,且其插值与局部多项式结合的数值策略对统计计算方向有参考价值。
  • 关键技术: nonparametric ODE estimation, local polynomial regression, minimax optimal rate, Hölder smoothness, polynomial interpolation
  • 为什么对您有用: 直接关联您的非参数理论兴趣,给出了 ODE 漂移函数估计的极小极大最优收敛率;同时其结合局部多项式与多项式插值的算法设计对统计计算(数值方法)方向有借鉴意义。

5. 10.3150/25-bej1962 — On the breakdown point of transport-based quantiles

  • 作者: Marco Avella Medina, Alberto González-Sanz
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 本文研究基于最优传输(optimal transport)的多维 center-outward 分位数函数的鲁棒性,具体推导其在污染模型下的 breakdown point。在 Chernozhukov et al. (2017) 和 Hallin et al. (2021) 定义的传输中位数(transport median)下,证明其 breakdown point 为 1/2;而对阶数 τ∈[0,1/2] 的传输深度等高线上的点,breakdown point 恰为 τ,与一元情形完全一致。核心证明技术是将传输映射在某点处的 breakdown point 与该点在参考测度下的 Tukey depth 建立一般性联系,从而将多元传输深度的鲁棒性归约为经典的半空间深度性质。该结果为多维非参数分位数的鲁棒推断提供了有限污染下的理论保证。对您而言,这是非参数理论中 optimal transport 与 robustness 交叉的新理论结果,传输映射与 Tukey depth 的连接技巧可能在因果推断中 transport-based counterfactual 分布的敏感性分析中有迁移价值。
  • 关键技术: optimal transport map, breakdown point, Tukey depth, center-outward quantiles, contamination model
  • 为什么对您有用: 属于非参数理论中 optimal transport 与 robustness 的交叉新理论;传输映射与 Tukey depth 的归约论证技巧,对因果推断中基于 transport 的 counterfactual 分布敏感性分析有潜在迁移价值。

6. 10.3150/25-bej1947 — Max-sliced Wasserstein concentration and uniform ratio bounds of empirical measures on RKHS

  • 作者: Ruiyu Han, Cynthia Rush, Johannes Wiesel
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 4/10 · novelty: sharper_rate
  • 摘要: 本文研究经验测度与真实测度之间 max-sliced Wasserstein 距离 $\overline{\mathcal{W}}_p$ 在无界 RKHS 上的集中不等式与期望上界。核心设定是:将高维 $\mathcal{W}_p$ 降为一维投影的最大化,以克服维数灾难;假设测度支撑于一般 RKHS 球。作者先改进了有限维情形下 $\overline{\mathcal{W}}_p$ 的已知上界,再将其推广至无穷维 RKHS,证明在一维子空间上概率测度以(近)参数速率 $n^{-1/2}$ 一致集中。关键技术工具包括 RKHS 上的 chaining/covering number 论证、sliced optimal transport 的对偶表示以及经验过程的集中不等式。主要理论结果给出了 $\mathbb{E}[\overline{\mathcal{W}}_p(\hat{\mu}_n, \mu)]$ 的显式上界及尾部概率界,速率接近 $n^{-1/2}$。对您而言,该文将 RKHS 经验过程集中与 sliced OT 结合,为高维非参数检验和两样本问题提供了近参数速率的理论保证,可直接服务于您在 nonparametric theory 与 hypothesis testing 交叉方向的研究。
  • 关键技术: max-sliced Wasserstein distance, RKHS concentration inequality, empirical measure uniform ratio bounds, covering number chaining, nearly parametric rate
  • 为什么对您有用: 直接推进您在 nonparametric theory 方向的兴趣:RKHS 上的经验过程集中结果是 semiparametric / nonparametric 推断的基础工具,而近参数速率的 sliced Wasserstein 界可为高维两样本假设检验提供 sharper rate 的理论支撑。

7. 10.3150/25-bej1960 — Optimal level set estimation for non-parametric tournament and crowdsourcing problems

  • 作者: Maximilian Graf, Alexandra Carpentier, Nicolas Verzelen
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 在众包与锦标赛(tournament)设定下,观测 n 个专家对 d 个问题的部分正确率矩阵 M,假设 M 在行、列置换后满足双单调(bi-isotonic)结构;当 n=d 时该模型涵盖 SST(strongly stochastic transitive)模型。目标是恢复矩阵 M 的水平集(level set),即区分 M_{ij}>p+h 与 M_{ij}<p-h 的位置,精度为 h。作者提出了基于双单调回归的水平集估计器,并建立了该问题的 minimax rate:在双单调约束下,水平集估计的最优收敛速率依赖于 n、d 与带宽 h 的交互关系,给出了匹配的上界与下界。核心工具包括双单调 M-估计的集中不等式与水平集分类的 FDR/风险分析。该结果为众包中高效分配工人提供了理论保证。对您而言,这是非参数理论中结构化模型(order constraint)下 minimax rate 的一个完整刻画,可与您关注的 semiparametric efficiency bound 思路做对比——结构约束下的最优速率是否可通过 influence function 类框架统一理解。
  • 关键技术: bi-isotonic regression, minimax rate, level set estimation, SST model, concentration inequality, structured nonparametric estimation
  • 为什么对您有用: 连接您 primary interest 中的非参数理论:双单调结构约束下的 minimax rate 刻画可与 semiparametric efficiency bound 的思路对照,且水平集估计与假设检验(区分 p±h)有天然联系。

8. 10.3150/25-bej1948 — Generalizing super/sub mot using weak ℓ1 transport

  • 作者: Erhan Bayraktar, Dominykas Norgilas
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10 · novelty: new_theory
  • 摘要: 本文在实数轴上研究带重心代价函数的弱最优运输(WOT)问题,刻画了 μ 与 ν 之间最优耦合的结构:左尾由 submartingale 耦合、右尾由 supermartingale 耦合、中间区域由 martingale 耦合。随后考虑约束最优运输问题,要求运输计划必须是 L^1 代价下 WOT 的最优解,该约束问题推广了 Beiglböck–Juillet 和 Nutz–Stebegg 等人的 (sub/super-)martingale optimal transport 框架。最后引入广义 shadow measure 并建立其与 WOT 的联系,将 martingale 设定下的 shadow 结果做了统一推广。核心工具为 barycentric cost 下的耦合分解与约束优化对偶。对您而言,martingale transport 的耦合结构在因果推断 partial identification 与 sensitivity analysis 中有潜在迁移价值,shadow measure 的推广也为分布约束下的界估计提供了新理论工具。
  • 关键技术: weak optimal transport, barycentric cost function, martingale optimal transport, shadow measure, submartingale/supermartingale coupling, constrained transport problem
  • 为什么对您有用: martingale optimal transport 的耦合分解与 shadow measure 推广可直接迁移至因果推断中 partial identification 与 sensitivity analysis 的分布约束界估计,属于非参数理论向因果推断的方法论溢出。

9. 10.3150/25-bej1930 — Merging rate of opinions via optimal transport on random measures

  • 作者: Marta Catalano, Hugo Lavenant
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10 · novelty: new_theory
  • 摘要: 在 Bayesian nonparametric 框架下,研究不同先验下后验分布的合并速率(merging rate),estimand 为后验法则间距离随样本量增加的衰减率,无需对真实数据生成过程做假设。定义了一种新的随机测度法则间距离,基于非平衡测度空间上的 Wasserstein 距离,底层空间赋予 bounded Lipschitz 度量。对完全随机测度(含 Poisson 和 gamma 随机测度特例)推导了紧分析界,该界可解释为 Lévy 测度间 adapted extended Wasserstein 距离的函数。将理论应用于 normalized gamma 与 generalized gamma 先验的后验合并分析,结合随机测度法则可识别性的细致研究,获得了渐近与有限样本洞察。对您而言,本文的随机测度最优传输框架与紧界技术对非参数理论(特别是 Bayesian nonparametric 渐近分析)有参考价值,但与您核心关注的半参数效率/debiased ML 方向距离较远。
  • 关键技术: Wasserstein distance on unbalanced measures, completely random measures, Lévy measures, bounded Lipschitz metric, posterior merging rates, optimal transport
  • 为什么对您有用: 本文属于非参数理论范畴,与您 primary interest 中的 semiparametric/nonparametric theory 有方法学重叠(随机测度渐近分析、紧界推导),但聚焦 Bayesian nonparametric 而非频率派半参数效率,收益主要在于了解最优传输在随机测度距离构造中的新理论工具。

10. 10.3150/25-bej1953 — Learning topic hierarchies by tree-directed latent variable models

  • 作者: Sunrit Chakraborty, Rayleigh Lei, XuanLong Nguyen
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 1/10 · novelty: new_theory
  • 摘要: 本文研究带有潜在有向树层级结构的主题模型(可视为受树约束的有限混合LDA),目标是在该结构下实现主题层级的可识别性与参数估计。在适当的正则条件下,作者建立了潜在主题层级的可识别性理论框架。进一步,推导了模型及其参数的后验收缩率(posterior contraction rates)的理论界。该工作将传统的LDA扩展至层级结构,并通过严格的贝叶斯非参数理论刻画了后验收敛性质。模拟与纽约时报数据实证验证了模型与理论的有效性。尽管应用场景为文本主题模型,其对潜在变量模型可识别性与后验收缩率的严格推导,对您在半参数/非参数理论中处理结构化潜在变量推断具有方法论借鉴意义。
  • 关键技术: latent variable model, identifiability, posterior contraction rate, hierarchical LDA, Bayesian nonparametrics
  • 为什么对您有用: 虽然应用领域为文本主题模型,但其核心贡献在于潜在变量模型的可识别性与后验收缩率推导,属于非参数/半参数理论范畴,对您研究结构化潜在变量模型的数学统计性质有直接参考价值。

11. 10.3150/25-bej1937 — Sample path properties of the fractional Wiener–Weierstrass bridge

  • 作者: Alexander Schied, Zhenyuan Zhang
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 1/10 · novelty: new_theory
  • 摘要: 本文研究分数维纳-魏尔斯特拉斯桥的样本路径性质,该高斯过程通过将经典魏尔斯特拉斯函数中的三角函数替换为分数布朗桥构造而成。核心机制是利用分数阶积分的上下界,对过程的局部与一致连续模、Φ-变差、Hausdorff维数及最大值位置进行精细刻画。技术上,作者对一类特殊阶梯函数的分数阶积分建立了对经典Hardy-Littlewood不等式的新改进。主要理论结果给出了该高斯过程样本轨道的渐近性质和分形特征。对您可能有用:虽然主要属于随机过程与概率论,但对Hardy-Littlewood不等式的改进可能对非参数理论中的分数阶微积分工具或高斯过程极值理论有借鉴意义。
  • 关键技术: fractional Brownian bridge, Hardy-Littlewood inequality, sample path properties, fractional integrals, Hausdorff dimension
  • 为什么对您有用: 属于数理统计与随机过程交叉,对Hardy-Littlewood不等式的改进可能为非参数理论中的分数阶积分或高斯过程样本路径分析提供新工具。

数理统计 / 假设检验 (hypothesis_testing, 7 篇)

1. 10.3150/25-bej1939 — Regularized e-processes: Anytime valid inference with knowledge-based efficiency gains

  • 作者: Ryan Martin
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在样本量数据依赖的序贯抽样设定下,传统假设检验方法失效,本文在 anytime-valid inference 框架下,利用不精确概率(imprecise probability)融入先验知识以提升 e-process 的效率。提出 regularized e-process,通过基于知识的正则化项调整标准 e-process;建立了推广的 Ville 不等式,保证正则化后的 e-process 在新的知识依赖意义下仍然 anytime valid。该方法在保持频率学派校准性质的同时,具备贝叶斯学派特性(满足似然原理、避免 sure-loss),并提供具有可靠性保证的决策框架。对您在假设检验与效率理论方面的兴趣有直接参考价值,展示了如何在序贯检验中通过不精确概率正则化实现效率提升,为动态数据下的因果推断或高维检验提供 anytime-valid 的新思路。
  • 关键技术: e-processes, anytime-valid inference, Ville's inequality, imprecise probability, sequential hypothesis testing
  • 为什么对您有用: 直接关联您在假设检验与效率理论的兴趣,展示了在序贯检验中融入先验知识提升效率的新理论,为动态数据下的因果推断或高维检验提供 anytime-valid 的思路。

2. 10.3150/25-bej1927 — SID: A novel class of nonparametric tests of independence for censored outcomes

  • 作者: Jinhong Li, Jicai Liu, Jinhong You, Riquan Zhang
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文针对右删失(right-censored)结局与协变量之间的独立性检验问题,提出了一类新的非参数度量——生存独立性散度(SID)。其核心技术是利用计数过程策略,将因删失导致不可直接处理的独立性检验等价转化为完全观测下的检验问题。SID 当且仅当删失响应与协变量独立时为零,且具备检测各类非线性依赖关系的能力。作者构造了 SID 的经验估计量并建立了其渐近性质,同时发展了 wild bootstrap 方法来估计临界值并证明了 bootstrap 检验的相合性。数值模拟表明基于 SID 的检验在广泛设定下优于现有方法。对您而言,该文将计数过程与非线性独立性检验结合的思路,直接丰富了您在假设检验与非参数理论交叉方向的方法库,且右删失设定对您关注的流行病学应用具有直接迁移价值。
  • 关键技术: nonparametric independence test, counting process strategy, right-censored data, wild bootstrap, asymptotic properties
  • 为什么对您有用: 直接对应您在假设检验与非参数理论方面的核心兴趣,其处理右删失数据的计数过程转化技巧和 wild bootstrap 渐近理论,对您在流行病学生存数据的独立性检验或因果推断应用具有方法迁移价值。

3. 10.3150/25-bej1951 — Convergence in χ2 distance to the normal distribution for sums of independent random variables

  • 作者: Vytas Zacharovas
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 6/10 · novelty: sharper_rate
  • 摘要: 在独立随机变量之和向正态分布收敛的设定下,本文研究标准化和与正态分布之间的 χ² 距离收敛速率,假设变量均值为零、方差相等且平均 χ² 距离有界。作者证明了当平均 χ² 距离受控于足够小的常数时,其标准化和与正态分布的 χ² 距离收敛率达到 O(1/n)。该证明利用了 χ² 散度的性质与特征函数的 Fourier 反演技术,给出了比传统 Kolmogorov 或全变差距离更精细的密度收敛界。这一 O(1/n) 的 sharp rate 对构建非参数检验的精确临界值有直接支撑;对您在数学统计与假设检验(特别是基于 χ² 距离的分布逼近与功效分析)方面的兴趣具有理论参考价值。
  • 关键技术: chi-squared distance, CLT convergence rate, Fourier inversion, independent non-identically distributed sums, density approximation
  • 为什么对您有用: 直接关联您在数学统计与假设检验的兴趣,χ² 距离的 O(1/n) sharp rate 为非参数检验的功效分析及高阶 U 统计量的分布逼近提供了更精细的理论界。

4. 10.3150/25-bej1959 — The limits of assumption-free tests for algorithm performance

  • 作者: Yuetian Luo, Rina Foygel Barber
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 本文研究在有限数据下对黑盒算法性能进行假设检验与推断的基本极限。区分了评估算法A在训练集大小为n时的泛化能力与评估特定拟合模型的表现;对于将算法视为黑盒的任意检验,除非总样本量N远大于评估样本量n,否则对算法A性能的推断存在不可逾越的极限。即使引入算法稳定性假设,该困难结果依然成立,除非处于拟合模型几乎非随机的高稳定性区间;对多算法比较问题也建立了类似的不可能定理。该结果对您在假设检验方向理解黑盒算法评估的理论下界有直接参考价值。
  • 关键技术: black-box testing, algorithmic stability, impossibility theorem, cross-validation inference, sample complexity limit
  • 为什么对您有用: 直接关联您在数学统计(假设检验)方向的兴趣,揭示了黑盒算法性能评估的理论下界与不可能定理,为评估交叉验证等推断方法的极限提供新理论。

5. 10.3150/25-bej1935 — Detecting a late changepoint in the preferential attachment model

  • 作者: Gianmarco Bet, Kay Bogerd, Rui M. Castro, Remco van der Hofstad
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在偏好依附随机图模型中,基于网络的单一快照(无动态观测信息)检测依附机制是否发生改变;原假设为常数仿射依附参数 δ₀,备择假设为参数在未知变点 τₙ = n - cnᵞ 处从 δ₀ 变为 δ₁。提出两个基于最小度顶点数的检验统计量,在 1/2 < γ < 1 的晚期变点设定下具有渐近功效;第一个检验需已知 δ₀,第二个更复杂的检验无需 δ₀ 且保持相同的功效保证。证明了两个检验统计量的渐近正态性,从而可以进行精确的检验校准;并猜想 γ < 1/2 时不存在强功效检验。理论刻画了晚期变点的可检测性边界及检验的渐近性质,数值实验验证了有限样本表现。对您有用:该文是数学统计假设检验在复杂网络模型中的精细应用,其渐近功效分析与无需原假设参数的检验构造思路可为您在假设检验与渐近理论方面的研究提供借鉴。
  • 关键技术: preferential attachment model, changepoint detection, asymptotic normality, asymptotic power, hypothesis testing boundary
  • 为什么对您有用: 该文严格处理了随机图模型中的变点假设检验问题,证明了渐近正态性与功效,直接契合您在数学统计(假设检验)方面的核心兴趣,其检验统计量的构造与校准方法具有参考价值。

6. 10.3150/25-bej1943 — Sharp anti-concentration inequalities for extremum statistics via copulas

  • 作者: Matias D. Cattaneo, Ricardo P. Masini, William G. Underwood
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 3/10 · novelty: sharper_rate
  • 摘要: 本文研究 d 个同分布实值随机变量最大统计量的逐点浓度函数(anti-concentration)的上下界。首先在不对边际分布或 copula 施加任何限制的条件下,证明浓度函数对维度 d 的严格次线性依赖一般不可能成立。随后引入具有凸对角截面(convex diagonal section)的新 copula 类,证明在此约束下可获得更紧的浓度函数上界,从而建立多种边际分布下与维度无关或仅 poly-log(d) 依赖的反集中不等式,改进了若干已知特例的最佳结果。应用于高维统计推断,特别在因子模型的 Gauss 混合逼近中给出了更优的分布保证。对您有用:反集中不等式是高维假设检验中 Berry-Esseen 型分布逼近的关键工具,本文的 sharper bound 可直接提升 max-type 检验统计量逼近精度。
  • 关键技术: anti-concentration inequalities, copula diagonal section, extremum statistics, Gaussian mixture approximation, factor model distributional guarantees
  • 为什么对您有用: 直接推进高维假设检验中 max-type 统计量的分布逼近理论,sharper anti-concentration bound 可提升检验 level 控制精度;因子模型应用与 RMT 及高维 inference 的交叉方向紧密相关。

7. 10.3150/25-bej1965 — Stability of Khintchine inequalities with optimal constants between the second and the p-th moment for p≥3

  • 作者: Jacek Jakimiuk
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10 · novelty: sharper_rate
  • 摘要: 本文研究经典 Khintchine 不等式在 $p\ge 3$ 时二阶矩与 $p$ 阶矩之间的最优常数形式的稳定性(stability)。在 Rademacher 和 $\sum a_i \varepsilon_i$ 的设定下,已知最优常数的 Khintchine 不等式被加强为一个带 deficit 项的版本,该 deficit 依赖于系数向量 $a$ 的具体结构,刻画了等号成立条件偏离时的精细行为。核心技术工具涉及 Rademacher 随机变量的矩比较与系数向量的几何性质分析。主要结果给出了比经典最优常数不等式更精细的界,揭示了 deficit 与系数分布的关系。对您而言,Khintchine 不等式是高维统计与经验过程理论中的基础 concentration 工具,该 deficit 刻画可为高维推断中矩界紧性分析提供更精细的理论支撑。
  • 关键技术: Khintchine inequality, Rademacher sum, moment comparison, deficit/stability analysis, optimal constant characterization
  • 为什么对您有用: Khintchine 不等式是高维统计与经验过程理论的基础工具,deficit 刻画对理解矩界紧性有直接价值,连接您 primary interest 中的 mathematical statistics 与高维统计的 concentration inequality 子方向。

统计计算 / 算法 (stat_computing, 2 篇)

1. 10.3150/25-bej1956 — Hessian stability and convergence rates for entropic and Sinkhorn potentials via semiconcavity

  • 作者: Giacomo Greco, Luca Tamanini
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 在一般无界设定下,研究 entropic optimal transport 对偶解(entropic potentials)的 Hessian 定量稳定性界,这是首个在无界设定下解决二阶稳定性估计的工作。核心技术工具是 entropic potentials 的半凹性(semiconcavity)以及将 entropic transport plans 表示为 Schrödinger bridge 的前向-后向扩散过程表示。由此推导出 entropic transport plans 和 entropic potentials 梯度的定量稳定性估计,并给出随机证明。作为直接推论,得到 Sinkhorn 迭代的梯度和 Hessian 的指数收敛速率,解决了无界设定下的开放问题;收敛速率对正则化参数具有多项式依赖。对您有用:Sinkhorn 算法的收敛率结果直接关联 statistical computing 中的数值方法与算法分析;entropic OT 的二阶稳定性也可为非参数理论中 transport-based inference 提供理论支撑。
  • 关键技术: semiconcavity, Schrödinger bridge, Sinkhorn algorithm, entropic optimal transport, quantitative stability, exponential convergence rate
  • 为什么对您有用: Sinkhorn 算法收敛率的精确刻画直接关联您在 statistical computing 中的数值方法兴趣;entropic potentials 的二阶稳定性估计可为非参数理论中 transport-based 估计的 sharper rate 提供基础。

2. 10.3150/25-bej1955 — The football model, stochastic ordering and martingale transport

  • 作者: Gaoyue Guo, Nicolas Juillet, Wenpin Tang
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 1/10 · novelty: new_method
  • 摘要: 本文研究竞赛排序的足球模型,目标是在随机序(stochastic ordering)约束下,为 Moon 定理保证的可行得分序列提供显式的概率构造。作者将此构造问题转化为鞅传输问题,并提出了两种解法:其一是通过 Sinkhorn 算法求解熵优化问题,其二是基于影子耦合的思想。理论结果表明,这两种构造均满足强随机传递性,论文还进一步探讨了非传递性情形下的模型表现。对您而言,其中 Sinkhorn 算法求解熵正则化传输的数值实现及鞅传输的数学结构,可为统计计算与半参数推断中的最优传输算法提供方法借鉴。
  • 关键技术: martingale transport, Sinkhorn algorithm, entropy optimization, shadow coupling, stochastic ordering, majorization
  • 为什么对您有用: 论文将概率存在性证明转化为可计算的鞅传输问题并使用 Sinkhorn 算法求解,对您在统计计算(数值方法与算法)和半参数理论中的最优传输/耦合方法有直接的算法借鉴价值。

其他 (other, 7 篇)

1. 10.3150/25-bej1934 — Optimal importance sampling for overdamped Langevin dynamics

  • 作者: Martin Chak, Tony Lelièvre, Gabriel Stoltz, Urbain Vaes
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 6/10
  • 摘要: { "topic": "stat_computing", "summary_zh": "本文研究多峰目标分布下基于过阻尼 Langevin 动力学的 MCMC 重要性采样方法,目标 estimand 为给定可观测函数的期望,关键假设为过程关于修改后势能的遍历性。核心方法是对势能施加偏置修改后沿修改动力学采样,并在遍历平均估计器中加入重加权项以消除偏置引入的偏差;在一维情形下,作者给出了最小化该估计器渐近方差的最优偏置势能的显式表达式,并在多维情形下提出通用数值逼近方案。此外,文章考虑了对一类可观测函数的渐近方差加权平均进行最小化的替代优化目标。数值实验验证了所提方法在多峰分布下方差缩减的有效性。对您而言,本文在统计计算(MCMC 数值方法)方向提供了渐近方差最优化的具体方案,且"最小化渐近方差"的思路与 efficiency theory 中的最优性追求有概念上的呼应,但技术路线差异较大。", "key_techniques": [ "overdamped Langevin dynamics", "importance sampling for MCMC", "asymptotic variance minimization", "optimal biasing potential", "ergodic average estim

2. 10.3150/25-bej1958 — Comparing moments of real log-concave random variables

  • 作者: Daniel Murawski
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10
  • 摘要: { "topic": "nonparam_semipara", "summary_zh": "本文研究实值 log-concave 随机变量的矩比较不等式,目标是在仅假设均值零或无对称性条件下,给出 $|X|_p / |X|_q$ 的最优上界。作者首先将经典对称 log-concave 情形下的 $|X|_p \leq (p/q)|X|_q$ 推广至均值零(非对称)log-concave 变量;其次证明对任意 log-concave 变量,该比值在平移指数分布处取极大值;由此导出一般界 $|X|_p \leq C_0 (p/q) |X|_q$,其中最优绝对常数 $C_0 = e^{W(1/e)} \approx 1.3211$($W$ 为 Lambert 函数)。技术工具涉及 log-concave 密度的极值刻画与矩比优化。结果为 log-concave 非参数推断中的 concentration inequality 和矩界提供了更精确的常数。对您而言,若在 semiparametric/nonparametric 理论或高维推断中需要 log-concave 假设下的矩控制,此 sharper constant 可直接用于收紧效率界或浓度不等式中的常数项。", "key_techniques": [ "log-concave mom

3. 10.3150/25-bej1932 — Optimal designs for regression on Lie groups

  • 作者: Somnath Chakraborty, Holger Dette, Martin Kroll
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10 · novelty: new_theory
  • 摘要: 本文在紧连通李群上的线性回归设定下研究最优实验设计,模型基于拉普拉斯-贝尔特拉米算子的特征函数展开。作者证明了归一化 Haar 测度在所有 Kiefer Φ_p-准则下均为近似最优设计。受代数组合中 t-design 启发,引入 λ-design 概念以构造固定样本量下的精确 Φ_p-最优设计。针对 SU(2) 和 SO(3) 李群,文章显式构造了相应的最优设计,并展示了其在生物学数据中的应用。对您而言,虽然主题为实验设计,但其中 Haar 测度与 Laplace-Beltrami 算子在非欧流形上的处理方式,对 astrostats 中方向数据(如 SO(3) 天体定向)的推断或流形上的非参数理论具有方法学借鉴价值。
  • 关键技术: optimal experimental design, Lie group, Laplace-Beltrami operator, Haar measure, Kiefer's Phi_p-criteria, t-design
  • 为什么对您有用: 虽然核心为实验设计,其基于李群(如 SO(3))与 Haar 测度的非欧几何推断框架,对您在 astrostats 中处理方向数据或流形上的非参数理论具有方法学迁移价值。

4. 10.3150/25-bej1961 — Functional central limit theorem for the subgraph count of the voter model on dynamic random graphs

  • 作者: Simone Baldassarri, Nikolai Kriukov
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 2/10 · novelty: new_theory
  • 摘要: 本文研究动态随机图上的两意见投票模型,其中边随顶点意见动态变化而意见演化不受图结构影响(单向反馈),目标是顶点数趋于无穷时投票子图计数向量的联合演化。子图计数本质上是网络中的高阶U统计量,其极限理论通常依赖于Hoeffding型投影与分解。作者通过适当的中心化和缩放,建立了该子图计数向量联合演化的渐近正态性。主要理论结果是证明其联合泛函收敛到一个特定的多维高斯过程,即函数中心极限定理(FCLT)。对您研究高阶U统计量的极限分布与渐近正态性理论有直接的概率论工具借鉴价值。
  • 关键技术: functional central limit theorem, subgraph count, voter model, dynamic random graphs, multidimensional Gaussian process
  • 为什么对您有用: 子图计数是高阶U统计量在网络分析中的典型实例,本文的FCLT为您研究高阶U统计量的极限理论与渐近分布提供了概率论视角的参考。

5. 10.3150/25-bej1950 — A law of large numbers for kinetic interacting diffusions

  • 作者: Carlo Bellingeri, Fabio Coppini
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 1/10 · novelty: weaker_assumption
  • 摘要: 本文研究有限时间域内动能相互作用粒子系统的经验分布收敛性,目标是在仅要求初始数据弱收敛(无需独立性或矩条件)的假设下,证明经验分布依概率收敛到对应的非线性 Fokker-Planck PDE。核心工具是近期关于动能非线性偏微分方程的理论进展,通过将粒子系统的经验测度与 PDE 解的适定性联系起来,建立 mean-field limit。主要结果是在比经典 propagation of chaos 文献更弱的初始条件下(仅弱收敛而非 i.i.d. 或有界矩)得到收敛性。该工作属于概率论与数学物理交叉领域,与统计推断的直接关联有限,但对理解粒子系统平均场行为有理论价值。
  • 关键技术: mean-field limit, kinetic Fokker-Planck PDE, weak convergence of empirical measures, propagation of chaos, interacting particle systems
  • 为什么对您有用: 与您的主要兴趣方向关联较弱;粒子系统的 mean-field 理论与统计计算中的 particle filter / SMC 方法有间接联系,但本文聚焦动能 PDE 适定性而非统计推断或计算方法,方法学可迁移性有限。

6. 10.3150/25-bej1946 — On the passage times of self-similar Gaussian processes on curved boundaries

  • 作者: Davar Khoshnevisan, Cheuk Yin Lee
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 1/10 · novelty: new_theory
  • 摘要: 在自相似高斯过程(自相似指数 α>0)与弯曲边界 ±ct^β 的设定下,研究首达时 T_{c,β} 的矩存在性。利用 Pitt (1978) 意义下的强局部非确定性(strong local nondeterminism),将 Breiman (1967) 和 Shepp (1967) 关于布朗运动在临界平方根边界上的经典结果推广至一般自相似高斯过程。主要理论结果分为三种情形:(i) β>α 时首达时以正概率无穷;(ii) β<α 且强局部非确定性成立时,首达时所有阶矩有限;(iii) β=α(临界情形)时存在连续严格递减函数 λ(c) 划分矩的有限与无限区域。本文属于纯概率论(高斯过程首达时),与您关注的因果推断、高维统计或效率理论等方向无直接交集,方法学新颖度为 minor。
  • 关键技术: self-similar Gaussian processes, strong local nondeterminism, passage times on curved boundaries, moment existence
  • 为什么对您有用: 本文属于纯概率论(高斯过程首达时),与您关注的因果推断、高维统计或效率理论等方向无直接交集,无直接迁移价值。

7. 10.3150/25-bej1949 — Convergence of the pruning processes of stable Galton-Watson trees

  • 作者: Gabriel Berzunza Ojeda, Anita Winter
  • 期刊/来源: Bernoulli
  • 分类: vol 32 · issue 3
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 本文在 bi-measure R-树空间及 leaf-sampling weak vague 拓扑下,研究稳定 Galton-Watson 树剪枝过程的收敛性,假设后代分布属于指数 α∈(1,2] 稳定律的吸引域。基于 Löhr, Voisin 和 Winter (2015) 建立的 Feller 连续 Markov 过程统一框架,证明适当重标度的临界条件 Galton-Watson 树序列在取值于该空间的 Skorokhod 空间中收敛到 α-稳定 Lévy 树。主要理论结果验证了离散树到连续树的统一收敛原则,属于纯概率论与随机过程研究。本文与您的核心兴趣(因果推断、高维统计、效率理论等)无直接方法学重叠,阅读收益有限。
  • 关键技术: Galton-Watson trees, Lévy trees, Skorokhod topology, leaf-sampling weak vague topology, stable law domain of attraction
  • 为什么对您有用: 本文属于纯概率论与随机过程(分支过程与 Lévy 树的标度极限)研究,与您的核心兴趣(因果推断、高维/随机矩阵、半参数效率界等)无直接方法学重叠,阅读收益极低。

Maintained by 陈星宇 · Homepage · Source on GitHub