Bernoulli — Vol 32 Issue 1 · 2026-06-18¶
- 共 34 篇 · Bernoulli
- 目录核对 ⚠️ 疑似漏 2 篇(对照 OpenAlex 36 篇):10.3150/25-bej1905、10.3150/25-bej1910
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
本期论文大致聚成四条主线:高维与随机矩阵理论(7篇)、非参数与半参数方法(12篇)、假设检验与极限理论(6篇)、概率过程与纪念综述(9篇)。高维主线聚焦谱统计量、过拟合与模型选择;非参数主线密集覆盖空间/函数型数据、依赖度量与稳健估计;检验主线深挖变点检测的相变与隐私推断;概率部分多为Barndorff-Nielsen纪念综述及交互粒子/分支过程。
非参数与半参数主线在本期体量最大,核心推进在于复杂依赖结构与逆问题的估计效率。空间与频域推断方面,多篇论文处理不规则采样与相依设计:Series ridge回归与谱空间统计量分别在空间趋势与各向同性检验中修正边缘效应并给出minimax收敛速率;傅里叶分析空间点过程与局部依赖随机图模型均利用频域二次型或Stein方法建立渐近正态逼近。依赖度量与稳健性方面,Azadkia–Chatterjee系数与条件分布灵敏度分别将非参数依赖测度推广至无穷维数据与统一框架;最小S-divergence估计量推导出维度无关的渐近崩溃点下界。逆问题与调参方面,异方差测量误差下利用Legendre多项式基达到最优极小化速率;实数域小波密度估计在极弱尾部假设下实现L1 minimax;高频数据截断阈值的随机不动点迭代为半参数调参提供了自动化机制。
高维与检验主线共同推进了信息论极限与推断可行性的刻画。高维随机矩阵方面,线性谱统计量之差的CLT放宽了对角化与矩条件并证明渐近独立;稀疏线性模型在重加权损失下突破了自适应置信椭球不可能性;实Ginibre矩阵与过参数化时间序列分别刻画了最小特征值间距律与泛化风险的相干性界;离散图形模型的贝叶斯选择一致性扩展至不可分解图。假设检验方面,高维变点检测精确定位了稀疏均值偏移的检测边界与相变点;KSD拟合优度检验引入谱正则化达到minimax分离速率;偏联合多重检验通过风险率不等式构建两步筛选降保守性;差分隐私下LR检验的大偏差展开显式量化了隐私的样本代价;优先依附图模型证明了晚期变点在无标号下的不可检测性。
与因果推断、半参数效率及高维推断最贴的论文适合优先看:高维主线中,自适应置信椭球与线性谱统计量之差CLT直接触及高维推断可行性与渐近效率;非参数主线中,局部依赖随机图的非渐近正态逼近、截断阈值的随机不动点迭代、以及条件分布灵敏度与Azadkia–Chatterjee系数的依赖度量推广,为半参数效率下的依赖结构处理与调参自动化提供了新工具;检验主线中,高维变点检测的相变边界与KSD拟合优度的minimax速率,深化了高维假设检验的信息论极限理解。
因果推断 (causal_inference, 1 篇)¶
1. 10.3150/25-bej1873 · arXiv — Faithlessness in Gaussian graphical models¶
- 作者: Mathias Drton, Leonard Henckel, Benjamin Hollering, Pratik Misra
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 在 DAG 模型与一个额外条件独立(CI)关系的设定下,研究 CI implication 问题何时具有图论表征;目标是在 Gaussian 情形下判定由 DAG 推导的 CI 加上一条额外 CI 是否蕴含另一条 CI,关键假设为 Gaussian 分布与 DAG 结构。核心机制利用代数几何/多项式代数技术,将 CI 蕴含问题转化为偏相关系数多项式理想的包含关系,给出完全的图论判定准则;进一步针对 causal discovery 中 strong faithfulness 假设的违反问题,将精确蕴含推广为近似蕴含:判定一个额外偏相关系数的微小是否必然导致另一偏相关系数的微小,并给出图论解。主要理论结果为 Gaussian DAG+1-CI 蕴含的完整代数-图论刻画及近似蕴含的图论条件;对您可能有用:该近似蕴含结果直接量化了 strong faithfulness 失败的图论结构,为 causal discovery 算法的有限样本保证提供了更精细的图论诊断工具。
- 关键技术:
conditional independence implication,DAG model,Gaussian graphical model,algebraic geometry / polynomial ideals,partial correlation,strong faithfulness - 为什么对您有用: 直接连接 causal inference 的 identification 与 faithfulness 假设子方向,为 causal discovery 算法(如 PC 算法)的 strong faithfulness 有限样本保证提供了图论-代数的精细刻画。可用 very_familiar 的高维渐近理论或 moderately_familiar 的 identification theory 来分析该近似蕴含在有限样本下的偏相关系数估计误差如何传播,验证其图论条件在数据下的 robustness。立即可做:用 very_familiar 的高维渐近/偏相关估计理论,将本文的近似蕴含图论条件与有限样本偏相关检验的 Type-I/II error 联系起来,推导更实用的 faithfulness failure 概率界。
高维统计 / 随机矩阵 (high_dim_rmt, 6 篇)¶
1. 10.3150/25-bej1872 · arXiv — A CLT for the difference of eigenvalue statistics of sample covariance matrices¶
- 作者: Nina Dörnemann, Holger Dette
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 9/10 · novelty:
weaker_assumption - 摘要: 在高维设定(维度与样本量同阶增长)下,本文研究样本协方差矩阵的线性谱统计量(LSS)与删去一行一列后所得子矩阵的 LSS 之差的中心极限定理。目标 estimand 为两个 LSS 差值的渐近分布,关键假设放宽了以往文献对总体协方差矩阵对角化的要求及对所有阶矩存在的条件。核心方法基于随机矩阵论中 LSS 的渐近理论,通过精细调整现有证明策略来处理差值型统计量的均值与协方差结构计算,并利用留一(leave-one-out)技巧刻画子矩阵与原矩阵谱统计量的关联。理论结果证明了该差值型谱统计量与原样本协方差矩阵的常规 LSS 渐近独立,且在非对角总体协方差与有限矩条件下成立。对您可能有用:该差值型 LSS 及其与原 LSS 的渐近独立性可直接用于构造高维协方差结构推断的两步检验,与您 high-dimensional asymptotics 及 hypothesis testing 的 primary interest 紧密相连。
- 关键技术:
linear spectral statistic,leave-one-out matrix,central limit theorem,high-dimensional asymptotics,asymptotic independence - 为什么对您有用: 直接连接您 primary interest 中的 high-dimensional statistics (Random matrix theory) 与 hypothesis testing:差值型 LSS 提供了无需对角化假设和全阶矩的高维谱统计量推断新工具,可用于构造检验协方差矩阵特定结构的两步法。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来验证和拓展该 CLT 在更复杂谱统计量(如 U-statistic 型谱泛函)下的适用性。立即可做:用 very_familiar 的高维渐近工具复现并尝试将差值型 LSS 推广到更高阶谱泛函或联合检验场景。
2. 10.3150/25-bej1863 · arXiv — On adaptive confidence ellipsoids for sparse high-dimensional linear models¶
- 作者: Xiaoyang Xie
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 本文研究稀疏高维线性模型中全参数向量的自适应置信椭球构建问题。传统上已知,在没有额外结构假设时,构建自适应置信集是不可能的。作者提出在重新加权损失函数(re-weighted loss functions)的框架下,自适应置信椭球的存在成为可能。论文给出了权重函数需满足的必要且充分条件,并证明了当条件成立时,可构造出速率最优(rate-optimal)的置信椭球。在可行区域(feasible regime)内,作者显式构造了一个具体的最优程序。该工作为高维稀疏模型的推断提供了新的理论可能性,与您在高维统计和假设检验方向的兴趣(特别是高维推断的可实现性)高度相关。
- 关键技术:
re-weighted loss functions,adaptive confidence sets,sparse high-dimensional linear models,rate-optimal procedure,necessary and sufficient conditions - 为什么对您有用: 本文直接命中您的主要兴趣子方向——高维稀疏模型中的统计推断。您熟悉的 high-dimensional asymptotics 武器可直接用于解析其权重条件的渐近行为,从而判断该可行区域在实际中是否可操作。立即可做:利用您已有的高维渐近工具,可以检验该文所给条件在常见稀疏模型(如 Lasso 后推断)中的适用性。
3. 10.3150/25-bej1860 · arXiv — Smallest gaps between eigenvalues of real Gaussian matrices¶
- 作者: Patrick Lopatto, Matthew Meeker
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究 \(n \times n\) 实高斯随机矩阵(Ginibre ensemble)复特征值之间最小间距的渐近分布。设定为实 Ginibre 矩阵,其复特征值在平面上非独立且具有实-复特征值对的特殊结构,regularity 假设继承自该矩阵的已知谱性质。核心机制是利用 Coulomb gas / point process 的关联函数与间隙概率(gap probability)方法,结合实 Ginibre 矩阵复特征值的联合密度精确表达式,推导最小间距的极限律。主要理论结果给出了最小复特征值间距在 \(n \to \infty\) 时的精确渐近分布(类似 Poisson 点过程间隙律的修正形式),填补了实 Ginibre 矩阵在间隙统计上的空白。对您可能有用:此结果为 RMT 间隙统计提供了实矩阵的新精确律,可与复 Ginibre 的经典结果做对比,拓展您对高维谱微观结构的理解。
- 关键技术:
real Ginibre ensemble,eigenvalue gap distribution,Coulomb gas joint density,gap probability / spacing statistics,point process correlation functions - 为什么对您有用: 本文直接属于您 primary interest 中的高维统计与随机矩阵理论(RMT)子方向,聚焦谱微观结构的间隙分布。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来理解本文的渐近设定与证明框架,但精确间隙概率的计算涉及实 Ginibre 矩阵特有的实-复特征值对联合密度技巧,属于 moderately_familiar。Follow-up 判断:中期可做——若想在此方向做理论延伸(如最小间距的极值统计或与复 Ginibre 的 rate 对比),需先在 moderately_familiar 的实 Ginibre 联合密度与间隙概率计算上长肌肉。
4. 10.3150/25-bej1877 · arXiv — Benign overfitting in time-series linear models with over-parameterization¶
- 作者: Shogo Nakakita, Masaaki Imaizumi
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 6/10 · novelty:
application - 摘要: 本文研究过参数化线性回归在时间序列依赖数据下的良性过拟合(benign overfitting)问题。设定为依赖的平稳时间序列,协变量为高维且不假设稀疏性,模型采用内插估计量(interpolation estimator)实现训练误差为零。核心贡献是导出了该估计量的非渐近风险上界,证明了风险受时间协方差矩阵的相干性(coherence)控制,具体表现为不同时间步协方差矩阵乘积的谱范数。文章通过若干依赖过程(如 AR、MA)验证了风险界的收敛速率,表明相干性决定了泛化性能的衰减速度。对您而言,本文连接了高维统计中的随机矩阵理论与时间序列依赖结构,扩展了经典 i.i.d. 下 benign overfitting 条件的适用范围。
- 关键技术:
benign overfitting,interpolation estimator,non-asymptotic risk bound,temporal covariance coherence,spectral analysis of covariance matrices - 为什么对您有用: 本文连接您高维统计兴趣中依赖数据的场景,将随机矩阵理论中常用的谱分析方法推广到时间序列协方差结构。您的 very_familiar 武器库包含 high-dimensional asymptotics,可用于理解其风险界;但时间序列依赖的谱分析需要额外掌握 mixing 条件和协方差算子谱特征,属中期可做任务,需补充时间序列谱分析技术。
5. 10.3150/25-bej1856 — Bayesian model selection consistency for high-dimensional discrete graphical models¶
- 作者: Lyndsay Roach, Hélène Massam, Nanwei Wang, Xin Gao
- 期刊/来源: Bernoulli
- 机构: York University · University of New Brunswick
- 分类: vol 32 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 研究高维离散图形模型的贝叶斯模型选择一致性问题。数据以列联表形式给出,N个对象按q个随机变量分类,假设单元格计数服从多项分布,对单元格概率参数施加超Dirichlet先验。主要问题是当维度q随样本量N增长时,贝叶斯因子能否一致地选择真实条件独立结构。证明在真实图可分解时,贝叶斯因子具有强模型选择一致性;当真实图不可分解时,贝叶斯因子一致地选择真实图的最小三角剖分(最少填充边)。理论推导依赖于超Dirichlet先验的共轭性和图形分解性质,利用了高维渐近分析中的Laplace近似和奇异性处理。结果扩展了此前仅适用于可分解图或固定维度的文献,为高维离散图形模型选择提供了理论保证。对您的主要兴趣(高维统计中的模型选择一致性)直接相关,其渐近一致性证明可借助武器库中的高维渐近工具进行核查。
- 关键技术:
Bayes factor,hyper Dirichlet prior,strong model selection consistency,decomposable graph,minimal triangulation,high-dimensional asymptotics - 为什么对您有用: 连接到高维统计中的图形模型选择问题,与您的主要兴趣中的高维渐近分析直接相关。武器库中very_familiar的高维渐近工具可用于理解其一致性证明的推导思路,但贝叶斯方法(超Dirichlet先验、贝叶斯因子)不在当前熟悉列表中,需要先补充贝叶斯图形模型知识,属于中期可做。
6. 10.3150/25-bej1896 — On Ole E. Barndorff-Nielsen’s contributions to classical and free infinite divisibility and Lévy processes¶
- 作者: Victor Pérez-Abreu, Steen Thorbjørnsen
- 期刊/来源: Bernoulli
- 机构: Universidad de Guanajuato · Aarhus University
- 分类: vol 32 · issue 1
- 相关性 1/10 · novelty:
survey - 摘要: 本文综述了Ole E. Barndorff-Nielsen在经典无限可分性和自由无限可分性以及Lévy过程方面的理论贡献。重点阐述了他对两类无限可分性之间内在关联的深刻理解,并展示了这一视角如何催生新的具体例子和分布族。经典无限可分性涉及Lévy-Khintchine表示和稳定分布,而自由无限可分性则与自由概率中的Voiculescu变换和自由稳定分布相关。Barndorff-Nielsen的工作统一了这两条主线,提出并研究了多种参数化分布族。文章以综述形式呈现,不包含新的理论或方法结果。如果您对随机矩阵理论中的自由概率工具感兴趣,这篇综述可作为理解自由无限可分性背景的入门材料。
- 关键技术:
infinite divisibility,free probability,Lévy processes,Lévy-Khintchine representation,free infinite divisibility,Voiculescu transform - 为什么对您有用: 本文连接了您对随机矩阵理论(自由概率作为核心工具)的兴趣,Barndorff-Nielsen的工作为自由无限可分性提供了丰富的分布族,这与您的高维统计背景(包括random matrix theory)相关。作为综述,它适合入门阅读,但自由概率的深层技术(如SoS、低度数似然比)不在您当前的武器库中,因此目前属于暂不可做范畴——若未来需要深入学习自由概率,此文是合适起点。
非参数 / 半参数 (nonparam_semipara, 14 篇)¶
1. 10.3150/25-bej1871 · arXiv — Series ridge regression for spatial data on Rd¶
- 作者: Daisuke Kurisu, Yasumasa Matsuda
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 8/10 · novelty:
new_theory - 摘要: 在 Rd 上不规则空间采样区域 Rn 的非参数回归与空间趋势回归设定下,研究 L2-penalized series estimator(ridge regression)的渐近理论。采样设计兼容纯 increasing domain 与混合 increasing domain 框架,协变量允许空间依赖。核心结果为:对一般 series estimator 建立了 uniform 与 L2 收敛速率及多元 CLT;证明 spline 与 wavelet series 在该空间依赖结构下可达最优 uniform/L2 minimax rate,并给出置信区间构造方案。依赖条件覆盖 Lévy-driven CARMA 等宽类随机场。对您有用:该文将 sieve/series 估计的 semiparametric 理论拓展至空间依赖数据,其 penalized series 与 uniform CLT 的技术路线可直接借鉴到您关注的 semiparametric efficiency 与 nonparametric 理论子方向。
- 关键技术:
series estimation,L2-penalized ridge regression,spatial increasing domain asymptotics,uniform convergence rate,spline and wavelet minimax rate,spatial CLT - 为什么对您有用: 直接连接到 semiparametric & nonparametric theory 子方向:本文在空间依赖设定下给出了 sieve/series estimator 的 uniform 与 L2 minimax rate 及 CLT,这是您熟悉的 nonparametric minimax bound 工具可直接验证的 sharper rate 场景。用您 very_familiar 的 minimax bounds for estimation problems 可立刻审视其 spline/wavelet 最优速率声明的紧性;其 penalized series 的 CLT 推导涉及 M-estimation 与 empirical process 工具,与您 moderately_familiar 的 M-estimation theory 对接。Follow-up 判断:立即可做——用 very_familiar 的 minimax 与 nonparametric statistics 武器即可复现/审视其速率声明,并可将该 penalized series + 空间 CLT 路线迁移到您因果推断中 spatial confounding / spatial trend 的 identification 场景。
2. 10.3150/25-bej1874 — Nonparametric curve estimation in measurement error problems with conditionally heteroscedastic variances¶
- 作者: Aurore Delaigle, Alexander Meister, Jiyang Zhang
- 期刊/来源: Bernoulli
- 机构: The University of Melbourne · University of Rostock
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究条件异方差测量误差模型中的非参数密度估计问题:潜在变量X的密度f_X需从含加性误差的重复观测中恢复,且误差方差依赖于X。传统傅里叶反卷积因误差与X相关而失效,作者改用Legendre多项式基展开,将展开系数表达为观测数据矩的可逆线性方程组,从而构造f_X的非参数估计量。在误差服从条件高斯分布时,该估计量达到最优极小化收敛速率(与同类问题中已知下界匹配)。为实际应用,论文提出了数据驱动的截断参数选择方法和支撑上界估计程序,并在模拟和NHANES营养调查数据上展示了良好有限样本表现。此外,该方法可推广至误差变量回归和方差函数估计。该工作与您非常熟悉的非参数统计和逆问题方法直接相关(Legendre基矩方法属于逆问题正则化策略),且其收敛速率分析可沿用您擅长的极小化界工具进行验证或扩展。
- 关键技术:
Legendre polynomial basis,minimax convergence rates,moment-based estimation,data-driven truncation parameter selection,errors-in-variables regression - 为什么对您有用: 本文属于非参数逆问题的新设定(条件异方差测量误差),与您的首要兴趣‘非参数统计与极小化界’直接对应。您非常熟悉的‘inverse problems with random noise’和‘minimax bounds’可立即用于复现和扩展其理论(例如验证速率是否紧、推广到其他基函数)。近期即可动手:其矩方法的思想也可启发高维U统计量中的对称化技巧。
3. 10.3150/25-bej1861 — Non-linear wavelet density estimation on the real line¶
- 作者: Mathieu Sart
- 期刊/来源: Bernoulli
- 机构: Institut National des Sciences Appliquées de Lyon · Université Jean Monnet · Université Claude Bernard Lyon 1 · Institut Camille Jordan · Centre National de la Recherche Scientifique
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 在实数域 ℝ 上研究基于 L1 损失的最优密度估计问题,目标密度满足光滑且尾部占优(dominated tails)假设,该假设极弱,允许处理奇点、空间非均匀光滑度及重尾分布。作者提出一种在小波展开中选取重要系数的新机制,构造了非线性小波密度估计量。在所设条件下,该估计量在 L1 损失下达到 minimax 收敛速率,且因弱假设覆盖了重尾与奇点情形,其适用范围显著宽于传统要求一致有界或全局光滑的估计框架。对您可能有用:此弱假设下的 minimax 速率与系数选择策略,可为 semiparametric 模型中 nuisance density 的稳健估计提供新思路。
- 关键技术:
nonlinear wavelet thresholding,L1 minimax rate,dominated tail condition,spatially inhomogeneous smoothness,coefficient selection rule - 为什么对您有用: 本文直接连接到非参数理论子方向,在极弱的尾部假设下建立 L1 minimax 速率,突破了传统一致有界限制。用您 very_familiar 的 minimax bounds 工具可直接验证其速率紧性,属于立即可做。若后续需在 semiparametric 模型中处理重尾 nuisance density,此系数选择机制可作为稳健估计的切入点。
4. 10.3150/25-bej1868 — Concentration inequalities for classical and smoothed empirical processes of independent and dependent random variables¶
- 作者: Eric Beutner, Henryk Zähle
- 期刊/来源: Bernoulli
- 机构: Vrije Universiteit Amsterdam · Saarland University
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究经典经验过程与光滑经验过程的浓度不等式,目标是在独立同分布和相依(线性过程)设定下,建立比现有结果更精确的指数型上界。对 i.i.d. 情形,作者证明 Massart 关于 Dvoretzky–Kiefer–Wolfowitz 不等式的改进可以推广到一致有界变差函数类索引的经验过程,而经典的 Talagrand 不等式不能直接得到该结果。进一步,他们证明 Massart 指数界及其推广版本在光滑经验过程中同样成立,为核密度估计等平滑方法提供了新的统概率工具。对线性相依过程,利用近期关于经典经验过程的浓度不等式,首次得到了相依随机变量的光滑经验过程的浓度不等式。这些结果直接服务于非参数估计的收敛速度分析、同时置信带构造以及假设检验的临界值控制。对您而言,该工作提供了更锐化的经验过程工具,可与您非常熟悉的非参数统计和极小极大界理论直接对接,用于改进因果推断中高维非参数估计的有限样本性质。
- 关键技术:
Empirical process,Dvoretzky–Kiefer–Wolfowitz inequality,Talagrand inequality,Function classes of bounded variation,Smoothed empirical process,Concentration inequalities for dependent data - 为什么对您有用: 直接关联非参数统计这一非常熟悉领域:论文给出了对有界变差函数类经验过程的改进型浓度界,是经典 DKW 不等式的泛化,可立即用于非参数估计的 sup-范数收敛速度分析或同时置信带构造。技术兵器的 nonparametric statistics 项足以消化全文,并可将新不等式引入因果推断中高维倾向得分或结果回归的均匀误差控制问题。Follow-up 粗判:立即可做——不等式形式明确,条件清晰,无需额外背景知识即可评估其在已有非参数率问题中的直接应用。
5. 10.3150/25-bej1866 · arXiv — Azadkia–Chatterjee’s dependence coefficient for infinite dimensional data¶
- 作者: Siegfried Hörmann, Daniel Strenger
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 本文在一般度量空间(特别是函数型数据)中扩展了 Azadkia-Chatterjee 依赖系数,用于衡量标量响应 Y 与无穷维协变量 X 之间的依赖强度。总体定义扩展虽然直接,但估计量的渐近分析因无穷维样本的最近邻结构而变得复杂,这是文献中未处理过的问题。论文深入剖析了这一复杂性,提出了基于最近邻图的估计策略,并建立了估计量的渐近性质。关键技术包括度量空间中的最近邻理论、图论方法以及经验过程工具。结果表明该方法在函数型数据上表现良好,并对其他基于图的依赖度量方法具有启示意义。对您有用:该工作直接关联非参数统计与高维/函数型数据,您熟悉的非参数统计工具可迅速理解核心论证,且其最近邻图结构可与高阶 U 统计量的树宽分析相结合。
- 关键技术:
Azadkia-Chatterjee coefficient,nearest neighbor graph,metric space,infinite-dimensional data,graph-based dependence measure,functional data analysis - 为什么对您有用: 该工作扩展了非参数依赖度量至无穷维设定,属于您主要兴趣中的非参数统计与假设检验方向。您技术武库中“非参数统计”非常熟悉,可立即理解其最近邻方法和渐近论证;同时,其估计量涉及最近邻图结构,可能对应某种 U 统计量形式,可利用您“高阶 U 统计量树宽”视角分析计算成本。follow-up 粗判:立即可做,无需额外学习即可深入阅读全文并评估理论。
6. 10.3150/25-bej1854 · arXiv — Quantifying and estimating dependence via sensitivity of conditional distributions¶
- 作者: Jonathan Ansari, Patrick B. Langthaler, Sebastian Fuchs, Wolfgang Trutschnig
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 本文提出一族基于条件分布灵敏度(sensitivity of conditional distributions)的依赖度量 Λ_φ,通过比较给定 X=x 下 Y 的条件分布与 Y 的边缘分布之间的差异来量化 X 与 Y 的关联强度,取值在 [0,1] 中,0 对应独立,1 对应 Y 是 X 的函数。该方法将 Chatterjee 相关系数作为特例纳入统一框架(φ 为凸函数),并推广到结合 copula 的 L^p 版本。在连续型 (X,Y) 设定下,给出了 Λ_φ 的强相合估计量(无需分布假定),并通过模拟和真实数据展示了估计表现。此外,通过轻微修改构造可定义新的可解释性度量,推广了已解释方差的比例。本研究属于非参数依赖性度量的方法拓展,与您‘非参数统计’和‘假设检验’方向高度相关,其估计量的相合性证明可直接借鉴在因果推断中检验 treatment 与 outcome 是否条件独立的场景。
- 关键技术:
conditional distribution sensitivity,Chatterjee's coefficient,convex function induced measure,copula,strong consistency,L^p version - 为什么对您有用: 本文直接对应您的‘非参数统计’兴趣(very_familiar 中的第一项),其依赖度量的构造和强相合估计方法可以迁移至因果推断中的独立性检验或敏感性分析(如检验负对照变量是否满足独立假设)。基于您非常熟悉的非参数理论即可理解并评估该方法在您研究问题中的适用性,属于‘立即可做’的延伸。
7. 10.3150/25-bej1864 · arXiv — Consistency of the oblique decision tree and its boosting and random forest¶
- 作者: Haoran Zhan, Yu Liu, Yingcun Xia
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 5/10 · novelty:
weaker_assumption - 摘要: 在非参数回归设定下,目标是证明斜决策树(ODT)及其衍生集成方法对一般回归函数的一致性,仅要求回归函数 L² 可积,远弱于传统 CART 所需的严格假设。核心机制在于 ODT 以特征的线性组合作为分割变量,降低了分区复杂度;作者先证明 ODT 本身的一致性,再推广至基于 ODT 的随机森林(ODRF,无论是否完全生长),最后借用正交匹配追踪(OMP)技术构造回归梯度提升树集成并证明其在温和树结构条件下的一致性。理论结果将一致性门槛从强光滑性假设降至 L² 可积,实证显示新方法优于传统 RF。对您研究非参数理论与 M-estimation 一致性有直接参考价值。
- 关键技术:
oblique decision tree,L2 integrability consistency,orthogonal matching pursuit boosting,random forest consistency,nonparametric regression - 为什么对您有用: 直接连接非参数理论子方向:将树方法的一致性假设从强光滑性降至 L² 可积,属于 weaker_assumption 类推进。用您 very_familiar 的 minimax bounds for estimation problems 可审视其 L² 可积条件下收敛率是否已达 minimax 最优,或用 moderately_familiar 的 M-estimation theory 检查其 OMP-boosting 的 M-estimator 收敛论证细节。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格评估其提升树一致性的理论缺口。
8. 10.3150/25-bej1876 · arXiv — Asymptotic breakdown point analysis for a general class of minimum divergence estimators¶
- 作者: Subhrajyoty Roy, Abir Sarkar, Abhik Ghosh, Ayanendranath Basu
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 在独立同分布参数模型下,本文研究最小 S-divergence 估计量(含最小 DPD 估计量)的渐近崩溃点(asymptotic breakdown point)。核心 estimand 为参数 θ 的 robust estimator,关键假设为 S-divergence 族定义及模型密度可分性条件。作者推导出该类估计量渐近崩溃点的下界,并证明该下界不依赖于数据维度 p。技术工具涉及 divergence measure 的代数性质、M-estimation 理论与崩溃点定义的极限分析。主要理论结果为:在高维设定下,最小 S-divergence 估计量仍保持维度无关的崩溃点下界,从理论上支撑了其在高维 robust inference 中的适用性。对您可能有用:该维度无关的崩溃点下界为高维 robust M-estimation 提供了新的理论视角,可与您的高维渐近理论及 M-estimation 理论工具结合。
- 关键技术:
minimum S-divergence estimator,density power divergence (DPD),asymptotic breakdown point,robust M-estimation,dimension-independent lower bound - 为什么对您有用: 本文直接连接到高维统计与 M-estimation 理论:证明了最小 S-divergence 估计量的渐近崩溃点下界不依赖于维度 p,为高维 robust inference 提供了理论支撑。您武器库中 moderately_familiar 的 M-estimation 理论可直接用来审视其崩溃点下界的紧性,或将其与高维渐近理论结合分析有限样本表现。中期可做:需先在 moderately_familiar 的 M-estimation 理论上长肌肉,特别是崩溃点与影响函数在高维 M-estimator 中的交互机制,才能评估该下界在具体高维模型中的实际效用。
9. 10.3150/25-bej1878 · arXiv — Total variation bound for Hadwiger’s functional using Stein’s method¶
- 作者: Valentin Garino, Ivan Nourdin
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 在 \(\mathbb{R}^d\) 凸体 \(K\) 的 Hadwiger-Wills 密度 \(\mu_K(x)=ce^{-\pi \text{dist}^2(x,K)}\) 设定下,目标是研究信息含量 \(H_K=\text{dist}^2(X_K,K)\) 在维度 \(d\to\infty\) 时的波动规律。作者结合 Stein's method 与 Brascamp-Lieb 不等式,构造了 \(H_K\) 与其 Gauss 对应量之间的 total variation 距离的显式上界。该 bound 随维度 \(d\) 增大而衰减,从而证明了 \(H_K\) 的高维正态逼近精度。核心工具是 Stein 方程的解界控制与 Brascamp-Lieb 的 log-concave 密度方差不等式,属于高维概率极限理论的经典路线。对您有用:本文展示了 Stein's method 在非标准几何测度泛函上的显式 TV bound 技术路线,可作为高维渐近理论工具库的补充参考。
- 关键技术:
Stein's method,Brascamp-Lieb inequality,total variation distance bound,Hadwiger-Wills functional,high-dimensional normal approximation,log-concave density - 为什么对您有用: 本文属于高维概率极限理论,与您 primary interest 中的 high-dimensional statistics / mathematical statistics 相邻,但核心 estimand(凸体距离泛函的正态逼近)不在您常规的因果/半参/效率框架内。您武器库中 minimax bounds 与 high-dimensional asymptotics 可直接读懂其渐近分析部分,但 Stein's method 的显式构造与 Brascamp-Lieb 不等式细节需额外长肌肉。中期可做:若想将 Stein's method 引入您自己的 higher-order U-statistics 或 HOIF 的分布逼近问题,需先在 moderately_familiar 的 higher-order U-statistics 理论上补充 Stein 方程解界技术。
10. 10.3150/25-bej1865 · arXiv — Balancing the edge effect and dimension of spectral spatial statistics under irregular sampling with applications to isotropy testing¶
- 作者: Theresa Eckle, Anne van Delft, Holger Dette
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 4/10 · novelty:
new_theory - 摘要: 在 Rd 上不规则采样随机场的设定下,研究谱空间统计量的分布性质,目标是基于最小 L2 距离构造各向同性(isotropy)检验。核心 estimand 是谱密度与其各向同性最佳逼近之间的最小 L2 距离,由谱密度的特定积分显式表达。经典谱估计量在 d>1 时受边缘效应(edge effect)偏差影响严重,偏差随维度 d 增大至使极限分布退化;本文对一类积分谱统计量提出 tapering 修正,在 d≤3 时显著削减偏差并保证渐近正态极限,且证明 tapering 函数需足够光滑。在 mixed increasing domain 框架下证明了检验统计量的渐近正态性,由此得到水平 α 检验,并在全域(而非有限空间点/有限 Fourier 频率)上完成各向同性检验。对您可能有用:本文处理的高维非参数谱估计偏差修正与渐近理论,与您在非参数统计和 minimax bound 方向的武器库直接相关。
- 关键技术:
spectral density estimation,minimum L2-distance isotropy test,tapering bias correction,mixed increasing domain asymptotics,integrated spectral statistics - 为什么对您有用: 本文连接到非参数统计与假设检验子方向,核心是高维(d≤3)空间谱估计的边缘偏差修正与渐近正态性,属于非参数 M-estimation 理论的具体场景。您武器库中 very_familiar 的 minimax bounds 与 nonparametric statistics 可直接用来审视本文 tapering 修正声称的偏差削减率是否达到 minimax 最优,moderately_familiar 的 M-estimation theory 可支撑对其渐近正态证明的细读。Follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉(特别是混合渐近框架下的 tapering M-estimator 理论),才能将本文的偏差修正与 minimax rate 做严格对比。
11. 10.3150/25-bej1852 · arXiv — Rates of convergence and normal approximations for estimators of local dependence random graph models¶
- 作者: Jonathan R. Stewart
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 4/10 · novelty:
new_theory - 摘要: 在局部依赖随机图模型(local dependence random graph model)框架下,目标是基于单次网络观测对块参数向量进行估计与推断,允许参数个数与块规模同时趋于无穷。作者首先推导了 MLE 的 ℓ₂-误差非渐近界,给出了收敛速率并刻画了达到 minimax optimal 的条件。核心贡献是利用 Stein 方法或类似概率工具,建立了参数向量多变量正态逼近的非渐近误差界,从而首次为该类模型提供了同时具备最优收敛速率与有效推断的理论保证。对您可能有用:该文的非渐近正态逼近与 minimax 收敛率分析思路,可迁移至高维/半参数因果推断中依赖结构数据的效率理论研究。
- 关键技术:
local dependence random graph model,non-asymptotic ℓ₂-error bound,minimax optimal convergence rate,multivariate normal approximation,maximum likelihood estimation under increasing dimension - 为什么对您有用: 本文连接到半参数/非参数理论中的 minimax rate 与非渐近正态逼近子方向;您武器库中 minimax bounds for estimation problems 与 high-dimensional asymptotics 可直接攻其收敛率最优性条件是否紧的口子。推断部分的多变量正态逼近非渐近界可能需要 Stein 方法等概率工具,您目前武器库未显式包含此工具,属于中期可做——需先在 moderately_familiar 的 M-estimation theory 之外补充 Stein 方法/耦合技术的肌肉。
12. 10.3150/25-bej1862 · arXiv — Fourier analysis of spatial point processes¶
- 作者: Junho Yang, Yongtao Guan
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 在二阶平稳空间点过程设定下,本文目标是利用离散傅里叶变换(DFT)及其 tapered 版本对谱密度(即二阶结构)进行频域估计与推断。核心机制是证明 DFT 与 tapered DFT 在共享极限频率时仍渐近联合独立且服从正态分布,从而为 tapered DFT 的二次型统计量建立 α-mixing 中心极限定理。基于此,作者推导了核谱密度估计量的渐近分布,并为参数化平稳点过程建立了频域推断方法;所得参数估计量计算可行,且在模型误设下仍具可解释的拟似然意义。模拟验证了正确设定与误设情形下的有限样本表现。对您可能有用:频域二次型统计量的 CLT 与谱密度估计理论,为非参数/半参数二阶结构推断提供了新工具。
- 关键技术:
discrete Fourier transform (DFT),tapered DFT,α-mixing central limit theorem,kernel spectral density estimator,frequency domain quasi-likelihood,second-order stationarity - 为什么对您有用: 本文属于非参数/半参数理论方向,聚焦空间点过程的频域推断,其核心是二次型统计量的渐近理论。您武器库中 very_familiar 的 minimax bounds 与 nonparametric statistics 可直接审视其谱密度估计的收敛率是否可达 minimax 下界;moderately_familiar 的 M-estimation theory 可分析其拟似然推断在误设下的性质。二次型统计量的结构与您熟悉的 higher-order U-statistics 有形式上的相似性,但本文基于频域与 α-mixing,而非经典 U-statistic 投影。Follow-up 判断:中期可做——若想将频域二次型与 higher-order U-statistic 的 tensor contraction 视角桥接,需先在 moderately_familiar 的 higher-order U-statistics 理论上长肌肉,明确频域二次型是否可嵌入 U-statistic 框架并用 einsum 复杂度刻画计算成本。
13. 10.3150/25-bej1853 · arXiv — Markov properties of Gaussian random fields on compact metric graphs¶
- 作者: David Bolin, Alexandre B. Simas, Jonas Wallin
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 本文研究紧致度量图(compact metric graph)上两类 Gauss 场的 Markov 性质:基于图上等距协方差函数定义的各向同性场,以及由分数阶微分方程 L^{α/2}(τu)=W 定义的一般化 Whittle–Matérn 场(其中 L=κ²−∇(a∇),W 为 Gauss 白噪声)。首先证明在一般度量图上不存在既各向同性又具 Markov 性的 Gauss 场;其次证明 Whittle–Matérn 场当 α∈N 时为 Markov 场,且在 a、κ 为常数时 Markov 性蕴含 α∈N。进一步,当 α∈N 时该场为 α阶 Markov,即区域 S 内的 u 与 Γ∖S 中的 u 在给定 ∂S 上 u 及其 α−1 阶导数后条件独立。作为推论,Markov 性导致固定边 e 上 u 的条件分布仅依赖两端顶点值而与图几何无关;且 L^{1/2} 解可通过在顶点处施加连续性条件,由各边独立 Neumann 边界 α=1 过程拼合获得。对您有用:若未来在因果推断或逆问题中遇到图结构上的 Gauss 过程建模(如网络干预的潜在结果),本文的 Markov–SPDE 对偶与条件独立刻画提供了精确的 semiparametric 框架。
- 关键技术:
Whittle-Matern fields on metric graphs,Markov property of Gaussian fields,fractional-order SPDE approach,isotropic covariance on graphs,conditional independence characterization - 为什么对您有用: 本文属于非参数/半参数 Gauss 过程理论在图结构上的基础工作,直接连接到 nonparametric statistics 与 inverse problems with random noise 两个武器库项。用 very_familiar 的 inverse-problem 视角可以审视 SPDE L^{α/2} 的谱结构与白噪声逆问题;用 moderately_familiar 的 M-estimation theory 可以探索图上 Whittle–Matérn 参数 (κ, a, α) 的估计效率。Follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是图上 Gauss 场的 efficient influence function 计算),才能切入参数估计的效率界问题。
14. 10.3150/25-bej1867 · arXiv — Data-driven fixed-point tuning for truncated realized variations¶
- 作者: B. Cooper Boniece, José E. Figueroa-López, Yuchen Han
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 2/10 · novelty:
new_method - 摘要: 在带跳半鞅的高频金融数据设定下,目标是估计积分波动率,核心难点在于 truncated realized variation 中的截断阈值需满足渐近约束且实际选取常依赖启发式规则。本文提出基于随机不动点迭代的数据驱动截断阈值选取程序,仅需采样频率信息即可自动迭代收敛至合适阈值,无需人为调参。理论证明该方法可实现积分波动率的渐近有效估计,且有限样本表现优于现有常用方法。对您可能有用:该随机不动点迭代机制为半参数估计中依赖渐近约束的调参问题提供了自动化替代方案,可启发因果推断与半参数理论中类似 sieve/阈值选取的调参困境。
- 关键技术:
truncated realized variation,random fixed-point iteration,semimartingale with jumps,asymptotically efficient estimation,integrated volatility estimation,data-driven tuning - 为什么对您有用: 直接连接半参数理论中估计量依赖阈值/窗宽等调参的普遍痛点,随机不动点迭代为自动化选取提供了新机制。用 technical_arsenal 中 very_familiar 的 M-estimation 理论与 moderately_familiar 的半参数理论可分析该不动点迭代的收敛性与有效估计条件。立即可做:用 M-estimation 理论验证其不动点迭代的收敛保证,并探索将类似机制迁移到因果推断中 IPW/DR 估计量的带宽选取问题。
数理统计 / 假设检验 (hypothesis_testing, 6 篇)¶
1. 10.3150/25-bej1859 · arXiv — Minimax optimal goodness-of-fit testing with kernel Stein discrepancy¶
- 作者: Omar Hagrass, Bharath Sriperumbudur, Krishnakumar Balasubramanian
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
sharper_rate - 摘要: 在一般域上的 goodness-of-fit 检验设定下,目标是基于 kernelized Stein discrepancy (KSD) 构造 minimax 最优检验,分离度量为 χ²-divergence,替代假设空间由光滑参数 θ 刻画。本文提出 KSD 的算子论表示,统一了文献中针对不同域的 KSD 检验,并在此基础上引入谱正则化 (spectral regularization) 构造修正的 discrepancy。理论证明:正则化检验在广泛 θ 范围内达到 minimax 分离速率,而无正则化的 KSD 检验无法达到该速率;同时提出自适应检验,在未知参数下达到 minimax 最优(仅差对数因子)。数值实验验证了正则化检验在多种域上的优越性。对您有用:本文将谱正则化引入 KSD 检验以修复 minimax rate 缺陷,直接连接到 hypothesis testing 与 minimax bounds 这两个核心兴趣。
- 关键技术:
kernelized Stein discrepancy,spectral regularization,minimax separation rate,operator-theoretic representation,goodness-of-fit testing,χ²-divergence separation - 为什么对您有用: 本文直接推进 hypothesis testing 与 minimax bounds 两个 primary interest 子方向,核心贡献是证明无正则化 KSD 检验的 minimax suboptimality 并用谱正则化修复。您武器库中 minimax bounds for estimation problems 的经验可直接迁移到检验问题的分离速率分析,且 operator-theoretic representation 与 RKHS 的结合可能为 higher-order U-statistics 的 tensor contraction 视角提供新的算子论切入点。判断:立即可做——用 very_familiar 的 minimax 工具即可验证其分离速率的紧性,并探索谱正则化与 HOIF 的联系。
2. 10.3150/25-bej1858 · arXiv — A procedure for multiple testing of partial conjunction hypotheses based on a hazard rate inequality¶
- 作者: Thorsten Dickhaus, Ruth Heller, Anh-Tuan Hoang, Yosef Rinott
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 本文针对偏联合(partial conjunction)原假设的多重检验问题,提出了一种降低保守性的两步筛选过程CoFilter。标准做法直接对偏联合p值进行多重检验往往过于保守,作者建议先选出PC p值低于某一阈值的集合,再在该选集中应用条件PC p值进行FWER或FDR控制。条件PC p值的有效性依赖于一个关于次序统计量和阶的偏和的风险率序新型不等式,该不等式本身具有独立统计价值。在Fisher合并方法下,该条件检验被证明是有效的,并且作者给出了FDR控制过程在名义水平之下的充分条件。通过在克罗恩病多个全基因组关联研究(GWAS)中的应用,展示了CoFilter的实际检验力提升。对您而言,本文在多重检验的保守性改进方面提供了一个可操作的筛选+条件验证框架,直接连接您的假设检验研究方向。
- 关键技术:
Partial conjunction hypothesis,Multiple testing,Conditional testing after filtering (CoFilter),Hazard rate inequality,Family-wise error rate (FWER),False discovery rate (FDR) - 为什么对您有用: 本文属于多重假设检验这一你primary interest中的数学统计方向,直接关注如何提升偏联合检验的检验力。你的武器库中'高阶U统计量理论'可用于分析该检验的渐进有效性,同时'statistical computing'技能可复现其算法实现。中期可做:若在moderately_familiar的HOIF上积累更多,可将该筛选+条件检验思路推广至更一般的U统计量检验。
3. 10.3150/25-bej1879 · arXiv — Sharp phase transitions in high-dimensional changepoint detection¶
- 作者: Daniel Xiang, Chao Gao
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 6/10 · novelty:
new_theory - 摘要: 本文在高维变点检测背景下研究假设检验问题。给定一个 p×n 的独立高斯矩阵,目标是判断是否存在一个稀疏的非零行子集,这些行在某个共同位置发生均值偏移。设定假设:非零行比例稀疏,变点位置对所有非零行相同,且信号强度可变。在 n 和 p 趋于无穷的渐近框架下,作者刻画了该检验问题的信息论极限,即检测边界公式,该公式将参数空间分为可检测区域和不可检测区域。关键机制是推导出检测误差之和趋于零的充分必要条件,从而精确定位相位转变点。主要结果给出了检测边界的具体表达式,并证明在不可检测区域内任何检验都无法一致区分备择假设与原假设。该结果对您直接相关,因为它深化了高维假设检验中相位转变理论的理解,并可用于比较不同检测方法的渐近最优性。
- 关键技术:
high-dimensional changepoint detection,phase transition,detection boundary,sparse signal detection,minimax testing - 为什么对您有用: 本文属于高维假设检验中的相位转变问题,直接对应您 primary interests 中的 high-dimensional statistics 和 hypothesis testing。您非常熟悉的高维渐近理论与极小极大边界技术可以直接用于验证或扩展本文的检测边界到非高斯或更一般的变点结构。由于核心工具(高维渐近和 minimax 下界)已在您的武器库中,您可以立即着手将本文的边界结果与其他方法(如 CUSUM 或似然比检验)进行对比,或者推广到异质变点设定。
4. 10.3150/25-bej1906 — O. E. Barndorff-Nielsen’s approximate conditional inference¶
- 作者: Nancy Reid, Heather Battey
- 期刊/来源: Bernoulli
- 机构: University of Toronto · Imperial College London
- 分类: vol 32 · issue 1
- 相关性 6/10 · novelty:
survey - 摘要: Barndorff-Nielsen 对近似条件推断的三大贡献——p 近似、修正剖面似然函数和 r 近似——构成了经典统计推断理论的重要基石。p 近似提供了高维或小样本下条件分布的显式密度近似;修正剖面似然解决了剖面似然对有信息参数的偏差问题;r 近似则是对似然比统计量的高阶修正,在精确推断中具有广泛应用。本文系统梳理了这三项工作的数学推导、渐近性质及其在假设检验、区间估计中的应用,并讨论了其与现代似然推断方法的联系。对于从事数学统计与假设检验的研究者,这是一篇理解渐近近似理论从源头到现代发展的理想综述。尽管不涉及新方法或理论突破,但清晰整理了半个世纪以来该领域的核心成果,有助于在经典推断框架下定位后续研究。
- 关键技术:
p* approximation,modified profile likelihood,r* approximation,higher-order asymptotics,conditional inference,likelihood ratio test - 为什么对您有用: 直接关联 researcher 的 primary interest 中的数学统计与假设检验方向,特别是渐近近似理论。武器库中的 moderately_familiar 的 semiparametric theory 和 M-estimation theory 可以用来理解修正剖面似然的偏差修正逻辑。此为综述性文献,立即可做——仅需阅读,无需扩展工具。
5. 10.3150/24-bej1851 · arXiv — On the impossibility of detecting a late change-point in the preferential attachment random graph model¶
- 作者: Ibrahim Kaddouri, Zacharie Naulet, Élisabeth Gassiat
- 期刊/来源: Bernoulli
- 机构: Université Paris-Saclay
- 分类: vol 32 · issue 1
- 相关性 4/10 · novelty:
new_theory - 摘要: 在 preferential attachment 随机图模型下研究 late change-point detection,目标是在 attachment 参数从 δ₀ 变为 δ₁ 的变点 τ_n = n - Δ_n 处检验 H₀: 无变点 vs H₁: 有变点。核心设定区分了观测 unlabeled graph 与 labeled graph 两种信息结构。对 labeled graph,证明变点可检测当且仅当 Δ_n → ∞;对 unlabeled graph,证明当 Δ_n = o(n^{1/3}) 时变点不可检测,部分验证了 Bet et al. 关于 o(n^{1/2}) 不可检测的猜想。关键技术工具涉及随机图序列的似然比分析、图拓扑结构的信息论约束与局部极限理论。结果揭示了标签信息对检测能力的决定性影响,对您在 hypothesis testing 与高维结构设定下的检测边界分析有直接参考价值。
- 关键技术:
preferential attachment random graph,late change-point detection,unlabeled vs labeled graph observation,likelihood ratio analysis,impossibility of testing,local limit theory for random graphs - 为什么对您有用: 直接连接 hypothesis testing 子方向,具体处理随机图结构上的变点检测 impossibility boundary,与经典 minimax 检测边界问题同构但信息结构更复杂。可用 very_familiar 的 minimax bounds 工具审视其 o(n^{1/3}) 与猜想 o(n^{1/2}) 之间的 gap 是否可通过更精细的似然比界或 higher-order U-stat 技术收紧。中期可做:需先在 moderately_familiar 的随机图局部极限理论(preferential attachment 模型的度分布收敛)上长肌肉,才能跟进其似然比不可检测的证明细节。
6. 10.3150/25-bej1869 · arXiv — On the power of private likelihood-ratio tests for goodness-of-fit in frequency tables¶
- 作者: Mario Beraha, Emanuele Dolera, Stefano Favaro
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 在 \((\varepsilon,\delta)\)-差分隐私框架下,研究频率表拟合优度检验的私有似然比(LR)检验的大样本功效。目标 estimand 为检验功效,关键设定为对多项分布数据施加隐私扰动后的 LR 统计量。核心机制通过 Bahadur-Rao 大偏差展开分析私有 LR 检验的功效,提取出一个由样本量 \(n\)、表维度 \(k\) 与 \((\varepsilon,\delta)\) 决定的关键量来刻画功效损失;同时发展了一项新的 iid 随机向量之和的精确大偏差原理(sharp LDP)。主要理论结果确定了差分隐私的样本代价:为恢复无扰动下多项 LR 检验同等功效所需的额外样本量,并显式揭示了隐私参数、维度与样本量之间的权衡。对您可能有用:该文将大偏差理论严格引入隐私约束下的假设检验功效分析,为统计-计算/隐私权衡提供了精确的数学刻画,直接连接到 hypothesis testing 与 stat-computing tradeoff 两个 primary interest。
- 关键技术:
Bahadur-Rao large deviation expansion,sharp large deviation principle for i.i.d. random vectors,differential privacy mechanism for multinomial data,private likelihood-ratio test,sample cost of differential privacy - 为什么对您有用: 本文直接连接到 primary interest 的 hypothesis testing 子方向,并在 stat-computing tradeoff 框架下将隐私约束视为计算/信息限制,给出了功效损失的精确大偏差刻画与样本代价,属于该方向对数学统计学者友好的 gateway reading。研究者可用 very_familiar 中的 minimax bounds for estimation problems 与 high-dimensional asymptotics 经验审视该文的 LDP 证明与样本代价界是否可推广至高维设定。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以将此处的私有 LR 检验与大偏差分析迁移到半参数 M-估计的私有推断场景。
其他 (other, 7 篇)¶
1. 10.3150/25-bej1903 · arXiv — Ole E. Barndorff-Nielsen: Sand, wind and inference¶
- 作者: Michael Sørensen
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 2/10 · novelty:
survey - 摘要: 这篇综述回顾了 Ole E. Barndorff-Nielsen 在职业生涯早期的主要研究成果。第一部分聚焦于统计推断的基础,包括条件推断方法和指数族理论,这是作者终身关注的课题。第二部分详述了他对风沙运动建模的研究,提出了双曲线分布和相关过程,并应用于湍流风场的描述。这些工作为后续的金融计量经济学和 ambit 过程研究奠定了基础。本文是一篇历史综述,而非新方法或理论发展。对您(研究者)而言,可作为了解统计推断经典思路的阅读材料,但与您当前的核心研究方向(因果推断、高维统计、半参数理论等)直接关联较弱。
- 关键技术:
conditional inference,exponential families,hyperbolic distributions,turbulence modeling,ambit processes - 为什么对您有用: 本文涉及统计推断基础(指数族、条件推断),与您 primary interest 中 mathematical statistics (hypothesis testing) 相关,但主要是历史综述,无新方法或可迁移技术。从您的技术武器库看,very_familiar 中的 nonparametric statistics 可帮助理解经典推断背景,但本文不提供可操作的工具或问题。follow-up:暂不可做,因为这不是方法论论文,属于背景阅读材料。
2. 10.3150/25-bej1881 — Equilibrium moderate deviations for occupation times of SSEP on regular trees¶
- 作者: Xiaofeng Xue
- 期刊/来源: Bernoulli
- 机构: Beijing Jiaotong University
- 分类: vol 32 · issue 1
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文研究正则树 Td (d≥2) 上的对称简单排斥过程 (SSEP),目标是在初始分布为不变乘积测度的设定下,建立占据时间的中偏差原理 (MDP)。核心机制依赖于两个替换引理 (replacement lemmas),其证明关键利用了 SSEP 与 Td 及 Td×Td 上两类随机游走之间的对偶关系。理论结果给出了占据时间在平衡态下偏离均值的精确中偏差速率函数。对您可能有用:本文是概率论与交互粒子系统的经典问题,虽涉及对偶与偏差理论,但与因果推断或高维统计的核心设定距离较远。
- 关键技术:
moderate deviation principle,symmetric simple exclusion process,replacement lemma,duality relationship,random walk on regular tree - 为什么对您有用: 本文属于交互粒子系统与概率极限理论的交叉,与您 primary interests 中的高维统计 / RMT / U-statistics / 因果推断无直接设定关联。您武器库中的 minimax bounds 与 higher-order U-statistics 理论无法直接攻入该粒子系统的对偶与替换引理技术口子。暂不可做:核心机器(交互粒子系统的对偶技巧与 hydrodynamic limit 方法)不在武器库中,且主题偏离核心研究方向,不建议展开阅读。
3. 10.3150/25-bej1870 · arXiv — Rates of convergence to the local time of oscillating and skew Brownian motion¶
- 作者: Sara Mazzonetto
- 期刊/来源: Bernoulli
- 机构: Université de Lorraine · Institut Élie Cartan de Lorraine
- 分类: vol 32 · issue 1
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文研究基于高频观测数据的振荡布朗运动与偏斜布朗运动的一类统计量。主要目标是通过中心极限定理得到这些统计量收敛到过程局部时的收敛速率。文中考虑了两种特殊扩散过程:振荡布朗运动和偏斜布朗运动,它们分别具有随位置变化的扩散系数和边界行为。利用随机分析中的鞅方法和局部时理论,推导了统计量的渐近分布。该结果在理论随机过程和高频金融数据推断中有潜在应用。但本文主题与您的主要兴趣方向(因果推断、高维统计、U统计量、非参数理论等)关联较弱,且涉及的工具(随机游走、扩散过程)不在您的技术武器库中。
- 关键技术:
high-frequency observations,oscillating Brownian motion,skew Brownian motion,local time,Central Limit Theorem,martingale methods - 为什么对您有用: 本文属于随机过程理论中的渐近推断方向,与您的主要兴趣(因果推断、高维统计、U统计量、半参数效率理论等)没有直接重叠。您熟悉的高阶U统计量和计算复杂性工具不适用于此类连续时间过程的局部时估计问题。研究方法依赖随机分析和鞅理论,而非您武器库中的非参数极小极大理论或因果推断 identification 技巧。因此,当前不具备直接跟进的基础,属于暂不可做的工作——缺少连续时间扩散过程局部时推理的相关背景。
4. 10.3150/25-bej1880 · arXiv — Quasi-limiting behaviour of the sub-critical multitype bisexual Galton-Watson process¶
- 作者: Coralie Fritsch, Denis Villemonais, Nicolás Zalduendo
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 1/10 · novelty:
new_theory - 摘要: 本文研究次临界多类型双性别 Galton-Watson 过程的准极限行为。与经典 Galton-Watson 过程不同,双性别模型因缺乏分支性质而难以分析。作者利用最近发展的思路,将该过程的灭绝行为与一个凹算子的特征值联系起来,从而证明准平稳分布的存在性及收敛性。文章给出了多个准平稳分布的条件,并刻画了其与初始分布的关系。该工作为理解这类无分支性质的分支过程提供了理论框架。这是纯概率理论贡献,暂无直接统计推断或应用连接。
- 关键技术:
quasi-stationary distributions,concave operator,eigenvalue approach,subcritical bisexual Galton-Watson process - 为什么对您有用: 本文涉及随机过程的极限理论,与您的主要兴趣中数学统计/假设检验的渐近理论有概念交集,但研究方法(凹算子和准平稳分布)属于概率论核心,不直接对应您的武器库。当前暂不可做:要跟进这一方向,需要掌握随机过程和泛函分析中的非线性算子理论,这不在您现有的 very_familiar 或 moderately_familiar 工具中。
5. 10.3150/25-bej1902 · arXiv — Research frontiers in ambit stochastics: In memory of Ole E. Barndorff-Nielsen¶
- 作者: Fred Espen Benth, Almut E.D. Veraart
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 1/10 · novelty:
survey - 摘要: 本文是纪念 Ole E. Barndorff-Nielsen 的 ambit stochastics 综述,梳理了过去二十年该领域的基础与进展。Ambit field 是一类时空随机过程,其核心设定是在时空域上以 ambit set 为积分区域、结合 Lévy seed 与 volatility modulation 的积分形式,关键 regularity 假设涉及 seed 的可积性与调制过程的平稳性。文章回顾了 ambit process 的定义、infinitesimal generator、以及与 turbulence / finance 等场景的联系,并指出当前趋势包括时空交互、高维建模与统计推断挑战。理论贡献主要是框架梳理与开放问题汇总,方法学 novelty 较低(综述性质)。对您而言,ambit field 的时空积分结构与高阶矩估计可能触及 higher-order U-statistics 的计算复杂度视角,但整体与您核心关注的方向距离较远。
- 关键技术:
ambit field,Lévy seed,volatility modulation,spatio-temporal stochastic integration,infinitesimal generator - 为什么对您有用: 本文属于 ambit stochastics 的入门级综述,与您 primary interests 的因果推断、高维 RMT、效率理论等无直接交集;其时空积分结构在形式上触及 higher-order U-statistics 的计算视角,但未展开统计推断的细节。武器库中 very_familiar 的 minimax bounds 与 higher-order U 计算无法直接攻入该领域,因缺乏 Lévy process 与随机测度论的先备工具。暂不可做:核心机器(Lévy-based stochastic integration / ambit field 的极限理论)不在武器库里,且作为综述 novelty 有限,不建议花时间读全文。
6. 10.3150/25-bej1855 · arXiv — Haldane’s asymptotics for supercritical branching processes in an iid random environment¶
- 作者: Florin Boenkost, Götz Kersting
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 1/10 · novelty:
new_theory - 摘要: 本文研究独立同分布随机环境下的超临界分支过程,关注存活概率的渐近衰减行为。具体设定中,后代均值从上方趋近于1,即略微超临界的情形。作者证明了在此设定下,经典的Haldane渐近公式仍然成立,前提是过程未进入临界或次临界区域。证明的核心工具是将问题与随机利率趋于零的perpetuity(永续年金)联系起来,并建立了相应的极限定理。该结果将Galton-Watson过程的经典结论推广到随机环境,揭示了环境随机性在一定条件下不改变渐近形态。文中使用了概率生成函数、鞅方法以及随机递归序列的极限理论。本文属于分支过程理论,与统计推断方法的直接关联较弱。
- 关键技术:
branching processes,iid random environment,Haldane's asymptotics,perpetuities with vanishing interest rates,limit theorems,probability generating functions - 为什么对您有用: 本文属于分支过程理论,与您核心兴趣(因果推断、高维统计、非参效率理论等)的交集很小。技术装备库中缺少相关工具(如perpetuity极限理论),短期内无法直接利用。若您对随机环境下的递归结构感兴趣,此文的渐近分析方法可能有间接参考价值,但暂不可做。
7. 10.3150/25-bej1857 · arXiv — Large deviations for fully local monotone stochastic partial differential equations driven by gradient-dependent noise¶
- 作者: Tianyi Pan, Shijie Shang, Jianliang Zhai, Tusheng Zhang
- 期刊/来源: Bernoulli
- 分类: vol 32 · issue 1
- 相关性 0/10 · novelty:
new_theory - 摘要: 本文研究 Gelfand triple V⊆H⊆V∗ 中具有完全局部单调系数的随机偏微分方程(SPDE)的小噪声大偏差原理(LDP),目标 estimand 为解过程 {uε} 在 ε→0 时的轨道大偏差率函数。核心难点在于扩散系数 B(t,·) 可依赖解的梯度(gradient-dependent noise),打破了以往仅处理 hemicontinuity / 严格单调系数的框架。作者采用伪单调(pseudomonotone)技巧与紧性论证的组合策略,绕过传统 Khasminskii 变分方法对梯度依赖噪声的不适用性,在更宽泛的局部单调设定下建立 LDP。理论结果覆盖了随机拟线性 SPDE、随机对流扩散方程、带梯度噪声的随机 p-Laplace 方程及 2D Navier-Stokes 方程等此前无法处理的模型。对您而言,本文属于随机分析 / SPDE 领域的纯理论推进,与因果推断、高维统计或半参数效率等核心方向无直接交集。
- 关键技术:
large deviation principle,pseudomonotone operator technique,Gelfand triple framework,gradient-dependent diffusion coefficient,compactness argument for SPDE - 为什么对您有用: 本文属于随机分析 / SPDE 的纯数学理论,与您 primary interests(因果推断、高维 RMT、半参数效率、higher-order U)无直接技术交集。您武器库中的 minimax bounds、higher-order U-statistics、semiparametric theory 均无法切入此 SPDE 大偏差框架。暂不可做:核心机器(Hilbert 空间随机分析、pseudomonotone 算子理论、SPDE 紧性论证)不在武器库中,且缺乏通往您研究方向的 methodological bridge。
Maintained by 陈星宇 · Homepage · Source on GitHub