Bernoulli — Vol 31 Issue 1 · 2026-06-18¶

共 33 篇 · Bernoulli
目录核对 ⚠️ 疑似漏 1 篇（对照 OpenAlex 34 篇）：10.3150/24-bej1743

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期 Bernoulli 第31卷第1期的33篇论文可归纳为四条主线：(1) 非参数与半参数方法（约15篇），涵盖经验过程、最优传输、深度学习自适应估计、变点回归、深度区域、网络模型、正则化最优传输、非平稳时间序列、谱密度估计等；(2) 假设检验理论（5篇），包括分布自由多元独立性检验、序列多重检验、鞅中偏差、Yule“伪相关”矩密度及社区递归树的推断可行性；(3) 高维随机矩阵与极值（4篇），聚焦非中心样本协方差矩阵谱外无特征值、最大点间距离Gumbel极限、Wigner矩阵logdet边缘CLT、高斯场临界点期望；(4) 概率论与随机过程（5篇），如Poisson驱动点过程的泊松极限、Kummer独立性刻画、稳定过程最优停止、分支Lévy最大位移尾概率、守恒律同步。统计计算方面有两篇在线算法（随机高斯牛顿、自适应再生MCMC）。其余少数论文属纯概率分析。

展开主线一：非参数与半参数方法中经验过程与最优传输的交叉。多篇论文利用最优传输或排序概念构造新的非参数工具：分布自由独立性检验（基于中心-外围秩和van der Waerden统计量）在最优传输下将多元秩映射到均匀参考网格，完全分布自由且渐近理论完备；散度正则化最优传输（DOT）研究了稳定性与样本复杂度，证明正则化能改善收敛率，为非参数密度估计和背景下的经验过程提供基准；Poisson hull通过Poisson点过程的凸包统计量，将估计误差表示为Kabanov–Skorohod积分，获得正态收敛速率；半空间深度trimmed region的强极限定理给出了Hausdorff距离下的Marcinkiewicz–Zygmund SLLN与重对数律，直接关联到凸浮动体估计。

展开主线二：时间序列与动态模型的非参数推断。变点回归交叉验证系统揭示了平方误差损失下的偏差放大机制，提出改用绝对误差损失或修改holdout划分。非线性时间序列的DNN自适应估计证明了稀疏惩罚DNN在minimax意义下可达最优速率（即使函数不连续），这一结果覆盖广义可加AR、单指标及阈值AR等广泛模型。非平稳计数时间序列提出对数线性模型，证明条件分布近尺度不变族的β-mixing指数衰减，为M估计提供理论保障。非遍历α-稳定过程的谱密度估计通过条件高斯结构将其转化为随机频率的密度估计问题，周期图方法简单一致。纯跳稳定CIR过程的联合估计采用似然近似与one-step修正，达到渐近有效，技术路线与半参数效率对照。

展开主线三：假设检验中的新理论框架。自正则化Cramér型中偏差定理将适用范围从i.i.d./混合扩展到一般鞅差分序列，为Student t统计量和BPRE的t检验提供精确概率控制。序列多重检验程序在异步决策及全局信息利用下达到渐近最优期望决策时间，且与同步/分散式程序的效率损失对比明确。Yule“伪相关”的矩与密度首次获得解析闭式，采用Itô公式而非积分方程路线，可推广至相关布朗运动。社区调制递归树中推断的可行性界将假设检验与NP-hard计算复杂性紧密关联。

其余亮点：高维随机矩阵方面，最大点间距离的Gumbel极限及最小距离联合收敛用于构造高维均值相等性检验；Wigner矩阵logdet在谱边缘与临界spike下的CLT可服务于协方差检测；非中心样本协方差矩阵谱外无特征值的结果完善信息加噪声型谱支撑。统计计算中，平均随机高斯牛顿算法在线性复杂度下达到渐近有效（Cramér-Rao下界），适用于非线性回归海量数据；自适应再生MCMC通过动态添加点质量避免传统方法中固定再生分布的困难。

与因果推断/半参数效率/高维最贴的论文：对因果推断研究者，分布自由多元独立性检验（基于最优传输的秩）为无模型独立性检验提供新工具；变点回归交叉验证的偏差分析可直接应用于因果结构变点的稳健选择；多尺度McKean-Vlasov SDE的最大似然估计与Poisson方程消去快变量技巧，与半参数效率中的Neyman正交性有方法关联。半参数效率方向尤可关注纯跳稳定CIR的one-step修正（达到渐近有效）、散度正则化OT的样本复杂度上界（联系经验过程收敛率）、以及非参数自回归中minimax下界推导。高维方向宜优先阅读最大点间距离极限分布（高维均值检验）、Wigner logdet边缘CLT（尖峰协方差检测）、以及非中心样本协方差矩阵谱外无特征值（信息加噪声模型）。

高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)¶

1. 10.3150/24-bej1744 · arXiv — No eigenvalues outside the support of the limiting spectral distribution of large dimensional noncentral sample covariance matrices¶

作者: Zhidong Bai, Jiang Hu, Jack W. Silverstein, Huanchao Zhou
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 本文研究信息加噪声型样本协方差矩阵 \(\mathbf{B}_n = \frac{1}{n}(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)(\mathbf{R}_n + \mathbf{T}_n^{1/2}\mathbf{X}_n)^*\) 的极限谱分布，其中 \(\mathbf{X}_n\) 为独立标准化随机变量矩阵，\(\mathbf{R}_n\) 为非随机信息矩阵，\(\mathbf{T}_n\) 为非随机非负定Hermitian矩阵（噪声协方差）。在 \(p/n \to c>0\) 的高维渐近框架下，已知经验谱分布几乎必然收敛至某一非随机极限分布。本文的主要贡献在于证明了：在对 \(\mathbf{R}_n\) 和 \(\mathbf{T}_n\) 的特征值施加适当条件后，对于极限谱分布支撑外任意闭区间，当 \(n\) 充分大时几乎必然没有特征值落在此区间内。证明依赖于Stieltjes变换的精细分析和矩阵摄动技巧，包括对Green函数进行局部律估计并利用Cauchy积分公式控制离群特征值的出现概率。该结果将经典Bai-Silverstein谱分离定理从中心情形推广至非中心（即信息加噪声）情形，为高维协方差矩阵检验、信号检测等应用提供了严格的谱支撑保证。对您而言，这是随机矩阵理论中关于谱支撑结构的核心进展，直接支撑您在高维统计推断中使用的Marčenko-Pastur型极限工具，并可能启发您将谱分离性质用于高维假设检验的p值校正或阈值确定问题。
关键技术: random matrix theory, Stieltjes transform, Marchenko-Pastur law, information-plus-noise matrix, eigenvalue separation, local law
为什么对您有用: 该论文直接属于您的主要兴趣‘高维统计与随机矩阵理论’，具体涉及非中心样本协方差矩阵的谱支撑性质，这是RMT中基础而重要的问题。您在技术兵器库中具有‘高维渐近’（very_familiar）和‘非参数统计’基础，足以理解其证明框架和结论；所需的核心RMT技巧（Stieltjes变换、局部律、谱分离）虽未在very_familiar中列出，但属于该方向的必备工具，您通过阅读本文可系统掌握信息加噪声模型的谱分析技术，属于‘立即可做’的经典读本。后续可探讨将谱支撑性质用于高维因子模型或因果推断中工具变量的弱识别检验。

2. 10.3150/24-bej1738 · arXiv — Maximum interpoint distance of high-dimensional random vectors¶

作者: Johannes Heiny, Carolin Kleemann
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 该文研究了高维随机向量最大点间距离的极限分布：设 p 个 i.i.d. 的 R^n 点，n 维数趋于无穷，p 随 n 增长至无穷，在适当矩条件下证明最大距离经标准化后依分布收敛至 Gumbel 分布。技术核心是 Chen-Stein Poisson 逼近与高斯大偏差概率近似，同时得到了最小距离的联合收敛性及点过程收敛。进一步将结果推广至具有非衰减相关性的随机游走的最大值，并给出了样本协方差矩阵最大非对角元的类似收敛性。应用方面，构造了基于最大距离的高维均值相等性检验。该文为高维统计中的极值问题提供了完整的渐近理论，其证明工具（极值分布、大偏差）对高维假设检验和随机矩阵理论有直接参考价值。
关键技术: Gumbel limit, Chen-Stein Poisson approximation, Gaussian approximation to large deviations, maximum interpoint distance, high-dimensional hypothesis testing, sample covariance matrix off-diagonal maximum
为什么对您有用: 本文直接涉及高维统计中的极值渐近理论，与您高维随机矩阵（最大非对角元）和假设检验（均值相等检验）两个兴趣点高度吻合。您的技术库中 high-dimensional asymptotics 可直接用于验证文中定理假设的紧性，而更高阶 U-statistics 的视角可进一步分析成对距离统计量的结构（尽管本文关注极值而非均值）。该工作立即可作为高维极值问题的基准参考，中期可尝试将 Chen-Stein 方法与您熟悉的张量收缩计算相结合，探索更一般的依赖结构。

3. 10.3150/24-bej1719 · arXiv — On the expected number of critical points of locally isotropic Gaussian random fields¶

作者: Hao Xu, Haoran Yang, Qiang Zeng
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 6/10 · novelty: new_theory
摘要: 本文研究 N 维欧氏空间中局部各向同性高斯随机场的临界点（梯度为零的点）期望个数。作者引入高斯正交不变矩阵（包括 GOE），建立了非各向同性高斯场的 Kac-Rice 表示，补充了 Cheng 和 Schwartzman（2018）仅处理各向同性情形的结果。在极限 N→∞ 下，证明该表示可完全由 GOE 矩阵给出，从而验证了 Auffinger 和 Zeng（2020）的猜想。技术核心包括 Kac-Rice 公式、随机矩阵谱分布以及高斯场协方差结构的正交不变性。该结果将随机场几何分析与高维随机矩阵理论紧密结合，为后续研究提供了统一的技术框架。对您而言，该文直接连接高维统计与随机矩阵理论，展示了如何将临界点计数问题转化为矩阵谱问题，可借助您熟悉的 high-dimensional asymptotics 和随机矩阵工具来理解并尝试推广。
关键技术: Gaussian Orthogonally Invariant Matrices, Gaussian Orthogonal Ensemble (GOE), Kac-Rice formula, Random field theory, High-dimensional asymptotics, Critical point counting
为什么对您有用: 直接连接到高维统计与随机矩阵理论（RMT）：论文使用 GOE 等随机矩阵工具来刻画随机场临界点期望个数，是 RMT 在随机场几何分析中的前沿应用。研究者可利用非常熟悉的 high-dimensional asymptotics 和随机矩阵理论深入理解其证明，并尝试将方法扩展到其他高斯场模型或非高斯随机场；该文属于立即可读的范畴，无需额外补课即可探索潜在扩展。

4. 10.3150/23-bej1703 · arXiv — An edge CLT for the log determinant of Wigner ensembles¶

作者: Iain M. Johnstone, Yegor Klochkov, Alexei Onatski, Damian Pavlyshyn
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 0/10 · novelty: new_theory
摘要: 在 Wigner 矩阵随机矩阵理论框架下，目标是建立 logdet(W_N - E_N) 在半圆律边缘附近的 CLT，其中 E_N = 2 + N^{-2/3}σ_N 且 σ_N 为常数或缓慢发散至正无穷（σ_N ≪ log^2 N）的序列。核心机制在于利用 Wigner 矩阵在谱边缘的局部性质，将 logdet 的波动归结为边缘极值特征值的联合分布与整体谱的贡献分离；对 spiked Wigner 模型，通过 BBP 相变附近的临界参数设定，推导出 logdet 在临界 spike 下的渐近正态性。主要理论结果给出了 logdet 在边缘及临界 spike 区域的精确渐近分布，并指出其在 critically spiked 模型的统计检验与球面 SK 模型自由能波动中的直接应用。对您可能有用：该结果直接补充了您在 high-dimensional asymptotics 与 RMT 方向的武器库，为基于 logdet 的高维假设检验提供了精确的边缘渐近理论。
关键技术: Wigner ensemble edge CLT, log determinant asymptotics, spiked Wigner model, BBP phase transition, spherical Sherrington-Kirkpatrick model
为什么对您有用: 本文直接连接到 primary interest 中的 high-dimensional statistics (Random matrix theory) 子方向，特别是 Wigner 矩阵谱边缘的渐近理论。您武器库中的 high-dimensional asymptotics 可直接用来审视该 CLT 在更一般矩阵族（如 sample covariance）下的可推广性，且 critically spiked 模型的检验问题与您熟悉的 hypothesis testing 兴趣交汇。Follow-up 判断：立即可做——用 very_familiar 的高维渐近工具即可验证该 logdet CLT 在您关心的其他高维检验设定中的适用性，并可直接阅读全文掌握边缘 RMT 的现代证明路径。

非参数 / 半参数 (nonparam_semipara, 16 篇)¶

1. 10.3150/24-bej1729 · arXiv — Nearest neighbor empirical processes¶

作者: François Portier
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 在非参数回归框架下，本文研究以给定协变量点 x 的最近邻响应所构造的经验测度作为核心统计量，目标泛函的估计依赖于该局部经验过程。核心结果之一：在函数类满足局部 bracketing entropy 条件下，该最近邻经验过程满足 uniform CLT；另一结果：在 VC-type 条件下给出 uniform non-asymptotic bound。极限分布的协方差算子恰好等于给定协变量值下的条件协方差算子，这意味着可用仅基于最近邻子集的标准公式估计方差，无需全样本。文中以条件累积分布函数估计和局部线性回归为例展示方差估计的可行性。对您可能有用：最近邻经验过程的 uniform CLT 与 non-asymptotic bound 为非参数条件推断提供新工具，可直接连接您 primary interest 中的 semiparametric efficiency 与 nonparametric theory。
关键技术: nearest neighbor empirical process, uniform central limit theorem, local bracketing entropy, VC-type uniform entropy, conditional covariance operator, local linear regression
为什么对您有用: 本文直接连接您 primary interest 中的 nonparametric theory 与 semiparametric efficiency：最近邻经验过程的 uniform CLT 给出了局部估计量的 influence function 结构（协方差即条件协方差算子），为构造条件推断的 one-step / debiased 估计器提供理论入口。用您 very_familiar 的 nonparametric statistics 与 minimax bounds 可立即审视其 entropy 条件是否可进一步弱化或给出 sharper rate（立即可做）；若想将其嵌入 semiparametric efficiency bound 框架做条件 ATE 的局部高效估计，需先在 moderately_familiar 的 semiparametric theory 上长肌肉（中期可做）。

2. 10.3150/24-bej1734 · arXiv — Fréchet mean set estimation in the Hausdorff metric, via relaxation¶

作者: Moïse Blanchard, Adam Quinn Jaffe
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 本文研究在非欧几里得度量空间中，基于独立同分布样本一致估计总体分布Fr échet均值集（相对于Hausdorff度量）的问题。作者采用松弛经验Fr échet均值集估计器，通过选择随样本量衰减的松弛量来识别近最小化Fr échet泛函的点集，并完整刻画了弱一致性与强一致性各自对松弛速率的要求。进一步提出一个自适应估计器，在仅假设有限矩和度量熵条件（覆盖数）下，自动地选择最快可能的松弛速率以达成强一致性。应用方面，该方法被应用于热带投影度量下的等距树空间（系统发育树），估计Fermat-Weber点集，并在真实系统发育数据上演示了性能。本文为度量空间中的集合估计提供了系统的理论框架，与您熟悉的非参数统计（经验过程、最小最大速率）有直接契合，可启发后续在非标准空间中的估计适配问题。
关键技术: Fr\'echet mean set estimation, Hausdorff metric, relaxed empirical estimator, adaptive relaxation rate, metric entropy, tropical projective metric, phylogenetic trees
为什么对您有用: 本文直接推进非参数统计中的集合估计理论，与您的非参数统计和最小最大界兴趣高度吻合。您可以使用熟悉的经验过程和覆盖数技术解析其一致性证明，并利用最小最大界框架评估文中松弛速率的最优性。后续：中期可做——该方法在度量空间中的自适应估计策略可启发您的高阶U统计量工作，但需要先补充Fr échet均值和度量空间统计的入门知识（不在当前武器库中），不过您的非参数功底可助快速进入。

3. 10.3150/24-bej1732 · arXiv — Cross-validation for change-point regression: Pitfalls and solutions¶

作者: Florian Pein, Rajen D. Shah
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 7/10 · novelty: new_method
摘要: 在变点回归设定下，研究用交叉验证（CV）选择变点数（tuning parameter）时平方误差损失的系统性偏差问题；目标 estimand 是变点数与均值函数。核心发现：标准 K-fold CV 配合 squared error loss 会因残差方差放大效应而系统性低估或高估变点数，导致均值函数估计在最易检测变点的简单设定下也严重偏离最优。提出两种修正方案：(1) 用 absolute error loss 替代 squared error，消除方差放大；(2) 修改 holdout set 划分方式，并给出一般变点估计程序下变点数一致估计的充分条件；对 least squares 估计器在给定错误变点数时的表现给出新理论结果，证明其满足该条件。数值实验表明，在误差分布正确设定时与经典变点方法持平，在模型误设时大幅胜出。对您可能有用：变点估计的 tuning 选择与 nonparametric M-estimation 理论紧密相关，absolute-error CV 的鲁棒性思路可迁移到其他分段/门限模型的 semiparametric 推断。
关键技术: cross-validation for change-point number, absolute error loss, modified holdout set partition, least squares with incorrect change-point number, consistent estimation of change-point count, model misspecification robustness
为什么对您有用: 直接连接到 nonparametric statistics 与 M-estimation theory：变点数选择本质是 nonparametric 模型复杂度 tuning，本文揭示 squared-error CV 的方差放大缺陷并提供 absolute-error 与 holdout-set 修正的理论保证。用 very_familiar 的 minimax bounds for estimation problems 可以验证文中 least squares 在错误变点数下的 risk bound 是否紧；用 moderately_familiar 的 M-estimation theory 可将 absolute-error CV 的一致性条件推广到更一般的 loss / 模型（如 semiparametric 变点）。立即可做：用 very_familiar 武器（minimax rate 分析）复现并拓展 least squares 在错误 K 下的 risk bound，或验证 absolute-error CV 在高维/semiparametric 变点设定下的理论性质。

4. 10.3150/24-bej1726 · arXiv — Adaptive deep learning for nonlinear time series models¶

作者: Daisuke Kurisu, Riku Fukami, Yuta Koike
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 7/10 · novelty: sharper_rate
摘要: 在非平稳非线性时间序列设定下，本文研究非线性自回归（AR）模型均值函数的非参数自适应估计，目标 estimand 为条件均值函数，关键假设为过程满足混合条件及均值函数具有内在低维结构。作者分别考虑无惩罚与稀疏惩罚的 DNN 估计器，利用非平稳时间序列的泛化误差界技术，推导出两类估计器的收敛速率。随后针对包含广义可加 AR、单指标及阈值 AR 等广泛非线性 AR 模型类，建立了 minimax 下界。核心理论结果为：稀疏惩罚 DNN 估计器能自适应地达到 minimax 最优速率（仅差 poly-log 因子），即使均值函数不连续或粗糙。对您可能有用：本文将 DNN 的自适应 minimax 理论从独立样本拓展至非平稳相依数据，为非参数效率与 minimax 界提供了新范例。
关键技术: sparse-penalized DNN estimator, minimax lower bounds, non-stationary mixing time series, generalization error bounds, nonlinear autoregressive models, adaptive rate
为什么对您有用: 直接连接到 primary interest 中的 nonparametric theory 与 minimax bounds：本文在非平稳相依数据下严格证明了 DNN 估计器的 minimax 自适应性，填补了独立设定外的理论空白。您 very_familiar 的 minimax bounds for estimation problems 可直接用来审视其下界构造是否紧，以及 poly-log 因子是否可进一步 sharpen。属于立即可做：用熟悉的 minimax 工具验证其速率紧性，或尝试将下界论证迁移到您关心的因果推断非参数设定中。

5. 10.3150/24-bej1740 · arXiv — Tractably modelling dependence in networks beyond exchangeability¶

作者: Weichi Wu, Sofia Olhede, Patrick Wolfe
期刊/来源: Bernoulli
机构: Tsinghua University · École Polytechnique Fédérale de Lausanne · Purdue University West Lafayette
分类: vol 31 · issue 1
相关性 7/10 · novelty: new_theory
摘要: 在非可交换网络数据设定下，本文提出基于有限增长历史与潜在序的复合 graphon 建模框架，边概率由潜在变量条件化并推广经典 graphon 函数。核心机制包括：对复合 graphon 提出在平方误差损失下的 minimax 估计器；证明在块常数复合 graphon 及附加条件下谱聚类可一致检测潜在分组；构造出具有重尾经验度分布的模型，解释稀疏与重尾度分布的生成机制。理论结果明确了非可交换数据可由 SBM 描述的一般条件，对您有用在于其 minimax 估计界与谱聚类一致性分析可直接对接您熟悉的 minimax bounds 与高维渐近理论。
关键技术: composite graphon, minimax estimation, spectral clustering consistency, non-exchangeable network model, heavy-tailed degree distribution, latent order
为什么对您有用: 本文直接连接您 primary interest 中的 nonparametric theory 与 minimax bounds——复合 graphon 的 minimax 估计器与谱聚类一致性证明是您 very_familiar 武器可直接攻的口子（验证 minimax 界是否紧、谱方法渐近性）。Follow-up 判断：立即可做——用 minimax bound 工具审视其估计率是否可达 sharper rate，或用高维渐近经验过程工具分析谱聚类在更弱假设下的表现。

6. 10.3150/24-bej1731 — Poisson hulls¶

作者: Günter Last, Ilya Molchanov
期刊/来源: Bernoulli
机构: Karlsruhe Institute of Technology · University of Bern
分类: vol 31 · issue 1
相关性 6/10 · novelty: new_theory
摘要: 在 Poisson 点过程框架下，本文引入 hull operator（如凸包）并研究基于 hull 内已知 intensity measure 对线性统计量的估计问题，目标 estimand 为期望线性统计量（特例为凸体体积或 Hölder 函数积分）。核心机制利用 Poisson 过程对 hull 的空间强 Markov 性质，证明估计误差恰好是 Kabanov–Skorohod 积分；在此基础上推导误差的正态收敛速率，并在 Hölder 函数积分估计中给出具体收敛阶。文章还讨论了高阶对称统计量（即高阶 U-statistics）的估计，将 hull 限制与 Poisson 随机测度的 Malliavin calculus 衔接。对您可能有用：高阶对称统计量部分直接触及 higher-order U-statistics 理论，且 Kabanov–Skorohod 积分作为 Poisson 空间上的 Malliavin 导数对应物，为非参数效率理论提供了新视角。
关键技术: Poisson point process hull operator, Kabanov-Skorohod integral, spatial strong Markov property, Malliavin calculus on Poisson space, higher-order symmetric statistics, normal convergence rate
为什么对您有用: 本文的高阶对称统计量部分直接连接 primary interest 中的 higher-order U-statistics，且估计误差由 Kabanov–Skorohod 积分刻画，这本质上是 Poisson 空间上的 influence function / Malliavin 导数，与 semiparametric efficiency theory 形式上平行。用 very_familiar 中的 higher-order U-statistics computation (treewidth / tensor contraction / einsum) 可以审视本文高阶对称统计量的计算复杂度口子——作者未讨论 combinatorial cost，这是一个可切入的 follow-up。判断：立即可做——用 very_familiar 的 U-statistic treewidth 视角分析其高阶统计量的 einsum 复杂度，并对比经典 U-statistic projection 与 Poisson 空间 Malliavin 体系的效率界。

7. 10.3150/24-bej1751 · arXiv — Strong limit theorems for empirical halfspace depth trimmed regions¶

作者: Andrii Ilienko, Ilya Molchanov, Riccardo Turin
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 6/10 · novelty: new_theory
摘要: 在半空间（Tukey）深度框架下，研究概率测度 μ 的经验加权半空间深度 trimmed region 的强极限定理，核心 estimand 是理论与经验 trimmed region 之间的 Hausdorff 距离及集合包含关系。对经验 trimmed region 证明了以集合包含与 Hausdorff 距离衡量的 Marcinkiewicz–Zygmund 强大数定律与重对数律。当 μ 为凸体 K 上均匀分布时，trimmed region 即 K 的凸浮动体，由此获得凸浮动体经验估计量的强收敛结果。主要理论贡献是给出了非参数深度区域估计的逐点强收敛率与重对数律界，对您可能有用：此处的 Hausdorff 距离收敛分析可为半参数/非参数深度区域估计的 minimax rate 研究提供基础。
关键技术: halfspace (Tukey) depth, depth trimmed region, Marcinkiewicz-Zygmund SLLN, law of the iterated logarithm, Hausdorff distance convergence, convex floating body
为什么对您有用: 本文直接连接到非参数统计与 minimax bounds 子方向：trimmed region 的 Hausdorff 距离收敛率是非参数集合估计 minimax 理论的经典对象。用您 very_familiar 的 minimax bounds for estimation problems 工具，可以检验本文给出的 LIL / MZ-SLLN 界是否紧、以及能否构造 minimax 下界匹配。follow-up 判断：立即可做——用 minimax 下界技术验证收敛率的紧性是直接可动手的方向。

8. 10.3150/24-bej1725 · arXiv — Stability and sample complexity of divergence regularized optimal transport¶

作者: Erhan Bayraktar, Stephan Eckstein, Xin Zhang
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 5/10 · novelty: sharper_rate
摘要: 研究散度正则化最优传输（DOT）的稳定性与样本复杂度。首先，在Wasserstein距离下获得了DOT优化器的定量稳定性结果，适用于一大类散度，同时改进了已知的熵正则化最优传输的相应结果。其次，研究经验测度近似下的样本复杂度，证明散度正则化可以改善最优传输的收敛率。利用成本函数和散度泛函的正则性以及边缘分布的内在维数，建立了样本复杂度的上界。推导了对偶优化器的正则性，以及经验测度在合适测试函数类下的极限定理。对非参数统计中经验过程与收敛速率理论的研究者而言，该工作为理解正则化如何加速OT收敛提供了理论基准。
关键技术: divergence regularized optimal transport, Wasserstein distance stability, sample complexity bounds, empirical measure approximation, dual optimizers regularity, convergence rate improvement
为什么对您有用: 直接关联非参数统计与经验过程理论——您熟悉的minimax下界工具可检验本文收敛率是否最优（立即可做）。文中对偶优化器的正则性分析也为高维渐近理论提供了技术接口。

9. 10.3150/24-bej1748 — Irregular nonparametric autoregression¶

作者: H. Gruber, M. Jirak
期刊/来源: Bernoulli
机构: Technische Universität Braunschweig
分类: vol 31 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 在非参数一阶自回归设定下，目标为估计正的 Hölder 连续系数函数，其中创新分布为 irregular（正支撑且边界密度趋于零）。作者采用 quasi-maximum likelihood 估计方法，核心难点在于控制弱相依过程的极值行为，主结果为针对此类量的 concentration inequality。基于此，推导了 upper bound 与 matching minimax lower bound，证明估计量的最优性。与 regular 情况不同，information-theoretic complexity 同时依赖光滑度与刻画分布 irregularity 的 shape parameter，且证明思路与经典及近期 locally stationary 方法截然不同。对您有用：此处的 minimax rate 依赖 shape parameter 的现象，可直接用 minimax bounds 武器检验其 rate 是否紧，并对比 HOIF 在 irregular 模型下的潜在改进空间。
关键技术: quasi-maximum likelihood estimation, minimax lower bounds, concentration inequality for weakly dependent extremes, irregular model shape parameter, locally stationary processes
为什么对您有用: 直接连接非参数理论中的 minimax estimation 与 irregular model 设定，其中 minimax rate 依赖 shape parameter 的现象值得用 very_familiar 的 minimax bounds 工具审视其紧性。对您而言，立即可做：用 minimax bounds 与 nonparametric statistics 武器验证其声称的 matching rate 是否在更一般的 irregular 设定下仍紧，并探索 HOIF（moderately_familiar）在此 irregular 模型下能否提供 sharper rate 或 debiased 改进。

10. 10.3150/24-bej1750 — Maximum likelihood estimation for small noise multi-scale McKean-Vlasov stochastic differential equations¶

作者: Jie Xu, Qiao Zheng, Jianyong Mu
期刊/来源: Bernoulli
机构: Henan Normal University · Henan Institute of Technology
分类: vol 31 · issue 1
相关性 4/10 · novelty: new_theory
摘要: 本文研究小噪声多尺度 McKean-Vlasov 随机微分方程（MVSDE）的参数估计问题，模型系数同时依赖慢分量、快分量及其自身分布（即 mean-field interaction）。作者首先利用 Poisson 方程技术证明了慢过程强平均原理的最优强收敛速率；随后基于平均化极限构造了最大似然估计量（MLE），并证明其一致性与渐近正态性；最后给出数值示例验证理论。对您可能有用：多尺度平均化与 MLE 渐近理论可视为 semiparametric efficiency 在一类特殊 mean-field SDE 上的对照，Poisson 方程消去快变量的技巧与 semiparametric 中的 nuisance parameter profiling 思路有结构相似性。
关键技术: McKean-Vlasov SDE, strong averaging principle, Poisson equation, maximum likelihood estimation, asymptotic normality, mean-field interaction
为什么对您有用: 本文连接到 semiparametric theory 子方向：多尺度模型中快分量作为 nuisance parameter，Poisson 方程实现 averaging 的手法与 semiparametric profiling 消去 nuisance parameter 的思路结构相似，MLE 的渐近正态性可对照 semiparametric efficiency bound 是否可达。用您 very_familiar 的 minimax bounds for estimation problems 可审视其声称的收敛速率是否紧，或用 moderately_familiar 的 M-estimation theory 检查其 MLE 渐近性质的证明细节。Follow-up 粗判：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉以深入审视其渐近理论，mean-field SDE 的概率工具目前不在武器库中。

11. 10.3150/24-bej1724 · arXiv — Simultaneous off-the-grid learning of mixtures issued from a continuous dictionary¶

作者: Cristina Butucea, Jean-François Delmas, Anne Dutfoy, Clément Hardy
期刊/来源: Bernoulli
机构: Centre for Research in Engineering Surface Technology · Centre de Recherche en Économie et Statistique · Center for Responsible Travel · CERMICS · EDF Energy (United Kingdom) · Électricité de France (France)
分类: vol 31 · issue 1
相关性 4/10 · novelty: new_theory
摘要: 在连续字典混合模型设定下，目标是从含噪信号集合（可能是连续统）中同时估计线性混合系数与非线性特征参数，假设各信号共享稀疏活跃特征结构。提出 Group-Nonlinear-Lasso 优化问题，使用 (ℓ1,Lp)-惩罚项，通过 certificate 函数给出预测误差的高概率界。基于 off-the-grid 方法的几何框架，证明当活跃特征参数在 Riemannian 度量下成对分离时，可构造所需 certificate。在有限信号与 Gaussian 噪声下，利用 Gaussian 与 χ² 随机过程极大值的 tail bound，对 p=1 和 p=2 给出更精细的误差界；p=2 时预测误差达到多任务线性回归 Group-Lasso 的收敛率，且当信号共享大部分非线性参数时 p=2 的速率优于 p=1。对您有用：该文的 off-the-grid certificate 与 Riemannian 分离条件为 semiparametric / nonparametric 理论中的连续参数估计提供了新的 minimax rate 分析视角。
关键技术: off-the-grid estimation, (ℓ1,Lp)-penalty, certificate functions, Riemannian metric separation, suprema of Gaussian processes, Group-Nonlinear-Lasso
为什么对您有用: 直接连接 nonparametric / semiparametric 理论中的连续参数估计与 minimax rate 问题。您武器库中 very_familiar 的 minimax bounds for estimation 与 inverse problems with random noise 可直接攻入其 certificate 函数构造与 Gaussian process tail bound 的具体口子，验证其声称的 sharper rate 是否紧。立即可做：用 minimax bound 与 inverse problem 工具检验其 Riemannian 分离条件下的收敛率是否达到 minimax lower bound。

12. 10.3150/24-bej1747 · arXiv — A log-linear model for non-stationary time series of counts¶

作者: Anne Leucht, Michael H. Neumann
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 4/10 · novelty: new_theory
摘要: 本文提出一类针对带强趋势非平稳整数时间序列的新模型，目标 estimand 为条件均值参数及其相关统计量，核心假设为条件分布属于近尺度不变族（均值与标准差同阶）。与经典 Poisson-INGARCH（方差随均值线性增长）不同，该模型借鉴 GARCH 思路，使方差与均值绝对值同阶，更适配强趋势计数数据。理论核心是证明了该计数过程的绝对正则性（β-mixing），且混合系数指数衰减，为后续 M-estimation 及渐近理论奠定基础。该指数衰减性质可直接用于经验过程与 M-估计量的一致性及收敛速率推导。对您可能有用：其 β-mixing 指数衰减结论可作为您研究 semiparametric/M-estimation 渐近理论时的过程依赖性工具。
关键技术: integer-valued time series, near scale invariance, absolute regularity (beta-mixing), exponentially decaying mixing coefficients, M-estimation theory
为什么对您有用: 本文连接到 semiparametric/M-estimation theory 子方向：β-mixing 指数衰减是推导非平稳过程 M-估计量渐近性质的关键前提。您武器库中 moderately_familiar 的 M-estimation theory 可直接攻入本文后续未展开的估计量渐近分布与效率分析口子。follow-up 判断：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以推导该模型下条件均值参数的 semiparametric efficiency bound 或构造 one-step efficient estimator。

13. 10.3150/24-bej1723 · arXiv — Non-ergodic statistics and spectral density estimation for stationary real harmonizable symmetric α-stable processes¶

作者: Ly Viet Hoang, Evgeny Spodarev
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 3/10 · novelty: new_method
摘要: 本文研究非遍历平稳实可调和对称α-稳定过程（SαS）的谱密度估计问题，设定为控制测度有限对称绝对连续且过程具有LePage级数表示。利用过程的条件高斯结构，推导出样本函数的非遍历极限，给出了经验特征函数与滞后过程非遍历极限的显式表达。过程可等价表示为随机频率正弦波级数，频率i.i.d.且其概率密度即为谱密度，从而将谱密度估计转化为随机频率的密度估计。基于周期图的强一致频率估计，构造了谱密度的强一致估计量；周期图计算高效且方法不受过程非遍历性影响。对您有用：本文将非遍历α-稳定过程的谱密度估计转化为经典密度估计问题，其条件高斯与级数表示技巧对研究重尾依赖过程的半/非参数理论有参考价值。
关键技术: LePage series representation, conditionally Gaussian structure, non-ergodic limit, periodogram frequency estimation, spectral density estimation, symmetric alpha-stable processes
为什么对您有用: 本文连接到非参数理论子方向（重尾依赖过程的谱密度估计），利用条件高斯与级数表示绕过非遍历性障碍。武器库中 very_familiar 的非参数统计与逆问题工具可直接理解其密度估计转化逻辑，但α-稳定过程的LePage表示与非遍历极限推导需在 moderately_familiar 的 M-estimation 理论上补充重尾过程基础。follow-up判断：中期可做——需先在α-稳定过程级数表示与非遍历极限理论上长肌肉。

14. 10.3150/24-bej1736 · arXiv — Estimation of a pure-jump stable Cox-Ingersoll-Ross process¶

作者: Elise Bayraktar, Emmanuelle Clément
期刊/来源: Bernoulli
机构: Laboratoire d’Analyse et de Mathématiques Appliquées
分类: vol 31 · issue 1
相关性 3/10 · novelty: new_theory
摘要: 本文研究由非对称稳定 Lévy 过程驱动的纯跳稳定 Cox-Ingersoll-Ross (α-stable CIR) 过程，在固定时间段内高频观测设定下，联合估计漂移、尺度与跳活动度参数（α∈(1,2)）。核心方法基于似然函数近似构造估计量，证明了其一致性、达到最优收敛速率且渐近条件正态；并在尺度与跳活动度已知或已一致估计的前提下建立了漂移估计量的唯一性。进一步，作者提出易于实现的初步估计量，并通过 one-step Newton-Raphson 型修正将其提升至渐近有效。对您可能有用：one-step 修正从初步估计量达到效率边界的路径，与 semiparametric efficiency 及 one-step estimation 理论直接呼应。
关键技术: α-stable Lévy process, likelihood approximation, one-step estimation, high-frequency asymptotics, conditional Gaussian limit, rate-optimal estimation
为什么对您有用: 本文的 one-step 修正从初步估计量达到最优速率与渐近正态的路径，直接连接到 primary interest 中的 semiparametric efficiency theory 与 one-step estimation。用 technical_arsenal 中 moderately_familiar 的 M-estimation theory 可以审视其似然近似与唯一性证明的细节；one-step 修正的效率提升机制与您熟悉的 HOIF / higher-order U-statistics 的迭代校正思想有结构相似性。follow-up 判断：中期可做——若想将此类纯跳过程的 one-step 效率论证与 HOIF 框架做类比或推广，需先在 moderately_familiar 的 semiparametric theory 上长肌肉（特别是非正则参数 / Lévy 过程的效率边界计算）。

15. 10.3150/24-bej1746 · arXiv — Some new concentration inequalities for the Itô stochastic integral¶

作者: Nguyen Tien Dung
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 在 Itô 随机积分设定下，目标是建立无界可积函数的 running supremum 的新 concentration inequality，核心假设放宽了经典 boundedness 条件。方法基于 Malliavin calculus 技术，利用 Wiener space 上的梯度与 Ornstein-Uhlenbeck 算子结构推导 tail bound，给出了比传统 Burkholder-Davis-Gundy (BDG) 不等式更精细的 concentration 界。理论结果提供了具体的指数衰减 tail 估计，并附带若干应用与示例。对您可能有用：此处的 Malliavin calculus 工具与 concentration 界推导，可为 semiparametric / nonparametric 估计中处理连续时间随机过程的 tail probability 提供新思路。
关键技术: Malliavin calculus, Itô stochastic integral, concentration inequality, running supremum, unbounded integrands, Burkholder-Davis-Gundy inequality
为什么对您有用: 本文连接到 nonparametric statistics 与 minimax bounds 子方向，核心是给出无界 Itô 积分 supremum 的 sharper concentration 界。用您 very_familiar 的 minimax bounds 与 inverse problems with random noise 经验，可以审视此界在连续时间 semiparametric 估计中的紧性（是否达到最优指数衰减率）。follow-up 粗判：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，将此连续时间 concentration 工具迁移到 semiparametric M-estimator 的 tail bound 推导中。

16. 10.3150/24-bej1749 · arXiv — Transportation cost inequalities for stochastic reaction diffusion equations on the whole real line¶

作者: Yue Li, Shijie Shang, Tusheng Zhang
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文研究定义在全实线 ℝ 上的、由乘性时空白噪声驱动的随机反应扩散方程（SRDE）的解的二次传输成本不等式（T_2）。由于空间域无界，经典 L² 范数不再适用，作者在加权空间 L²_tem 与 C_tem 中，采用加权 L² 范数与加权一致度量建立 T_2 不等式。核心技术工具是针对时空白噪声的随机卷积的新矩估计，用以控制无界域上的解的尾部行为。此外，结果被推广至随机初始值的情形。对您而言，该文在无界域上处理随机卷积矩估计的技术，可为研究带空间结构的逆问题或高维渐近理论中的无穷维随机扰动提供参考。
关键技术: quadratic transportation cost inequality (T_2), stochastic reaction diffusion equation, multiplicative space-time white noise, weighted L^2_tem / C_tem spaces, stochastic convolution moment estimates, Talagrand-type concentration
为什么对您有用: 本文属于无穷维 SPDE 的概率度量收敛理论，与您 primary interest 中的高维渐近 / 逆问题有远端联系（无界域上的随机卷积矩估计技术）。您武器库中的 inverse problems with random noise 可直接对接其随机卷积分析，但 T_2 不等式与加权空间所需的 SPDE 鞅解存在性理论不在 very/moderately_familiar 范围。暂不可做：核心 SPDE 鞅方法与加权空间拓扑工具缺失，需先补强无穷维 SDE/SPDE 的弱解与矩估计理论。

数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶

1. 10.3150/24-bej1721 · arXiv — Distribution-free tests of multivariate independence based on center-outward quadrant, Spearman, Kendall, and van der Waerden statistics¶

作者: Hongjian Shi, Mathias Drton, Marc Hallin, Fang Han
期刊/来源: Bernoulli
机构: Technical University of Munich · Université Libre de Bruxelles · University of Washington
分类: vol 31 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 本文提出了一类基于最优传输定义的多元秩的分布自由独立性检验统计量，包括中心-外围象限统计量、多元Spearman ρ、Kendall τ和van der Waerden协方差。经典一元秩检验因缺乏R^d上的自然序而难以推广，作者利用最优传输将数据点映射到均匀参考分布的网格上，从而获得多元秩、符号及数据驱动的排序。所有检验统计量完全分布自由，对任意绝对连续分布均保持有限样本有效性。文章建立了这些统计量的渐近分布理论，给出了检验独立性的临界值近似，并在推广的Konijn模型（椭球对称广义Konijn模型）下进行了功效分析。特别是证明了van der Waerden检验相对于Wilks经典伪高斯过程的渐近相对效率恒大于等于1，仅在正态分布下取等，建立了多元Chernoff-Savage性质；同时给出了Spearman检验相对于Wilks检验的ARE下界，将Hodges-Lehmann关于一元位置模型中Wilcoxon检验与Student检验ARE的经典结果推广到多元设置。对您而言，该工作直接对应主要兴趣中的‘数学统计与假设检验’和‘非参数理论’，其基于最优传输的多元秩技术为核心武器库中的‘非参数统计’提供了新的理论分析工具和可用的检验方法。
关键技术: Optimal transport-based multivariate ranks, Center-outward quadrant statistic, Multivariate Spearman's rho, Multivariate Kendall's tau, van der Waerden covariances, Multivariate Chernoff-Savage property
为什么对您有用: 本文的核心内容直接衔接您的主要兴趣‘数学统计与假设检验’和‘非参数与半参数理论’，通过最优传输构造多元秩并建立完整的渐近分布和效率理论。您对‘非参数统计’非常熟悉，可立即理解其技术路径（如最优传输的rank构造和渐近论证），无需额外工具。此外，若后续考虑将这类多元秩方法应用于因果推断中的敏感性分析或分层，武器库中的‘M-estimation理论’和‘识别理论’能提供中期拓展可能。本文值得全文精读，以掌握该方法的理论证明细节及其在多元假设检验中的创新框架。

2. 10.3150/24-bej1722 · arXiv — Self-normalized Cramér type moderate deviations for martingales and applications¶

作者: Xiequan Fan, Qi-Man Shao
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 7/10 · novelty: new_theory
摘要: 本文在鞅设定下建立了自正则化的Cramér型中偏差（moderate deviations）定理，无需矩生成函数假设，仅依赖鞅差序列的某种充分条件。推广了Fan, Grama, Liu and Shao (2019)的结果，将适用范围从独立同分布/混合情形扩展到一般鞅差分序列。核心工具是自正则化因子（如二次变差）与指数型鞅不等式，通过精细的概率估计得到相对误差趋于零的偏差界。应用部分展示了该定理如何用于Student t统计量、平稳鞅差序列以及随机环境中的分支过程（BPRE）的t统计量的中偏差推断。特别地，为BPRE下的t检验提供了严格的概率偏差控制，这在生态学与人口动态建模中有实际意义。对您而言，该结果为高维假设检验中基于鞅的自正则化统计量（如序列t检验）提供了误差控制的极限理论支撑，可直接用于强化您熟悉的高维渐近分析工具箱。
关键技术: Self-normalization, Cramér type moderate deviations, Martingale difference sequences, Exponential martingale inequality, Student's t-statistic, Branching processes in a random environment
为什么对您有用: （1）论文直接关联您primary interest中的hypothesis testing方向，特别是自正则化统计量（如Student t）的中偏差性质，这在序列检验和高维稀疏检测中关键。（2）您的very_familiar工具包括high-dimensional asymptotics和inverse problems，可以立即将本文的鞅中偏差结果应用到高维自正则化检验的误差控制问题中，例如为高维稀疏线性模型的双样本t检验构建更紧的误差界。（3）立即可做：本文的概率工具与您已有的非参数统计和渐近理论背景高度兼容，无需额外学习新框架，即可尝试在自正则化统计量的假设检验场景中导出改进的拒绝阈值。

3. 10.3150/24-bej1727 · arXiv — Asymptotically optimal sequential multiple testing with asynchronous decisions¶

作者: Yiming Xing, Georgios Fellouris
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 7/10 · novelty: new_theory
摘要: 在独立数据流序列监测的多重检验设定下，目标是各流边际分布的假设检验，允许各流在不同时间做出异步决策且可利用全部流数据直至所有决策完成，并假设信号数量有先验上界。提出了一种新的序列多重检验程序，在全局错误率指标趋于零时，该程序在每个数据流和每种信号配置下均渐近达到最小期望决策时间。最优性在一般参数复合假设、多种错误度量及允许时间依赖的弱分布假设下建立；此外，还计算了在仅限同步或分散式程序时，某流期望决策时间增加因子的极限值。仿真比较了现有两种序列多重检验程序与所提程序的表现。对您可能有用：本文的异步决策与全局信息利用机制，为序列假设检验中的最优停止与效率理论提供了新视角。
关键技术: sequential multiple testing, asynchronous decision times, asymptotic optimality, expected decision time minimization, global error rate control, composite hypotheses under temporal dependence
为什么对您有用: 本文直接推进了数学统计中假设检验方向，特别是在序列多重检验的渐近最优性上给出了严格的期望决策时间最小化结果。研究者可用 very_familiar 中的 minimax bounds for estimation problems 经验，审视此处的期望决策时间下界推导是否与经典 minimax 理论有相通的证明结构，并用 moderately_familiar 的 M-estimation theory 探索复合假设下异步停止规则的效率界。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将经典效率界工具迁移到序列停止规则的期望时间优化问题。

4. 10.3150/24-bej1733 — Yule’s “nonsense correlation”: Moments and density¶

作者: Philip A. Ernst, L.C.G. Rogers, Quan Zhou
期刊/来源: Bernoulli
机构: Imperial College London · University of Cambridge · Texas A&M University
分类: vol 31 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 在 Yule 1926 年提出的 nonsense correlation 设定下，两个独立随机游走的偏和序列构成伪相关系数 ρ_n，其极限 ρ 为两个独立 Wiener 过程的二次泛函比值。本文不沿用 Ernst et al. (2017) 的积分方程路线，而是利用 Gaussian diffusion 二次泛函分布的经典结果，发展出 Itô 公式方法计算 ρ 的 Laplace 变换，由此解析地求出直至 16 阶的矩，首次给出了 Yule nonsense correlation 的密度近似。方法可自然推广至 correlated Brownian motions、独立 OU 过程与 Brownian bridges 等设定，并对 OU 过程情形在 [0,T] 上证明了 CLT。对您有用：本文将高阶矩计算转化为 Laplace 变换与 Itô 随机分析问题，其矩-密度重构逻辑与 higher-order U-statistics 的投影-重构思路有结构相似性。
关键技术: Ito formula for quadratic functionals, Laplace transform of diffusion functionals, moment-density reconstruction, weak convergence of partial-sum correlation, Gaussian diffusion quadratic functional distribution
为什么对您有用: 本文直接处理 hypothesis_testing / mathematical statistics 中伪相关的极限分布与高阶矩解析计算，属于您 primary interest 中 mathematical statistics 的经典问题。技术层面，它用 Laplace 变换从矩重构密度，与您 moderately_familiar 的 HOIF（Higher-Order Influence Functions）中用高阶矩逼近密度/分布的思路有结构类比——可借本文的 Itô-Laplace 框架审视 HOIF 在 Gaussian diffusion 泛函设定下的可移植性。Follow-up 判断：中期可做——需先在 moderately_familiar 的 HOIF 理论上长肌肉，尝试将 HOIF 的高阶矩逼近逻辑与本文的 Laplace 变换/Itô 公式结合，看能否在更一般的 semiparametric 泛函极限分布中给出密度近似。

5. 10.3150/24-bej1735 · arXiv — Inference in balanced community modulated recursive trees¶

作者: Anna Ben-Hamou, Vasiliki Velona
期刊/来源: Bernoulli
机构: Sorbonne Université · Hebrew University of Jerusalem · Institute of Mathematical Sciences
分类: vol 31 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 在平衡社区调制随机递归树（BCMRT）模型下，节点按时间以异质/同质偏好（参数 q）依次附着，目标是推断社区混合参数 q 及节点分区。由于不同 q 下的极限度分布重合，度统计量无法用于推断，作者转向时间标签与树结构信息。在有标签（观测到达时间但未知类型）设定下，构造了 q 的一致估计量并给出两值 q 间假设检验的可行性界；当 q 足够小时，虽聚类算法与最小公平二分问题（NP-hard）紧密相关且时间指数级，仍可实现与真实分区相关的聚类。在无标签（仅观测树结构）设定下，通过对距离和统计量的精细分析，证明检验不同 q 可严格优于随机猜测。对您有用：本文将假设检验可行性界与计算复杂性（NP-hard / 指数时间算法）显式连接，为统计-计算权衡方向提供了随机图模型上的具体案例。
关键技术: random recursive tree, community detection, sum-of-distances statistic, hypothesis testing feasibility bounds, minimum fair bisection, NP-hard clustering
为什么对您有用: 直接连接到统计-计算权衡（primary interest）：本文显式刻画了推断 q 的统计可行性界，同时指出聚类算法与 NP-hard 问题等价、需指数时间，构成了典型的信息-计算缺口案例。用您 very_familiar 的 minimax bounds for estimation problems 可审视其检验可行性界是否紧；但分析计算下界（证明多项式时间不可达）所缺的 average-case hardness / low-degree likelihood ratio 机器不在武器库中。中期可做：需先在 moderately_familiar 的 M-estimation theory 或长肌肉于 low-degree polynomial barrier 工具，才能将本文的指数时间聚类缺口升级为严格的多项式时间下界。

统计计算 / 算法 (stat_computing, 3 篇)¶

1. 10.3150/23-bej1637 · arXiv — An efficient averaged stochastic Gauss-Newton algorithm for estimating parameters of nonlinear regressions models¶

作者: Peggy Cénac, Antoine Godichon-Baggioni, Bruno Portier
期刊/来源: Bernoulli
机构: Université de Bourgogne · Institut de Mathématiques de Bourgogne · Institut de Mathématiques de Bordeaux · Laboratoire de Probabilités et Modèles Aléatoires · Laboratoire de Probabilités, Statistique et Modélisation · Ludlum Measurements (United States) · Laboratoire de Mathématiques Blaise Pascal · Laboratoire de Mathématiques de l'INSA de Rouen 等
分类: vol 31 · issue 1
相关性 4/10 · novelty: new_method
摘要: 本文针对非线性回归模型的参数估计问题，提出了一种在线随机高斯牛顿（Stochastic Gauss-Newton）算法及其平均版本（Averaged Stochastic Gauss-Newton），以应对海量序贯数据场景。传统的随机梯度及其平均版本在Hessian矩阵特征值尺度差异大时表现敏感，而高斯牛顿步长利用二阶信息可缓解此问题。算法在每一步仅需计算梯度与近似Hessian的逆，计算成本线性于数据量。作者证明了平均随机高斯牛顿估计量的渐近正态性及渐近效率，即其协方差达到Cramér-Rao下界。仿真实验验证了算法在有限样本下的优良表现，尤其对初始化不敏感。本文属于统计计算中在线优化方法的理论贡献，与您的主要兴趣“统计计算（数值方法与算法）”直接相关，为处理连续到达数据的参数估计提供了可证明高效的递归工具。
关键技术: Stochastic Gauss-Newton, averaged algorithm, recursive estimation, asymptotic efficiency, nonlinear regression
为什么对您有用: 本文属于统计计算领域的在线算法研究，直接对应您的主要兴趣“统计计算（数值方法与算法）”。其提出的平均随机高斯牛顿算法在理论上达到渐近效率，可视为处理连续数据流参数估计的可靠工具。您对高维统计和估计理论非常熟悉，可轻松理解其渐近分析，并考虑将该算法扩展至高维或半参数模型；报告中的分析工具（如鞅差收敛定理）也在您的武器库覆盖范围内。综上，本文值得阅读全文以了解具体实现与理论证明细节（立即可做）。

2. 10.3150/24-bej1730 · arXiv — Parameter estimation with increased precision for elliptic and hypo-elliptic diffusions¶

作者: Yuga Iguchi, Alexandros Beskos, Matthew Graham
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 4/10 · novelty: new_method
摘要: 本文针对离散观测扩散过程的参数估计问题，提出了一种统一的似然推断框架。首先为椭圆型和亚椭圆型SDE分别构造了两类弱二阶抽样格式，并给出格式过渡密度的小时间展开作为真实不可处理密度的近似。然后建立了基于该近似密度的极大似然和贝叶斯估计的理论性质，包括估计量的渐近偏差和方差表达式，展示了所提格式相比传统一阶格式在参数精度上的提升。数值实验覆盖了经典频率推断和贝叶斯推断，验证了理论结果。本文对从事统计计算的学者有一定参考价值：可了解SDE数值方法与似然推断的结合，以及弱二阶格式的设计与理论分析。
关键技术: weak second order schemes, hypo-elliptic SDEs, small-time density expansion, likelihood-based estimation, discrete-time approximation, Bayesian inference
为什么对您有用: 本文属于统计计算（numerical methods）方向的成果，直接覆盖您的主要兴趣。但目前您的技术武器库中缺乏随机微分方程专门工具（如弱格式、小时间展开），无法立即代入核心方法；中期可考虑补充SDE数值模拟和渐近理论（moderately_familiar 中暂未覆盖），再评估可迁移性。

3. 10.3150/24-bej1737 · arXiv — Sampling using adaptive regenerative processes¶

作者: Hector McKimm, Andi Wang, Murray Pollock, Christian Robert, Gareth Roberts
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 3/10 · novelty: new_method
摘要: 在自适应再生MCMC框架下，目标是构造以目标分布π为不变分布的Markov过程，核心设定是在Brownian motion上以速率κ从再生分布μ进行再生。传统方法需预先固定μ并计算常数C，两者在实践中均困难且影响采样效率。本文提出自适应算法，通过向μ逐步添加点质量（point masses）来动态调整再生分布，使过程尽可能少地再生，同时完全免除了对常数C的计算需求。理论部分证明了该自强化过程（self-reinforcing process）的收敛性；数值实验表明，自适应机制能有效抵御固定μ的劣质选择，并在π偏态时显著降低Monte Carlo期望估计的误差。对您可能有用：若在因果推断或高维推断的MCMC计算中遇到偏态后验或常数C难求的问题，此自适应再生机制提供了一种绕开C计算的算法思路。
关键技术: regenerative Markov process, adaptive regeneration distribution, self-reinforcing process convergence, point mass adaptation, Monte Carlo expectation estimation
为什么对您有用: 本文属于统计计算（MCMC算法设计）方向，与您primary interest中的statistical computing子方向直接相连。您武器库中的software development与very_familiar的数值方法可以直接攻这篇paper的算法实现与实验复现口子。Follow-up判断：立即可做——用您熟悉的软件开发与数值计算工具即可实现该自适应再生算法并在偏态目标分布上做benchmark验证。

其他 (other, 5 篇)¶

1. 10.3150/23-bej1688 · arXiv — Poisson approximation of Poisson-driven point processes and extreme values in stochastic geometry¶

作者: Moritz Otto
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 3/10 · novelty: new_theory
摘要: 本文研究泊松过程驱动的点过程的泊松极限定理，这类点过程由底层泊松过程的点组中心构成，可用于随机几何中描述几何功能超标的极值行为。作者通过将点过程与其Palm版本耦合，证明了一个一般的泊松极限定理。随后将该定理应用于随机k近邻球的最大体积含量，得到了其渐近分布的Gumbel极限。结合随机镶嵌中大规模胞体渐近形状的理论，进一步建立了泊松-Voronoi和泊松-Delaunay镶嵌中胞体中心的泊松极限定理，并由此导出最大胞体尺寸（关于一般尺寸泛函）的Gumbel极限分布。本文贡献属于概率论与随机几何的纯理论范畴，未涉及统计推断或方法学。
关键技术: Poisson point process, Palm distribution, coupling, extreme value theory, Voronoi tessellation, k-nearest neighbor balls
为什么对您有用: 本论文与您的主要研究兴趣（因果推断、高维统计、U统计、半参理论等）及次要兴趣（天文、经济、流行病学）均无直接联系。其中使用的泊松逼近与Palm耦合技术虽为概率论工具，但与您武器库中当前工具（非参统计、U统计计算等）无技术交集。不推荐深入阅读。

2. 10.3150/24-bej1728 · arXiv — Independence preserving property of Kummer laws¶

作者: Angelo Efoévi Koudou, Jacek Wesołowski
期刊/来源: Bernoulli
机构: Institut Élie Cartan de Lorraine · Université de Lorraine · Warsaw University of Technology
分类: vol 31 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文研究正独立随机变量在特定非线性变换 ψ_{α,β} 下保持独立性的刻画问题，目标 estimand 是联合分布的乘积结构。设定为 X,Y 正独立非退化，变换后 (U,V)=ψ_{α,β}(X,Y) 独立当且仅当 X,Y 服从参数匹配的 Kummer 分布。核心机制利用 Croydon-Sasada (2020) 的 lattice recursion 模型与 invariant measure 理论，将独立性刻画转化为不变测度的乘积结构判定。理论结果统一了若干已知极限特例（Lukacs, Kummer-Gamma, Matsumoto-Yor, discrete KdV 模型）的独立性刻画。本文属于概率论与数学物理的 characterization 定理，对您可能有用之处在于：若未来研究 higher-order U-statistics 的非线性核函数独立性或随机矩阵特征值的极限独立性结构，Kummer 律的乘积不变性可提供特殊分布族的参考。
关键技术: Kummer distribution characterization, lattice recursion invariant measure, independence preserving transformation, Croydon-Sasada scheme, Matsumoto-Yor property
为什么对您有用: 本文属于概率分布刻画（characterization）与数学物理（lattice recursion / discrete KdV），与您 primary interests 中的因果推断、高维 RMT、效率理论等无直接技术交集。武器库中的 minimax bounds、HOIF、tensor contraction 等均无法直接攻入此概率刻画问题。follow-up 判断：暂不可做——核心机器（lattice recursion 不变测度理论、特殊函数族的 characterization 技术）不在武器库中，且该方向与您当前研究主线偏离较大，不建议花时间深读全文。

3. 10.3150/24-bej1741 · arXiv — Optimal stopping of the stable process with state-dependent killing¶

作者: Kees van Schaik, Alexander R. Watson, Xin Xu
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 1/10 · novelty: new_theory
摘要: 本文研究带状态依赖杀灭率的稳定 Lévy 过程的最优停止问题，杀灭率被设定为使杀灭后过程保持自相似性，以此作为破产模型。核心机制是通过刻画与该稳定过程关联的自相似 Markov 过程（self-similar Markov process），利用 Lamperti 变换与正交变换将问题转化为常系数扩散的停止问题。最优停止策略为首次进入某特定区间时停止，该区间阈值由模型参数显式给出。理论结果完全基于 Markov 过程的轨道性质与尺度函数（scale function）解析，未涉及统计推断或估计问题。对您而言，本文属于纯概率论最优停止，与因果推断或高维统计等 primary interests 无直接交集。
关键技术: stable Levy process, self-similar Markov process, Lamperti transformation, optimal stopping, state-dependent killing
为什么对您有用: 本文属于纯概率论与随机过程领域，与您 primary interests（因果推断、高维/RMT、半参/效率理论、U-statistics）及 secondary interests（天文、经济、流行病学）均无方法或数据交集。您的 technical_arsenal（minimax bounds、U-statistics、causal estimation）无法切入该论文的 Markov 过程轨道分析口子。暂不可做：核心机器（Lévy 过程的尺度函数解析与 Lamperti 变换）不在武器库里，且该方向与您当前研究议程无连接，不建议花时间读全文。

4. 10.3150/24-bej1742 · arXiv — Tail probability of maximal displacement in critical branching Lévy process with stable branching¶

作者: Haojie Hou, Yiyang Jiang, Yan-Xia Ren, Renming Song
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 1/10 · novelty: weaker_assumption
摘要: 该论文研究临界分支 Lévy 过程的最大位移的尾概率。考虑分支率为β>0、后代分布{p_k}及空间运动{ξ_t, Π_x}的临界分支 Lévy 过程，在假设后代分布具有α∈(1,2)的稳定型尾部（即lim_{n→∞} n^α ∑_{k=n}^∞ p_k =κ∈(0,∞)），且空间运动满足相关矩条件下，推导了最大位移M的尾概率渐近形式。该结果推广了Sawyer和Fleischman(1979)关于分支布朗运动以及Lalley和Shao(2015)关于分支随机游走的主要结论，此前这些结论均假定后代分布的三阶矩有限。论文的核心技术工具包括分支过程、Lévy过程的波动理论以及尾部概率的精细渐近分析。与您的研究兴趣（因果推断、高维统计、半参数理论、统计计算等）无直接关联，属于概率论领域的纯理论研究。
关键技术: branching Lévy process, stable branching, tail probability asymptotics, maximal displacement, critical branching, heavy-tailed offspring distribution
为什么对您有用: 该论文属于概率论分支过程的理论研究，与您的主、次研究兴趣（因果推断、高维统计、U-统计量、半参数理论、效率理论、统计计算、天体统计、经济理论、流行病学）均无直接交叉。论文的方法（分支Lévy过程的波动理论、稳定尾假设下的渐近分析）不在您current technical arsenal的工具范围内，且未提供可直接迁移的统计推断方法或应用背景。因此，这不属于您日常需要关注的论文，建议跳过阅读。

5. 10.3150/24-bej1739 · arXiv — Synchronisation for scalar conservation laws via Dirichlet boundary¶

作者: Ana Djurdjevac, Tommaso Rosati
期刊/来源: Bernoulli
分类: vol 31 · issue 1
相关性 0/10 · novelty: new_method
摘要: 该论文研究 Dirichlet 边界条件下的标量守恒律的同步现象，属于偏微分方程和动力系统的数学理论。作者提供了一个初等证明，不依赖于严格最大值原理，而是基于边界耗散的定量估计。他们识别了一个强制条件，使得估计在初始条件上一致，通过构造适当的超解和子解。在没有强制条件的情况下，结果基于 Lp 能量估计和 Lyapunov 结构。这是纯理论分析，不涉及统计模型、数据或推断方法。对统计学研究者而言缺乏应用背景和方法学连接。
关键技术: geometric synchronisation, coercivity condition, Lyapunov structure, Lp energy estimates
为什么对您有用: 该论文与研究者任何兴趣方向（因果推断、高维统计、非参数/半参数理论等）均无关联，属于纯数学领域。研究者当前的技术武器库（如高维渐近、U统计量等）无法直接应用。建议跳过，不深入阅读。

Maintained by 陈星宇 · Homepage · Source on GitHub