Bernoulli — Vol 30 Issue 1 · 2026-06-23¶

共 28 篇 · Bernoulli
目录核对 ⚠️ 疑似漏 5 篇（对照 OpenAlex 33 篇）：10.3150/23-bej1608、10.3150/23-bej1603、10.3150/23-bej1594、10.3150/23-bej1599、10.3150/23-bej1592

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期《Bernoulli》第30卷第1期的28篇论文主要覆盖五条主线：高维随机矩阵与谱推断（6篇）、假设检验（6篇）、非参数与半参数方法（10篇）、因果推断与图模型（1篇），以及概率论与随机过程/计算（5篇）。高维随机矩阵条目最多，集中处理信号加噪声矩阵的特征值与特征向量渐近分布，并拓展到相关矩阵对数、自归一化和、线性回归ℓ∞估计以及Lévy驱动过程稀疏估计。假设检验线则聚焦于维度无关推断、多重检验相依性、基于图的二样本检验、污染模型检验以及相依数据CLT，统一特征是对检验统计量在宽泛设定下建立中心极限定理。非参数/半参数线内容最杂，可进一步分为高维非参数回归（信号检测与神经网络）、函数型数据分析（函数回归与FARMA）、极值统计（极端值降维与异方差时间序列）、以及低秩量子态/平面点过程等交叉方向。此外，因果推断与图模型仅有一篇，涉及树结构鲁棒可识别性；统计计算有一篇，给出几何遍历马尔可夫链谱理论显式界。

高维随机矩阵主线中，Tracy-Widom law一文将信号矩阵从低秩推广至满秩，允许M/N→c∈(0,1]，利用线性谱统计量与Gaussian近似证明最大特征值收敛到TW_1分布。Entrywise limit theorems则在弱信号区域（nρ_n∝log n）建立特征元逐元素Berry-Esseen界，并应用于对称噪声矩阵补全与随机图推断。Logarithmic law of correlation matrices给出样本相关矩阵对数行列式在p/n→γ下的CLT，渐近方差表达式可用于非相关检验。CLT for self normalized sums放宽矩条件至多项式阶，在超矩形类上得到UCLT，并获近经典Berry-Esseen速率。Non-asymptotic bounds for ℓ∞ estimator研究均匀噪声下Chebyshev估计量的ℓ2误差，并推广出Chebyshev's LASSO。On Lasso and Slope drift estimators则在Lévy驱动OU过程中证明了Lasso和Slope的极小极大最优速率。这些工作共同展示了随机矩阵工具在特征值、特征向量与参数估计中的前沿拓展。

假设检验主线中，Dimension-agnostic inference使用cross U-statistics，通过样本分割与自归一化丢弃对角块，使得检验统计量在任意d/n比例下收敛到标准正态。Central limit theorem for BH程序在因子模型框架下刻画FDP的burstiness，证明大量强长程相关时跨越控制的现象。Limiting distributions of graph-based tests建立了从稀疏到稠密图的统一渐近理论，放松图正则性要求。Two-sample contamination model test提出Inversion-Best Matching方法构造半参数Cramér-von Mises统计量，无需调参。CLTs for high dimensional dependent data对α-混合、m-相依及物理依赖度量三种框架建立Gaussian近似误差界，并给出bootstrap程序。Refined behaviour of a conditioned random walk则用指数倾斜给出条件分布的一阶修正，属于大偏差精细结果。该线核心工具是U-统计量、经验过程、因子模型谱分析与集中不等式。

非参数/半参数线中，Linear and nonlinear signal detection在部分线性模型下联合选择线性与非线性成分，使用带宽正则化与SCAD惩罚。Tail inverse regression提出TIREX框架，通过尾部经验过程估计极端值充分降维空间。Statistical inference for function-on-function regression采用RKHS与薄板样条，获得系数函数极小极大速率及Bahadur表示。Convergence rates for shallow neural networks证明仅调整外权重时梯度下降可达接近1/√n的L2收敛率。High dimensional Bernoulli distributions用代数理想刻画同均值Bernoulli分布类凸集，用于极值点搜索与凸序下界。Estimation of functional ARMA模型结合FPCA降维与低维ARMA参数估计。Statistics for heteroscedastic time series extremes将scedasis函数核估计推广到序列依赖极值，并提供bootstrap检验。Flexible-bandwidth needlets在球面构造灵活带宽小波系统，证明新系数的渐近不相关性。Normality of smooth statistics for planar DPP在有限方差下建立CLT，利用reproducing property替代解析性假设。Minimax estimation of low-rank quantum states通过量子局部渐近等价将实验逼近为混合模型，获得线性泛函的minimax最优估计。

与因果推断最贴合的为Tree structured models的鲁棒可识别性。与半参数效率相关的是High-dimensional nonparametric regression中的部分线性估计、Function-on-function regression的RKHS推断，以及Random matrix entrywise limit theorems中应用于推断的对称噪声矩阵补全。高维方向中，Dimension-agnostic inference适用于任意维度，Non-asymptotic bounds for ℓ∞ estimator与Lasso/Slope for Lévy-driven OU均涉及高维稀疏估计，而各随机矩阵论文则为高维谱推断提供理论工具。

因果推断 (causal_inference, 1 篇)¶

1. 10.3150/22-bej1477 — Identifiability in robust estimation of tree structured models¶

作者: Marta Casanellas, Marina Garrote-López, Piotr Zwiernik
期刊/来源: Bernoulli
机构: Universitat Politècnica de Catalunya · Max Planck Institute for Mathematics in the Sciences · Max Planck Institute for Mathematics · University of Toronto
分类: vol 30 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 本文研究树结构图模型在鲁棒估计下的可识别性问题。作者考虑观测数据可能来自错误指定模型或受污染的情形，探讨树结构参数是否仍可能唯一识别。通过代数统计方法，文章给出了树结构可识别性的充分条件，尤其是在协方差结构满足特定代数约束时。主要结果表明，即使分布偏离假设，树的拓扑结构仍可从观测协方差矩阵中恢复。文章还讨论了潜在变量存在时的扩展。这项工作为因果推断中图形模型的结构学习提供了理论保证。对您而言，本文直接关联到因果推断中基于图模型的识别性理论，有助于理解当模型假设不满足时识别性是否依然成立。
关键技术: tree structured graphical models, identifiability conditions, robust estimation, algebraic statistics, covariance matrix analysis
为什么对您有用: 本文研究树结构因果模型在模型错误指定下的可识别性，直接关联到您的主要兴趣方向——因果推断中的识别理论。您中度熟悉的因果识别理论可用于分析本文的条件，但具体使用的代数统计工具（如簇、多项式环）不在您当前的武器库中，因此属于中期可做的方向：需先在因果识别理论上深入，尤其是图模型识别性的代数方法。通过攻读本文，您可以拓展对因果模型在鲁棒条件下识别性的理解，并为后续开发更稳健的因果推断方法奠定基础。

高维统计 / 随机矩阵 (high_dim_rmt, 6 篇)¶

1. 10.3150/23-bej1604 · arXiv — Tracy-Widom law for the extreme eigenvalues of large signal-plus-noise matrices¶

作者: Zhixiang Zhang, Yiming Liu, Guangming Pan
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 该文研究信号加噪声矩阵 Y = R + X 的极端特征值渐近分布，其中 R 为满秩对角矩阵（信号矩阵），X 为 i.i.d. 噪声矩阵。与常见低秩信号设定不同，本文允许 R 满秩，这在实际应用中（如多重主成分分析）更为一般。在 M/N→c∈(0,1] 的高维渐近框架下，作者建立了 YY* 最大特征值经适当位移和缩放后依分布收敛到 Tracy-Widom 分布 (TW_1)。证明依赖于随机矩阵理论中的线性谱统计量方法、矩方法及 Gaussian 近似技术，关键步骤包括对信号矩阵特征值分布的细致刻画和残差项的指数型集中不等式。该结果显著推广了经典零噪声或低秩信号下的 Tracy-Widom 定律，并为信号检测与高维假设检验提供了新的临界值理论基础。对您而言，该文直接触及您对随机矩阵理论（primary interest）的兴趣，且其满秩设定下的渐近推理技术可借助您熟悉的 high-dimensional asymptotics 工具深入理解。
关键技术: Tracy-Widom law, signal-plus-noise matrix, extreme eigenvalues, random matrix theory, high-dimensional asymptotics, moment method
为什么对您有用: 该文直接对应您 primary interest 中的随机矩阵理论方向，特别是满秩信号矩阵下的特征值极限分布，这是经典低秩结果的重要推广。您武器库中的 high-dimensional asymptotics（very_familiar）足以支撑您理解其渐近分析主线，并可尝试将其中满秩条件下的线性谱估计技巧迁移至您感兴趣的更高阶 U-statistics 的谱分析。立即可做：利用您已有的高维渐近知识完整复现该文的证明骨架。

2. 10.3150/23-bej1602 · arXiv — Entrywise limit theorems for eigenvectors of signal-plus-noise matrix models with weak signals¶

作者: Fangzheng Xie
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 本文针对一类广泛的信号加噪声随机矩阵模型，在弱信号区域（nρ_n 以 log n 的速率增长）建立了特征向量逐元素的有限样本 Berry-Esseen 定理。核心技术贡献是一个尖锐的有限样本特征向量扰动界，改进了以往工作中对高阶余项的 two-to-infinity 范数估计，从而在信号强度仅为对数阶时仍能保证渐近正态性。该逐元素分析结果被应用于三个具体问题：对称噪声矩阵完成、随机点积图，以及两个随机图推断任务（混合隶属随机块模型中的纯节点估计和潜在位置相等的假设检验）。理论证明依赖精细的随机矩阵扰动和集中不等式。对于您的高维统计与随机矩阵理论研究，该结果直接填补了弱信号下特征向量推断的理论空白，并为假设检验提供了可操作的渐近分布。
关键技术: Berry-Esseen theorem, entrywise eigenvector perturbation, two-to-infinity norm, signal-plus-noise matrix model, random dot product graphs, mixed membership stochastic block models
为什么对您有用: 直击您 primary interest 中的高维统计/随机矩阵理论：本文为弱信号（nρn ~ log n）下特征向量提供逐元素正态逼近与有限样本 Berry-Esseen 界，与您熟悉的极大极小界和渐近分析完全兼容。武器库中“高维渐近”和“逆问题”工具可直接用于验证其 bound 的紧性，且文中假设检验应用可直接衔接您对 hypothesis testing 的兴趣。立即可做：读通定理后即可将 entrywise 扰动技术迁移到您关心的其他弱信号矩阵问题（如因子模型）。

3. 10.3150/23-bej1600 · arXiv — Logarithmic law of large random correlation matrices¶

作者: Nestor Parolya, Johannes Heiny, Dorota Kurowicka
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 9/10 · novelty: new_theory
摘要: 本文研究高维样本相关矩阵的对数行列式在 p/n→γ∈(0,1] 条件下的中心极限定理。假设总体相关矩阵谱范数有界且 x_i 具有有限四阶矩，推导出渐近均值和方差的显式公式。当总体均值未知时，使用经验均值中心化后的结果仅使渐近均值产生偏移。该 CLT 进一步应用于检验 p 个随机变量的非相关性：在原假设 R=I 下，检验统计量完全枢轴化，且仿真表明四阶矩不存在时 CLT 仍成立。这一结果对厚尾高维数据的假设检验具有鲁棒性，属于随机矩阵理论与非正态高维统计的交叉贡献。对您的价值：直接连接您在高维统计与随机矩阵理论的主要兴趣，特别是为相关结构的假设检验提供了可操作的渐近工具。
关键技术: Random matrix theory, Central limit theorem for log determinant, Sample correlation matrix, High-dimensional asymptotics, Testing uncorrelatedness, Fourth moment condition
为什么对您有用: 直接对应您在高维统计与随机矩阵理论方向的主要兴趣，特别是基于样本相关矩阵对数行列式的 CLT 提供了新的检验框架。您非常熟悉高维渐近理论，因此可以立即理解其推导并评估其在您的假设检验工作中的适用性，属于“立即可做”的范畴。

4. 10.3150/23-bej1597 · arXiv — Central limit theorem and near classical Berry-Esseen rate for self normalized sums in high dimensions¶

作者: Debraj Das
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 7/10 · novelty: new_theory
摘要: 本文在高维框架下研究自归一化和向量T_n（每个分量为sum X_ij / sqrt(sum X_ij^2)）在超矩形类上的均匀中心极限定理（UCLT）。核心目标是放宽传统高维CLT所需的指数阶矩条件至多项式矩条件。作者证明，仅需各分量存在2至4阶多项式矩，即可保证维度p随样本量n指数增长时UCLT成立，且log p的最优增长率不能超过o(n^{1/2})，即使分量有界也无法改进。此外，在X_ij存在(2+κ)阶绝对矩（0<κ≤1）的条件下，建立了n^{-κ/2}量级的Berry-Esseen界，并在κ=1时证明该界最优。技术工具包括自归一化和的渐近展开、耦合论证及高维概率集中不等式。该结果可直接应用于分量wise的t统计量，为高维假设检验（如多重比较）提供理论支撑。对您而言，本文在高维渐近理论（very_familiar）中推进了自归一化和的极限分布知识，立即可用于评估高维t检验的精度。
关键技术: self-normalized sums, high-dimensional central limit theorem, Berry-Esseen bound, uniform convergence over hyper-rectangles, moment conditions relaxation, Student's t-statistic
为什么对您有用: 本文直接连接您对高维统计（high-dimensional asymptotics）的兴趣，特别是自归一化和的极限理论——这是高维t检验和多变量推断的基础。您非常熟悉的high-dimensional asymptotics工具可以直接理解并应用其最优矩条件和Berry-Esseen界，例如在设计高维t统计量的正态逼近时利用其速率结论。立即可做：将结果纳入高维假设检验的误差控制分析（如多重比较校正）。

5. 10.3150/23-bej1607 · arXiv — Non-asymptotic bounds for the ℓ∞ estimator in linear regression with uniform noise¶

作者: Yufei Yi, Matey Neykov
期刊/来源: Bernoulli
机构: Carnegie Mellon University
分类: vol 30 · issue 1
相关性 6/10 · novelty: new_theory
摘要: 本文研究线性回归中 Chebyshev 估计量（ℓ∞ 最小化）的非渐近理论，假设误差服从均匀分布 U([−a,a])。目标是为高维设定下 ℓ∞ 估计量的 ℓ2 估计误差提供以高概率成立的上界，并讨论其 minimax 最优性。在随机设计矩阵满足较温和假设的条件下，推导出估计误差以高概率不超过 C_p/n，其中 C_p 依赖于维数 p 和设计分布。进一步展示了在某些设计下 Chebyshev 估计量接近 minimax 最优，但在另一些设计下常数 C_p 对 p 的依赖可能次优。此外，对于稀疏高维情形，提出了“Chebyshev's LASSO”，在均匀噪声下比经典 LASSO 有更快的估计速率，具体依赖于稀疏度和环境维数相对于样本量的增长速度。该工作为 ℓ∞ 损失回归提供了有限样本保证，补充了已有的渐近理论。您对高维统计和 minimax 界的熟悉度能直接理解其技术贡献；而其中关于 estimator 速率与设计结构的关系，也可能启发您在因果推断中处理类似的高维线性设定。
关键技术: ℓ∞ estimator, non-asymptotic bounds, uniform noise, high-dimensional regression, minimax optimality, Chebyshev LASSO
为什么对您有用: 论文核心是高维线性回归中 ℓ∞ 估计的非渐近界，直接连接您的「高维统计」子方向。您技术库中的「minimax bounds for estimation problems」与「high-dimensional asymptotics」可直接用于验证文中界是否紧，并考虑推广到其他误差分布（如 sub-Gaussian）。立即可做：凭借对 minimax 理论和非参数统计的熟悉，您能立即评估该结果的 sharpness 并尝试拓展其常数依赖。

6. 10.3150/22-bej1574 · arXiv — On Lasso and Slope drift estimators for Lévy-driven Ornstein–Uhlenbeck processes¶

作者: Niklas Dexheimer, Claudia Strauch
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 6/10 · novelty: sharper_rate
摘要: 本文研究高维Lévy驱动的Ornstein–Uhlenbeck过程在稀疏假设下的漂移参数估计问题。目标是在高维框架下，利用Lasso和Slope估计量恢复漂移向量的非零元素。与标准OU过程的结果相比，本文在调参独立于置信水平的前提下，证明了Lasso和Slope均能达到极小极大最优收敛速率（仅相差数值常数）。结果是非渐近的，在概率意义下成立，且在限制特征值条件的事件上条件期望中也成立。技术核心包括对Lévy过程跳跃行为的处理以及限制特征值条件的验证。对您而言，该工作直接丰富了高维统计中稀疏估计的渐近下界理论，且您熟悉的极小极大界与非渐近分析工具可轻松复现其核心论证。
关键技术: Lasso, Slope, restricted eigenvalue condition, minimax optimal rate, nonasymptotic bounds, Lévy-driven Ornstein–Uhlenbeck process
为什么对您有用: 该论文直接连接您高维统计中稀疏估计与限制特征值条件的方向。您的‘minimax bounds for estimation problems’和‘high-dimensional asymptotics’两项武器完全能覆盖其理论证明，属于立即可读的文献。本文虽未直接涉及随机矩阵理论，但限制特征值条件的概率论证可启发您在高维时间序列中的后续工作。

非参数 / 半参数 (nonparam_semipara, 10 篇)¶

1. 10.3150/23-bej1611 — Linear and nonlinear signal detection and estimation in high-dimensional nonparametric regression under weak sparsity¶

作者: Kin Yap Cheung, Stephen M.S. Lee, Xiaoya Xu
期刊/来源: Bernoulli
机构: University of Hong Kong
分类: vol 30 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文在高维非参数回归框架下研究线性与非线性信号的检测与估计问题，设定中信号强度按渐近阶连续缩放，并允许大量不可检测的弱信号存在（weak sparsity）。作者提出一种结合带宽正则化（选择非线性成分）与 SCAD 惩罚（选择线性成分）的惩罚回归方法，在部分线性模型设定下同时检测强线性与非线性信号。理论贡献包括强信号检测的一致性以及回归函数估计的误差速率，核心工具涉及高维 M-estimation 的 oracle property 与非参数收敛速率分析。数值模拟展示了方法在有限样本下的表现。对您有用之处在于：这是高维半参数模型变量选择的一个新视角，与您 primary interest 中的 semiparametric theory 和 high-dimensional statistics 直接相关。
关键技术: partially linear model, SCAD penalization, bandwidth regularization, weak sparsity, oracle property, high-dimensional variable selection
为什么对您有用: 直接连接到您 primary interest 中的 semiparametric theory（部分线性模型设定）与 high-dimensional statistics（高维变量选择）。您武器库中 very_familiar 的 minimax bounds for estimation problems 可用于审视本文声称的估计误差速率是否紧，moderately_familiar 的 M-estimation theory 可帮助深入理解其 oracle property 的证明细节。立即可做：用您熟悉的 minimax bound 工具验证其估计速率的 sharpness，或用 nonparametric statistics 视角分析其带宽正则化的理论性质。

2. 10.3150/23-bej1606 — Tail inverse regression: Dimension reduction for prediction of extremes¶

作者: Anass Aghbalou, François Portier, Anne Sabourin, Chen Zhou
期刊/来源: Bernoulli
机构: Télécom Paris · Laboratoire Traitement et Communication de l’Information · École Nationale de la Statistique et de l'Analyse de l'Information · Centre de Recherche en Économie et Statistique · Centre National de la Recherche Scientifique · Université Paris Cité · Mathématiques Appliquées à Paris 5 · Tinbergen Institute 等
分类: vol 30 · issue 1
相关性 7/10 · novelty: new_method
摘要: 本文聚焦于极端值预测中的监督降维问题。设定中，目标变量Y的极端值（高于高阈值）由高维协变量X解释，目标是找到一个低维投影子空间，使得在此子空间上条件独立于Y的极端事件。作者提出了“尾部条件独立性”（Tail Conditional Independence）的新定义，并受切片逆回归（SIR）启发，开发了TIREX（Tail Inverse Regression for EXtreme response）框架用于估计该极端充分降维空间。方法的核心是通过尾部经验过程构建基于逆矩的估计量，并采用分位数回归和极值阈值选择技术。理论方面，证明了所涉及的尾部经验过程的弱收敛性，进而建立估计量的相合性和渐近正态性。模拟和真实数据实验表明，TIREX在极端区域中的降维效果优于经典SIR，尤其适用于保险、金融等极端事件预测场景。对于您的高维统计与非参数理论兴趣，该方法展示了一种将非参数经验过程工具与极值理论结合的降维策略，其理论分析路径可迁移至您熟悉的极值渐近和非参数约束框架下。
关键技术: Sliced Inverse Regression (SIR), Tail Conditional Independence, extremal conditional quantile estimation, tail empirical processes, weak convergence in extreme value theory, dimension reduction for heavy-tailed distributions
为什么对您有用: (1) 该方法属于高维降维的前沿，直接连接您在高维统计与非参数理论中的典型工具（经验过程、弱收敛、极值渐近）。(2) 武器库中‘非参数统计’和‘高维渐近’两项可立即用于复现其理论证明中的收敛速率推导，或验证其估计量的极值门限敏感性。(3) 立即可做：您可尝试将其极端充分降维估计量与您熟悉的U-统计量框架结合，例如评估降维后极端分布的不确定性；中期可做：若能进一步深入极值理论的协变量选择机制，需先加强对‘极值分位数回归’的理解（目前moderately_familiar范围）。

3. 10.3150/23-bej1598 · arXiv — Statistical inference for function-on-function linear regression¶

作者: Holger Dette, Jiajun Tang
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 6/10 · novelty: new_method
摘要: 本文研究函数对函数线性回归的统计推断问题，即响应变量和预测变量均为函数时的回归模型。采用再生核希尔伯特空间（RKHS）方法，通过薄板样条光滑惩罚的惩罚最小二乘估计系数函数。获得了系数函数估计量的极小极大最优收敛速度，并推导了Bahadur表示，为推断提供基础。利用Banach值随机变量在一致范数下的收敛性质，提出了基于bootstrap的统计推断方法。通过模拟实验和真实数据分析验证了方法的有效性和理论结果。该方法为函数型数据回归分析提供了完整的推断框架，对非参数和半参数统计学有参考价值。其中系数函数的估计和推断技术可与研究者熟悉的高阶U-统计量或半参数方法结合，拓展到更复杂的函数型因果推断问题。
关键技术: Reproducing kernel Hilbert space, Thin-plate spline penalty, Penalized least squares, Bahadur representation, Bootstrap inference, Minimax-optimal convergence rate
为什么对您有用: 本文属于函数型数据回归的非参数推断，与研究者的非参数统计和半参数理论兴趣直接相关。研究者可以运用其熟悉的极小极大界工具来复现并验证本文的最优速率结果，并考虑将Bahadur表示推广到其他设定（如函数型因果效应估计）。从武器库出发，'nonparametric statistics'和'semiparametric theory'为非常熟悉，因此可立即可用这些工具深入理解本文的技术细节，并能尝试将方法迁移到函数型工具变量或纵向数据问题。

4. 10.3150/23-bej1605 · arXiv — Convergence rates for shallow neural networks learned by gradient descent¶

作者: Alina Braun, Michael Kohler, Sophie Langer, Harro Walk
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 5/10 · novelty: sharper_rate
摘要: 本文分析单隐层神经网络回归估计的L2收敛率，假设回归函数具有足够快的傅里叶衰减。在该假设下，证明如果初始内权重按均匀分布选取、外权重通过梯度下降更新，则估计可以达到接近1/√n的收敛率（仅差对数因子）。核心机制在于初始内权重的合适分布与仅调整外权重的策略，表明线性最小二乘足以替代梯度下降选取外权重。作者进一步提出线性最小二乘神经网络估计并给出理论保证，模拟实验显示该方法在多种情形下优于标准梯度下降。主要技术工具包括傅里叶分析、梯度流分析和最小二乘理论。该结果对非参数回归中的神经网络方法给出了清晰的理论速率，有助于理解浅层网络在光滑函数类上的统计表现。对于您的非参数统计和minimax界研究，可用minimax下界验证该率是否达到最优，或尝试放松傅里叶衰减条件至更一般的平滑类。
关键技术: shallow neural networks, Fourier decay assumption, gradient descent learning, least squares estimation, rate of convergence analysis
为什么对您有用: 该论文直接连接您的非参数统计兴趣子方向——非参数函数估计的收敛率理论。您very_familiar的minimax bounds工具可用于检验1/√n率是否为该类假设下的最优minimax率，也可尝试用相同框架处理其他光滑条件（如Sobolev类）。此外，文章中梯度下降与线性最小二乘的对比为理解计算-统计权衡提供了具体案例，您的非常高阶U-统计量计算视角可扩展到这类estimator的计算复杂度分析。立即可做：用minimax bound验证该率的最优性，或放松假设推导更宽类下的率。

5. 10.3150/23-bej1618 · arXiv — High dimensional Bernoulli distributions: Algebraic representation and applications¶

作者: Roberto Fontana, Patrizia Semeraro
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 本文研究具有相同均值 p 的 d 维 Bernoulli 分布类 F_d(p) 的代数表示问题，目标是在任意维度下解析地刻画该凸集的生成元。作者将 F_d(p) 映射到一个点理想（ideal of points），证明该分布类可由有限个简单多项式生成，从而给出显式的代数构造。两个应用：(1) 利用多项式生成元高效寻找高维情形下 F_d(p) 凸多面体的极值点；(2) 在边际分布给定但依赖结构未知的设定下，求解多元 Bernoulli 和的凸序下界。该工作属于数学统计基础范畴，对您理解高维离散分布的结构与边界可能有参考价值。
关键技术: algebraic statistics, ideal of points, convex polytope extremal points, convex order bounds, multivariate Bernoulli distributions, polynomial generators
为什么对您有用: 本文属于代数统计与高维离散分布的交叉，与您 primary interest 中的高维统计和非参数理论有一定距离。您武器库中的 minimax bounds 和 nonparametric statistics 对本文的代数几何工具（ideal、Gröbner basis 等）并不直接适用。暂不可做：核心机器（代数统计、理想理论）不在武器库中，需先系统学习代数统计基础才能跟进。

6. 10.3150/23-bej1591 — Estimation of functional ARMA models¶

作者: Thomas Kuenzer
期刊/来源: Bernoulli
机构: Graz University of Technology · Medical University of Graz
分类: vol 30 · issue 1
相关性 4/10 · novelty: new_method
摘要: 本文研究 Hilbert 空间中函数时间序列的 FARMA（ARMA_H）模型估计问题，目标是在弱正则条件下估计自回归和滑动平均算子。作者提出基于函数主成分分析（FPCA）降维的两步估计法：先将无穷维投影到有限维主成分子空间，再在低维空间估计 ARMA 参数。理论部分证明了估计量在最小假设下的一致性，并在更实用的设定下给出了收敛速率；关键工具包括谱分解的扰动分析和算子范数收敛。模拟显示该方法优于现有竞争方法。对您而言，这是函数数据分析与半参数/非参数理论的交叉，涉及无穷维参数估计的正则化策略。
关键技术: functional principal component analysis, Hilbert space ARMA models, operator norm convergence, dimension reduction regularization, spectral decomposition
为什么对您有用: 连接到 primary interest 中的 semiparametric and nonparametric theory——无穷维参数估计的正则化与收敛速率分析。您武器库中的 minimax bounds for estimation problems 可用于审视本文声称的收敛速率是否紧，以及是否可以建立更精确的 minimax 下界。中期可做：需先在 moderately_familiar 的 semiparametric theory 上补充算子估计的效率理论，才能切入更深的效率界或 adaptive estimation 问题。

7. 10.3150/22-bej1560 · arXiv — Statistics for heteroscedastic time series extremes¶

作者: Axel Bücher, Tobias Jennessen
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 4/10 · novelty: new_theory
摘要: 在异方差极值模型设定下，目标是估计 scedasis 函数（刻画极值方差随时间变化的强度）并检验极值是否同方差，关键假设是观测存在序列依赖。核心方法是 scedasis 函数的核估计与积分 scedasis 函数的经验过程估计，证明了局部极限定理和泛函极限定理，并建立了 bootstrap 方案的一致性用于同方差假设检验。技术工具包括 tail empirical process、sequential empirical process 在序列依赖下的渐近理论，以及 extremal index 的估计。主要理论贡献是将 Einmahl et al. (2016) 的独立设定推广到时间序列极值，对您在非参数理论方面的兴趣有参考价值。
关键技术: tail empirical process, sequential empirical process, kernel estimation, functional limit theorem, bootstrap consistency, extremal index estimation
为什么对您有用: 连接到非参数理论中的 empirical process 方法，特别是 sequential empirical process 在依赖数据下的渐近分析。您武器库中的 nonparametric statistics 和 minimax bounds 理论可以直接用来审视本文的收敛率是否紧；但本文的核心是极值理论（extreme value theory）框架，这一机器不在您的 familiar 列表中。中期可做：若想进入极值理论的非参数估计领域，需先在 moderately_familiar 的 semiparametric theory 基础上补充 extreme value theory 的基础（如 regular variation、POT 方法），但若您不打算深耕极值方向，本文可跳过。

8. 10.3150/22-bej1513 · arXiv — Flexible-bandwidth needlets¶

作者: Claudio Durastanti, Domenico Marinucci, Anna Paola Todino
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 3/10 · novelty: new_method
摘要: 本文在球面小波/needlets 框架下提出一种灵活带宽的推广构造，允许其频率域（多重极空间）的支撑集采用比传统矩形窗更一般的形式。作者引入一类依赖于自由参数的窗函数，系统地分析了该系统的时频局部化性质，包括 Calderón-type 重构公式和框架界。进一步将构造应用于各向同性随机场，严格证明了在高频极限下，needlet 系数序列具有渐近不相关性和局部化特征，且这些结论在比文献更宽松的谱密度假设下成立。证明依赖于球谐展开和谱密度函数的正则性条件，未使用具体衰减假定。这一推广为球面数据分析提供了更灵活的多尺度工具，可能在天文（如 CMB 数据分析）中得到应用。
关键技术: spherical wavelets, needlets, high-frequency asymptotics, isotropic random fields, frame bounds, spectral density
为什么对您有用: 本文属于非参数统计中的多尺度方法，直接对接你对非参数理论的兴趣。你非常熟悉的非参数统计工具（如最小最大界、谱分析）可用于评估该构造的统计最优性，或与其他球面小波（如 Slepian 小波）的效率比较。鉴于你武器库中非参数统计为 very_familiar，立即可用现有知识理解其框架，无需额外学习。

9. 10.3150/23-bej1612 · arXiv — Normality of smooth statistics for planar determinantal point processes¶

作者: Antti Haimi, José Luis Romero
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 3/10 · novelty: new_theory
摘要: 本文研究复平面上 determinantal point processes (DPP) 的光滑线性统计量的渐近正态性，目标是在有限方差情形下建立 CLT——此时经典的 Soshnikov 定理因方差发散而不适用。设定要求相关核具有 reproducing property，替代了 Rider-Virág (2007) 的解析性条件和 Ameur-Hedenmalm-Makarov (2011) 的径向对称假设。证明策略借鉴正态随机矩阵特征值的复分析方法，利用 reproducing kernel 结构补偿解析性与对称性的缺失，通过积分算子谱分解与方差渐近控制完成中心极限定理。主要贡献在于将 DPP 的 CLT 理论从解析核推广到更一般的 reproducing kernel 类，放宽了正则性要求。对您而言，这是随机矩阵理论向点过程方向的延伸，与您 primary interest 中的 RMT 高维渐近有直接技术关联。
关键技术: determinantal point processes, reproducing kernel Hilbert space, central limit theorem for linear statistics, complex analysis methods, integral operator spectral theory
为什么对您有用: 直接连接到您 primary interest 中的 high-dimensional statistics (Random matrix theory)——DPP 是随机矩阵特征值分布的推广框架，其线性统计量 CLT 与 RMT 的核心工具（积分算子、谱方法）高度重叠。您武器库中的 high-dimensional asymptotics 可直接迁移，reproducing kernel 与 RKHS 理论也在您 very_familiar 的 nonparametric statistics 范畴内。立即可做：用您熟悉的 minimax bounds 和 high-dimensional asymptotics 视角审视本文的 rate 是否紧，或尝试将 reproducing kernel 条件进一步弱化。

10. 10.3150/23-bej1610 · arXiv — Minimax estimation of low-rank quantum states and their linear functionals¶

作者: Samriddha Lahiry, Michael Nussbaum
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 1/10 · novelty: new_theory
摘要: 本文研究低秩量子态（qudit）的 minimax 估计问题，设定为 n 个独立同分布的低秩量子系统，目标是在 rank-r 约束下估计量子态本身及其线性泛函。核心方法是量子局部渐近等价（quantum local asymptotic equivalence），将原量子实验逼近为一个混合模型：r-1 维 Gauss 分布加上由平移纯态和热态组成的量子部分，这是 full-rank 情形结果向 low-rank 情形的推广。在极限 Gauss 模型中建立 asymptotic minimax 理论后，利用等价性将结果迁移回原量子模型，构造了线性泛函的估计量并证明其 minimax 最优性。技术工具涉及 Le Cam 局部渐近正态性、量子态空间的结构约束、以及 minimax risk bound 的精确刻画。对您有用之处在于：这是经典的 asymptotic equivalence + minimax 理论在量子统计中的延伸，与您熟悉的非参数 minimax 理论和逆问题有直接的方法论对应。
关键技术: quantum local asymptotic equivalence, Le Cam model equivalence, minimax estimation under rank constraint, low-rank quantum state estimation, linear functional estimation
为什么对您有用: 连接到您 primary interest 中的 semiparametric/nonparametric theory 和 minimax bounds——这是经典 Le Cam 渐近等价框架在量子统计中的推广，技术内核与您熟悉的非参数 minimax 理论完全平行。您武器库中的 minimax bounds for estimation problems 和 inverse problems with random noise 可直接迁移到这个设定，rank constraint 对应的结构降维与高维统计中的 low-rank matrix estimation 也有相通之处。中期可做：需先在 moderately_familiar 的 semiparametric theory 上补充量子态空间的参数化结构知识，但核心数学工具（局部渐近正态性、minimax risk 刻画）已在武器库内。

数理统计 / 假设检验 (hypothesis_testing, 6 篇)¶

1. 10.3150/23-bej1613 · arXiv — Dimension-agnostic inference using cross U-statistics¶

作者: Ilmun Kim, Aaditya Ramdas
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文研究 dimension-agnostic inference 问题：在不对 d/n 比例做任何假设的前提下，构造具有统一渐近行为的检验统计量。核心方法是 cross U-statistics：对现有 degenerate U-statistics 进行改造，通过 sample splitting 和 self-normalization，丢弃对角块、保留 off-diagonal 块，得到一个 Gaussian limit。理论结果表明，无论 d 如何随 n 增长（固定、高维、或中间情形），检验统计量均收敛到标准正态，且在适当的 local alternatives 下达到 minimax rate-optimal power。在大多数设定下，cross U-statistic 的 power 与原始 degenerate U-statistic 在高维情形下的 power 相比仅损失 √2 因子。对您有用：该工作将 U-statistic 结构与高维假设检验结合，直接连接到您的 higher-order U-statistics 与 hypothesis testing 两个 primary interests。
关键技术: degenerate U-statistics, sample splitting, self-normalization, minimax rate-optimality, Gaussian approximation, variational representation
为什么对您有用: 直接连接到 hypothesis testing 与 higher-order U-statistics 两个 primary interests，且涉及高维设定下的 minimax rate 分析。您武器库中 'computation of higher-order U-statistics (treewidth / tensor contraction)' 的 very_familiar 技术可以用来分析 cross U-statistic 的计算复杂度，特别是 'dropping diagonal blocks' 操作在 tensor contraction 视角下的 cost；同时 'minimax bounds for estimation problems' 的 very_familiar 工具可验证其声称的 minimax rate-optimality 是否紧。立即可做：用 very_familiar 的 U-statistic 计算框架和 minimax 分析工具即可展开研究，例如将 cross U-statistic 推广到其他检验问题或分析其计算效率。

2. 10.3150/23-bej1615 · arXiv — A central limit theorem for the Benjamini-Hochberg false discovery proportion under a factor model¶

作者: Dan M. Kluger, Art B. Owen
期刊/来源: Bernoulli
机构: Stanford University
分类: vol 30 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 本文研究 Benjamini-Hochberg (BH) 程序在相关检验统计量下的 false discovery proportion (FDP) 的分布行为，核心关注点是 'bursty' 现象——即 FDP 均值控制良好但偶尔出现大幅超调。设定为 factor model 下的多重检验问题，检验统计量间的相关结构可表现为短程/长程、弱/强相关。作者证明了 FDP 的中心极限定理，给出了其渐近正态性的条件，关键工具包括对经验过程和 factor model 协方差结构的精细分析。理论结果表明：当检验统计量存在大量强长程相关时，BH 程序表现出严重的 burstiness；而在其他相关结构下 FDP 控制良好。对您研究假设检验理论中的 FDR 控制与相关性影响有直接参考价值。
关键技术: Benjamini-Hochberg procedure, false discovery proportion, factor model correlation structure, central limit theorem for empirical processes, long-range vs short-range dependence, multiple testing under dependence
为什么对您有用: 直接连接到 primary interest 中的 hypothesis testing，特别是多重检验中相关性对 FDR 控制的影响这一经典问题。您熟悉的 minimax bounds 和 high-dimensional asymptotics 可用于审视其 CLT 所需的 threshold 条件是否紧，以及 factor model 假设的必要性。立即可做：用 very_familiar 的高维渐近理论工具验证其 CLT rate 是否可达最优，或探索更一般的协方差结构下的推广。

3. 10.3150/23-bej1616 · arXiv — Limiting distributions of graph-based test statistics on sparse and dense graphs¶

作者: Yejiong Zhu, Hao Chen
期刊/来源: Bernoulli
机构: University of California, Davis
分类: vol 30 · issue 1
相关性 8/10 · novelty: new_theory
摘要: 本文研究基于相似图的 two-sample test 在稀疏到稠密图谱上的极限分布理论。设定为高维/非欧数据的 two-sample problem，现有文献主要处理边数 O(n) 的稀疏图且对图结构施加强正则性条件。作者建立了一个统一的渐近理论框架，覆盖从稀疏到稠密的图，放松了图结构的正则性假设。核心工具包括 U-statistic 理论、图上随机游走的局部逼近、以及中心极限定理的 Stein 方法。主要理论贡献是证明了 test statistic 在更广的图密度范围内收敛到正态分布，并给出了具体的方差表达式。对您有用：这是您 very_familiar 的 nonparametric statistics 与 moderately_familiar 的 higher-order U-statistics 理论的直接交汇点。
关键技术: graph-based two-sample test, U-statistic theory, Stein's method for CLT, local graph approximation, sparse and dense graph regimes
为什么对您有用: 直接连接到 primary interest 中的 hypothesis testing 与 higher-order U-statistics。您武器库中 very_familiar 的 nonparametric statistics 与 moderately_familiar 的 higher-order U-statistics theory 正是本文的核心工具——可以立即用您熟悉的 U-statistic projection 技术审视其方差分解是否紧、是否可以推广到 degenerate U-statistic 情形。follow-up 判定：立即可做——用 higher-order U-statistic 的 treewidth/tensor contraction 视角分析其计算复杂度，或尝试用 minimax 理论刻画不同图密度下的检验功效界。

4. 10.3150/23-bej1593 — Two-sample contamination model test¶

作者: Xavier Milhaud, Denys Pommeret, Yahia Salhi, Pierre Vandekerkhove
期刊/来源: Bernoulli
机构: Aix-Marseille Université · Centrale Marseille · Université Claude Bernard Lyon 1 · Laboratoire d’Analyse et de Mathématiques Appliquées · Université Gustave Eiffel
分类: vol 30 · issue 1
相关性 7/10 · novelty: new_method
摘要: 本文考虑两样本污染模型（每个样本来自一个两成分混合分布，其中一个成分已知，另一个未知），主要目标是检验两个样本中未知污染成分的分布是否相等。作者提出 Inversion-Best Matching (IBM) 方法，生成一个无需调参的放松半参数 Cramér-von Mises 型两样本检验统计量。该方法仅需最小化关于未知分布的假设，并依赖两样本情形下自然可解释的 mutual-identifiability 条件。理论部分建立了比例参数和未知累积分布函数的泛函中心极限定理，给出渐近分布。大量数值模拟验证了有限样本下的渐近性质。最后应用于欧洲国家 COVID-19 超额死亡率的两两比较，提供实际数据分析案例。对您而言，该工作直接连接假设检验和非参数/半参数理论，其泛函中心极限定理和 Cramér-von Mises 框架可迁移至其他半参数检验问题。
关键技术: Cramér-von Mises type test, Inversion-Best Matching, semiparametric mixture model, functional central limit theorem, mutual-identifiability conditions
为什么对您有用: (1) 本文直接关联您的假设检验与非参数/半参数理论兴趣，提出一个新颖的两样本半参数检验框架；(2) 您 arsenal 中 very_familiar 的非参数统计与高维渐近工具可直接用于理解和扩展该检验的泛函中心极限定理，例如推导更紧的收敛速率或处理高维污染因子；(3) 本文的 IBM 方法和 Cramér-von Mises 型统计量结构清晰，您可以立即基于该框架设计更复杂的相依样本检验或与因果推断中的敏感性分析结合。因此，该论文适合立即可做地深入阅读和可能的方法改进。

5. 10.3150/23-bej1614 · arXiv — Central limit theorems for high dimensional dependent data¶

作者: Jinyuan Chang, Xiaohui Chen, Mingcong Wu
期刊/来源: Bernoulli
机构: Chinese Academy of Sciences · Southwestern University of Finance and Economics · Academy of Mathematics and Systems Science · University of Southern California · University of Illinois Urbana-Champaign
分类: vol 30 · issue 1
相关性 7/10 · novelty: new_theory
摘要: 本文在高维时间序列数据背景下，研究相依随机向量求和的中心极限定理，建立高斯近似在超矩形、简单凸集和稀疏凸集上的非渐近误差界。作者分别考虑α-混合、m-相依和物理依赖度量三种时间相依框架，在物理依赖度量下获得比现有结果更快的收敛速率。为实现实际推断，提出基于核估计长程协方差矩阵的数据驱动参数bootstrap程序，可自动适应未知相依结构。该理论统一应用于高维均值向量检验（组合ℓ2和ℓ∞统计量）、变化点检测以及协方差/精度矩阵置信区域的构建。对您而言，该工作直接涉及高维假设检验和时间序列相依数据的推断问题，可用您在高维渐近领域的理论工具来评估误差界的紧性，并探索在时间序列因果推断中的统计检验应用。
关键技术: Gaussian approximation for high-dimensional dependent data, non-asymptotic error bounds, α-mixing and physical dependence measures, kernel estimator for long-run covariance, parametric bootstrap for high-dimensional time series
为什么对您有用: 本文核心是高维相依数据的中心极限定理与假设检验，直接呼应您对高维假设检验的兴趣。您可以用熟悉的高维渐近理论（very_familiar中的high-dimensional asymptotics）来评价本文给出的收敛速率是否最优，并尝试将相关bootstrap程序扩展到时间序列因果推断（如差分估计量的推断）。立即可做：您的高维渐近知识足以理解并批判该文的理论结果；进一步可中期考虑在您的时间序列因果推断工作中引入本文的bootstrap方法。

6. 10.3150/23-bej1601 — Refined behaviour of a conditioned random walk in the large deviations regime¶

作者: Søren Asmussen, Peter W. Glynn
期刊/来源: Bernoulli
机构: Aarhus University · Stanford University
分类: vol 30 · issue 1
相关性 3/10 · novelty: new_theory
摘要: 本文研究随机游走 S_n = X_1+...+X_n 在大偏差 regime 下的条件渐近行为，具体考虑条件事件 {S_n ≥ n b} 或 {S_n = n b}，其中 b > E X。利用指数倾斜（exponential tilting）将原始分布转化为倾斜分布 f_θ(x) = e^{θx - ψ(θ)} f(x)，其中 θ 满足 b = ψ'(θ)，从而鞍点逼近这些条件事件的概率。主要贡献是给出条件分布的精确修正项：对于固定长度的段 (X_1,...,X_k)，条件分布在总变差距离下以速率 O(1/√n) 收敛于倾斜分布，并给出了显式的一阶修正。对于经验分布函数 F̂_n，给出了其均值与方差的修正项，以及其与倾斜分布函数 F_θ 之差的渐近行为。进一步，当 k/n → c ∈ (0,1) 时，推导了段的总变差距离结果，并给出了 (F̂_k, S_k) 的双变量条件布朗极限定理。本文为鞍点逼近的经典理论提供了精细化的有限样本和渐近刻画。对您有用：这些结果可直接用于改进假设检验中尾部概率的逼近精度，例如在似然比检验和 Cramér 型大偏差中，与您的假设检验兴趣一脉相承。
关键技术: saddlepoint approximation, exponential tilting, conditioned limit theorem, total variation distance, functional limit theorem, empirical distribution function
为什么对您有用: 本文直接连接您的数学统计兴趣中的鞍点逼近和大偏差理论，这些是假设检验中计算 p 值和置信区间的重要工具。您的武器库中 'minimax bounds for estimation problems' 可用于评估这些逼近的误差最优性，而 'high-dimensional asymptotics' 背景有助于理解其渐近结构。目前状态：暂不可做——核心机器（大型偏差理论、鞍点逼近的精细概率计算）不在您的武器库里，需要先系统学习鞍点逼近和随机游走的概率技术方能展开后续工作。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.3150/23-bej1609 — Explicit bounds for spectral theory of geometrically ergodic Markov kernels and applications¶

作者: Loïc Hervé, James Ledoux
期刊/来源: Bernoulli
机构: Centre National de la Recherche Scientifique · Institut National des Sciences Appliquées de Rennes · Institut de recherche mathématique de Rennes · Université de Rennes
分类: vol 30 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文针对可测状态空间上满足几何漂移条件且具有非周期小集的马尔可夫链，研究其转移核 P 的谱理论。在标准 V^{α₀} 加权范数下，作者给出了第二特征值 ρ_{α₀} 的显式刻画：要么由 Γ 区域内满足某级数方程的谱值构成，要么小于 δ_{α₀}。进一步，通过推导 (zI-P)^{-1} 的算子范数显式界，得到了收敛速率中的乘性常数，该常数可在已知第二特征值时数值计算。利用 (I-P+π(·)1_X)^{-1}（泊松方程基本解）的简单显式界，作者定位了 P 的特征值位置，并给出了 ρ_{α₀} 的通用上界。对可逆正马尔可夫核的情况，该上界与预期一致，且在 Metropolis-Hastings 和高斯自回归链上给出数值示例。最后，文中 (I-R)^{-1} 的算子范数估计将 [LL18] 中离散原子链的误差界推广到一般几何遍历链。这些结果对统计计算中 MCMC 方法的收敛性诊断和误差控制具有直接实用价值。
关键技术: geometric drift condition, small-set, spectral radius, Poisson's equation, operator norm bounds, Metropolis-Hastings algorithm
为什么对您有用: 本文属于统计计算中MCMC理论的核心话题，为几何遍历马尔可夫链的谱半径和收敛速率提供了可计算的显式界，可直接用于MCMC算法的误差诊断。研究者若关注MCMC的数值实现（如使用经验特征值估计），可利用其软件开发和数值方法经验实现这些界，但这需要先在几何遍历性理论（moderately_familiar外）上补课，属于中期可做。

其他 (other, 4 篇)¶

1. 10.3150/23-bej1617 · arXiv — On estimators of the mean of infinite dimensional data in finite populations¶

作者: Anurag Dey, Probal Chaudhuri
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 5/10 · novelty: new_theory
摘要: 本文研究有限总体均值估计在无限维数据（如函数型数据）下的渐近理论。对Horvitz-Thompson（HT）、Rao-Hartley-Cochran（RHC）和广义回归（GREG）三种估计量，基于多种抽样设计和满足线性回归模型的超总体推导渐近分布。理论表明GREG在任何抽样设计下均至少与其他两种同样有效。进一步发现，当线性回归的异方差性较小时，使用辅助信息的抽样设计会损害GREG的表现；而异方差性较大时则改善。作者还提出了确定异方差程度的方法，以指导抽样设计的选择，并证明了协方差算子的一致性。数值实验支持理论结果。对您而言，本文扩展了经典抽样估计到无限维设定，属于非参数/高维统计的交叉，可为高维数据中的估计效率比较提供新视角。
关键技术: Horvitz-Thompson estimator, Rao-Hartley-Cochran estimator, generalized regression estimator, asymptotic distribution, covariance operator, heteroscedasticity analysis
为什么对您有用: 本文的核心关注点——无限维数据下的有限总体均值估计——属于非参数统计的延伸，与您的非参数/半参数理论兴趣直接相关。文中协方差算子一致性的分析可借助您非常熟悉的高维渐近工具进行深入验证或推广。不过，具体抽样设计（HT、RHC）及其效率比较并非您的日常工具箱，因此属于中期可做的方向：需要先补充survey sampling的特定文献，但分析途径与您已有的非参数、高维渐近能力高度匹配。

2. 10.3150/22-bej1564 — A note on the empty balls of a critical super-Brownian motion¶

作者: Shuxiong Zhang, Jie Xiong
期刊/来源: Bernoulli
机构: Anhui Normal University · Southern University of Science and Technology
分类: vol 30 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文研究d维临界超布朗运动X_t从勒贝格测度泊松随机测度出发时，最大空球半径R_t的渐近分布。作者证明R_t经规范化后极限分布为极端值型，即P(R_t/t^{(1/d)∧(3-d)_+}≥r)→e^{-A_d(r)}，且A_d(r)在d=2时具有明确渐近行为。证明依赖于超布朗运动的势理论和空球概率的精细分析。该结果刻画了临界超过程中孤立空洞的极值尺度。对于您的兴趣方向，本文属于纯概率论领域，与因果推断、高维统计等主要兴趣无直接交叉。武器库中缺乏超过程与分支过程的理论工具，暂不可做深读；但可作为空间过程极值理论的入门参考。
关键技术: critical super-Brownian motion, empty ball probability, extreme value theory, spatial branching process
为什么对您有用: 本文主题为超布朗运动的极值行为，与您的主要兴趣方向（因果推断、高维统计等）无直接关联。武器库中缺乏超过程及分支过程的极限理论工具，暂不可做深读。但若您对空间过程极值理论入门感兴趣，可作为消遣阅读。

3. 10.3150/23-bej1595 — On bivariate distributions of the local time of Itô-McKean diffusions¶

作者: Jacek Jakubowski, Maciej Wiśniewolski
期刊/来源: Bernoulli
机构: Institute of Mathematics · University of Warsaw
分类: vol 30 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文研究 Itô-McKean 扩散过程 X 在零点的局部时 L_t 的联合分布问题，核心 estimand 是 (X_t, L_t) 的转移密度及 L_t 的边缘分布。作者利用 excursion theory 和卷积指数给出了 L_t 分布的显式刻画，并推导了二元 Itô-McKean 扩散从超平面出发的 excursion 分布的连接公式。主要技术工具包括 Itô-McKean 扩散的谱表示、excursion 测度的精细分析以及 transient 扩散的极限行为。理论结果包括若干显式分布公式，例如 transient 扩散下 (X_t, L_∞) 的联合分布。本文属于概率论与随机过程的纯理论工作，与您 primary interests 中的因果推断、高维统计、半参数理论等方法论方向无直接交集。
关键技术: excursion theory, local time, Itô-McKean diffusion, spectral representation, convolution exponent
为什么对您有用: 本文属于随机过程的纯概率论工作，研究 Itô-McKean 扩散的局部时分布，与您 primary interests（因果推断、高维统计、半参数效率理论、higher-order U-statistics）的方法论方向无交集。核心工具 excursion theory 和 local time 不在您的 technical_arsenal 中，且难以迁移到您当前的研究问题。暂不可做：核心机器（随机过程理论、excursion theory）不在武器库里，且与您的研究议程无明显连接点。

4. 10.3150/23-bej1596 · arXiv — The infinite Viterbi alignment and decay-convexity¶

作者: Nick Whiteley, Matt W. Jones, Aleks P.F. Domanski
期刊/来源: Bernoulli
分类: vol 30 · issue 1
相关性 2/10 · novelty: new_theory
摘要: 本文研究隐马尔可夫模型（HMM）中无限时间Viterbi对齐极限的存在性与定量逼近，状态空间为ℝᵈ。作者提出一个新的“decay-convexity”条件，在该条件与适当的HMM正则性假设下，证明了无限Viterbi对齐在无穷维Hilbert空间中的存在性。首次推导出有限时间Viterbi路径到无限Viterbi对齐的距离的定量界，该界不依赖于状态空间维度d。这一结果保证了通过并行化（将时间轴分段独立估计然后拼接）逼近Viterbi路径的准确性，且收敛速率与d无关。应用方面，文章将理论用于神经群体活动模型的近似估计。对您而言，本文的高维HMM处理思路与并行化估计的维度无关性，可作为您在高维统计和非参数方法中处理复杂状态空间模型的一个参考文献，但核心工具（decay-convexity、Hilbert空间嵌入）与您现有武器库交集较小。
关键技术: infinite Viterbi alignment, decay-convexity, Hilbert space embedding, parallel estimation, hidden Markov model
为什么对您有用: 本文可连接到统计计算中的并行化估计方法，但核心理论工具（decay-convexity、无穷维Hilbert空间分析）不属于您的武器库。您的very_familiar工具（如非参数统计、高维渐近）无法直接复现或验证其主要定理。暂不可做——需先补充HMM极限理论和泛函分析工具才能切入该文的后续工作。

Maintained by 陈星宇 · Homepage · Source on GitHub