Bernoulli — Vol 31 Issue 3 · 2026-06-18¶

共 30 篇 · Bernoulli
目录核对 ⚠️ 疑似漏 4 篇（对照 OpenAlex 34 篇）：10.3150/24-bej1806、10.3150/24-bej1794、10.3150/24-bej1811、10.3150/22-bej1473

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期论文呈现出三条清晰的方法与主题主线：高维与随机矩阵渐近理论（10篇）、非参数与半参数推断（10篇）、统计计算与MCMC收敛分析（5篇），另有零星假设检验与随机分析结果。高维主线集中探讨谱分析、稀疏协方差/漂移估计及高维渐近展开的误差界；非参数主线侧重于最优传输、密度/均值估计的sup-norm收敛率及复杂域/无界设定的自适应；计算主线则系统刻画PDMP、MYMALA及RWMH算法的缩放律与收敛上下界。

高维与随机矩阵主线在本期推进了高维渐近逼近的误差定界与复杂噪声下的谱极限刻画。高维Laplace与鞍点近似给出了联合/边际密度逼近误差的显式阶（\(O(p^4/n)\)及\(O(p^3/n)\)），将经典低维结果推广至\(p=o(n^{1/3})\)设定；异方差噪声与弱信号下的尖峰模型推导了奇异向量渐近极限与特征值极限分布，并据此提出聚类数估计准则；非高斯噪声下秩一尖峰Wigner模型的对数似然比渐近正态性则刻画了弱检测的相变阈值与minimax极限。在估计端，高维扩散漂移的Lasso借助chaining与concentration建立oracle不等式，协方差算子阈值化估计利用短相关结构获得样本复杂度的指数级改进，多响应回归误差协方差的逆Wishart非信息先验则结合RMT谱工具填补了后验相合性空白。此外，高维多响应回归的goodness-of-fit检验揭示了响应维增加可提升局部备择检测速率且具dimension-agnostic性质，高斯混合聚类明确刻画了最优误分类率下的统计-计算gap阈值。

非参数与半参数主线本期聚焦于sup-norm最优速率与无界/复杂设定的收敛定界。密度估计的模型框架在sup-norm下给出oracle不等式，并在单指标模型中恢复了非参数最优速率；函数数据均值估计揭示了sup-norm下由观测误差主导的中间regime，构造了dense设计下无额外对数因子的\(\sqrt{n}\)速率估计量；复杂域上的局部多项式密度估计借助Goldenshluger–Lepski方法实现了L2 minimax自适应。在无界与极值设定下，经验最优传输通过分解-截断策略将紧空间的自适应收敛率迁移至仅损失任意小\(\varepsilon\)的无界情形；重尾大偏差的“最少大跳跃原理”将经典单大跳跃推广至移动截断边界下的条件分布刻画。此外，SDE间Wasserstein-1距离对跳跃与连续扩散给出了\(O((2-\alpha)d\log(1+d))\)的收敛率，粗糙波动率下特征函数的高阶展开则类比HOIF思想构造了Hurst参数的非参数估计量。

统计计算主线系统推进了MCMC算法的缩放律与收敛速率定界。PDMP缩放分析表明Bouncy Particle Sampler与Zig-Zag在非各向异性目标下计算成本分别为\(O(\epsilon^{-1})\)与\(O(\epsilon^{-2})\)，优于RWM；MYMALA在非可微目标下推导了扩散逼近与最优步长/包络参数\(\lambda\)的调参指南；RWMH的几何收敛速率则通过显式drift-minorization条件给出了上下界。对侧，接受-拒绝型链的收敛下界在总变差与Wasserstein距离下识别了调参不良的失效模式，要求步长须随样本量\(n\)谨慎变化。假设检验方面，Stein方法绕开光滑性限制实现了二次Edgeworth展开，change-plane回归处理了非唯一最小值下的\(n\)速率收敛与参数bootstrap推断。

与因果推断/半参数效率/高维方向最贴的论文：高维渐近定界与弱检测相变（Laplace近似、尖峰Wigner对数似然比）；半参数效率与高阶校正（单指标密度sup-norm最优速率、粗糙波动率特征函数高阶展开、Stein方法二次Edgeworth）；非光滑M估计与推断（change-plane回归极限分布与bootstrap）。优先看上述题目可快速把握本期在半参数速率突破与高维渐近精细刻画上的推进。

高维统计 / 随机矩阵 (high_dim_rmt, 8 篇)¶

1. 10.3150/24-bej1758 · arXiv — Laplace and saddlepoint approximations in high dimensions¶

作者: Yanbo Tang, Nancy Reid
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 9/10 · novelty: new_theory
摘要: 本文在高维渐近框架下考察 Laplace 近似与鞍点近似的精度，其中模型维数 p 随样本量 n 增长。主要目标是对联合密度、边际后验密度及条件密度给出逼近误差的显式阶数。在较弱的模型假设下，联合密度逼近的误差阶为 O(p^4/n)，要求 p = o(n^{1/4})；若对对数似然的二阶导数附加正则条件，误差可降至 O(p^3/n)，允许 p = o(n^{1/3})。对于边际后验密度，可得到更强的结果（误差阶更优或允许更大的 p/n）。方法的核心是使用 Edgeworth 展开与 Laplace 型积分的高阶渐近分析，通过精细的余项控制得到统一的误差界。这些结果将经典的低维渐近理论系统推广到高维，为高维贝叶斯推断中 Laplace 近似的适用性提供了理论保证。对您而言，本文直接触及高维渐近这一主兴趣，您熟悉的 high-dimensional asymptotics 工具可立即用于理解其误差界推导，并可能进一步拓展至更一般的非参数模型。
关键技术: Laplace approximation, saddlepoint approximation, high-dimensional asymptotics, error rate analysis, Edgeworth expansion, posterior approximation
为什么对您有用: 本文直接属于您的主兴趣“高维统计”（high-dimensional statistics），系统研究了高维下经典逼近方法的误差阶和允许的 p/n 比例。您武器库中 very_familiar 的“high-dimensional asymptotics”可立即用于消化其推导和假设，并可能将结果延伸到更复杂的估计问题（如半参数模型中的后验逼近）。立即可做：您可以直接阅读全文，并尝试将这里的误差界技术与您熟悉的非参数极小极大界对比，检验其紧性。

2. 10.3150/24-bej1808 · arXiv — Asymptotic limits of spiked eigenvalues and eigenvectors of signal-plus-noise matrices with weak signals and heteroskedastic noise¶

作者: Xiaoyu Liu, Yiming Liu, Guangming Pan, Lingyue Zhang, Zhixiang Zhang
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 9/10 · novelty: new_theory
摘要: 本文研究高维信号加噪声模型（signal-plus-noise model），其中维度p和样本量n可比，噪声具有异方差结构（一般协方差矩阵），确定性信号的强度与噪声同量级且秩可发散至无穷。在弱信号（信号强度不随维度增长）和异方差噪声的联合设定下，推导了左/右尖峰奇异向量的渐近极限以及对应Gram矩阵尖峰特征值的极限分布。方法的核心机制基于随机矩阵理论（RMT）的谱分析，利用尖峰模型（spiked model）的相位转移现象，并处理了噪声协方差非球性的技术挑战。论文给出了显式的渐近偏差公式，揭示了异方差性对奇异向量方向一致性的影响。作为应用，提出了一种基于特征值极限的新准则来估计聚类数目（clustering），并通过数值实验验证了有效性。该工作为高维因子模型、网络分析等场景中的弱信号检测与估计提供了重要的理论基准。
关键技术: spiked covariance model, signal-plus-noise matrix, heteroskedastic noise, asymptotic limits of eigenvectors/eigenvalues, phase transition, random matrix theory
为什么对您有用: 直接对接您对高维统计和随机矩阵理论的核心兴趣，尤其针对弱信号和异方差噪声这一更现实的设定，突破了经典尖峰模型常假设噪声为球性的限制。您武器库中非常熟悉的'高维渐近'理论恰好可用于验证其渐近偏差公式并寻找更紧的收敛速率。可进一步思考：是否可将该结果用于因果推断中的因子IV识别（如弱工具变量）作为中期方向，但当前结果本身即可作为立即可读的RMT理论进展。

3. 10.3150/24-bej1805 · arXiv — Asymptotic normality of log likelihood ratio and fundamental limit of the weak detection for spiked Wigner matrices¶

作者: Hye Won Chung, Jiho Lee, Ji Oon Lee
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 9/10 · novelty: new_theory
摘要: 本文考虑秩一尖峰Wigner模型中的信号检测问题，假设信号服从Rademacher先验且噪声为非高斯分布。主要结果证明，当信噪比低于某个临界阈值时，对数似然比统计量渐近收敛到正态分布；该阈值在变换PCA可实现可靠检测的意义下是最优的。利用渐近正态的均值和方差，精确计算似然比检验的第一类与第二类误差之和的极限。对噪声不对称但信号对称的尖峰IID模型，同样建立了类似的理论。该工作将经典高斯噪声设定下的结论推广至非高斯噪声，为随机矩阵框架下的弱检测问题提供了精确的相变刻画。对于高维统计与假设检验方向，该结果展示了似然比统计量在复杂噪声结构下的极限行为，可直接联系到研究者熟悉的RMT和minimax下界分析。
关键技术: log likelihood ratio, spiked Wigner model, Rademacher prior, transformed PCA, Gaussian limit, hypothesis testing
为什么对您有用: 该论文直接切入高维统计与随机矩阵理论的核心问题——尖峰Wigner模型中的信号检测相变，是研究者主要兴趣中高维渐近与假设检验的典型代表。研究者可凭借"high-dimensional asymptotics"和"minimax bounds"两项very_familiar武器，迅速验证阈值的最优性，并考虑将结果扩展至更一般的信号先验或协方差结构。立即可做：推导思路仅依赖经典RMT与经验过程工具，无需额外预备知识。

4. 10.3150/24-bej1804 · arXiv — Uniform error bound for PCA matrix denoising¶

作者: Xin T. Tong, Wanjie Wang, Yuguan Wang
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 7/10 · novelty: sharper_rate
摘要: 在低秩子空间加独立高维 sub-Gaussian 噪声的矩阵去噪设定下，目标是建立 PCA 去噪后逐点误差的 uniform bound。在 clean data 的低秩假设与 mild spectral gap 假设下，作者证明每对 PCA 去噪点与 clean 点的距离被 \(O(\sigma \log n)\) uniformly 控制，并指出该 spectral gap 条件在非退化协方差矩阵下即可满足。进一步给出去噪误差的一般下界，证明 PCA 去噪的 uniform error rate 是 minimax rate-optimal 的。最后将此 uniform bound 应用于聚类与流形学习等下游任务，数值实验验证了理论并展示 uniform error 的重要性。对您有用：此文的 minimax rate-optimal uniform bound 直接关联您的高维统计与 minimax bound 兴趣，且其逐点误差控制思路可迁移至因果推断中高维 proxy/IV 的噪声扰动分析。
关键技术: PCA matrix denoising, uniform error bound, sub-Gaussian noise, spectral gap assumption, minimax rate-optimal lower bound, downstream clustering impact
为什么对您有用: 本文直接关联您的高维统计与 minimax bound 兴趣：在 spiked model 变体下给出了逐点 \(O(\sigma \log n)\) 的 uniform bound 并证明其 minimax rate-optimal。您可用 very_familiar 的 minimax bounds for estimation problems 工具验证其下界是否紧，或探讨 spectral gap 条件在更一般噪声结构下的松弛。对您而言，这是立即可做的 follow-up：用您熟悉的 minimax 与高维渐近工具即可动手检查其 rate-optimality 声明并尝试扩展噪声假设。

5. 10.3150/24-bej1798 · arXiv — Clustering a mixture of Gaussians with unknown covariance¶

作者: Damek Davis, Mateo Díaz, Kaizheng Wang
期刊/来源: Bernoulli
机构: Cornell University · California Institute of Technology · Columbia University
分类: vol 31 · issue 3
相关性 7/10 · novelty: new_theory
摘要: 在共享未知（可能病态）协方差矩阵的双分量等权高斯混合设定下，目标是实现最优误分类率。作者从MLE出发推导出Max-Cut整数规划，证明其解在样本量与维度线性增长时达到最优误分类率（至多log因子）。然而Max-Cut求解计算不可行，故提出高效谱算法，在二次样本量下达到相同最优率。作者明确指出线性与二次样本量阈值间的gap即为统计-计算gap，并给出理论与数值证据支持此猜想，认为无多项式时间算法能突破此二次门槛。最后将Max-Cut推广至处理不等权多分量混合的k-means规划。对您可能有用：本文清晰展示了高维混合模型中statistical-computational gap的具体阈值刻画，是进入computational-constrained statistics方向的优质gateway reading。
关键技术: Max-Cut integer program, spectral clustering, misclassification rate, statistical-computational gap, ill-conditioned covariance, k-means generalization
为什么对您有用: 直接连接到您 primary interest 中的 statistical-computational tradeoff 子方向：本文对统计阈值（线性样本量）与计算阈值（二次样本量）的gap给出了明确界定与猜想，且对计算模型（多项式时间算法类）和失败模式的表述对外行友好。用您 very_familiar 的高维渐近理论可以验证其谱算法在二次样本量下的rate是否紧；用 moderately_familiar 的 minimax bound 工具可尝试对线性样本量的信息论下界做更精细刻画。follow-up判断：中期可做——需先在 moderately_familiar 的低阶多项式/谱方法计算下界工具上长肌肉，才能切入其计算不可行猜想的严格证明。

6. 10.3150/24-bej1781 · arXiv — On Lasso estimator for the drift function in diffusion models¶

作者: Gabriela Ciołek, Dmytro Marushkevych, Mark Podolskij
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_theory
摘要: 在高维多参数扩散模型设定下，基于连续观测路径 [0,T] 估计稀疏漂移函数，允许模型维度与参数空间维度同时增大。核心估计量为 Lasso estimator，通过扩散过程线性泛函的 concentration inequality 建立 oracle inequality，进而给出 L2 误差界。概率工具主要依赖 empirical process theory 与 chaining method，以控制高维设计矩阵的 restricted eigenvalue 条件。理论结果为高维扩散漂移的 Lasso 提供了非渐近有限样本保证，对您有用之处在于其 chaining + concentration 的技术路径可直接迁移至高维统计与随机矩阵理论中的相关界推导。
关键技术: Lasso estimator, oracle inequality, concentration inequality for diffusion functionals, empirical process chaining, restricted eigenvalue condition, high-dimensional diffusion model
为什么对您有用: 直接连接高维统计与随机矩阵理论（高维参数扩散模型的稀疏估计）；您 very_familiar 的高维渐近学与 minimax bounds 可用于验证其 L2 误差界是否达到 minimax optimal rate，chaining 技术也与您熟悉的 empirical process 工具对接。立即可做：用 minimax lower bound 检验本文 oracle inequality 的 rate sharpness。

7. 10.3150/24-bej1809 · arXiv — Covariance operator estimation: Sparsity, lengthscale, and ensemble Kalman filters¶

作者: Omar Al-Ghattas, Jiaheng Chen, Daniel Sanz-Alonso, Nathan Waniorek
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 6/10 · novelty: sharper_rate
摘要: 该论文研究高斯随机场中协方差算子的阈值化估计，假设协方差算子近似稀疏，并考虑场的相关长度尺度。作者建立了非渐近误差界，将估计误差表示为稀疏水平和场期望上确界的函数。核心结果表明，当相关长度尺度很小时，阈值化估计器的样本复杂度相比标准样本协方差有指数级改进。该证明依赖于对阈值化后偏置-方差权衡的精细分析，利用稀疏性和短相关结构。作为应用，论文将阈值化协方差估计引入集合卡尔曼滤波，展示了理论在实际数据同化中的效用。该结果与您感兴趣的高维统计（稀疏协方差估计的非渐近理论）直接相关，并且集合卡尔曼滤波的应用触及统计计算方向。
关键技术: thresholded covariance estimator, non-asymptotic bounds, sample complexity exponential improvement, correlation lengthscale, ensemble Kalman filter
为什么对您有用: 该论文属于高维统计中稀疏协方差估计的前沿工作，直接连接您对高维统计（特别是协方差矩阵/算子的非渐近理论）的兴趣。您的技术库中'high-dimensional asymptotics'和'nonparametric statistics'可直接用于理解其误差界的推导与随机场模型的非参数假设。关于follow-up：中期可做——您只需在'moderately_familiar'的'semiparametric theory'上补充一些关于高斯随机场协方差结构建模的知识，即可尝试将类似阈值化技巧推广到更一般的半参数协方差设定中。

8. 10.3150/24-bej1810 · arXiv — Posterior consistency in multi-response regression models with non-informative priors for the error covariance matrix in growing dimensions¶

作者: Partha Sarkar, Kshitij Khare, Malay Ghosh
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 3/10 · novelty: new_theory
摘要: 该论文研究多响应回归模型（q个响应变量，n个样本）中误差协方差矩阵在施加逆Wishart尺度混合非信息先验下的后验相合性问题。在“q_n大、n大”且q_n = o(n)的设定下，对回归系数矩阵和误差协方差矩阵分别建立了后验相合性及收缩率，假设真实生成协方差矩阵满足一定谱条件且超参数适当。同时，当q_n/n → γ（γ>0）时，给出了后验分布及后验均值不一致的部分结果。技术关键包括利用逆Wishart尺度混合先验的谱表示、随机矩阵理论中的特征值集中工具来导出后验收缩率。这项工作是首个在高维回归框架下系统考察此类先验后验渐近性质的理论成果，填补了贝叶斯高维协方差建模中相合性分析的空白。对您而言，高维渐近结果与q_n/n阈值相关的相变现象直接联系到您在高维统计与随机矩阵理论中的兴趣——随机矩阵相变理论可用以解释这些不一致性。
关键技术: Inverse-Wishart scale mixture prior, posterior consistency, contraction rate, high-dimensional regression, spectral norm bounds, Bayesian asymptotics
为什么对您有用: 本文直接对应您在高维统计与随机矩阵理论中的核心兴趣：建立了q_n = o(n)下后验一致性，并揭示了q_n/n收敛到正常数时的不一致性，类似于RMT中的相变现象。您非常熟悉的高维渐近武器（如谱范数界限、特征值集中不等式）足以读懂其主要理论结果；中期可做的工作是推广到q_n/n→γ情形并建立精确相变阈值，这需要进一步提升随机矩阵理论（Marchenko-Pastur定律、尖峰模型）的精熟度。目前论文本身是一篇优秀的理论入口，值得深读。

非参数 / 半参数 (nonparam_semipara, 11 篇)¶

1. 10.3150/24-bej1800 · arXiv — A model-based approach to density estimation in sup-norm¶

作者: Guillaume Maillard
期刊/来源: Bernoulli
机构: University of Lusaka · École Nationale de la Statistique et de l'Analyse de l'Information · École Nationale de la Statistique et de l'Administration Économique · University of Luxembourg
分类: vol 31 · issue 3
相关性 9/10 · novelty: new_method
摘要: 本文提出一种基于模型框架的密度估计方法，目标是在一致范数（sup-norm）下寻找给定模型内的准最佳逼近。数据来自独立同分布样本，样本分布的平均值为目标密度，而目标密度不必属于该模型。方法通过构造一个经验损失函数并最小化来获得估计量，并进一步给出模型选择准则，使得在一般设定下满足 oracle 不等式。不等式质量依赖于模型内函数间 |p-q| 接近其最大值的集合的测度体积。在分段多项式和各向异性光滑类上，该方法达到了最优收敛速率。特别值得关注的是固定光滑度的单指标模型，该方法恢复了相应一维非参数速率，解决了一个开放问题。本文对一致范数下密度估计的理论分析具有纲领性贡献，为半参数和非参数估计提供了新视角。
关键技术: sup-norm density estimation, oracle inequalities, model selection via volume condition, piecewise polynomials, single index model, anisotropic smoothness classes
为什么对您有用: 该论文直接对应您对非参数与半参数理论（特别是密度估计的 minimax 理论）的兴趣，属于该子方向的前沿理论工作。您武器库中“非参数统计”和“minimax bounds”两项非常熟悉的工具可直接用于评估其 oracle 不等式的紧性，或尝试拓展到其他损失函数（如 Lp 范数）和更复杂的半参数模型。立即可做：您的现有技术足够深入理解并验证其理论结果，甚至可考虑将体积条件推广到高维或网络结构建模。

2. 10.3150/24-bej1792 · arXiv — Convergence of empirical optimal transport in unbounded settings¶

作者: Thomas Staudt, Shayan Hundrieser
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 8/10 · novelty: sharper_rate
摘要: 在无界设定下研究经验最优传输（EOT）代价向总体值的收敛速率，目标 estimand 为总体 OT 代价，关键假设为测度的矩条件（sharp up to ε>0）。核心方法基于分解策略：将无界空间上的 OT 代价分解为紧支撑截断部分与尾部误差，从而将紧空间上已知的收敛率结果迁移至无界情形。证明了紧空间上 EOT 的标志性性质——如对低复杂度的自适应（adaptation to lower complexity）——在无界情形下依然成立，收敛率在矩条件下仅损失任意小的 ε。主要理论结果是无界设定下近乎紧致的收敛率界，对您可能有用：该分解-截断思路与 semiparametric / nonparametric 理论中处理无穷维参数尾部误差的技术同源，且 OT 代价的收敛率分析直接关联 minimax rate 与 efficiency bound 的构造。
关键技术: empirical optimal transport, decomposition-based truncation, moment condition assumption, adaptation to lower complexity, convergence rate analysis
为什么对您有用: 本文连接到 nonparametric theory 与 minimax bounds 子方向：无界设定下 OT 代价的收敛率界是无穷维估计 minimax 理论的基础构件，而分解-截断策略与您熟悉的 nonparametric statistics 中处理尾部/无穷维参数的方法同构。用 very_familiar 的 minimax bounds for estimation problems 与 nonparametric statistics 武器即可审视其 rate 是否紧致、矩条件是否可进一步弱化，属于立即可做的 follow-up：验证其声称的 sharp-up-to-ε 界在具体 semiparametric 模型中是否可被 HOIF 或 higher-order U-statistic 技术逼近。

3. 10.3150/24-bej1789 · arXiv — From dense to sparse design: Optimal rates under the supremum norm for estimating the mean function in functional data analysis¶

作者: Max Berger, Philipp Hermann, Hajo Holzmann
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 7/10 · novelty: sharper_rate
摘要: 在多元固定同步设计下重复离散观测随机过程的设定中，目标是估计其 Hölder-smooth 均值函数在 supremum norm 下的最优收敛速率。与 L2 下已知结果类似，sparse design 下离散化项主导速率，而 dense design 下可达参数化 √n 速率；但本文揭示在 supremum norm 下存在一个由观测误差主导的中间 regime，这是 L2 分析中未出现的现象。技术上，作者证明 L2 下充分的插值估计量在 dense supremum norm 设定下是 sub-optimal 的，并通过构造新估计量在 dense 情形获得无额外对数因子的 √n 速率。进一步，文章给出了 supremum norm 下的中心极限定理，为构建 uniform confidence band 提供理论基础。对您可能有用：supremum norm 下的中间 regime 与无对数因子的 √n 速率直接丰富了非参效率与 minimax rate 理论的理解。
关键技术: supremum norm minimax rate, Hölder smoothness, functional data analysis, uniform confidence band, central limit theorem in supremum norm, sparse-dense intermediate regime
为什么对您有用: 本文直接推进了非参数 minimax rate 理论在 supremum norm 下的精细刻画，属于 primary interest 中 nonparametric / minimax bounds 的核心范畴。您可用 very_familiar 的 minimax bounds for estimation problems 工具验证其声称的中间 regime 与 sharper rate（无对数因子）是否紧，并审视插值估计量 sub-optimality 的 lower bound 构造。立即可做：用 minimax lower bound 技术复现或拓展其 supremum norm 下 sparse-dense phase transition 的阈值刻画。

4. 10.3150/24-bej1802 · arXiv — A new adaptive local polynomial density estimation procedure on complicated domains¶

作者: Karine Bertin, Nicolas Klutchnikoff, Frédéric Ouimet
期刊/来源: Bernoulli
机构: University of Valparaíso · Université Rennes 2 · Institut de recherche mathématique de Rennes · Université de Rennes · McGill University
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_method
摘要: 在已知任意维数复杂域上，目标是利用非参数局部多项式估计器进行多元密度函数的点估计，关键假设是域可以具有尖锐凹性、孔洞或局部收缩（如多项式扇区）而非星形。核心机制是构造适用于非星形域的局部多项式密度估计器，并引入基于 Goldenshluger–Lepski 方法的数据驱动带宽选择规则。理论方面，证明了在 Hölder 类下局部多项式估计器在 L² 风险下达到 minimax rate；自适应情形下给出了 oracle inequality 并显式确定了收敛速率。实证上，在多项式扇区域的模拟中，oracle 估计优于 R 包 sparr 的替代方法，且提供了在线 R 包实现。对您可能有用：该文的 minimax 收敛速率与 oracle inequality 分析直接连接到非参数统计与 minimax bound 武器库。
关键技术: local polynomial density estimation, Goldenshluger-Lepski bandwidth selection, minimax rate under L2 risk, oracle inequality, Holder-type functional classes, non-star-shaped domain adaptation
为什么对您有用: 本文直接连接到非参数统计与 minimax bounds 两个具体 interest 子方向，处理复杂域上的密度估计 minimax 与自适应理论。用 very_familiar 武器库中的 minimax bounds for estimation problems 与 nonparametric statistics 即可验证其声称的 minimax rate 与 oracle inequality 是否紧，并可将复杂域设定迁移到因果推断中处理 support 受限的 treatment/outcome 分布估计。立即可做：用 very_familiar 武器即可动手验证其 minimax 界的紧性与复杂域假设的必要性。

5. 10.3150/24-bej1788 · arXiv — Optimal Wasserstein-1 distance between SDEs driven by Brownian motion and stable processes¶

作者: Chang-Song Deng, René L. Schilling, Lihu Xu
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 4/10 · novelty: sharper_rate
摘要: 本文研究由对称 α-稳定 Lévy 过程与 Brownian 运动（α=2 特例）驱动的两个 ℝ^d SDE 之间的 Wasserstein-1 距离，目标是在 drift b 与扩散矩阵 σ 可逆的设定下量化跳跃扩散与连续扩散的分布偏差。核心上界利用了 SDE 解的 Feller 性与耦合技术，证明对 α∈[α₀,2)，W₁(X_t^x, Y_t^y) ≤ C₁e^{-C₂t}|x-y| + C/(α₀-1)(2-α)d·log(1+d)，从而对遍历测度 μ_α 与 μ_2 给出 O((2-α)d·log(1+d)) 的收敛率。在 Ornstein–Uhlenbeck 特例下，作者给出下界 W₁(μ_α, μ_2) ≥ C_d(2-α)，证实关于 α 的速率 (2-α) 最优，并指出 d·log(1+d) 的维度依赖似亦最优。对您而言，此结果为高维扩散逼近与 Lévy 过程的 minimax 速率提供了精确上下界参照。
关键技术: Wasserstein-1 distance, SDE coupling, stable Levy process, ergodic measure convergence, Ornstein-Uhlenbeck process, dimension-dependent rate
为什么对您有用: 本文直接涉及 minimax bounds 与高维渐近理论（primary interest），给出了 α→2 时稳定过程逼近 Brownian 运动的精确收敛率与维度依赖，属于 sharper_rate 类结果。您可用 very_familiar 中的 minimax bounds for estimation problems 视角审视其下界论证是否可迁移至统计逆问题中 Lévy 噪声 vs Gaussian 噪声的速率比较。follow-up 粗判：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将此 SDE 耦合速率嵌入到带 Lévy 噪声的 semiparametric M-estimator 效率界分析中。

6. 10.3150/24-bej1816 · arXiv — The fewest-big-jumps principle and an application to random graphs¶

作者: Céline Kerriou, Peter Mörters
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 3/10 · novelty: new_theory
摘要: 在独立重尾随机变量之和受移动截断边界（位置 n）约束的大偏差设定下，本文研究条件分布的渐近行为。核心结果是证明了一个“最少大跳跃原理”的大偏差原理：在给定总和在 n 尺度上异常大的条件下，仅有有限个变量取值接近截断边界，其余变量仍服从大数定律，这将无截断下的经典“单大跳跃原理”推广至仅发生最少必要跳跃的情形。作为应用，考虑环面格点上以重尾随机半径生成定向边的随机图；在给定边数异常大的条件下，证明超额出度凝聚于有限个随机散布的宏观出度顶点，而入度保持微观尺度无凝聚现象。对您可能有用：该最少跳跃机制为重尾模型中的稀疏极端事件提供了精细的条件分布刻画，可作为理解高维/半参数极端子空间行为的入门视角。
关键技术: large deviation principle, heavy-tailed random variables, fewest-big-jump principle, moving cut-off boundary, condensation in random graphs, conditional large deviations
为什么对您有用: 本文连接到非参数理论中重尾分布的大偏差分析，其“最少大跳跃”机制刻画了条件极端事件的稀疏结构。研究者可用 very_familiar 中的 minimax bounds for estimation problems 经验来审视该大偏差速率函数是否紧，或用 moderately_familiar 中的 M-estimation theory 思考重尾 M-估计的条件渐近行为是否受类似截断-跳跃机制支配。follow-up 粗判：中期可做——需先在 moderately_familiar 的大偏差理论（当前未列入 arsenal）上长肌肉，才能将该条件 LDP 工具迁移到高维估计或因果推断中重尾干扰的极端行为分析。

7. 10.3150/24-bej1793 · arXiv — Topological signatures of periodic-like signals¶

作者: Frédéric Chazal, Bertrand Michel, Wojciech Reise
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 3/10 · novelty: new_method
摘要: 在非参数信号分析设定下，本文针对周期类（periodic-like）信号构建了一种基于拓扑的签名（signature），目标 estimand 是仅依赖函数形状、对重参数化（reparametrisation）鲁棒的拓扑特征量。核心机制利用局部极值的排序与取值信息，通过持久图（persistence diagram）等拓扑工具将信号映射为签名，并在观测包含越来越多周期时证明签名的收敛性。估计方面，作者从单条时间序列出发，采用 bootstrap 技术构建签名的统计推断流程，避免了多样本重复观测的要求。主要理论结果给出了签名的收敛保证与 bootstrap 有效性，对您可能有用：该工作为非参数形状分析提供了拓扑视角，可与您熟悉的 minimax bound 工具结合探讨其估计率的紧性。
关键技术: topological data analysis, persistence diagram, reparametrisation-invariant signature, bootstrap inference, local extrema ordering, nonparametric shape analysis
为什么对您有用: 本文连接到非参数理论子方向，用拓扑签名做对重参数化鲁棒的形状推断，属于非参数统计与拓扑数据分析的交叉。您武器库中 very_familiar 的 minimax bounds for estimation problems 可直接用来分析该签名估计的 minimax rate 是否紧，或探讨拓扑特征估计的 lower bound。follow-up 判断：立即可做——用 minimax 工具分析其收敛率紧性。

8. 10.3150/24-bej1757 — Random fields on Hilbert spaces with their equivalent Gaussian measures¶

作者: Vinícius Ferreira, Emilio Porcu, Jorge Zubelli
期刊/来源: Bernoulli
机构: Khalifa University of Science and Technology
分类: vol 31 · issue 3
相关性 3/10 · novelty: new_theory
摘要: 在 Rd 紧集上索引的 Hilbert 空间值 Gauss 随机场框架下，目标是刻画两个 Gauss 测度在路径空间上的等价性（equivalence of Gaussian measures）。核心机制基于两场对应的 correlation operator 之差的谱性质：证明了测度等价性完全由该差 operator 的迹类（trace-class）条件与 Hilbert-Schmidt 结构决定。同时给出了 correlation operator 的 Bochner 特征化定理，将有限维矩阵核推广至无穷维 operator-valued 核的谱表示。理论结果为无穷维参数空间的 likelihood-based 推断与 Cameron-Martin 空间结构提供了严格的测度论基础，对您研究 semiparametric efficiency bound 在非标准路径空间下的计算可能有用。
关键技术: equivalence of Gaussian measures, correlation operator, trace-class condition, Bochner characterization for operator-valued kernels, Cameron-Martin space, Hilbert-space valued random fields
为什么对您有用: 直接连接 semiparametric theory 中 likelihood / influence function 在无穷维参数空间下的测度论根基（Cameron-Martin 空间与 Gauss 测度等价性是 semiparametric efficiency bound 的经典前置工具）。用 very_familiar 中的 high-dimensional asymptotics 与 inverse problems with random noise 经验可以审视其 correlation operator 谱条件的紧性。立即可做：用本文的 trace-class 等价条件检查您熟悉的 semiparametric 模型中 nuisance 参数路径的 Hellinger 覆盖条件是否可被更精确地刻画。

9. 10.3150/24-bej1803 · arXiv — The functional central limit theorem with mean uncertainty under the sublinear expectation¶

作者: Xiaofan Guo, Xinpeng Li
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 2/10 · novelty: new_theory
摘要: 在 sublinear expectation 框架下，研究具有均值不确定性（mean-uncertainty）的 iid 序列的泛函中心极限定理（FCLT），设定为 canonical space 上的概率核模型。核心机制利用经典概率论中的鞅中心极限定理与随机积分稳定性，在具有 well-defined 上下方差（upper/lower variance）的条件下，给出 canonical space 上的均值不确定性 FCLT。随后通过新的表示定理（representation theorem），将结果推广到一般 sublinear expectation space，从而将 Peng 的零均值非线性 CLT 推广至均值不确定情形，并给出纯概率证明而非现有的非线性 PDE 方法。作为应用，将两臂 bandit 问题的 CLT 从均值确定推广到均值不确定情形。对您可能有用：若关注 semiparametric efficiency bound 在分布不确定性下的稳健性，sublinear expectation 的上下方差结构提供了一种非 PDE 的概率刻画路径。
关键技术: sublinear expectation, functional central limit theorem, martingale CLT, stochastic integral stability, upper/lower variance, representation theorem
为什么对您有用: 本文连接到 semiparametric / nonparametric theory 子方向：sublinear expectation 的上下方差结构为 semiparametric efficiency bound 在分布不确定性下的稳健性提供了一种概率刻画，纯概率证明路径（鞅 CLT + 随机积分稳定性）对熟悉高维渐近与 minimax 理论的研究者而言是可读的入门。用 very_familiar 中的 minimax bounds 与 high-dimensional asymptotics 可以审视其上下方差界是否与经典 minimax rate 有对应关系。follow-up 判断：中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉，将 sublinear expectation 的上下方差与 semiparametric efficiency bound 的信息界做对接。

10. 10.3150/24-bej1762 · arXiv — Short-time expansion of characteristic functions in a rough volatility setting with applications¶

作者: Carsten H. Chong, Viktor Todorov
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 2/10 · novelty: new_theory
摘要: 在 Itô 半鞅框架下，目标是当观测时间间隔趋于零时，对增量条件特征函数进行高阶渐近展开；关键假设允许扩散波动率的路径具有粗糙性（Hurst 参数 H<1/2 的分数布朗运动局部行为）且跳跃活动度任意。核心机制是通过迭代 Itô 公式与随机 Fubini 定理，将特征函数展开至高阶项，揭示粗糙波动率、跳跃与连续局部时间对展开系数的分层贡献。基于该展开，构造了 Hurst 参数的非参数估计量，利用短期期权组合数据实现估计，并给出估计量的收敛速率与渐近分布。对您可能有用：本文的高阶特征函数展开技术可视为连续时间半参数模型中 HOIF 思想的类比，其粗糙波动率设定下的非参数推断与您对高阶 U-统计量及半参数效率的兴趣直接相连。
关键技术: higher-order asymptotic expansion, conditional characteristic function, rough volatility, Itô semimartingale, nonparametric Hurst parameter estimation, short-dated options portfolio
为什么对您有用: 本文连接到您 primary interest 中的非参数/半参数理论与高阶 U-统计量：其高阶特征函数展开本质上是在连续时间极限下对特征函数做逐阶逼近，与您熟悉的 HOIF（高阶影响函数）逐阶修正思想有结构相似性，可用您 very_familiar 的非参数统计与 minimax bound 工具审视其 Hurst 参数估计的收敛率是否达到极小极大下界。Follow-up 判断：中期可做——需先在 moderately_familiar 的 HOIF 理论上长肌肉，将离散时间 HOIF 的逐阶投影与本文连续时间 Itô 展开做严格类比，以探索粗糙波动率设定下是否存在半参数效率界及可达的 debiased 估计量。

11. 10.3150/24-bej1797 — PDE characterization of geometric distribution functions and quantiles¶

作者: Dimitri Konen
期刊/来源: Bernoulli
机构: University of Cambridge
分类: vol 31 · issue 3
相关性 1/10 · novelty: new_theory
摘要: 在欧氏空间中，研究任意概率测度如何通过其几何（空间）分布函数（即统计深度区域的概率含量）被显式重构的问题。核心发现是重构可由一个（可能分数阶的）线性 PDE 实现，且微分算子具有闭式表达，从而推翻了深度社区认为几何 cdf 无法精确控制深度区域概率含量的普遍观点。作者系统研究了几何分布函数的正则性，证明连续密度一般不足以支撑逐点密度重构所需的几何 cdf 正则性。最惊人的理论结果是重构行为在奇偶维数下截然不同：奇数维下重构是局部的，偶数维下则完全非局部；文中给出了偶数维的部分补偿结果及奇数维球对称分布的几何 cdf 一般表示公式，并在 d=2,3 给出显式密度重构。对您可能有用：PDE 重构与奇偶维数局部性差异为非参数理论提供了新的函数空间视角，可启发半参数效率界中影响函数的正则性分析。
关键技术: geometric distribution function, statistical depth, fractional linear PDE reconstruction, regularity of spatial cdf, local vs nonlocal reconstruction parity, spherically symmetric representation
为什么对您有用: 本文直接连接非参数理论子方向，用 PDE 刻画几何分布函数与密度的重构关系，并揭示奇偶维数下局部/非局部性的本质差异。您武器库中 very_familiar 的 minimax bounds for estimation problems 可直接攻入：几何 cdf 的正则性阶数决定了密度重构的收敛速率下界，用 minimax 框架可验证文中 PDE 重构在偶数维非局部情形下的速率是否紧。follow-up 判断：立即可做——用 minimax rate 分析不同维数下基于几何 cdf 的密度估计效率。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)¶

1. 10.3150/24-bej1795 · arXiv — Edgeworth expansion by Stein’s method¶

作者: Xiao Fang, Song-Hao Liu
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 9/10 · novelty: new_method
摘要: 本文在一般分布设定下（不要求光滑测试函数或连续型随机变量）使用 Stein 方法证明了二次 Edgeworth 展开。经典 Edgeworth 展开通常利用特征函数，而 Stein 方法的已有结果受限于测试函数光滑性或连续性假设。作者通过反复使用 Stein 方程、基于 Stein 核的恒等式以及替换论证，绕开了这些限制，得到了与古典结果同样的二阶精度。关键在于构造合适的 Stein 核并迭代 Stein 方程，从而处理指示函数的不可微性。该方法为分布近似中更高阶校正提供了统一的 Stein 方法框架。理论结果直接适用于假设检验中检验统计量 p 值的更精确近似，与您对假设检验渐近理论的兴趣紧密相连。
关键技术: Stein's method, Edgeworth expansion, Stein kernel, Stein equation, replacement argument, higher-order corrections
为什么对您有用: 论文直接关联您对假设检验中分布近似理论的兴趣，Edgeworth 展开可为检验统计量的 p 值提供二阶校正，提升有限样本精度。您在高维渐近领域的技术积累可以快速理解本文的渐近分析框架，而其中的 Stein 核技术也能与您熟悉的高阶 U 统计量的分布展开产生交叉（例如用 Stein 方法推导 U 统计量的 Edgeworth 展开）。立即可做：利用本文的方法直接改进您研究中的某个检验统计量的高阶近似。

2. 10.3150/24-bej1801 — Goodness-of-fit tests for high-dimensional parametric multiresponse regressions¶

作者: Ran Liu, Jiaqi Huang, Lixing Zhu
期刊/来源: Bernoulli
机构: Beijing Jiaotong University · Beijing Normal University
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_theory
摘要: 在高维参数多响应回归（响应数与参数数可随样本量发散）设定下研究 goodness-of-fit 检验，特别关注 ODE 模型解作为多响应回归实例的情形。提出两类新检验：全局平滑检验具有正态弱极限，克服了经典固定维情形下零假设极限分布不可追踪的难题；局部平滑检验在特定条件下具有 dimension-agnostic 性质。关键发现是响应维度的增加可提升两类检验对备择模型的敏感度；在特定 regularity 条件下，它们能以快于固定维经典检验最快可达速率的速率检测局部备择假设。对您有用：本文直接推进高维假设检验理论，其 dimension-agnostic 与 faster-than-classical local-alternative detection 机制与您的高维渐近及非参检验兴趣高度契合。
关键技术: high-dimensional multiresponse regression, global smoothing test, local smoothing test, dimension-agnostic limiting distribution, normal weak limit under null, local alternative detection rate
为什么对您有用: 直接连接您 primary interest 中的 hypothesis testing 与 high-dimensional asymptotics 子方向；您 very_familiar 的高维渐近与 minimax bound 工具可直接用来审视本文声称的 faster-than-classical detection rate 是否紧、dimension-agnostic 条件是否可进一步弱化。立即可做：用 minimax rate 与高维渐近工具验证其局部备择检测速率的 sharpness，并探索该多响应框架下是否存在 semiparametric efficiency bound。

3. 10.3150/24-bej1812 · arXiv — Inference for change-plane regression¶

作者: Chaeryon Kang, Hunyong Cho, Rui Song, Moulinath Banerjee, Eric B. Laber, Michael R. Kosorok
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 4/10 · novelty: new_method
摘要: 本文研究 change-plane 回归的推断问题，其中 change-plane 参数（分割超平面）的估计面临目标函数具有多个全局最小值的困难。为此作者提出了两种处理非唯一性的估计量，并证明了它们均达到 n 速率收敛，推导了各自的极限分布。基于这些结果，设计了参数 bootstrap 程序用于假设检验和区间估计。模拟实验验证了有限样本性能，并在 ACTG175 AIDS 数据中展示了该方法在精准医学中识别潜在亚组的应用。该工作紧密结合 M 估计理论与非光滑目标函数的渐近分析，对您之前熟悉的假设检验和 M 估计工具有直接延拓价值。
关键技术: change-plane regression, parametric bootstrap, n-rate convergence, multiple minimizers, M-estimation, subgroup identification
为什么对您有用: 该论文处理非光滑目标函数下的参数推断，与您假设检验和 M 估计理论（moderately_familiar 中的 M-estimation theory）直接相关；其 change-plane 模型在精准医学中识别异质性亚组，可连接到您因果推断兴趣中的个体化处理效应。中期可做：需先在 M 估计理论（非光滑目标的一阶条件、经验过程工具）上加强，但 very_familiar 中的非参数统计和高维渐近已是起步基础。

统计计算 / 算法 (stat_computing, 5 篇)¶

1. 10.3150/24-bej1807 · arXiv — Scaling of piecewise deterministic Monte Carlo for anisotropic targets¶

作者: Joris Bierkens, Kengo Kamatani, Gareth O. Roberts
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_theory
摘要: 本文研究分段确定性蒙特卡洛（PDMP）方法在非各向异性目标分布下的计算成本缩放。具体设定为高斯目标分布包含两个尺度（1和ε）。作者采用多尺度分析框架，推导出Bouncy Particle Sampler的计算成本为O(ε^{-1})，而Zig-Zag采样器为O(ε^{-2})。相比之下，传统随机游走Metropolis（RWM）方法在目标小分量维数大于1时成本为O(ε^{-2})。因此，PDMP方法在处理非各向异性目标时具有鲁棒性优势。这一结果为高维MCMC方法的选择提供了理论指导。本研究属于统计计算中的MCMC理论方向，与您对统计计算和计算约束统计的兴趣直接相关，可作为理解PDMP类方法的入门读物。
关键技术: piecewise deterministic Markov processes, Zig-Zag sampler, Bouncy Particle Sampler, multi-scale analysis, computational cost scaling, anisotropic Gaussian targets
为什么对您有用: 本文是MCMC缩放分析的清晰入门，适合外行理解PDMP。您的武器库中“高维渐近”和“软件开发”可用于验证缩放结果或扩展至更一般分布，但对MCMC收敛理论本身需要补充学习（moderately_familiar中的“M估计理论”可能有部分重叠）。值得花时间阅读全文，因为MCMC是计算统计的核心工具，了解其鲁棒性对您未来的方法论研究有参考价值。

2. 10.3150/24-bej1790 · arXiv — Optimal scaling results for Moreau-Yosida Metropolis-adjusted Langevin algorithms¶

作者: Francesca R. Crucinio, Alain Durmus, Pablo Jiménez, Gareth O. Roberts
期刊/来源: Bernoulli
机构: École Polytechnique · Centre de Mathématiques Appliquées de l'École polytechnique
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_theory
摘要: 本文研究基于 Moreau-Yosida 近邻映射的 Metropolis-adjusted Langevin 算法（MYMALA）在非可微目标分布下的最优 scaling 问题，核心参数为近邻包络的 λ。该方法通过 Moreau-Yosida 正则化构造 proposal，兼容可微与非可微目标，比经典 MALA 具有更宽的稳定性。作者在高维极限下推导了该算法族（包含 MALA 作为特例）的扩散逼近与最优步长选取准则，给出了 λ 与步长的实用调参指南。主要理论结果刻画了 λ 对接受率与混合速度的影响，并显式给出最优 scaling 常数。对您有用：若在统计计算中遇到非可微目标（如 L1 正则后验、截断分布）的 MCMC 采样，MYMALA 提供了有理论保障的替代方案。
关键技术: Moreau-Yosida envelope, Metropolis-adjusted Langevin algorithm, optimal scaling, diffusion approximation, proximal MCMC
为什么对您有用: 本文连接到统计计算与数值方法方向，核心是 MCMC 算法在高维非可微目标下的最优 scaling 理论。您武器库中的高维渐近理论可直接用于审视其 diffusion approximation 推导；若后续要为非可微 semiparametric / debiased-ML 目标设计采样器，MYMALA 的近邻映射思路可借鉴。Follow-up 判断：立即可做——用您熟悉的 minimax / 高维渐近视角验证其 scaling 常数在特定非可微模型（如 Laplace 先验）下是否紧。

3. 10.3150/24-bej1796 · arXiv — Explicit constraints on the geometric rate of convergence of random walk Metropolis-Hastings¶

作者: Riddhiman Bhattacharya, Galin Jones
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 6/10 · novelty: new_theory
摘要: 在一般状态空间上，研究随机游走 Metropolis-Hastings (RWMH) Markov 链的几何收敛速率，目标是在 drift-and-minorization 假设下给出收敛速率的显式上下界。核心技术创新是为 RWMH 构造了显式的 drift 函数与 minorization 条件，从而首次获得几何收敛速率的显式约束（而非仅证明其存在性）；同时利用谱理论推导了收敛速率的下界。理论结果被应用于 Bayesian Poisson 回归等此前无法分析的 GLM 指数族模型，填补了现有几何遍历充分条件无法给出速率显式约束的空白。对您可能有用：若在因果推断或高维 M-estimation 中使用 RWMH 做 posterior 或 target density 抽样，显式速率界可直接用于 Monte Carlo 误差的 rigorous 评估。
关键技术: explicit drift and minorization conditions, geometric convergence rate bounds, spectral theory for Markov chains, random walk Metropolis-Hastings, Bayesian generalized linear models
为什么对您有用: 本文属于 stat_computing 与 mathematical statistics 交叉，显式 drift/minorization 条件与谱理论下界为 MCMC 收敛诊断提供了可计算的工具，连接到您 primary interest 中的 statistical computing 与 hypothesis testing（MCMC 误差控制是 permutation/randomization test 的基础）。您武器库中 very_familiar 的 inverse problems with random noise 与 high-dimensional asymptotics 可用于审视本文 GLM 设定下 drift 函数在高维极限的退化行为，这是一个自然的 follow-up 口子。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将本文的 drift/minorization 技术推广到 semiparametric M-estimator 的 posterior 收敛速率分析。

4. 10.3150/24-bej1799 · arXiv — On the convergence of PINNs¶

作者: Nathan Doumèche, Gérard Biau, Claire Boyer
期刊/来源: Bernoulli
机构: Laboratoire de Probabilités et Modèles Aléatoires · Laboratoire de Probabilités, Statistique et Modélisation · Bristol-Myers Squibb (Switzerland)
分类: vol 31 · issue 3
相关性 5/10 · novelty: new_theory
摘要: 该文研究物理信息神经网络（PINNs）求解偏微分方程（PDE）的收敛性。经典PINN训练可能遭受系统性过拟合，导致解不满足物理约束。作者在经验风险中加入岭正则化（ridge regularization），证明了所得估计量在线性与非线性PDE系统中都是风险一致的（risk-consistent）。对于线性PDE，进一步引入可实现的Sobolev型正则化，可重构出既达到统计精度又符合物理定律的解。证明借助泛函分析与变分法工具，建立了强收敛性。该文为PINN提供了理论保证，对统计计算中的正则化方法选择具有指导意义。
关键技术: physics-informed neural networks, ridge regularization, Sobolev regularization, risk consistency, functional analysis
为什么对您有用: 连接统计计算子方向（数值方法/算法），PINN的正则化一致性分析属于计算统计学的理论问题。您非常熟悉的非参数统计中偏差-方差权衡与泛函分析工具可直接用于理解其正则化机制。立即可做：用非参数统计视角检验其风险一致性条件是否紧。

5. 10.3150/24-bej1791 · arXiv — Lower bounds on the rate of convergence for accept-reject-based Markov chains in Wasserstein and total variation distances¶

作者: Austin Brown, Galin Jones
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 4/10 · novelty: new_theory
摘要: 本文针对接受-拒绝型马尔可夫链（如Metropolis-Hastings算法）的收敛速度，分别在总变差距离和Wasserstein距离下导出了下界，用于识别调参不良时链的失效模式。利用下界研究了几何遍历链的收敛复杂度，并约束了其收敛率。特别关注当参数n（如后验集中参数）增大时，调参须随n谨慎变化，否则收敛率可任意慢。采用Bayesian logistic回归（Zellner's g-prior，维度与样本同增；flat prior，n增大）作为实证示例，展示了调参须适应n的增长以避免慢收敛。该结果为MCMC算法调参提供了理论指导，对您可能有用：本文的下界工具可直接与您熟练的minimax bound技术对接，为高维后验抽样的计算瓶颈诊断提供新视角。
关键技术: Metropolis-Hastings, total variation distance, Wasserstein distance, geometric ergodicity, lower bounds on convergence rate, Bayesian logistic regression
为什么对您有用: 本文直接连接您对统计计算中算法收敛分析的关注，特别是MCMC调参的理论指导。您对minimax bounds非常熟悉，可以立即用该下界技术评估其紧性，并推广到Hamiltonian Monte Carlo等其他算法。该问题立即可做，无需新工具。

其他 (other, 3 篇)¶

1. 10.3150/24-bej1745 · arXiv — Limit theorems for SDEs with irregular drifts¶

作者: Jianhai Bao, Jiaqing Hao
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 4/10 · novelty: new_theory
摘要: 本文研究了具有Hölder连续或分段连续漂移的随机微分方程（SDE）的强大数定律和中心极限定理。通过构造精巧的测试函数并运用反射耦合方法，证明了在拟Wasserstein距离下解过程的指数收缩性质。该收缩性质是推导加性泛函收敛速率的关键，且结论对于不规则漂移的SDE是全新的。论文给出了明确的收敛阶（如n^{-1/2}率），并展示了反射耦合在处理非光滑漂移时的优势。该工作为SDE的极限理论提供了分析工具，但未涉及统计推断中的具体问题。
关键技术: strong law of large numbers, central limit theorem, reflection coupling, quasi-Wasserstein distance, additive functionals, Hölder continuous drift
为什么对您有用: 本文属于随机过程极限定理，与您的因果推断、高维统计等主要兴趣无直接交叉。反射耦合方法虽在MCMC加速中有用，但当前武器库（非参、U统计等）无法直接迁移。暂不可做：缺乏SDE耦合理论的基础工具。

2. 10.3150/24-bej1815 · arXiv — Extrinsic derivative formula for distribution dependent SDEs¶

作者: Panpan Ren
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 0/10 · novelty: new_theory
摘要: 本文在分布依赖型随机微分方程（DDSDEs）框架下，建立了外导数（extrinsic derivative）的 Bismut 型公式。主要方法是利用 Malliavin 微积分工具，通过概率表示给出梯度的显式表达式，避免了经典偏微分方程理论的限制。该公式适用于非退化 DDSDEs，允许漂移项具有时空奇异行为；也适用于退化 DDSDEs，仅要求系数满足弱单调条件。结果不依赖于解的正则性，可直接用于灵敏度分析和参数扰动研究。本文的工作严格属于随机分析领域，与您的主要研究方向（因果推断、高维统计等）无直接交集。但对于连续时间处理效应或中介分析中涉及 SDE 建模的问题，Malliavin 导数技术可能提供新的分析视角。
关键技术: Bismut formula, extrinsic derivative, distribution dependent SDEs, Malliavin calculus, nondegenerate DDSDEs, weakly monotone coefficients
为什么对您有用: 本文属于随机分析理论，与您的核心研究兴趣（因果推断、半参效率理论、高维统计）无直接重叠。作为纯粹的数学统计拓展阅读，Malliavin 微积分在无限维灵敏度分析中的使用可能对您未来在连续时间因果推断（如 SDE 处理效应）有启发，但当前阶段不构成直接可迁移的技术切入点。暂不可做，因为所需的 Malliavin 导数工具不在当前武器库中。

3. 10.3150/24-bej1814 · arXiv — Sandpiles on the Vicsek fractal explode with probability 14¶

作者: Nico Heizmann, Robin Kaiser, Ecaterina Sava-Huss
期刊/来源: Bernoulli
分类: vol 31 · issue 3
相关性 0/10 · novelty: new_theory
摘要: 本文研究 Vicsek 分形图上 Abelian 沙堆模型的稳定与爆炸问题，目标是在无限体积极限加一粒子的设定下确定爆炸概率。作者给出两种证明路径：概率方法通过分析有限体积边界接收粒子数大于四的正概率来刻画爆炸；代数方法将无限体积爆炸问题转化为有限近似图上沙堆群元素的阶，并借此求出所有不变因子。核心结论是爆炸概率精确为 1/4（稳定概率 3/4），且代数方法可推广至更一般的状态空间。Vicsek 分形的自相似与树状结构使得闭式表达可行，这与 Z^2 上沙堆理论仍存大量开放问题形成对比。对您而言，本文的代数沙堆群视角与分形图上的精确组合计算可作为概率图模型与组合统计的课外参考，但与您核心研究方向无直接交集。
关键技术: Abelian sandpile model, sandpile group invariant factors, Vicsek fractal graph, infinite volume limit stabilization, self-similar graph combinatorics
为什么对您有用: 本文属于概率与组合图论交叉，与您 primary interests（因果推断、高维/效率理论、U-statistics）无直接方法学关联。虽然沙堆群涉及有限图上的代数结构，且 Vicsek 分形有树状特征，但这些组合工具与您 technical_arsenal 中的 treewidth/tensor contraction（用于高阶 U-statistic 计算复杂度）属于不同语境，无法直接迁移。暂不可做：核心机器（沙堆群代数理论、分形图上的随机过程）不在武器库中，且缺乏通向因果/高维/效率理论的明确桥梁；仅可作为纯数学消遣阅读，不建议投入时间深读。

Maintained by 陈星宇 · Homepage · Source on GitHub