EJS — Vol 19 Issue 2 · 2026-06-23¶

共 34 篇 · Electronic Journal of Statistics
目录核对 ⚠️ 疑似漏 37 篇（对照 OpenAlex 72 篇）：10.1214/25-ejs2467、10.1214/25-ejs2397、10.1214/25-ejs2427、10.1214/25-ejs2456、10.1214/25-ejs2416 等

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

这一期34篇论文可归纳为四条主线：因果识别与效率改进、高维统计与随机矩阵、非参数与函数数据方法、假设检验新框架。因果主线包括分布性IV估计、改进双稳健ATE估计、转移Q学习、联合动态模型；高维主线覆盖概率矩阵谱衰减估计、fiducial选择器、高维时间序列变点检测、扩散过程Lasso、极值方向数选择；非参主线数量最多，涉及深度神经网络的minimax最优性、卷积密度估计、高斯过程后验收缩、多元函数数据正则性、多变量逆高斯核、FNP-MIDAS、极端回归、过参数化神经网络、常数步长SGD、流形共形推断、差分隐私深度中位数、协方差同时推断、形状约束函数数据、Riemannian CCA、熵正则化Wasserstein估计等；假设检验主线包括稀疏图选择后推断、置换多重检验、函数数据变点检测、流形功能时间序列LRD检验、图割极限分布。

因果主线推进最集中：Instrumental variable estimation of distributional causal effects将IV方法从平均效应扩展到整条干预分布，提出了非参数DIVE估计量并给出识别条件；Efficiency-improved doubly robust estimation通过引入非混杂预测协变量，在倾向得分正确指定时达到DR估计量族中的最小渐近方差，同时保留双稳健性；Transfer Q-learning针对有限时域MDP，利用源任务数据通过重定目标步骤实现跨阶段迁移，优化了Q函数估计的收敛速度和遗憾界；Joint dynamic models对复发事件、纵向标记、健康状态建立半参数联合模型，在计数过程框架下给出n^{-1/2}-CAN估计。这几篇共同拓展了因果推断中IV、DR、动态处理及纵向因果的方法工具箱，尤其注重非参数或半参数效率保证。

高维主线呈现两类推进：一是基础结构的极小极大估计，如Minimax optimal probability matrix estimation for graphon with spectral decay证明谱阈值算法在谱衰减类图上达到最优率且无计算-统计差距，Fiducial selector以一次fiducial抽样实现模型选择、无偏估计与置信区间，无需交叉验证；二是高维时间序列的变点与稀疏推断，如Change point estimation for high-dimensional time series with network structure用fused LASSO两步法同时估计变点位置与网络系数，Sampling effects on Lasso estimation of drift functions in high-dimensional diffusion processes给出离散观测下的oracle不等式并恢复连续速率，Information criteria for the number of directions of extremes in high-dimensional data提出BIC与QAIC一致估计极端方向数。此外，Selective inference for sparse graphs via neighborhood selection利用外部随机化得到精确选择后条件分布，Permutation-based multiple testing when fitting many generalized linear models通过符号翻转分数自适应相关结构控制族系错误率。

非参主线数量庞大，核心趋势是融合深度网络、函数数据与流形结构。深度网络方面，Minimax optimality of deep neural networks on dependent data via PAC-Bayes bounds将最小最优结果扩展到依赖链，On the rate of convergence of an over-parametrized deep neural network regression estimate证明梯度下降训练的过参数化ReLU网络可达到经典极小极大速率；函数数据方面，Simultaneous inference for covariance function of next-generation functional data用三角剖分样条在非规则域上构造渐近同时置信区域，Decomposition-based intrinsic modeling of shape-constrained functional data通过Fréchet均值与回归建模正/单调约束函数，Fully NonParametric MIDAS以回拟合与趋势过滤处理混合频率非线性回归，Learning the regularity of multivariate functional data给出曲面正则性的指数浓度界；流形方法上，Conformal inference for regression on Riemannian manifolds将共形预测推广至流形值响应，High-dimensional generalized linear models for Hilbert manifold covariates结合谱分解与惩罚估计Riemannian协变量上的惩罚函数，Asymmetric canonical correlation analysis of Riemannian and high-dimensional data用切线空间筛与群稀疏惩罚估计异质数据间的典型相关方向。这些工作共同丰富了非参数估计在依赖数据、函数约束、复杂域上的收敛理论与自适应工具。

适合按主题优先看：因果推断方向——Instrumental variable estimation of distributional causal effects、Efficiency-improved doubly robust estimation、Transfer Q-learning；半参数效率方向——Joint dynamic models and statistical inference for recurrent competing risks, longitudinal marker, and health status、Online inference in high-dimensional regression with streaming clustered data；高维方向——Minimax optimal probability matrix estimation for graphon with spectral decay、Fiducial selector: Fast and efficient inference for high-dimensional regression、Selective inference for sparse graphs via neighborhood selection。

因果推断 (causal_inference, 4 篇)¶

1. 10.1214/25-ejs2460 · arXiv — Instrumental variable estimation of distributional causal effects¶

作者: Lucas Kook, Niklas Pfister
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 9/10 · novelty: new_method
摘要: 本文针对工具变量（IV）框架下分布性因果效应的估计问题。在二元处理变量设定下，提出一套分布性IV模型假设，推导出干预累积分布函数（CDF）的识别条件。基于该识别结果，构造了一个非参数估计量DIVE，用于估计两种处理水平下的干预CDF。方法不依赖参数模型，适用于存在未测混杂或随机试验不依从的场景。通过模拟实验和两个真实数据应用验证了方法的有效性。该工作将IV方法从平均效应拓展至整个响应分布，丰富了因果推断的工具箱。对您的价值：直接连接您的主要兴趣——因果推断中的IV方法，并且非参数估计框架与您擅长的非参数统计和因果推断估计理论高度契合。
关键技术: instrumental variable, interventional CDF, nonparametric estimation, distributional causal effects, identification
为什么对您有用: 本文属于因果推断中IV方法在分布性效应上的拓展，直接对口您“因果推断（identification, estimation, IV）”子方向。您武器库中“非参数统计”和“因果推断估计理论”两项very_familiar工具可直接用于分析其非参数估计量的收敛性质和效率，而“因果推断识别理论”这一moderately_familiar项也正好通过本文的识别假设得到锻炼。判为“立即可做”——您已有足够装备深入其理论或尝试扩展到连续处理等场景。

2. 10.1214/25-ejs2424 · arXiv — Efficiency-improved doubly robust estimation with non-confounding predictive covariates¶

作者: Shanshan Luo, Mengchen Shi, Wei Li, Xueli Wang, Zhi Geng
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 9/10 · novelty: new_method
摘要: 本文针对平均处理效应（ATE）的双稳健（DR）估计量在结局模型可能误设时方差过大的问题，提出了一种改进的DR估计量。该估计量在倾向得分模型正确指定时达到所有DR估计量中最小的渐近方差，同时保留了双稳健性（即倾向得分或结局模型之一正确时仍保持一致性）。方法的核心是额外引入对结局有预测能力、但不影响处理的非混杂协变量（non-confounding predictive covariates），通过加权或调整来进一步降低估计变异性。理论部分证明了新估计量的渐近正态性和方差最优性，并与现有DR估计量（如基于逆概率加权和回归调整的经典形式）进行了方差比较。模拟和两例真实数据分析显示，在结局模型误设时新方法估计精度显著优于传统DR估计量。对您而言，本文直接涉及因果推断中估计效率的提升，与您擅长的估计理论（特别是处理效应估计的半参效率界）紧密相关，可立即可用您熟悉的因果推断估计理论来分析其方差表达式与效率界的关系。
关键技术: doubly robust estimation, non-confounding predictive covariates, asymptotic variance minimization, propensity score model, outcome regression misspecification
为什么对您有用: 本文属于因果推断中ATE估计效率优化的方法论工作，直接对应您对双稳健估计和半参效率理论的兴趣。您已有的估计理论（very_familiar）可以立即用于验证其方差最优性证明的严密性，并探讨非混杂协变量选择对效率界的影响。立即可做：用您熟悉的半参效率界框架检查其是否达到局部效率下界，或通过更高阶U统计量的视角分析其方差结构。

3. 10.1214/25-ejs2459 — Transfer Q-learning for finite-horizon Markov decision processes¶

作者: Elynn Chen, Sai Li, Michael I. Jordan
期刊/来源: Electronic Journal of Statistics
机构: New York University · Renmin University of China · University of California, Berkeley
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 研究问题：在时齐有限时域马尔可夫决策过程（MDP）中，针对高维状态空间和样本不足的挑战，利用多个源任务的数据进行知识迁移以改进目标任务的Q学习。方法：提出了适用于批处理和在线的迁移Q学习算法，包含一个新颖的重定目标（re-targeting）步骤，实现跨阶段（cross-stage）和跨任务的有效迁移。理论：在阶段间奖励相似性和适度设计相似性假设下，证明了离线迁移中Q*函数估计的收敛速度更快，以及离线到在线迁移中遗憾界更低。实证：通过合成数据和真实数据验证了算法的有效性和理论结果。对您有用：该方法与动态治疗机制中的强化学习因果推断直接相关，您擅长的非参数估计和最小最大速率分析可用于检验其最优性或在更一般的半参数框架下扩展。
关键技术: Transfer learning, Q-learning, Finite-horizon Markov decision process, Offline reinforcement learning, Regret bound analysis, Cross-stage transfer
为什么对您有用: 本文直接涉及动态治疗机制（dynamic treatment regimes）中的因果推断与强化学习，与您的第一兴趣方向吻合。您非常熟悉的非参数统计和估计理论中的最小最大界工具可用于验证该方法是否达到最优收敛速率，或将其结果扩展到半参数效率界。基于现有武器库，可以立即可做，用您熟悉的极小极大界分析其迁移学习的敛速最优性。

4. 10.1214/25-ejs2411 · arXiv — Joint dynamic models and statistical inference for recurrent competing risks, longitudinal marker, and health status¶

作者: Lili Tong, Piaomu Liu, Edsel A. Peña
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文在纵向生物医学/公共卫生研究设定下，考虑一个同时包含竞争性复发事件过程、离散状态纵向标记过程、以及离散状态健康状态过程（含吸收态）的联合动态模型。目标是对模型参数（有限维和无限维）进行半参数和似然推断，并在计数过程和连续时间 Markov 链框架下刻画各过程间的动态关联。核心方法包括基于计数过程强度的似然函数构造、半参数 M-estimation、以及无穷维参数的渐近理论；估计量被证明具有 n^{-1/2}-CAN 性质和渐近正态性。理论结果通过有限样本模拟验证，展示了估计量的偏差、方差和覆盖概率表现。对您而言，这篇论文提供了纵向/复发事件数据的联合建模视角，可补充您在 longitudinal causal inference 和 semiparametric efficiency 方面的技术储备。
关键技术: counting process intensity, continuous-time Markov chain, semiparametric M-estimation, competing risks model, joint longitudinal-survival model, asymptotic normality
为什么对您有用: (1) 连接到您 primary interest 中的 longitudinal causal inference 和 semiparametric theory——本文的联合动态模型框架可作为处理 time-varying confounding 和 competing risks 的基础设定。(2) 您 very_familiar 的 nonparametric statistics 和 moderately_familiar 的 semiparametric theory / M-estimation theory 足以攻本文的估计量和渐近性质分析；若想深入，可用 semiparametric efficiency bound 验证其估计量是否达到效率下界。(3) 中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉（特别是无穷维参数的 influence function 计算），才能判断其似然估计量是否 efficient 或能否构造 one-step efficient estimator。

高维统计 / 随机矩阵 (high_dim_rmt, 5 篇)¶

1. 10.1214/25-ejs2432 · arXiv — Minimax optimal probability matrix estimation for graphon with spectral decay¶

作者: Yuchen Chen, Jing Lei
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 8/10 · novelty: new_theory
摘要: 本文研究基于图谱的随机图模型中概率矩阵的极小极大最优估计问题，以图的特征值衰减率刻画图的正则性。作者证明，对于谱衰减类图（如多项式或指数衰减），谱阈值算法能够达到极小极大最优率，且与信息论下界仅差一个对数因子。与传统的阶梯图（step-graphon）或Hölder光滑图不同，谱衰减类图不存在计算-统计差距——即多项式时间算法即可实现统计最优率。技术核心是利用特征值阈值化自适应选择秩，并借助随机矩阵理论中的谱偏差分析控制估计误差。理论结果揭示了光滑性并非图的本质特征，而谱衰减才是内在的regularity条件。对您而言，本文直接连接您的高维统计和随机矩阵理论兴趣，且所揭示的计算-统计差距消失现象对您关注的统计-计算权衡领域具有gateway价值。文中谱阈值方法完全在您非常熟悉的高维渐近和极小极大界分析框架内，可立即复现或推广至其他图模型。
关键技术: spectral thresholding, minimax optimal rate, eigenvalue decay, graphon, computational-statistical gap
为什么对您有用: 本文以特征值衰减（谱类）替代传统光滑性假设，与您非常熟悉的高维渐近和随机矩阵理论有机衔接——谱阈值估计器的分析几乎可直接套用您的已有工具（如Marchenko-Pastur类谱分离结果）。此外，文中关于谱类图无计算-统计差距的结论，恰好是您作为outsider进入统计-计算权衡领域的理想入门案例：模型简单、对比清晰（光滑类有gap vs 谱类无gap），且证明策略（下界构造+算法上界）易于提取。粗判为立即可做——您无需额外学习新机器即可复现、扩展或探索谱衰减假设下因果图模型的估计问题。

2. 10.1214/25-ejs2435 — Fiducial selector: Fast and efficient inference for high-dimensional regression¶

作者: Wei Du, Jan Hannig, Randy C. S. Lai, Thomas C. M. Lee, Chunzhe Zhang
期刊/来源: Electronic Journal of Statistics
机构: University of California, Davis · University of North Carolina at Chapel Hill
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_method
摘要: 本文研究高维线性回归的统计推断问题，目标是在p远大于n的设定下同时实现模型筛选、参数估计和不确定性量化。作者基于广义fiducial推断（GFI）框架提出fiducial selector，该方法内嵌一个去偏组件，以修正Lasso型估计的偏差。理论上证明了模型选择相合性（selection consistency）和非零参数估计的无偏性。计算上仅需一次fiducial抽样即可获得点估计和置信区间，无需交叉验证或调参，数值效率显著高于de-biased Lasso、multi-sample splitting等现有方案。在模拟和真实数据对比中，fiducial selector在均方误差、覆盖概率和计算时间三个维度均表现出优势。本文的方法论贡献在于将fiducial思想与去偏技术结合，为高维回归提供了一种理论保证与计算速度兼顾的实用工具，尤其对研究者熟悉的高维渐近理论和非参数计量方向具有直接参考价值。
关键技术: Generalized Fiducial Inference (GFI), De-biased estimation, Model selection consistency, High-dimensional linear regression, Fiducial selector
为什么对您有用: 本文直接对应您核心兴趣中的高维统计推断问题，特别是高维回归的模型选择与无偏估计。您非常熟悉的高维渐近理论和minimax界可以立即用于检验该方法的一致性条件是否紧，或将其推广到广义线性模型。目前您可立即可做：用您擅长的非参数minimax和最优化分析验证本文理论假设的充分性，或尝试将该框架推广到其他高维设定的置信区间构建。

3. 10.1214/25-ejs2413 — Change point estimation for high-dimensional time series with network structure¶

作者: Li Yuanbo, Ng Chi Tim, Wu Gan, Yau Chun Yip, Zhang Chuan
期刊/来源: Electronic Journal of Statistics
机构: University of International Business and Economics · University of International Business · Hang Seng University of Hong Kong · University of Hong Kong · Chinese University of Hong Kong · Southwestern University of Finance and Economics
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_method
摘要: 本文研究带网络结构的高维时间序列变点检测问题，设定为分段平稳的 network autoregressive (NAR) 模型，目标是在稀疏高维设定下同时估计变点数目、位置及各段的回归系数。作者提出两步法：先用 fused LASSO 做变点检测，再用信息准则确定变点数目，算法复杂度较低，适用于 p >> n 的情形。理论贡献包括：在允许节点异质性、同质性、分组结构三种设定下，证明了变点数目和位置的估计一致性，以及系数估计的收敛率和分组结构恢复的一致性。技术工具涉及 fused LASSO 的 oracle 不等式、高维时间序列的 concentration inequality、以及信息准则的 model selection 一致性分析。实证部分用美股收益率数据验证方法有效性。对您而言，这是高维时间序列变点检测与网络结构建模的结合，涉及您熟悉的高维渐近理论和 minimax 界的分析框架。
关键技术: network autoregressive model, fused LASSO, change point detection, high-dimensional consistency, information criterion, group structure recovery
为什么对您有用: 本文属于高维统计与时间序列变点检测的交叉，涉及您 primary interest 中的高维统计理论。技术层面，其一致性证明依赖于高维 concentration 和 oracle-type 不等式，与您 very_familiar 的 minimax bounds 和 high-dimensional asymptotics 直接对接。follow-up 判断：立即可做——可用您熟悉的高维 minimax 理论审视其变点检测的收敛率是否达到 minimax optimal，或探索更弱的正则条件；若想深入，可在 moderately_familiar 的 M-estimation 理论框架下研究 fused LASSO 在相依数据上的 refined 分析。

4. 10.1214/25-ejs2453 · arXiv — Sampling effects on Lasso estimation of drift functions in high-dimensional diffusion processes¶

作者: Chiara Amorino, Francisco Pina, Mark Podolskij
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_theory
摘要: 本文研究高维扩散过程的漂移函数参数估计问题，设定为 d 维遍历扩散过程在离散时间点观测，漂移函数具有线性形式（包括 OU 过程），核心假设是参数向量的稀疏性。方法上采用 Lasso 估计器，主要贡献是证明了 oracle inequality，该不等式在三个特定集合的交集上成立，作者通过精细控制这些集合的概率来处理离散观测带来的核心挑战。理论结果表明，在适当条件下离散化误差可忽略，Lasso 估计器能达到与连续轨迹观测相同的最优收敛速率（\(\\sqrt{s\\log(d)/n}\) 量级，s 为稀疏度），并在 \(l_1\) 和 \(l_2\) 范数下给出误差界。数值实验验证了理论发现，显示 Lasso 在支持恢复方面显著优于 MLE。对您有用之处：这是高维统计与连续时间过程交叉的工作，涉及 Lasso oracle inequality 和离散化误差分析，与您的高维统计兴趣直接相关。
⚠️ 摘要不完整，待重跑（python -m research_news.rerun）
关键技术: Lasso oracle inequality, discrete-time diffusion observation, ergodic diffusion process, sparse parameter estimation, support recovery, discretization error analysis
为什么对您有用: (1) 直接连接到您 primary interest 中的高维统计，具体是高维参数估计的 oracle inequality 和稀疏性设定。(2) 您武器库中的 minimax bounds for estimation problems 和 high-dimensional asymptotics 可以用来审视本文声称的"最优速率"是否真正达到 minimax optimal，以及 discretization error negligible 的条件是否可以放松。(3) 立即可做：用 very_familiar 的 minimax bound 工具验证其速率的紧性，或尝试将离散化误差分析框架推广到其他扩散模型。

5. 10.1214/25-ejs2469 · arXiv — Information criteria for the number of directions of extremes in high-dimensional data¶

作者: Lucas Butsch, Vicky Fasen-Hartmann
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_theory
摘要: 本文在多元极值分析中，针对高维数据极端方向个数的估计问题展开。利用Meyer和Wintenberger（2021）提出的稀疏正则变化概念，构造了三种信息准则：贝叶斯信息准则（BIC）、基于均方误差的信息准则（MSEIC）和基于高斯拟似然的准AIC（QAIC）。为了解决极值分析中阈值个数k_n的选择难题，提出两步法同时估计极端方向数和最优k_n。理论分析证明，AIC和MSEIC在方向数选择上不一致，而BIC和QAIC具有一致性。模拟实验和风速数据应用验证了准则的表现。对您而言，该论文涉及高维统计中的模型选择问题，与您在high-dimensional statistics方向关注的结构估计和变量选择有方法论交叉；一致性证明可视为假设检验的一种延伸。不过，核心工具依赖极值理论（正则变化、点过程），目前武器库中缺乏直接对应技术，需补充该方向知识后方可深入。
关键技术: sparse regular variation, Bayesian information criterion (BIC), quasi-Akaike information criterion (QAIC), consistency of model selection, two-step estimation, multivariate extreme value theory
为什么对您有用: 本文属于高维统计的模型选择问题，直接连接到您primary interest中的high-dimensional statistics（尽管非随机矩阵，但高维极值结构估计是统计推断前沿）。技术武器库中的high-dimensional asymptotics和minimax bounds可帮助理解其一致性证明框架，但核心稀疏正则变化工具不在arsenal中，且极值点过程等概念需额外学习。因此暂不可做：缺极值统计的专门技术储备（如正则变差、极值图模型），但作为扩展视野的gateway reading有价值。

非参数 / 半参数 (nonparam_semipara, 16 篇)¶

1. 10.1214/25-ejs2475 · arXiv — Minimax optimality of deep neural networks on dependent data via PAC-Bayes bounds¶

作者: Pierre Alquier, William Kengne
期刊/来源: Electronic Journal of Statistics
机构: Institut Camille Jordan · École Supérieure des Sciences Économiques et Commerciales · CY Cergy Paris Université
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_theory
摘要: 本文扩展了经典深度神经网络最小最优性结果至时间依赖数据。将观测假设放宽为具有非零伪谱间隙的马尔可夫链，而非i.i.d.。考虑更一般的机器学习问题，包括最小二乘和逻辑回归。利用PAC-Bayes oracle不等式和针对相依数据的Bernstein不等式，推导广义贝叶斯估计量的风险上界。对于最小二乘回归，上界匹配已有下界（对数因子）；对于逻辑回归，建立类似下界并证明最优性。本文为依赖数据下的深度神经网络提供了严谨理论保证。对您而言，其核心非参数minimax分析技术与您的“非参数统计”和“minimax界”工具直接对应，但依赖数据设定对您在因果推断纵向数据中的方法可能具有启示。
关键技术: PAC-Bayes bounds, oracle inequalities, Bernstein inequality for Markov chains, deep ReLU networks, composition classes, minimax optimality
为什么对您有用: 本文直接关联您的非参数统计理论兴趣，特别是minimax最优性分析。您非常熟悉的minimax界工具可用于验证其上界的紧致性。但由于其核心依赖PAC-Bayes和深度网络专业理论，而您武器库中未包含这些，暂不可直接复制其技术；若想将依赖数据理论引入您的纵向因果推断研究，需先熟悉PAC-Bayes框架（目前缺失）。

2. 10.1214/25-ejs2477 — Estimation for the convolution of several multidimensional densities¶

作者: Fabienne Comte, Bianca Neubert
期刊/来源: Electronic Journal of Statistics
机构: Université Paris Cité · Sorbonne Paris Cité · Département mathématiques, informatique, sciences de la donnée et technologies du numérique · Mathématiques Appliquées à Paris 5 · Heidelberg University
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_method
摘要: 该论文研究估计m个独立随机向量密度的m重卷积的非参数问题。提出了核估计和投影估计两种非参数估计量，并以积分二次风险为准则分析其性能。利用傅里叶分析控制方差项，在标准Sobolev光滑类下导出核估计的收敛速度。进一步给出了核估计的自适应带宽选择规则以及投影估计的模型选择准则。模拟实验验证了所提估计量的有限样本表现。该工作属于密度估计中特定结构（卷积）的非参数方法，与您熟悉的非参数理论（尤其是核方法、投影估计、Sobolev类）直接对应。
关键技术: kernel density estimation, projection estimator, Fourier analysis, integrated quadratic risk, Sobolev classes, bandwidth selection
为什么对您有用: 该问题属于非参数统计的具体应用（卷积密度估计），您对该领域非常熟悉（技术武器库中‘非参数统计’为very_familiar），可以用现有理论（如minimax风险、Sobolev光滑性）衡量方法的紧致性或提出改进。这是一项立即可做的工作——您无需学习新工具就能理解乃至拓展其实验设计或理论分析。

3. 10.1214/25-ejs2417 · arXiv — Posterior concentration for Gaussian process priors under rescaled and hierarchical Matérn and Confluent Hypergeometric covariance functions¶

作者: Xiao Fang, Anindya Bhadra
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 7/10 · novelty: weaker_assumption
摘要: 本文研究非参数贝叶斯回归中高斯过程先验的后验收缩率。传统结果要求先验的平滑参数与目标函数的真实平滑度匹配才能达到minimax最优速率。作者考虑重新缩放（rescaling）的Matérn协方差函数和新提出的Confluent Hypergeometric协方差族，证明通过适当选择尺度参数，即使平滑参数不匹配，仍可获得minimax最优的后验收缩率。对于固定设计非参数回归模型，后验以最优速率收敛到η-正则函数。进一步，对重新缩放参数采用完全贝叶斯分层处理，所得后验仍以minimax最优速率收缩，且自动适应未知平滑度，无需先验指定平滑度。方法核心在于引入额外尺度参数调整协方差函数的局部行为，从而放松平滑匹配条件。该结果对非参数贝叶斯方法的选择提供了理论指导，与您primary interest中的非参数理论直接相关，且您熟悉的minimax下界工具可用于验证最优速率的紧性。
关键技术: posterior contraction rate, minimax optimal rate, rescaled Matérn covariance, Confluent Hypergeometric covariance, hierarchical Bayesian adaptation
为什么对您有用: 本文属于非参数贝叶斯的后验收缩理论，与您primary interest中的非参数理论方向紧密相连。您非常熟悉的minimax下界技术可直接用于验证文中声称的最优速率是否真正紧，这是您能立刻操作的分析任务。立即可做：利用您对minimax bound的掌握，可以检验不同正则性假设下该速率的sharpness，甚至考虑将类似的自适应分层策略应用于因果推断中的非参数建模。

4. 10.1214/25-ejs2433 · arXiv — Learning the regularity of multivariate functional data¶

作者: Omar Kassi, Nicolas Klutchnikoff, Valentin Patilea
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 本文针对多元函数型数据（曲面）的局部正则性估计问题，在表面独立生成且观测值带有测量误差、可能随机离散时间的设定下，提出了一个结合样本内和样本间信息的简单估计量。推导了正则性估计的非渐近指数型浓度界，并构造了一个反映各向异性的指标，同时给出该指标风险的指数界。应用包括：对含域变形的多分数二维布朗片类进行变形非参数估计，以及构建双变量核估计量以最小化曲面重建的极小极大风险。本文的方法和理论为曲面正则性推断提供了有保证的工具。对研究者而言，非参数正则性估计与浓度不等式技术可借鉴到其他非参数模型（如因果推断中的连续处理效应假设）中。
关键技术: local regularity estimation, concentration inequalities, anisotropy indicator, multi-fractional Brownian sheet, minimax optimal kernel estimation
为什么对您有用: 本文属于非参数统计中的正则性估计，直接对应主兴趣中的非参数理论；研究者非常熟悉的非参数工具和极小极大界可用于理解其浓度界推导与核估计的最优性；当前即可用现有武器精读，若未来需将正则性估计推广至高维或因果推断中的平滑参数设定，则需补充更复杂的函数类模型（中等熟悉），但非必需。

5. 10.1214/25-ejs2407 · arXiv — Normal approximations for the multivariate inverse Gaussian distribution and asymmetric kernel smoothing on d-dimensional half-spaces¶

作者: Léo R. Belzile, Alain Desgagné, Christian Genest, Frédéric Ouimet
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 论文提出一种新型密度估计器，用于d维半空间上的分布。这是文献中首个支持在半空间上的不对称核密度估计器。采用多元逆高斯（MIG）分布作为核函数，并结合局部自适应参数，自动校正边界偏误。为了研究该估计量的均方积分误差（MISE）和渐近正态性，作者建立了MIG分布与具有相同均值向量和协方差矩阵的多元正态分布之间的局部极限定理和概率度量界，这些结果本身也可能有独立价值。同时，开发了一种更快更准确生成MIG随机向量的新算法，优于Minami基于布朗首次击中时间表示的算法。在模拟中比较了最优MISE和似然交叉验证带宽选择方法的效果，并以拟合大型电磁风暴数据中广义帕累托模型的后验分布平滑为例展示了应用。对您而言，本文的非参数密度估计新工具（尤其边界修正机制）可补充您的非参数理论工具箱；其中的概率度量界技术对高维渐近或集中不等式研究也有潜在参考价值。
关键技术: multivariate inverse Gaussian (MIG) kernel, asymmetric kernel density estimation, local limit theorem, probability metric bounds, boundary bias correction, MIG random vector generation algorithm
为什么对您有用: 本文直接落在您的primary interest——非参数统计理论，尤其涉及半空间上的密度估计边界修正和渐近性分析。您非常熟悉的非参数统计和渐近理论足以理解方法要点，但核心的MIG分布特性和局部极限定理证明并非您武器库中的现有工具（如U-statistic或einsum复杂度），因此属于暂不可做——需要先学习MIG分布的分析性质才能推进或扩展该方向的工作。不过，作为非参数新工具的介绍，值得花短时间阅读摘要和引言，了解边界修正的新思路。

6. 10.1214/25-ejs2406 — Fully NonParametric MIDAS: A new approach for nonparametric mixed frequency time series regression¶

作者: James L. Wei, Guy P. Nason
期刊/来源: Electronic Journal of Statistics
机构: Imperial College London
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 本文提出 Fully NonParametric MIDAS (FNP-MIDAS) 方法，用于估计混合频率时间序列回归模型。传统 MIDAS 模型假设线性加权结构，而 FNP-MIDAS 引入非线性成分函数，允许高频滞后项通过同一非线性函数变换后再经 MIDAS 系数缩放。模型采用加性结构，每个高频变量对应一个成分函数，所有滞后共享该函数但幅值不同。估计使用简单的回拟合 (backfitting) 算法，交替估计 MIDAS 系数和成分函数；成分函数通过趋势过滤 (trend filtering) 拟合，在局部自适应性和计算复杂度之间取得良好平衡。模拟和真实数据（城市空气质量预测）显示，FNP-MIDAS 在预测精度上显著优于线性 MIDAS 模型。本文为时间序列中的混合频率非参数建模提供了简洁有效的工具，对您而言，其加性非参数结构与趋势过滤技术可与非参数统计理论中的平滑与自适应估计方法直接对话。
关键技术: backfitting algorithm, trend filtering, mixed frequency time series, nonparametric additive model, spline regression
为什么对您有用: 本文直接对应非参数统计与半参数理论兴趣中的非参数回归方法，尤其是加性模型和自适应平滑（trend filtering）。武器库中的非参数统计（如核方法、样条）和极小极大界可用来分析 FNP-MIDAS 的收敛速度与自适应性质。属于中期可做：回拟合算法和趋势过滤本身是熟悉工具，但混合频率时间序列的框架（滞后结构、频率对齐）需要额外熟悉，可先读本文作为入门。

7. 10.1214/25-ejs2441 · arXiv — On regression in extreme regions¶

作者: Stephan Clémençon, Nathan Huet, Anne Sabourin
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_theory
摘要: 本文研究连续回归问题中外推（extrapolation）到协变量尾部未观测区域的非参数最小二乘估计。设定基于多元正则变化（multivariate regular variation）理论，假设协变量尾部服从重尾分布，目标是对远离原点的观测子集进行回归，特别关注其角度分量。方法上采用 VC 类预测器的非参数最小二乘，导出了尾部区域预测性能的有限样本风险界，并给出明确的 bias-variance 分解形式。理论结果表明，虽然连续标签设定需要不同的正则性假设和技术，但主要结论与先前二元分类的极端协变量研究相呼应。数值实验用模拟和真实数据验证了理论发现。对您研究非参数理论中的 minimax bound 和有限样本风险界有参考价值。
关键技术: multivariate regular variation, nonparametric least squares, VC class, bias-variance decomposition, finite sample risk bound, extreme value theory
为什么对您有用: 本文将非参数回归理论拓展到极端值区域，涉及 minimax bounds 和有限样本风险界，与您 very_familiar 的非参数统计和 minimax bounds for estimation 直接相关。您可以用现有的 minimax 理论工具审视其声称的风险界是否紧，以及正则变化假设是否可弱化。立即可做：用 very_familiar 的非参数统计和 minimax bound 武器即可评估本文理论贡献的深度。

8. 10.1214/25-ejs2444 · arXiv — On the rate of convergence of an over-parametrized deep neural network regression estimate with ReLU activation function learned by gradient descent¶

作者: Michael Kohler, Jeongik Cho, Adam Krzyżak
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_theory
摘要: 考虑随机设计的非参数回归问题，误差准则为对设计测度积分的L2误差。定义了一个过参数化的深度神经网络回归估计量，使用logistic激活函数，所有权重通过梯度下降学习。假设回归函数属于(p,C)-光滑函数类。证明了该估计量在回归函数光滑时达到近乎最优的收敛速率，逼近经典极小最大速率。证明依赖于神经网络的表示能力以及梯度下降的隐式正则化效应，结合经验过程理论和函数类的复杂度控制。结果展示了过参数化神经网络在非参数回归中的理论有效性，与经典方法（如核平滑）的速率相匹配。对您有用：直接连接非参数统计的光滑函数估计理论，可用武器库中'minimax bounds for estimation problems'验证该速率是否紧，并对比经典非参数方法的效率。
关键技术: over-parametrized deep neural network, logistic activation, gradient descent, nonparametric regression, rate of convergence, smoothness class
为什么对您有用: 连接非参数回归的深度神经网络收敛率理论，属于半参数/非参数理论兴趣。武器库中'minimax bounds for estimation problems'可直接验证其速率近最优性，'nonparametric statistics'背景能对比经典核方法的效率。本研究是深度学习理论分析的非参数范例，值得细读；但核心机器（深度神经网络复杂度分析）不在武器库中，暂不可直接迁移，需先熟悉相关理论。

9. 10.1214/25-ejs2471 · arXiv — Convergence and concentration properties of constant step-size SGD through Markov chains¶

作者: Ibrahim Merad, Stéphane Gaïffas
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_theory
摘要: 本文研究光滑强凸目标函数下常数步长 SGD 的收敛与浓度性质，将其迭代序列视为 Markov chain 进行分析。在梯度估计无偏且方差受控的条件下，证明了迭代在 total variation 距离下收敛到不变分布，并在比先前工作更弱的梯度噪声假设下建立了 Wasserstein-2 距离的收敛。核心发现是：当梯度噪声具有 sub-Gaussian 或 sub-exponential 尾部时，SGD 迭代及其不变分布继承相同的浓度性质，从而导出最终估计的高置信界。在线性情形下，对 Polyak-Ruppert 平均获得了 dimension-free 的偏差界。所有结果均为 non-asymptotic，对您在 semiparametric efficiency 和 debiased ML 中常用的迭代估计量的理论分析有参考价值。
关键技术: Markov chain convergence in total variation, Wasserstein-2 distance contraction, sub-Gaussian/sub-exponential concentration inheritance, Polyak-Ruppert averaging, non-asymptotic analysis, dimension-free deviation bounds
为什么对您有用: 本文连接到您 primary interest 中的 semiparametric theory 和 efficiency theory——debiased ML 和 one-step estimator 常涉及迭代算法，常数步长 SGD 的 Markov chain 视角提供了分析其非渐近行为的新工具。您武器库中的 minimax bounds 和 high-dimensional asymptotics 经验可直接用于验证本文 concentration bound 的紧性。中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉，将本文的 Markov chain 浓度工具迁移到 debiased ML 的迭代估计场景。

10. 10.1214/25-ejs2431 — High-dimensional generalized linear models for Hilbert manifold covariates¶

作者: Changwon Choi, Byeong U. Park
期刊/来源: Electronic Journal of Statistics
机构: Seoul National University
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_theory
摘要: 本文研究高维广义线性模型，其中协变量取值于 Riemannian Hilbert 流形，目标是对连接协变量切丛与响应的 Hilbert-Schmidt 算子进行 identification 与估计。核心方法结合谱分解与惩罚技术，允许协变量维数以样本量的指数速度发散，并给出约束最小化问题的计算算法。理论贡献包括：推导了估计量的多种误差界，其收敛率与欧氏协变量情形可比；利用所提惩罚函数类的 vanishing-gradient 性质证明了 oracle property。实证部分通过模拟与真实数据展示了有限样本表现。对您有用之处在于：这是高维半参数/非参数理论的一个非欧推广，涉及 Hilbert-Schmidt 算子与流形上的 M-estimation。
关键技术: Hilbert-Schmidt operator estimation, Riemannian Hilbert manifold, spectral decomposition, penalized M-estimation, oracle property, high-dimensional error bounds
为什么对您有用: (1) 连接到 primary interest 中的 semiparametric and nonparametric theory，具体是流形上函数估计与高维 M-estimation 的交叉。(2) 您的 very_familiar 武器库中 minimax bounds for estimation problems 与 high-dimensional asymptotics 可直接用于审视本文声称的 error bounds 是否紧、是否可改进。(3) 立即可做：用您熟悉的 minimax 理论框架验证其收敛率在何种正则条件下达到 optimal；若对 Riemannian manifold 背景不熟，属于 moderately_familiar 的 M-estimation theory 可快速补齐。

11. 10.1214/25-ejs2478 · arXiv — Conformal inference for regression on Riemannian manifolds¶

作者: Alejandro Cholaquidis, Fabrice Gamboa, Leonardo Moreno
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文研究响应变量Y位于Riemannian流形上、协变量X在欧几里得空间中的回归预测集构建问题，目标是在分布自由（无分布假设）且非参数化的框架下得到有限样本有效的预测区域。该方法将Lei与Wasserman（2014）的共形推断框架推广至流形值响应，使用共分位数（conformal quantiles）和流形上的恰当距离定义预测球。关键工具包括：利用非对称性分数（nonconformity score）构造预测区域，通过split conformal或full conformal校准覆盖概率。作者证明了经验预测集在几乎必然意义下收敛到其总体版本（即流形上真实的预测区域），收敛速率依赖于流形维数及回归函数的正则性。模拟与真实数据（如风向数据、协方差矩阵的流形回归）验证了方法的有限样本覆盖精度与适应性。对您有用：该工作直接连接您的非参数统计与假设检验兴趣，您熟悉的经验过程与非参数收敛技术可用来进一步研究流形上预测集的 minimax 最优性，或扩展至条件分位数回归等更复杂目标。
关键技术: conformal prediction, distribution-free prediction sets, nonparametric regression on Riemannian manifolds, nonconformity score, split conformal calibration, almost-sure convergence
为什么对您有用: 本文直接连接您的非参数统计兴趣和假设检验方向（预测集覆盖概率的有限样本控制）。您非常熟悉的经验过程工具可直接用于分析其收敛性证明的紧致性，但流形上的测地线距离与切空间结构可能需要中期补充（当前武器库未包含Riemannian几何基础）。立即可做的一个入口：将该预测方法与您熟悉的逆概率加权或因果推断中的倾向性得分结合，处理流形值终点的因果效应估计。

12. 10.1214/25-ejs2464 · arXiv — Differentially private projection-depth-based medians¶

作者: Kelly Ramsay, Dylan Spicker
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文在差分隐私框架下研究 projection-depth-based median 的私有化估计问题，目标是构造满足 (ϵ,δ)-DP 的稳健位置估计量。核心方法是结合 propose-test-release (PTR) 机制与 exponential mechanism，在无需矩假设的一般条件下，给出 PTR 测试失败概率的量化以及隐私代价的 finite sample deviation bounds。作者进一步证明当输入的 location/scale estimator 具有 breakdown 性质时，私有化后的 projection-depth-based median 同样保持 breakdown robustness。在 Gaussian setting 下，所得 deviation bound 匹配已知 private Gaussian mean estimation 的下界；文中还给出了一般 PTR 机制的结果以及关于 projected spacings of order statistics 的 uniform concentration 结果。对您而言，这是 robust statistics 与 privacy 交叉方向的工作，涉及 finite-sample bound 和 breakdown point 分析。
关键技术: propose-test-release mechanism, exponential mechanism, projection depth, finite sample deviation bounds, breakdown point analysis, differential privacy
为什么对您有用: 本文属于 robust statistics 与 differential privacy 的交叉，涉及 finite-sample deviation bound 和 breakdown point 分析，与您 primary interest 中的 nonparametric theory 和 minimax bound 技术相关。您武器库中的 minimax bounds for estimation problems 和 nonparametric statistics 可以直接用来审视本文 deviation bound 的紧性和 breakdown 性质；uniform concentration on projected spacings 的技术可能对您有一定参考价值。中期可做：若要进入 DP 领域，需先在 moderately_familiar 的 semiparametric theory 基础上补充 DP 的 standard mechanisms（exponential mechanism, PTR）及其 utility analysis 框架。

13. 10.1214/25-ejs2410 — Simultaneous inference for covariance function of next-generation functional data¶

作者: Qirui Hu, Jie Li
期刊/来源: Electronic Journal of Statistics
机构: Shanghai University of Finance and Economics · Renmin University of China
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文研究新一代功能数据（如医学成像）在不规则域上的协方差函数估计与同时推断问题。提出基于三角剖分的双变量样条估计量，利用灵活样条适应不规则区域。该估计量具有oracle性质，即与假设个体曲线完全观测无误差时得到的估计量渐近等价。建立估计量的局部弱收敛和一致弱收敛，并在此基础上构造渐近同时置信区域（SCRs）。模拟实验验证了理论结果，并应用于ADNI脑PET数据分析。该方法属于非参数函数估计，与您非常熟悉的非参数统计直接对接，且同时推断工具可迁移至高维或因果推断中的置信区域问题。
关键技术: bivariate spline, triangulation, covariance function estimation, oracle property, simultaneous confidence regions
为什么对您有用: 本文属于非参数统计中的协方差函数同时推断，与您的主兴趣直接吻合。您very_familiar的非参数统计和minimax bounds可以直接用于评估该方法的oracle性质紧性及拓展至不规则域高维功能数据。立即可做：您完全有能力复现或改进该估计框架，并应用于您关心的时空因果推断或流行病学影像分析。

14. 10.1214/25-ejs2442 · arXiv — Decomposition-based intrinsic modeling of shape-constrained functional data¶

作者: Poorbita Kundu, Hans-Georg Müller
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文针对受形状约束（正性和单调性）的函数数据，提出一种基于分解的内在建模方法。将每个函数轨迹分解为尺度（size）和形状（shape）两个成分，并在个体水平上构造估计量。方法利用 Fréchet 均值和 Fréchet 回归进行后续分析，依赖函数数据的固有几何结构而非严格分布假设。作者建立了经验估计量的收敛速率，并在模拟和实际数据（地中海果蝇活动曲线、苏黎世纵向生长研究）中验证了方法。该工作为非参数形状约束函数数据分析提供了一条新思路，其收敛速率结果可用于评估估计量的 minimax 最优性。对您而言，本文的非参数估计技术可直接与您熟悉的最小极大界工具结合，用于检查 shape-constrained 设定下速率的紧致性。
关键技术: Fréchet mean, Fréchet regression, decomposition into size and shape, shapes constraints (positivity, monotonicity), convergence rates for functional estimators
为什么对您有用: 本文属于非参数统计（尤其是形状约束函数数据建模）方向，与您主要兴趣中的非参数理论直接相关。您非常熟悉的 minimax bounds for estimation problems 工具可用来检验本文所得收敛速率的最优性，形成立即可做的跟进问题。具体而言，可利用 minimax 下界技术判断所提估计量是否达到最优速率，或探索其他形状约束（如凸性）下的类似分解框架。

15. 10.1214/25-ejs2465 · arXiv — Comparison results for positive supermodular dependent Markov tree distributions¶

作者: Jonathan Ansari, Moritz Ritter
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 本文研究 Markov 树结构下正相依分布的 supermodular 序比较问题，目标是在无需传统强假设（如条件分布相等、可交换性或平稳性）下建立随机序结果。核心机制是利用树结构的 Markov 性质，通过边缘 copula 的点序和简单的随机单调性条件来刻画分布间的 supermodular 序；技术工具包括 supermodular 函数类、bivariate copula、stochastic/convex order 理论。主要理论结果包括：极值次序统计量和正相依随机变量和的一阶/二阶随机占优结论，以及扰动随机游走最大值在模型不确定性下的分布鲁棒性分析。对您可能有用：虽然主题是相依性建模，但其 stochastic order 和 minimax-type robustness 分析视角与您熟悉的 minimax bounds 和 nonparametric theory 有方法论上的连接。
关键技术: supermodular ordering, Markov tree distributions, bivariate copula comparison, stochastic dominance, convex order, distributional robustness
为什么对您有用: (1) 连接到 nonparametric theory 中的 stochastic order 和 dependence structure 建模，属于您 very_familiar 的 nonparametric statistics 范畴。(2) 您的 minimax bounds 工具可以用来审视文中 distributional robustness 结论的 tightness，或扩展到更一般的图结构（如 treewidth > 1 的情形，与您 higher-order U-stat 的 treewidth 视角有潜在交叉）。(3) 立即可做：用 very_familiar 的 nonparametric statistics 和 minimax bounds 武器可以立即跟进其 robustness 分析的 sharpness 问题；若想深入相依性建模本身，属于中期可做（需补充 copula theory 细节）。

16. 10.1214/25-ejs2468 · arXiv — Asymmetric canonical correlation analysis of Riemannian and high-dimensional data¶

作者: James Buenfil, Eardi Lila
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_method
摘要: 本文研究 Riemannian 流形上的函数型数据与高维数据之间的整合分析问题，目标是估计两类异质数据间的典型相关方向。方法上提出 asymmetric CCA 框架：对 Riemannian-valued 数据（正定协方差矩阵流形）使用 tangent space sieve 近似控制函数方向的复杂度，对高维方向施加 group sparsity penalty 实现可解释的变量选择。理论贡献包括在高维设定下建立估计量的收敛速率 guarantee，结合了 sieve M-estimation 与 high-dimensional sparse estimation 的分析技术。实证应用于 Human Connectome Project 数据，揭示了动态功能连接与生活方式/心理测量变量间的主导协变模式及时间非平稳性。对您有用之处在于：tangent space sieve 是处理流形数据的经典 semiparametric 工具，其与高维 sparse CCA 的结合方式可借鉴到其他 nonparametric + high-dim 混合问题。
关键技术: canonical correlation analysis, tangent space sieve approximation, Riemannian manifold statistics, group sparsity penalty, sieve M-estimation, high-dimensional convergence rates
为什么对您有用: (1) 连接到 semiparametric theory 兴趣中的 sieve approximation 方法，以及 high-dimensional statistics 中的 sparse estimation 问题。(2) 您的 very_familiar 武器库中 minimax bounds for estimation 和 high-dimensional asymptotics 可直接用于审视文中声称的收敛速率是否 tight；moderately_familiar 的 semiparametric theory 可帮助理解 tangent space sieve 的正则化条件。(3) 立即可做：用 minimax 理论验证其 sieve 维度选择与 sparsity 参数的 trade-off 是否达到 optimal rate；或探索该 asymmetric CCA 框架是否能推广到其他流形数据（如 tensor-valued data）。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1214/25-ejs2446 — Online inference in high-dimensional regression with streaming clustered data¶

作者: Haihan Xie, Jinhan Xie, Bei Jiang, Linglong Kong
期刊/来源: Electronic Journal of Statistics
机构: University of Alberta · Yunnan University
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 本文研究高维线性混合效应模型在流式聚类数据下的在线估计与推断问题，目标是对固定效应参数建立有效的置信区间。方法上采用基于拟似然的在线更新框架，通过维护历史数据的充分统计量，避免重复访问原始数据，实现对高维回归系数的实时更新。理论贡献包括：在高维设定下证明在线估计量的相合性与渐近正态性，建立 n^{-1/2}-CAN 结果，支持在线假设检验与置信区间构造。实验部分通过模拟和 Communities and Crime、ABIDE 数据集验证方法有效性。对您而言，这篇论文连接了高维统计与在线推断，提供了 streaming data 场景下 debiased-type 方法的理论框架。
关键技术: online updating with sufficient statistics, quasi-likelihood estimation, high-dimensional linear mixed-effects model, asymptotic normality, streaming data inference, clustered data
为什么对您有用: (1) 连接到您 primary interest 中的高维统计与效率理论，特别是高维设定下的渐近正态性与推断问题。(2) 您的 very_familiar 武器库中的 high-dimensional asymptotics 和 estimation theory 可直接用于审视其理论证明；moderately_familiar 中的 semiparametric theory 可帮助理解其 quasi-likelihood 框架与效率性质的关联。(3) 立即可做：用您熟悉的高维渐近理论验证其声称的收敛率是否紧，或探索是否可用 cross-fitting / orthogonal score 思路改进其在线估计量的效率。

数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶

1. 10.1214/25-ejs2429 · arXiv — Selective inference for sparse graphs via neighborhood selection¶

作者: Yiling Huang, Snigdha Panigrahi, Walter Dempsey
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 8/10 · novelty: new_method
摘要: 本文研究稀疏精度矩阵图模型中选择后推断（selective inference）的问题，旨在为邻域选择（neighborhood selection）估计出的边（即精度矩阵非零元素）提供不确定度量，克服仅报告点估计导致的可重复性危机。假设数据来自高斯图模型，利用节点回归（nodewise Lasso）估计条件独立结构。方法通过引入外部随机化变量（external randomization）调整边选择事件，将条件分布问题转化为计算选择事件概率，该概率等价于节点回归中的一组符号约束，且可解耦到各节点回归，计算简便。理论证明，将此选择事件概率乘以Wishart密度后得到的选择后条件分布是精确的，从而可以构造有效的p值和置信区间，无需渐近近似。模拟和心理健康移动健康试验数据分析表明，该方法相比现有方法具有更高的检验功效和更准确的估计精度。该方向与您的高维假设检验和因果图建模（如DAG推断）高度相关，您可直接利用您熟悉的高维渐近工具检验该方法的理论性质，或将其推广至有向图模型的选择后推断。
关键技术: Neighborhood selection, Selective inference, Randomization-based adjustment, Conditioned Wishart density, Nodewise regression, Gaussian graphical model
为什么对您有用: (1) 本文属于高维图模型中的选择性推断，直接对应于您primary interests中的假设检验与高维统计；(2) 您武器库中非常熟悉的高维渐近和逆问题知识可直接用于分析该方法的渐近有效性、条件分布的误差界，且其基于随机化调整的思想可与您的U统计量计算经验（树宽/张量网络视角）结合，以探索更复杂选择事件的高效计算；(3) 立即可做：您已具备理解该方法所需的高维渐近和逆问题理论背景，可直接复现其模拟并尝试扩展至因果图结构（如PC算法后的推断）。

2. 10.1214/25-ejs2409 · arXiv — Permutation-based multiple testing when fitting many generalized linear models¶

作者: Riccardo De Santis, Jelle J. Goeman, Samuel Davenport, Jesse Hemerik, Livio Finos
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_method
摘要: 本文针对高维数据中同时拟合大量广义线性模型时的多重检验问题，提出了一种基于置换的新方法。该方法将近年发展的符号翻转检验（sign-flip test）与置换多重检验程序相结合，构建了多变量标准化翻转分数检验。核心优势在于对广义线性模型中错误指定的方差具有鲁棒性，这在模型验证困难的高维场景下尤为关键。此外，该方法能自适应未知的响应变量相关结构，从而在存在相关性的情况下显著提升检验功效。通过理论分析和模拟研究，作者验证了该方法在控制族系错误率的同时相比传统方法具有更优的统计性能。
关键技术: sign-flip test, permutation-based multiple testing, generalized linear models (GLM), high-dimensional multiple testing, robustness to variance misspecification
为什么对您有用: 该论文直接关联您的主要兴趣——数学统计中的假设检验领域，特别是高维多重检验问题。您非常熟悉的高维渐近理论和非参数统计方法可直接用于理解该方法的置换分布性质和鲁棒性理论证明，便于您评估是否可推广到更一般的估计方程或因果推断中的敏感性分析场景。

3. 10.1214/25-ejs2451 · arXiv — Choosing the right norm for change point detection in functional data¶

作者: Patrick Bastian
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_method
摘要: 考虑功能时间序列均值函数的变化点检测问题，提出基于L1范数的检验方法。与现有基于L2范数和上确界范数的方法进行理论比较，证明L1范数在广泛情景下具有最优的渐近检验功效。进一步引入功率增强成分，改善L1检验对稀疏备择假设的表现。在经典假设和相关备择假设下均建立了检验的渐近有效性。通过模拟和真实数据实验验证了方法优势。对您而言，本文连接了假设检验与非参数功能数据分析，您可以用熟悉的非参数工具进一步探索其他范数选择或适应性检验。
关键技术: L1 norm based test, functional data change point detection, power enhancement component, asymptotic analysis under alternative, comparison of norms
为什么对您有用: 本文直接研究变化点检测中不同范数的检验表现，属于您感兴趣的假设检验方向。您熟悉的非参数统计和渐近理论（very_familiar）可用来理解并潜在改进本文的L1方法，例如扩展到多个变化点或非平稳功能数据。立即可做。

4. 10.1214/25-ejs2421 · arXiv — Testing LRD in the spectral domain for functional time series in manifolds¶

作者: María D. Ruiz–Medina, Rosa M. Crujeiras
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 本文在流形上的泛函时间序列设定下，研究谱域中长程依赖（LRD）的假设检验问题，目标是在谱密度算子关于流形等距群不变的假设下检验 LRD 是否存在。提出的检验统计量基于加权周期图算子，核心工具包括 Hilbert-Schmidt 算子范数下的偏差收敛率分析和积分经验二阶/四阶累积量谱密度算子。在原假设下，作者证明了检验统计量算子的中心极限定理，导出其渐近高斯分布；在备择假设下，给出了偏差收敛到零的收敛率，并由此建立检验的一致性。实际实现采用随机投影方法将无穷维算子问题降维到有限维，模拟研究在球面泛函时间序列背景下验证了渐近正态性和检验功效。本文属于非参数假设检验与泛函时间序列的交叉，对您在 hypothesis testing 和 nonparametric theory 方向的技术积累有直接参考价值。
关键技术: weighted periodogram operator, Hilbert-Schmidt operator norm, Central Limit Theorem in Hilbert space, spectral density operator, random projection methodology, long range dependence testing
为什么对您有用: 本文连接到您 primary interest 中的 hypothesis testing 和 nonparametric theory，具体涉及 Hilbert 空间中的渐近理论和谱方法。您武器库中 very_familiar 的 nonparametric statistics 和 minimax bounds 可以直接用来审视本文声称的偏差收敛率是否紧、是否可以改进；moderately_familiar 的 semiparametric theory 可用于思考是否存在更高效的检验统计量构造。follow-up 判定：立即可做——用您熟悉的非参数和 minimax 工具分析本文收敛率的紧性和可能的 sharper rate。

5. 10.1214/25-ejs2476 · arXiv — Distributional limits of graph cuts on discretized grids¶

作者: Leo Suchan, Housen Li, Axel Munk
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 本文研究在固定但任意离散化网格上随机采样数据时，平衡图割（Minimum Cut、Ratio Cut、Normalized Cut）的极限分布。作者证明当样本量增大时，这些图割的最优目标值渐近服从高斯极小值分布；但Cheeger Cut存在二分性：当最优分割产生不等体积的两部分时，极限分布仍为高斯极小值，否则为随机混合高斯极小值。利用割泛函的方向可微性，进一步证明了所有类型图割的bootstrap一致性。通过蒙特卡洛实验验证理论结果，并考察不同割之间的差异及对底层分布的依赖。此外，将理论推广到Xist算法（图割的计算代理），展示了其在统计检验等实际应用中的可行性。这些结果为基于图的聚类和分类统计推断提供了严格的极限理论，与您在高维假设检验和非参数统计推断方面的兴趣直接相关。
关键技术: graph cuts, empirical process, bootstrap consistency, directional differentiability, Gaussian minima distribution
为什么对您有用: 该论文将经典图割问题纳入统计推断框架，其极限分布理论可直接用于高维分类中的假设检验，这与您核心兴趣中的hypothesis testing和nonparametric theory高度契合。您的moderately_familiar武器库中semiparametric theory中的方向可微性概念恰好是本文bootstrap一致性证明的核心工具，您可以据此评估证明的严密性并探索更一般的割泛函。整体上，本文属于立即可读的理论工作，无需额外准备即可理解其主要结论。

统计计算 / 算法 (stat_computing, 2 篇)¶

1. 10.1214/25-ejs2430 · arXiv — On the potential benefits of entropic regularization for smoothing Wasserstein estimators¶

作者: Jérémie Bigot, Paul Freulon, Boris P. Hejblum, Arthur Leclaire
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_theory
摘要: 本文在最优传输框架下，研究熵正则化作为Wasserstein估计器的平滑方法，目标是在分布数据统计学习中，通过引入熵罚项替代原始最优传输代价，分析正则化对估计器近似误差与估计误差之间的经典权衡。作者推导了正则化Wasserstein估计器的收敛速率，表明在适当的正则化参数选择下，其统计性能可与未正则化估计器持平，同时计算复杂度显著降低（通过Sinkhorn算法实现）。关键技术工具包括经验过程理论、熵正则化最优传输的鞍点结构以及Wasserstein距离的浓度不等式。数值实验验证了理论结果，并展示了在混合模型比例估计中的实际表现。本文的核心理论结果揭示了正则化强度与估计精度间的定量关系，对您而言，它直接连通了您在统计计算与计算约束统计中的兴趣（尤其是计算-统计效率权衡），且其分析框架可迁移至您熟悉的因果推断中分布处理效应的估计问题。
关键技术: entropic regularization, Wasserstein estimators, approximation vs estimation tradeoff, distributional data analysis, optimal transport, Sinkhorn algorithm
为什么对您有用: 本文直接讨论统计计算中的计算-统计权衡，与您primary interests中的“statistical-computational tradeoff”完全对应。您非常熟悉的“minimax bounds for estimation problems”可用来验证本文收敛速率是否达到最优，而“software development”背景可帮助实现熵正则化估计器的数值实验。中期可做：需先熟悉最优传输理论和Sinkhorn算法的实现细节（不在当前武器库中），但理论分析可通过已有的非参经验过程工具展开；若能将此框架应用到因果推断中分布处理效应的敏感性分析，则可能产出新方法。

2. 10.1214/25-ejs2470 · arXiv — Asymptotics of wide remedians¶

作者: Philip T. Labo
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 本文研究流式环境中稳健中位数估计器remedian的渐近性质。Remedian通过k×b矩阵递归地计算缓冲区的样本中位数，在仅存储b^k个值的条件下近似n≤b^k个样本的中位数。以往研究关注k→∞或b→∞的极限分布，本文在b→∞的“宽”remedian设定下推导了标准化向量(样本均值、样本中位数、remedian、remedian秩)的联合渐近正态分布。分析表明当b很大时，remedian能够渐近精确地近似样本中位数。通过与样本均值和样本中位数的效率比较，展示了remedian在记忆-精度-稳健性之间的权衡。进一步，本文将结果扩展到对独立同分布随机向量各分量同时进行多分位数估计的并行remedian情形。这些结果对理解流式数据中稳健估计的计算与统计效率具有理论价值。对您而言，该论文直接连接您对统计计算（流式算法）的兴趣，并涉及到您熟悉的非参数统计（中位数估计的渐近理论）和效率分析，您可以基于现有渐近理论进一步分析其有限样本性质或拓展到其他稳健统计量。
关键技术: streaming remedian algorithm, breakdown point analysis, multivariate asymptotic normality, robust estimation efficiency comparison, parallel quantile estimation
为什么对您有用: 该论文直接对应您统计计算（流式算法）及统计-计算权衡的主要兴趣，特别是记忆-精度-稳健性权衡的分析。您可以使用非常熟悉的非参数统计学和渐近理论工具（弱收敛、中位数渐正态）立即理解并验证其渐近分布推导，甚至可以探索将该方法应用于因果推断中稳健估计的流式计算场景（如处理大样本时的中位数因果效应估计）。立即可做。

其他 (other, 1 篇)¶

1. 10.1214/25-ejs2463 · arXiv — Ranking hierarchical multi-label classification results with mLPRs¶

作者: Yuting Ye, Christine Ho, Ci-Ren Jiang, Wayne Tai Lee, Haiyan Huang
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 3/10 · novelty: new_method
摘要: 本文研究层次多标签分类（HMC）中的第二阶段问题：在给定类别层次结构下，如何整合第一阶段的单类分类器得分以做出最优分类决策。作者提出新目标函数 CATCH，旨在平衡分类准确性和层次一致性。为优化 CATCH，引入多维局部精确率（mLPR）指标，其反映在给定所有分类器得分和层次结构下对象属于某类的条件概率。理论上证明，在特定条件下，将分类器得分转化为 mLPR 并比较所有对象对各类别的 mLPR 值，可保证层次约束并最大化 CATCH。实践中提出 HierRank 算法，在层次约束下对估计的 mLPR 进行排序，以最大化经验 CATCH。在合成数据和两个真实数据集上，该方法在决策准确性上优于多种现有方法。本文对分类问题中层次约束与多标签整合的统计方法有贡献，但对您的主要研究方向（因果推断、高维统计、U 统计量等）关联较弱。
关键技术: hierarchical multi-label classification, local precision rate (mLPR), CATCH objective function, HierRank algorithm, multi-class score integration
为什么对您有用: (1) 本文属于多标签分类的统计方法，与您的主要兴趣（因果推断、高维统计、效率理论）无直接关联，仅通过统计学习的一般方法论有微弱连接。 (2) 技术武器库中的非参数统计、最小最大界等高阶工具难以直接用于分析本文的排名目标或层次约束，问题结构差异较大。 (3) 暂不可做：核心机器（层次分类的排名优化与多阶段整合）不在武器库熟悉范围内，且不属于 gateway-reading 范畴。

Maintained by 陈星宇 · Homepage · Source on GitHub