EJS — Vol 19 Issue 2 · 2026-05-18¶

共 12 篇 · Electronic Journal of Statistics

因果推断 (causal_inference, 1 篇)¶

1. 10.1214/25-ejs2474 — Domain adaptation under hidden confounding¶

作者: Carlos García Meixide, David Ríos Insua
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 9/10 · novelty: new_method
摘要: 在跨分布数据源的 domain adaptation 设定下，本文研究存在隐藏混杂时的因果参数一致估计与预测问题，目标 estimand 捕捉响应噪声与协变量之间的依赖结构。核心方法将因果参数嵌入生成模型，自适应地复现测试环境的条件分布，从而在任意干预下实现与测试分布的概率对齐。identifiability 仅需一个可直接经验验证的假设，无需 worst-case 优化或对测试时扰动强度的假设。理论上保证了在隐藏混杂下因果参数的一致估计，同时避免了因果参数在预测中已知的最优性不足问题。模拟实验表明该方法优于现有 invariance-based 和 domain adaptation 方法，并在心血管疾病数据集上验证了实用性。对您有用：该工作在隐藏混杂下的 identification 与因果参数估计直接关联您 primary interest 中的 causal inference (sensitivity/identification)，同时心血管疾病应用提供了 epidemiology 方面的数据集参考。
关键技术: hidden confounding identification, generative model for domain adaptation, causal parameter consistent estimation, noise-covariate dependence estimand, probabilistic distribution alignment
为什么对您有用: 直接关联您 primary interest 中因果推断的隐藏混杂 identification 问题，提出的新 estimand 和可经验验证的 identifiability 条件为 sensitivity analysis 和 proximal CI 提供了新思路；心血管疾病数据集对您 secondary interest 的 epidemiology 应用有参考价值。

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)¶

1. 10.1214/25-ejs2456 — Unified and robust tests for cross sectional independence in large panel data models¶

作者: Zhenhong Huang, Zhaoyuan Li, Jianfeng Yao
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 8/10 · novelty: new_theory
摘要: 在大维面板数据模型中，针对截面无相关性（cross-sectional independence）的原假设，本文重新审视了Lagrange乘子（LM）型检验，设定时间维度T与截面维度N成比例同时趋于无穷的simultaneous limit方案。提出了统一的检验程序及其功效增强版本，该方法对异质/固定效应模型、弱外生及滞后因变量回归元以及非正态误差均具有稳健性。核心理论工具是随机矩阵理论（RMT），通过谱分析推导检验统计量的渐近分布，避免了传统大N固定T下的局限。蒙特卡洛模拟证实了两种检验的稳健性及功效增强技术的有效性。对您有用：直接展示了RMT在高维假设检验中的渐近理论构建，且面板截面相关性检验对经济理论中的大维面板因果推断具有方法迁移价值。
关键技术: Lagrange multiplier test, Random Matrix Theory, simultaneous limit scheme, power enhancement technique, high-dimensional panel data, cross-sectional independence
为什么对您有用: 直接连接您对高维统计（随机矩阵理论）与假设检验的primary interest，同时面板截面独立性检验是经济理论大维面板模型的基础，具有方法学与理论的双重参考价值。

2. 10.1214/25-ejs2454 — Confidence sets in a sparse stochastic block model with two communities of unknown sizes¶

作者: B. J. K. Kleijn, J. van Waaij
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 0/10 · novelty: new_theory
摘要: 在具有两个不等规模社区的稀疏随机块模型（SBM）中，研究社区分配的有限样本置信集构造与后验恢复性质。作者推导了两个后验集中不等式，证明了在类似于种植二分图模型尖锐界的稀疏界下，后验可实现（几乎）精确恢复。基于此，提出从贝叶斯可信集构造频率派置信集的方法，实现非渐近图规模下的精确频率派不确定性量化。研究发现可信水平与置信水平之间不存在比例关系：在临界图规模处，所需可信水平从接近1骤降至接近0，此时频率派置信集仅需包含后验概率最高的一小部分赋值（如MAP估计）。理论上证明了对于所提置信集构造，MCMC后验采样存在早停机制，从而支持更大规模图的计算。这对您有用：该工作将高维稀疏网络推断与频率派置信集结合，其非渐近后验集中不等式及早停MCMC计算策略，对您在高维统计推断与统计计算方向的研究具有直接借鉴价值。
关键技术: sparse stochastic block model, posterior concentration inequality, frequentist confidence sets, Bayesian credible sets, MAP estimator, MCMC early stopping
为什么对您有用: 涉及高维稀疏模型的非渐近推断与置信集构造，且包含MCMC早停的计算优化，直接关联您的高维统计与统计计算兴趣；其频率派-贝叶斯推断桥梁的思路对假设检验/置信集构建有启发。

3. 10.1214/25-ejs2455 — High-dimensional change point detection with missing values¶

作者: Yanxi Liu, Abolfazl Safikhani
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 0/10 · novelty: new_method
摘要: 在高维均值漂移模型下研究带有缺失值的变点检测问题，目标是估计变点的数量与位置。缺失值的存在会导致变点前后信息损失，使检测问题复杂化。为此提出一种四步算法：首先将观测分块并使用正则化估计量进行参数估计与缺失值插补；其次通过阈值化与重新插补修正第一步因误判导致的偏差；最后通过穷举搜索精确定位变点。在温和条件下证明了算法对变点个数与位置估计的相合性，并在收敛率中显式量化了缺失机制对检测精度的影响。模拟与真实数据验证了算法的有效性。对您有用：该文将缺失值影响量化进高维变点检测的收敛率，对您在 high-dimensional statistics 与 hypothesis testing 交叉方向的研究有直接参考价值。
关键技术: high-dimensional change point detection, regularized estimator, missing data imputation, consistency rate, mean shift model
为什么对您有用: 直接涉及高维统计的相合性收敛率分析，且变点检测本质为多重假设检验问题，契合您在 high-dimensional statistics 与 hypothesis testing 的主要兴趣。

非参数 / 半参数 (nonparam_semipara, 5 篇)¶

1. 10.1214/25-ejs2449 — Posterior contraction rates in a sparse non-linear mixed-effects model¶

作者: Marion Naveau, Maud Delattre, Laure Sansonnet
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 6/10 · novelty: new_theory
摘要: 在高维稀疏非线性混合效应模型下，研究贝叶斯后验收缩速率；回归向量与随机效应协方差矩阵未知，残差方差已知。对稀疏回归系数采用 spike-and-slab 先验（零点退化+Laplace），对随机效应协方差采用 Inverse-Wishart 先验。首先证明模型有效维度在高后验概率下有界，进而导出协方差参数与预测项的后验收缩速率。在额外正则假设下，稀疏回归向量的后验收缩速率与线性情形已知的 minimax-optimal 速率一致，填补了非线性高维设定下贝叶斯频率渐近性质的空白。该工作将高维稀疏贝叶斯理论从线性推广至非线性混合效应模型，与您在 semiparametric theory 和 high-dimensional statistics 的兴趣直接相关，其收缩速率的推导技术可迁移至其他半参数/非线性结构模型的后验分析。
关键技术: spike-and-slab prior, posterior contraction rate, sparse high-dimensional estimation, non-linear mixed-effects model, Inverse-Wishart prior, effective dimension bound
为什么对您有用: 将高维稀疏贝叶斯后验收缩理论从线性模型推广至非线性混合效应模型，与您 primary interest 中的 high-dimensional statistics 和 semiparametric theory 直接相关；收缩速率的证明技术可迁移至其他含潜变量/非线性结构的半参数模型。

2. 10.1214/25-ejs2437 — Nonparametric regression for a circular response with error-in-covariate¶

作者: Nicholas Woolsey, Xianzheng Huang
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文研究线性协变量含测量误差时圆响应变量的非参数回归问题，目标是在经典测量误差设定下估计圆回归函数。基于无测量误差时的现有估计量，作者提出三种修正方法，三者通过不同方式利用解卷积算子而内在关联。此外，针对测量误差下的调参问题，提出了一种比现有方法计算效率更高的带宽选择算法。理论上推导了各估计量的渐近性质，模拟研究验证了有限样本表现。对您而言，本文在非参数解卷积估计与高效带宽计算上的处理思路可作参考，但圆响应的特定设定与您核心关注的高维/效率理论交集有限。
关键技术: nonparametric circular regression, measurement error modeling, deconvolution kernel, bandwidth selection, asymptotic properties
为什么对您有用: 涉及非参数理论中的解卷积估计与统计计算中的高效调参算法，可为您在非参数测量误差模型下的计算与理论推导提供参考，但圆响应设定较为小众。

3. 10.1214/25-ejs2472 — Existence and breakdown analysis of M-quantiles in general Hilbert spaces¶

作者: Dimitri Konen, Davy Paindaveine
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 3/10 · novelty: new_theory
摘要: 本文在一般（可能无穷维）Hilbert 空间框架下研究 M-quantile 的存在性与崩溃点（breakdown point），目标是对凸损失函数下的 M-quantile 进行全局鲁棒性分析。作者首先利用弱拓扑论证建立了无穷维 Hilbert 空间中 M-quantile 的存在性，填补了该框架下的理论空白。随后在极弱的凸损失函数假设下推导了崩溃点，核心工具是关于凸损失函数正则变化（regular variation）的原创性结果。为处理 M-quantile 可能的非唯一性，引入了下/上崩溃点概念，使分析比以往几乎仅针对普通 quantile 的工作更为一般。主要结论给出了 M-quantile 在鲁棒性与效率之间的显式权衡界。对您而言，Hilbert 空间中的 M-estimation 理论与 semiparametric theory 中的效率-鲁棒性权衡有直接方法论联系，崩溃点分析框架也可迁移至高维/函数型数据的稳健推断问题。
关键技术: M-quantiles in Hilbert spaces, breakdown point analysis, weak topology existence proof, regular variation of convex loss functions, lower/upper breakdown point, functional M-estimation
为什么对您有用: Hilbert 空间 M-estimation 的存在性与崩溃点分析直接关联 semiparametric/nonparametric theory 中的效率-鲁棒性权衡，且无穷维框架下的弱拓扑论证与正则变化工具可迁移至高维统计与函数型数据的稳健推断。

4. 10.1214/25-ejs2443 — Adjusting inverse regression for predictors with clustered distribution¶

作者: Wei Luo, Yan Guo
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 0/10 · novelty: new_method
摘要: 在充分降维(SDR)的逆回归框架下，传统方法要求预测变量 X 满足线性 E(X|βᵀX) 和退化 var(X|βᵀX)，本文旨在放松这些条件以适应聚类分布。作者在 X 的混合模型假设下，通过直接建模条件期望与条件方差来调整一阶与二阶逆回归，使其能捕捉更复杂的模式。所提方法在逆回归与局部化 SDR 之间建立了桥梁，兼具两者优势：达到 √n-consistent 收敛率且计算高效。理论及模拟表明该方法可直接推广至高维设定，完全恢复目标降维预测子，且对非聚类数据同样有效。对您有用：该文放松经典假设的高维 SDR 调整思路及 √n-consistent 性质，直接关联您的高维统计与半参数理论兴趣，计算高效性也契合统计计算方向。
关键技术: sufficient dimension reduction, inverse regression, mixture model, high-dimensional adjustment, sqrt(n)-consistency
为什么对您有用: 该文放松了逆回归的经典线性/方差假设并在高维下保持 √n-consistent，直接关联您的高维统计与半参数理论兴趣；其计算高效实现也契合统计计算方向。

5. 10.1214/25-ejs2420 — Transform-scaled process priors for trait allocations in Bayesian nonparametrics¶

作者: Mario Beraha, Stefano Favaro
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 0/10 · novelty: new_theory
摘要: 在贝叶斯非参数(BNP)特征分配(trait allocation)设定下，传统完全随机测度(CRM)先验导致新数据点的新特征数服从泊松分布，且该分布仅依赖样本量而与样本具体信息无关。本文引入变换缩放过程(T-SP)先验，在保持解析可处理性的同时丰富新特征的后验分布。基于稳定CRM构建的Stable T-SP先验，使新特征数服从负二项分布，且该分布同时依赖样本量和已观测到的不同特征数。进一步，通过层次化T-SP先验，将理论扩展至多组数据或亚群的特征分配设定。该方法克服了CRM先验下新特征后验完全由先验参数估计决定的缺陷。对您而言，虽然本文侧重贝叶斯非参数先验而非频率学派的半参数效率，但其对非参数过程后验解析性质的推导可为非参数理论提供补充视角。
关键技术: Completely random measures, Bayesian nonparametrics, Transform-scaled process priors, Trait allocations, Negative-Binomial posterior, Hierarchical priors
为什么对您有用: 本文属于非参数理论范畴，虽然侧重贝叶斯先验而非您主要关注的半参数效率界/频率学派推断，但其对非参数模型后验结构的解析推导可为非参数理论提供补充视角。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1214/25-ejs2466 — Mixed semi-supervised generalized linear regression with applications to deep learning and interpolators¶

作者: Oren Yuval, Saharon Rosset
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_method
摘要: 在半监督学习框架下，针对广义线性模型(GLM)和线性插值器两类模型，研究如何通过混合参数α整合无标签数据以提升预测性能，关键正则假设为GLM的指数族结构与插值器的过参数化设定。提出多种混合机制将无标签数据纳入监督学习流程，每种机制引入混合参数α控制无标签数据权重；理论上证明在预测风险意义下，始终存在α>0使混合SSL优于纯监督方法，并给出严格框架利用手头标签与无标签数据估计最优混合比。核心分析工具包括GLM的渐近风险分解与插值器在过参数化区间下的偏差-方差刻画。主要理论结果保证混合SSL的一致优越性，模拟与真实数据（含深度神经网络启发式扩展）验证了显著预测提升；对您在效率理论（无标签数据提升半参数效率界）和高维统计（过参数化插值器预测行为）方向有直接参考价值。
关键技术: semi-supervised GLM, mixing parameter estimation, linear interpolators, overparameterized regime, predictive risk decomposition
为什么对您有用: 直接连接效率理论（利用无标签数据提升估计效率的最优权重选择）与高维统计（过参数化插值器的风险分析），其最优混合比估计框架可迁移至半参数效率提升与debiased ML场景。

数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶

1. 10.1214/25-ejs2416 — Selective inference using randomized group lasso estimators for general models¶

作者: Yiling Huang, Sarah Pirenne, Snigdha Panigrahi, Gerda Claeskens
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 7/10 · novelty: new_method
摘要: 本文在广义模型（含指数族与拟似然）设定下，研究基于随机化 Group Lasso 的选择后推断问题，目标是在给定变量选择事件条件下对回归参数进行有效估计与检验。方法核心在于向 Group Lasso 优化中引入随机化项，从而构造出条件选择后似然函数。基于该似然，作者提出了修正选择偏差的 selective 点估计，并构建了 Wald 型置信域，证明了其体积有界。模拟与 NHANES 流行病学数据应用展示了其相对其他方法的优越性。该工作将随机化选择推断从线性模型拓展至拟似然等半参数/广义模型，对您在高维统计推断与假设检验交叉领域的研究有直接参考价值，同时 NHANES 应用契合您的流行病学次级兴趣。
关键技术: selective inference, randomized group lasso, post-selection likelihood, quasi-likelihood, Wald-type confidence region
为什么对您有用: 拓展了高维 Group Lasso 的选择后假设检验与置信域构建方法至拟似然模型，契合您在高维统计推断与假设检验方向的兴趣；NHANES 数据应用也契合您的流行病学次级兴趣。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1214/25-ejs2397 — On mixing rates for Bayesian CART¶

作者: Jungeum Kim, Veronika Ročková
期刊/来源: Electronic Journal of Statistics
分类: vol 19 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 本文研究 Bayesian CART 的 MCMC 混合速率，目标是在非参数回归设定下推导后验分布的 Markov 链收敛上界。利用树的小波表示，作者证明在信号满足层次连通性限制时，标准 Bayesian CART（grow/prune 提议）可达到多项式混合时间；同时给出负面结果：对深层孤立信号，标准算法的混合时间下界为指数级。为克服短视探索问题，提出 Twiggy Bayesian CART，在提议分布中整体附加/删除枝条（而非单节点），证明在无连通性假设下仍可多项式混合；进一步证明 informed 变体可实现更快混合。模拟比较了 spike-and-slab 先验与不同提议下 Bayesian CART 的表现差异。对您有用：本文将 MCMC 混合率理论与非参数贝叶斯计算结合，属于统计计算与算法设计的交叉，对理解 BART 类方法 MCMC 收敛瓶颈及设计高效提议分布有直接参考价值。
关键技术: mixing time upper bounds, wavelet representation of trees, Bayesian CART proposal distributions, spike-and-slab priors, Twiggy Bayesian CART, informed MCMC proposals
为什么对您有用: 直接关联您 primary interest 中的统计计算（数值方法与算法）：给出了 Bayesian CART 混合时间的正/负面理论结果及改进算法，对 BART 类因果/非参数推断中 MCMC 计算瓶颈的理解与加速有迁移价值。

Maintained by 陈星宇 · Homepage · Source on GitHub