EJS — Vol 19 Issue 1 · 2026-06-18¶
- 共 38 篇 · Electronic Journal of Statistics
- 目录核对 ⚠️ 疑似漏 32 篇(对照 OpenAlex 70 篇):10.1214/25-ejs2347、10.1214/25-ejs2369、10.1214/25-ejs2365、10.1214/25-ejs2378、10.1214/25-ejs2357 等
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
本期论文大致聚成五条主线:高维与随机矩阵理论(含稀疏推断、低秩回归与部分观测时间序列)、假设检验与多重比较(含差分隐私检验、变化点监测与网络拓扑检验)、半参数与非参数估计(含BvM定理、泛函推断与函数型数据)、因果推断与缺失数据(含代理变量辅助推断与非可忽略缺失),以及统计计算与网络模型(含重要性采样优化、耦合自助法与网络U统计量)。
高维与随机矩阵主线推进了复杂结构下的minimax最优性与异质性推断。针对高维回归中的大量干扰参数,diffShrinkHDR通过分层收缩区分目标与干扰参数的惩罚强度;部分观测VAR与双侧矩阵回归两文,分别基于Dantzig selector与核范数惩罚推导了转移矩阵估计和低秩预测的minimax收敛率;高维生存亚组分析则结合惩罚融合与模型平均实现系数合并与变量选择。
假设检验主线集中探讨差分隐私约束下的检验效用与复杂数据的非参数检验。差分隐私多元统计与KS-type检验两文,分别通过James-Stein收缩机制与base sensitivity刻画,在GDP框架下优化列联表与经验分布检验的功效;变化点推断与网络小世界检验,利用差分算子与参数bootstrap实现分段多项式定位的minimax速率推断与拓扑性质解耦检验;两样本二部排序检验则通过似然比投影将高维检验降维至一维秩过程。
半参数与非参数主线侧重于渐近效率、自适应收敛率与鲁棒性。半参数BvM定理在逆问题下证明了边际后验的频率学派效率;广义泛函推断统一了分位数与风险测度的M-估计渐近正态性;函数型线性模型与Hermite过程两文分别推导了投影估计的oracle不等式与Hurst参数估计的Malliavin收敛界;非可忽略缺失数据推断通过构造估计方程规避了倾向性模型中非参数分量的估计,实现稳健推断。
对因果推断与半参数效率方向最贴的是:非可忽略缺失下的稳健估计与PRO缺失下的代理辅助one-step debiased估计,两者均聚焦于复杂缺失机制下的有效识别与偏差消除;对高维与minimax理论最贴的是:部分观测VAR、双侧矩阵回归与变化点推断,直接给出了稀疏、低秩与结构突变设定下的sharp收敛界限。
因果推断 (causal_inference, 1 篇)¶
1. 10.1214/24-ejs2335 · arXiv — Efficient surrogate-assisted inference for patient-reported outcome measures with complex missing mechanism¶
- 作者: Jaeyoung Park, Muxuan Liang, Ying-Qi Zhao, Xiang Zhong
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 在患者报告结局(PRO)数据的预测模型中,因自愿填报导致高缺失率且缺失机制复杂,目标参数的 inference 面临挑战。当使用 ML/非参灵活插补模型时,其慢收敛率会造成不可忽略偏差,而传统缺失倾向得分在复杂机制下难以估计。本文引入信息性 surrogate,使灵活插补模型落入低维子空间;同时识别出一类 weighting functions 替代传统倾向得分,并在该函数类中估计低维权重以消除偏差。基于此低维权重,构造了无需真实缺失倾向信息的 one-step debiased estimator,并证明其渐近正态性(n^{-1/2}-CAN)。模拟与真实数据验证了方法优势;对您有用之处在于该 surrogate-assisted + 低维 weighting 的 identification 策略与 one-step debiasing,直接连接到您 primary interest 中的 semiparametric efficiency / debiased ML 与因果缺失数据处理。
- 关键技术:
one-step debiased estimator,surrogate-assisted identification,low-dimensional weighting function,flexible imputation model bias correction,n^{-1/2}-CAN asymptotic normality - 为什么对您有用: 本文直接连接到您 primary interest 中的 semiparametric efficiency / debiased ML 理论:用低维 weighting function 替代难以估计的倾向得分来消除灵活插补模型的偏差,本质上是寻找更易估计的 influence function 轨道。您 very_familiar 的 minimax bounds 与 estimation theory 可用于验证其声称的低维权重是否真的达到 semiparametric efficiency bound,或是否存在更优的 weighting class。follow-up 判断:立即可做——用您熟悉的 one-step / influence function 框架审视其 debiasing 构造,验证其效率性质并尝试在更弱假设下收紧理论。
高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)¶
1. 10.1214/25-ejs2401 — High dimensional regression with many nuisance parameters: Both cases of specified and unspecified parameters of interest¶
- 作者: Reza Drikvandi
- 期刊/来源: Electronic Journal of Statistics
- 机构: Durham University
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 在高维线性回归设定下,当 nuisance 参数维度远大于目标参数维度时,传统方法仅能处理极低维(1或几个)目标参数且无法有效控制估计方差。本文提出 diffShrinkHDR 方法:在正则化过程中对目标参数与 nuisance 参数施加不同收缩——对目标参数用光滑 penalty(如 MCP/SCAD)温和收缩以控制方差,对 nuisance 参数用非光滑 penalty(如 Lasso)强力收缩以剔除小参数。进一步将方法扩展到无预先指定目标参数的更困难情形,通过数据驱动的筛选与分层收缩实现估计与推断。理论部分给出了 oracle 性质与收敛率,实证与 R 包 diffShrinkHDR 验证了方法优势。对您有用:该分层 penalty 思路为高维因果推断中大量 nuisance IV/confounder 的筛选与目标参数 debiased 估计提供了新视角。
- 关键技术:
differential shrinkage,smooth penalty (MCP/SCAD),non-smooth penalty (Lasso),oracle property,high-dimensional nuisance parameters,data-driven variable separation - 为什么对您有用: 直接连接高维统计与因果推断中 nuisance 参数膨胀的估计难题——当 IV/proximal negative-control 数量远超目标参数时,分层 penalty 可替代一刀切的 Lasso/Debiased-ML 流程。用 very_familiar 的高维渐近理论可直接验证其声称的 oracle rate 是否在 semiparametric efficiency bound 语境下紧;若要推进到 semipara 模型(moderately_familiar),需先补 M-estimation 下分层 penalty 的理论。立即可做:用 minimax bound 检查其 rate 紧性。
2. 10.1214/25-ejs2387 · arXiv — Minimax estimation of partially-observed vector autoregressions¶
- 作者: Guillaume Dalle, Yohann De Castro
- 期刊/来源: Electronic Journal of Statistics
- 机构: CERMICS · École Centrale de Lyon · Institut Camille Jordan · International Center for Transitional Justice
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
sharper_rate - 摘要: 在部分观测的向量自回归(VAR)状态空间模型下,目标是估计稀疏转移矩阵,设定中仅能获得状态分量的小规模、带噪且时间相关的随机子样本。作者基于 Yule-Walker 方程与 Dantzig selector 构造了估计器,并给出了其非渐近误差上界。随后通过 minimax lower bound 证明了该估计器的近最优性,收敛率清晰揭示了采样比例、噪声水平与转移矩阵非零元个数等关键参数的作用。理论结果由模拟实验佐证。对您有用:本文将高维稀疏估计与 minimax 理论结合于部分观测时间序列,直接触及您的高维统计与 minimax bound 专长。
- 关键技术:
partially-observed VAR,Yule-Walker equation,Dantzig selector,minimax lower bound,non-asymptotic error bound,sparse transition matrix estimation - 为什么对您有用: 本文直接连接您的高维统计与 minimax 估计核心方向,且部分观测设定下的收敛率刻画是经典的 minimax 理论应用场景。您可用 very_familiar 的 minimax bounds for estimation problems 武器直接审视其 lower bound 构造是否紧,并判断其 Dantzig selector 上界在观测缺失机制下的 sharpness。属于立即可做:用 minimax 与高维渐近工具即可复现或拓展其 rate 分析。
3. 10.1214/25-ejs2360 — Low-rank regularization in two-sided matrix regression¶
- 作者: Nayel Bettache, Cristina Butucea
- 期刊/来源: Electronic Journal of Statistics
- 机构: Centre de Recherche en Économie et Statistique · ENSAE Paris
- 分类: vol 19 · issue 1
- 相关性 6/10 · novelty:
new_theory - 摘要: 在高维双侧矩阵回归模型 Y=A∗XB∗+E 下,目标是同时捕获列特征(通过 B∗)与行特征(通过 A∗)的线性关联,对预测误差进行估计。作者提出基于秩惩罚与核范数惩罚的最小二乘低秩预测器,虽目标函数非联合凸,但利用 SVD 构造了显式预测器并证明了最优预测界(minimax rate)。文中给出了秩选择一致性的充分条件,并进一步提出完全数据驱动的秩自适应程序。模拟验证了数据驱动调参下预测与秩一致性的良好表现。对您有用:该文在非凸惩罚下仍获得 minimax 最优率,与您的高维渐近理论及逆问题随机噪声估计工具直接相关。
- 关键技术:
two-sided matrix regression,nuclear norm penalization,rank-penalized least squares,SVD-based explicit predictor,minimax prediction bound,rank-adaptive procedure - 为什么对您有用: 本文直接连接您的高维统计与随机矩阵理论(RMT)子方向,双侧矩阵回归的 SVD 显式预测器与 minimax 界是您 very_familiar 的高维渐近理论与逆问题随机噪声估计可直接攻入的口子。您可用 minimax bound 验证其声称的最优率是否紧,或用 RMT 工具刻画 A∗、B∗ 在高维谱极限下的秩恢复相变阈值。Follow-up 判断:立即可做——用 very_familiar 的高维渐近与 minimax 工具即可展开对预测界紧性与秩选择相变的分析。
4. 10.1214/24-ejs2337 — Subgroup analysis of high dimensional survival data based on penalized fusion and model averaging¶
- 作者: Yuxiang Wu, Mingyue Du, Hui Zhao, Jianguo Sun
- 期刊/来源: Electronic Journal of Statistics
- 机构: University of Missouri · Jilin University · Zhongnan University of Economics and Law
- 分类: vol 19 · issue 1
- 相关性 4/10 · novelty:
new_method - 摘要: 在异质性比例风险模型下,本文研究高维生存数据的亚组分析问题,目标是同时识别亚组结构、重要预测变量及其效应。核心方法结合惩罚融合(penalized fusion)实现亚组系数的合并与变量选择,并引入模型平均(model averaging)提升估计稳定性。理论部分给出了所提估计量的收敛性质与亚组识别的一致性保证,但未涉及 minimax rate 或 semiparametric efficiency bound。模拟与癌症数据应用展示了方法在有限样本下的实用性。对您可能有用:该文的高维惩罚融合框架可视为高维 M-estimation 的一个实例,适合作为您熟悉的高维渐近理论在生存分析场景的对照阅读。
- 关键技术:
penalized fusion,model averaging,heterogeneous proportional hazards model,high-dimensional variable selection,subgroup identification consistency - 为什么对您有用: 本文属于高维统计中的惩罚融合与亚组识别问题,连接到您的高维统计与 M-estimation 理论子方向。您武器库中的 minimax bounds 与 M-estimation theory(moderately_familiar)可以直接用来审视该文声称的理论结果是否达到 sharper rate 或仅是常规收敛保证。中期可做:若想在此方向深入,需先在 moderately_familiar 的 M-estimation theory 上长肌肉,特别是高维惩罚 M-estimator 的 oracle property 与 rate tightness 分析。
非参数 / 半参数 (nonparam_semipara, 18 篇)¶
1. 10.1214/25-ejs2372 — Semi-parametric Bernstein-von Mises theorem in linear inverse problems¶
- 作者: Adel Magra, Aad van der Vaart, Harry van Zanten
- 期刊/来源: Electronic Journal of Statistics
- 机构: Vrije Universiteit Amsterdam · Delft University of Technology
- 分类: vol 19 · issue 1
- 相关性 9/10 · novelty:
new_theory - 摘要: 在信号-白噪声线性逆问题设定下,目标是从两个独立带噪观测(原函数及其线性变换)中恢复未知算子所含的标量参数,核心 regularity 假设涉及算子的谱衰减性质。本文在贝叶斯框架下证明该标量参数边际后验的半参数 Bernstein-von Mises (BvM) 定理,确保后验分布以 n^{-1/2} 速率收敛至以 efficient influence function 为方差的正态分布,从而具备频率学派渐近效率。进一步推导了不同先验下的 BvM 结果,并应用于热方程热扩散率恢复与半盲去卷积位置参数恢复两个具体实例。对您有用:本文将 semiparametric efficiency 与 inverse problems 结合,为处理部分已知算子的因果/测量误差模型提供了贝叶斯 BvM 视角的理论基准。
- 关键技术:
Bernstein-von Mises theorem,semiparametric efficiency,linear inverse problems,spectral regularization,marginal posterior asymptotics,efficient influence function - 为什么对您有用: 直接连接 semiparametric efficiency 与 inverse problems with random noise 两个 primary interest 子方向:在部分已知算子的逆问题中证明 BvM,给出了贝叶斯后验也能达到 semiparametric efficiency bound 的严格条件。用 very_familiar 的 inverse problems with random noise 谱分析工具即可验证其算子 regularity 假设的覆盖范围,属于立即可做的 follow-up;可进一步用 moderately_familiar 的 HOIF / semiparametric theory 探究更高阶参数或非标量参数的 BvM 是否成立。
2. 10.1214/25-ejs2375 — Multivariate weighted empirical likelihood MLE for the Cox model with various types of censored data¶
- 作者: Jian-Jian Ren, Yuanhang Wang
- 期刊/来源: Electronic Journal of Statistics
- 机构: University of Maryland, College Park
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 针对生存分析中各种类型的删失数据(右删失、双删失、区间删失、部分区间删失、双变量右删失等),本文提出基于多元加权经验似然(WEL)的Cox比例风险模型统一估计框架。将加权经验似然从一元推广到多元,构造加权最大似然估计(WMLE),并给出WEL版本的Cox偏似然估计。建立了估计量的渐近正态性等渐近性质,并设计了稳定的计算算法。模拟研究验证了方法在不同删失类型下的有限样本表现。该框架统一了现有零散方法,无需逐类处理。对您而言,该工作与半参数理论(Cox模型)和统计计算(算法实现)直接相关;加权经验似然作为一种非参似然方法,可与您熟悉的非参数统计和M估计理论无缝衔接。
- 关键技术:
Weighted empirical likelihood,Cox proportional hazards model,Weighted maximum likelihood estimator (WMLE),Cox partial likelihood,Asymptotic normality,Computing algorithms for censored data - 为什么对您有用: (1)该论文提出了处理各种删失数据的统一半参数推断框架,直接连接到您的半参数与非参数理论兴趣方向,尤其是Cox模型这一经典半参模型。(2)您的非常熟悉工具库中的非参数统计和M估计理论足以理解加权经验似然的渐近性质与算法逻辑,并可用于评估其效率损失或拓展至其他半参模型(如加速失效时间模型)。(3)立即可做:您可基于该框架,将加权经验似然方法引入因果推断中的删失数据处理(如带右删失的生存因果效应估计),或进一步将其与去偏机器学习结合以提高半参效率。
3. 10.1214/25-ejs2355 — Robust estimation under a semiparametric propensity model for nonignorable missing data¶
- 作者: Samidha Shetty, Yanyuan Ma, Jiwei Zhao
- 期刊/来源: Electronic Journal of Statistics
- 机构: Montana State University · Pennsylvania State University · University of Wisconsin–Madison
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 本文研究非可忽略缺失数据下,在结果与协变量的回归关系完全未建模、而倾向性模型为半参数(对协变量的依赖未知且未指定)时,如何估计感兴趣的参数或泛函。核心挑战在于倾向性模型中的未知非参数分量无法直接由观测数据估计,传统方法需对此分量进行近似或假设,可能引入偏差。作者仔细分析半参数结构,发现通过构造适当的估计方程,可以在完全不估计该未知函数的情况下同时估计倾向性模型参数和感兴趣的泛函,从而克服了这一根本性障碍。所提出的估计量在正则条件下具有相合性和渐近正态性,理论性质通过严格推导确立,并得到模拟和实际数据应用的支持。该方法避免了非参数分量的估计,简化了计算,并可能提高稳健性,特别适用于高维协变量或复杂缺失机制。对于您而言,本文的半参数绕过技术可直接应用于因果推断中的缺失数据处理,其结构分析与您熟悉的非参数统计和因果推断估计理论深度契合,可快速吸收并拓展到您的因果推断工作。
- 关键技术:
semiparametric propensity model,nonignorable missingness,nuisance function bypass,asymptotic normality,orthogonal estimating equations - 为什么对您有用: 本文研究对象是非可忽略缺失数据下的半参数估计,直接连接您的主要兴趣“半参数与非参数理论”和“因果推断中的估计理论”。您武器库中very_familiar的nonparametric statistics和estimation theory in causal inference可轻松理解本文绕过非参数分量的核心思路,并可用于改进您现有的缺失数据处理方法。对于follow-up:立即可做,因为原理与您熟悉的非参数统计和因果推断方法一脉相承,您可以快速复现并扩展至其他因果参数估计。
4. 10.1214/25-ejs2376 · arXiv — Covariance constraints for stochastic inverse problems of computer models¶
- 作者: Nicolas Bousquet, Mélanie Blazère, Thomas Cerbelaud
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究计算机模型的随机逆问题,目标是在模型噪声干扰下估计随机输入的概率分布参数(Gaussian线性/可线性化设定,epistemic uncertainty 框架)。核心方法结合全局敏感性分析与信息论原理,推导出新的先验协方差约束,要求解能解释大部分可观测不确定性而模型噪声仅占次要因素。技术工具包括Sobol敏感性指标、互信息约束、Gaussian协方差结构下的解析推导,以及将这些约束注入参数化贝叶斯推断算法。模拟实验表明,协方差约束能有效抑制模型噪声对估计结果的影响。对您有用:本文在随机逆问题中引入信息论与敏感性约束的思路,可与您熟悉的 inverse problems with random noise 及高维渐近理论对接。
- 关键技术:
stochastic inverse problem,global sensitivity analysis (Sobol indices),information-theoretic covariance constraint,Gaussian linear model,parametric Bayesian inference - 为什么对您有用: 直接连接您 primary interest 中的 inverse problems with random noise,在 Gaussian 线性可逆设定下用信息论与 Sobol 指标构造协方差先验约束,思路可迁移到您熟悉的随机逆问题估计理论。用 very_familiar 的 inverse problems with random noise 与 minimax bounds 视角即可审视其约束是否构成 sharper rate 或 weaker assumption 的改进,属于立即可做的阅读与评估。
5. 10.1214/25-ejs2381 · arXiv — Covariate-informed reconstruction of partially observed functional data via factor models¶
- 作者: Maximilian Ofner, Siegfried Hörmann
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究部分观测的函数型数据线性重构问题,数据在离散网格上记录。提出一种基于近似因子模型(递增秩)的新估计方法,并利用协变量信息,无需预平滑即可同时分离信号与噪声并重构缺失片段。建立了估计量的均匀一致收敛率,并构造了缺失轨迹的同时预测带。模拟研究展示了有限样本性能,温度曲线实际数据表明方法简单有效。对您而言,本文提供的函数型数据重构收敛率分析可与您熟悉的非参数统计和渐近理论直接衔接,高维因子模型的秩递增设定也与高维渐近兴趣相关。
- 关键技术:
approximate factor model with increasing rank,functional data reconstruction,uniform convergence rates,simultaneous prediction bands,smoothing-free signal extraction - 为什么对您有用: 本文主题属于非参数统计中的函数型数据分析,与您非常熟悉的 nonparametric statistics 直接相关,可用 minimax bounds 和 high-dimensional asymptotics 分析其收敛率是否最优。您已熟悉高维渐近和逆问题,本文的因子模型设定和均匀收敛率证明可望在阅读后快速内化,属于中期可做范畴——若想深入,可先强化对函数型数据主成分分析(FPCA)相关工具的理解。
6. 10.1214/25-ejs2361 · arXiv — Fast robust kernel regression through sign gradient descent with early stopping¶
- 作者: Oskar Allerbo
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究核岭回归 (KRR) 的等价目标函数重构,从而将 \(\ell_2\) 惩罚推广至 \(\ell_\infty\) 与 \(\ell_1\) 惩罚,分别实现鲁棒与稀疏核回归。核心机制是建立显式惩罚与迭代早停 (early stopping) 的对应:\(\ell_\infty\) 惩罚对应 sign gradient descent,\(\ell_1\) 对应 forward stagewise / coordinate descent,\(\ell_2\) 对应 gradient descent,并对后者给出了早停解与显式惩罚解的理论偏差界。利用此对应,作者提出基于 sign gradient descent 早停的快速鲁棒核回归算法,在五个真实数据集上比现有鲁棒核回归方法快 1–2 个数量级且精度不损。对您可能有用:早停与显式惩罚的等价性分析为非参数估计的 implicit-explicit regularization 理论提供了新视角。
- 关键技术:
kernel ridge regression,sign gradient descent,early stopping regularization,l_infinity penalty,forward stagewise regression,implicit-explicit regularization equivalence - 为什么对您有用: 本文连接了非参数统计中的 kernel regression 与统计计算中的早停迭代算法,属于非参数估计与计算效率交叉;您武器库中 very_familiar 的 nonparametric statistics 与 software development 可直接审视其理论界与算法实现。早停与显式惩罚的等价性分析是 nonparametric M-estimation 的一个具体口子,可用 moderately_familiar 的 M-estimation theory 检验其偏差界是否可推广到更一般的 loss/penalty 组合。立即可做:用 very_familiar 的非参数理论审视其 \(\ell_2\) 早停偏差界的紧性,并复现其 sign GD 算法验证计算加速声称。
7. 10.1214/25-ejs2396 · arXiv — Local differential privacy in survival analysis using private failure indicators¶
- 作者: Maxime Egéa, Mikael Escobar-Bach
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
sharper_rate - 摘要: 在右删失生存数据设定下,目标是对累积危险函数(及等价的分布函数)进行非参数估计,同时对失效指示变量施加 α-局部差分隐私(LDP)机制以保护数据库隐私。作者提出了一种基于核的非参数累积危险函数估计器,证明了在隐私化机制下该估计器仍保持一致性。在温和条件下,本文推导了该问题的 minimax 收敛速率下界,并证明在适当选择带宽时,所提估计器达到 minimax 最优性。该工作将局部差分隐私引入经典生存分析的非参数估计框架,给出了明确的隐私-统计效率权衡的 minimax 量化。对您可能有用:本文展示了如何在非参数估计中严格量化 LDP 引入的 minimax rate 退化,与您在非参数 minimax bound 和高维/逆问题中的经验直接相连。
- 关键技术:
local differential privacy,nonparametric kernel estimation,cumulative hazard function,minimax lower bounds,censored survival data,privacy-utility tradeoff - 为什么对您有用: 本文直接连接到您 primary interest 中的非参数 minimax rate 理论:它给出了 LDP 机制下累积危险函数估计的 minimax 下界与最优带宽选择,属于经典的 minimax bound 问题加上隐私约束的变体。您武器库中 very_familiar 的 minimax bounds for estimation problems 完全可以直接用来审视其下界构造(通常基于 Fano 或 Le Cam),甚至可以推广到您熟悉的 inverse problems with random noise + LDP 设定。立即可做:用您已有的 minimax 下界工具验证其 rate 是否紧,或尝试将类似 LDP 约束引入您熟悉的逆问题框架。
8. 10.1214/24-ejs2339 · arXiv — Strong identifiability and parameter learning in regression with heterogeneous response¶
- 作者: Dat Do, Linh Do, XuanLong Nguyen
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 6/10 · novelty:
new_theory - 摘要: 本文研究有限混合回归模型在异质性响应变量下的强可识别性、参数学习及收敛率问题。模型设定为给定协变量后响应变量的条件分布由多个潜在子群体的混合表示,允许组件数未知且可能被过设定。方法核心是利用强可识别性条件保证参数估计的一致性,并推导了条件密度和参数估计的收敛速度(minimax最优或接近最优),同时分析了贝叶斯后验收缩行为。论文覆盖常见链接函数和条件分布族(如高斯、逻辑斯蒂克等),理论结果适用于精确拟合和过拟合两种场景。模拟和数据分析展示了参数学习行为与文献中观察的一致性。对您而言,该工作与非参数/半参数理论中混合模型的可识别性和收敛率分析紧密相关,特别是处理异质性数据的方法论基础,可为因果推断中的异质性处理效应建模提供理论参考。
- 关键技术:
finite mixture of regressions,strong identifiability,convergence rates for conditional density estimation,Bayesian posterior contraction,overfitted mixture models - 为什么对您有用: 论文主题直接连接到您的非参数与半参数理论兴趣,尤其是混合模型的可识别性和收敛率。您非常熟悉的非参数统计、minimax界工具可用来评估其收敛率是否最优或可改进。由于混合模型在后验收缩和过设定理论方面需要一定背景,但核心分析框架与您的武器库吻合,故可列为中期可做(需先熟悉混合模型的后验收缩文献)。
9. 10.1214/25-ejs2400 · arXiv — Adaptive nonparametric estimation in the functional linear model with functional output¶
- 作者: Gaëlle Chagny, Anouar Meynaoui, Angelina Roche
- 期刊/来源: Electronic Journal of Statistics
- 机构: Laboratoire de Mathématiques Raphaël Salem · Centre de Recherche en Mathématiques de la Décision
- 分类: vol 19 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 本文考虑函数型线性回归模型,其中协变量和响应变量均为函数型随机变量,目标是估计条件期望算子。采用投影估计方法,将算子投影到由经验PCA函数基生成的有限维子空间上,得到估计量的非渐近偏差-方差分解。通过惩罚对比准则进行模型选择,自动权衡投影维度,证明了所选择的估计量满足oracle不等式,从而实现自适应最优性。在椭圆光滑空间上推导了收敛速率,并给出了匹配的minimax下界,证明速率最优。数值实验包括模拟数据和两个真实数据集,验证了方法的实际表现。该论文的非参数自适应估计思路与您的非参数统计与minimax理论兴趣高度相关,函数型数据分析也是高维统计的延伸。
- 关键技术:
projection estimator,empirical PCA basis,model selection by penalized contrast,oracle inequality,minimax lower bound,functional data analysis - 为什么对您有用: 该论文聚焦于函数型数据的非参数自适应估计,连接您的非参数统计与高维渐近兴趣子方向。您非常熟悉的非参数minimax bound技术可以直接用于验证其收敛速率的最优性,而投影估计与模型选择方法也易于拓展到其他半参数设定。属于立即可做的领域,当前武器库中的非参数估计和minimax理论足以深入理解并可能应用。
10. 10.1214/24-ejs2341 — Regression analysis of semiparametric Cox-Aalen transformation models with partly interval-censored data¶
- 作者: Xi Ning, Yanqing Sun, Yinghao Pan, Peter B. Gilbert
- 期刊/来源: Electronic Journal of Statistics
- 机构: Colby College · University of North Carolina at Charlotte · University of Washington
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_method - 摘要: 本文研究部分区间删失数据(同时包含精确观测和区间删失观测)的半参数Cox-Aalen变换模型,该模型能够灵活容纳乘性和加性协变量效应、常数与时变效应,且包含半参数变换模型、Cox-Aalen模型、分层Cox模型等常见模型作为特例。作者构造一组估计方程,并提出期望求解(ES)算法,兼顾数值稳定性和快速收敛性。在温和正则性假设下,证明估计量的相合性和渐近正态性,并验证加权bootstrap重抽样方法的有效性。进一步提出上确界检验以检验协变量时变效应的假设。通过数值模拟和一项随机HIV/AIDS临床试验数据应用验证了方法的有用性。该工作将半参数变换模型的适用范围拓展至部分区间删失场景,对纵向生存数据的回归分析具有参考价值。
- 关键技术:
Semiparametric Cox-Aalen transformation models,Partly interval-censored data,Expectation-Solving (ES) algorithm,Estimating equations,Weighted bootstrap,Supremum test for time-varying effects - 为什么对您有用: 该论文直接对应您的半参数理论兴趣,特别是将经典生存模型扩展到部分区间删失数据并引入高效算法。您武器库中的【M-estimation理论】(moderately_familiar)可用于分析其估计方程和渐近性质,而非参数统计基础可帮助理解模型灵活性。中期可做:若进一步强化M-estimation理论,可将本文的ES算法思想迁移至因果推断中带有区间删失的纵向分析问题。
11. 10.1214/25-ejs2391 — On a general class of functionals: Statistical inference and application to risk measures¶
- 作者: Dieter Debrauwer, Irène Gijbels, Klaus Herrmann
- 期刊/来源: Electronic Journal of Statistics
- 机构: KU Leuven · Université de Sherbrooke
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_method - 摘要: 论文提出了一类广义泛函,通过优化问题统一刻画分位数、期望分位数、极端分位数以及扭曲风险等概念,其中优化问题的关键要素是损失函数和分布权重函数。作者为这类泛函构造了通用估计量,并建立了渐近相合性和渐近正态性,从而为所有成员提供了统一的统计推断工具(如置信区间构造)。方法的核心机制在于将不同泛函纳入同一框架,利用M-估计理论或经验过程工具推导渐近性质,避免了针对每个概念单独推导的需要。论文在理论发展后展示了多个应用场景,包括真实数据中自然灾害风险测度的分析。该工作为半参数泛函推断提供了一种统一理论,与您的非参数统计和渐近理论专业知识高度相关,且可直接运用M-估计理论理解其方法论核心。
- 关键技术:
M-estimation,asymptotic normality,influence function,distortion risk measures,expectiles and extremiles - 为什么对您有用: 本文属于半参数/非参数推断领域,直接对应您对非参数统计和假设检验的兴趣。它统一处理多种泛函(分位数、期望分位数、风险测度)的渐近推断,您可运用非常熟悉的M-估计理论及渐近工具快速理解和评估其方法的通用性。立即可做:您掌握的非参数统计和渐近理论足以读懂并批判该框架的假设与证明,并可探讨其在高维或U-统计量方向上的扩展。
12. 10.1214/25-ejs2380 · arXiv — An asymptotic study of the joint maximum likelihood estimation of the regularity and the amplitude parameters of a periodized Matérn model¶
- 作者: Sébastien J. Petit
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_theory - 摘要: 本文研究了周期化Matérn协方差模型(Stein引入)中正则性参数和幅度参数的联合最大似然估计的渐近性质。设定为高斯过程插值,数据按照模型采样,目标是同时估计这两个参数。作者推导了联合MLE的收敛速率,证明了估计参数的均方积分误差(MISE)与使用真参数时的MISE渐近等价。关键工具包括似然函数的谱近似、渐近展开以及Sobolev空间的嵌入性质。进一步,当观测函数是固定Sobolev空间中的确定性元素时,联合估计不会像固定幅度时那样选择正则性参数。该工作为高斯过程协方差参数估计提供了严格的渐近理论。对您而言,本文所研究的正则性参数联合估计问题与非参数统计中的平滑参数选择和函数估计精度紧密相关,同时其渐近分析方法可迁移至高维统计中协方差矩阵估计的MLE性质研究。
- 关键技术:
periodized Matérn covariance,joint maximum likelihood estimation,asymptotic convergence rates,mean integrated squared error (MISE),Sobolev space embedding - 为什么对您有用: 本文直接连接您对非参数统计的兴趣:它提供了高斯过程协方差函数中正则性参数联合MLE的渐近理论,这类问题与平滑参数选择密切相关。您武器库中的非参数统计和逆问题随机噪声知识可以直接用于理解本文证明的框架(谱展开、收敛速率推导)。立即可做:用非参数统计的视角审视其渐近最优性,并考虑将分析方法扩展到更一般的协方差模型。
13. 10.1214/25-ejs2359 · arXiv — Resistant convex clustering: How does the fusion penalty enhance resistance?¶
- 作者: Qiang Sun, Archer Gong Zhang, Chenyu Liu, Kean Ming Tan
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 4/10 · novelty:
new_method - 摘要: 本文针对凸聚类(convex clustering)对异常值敏感的问题,提出了抵抗性凸聚类(resistant convex clustering)方法。该方法通过修改平方误差损失函数(例如使用Huber损失或截断损失),并结合融合惩罚(fusion penalty),使得估计量在数据污染下仍保持鲁棒。理论证明,新估计量的崩溃点(breakdown point)可达50%,即只要正常样本超过一半,估计量就不会完全失效。关键发现是融合惩罚本身可以增强抵抗性:它促使估计量向未污染样本的聚类中心融合,而不是向污染样本方向偏离。数值实验验证了方法的有效性,并提供了R包Rcvxclustr。本文对非参数统计中的鲁棒聚类问题给出了清晰的理论解释,与您对非参数统计的兴趣方向相关,可作为了解鲁棒聚类理论的入门材料。
- 关键技术:
convex clustering,fusion penalty,breakdown point,resistant estimation,convex optimization - 为什么对您有用: 本文研究的鲁棒凸聚类属于非参数统计中的聚类鲁棒性问题,与您的非参数统计兴趣中'逆问题与随机噪声'及'最小最大界'方向有交集。利用您熟悉的非参数统计工具(如经验过程、收敛速率分析)可进一步评估该估计量的渐近性质。但该问题的核心(崩溃点与融合惩罚的交互)与您当前主要研究的因果推断、高维统计等方向关联较弱,因此从务实角度看,本文可作拓宽视野的阅读,暂不可作为核心研究课题直接跟进。
14. 10.1214/25-ejs2350 · arXiv — Robust estimation for functional logistic regression models¶
- 作者: Graciela Boente, Marina Valdora
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 4/10 · novelty:
new_method - 摘要: 在函数型 logistic 回归设定下,目标是估计函数型斜率参数并实现稳健分类,假设协变量为无限维函数且存在异常点污染。本文将有限维稳健 logistic 回归的优良实践(如稳健 M-估计 / bounded loss)迁移至函数型框架,结合维度缩减或惩罚正则化工具计算斜率估计量。在正则性条件下,证明了估计量的相合性以及预测的收敛速率。数值实验与真实数据表明该方法在多种污染场景下保持稳定。对您有用之处在于:函数型斜率的收敛速率分析可与非参数 minimax 理论对接,稳健 M-估计框架也为半参数理论下的 influence function 分析提供参照。
- 关键技术:
functional logistic regression,robust M-estimation,bounded loss function,dimension reduction regularization,consistency and convergence rates - 为什么对您有用: 本文连接到非参数/半参数理论中的函数型数据估计与 minimax rate 子方向;您武器库中 very_familiar 的 minimax bounds 可直接用来审视本文声称的收敛速率是否紧,moderately_familiar 的 M-estimation theory 则可切入其稳健估计量的 influence function 与 asymptotic variance 分析。follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,才能系统化地推导该函数型稳健估计量的 semiparametric efficiency bound 并验证其速率最优性。
15. 10.1214/25-ejs2343 · arXiv — Two-step mixed-type multivariate Bayesian sparse variable selection with shrinkage priors¶
- 作者: Shao-Hsuan Wang, Ray Bai, Hsin-Hsiung Huang
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 在混合型(连续+离散)多变量回归框架下,目标是利用连续收缩先验对 \(p\) 个协变量进行联合变量选择与参数估计,核心假设是响应变量间的相关性结构与协变量的稀疏性。本文首次建立该类模型的后验收缩理论,证明在 \(p\) 相对于 \(n\) 指数级增长(\(p=e^{o(n)}\))的极端高维设定下,后验仍能以极小速率收缩至真实参数;此前文献仅覆盖亚指数增长情形。技术上,通过两步法(two-step)实现变量选择:第一步具备 sure screening 性质以降维,第二步在筛选后子模型上施加收缩先验并证明其后验收缩。主要理论结果给出了后验收缩的必要与充分条件,实证分析在癌症基因组数据(\(n=174, p=9183\))上验证了方法。对您可能有用:本文将高维贝叶斯后验收缩理论从亚指数推广至指数增长,其 sure screening + 收缩先验的两步降维-估计策略与 semiparametric / high-dim 理论中的 debiased / orthogonal 两步法有结构相似性,可供理论对比。
- 关键技术:
continuous shrinkage priors,posterior contraction rates,sure screening property,mixed-type multivariate regression,exponential dimension growth,two-step variable selection - 为什么对您有用: 本文直接触及 high-dimensional statistics 与 semiparametric theory 交叉地带:将高维贝叶斯后验收缩的维度增长上限从亚指数推至指数级,并给出必要与充分条件,这对您熟悉的高维 minimax 理论与 estimation rate 界定有直接参照价值。您可用 very_familiar 的 minimax bounds 工具检验其声称的指数增长下后验收缩速率是否与频率派 minimax rate 匹配,或用 moderately_familiar 的 M-estimation theory 对比其两步法与频率派 orthogonal/debiased 两步法的理论保证差异。中期可做:若要深入其贝叶斯收缩证明细节,需先在 moderately_familiar 的 M-estimation / semiparametric theory 上补充贝叶斯高维先验浓度(prior concentration)与测试函数(testing argument)的专门技术。
16. 10.1214/25-ejs2390 · arXiv — Modified wavelet variation for the Hermite processes¶
- 作者: Laurent Loosveldt, Ciprian A. Tudor
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 3/10 · novelty:
new_theory - 摘要: 本文研究任意 Hermite 过程(包括分数布朗运动等高斯与非高斯自相似过程)的 Hurst 参数估计问题,设定为仅依赖过程单条轨道的离散观测。核心构造是 modified wavelet variation:通过精心选取小波系数使得各分量在忽略微小余项后相互独立,从而规避了标准小波变差中分量强相关导致的非标准极限分布难题。利用 Stein-Malliavin calculus 证明了该估计量的多维中心极限定理,并给出了 Wasserstein 距离的显式收敛界,由此得到 Hurst 参数的强一致且渐近正态估计。对您可能有用:本文将 Stein-Malliavin 方法与小波变差结合以获得显式 Berry-Esseen 型界,这一技术路线可迁移至高阶 U-统计量或半参数估计量的高阶渐近分析。
- 关键技术:
modified wavelet variation,Hermite processes,Hurst parameter estimation,Stein-Malliavin calculus,Wasserstein distance bound,multidimensional CLT - 为什么对您有用: 本文直接连接到非参数统计与高阶 U-统计量理论:Hermite 过程的变差估计本质上是高阶多项式泛函的极限行为分析,而 Stein-Malliavin 工具与您熟悉的 higher-order influence functions (HOIF) 在刻画高阶渐近与显式误差界上有深层技术同构。您可以用 very_familiar 的高阶 U-统计量计算(treewidth / tensor contraction)视角审视其小波系数独立化构造的组合代价,并尝试用 moderately_familiar 的 HOIF 理论为该估计量推导更精细的 higher-order expansion。立即可做:用 very_familiar 的高维渐近与 minimax 工具验证其 Hurst 估计量的 rate 是否达到参数下界;用 moderately_familiar 的 HOIF 探索其 Wasserstein 界的 higher-order 改进。
17. 10.1214/25-ejs2383 · arXiv — A new framework for Bayesian function registration¶
- 作者: Yijia Ma, Wei Wu
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 2/10 · novelty:
new_method - 摘要: 在函数型数据对齐(function registration / alignment)问题中,目标是估计最优时间扭曲函数(time warping function),经典 Fisher-Rao 方法将其视为纯优化问题。近期贝叶斯方法将经典对齐作为似然、对时间扭曲引入先验,但现有先验常依赖非线性近似,导致计算不准确与效率低下。本文提出新贝叶斯框架,采用给出线性表示的先验,使 Gaussian 或非 Gaussian 随机过程可直接施加于时间扭曲函数,无需线性化近似。后验通过标准 MCMC 采样获得,多个模拟实验表明新框架在函数对齐精度上优于先前方法,并在真实数据集上取得理想对齐效果。对您可能有用:本文的线性表示先验与 MCMC 计算框架为非参数贝叶斯函数估计提供了新思路,可对比 semiparametric efficiency bound 视角下的扭曲函数估计极限。
- 关键技术:
function registration / alignment,Fisher-Rao distance,time warping function,Bayesian prior with linear representation,MCMC posterior sampling,functional data analysis - 为什么对您有用: 本文属于非参数函数型数据分析,与您 primary interest 中的 semiparametric & nonparametric theory 相连,但核心是贝叶斯先验设计而非效率理论或 minimax 界。您武器库中的 nonparametric statistics 可用来审视其线性先验的逼近性质,但本文未触及 influence function 或效率界,方法学 novelty 属框架改进而非理论突破。follow-up 判断:中期可做——若想将贝叶斯对齐与 semiparametric efficiency bound 结合,需先在 moderately_familiar 的 semiparametric theory 上长肌肉,推导扭曲函数估计的 efficient influence function。
18. 10.1214/24-ejs2340 · arXiv — Clustered Archimax copulas¶
- 作者: Simon Chatelain, Samuel Perreault, Anne-Laure Fougères, Johanna G. Nešlehová
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 2/10 · novelty:
new_method - 摘要: 在多元极值建模设定下,本文针对 Archimax copula 的随机表示提出聚类扩展(clustered Archimax copula),以刻画组间渐近依赖或渐近独立、组内 pre-extreme 依赖的混合结构。核心机制是通过对变量进行分划,各组由各自的 Archimedean 生成器与 stable tail dependence function 定义,组间通过 radial copula 连接;模型继承了 Archimax copula 对非极端水平依赖的刻画能力,同时允许组间渐近独立或依赖。理论结果给出了该模型的渐近行为,证明其导出一类丰富的 stable tail dependence function 族。对您而言,本文的 copula 结构与分划机制可作为因果推断中处理多干预变量或纵向数据联合分布的 semiparametric 建模参考。
- 关键技术:
Archimax copula,stable tail dependence function,Archimedean generator,radial copula,asymptotic dependence structure,stochastic representation - 为什么对您有用: 本文属于非参数/半参数 copula 建模,其聚类分划与 radial copula 连接机制可迁移到因果推断中多处理变量或纵向数据的联合分布建模。用 very_familiar 中的 nonparametric statistics 可直接分析其 stable tail dependence function 的估计效率与 minimax rate;若要深入其渐近理论推导,需在 moderately_familiar 的 semiparametric theory 上稍作延伸。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是 copula 模型下的 semiparametric efficiency bound 推导),才能将此模型与因果推断的 identification/estimation 做深度对接。
数理统计 / 假设检验 (hypothesis_testing, 11 篇)¶
1. 10.1214/25-ejs2368 · arXiv — Differentially private multivariate statistics with an application to contingency table analysis¶
- 作者: Minwoo Kim, Jonghyeok Lee, Seung Woo Kwak, Sungkyu Jung
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 该论文在差分隐私框架下研究多元统计量的隐私保护释放问题,目标是在满足高斯差分隐私(GDP)准则的同时最大化统计效用。作者提出了秩亏James-Stein高斯机制(rank-deficient James-Stein Gaussian mechanisms),通过对普通高斯机制进行收缩修正,显著提升了隐私保护下统计量的精度。同时分析了拉普拉斯机制在GDP下的最优校准,发现其需要比全局敏感性更多的信息,且除极低隐私水平外统计效用普遍低于高斯机制。论文将所提机制应用于列联表的拟合优度检验和齐性检验,结合自助法构造了差分隐私下的假设检验流程,仿真显示新机制下的检验功效明显优于现有竞争者。该工作将隐私保护与经典多元统计推断相结合,其James-Stein收缩思路对高维隐私估计中偏差-方差权衡的优化具有启发价值,与您对统计计算和假设检验的兴趣直接相关。
- 关键技术:
Gaussian differential privacy (GDP),rank-deficient James-Stein Gaussian mechanisms,Laplace mechanisms under GDP,global sensitivity,bootstrap-based goodness-of-fit and homogeneity tests - 为什么对您有用: 本文连接您对统计计算和假设检验的兴趣(primary interest),其在差分隐私框架下改进统计效用的思路可视为一类受约束的估计问题。您的技术武器库中的 minimax bounds for estimation problems 可以用于刻画该机制的最优性边界,从而判断其收缩量是否达到隐私-精度的最优折中。就follow-up而言,该方向属于中期可做:需要先在 moderately_familiar 中的 semiparametric theory 上建立隐私推断的联系(因为差分隐私的灵敏度与半参效率存在类比),而后可进一步拓展至因果推断中的隐私保护估计。
2. 10.1214/25-ejs2349 · arXiv — Differentially private Kolmogorov-Smirnov-type tests¶
- 作者: Jordan Awan, Yue Wang
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 8/10 · novelty:
new_method - 摘要: 在差分隐私(DP)框架下,本文针对 goodness-of-fit、两样本及配对数据检验,基于 Kolmogorov-Smirnov、Kuiper、Cramér-von Mises 与 Wasserstein 统计量构建了一系列新的非参数检验。核心机制是将这些统计量统一视为经验累积分布函数(ecdf)上的伪度量,并证明其 DP sensitivity 可由 base sensitivity(相邻数据库 ecdf 间的伪度量距离)精确刻画,从而仅需极小噪声即可满足 DP。在零假设下,加噪后统计量的抽样分布是 distribution-free 的,可通过 Monte Carlo 方法直接计算 p-value。理论证明与数值实验表明,在小隐私预算或重尾数据设定下,新检验的 power 显著优于现有 DP 非参数检验。对您有用:本文将 DP sensitivity 与 ecdf 伪度量结合的思路,为非参数假设检验的隐私化改造提供了清晰的数学框架。
- 关键技术:
differential privacy sensitivity,empirical CDF pseudo-metric,Kolmogorov-Smirnov test,distribution-free sampling distribution,Monte Carlo p-value computation,nonparametric goodness-of-fit - 为什么对您有用: 本文直接连接到 primary interest 中的 hypothesis testing 子方向,将经典非参数检验(KS/CvM/Wasserstein)在 DP 约束下的 sensitivity 分析统一为 ecdf 伪度量问题。用您 very_familiar 的 nonparametric statistics 武器即可攻其核心:base sensitivity 的计算本质上是 ecdf 距离的逐点极值分析,属于经典非参数范畴;distribution-free 性质的推导也无需超出当前武器库。判断为立即可做:若想延伸此工作,可直接用 minimax bounds 工具评估这些 DP 检验在更广非参数模型类下的 power 衰减率,或探索更高阶 U-statistic 型检验(如 higher-order influence function 版 CvM)的 DP sensitivity 结构。
3. 10.1214/25-ejs2386 · arXiv — Integrated empirical measures and generalizations of classical goodness-of-fit statistics¶
- 作者: Hsien-Kuei Hwang, Satoshi Kuriki
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文基于多重积分经验测度,提出了三类推广的拟合优度检验统计量,分别对应Anderson-Darling、Cramér-von Mises和Watson统计量的泛化版本,旨在检测分布的各种特征偏差。通过分析相应的极限随机过程,作者推导了这些统计量在零假设下的极限分布,并给出了Karhunen-Loève展开及协方差核的显式闭式表达式。特别地,他们获得了对应积分算子的特征值显式公式,从而精确描述了极限分布的谱结构。进一步地,他们将极限分布的矩生成函数表示为无穷乘积,并巧妙化简为有限项乘积,使得数值计算变得高效可行。该工作为拟合优度检验提供了具有解析可处理性的新工具库,其将经典统计量推广到更灵活的框架。对您而言,积分经验测度的构造与您熟悉的高阶U-统计量在积分表示上有深刻联系,可直接运用非参数经验过程理论分析这些新检验的局部幂性质,是假设检验方向值得跟进的理论进展。
- 关键技术:
Integrated empirical process,Karhunen-Loève expansion,Eigenvalue computation for integral operators,Moment-generating function factorization,Generalized Anderson-Darling, Cramér-von Mises, Watson statistics - 为什么对您有用: 本文直接回应了您在假设检验(数学统计)中的兴趣,尤其是拟合优度检验的新方法发展。您非常熟悉的非参数统计和经验过程理论(very_familiar)可立即用于分析这些新统计量的局部渐近功效或与U-过程的联系;基于已有武器,立即可做:尝试将这些检验在特定备择假设下的检测效率与传统版本做比较,或探索积分阶数与检验敏感性的关系。
4. 10.1214/25-ejs2404 · arXiv — Information-theoretic limits for testing community structures in weighted networks¶
- 作者: Mingao Yuan, Zuofeng Shang
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究加权网络中检验社区结构是否存在的问题,使用(可能无限维)指数族分布对边权重建模。主要贡献是推导了检验可一致检测社区结构的sharp信息论极限,即存在一个相变阈值:低于该阈值任何检验一致收敛速率均不成立,高于该阈值则可构建一致检验。基于该极限,作者首次从假设检验角度形式化量化了将加权网络二值化为二进制网络的信息损失。文中提出了若干新的检验统计量,并通过模拟显示其良好表现。最后将方法应用于一个动物社交网络数据集。对您来说,本文的信息论极限推导方法与您在minimax下界方面的技术积累紧密相关,可助力您将假设检验下界工具拓展至网络数据领域。
- 关键技术:
Information-theoretic limits,Exponential family models,Consistent hypothesis tests,Phase transition,Dichotomization information loss - 为什么对您有用: 本文在加权网络社区检验中推导信息论极限,直接关联您的数学统计与假设检验兴趣方向。其下界分析技术与您非常熟悉的minimax bounds for estimation problems相通,可快速掌握并用于扩展网络假设检验的相变理论。立即可做。
5. 10.1214/25-ejs2392 · arXiv — A bipartite ranking approach to the two-sample problem¶
- 作者: Stephan Clémençon, Myrto Limnios, Nicolas Vayatis
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 7/10 · novelty:
new_method - 摘要: 在高维两样本检验问题中,经典基于经验分布差异的方法受维度诅咒影响严重;本文提出基于二部排序(bipart ranking)的两步法:将两样本赋予正负标签并分拆,第一步在训练集上学习评分函数以逼近似然比的单调变换,第二步对剩余数据的评分执行一维秩检验。核心 estimand 是两分布的似然比投影,关键假设是排序模型偏差可控;方法利用评分函数将多维数据投影至一维,从而规避多维自然序缺失问题并保留一维秩检验优势。理论贡献是基于两样本线性秩过程的非渐近误差界(concentration inequality),实证表明在高维设定下优于 MMD 等自然竞争方法。对您有用:本文将似然比估计与秩检验结合,为高维两样本检验提供了绕开维度诅咒的新路径,直接关联您对 hypothesis testing 与 nonparametric theory 的兴趣。
- 关键技术:
bipartite ranking,likelihood ratio scoring,two-sample linear rank process,nonasymptotic concentration bounds,univariate rank test on projected scores - 为什么对您有用: 本文直接关联您 primary interest 中的 hypothesis testing 与 nonparametric theory 子方向,将高维两样本检验转化为似然比估计+一维秩检验的组合问题。您武器库中 very_familiar 的 minimax bounds for estimation problems 与 nonparametric statistics 可直接用于分析其评分函数学习步骤的 minimax rate,并验证其声称的非渐近界是否紧。follow-up 判断:立即可做——用 minimax 与 concentration 工具审视其似然比估计步骤的理论界,或探讨该框架下 semiparametric efficiency bound 的可达性。
6. 10.1214/25-ejs2398 · arXiv — A new class of tests for convex-ordered families based on expected order statistics¶
- 作者: Tommaso Lando, Mohammed Es-Salih Benjrada
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 在已知参考分布 G 与未知分布 F 的设定下,本文提出检验 G^{-1}∘F 的凸性/凹性 vs 等分布(允许位置-尺度变换),从而覆盖递增失效率等经典及新兴凸序族。核心检验统计量基于“随机变量不超过某期望次序统计量”的估计概率,其中期望次序统计量通过 L-estimation 估计。作者证明了 L-estimator 在均值可能不存在(重尾)时仍满足强定律,确保检验无偏、一致且在凸变换序下具有单调功效;方法不依赖 G 的具体选择与支撑限制。模拟与实例验证了实用性。对您有用:为非参数序约束检验提供了新的 unbiased consistent 工具,直接补充 hypothesis testing 方向的 nonparametric arsenal。
- 关键技术:
convex transform order,expected order statistics,L-estimation,strong law of large numbers for heavy-tailed distributions,monotone power property,nonparametric hypothesis testing - 为什么对您有用: 直接连接 primary interest 中的 hypothesis testing 与 nonparametric theory 子方向,检验凸序约束而非简单参数/半参数假设。用 very_familiar 的 nonparametric statistics 与 minimax bounds 工具可审视其 L-estimator 的收敛率是否可达 minimax optimal,以及检验的 local power 性质。立即可做:用现有武器即可复现模拟并尝试推导 local asymptotic power 的 sharper bound。
7. 10.1214/25-ejs2345 · arXiv — Fast and optimal inference for change points in piecewise polynomials via differencing¶
- 作者: Shakeel Gavioli-Akilagun, Piotr Fryzlewicz
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 6/10 · novelty:
new_method - 摘要: 本文研究分段多项式回归中变化点的不确定性量化问题,目标是构造同时置信区间,使得每个区间以给定置信水平覆盖真实变化点位置。方法基于在稀疏网格上的多尺度局部检验,利用差分算子消除多项式趋势,并通过自适应多重检验校正来控制族系错误率。计算复杂度为 O(n log n),与数据长度呈近线性关系。理论结果表明,在温和条件下,所有变化点均能以高概率被检测,且所得区间宽度匹配变化点定位的 minimax 最优速率(至多相差对数因子)。模拟实验显示该方法与现有最先进算法相比具有竞争力。本文还提供了 R 包 ChangePointInference。对您而言,变化点推断是非参数统计和假设检验的核心问题,本文的最优速率分析与固定设计非参数回归中的 minimax 理论直接关联,且计算策略的经验值得关注。
- 关键技术:
change point detection,piecewise polynomial regression,differencing,multiple testing correction,minimax localization rates,local tests on a sparse grid - 为什么对您有用: 本文属于非参数统计中的变化点推断,直接对应您 primary interest 中的 hypothesis testing 和 nonparametric theory。您 very_familiar 工具包中的 minimax bounds 可直接用于验证其定位速率的紧性;同时,基于局部检验的多重校正策略可迁移至您关注的更高阶 U-统计量的变化点检测问题(中期可做,需在 moderately_familiar 的 higher-order U-statistics 上进一步熟悉)。本文计算复杂度分析清晰,适合作为统计计算方向的参考。
8. 10.1214/25-ejs2354 — FDP control in mass-univariate linear models using the residual bootstrap¶
- 作者: Samuel Davenport, Bertrand Thirion, Pierre Neuvial
- 期刊/来源: Electronic Journal of Statistics
- 机构: University of California San Diego · Université Fédérale de Toulouse Midi-Pyrénées · Institut de Mathématiques de Toulouse
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_method - 摘要: 在大规模单变量线性模型(mass-univariate linear models)中,针对多个对比的假发现比例(FDP)进行后验推断控制。现有参数方法依赖正态性或渐近近似,在样本量有限或噪声分布非标准时保守或失效。本文提出基于残差bootstrap的方法:通过残差重抽样模拟零假设对比的联合分布,并将其与[11]的后验推断界结合,推导出渐近同时控制所有子集FDP的置信上界。理论证明在一般条件下该界成立;模拟实验表明,与参数方法相比,该方法在保持控制的同时显著提高检验功效,尤其在弱信号场景下优势明显。最后在fMRI和转录组数据上展示实用性。该工作为多重假设检验中的推断不确定性量化提供了稳健的计算方案,直接对接研究者对假设检验中非参数bootstrap方法的核心兴趣。
- 关键技术:
Residual bootstrap,Post hoc inference,False Discovery Proportion (FDP) control,Mass-univariate linear models,Simultaneous inference over subsets - 为什么对您有用: 本文属于多重假设检验的FDP控制方向,是研究者primary interest中'mathematical statistics (hypothesis testing)'的具体发展。技术武库中'very_familiar'的非参数统计和高维渐近理论可直接用于分析bootstrap的近似的渐近精度,而bootstrap本身也是统计计算的核心重抽样工具('statistical computing')。立即可做:研究者可用其熟悉的极值理论或bootstrap Edgeworth展开验证该方法的有限样本性质,或将其推广到更一般的依赖结构。
9. 10.1214/25-ejs2395 · arXiv — Multiple comparison procedures for simultaneous inference in functional MANOVA¶
- 作者: Merle Munko, Marc Ditzhaus, Markus Pauly, Łukasz Smaga
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 4/10 · novelty:
new_method - 摘要: 本文针对功能型数据(函数型数据)在多组比较中的多重检验问题,提出一类新的检验过程。该方法适用于一般因子设计的任意线性假设,可对单变量和多变量均值函数同时进行全局及多重推断,且不假设误差分布或协方差函数的同质性。通过构造逐点二次型检验函数并取其上确界定义局部检验统计量,能够自适应处理异方差结构。作者推导了检验统计量的联合渐近分布,并引入重抽样方法逼近极限分布,从而保证弱条件下渐近有效性。通过广泛的仿真实验评估了小样本性能,并利用多变量功能空气污染数据展示了应用。该过程已在R包gmtFD中实现。对您而言,本文在假设检验方向提出一个通用框架,其中的多重比较调整方法和重抽样渐近理论可启发您在高维或U统计量的多重检验问题中的类似设计。
- 关键技术:
pointwise quadratic-form-type test statistics,supremum-based local test statistics,resampling approximation,functional MANOVA,multiple comparison procedures,heteroscedasticity-robust testing - 为什么对您有用: 本文涉及假设检验方向,与您的主要兴趣(mathematical statistics & hypothesis testing)直接相关。其中的多重比较调整策略和重抽样方法的渐近分析思路,您可以用非常熟悉的武器(high-dimensional asymptotics, nonparametric statistics)加以理解或改进。虽然功能数据不是您的核心领域,但该方法框架可迁移至您的高维U-statistics或多组因果推断中的多重检验问题,属于中期可做的方向(需先熟悉功能数据的弱收敛技术)。
10. 10.1214/25-ejs2385 — Monitoring time series with short detection delay¶
- 作者: Tim Kutta, Nina Dörnemann
- 期刊/来源: Electronic Journal of Statistics
- 机构: Aarhus University
- 分类: vol 19 · issue 1
- 相关性 4/10 · novelty:
new_theory - 摘要: 在 Banach 空间值相依时间序列的 sequential change-point detection 设定下,目标是监测均值突变并实现短 detection delay。作者提出一类 weighted CUSUM 统计量,通过权重设计使得在整个监测期内均保持一致短延迟,克服了现有方法仅在监测初期有短延迟或整体延迟长的缺陷。理论核心是证明了 Banach 空间值数据的 Hölderian invariance principle(高阶连续映射极限定理),并在高阶条件下验证其适用性;特别对 Hilbert 空间上 m-approximable 时间序列给出了该原理的具体实现。模拟与实证(流行病学、金融数据)显示该方法在延迟与检测功效上优于传统 CUSUM。对您有用:该文将 Hölderian invariance principle 引入 sequential testing,与您 hypothesis testing 及高维/函数数据渐近理论兴趣直接相连。
- 关键技术:
weighted CUSUM statistic,Hölderian invariance principle,sequential change-point detection,m-approximable time series,Banach-space-valued asymptotics - 为什么对您有用: 直接连接您 primary interest 中的 hypothesis testing 子方向,特别是 sequential / monitoring test 的渐近理论。文中核心工具 Hölderian invariance principle 涉及高阶经验过程极限定理,您武器库中 very_familiar 的 minimax bounds 与 high-dimensional asymptotics 可直接用来审视其 detection delay 界是否紧;moderately_familiar 的 M-estimation theory 可扩展至 Banach 空间 CUSUM 的效率分析。流行病学与金融的实证数据属于您 secondary interest。Follow-up 判断:立即可做——用 very_familiar 的高维渐近与 minimax 视角评估其 delay rate 的最优性,或将其 weighted CUSUM 推广至高维/随机矩阵设定。
11. 10.1214/25-ejs2364 · arXiv — Testing for the network small-world property¶
- 作者: Kartik Lovekar, Srijan Sengupta, Subhadeep Paul
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 2/10 · novelty:
new_method - 摘要: 在网络数据设定下,本文针对“小世界性质”(高传递性+低平均路径长度)提出正式的假设检验框架,克服了现有小世界系数将两个维度混淆且缺乏统计推断的缺陷。作者将高传递性与低平均路径长度解耦为两个独立事件分别检验,并以参数化网络模型(如 Erdős–Rényi)为 null,构建了参数 bootstrap 检验与渐近检验。在 ER null 下,对聚类系数在不同边概率渐近增长率(稀疏/稠密)情形推导了渐近分布,并给出了检验的渐近 level 与 power 理论保证。大量网络数据集的应用揭示了以往仅凭系数判定小世界性质的误导性。对您有用:本文将网络拓扑性质转化为正式的假设检验问题,渐近分布推导与 bootstrap 方案可直接借鉴到您对高维/网络结构假设检验的理论工作中。
- 关键技术:
parametric bootstrap test,asymptotic distribution of clustering coefficient,Erdős-Rényi null model,decoupled hypothesis testing,network transitivity - 为什么对您有用: 本文直接连接到您 primary interest 中的 hypothesis testing 子方向,将网络拓扑性质(传递性、路径长度)的判定从描述性指标提升到有渐近 level/power 保证的正式检验。您武器库中 very_familiar 的 minimax bounds 与 high-dimensional asymptotics 可直接用来审视其 ER null 下渐近分布的稀疏/稠密分界是否紧,以及评估其 power 在更复杂 null 模型下的表现。follow-up 判断:立即可做——用 minimax 理论与高维渐近工具即可着手分析其检验在非 ER null(如 stochastic block model)下的 power 界与 sharper rate。
统计计算 / 算法 (stat_computing, 3 篇)¶
1. 10.1214/25-ejs2384 · arXiv — Importance sampling-based gradient method for dimension reduction in Poisson log-normal model¶
- 作者: Bastien Batardière, Julien Chiquet, Joon Kwon, Julien Stoehr
- 期刊/来源: Electronic Journal of Statistics
- 机构: Mathématiques et Informatique Appliquées · Centre de Recherche en Mathématiques de la Décision
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_method - 摘要: 针对高维计数数据,采用低秩约束的泊松对数正态模型(PLN),以最大化对数似然为估计目标实现降维。传统变分推断虽计算高效但缺乏统计性质的保证,本文提出投影随机梯度方案,通过重要性采样近似梯度,避免变分近似偏差。在非凸 L-光滑目标函数下,证明随机有偏梯度估计的收敛速率为 O(T^{-1/2}+N^{-1}),其中 T 为迭代步数、N 为蒙特卡洛样本量,这依赖于所推导的非凸下降引理。数值实验表明该方法在模型拟合与推断精度上优于变分推断,且能随样本量扩展。从统计计算角度看,该算法将随机梯度法与重要性采样结合,可启发您在因果推断或 U-统计量计算中设计类似的有偏梯度优化策略。
- 关键技术:
Poisson log-normal model,importance sampling,projected stochastic gradient,non-convex L-smooth optimization,biased gradient estimate,convergence rate analysis - 为什么对您有用: 本文直接对应 primary interest 中的 statistical computing(数值方法与算法),提供了在低秩 PLN 模型中直接最大化似然的计算方案。研究者 very_familiar 中的 high-dimensional asymptotics 和非参数统计技巧可用于理解收敛证明中的浓度不等式;但随机有偏梯度的非凸优化理论并非已有武器库的核心内容,需先在 moderately_familiar 的 M-estimation theory 方向上补强随机梯度的统计推断分析,方能将该梯度框架迁移至因果推断的半参数估计。因此 follow-up 粗判为中期可做。
2. 10.1214/24-ejs2336 · arXiv — Unbiased test error estimation in the Poisson means problem via coupled bootstrap techniques¶
- 作者: Natalia L. Oliveira, Jing Lei, Ryan J. Tibshirani
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 5/10 · novelty:
new_method - 摘要: 本文针对Poisson序列均值问题,提出一种耦合自助法(coupled bootstrap, CB)来估计任意均值估计算法的测试误差。该方法通过向原始Poisson数据添加独立的二项噪声,生成两个彼此耦合的数据向量,分别用作训练集和测试集;通过多次自助平均(B次)稳定估计量。核心理论性质是:CB估计量对于原始均值被缩小因子p后的Poisson测试误差是无偏的(p为二项成功概率)。当B→∞且p→0时,CB估计量退化为基于Hudson引理的经典无偏估计,不需要对估计算法施加任何光滑性假设。文章针对泊松偏差损失和平方损失两种损失函数,给出了CB估计量的偏差-方差分解,分析了p和B对估计精度的影响,并通过模拟和真实数据验证了方法表现。本文对您作为统计计算方向的研究者尤其有用:该方法是一种新颖的、无需交叉验证或数据分裂的测试误差无偏估计技术,可直接与您的软件开发经验结合进行算法实现与扩展。
- 关键技术:
coupled bootstrap,Hudson's lemma,Poisson deviance,squared loss,bias-variance decomposition - 为什么对您有用: 本文直接关联您的首要兴趣——统计计算,特别是自助法(bootstrap)的变体设计。您熟悉的非参数统计与 minimax 理论可用于分析该估计量的效率(例如与交叉验证的比较)。利用您 very_familiar 中的软件开发能力,可以立即可复现本文算法并将其推广至其他指数族分布(如负二项或伯努利),或在因果推断中估计倾向得分模型的预测误差。立即可做:无需额外技能即可动手实现并测试其在不同噪声模型下的表现。
3. 10.1214/25-ejs2353 · arXiv — Road traffic estimation and distribution-based route selection¶
- 作者: Rens Kamphuis, Michel Mandjes, Paulo Serra
- 期刊/来源: Electronic Journal of Statistics
- 分类: vol 19 · issue 1
- 相关性 2/10 · novelty:
new_method - 摘要: 在路网图模型设定下,目标是估计各边行程时间的联合分布并实现基于分布的路由选择,而非传统 Dijkstra 单准则最短路径。作者将每条边细分为空间邻近的子片段以刻画统计相似性,采用贝叶斯方法构建联合分布估计器,从而自然提供不确定性量化。核心理论工具是极限定理,使估计程序仅依赖工作模型而不依赖特定分布假设,具备分布鲁棒性。数值实验验证了估计程序的有效性及分布估计在数据驱动路由决策中的实用性。对您可能有用:本文的贝叶斯图结构估计与分布鲁棒路由框架,为统计计算与数值优化在空间网络模型中的应用提供了一个具体案例。
- 关键技术:
Bayesian distribution estimation,graph-structured spatial model,limit theorem based robust estimation,distribution-based route selection,uncertainty quantification - 为什么对您有用: 本文连接到统计计算与数值方法这一 primary interest 子方向,展示了图结构数据上的贝叶斯联合估计与鲁棒极限定理如何支撑路由算法设计。用您 very_familiar 的软件开发与高维渐近理论可以复现其数值实验并检验极限定理在有限样本下的表现,但本文缺乏与您核心武器库(高维 RMT、U-statistic、semiparametric efficiency)的直接技术交汇。属于中期可做:若想在此方向深入,需先在 moderately_familiar 的 M-estimation 理论上长肌肉,以建立该贝叶斯估计器的渐近效率与 minimax 性质。
其他 (other, 1 篇)¶
1. 10.1214/25-ejs2402 · arXiv — Hoeffding-type decomposition for U-statistics on bipartite networks¶
- 作者: Tâm Le Minh, Sophie Donnet, François Massol, Stéphane Robin
- 期刊/来源: Electronic Journal of Statistics
- 机构: Département mathématiques, informatique, sciences de la donnée et technologies du numérique · Mathématiques et Informatique Appliquées · Inserm · Center for Infection and Immunity of Lille · Laboratoire de Probabilités et Modèles Aléatoires · Laboratoire de Probabilités, Statistique et Modélisation
- 分类: vol 19 · issue 1
- 相关性 9/10 · novelty:
new_theory - 摘要: 本文考虑一类广泛的随机二部网络,其分布对每种节点内部的置换具有不变性(行-列可交换矩阵)。目标是在该网络的邻接矩阵上定义U统计量,并提出一种基于Aldous-Hoover-Kallenberg表示的新型Hoeffding分解方法。该分解将U统计量投影到相互正交的矩函数上,从而刻画非退化条件并推导出渐近正态性。同时,它提供了一个自然且易于实现的渐近方差估计量,无需复杂的重抽样。文中通过典型随机图模型(如随机块模型)的模拟验证了估计和检验的性能。对您而言,本文直接推进了高阶U统计量在网络设定下的理论,且您熟悉的树宽/张量收缩视角可用来进一步分析此类U统计量的计算效率。
- 关键技术:
Hoeffding decomposition,Aldous-Hoover-Kallenberg representation,row-column exchangeable matrices,U-statistics on bipartite networks,asymptotic normality,variance estimation - 为什么对您有用: 本文直接关联到您对高阶U统计量的兴趣(更高阶U统计量理论),特别是其在二部网络中的分解与渐近理论。您非常熟悉的
计算高阶U统计量(树宽/张量收缩/einsum)技术可用于分析这些U统计量的计算复杂度,例如利用图论性质优化收缩顺序。判为立即可做:核心武器(U统计量理论、非参数渐近、树宽计算)均在武器库内,可在此基础上设计针对二部网络的更高效测试或估计量。
Maintained by 陈星宇 · Homepage · Source on GitHub