跳转至

EJS — Vol 19 Issue 1 · 2026-06-23

  • 共 29 篇 · Electronic Journal of Statistics
  • 目录核对 ⚠️ 疑似漏 42 篇(对照 OpenAlex 70 篇):10.1214/25-ejs2390、10.1214/25-ejs2385、10.1214/24-ejs2339、10.1214/25-ejs2355、10.1214/25-ejs2357 等

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

EJS Vol 19 Issue 1 涵盖 29 篇论文,可归为四条主线:因果识别与稳健推断(4 篇,聚焦非依从、工具变量、伪似然、子群异质性);半参数与非参数方法(9 篇,覆盖变量选择、收缩先验、图基统计量、矩估计、拓扑聚类、分位数回归等);高维统计与随机矩阵(5 篇,涉及尖峰检验、无惩罚变量选择、稀疏多块 CCA、最佳子集复杂度、异常值检测);假设检验(4 篇,包括高维子群检验、依赖数据下的两样本平滑检验、稀疏函数数据检验、双变量变化点检测)。此外各有 1 篇属计算方法(并行 MCMC)和杂项(网络 bootstrap、贝叶斯基础、时空预测、极值、点过程、退化扩散),与前几条主线交集较少。

因果推断主线中,四篇论文从不同角度应对识别与效率挑战。"Sensitivity analysis for constructing optimal regimes" 在非依从且双活性治疗下,将最优策略表达为敏感性参数函数并推导 canonical gradient,提出 multiply robust 分类型估计量,直接关联半参数效率理论。"Pseudo-empirical likelihood methods for causal inference" 运用伪经验似然处理 ATE,给出双重稳健估计量及非标准 Wilks 定理,方法与 TMLE 同属因果效率框架。"Instrumental variable estimation of the proportional hazards model by presmoothing" 通过预平滑将离散 IV 非参数估计转化为代理数据,再套用偏似然,其正交化技巧可视为半参数效率的变体。"Bayesian variable selection on structured logistic-normal mixture models for subgroup analysis" 采用 spike-and-slab 先验同时筛选预后和效应修饰变量,证明高维稀疏下的变量选择一致性,将贝叶斯方法与亚组因果推断结合。

高维统计与变量选择主线以三种路径展开:一是无惩罚方法,如"Penalty free variable selection for high-dimensional linear models" 用 OLS 筛选后以 GIC 确定规模,计算成本线性化且证明模型选择一致性;二是复杂度分析,"Understanding best subset selection" 揭示残差化信号与虚假投影复杂度在 margin 条件中的基础角色;三是稳健视角,"High-dimensional outlier detection and variable selection via adaptive weighted mean regression" 在 Huber 损失框架下同时实现异常值检测与稀疏估计,并对重尾异方差有理论保证。随机矩阵方面,"Inference on testing the number of spikes in a generalized spiked Fisher matrix" 用部分线性谱统计量实现尖峰数量检验,可服务于高维线性回归的变量选择。"Estimation of leading multi-block canonical correlation directions via ℓ1-norm constrained proximal gradient descent" 给出 ℓ1 约束下的最优收敛率,填补稀疏 CCA 方法理论空白。假设检验主线中,"A shrinkage likelihood ratio test for high-dimensional subgroup analysis" 在零假设下收缩未识别参数,得到简单卡方渐近分布,解决了不规则和非高维限制问题;"Two-sample smooth test for the equality of distributions for dependent data" 证明多种依赖结构下的分布无关性并提供 bootstrap 一致性;"Two-sample inference for sparse functional data" 在不假设同质协方差下比较函数型均值,弱收敛证明独立于 FPC 方法。

与因果推断、半参数效率方向最贴的论文:因果推断四篇,尤其是涉及 multiply robust 估计与半参数效率界的那两篇;"Understanding best subset selection" 和 "Exact variable selection in sparse nonparametric models"(给出 Hamming 风险下 minimax 最优精确选择)适合关注高维变量的读者。

因果推断 (causal_inference, 4 篇)

1. 10.1214/25-ejs2377 · arXiv — Sensitivity analysis for constructing optimal regimes in the presence of treatment non-compliance and two active treatments

  • 作者: Cuong T. Pham, Kevin G. Lynch, James R. McKay, Ashkan Ertefaie
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在 two active treatments 和 non-compliance 的设定下,传统 IV 方法因二元工具变量无法识别平均因果效应而失效,本文提出 sensitivity analysis 框架来识别最优治疗策略及对应的 value function。核心贡献是将最优策略和 value function 表达为 sensitivity 参数向量的函数,并推导出目标参数的 canonical gradient(有效影响函数)。基于此,作者提出 multiply robust 的分类型估计器,该估计器在部分 nuisance model 误设时仍保持一致性。模拟研究展示了方法的实用性,并应用于酒精和可卡因依赖的随机试验数据。对您有用之处:这是 sensitivity analysis 与 optimal treatment regime 的交叉工作,涉及 semiparametric efficiency 理论和 multiply robust 估计。
  • 关键技术: instrumental variable, sensitivity analysis, canonical gradient, multiply robust estimation, optimal treatment regime, classification-based estimator
  • 为什么对您有用: 直接连接到 causal inference 中的 sensitivity analysis 和 IV 方法,同时涉及 semiparametric efficiency theory(canonical gradient 推导)和 multiply robust 估计器设计。您在 estimation theory in causal inference 方面的 very_familiar 武器可以直接用来审视其 efficiency bound 推导和 multiply robust 性质;moderately_familiar 的 semiparametric theory 和 identification theory 可帮助理解其 sensitivity parameter 的 identification 策略。立即可做:用您熟悉的 semiparametric efficiency 工具验证其 canonical gradient 推导,或探索该 sensitivity framework 在其他 IV 设定下的推广。

2. 10.1214/24-ejs2338 · arXiv — Pseudo-empirical likelihood methods for causal inference

  • 作者: Jingyue Huang, Changbao Wu, Leilei Zeng
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文在因果推断框架下研究 ATE 的伪经验似然推断方法,假设无混杂性及正确的倾向得分或结局回归模型设定。提出两种方法:第一种基于估计倾向得分构造 PEL 函数,所得最大 PEL 估计量等价于逆概率加权(IPW)估计量,重点推导 PEL ratio 统计量的渐近分布及其非标准 Wilks 定理形式;第二种通过 model-calibration 约束纳入结局回归模型,所得估计量具有双重稳健性,并建立相应 PEL ratio 统计量的渐近理论。为避免渐近分布中难以计算的 scaling constant,提出 bootstrap 方法构造置信区间。模拟研究比较了所提方法与现有 DR / TMLE 方法的有限样本表现。对您而言,这是将经典经验似然工具与因果推断 DR 理论结合的案例,可作为 semiparametric efficiency 理论的应用参考。
  • 关键技术: pseudo-empirical likelihood, doubly robust estimation, inverse probability weighting, model-calibration constraints, empirical likelihood ratio statistic, bootstrap confidence intervals
  • 为什么对您有用: 直接连接因果推断中的 ATE 估计与双重稳健推断,属于您 primary interest 中 estimation theory in causal inference 的范畴。技术武器库中的 semiparametric theory 和 M-estimation theory 足以完全覆盖本文的理论推导,属于立即可做的阅读材料。本文的价值在于展示经验似然这一经典工具如何与 DR 估计结合,可能启发您在其他因果推断问题(如 longitudinal / mediation)中使用类似的 likelihood-based 推断框架。

3. 10.1214/25-ejs2346 · arXiv — Instrumental variable estimation of the proportional hazards model by presmoothing

  • 作者: Lorenzo Tedesco, Jad Beyhum, Ingrid Van Keilegom
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文在工具变量(IV)框架下估计比例风险模型,其中工具和内生变量均为离散,可通过秩不变假设将模型重新表述为半参数IV分位数回归模型。为克服条件矩条件直接估计带来的非凸和不光滑目标函数,作者提出一种预平滑(presmoothing)方法:先对模型进行非参数估计,在单侧不依从随机实验这一重要特例中该非参数估计有闭式解;然后利用非参数估计生成“代理”观测值使得外生性成立;最后对代理数据应用标准偏似然估计。方法允许右随机删失,并证明了估计量的渐近正态性。模拟和伊利诺伊州失业激励实验的实证应用验证了方法的有限样本表现。该工作将IV方法与半参数生存分析结合,其预平滑思路可视为一种正交化技巧,与您熟悉的非参数统计和因果推断IV领域直接相关。
  • 关键技术: Instrumental variable, Proportional hazards model, Presmoothing, Rank invariance, Semiparametric quantile regression, Nonparametric estimation
  • 为什么对您有用: 本文聚焦于因果推断中的工具变量方法,并拓展到半参数比例风险模型,与您对IV和半参数理论的兴趣高度一致。预平滑的核心是先用非参数估计解除内生性,这可以运用您非常熟悉的非参数统计和因果推断估计理论来理解甚至优化;您现有的武器库(非参数统计、因果推断估计理论)足以支撑对本文方法的深入分析,属于立即可做的阅读。

4. 10.1214/25-ejs2403 — Bayesian variable selection on structured logistic-normal mixture models for subgroup analysis

  • 作者: Ruqian Zhang, Naveen N. Narisetty, Xuming He, Juan Shen
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Fudan University · Washington University in St. Louis
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究高维协变量下亚组分析中的异质性处理效应识别问题。现有方法大多假设低维变量,而本文提出一种结构化逻辑斯蒂正态混合模型,结合贝叶斯变量选择(spike-and-slab先验)来同时筛选预测变量(prognostic)和效应修饰变量(predictive)。模型将两个成分的混合比例与协变量通过逻辑斯蒂回归连接,并允许各成分内对预测变量进行不同的系数约束。理论部分证明了变量选择一致性和后验收缩率,给出了在稀疏高维设定下的有限样本保证。模拟实验验证了方法在变量选择和效应估计上的表现。最后应用于国家支持工作(NSW)和艾滋病临床试验组320(ACTG 320)真实数据集,识别出与差异化治疗效果相关的协变量。该方法为因果推断中的亚组分析提供了高维贝叶斯工具,其变量选择一致性理论对您的高维统计兴趣具有参考价值。
  • 关键技术: spike-and-slab prior, variable selection consistency, posterior contraction, structured logistic-normal mixture, subgroup analysis, high-dimensional variable selection
  • 为什么对您有用: 该文直接对接到您在因果推断中关心的亚组异质性处理效应识别问题,且在高维变量选择这一具体方向与您的高维统计兴趣重叠。您的中等熟悉武器库中的identification theory可用于审视其模型假设(如两个成分的可解释性),而非常熟悉的高维渐近工具可用于验证其变量选择一致性证明的紧致性。总体而言,本文是一篇方法学论文,可读性中等,立即可做的是用您已有的最小最大界技术评估其后验收缩率是否最优。

高维统计 / 随机矩阵 (high_dim_rmt, 5 篇)

1. 10.1214/25-ejs2362 · arXiv — Inference on testing the number of spikes in a high-dimensional generalized spiked Fisher matrix

  • 作者: Rui Wang, Dandan Jiang
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 本文研究高维广义尖峰Fisher矩阵中尖峰数量的检验问题,放宽了传统的高斯总体假设和对角协方差约束。方法基于部分线性谱统计量构造检验统计量,并建立了该统计量在原假设下的中心极限定理。该检验可应用于高维线性回归的变量选择和变化点检测两大统计问题。模拟和实证分析表明方法在各种场景下表现良好。本文的工作推进了随机矩阵理论在高维推断中的应用,为无高斯假设下的尖峰模型检验提供了可操作的框架。对于您的研究,该论文直接关联到高维统计和随机矩阵理论,其技术(部分线性谱统计量)与您熟悉的高维渐近性相契合,值得细读。
  • 关键技术: spiked Fisher matrix, partial linear spectral statistics, central limit theorem, high-dimensional inference, random matrix theory
  • 为什么对您有用: 本文核心是高维随机矩阵理论中的尖峰模型检验,直接命中您的primary兴趣“高维统计(随机矩阵理论)”和“假设检验”。您熟悉的very_familiar工具“高维渐近理论”可直接用于理解其CLT推导。此外,该方法放宽了高斯假设,提高了实用性,可启发您在高维因果推断或计量经济学中处理类似检验问题。属于立即可读的重要文献。

2. 10.1214/25-ejs2399 — Penalty free variable selection for high-dimensional linear models

  • 作者: Tonglin Zhang
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Purdue University West Lafayette
  • 分类: vol 19 · issue 1
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在高维线性模型设定下,目标是实现变量选择的一致性,传统方法依赖 penalized least squares。本文提出一种无惩罚的两步方法:第一步基于给定模型规模用 OLS 筛选变量,第二步用广义信息准则 (GIC) 估计真实模型规模。理论分析表明该方法计算复杂度为线性,且在较弱的正则条件下可证明 model selection consistency。数值模拟显示该方法在多种设定下优于 LASSO 等惩罚方法。对您研究高维统计中的变量选择理论有参考价值。
  • 关键技术: ordinary least squares, generalized information criterion, model selection consistency, high-dimensional linear models, computational complexity
  • 为什么对您有用: 连接到您 primary interest 中的高维统计方向,涉及 model selection consistency 的理论分析。您武器库中的 minimax bounds 和 high-dimensional asymptotics 可用于审视该方法声称的优越性是否理论上紧。中期可做:需先在 moderately_familiar 的 M-estimation theory 上确认其正则条件与现有 penalized 方法的比较,判断理论贡献的边际增量。

3. 10.1214/25-ejs2351 — Estimation of leading multi-block canonical correlation directions via ℓ1-norm constrained proximal gradient descent

  • 作者: Leying Guan
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Yale University
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究多块典型相关分析(mCCA)的估计问题,目标是在多组高维数据中提取解释共变的前导线性组合。将mCCA表述为广义特征值问题,并提出基于ℓ1范数约束的近端梯度下降算法来估计前导mCCA方向。区别于固定约束值,作者引入一个随迭代衰减的约束序列,并在适当假设下证明该估计量达到最优收敛速率。此前仅有ℓ0约束形式达到过此类最优性,而广泛使用的ℓ1约束缺乏相应理论保证,本文填补了这一空白。还给出了用于顺序估计多个方向的简单消去步骤。在仿真和TCGA癌症数据集上,所提方法优于R中已有的多种mCCA算法。对您而言,本文的高维稀疏降维问题与您的随机矩阵理论和高维渐近兴趣直接相关,且优化策略可用于其他高维特征分解问题。
  • 关键技术: ℓ1-constrained proximal gradient descent, multi-block CCA, generalized eigenvalue problem, decaying constraint sequence, rate-optimal estimation, deflation procedure
  • 为什么对您有用: 连接至 primary 中 high-dimensional statistics (Random matrix theory) 的高维降维问题,以及 statistical computing 中的优化算法。您的技术库中 very_familiar 的 high-dimensional asymptotics 可直接用于检验其速率上界的紧性。立即可做:您对高维渐近分析非常熟悉,可以复现或扩展其证明思路(如不同约束或非高斯噪声)。

4. 10.1214/25-ejs2388 · arXiv — Understanding best subset selection: A tale of two c(omplex)ities

  • 作者: Saptarshi Roy, Ambuj Tewari, Ziwei Zhu
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 本文在高维稀疏线性回归框架下研究最优子集选择(BSS)的模型一致性。已有研究表明BSS的模型选择性能依赖于一种称为identifiability margin的度量,该度量刻画了一般相关结构下的模型区分力。本文进一步揭示:残差化信号(residualized signals,即与真实活跃特征正交的信号部分)的复杂度和虚假投影(spurious projections,即与无关特征关联的投影算子)的复杂度,同样在刻画模型一致性的margin条件中起基础作用。作者建立了仅依赖于identifiability margin和这两个复杂度度量的必要且充分的margin条件,并部分将充分性结果推广到高维稀疏广义线性模型(GLM)。理论贡献在于将模型一致性的充要条件归结为三个可解释的量,从而深化了对BSS统计性质的理解。对您而言,该工作为高维稀疏回归的模型选择提供了精确的充要条件,可直接用您熟悉的高维渐近理论框架进行验证和拓展。
  • 关键技术: best subset selection, identifiability margin, complexity of residualized signals, spurious projections, margin condition for model consistency, high-dimensional sparse GLM
  • 为什么对您有用: 该论文属于高维统计中稀疏线性回归模型选择的理论刻画,与您的高维统计兴趣直接吻合。您武器库中的'high-dimensional asymptotics'(very familiar)可用于验证其margin条件的渐近行为,并进一步探索与其他模型选择方法(如LASSO)的比较。粗判为立即可做:您已有的非参数统计和极小极大界工具能直接解读其定理的统计含义。

5. 10.1214/25-ejs2394 · arXiv — High-dimensional outlier detection and variable selection via adaptive weighted mean regression

  • 作者: Jiaqi Li, Linglong Kong, Bei Jiang, Wei Tu
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究高维线性模型中同时进行异常值检测与变量选择的问题。设定为响应变量和协变量均可能含有异常值,且误差分布可能重尾或异方差。方法采用自适应加权均值回归,结合自适应Huber损失函数,通过惩罚似然框架同时估计回归系数和异常值指示变量。理论方面证明了异常值检测一致性、高维oracle不等式、有限样本崩溃点和光滑影响函数等稳健性质。模拟研究表明该方法在变量选择和异常值检测上优于现有基于均值漂移模型的方法,并在乳腺癌生存数据上展示了实用价值。该工作连接了高维统计中的稳健估计和变量选择,您可借鉴其Huber损失的正则化思路,在因果推断中处理高维协变量含异常值的场景。
  • 关键技术: Adaptive Huber loss, weighted mean regression, penalized regression, oracle inequality, breakdown point, influence function
  • 为什么对您有用: 该方法直接对应您 primary interest 中的高维统计问题。您熟悉的 high-dimensional asymptotics 可以用于检验其 oracle inequality 的紧性;您也可考虑将该稳健框架迁移到您 causal inference 工作中,处理协变量或潜在结果中的异常值。当前无需补充新工具即可着手复现或扩展该方法,属于立即可做的方向。

非参数 / 半参数 (nonparam_semipara, 9 篇)

1. 10.1214/25-ejs2374 · arXiv — Exact variable selection in sparse nonparametric models

  • 作者: Natalia Stepanova, Marie Turcicova
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在高斯白噪声模型下研究稀疏非参数回归中的自适应变量选择问题。回归函数假定为 d 个 k 维函数之和(k 固定或缓慢增长),其中只有少数非零,d 随噪声水平趋于零而发散。提出一种自适应选择过程,在一定的稀疏性和正则性条件下能够精确识别所有非零 k 维分量。同时建立了信息论下界,证明当信号强度低于某个阈值时不可能精确识别,从而说明所提过程在 Hamming 风险下是渐近 minimax 最优的。该结果将经典线性模型下的变量选择最优性推广到了非参数加性结构,提供了高维非参数设定下可识别性与算法最优性的清晰刻画。对您的主要兴趣方向——非参数理论与高维统计——有直接关联,特别是其中 minimax 下界分析技术可以与您熟悉的非参 minimax 工具箱衔接。
  • 关键技术: adaptive variable selection, sparse additive nonparametric model, minimax Hamming risk, exact recovery threshold, information-theoretic lower bound
  • 为什么对您有用: 本文属于非参数变量选择与高维渐近最优性交叉领域,直接关联您 primary interest 中的非参数统计与高维渐近理论。您熟悉的 minimax 下界和非参数风险分析技术可用来评估该方法是否可推广到其他损失函数(如预测风险),属于中期可做的工作——需先熟悉本文的自适应阈值构造(moderately_familiar 中的非参估计理论可支撑)。

2. 10.1214/25-ejs2370 — Modeling sparsity with super heavy-tailed priors

  • 作者: Zihan Zhu, Xueying Tang
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Case Western Reserve University · University of Arizona
  • 分类: vol 19 · issue 1
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文研究高维正常均值估计中的稀疏参数建模。贝叶斯框架下常用尖峰-平板先验或全局-局部收缩先验,后者通常表示为正态的尺度混合,边际分布为多项式尾部。本文提出超级重尾先验类(如 log Cauchy 先验),其尾部阶数可任意接近1但仍是正常分布(proper)。后验均值表现为收缩估计,且后验收缩率达到尖锐的 minimax 最优率。通过模拟和真实数据展示了该先验的实证性能。该工作为贝叶斯稀疏估计提供了一种新的重尾先验构造,对您而言,可直接将 minimax 率分析工具应用于验证其最优性的紧度,并可能将此类先验推广到非参数回归或因果推断中的高维混杂控制问题。
  • 关键技术: super heavy-tailed priors, log Cauchy prior, posterior contraction rate, minimax optimality, shrinkage estimation, scale mixture of normals
  • 为什么对您有用: 本文直接涉及您的高维统计兴趣(稀疏参数估计中的 minimax 最优率)。您武器库中的 minimax 界工具可快速验证文中声称的最优率是否为紧界。将此先验思想迁移到因果推断中的高维混杂控制属中期可做(需加强贝叶斯非参数方法的熟悉度)。

3. 10.1214/25-ejs2367 · arXiv — On the tightness of graph-based statistics

  • 作者: Lynna Chu, Hao Chen
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 本文研究基于图的随机过程在 Skorokhod 空间 \(D[0+\epsilon, 1-\epsilon]\) 上的紧致性(tightness),这是证明 graph-based test statistics 弱收敛到极限分布的关键步骤。经典紧致性刻画在此设定下因图结构的依赖性而难以处理,作者另辟蹊径,通过研究检验统计量的高阶矩行为来建立紧致性。核心贡献是在关于图的温和条件下,通过获得图基统计量高阶矩的显式上界来建立随机过程的紧致性,并给出了这些矩的解析表达式。结果适用于一般图结构,包括边数可高于样本量阶数的稠密图。对您有用之处在于:高阶矩的显式计算与 higher-order U-statistics 理论有自然连接,且紧致性证明技巧可迁移至其他非参数检验问题。
  • 关键技术: tightness of stochastic processes, higher moments bounds, graph-based test statistics, similarity graphs, Skorokhod space, weak convergence
  • 为什么对您有用: 本文属于非参数假设检验的理论工作,核心是 graph-based test statistics 的渐近理论。您武器库中 'theory of higher-order U-statistics' 可直接用于分析这些 graph-based statistics 的矩结构——graph-based statistics 本质上是样本点之间相似性度量的 U-statistics 或其变体。立即可做:用您熟悉的 higher-order U-statistics 矩计算技术验证作者给出的矩界是否紧,或推广到其他图结构。

4. 10.1214/25-ejs2373 · arXiv — Stein’s method of moments for truncated multivariate distributions

  • 作者: Adrian Fischer, Robert E. Gaunt, Yvik Swan
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在截断多元分布的参数估计问题中,目标是估计截断多元正态及独立乘积分布的参数,假设 i.i.d. 样本且截断区域已知。本文利用 Stein 特征刻画推导出新的矩类型估计量,通过构造 Stein 方程的解将参数与可观测矩条件联系起来,避免了 MLE 的数值优化困难。证明了估计量具有相合性与渐近正态性,给出了显式的渐近协方差矩阵表达式。模拟实验显示该方法与 MLE 和 score matching 相比具有竞争力,且计算上更为简便。对您在 semiparametric theory 和 M-estimation 方面的兴趣有直接参考价值。
  • 关键技术: Stein's method, method of moments, truncated multivariate normal, asymptotic normality, score matching comparison
  • 为什么对您有用: 连接到 semiparametric theory 和 M-estimation theory 这两个 moderately_familiar 方向——本文展示了如何用 Stein 方法构造显式估计量并推导渐近性质,这是 M-estimation 理论的一个非标准应用。用您 very_familiar 的 minimax bounds 和 estimation theory 可以进一步分析这些矩估计量在截断设定下的效率性质,判断是否达到 semiparametric efficiency bound。中期可做:需先在 semiparametric efficiency theory 上加强,才能深入分析这些估计量的效率最优性问题。

5. 10.1214/25-ejs2389 · arXiv — Bayesian one- and two-sided inference on the local effective dimension

  • 作者: Eduard Belitser
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在无限维信号模型(Gaussian sequence model / inverse problem)下,本文引入 local effective dimension 的概念,研究其在噪声观测下的识别与推断问题。核心问题是:基于噪声数据恢复信号的有效维度,这可关联到自适应量化、有损数据压缩和 oracle 估计。采用 Bayes 方法构造 posterior,然后研究其 frequentist 性质(覆盖概率、收缩率),同时给出纯 frequentist 版本的结果。主要理论贡献是证明 one-sided inference(置信下界)可以保证,但 two-sided inference(双侧置信区间)在一般情况下不可行,并给出 two-sided inference 成立的最小条件。最后将结果联系到 Sobolev 光滑阶估计的经典问题。对您在 semiparametric theory 和 minimax bounds 方面的兴趣有直接参考价值。
  • 关键技术: Bayesian nonparametrics, frequentist coverage, minimax lower bounds, Gaussian sequence model, adaptive inference, Sobolev spaces
  • 为什么对您有用: 本文涉及 semiparametric inference 中的 identifiability 和 minimax 界问题,属于您 primary interest 中 semiparametric theory 的核心议题。您可以用 very_familiar 的 minimax bounds 工具验证文中声称的 lower bound 是否紧,用 moderately_familiar 的 semiparametric theory 分析其 one-sided vs two-sided inference 的本质差异。中期可做:需先在 moderately_familiar 的 semiparametric theory 上加深(特别是 adaptive inference 的 impossibility 结果),然后可以研究该框架在 high-dimensional setting 下的推广。

6. 10.1214/25-ejs2358 · arXiv — On factor copula-based mixed regression models

  • 作者: Pavel Krupskii, Bouchra R Nasri, Bruno N Rémillard
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在聚类数据框架下,目标是估计响应变量在给定协变量和潜在公共因子时的条件分布,关键假设是因子 copula 结构与参数边际分布。方法核心是两阶段估计:先估计边际参数,再通过 pseudo-likelihood 估计 copula 参数,建立 M-estimation 理论框架。证明了估计量的渐近正态性,给出了具体的渐近方差表达式,并通过数值实验验证有限样本性质。应用于 COVID-19 疫苗犹豫多国数据,使用 R 包 CopulaGAMM 实现。对您在 semiparametric theory 和 M-estimation 方面的 moderately_familiar 知识是不错的练习素材。
  • 关键技术: factor copula, M-estimation theory, pseudo-likelihood estimation, asymptotic normality, clustered data modeling
  • 为什么对您有用: 连接到 semiparametric theory 这一 moderately_familiar 方向,具体是 M-estimation 的渐近理论推导。技术武器库中 M-estimation theory 可以直接攻这篇 paper 的理论部分,属于立即可做的范畴。但 novelty 有限——主要是将已有 M-estimation 框架应用到 factor copula 设定,理论贡献是标准化的渐近性质而非新的 estimation paradigm 或 sharper rate。

7. 10.1214/25-ejs2356 — Inference methods in time-varying linear diffusion processes

  • 作者: Yunhong Lyu, Sévérien Nkurunziza
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: University of Windsor
  • 分类: vol 19 · issue 1
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 本文研究一类具有周期均值回归水平的非齐次扩散过程,目标是漂移参数的估计与假设检验问题。作者证明了过程的遍历性,推导了无约束极大似然估计(UMLE)和约束极大似然估计(RMLE),并建立二者的联合渐近正态性。基于此,构造了收缩估计量(shrinkage estimators)用于整合先验约束信息,并提出了检验约束有效性的统计量及其渐近功效分析。理论部分给出了各估计量的相对效率比较,模拟与金融市场数据应用验证了方法的有效性。对您而言,本文提供了扩散过程参数推断的完整渐近理论框架,可作为 semiparametric efficiency 理论在连续时间随机过程设定中的参考案例。
  • 关键技术: maximum likelihood estimation, asymptotic normality, shrinkage estimation, ergodic theory, hypothesis testing, relative efficiency analysis
  • 为什么对您有用: 本文属于 semiparametric/nonparametric 理论范畴,涉及估计量的渐近性质与效率比较,与您 primary interest 中的 efficiency theory 有一定关联。您武器库中的 semiparametric theory(moderately_familiar)可用于审视本文的渐近效率分析是否达到 semiparametric efficiency bound,但扩散过程的随机分析工具(Itô calculus、随机微分方程理论)可能超出当前武器库范围。中期可做:若想深入连续时间过程的推断理论,需先在随机微积分与扩散过程遍历理论上长肌肉;若仅关注效率理论视角,可用 minimax bounds 工具审视本文估计量的最优性问题。

8. 10.1214/24-ejs2329 — Topological K-means clustering in reproducing kernel Hilbert spaces

  • 作者: Matthew Dixon, Yuzhou Chen, Yulia R. Gel
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Illinois Institute of Technology · University of California, Riverside · U.S. National Science Foundation · Virginia Tech
  • 分类: vol 19 · issue 1
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文提出一种基于再生核希尔伯特空间(RKHS)的拓扑K-means聚类方法,核心思想是对点云的局部邻域提取持久同调特征(persistence diagram, PD),并将PD嵌入RKHS,从而在形状相似性而非欧氏距离上进行聚类。方法通过推广经验风险最小化框架实现,将拓扑特征向量化后融入K-means目标函数。理论方面,首次建立了拓扑划分的稳定性与一致性保证,并给出了RKHS中覆盖数的新上界,这些结果对统计学习理论有独立价值。实证部分在模拟和COVID-19数据上展示了优于传统欧氏聚类方法的性能。该文将拓扑数据分析与统计推断紧密结合,其覆盖数界等工具对您在非参数统计中的理论兴趣有参考价值。
  • 关键技术: persistent homology, persistence diagram, topological K-means, reproducing kernel Hilbert space, empirical risk minimization, covering number bounds
  • 为什么对您有用: (1) 本文直接连接您的非参数统计兴趣,特别是RKHS中的函数估计与聚类理论。 (2) 您的武器库中“nonparametric statistics”可以用于审视其覆盖数界是否最优,同时“minimax bounds”视角可检验聚类一致性率的紧性。 (3) 立即可做:基于您已有的非参数与高维渐近工具,可深入阅读并评估其理论结果的严谨性与泛化潜力。

9. 10.1214/24-ejs2334 — Quantile regression for interval censored data using an Enriched Laplace distribution

  • 作者: Ingrid Van Keilegom, Benjamin Deketelaere
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: KU Leuven
  • 分类: vol 19 · issue 1
  • 相关性 0/10 · novelty: new_method
  • 摘要: 本文研究线性分位数回归模型在响应变量受区间删失(interval censoring)情况下的估计问题,目标参数为分位数回归系数。核心方法是将分位数回归问题转化为极大似然问题,通过引入 Enriched Laplace 分布——一种用 Laguerre 多项式展开逼近的 Laplace 分布推广形式——来近似真实误差分布,该分布构造上保证第 τ 分位数等于零。作者证明了估计量的相合性,并通过大量模拟和毕业生起薪数据验证了有限样本表现。该方法为区间删失数据的分位数回归提供了新的似然框架,属于半参数估计范畴。
  • 关键技术: quantile regression, interval censoring, maximum likelihood estimation, Laguerre polynomial expansion, consistency theory, enriched Laplace distribution
  • 为什么对您有用: 本文涉及区间删失数据的半参数估计理论,与您 primary interest 中的 semiparametric theory 相关。技术层面,Laguerre 多项式展开逼近误差分布的思路与 sieve / series estimation 有相通之处,属于您 very_familiar 的 nonparametric statistics 武器库可覆盖范围。但本文核心贡献是方法层面的似然重构,理论深度止于相合性,未触及效率界或收敛率等您更关注的效率理论问题。follow-up 判断:立即可做——若想深入,可用 semiparametric efficiency bound 视角分析该估计量是否达到效率界,或用 minimax rate 视角审视其收敛率是否最优。

数理统计 / 假设检验 (hypothesis_testing, 4 篇)

1. 10.1214/25-ejs2379 · arXiv — A shrinkage likelihood ratio test for high-dimensional subgroup analysis with a logistic-normal mixture model

  • 作者: Shota Takeishi
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在 subgroup analysis 框架下,目标是检验是否存在具有差异处理效应的子群,核心难点在于零假设下子群分类参数不被识别的 irregularity 问题。作者提出基于 logistic-normal mixture model 的 shrinkage likelihood ratio test,通过在零假设下将高维未识别参数向零收缩来处理 irregularity。该方法在高维设定下恢复了简单的 chi-square-type 渐近分布,避免了现有方法中计算昂贵的 resampling 方法。理论贡献在于同时解决了零假设下渐近分布 intractable 和协变量维度不能过高这两个长期存在的限制。对您在假设检验理论方面的工作有直接参考价值,特别是处理 non-regular 参数和 high-dimensional asymptotics 的交叉。
  • 关键技术: shrinkage likelihood ratio test, logistic-normal mixture model, chi-square asymptotics, non-regular parameter, high-dimensional hypothesis testing, subgroup analysis
  • 为什么对您有用: 直接连接到您 primary interest 中的 hypothesis testing 和 high-dimensional statistics 交叉领域,特别是处理参数在零假设下不被识别这一经典的 non-regular 问题。您武器库中的 high-dimensional asymptotics 和 minimax bounds 工具可以直接用来审视其声称的 chi-square-type asymptotics 在高维 regime 下的适用边界——这是一个立即可做的 follow-up 方向,可以验证其 shrinkage 策略是否真正解决了 irregularity 还是只是转移了问题。

2. 10.1214/25-ejs2352 — Two-sample smooth test for the equality of distributions for dependent data and its bootstrap consistency

  • 作者: Eric Beutner
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Vrije Universiteit Amsterdam
  • 分类: vol 19 · issue 1
  • 相关性 7/10 · novelty: weaker_assumption
  • 摘要: 本文研究在依赖数据(样本间依赖、样本内依赖或两者兼有)下两样本分布相等检验的渐近理论。方法基于Beutner等人提出的平滑检验(smooth test),该检验利用正交多项式对分布进行展开,构造检验统计量。作者证明在三种依赖设定下,检验统计量的渐近分布均与边际分布无关,实现了分布无关性(distribution-free)。进一步,针对每种依赖结构,设计了相应的bootstrap方案并证明其一致性(bootstrap consistency),使得临界值可在有限样本下可靠逼近。理论结果覆盖了现有两样本检验方法(如特征函数法、经验似然、Cramér-von Mises检验)尚未处理的依赖情形,填补了空白。对您而言,本文为假设检验方向中依赖数据的双样本问题提供了严格的渐近基础,可直接与您熟悉的非参数统计工具对接,并可启发后续在高阶U统计量框架下构造依赖数据的检验。
  • 关键技术: smooth test, orthogonal polynomials, bootstrap consistency, dependent data, asymptotic distribution-free
  • 为什么对您有用: 本文直接服务于您的假设检验兴趣,尤其是依赖数据下分布等价的检验问题。您对非参数统计非常熟悉,可立即运用该领域的smooth test理论分析检验的渐近效率或推广至多重比较;同时,您在高阶U统计量上的积累(如treewidth/einsum复杂性)可用于检验统计量的计算成本分析,探索依赖数据下的快速算法。立即可做:用非参数工具复现并验证其渐近结果,或探索将smooth test与高阶U统计量结合以处理更复杂的依赖结构。

3. 10.1214/25-ejs2348 · arXiv — Two-sample inference for sparse functional data

  • 作者: Chi Zhang, Peijun Sang, Yingli Qin
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文针对稀疏且不规则采样的函数型数据,提出一种在再生核希尔伯特空间(RKHS)框架下的两样本均值函数比较检验方法。传统方法通常假设两组协方差结构同质,但在实际中难以验证;本文通过先对均值估计建立线性近似(表示为独立同分布随机元素之和),得到点态极限分布,进而证明均值估计的弱收敛性,构造检验统计量。该方法无需同质协方差假设,既不依赖功能主成分分析,也适用于观测时间随机的情景。模拟和两项实际数据应用表明,该方法在控制第一类错误上优于现有若干常规检验,且实现简单。该工作直接属于假设检验方向的方法学贡献,与您对数理统计中非参数检验和函数数据推断的兴趣高度契合。
  • 关键技术: Reproducing kernel Hilbert space (RKHS), linear approximation for mean estimator, weak convergence, two-sample test statistic, sparse functional data
  • 为什么对您有用: 本文属于假设检验和非参数推断的交叉,直接对应您primary_interests中的‘mathematical statistics & hypothesis testing’和‘semiparametric & nonparametric theory’。您武器库中‘nonparametric statistics’和‘high-dimensional asymptotics’两项very_familiar工具可直接用于理解该方法的弱收敛证明、线性近似展开及检验的渐近有效性,甚至可在类似框架下推广到更复杂的协变量调整情形(如带高维协变量的两样本检验)。该文提出的线性近似技术(i.i.d.随机元素和展开)与您熟悉的非参数M-估计渐近理论相通,立即可读并有可能转化为您其他课题中函数型效应的推断工具。

4. 10.1214/25-ejs2382 · arXiv — Bivariate change point detection in movement direction and speed

  • 作者: Solveig Plomer, Theresa Ernst, Philipp Gebhardt, Enrico Schleiff, Ralph Neininger, Gaby Schneider
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 4/10 · novelty: application
  • 摘要: 针对生物运动模式中方向与速度的突然变化,本文提出一个新的随机模型,假设运动沿线性结构且增量存在序列依赖。通过极大似然估计参数,并用移动核估计量替代经典MOSUM统计量来处理相关性。证明了差值过程的收敛性以及方差估计量的强相合性。论文提出了估计变化点的图形方法,能够区分方向变化和速度变化。该方法在根细胞质体运动数据上进行了应用验证。理论贡献在于处理序列依赖时的核估计渐近性质,但整体方法偏向应用导向。对于您而言,本文可视为假设检验中变化点检测的一个具体案例,但技术成熟度一般。
  • 关键技术: moving kernel estimator, MOSUM statistic, maximum likelihood estimation, strong consistency, change point detection
  • 为什么对您有用: 本文属于假设检验中的变化点检测问题,直接对应您 primary interest 中的“mathematical statistics (hypothesis testing)”子方向。技术武器中“nonparametric statistics”可用来分析核估计量的带宽选择,但本文的理论深度有限,不涉及您熟悉的高维或U-statistics。follow-up 方面,本文暂不可做直接复现或扩展,因为核心机器(如序列依赖下的差值过程收敛)并不在您的武器库中,且缺乏明确的开放理论问题。建议仅作为阅读材料了解生物学变化点检测的建模思路。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1214/25-ejs2363 — Auxiliary MCMC samplers for parallelisable inference in high-dimensional latent dynamical systems

  • 作者: Adrien Corenflos, Simo Särkkä
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: Aalto University
  • 分类: vol 19 · issue 1
  • 相关性 7/10 · novelty: new_method
  • 摘要: 针对高维非线性非高斯潜变量动态系统(latent dynamical systems)的后验采样问题,提出了一类辅助MCMC采样器。标准Particle Gibbs(条件序贯蒙特卡洛)在高维潜空间下性能急剧退化,而全局高斯近似方法(如扩展卡尔曼滤波)虽更稳健但引入不可忽略的偏差。本文通过将系统的人工观测作为辅助变量引入MCMC核,构造了精确的卡尔曼基采样器(exact Kalman-based sampler),并改进了Particle Gibbs算法使其在高维下仍保持性能。部分方法支持时间维度上的并行化,在GPU上达到对数级扩展。实验表明,所提方法在统计效率和计算效率上均优于现有方案。对您的价值:该工作直接连接您的主要兴趣中的“统计计算”(statistical computing),特别是高维潜在变量模型下的采样算法设计,您可利用熟悉的“软件开发和数值方法”在R或Python中复现其并行化策略。
  • 关键技术: Particle Gibbs, conditional sequential Monte Carlo, extended Kalman filter, auxiliary variables, GPU parallelization
  • 为什么对您有用: 本文属于统计计算(MCMC方法),是您主要兴趣中的明确方向。您的武器库中“软件开发”和“高维渐近”可帮助快速理解其算法实现与扩展;目前对MCMC理论(如Particle Gibbs的收敛性)不属于非常熟悉,属“中期可做”——需先补充“MCMC诊断与理论”(moderately_familiar)后才能评估其在高维因果推断设定中的可行性。总体而言,这是一篇值得细读的算法论文,可作为进入高维状态空间模型采样领域的入口。

其他 (other, 6 篇)

1. 10.1214/25-ejs2347 · arXiv — Bootstrapping networks with latent space structure

  • 作者: Keith Levin, Elizaveta Levina
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 网络数据分析的核心挑战在于通常只观测到单个网络,而非样本,因此经典bootstrap方法无法直接应用。本文在潜在空间模型(Latent Space Model)下提出两种bootstrap方案,以解决网络统计量的重抽样问题。第一种方法针对可表示为潜在位置U-统计量的网络摘要(如平均度、子图计数),通过重采样潜在位置间接生成bootstrap复制,无需构造新网络。第二种方法适用于任意网络函数,直接生成新网络样本,可用于聚类系数等非U-统计量。在随机点积图(RDPG)假设下,作者证明了两种bootstrap估计量的相合性。数值实验验证了方法在合成数据上的有效性。本文直接连接您对高阶U-统计量的兴趣,特别是U-统计量在依赖网络结构下的bootstrap一致性理论,对您在高维或因果推断中依赖数据复杂结构时的bootstrap设计具有参考价值。
  • 关键技术: U-statistics, Latent space models, Random dot product graph, Bootstrap for networks, Consistency of bootstrap
  • 为什么对您有用: 论文聚焦于网络数据中潜在位置U-统计量的bootstrap,直接对应您primary interest中的higher-order U-statistics方向。您非常熟悉U-统计量的计算(树宽/张量收缩/einsum),可以立即可用该工具分析其bootstrap方法的计算复杂度或提出基于einsum的快速实现。中期可进一步将网络bootstrap思想迁移至您的HOIF(高阶影响函数)工作,检验在弱依赖数据下bootstrap对高阶推断的覆盖精度。

2. 10.1214/25-ejs2369 — Bayesian analysis with conditionally identically distributed sequences

  • 作者: Pier Giovanni Bissiri, Stephen G. Walker
  • 期刊/来源: Electronic Journal of Statistics
  • 机构: University of Milano-Bicocca · The University of Texas at Austin
  • 分类: vol 19 · issue 1
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 该论文在贝叶斯分析框架中用条件同分布(c.i.d.)序列替代传统的可交换序列作为基础假设。作者证明,在c.i.d.假设下仍存在合理的先验和后验,且更新机制可通过预测分布实现,这依赖于Doob关于可交换情形下后验可由预测分布构造的基本结果。为具体建模预测分布并保持c.i.d.结构,论文引入copula函数族。该工作本质上是贝叶斯基础理论的推广,不涉及频率学派推断、半参数效率或高维统计等方向。对您而言,论文提供了非参数预测分布建模的一种新角度,但方法框架与您主要关注的因果推断、半参数理论及效率理论距离较远,且未涉及统计计算权衡等您熟悉的工具。
  • 关键技术: conditionally identically distributed sequences, predictive distributions, copula modeling, Doob's theorem
  • 为什么对您有用: 论文属于贝叶斯基础理论,与您主要兴趣中的非参数预测分布略有交集(copula建模预测分布),但方法学核心不在您熟悉的武器库内——您熟悉的非参数统计(minimax界、U统计量)及因果推断工具无法直接攻入该框架;且您对贝叶斯半参/非参方法尚不熟悉,故暂不可做。若您未来想拓展到贝叶斯非参数方向,本文可作为入门阅读,但目前对您的日常工作参考价值有限。

3. 10.1214/25-ejs2344 · arXiv — Mixed moving average field guided learning for spatio-temporal data

  • 作者: Imma Valentina Curato, Orkun Furat, Lorenzo Proietti, Bennet Ströh
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 3/10 · novelty: application
  • 摘要: 本文针对时空数据建模与预测问题,假设数据来自混合移动平均(Mixed Moving Average, MMA)场,这是一种灵活的模型类,但预测分布一般未知。作者提出一种理论引导的机器学习方法:利用广义贝叶斯算法生成集成预测,并基于Lipschitz预测器推导固定时间和任意时间的PAC贝叶斯界(batch learning setting)。方法强调“因果预测”(causal forecast),即利用过去信息预测未来,适用于具有短程和长程时空依赖的数据。数值实验中,采用线性预测器和来自时空Ornstein-Uhlenbeck过程的模拟数据验证方法性能。文章侧重预测不确定性量化与理论保障,但与您熟悉的因果识别、效率理论或高维统计的关联较弱。该文可作为时空统计方法的一个参考,但并非您核心兴趣的直接推进。
  • 关键技术: Mixed moving average fields, Generalized Bayesian algorithm, PAC-Bayesian bounds, Lipschitz predictors, Ensemble forecasting
  • 为什么对您有用: 本文涉及时空数据的因果预测概念,与您纵向因果推断中考虑时间顺序的思路有表面联系,但未使用您熟悉的因果识别框架(如IV、proximal CI)。武器库中'nonparametric statistics'可用于分析Lipschitz预测器的泛化界,但属于中等熟悉程度,且本文未提供超越现有理论的实质新结果。总体而言,该文与您的主要兴趣交集有限,暂不可作为立即可攻的直接入口;若您未来拓展时空因果推断,可将其作为方法背景阅读。

4. 10.1214/25-ejs2393 · arXiv — Heterogeneous extremes in the presence of random covariates and censoring

  • 作者: Martin Bladt, Christoffer Øhlenschlæger
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 本文研究含随机协变量和删失数据的条件极值估计问题。在Fréchet最大吸引域假设下,考虑一类基于乘积-极限积分的估计量。核心贡献是建立了正则变化尾族的均匀条件,使估计量的渐近行为可解析。通过将积分估计量分解为可交换和,推导出强大数律和多个中心极限定理,并获得估计量的渐近分布。模拟和两个真实数据示例验证了有限样本性能。对您而言,可交换和分解与U统计量理论基础相通,但需额外熟悉极值理论的正则变化与吸引域概念。
  • 关键技术: product-limit integrals, exchangeable sums decomposition, regular variation, Fréchet max-domain of attraction, central limit theorems
  • 为什么对您有用: 论文的可交换和分解与高阶U统计量理论直接相关,您可以用非常熟悉的高阶U统计量树宽/张量收缩视角分析该分解的计算效率。但本文涉及极值理论的正则变化和吸引域,当前武器库中缺少该背景,属于中期可做方向:需先学习极值理论的基础概念,再考虑将分解技巧迁移至高维或删失场景。

5. 10.1214/25-ejs2378 · arXiv — On minimum contrast method for multivariate spatial point processes

  • 作者: Lin Zhu, Junho Yang, Mikyoung Jun, Scott Cook
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文针对多元空间点过程,提出了基于K函数矩阵的最小对比(MC)估计方法,目标是在参数模型下实现计算高效的估计与推断。对比函数定义为迹((差别矩阵的幂)),其中差别矩阵为猜测的K函数矩阵与非参数无偏边缘修正估计量之差。在标准正则性假设下,推导了MC估计量的渐近正态性,给出了协方差矩阵的表达式。通过双变量对数高斯Cox过程和五变量乘积冲击噪声Cox过程的模拟研究验证了方法的有限样本表现。该方法在计算上比似然方法快得多,适用于复杂多变量点过程模型。尽管应用场景与您的核心兴趣(因果推断、半参理论)不同,但其中的非参数估计与渐近分析思路、以及计算效率优先的设计哲学,可能对您在高维统计或统计计算方面的广义问题有间接启发。
  • 关键技术: Minimum contrast estimation, K-function matrix, Edge-corrected estimator, Asymptotic normality, Multivariate spatial point processes, Bivariate log-Gaussian Cox process
  • 为什么对您有用: 本文聚焦空间点过程的最小对比方法,属于非参数估计与计算效率的结合,但与您的主要兴趣(因果推断、半参数效率、高维随机矩阵等)无直接交集。您武器库中‘非参数统计’和‘估计理论’可以理解其渐近论证框架,但该论文核心依赖K函数的点过程专用概念,不在您熟悉范围内。因此这条线索的follow-up价值有限:暂不可做,因为缺乏空间点过程的理论基础和实际数据背景,需要额外投入学习K函数和点过程建模才能转化为研究问题。

6. 10.1214/25-ejs2365 · arXiv — Parameter inference for hypo-elliptic diffusions under a weak design condition

  • 作者: Yuga Iguchi, Alexandros Beskos
  • 期刊/来源: Electronic Journal of Statistics
  • 分类: vol 19 · issue 1
  • 相关性 2/10 · novelty: weaker_assumption
  • 摘要: 本文针对扩散矩阵不满秩的退化扩散过程(hypo-elliptic SDE),基于离散观测数据研究参数估计问题。现有对比估计量要求观测间隔Δ_n满足Δ_n=o(n^{-1/2})的快速增加设计条件,本文将其放宽至Δ_n=o(n^{-1/p})(p≥2),这一弱化在椭圆型扩散中已有结果,但在退化情形推导显著复杂。方法上构建了基于局部时间近似或鞅的对比函数,并借助Malliavin分析等工具处理扩散的不可逆性,证明了估计量的渐近正态性。数值模拟验证了有限样本性能。该工作实质改进了高频率观测设计下的理论条件,属于参数推断中的假设放松。与研究者关注的M-估计理论和渐近分布理论有概念联系,但核心技术(退化扩散分析、Malliavin calculus)不在当前武器库内,因此短期内难以直接转化应用,可作为了解SDE推断前沿的扩展阅读。
  • 关键技术: contrast estimator, hypo-elliptic diffusion, weak design condition, asymptotic normality, Malliavin calculus
  • 为什么对您有用: 本文的弱设计条件放松与研究者 moderately_familiar 的 M-estimation 渐近理论有方法学共鸣,但核心工具(Malliavin calculus、退化扩散分析)不在武器库中,属于“暂不可做”——需先补充 SDE 推断专门背景。若有意拓展推断领域至扩散过程,本文是方法论深度的参考文献。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论