JMLR — Vol 27 · 2026-05-18¶
- 共 50 篇 · JMLR
因果推断 (causal_inference, 6 篇)¶
1. jmlr:v27/23-0535 — A causal fused lasso for interpretable heterogeneous treatment effects estimation¶
- 作者: Oscar Hernan Madrid Padilla, Yanzhen Chen, Carlos Misael Madrid Padilla, Gabriel Ruiz
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 9/10 · novelty:
new_method - 摘要: 本文研究异质性处理效应(CATE)的估计问题,在基于倾向得分或预后得分对样本排序的设定下,目标是获得可解释的分段常数型处理效应。方法首先根据得分对处理组和对照组样本进行匹配,随后沿得分排序方向应用 fused lasso 惩罚,从而自适应地划分出具有常数处理效应的子群。与预先固定子群的离散化方法不同,该估计器通过 L1 惩罚自动实现子群的数据驱动划分。理论上,在关于协变量和处理分配的较一般条件下,证明了该估计量对条件处理效应的一致性。实验表明该方法在保持子群可解释性的同时,与现有最优方法具有竞争力。对您有用:这为 CATE 估计提供了一种基于 fused lasso 的结构化惩罚视角,适合关注因果推断中可解释子群发现与半参数/非参数估计理论的您参考。
- 关键技术:
heterogeneous treatment effects,fused lasso,propensity score,prognostic score,data-adaptive subgroups,piecewise constant estimation - 为什么对您有用: 直接关联您 primary interest 中的因果推断估计(CATE),提供了一种不同于传统 DR/TMLE 的基于 fused lasso 结构化惩罚的半参数/非参数估计视角,且在子群发现上具有可解释性。
2. jmlr:v27/23-0944 — Flexible Functional Treatment Effect Estimation¶
- 作者: Jiayi Wang, Raymond K. W. Wong, Xiaoke Zhang, Kwun Chuen Gary Chan
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 8/10 · novelty:
weaker_assumption - 摘要: 本文研究函数型处理下的因果效应估计,目标泛函为函数上的函数(平均潜在结果泛函),采用灵活的 scalar-on-function 边际结构模型。提出权重修正核岭回归(WMKRR)进行估计;权重构造不依赖特定处理选择模型,而是通过直接最小化由 WMKRR 估计量分解得到的均匀平衡误差来获得。借助表示定理,将复杂的均匀平衡误差最小化转化为有限维凸优化问题,保证了计算可行性。理论上证明了在不对真实权重函数施加平滑性假设的条件下,所提 WMKRR 估计量仍可达到最优收敛速率。对您有用:将连续处理因果推断推广至函数型处理,并在非参数理论下实现了无需权重平滑假设的最优速率,对研究高维/函数型因果推断及非参数效率界具有直接参考价值。
- 关键技术:
functional treatment effect,marginal structural model,kernel ridge regression,uniform balancing error,representer theorem - 为什么对您有用: 直接连接您 primary interest 中的因果推断(连续/函数型处理估计)与非参数理论;其通过最小化平衡误差绕过倾向得分模型、且无需权重平滑假设即可达最优收敛速率的思路,对放松非参数因果推断中的正则性条件有重要启发。
3. jmlr:v27/23-1249 — Neural Network Parameter-optimization of Gaussian Pre-marginalized Directed Acyclic Graphs¶
- 作者: Mehrzad Saremi
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 8/10 · novelty:
new_method - 摘要: 在 Gaussian Bayesian network 的潜在变量因果模型中,本文首先证明现有因果图结构在边际化(marginalization)下不稳定,并提出一种新的图结构——Pre-marginalized DAG——能够忠实表示 Gaussian BN 的边际分布。核心发现是:潜在变量模型的参数优化与在相同参数空间中训练前馈神经网络之间存在对偶性(duality),从而将因果模型参数估计转化为神经网络优化问题。基于此对偶性,作者开发了利用观测分布进行参数优化的算法,并给出了 Gaussian 设定下因果效应可识别性的充分条件及一个检验可识别性的元算法。最后,文章为将该对偶性从 Gaussian 推广到其他分布族奠定了理论基础。对您有用之处在于:该工作为潜在变量因果模型的 identification 提供了新的计算视角(NN 参数空间对偶),与您关注的 proximal CI 中 negative control/潜在混杂的 identification 问题有方法论上的呼应,且算法思路可迁移至统计计算实现。
- 关键技术:
Gaussian Bayesian network marginalization,pre-marginalized DAG,neural network parameter-space duality,causal effect identifiability,feed-forward neural network optimization - 为什么对您有用: 直接关联您 primary interest 中的因果 identification 与统计计算:潜在变量因果模型的参数优化对偶性为 latent variable 设定(如 proximal CI)提供了新的可识别性检验与估计算法思路,且 NN 参数空间优化的计算框架对统计计算方向有迁移价值。
4. jmlr:v27/25-0899 — Hierarchical Causal Models¶
- 作者: Eli N. Weinstein, David M. Blei
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 8/10 · novelty:
new_theory - 摘要: 本文研究嵌套层级数据(如学校-学生、患者-细胞)下的因果识别与估计问题,通过在结构因果模型与图模型中引入内层板(inner plates)来表征嵌套数据结构。作者提出层级因果模型,并发展了推广 do-演算的图形化识别技术,证明层级数据能在非层级数据无法识别时(如仅有单元级汇总变量可用)实现因果识别。在估计策略上,文章采用层级贝叶斯模型进行推断,并通过模拟与经典“八校”数据再分析验证了方法。该工作将因果图与识别理论从扁平结构推广至层级结构,对您有用:为处理具有嵌套特征的纵向因果推断或流行病学/经济学层级数据提供了新的 identification 工具与图模型视角。
- 关键技术:
hierarchical causal models,graphical identification,do-calculus generalization,inner plates,hierarchical Bayesian estimation - 为什么对您有用: 直接扩展了因果推断的 identification 理论,针对层级/嵌套数据(与纵向因果及流行病学/经济学应用高度相关)提出了新的图模型识别准则,弥补了传统非层级设定下的识别盲区。
5. jmlr:v27/24-2207 — Boosted Control Functions: Distribution Generalization and Invariance in Confounded Models¶
- 作者: Nicola Gnecco, Jonas Peters, Sebastian Engelke, Niklas Pfister
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 8/10 · novelty:
new_theory - 摘要: 在隐藏混杂导致的分布偏移预测问题中,本文研究当结构函数非线性且不可识别时,如何定义满足强不变性(strong invariance)的可识别推断目标。设定为 SIMDG(Simultaneous Equation Models for Distribution Generalization),假设存在工具变量但混杂不可观测。核心贡献是提出 Boosted Control Function (BCF)——一个可识别的预测目标,满足所提出的强不变性概念,并在分布偏移下具有最坏情形最优性(worst-case optimal)。与传统弱不变性不同,强不变性不要求结构函数本身可识别,而是通过控制函数框架将混杂信息编码进预测量。估计方面,提出 ControlTwicing 算法,利用非参数机器学习方法两阶段估计控制函数并构建 BCF。理论上证明了 BCF 在 SIMDG 类下的不变性和最坏情形最优性;实证上在合成和真实数据上优于 ERM 及鲁棒方法。对您而言,该文将 IV/控制函数方法与因果不变性理论统一,为混杂下的分布泛化提供了新的可识别目标和理论保证,直接关联您在因果推断(IV、混杂)和半参数/非参数理论方面的兴趣。
- 关键技术:
control function approach,instrumental variables,distribution generalization,causal invariance,nonparametric two-stage estimation,worst-case optimality - 为什么对您有用: 将因果推断中 IV/控制函数方法与分布泛化/不变性理论统一,为混杂下的预测提供了可识别目标和最坏情形最优保证,直接关联您在因果推断(IV、混杂敏感性)和经济理论(计量经济学联立方程模型)方面的研究,理论框架和估计方法均可迁移。
6. jmlr:v27/23-1023 — Identifying Weight-Variant Latent Causal Models¶
- 作者: Yuhang Liu, Zhen Zhang, Dong Gong, Mingming Gong, Biwei Huang, Anton van den Hengel et al.
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10 · novelty:
new_theory - 摘要: 本文研究从观测数据中识别潜在高阶因果变量的可识别性问题,设定为潜在变量间允许瞬时因果关系的线性高斯结构方程模型,其中因果系数与噪声分布受额外观测变量(辅助变量)调制。作者系统分析了传递性、置换与尺度三种内在不可识别性,指出传递性是阻碍潜在因果变量可识别性的关键因素。为克服传递性导致的不可识别,引入权重变异条件:存在参考条件下潜在因果影响消失,此时潜在因果变量可被识别至平凡置换与尺度变换;若参考条件仅对部分变量成立,则给出部分可识别性结果。基于上述理论,提出 SuaVE(Structural caUsAl Variational autoEncoder)方法,联合学习因果表示、潜在因果结构及映射函数,合成与真实数据实验验证了可识别性与一致性。对您而言,该文的可识别性理论框架(辅助变量调制条件放松传递性不可识别)与 proximal CI 中利用 negative control 辅助变量实现 identification 的思路有结构相似性,可借鉴其辅助变量驱动的 identification 逻辑。
- 关键技术:
latent causal model identifiability,weight-variant condition,linear-Gaussian structural equation model,variational autoencoder,auxiliary variable modulation,partial identifiability - 为什么对您有用: 与您 primary interest 中 causal inference 的 identification 子方向直接相关:该文通过辅助观测变量调制条件解决潜在因果模型的不可识别性,其 identification 策略与 proximal CI 利用 negative control 辅助变量的 identification 逻辑有结构对应,可启发您思考 proximal 框架下潜在混杂的可识别性边界。
高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)¶
1. jmlr:v27/25-0458 — The Distribution of Ridgeless Least Squares Interpolators¶
- 作者: Qiyang Han, Xiaocong Xu
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 8/10 · novelty:
new_theory - 摘要: 在高维过度参数化线性回归中,本文研究 Ridgeless 最小 ℓ₂ 范数插值器的精确分布性质,设定为一般非高斯随机设计矩阵。核心方法是将该插值器的分布等价于一个相关高斯序列模型中带有正则化的 Ridge 估计器,从而在最一般的分布意义下精确量化了其隐式正则化效应。基于此分布刻画,推导出一般加权 ℓ_q 风险的完整表达式,突破了以往随机矩阵理论(RMT)仅能处理 q=2 风险的局限,且涵盖了协变量偏移等非标准设定。进一步证明,通过广义或 k 折交叉验证调节 ℓ₂ 预测风险,可同时实现样本内 ℓ₂ 风险、预测风险、估计风险以及 debiased 置信区间长度的最优性。该工作对您有用:不仅提供了高维 RMT 领域中超越传统谱分析的新分布刻画工具,其关于 debiased 置信区间最优长度的结论也直接关联到您关注的 efficiency theory 与 debiased ML 方向。
- 关键技术:
Ridgeless interpolation,Gaussian sequence model,weighted ℓ_q risk,implicit regularization,debiased confidence intervals,covariate shift - 为什么对您有用: 本文通过高维等价类刻画了 Ridgeless 插值器的分布并导出了 debiased 置信区间的最优性,直接关联您的高维统计与 RMT 兴趣,同时其 debiased 推断结果对您关注的 efficiency theory 与 debiased ML 具有理论参考价值。
2. jmlr:v27/25-0151 — Adaptive Forward Stepwise: A Method for High Sparsity Regression¶
- 作者: Ivy Zhang, Robert Tibshirani
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10 · novelty:
new_method - 摘要: 在高维稀疏回归设定下,针对 Forward Stepwise (FS) 缺乏收缩易过拟合、而 LASSO 收缩后仍选过多特征的问题,本文提出 Adaptive Forward Stepwise Regression (AFS)。AFS 通过连续插值 FS 与 LASSO,在 FS 的迭代中引入 soft-thresholding 收缩,从而在保持极高稀疏性的同时获得收缩带来的稳定性。作者证明了该方法与 boosting 的 soft-thresholding 视角存在理论联系,并可自然扩展至分类任务。模拟与真实数据表明,AFS 相较于常用稀疏方法具有更低的 MSE 和更少的特征选择数。对您有用:本文属于高维稀疏回归的算法创新,可为您的高维统计与统计计算兴趣提供新的稀疏建模基线与算法思路,但缺乏 RMT 或渐近效率方面的理论深度。
- 关键技术:
Forward Stepwise selection,LASSO soft-thresholding,sparse regression,boosting connection,high-dimensional sparsity - 为什么对您有用: 涉及高维稀疏回归中 FS 与 LASSO 的算法改进,属于您 primary interest 中的高维统计与统计计算方向,可提供稀疏建模的新算法视角,尽管缺乏 RMT 或效率理论的深度。
3. jmlr:v27/25-2745 — Refined Risk Bounds for Unbounded Losses via Transductive Priors¶
- 作者: Jian Qian, Alexander Rakhlin, Nikita Zhivotovskiy
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
sharper_rate - 摘要: 在 transductive online learning 设定下(设计向量集合已知但顺序未知),本文研究无界损失下线性回归(平方损失)、分类(hinge 损失)和 logistic 回归的序贯预测问题,不假设设计向量有界或最优参数范数有界。核心方法是带 transductive(依赖设计全集)先验的 exponential weights 算法,结合额外聚合工具处理最优解的无界范数。分类遗憾界仅依赖参数空间维度与轮数,与设计向量及最优解范数无关——此性质在文献中此前仅对有界损失成立。对平方损失线性回归,进一步给出稀疏遗憾界,额外仅依赖响应变量幅度。关键理论贡献是将 transductive 界转化为随机设计下的统计界,无需设计分布的额外假设,这是标准 denoising 结果无法做到的。对您在高维稀疏回归中追求 sharper rate 以及统计计算中 log-concave 采样方法有直接参考价值。
- 关键技术:
exponential weights with transductive priors,online-to-batch conversion,sparsity regret bounds,log-concave sampling,aggregation for unbounded norms - 为什么对您有用: 直接推进高维稀疏回归的 sharper rate 理论(分类遗憾界与设计/范数无关),且算法端提供 log-concave 采样的多项式时间近似,对您的高维统计与统计计算两个 primary interest 均有方法论迁移价值。
非参数 / 半参数 (nonparam_semipara, 12 篇)¶
1. jmlr:v27/22-1436 — Decorrelated Local Linear Estimator: Inference for Non-linear Effects in High-dimensional Additive Models¶
- 作者: Zijian Guo, Wei Yuan, Cunhui Zhang
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 9/10 · novelty:
new_method - 摘要: 在高维可加模型设定下,本文研究函数导数的统计推断(置信区间与假设检验),旨在识别非线性的处理效应。提出了一种新的 decorrelated local linear estimator,其核心创新在于构造去相关权重,以消除高维 nuisance 函数估计误差对目标参数推断的影响。理论上证明了该估计量的渐近正态性,从而实现了 $n^{-1/2}$-CAN 的推断。基于此渐近分布,本文构建了函数导数的置信区间并开展了相应的假设检验。模拟与 motif regression 实例验证了方法的有限样本表现。对您有用:该去相关权重构造与 semiparametric efficiency/debiased ML 的正交化思路一脉相承,直接推进了高维非参数设定下的假设检验与推断理论。
- 关键技术:
decorrelated local linear estimator,high-dimensional additive model,nuisance decorrelation,asymptotic normality,inference for function derivative - 为什么对您有用: 直接连接您的高维统计推断与 semiparametric/debiased ML 兴趣:decorrelation 权重构造本质上是高维非参数设定下的 orthogonal score/debiasing 操作,为高维可加模型的假设检验提供了完整的推断框架。
2. jmlr:v27/23-0425 — Error Analysis for Deep ReLU Feedforward Density-Ratio Estimation with Bregman Divergence¶
- 作者: Siming Zheng, Guohao Shen, Yuanyuan Lin, Jian Huang
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究在 Bregman 散度下使用深度 ReLU 前馈神经网络进行密度比估计(BDD)的理论性质,目标是密度比函数及其泛函(如 KL 散度)。作者建立了 BDD 估计量的非渐近误差界,在数据分布具有有限支撑时达到极小极大最优(至多相差对数因子)。通过数据分割与密度比收敛结果,提出了渐近正态的 KL 散度估计量,并将理论扩展至无界支撑与无界密度比情形。当数据分布在近似低维流形上时,BDD 估计量可缓解维数灾难;同时将结果应用于伸缩密度比估计量,给出了其优于单比估计量的充分条件。对您有用:该文提供了深度非参数估计的极小极大收敛率与 n^{-1/2}-CAN 结果,直接关联您在半参数/非参数理论与效率理论方面的兴趣,且密度比估计是因果推断 IPW 与 proximal CI 的核心组件,理论可迁移。
- 关键技术:
density-ratio estimation,Bregman divergence,deep ReLU neural networks,minimax optimal rate,asymptotic normality,low-dimensional manifold assumption - 为什么对您有用: 直接关联半参数/非参数理论与效率理论(KL散度的渐近正态性),且密度比估计是因果推断IPW与proximal CI中处理未测量混杂的基础工具,理论结果可迁移。
3. jmlr:v27/25-0121 — Nonparametric Estimation of a Factorizable Density using Diffusion Models¶
- 作者: Hyeok Kyu Kwon, Dongha Kim, Ilsang Ohn, Minwoo Chae
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 6/10 · novelty:
new_theory - 摘要: 本文在密度可分解为低维组件(如贝叶斯网络和马尔可夫随机场)的非参数设定下,研究基于扩散模型的隐式密度估计问题,以缓解高维推断的维数灾难。作者将扩散模型视为隐式非参数密度估计器,并设计了一种稀疏权值共享神经网络架构来构建估计器。在合适的正则性假设下,证明了该估计器能够自适应于密度的因子化结构,并在全变差距离下达到极小极大最优收敛速率。理论结果揭示了扩散模型在实际中规避维数灾难的统计学机制,即通过利用数据的低维结构。对您有用:该文将深度生成模型严格纳入非参数理论框架,其极小极大最优速率证明和稀疏网络架构设计,对您在非参数理论及统计计算方向的研究(特别是高维结构自适应与算法理论化)具有直接参考价值。
- 关键技术:
diffusion models,nonparametric density estimation,factorizable density,minimax optimal rate,total variation distance,sparse weight-sharing neural network - 为什么对您有用: 该文将扩散模型严格纳入非参数密度估计理论框架并证明极小极大最优速率,直接契合您在非参数理论及统计计算方向的兴趣;其利用低维结构规避维数灾难的思路,对高维推断和算法理论化有借鉴意义。
4. jmlr:v27/23-0958 — Bayesian Inference of Contextual Bandit Policies via Empirical Likelihood¶
- 作者: Jiangrong Ouyang, Mingming Gong, Howard Bondell
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 6/10 · novelty:
new_method - 摘要: 在 contextual bandit 的 off-policy 评估设定下,本文旨在对多个策略的价值进行有限样本下的联合推断。核心方法是将经验似然(Empirical Likelihood, EL)引入贝叶斯推断框架,利用 EL 的非参数似然性质构建策略价值的后验分布。该方法无需指定误差分布,在小样本下对策略价值评估和策略比较提供了稳健的不确定性量化,并继承了 EL 在约束估计下的渐近有效性。理论与模拟表明,相较于常规渐近正态近似,该方法在有限样本下校准更好;实证应用于青少年 BMI 数据集。经验似然是半参数理论的经典工具,本文将其与贝叶斯推断结合用于策略评估,对您在半参数效率与因果推断(off-policy evaluation)交叉领域的方法论拓展有直接参考价值。
- 关键技术:
empirical likelihood,Bayesian inference,off-policy evaluation,contextual bandit,uncertainty quantification,semiparametric efficiency - 为什么对您有用: 经验似然是半参数理论的核心工具,本文将其用于 bandit 策略评估(因果推断 off-policy 的典型场景),对您在半参数效率与因果推断交叉方向的研究有方法论借鉴意义,且包含流行病学(BMI)数据应用。
5. jmlr:v27/25-0376 — A Data-Augmented Contrastive Learning Approach to Nonparametric Density Estimation¶
- 作者: Chenghao Li, Yuanyuan Lin
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10 · novelty:
new_method - 摘要: 在非参数密度估计问题中,基于噪声对比估计(NCE)与深度神经网络,目标是在无归一化约束下估计未知密度函数。提出 data-augmented NCE 方法,利用对比学习实现一步且免模拟的密度估计,无需对神经网络施加约束,且估计量具有一致性与渐近自动归一化性质。引入数据增强过程以缓解参考分布选择对估计的影响。建立了期望 L2 风险与期望全变距离的非渐近上界,达到 minimax 最优速率;在组合结构假设下,方法对低维结构具有内在自适应性,获得更快收敛速率。对您有用之处在于其非参数理论中的 minimax rate 与自适应性质,以及对比学习在非参数估计中的计算优势,可迁移至 semiparametric / nonparametric efficiency 与统计计算的兴趣中。
- 关键技术:
noise contrastive estimation,contrastive learning,deep neural networks,minimax optimal rate,data augmentation,compositional structure assumption - 为什么对您有用: 涉及非参数理论的 minimax 最优速率与低维结构自适应,且一步免模拟的计算优势契合统计计算兴趣,可为您在非参数/半参数效率理论及计算方法上提供新视角。
6. jmlr:v27/25-1017 — Nonlinear function-on-function regression by RKHS¶
- 作者: Peijun Sang, Bing Li
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10 · novelty:
new_theory - 摘要: 在函数对函数回归设定下,目标是估计随机函数协变量 X 对随机函数响应 Y 的非线性关系,假设非线性结构由嵌套 Hilbert 空间中的 RKHS 刻画。方法分两步:首先为 X 和 Y 构建第一层 Hilbert 空间,然后基于第一层 X 空间的内积生成正定核,构建第二层 RKHS 以捕捉非线性。估计程序允许不同个体在不同时间点观测的函数数据(irregular functional data),提升了计算适用性。理论上,建立了估计量的收敛率以及预测响应在 Hilbert 空间中的弱收敛。数值模拟和实际数据分析验证了有限样本表现。对您有用:该文将 RKHS 嵌套结构引入非参数函数回归,其收敛率与弱收敛理论对您关注的非参数理论有直接参考价值,且针对不规则观测的算法设计对统计计算有借鉴意义。
- 关键技术:
nested Hilbert spaces,reproducing kernel Hilbert space (RKHS),function-on-function regression,weak convergence in Hilbert space,irregular functional data estimation - 为什么对您有用: 直接推进您 primary interest 中的非参数理论(RKHS 收敛率与弱收敛),且针对不规则观测的估计算法对统计计算方向有借鉴价值。
7. jmlr:v27/25-0668 — Covariate-dependent Hierarchical Dirichlet Processes¶
- 作者: Huizi Zhang, Sara Wade, Natalia Bochkina
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 4/10 · novelty:
new_method - 摘要: 在多组密度估计与聚类设定下,本文提出结合层次狄利克雷过程(HDP)与依赖狄利克雷过程(DDP)的贝叶斯非参数模型,以整合协变量信息并跨组借力。模型通过核函数处理混合协变量,利用特定似然支持不同输出类型,从而刻画协变量与聚类的关系。针对不可处理的归一化权重,引入数据增广技巧构建了MCMC后验推断算法。模拟与单细胞RNA测序、钙成像数据实验表明,该方法能有效发现额外细胞子群及可解释的神经活动聚类。对您而言,此文展示了贝叶斯非参数在带协变量聚类中的计算策略,但偏向贝叶斯建模而非频率学派的半参数效率界或因果识别,方法学新颖度属模型拓展。
- 关键技术:
Hierarchical Dirichlet Process,Dependent Dirichlet Process,data augmentation,MCMC posterior inference,Bayesian nonparametric density estimation - 为什么对您有用: 涉及您 primary interest 中的非参数理论与统计计算(MCMC/数据增广),但偏向贝叶斯非参数建模而非频率学派效率理论或因果推断,可作计算技巧参考。
8. jmlr:v27/25-0746 — Nonlocal Techniques for the Analysis of Deep ReLU Neural Network Approximations¶
- 作者: Cornelia Schneider, Mario Ullrich, Jan Vybíral
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文研究深度 ReLU 神经网络对函数类的逼近能力,核心设定是 Daubechies 等人引入的分段线性函数系在 $L_2([0,1]^d)$ 中构成 Riesz 基。作者将该结果推广至多元 Sobolev 空间 $W^s([0,1]^d)$ 和 Barron 类 $\mathbb{B}^s([0,1]^d)$(光滑度 $0<s<1$),证明该函数系在这两类空间中同样是 Riesz 基。基于此非局部(nonlocal)技术,作者重新证明了深度 ReLU 网络逼近这两类函数的已有结果,避免了传统局部逼近方法,并能显式追踪隐含常数。进一步,该方法表明在 Barron 类上可以避免维数灾难(curse of dimensionality)。此外,文章还研究了仅已知函数值时神经网络对 Sobolev 和 Barron 函数的逼近精度。对您而言,Riesz 基视角与 sieve 估计理论天然对接,Barron 类上避免维数灾难的结果对高维非参数/半参数效率理论中的函数类刻画有参考价值。
- 关键技术:
Riesz basis for Sobolev and Barron spaces,nonlocal approximation via piecewise linear systems,deep ReLU neural network expressivity,curse of dimensionality avoidance in Barron classes,function value-based approximation - 为什么对您有用: Riesz 基框架为 sieve M-estimation 提供了新的函数类逼近保证,Barron 类上避免维数灾难的结果对您关注的半参数效率理论中高维 nuisance 估计的 rate 要求有直接启发。
9. jmlr:v27/23-1465 — Exploring Novel Uncertainty Quantification through Forward Intensity Function Modeling¶
- 作者: Yudong Wang, Zhi-Sheng Ye, Cheng Yong Tang
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_method - 摘要: 本文研究带有动态协变量(可为随机过程)的时间事件数据预测与不确定性量化(UQ)问题,核心设定基于前向强度函数(forward intensity function)建模。方法通过前向强度函数的新颖构造生成预测区间,规避了传统生存模型在复杂动态协变量下的计算瓶颈。理论上,作者证明了函数型参数估计量的弱收敛性(weak convergence),为 UQ 提供了严格的理论保证。计算上,该框架在大规模数据下展现出极高的计算效率。模拟与真实数据验证了方法的有效性。对您而言,文中函数型参数弱收敛的理论推导可为您在半参数理论方面的研究提供参考,且该方法可直接应用于流行病学队列研究中的生存预测与区间估计。
- 关键技术:
forward intensity function,uncertainty quantification,weak convergence of function-valued parameters,time-to-event modeling,dynamic predictors - 为什么对您有用: 文中关于函数型参数弱收敛的理论推导与您的半参数理论兴趣直接相关,且时间事件数据的UQ方法可迁移至流行病学队列研究的生存分析应用中。
10. jmlr:v27/24-1199 — Finite Neural Networks as Mixtures of Gaussian Processes: From Provable Error Bounds to Prior Selection¶
- 作者: Steven Adams, Andrea Patanè, Morteza Lahijanian, Luca Laurenti
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_theory - 摘要: 在有限宽度和深度的神经网络(NN)设定下,目标是将其输出分布近似为高斯过程混合(MGP),并给出可证明的近似误差界。核心方法利用 Wasserstein 距离衡量概率模型间的接近度,结合最优传输与 GP 工具,逐层迭代地将 NN 每层输出分布近似为 MGP。对任意 NN 和 ε>0,算法能在有限输入点集上返回与 NN 输出 ε-接近的 MGP,且误差界关于网络参数可微,从而可用于调整 NN 参数以逼近给定 GP 的泛函行为(如贝叶斯推断中的先验选择)。该工作将无限宽 NN-GP 等价性推广到有限情形并给出非渐近界,对您在非参数理论中理解 NN 与 GP 的近似关系及不确定性量化有参考价值。
- 关键技术:
Wasserstein distance,mixture of Gaussian processes,optimal transport,iterative layer-wise approximation,Bayesian prior selection,non-asymptotic error bound - 为什么对您有用: 对您 semiparametric/nonparametric theory 兴趣有间接价值:提供了有限 NN 到 GP 的非渐近近似界,可辅助理解基于 NN 的非参数估计量的不确定性量化;同时算法框架对 statistical computing 兴趣有参考意义。
11. jmlr:v27/24-2030 — Optimization and Generalization of Gradient Descent for Shallow ReLU Networks with Minimal Width¶
- 作者: Yunwen Lei, Puyu Wang, Yiming Ying, Ding-Xuan Zhou
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
sharper_rate - 摘要: 本文研究浅层 ReLU 网络上梯度下降的优化与泛化,设定为 NTK-separable 数据且 margin 为 γ,目标是获得更优的风险界。作者证明梯度下降的收敛速率为 O(1/T),且迭代点落在初始化点或参考点附近的局部球内。利用 ReLU 激活模式在这些局部球内,作者改进了 Rademacher 复杂度估计。在 polylogarithmic 宽度下,得到几乎最优的风险界 O(1/(nγ²)),优于以往 O(1/√n) 的结果。对您而言,该文将局部 Rademacher 复杂度与优化轨迹结合的技巧可为非参理论中 fast rate 的证明提供借鉴,但其深度学习理论设定与您关注的半参效率界距离较远。
- 关键技术:
Rademacher complexity,gradient descent convergence rate,NTK-separability,local ball analysis,ReLU activation pattern - 为什么对您有用: 涉及非参数泛化界的 fast rate 证明与优化算法收敛性分析,与您 primary interest 中的非参理论及统计计算(优化算法)有方法学交叉,但核心设定偏向深度学习理论而非半参效率。
12. jmlr:v27/25-1214 — Transformers Can Overcome the Curse of Dimensionality: A Theoretical Study from an Approximation Perspective¶
- 作者: Yuling Jiao, Yanming Lai, Yang Wang, Bokai Yan
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
new_theory - 摘要: 本文研究 Transformer 对 Hölder 连续函数类 $\mathcal{H}_Q^\beta([0,1]^{d\times n}, \mathbb{R}^{d\times n})$ 的逼近能力,在序列输入设定下构造了可克服维数灾难的 Transformer 结构。所构造的网络仅含一层单头 softmax self-attention 与若干前馈层:若前馈层使用 ReLU 与 floor 激活,达到精度 $\epsilon$ 仅需 $\mathcal{O}(\log 1/\epsilon)$ 层、宽度不超过 $\mathcal{O}(\epsilon^{-2/\beta}\log 1/\epsilon)$;若允许其他激活函数,宽度可进一步降至常数。核心构造基于 Kolmogorov-Arnold 叠加定理(KAT),绕开了此前工作所需的 contextual mapping 概念,证明更直观;同时提出的平移技术可将前馈网络的已有逼近结果迁移至 Transformer。该结果从逼近论角度揭示了 Transformer 在高维非参数回归中的表达力优势,对您在非参数理论与效率理论方向思考高维非参数估计的 minimax rate 与深度估计器的统计性质有参考价值。
- 关键技术:
Kolmogorov-Arnold Superposition Theorem,Hölder class approximation,curse of dimensionality,Transformer expressivity,ReLU/floor activation construction - 为什么对您有用: 虽然本文是逼近论而非统计推断,但其对 Hölder 类克服维数灾难的逼近率结果,对您在非参数理论方向理解深度估计器(如 debiased ML 中非参数 nuisance 估计)的统计收敛极限有直接借鉴意义。
效率理论 / Debiased ML (efficiency_dml, 1 篇)¶
1. jmlr:v27/23-0440 — Communication-efficient Distributed Statistical Inference for Massive Data with Heterogeneous Auxiliary Information¶
- 作者: Miaomiao Yu, Zhongfeng Jiang, Jiaxuan Li, Yong Zhou
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 6/10 · novelty:
new_method - 摘要: 在异质辅助信息(如外部汇总统计量)广泛存在的大数据场景下,研究如何结合个体水平数据与异质汇总统计量进行通信高效的分布式统计推断。通过乘积似然与置信密度(confidence density)提出整合个体数据与异质外部汇总统计量的新框架;理论上证明该方法可达到与使用全部个体数据的 IPD 估计量相当的渐近统计效率。进一步提出通信高效的分布式推断程序,其迭代算法在一般条件或广义线性模型下具有线性收敛速度。该方法在保证渐近效率的同时实现了分布式计算的通信高效性,对您在效率理论(渐近效率/IPD效率)和统计计算(分布式迭代算法与收敛性)方面的研究有直接参考价值。
- 关键技术:
distributed statistical inference,confidence density,heterogeneous summary statistics,IPD efficiency,linear convergence,communication efficiency - 为什么对您有用: 直击您的效率理论(证明达到 IPD 渐近效率)与统计计算(分布式迭代算法及线性收敛性)两个 primary interests,为分布式/隐私受限场景下的数据整合与效率边界计算提供了新方法与理论参考。
数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶
1. jmlr:v27/23-0274 — Online Detection of Changes in Moment--Based Projections: When to Retrain Deep Learners or Update Portfolios?¶
- 作者: Ansgar Steland
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_theory - 摘要: 本文研究高维非平稳时间序列下基于投影二阶矩的在线变点监测问题,旨在为深度学习网络重训练或投资组合更新提供触发机制。作者提出开环与闭环监测规则,核心基于投影部分和的Gaussian逼近,并允许投影向量被估计。针对投影向量的估计,文章分别在经典非ℓ₀稀疏与严格稀疏设定下进行了理论分析。当最优投影依赖于未知协方差矩阵时,进一步研究了硬阈值与软阈值估计量的渐近性质。理论结果在温和正则条件下证明了监测规则的渐近水平与功效,仿真与合成数据实验支持了方法的有效性。对您而言,该文将高维投影估计与序贯假设检验结合的框架,可为高维统计中的在线推断与假设检验提供理论参考。
- 关键技术:
sequential monitoring,projected partial sums,Gaussian approximation,high-dimensional time series,sparse projection estimation,hard/soft thresholding - 为什么对您有用: 本文涉及高维时间序列下的序贯假设检验(变点监测)与高维投影向量估计,直接关联您在假设检验与高维统计方面的研究兴趣,其Gaussian逼近与阈值化技术对高维推断具有参考价值。
2. jmlr:v27/24-0680 — An Anytime Algorithm for Good Arm Identification¶
- 作者: Marc Jourdan, Andrée Delahaye-Duriez, Clémence Réda
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
new_method - 摘要: 在随机多臂老虎机设定下,Good Arm Identification (GAI) 的目标是在给定阈值下识别出至少一个期望收益超过该阈值的臂。作者提出了 APGAI (Anytime Parameter-free GAI) 采样规则,这是一种无需调参的任意时间算法,可同时适用于 fixed-confidence 和 fixed-budget 设定。理论上,该算法在任意时间的错误概率上界被严格推导,证明了自适应策略在检测“好臂不存在”时比均匀采样具有更优的收敛性质。结合停止规则后,作者进一步给出了在任意置信水平下的期望采样复杂度上界。实验验证了 APGAI 在合成与真实数据上的表现,该工作为 GAI 问题提供了跨设定的统一视角。对您而言,该算法在序列假设检验与自适应采样策略上的理论界推导,可为 sequential hypothesis testing 和统计计算算法设计提供方法学借鉴。
- 关键技术:
good arm identification,anytime algorithm,stochastic bandits,sampling complexity upper bound,sequential testing - 为什么对您有用: 该论文将好臂识别视为序列假设检验问题,其自适应采样策略与采样复杂度界分析,对您在 mathematical statistics (hypothesis testing) 中的序列检验设定以及 statistical computing 中的算法设计有直接的方法学借鉴价值。
统计计算 / 算法 (stat_computing, 20 篇)¶
1. jmlr:v27/23-0737 — Efficient frequent directions algorithms for approximate decomposition of matrices and higher-order tensors¶
- 作者: Maolin Che, Yimin Wei, Hong Yan
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 6/10 · novelty:
new_method - 摘要: 在 frequent directions (FD) 框架下,本文研究矩阵和张量的低秩近似分解算法。对矩阵情形,作者将 sketching 矩阵构造为 sparse embedding (SpEmb) 与标准高斯矩阵或 SRHT 的乘积,给出两种高效 FD 变体,其理论保证依赖于高斯矩阵奇异值界及 SpEmb/SRHT 的已知谱性质。对张量情形,基于给定 Tucker-rank,提出 FD-based 随机化 T-HOSVD 与 ST-HOSVD 算法计算近似 Tucker 分解;同时给出基于 FD 的随机化 Tensor-Train (TT) 分解算法。合成与真实数据实验验证了算法在效率与精度上的优势。对您有用:该工作将随机化 sketching 与 FD 结合用于张量分解,直接关联您在 statistical computing(矩阵/张量数值算法)方面的兴趣,且理论分析中用到的高斯矩阵奇异值界与 RMT 工具可为您的高维统计与随机矩阵理论研究提供算法视角的参考。
- 关键技术:
frequent directions algorithm,randomized sketching (sparse embedding, SRHT),Tucker decomposition (T-HOSVD, ST-HOSVD),Tensor-Train decomposition,singular value bounds of Gaussian matrices - 为什么对您有用: 直接关联您 primary interest 中的 statistical computing(矩阵与张量数值算法),同时理论分析依赖高斯矩阵奇异值界,与您 high-dimensional statistics / RMT 兴趣有方法交叉,可借鉴其将 RMT 工具用于算法误差界分析的思路。
2. jmlr:v27/22-0483 — The surrogate Gibbs-posterior of a corrected stochastic MALA: Towards uncertainty quantification for neural networks¶
- 作者: Sebastian Bieringer, Gregor Kasieczka, Maximilian F. Steffen, Mathias Trabs
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10 · novelty:
new_method - 摘要: 在非参数回归模型下,本文研究基于Gibbs后验的神经网络不确定性量化问题,提出corrected stochastic MALA (csMALA)算法,通过简单修正项使surrogate后验与原始Gibbs后验的距离随全样本量n递减,同时保持对大数据集的可扩展性。csMALA克服了标准sMALA仅使用子样本导致目标分布偏移的问题。理论方面,作者证明了surrogate后验的PAC-Bayes oracle不等式;对浅层神经网络分析了credible ball的直径与覆盖性质,对深度神经网络证明了最优收缩率(optimal contraction rates)。其中可信度结果独立于修正项,同样适用于标准Gibbs后验。高维参数空间模拟验证了csMALA基于surrogate Gibbs后验的估计器在实践中确实具备上述优势。对您而言,本文将PAC-Bayes非参数理论与可扩展MCMC计算结合的框架,可为统计计算中大规模贝叶斯推断提供理论保证的思路借鉴。
- 关键技术:
corrected stochastic MALA,Gibbs posterior,PAC-Bayes oracle inequality,contraction rates for deep neural networks,credible ball coverage - 为什么对您有用: 本文连接了您的statistical computing兴趣(可扩展MCMC算法设计)与nonparametric theory兴趣(PAC-Bayes oracle不等式、深度神经网络的optimal contraction rates),展示了如何在计算方法中嵌入非参数理论保证。
3. jmlr:v27/25-0858 — LazyDINO: Fast, Scalable, and Efficiently Amortized Bayesian Inversion via Structure-Exploiting and Surrogate-Driven Measure Transport¶
- 作者: Lianghao Cao, Joshua Chen, Michael Brennan, Thomas O'Leary-Roseberry, Youssef Marzouk, Omar Ghattas
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 4/10 · novelty:
new_method - 摘要: 本文针对高维非线性贝叶斯反问题中参数到观测(PtO)映射昂贵的计算瓶颈,提出 LazyDINO——一种基于测度传输的变分推断方法。离线阶段利用 PtO 映射及其 Jacobian 的联合样本构建 derivative-informed neural surrogate,其 reduced basis 架构最小化 surrogate 后验逼近误差的期望上界;在线阶段给定观测数据后,通过结构化低维非线性传输映射(lazy map)快速逼近后验。理论证明 derivative-informed surrogate 训练最小化 surrogate-driven 变分推断的期望误差。数值实验显示,相比 conditional transport 的 amortized SBI 和传统 surrogate-driven transport,离线代价降低 1–2 个数量级;在少于 1000 次 PtO 评估下即可超越 Laplace 近似,而对比方法在 16000 次评估时仍可能失败。对您有用:该工作的 offline/online 分解策略和 derivative-informed surrogate 构建思路可迁移至统计计算中高维似然/后验的快速近似问题,且传输映射框架与 semiparametric efficiency 的 influence function 构造有深层联系。
- 关键技术:
transport map variational inference,derivative-informed neural surrogate,reduced basis architecture,lazy map (low-dimensional nonlinear transport),amortized Bayesian inversion,surrogate-driven measure transport - 为什么对您有用: 直接关联 statistical computing(高维贝叶斯反问题的快速 amortized 算法);传输映射框架与 semiparametric efficiency theory 中 influence function / 最优传输构造有方法论交叉,derivative-informed 思路可启发 debiased ML 中的 score function 近似策略。
4. jmlr:v27/23-0157 — Unsupervised Feature Selection via Nonnegative Orthogonal Constrained Regularized Minimization¶
- 作者: Yan Li, Defeng Sun, Liping Zhang
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 4/10 · novelty:
new_method - 摘要: 在高维无监督特征选择设定下,本文提出基于非负正交约束正则化最小化的新模型,将特征选择嵌入非负谱聚类并防止过拟合。为求解该非凸约束优化模型,作者发展了非精确增广拉格朗日乘子法(IALM),并采用近端交替最小化(PAM)处理子问题。理论上严格证明了算法迭代序列收敛至模型的稳定点,弥补了现有无监督特征选择方法缺乏收敛保证的不足。数值实验表明该方法在聚类指标上优于现有SOTA且具鲁棒性。对您可能有用:若关注统计计算中的非凸约束优化数值算法及收敛性分析,此文的 IALM+PAM 框架可提供方法论借鉴。
- 关键技术:
nonnegative orthogonal constraints,inexact augmented Lagrangian multiplier method,proximal alternating minimization,convergence to stationary point,unsupervised feature selection - 为什么对您有用: 涉及您 primary interest 中的统计计算(数值方法与算法),提供了非凸正交约束下 IALM+PAM 算法的严格收敛性证明,对设计高维或约束优化求解器有直接参考价值。
5. jmlr:v27/24-1057 — Extending Mean-Field Variational Inference via Entropic Regularization: Theory and Computation¶
- 作者: Bohan Wu, David M. Blei
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_method - 摘要: 本文在均值场变分推断(MFVI)框架下引入熵正则化,提出 Ξ-VI 方法,目标是在保持计算可行性的同时恢复真实后验的变量依赖结构。核心机制是将变分近似问题与熵最优传输(entropic optimal transport)建立联系,利用 Sinkhorn 算法实现多项式时间收敛,正则化参数控制似然降权程度以平衡依赖恢复与计算代价。理论上给出了 Ξ-VI 的频率渐近性质:一致性、渐近正态性、高维渐近分析以及算法稳定性,并刻画了统计精度与计算复杂度之间的 trade-off——更高精度需要更大计算量。实证表明 Ξ-VI 在依赖恢复和推断精度上优于 MFVI 和 normalizing flow 等方法。对您而言,Sinkhorn 算法的多项式收敛分析及高维渐近结果与统计计算和高维统计两个 primary interest 直接相关,频率渐近性质的推导思路也可借鉴至其他变分/优化类估计量的理论分析。
- 关键技术:
entropic optimal transport,Sinkhorn algorithm,mean-field variational inference,high-dimensional asymptotics,entropic regularization,algorithmic stability - 为什么对您有用: Sinkhorn 算法的计算复杂度分析与多项式收敛保证直接对应统计计算兴趣;高维渐近和频率性质(一致性、渐近正态)的推导可迁移至高维统计与效率理论中其他优化类估计量的分析。
6. jmlr:v27/25-0012 — Guaranteed Nonconvex Low-Rank Tensor Estimation via Scaled Gradient Descent¶
- 作者: Tong Wu
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_method - 摘要: 在 t-product 与 t-SVD 框架下,本文研究存在缺失项或稀疏噪声等破坏的低秩张量估计问题。提出缩放梯度下降算法,配合定制谱初始化直接估计张量因子。理论证明 ScaledGD 在张量鲁棒 PCA、张量补全及张量回归任务中均实现线性收敛,且收敛率独立于真实低秩张量的条件数,同时保持与普通梯度下降相同的低迭代复杂度。这是首个在 t-SVD 下可证明具有此性质的算法。对您有用:该算法为高维张量计算提供了高效的数值方法,直接契合您在统计计算(数值方法与算法)方面的兴趣,且对病态低秩估计有显著加速效果。
- 关键技术:
scaled gradient descent,tensor singular value decomposition (t-SVD),tensor-tensor product (t-product),nonconvex optimization,condition number independence,spectral initialization - 为什么对您有用: 直接契合您在统计计算(数值方法与算法)方面的兴趣,为高维张量数据提供了条件数无关的高效数值优化算法,对处理病态低秩估计问题有实际加速价值。
7. jmlr:v27/24-1139 — Simulation-based Calibration of Uncertainty Intervals under Approximate Bayesian Estimation¶
- 作者: Terrance D. Savitsky, Julie Gershunskaya
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_method - 摘要: 在 mean field variational Bayes (VB) 框架下,目标是校正因后验参数相关而导致的不确定性区间覆盖失准问题,假设近似算法在正确模型下产生一致的一阶矩估计。作者提出一种基于模拟的校准程序:先用初始模型运行得到的参数估计生成重复数据集,再在每个重复数据集上重新估计模型,利用重采样经验分布构造校准后的置信区间,渐近保证达到名义覆盖率。该方法可检测并校正近似边际后验分布的一阶和二阶矩偏差,适用于任何在正确模型下产生一致一阶矩的估计算法。Monte Carlo 模拟和 Current Employment Statistics 调查数据的应用验证了方法有效性。对您而言,该工作在统计计算与推断交叉处提供了 VB 不确定性校正的具体算法方案,可关注其 simulation-based 校准思路是否可迁移至 debiased ML 或 semiparametric 推断中的区间覆盖问题。
- 关键技术:
mean field variational Bayes,simulation-based calibration,uncertainty interval coverage,moment bias correction,parametric bootstrap - 为什么对您有用: 连接您 primary interest 中的统计计算(数值方法与算法)以及假设检验/推断中的覆盖保证问题;VB 校准思路可启发 debiased ML 或 semiparametric 推断中区间覆盖的校正方案,同时应用数据集来自经济统计调查,契合您 secondary interest 中的经济理论数据集方向。
8. jmlr:v27/25-1024 — A Common Interface for Automatic Differentiation¶
- 作者: Guillaume Dalle, Adrian Hill
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_method - 摘要: 针对科学机器学习中自定义代码的自动微分(AD)后端选择与切换困难问题,本文提出 Julia 包 DifferentiationInterface.jl。该包为十余种 AD 后端提供统一前端,支持无缝性能比较与模块化开发。其核心机制是内置的 preparation phase,通过摊还一次性计算来利用各后端特性,显著提升微分效率。该机制使稀疏性处理等高级特性对用户透明,降低了复杂计算图的实现负担。实证表明该接口在不牺牲性能的前提下提升了 AD 系统的可用性与灵活性。对您有用:直接契合您在统计计算(数值方法与算法)方向的兴趣,为高效实现复杂半参数/去偏估计量(如计算 efficient influence function 的梯度/Hessian)提供了灵活的底层计算工具。
- 关键技术:
Automatic Differentiation,Julia ecosystem,preparation mechanism,sparsity handling,modular backend interface - 为什么对您有用: 直接契合您在统计计算(数值方法与算法)方向的兴趣;在实现半参数有效估计或 debiased ML 时,常需计算复杂 efficient influence function 的梯度/Hessian,该工具可大幅简化 AD 后端的切换与稀疏优化。
9. jmlr:v27/24-0020 — Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization¶
- 作者: Yuchen Li, Laura Balzano, Deanna Needell, Hanbaek Lyu
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 3/10 · novelty:
new_theory - 摘要: 本文研究块大化-最小化(BMM)算法在约束块 Riemannian 优化中的收敛性与迭代复杂度,目标函数为非光滑非凸,各参数块约束于 Riemann 流形的子集上。核心机制是逐块最小化目标函数的 surrogate 函数,作者证明算法渐近收敛到驻点集,并在 $\tilde{O}(\epsilon^{-2})$ 次迭代内达到 $\epsilon$-驻点;当底流形为 Euclidean 或 Stiefel 流形的乘积时,复杂度假设完全 Euclidean,但证明显式利用了 Riemann 几何结构。该框架统一覆盖了 Riemannian MM、块投影梯度下降、Bures-JKO Wasserstein 变分推断、optimistic likelihood 估计、robust PCA 及 Riemannian CP 字典学习等多种算法。实验表明在 Riemannian 约束下该算法比直接套用 Euclidean 算法收敛更快。对您有用:该工作为 Stiefel 流形上的矩阵/张量计算(如 robust PCA、子空间追踪)提供了统一的迭代算法与收敛保证,可直接服务于您在统计计算与高维统计中的数值方法需求。
- 关键技术:
block majorization-minimization,Riemannian manifold optimization,Stiefel manifold constraints,iteration complexity analysis,robust PCA,Wasserstein variational inference - 为什么对您有用: 直接服务于您 primary interest 中的统计计算(数值方法与算法)方向,为 Stiefel 流形约束下的矩阵/张量优化问题提供了统一收敛框架;同时 robust PCA 与子空间追踪的应用连接到高维统计与随机矩阵理论的计算层面。
10. jmlr:v27/24-0637 — Stochastic Gradient Methods: Bias, Stability and Generalization¶
- 作者: Shuang Zeng, Yunwen Lei
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文研究有偏随机梯度方法(BSGMs,如Zeroth-order SGD与Clipped-SGD)在凸光滑设定下的算法稳定性与泛化性。作者引入了关于梯度估计与偏置的广义Lipschitz条件,建立了统一的稳定性界,量化偏置对稳定性的影响。基于此,首次为Zeroth-order SGD与Clipped-SGD推导了稳定性界,且在适当平滑/裁剪参数下与无偏SGD的界匹配。结合收敛性分析,得出这两种方法的excess risk界为$O(1/\sqrt{n})$。对您而言,本文虽侧重学习理论,但对有偏优化算法的稳定性分析可为统计计算中数值算法的鲁棒性设计提供理论依据。
- 关键技术:
algorithmic stability,biased stochastic gradient methods,Zeroth-order SGD,Clipped-SGD,excess risk bounds,generalized Lipschitz condition - 为什么对您有用: 涉及统计计算中的优化算法(SGD及有偏变体)的稳定性与收敛理论,对您在统计计算(数值方法与算法)方向的兴趣有直接参考价值,特别是有偏梯度估计的鲁棒性分析。
11. jmlr:v27/23-0946 — Generative Bayesian Inference with GANs¶
- 作者: Yuexi Wang, Veronika Rockova
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_method - 摘要: 在无显式或易处理似然的设定下,本文旨在通过结合近似贝叶斯计算(ABC)与深度生成模型来实现后验推断。提出 Bayesian GAN (B-GAN) 采样器,通过对抗优化直接逼近后验分布,利用条件 GAN 在 ABC 参考分布上学习确定性映射,使得训练后能以极低计算成本生成 iid 后验样本。为提升精度,设计了两种后处理局部修正策略:基于数据驱动提议的重要性重加权与变分贝叶斯。在理论层面,针对特定神经网络生成器与判别器,证明了真实后验与近似后验间的全变距离(TV distance)收敛至零,给出了频率学派-贝叶斯学派的收敛保证。对您可能有用:该工作的神经网络非参数收敛理论对您关注的非参数/半参数理论有参考价值,且其快速后验采样算法可迁移至复杂因果模型(如含不可观测混淆的贝叶斯因果图)的统计计算中。
- 关键技术:
approximate Bayesian computation,generative adversarial networks,adversarial variational Bayes,importance reweighting,total variation distance convergence,conditional GAN - 为什么对您有用: 本文的神经网络非参数收敛理论与快速后验采样算法直接契合您在统计计算方向的兴趣;同时,无似然推断方法在处理复杂因果模型(如隐变量因果图或 proximal CI 中的代理变量模型)的贝叶斯推断时具有潜在的方法迁移价值。
12. jmlr:v27/24-0526 — Two-way Node Popularity Model for Directed and Bipartite Networks¶
- 作者: Bing-Yi Jing, Ting Li, Jiangzhou Wang, Ya Wang
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_method - 摘要: 在有向与二分网络的社区检测问题中,针对现有方法忽略节点流行度且对边分布假设过强的问题,本文提出了 Two-Way Node Popularity Model (TNPM),允许边分布属于一般 sub-Gaussian 族。作者引入 Delete-One-Method (DOM) 进行模型拟合与社区识别,并给出了处理 sub-Gaussian 推广的严格理论分析。针对大规模网络,进一步提出了 Two-Stage Divided Cosine Algorithm (TSDC) 以提升计算效率。数值实验与实际数据应用表明该方法在估计精度与计算速度上均具优势。对您可能有用:其大规模网络算法(TSDC)及 sub-Gaussian 假设下的理论技巧,可为高维数据统计计算与矩阵估计提供方法借鉴。
- 关键技术:
sub-Gaussian distribution,community detection,Delete-One-Method (DOM),Two-Stage Divided Cosine Algorithm (TSDC),network model estimation - 为什么对您有用: 虽非核心因果或效率理论,但其针对大规模网络的 TSDC 算法及 sub-Gaussian 假设下的理论推导技巧,对您在统计计算(大规模算法)和高维估计方面的兴趣有一定参考价值。
13. jmlr:v27/24-0792 — A Symplectic Analysis of Alternating Mirror Descent¶
- 作者: Jonas E. Katona, Xiuyuan Wang, Andre Wibisono
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
sharper_rate - 摘要: 本文研究双线性零和博弈中交替镜像下降(AMD)算法的动力学行为,将其建模为连续时间哈密顿流的辛欧拉离散化。基于哈密顿动力学与辛数值积分理论,重点分析了辛欧拉方法下修正哈密顿量(MH)作为守恒量的存在性与性质。针对二次哈密顿量情形,给出了MH的闭式表达,并推导了关于步长截断阶数的MH误差界。利用该误差界,证明了AMD具有改进的 O(K^{1/5}) 总遗憾界和 O(K^{-4/5}) 平均迭代对偶间隙。最后提出了若MH满足特定收敛条件则遗憾界可达 O(K^{\varepsilon}) 的猜想。对您在统计计算(数值方法与算法)方向的兴趣有直接参考价值,展示了辛几何与向后误差分析在优化算法收敛率证明中的新应用。
- 关键技术:
symplectic Euler method,modified Hamiltonian,backward error analysis,alternating mirror descent,Hamiltonian flow - 为什么对您有用: 直接连接到您在统计计算(数值方法与算法)方面的兴趣,展示了辛数值积分与向后误差分析如何用于获得优化算法更紧的收敛率,该方法论可迁移至其他统计优化算法的理论分析。
14. jmlr:v27/25-0185 — DCatalyst: A Unified Accelerated Framework for Decentralized Optimization¶
- 作者: TIanyu Cao, Xiaokai Chen, Gesualdo Scutari
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_method - 摘要: 在无中心服务器的去中心化网络设定下,研究复合函数 f+r(f 为强凸平均损失,r 为凸正则项)的优化问题。提出 DCatalyst 统一黑盒框架,将 Nesterov 型加速注入去中心化算法:外层为非精确动量加速近端格式,内层调用任意去中心化方法。核心技术是引入“非精确估计序列”(inexact estimating sequences),推广了 Nesterov 经典估计序列以系统处理共识误差与局部子问题非精确解。理论证明该框架在广泛问题上达到最优(至多对数因子)通信与计算复杂度,填补了部分去中心化问题缺乏加速方法的空白。对您在统计计算(数值方法与算法)方向的兴趣有直接参考价值,其非精确近端与动量机制可迁移至大规模去中心化 M-估计或分布式 debiased ML 的优化求解。
- 关键技术:
decentralized optimization,Nesterov acceleration,inexact estimating sequences,proximal scheme,consensus error,communication complexity - 为什么对您有用: 虽为纯优化论文,但其去中心化加速算法框架与您 primary interest 中的统计计算(数值方法与算法)直接相关,非精确近端机制可启发分布式 debiased ML 或大规模 M-估计的优化求解设计。
15. jmlr:v27/24-0290 — Classification Under Local Differential Privacy with Model Reversal and Model Averaging¶
- 作者: Caihong Qin, Yang Bai
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
new_method - 摘要: 在局部差分隐私(LDP)设定下,研究分类问题的超额风险界与算法改进,将带噪数据到干净数据的映射重新解释为迁移学习问题。提出三种技术:基于噪声二元反馈的评估机制以估计数据集效用;模型反转(model reversal)通过反转决策边界恢复欠佳分类器的性能;模型平均(model averaging)基于估计效用对多个反转分类器赋权。理论上给出了 LDP 下的超额风险界,并证明所提方法能降低该风险;模拟与真实数据均显示分类精度显著提升。对您可能有用:虽然核心是隐私保护,但其对带噪决策边界的反转与加权机制,可为统计计算中处理扰动数据或因果推断中测量误差的校正提供算法层面的借鉴。
- 关键技术:
local differential privacy,transfer learning reinterpretation,model reversal,model averaging,excess risk bounds,noised binary feedback - 为什么对您有用: 涉及统计计算中的算法设计与带噪数据的理论风险界,其处理噪声导致的决策边界偏移的思路,对因果推断中测量误差或代理变量的估计有间接的方法论启发。
16. jmlr:v27/24-1840 — skwdro: a library for Wasserstein distributionally robust machine learning¶
- 作者: Vincent Florian, Waïss Azizian, Franck Iutzeler, Jérôme Malick
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
application - 摘要: 本文介绍了一个名为 skwdro 的 Python 库,旨在通过基于 Wasserstein 距离的分布鲁棒优化(DRO)来训练鲁棒机器学习模型。该库的核心实现依赖于对原始鲁棒目标的熵平滑(entropic smoothing)处理,以保证模型的最大灵活性;同时提供了 PyTorch 模块的封装器和与 scikit-learn 兼容的估计器,使得模型损失的鲁棒化只需极少的代码修改。作为一个开源软件贡献,它降低了 Wasserstein DRO 方法的使用门槛,但本文主要侧重于软件实现而非新的理论突破。对您在统计计算(数值方法与软件)方向的兴趣有直接参考价值,可作为快速实现鲁棒估计的计算工具。
- 关键技术:
Wasserstein distributionally robust optimization,entropic smoothing,PyTorch wrapper,scikit-learn estimator,optimal transport - 为什么对您有用: 直接对应您在统计计算(数值方法与软件)方向的兴趣,提供了一个开箱即用的 Wasserstein DRO 计算工具,可用于快速实现和验证鲁棒估计方法。
17. jmlr:v27/24-1592 — Contrasting Local and Global Modeling with Machine Learning and Satellite Data: A Case Study Estimating Tree Canopy Height in African Savannas¶
- 作者: Esther Rolf, Lucia Gordon, Milind Tambe, Andrew Davies
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
application - 摘要: 本文在卫星机器学习(SatML)框架下,研究全局预训练与局部数据训练在预测莫桑比克Karingani保护区树冠高度(TCH)时的表现差异。核心发现是,仅用局部数据训练的小模型在预测精度上不仅优于已发表的全局TCH地图,甚至优于基于全局预训练再在局部微调的模型。作者进一步剖析了局部与全局建模目标之间的冲突与协同,指出全局模型在特定区域泛化能力的局限性。该研究属于纯实证与建模分析,未涉及严格统计理论或收敛率证明。对您而言,若关注空间/遥感数据集的统计计算或迁移学习中的局部-全局权衡,该文提供了数据集与经验参考,但方法学理论创新有限。
- 关键技术:
Satellite machine learning (SatML),global-to-local fine-tuning,spatial prediction,transfer learning - 为什么对您有用: 虽然缺乏理论深度,但涉及统计计算中的模型训练范式对比与空间数据集;若您对遥感/空间数据(类似天文大数据)的迁移学习或局部-全局权衡感兴趣,可作应用参考。
18. jmlr:v27/25-1557 — UQLM: A Python Package for Uncertainty Quantification in Large Language Models¶
- 作者: Dylan Bouchard, Mohit Singh Chauhan, David Skarbrevik, Ho-Kyeong Ra, Viren Bajaj, Zeya Ahmad
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
application - 摘要: 本文介绍 UQLM,一个用于大语言模型(LLM)幻觉检测的 Python 开源软件包,目标是通过不确定性量化(UQ)技术为模型输出提供 0-1 之间的响应级置信度分数。该工具包集成了多种基于 UQ 的评分器,作为即插即用的解决方案,旨在提升 LLM 输出的可靠性。其核心技术依赖于对 LLM 生成多样性与一致性的黑箱 UQ 评估,而非底层统计推断理论的创新。主要贡献在于工程实现与软件集成,方便下游应用快速部署幻觉检测。对您而言,虽然该文缺乏半参数或高维等理论深度,但作为统计计算(软件与算法)方向的 UQ 开源实践,其架构设计具有一定工程参考价值。
- 关键技术:
uncertainty quantification,hallucination detection,response-level confidence scores,LLM consistency checking - 为什么对您有用: 该文属于统计计算与软件范畴,虽然聚焦于 LLM 幻觉检测而非您关注的核心理论,但其开源 UQ 工具包的设计思路可为您在统计计算(软件与算法)方向的开发提供工程参考。
19. jmlr:v27/25-1106 — Reparameterized Complex-valued Neurons Can Efficiently Learn More than Real-valued Neurons via Gradient Descent¶
- 作者: Jin-Hui Wu, Shao-Qun Zhang, Yuan Jiang, Zhi-Hua Zhou
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
new_theory - 摘要: 在梯度下降优化框架下,本文比较了实值神经元与复值神经元的可学习性及收敛速率。理论证明,单个复值神经元能以 $O(t^{-3})$ 和 $O(t^{-1})$ 的速率分别学习实值和复值神经元,而有限宽两层实值网络无法学习非退化复值神经元。然而,未加调整的复值神经元学习实值神经元时收敛极慢($\Omega(t^{-3})$),远慢于实值情形的线性收敛。通过对相位参数进行重参数化,证明重参数化复值神经元学习实值神经元可实现线性收敛速率。该文从收敛率角度严格刻画了复值网络的表达优势与优化瓶颈;对您在统计计算(梯度下降收敛性分析)方向的算法理论有一定参考价值,但核心属于深度学习优化。
- 关键技术:
gradient descent convergence,reparameterization,complex-valued neural networks,linear convergence rate,learnability analysis - 为什么对您有用: 涉及梯度下降算法的收敛率严格分析,属于统计计算(数值优化算法)范畴,对理解优化算法收敛性质有直接参考;但与您主攻的半参数效率/因果推断距离较远。
20. jmlr:v27/25-0989 — Online Bernstein-von Mises theorem¶
- 作者: Jeyong Lee, Junhyeok Choi, Minwoo Chae
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
new_theory - 摘要: 在正则参数模型与在线小批量数据设定下,研究递归贝叶斯更新的频率学派性质,目标为未知参数的后验分布及其渐近有效性。由于非共轭模型下精确递归更新不可行,本文在每步采用基于正态分布的变分近似,并利用 Bernstein-von Mises (BvM) 定理为其提供理论依据。核心理论结果表明,当小批量大小超过一个依赖于参数维度的阈值时,累积的变分近似误差渐近可忽略,从而顺序更新后验与全样本后验渐近不可区分。该结论为在线变分推断提供了严格的频率学派保证,对您在统计计算(在线推断算法)和效率理论(BvM 定理与渐近有效性)方面的兴趣有直接的理论参考价值。
- 关键技术:
online Bayesian updating,Bernstein-von Mises theorem,variational approximation,frequentist asymptotics,mini-batch threshold - 为什么对您有用: 该文将 BvM 定理拓展至在线变分推断场景,对您在统计计算(在线推断算法设计)和数理统计(后验渐近正态与频率学派有效性)方面的兴趣有直接参考价值,提供了在线近似算法的严格理论保证。
经济理论 / 应用 (econ_theory, 1 篇)¶
1. jmlr:v27/22-1194 — A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design¶
- 作者: Rui Ai, Boxiang Lyu, Zhaoran Wang, Zhuoran Yang, Michael I. Jordan
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
new_method - 摘要: 本文研究多阶段第二价格拍卖中的保留价优化,设定为卖家的先验动作通过 MDP 影响投标者后续估值。针对不诚实投标者、未知市场噪声分布及不可直接观测的非线性随机收益三个挑战,提出 CLUB 算法。算法引入“缓冲期”与低切换成本 RL 激励近似诚实投标,设计新机制免除未知噪声下的纯探索,并扩展 LSVI-UCB 利用拍卖底层结构控制收益函数不确定性。理论上,CLUB 在已知与未知市场噪声下分别达到 Õ(H^{5/2}√K) 与 Õ(H^3√K) 的收益遗憾界。对您而言,本文虽以 RL 遗憾最小化为主,但其动态机制设计(MDP+拍卖)的建模思路可为经济理论中的动态因果推断与序贯决策提供结构模型参考。
- 关键技术:
LSVI-UCB,buffer periods,low switching cost RL,regret minimization,mechanism design - 为什么对您有用: 虽然方法学核心是强化学习而非您关注的半参数/效率理论,但其对多阶段拍卖(经济理论模型)的 MDP 建模与序贯机制设计,可为动态因果推断或经济理论中的结构模型提供思路借鉴。
其他 (other, 5 篇)¶
1. jmlr:v27/24-0456 — Persistence Diagrams Estimation of Multivariate Piecewise Hölder-continuous Signals¶
- 作者: Hugo Henneuse
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 5/10
- 摘要: { "topic": "nonparam_semipara", "summary_zh": "在非参数回归设定下,本文研究从含噪信号估计持久图(persistence diagrams,子水平集滤流)的 minimax 收敛速率,目标函数类为分段 Hölder 连续函数且对间断集的 reach 有控制。核心创新在于放弃传统的 sup-norm 稳定性定理提升信号估计结果,转而利用代数稳定性(algebraic stability)通过底层 interleaving 直接刻画瓶颈距离(bottleneck distance)。这一路径允许引入子水平集的形变收缩(deformation retractions),从而处理 sup-norm 稳定性分析无法应对的边界间断问题。结果表明,仅用简单的直方图估计器即可达到与 Hölder 连续函数相同的已知 minimax 速率,避免了 sup-norm 提升带来的速率损失。对您研究非参数理论中的 minimax rate 分析有直接借鉴价值:展示了更换稳定性工具(从泛函范数到代数/拓扑稳定性)如何获得更优速率。 ", "key_techniques": [ "persistence diagram estimation", "minimax rate", "algebraic stability theor
2. jmlr:v27/24-1901 — Learning Bayesian Network Classifiers to Minimize Class Variable Parameters¶
- 作者: Shouta Sugahara, Koya Kato, James Cussens, Maomi Ueno
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 2/10 · novelty:
new_method - 摘要: 本文提出一种新型贝叶斯网络分类器,在类变量无父节点的结构族中,以最少的类变量参数渐近估计类变量的真实概率分布。为搜索最优结构,作者分别提出了基于深度优先搜索和基于整数规划(ILP)的两种结构学习方法,并证明所提方法在渐近意义下能恢复真实分布且最小化类变量参数个数。基准数据集上的对比实验验证了方法的有效性。该工作属于参数化贝叶斯网络结构学习范畴,与半参数效率界或高维推断理论无直接关联,对您的主要兴趣方向参考价值有限。
- 关键技术:
Bayesian network classifier,integer programming structure learning,depth-first search,parameter minimization - 为什么对您有用: 与您的主要兴趣(因果推断、效率理论、高维统计)关联较弱;仅在统计计算(整数规划求解结构搜索)方面有轻微方法借鉴价值,但核心问题设定差异较大。
3. jmlr:v27/25-0549 — Optimizing Attention with Mirror Descent: Generalized Max-Margin Token Selection¶
- 作者: Addison Kristanto Julistiono, Davoud Ataee Tarzanagh, Navid Azizan
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 1/10 · novelty:
new_theory - 摘要: 在 softmax attention 分类模型设定下,本文研究以 $\ell_p$-范数势函数构建的 mirror descent (MD) 算法的优化动态与隐式偏差。核心理论证明表明,尽管问题高度非凸非线性,MD 算法在方向上收敛于带 $\ell_p$-范数目标的广义 hard-margin SVM,且收敛率与传统梯度下降相当。进一步地,文章分析了 key-query 矩阵与解码器的联合优化动态,确立了其收敛至各自 hard-margin SVM 解的条件。数值实验验证了 MD 在最优 token 选择与泛化性能上优于标准梯度下降。对您而言,本文属于深度学习优化理论,仅与您在统计计算(数值优化算法)方向的兴趣有边缘关联,对传统统计推断的直接参考价值较低。
- 关键技术:
mirror descent,implicit bias,softmax attention,hard-margin SVM,nonconvex optimization - 为什么对您有用: 本文涉及数值优化算法(mirror descent)的收敛性与隐式偏差分析,与您在统计计算(数值方法与算法)方向的兴趣有微弱关联,但核心场景为深度学习 attention 机制,对传统统计推断的直接启发有限。
4. jmlr:v27/24-0428 — Extrapolated Markov Chain Oversampling Method for Imbalanced Text Classification¶
- 作者: Aleksi Avela, Pauliina Ilmonen
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
new_method - 摘要: 本文针对不平衡文本分类问题,提出了一种外推马尔可夫链过采样方法(Extrapolated Markov Chain Oversampling)。在文本数据中,样本量增加往往伴随词汇表(特征空间)的扩大,传统过采样方法难以处理此特征扩展。该方法通过从少数类和多数类共同估计马尔可夫转移概率,使得生成的合成少数类样本能够扩展到未见过的词汇特征。实验评估显示,在严重不平衡的真实文本数据集上,该方法相比主流过采样算法取得了更具竞争力的分类性能。该方法主要聚焦于离散文本特征的生成算法,缺乏渐近理论或效率界的讨论,与您关注的高维统计理论或因果推断距离较远,仅在统计计算(算法设计)层面有极微弱关联。
- 关键技术:
Markov chain oversampling,imbalanced classification,feature space expansion,synthetic minority oversampling - 为什么对您有用: 本文属于文本挖掘与机器学习应用范畴,与您关注的高维统计理论、因果推断及半参数效率等核心方向无直接交集,仅在统计计算(算法设计)层面有极微弱关联,对您的研究直接参考价值较低。
5. jmlr:v27/24-0783 — CHANI: Correlation-based Hawkes Aggregation of Neurons with bio-Inspiration¶
- 作者: Sophie Jaffard, Samuel Vaiter, Patricia Reynaud-Bouret
- 期刊/来源: JMLR
- 分类: JMLR v27
- 相关性 0/10 · novelty:
new_theory - 摘要: 本文研究基于生物启发的脉冲神经网络能否仅通过局部变换完成分类任务,提出神经元活动由Hawkes过程建模的CHANI网络。其突触权重通过专家聚合算法更新,提供了一种局部且简单的学习规则。作者严格证明了该网络在平均和渐近意义下具备学习能力,并证明其能自动形成神经元集合(即中间层同一神经元可被多类别激活)。理论结果在合成数据集上得到了数值模拟验证,区别于传统生物启发网络的纯经验验证。对您而言,本文对Hawkes过程渐近性质的严格数学处理可为统计计算或点过程理论提供边缘参考,但与您核心的因果推断或高维统计方向距离较远。
- 关键技术:
Hawkes processes,expert aggregation algorithm,spiking neural networks,asymptotic convergence,point processes - 为什么对您有用: 本文核心属于计算神经科学与点过程建模,与您的主要研究方向(因果推断、高维统计、效率理论等)交集较小;仅当您对Hawkes过程的渐近收敛证明或局部更新算法的数学结构感兴趣时,可作边缘参考。
Maintained by 陈星宇 · Homepage · Source on GitHub