2026-05-18 每日 arXiv 资讯¶

高相关论文 8 篇 · 中相关 12 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文（按主题分组）¶

因果推断 (causal_inference, 2 篇)¶

1. 2605.15373 — Nonparametric inference for sublevel-set probabilities of conditional average treatment effect functions¶

作者: Anders Munch, Thomas A. Gerds
分类: stat.ME
相关性 9/10 · novelty: new_method
摘要: 在非参数模型下，针对条件平均处理效应（CATE）函数的子集概率进行推断，该概率随阈值变化形成单调曲线，用于刻画处理效应异质性。目标曲线在非参数模型下非路径可微，作者采用结合机器学习的 Grenander-type 估计量进行单调函数估计。进一步，证明该曲线的最佳分段线性逼近是路径可微的，并为此逼近构造了 debiased ML 估计量以实现 n^{-1/2}-CAN 推断。理论给出了估计量的收敛性质，数值模拟与糖尿病 RCT 数据验证了有限样本表现。将 CATE 异质性可视化转化为非参数单调推断与 debiased ML 问题，对您在因果推断的 CATE 估计以及半参数效率理论（路径可微性与 debiased ML）的结合有直接参考价值。
关键技术: CATE sublevel-set probability, Grenander-type estimator, pathwise differentiability, debiased machine learning, piecewise linear approximation
为什么对您有用: 直接连接因果推断（CATE异质性刻画）与半参数/效率理论（路径可微性与debiased ML），为您在非参数模型下处理不可微目标参数提供了Grenander估计与逼近可微的新思路。

2. 2605.15702 — Re-examining and calibrating weighted survival analysis for causal inference¶

作者: Wenfu Xu, Yi Zhang, Tobias Gerhard, Zhiqiang Tan
分类: stat.ME
相关性 8/10 · novelty: new_method
摘要: 在静态处理与 time-to-event 结局的因果推断设定下，本文重新审视了基于倾向得分加权的 Kaplan-Meier 生存概率估计与 Breslow-Peto 风险比估计，旨在弥补其统计性质研究的不足。作者将加权 Kaplan-Meier 方法正式纳入增强逆概率加权（AIPW）的一般框架，统一了点估计与方差估计的理论基础。针对现有加权方法的局限，本文在低维和高维设定下提出了基于校准（calibrated）的新估计方法及相应理论，通过校准步骤修正倾向得分权重以改善有限样本表现。模拟与实证（精神分裂症辅助治疗）表明，校准方法覆盖率更接近名义水平且置信区间更短。该工作将生存分析加权法与 AIPW 统一并在高维下引入校准，直接关联您关注的因果推断估计理论、半参数效率（AIPW）及高维统计设定。
关键技术: augmented inverse probability weighting (AIPW), weighted Kaplan-Meier estimation, calibrated estimation, propensity score weighting, high-dimensional causal inference, survival analysis
为什么对您有用: 直接关联您 primary interest 中的因果推断估计理论与半参数效率（AIPW 框架），并在高维设定下提出校准方法，对处理高维生存数据因果推断的效率与推断问题有直接借鉴价值。

效率理论 / Debiased ML (efficiency_dml, 2 篇)¶

1. 2605.15483 — Improving the Efficiency of Subgroup Analysis in Randomized Controlled Trials with TMLE¶

作者: Sky Qiu, Nerissa Nance, Rachael Phillips, Jens Tarp, Maya Petersen, Mark van der Laan
分类: stat.ME · stat.ML
相关性 9/10 · novelty: new_method
摘要: 在 RCT 亚组分析设定下，目标是估计亚组特异性处理效应（如风险差），关键假设为试验内部随机化与协变量结构的一致性。为解决亚组样本量不足导致的低功效问题，提出两种借用同试验非亚组样本信息的 TMLE 估计量：TMLE-PR 与 A-TMLE。TMLE-PR 通过合并回归共享协变量-结局关系，而 A-TMLE 引入协变量特异性截距项以实现局部渐近效率。两者均通过 targeting step 求解 efficient influence function (EIF) 方程，保证 n^{-1/2}-CAN 性质，且无需外部数据从而避免引入偏差。在 LEADER 心血管试验的实证中，A-TMLE 为样本占比不足 10% 的亚组提供了更窄的置信区间并达到统计显著。对您有用：该工作展示了如何在半参数框架下利用辅助信息构造高效估计量，对您在 efficiency theory 与 causal inference 交叉领域（特别是异质性处理效应的局部效率提升）有直接的方法论借鉴价值。
关键技术: Targeted Maximum Likelihood Estimation, Efficient Influence Function, Adaptive TMLE, Pooled regression, Subgroup treatment effect
为什么对您有用: 直接涉及 efficiency theory（通过 TMLE 求解 EIF 提升局部渐近效率）与 causal inference（亚组处理效应估计），对您研究半参数模型下利用辅助信息构造高效估计量有方法论启发；其心血管流行病学应用也契合您的 secondary interest。

2. 2605.15911 — Statistical Inference for Smoothed Support Vector Machines in High Dimensions: From Offline to Online Data¶

作者: Shuya Zhou, Junwen Xia, Jingxiao Zhang
分类: stat.ME
相关性 9/10 · novelty: new_method
摘要: 在高维 Lasso-penalized SVM 分类问题中，hinge loss 与 Lasso 惩罚的双重非光滑性使统计推断与计算面临挑战，本文提出统一的离线与在线推断框架。离线情形下，对 hinge loss 施加卷积平滑（convolution smoothing），构造 debiased estimator 消除 shrinkage bias，从而建立有效置信区间。在线流数据情形下，开发仅依赖历史数据汇总统计量的实时估计与推断程序，避免存储原始数据。理论上严格证明了离线与在线 debiased estimator 的渐近正态性，模拟与实际数据验证了推断有效性与计算效率提升。对您有用：该工作将 debiased 推断从高维线性/广义线性模型拓展至非光滑 loss 的 SVM，且在线推断框架对高维流数据场景有直接迁移价值，与您在 efficiency theory (debiased ML) 和 statistical computing 上的兴趣高度相关。
关键技术: convolution smoothing for hinge loss, debiased estimator for high-dimensional SVM, Lasso-penalized SVM, online streaming inference with summary statistics, asymptotic normality of debiased estimator
为什么对您有用: 直接推进高维 debiased inference 方法论——从线性模型拓展至非光滑 SVM loss，且在线推断框架与您在 efficiency theory (debiased ML) 和 statistical computing 上的兴趣紧密相连，可迁移至其他高维流数据推断场景。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶

1. 2605.16033 — Tests for the mean of high-dimensional data¶

作者: Dietmar Ferger
分类: math.ST · stat.TH
相关性 8/10 · novelty: new_theory
摘要: 在高维数据维度 p 相对样本量 n 无显式增长率限制的设定下，本文研究总体均值的假设检验问题。提出基于 V_n = n||X̄_n||^2 的检验统计量，避免了高维协方差矩阵求逆的困难。通过将观测嵌入 Hilbert 空间 l_2，作者建立了一个新的 l_2 空间中心极限定理（CLT）作为核心推导工具。基于此 CLT，推导了固定与递增维度下 V_n 的渐近分布，并证明了 Bootstrap 近似的渐近有效性。所得 Bootstrap 检验无需协方差矩阵的稀疏性或结构性假设即可达到渐近水平 α。对您的高维假设检验研究有用：该文通过 l_2 空间嵌入和新 CLT 绕开了传统 RMT 方法对 p/n 比率或迹条件的依赖，为高维均值检验提供了无需稀疏假设的新理论路径。
关键技术: Hilbert space l2 embedding, Central Limit Theorem in l2, Bootstrap approximation, norm-based test statistic, high-dimensional mean test
为什么对您有用: 直接关联您的高维统计与假设检验兴趣：该文通过 l_2 空间 CLT 和 Bootstrap 绕开了传统 RMT 方法对 p/n 比率或迹条件的依赖，为高维均值检验提供了无需稀疏假设的新理论路径。

2. 2605.16033 — Tests for the mean of high-dimensional data¶

作者: Dietmar Ferger
分类: math.ST · stat.TH
相关性 8/10 · novelty: weaker_assumption
摘要: 本文研究高维数据的均值检验问题，目标是在维度 p 相对样本量 n 无显式速率限制的设定下检验均值向量，且不依赖协方差矩阵的稀疏性或结构性假设。提出基于统计量 V_n = n||X_n||^2 的检验方法，避免了高维协方差矩阵的求逆运算。通过将观测数据嵌入到 Hilbert 空间 l_2 中，推导出在固定和增长维度下的渐近分布结果。证明了一个新的 l_2 空间中心极限定理（CLT），并据此建立了 Bootstrap 近似的渐近有效性。理论结果保证了所得 Bootstrap 检验具有渐近水平 α 的性质，对您有用：该工作直接推进了您关注的“高维统计”与“假设检验”交叉领域，其放松协方差稀疏假设的 l_2 空间嵌入技巧可为高维推断提供新思路。
关键技术: high-dimensional mean testing, Hilbert space l_2 embedding, Central Limit Theorem in l_2, bootstrap approximation, covariance matrix inversion avoidance
为什么对您有用: 直接对应您 primary interest 中的“假设检验”与“高维统计”；其无需稀疏假设的 l_2 空间 CLT 和 Bootstrap 方法，为高维推断放松了正则性条件，具有理论迁移价值。

其他 (other, 2 篇)¶

1. 2605.16027 — Nearest-Neighbour Matching on Unbounded Supports and Covariate Shift Transfer¶

作者: Simon Viel
分类: math.ST · stat.TH
相关性 8/10
摘要: 在协变量偏移(covariate shift)与缺失标签设定下估计多元函数期望（含ATE），传统最近邻匹配要求协变量支撑集紧致且密度下界非零。本文提出源分布与目标分布间的"可迁移性"(transferability)度量，替代紧致支撑与密度下界假设，证明最近邻匹配在此条件下仍可达通常收敛速率。该可迁移性条件适用于流形支撑分布，且允许目标分布比源分布尾部更重；同时证明该条件对任何估计器达到优速率是必要的。将结果应用于处理效应估计时，放松了倾向得分需远离0和1的positivity假设。对您有用：直接关联causal inference中positivity假设的放松以及nonparametric theory中支撑集正则条件的弱化，为重尾/无界支撑下的匹配估计与ATE识别提供更弱假设下的速率保证。
关键技术: nearest-neighbour matching, covariate shift transfer, transferability measure, minimax convergence rates, positivity assumption relaxation

2. 2605.16027 — Nearest-Neighbour Matching on Unbounded Supports and Covariate Shift Transfer¶

作者: Simon Viel
分类: math.ST · stat.TH
相关性 8/10
摘要: 在协变量偏移(covariate shift)与平均处理效应框架下，目标是估计缺失标签下多元函数的期望，传统非参数方法要求协变量支撑集紧致且密度下界为正。本文基于最近邻匹配估计器，用源分布与目标分布之间的"可迁移性"(transferability)测度替代紧致支撑与密度下界假设，证明在无界支撑上仍可达经典收敛速率。该可迁移性条件适用于流形支撑分布，且允许目标分布尾部比源分布更重；同时证明此条件对任何估计器达到良好收敛速率是必要的（minimax 型下界）。将结果应用于处理效应估计时，成功放松了倾向得分需远离0和1的positivity假设。对您有用：直接推进了因果推断中positivity假设的放松，同时在非参数理论中给出了无界支撑下的收敛率与必要性下界，与您的causal inference和nonparametric theory兴趣高度相关。
关键技术: nearest-neighbour matching, covariate shift transferability, minimax lower bound, positivity assumption relaxation

📌 中相关论文（按主题分组）¶

因果推断 (causal_inference, 1 篇)¶

1. 2605.15639 — Leveraging heterogeneity for identifiability: Bayesian order-based learning of multiple DAGs¶

作者: Hyunwoong Chang, Fariha Taskin
分类: stat.ME · stat.CO · stat.ML
相关性 7/10 · novelty: new_method
摘要: 在异质数据设定下，本文研究多 DAG 的因果结构学习问题，目标是在异质性辅助下实现因果排序（causal ordering）的可识别性。提出联合 order-based scoring 框架，证明利用异质性可将因果排序的可识别性提升至最多两种排列；在此基础上构建高维 Gaussian DAG 的 order-based Bayesian 方法，并建立高维情形下的后验一致性理论。计算方面，设计 random-to-random (R2R) proposal 用于 Metropolis-Hastings 在排序空间上的后验采样，理论上动机明确且混合效率优于传统 proposal。模拟与单核 RNA 测序数据应用验证了方法表现。对您而言，该文在因果 identification（利用异质性放松可识别性条件）和高维 Bayesian 后验理论方面有参考价值，R2R proposal 的设计思路也可迁移至其他排序空间上的统计计算问题。
关键技术: order-based Bayesian scoring, heterogeneous DAG identifiability, high-dimensional posterior consistency, Metropolis-Hastings R2R proposal, causal ordering learning
为什么对您有用: 与您 primary interest 中因果推断的 identification 问题直接相关（异质性辅助因果排序可识别性），同时涉及高维统计理论与统计计算（MCMC 在排序空间的高效采样），方法思路可迁移至其他因果结构或排序推断场景。

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)¶

1. 2605.15278 — Intrinsic-dimension empirical Bernstein inequalities for bounded self-adjoint operators¶

作者: Diego Martinez-Taboada, Aaditya Ramdas
分类: math.ST · stat.TH
相关性 7/10 · novelty: new_theory
摘要: 本文研究有界紧自伴算子之和的经验 Bennett 与 Bernstein 不等式，设定为独立随机算子序列，无需预先知道真实方差且不依赖环境维度。核心方法是用经验方差估计替代 oracle 方差，并以算子的 intrinsic dimension（迹与谱的比值）代替 ambient dimension，从而获得完全数据驱动的浓度界。这一结构转换使得对非各向同性随机矩阵的界严格更紧，并无缝推广到无穷维 Hilbert 空间。理论结果证明经验界渐近达到已知最优 oracle 速率；副产品是给出了 intrinsic dimension 本身的经验浓度保证。对您的高维统计与 RMT 研究有直接价值：intrinsic-dimension-based 浓度界可为非各向同性协方差/投影算子的推断提供更紧的 finite-sample guarantee，也可作为高维假设检验或 debiased ML 中算子浓度步骤的技术工具。
关键技术: empirical Bernstein inequality, intrinsic dimension of self-adjoint operators, operator-valued concentration, compact self-adjoint operators, dimension-free bounds, empirical variance substitution
为什么对您有用: 直接推进您 primary interest 中高维统计与 RMT 的浓度不等式工具箱：intrinsic-dimension 替代 ambient dimension 的思路可为非各向同性随机矩阵推断提供更紧 finite-sample 界，也可服务于高维假设检验中算子浓度的技术需求。

2. 2605.15278 — Intrinsic-dimension empirical Bernstein inequalities for bounded self-adjoint operators¶

作者: Diego Martinez-Taboada, Aaditya Ramdas
分类: math.ST · stat.TH
相关性 7/10 · novelty: new_theory
摘要: 在有界紧自伴算子之和的浓度不等式设定下，目标是建立无需真实方差先验知识且仅依赖内在维度(intrinsic dimension)而非环境维度的经验Bennett与Bernstein不等式。核心方法是用经验方差估计替代未知oracle方差，并将界中的维度项从环境维度替换为内在维度tr(Σ)/‖Σ‖，从而对非各向同性随机矩阵获得严格更紧的保证。该结构使得浓度界可计算、维度无关，并无缝推广至无穷维Hilbert空间。理论上证明经验界达到已知最优oracle rate的渐近尖锐性；作为副产品，还给出了内在维度本身的新经验浓度保证。对您的高维统计与RMT研究有直接工具价值：内在维度替代环境维度的思路可为非各向同性协方差结构下的假设检验与debiasing推断提供更紧的finite-sample保证。
关键技术: operator-valued concentration inequality, intrinsic dimension tr(Σ)/‖Σ‖, empirical Bennett/Bernstein inequality, compact self-adjoint operators, dimension-free oracle rates
为什么对您有用: 直接推进您primary interest中高维统计/RMT方向的浓度不等式工具箱：内在维度替代环境维度的思路对非各向同性随机矩阵下的假设检验与debiasing推断有更紧finite-sample保证的潜力。

3. 2605.15358 — Double Descent and Benign Overfitting in Macroeconomic Forecasting¶

作者: Andrea Carriero, Florian Huber, Davide Pettenuzzo
分类: econ.EM
相关性 6/10 · novelty: new_theory
摘要: 本文研究宏观经济预测中的 double descent 与 benign overfitting 现象，设定为小数量潜在因子驱动的宏观面板数据（FRED-MD/QD），关键假设为 Bartlett et al. (2020) 的 benign-overfitting 条件。在 exact factor model 下该条件自动满足，在 approximate factor model 下需个体方差跨序列不过度分散。由于宏观面板 N/T 维度适中、不满足理论所需的过参数化比，作者提出用估计因子模型生成的合成副本增广数据，并证明该策略等价于收敛到具有 factor-structured kernel 的 kernel ridge regression。实证表明该估计量在所有序列和预测期上一致优于 Stock-Watson 因子模型，且优势随预测期增长而扩大。核心洞见是 benign overfitting 的成功源于过参数化隐式构造了良态核，而非过参数化本身。对您有用：将 benign overfitting 理论与因子结构/RMT 联系，并在中等维宏观数据上提供了可操作的数据增广方案，直接连接高维统计与经济预测应用。
关键技术: double descent, benign overfitting, factor model, kernel ridge regression, data augmentation via synthetic copies, Bartlett et al. (2020) conditions
为什么对您有用: 直接连接您的高维统计/RMT 兴趣（benign overfitting 条件刻画、因子结构下的过参数化理论）与经济理论应用（FRED 宏观数据集、Stock-Watson 因子模型对比），提供了从 RMT 式理论到中等维实际数据的桥接方案。

非参数 / 半参数 (nonparam_semipara, 2 篇)¶

1. 2605.15531 — Bounds on the Number of Modes of a Gaussian Mixture Density¶

作者: Hien Duy Nguyen
分类: math.ST · math.CO · stat.TH
相关性 4/10 · novelty: new_theory
摘要: 在 \(\mathbb{R}^d\) 上 \(k\)-分量高斯混合密度的非退化临界点数与模态数上界问题中，作者通过将临界点方程归一化至参考分量，利用 Pfaffian 界给出了异方差上界 \(U_{\mathrm{het}}(d,k)\)，再通过精确消元与代数互反变量得到另一上界 \(U_{\mathrm{aug}}(d,k)\)，取两者最小值；同方差情形下进一步利用仿射秩降维得到维度无关界 \(U_{\mathrm{aug,hom}}(k)\)。Morse 理论论证将有限模态上界改进为临界点上界加一除二取整。下界方面，对 \(d,k\ge2\) 给出组合下界 \(L_{\mathrm{bin}}(d,k)\) 及线性下界 \(d+k-1\)，并提出了 padding-product 族与 seed-closure 原则。结果为高斯混合模态结构提供了紧致的显式代数界，对您在 semiparametric 理论中处理混合模型 identification 与假设检验（如分量数检验）的复杂性分析有参考价值。
关键技术: Pfaffian bound, algebraic elimination theory, Morse theory, affine rank reduction, seed-closure principle, Gaussian mixture critical-point equations
为什么对您有用: 高斯混合是经典 semiparametric 模型，模态数的显式界对理解其 likelihood 地貌与分量数假设检验的复杂性有直接意义；Morse 理论与代数消元的手法可迁移至其他 semiparametric 模型的拓扑分析。

2. 2605.15531 — Bounds on the Number of Modes of a Gaussian Mixture Density¶

作者: Hien Duy Nguyen
分类: math.ST · math.CO · stat.TH
相关性 4/10 · novelty: new_theory
摘要: 在 \(\mathbb{R}^d\) 上的 \(k\)-分量高斯混合密度设定下，研究其非退化临界点数量与模态（modes）数量的显式上下界。通过参考分量归一化临界点方程，导出异方差情形下的 Pfaffian 界 \(U_{\mathrm{het}}(d,k)\)；结合精确消元与代数互反变量，得到另一增强界 \(U_{\mathrm{aug}}(d,k)\)。利用 Morse 理论，将有限模态上界改进为两者最小值加一除二的下取整。在同方差情形下，通过仿射秩降维和增强同方差约简，进一步得到与维度无关的模态界 \(U_{\mathrm{aug,hom}}(k)\)。下界方面，基于二项式构造与填充-乘积族，给出了线性下界 \(d+k-1\) 及组合下界 \(L_{\mathrm{bin}}(d,k)\)。该工作为高斯混合密度的拓扑结构提供了严格的代数与几何刻画，对您在非参数理论中研究混合模型模态结构、或在假设检验中涉及单峰性检验的理论分析有直接参考价值。
关键技术: Pfaffian bound, Morse theory, algebraic elimination, affine rank reduction, seed-closure principle
为什么对您有用: 与您 primary interest 中的非参数理论（混合模型模态结构）和数学统计（假设检验中关于单峰性的理论）直接相关，提供了高斯混合密度模态数的精确代数与拓扑界，有助于理解聚类数目与密度模态的对应关系。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 2605.15802 — Generalized raking and stabilized weights for regression modeling in two-phase samples¶

作者: Tong Chen, Joshua Slone, Gustavo Amorim, Pamela A. Shaw, Bryan E. Shepherd, Thomas Lumley
分类: stat.ME
相关性 6/10 · novelty: new_method
摘要: 在两阶段抽样（two-phase sampling）的回归建模中，传统抽样权重常包含非必要变异从而膨胀方差估计。本文研究最优稳定化权重（optimal stabilized weights）的表现，并提出将其与广义校准（generalized raking）结合——后者是一类基于设计的高效估计器，通过辅助变量约束提升效率。核心机制是：稳定化权重削减由协变量解释的非必要权重变异，而 raking 利用辅助变量的边际信息进一步降低方差；两者结合可通过标准统计软件包实现。模拟表明在现实两阶段设计下精度提升显著，但在高度信息性设计（highly informative designs）中增益有限。实证应用于多国 HIV 人群 Kaposi 肉瘤的两阶段研究。对您而言，该工作展示了辅助变量校准与权重稳定化在效率提升上的交互机制，与 semiparametric efficiency theory 中利用辅助信息达到效率界的思路一致，且提供了流行病学两阶段设计的应用范例。
关键技术: generalized raking, stabilized weights, two-phase sampling design, calibration estimation, auxiliary variable constraints, design-based efficiency
为什么对您有用: 与 primary interest 中的 efficiency theory 相关：raking 本质上是通过辅助变量约束逼近 semiparametric efficiency bound；同时提供了 epidemiology secondary interest 中两阶段设计的实际数据集与应用方法。

数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶

1. 2605.15814 — Goodness-of-Fit Testing for Point Processes in Large Populations¶

作者: Sami Umut Can, Estate V. Khmaladze, Roger J. A. Laeven
分类: math.ST · stat.TH
相关性 5/10 · novelty: new_method
摘要: 在大群体点过程设定下，本文研究条件强度是否属于特定参数族的原假设拟合优度检验问题。作者提出对自然参数检验过程构造酉变换（unitary transformation），使其弱收敛到一个独立于原假设参数形式的“标准”目标过程。该变换本质上是 Khmaladze 变换在点过程上的拓展，从而实现了渐近分布无关（asymptotically distribution-free）的检验。通过 Aalen 型生存过程、混合治愈模型及软件可靠性模型的模拟，以及人类寿命与软件故障的真实数据，验证了该方法的有限样本表现。对您有用：本文直接推进了数学统计中的假设检验理论，其通过酉变换消除参数依赖以获得分布无关统计量的技巧，对您在半参数/非参数理论及假设检验方面的研究具有方法论借鉴价值。
关键技术: goodness-of-fit testing, point process conditional intensity, unitary transformation, Khmaladze-type transformation, asymptotically distribution-free test, Aalen-type survival process
为什么对您有用: 直接对应您 primary interest 中的数学统计（假设检验）方向；通过酉变换消除参数依赖以获得渐近分布无关检验统计量的技巧，对半参数/非参数理论中的检验问题有直接的方法论启发。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 2605.16075 — REX-SUB: A Scalable Subsampling Strategy for Modeling Large Spatial Datasets¶

作者: Nicholas Rios, Ben Seiyon Lee
分类: stat.ME · stat.CO
相关性 4/10 · novelty: new_method
摘要: 针对大规模空间数据集中高斯过程（GP）拟合计算代价过高的问题，本文研究基于最优子抽样的近似推断设定。提出了一种随机交换子抽样算法（REX-SUB），通过优化预测误差准则来高效选取小子集。为提升计算效率，将 Vecchia 近似嵌入 GP 联合似然中，利用精度矩阵的稀疏性实现快速推断。模拟与遥感水汽数据应用表明，REX-SUB 相比竞争方法具有更低的均方预测误差和区间得分。对您有用之处在于：该文展示了如何结合稀疏矩阵结构与随机优化算法突破大规模计算瓶颈，属于您关注的统计计算（数值方法与算法）方向，可为大规模半参数或因果模型的计算实现提供算法设计借鉴。
关键技术: Gaussian process, randomized exchange algorithm, Vecchia approximation, sparse precision matrix, optimal subsampling
为什么对您有用: 属于您关注的统计计算（数值方法与算法）方向，展示了如何利用稀疏精度矩阵与随机优化解决大规模模型计算瓶颈，可为大规模半参数或因果模型的计算实现提供算法设计借鉴。

经济理论 / 应用 (econ_theory, 2 篇)¶

1. 2605.15966 — Quasi-Bayesian Local Projection Instrumental-Variables Method: Application to Renewable Energy and Electricity Prices¶

作者: Masahiro Tanaka
分类: econ.EM · stat.ME
相关性 7/10 · novelty: new_method
摘要: 在局部投影工具变量（LP-IV）框架下，目标是估计跨期脉冲响应函数，传统 GMM 方法在中长期水平存在有限样本不稳定问题。本文提出一种准贝叶斯方法，利用 GMM 目标函数构建基于矩的准后验分布。核心技术是引入粗糙度惩罚先验（roughness-penalty prior）来平滑不同期限的脉冲响应，从而实现正则化。该方法保留了传统 LP-IV 的一阶渐近特征，同时提升了有限样本稳定性，并允许通过同步置信带（simultaneous bands）进行联合推断。模拟显示，相比标准 GMM，该正则化方法在中长期水平显著降低了 RMSE；在丹麦电力市场的应用验证了其实用性。对您而言，该方法为准贝叶斯与 GMM 结合在 IV 估计中的正则化应用提供了新思路，直接关联您 primary interest 中的 IV 方法与 secondary interest 中的经济因果推断应用。
关键技术: local projection IV, quasi-Bayesian posterior, GMM objective function, roughness-penalty prior, simultaneous confidence bands
为什么对您有用: 直接关联 primary interest 中的 IV 方法与 secondary interest 中的经济因果推断应用，为准贝叶斯正则化改善 IV 脉冲响应估计的有限样本表现提供了可迁移的新思路。

2. 2605.15902 — Tweedie's Formula, Variance Functions, and Score-Driven Updating¶

作者: Peter Reinhard Hansen, Chen Tong
分类: econ.EM · stat.ME
相关性 6/10 · novelty: new_theory
摘要: 本文在 score-driven 模型框架下，为基于条件似然分数的时变参数更新提供贝叶斯解释，核心设定为自然指数族与高斯信号提取模型。利用 Tweedie 公式，将后验修正表达为边际预测密度的 scaled score；对一般条件密度，证明 inverse-Fisher-scaled 条件分数等价于基于 Fisher scoring 与 precision discounting 的局部高斯后验修正。对共轭自然指数族，经典折扣贝叶斯递推具有精确 score-driven 表示：稳态精度折扣与期望空间 inverse-Fisher 缩放下，score-driven 修正等于转移动态施加前的贝叶斯后验均值。Tweedie 方差函数指标进一步阐明条件分数如何标准化预测误差。主要理论结果将 empirical Bayes、近似滤波、动态 GLM 与 score-driven 模型统一联系，并区分了精确贝叶斯更新与局部分数近似。对您有用：Tweedie 公式与 empirical Bayes 的理论桥梁为效率理论中 compound decision 问题的理解提供新视角，同时 score-driven 模型在经济时间序列中的广泛应用契合您的经济理论兴趣。
关键技术: Tweedie's formula, score-driven models, Fisher scoring, natural exponential families, empirical Bayes, precision discounting
为什么对您有用: Tweedie 公式是 empirical Bayes 与 semiparametric efficiency 的经典工具，本文将其与 score-driven 更新的贝叶斯解释统一，对您 efficiency theory 和经济理论两个方向均有启发；inverse-Fisher 缩放与后验修正的等价性为高维/时间序列设定下的近似推断提供了可迁移的理论框架。

其他 (other, 1 篇)¶

1. 2605.15814 — Goodness-of-Fit Testing for Point Processes in Large Populations¶

作者: Sami Umut Can, Estate V. Khmaladze, Roger J. A. Laeven
分类: math.ST · stat.TH
相关性 5/10
摘要: 在大群体点过程设定下，研究条件强度是否属于某参数族的拟合优度检验问题，零假设下允许一般的正则条件。核心方法是对自然的参数检验过程构造酉变换（Khmaladze-type transformation），使其弱收敛到一个不依赖于零假设具体参数形式的"标准"目标过程，从而实现渐近分布自由的拟合优度检验。技术工具涉及鞅补偿器理论、检验过程的弱收敛、酉算子构造。模拟覆盖 Aalen 型生存过程（含删失）、mixture cure 模型及软件可靠性模型，并附真实人类寿命数据与软件故障数据实证。对您有用：直接推进了 hypothesis testing 方向的分布自由检验理论，Khmaladze 变换向点过程的拓展为生存/可靠性数据的拟合优度提供了可迁移的新方法。
关键技术: Khmaladze transformation, distribution-free goodness-of-fit test, point process conditional intensity, unitary transformation of testing process

Maintained by 陈星宇 · Homepage · Source on GitHub

2026-05-18 每日 arXiv 资讯¶

⭐ 高相关论文（按主题分组）¶

因果推断 (causal_inference, 2 篇)¶

1. 2605.15373 — Nonparametric inference for sublevel-set probabilities of conditional average treatment effect functions¶

2. 2605.15702 — Re-examining and calibrating weighted survival analysis for causal inference¶

效率理论 / Debiased ML (efficiency_dml, 2 篇)¶

1. 2605.15483 — Improving the Efficiency of Subgroup Analysis in Randomized Controlled Trials with TMLE¶

2. 2605.15911 — Statistical Inference for Smoothed Support Vector Machines in High Dimensions: From Offline to Online Data¶

数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶

1. 2605.16033 — Tests for the mean of high-dimensional data¶

2. 2605.16033 — Tests for the mean of high-dimensional data¶

其他 (other, 2 篇)¶

1. 2605.16027 — Nearest-Neighbour Matching on Unbounded Supports and Covariate Shift Transfer¶

2. 2605.16027 — Nearest-Neighbour Matching on Unbounded Supports and Covariate Shift Transfer¶

📌 中相关论文（按主题分组）¶

因果推断 (causal_inference, 1 篇)¶

1. 2605.15639 — Leveraging heterogeneity for identifiability: Bayesian order-based learning of multiple DAGs¶

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)¶

1. 2605.15278 — Intrinsic-dimension empirical Bernstein inequalities for bounded self-adjoint operators¶

2. 2605.15278 — Intrinsic-dimension empirical Bernstein inequalities for bounded self-adjoint operators¶

3. 2605.15358 — Double Descent and Benign Overfitting in Macroeconomic Forecasting¶

非参数 / 半参数 (nonparam_semipara, 2 篇)¶

1. 2605.15531 — Bounds on the Number of Modes of a Gaussian Mixture Density¶

2. 2605.15531 — Bounds on the Number of Modes of a Gaussian Mixture Density¶

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 2605.15802 — Generalized raking and stabilized weights for regression modeling in two-phase samples¶

数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶

1. 2605.15814 — Goodness-of-Fit Testing for Point Processes in Large Populations¶

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 2605.16075 — REX-SUB: A Scalable Subsampling Strategy for Modeling Large Spatial Datasets¶

经济理论 / 应用 (econ_theory, 2 篇)¶

1. 2605.15966 — Quasi-Bayesian Local Projection Instrumental-Variables Method: Application to Renewable Energy and Electricity Prices¶

2. 2605.15902 — Tweedie's Formula, Variance Functions, and Score-Driven Updating¶

其他 (other, 1 篇)¶

1. 2605.15814 — Goodness-of-Fit Testing for Point Processes in Large Populations¶

评论