跳转至

2026-05-11 每日 arXiv 资讯

  • 高相关论文 2 篇 · 中相关 6 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 1 篇)

1. 2605.09116 — Fit CATE Once: Model-Assisted Randomization Tests Without Sample Splitting

  • 作者: Fangnan Zheng, Yao Zhang
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在随机化面板实验设定下,研究如何结合灵活的CATE模型与随机化检验,以在不进行样本分割的前提下实现有效推断。核心方法是从残差化结果的协方差结构中估计无符号的CATE(unsigned CATE),保留已实现的分配机制用于随机化推断,并通过选择最优符号拟合观测结果。理论方面,证明了无符号CATE估计量的可识别性与一致性,以及CATE辅助随机化检验的有效性。实验表明该方法控制了第一类错误,且比协变量调整和样本分割方案具有更高的检验功效,同时可用于发现异质性子群并检验子群特异的处理效应。对您有用:该文将CATE估计与随机化假设检验无缝结合,放松了样本分割假设并提升了检验功效,直接关联您在因果推断(CATE identification)与假设检验方向的兴趣。
  • 关键技术: randomization inference, unsigned CATE identification, residualized outcomes, model-assisted test, subgroup analysis
  • 为什么对您有用: 直接关联您在因果推断(CATE identification/估计)与假设检验(随机化检验)方向的兴趣;无需样本分割的CATE辅助检验放松了常规假设并提升了检验功效,方法可迁移至面板实验或经济学应用中。

非参数 / 半参数 (nonparam_semipara, 1 篇)

1. 2605.08656 — Bias Correction for Semiparametric Regression Models

  • 作者: Yuming Zhang, Yanyuan Ma, Xuming He, Stéphane Guerrier
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在半参数回归模型 f{Y|x^⊤β+m(z), φ} 设定下,当参数维度 p 相对 n 发散或分散参数 φ 较大时,标准估计量的有限样本偏差可能非常严重,进而破坏 β 的推断。本文提出 SABRE(Simulation-based Bias Correction)框架,对 β 和 φ 的偏差进行显式修正。在广义部分线性模型(GPLM)子类中,理论证明 SABRE 能在不膨胀方差的前提下实现偏差缩减,从而改善推断的覆盖概率。核心技术依赖于半参数有效得分函数的偏差分解与基于模拟的修正项构造,并给出了修正后估计量的渐近性质。实证部分在早期糖尿病流行病学数据上验证了方法的有效性。对您有用:该工作直接推进了半参数理论中的有限样本偏差修正,且在 p 发散设定下保持方差不增的技巧对您关注的 efficiency theory 与高维半参数推断有直接参考价值。
  • 关键技术: semiparametric regression, bias correction, generalized partially linear models, simulation-based estimation, diverging dimension, nuisance parameter expansion
  • 为什么对您有用: 直接涉及半参数理论中的有限样本偏差修正,且处理了 p 发散的设定,对您关注的 efficiency theory 和高维半参数推断有直接启发;流行病学数据应用也契合您的次要兴趣。

📌 中相关论文(按主题分组)

因果推断 (causal_inference, 1 篇)

1. 2605.11284 — Rethinking external validation for the target population: Capturing patient-level similarity with a generative model

  • 作者: Mohammad Azizmalayeri, Ameen Abu-Hanna, Saskia Houterman, Marije M. Vis, Giovanni Cinà
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在预测模型的外部验证(可移植性/transportability)问题中,目标是将模型表现不佳归因于病例组合差异(case-mix)还是模型本身缺陷,假设外部人群与开发人群存在分布偏移。提出一个基于自编码器(autoencoder)的生成模型框架,量化外部个体与开发数据的相似度,并在不同相似度子群中评估模型表现,无需共享原始开发数据。相比传统线性方法,自编码器提供了更灵活的分布对齐度量;通过合成数据与荷兰心脏注册(NHR)经导管主动脉瓣置换术死亡率预测数据验证。传统外部验证可能掩盖子群层面的表现差异,而该框架能识别出与开发分布对齐的子群中表现一致的模型,或揭示整体表现可接受但特定子群表现不足的情况。虽然聚焦预测模型而非因果效应,但其对 transportability 和分布偏移下子群表现的量化思路,对您在因果推断中处理外部有效性与可移植性(transportability of causal effects)有方法学借鉴意义。
  • 关键技术: transportability, autoencoder, distribution shift, subgroup analysis, external validation
  • 为什么对您有用: 虽然本文聚焦预测模型而非因果效应,但其对 transportability 和分布偏移下子群表现的量化思路,对您在因果推断中处理外部有效性与可移植性(transportability of causal effects)有方法学借鉴意义。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)

1. 2605.08995 — Semiparametric Elliptical Mixture Clustering for High-Dimensional Data

  • 作者: Long Feng, Dan Zhuang
  • 相关性 5/10 · novelty: new_method
  • 摘要: 针对高维重尾且近似椭圆分布的混合数据聚类问题,本文提出一种半参数椭圆混合聚类框架,设定簇中心各异、径向生成器未知且共享、以及共享稀疏精度-形状矩阵。方法上,开发了广义EM算法(GEM),通过变换半径估计径向生成器、径向得分更新簇中心,并利用Tyler-POET-GLASSO更新共享精度-形状矩阵。该方法避免了指定参数化径向分布族,且在高维下保持计算可行性。理论上,建立了模型成分估计的高维一致性及过量误聚类误差的收敛界。模拟与手写数字应用验证了其在重尾设定下的鲁棒性与竞争力。对您有用:该文将半参数模型与高维稀疏精度矩阵估计(Tyler-POET-GLASSO)结合,对您在高维统计(RMT/协方差估计)与半参数理论交叉领域的方法构建有直接参考价值。
  • 关键技术: semiparametric elliptical mixture, Tyler-POET-GLASSO, generalized EM algorithm, high-dimensional consistency, sparse precision matrix estimation
  • 为什么对您有用: 该文将半参数理论(未知径向生成器)与高维统计(Tyler-POET-GLASSO)结合,对您在高维统计(RMT/协方差估计)与半参数理论交叉领域的方法构建与理论分析有直接参考价值。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 2605.11306 — Unified Operator Framework for Functional and Multivariate Regression

  • 作者: Mark Carpenter, Nicholas Gaubatz
  • 相关性 4/10 · novelty: minor
  • 摘要: 本文提出基于一般测度下积分算子的统一算子框架,将标量、多元及函数回归(scalar-on-function, function-on-scalar, function-on-function, multivariate multiple regression)统一为同一算子在不同输入输出测度下的特例。核心机制在于:离散表示对应离散测度下的精确算子求值,且随观测网格加密收敛至连续算子;离散测度下的估计退化为标准多元回归,统计性质由经典结果刻画。模拟实验验证了离散化、条件数与估计精度之间的关系。该框架解释了线性设定下向量化多元回归常与函数方法竞争力相当的现象——前者直接估计底层算子的离散测度表示。对您而言,该文将函数回归与多元回归的算子视角统一,可为 semiparametric/nonparametric 理论中函数型数据的效率界推导与离散化近似提供概念工具。
  • 关键技术: integral operator under general measure, functional regression taxonomy, discrete-to-continuous operator convergence, multivariate regression as operator estimation, discretization and conditioning analysis
  • 为什么对您有用: 统一算子框架为函数型数据的 semiparametric efficiency bound 推导与离散化近似提供了清晰的测度论视角,对您在 nonparametric theory 中处理函数型 estimand 的效率计算有概念迁移价值。

2. 2605.10553 — Estimation of the Risk Measure under a Nuisance Autoregression

  • 作者: Jana Jurečková, Jan Picek
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在自回归模型设定下,自回归系数为未知干扰参数,目标是仅基于可观测序列 $X_t$ 估计不可观测误差项 $Z_t$ 的分位数函数,以此作为风险度量。核心方法结合了自回归系数的 R-估计量与自回归分位数技术。R-估计量基于秩统计量构造,无需对误差分布做参数化假设,具有半参数稳健性。通过先剥离自回归趋势再对残差推断的策略,解决了干扰参数存在下的分位数估计问题。该工作为时间序列中的半参数推断提供了具体估计器,对您在半参数理论中处理干扰参数及经济理论中的风险度量应用有参考价值。
  • 关键技术: R-estimator, autoregression quantiles, rank-based inference, nuisance parameter, quantile function estimation
  • 为什么对您有用: 涉及半参数理论中处理干扰参数的推断问题(R-estimator),且应用背景为经济风险度量,对您在半参数理论及经济理论(econ theory)的交叉研究有方法迁移价值。

统计计算 / 算法 (stat_computing, 2 篇)

1. 2605.11168 — Variational predictive resampling

  • 作者: Laura Battaglia, Stefano Cortinovis, Chris Holmes, David T. Frazier, Jack Jewson
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在贝叶斯推断中,MCMC 计算代价高昂,而 mean-field 变分推断(MF-VI)虽具可扩展性但常导致后验过度集中且忽略参数依赖,本文旨在解决 MF-VI 的这一缺陷。提出 variational predictive resampling (VPR) 方法,通过预测重抽样框架反复从当前变分预测分布中填补未来观测,更新变分近似并记录隐含参数值。理论上证明了 VPR 返回参数的分布律良定义且有限步近似收敛至该极限。在高斯位置模型中,VPR 结合 MF 预测分布可收敛至精确贝叶斯后验,而最优 MF-VI 存在非消失的渐近偏差。在线性回归、逻辑回归及分层线性混合效应模型上的实验表明,VPR 显著改善了后验不确定性量化并恢复了 MF-VI 丢失的参数依赖,计算效率与 MCMC 相当甚至更优。对您有用:该工作为统计计算(primary interest)提供了一种兼具可扩展性与理论收敛保证的后验抽样新算法,其预测重抽样思想对处理复杂依赖结构的计算问题具有借鉴价值。
  • 关键技术: variational inference, predictive resampling, mean-field approximation, posterior convergence, Bayesian computation
  • 为什么对您有用: 属于 primary interest 中的统计计算方向,提供了一种克服 mean-field 变分推断过度集中的新算法与理论收敛保证,对需要高效贝叶斯计算的模型(如分层模型)有直接应用价值。

2. 2605.10495 — Robust Bayes Acts under Prior Perturbations: Contamination, Stability, and Selection Paths

  • 作者: Christoph Jansen, Georg Schollmeyer
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在有限决策问题的先验扰动下,本文研究了贝叶斯最优行动的鲁棒性量化问题,核心设定为 ε-污染邻域下的先验不确定性。引入两个互补稳定性指标:鲁棒半径(保持贝叶斯最优的最大扰动)与污染需求(成为贝叶斯最优的最小扰动),二者均通过线性规划(LP)刻画,并利用二分法单调性高效求解。基于此提出成本调整稳定性准则,通过正则化参数生成参数化决策规则族,推导了揭示稳定性与成本驱动结构转换的选择路径。实证将框架应用于ETF投资组合选择,展示先验误设下鲁棒选择对经典期望效用的修正。对您而言,该文的线性规划计算方案与经济数据应用可提供参考,但其贝叶斯决策理论框架与您关注的半参数效率/因果推断核心方向距离较远。
  • 关键技术: Bayesian robustness, epsilon-contamination neighborhood, linear programming, bisection method, cost-adjusted stability, portfolio choice
  • 为什么对您有用: 涉及统计计算(线性规划与二分法求解)与经济理论应用(投资组合与ETF数据),但核心贝叶斯决策鲁棒性理论与您主攻的半参数效率/因果推断关联较弱,主要提供计算视角与经济数据集参考。

Maintained by 陈星宇 · Homepage · Source on GitHub