2026-05-22 每日 arXiv 资讯¶
- 高相关论文 3 篇 · 中相关 7 篇 · 其他 15 篇 · 会议/Seminar 事件 0 条
⭐ 高相关论文(按主题分组)¶
因果推断 (causal_inference, 1 篇)¶
1. 2605.21793 — Targeted maximum likelihood estimation of vaccine effectiveness and immune correlates in test-negative design studies with missing data¶
- 作者: Leah I. B. Andrews, Lars van der Laan, Peter B. Gilbert
- 分类: stat.ME · stat.AP · stat.ML
- 相关性 9/10 · novelty:
new_method - 摘要: 在 test-negative design (TND) 观测研究设定下,目标是 healthcare-seeking 人群中症状疾病的因果条件风险比 (causal conditional risk ratio),关键假设包括 TND 的选择结构、无混杂及 missing-at-random。作者提出基于 semiparametric logistic regression 的 TMLE 方法,通过 targeting 步骤将初始估计偏向目标参数,生成 n^{-1/2}-CAN 的有效估计量,同时灵活地做数据驱动的混杂控制与缺失暴露变量处理。理论保证在因果与 MAR 假设下估计量渐近线性且达到 semiparametric efficiency bound。仿真采用 plasmode simulation 评估有限样本表现,实证分析基于 Moderna COVID-3 期试验的 TND 队列评估疫苗有效性与抗体免疫标志物关联。对您有用:该文将 TMLE / efficient influence function 框架系统性地移植到 TND 这一流行病学常用设计,是因果推断效率理论与流行病学应用结合的范例,可借鉴其缺失数据下 semiparametric efficient estimation 的构造思路。
- 关键技术:
targeted maximum likelihood estimation,semiparametric logistic regression,efficient influence function,test-negative design,missing at random,asymptotically linear estimator - 为什么对您有用: 直接连接因果推断(TMLE / efficient influence function)与流行病学应用(TND 设计、疫苗有效性),缺失数据下的 semiparametric efficient estimation 构造对您在 proximal CI 或 mediation 中处理缺失/部分观测场景有方法迁移价值。
数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶
1. 2605.21848 — Block-Independent Likelihood Ratio Testing for High-Dimensional Mean Vectors with Applications to Matrix-Variate Data¶
- 作者: Minsub Shin, Kwangok Seo, Sang Han Lee, Johan Lim
- 分类: stat.ME
- 相关性 8/10 · novelty:
new_method - 摘要: 在高维设定(p≥n)下检验两总体均值向量相等性,经典 Hotelling T² 失效,现有 DLRT 基于变量工作独立假设导致在相关性下功效损失。本文提出 Block Independent Likelihood Ratio Test (BILT),将工作独立假设放松为块独立假设,利用分块协方差结构构建检验统计量。在温和正则条件下,证明了 p→∞ 且 n 较小时 BILT 统计量零分布的渐近正态性,并推导了局部替代假设下的渐近功效。模拟表明 BILT 在控制第一类错误的同时,较 DLRT 在多种协方差结构下有显著功效提升;ADNI 数据集展示了其在矩阵变量总体均值检验中的应用。对您有用:该工作直接推进了您关注的高维假设检验方向,其从独立到块独立的放松策略对处理高维矩阵/张量数据的检验问题具有方法迁移价值。
- 关键技术:
high-dimensional mean test,likelihood ratio test,block independence assumption,asymptotic normality,local alternatives,matrix-variate data - 为什么对您有用: 直接契合您在数学统计(假设检验)与高维统计方面的兴趣;从对角协方差放松至块协方差的结构化假设,为高维矩阵/张量数据的检验提供了新思路,且 ADNI 应用展示了神经影像数据的实证分析范式。
其他 (other, 1 篇)¶
1. 2605.21893 — Sequential Sensitivity Analysis for Multiple Assumptions: A Framework for Understanding Racial Disparity in Police Use of Force¶
- 作者: Thomas Leavitt, Jake Bowers, Luke Miratrix
- 分类: stat.ME · stat.AP
- 相关性 8/10
- 摘要: 在警察武力使用的种族差异因果推断中,识别平均因果效应依赖于"无拦截歧视"与"无遭遇偏倚"两个不可检验的假设,违反任一均会掩盖或扭曲真实效应。现有敏感性分析通常仅针对单一假设进行评估,本文提出了一种顺序敏感性分析框架,允许联合变动这两个假设并考察其交互效应。核心机制是通过参数化偏倚幅度,系统量化联合违反假设对因果结论的影响,从而突破单假设敏感性分析的局限。将该框架应用于 NYPD 2003-2013 年的拦截搜查数据,发现在合理的拦截歧视水平下存在显著的武力种族差异。然而,该差异反映武力歧视的结论对遭遇偏倚的微小偏离极为脆弱,且人口学校准表明这种偏离在现实中是可行的。对您有用之处在于,它拓展了因果推断中敏感性分析的标准范式,展示了如何处理多假设联合违反的交互作用,该思路可迁移至流行病学或经济学中具有多重不可检验假设的因果推断场景。
- 关键技术:
sensitivity analysis,multiple assumptions,sequential sensitivity analysis,bias parameterization,potential outcomes
📌 中相关论文(按主题分组)¶
因果推断 (causal_inference, 1 篇)¶
1. 2605.21846 — Causal Discovery in Structural VAR Models Under Equal Noise Variance¶
- 作者: SeyedSina Seyedi HasanAbadi, Fahimeh Arab, Erfan Nozari, AmirEmad Ghassami
- 分类: stat.ME · cs.LG · stat.ML
- 相关性 5/10 · novelty:
new_method - 摘要: 在线性高斯结构 VAR 模型下,假设结构噪声项具有等方差(equal noise variance),研究同期效应与跨期效应并存时的因果发现问题。与截面数据中等方差假设可点识别唯一 DAG 不同,时间序列设定下一般无法点识别唯一因果图——多个结构 VAR 参数化可诱导相同的平稳观测过程分布。作者引入了适用于此设定的观测等价(observational equivalence)概念,证明等价类由结构方程的正交变换与全局正缩放刻画。基于此刻画,提出观测对齐差异(observational alignment discrepancy),在保持观测分布不变的变换下比较结构模型,并据此提出 ENVAR 方法:在等价类中搜索稀疏的归一化结构代表。合成数据与 fMRI 数据上的实验表明 ENVAR 在等方差假设下优于忽略等价类的方法。对您有用:等方差假设下观测等价类的正交变换刻画为 VAR 设定中的 identification 理论提供了新视角,与您因果推断中 identification 的兴趣相连,但本文核心是结构学习而非效应估计,直接迁移性有限。
- 关键技术:
structural VAR,equal noise variance assumption,observational equivalence class,orthogonal transformation characterization,sparsity-based model selection,observational alignment discrepancy - 为什么对您有用: 等方差假设下观测等价类的正交变换刻画是 identification 理论的新结果,与您因果推断中 identification 的兴趣相关;但本文聚焦因果发现/结构学习而非效应估计或敏感性分析,与您核心关注点的直接重叠有限。
非参数 / 半参数 (nonparam_semipara, 4 篇)¶
1. 2605.21757 — Substantive-Model-Compatible Multiple Imputation for Cox Regression with a Diverging Number of Covariates¶
- 作者: Zhilin Zhang, Yi Li
- 分类: stat.ME
- 相关性 7/10 · novelty:
new_method - 摘要: 在高维 Cox 回归中,当协变量维度随样本量发散且存在缺失时,如何进行多重插补与推断。现有 SMC-FCS 方法仅适用于固定维度设定,本文将其推广至发散维度:通过 ridge 正则化后验抽样稳定插补模型,用拒绝采样保证 substantive-model compatibility,并以插补-正则化迭代稳定 Cox 估计量。对低维线性泛函 c^⊤β,结合 debiased 估计量与 Rubin 规则进行池化推断,在发散维度下建立了池化估计量的一致性与渐近正态性。模拟显示有限样本表现良好,Boston 肺癌生存队列展示了实际应用。对您而言,该文将 debiased inference 与多重插补在发散维度下统一的理论框架,可为高维缺失数据下 semiparametric efficiency 与 debiased ML 的延伸提供参考,同时流行病学队列数据集具有复用价值。
- 关键技术:
SMC-FCS multiple imputation,ridge-regularized posterior draws,debiased estimator for diverging dimension,Rubin's rules pooling,Cox proportional hazards,substantive-model compatibility - 为什么对您有用: 连接您 primary interest 中的高维 debiased inference 与 semiparametric theory(发散维度下 debiased 估计量的渐近正态性),同时 Boston 肺癌生存队列属于您 secondary interest 中流行病学的真实数据集。
2. 2605.22354 — From Volterra Series to Kunchenko Stochastic Polynomials: Half a Century of Non-Gaussian Estimation Methodology¶
- 作者: Serhii Zabolotnii
- 分类: stat.ME · eess.SP
- 相关性 5/10 · novelty:
survey - 摘要: 本文回顾了 Kunchenko 学派半个世纪以来在非高斯估计方面的半参数方法发展,从 1972 年 Volterra 级数估计随机过程参数出发,梳理至 2006–2026 年的 Kunchenko 随机多项式体系。核心方法包括:用于参数估计的多项式最大化方法(PMM)、用于假设检验的多项式准则,以及基于生成元空间的分解;PMM 本质上是依赖参数的矩–累积量程序,与 MMSE/L2 协方差投影有本质区别。文章建立了有限 Volterra 模型与广义 Kunchenko 多项式之间的形式化桥梁,并明确 PMM 效率增益的条件:矩存在、中心相关矩阵非退化、方差缩减系数小于一。作为历史综述,方法学新颖性有限,但 PMM 的矩–累积量框架与高阶 U-统计量投影技术有结构相似性,对您在 higher-order U-statistics 与 semiparametric efficiency 的交叉思考可能提供不同传统的视角。
- 关键技术:
Kunchenko stochastic polynomials,polynomial maximization method (PMM),Volterra series parameter estimation,moment-cumulant procedures,centered correlant matrix,polynomial hypothesis testing criteria - 为什么对您有用: PMM 的矩–累积量多项式结构与您关注的 higher-order U-statistics 投影/退化核技术有结构对应,且该文将 Kunchenko 框架定位为半参数非高斯估计,可为您在 semiparametric efficiency bound 与非高斯设定下的比较提供一条不同学派的参考路径。
3. 2605.22062 — A Circular Chatterjee's Correlation Coefficient¶
- 作者: Sourav Majumdar
- 分类: math.ST · stat.TH
- 相关性 4/10 · novelty:
new_method - 摘要: 针对环形数据的非参数独立性检验与函数依赖测度,解决经典 Chatterjee 秩相关系数需人为切断环面导致有限样本结果不一致的问题。提出环形 Chatterjee 系数,总体构造对环形秩空间的响应截断取平均,有限样本构造对样本截断间隙取平均,化简为仅依赖循环秩的简单统计量。该系数保持方向性,在非原子边际分布下,独立时为0、存在可测函数依赖时为1。证明了估计量的一致性,并导出了独立假设下分布无关的渐近零分布。模拟显示其对多圈环形依赖(如响应绕圆两圈而预测变量绕一圈)具有强检测力,弥补了传统环形相关的盲区。对您在非参数假设检验的兴趣有直接理论联系,且环形数据在天文统计中极为常见,方法可迁移至天体位置/相位等数据集分析。
- 关键技术:
Chatterjee's rank correlation,circular data,cyclic ranks,distribution-free test,independence testing,nonparametric dependence measure - 为什么对您有用: 该文属于非参数假设检验的新方法,同时环形数据是天文统计(您的 secondary interest)中的典型数据结构(如赤经/相位),此方法可直接迁移用于天文数据集的依赖性发现。
4. 2605.22062 — A Circular Chatterjee's Correlation Coefficient¶
- 作者: Sourav Majumdar
- 分类: math.ST · stat.TH
- 相关性 4/10 · novelty:
new_method - 摘要: 本文针对圆周数据提出了一个无需任意截断点的 Chatterjee 秩相关系数的圆周版本,旨在检测圆周变量间的函数依赖关系。该系数在总体构造上对圆周秩空间中的响应截断取平均,在有限样本下对样本截断间隙取平均,从而简化为仅依赖循环秩的简单统计量。在非原子圆周边际下,该系数在独立时精确为零,在圆周响应为圆周预测变量的可测函数时精确为一。文章证明了该估计量的一致性,并推导了其在独立性原假设下的 distribution-free 渐近零分布。对您在非参数假设检验方面的兴趣有直接参考价值,特别是其处理多缠绕圆周关系的能力为方向性数据的独立性检验提供了新工具。
- 关键技术:
Chatterjee's rank correlation,circular rank statistics,distribution-free test,nonparametric independence testing,functional dependence measure - 为什么对您有用: 直接关联您在非参数理论与假设检验方面的兴趣;Chatterjee 系数是近年非参数依赖性度量的热点,本文将其拓展至圆周数据并给出 distribution-free 零分布,对研究非参数检验的渐近理论有参考价值。
数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶
1. 2605.22025 — Testing for Serial Independence via Auto Hilbert-Schmidt Independence Criterion¶
- 作者: Muyi Li, Yuqing Xu, Zhou Zhou
- 分类: stat.ME
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文在严平稳时间序列设定下,基于 Hilbert-Schmidt 独立性准则(HSIC)提出 AutoHSIC 框架,用于检验观测与其滞后项之间的非线性序列独立性。经验 AutoHSIC 统计量是由重叠观测构造的滞后 U-statistic,即使在 i.i.d. 原假设下也具有时间依赖性,因此其渐近分析必须处理原假设下的退化问题,这不同于标准 i.i.d. HSIC 理论。文章建立了单滞后与 portmanteau 检验统计量在原假设及固定备择假设下的极限分布。针对极限零分布非 pivotal 的问题,作者发展了 wild bootstrap 过程逼近临界值并证明其渐近有效性,同时将框架扩展至残差诊断以处理参数估计的影响。该文对您有用,因为它直接处理了时间序列设定下退化 U-statistic 的渐近分析,这是您 higher-order U-statistics 与 hypothesis testing 兴趣的交叉点,且残差诊断部分对经济时间序列建模有应用价值。
- 关键技术:
Hilbert-Schmidt Independence Criterion (HSIC),lagged U-statistic,degenerate U-statistic asymptotics,wild bootstrap,portmanteau test,residual-based diagnostics - 为什么对您有用: 直接涉及您 primary interest 中的 hypothesis testing 与 higher-order U-statistics(处理时间序列重叠观测导致的退化 U-statistic 渐近性),同时残差诊断扩展对 secondary interest 中的 econ theory(时间序列建模)有直接应用价值。
统计计算 / 算法 (stat_computing, 1 篇)¶
1. 2605.21641 — Stable direct estimation for GPLSIAMs using P-splines with dynamically updated boundaries¶
- 作者: Danilo V. Silva, Gilberto A. Paula
- 分类: stat.ME · stat.CO
- 相关性 5/10 · novelty:
new_method - 摘要: 本文研究广义部分线性单指标可加模型(GPLSIAM)的稳定数值估计问题,目标是在非高斯分布下同时估计参数单指标系数与非参数可加函数。核心方法利用每个单指标效应的模型矩阵与惩罚完整 Fisher 信息矩阵,在统一迭代框架内动态更新单指标协变量的边界,避免了传统两步法中边界固定导致的数值不稳定。平滑参数通过广义 Fellner-Schall 方法更新,复用已计算的矩阵分解,从而高效逼近全局惩罚优化问题;由此可快速计算有效自由度与逐点置信带。模拟显示在中等样本量下估计具有经验一致性,且在竞争方法无法恢复真实系数与非线性函数的场景下仍保持稳定,最耗时场景下比两步法快约 80 倍。对您而言,该文在统计计算(矩阵分解复用、迭代边界更新策略)方面提供了可迁移的数值算法思路,同时单指标模型的半参数推断(置信带、有效自由度)与您的半参数理论兴趣有交叉,但理论深度偏向计算而非效率界。
- 关键技术:
P-spline penalization,penalized complete Fisher information matrix,generalized Fellner-Schall method,dynamic boundary update,single-index model matrix decomposition,effective degrees of freedom - 为什么对您有用: 与您的统计计算兴趣直接相关(矩阵分解复用加速迭代优化、R 实现透明可复现),单指标模型的半参数设定与置信带构造触及您的半参数理论兴趣,但本文侧重计算稳定性而非 semiparametric efficiency bound 或 influence function 理论。
🗂 其他论文(仅 LLM 评分,未生成摘要)¶
未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。
1. 2605.22400 — STARFIRE-2: Can we detect the global redshifted 21-cm signal from the cosmic dawn in Earth orbit?¶
- 作者: Yogen Pranesh (Department of Physics, University of Rome Tor Vergata, Raman Research Institute, Bangalore), Mayuri Sathyanarayana Rao (Raman Research Institute, Bangalore), Saurabh Singh (Raman Research Institute, Bangalore)
- 分类: astro-ph.IM · astro-ph.CO
- 相关性 3/10
- 评分理由: Astronomy paper on 21-cm signal detection feasibility; primarily an engineering/RFI assessment study rather than a paper articulating a clear statistical data/model problem for an outsider.
2. 2605.21535 — An Old Look at Empirical Bayes¶
- 作者: Nicholas G. Polson, Vadim O. Sokolov, Daniel Zantedeschi
- 分类: stat.ME
- 相关性 3/10
- 评分理由: Empirical Bayes discussion is loosely related to hierarchical modeling but lacks direct connection to the researcher's specific theoretical focuses.
3. 2605.21627 — Distribution-free root cause analysis¶
- 作者: Rohan Hore, Aaditya Ramdas
- 分类: stat.ME · stat.ML
- 相关性 3/10
- 评分理由: Conformal p-values for change-point detection touches hypothesis testing, but 'root cause analysis' here is anomaly detection, not causal inference.
4. 2605.21651 — Similarity-Driven Proposals for MCMC Algorithms on Discrete Spaces¶
- 作者: Luca Aiello, Raffaele Argiento, Alexandros Beskos, Maria De Iorio
- 分类: stat.ME · stat.CO
- 相关性 3/10
- 评分理由: MCMC algorithm for discrete spaces falls under statistical computing but misses the theoretical depth of the researcher's primary interests.
5. 2605.21884 — Trend and seasonality estimation for point-process time series¶
- 作者: Daniel Gervini, Simon A. Kopischke
- 分类: stat.ME
- 相关性 3/10
- 评分理由: M-estimators for point-process time series with asymptotic theory; tangential to the researcher's primary semiparametric/causal interests.
6. 2605.21530 — Pairwise Distance-Diffusion Analysis (PDDA): A Geometric Framework for Estimating Hurst Exponents in Multivariate Long-Memory Processes¶
- 作者: Diogo C. Soriano, Frederique Vanheusden, Slawomir J. Nasuto
- 分类: stat.ME · nlin.CD · physics.data-an
- 相关性 2/10
- 评分理由: Long-memory process estimation is tangential to the researcher's core interests in causal inference, high-dimensional RMT, and semiparametric efficiency.
7. 2605.21782 — A Scalable Parametric Item Calibration Engine (SPICE) for Explanatory IRT with Sparse Data¶
- 作者: Steven W. Nydick, Manqian Liao, J. R. Lockwood
- 分类: stat.ME · stat.AP · stat.CO
- 相关性 2/10
- 评分理由: Psychometric IRT estimation is largely unrelated to the researcher's core theoretical and applied interests.
8. 2605.22004 — Selecting Informative Conformal Prediction Sets with an Optimized FCR-Controlled Approach¶
- 作者: Israela Solomon, Etienne Roquain, Saharon Rosset, Ruth Heller
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Conformal prediction with selective inference control is largely outside the researcher's primary methodological interests.
9. 2605.22038 — A Mixed Self-Exciting Process to Model Epileptic Seizures¶
- 作者: Karen Kanaster, Giovani L. Silva, Peter Mueller, Jacob Pellinen, Elizabeth Juarez-Colunga
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Bayesian Hawkes process for seizure modeling is an epidemiology-adjacent application but lacks causal inference or primary methodological overlap.
10. 2605.22110 — Two-stage Ensemble Clustering of Functional Data Using Random Projections¶
- 作者: Sourav Chakrabarty, Anirvan Chakraborty, Shyamal K. De
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Functional data clustering via random projections has no clear connection to the researcher's primary interests in causal inference, high-dim theory, or U-statistics.
11. 2605.22253 — Bayesian Nonparametrics: Principles and Practice¶
- 作者: Nils Lid Hjort, Chris Holmes, Peter Mueller, Stephen G. Walker
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Book preface providing an overview of Bayesian nonparametrics; no novel theory or method advancing the researcher's primary interests.
12. 2605.22301 — Chained Markov melding using divide and conquer sequential Monte Carlo¶
- 作者: Yixuan Liu, Robert J. B. Goudie
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Bayesian model melding with SMC is computational Bayesian methodology; little overlap with causal inference, high-dim theory, or efficiency.
13. 2605.22640 — Positive-definiteness in separable priors: effects on prior interpretability and inference¶
- 作者: Jack Storror Carter, David Rossell
- 分类: stat.ME
- 相关性 2/10
- 评分理由: Priors for positive-definite matrices with truncation analysis is Bayesian methodology; tangential to the researcher's core theoretical interests.
14. 2605.22407 — Hostless extragalactic transients in Fink: Results from the ELEPHANT pipeline¶
- 作者: R. Durgesh, P. J. Pessi, E. E. O. Ishida, J. Peloton
- 分类: astro-ph.IM · astro-ph.CO
- 相关性 1/10
- 评分理由: Astroinformatics pipeline paper with heavy jargon, no statistical methodology content, and no clear data/model exposition accessible to an outsider statistician.
15. 2605.22595 — A new class of functional conditional autoregressive models¶
- 作者: Sooran Kim
- 分类: stat.ME
- 相关性 1/10
- 评分理由: Spatial functional CAR models are unrelated to the researcher's primary interests in causal inference, high-dim statistics, or efficiency theory.
Maintained by 陈星宇 · Homepage · Source on GitHub