2026-06-12 每日 arXiv 资讯¶
- 高相关论文 6 篇 · 中相关 19 篇 · 其他 55 篇 · 会议/Seminar 事件 0 条
⭐ 高相关论文(按主题分组)¶
因果推断 (causal_inference, 3 篇)¶
1. 2606.14132 — HSCI: Neyman-Orthogonal Causal Inference under High-Dimensional Proportional Hazards¶
- 作者: Yingying Fan, Lan Gao, Daoji Li, Jinchi Lv
- 相关性 9/10 · novelty:
new_method - 摘要: 在高维生存分析设定下,本文研究 Cox 比例风险模型中处理效应的因果推断问题,目标 estimand 为处理效应系数,关键假设为稀疏高维 Cox 模型与高维 logistic 倾向得分模型。核心方法是通过构造处理效应的 Neyman 近正交得分来缓解高维 nuisance 参数估计偏差,并结合 cross-fitting 实现样本分割。在双重稳健 nuisance-rate 条件下,证明了估计量的 n^{-1/2}-CAN 性质与方差的一致估计,并将框架扩展至高维生存协变量效应的推断。模拟显示 HSCI 相较于正则化 Cox 估计大幅降低偏差,并在不同维度、删失与倾向模型误设下维持置信区间覆盖率。对您有用:本文将 debiased ML / orthogonal score 的效率理论工具系统化地移植到高维生存因果推断,是 semiparametric efficiency 与 causal inference 交叉方向的典型新方法工作。
- 关键技术:
Neyman near-orthogonal score,cross-fitting,doubly robust nuisance-rate conditions,Cox proportional hazards model,high-dimensional logistic propensity score,root-n asymptotic normality - 为什么对您有用: 本文直接连接 causal inference 的处理效应估计与 efficiency theory 的 debiased ML / orthogonal score 工具,在高维 Cox 模型下实现了 n^{-1/2}-CAN 与双重稳健性。您可以用 very_familiar 的高维渐近理论与 minimax bound 视角审视其 nuisance-rate 条件是否紧,或用 moderately_familiar 的 semiparametric theory 推导该设定下的 semiparametric efficiency bound 以验证其正交得分是否达到最优。Follow-up 判断:立即可做——用现有武器库即可复现其正交得分构造并检验效率界。
2. 2606.13947 — Constraint-based difference graph discovery in a linear setting¶
- 作者: Daria Bystrova, Emilie Devijver
- 相关性 9/10 · novelty:
new_theory - 摘要: 本文研究在两个环境下推断线性结构因果模型(SCM)差异图(difference graph)的因果发现问题,目标 estimand 为跨环境回归系数是否相等所刻画的边差异。作者指出回归系数的不变性由超越标准 d-separation 的图条件决定,因此提出新的图准则 diff-separation,精确刻画了何种条件集能阻断所有导致跨环境回归系数差异的路径。基于此准则,引入 diff-faithfulness 假设,将 diff-separation 的图陈述与回归系数等式约束联系起来。最终提出 LDiffPC 算法,以 PC 算法风格通过回归系数等式检验从多环境数据中恢复差异图。对您可能有用:本文的 diff-separation 扩展了经典 d-separation,为多环境因果发现提供了新的 identification 理论视角。
- 关键技术:
difference graph,diff-separation criterion,diff-faithfulness assumption,regression coefficient equality test,PC-style causal discovery algorithm,linear structural causal model - 为什么对您有用: 本文直接连接到 causal inference 的 identification theory 子方向,提出了超越 d-separation 的 diff-separation 准则,为多环境因果图发现提供了新的图论刻画。您武器库中 moderately_familiar 的 identification theory in causal inference 可以直接用来审视 diff-faithfulness 假设的合理性及可放宽空间,very_familiar 的 nonparametric statistics 可用于将当前基于线性回归系数等式检验的 LDiffPC 推广到半参数/非参数设定。follow-up 粗判:立即可做——用现有 identification 与非参数工具即可着手研究 diff-separation 在非参数 SCM 下的推广及相应检验的渐近性质。
3. 2606.14131 — G-computation for causal effect estimation from observational hierarchical data with unmeasured cluster context¶
- 作者: Shafayet Khan Shafee, Bishal Sarker, Md. Niamul Islam Sium
- 相关性 8/10 · novelty:
new_method - 摘要: 在分层观测数据(个体嵌套于集群)设定下,目标为平均处理效应(ATE),关键假设是存在未测量的集群水平混杂因子,且该因子可能同时引发处理效应异质性。作者将 g-computation 扩展至分层结构,在 outcome 模型中引入随机效应模型(REM)以吸收未测集群变异,并提出 within-group g-computation 策略:按集群的处理比例(treatment prevalence)分组,在组内执行 g-computation 后再聚合组特异估计。Monte Carlo 模拟表明,当未测集群变量仅作混杂时,标准与 within-group REM 均大幅减偏;当其同时驱动效应异质性时,within-group REM 的 RMSE 最小。实证分析使用 2019 孟加拉国 MICS 数据估计青少年怀孕对儿童身高 Z-score 的因果效应为 -0.12(95% bootstrap CI [-0.18, -0.06])。对您可能有用:本文为纵向/分层因果推断中未测集群混杂的 g-formula 扩展提供了一个具体案例。
- 关键技术:
g-computation,random-effects model,within-group estimation,treatment prevalence stratification,cluster-level confounding,bootstrap confidence interval - 为什么对您有用: 本文直接连接 causal inference 中纵向/分层数据的 identification 与 estimation 子方向,处理未测集群混杂的策略(按 treatment prevalence 分组 + REM)属于 semiparametric 理论中 partial pooling 的启发式变体。用您 very_familiar 的 estimation theory in causal inference 可审视其 identification 逻辑是否完备(分组策略是否等价于某种 conditional ignorability),并用 moderately_familiar 的 semiparametric theory 评估其 estimator 的效率性质(是否触及 semiparametric efficiency bound)。Follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,才能将此启发式 within-group 策略严格嵌入 influence function / TMLE 框架并推导效率界。
高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶
1. 2606.14450 — Universality for Products of Random Matrices with i.i.d. Entries and the Fuss--Catalan Number¶
- 作者: Yanjin Xiang, Kun Chen, Zhihua Zhang
- 相关性 8/10 · novelty:
sharper_rate - 摘要: 在单一 i.i.d. 随机矩阵阵列(均值0、方差σ²、有限四阶矩)设定下,本文研究固定乘积矩阵的几乎必然极限算子范数。定义第 k 阶自由系数 γ_k=√((k+1)^{k+1}/k^k),证明单矩阵幂 ‖X_n^k‖ 及从有限独立副本池中抽样替换的任意乘积的范数均几乎必然收敛至 σ^k γ_k。核心上界技术是对 E[Tr((X_n^k X_n^{*k})^m)] 做高阶矩展开:主导的零缺陷迹词呈树状结构,其计数由 Fuss–Catalan 数 F_{k,m} 精确给出;对缺陷为 r 的词类,设计了缺陷敏感全局枚举,证明其数量至多为 F_{k,m}(Cm)^{Dr}(多项式损失,阶数与缺陷成比例),从而在 log矩范围内可求和。该结果将经典 Bai–Yin 型幂估计从 σ^k(k+1) 改进至 σ^k√(k+1)。对您有用:本文的迹词组合枚举与缺陷计数框架,为高阶 U-统计量中的 treewidth / tensor contraction 复杂度分析提供了直接可迁移的组合工具。
- 关键技术:
high-moment trace expansion,Fuss-Catalan number enumeration,defect-sensitive global enumeration,operator norm convergence,free probability freeness coefficient - 为什么对您有用: 直接连接到 primary interest 中的 Random matrix theory,其核心组合工具(迹词的树状结构计数与缺陷敏感枚举)与您 very_familiar 的 higher-order U-statistics treewidth / tensor contraction 视角高度同构——U-统计量的高阶矩展开同样面临词/图的组合计数与复杂度分级问题。立即可做:用您熟悉的 treewidth / einsum 组合框架重新审视本文的 Fuss–Catalan 迹词枚举,验证其缺陷敏感多项式损失界是否可迁移至高阶 U-统计量的方差/矩界分析中。
数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶
1. 2606.14092 — Cauchy Aggregation of Ridge-Regularized Hotelling Tests for High-Dimensional Change-Point Detection¶
- 作者: Ping Zhao, Le Zhou, Long Feng
- 相关性 8/10 · novelty:
new_method - 摘要: 在高维变点检测设定下,针对ridge-regularized Hotelling (RHT) 检验中ridge参数λ的最优值依赖未知协方差与均值漂移的问题,提出在有限确定性网格上计算固定λ的p值并用Cauchy组合规则聚合,以避免单一λ选择。在标准随机矩阵条件下,建立了ridge过程的有限网格联合弱收敛,由此导出联合极限校准下的固定水平有效性及解析Cauchy p值的小尾有效性。Monte Carlo表明该方法尺寸稳定,且功率接近最优固定ridge选择。对您有用:将RMT高维渐近与多检验Cauchy聚合结合,为高维假设检验中参数选择难题提供了一条有理论保证的实用路径。
- 关键技术:
ridge-regularized Hotelling test,Cauchy combination rule,random matrix joint weak convergence,high-dimensional change-point detection,finite-grid ridge process - 为什么对您有用: 直接连接高维假设检验与随机矩阵理论(RMT)两个primary interest子方向;您武器库中的高维渐近理论可直接攻入其联合弱收敛证明,而Cauchy聚合的p值组合技巧与您熟悉的minimax bound分析可验证其声称的功率稳定性是否紧。立即可做:用very_familiar的高维渐近工具复现或推广其ridge process极限定理。
经济理论 / 应用 (econ_theory, 1 篇)¶
1. 2606.14057 — Granular Instrumental Variables: Estimation and Inference¶
- 作者: Jinyong Hahn, Niu He, Zhipeng Liao, Wenyu Zhou
- 相关性 9/10 · novelty:
new_method - 摘要: 在带有潜在聚合冲击(latent aggregate shocks)的因子模型设定下,本文研究 granular instrumental variables (GIVs) 的识别与估计问题,目标 estimand 为结构参数(如股权需求弹性)。核心洞察是:有效 GIV 可由因子载荷空间(factor-loading space)的正交补刻画,从而在载荷未知时提供可行的 GIV 构造程序,且不要求截面维度 N→∞。估计与推断基于正交补投影构造的 IV,辅以 specification test 检验 GIV 有效性;实证应用于估计聚合股权市场乘数,揭示投资者部门间需求弹性的异质性,为 inelastic-markets 假设提供细化证据。对您有用:本文将因子结构正交性与 IV 有效性直接挂钩,为经济理论中的 IV 应用提供了新颖的 identification 视角。
- 关键技术:
granular instrumental variables,factor-loading space orthogonal complement,latent aggregate shocks,specification testing for IV validity,heterogeneous demand elasticity estimation - 为什么对您有用: 本文直接连接经济理论中的 IV 方法与因果推断 identification 理论:它将因子载荷空间的正交补作为 IV 有效性条件,是 identification theory 在计量经济因子模型中的新颖应用。您武器库中 'identification theory in causal inference'(moderately_familiar)可直接切入其正交补识别条件的理论分析,而 'high-dimensional asymptotics'(very_familiar)可用于审视其不依赖大 N 的推断程序是否可进一步在高维载荷下获得 sharper rate。Follow-up 判断:中期可做——需先在 moderately_familiar 的 identification theory 上长肌肉,以将此正交补 IV 框架推广至更一般的潜变量因果模型。
📌 中相关论文(按主题分组)¶
高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶
1. 2606.14436 — Joint Nuclear and \(\ell_1\) Regularization for Logistic Matrix Regression with Applications to Brain Imaging¶
- 作者: Damian Brzyski, Aaron Cohen, Zijian Wang, Mario Dzemidzic, David A. Kareken, Jaroslaw Harezlak
- 相关性 7/10 · novelty:
new_method - 摘要: 在 scalar-on-matrix logistic 回归设定下,目标是估计高维矩阵型预测变量的系数矩阵,同时假设该系数矩阵兼具低秩与稀疏结构。本文提出联合 nuclear norm 与 ℓ1 norm 的凸惩罚框架,以同时强制低秩与稀疏性,从而获得可解释的估计。求解方面,作者基于 ADMM 设计了定制算法,并证明了所得凸优化解的理论性质。数值实验表明该方法在恢复预测模式上优于单一惩罚方案;脑成像应用识别了与酒精使用障碍家族史相关的功能连接结构。对您而言,本文将矩阵系数估计与 nuclear norm(低秩)惩罚直接挂钩,是 RMT 与高维矩阵回归交叉的典型实例。
- 关键技术:
nuclear norm regularization,ℓ1 norm penalty,scalar-on-matrix logistic regression,ADMM algorithm,convex optimization,low-rank sparse matrix estimation - 为什么对您有用: 本文连接到高维统计与矩阵回归方向,核心是 nuclear norm 惩罚下的低秩矩阵估计——与您熟悉的高维渐近理论与 RMT 直接相关。您可用 very_familiar 中的高维渐近理论工具分析该 estimator 在 p/n → γ 有限情形下的收敛率与相变阈值,验证其声称的理论性质是否可进一步 sharpen。中期可做:需先在 moderately_familiar 的 M-estimation 理论上补充矩阵参数空间中 M-estimator 的渐近分析,再切入理论改进。
非参数 / 半参数 (nonparam_semipara, 4 篇)¶
1. 2606.14514 — Nonparametric inference on Fokker-Plank and McKean-Vlasov models¶
- 作者: Adriana Laurindo Monteiro, Roberto Imbuzeiro Oliveira
- 相关性 7/10 · novelty:
new_method - 摘要: 本文针对 d 维相互作用粒子系统,提出一种基于核估计的 velocity field 非参数推断方法。设定粒子初始位置独立同分布于 μ₀,动力学由 Fokker-Planck 方程或 McKean-Vlasov 方程驱动,目标为恢复势函数或相互作用核。估计器核心为核光滑,利用时间离散观测和粒子样本构造经验分布梯度。收敛性分析给出显式均方误差率 h² + N^{-2/(d+2)},其中 h 为时间步长、N 为粒子数。在 Fokker-Planck 设定下可反卷积势函数;在 McKean-Vlasov 设定下可识别平均场相互作用核。该工作将经典非参数技术扩展到粒子系统反问题,为统计学家从粒子动力学数据中推断底层机制提供了理论保证。与您非常熟悉的非参数统计和反问题领域直接相关,值得作为进入相互作用粒子系统推断的入口阅读。
- 关键技术:
kernel density estimation,Fokker-Planck equation,McKean-Vlasov equation,mean-field interaction,time-discretization,mean-squared error rate - 为什么对您有用: 该论文将非参数核估计系统性应用于Fokker-Planck与McKean-Vlasov动态系统的反问题,属于您非常熟悉的非参数统计领域,且问题设定可视为带噪声的反问题(velocity field的逆估计)。您现有武器库中的非参数统计与minimax界技术可直接用于理解其收敛率是否最优,并尝试推广至交互核的分量稀疏或非同质性设定。立即可做:用您熟练掌握的非参数工具检验该文提出的率是否紧,并探索在d较大时是否可能存在更好自适应方法。
2. 2606.14087 — Confidence Bands for the Gradient Lines of a Density Function¶
- 作者: Ery Arias-Castro, Wanli Qiao
- 相关性 6/10 · novelty:
new_method - 摘要: 本文研究密度函数梯度上升线的统计推断问题,目标是为从给定点出发的梯度上升线构建置信区域。基于核密度估计的插件估计量,作者建立了该估计量在适当光滑条件下的弱收敛结果,从而为构造渐近有效的置信带提供了理论基础。方法的核心在于利用核密度估计的渐近正态性,并通过Delta方法推导梯度线估计的极限分布。进一步,作者还介绍了基于bootstrap的置信带构造方法,以放松对渐近协方差矩阵显式估计的依赖。理论结果涵盖了估计量的逐点和函数型收敛性质,但主要贡献在于将弱收敛从密度估计推广到其梯度上升线这一几何特征。该工作与您对非参数推断的兴趣直接相关,特别是针对密度函数几何特征的推断问题,您熟悉的非参数渐近理论足以理解甚至扩展本文的方法。立即可做的后续方向包括:将当前的一维梯度上升线推广到高维情形,或研究密度水平集(如脊线)的置信区域。
- 关键技术:
kernel density estimation,plugin estimator,weak convergence,confidence bands,bootstrap,functional delta method - 为什么对您有用: 本文属于非参数推断领域,具体涉及密度函数几何特征的统计推断,这与您的主要兴趣(非参数理论、假设检验)高度吻合。您的技术武库中“nonparametric statistics”和“inverse problems with random noise”可直接用于理解本文的弱收敛论证(核密度估计的渐近分布是经典工具),因此属于立即可做的范畴。该工作可作为您进入密度几何推断方向的切入点,后续可探索更复杂的流形与几何特征推断。
3. 2606.14085 — Bias-corrected empirical likelihood-based inference for the tail index under heavy-tailed models¶
- 作者: Haodi Liang, Natalia Nolde
- 相关性 5/10 · novelty:
new_method - 摘要: 在重尾模型设定下,目标是估计刻画尾部衰减的 tail index 参数,现有极值估计常受二阶尾部行为的偏差困扰。本文将偏差校正(bias-correction)与经验似然(empirical likelihood)结合,提出一种新的 tail index 估计量,以同时修正偏差并利用经验似然的形状约束优势。作者建立了该估计量的渐近理论,证明了其收敛性质与分布逼近,并通过模拟与真实数据验证有限样本表现。对您可能有用:本文将经验似然这一半参数工具引入极值分析的偏差校正框架,为重尾分布下的 semiparametric inference 提供了新视角。
- 关键技术:
empirical likelihood,bias-correction for extreme value estimators,tail index estimation,second-order regular variation,asymptotic distribution theory,Hill estimator modification - 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 子方向,核心是将经验似然这一半参数推断工具与极值估计的偏差校正结合。(2) 您武器库中的 nonparametric statistics 与 minimax bounds 理论可直接审视该估计量在二阶 regular variation 假设下的渐近效率是否达到半参数有效界,以及偏差校正后的收敛率是否 minimax optimal。(3) 中期可做:若要在此方向深入,需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以推导偏差校正经验似然估计量的 M-estimator 渐近性质与影响函数。
4. 2606.13213 — Calibrating simplified vine copulas with a noise contrastive estimation approach¶
- 作者: Michael Denis Kraus, David Huk, Claudia Czado
- 相关性 5/10 · novelty:
new_method - 摘要: 在简化藤蔓copula(simplified vine copula)框架下,目标是修正因条件依赖假设(simplifying assumption)导致的局部模型误设定问题。核心方法是将已拟合的简化藤蔓copula视为噪声分布,利用噪声对比估计(NCE)将密度估计重构为二分类任务,从而为每个观测生成特定的修正因子。这些修正因子提供经局部调整的观测级对数似然估计,在简化假设被违反时有效提升模型精度,而在假设成立时保持中性。模拟与两项实际数据应用验证了该策略的实用性。对您可能有用:NCE作为密度估计的替代工具,为semiparametric模型中局部误设定的诊断与修正提供了新视角。
- 关键技术:
vine copula,simplifying assumption,noise contrastive estimation,density estimation via binary classification,observation-specific correction factor,local model misspecification adjustment - 为什么对您有用: 本文连接到semiparametric theory中模型误设定与局部修正的子方向,将NCE这一计算统计工具引入copula的密度估计修正。用您武器库中very_familiar的software development与moderately_familiar的M-estimation理论,可以审视该观测级修正因子的理论性质(如是否影响渐近效率或产生额外偏差)。属于中期可做:需先在moderately_familiar的semiparametric theory上长肌肉,以建立修正估计量的渐近分析框架。
数理统计 / 假设检验 (hypothesis_testing, 4 篇)¶
1. 2606.14335 — Recovery thresholds for hidden weighted sparse graphs¶
- 作者: Zhe Hou, Jingcheng Liu
- 相关性 7/10 · novelty:
new_theory - 摘要: 本文研究隐藏加权稀疏图的恢复问题:给定一张完全图,每条边独立地以概率来自隐藏图H(服从分布P_n)或噪声(服从Q_n),目标是几乎精确地恢复H。在假设P_n和Q_n之间的Rényi散度满足局部Lipschitz条件,且图类H_n满足温和密度条件的前提下,给出了几乎精确恢复的信息论极限的统一刻画。该刻画将KL散度与Erdős-Rényi随机图G(n,p)的一阶矩阈值对数联系起来,揭示了恢复阈值与图结构的关系。下界也推广到部分恢复问题,其中只需恢复常数λ比例的边。对于Bernoulli、Exponential以及Gaussian等具体分布,进一步展示了指数尺度上的All-or-Nothing阈值现象。本文的方法为高维统计中图恢复问题的信息论基准提供了统一的框架,对您在高维统计和假设检验方向的工作具有参考价值。
- 关键技术:
Rényi divergence,KL divergence,first moment method,Erdős-Rényi random graph,almost exact recovery threshold,All-or-Nothing phenomenon - 为什么对您有用: 本文研究的高维图恢复问题是您primary interest中high-dimensional statistics和hypothesis testing的具体子方向。您熟悉的minimax bounds技术可用于验证本文阈值的紧性,而本文的All-or-Nothing现象与您在统计-计算权衡中关注的相变问题有概念联系,可作为理解信息论基准的入门材料。当前对图恢复的信息论极限可立即可做,因为您对高维渐近和minimax下界方法已经很熟悉,能直接理解本文推导并用于对比计算极限。
2. 2606.13864 — The Generalized Fisher Transformation: Finite-Sample Properties and Inference¶
- 作者: Ilya Archakov, Peter Reinhard Hansen
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究广义Fisher变换(GFT)对相关矩阵参数化的有限样本性质,该变换定义为γ(C)=vecl log C,将Fisher变换推广到n>2维。对于椭圆分布数据,GFT坐标的有限样本分布接近高斯分布,且坐标之间近似不相关,协方差矩阵几乎不依赖于真实相关矩阵C。这种近似正交性和不变性使得基于GFT的推断(如置信区间和假设检验)在有限样本中比基于样本相关系数或逐元素Fisher变换的推断更优,估计误差近似高斯、弱依赖且几乎枢轴化。文中通过理论分析和数值模拟验证了这些性质,为相关矩阵的统计推断提供了实用工具。该工作对您在高维假设检验和相关性分析中的方法选择有直接参考价值,尤其适用于需要改进相关矩阵推断精度的场景。
- 关键技术:
Generalized Fisher Transformation,matrix logarithm,vecl operator,elliptical distributions,finite-sample inference - 为什么对您有用: 该论文直接关联您对数学统计中假设检验的兴趣,为相关矩阵的推断提供了一种有限样本性质更优的变换方法。您武器库中的高维渐近工具可用于拓展GFT在高维相关矩阵检验中的应用(例如检验稀疏性),属于立即可做的方向——利用熟悉的非参和高维渐近技术即可设计新过程。
3. 2606.12261 — Rbreak: An R Package for Estimating Structural Breaks under Linear Restrictions with Application to Linear Model Tree¶
- 作者: Cheolju Kim, Zhongjun Qu
- 相关性 6/10 · novelty:
application - 摘要: 本文介绍 R 包 rbreak,用于在线性回归模型下检测结构断点并估计断点位置,支持对系数向量施加一般线性约束(包括组内、组间约束以及两种形式:仿射参数化 delta = Stheta + s 和显式线性约束 Rdelta = r)。方法核心包括:基于 sup-F 检验检验无结构变化的原假设,提供断点日期的置信区间估计,通过 Monte Carlo 模拟临界值,并引入 bootstrap 重启程序以降低收敛至虚假局部最优的风险。此外,包还实现了线性模型树(linear model tree),其中每个叶子节点拟合线性回归而非局部均值。方法本质上是对经典断点回归(如 Bai-Perron)的扩展,在约束形式和处理上更为灵活。本文通过应用示例说明了包的使用流程。对您而言,该包提供了可用的工具,但方法学新颖性有限——主要是软件实现与集成;若您后续遇到时间序列断点检测或回归树相关的项目(例如在流行病学或经济学纵向数据中),可考虑使用该包作为参考工具。
- 关键技术:
Sup-F test,bootstrap restart,linear model tree,Monte Carlo critical values,break date confidence interval - 为什么对您有用: 这篇论文主要涉及假设检验(sup-F检验)和统计计算(R包实现),连接到您对 hypothesis testing 和 statistical computing 的兴趣。不过,该方法是经典框架(Bai-Perron)的扩展,并无理论创新;武器库中的 minimax bounds、higher-order U-statistics 等核心工具在此并不直接适用。属于‘暂不可做’类别——核心机制(断点检测的 sup-F 检验及其渐近分布)是标准计量经济学内容,您的技术栈(非参数/高维/高阶U)与其交集不大,除非未来需要处理复杂约束下的断点问题,否则暂不值得深读。
4. 2606.13973 — Scan Statistics for Nonhomogeneous Poisson Processes with Extreme-Value Calibration and Application to CNV Detection¶
- 作者: Tung-Lung Wu, Asanka R. Duwage
- 相关性 5/10 · novelty:
new_method - 摘要: 在两样本非齐次 Poisson 过程 (NHPP) 框架下,目标是检测局部聚类(如 CNV 区域),原假设为经控制样本经验时间变换后的病例样本在 [0,1] 上近似均匀。扫描统计量定义为滑动窗口内变换点数的最大值,核心机制是利用重叠窗口引入的相依性,证明该统计量收敛到带有极值指数的广义极值 (GEV) 分布,并通过极大似然与超限聚类方法估计 GEV 参数与极值指数以实现渐近校准。同时开发了置换程序作为非参数校准替代。模拟显示置换校准在各设定下保持 Type I error 接近名义水平,GEV 校准对小窗口更精确,且在异质基线强度下比连续检验方法更具竞争力。对您可能有用:本文将极值理论 (EVT) 与扫描统计量结合处理非齐次过程,为依赖结构的假设检验校准提供了一个具体案例。
- 关键技术:
scan statistic,nonhomogeneous Poisson process,generalized extreme value distribution,extremal index,empirical time transformation,permutation calibration - 为什么对您有用: 本文连接到 hypothesis testing 子方向,展示了如何用极值理论为具有局部相依结构(重叠窗口)的扫描统计量做渐近校准。您武器库中的 minimax bounds 与 nonparametric statistics 理论可以直接审视其经验时间变换与极值指数估计的收敛条件与理论紧性。Follow-up 判断:立即可做——用 very_familiar 的 minimax 与 nonparametric 工具可评估其变换步骤的渐近性质及极值逼近的 rate;若想深入极值指数的精细理论,需在 moderately_familiar 的 M-estimation 上稍作补充。
天体统计 (astrostats, 4 篇)¶
1. 2606.14045 — Semianalytic Sensitivity Estimates for Out-of-Bank Gravitational-Wave Signals¶
- 作者: Aditya Vijaykumar, Reed Essick
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究引力波匹配滤波搜索对模板库外信号的灵敏度估计问题,核心设定是计算未显式建模的物理信号在现有模板库上的最大重叠度(fitting factor)。作者提出一种半解析近似方法,将拟合因子与搜索灵敏度(检测概率/信噪比阈值)之间的映射关系快速近似化,避免了传统蒙特卡洛注入实验的高计算成本。技术核心是基于匹配滤波的似然/重叠度几何,结合参数空间的解析积分近似与经验校准。实证部分将该方法应用于自旋双中子星、轨道偏心率及广义相对论偏离等场景,验证了近似精度与计算加速效果。对您可能有用:作为 astrostats 入门,本文清晰展示了匹配滤波搜索的统计模型(似然、重叠度、阈值)与灵敏度评估的计算瓶颈,是理解引力波数据分析流程的好切入点。
- 关键技术:
matched-filter search,fitting factor,template bank overlap,semianalytic sensitivity approximation,gravitational-wave detection probability - 为什么对您有用: 本文属于 astrostats gateway reading:(1) 清晰解释了匹配滤波搜索的统计模型(似然比、重叠度、信噪比阈值)与灵敏度评估的计算瓶颈,对外行友好;(2) 武器库中的高维渐近理论与软件开发经验足以支撑理解本文的似然几何与数值积分近似,但引力波波形建模本身需额外领域知识;(3) 值得花时间读引言与方法框架部分,了解天文数据分析中的统计-计算权衡,但无需深读物理波形细节。
2. 2606.13978 — Classification of Astronomical Spectra Using PCA-Compressed Flux and Inverse-Variance Features¶
- 作者: Bruno Santos Meneses Barreto, Marcio Eisencraft
- 相关性 7/10 · novelty:
application - 摘要: 本文评估了一种基于信号处理与监督学习的流水线,用于将SDSS DR17天文光谱分类为恒星、星系和类星体。每条光谱由测量通量及其逆方差信息共同表示,从而同时利用光谱形状和逐波长的可靠性轮廓。在对数波长格点重新采样后,通量和逆方差向量分别经标准化并独立进行主成分分析降维。得到的成分拼接后用于训练多种分类器,其中LightGBM梯度提升分类器表现最佳,在测试集上达到94.6%准确率和92.1%平衡准确率。作为天文数据应用的入门实例,本文清晰展示了光谱数据的预处理、特征工程和分类管道,适合不熟悉天文学的统计学家快速了解该领域的数据结构。
- 关键技术:
Principal Component Analysis (PCA),LightGBM,Inverse-variance weighting,Spectrum resampling,Supervised classification pipeline - 为什么对您有用: 本文属于天文统计学的入门级阅读:数据来源SDSS DR17光谱的物理意义和噪声结构在摘要中有明确交代(通量与逆方差),预处理步骤(重采样、标准化、PCA压缩)表述清晰,适合统计学家快速理解天文光谱分类的数据流。虽然方法学深度有限(无新理论或新算法),但作为gateway reading,能帮助研究者建立对天文数据集和分析管道的直观认识。武器库中非参数统计、高维渐近等知识足以评价其PCA降维合理性,但不需要深入。值得花时间读全文以熟悉天文典型问题结构。
3. 2606.13868 — Multi-Variable Stellar Parameter Estimation Using Residual Multitask Neural Networks¶
- 作者: Bruno Santos Meneses Barreto, Marcio Eisencraft
- 相关性 6/10 · novelty:
application - 摘要: 本文提出基于残差多任务全连接神经网络的端到端管线,从 SDSS DR12 光谱估计恒星三个核心参数(有效温度 \(T_{\mathrm{eff}}\)、金属丰度 [Fe/H]、表面重力 \(\log g\))。预处理包含逐光谱标准化、RobustScaler 目标归一化及 Gaussian noise injection 数据增广;超参通过 Bayesian optimization 调优。在测试集上 MAE 分别为 59.76 K、0.103 dex、0.130 dex(range-normalized error 1%–3%),模型仅约 54 万参数,以远低于深层基线的复杂度取得竞争性能。作为 astrostats 入门读物,本文清晰展示了光谱数据结构、噪声处理与非线性回归建模流程,但统计理论深度有限(novelty 为 application 级)。对您而言,本文可作为了解天文光谱数据特性与标准预处理范式的 gateway reading。
- 关键技术:
multitask neural network,residual blocks,Bayesian hyperparameter optimization,RobustScaler normalization,Gaussian noise injection augmentation,stellar spectral parameter estimation - 为什么对您有用: 本文属于 astrostats gateway reading:数据侧清晰展示了 SDSS 光谱的维度、噪声与目标变量分布,模型侧给出了从预处理到多任务回归的完整管线,对外行友好。您武器库中的 software development 与 high-dimensional asymptotics 足以支撑进入此方向,但本文未触及 minimax 界或 semiparametric efficiency 等您熟悉的统计理论,仅是工程级应用。值得花时间快速浏览以建立天文光谱数据直觉,但无需深读理论细节。
4. 2606.11587 — Recalibration of SDSS photometric zero-points based on the InfraRed Flux Method temperature scale¶
- 作者: Zenghua Zhou, Luca Casagrande, Heran Xiong, Yanjun Guo, Jiajia Li, Zhanwen Han et al.
- 相关性 6/10 · novelty:
application - 摘要: 本文研究 SDSS ugriz 测光系统的零点校准问题,目标是将观测星等精确转换到 AB 标准物理流量。作者利用红外流量法(IRFM)对宽带流量校准的敏感性,以 6000+ FGK 型星的基准有效温度为锚点,反演求出 SDSS 各波段所需的零点修正。结果显示 r 波段校准良好,i/z 波段有数百分之一星等的偏移,g 波段有小偏移,而 u 波段偏移最大且高度依赖滤光片透射曲线的定义(尤其是 red leak 的处理),这会在晚型星样本中引入颜色依赖的零点偏移。CALSPEC 和 Gaia XP 光谱的独立比对总体支持 IRFM 推导的偏移量。对您而言,这是一篇不错的 astrostats 入门读物,清晰展示了测光校准中物理模型(IRFM/温度标)与数据系统误差(滤光片定义/red leak/颜色依赖)的交互,比纯天文发现更值得统计学者关注。
- 关键技术:
Infrared Flux Method (IRFM),photometric zero-point calibration,AB magnitude system,filter transmission curve modeling,colour-dependent systematic offset,spectrophotometric standard comparison - 为什么对您有用: 本文属于 astrostats gateway reading:数据结构(6000+ 恒星的多波段测光与光谱比对)和模型(IRFM 反演校准)交代清晰,不假设读者懂天文术语,适合作为测光校准问题的入门。(2) 您的武器库(inverse problems with random noise / high-dimensional asymptotics)足以支撑进入此方向——IRFM 反演零点本质上是一个带系统误差的逆问题,数值求解与不确定性量化完全在 very_familiar 范围内。(3) 值得花时间读全文,尤其是 u 波段 red leak 引入的颜色依赖偏移部分,对理解大规模巡天数据系统误差结构很有启发。
经济理论 / 应用 (econ_theory, 2 篇)¶
1. 2606.14009 — Reliable Panel Regression: A Default Workflow for Slow-Moving, Mismeasured Variables¶
- 作者: Andrew S. Rosenberg
- 相关性 7/10 · novelty:
new_method - 摘要: 在面板数据的固定效应(FE)回归设定下,当回归变量具有慢变性和测量误差时,研究如何区分系数缩减(shrinkage)究竟源于混杂消除还是测量误差衰减。核心机制是:FE 估计量剥离了大部分组间信号,使得估计量所依赖的组内变异中测量误差占比不成比例地放大,导致衰减偏向零;该衰减程度由回归变量的组内相关系数(intraclass correlation)与测量信度(reliability)共同决定。作者提出了一套默认分析流程:尽可能估计信度、报告 pooled 与 FE 估计并做 within-unit 信度校正;当两者同号时使用部分识别(partial identification)界;异号时则将 FE 视为纯组内估计量;对无信度估计的变量,引入自相关前沿(autocorrelation frontier)直接界定衰减因子。实证回溯多篇已发表研究,表明数据往往无法区分衰减与混杂,而该流程能明确揭示研究者面临的具体情形。对您可能有用:该文将测量误差与 FE 衰减的识别问题转化为 partial identification 界的构造,为面板因果推断中的敏感性分析提供了新视角。
- 关键技术:
fixed effects attenuation bias,intraclass correlation,measurement reliability correction,partial identification bounds,autocorrelation frontier - 为什么对您有用: 本文直接连接到因果推断中面板数据固定效应模型的敏感性分析子方向,将测量误差导致的衰减与混杂消除的不可区分性形式化为 partial identification 问题。您武器库中的 semiparametric theory 与 identification theory in causal inference(moderately_familiar)可以直接攻击其 partial identification 界的收紧与 semiparametric 效率估计问题。中期可做:需先在 identification theory 的 partial identification / bounds 估计上长肌肉,才能将本文的 ad hoc 界推广到更一般的 semiparametric 设定。
2. 2606.14143 — Forecasting with Bayesian Panel Vector Autoregressions Using the R Package bpvars¶
- 作者: Miguel Sanchez-Martinez, Tomasz Woźniak
- 机构: International Labour Organization · The University of Melbourne
- 相关性 6/10 · novelty:
application - 摘要: 本文介绍R包bpvars,用于贝叶斯分层面板VAR(Vector Autoregression)的预测,原始应用场景为189个国家的劳动力市场指标。模型设定包含五个特征:国家特定VAR、参数先验以全局对应为中心、灵活多层分层先验、多种基准先验变体、以及四种参数分组设定;此外,包内实现了基于模型一致的贝叶斯缺失值处理与多种预测规范。计算层面,核心估计与预测算法用C++编写,结合前沿计量经济学与数值方法以实现高计算速度;同时提供伪样本外递归预测评估框架。对您而言,此包是经济面板数据贝叶斯动态建模与预测的完整workflow参考,缺失值处理与分层先验设定对纵向因果推断中的panel IV/ mediation建模有直接借鉴价值。
- 关键技术:
Bayesian hierarchical panel VAR,multi-level hierarchical prior,model-coherent missing observation treatment,pseudo-out-of-sample recursive forecasting,C++ numerical computation - 为什么对您有用: 直接连接经济理论secondary interest中的面板数据模型与因果推断应用;包内model-coherent的贝叶斯缺失值处理与分层先验设定,对您primary interest中纵向因果推断(longitudinal CI)的panel IV/ mediation设定有建模思路借鉴。您very_familiar中的software development可直接上手试用该包的workflow与C++底层,评估其数值方法是否可迁移至您自己的因果推断软件栈——立即可做。
流行病学 (epidemiology, 3 篇)¶
1. 2606.14587 — Typical Healthcare Pathways as a Basis for Admixture Modeling of Patient Trajectories¶
- 作者: Maryam Farhadizadeh, Carola S. Heinzel, August Sigle, Harald Binder, Frederik Wenz, Jan Hasenauer et al.
- 相关性 6/10 · novelty:
application - 摘要: 本文聚焦于患者治疗历程中的典型路径识别与患者个体异质性建模问题。数据层面,常规医疗轨迹因诊断、治疗时序和记录方式不同而难以直接比较。方法层面,首先使用基于规则的算法从群体数据中提取典型医疗路径,并将其表示为紧凑的路径图;然后将这些路径建模为马尔可夫链,并作为混合模型的结构化组件。患者层使用admixture模型,将每个患者表示为一组典型路径的概率混合,而非强制分配至单一路径,从而保留个体差异。作者通过多次训练-测试划分验证了路径结构与患者级混合权重的稳定性。在前列腺癌根治术患者的常规护理数据上,该框架识别出可解释的护理模式并支持亚组发现。本文虽未提出新统计理论,但提供了一个清晰、稳定的处理医疗轨迹的框架,且使用了真实数据集,适合作为流行病学应用方向的入门阅读。
- 关键技术:
rule-based pathway identification,Markov chain models,admixture model,patient trajectory clustering - 为什么对您有用: 本文属于流行病学中的应用研究,与您在secondary interest中关注的真实医疗数据集和实用建模方法直接相关。您非常熟悉的软件开发和estimation theory可以用于复现或扩展该框架(例如加入因果推断的时序处理)。作为gateway reading,本文对新手友好,问题刻画清晰,值得花时间全文阅读。
2. 2606.12701 — Bayesian machine learning approach for recurrent events studies using Soft Bayesian Additive Regression Trees (SBART)¶
- 作者: MengXing Chen, Debajyoti Sinha, Antonio Linero
- 相关性 6/10 · novelty:
application - 摘要: 本文针对复发事件数据(如多次住院)的强度函数估计提出了一个非参数贝叶斯方法RecSBART,基于软贝叶斯加性回归树(SBART)。模型将非齐次泊松过程的条件强度分解为时间常数基线、个体frailty随机效应以及捕捉协变量非线性与时间交互的非参数项的乘积。采用两层数据扩增方案实现高效的MCMC后验采样,避免了传统BART的硬分割导致的不光滑问题。模拟研究表明,在模型设定不准确时RecSBART对累积强度的估计精度仍优于现有方法。在结直肠癌患者复发住院数据的分析中,该方法揭示了协变量间的复杂非线性关系。该文展示的贝叶斯集成学习框架对流行病学队列中的纵向事件数据分析具有实用价值,其非参数乘积形式也可以启发因果推断中未测量混杂建模的思路。
- 关键技术:
Soft Bayesian Additive Regression Trees (SBART),non-homogeneous Poisson process,frailty model,data augmentation (two-layer),MCMC,ensemble learning - 为什么对您有用: (1)该文处理复发事件数据,属于流行病学纵向数据应用,与您的次要兴趣流行病学直接对接;(2)您对非参数统计和estimation theory非常熟悉,可以深入分析SBART的逼近性质,并用software development技能实现其计算流程;(3)由于贝叶斯非参数MCMC不在您当前技术武库中,将该方法迁移至因果推断(如估计平均处理效应的条件强度)属于中期可做——需要先学习和掌握贝叶斯BART的计算框架。
3. 2606.12677 — Restricted Multivariate Spatial Modeling¶
- 作者: Jihyeon Kwon, Harrison Quick
- 相关性 6/10 · novelty:
new_method - 摘要: 本文针对多元小区域健康数据建模中广泛使用的MCAR模型存在信息量过大、导致估计过于精确的问题。作者扩展了单变量BYM模型信息量量化的方法,提出一个框架来测量MCAR模型的信息量,并引入通过重新参数化来控制信息量的策略,确保模型对各亚组贡献相当。该重新参数化保持了计算效率(MCMC实现),使模型更容易应用于实际数据。通过模拟实验和县级心脏病死亡数据(按种族与性别分层)展示了MCAR模型与BYM模型在信息量和过度平滑上的对比,凸显受限MCAR模型的优势。该工作为流行病学中多响应小域估计的偏差控制提供了具体思路,研究者可借鉴其信息量化方法用于因果推断中模型不确定性评估或敏感性分析。
- 关键技术:
conditional autoregressive (CAR) model,multivariate CAR (MCAR),BYM model,reparameterization,informativeness control,MCMC - 为什么对您有用: (1) 本文是空间流行病学建模的优质入门读物:清晰介绍了BYM及MCAR模型框架、信息量问题及其量化/控制方案,即便没有空间统计背景的统计学家也能理解核心逻辑。(2) 研究者当前武器库中的非参数统计和逆问题经验足以把握其“信息量控制”作为先验强度调整的本质,但若要深入扩展(如将方法引入因果推断的空间加扰机制),需额外学习贝叶斯空间协方差建模和MCMC调优——当前武器库并未覆盖这些技能。(3) 论文基于真实分层死亡率数据给出了明确的比较结果,值得花时间阅读以获取多响应空间建模的实用直觉和诊断工具。
其他 (other, 1 篇)¶
1. 2606.14615 — Testing Preferential Sampling¶
- 作者: Isabel Natario, Andreia Monteiro
- 相关性 6/10 · novelty:
application - 摘要: 本文针对地质统计学中的优先采样(preferential sampling)问题,提出了一种简单易行的假设检验方法。优先采样指采样点位置与测量值之间存在随机依赖,忽略该问题会导致有偏估计。检验统计量基于采样点数量与对应测量值之间的相关性,计算简便,无需复杂模型。通过大规模模拟研究评估了不同偏好程度、协变量、样本量和检验条件的影响,结果表明该方法能有效检测优先采样。两个已知真实数据集(苔藓中铅浓度、虾捕获量)的应用进一步验证了其有效性。该方法虽不涉及高深理论,但为空间数据分析中的偏误诊断提供了实用工具。对于您关注的空间数据或样本选择偏差相关应用(如流行病学中的地理采样)可能有用,但方法学新颖性有限。
- 关键技术:
preferential sampling,spatial statistics,hypothesis testing based on correlation,simulation study - 为什么对您有用: 本文属于假设检验这一您的primary interest,但方法较为基础,不涉及您熟悉的高维统计或半参理论。检验的思想可迁移至因果推断中的样本选择偏差诊断,但需要更强的识别条件。目前您可直接理解该方法,但作为follow-up,暂不可做——核心竞赛在于空间自相关与采样过程建模,而非您的技术武器库主攻方向。建议仅作背景阅读,不深入。
🗂 其他论文(仅 LLM 评分,未生成摘要)¶
未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。
1. 2606.11715 — Bracketing Relationships of Weighted Average Treatment Effects¶
- 作者: Pengfei Tian, Fan Yang, Peng Ding
- 分类: stat.ME
- 相关性 9/10 · novelty:
new_theory - 评分理由: Bracketing relationships of weighted ATEs and weighted LATEs using overlap weights; directly advances estimation and identification theory in causal inference.
2. 2606.11263 — Geometric bias in eigenspace perturbation under random heterogeneous noise¶
- 作者: Fengkai Liu, Ke Wang, Wanjie Wang
- 分类: math.ST · cs.LG · cs.NA · math.NA · math.PR · stat.TH
- 相关性 9/10
- 评分理由: Directly hits primary interest in high-dimensional statistics / random matrix theory; refines classical worst-case bounds (Davis-Kahan) using signal geometry and random noise, aligning with very_familiar arsenal.
3. 2606.12185 — Pivotal and identification-robust nonparametric inference in linear IV models¶
- 作者: Bertille Antoine, Pascal Lavergne
- 分类: econ.EM · math.ST · stat.TH
- 相关性 9/10 · novelty:
new_theory - 评分理由: Directly advances primary interests in IV and identification-robust inference, with strong arsenal overlap in estimation theory in causal inference and nonparametric statistics.
4. 2606.11421 — Second-Order Least Squares as a Special Case of the Polynomial Maximization Method¶
- 作者: Serhii Zabolotnii
- 分类: stat.ME · math.ST · stat.CO · stat.TH
- 相关性 8/10 · novelty:
new_theory - 评分理由: Equivalence of second-order least squares and degree-two polynomial maximization; directly touches M-estimation theory and higher-order moments.
5. 2606.11526 — What is the Long-Term Value of Reliability?¶
- 作者: Chenyu Qiu, Xu Kuang, Inessa Liskovich, Ali Rauh, Stefan Wager
- 分类: stat.ME · econ.EM
- 相关性 8/10 · novelty:
new_method - 评分理由: Causal identification of long-term effects via sequential unconfoundedness and marginal policy effect; directly touches identification/estimation theory in causal inference and econ application.
6. 2606.12184 — Threshold Regression for Fixed-T Panel Data with Interactive Fixed Effects¶
- 作者: Jan Ditzen (Free University of Bozen-Bolzano), Yiannis Karavias (Brunel University of London, University of Birmingham), Joakim Westerlund (Lund University, Deakin University)
- 机构: Free University of Bozen-Bolzano · University of London · Universidad de Londres · Brunel University of London · University of Birmingham · Deakin University · Lund University
- 分类: econ.EM
- 相关性 8/10 · novelty:
new_method - 评分理由: Secondary interest in econ theory (causal inference application); develops estimation and inference for threshold regression with interactive fixed effects, a common econometric identification/estimation problem.
7. 2606.11746 — Time Series Analysis in Machine Learning¶
- 作者: Antonio Pagliaro, Anna Anzalone
- 分类: astro-ph.IM · stat.ML
- 相关性 8/10 · novelty:
survey - 评分理由: Astrostats gateway: pedagogical review of time series ML accessible to outsiders, explicitly connects classical statistical models to modern ML in astrophysics.
8. 2606.14001 — Efficient Evaluation of Gravitational Lensing Amplification Factors: A Deep Learning Framework¶
- 作者: Fan Zhang, Qikai Zhang, Qiyuan Yang, Yong Yuan, Xilong Fan
- 相关性 8/10 · novelty:
application - 评分理由: Clear computational problem with accessible ML method (SIRENs) and relevance to gravitational wave lensing; well-suited for statistician.
9. 2606.11405 — Bayesian Causal Machine Learning for Cure Models¶
- 作者: Antonio R. Linero, F. Javier Rubio, Piyali Basak
- 分类: stat.ME · stat.AP
- 相关性 7/10
- 评分理由: Causal inference applied to survival/cure models; touches estimation theory in causal inference and semiparametric structures.
10. 2606.11548 — Estimating the local false discovery rate under an unknown symmetric null¶
- 作者: Daniel Xiang, William Fithian, Nikolaos Ignatiadis, Jake A. Soloff, Asaf Weinstein
- 分类: stat.ME
- 相关性 7/10 · novelty:
new_method - 评分理由: Estimating local FDR under symmetric null; touches hypothesis testing and high-dimensional variable selection (knockoffs), relevant to mathematical statistics.
11. 2606.12317 — ShrinkageTrees: An R Package for Bayesian Tree Ensembles for Survival Analysis and Causal Inference¶
- 作者: Tijn Jacobs
- 分类: stat.ME · stat.CO
- 相关性 7/10 · novelty:
new_method - 评分理由: Directly targets causal inference with prognostic/treatment-effect decomposition; software development overlaps with very_familiar arsenal.
12. 2606.11406 — Posterior consistency of P\'olya trees for deconvolution under the linear model¶
- 作者: Nakul Shenoy, Asaf Weinstein
- 分类: math.ST · stat.TH
- 相关性 7/10 · novelty:
new_theory - 评分理由: Fits primary interest in semiparametric/nonparametric theory and inverse problems with random noise; studies Bayesian deconvolution under linear models using Pólya tree priors.
13. 2606.11933 — Testing axial symmetry in multivariate location-scale linear regression¶
- 作者: \v{S}\'arka Hudecov\'a, Miroslav \v{S}iman
- 分类: math.ST · stat.ME · stat.TH
- 相关性 7/10 · novelty:
new_method - 评分理由: Fits primary interest in mathematical statistics (hypothesis testing) and nonparametric theory; develops integrated rank scores test for axial symmetry in multivariate regression.
14. 2606.12324 — Assumption-Lean Shrinkage and Model Averaging for Spatial Parameters¶
- 作者: Harvey Barnhard
- 分类: econ.EM
- 相关性 7/10 · novelty:
new_method - 评分理由: Assumption-lean shrinkage using SURE for spatial parameters touches nonparametric estimation theory and economic theory; SURE-based model averaging is a nice methodological overlap.
15. 2606.11595 — Wavelet-Based Extraction of Transient Noise in Gravitational-Wave Interferometers using a Saliency-Guided Learning Architecture¶
- 作者: Christopher Allene, Dhruv Kumar, Yusuke Sakai, Marco Meyer-Conde, Hirotaka Takahashi
- 分类: astro-ph.IM · gr-qc
- 相关性 7/10 · novelty:
application - 评分理由: Gateway astrostats paper: clearly articulates the data-analysis problem (glitch extraction in GW data), model (wavelet + saliency), and noise structure, accessible and methodologically interesting.
16. 2606.11741 — Machine Learning for Event Reconstruction in Imaging Atmospheric Cherenkov Telescopes¶
- 作者: Antonio Pagliaro, Antonino La Barbera
- 分类: astro-ph.IM
- 相关性 7/10 · novelty:
survey - 评分理由: Astrostats gateway: clearly articulates the IACT data structure, noise/background challenge, and reconstruction pipeline using ML, accessible to an outsider.
17. 2606.11983 — Calibration of an Analog-to-Digital Conversion Nonlinearity in JWST/NIRISS¶
- 作者: Shashank Dholakia, Shishir Dholakia, Benjamin J. S. Pope, Louis Desdoigts, Shrishmoy Ray, Peter G. Tuthill, Anand Sivaramakrishnan
- 分类: astro-ph.IM · astro-ph.EP
- 相关性 7/10 · novelty:
application - 评分理由: Astrostats gateway: quantifying a periodic systematic error in JWST ADC counts is a clear, accessible data-calibration problem with explicit noise/model structure that a statistician could improve.
18. 2606.11439 — A Likelihood Ratio Testing Approach for Interval-Censored Data¶
- 作者: Yuan Wu, Susan Halabi
- 分类: stat.ME
- 相关性 6/10 · novelty:
new_method - 评分理由: Spline-sieve LRT for interval-censored data; touches semiparametric/nonparametric theory and hypothesis testing.
19. 2606.12296 — Bayesian Triangulation Splines: Spatial Adaptation on Irregular Domains¶
- 作者: Sihyeon Pyeon, Sunwoo Lim, Seonghyun Jeong
- 分类: stat.ME
- 相关性 6/10 · novelty:
new_theory - 评分理由: Nonparametric regression on irregular domains via triangulation splines; directly touches nonparametric statistics (very_familiar) and spatial adaptation.
20. 2606.12131 — A Discrete Cumulative Distribution Transform via Optimal Transport¶
- 作者: Harbir Antil, Gustavo Rohde, Aryan Saxena
- 分类: math.ST · math.OC · stat.TH
- 相关性 6/10 · novelty:
new_method - 评分理由: Develops a discrete CDT via optimal transport with linear-time algorithms; overlaps with nonparametric statistics and statistical computing, but lacks direct connection to primary causal/high-dim interests.
21. 2606.14544 — On the design distribution for predictive Bayesian regression¶
- 作者: Wanyue Sun, Edwin Fong
- 相关性 6/10 · novelty:
new_method - 评分理由: Touches Bayesian nonparametrics and identifiability, which connects moderately to semiparametric theory, though the predictive resampling machinery is not a primary focus.
22. 2606.11887 — Model-based sparse mixed-type PCA¶
- 作者: Lauri Heinonen, Joni Virta
- 分类: stat.ME
- 相关性 5/10 · novelty:
new_method - 评分理由: Mixed-type PCA via latent Gaussian models touches high-dimensional estimation, but the method-of-moments approach is a weak match for the researcher's semiparametric/efficiency focus.
23. 2606.11962 — Composite likelihood inference of fractional Gaussian processes with sequentially optimal subset selection¶
- 作者: Mathis Fourreau, Matthieu Garcin
- 分类: stat.ME · q-fin.ST · stat.CO
- 相关性 5/10 · novelty:
new_method - 评分理由: Composite likelihood for fractional Gaussian processes; involves Fisher/Godambe information and computational tradeoffs, moderately adjacent to estimation theory and stat-comp.
24. 2606.12015 — Introducing precision-weighted bias as a performance measure to inform the inclusion of adaptive designs in meta-analysis¶
- 作者: Martin Law, David S. Robertson, Sofia S. Villar, Tim P. Morris, Babak Choodari-Oskooei, Thomas Jaki et al.
- 机构: University of Cambridge · Papworth Hospital · Medical Research Council · Statistical Service · MRC Clinical Trials Unit at UCL · University College London · University of Regensburg
- 相关性 5/10 · novelty:
new_method - 评分理由: Proposes precision-weighted bias for meta-analysis; touches estimation theory and bias, mildly relevant to efficiency theory and econ/epi applications.
25. 2606.12164 — Bayesian Effect Selection for Additive Quantile Regression with an Application to Air Pollution Thresholds¶
- 作者: Nadja Klein, Aaron Wei Qi Lee, Jorge Mateu
- 分类: stat.ME
- 相关性 5/10 · novelty:
new_method - 评分理由: Bayesian effect selection for additive quantile regression; touches nonparametric theory and variable selection, but application-driven and peripheral to primary interests.
26. 2606.11487 — Unbiased Derivative Estimation for Stationary Mean of Parameterized Markov chains¶
- 作者: Jeffrey Wang, Chang-han Rhee
- 分类: math.ST · math.PR · stat.ML · stat.TH
- 相关性 5/10 · novelty:
new_method - 评分理由: Unbiased gradient estimation for Markov chains touches statistical computing, but the core machinery (neural network parametrization, MCMC) is outside the primary focus of minimax/high-dim/causal theory.
27. 2606.12333 — Integrated expectile-based measures of inequality¶
- 作者: Ignacio Cascos, Marco Tarsia
- 分类: math.ST · math.PR · stat.TH
- 相关性 5/10 · novelty:
new_method - 评分理由: Introduces integrated expectile functionals for inequality; touches on semiparametric/nonparametric functional estimation but is primarily a probability/risk-measure result without deep estimation theory.
28. 2606.14012 — Prime Focus Spectrograph on the Subaru Telescope: Overview of Science Operations¶
- 作者: Masayuki Tanaka, Akira Arai, Wanqiu He, Miho N. Ishigaki, Eric Jeschke, Russell Kackley et al.
- 相关性 5/10
- 评分理由: Presents a new science operation framework for a major spectrograph, but abstract lacks clear data/model exposition for a stats outsider; weak gateway match.
29. 2606.11624 — The Triply-Randomized Negative Binomial Beta for Robust Regression and Conjugate Models of Bounded Support Data¶
- 作者: Jimmy Lederman, Aaron Schein
- 相关性 4/10 · novelty:
new_method - 评分理由: Robust regression distribution; tangential methodological overlap but no primary interest connection.
30. 2606.12021 — Adaptive spatial blocking for scalable clustering inference with applications to high-throughput spatial proteomics¶
- 作者: Mingyu Go, Julia Wrobel, Hoseung Song
- 分类: stat.ME
- 相关性 4/10
- 评分理由: Spatial blocking for scalable clustering inference; addresses computational cost of spatial statistics, mildly adjacent to stat-comp tradeoffs.
31. 2606.12566 — Inferring resource selection and utilization distributions from irregular and error-prone animal tracking data¶
- 作者: Fanny Dupont, Brett T. McClintock, Jan-Ole Fischer, Marianne Marcoux, Nigel E. Hussey, Marie Auger-Méthé
- 相关性 4/10 · novelty:
new_method - 评分理由: Langevin diffusion for animal tracking; touches inverse problems with noise and nonparametric estimation, but application domain is distant.
32. 2606.13280 — Generalization Bounds for Transformer-Based Next-Token Prediction in a Language Model¶
- 作者: Insung Kong, Niklas Dexheimer, Johannes Schmidt-Hieber
- 相关性 4/10 · novelty:
new_theory - 评分理由: Generalization bounds for transformers on a specific language model; adjacent to high-dim/stat-comp but lacks clear connection to researcher's specific arsenal or gateway criteria.
33. 2606.14382 — Predictive Concordance for Parameter Optimisation and Mixture Synthesis¶
- 作者: Tobias Adrian, Domenico Giannone, Matteo Luciani, Mike West
- 相关性 4/10
- 评分理由: Concordance measure for distributions, not directly in primary areas.
34. 2606.13850 — Controller-Augmented Hidden Markov Models: A Computational Framework for Constrained Sequential Inference¶
- 作者: Lekha Patel, Luis Damiano
- 相关性 4/10 · novelty:
new_method - 评分理由: Computational framework for constrained HMMs touches statistical computing, but lacks connection to causal inference, high-dim, or semiparametric theory.
35. 2606.13793 — A Scalable Fast Multipole Method Poisson Solver for the RAMSES code: I. Unigrid Algorithm¶
- 作者: Jun-Young Lee, Romain Teyssier
- 相关性 4/10
- 评分理由: Numerical solver paper; somewhat relevant to computing but lacks clear data model exposition.
36. 2606.11414 — Group Sequential Sample Size for Comparing Two Survival Probabilities at a Specific Time Point¶
- 作者: Susan Halabi, Lu Liu, Chenxi Yu, Yuan Wu
- 分类: stat.ME
- 相关性 3/10
- 评分理由: Clinical trial sample size calculation for survival probabilities; tangential to primary interests in causal inference and mathematical statistics.
37. 2606.11768 — Hierarchical excitatory processes for modelling event-time data in the presence of exogenous stimuli¶
- 作者: Francesco Sanna Passino, Nicholas A. Heard, Jeffrey W. Brown, William N. Frost, Vince P. Lyzinski
- 分类: stat.ME · stat.AP
- 相关性 3/10
- 评分理由: Point process model for event-time data; unrelated to primary interests in causal inference, high-dim stats, or efficiency theory.
38. 2606.12305 — Bayesian nonparametric Mallows model for clustering preference data¶
- 作者: Lorenzo Zuccato, Veronica Vinciotti, Valeria Vitelli
- 分类: stat.ME
- 相关性 3/10
- 评分理由: Bayesian nonparametric Mallows model for preference clustering; unrelated to causal inference, high-dim theory, or efficiency bounds.
39. 2606.11726 — Notes on the Theory of Statistical Symbol Recognition¶
- 作者: Nils Lid Hjort
- 分类: math.ST · stat.TH
- 相关性 3/10
- 评分理由: Historical monograph on statistical pattern recognition from 1986; tangential to the researcher's modern primary interests in causal inference, high-dim stats, and computational tradeoffs.
40. 2606.12244 — Barycentric Corrections for HST/STIS Data¶
- 作者: Joshua D. Lothringer, Joleen K. Carlberg, Sean Lockwood
- 分类: astro-ph.IM
- 相关性 3/10
- 评分理由: Software utility for barycentric corrections; accessible but purely deterministic calculation with no statistical estimation or modeling question for a statistician.
41. 2606.13433 — Smoothed-KL Reweighting: A Principled Account and Matching Rule for SNR-Based Diffusion Training¶
- 作者: Lei Li
- 相关性 3/10
- 评分理由: Diffusion training KL-reweighting is deep learning methodology; unrelated to the researcher's primary statistical theory and causal inference interests.
42. 2606.12842 — Connecting Polarization to Exoplanet Yield Calculations for HWO¶
- 作者: Jaren N. Ashcraft, Scott D. Will, Maxwell A. Millar-Blanchaer, Breann Sitarski, Christopher C. Stark, Ewan S. Douglas et al.
- 相关性 3/10
- 评分理由: Pure astrophysics/optics paper on coronagraph polarization aberrations; lacks accessible data/model exposition for a statistician outsider.
43. 2606.14019 — Real-order moments, tail representations, and logarithmic means¶
- 作者: Roberto Vila, Eduardo Nakano
- 相关性 3/10
- 评分理由: Pure probability theory on real-order moments and tail representations; lacks the estimation, testing, or high-dim statistical theory core to the researcher's interests.
44. 2606.13816 — Design and Commissioning of an Iodine Cell for the ESPRESSO Spectrograph¶
- 作者: Gillian Nave, R. Paul Butler
- 相关性 3/10
- 评分理由: Instrument design paper for a spectrograph; pure hardware/astrophysics focus with no data-analysis or modeling question for a statistician.
45. 2606.11305 — Modeling the impact of filter-substrate refraction in the Roman point spread function¶
- 作者: Federico Berlfein, Rachel Mandelbaum, Tianqing Zhang, Nihar Dalal, Christopher M. Hirata, Charuhas Shiveshwarkar, Anthony Harbo Torres
- 分类: astro-ph.IM · astro-ph.CO
- 相关性 2/10
- 评分理由: Pure astrophysics/optics modeling of PSF refraction; lacks accessible data/model exposition for a statistician outsider.
46. 2606.11506 — Revealing Cosmic Ecosystems with the Hubble Space Telescope in 2030s and Beyond¶
- 作者: Sanchayeeta Borthakur, Tanmay Singh, David French, Yakov Faerman, Kate Rubin, Brad Koplitz, Rongmon Bordoloi, Frances H. Cashman, Matthew J. Hayes, Yong Zheng, Joseph N. Burchett, Jane C. Charlton, Hsiao-Wen Chen, Andrew J. Fox, Yucheng Guo, Timothy M. Heckman, Christopher J. Howk, Sean D. Johnson, Glenn G. Kacprzak, Varsha P. Kulkarni, Nicolas Lehner, Sowgat Muzahid, Namrata Roy, Evan Scannapieco, Jessica K. Werk
- 分类: astro-ph.IM · astro-ph.GA
- 相关性 2/10
- 评分理由: Astro-ph proposal for HST UV spectroscopy; lacks clear statistical problem exposition accessible to a data-analysis statistician.
47. 2606.11848 — Some polarized lines of the second solar spectrum (SrI, CaI, BaII, C2, MgH, NdII) observed at the Meudon Solar Tower spectropolarimeter¶
- 作者: Jean-Marie Malherbe
- 机构: Lira Hospital
- 相关性 2/10
- 评分理由: 太阳谱线观测,需大量天文学背景,未说明统计模型或数据分析
48. 2606.13327 — Disclosure risk in a geo-spatial setting¶
- 作者: Peter-Paul de Wolf
- 相关性 2/10
- 评分理由: Focuses on spatial disclosure risk and MAUP for thematic maps, unrelated to primary interests in causal inference, high-dim stats, or efficiency theory.
49. 2606.12653 — What I Wish I had Known When I Began Building Astronomical Instruments¶
- 作者: Daniel Fabricant
- 相关性 2/10
- 评分理由: Personal career reflections on building astronomical instruments; no statistical methodology or data-analysis problem presented.
50. 2606.14117 — A Two-Stage Statistical Framework for Evaluating Associative Interference in Large Language Models¶
- 作者: Achraf Cohen, Andrew Kincaid
- 相关性 2/10
- 评分理由: LLM bias evaluation using IAT adaptations is unrelated to the researcher's mathematical statistics and causal inference interests.
51. 2606.11367 — Studying hot evolved stars with ultraviolet spectroscopy¶
- 作者: Stephan Geier, Nicole Reindl, Matti Dorsch, Vikrant Jadhav, Helge Todt, Klaus Werner, Ulrich Heber, Marcelo M. Miller Bertolami, Tiara Battich, Semih Filiz
- 分类: astro-ph.IM · astro-ph.SR
- 相关性 1/10
- 评分理由: Pure astrophysics review of hot evolved stars; no statistical methodology or data-analysis exposition for outsiders.
52. 2606.11714 — Design of a three-lens wide field corrector with aspherical surfaces for the 2.34-m VBT¶
- 作者: Nitish Singh, S. Sriram, Bharat Kumar Yerra
- 分类: astro-ph.IM
- 相关性 1/10
- 评分理由: 纯望远镜光学器件设计,无统计或数据建模内容,与研究者兴趣无关。
53. 2606.13440 — Japan's Possible Contributions for Coronagraph of the Habitable Worlds Observatory (HWO)¶
- 作者: Keigo Enya, Kenta Yoneta, Naoshi Murakami, Jun Nishikawa, Satoshi Itoh, Taro Matsuo et al.
- 相关性 1/10
- 评分理由: Hardware contribution proposal for a coronagraph; pure instrumentation, no statistical or data-analysis content.
54. 2606.14124 — Demonstration of a Single-chip Dual-polarization Sideband-separation SIS mixer at 2 mm Band¶
- 作者: Wenlei Shan, Shohei Ezaki, Yoshinori Uzawa
- 相关性 0/10
- 评分理由: SIS mixer physics paper; completely unrelated to statistics.
55. 2606.13914 — Autonomous AI-Cosmoindustry and the Quiet Expansion Filter: A Threshold-Based Resolution of the Fermi Paradox¶
- 作者: Sergey Ivliev
- 相关性 0/10
- 评分理由: Speculative Fermi paradox discussion unrelated to statistical data analysis.
Maintained by 陈星宇 · Homepage · Source on GitHub