跳转至

2026-06-09 每日 arXiv 资讯

  • 高相关论文 18 篇 · 中相关 7 篇 · 其他 41 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 5 篇)

1. 2606.07871 — Inference on the TSLS Estimand with Weak Instruments and Treatment Effect Heterogeneity

  • 作者: Arnstein Vestre
  • 分类: econ.EM
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在过度识别 IV 设定下,当处理效应存在异质性且工具变量弱时,传统 TSLS 推断丧失 size 控制,而 AR/LM/CLR 检验仅在常数效应或单工具下保持 validity。本文提出 TSLS 似然比(TLR)统计量,对 TSLS estimand(异质性下的加权局部平均效应)做推断,并结合 Berger-Boos (1994) 型两步程序,在弱工具与强工具两个 regime 上均获得 uniform validity。两步法第一步 level 取小值即可保持 power,且在强工具极限下 TLR 检验数值上退化为 Wald 检验,避免强工具 regime 的效率损失。对您而言,本文直接触及 IV 推断中 hypothesis testing 与 uniform size control 的交叉问题,是弱 IV 下异质性推断的新方法。
  • 关键技术: TSLS likelihood ratio statistic, Berger-Boos two-step procedure, uniform validity over weak/strong IV regimes, weak instrument robust inference, TSLS estimand under heterogeneity, Anderson-Rubin test
  • 为什么对您有用: 本文直接连接到您 primary interest 中 IV 推断与 hypothesis testing 的交叉:TSLS estimand 在异质性下的 identification 是经典难题,而跨弱/强 IV regime 的 uniform validity 是数学统计中 size control 的硬核议题。您 very_familiar 的 estimation theory in causal inference 可直接审视 TLR 统计量的构造逻辑与 influence function 视角,moderately_familiar 的 identification theory 可追问 TSLS estimand 在高维 IV / longitudinal 设定下的类似推断缺口。立即可做:用您熟悉的 IV estimation theory 与 minimax 视角审视 TLR 的 uniform power 性质,或探索将两步程序迁移到 proximal CI / mediation 等弱识别设定。

2. 2606.08474 — Semiparametric Difference-in-Differences Estimation With Missing Not at Random Data: A Shadow Variable Approach

  • 作者: Junjie Li, Dongyuan Mu
  • 分类: econ.EM
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在结局变量缺失非随机(MNAR)的半参数差分中差分(DID)设定下,本文利用完全观测的影子变量(shadow variable)识别并估计处理组平均处理效应(ATT)。影子变量需与结局演化相关、但条件独立于缺失机制(给定协变量与结局演化),此假设与 proximal CI 中的 negative control 变量逻辑高度同构。作者在半参数框架下推导了 ATT 的非参数识别公式,并提出了相应的估计算法。模拟与实证数据验证了有限样本表现。该文的 shadow variable 识别策略为 MNAR 下的因果推断提供了新的结构假设视角,对您关注的 proximal CI 及 negative control 设定有直接借鉴意义。
  • 关键技术: Difference-in-Differences (DID), Missing Not at Random (MNAR), Shadow variable identification, Semiparametric estimation, Average Treatment Effect on the Treated (ATT)
  • 为什么对您有用: 直接连接到 causal inference 的 identification 与 MNAR 设定,其 shadow variable 假设与您关注的 proximal CI / negative control 框架逻辑同构。可用您 moderately_familiar 的 identification theory in causal inference 审视其识别条件的强弱与可替代性,并用 very_familiar 的 estimation theory in causal inference 推导该估计量的 influence function 与 semiparametric efficiency bound。立即可做:推导该 MNAR-DID 估计量的效率界,或形式化 shadow variable 与 negative control 假设的数学等价关系。

3. 2606.09223 — Sharp Bounds and Inference in Sample Selection Models with Treatment Endogeneity

  • 作者: Yingying Dong, Phillip Heiler
  • 分类: econ.EM
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在非参数样本选择模型中,处理内生性(非合规)与弱样本选择单调性下,本文对 complier 的 intensive margin 处理效应提供部分识别与推断。所提出的 bounds 比 Chen & Flores (2015) 更紧且是 sharp 的。推断方面,作者构造了 semiparametrically efficient orthogonal moments,并发展了 debiased ML procedure,在高维协变量/灵活函数形式下仍保证 root-n CAN 推断。模拟显示有限样本表现良好;对 Job Corps 与 Oregon Health Insurance Experiment 的应用表明该方法能给出显著更紧的效应 bounds 与置信区间。对您有用:本文将样本选择 + IV endogeneity 的 identification 与 DML-based efficient inference 结合,直接触及 causal inference 的 identification/estimation 与 efficiency theory 的交叉。
  • 关键技术: partial identification, sample selection monotonicity, sharp bounds, orthogonal moments, debiased machine learning, semiparametric efficiency
  • 为什么对您有用: 直接连接 causal inference 的 IV + sample selection 设定(complier intensive margin TE 的部分识别),以及 efficiency theory 的 orthogonal moments + DML 推断。用 very_familiar 的 estimation theory in causal inference 与 moderately_familiar 的 semiparametric theory / identification theory 可以攻这篇 paper 的 identification bound 构造与 efficient influence function 推导。立即可做:用 very_familiar 武器验证其声称的 sharp bound 是否确实紧,或考虑将 weak monotonicity + DML 框架扩展到 longitudinal setting 下的动态样本选择。

4. 2606.08642 — A Practical Framework for Sensitivity Analysis in Externally Controlled Trials: An Illustration with a Bayesian Hybrid Evidence Synthesis Case Study

  • 作者: Xuemin Gu, Kitty Guo, Jane Zhang
  • 分类: stat.ME · stat.AP
  • 相关性 8/10 · novelty: minor
  • 摘要: 本文针对外部对照试验(ECT)中借用历史/外部对照数据的假设,提出三支柱敏感性分析框架:借用是否恰当、是否贡献有价值信息、结论对扰动是否稳健。框架包含八项模块化分析(异质性诊断、来源影响、无借用参照、有效样本量、先验敏感性、tipping point、替代借用方法、结构模型敏感性),方法无关且适用于贝叶斯或频率学派借用设定。案例模拟族裔桥接提交的混合证据合成场景,结合全球关键试验个体数据与区域真实世界研究及已发表队列汇总数据,采用贝叶斯纵向模型拟合族裔差异参数。该框架为监管提交提供可复现模板,但未提出新的 identification 条件、效率界或 sharper rate。对您而言,本文触及 causal inference 中 sensitivity analysis 的外部控制借用设定,但方法学贡献偏实务组织而非理论推进。
  • 关键技术: sensitivity analysis framework, Bayesian evidence synthesis, external control borrowing, tipping point analysis, prior sensitivity, effective sample size
  • 为什么对您有用: 本文触及 causal inference 中 sensitivity analysis 的外部控制/历史数据借用设定,但属于实务框架而非理论推进。研究者 moderately_familiar 的 identification theory in causal inference 可用于更严格形式化'借用是否恰当'支柱——例如将外部对照与当前试验间的 unmeasured confounding 用 marginal sensitivity model 或 Rosenbaum-bound 式框架量化,而非仅靠异质性诊断与 tipping point 的实务检查。中期可做:需先在 identification theory 上长肌肉,将实务框架中的模块与 formal sensitivity model 对接,才能产出有理论深度的工作。

5. 2606.09625 — A Synthetic Control Approach to Conditional Distributional Treatment Effects

  • 作者: Dominik Wied
  • 分类: econ.EM · stat.ME
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文在合成控制(SC)框架下研究条件分布处理效应(CDTE)的识别与估计,核心假设是半参数分布回归(DR)参数空间上的平行趋势。识别策略将反事实条件分布限制在 DR 模型类内,权重通过带加总约束的最小二乘求解,具有闭式表达式。推导了反事实估计量的渐近分布,关键发现是 DR 估计误差与权重估计误差以相同速率贡献渐近方差。基于此渐近理论,提出了无处理效应的 supremum 检验,其极限分布为高斯过程的上界。模拟与 1992 新泽西最低工资(CPS 数据)的实证表明,条件分布能揭示无条件分布难以检测的异质性效应。对您可能有用:本文将半参数 DR 与 SC 结合的方差分解及 supremum 检验,直接连接到您对半参数理论与假设检验的兴趣,同时提供了经典的经济学因果应用数据集。
  • 关键技术: distribution regression, synthetic control, parallel trends in parameter space, asymptotic variance decomposition, supremum test of Gaussian process, conditional distributional treatment effects
  • 为什么对您有用: 连接到因果推断的合成控制与分布处理效应设定,以及半参数理论的两步估计方差分解与假设检验的 supremum test。用 moderately_familiar 的半参数理论(M-estimation / influence function)可以审视其 DR+权重误差的方差分解是否达到 semiparametric efficiency bound;用 very_familiar 的 minimax 视角可考察权重估计在高维下的过拟合风险。中期可做——需先在 moderately_familiar 的半参数两步估计理论(特别是 DR 的 influence function)上长肌肉,才能严格审视其方差分解的效率性质;若仅关注 econ 应用与 CPS 数据集,则立即可做

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)

1. 2606.09153 — The Asymptotic Distribution of Sample Canonical Directions in Gaussian Spiked High-dimensional CCA

  • 作者: Zhangni Pu, Zhangxiao Zhuo, Jiang Hu
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 本文研究有限秩 spiked 高维 CCA 模型下样本典型方向的渐近行为,设定为两个数据块维度与样本量成比例增长且总体服从 Gauss 分布。即使样本典型相关系数从 bulk spectrum 中分离,样本典型方向仍不一致;为量化方向恢复,作者研究样本方向与总体方向的 squared alignment。对每个简单总体 spike,首先建立 squared alignment 的确定性一阶极限,给出总体方向信息保留的显式度量;随后证明其围绕确定性极限的 CLT,渐近方差通过 resolvent trace functionals 的确定性极限显式表达。为使理论量可从数据计算,通过反演确定性 outlier eigenvalue map 构造极限均值与渐近方差的 plug-in 估计量并证明其一致性。对您研究高维渐近理论及 RMT 在 inference 中的应用有直接参考价值。
  • 关键技术: spiked CCA model, squared alignment, resolvent trace functionals, deterministic outlier eigenvalue map inversion, central limit theorem for eigenvector fluctuations, plug-in estimators for asymptotic variance
  • 为什么对您有用: 直接连接您 primary interest 中的高维统计与随机矩阵理论(RMT),特别是高维 inference(eigenvector/eigenvalue fluctuation)方向。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来审视本文 resolvent trace functional 与 CLT 的推导细节,判断其 sharper rate 是否紧或能否推广到非 Gauss 设定。立即可做:用您熟悉的高维渐近工具复现/验证其 deterministic limit 与 plug-in 估计量一致性;中期可做:若想拓展至 semiparametric efficiency bound 或 debiased inference,需先在 moderately_familiar 的 semiparametric theory 上长肌肉。

2. 2606.09153 — The Asymptotic Distribution of Sample Canonical Directions in Gaussian Spiked High-dimensional CCA

  • 作者: Zhangni Pu, Zhangxiao Zhuo, Jiang Hu
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 本文研究有限秩 spiked 高维 CCA 模型下样本典型方向的渐近行为,设定为两个数据块维度与样本量成比例增长且总体服从 Gauss 分布。即使样本典型相关系数从 bulk spectrum 中分离,样本典型方向仍不一致;为量化方向恢复,作者研究样本方向与总体方向的 squared alignment。对每个简单总体 spike,首先建立 squared alignment 的确定性一阶极限,给出总体方向信息保留的显式度量;随后证明其围绕确定性极限的 CLT,渐近方差通过 resolvent trace functionals 的确定性极限显式表达。为使理论量可从数据计算,通过反演确定性 outlier eigenvalue map 构造极限均值与渐近方差的 plug-in 估计量并证明其一致性。对您研究高维渐近理论及 RMT 在 inference 中的应用有直接参考价值。
  • 关键技术: spiked CCA model, squared alignment, resolvent trace functionals, deterministic outlier eigenvalue map inversion, central limit theorem for eigenvector fluctuations, plug-in estimators for asymptotic variance
  • 为什么对您有用: 直接连接您 primary interest 中的高维统计与随机矩阵理论(RMT),特别是高维 inference(eigenvector/eigenvalue fluctuation)方向。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来审视本文 resolvent trace functional 与 CLT 的推导细节,判断其 sharper rate 是否紧或能否推广到非 Gauss 设定。立即可做:用您熟悉的高维渐近工具复现/验证其 deterministic limit 与 plug-in 估计量一致性;中期可做:若想拓展至 semiparametric efficiency bound 或 debiased inference,需先在 moderately_familiar 的 semiparametric theory 上长肌肉。

3. 2606.07986 — Inference for High-Dimensional Sparse Spectral Precision Matrices

  • 作者: Navonil Deb, Younghoon Kim, Sumanta Basu
  • 分类: stat.ME · stat.ML
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在平稳高维时间序列的频域 Gaussian graphical model 设定下,目标是固定频率下 spectral precision matrix 的 entry-wise inference(条件独立性检验)。作者提出基于相邻离散 Fourier 变换全似然的 debiased complex graphical lasso estimator,通过聚合相邻频率信息构造 entry-wise 协方差估计量。核心理论工具是多元时间序列二次型的渐近理论,同时控制了 regularization bias、有限样本 truncation bias 与 smoothing bias,从而在复数域实现有效的高维推断。证明了估计量的渐近正态性,模拟显示在非零频率处覆盖率可靠且检测功效优于 benchmark。对您有用:这是 debiased ML / one-step 思想在复数频域高维推断的扩展,直接关联您的高维渐近与效率理论兴趣。
  • 关键技术: debiased complex graphical lasso, spectral precision matrix, quadratic forms of multivariate time series, full likelihood of neighboring DFTs, simultaneous bias control (regularization, truncation, smoothing)
  • 为什么对您有用: 本文将 debiased ML 思想扩展至复数频域高维推断,直接关联您的高维渐近与效率理论(debiased ML)子方向。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接解析其二次型渐近理论,但 dissect 复数域 graphical lasso 的 debiasing 机制需调用 moderately_familiar 的 M-estimation theory。Follow-up 判断:中期可做——需先在 M-estimation theory 上长肌肉以彻底吃透 complex lasso loss 的 debiasing 步骤,但高维渐近部分立即可切入。

非参数 / 半参数 (nonparam_semipara, 3 篇)

1. 2606.08468 — Nonparametric undirected graphical model selection using diffusion models

  • 作者: Hyeok Kyu Kwon, Myeonggu Kang, Minwoo Chae, Wanjie Wang
  • 分类: stat.ME · math.ST · stat.ML · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在高维非参数设定下,本文研究无向图模型选择问题——即从数据中估计变量间的条件独立结构,现有方法大多局限于参数设定(如 Gaussian graphical models)。作者提出基于 diffusion models 的非参数图选择方法:利用扩散模型能自适应未知图结构的特性,通过 score matching / conditional independence 检验实现显式图估计。理论贡献为 model selection consistency(在适当 regularity 假设下恢复真实图结构),但未给出 minimax rate 或 semiparametric efficiency bound。仿真与两个真实数据验证了方法表现。对您而言,问题本身(高维非参数图选择)落在非参数理论和高维统计的交叉地带,但解法路径(diffusion model)与您惯用的 sieve / kernel / influence-function 工具链不同。
  • 关键技术: diffusion model score matching, nonparametric graphical model selection, model selection consistency, conditional independence graph estimation, high-dimensional structure recovery
  • 为什么对您有用: 问题端连接您 primary interest 中的非参数理论与高维统计(图模型选择是经典高维问题),但解法端(diffusion model)不在您的 technical_arsenal 中。您可用 minimax bounds for estimation problems 的视角审视其 consistency 结果能否加强为 rate 结果或效率界——这是理论上的一个口子。暂不可做:核心机器(diffusion model 的 score-based 生成框架与训练动力学)不在武器库中,若要深入需先补 diffusion model 基础;若仅从理论侧追问 minimax rate / efficiency,则中期可做(需在 moderately_familiar 的 semiparametric theory 上长肌肉以构造非参数图选择的 efficiency bound)。

2. 2606.09594 — Constraint residuals, graph posteriors, and determinant-corrected full-space targets in Bayesian inverse problems

  • 作者: Jonathon Cottom, Emilia Olsson
  • 分类: math.ST · cond-mat.stat-mech · cs.NA · math-ph · math.MP · math.NA · stat.TH
  • 相关性 8/10
  • 摘要: 在带状态方程约束的贝叶斯逆问题中,全空间(参数-状态联合)与降维空间(消去状态变量)的后验测度并不自动等价。设定状态方程 c(θ,u)=0 有唯一解 u=G(θ) 且状态 Jacobian D_u c 非奇异,本文证明降维后验、其 graph lift 与零噪声残差后验三者互不相同。通过局部变量替换,作者发现未校正高斯残差惩罚在边际化 u 后收敛到降维密度乘以 |det D_u c|^{-1},即代数等价残差定义相同可行集但极限后验不同。针对无权重、有权重及重标度残差惩罚,推导了行列式校正项,使其硬约束极限恰好为 graph-lifted 降维后验。结论将可行性与后验校准分离:仅将残差驱至零不足以精确采样 graph-lifted 后验,必须额外校正密度。
  • 关键技术: Bayesian inverse problems with constraints, reduced vs full-space posterior equivalence, determinant correction for Jacobian, graph lift of posterior measure, local change of variables, hard-constraint limit of residual penalty
  • 为什么对您有用: 本文直接触及 inverse problems with random noise(very_familiar 武器库)中的贝叶斯后验校准问题,行列式校正项与 Jacobian 行列式的关系是经典测度变换问题,研究者可立即用非参数/半参数理论审视更一般约束下的校正形式。立即可做:用 very_familiar 的 inverse problems 与 minimax 理论,检查该行列式校正对非光滑或高维约束是否仍成立,或将其嵌入 semiparametric efficiency bound 的框架审视全空间 vs 降维空间的效率差异。

3. 2606.09594 — Constraint residuals, graph posteriors, and determinant-corrected full-space targets in Bayesian inverse problems

  • 作者: Jonathon Cottom, Emilia Olsson
  • 分类: math.ST · cond-mat.stat-mech · cs.NA · math-ph · math.MP · math.NA · stat.TH
  • 相关性 8/10
  • 摘要: 在带状态方程约束的贝叶斯逆问题中,全空间(参数-状态联合)与降维空间(消去状态变量)的后验测度并不自动等价。设定状态方程 c(θ,u)=0 有唯一解 u=G(θ) 且状态 Jacobian D_u c 非奇异,本文证明降维后验、其 graph lift 与零噪声残差后验三者互不相同。通过局部变量替换,作者发现未校正高斯残差惩罚在边际化 u 后收敛到降维密度乘以 |det D_u c|^{-1},即代数等价残差定义相同可行集但极限后验不同。针对无权重、有权重及重标度残差惩罚,推导了行列式校正项,使其硬约束极限恰好为 graph-lifted 降维后验。结论将可行性与后验校准分离:仅将残差驱至零不足以精确采样 graph-lifted 后验,必须额外校正密度。
  • 关键技术: Bayesian inverse problems with constraints, reduced vs full-space posterior equivalence, determinant correction for Jacobian, graph lift of posterior measure, local change of variables, hard-constraint limit of residual penalty
  • 为什么对您有用: 本文直接触及 inverse problems with random noise(very_familiar 武器库)中的贝叶斯后验校准问题,行列式校正项与 Jacobian 行列式的关系是经典测度变换问题,研究者可立即用非参数/半参数理论审视更一般约束下的校正形式。立即可做:用 very_familiar 的 inverse problems 与 minimax 理论,检查该行列式校正对非光滑或高维约束是否仍成立,或将其嵌入 semiparametric efficiency bound 的框架审视全空间 vs 降维空间的效率差异。

效率理论 / Debiased ML (efficiency_dml, 2 篇)

1. 2606.08730 — Statistical Optimality of Prediction-Powered Inference

  • 作者: Se Yoon Lee, Jae Kwang Kim
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究 Prediction-Powered Inference (PPI) 的统计最优性:在半监督设定下,利用少量标注样本与 ML 预测做 M-estimation 推断,estimand 为满足 estimating equation 的参数,关键假设为 simple random sampling without replacement 与 predictor 的 score-calibration(预测输出与 estimating function 的真实条件期望一致)。作者将 PPI 框架为 M-estimation 问题,揭示 bias-corrected PPI estimating equation 与理想全数据 estimating equation 的等价联系,由此建立 consistency 与 n^{-1/2}-CAN。核心理论贡献:识别出 efficient influence function,证明在 score-calibrated 条件下 PPI 达到 semiparametric efficiency lower bound。对 learned prediction rules,分别发展 cross-fitting 渐近理论与 single-fit + variance correction(特例为 semiparametric mean estimation)的渐近理论。对您有用:直接推进了 semiparametric efficiency bound 在半监督/预测辅助推断中的刻画,与您 primary interest 的 efficiency theory 及 M-estimation theory 高度对接。
  • 关键技术: semiparametric efficiency bound, efficient influence function, M-estimation, cross-fitting, score-calibration, variance correction
  • 为什么对您有用: 本文直接连接到您 primary interest 的 semiparametric efficiency bounds 与 M-estimation theory——PPI 的 efficiency bound 证明是经典的 influence function + projection 论证在半监督设定下的推广。用 moderately_familiar 的 M-estimation theory 与 semiparametric theory 可以攻这篇 paper 的 efficiency bound 证明细节与 cross-fitting 渐近展开;very_familiar 的 minimax bounds 可验证其声称的 efficiency 是否紧。立即可做:用现有武器即可跟进其理论推导并检验 score-calibration 假设的必要性。

2. 2606.08730 — Statistical Optimality of Prediction-Powered Inference

  • 作者: Se Yoon Lee, Jae Kwang Kim
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究 Prediction-Powered Inference (PPI) 的统计最优性:在半监督设定下,利用少量标注样本与 ML 预测做 M-estimation 推断,estimand 为满足 estimating equation 的参数,关键假设为 simple random sampling without replacement 与 predictor 的 score-calibration(预测输出与 estimating function 的真实条件期望一致)。作者将 PPI 框架为 M-estimation 问题,揭示 bias-corrected PPI estimating equation 与理想全数据 estimating equation 的等价联系,由此建立 consistency 与 n^{-1/2}-CAN。核心理论贡献:识别出 efficient influence function,证明在 score-calibrated 条件下 PPI 达到 semiparametric efficiency lower bound。对 learned prediction rules,分别发展 cross-fitting 渐近理论与 single-fit + variance correction(特例为 semiparametric mean estimation)的渐近理论。对您有用:直接推进了 semiparametric efficiency bound 在半监督/预测辅助推断中的刻画,与您 primary interest 的 efficiency theory 及 M-estimation theory 高度对接。
  • 关键技术: semiparametric efficiency bound, efficient influence function, M-estimation, cross-fitting, score-calibration, variance correction
  • 为什么对您有用: 本文直接连接到您 primary interest 的 semiparametric efficiency bounds 与 M-estimation theory——PPI 的 efficiency bound 证明是经典的 influence function + projection 论证在半监督设定下的推广。用 moderately_familiar 的 M-estimation theory 与 semiparametric theory 可以攻这篇 paper 的 efficiency bound 证明细节与 cross-fitting 渐近展开;very_familiar 的 minimax bounds 可验证其声称的 efficiency 是否紧。立即可做:用现有武器即可跟进其理论推导并检验 score-calibration 假设的必要性。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 2606.09049 — Data augmented bootstrap: Unifying confidence interval construction by approximate invariance

  • 作者: Kevin Han Huang
  • 分类: stat.ME · cs.LG · math.ST · stat.ML · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文提出 data augmented bootstrap (DAB) 框架,在近似不变性(approximate invariance)假设下为一般统计量构建置信区间,核心 estimand 是统计量的分布与覆盖概率。DAB 统一了基于精确群对称的方法(conformal prediction、wild bootstrap for MMD U-statistics、SymmPI)以及经典 bootstrap(利用数据集对均匀抽样指标的近似不变性)。理论贡献:覆盖保证在有限样本与渐近之间按不变性强度插值,不变性用 Kolmogorov 距离度量;对满足 Gaussian universality 的统计量,近似不变性简化为条件均值与方差匹配,从而将 ML 中广泛使用的 data augmentation 纳入正式推断流程。实证部分验证了将 DA 融入 bootstrap、wild bootstrap 和 conformal prediction 在模拟及图像/语言/科学数据上的表现。对您有用:DAB 对 MMD U-statistics wild bootstrap 的统一处理直接连接 higher-order U-statistics 方向,Gaussian universality 条件与高维渐近理论有自然交集。
  • 关键技术: approximate invariance in Kolmogorov distance, Gaussian universality, wild bootstrap for MMD U-statistics, conformal prediction, data augmentation integration, coverage interpolation finite-sample to asymptotic
  • 为什么对您有用: 本文直接连接 higher-order U-statistics(MMD U-statistics 的 wild bootstrap 统一框架)与 hypothesis testing(CI 构建的一般理论)。用 very_familiar 的 'computation of higher-order U-statistics (treewidth / tensor contraction)' 可以分析 DAB 框架下高阶 U-statistics bootstrap 的计算成本与近似不变性的 tensor-contraction 结构;用 minimax bounds 可验证其覆盖插值界是否紧。Follow-up 判断:中期可做——需先在 moderately_familiar 的 'theory of higher-order U-statistics' 上长肌肉,以将 DAB 的近似不变性理论从 MMD(二阶)推广到更高阶 U-statistics 的 wild bootstrap 方案。

2. 2606.08498 — Tests for Independence of High-Dimensional Nonstationary Time Series

  • 作者: Yunyi Zhang
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在两个高维时间序列的独立性检验问题中,目标是在不假设弱平稳性(允许自协方差随时间变化)的设定下检验 H₀:两序列相互独立。提出双模加权平均(bimodal weighted-average)检验统计量,在零假设下直接消除时间依赖引起的偏差,从而避免在高维非平稳设定下困难且不稳定的白化预处理。推断方面开发了 dependent wild bootstrap 程序。理论核心是针对一类高维非线性非平稳过程的时间序列二次型建立了浓度不等式,由此推导出检验统计量的渐近零分布并证明 bootstrap 有效性。数值结果显示即使 p>n 或自协方差时变时仍能保持正确 size 和良好 power,而基于白化的方法在自协方差不稳定时 size 失控。对您可能有用之处在于,该二次型浓度不等式与您熟悉的高维渐近理论直接相关,且高维独立性检验是您 hypothesis testing 兴趣的具体子方向。
  • 关键技术: bimodal weighted-average test statistic, dependent wild bootstrap, concentration inequality for quadratic forms, high-dimensional nonstationary time series, independence testing without whitening
  • 为什么对您有用: 直接连接到您 hypothesis testing 兴趣中的高维独立性检验子方向,以及高维渐近理论(二次型浓度不等式)。您 very_familiar 的高维渐近理论可以用来审视该浓度不等式的紧性与适用范围,moderately_familiar 的 M-estimation 理论可审视该检验在更一般半参数模型下的渐近效率。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以分析该检验相对于 semiparametric efficiency bound 的效率损失。

3. 2606.08498 — Tests for Independence of High-Dimensional Nonstationary Time Series

  • 作者: Yunyi Zhang
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在两个高维时间序列的独立性检验问题中,目标是在不假设弱平稳性(允许自协方差随时间变化)的设定下检验 H₀:两序列相互独立。提出双模加权平均(bimodal weighted-average)检验统计量,在零假设下直接消除时间依赖引起的偏差,从而避免在高维非平稳设定下困难且不稳定的白化预处理。推断方面开发了 dependent wild bootstrap 程序。理论核心是针对一类高维非线性非平稳过程的时间序列二次型建立了浓度不等式,由此推导出检验统计量的渐近零分布并证明 bootstrap 有效性。数值结果显示即使 p>n 或自协方差时变时仍能保持正确 size 和良好 power,而基于白化的方法在自协方差不稳定时 size 失控。对您可能有用之处在于,该二次型浓度不等式与您熟悉的高维渐近理论直接相关,且高维独立性检验是您 hypothesis testing 兴趣的具体子方向。
  • 关键技术: bimodal weighted-average test statistic, dependent wild bootstrap, concentration inequality for quadratic forms, high-dimensional nonstationary time series, independence testing without whitening
  • 为什么对您有用: 直接连接到您 hypothesis testing 兴趣中的高维独立性检验子方向,以及高维渐近理论(二次型浓度不等式)。您 very_familiar 的高维渐近理论可以用来审视该浓度不等式的紧性与适用范围,moderately_familiar 的 M-estimation 理论可审视该检验在更一般半参数模型下的渐近效率。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以分析该检验相对于 semiparametric efficiency bound 的效率损失。

天体统计 (astrostats, 1 篇)

1. 2606.09010 — Statistical Estimation and Correction of Model-Measurement Bias in Time-Dependent Correction Factors of KAGRA

  • 作者: Shingo Hido, Takahiro Yamamoto, Dan Chen, Takahiro Sawada, Shinji Miyoki
  • 分类: astro-ph.IM · gr-qc
  • 相关性 8/10 · novelty: application
  • 摘要: 在引力波探测器 KAGRA 的校准设定下,目标是估计并修正时间依赖修正因子(TDCFs)中的模型-测量偏差,该偏差源于宽带扫频正弦校准测量(SSCMs)参考模型与实际传递函数之间的系统性偏离。作者提出基于重复测量-模型比值的滚动随机效应模型,用限制最大似然(REML)估计偏差修正因子,并将其纳入 TDCF 估计流程,同时将修正因子不确定性传播至重建响应。应用于 KAGRA O4c 数据,未修正响应在幅度上偏差达约 7%、相位偏差达约 5 度;修正后偏差显著减小,代价是传播不确定性略有增加。对您而言,本文展示了随机效应模型在物理探测器校准中的实际应用,可作为 astrostats 入门读物了解引力波校准的数据结构与统计问题。
  • 关键技术: random-effects model, REML estimation, rolling estimation, uncertainty propagation, calibration-line-based tracking, transfer function bias correction
  • 为什么对您有用: 本文属于 astrostats 方向的 gateway reading,展示了 REML 随机效应模型在引力波探测器校准中的具体应用场景(数据结构、噪声来源、选择效应均有交代)。武器库中的 estimation theory 和 software development 足以支撑理解本文方法,但统计方法本身(REML 随机效应)属于标准工具,novelty 有限。值得花时间读全文以了解 KAGRA 校准数据结构与物理建模方式,但若寻求方法学突破则不必深入。

经济理论 / 应用 (econ_theory, 1 篇)

1. 2606.08359 — Adaptive Estimation of Aggregated Values of Conditional Linear Programs

  • 作者: Gevorg Khandamiryan, Vira Semenova
  • 分类: econ.EM
  • 相关性 9/10 · novelty: new_method
  • 摘要: 本文研究部分识别参数的协变量辅助估计问题,目标参数为已知系数的欠定线性方程组的解集边界(support function),涵盖处理效应界、失业状态依赖模型、IV选择模型与随机效用模型等应用。作者将识别集边界表示为回归函数交集在协变量分布上的聚合均值,证明该边界是正则参数(regular parameter),从而具备 n^{-1/2}-CAN 性质。估计策略采用 sieve/series 回归逼近回归函数交集,再对协变量分布做聚合,给出相应的渐近理论。实证部分用 Jobs First 数据展示方法应用。对您而言,本文将部分识别与 semiparametric aggregation 结合,是经济理论中因果推断部分识别设定的一则具体案例。
  • 关键技术: partial identification, support function, regular parameter, sieve regression, aggregated conditional expectation, n^{-1/2}-CAN
  • 为什么对您有用: 本文连接到经济理论中的因果推断部分识别设定(treatment effect bounds / IV choice models),技术上将识别集边界表示为回归函数交集的聚合均值并证明其 regularity,属于 semiparametric aggregation 与部分识别的交叉。用您 very_familiar 的 minimax bounds / high-dimensional asymptotics 可检验其 sieve 逼近率的紧性,或用 moderately_familiar 的 semiparametric theory 推导其 efficient influence function 是否可达。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是 efficient influence function 在部分识别 support function 下的推导),再考虑 sharper rate 或 debiased 版本。

📌 中相关论文(按主题分组)

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)

1. 2606.09021 — Sparse Convexification for High-Dimensional Constrained Regression

  • 作者: Matey Neykov
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在高维线性回归设定下,研究一般 sign-symmetric 且 permutation-invariant 凸体 \(K\subseteq\mathbb{R}^p\) 约束下的估计问题,目标是在 sub-Gaussian random design 与 noise 假设下获得自适应 oracle inequality。提出 sparse convexification hierarchy \(K^{(s)}=\text{conv}\{v\in K:\|v\|_0\le s\}\),构造在该层级上搜索的 penalized least-squares estimator,自适应于 target 的最佳 sparse convex approximation。对 \(s\)-sparse target,oracle inequality 给出 squared-error rate 由 effective sparse dimension \(s\log(ep/s)\)、noise level \(\sigma\)\(K^{(s)}\) 的 Euclidean diameter \(d_s\) 控制。框架适用于对称 norm balls,仅需对 \(K\) 的 Minkowski functional 的 oracle access 即可实现,constrained Lasso 作为特例推出 consistency。对您有用:该框架统一了高维 constrained regression 的 rate 分析,与您 minimax bounds 武器直接对接,sparse convexification 的几何构造为高维 M-estimation under constraint 提供新视角。
  • 关键技术: sparse convexification hierarchy, oracle inequality, penalized least-squares under convex constraint, Minkowski functional oracle access, sub-Gaussian random design, constrained Lasso
  • 为什么对您有用: 直接连接高维统计的 minimax rate 分析——oracle inequality 给出 \(s\log(ep/s)\) 型 rate,与您 very_familiar 的 minimax bounds 工具直接对接。凸约束下 M-estimation 的理论框架连接您 moderately_familiar 的 M-estimation theory;sparse convexification 的几何构造为 constrained estimation 提供统一视角。中期可做:需先在 moderately_familiar 的 M-estimation under general convex body 上长肌肉,才能将此框架推广到 semiparametric efficiency 或 debiased inference 场景。

数理统计 / 假设检验 (hypothesis_testing, 4 篇)

1. 2606.07816 — High Dimensional Change Point Models for Two-Directional Data

  • 作者: Abhishek Kaul, Dipesh Baral, Stergios B. Fotopoulos, Venkata K. Jandhyala, Rebecca Killick
  • 分类: stat.ME
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文研究二维网格上高维均值过程的变点检测与估计问题,数据同时具有两个时间索引(如日观测×年尺度),空间维度可很高。在单变点设定下,作者提出基于 CUSUM 型统计量的估计方法,证明了变点估计量的收敛速率并推导了极限分布,随后扩展至多变点情形。核心技术工具包括高维 CUSUM 聚合、逐步检测(stepwise/multiple change point)以及适用于二维网格结构的渐近分析。Monte Carlo 模拟和太平洋西北地区气候数据实证支撑了理论结果。对您而言,该文的高维变点渐近理论(收敛速率+极限分布)与您在 hypothesis testing 和 high-dimensional asymptotics 方向的兴趣有直接交集。
  • 关键技术: CUSUM-type statistic for 2D grid, high-dimensional mean change point, rate of convergence for change point estimator, limiting distribution under single change point, multiple change point extension
  • 为什么对您有用: 本文连接您 primary interest 中 high-dimensional statistics(高维均值过程的渐近)与 hypothesis testing(变点检测本质是序贯/分段检验)。您 very_familiar 的高维渐近工具可直接审视其收敛速率是否达到 minimax optimal;但该文的核心是二维网格结构下的 CUSUM 聚合与极限分布推导,与您的 RMT / U-stat 武器库交集有限。中期可做:若想进入变点检测方向,需先在 moderately_familiar 的 M-estimation theory 上补充变点文献中常用的 weak convergence / functional CLS 工具。

2. 2606.08499 — A Transferability Criterion for Null-Optimized Variance Reduction in Cumulant-Based Error-Independence Testing

  • 作者: Serhii Zabolotnii
  • 分类: stat.ME · stat.CO
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在假设检验框架下,control-variate 与 polynomial-maximization (PMM) 估计量在 H0 下优化以降低方差,但检验需在 null 与 alternative 两个参数区域间决策,核心问题是 null-optimized 方差缩减何时无偏地转移到 alternative 侧。作者给出闭式准则:对 H0-centered augmentation with weight vector K0,alternative 侧期望等于 target 加 K0^T μ_{a,H1},方差缩减无偏转移的充要条件是正交性条件 K0^T μ_{a,H1}=0(各 augmenting function 均值零是充分非必要条件)。将该准则实例化于 Wiedermann-Shi 三阶累积量测量误差独立性检验:二阶 PMM 修正在 null 下无偏且方差更低(ARE 1.23–5.16,36 条件下相对效率 ≥1),但在 alternative 下 provably inconsistent——反对称多项式辅助量获得非零均值,以闭式因子衰减 target,损失 7–52 个百分点的功效,且在检验最强处与重尾下恶化最甚。四阶变体降方差(比率 1.127)但违反 nuisance guard(拒绝率 0.295 vs 0.10)。最终导出可复用的 alternative-consistency acceptance gate 用于筛选方差缩减检验统计量。对您有用:该正交性转移准则为 null-optimized variance reduction 在假设检验中的安全性提供了通用理论工具,直接连接 hypothesis testing 与 efficiency theory 两个 primary interest。
  • 关键技术: polynomial-maximization estimators, control-variate variance reduction, third-order cumulant independence test, asymptotic relative efficiency, orthogonality transfer condition, alternative-consistency acceptance gate
  • 为什么对您有用: 本文直接连接 hypothesis testing(primary)与 efficiency theory(primary)——正交性条件 K0^T μ_{a,H1}=0 为 null-optimized 方差缩减在检验中的无偏转移提供了闭式判据,这是对 ARE/功效分析的理论补充。研究者武器库中 higher-order U-statistics 的 treewidth / tensor contraction 视角可用来分析 PMM 多项式辅助量的计算代价(einsum 复杂度随阶数增长),这是具体攻入点。Follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,将转移准则推广至更一般的 semiparametric test statistic(如 HOIF-based test)的 variance reduction 场景。

3. 2606.07847 — Revisiting the Behrens-Fisher Problem: Validity-First Optimality

  • 作者: Xiao Wang, Chuanhai Liu
  • 分类: math.ST · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 本文在 inferential model (IM) 框架下重新审视 Behrens-Fisher 问题,目标是在两个正态均值差(方差未知且不等)的推断中,寻找在 prior-free 且保持 exact finite-sample validity 的前提下最短的置信区间。经过 conditioning 与 marginalization,exact association 为二维(标准化均值对比 + 方差比),其 generalized marginal IM 对应一个圆柱型二维预测随机集:均值对比投影方向由 Hsu 随机占优保证 sharp,方差比方向 vacuous。主要定理给出 validity-first optimality:在所有保持 exact uniform finite-sample validity 的 prior-free 程序中,IM 区间最短;证明了 minimaxity 与 admissibility(圆柱类),并通过投影论证推广到矩形与一般二维预测随机集。伴随的 tradeoff principle 表明任何 adaptive 程序只能在不同方差比 regime 间重新分配区间宽度,无法全局缩短。Monte Carlo 显示 Welch 与 bootstrap under-cover,保守 fiducial 并不优于 IM 区间。对您可能有用:本文的 minimaxity 与 admissibility 论证为数学统计中 nuisance parameter 下 exact inference 的 optimality 提供了新视角,直接连接 hypothesis testing 与 validity-first 优化。
  • 关键技术: inferential model (IM), predictive random set, validity-first optimality, minimaxity and admissibility, cylindrical predictive random set, Hsu's stochastic domination
  • 为什么对您有用: 本文直接连接 hypothesis testing(primary interest)中 nuisance parameter 下 exact inference 的 optimality 问题,给出了 prior-free 且 exact validity 下的 minimaxity 与 admissibility 证明。研究者 very_familiar 的 minimax bounds for estimation problems 可直接用来审视本文声称的 minimaxity 是否与经典 minimax 理论一致,以及 validity-first optimality 是否可推广到其他 nuisance parameter 结构。立即可做:用 minimax 理论验证本文的 optimality claim,并探索 IM 框架在更一般 semiparametric nuisance 场景下的 validity-first 性质。

4. 2606.07847 — Revisiting the Behrens-Fisher Problem: Validity-First Optimality

  • 作者: Xiao Wang, Chuanhai Liu
  • 分类: math.ST · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 本文在 inferential model (IM) 框架下重新审视 Behrens-Fisher 问题,目标是在两个正态均值差(方差未知且不等)的推断中,寻找在 prior-free 且保持 exact finite-sample validity 的前提下最短的置信区间。经过 conditioning 与 marginalization,exact association 为二维(标准化均值对比 + 方差比),其 generalized marginal IM 对应一个圆柱型二维预测随机集:均值对比投影方向由 Hsu 随机占优保证 sharp,方差比方向 vacuous。主要定理给出 validity-first optimality:在所有保持 exact uniform finite-sample validity 的 prior-free 程序中,IM 区间最短;证明了 minimaxity 与 admissibility(圆柱类),并通过投影论证推广到矩形与一般二维预测随机集。伴随的 tradeoff principle 表明任何 adaptive 程序只能在不同方差比 regime 间重新分配区间宽度,无法全局缩短。Monte Carlo 显示 Welch 与 bootstrap under-cover,保守 fiducial 并不优于 IM 区间。对您可能有用:本文的 minimaxity 与 admissibility 论证为数学统计中 nuisance parameter 下 exact inference 的 optimality 提供了新视角,直接连接 hypothesis testing 与 validity-first 优化。
  • 关键技术: inferential model (IM), predictive random set, validity-first optimality, minimaxity and admissibility, cylindrical predictive random set, Hsu's stochastic domination
  • 为什么对您有用: 本文直接连接 hypothesis testing(primary interest)中 nuisance parameter 下 exact inference 的 optimality 问题,给出了 prior-free 且 exact validity 下的 minimaxity 与 admissibility 证明。研究者 very_familiar 的 minimax bounds for estimation problems 可直接用来审视本文声称的 minimaxity 是否与经典 minimax 理论一致,以及 validity-first optimality 是否可推广到其他 nuisance parameter 结构。立即可做:用 minimax 理论验证本文的 optimality claim,并探索 IM 框架在更一般 semiparametric nuisance 场景下的 validity-first 性质。

统计计算 / 算法 (stat_computing, 2 篇)

1. 2606.08560 — CP-factorization for high dimensional tensor time series and double projection iterations

  • 作者: Jinyuan Chang, Guanglin Huang, Qiwei Yao, Long Yu
  • 分类: stat.ME · econ.EM · stat.ML
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在高维张量时间序列设定下,本文采用 CP 分解识别并估计因子载荷,关键假设为因子载荷向量线性独立(不要求近似正交)且允许因子相关。提出基于序列依赖结构构造矩阵的单次估计(one-pass estimation),通过标准特征分析实现,该方法适应因子载荷稀疏性并容纳弱因子。进一步提出基于双投影(double projection)的迭代算法以降低估计误差,理论上证明了迭代估计器的改进收敛速率并推导了极限分布,同时提供了渐近方差的一致估计量用于推断。对您可能有用:张量分解的计算与渐近理论直接连接 stat_computing(tensor/matrix 数值方法)与 high-dim asymptotics 武器库,双投影迭代机制可能为 higher-order U-stat 的 tensor contraction 优化提供新视角。
  • 关键技术: CP decomposition, eigen-analysis of serial dependence matrix, one-pass estimation, double projection iteration, asymptotic limiting distribution, weak factor accommodation
  • 为什么对您有用: 连接到 stat_computing(tensor/matrix 数值方法与迭代算法)和 high-dim asymptotics 子方向;张量时间序列的 CP 分解估计是高维统计与计算交叉的新场景。用 very_familiar 中的 tensor contraction / einsum 视角可分析双投影迭代中张量投影运算的计算复杂度结构,看是否能用 einsum 优化 contraction order。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉以严格分析迭代估计器的收敛保证,但核心张量计算部分立即可用现有武器探索。

2. 2606.08668 — Biweighted Poisson Subsampling for Convoluted Rank Regression with Massive Data

  • 作者: Jialiang Li, Xiaochao Xia, Wei Zhong
  • 分类: math.ST · stat.TH
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文针对大规模数据下成对损失优化问题——特别是卷积秩回归(CRR)——提出双加权 Poisson 子抽样(BIPS)框架,核心 estimand 为 CRR 参数,关键假设是目标函数的双求和结构可被成对加权近似。方法对观测对而非单点设计 IPW 权重,构造 BIPS-CRR 估计量,证明其一致性及 n^{-1/2}-CAN,并在 L-最优性准则下导出最优 Poisson 子抽样概率;进一步提出分布式估计量,以 BIPS 为 pilot 策略实现全局效率且对数据分布随机/非随机均稳健。技术工具包括 U-statistic 投影、IPW 重加权与分布式一致性理论。作者指出 BIPS 可推广至一般 U-statistic 优化与 pairwise learning。对您而言,BIPS 直接触及 higher-order U-statistics 的计算瓶颈与 subsampling 策略,且分布式估计量与您熟悉的 high-dimensional asymptotics 有交叉。
  • 关键技术: Poisson subsampling, inverse probability weighting (IPW), L-optimality criterion, U-statistic double summation structure, distributed estimation, convoluted rank regression
  • 为什么对您有用: 本文直接处理 U-statistic 双求和结构的子抽样计算,与您 primary interest 中 higher-order U-statistics 的 treewidth/einsum 计算视角高度相关——BIPS 的成对加权可视为对 U-statistic 计算成本的近似削减。用您 very_familiar 的 higher-order U-statistics 计算工具可分析 BIPS 在更高阶 U-statistic 下的推广成本与最优性;分布式估计量的全局效率证明可用 moderately_familiar 的 M-estimation 理论检验。立即可做:用 einsum/treewidth 框架量化 BIPS 在 k-阶 U-statistic 下的计算节省与信息损失。

🗂 其他论文(仅 LLM 评分,未生成摘要)

未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。

1. 2606.07715 — Causality versus Serial Correlation: an Asymmetric Portmanteau Test

  • 作者: Amedeo Andriollo
  • 分类: econ.EM
  • 相关性 7/10
  • 评分理由: Hypothesis testing for causality vs serial correlation in dynamic models with omitted variables; touches causal inference identification and testing theory.

2. 2606.08853 — AI-Assisted Variance Reduction in Randomized Experiments

  • 作者: David Arbour, Eli Ben-Michael, Avi Feller, Apoorva Lal, Lo-Hua Yuan
  • 分类: econ.EM · stat.ME
  • 相关性 7/10
  • 评分理由: Variance reduction in randomized experiments via AI covariate adjustment touches causal inference estimation theory, though contribution is more applied than deep theory.

3. 2606.07771 — Beyond Point Estimates: Benchmarking Uncertainty Quantification Methods on the AION-1 Astronomical Foundation Model

  • 作者: Karla Tame-Narvaez, Aleksandra \'Ciprijanovi\'c, Shubhendu Trivedi
  • 分类: astro-ph.IM · astro-ph.GA · cs.AI
  • 相关性 7/10
  • 评分理由: Good gateway paper: benchmarks UQ methods on astronomical foundation-model embeddings; accessible, articulates why reliable UQ matters for scientific inference, lays out data and model sides.

4. 2606.08786 — Inference for Balance in Dynamic Signed Networks

  • 作者: Ergan Shang, Yuan Zhang, Weijing Tang
  • 分类: stat.ME
  • 相关性 6/10
  • 评分理由: Nonparametric inference for structural balance touches nonparametric statistics (very_familiar), but network-specific framing is adjacent rather than core.

5. 2606.08981 — Divide-and-shrink: An efficient and heterogeneity-agnostic approach for transfer estimation using summary statistics

  • 作者: Ruoyu Wang, Xihong Lin
  • 分类: stat.ME
  • 相关性 6/10
  • 评分理由: Transfer estimation with summary statistics connects to estimation theory (very_familiar) and has relevance to causal inference settings with heterogeneous data sources.

6. 2606.09307 — Robust high-dimensional Bayesian regression with non-Gaussian errors under global--local shrinkage priors

  • 作者: Mohammad Arashi
  • 分类: stat.ME · stat.AP · stat.CO
  • 相关性 6/10
  • 评分理由: High-dimensional regression with non-Gaussian errors overlaps high-dim statistics and robustness/nonparametric theory, though Bayesian horseshoe+ machinery is not in arsenal.

7. 2606.09737 — Online change point detection under heavy-tailedness and contamination

  • 作者: Edwin Yiu Nam Tang, Yudong Chen, Mengchu Li, Yi Yu
  • 分类: math.ST · stat.TH
  • 相关性 6/10
  • 评分理由: Online change-point detection with minimax-style regime characterization of detection delay; overlaps hypothesis testing and minimax bounds (very_familiar arsenal).

8. 2606.08319 — Fast Astronomical Transients in Archival Photographic Plates: Using optical aberrations as a tool for discerning real images, from plate artifacts

  • 作者: Ivo Busko
  • 分类: astro-ph.IM
  • 相关性 6/10
  • 评分理由: Signal-vs-artifact discrimination using physical aberration signatures; accessible and has a genuine detection problem a statistician could engage with, though methodology is physics-driven.

9. 2606.07680 — A Counting Process View of Relational Event Models: Practical Asymptotics

  • 作者: Cornelius Fritz, Alexander Fuchs-Kreiss
  • 分类: stat.ME · cs.SI
  • 相关性 5/10
  • 评分理由: Counting-process asymptotics for REMs touches mathematical statistics and MLE guarantees, but the network-event-model domain is distant from core interests.

10. 2606.07947 — Bayesian Global Fr\'echet Regression via Weak Conditional Expectations

  • 作者: Simon Fontaine, Bing Li, Lingzhou Xue
  • 分类: stat.ME · math.ST · stat.AP · stat.TH
  • 相关性 5/10
  • 评分理由: Fréchet regression Bayesian framework touches nonparametric statistics (very_familiar), but object-valued regression and Bayesian approach are specialized tangents.

11. 2606.08261 — Sparse Longitudinal Functional Principal Component Analysis for Episodic Ambulatory Behavioral Assessments

  • 作者: Nidhi Pai, Yu Fang, Srijan Sen, Zhenke Wu, Erjia Cui
  • 分类: stat.ME · stat.AP
  • 相关性 5/10
  • 评分理由: Longitudinal functional PCA has some overlap with longitudinal analysis and nonparametric statistics, but the ambulatory-assessment application is peripheral.

12. 2606.08418 — TS-Neyman: Posterior Sampling for Adaptive Stratified Estimation

  • 作者: Kosuke Morikawa, Mst Moushumi Pervin, Jae Kwang Kim
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: Adaptive stratified estimation touches estimation theory and could apply in causal-inference settings, but core contribution is sequential allocation design rather than primary-interest theory.

13. 2606.08819 — Model Selection for SLOPE Models: A Bayesian Perspective

  • 作者: Fabio Feser, Marina Evangelou
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: High-dimensional variable selection (SLOPE) overlaps with high-dim statistics interest, but Bayesian FDR focus is not the researcher's core theoretical angle.

14. 2606.07984 — Lagrange multipliers in Maximum likelihood estimations and Least squares problems with Constraints

  • 作者: Takeshi Fukasawa
  • 分类: econ.EM · cs.NA · math.NA · stat.CO
  • 相关性 5/10
  • 评分理由: Asymptotic properties of Lagrange multipliers in constrained MLE/LS; touches statistical computing and M-estimation theory (moderately_familiar), but contribution is incremental.

15. 2606.07981 — Making Recursive Bayesian Inference Robust

  • 作者: Myungsoo Yoo, Daniel W\"urzler Barreto, Mevin B. Hooten
  • 分类: stat.ME · stat.CO
  • 相关性 4/10
  • 评分理由: Scalable recursive Bayesian computation is adjacent to statistical computing interest, but core is Bayesian algorithmics rather than theory the researcher focuses on.

16. 2606.09089 — Supervised Low-Rank Structure Discovery for Developmental Epigenetic Aging in Ultra-High-Dimensional DNA Methylation Data

  • 作者: Priyam Das, Jiyeon Song, Lathika Mohanraj, Karolina A. Aberg, Yi Li, Subharup Guha
  • 分类: stat.ME · stat.CO
  • 相关性 4/10
  • 评分理由: Ultra-high-dimensional regression touches high-dim statistics interest, but the epigenetics domain and latent-factor focus are too applied/specialized for core theory overlap.

17. 2606.08084 — Assessing model calibration with boosting trees

  • 作者: Selim Gatti
  • 分类: math.ST · stat.AP · stat.ML · stat.TH
  • 相关性 4/10
  • 评分理由: Calibration assessment via boosting trees; weakly adjacent to semiparametric conditional mean estimation but focused on practical methodology rather than theory.

18. 2606.07759 — SynIM: a high-performance GPU-accelerated Python library for synthetic interaction and tomographic reconstruction matrices in next-generation adaptive optics

  • 作者: Guido Agapito, Fabio Rossi, Alfio Puglisi
  • 分类: astro-ph.IM
  • 相关性 4/10
  • 评分理由: Domain-specific GPU software for AO calibration matrices; limited statistical methodology content, heavy on astronomical jargon.

19. 2606.07779 — Do Vision-Language Models See Dwarf Galaxies the Way We Do?

  • 作者: Dimitrios Tanoglidis, Chin Yi Tan, Kate Overdeck, Alex Drlica-Wagner
  • 分类: astro-ph.IM · astro-ph.GA
  • 相关性 4/10
  • 评分理由: ML evaluation paper comparing VLMs to citizen-science annotations; thin statistical methodology, more about model benchmarking than a statistical problem worth attacking.

20. 2606.07762 — Probabilistic Win Ratio Method For Hierarchical Composite Endpoints With Coarsened Outcomes

  • 作者: Lei Li, Jing Lei, Yuexiao Dong
  • 分类: stat.ME · stat.OT
  • 相关性 3/10
  • 评分理由: Clinical-trial win ratio methodology with censoring; specialized biostatistics not aligned with causal inference, high-dim, or efficiency theory interests.

21. 2606.08407 — Topological Effective Connectivity Modeling in Brain Networks

  • 作者: Anass El-Yaagoubi, Moo K. Chung, Hernando Ombao
  • 分类: stat.ME · stat.AP
  • 相关性 3/10
  • 评分理由: Brain-network application with nonparametric Hodge decomposition; nonparametric overlap is weak and application area is unrelated to primary/secondary interests.

22. 2606.08551 — Enhanced localized conformal prediction with imperfect auxiliary information

  • 作者: Yinjie Min, Liuhua Peng, Changliang Zou
  • 分类: stat.ME
  • 相关性 3/10
  • 评分理由: Conformal prediction with auxiliary data; conformal methodology is tangential to primary interests despite loose auxiliary-information connection.

23. 2606.09391 — Kling-Gupta linear regression

  • 作者: Hristos Tyralis, Georgia Papacharalampous
  • 分类: math.ST · physics.ao-ph · stat.ME · stat.TH
  • 相关性 3/10
  • 评分理由: Domain-specific hydrology estimator formalized as M-estimation; weak methodological overlap, no primary/secondary interest match.

24. 2606.09660 — New Baire category results for stochastic orders on bivariate copulas

  • 作者: Mar\'ia del Rosario Rodr\'iguez-Gri\~nolo, Manuel \'Ubeda-Flores
  • 分类: math.ST · stat.TH
  • 相关性 3/10
  • 评分理由: Baire category / topological genericity for copula stochastic orders; tangential despite copulas being nonparametric — no estimation or testing angle.

25. 2606.07811 — When Do Markets Fully Process Public Information? Evidence from Real-Time Prediction Markets

  • 作者: Giovanni Angelini, Luca De Angelis
  • 分类: econ.EM
  • 相关性 3/10
  • 评分理由: Applied market-efficiency study using prediction markets; minimal methodological overlap with primary interests.

26. 2606.08141 — A Structural Matrix Autoregressive Model for the Joint Dynamics of Volume, Volatility, and Returns

  • 作者: Andrea Bucci, Giulio Palomba, Eduardo Rossi
  • 分类: econ.EM · q-fin.GN
  • 相关性 3/10
  • 评分理由: Structural matrix AR model for financial data; high-dimensional VAR reduction not aligned with researcher's RMT/minimax high-dim interests.

27. 2606.08398 — Regime-Switching Models for Disaggregated Data

  • 作者: Anlong Qin, Zhongjun Qu
  • 分类: econ.EM
  • 相关性 3/10
  • 评分理由: Regime-switching macro model with cross-sectional aggregation; econ application without strong methodological overlap with primary interests.

28. 2606.08791 — Evaluating AI Investment Strategies

  • 作者: Irene Aldridge
  • 分类: econ.EM · cs.AI · q-fin.PM · q-fin.RM · q-fin.ST
  • 相关性 3/10
  • 评分理由: Algorithmic auditing and regret decomposition in dynamic programming; no connection to causal inference, semiparametric theory, or high-dim statistics.

29. 2606.09531 — Asymptotics of an Explosive Autoregression under Dependence

  • 作者: Kasper Sunn Blumensaat
  • 分类: econ.EM
  • 相关性 3/10
  • 评分理由: Explosive AR asymptotics under dependence is time-series econometrics, not in the researcher's core areas of causal inference or high-dim / semiparametric theory.

30. 2606.07679 — PyCBC Live Search for Compact Binary Mergers in Advanced LIGO and Virgo's Fourth Observing Run

  • 作者: Max Trevor, Gareth S. Cabourn Davies, Tito Dal Canton, Thomas Dent, Ian Harry, Stephanie Hoang, Arthur Tolley
  • 分类: astro-ph.IM · astro-ph.HE · gr-qc
  • 相关性 3/10
  • 评分理由: Gravitational-wave detection pipeline paper with heavy domain jargon; not accessible as gateway astrostats reading and statistical methodology is buried in physics context.

31. 2606.08373 — Dust to Dust: Prospects for Passive Technosignatures as Relics of ETI

  • 作者: Brian C. Lacki
  • 分类: astro-ph.IM · astro-ph.EP · astro-ph.HE · physics.pop-ph
  • 相关性 3/10
  • 评分理由: Speculative SETI/technosignature conceptual paper; engaging but no concrete statistical model or data-analysis pipeline for a statistician to improve.

32. 2606.08289 — Direct domain estimation via regression-tree-assisted estimators in the production of official statistics

  • 作者: Juan Pablo Ferreira
  • 分类: stat.ME
  • 相关性 2/10
  • 评分理由: Design-based survey estimation with regression trees; unrelated to researcher's primary or secondary interests.

33. 2606.08966 — Class Imbalance Corrections Failed to Enhance Discrimination, Model Calibration, and Prediction Stability: An Empirical Simulation Study Based on Clinical Dataset

  • 作者: Wachiranun Sirikul, Natthanaphop Isaradech, Wuttipat Kiratipaisarl, Pakpoom Wongyikul, Noraworn Jirattikanwong, Phichayut Phinyo
  • 分类: stat.ME
  • 相关性 2/10
  • 评分理由: Applied clinical prediction model simulation study; tangential to all primary and secondary interests.

34. 2606.07901 — Ergodic Theory in Classical and Bayesian Inference

  • 作者: Artur O. Lopes
  • 分类: math.ST · math.DS · math.PR · stat.TH
  • 相关性 2/10
  • 评分理由: Expository ergodic theory paper with no new results; tangential subfield unrelated to researcher's primary interests.

35. 2606.09328 — Parameter estimation in generalized fractional neuronal models

  • 作者: Pauliina Ilmonen, Milla Laurikkala, Enrica Pirozzi, Luigia Caputo, Lauri Viitasaari
  • 分类: math.ST · math.PR · stat.TH
  • 相关性 2/10
  • 评分理由: Specialized fractional neuronal model estimation; tangential to researcher's interests despite faint inverse-problem connection.

36. 2606.09116 — On the Nonlinear Dependence of Underground Muon Rate on Atmospheric Temperature Observed at Daya Bay

  • 作者: Lei Liao, Taichong Ge, Zhe Wang
  • 分类: astro-ph.IM · astro-ph.HE
  • 相关性 2/10
  • 评分理由: Pure astrophysics result on muon-temperature dependence; no clear statistical methodology or data-model exposition for a statistician outsider.

37. 2606.09515 — Control problem in millimeter-wave adaptive optics

  • 作者: Ichiro Jikuya, Yoichi Tamura
  • 分类: astro-ph.IM
  • 相关性 2/10
  • 评分理由: Control-theoretic framework for adaptive optics; core is engineering/control, not statistical data-analysis, and not accessible gateway astrostats reading.

38. 2606.08409 — Matrix representations and distance metrics for unlabeled ranked phylogenetic networks

  • 作者: Jiayang Wang, Julia A. Palacios, Claudia Sol\'is-Lemus
  • 分类: stat.ME · q-bio.PE
  • 相关性 1/10
  • 评分理由: Phylogenetic network distance metrics; completely unrelated to any primary or secondary interest.

39. 2606.07755 — MORFEO wavefront error budget

  • 作者: Guido Agapito, Lorenzo Busoni, C\'edric Plantet, Giulia Carl`a, Jean-Pierre V\'eran
  • 分类: astro-ph.IM
  • 相关性 1/10
  • 评分理由: Pure adaptive-optics engineering paper for a telescope; no statistical methodology or data-analysis problem exposed, completely unrelated.

40. 2606.07788 — Dynamic Range Beyond Bit Depth of a CMOS Image Sensor Using Interleaved Row Readout

  • 作者: Supriyo Ghosh (University of Hertfordshire, UK), William Martin (University of Hertfordshire, UK), Hugh R. A. Jones (University of Hertfordshire, UK), Angaraj Duara (The Open University, UK), Konstantin Stefanov (The Open University, UK), Jesper Skottfelt (The Open University, UK)
  • 机构: University of Hertfordshire · The Open University
  • 分类: astro-ph.IM · astro-ph.EP · astro-ph.GA · astro-ph.SR
  • 相关性 1/10
  • 评分理由: Pure hardware/sensor readout modification paper; no statistical modeling or data-analysis question.

41. 2606.08073 — Detector Development for HUBS I: Initial Testing of Small-Area TES Microcalorimeters

  • 作者: Naihui Chen, Jian Ma, Sifan Wang, Qian Wang, Guanhua Gao, Qing Yu, Yajie Liang, Yaowu Song, Jingyi Zhang, Wei Cui
  • 分类: astro-ph.IM
  • 相关性 1/10
  • 评分理由: Pure detector physics instrumentation paper; no statistical content.

Maintained by 陈星宇 · Homepage · Source on GitHub

评论