跳转至

2026-06-26 每日 arXiv 资讯

  • 高相关论文 1 篇 · 中相关 27 篇 · 其他 45 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 1 篇)

1. 2606.28017 — A Toolkit for the Study of Treatment-Effect Discontinuities

  • 作者: Alessandro Baldi Antognini, Paolo Verme
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文针对分布处理效应(DTE)中的效应符号翻转点(treatment-effect discontinuities)提供了一套分析工具包。基于Treatment Effects Curve (TEC)框架,作者首先提出水平不连续性分析(HDA),利用因果森林比较符号相反区域的处理效应;其次提出垂直不连续性分析(VDA),专门检验TEC与零线交叉点的局部斜率是否非切向(即符号翻转是否尖锐)。在推断上,作者将交叉点渐近理论(crossing-point asymptotics)适配到该设定,构造了偏差校正的Wald统计量来定位符号翻转点并检验其非切向性。方法在合成数据和墨西哥PROGRESA项目数据上进行了诊断性应用。本文的方法学贡献在于为DTE分析提供了系统性的推断工具,补充了现有方法(如分位数处理效应、分布回归)在符号翻转点识别上的空白。对您而言,该工作直接关联因果推断中的异质性处理效应分析,其符号翻转点的推断框架可迁移至您熟悉的非参数估计和M估计理论中,中期可做(需先熟悉交叉点渐近理论这一moderately_familiar工具)。
  • 关键技术: Treatment Effects Curve, causal forest, crossing-point asymptotics, bias-corrected Wald statistic, distributional treatment effects
  • 为什么对您有用: 本文直接关联您primary interest中的因果推断(异质性处理效应)和假设检验(符号翻转点的推断)。技术层面,交叉点渐近理论是您moderately_familiar的M估计理论的一个具体应用场景,可借此深入理解该工具。中期可做:需先熟悉交叉点渐近理论(moderately_familiar),再考虑将符号翻转点推断推广至更复杂的识别设定(如IV或proximal CI)。

📌 中相关论文(按主题分组)

因果推断 (causal_inference, 4 篇)

1. 2606.28621 — A bootstrap approach to prediction-powered inference

  • 作者: Bradley Efron
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文研究预测驱动推断(PPI)问题,设定为观测到一组带标签的(x,y)数据、一组无标签的x数据,以及一个独立背景数据训练出的预测规则f(x)(如机器学习模型),目标是对y的期望值等参数进行推断。核心挑战在于f(x)可能不准确,需利用无标签数据提升效率。作者提出基于bootstrap的替代算法,避免渐近近似,直接通过重抽样构造置信区间和偏差校正。与Angelopoulos et al. (2023a)的渐近方法相比,bootstrap方法在效率上更优,且适用于更一般的参数(如分位数、相关系数)。理论部分通过bootstrap的bias校正和方差估计,揭示了无标签数据的信息量:当预测规则足够好时,无标签数据可显著降低估计方差。模拟和实证表明,bootstrap PPI在有限样本下优于现有方法。对您而言,该工作连接了半参数效率理论和因果推断中的数据融合问题(如利用外部预测模型提升ATE估计精度),且bootstrap框架可直接迁移至您的proximal CI或IV设定中的敏感性分析。
  • 关键技术: bootstrap bias correction, prediction-powered inference, semiparametric efficiency, data fusion, confidence interval construction
  • 为什么对您有用: 本文直接关联您的primary interest中的因果推断(数据融合与效率提升)和半参数理论(无标签数据的信息量刻画)。技术层面,您very_familiar的bootstrap和nonparametric statistics可直接用于复现或扩展其方法至ATE估计;其bootstrap框架为proximal CI中利用负对照变量提升效率提供了新思路。中期可做:将bootstrap PPI与您的HOIF工具结合,处理高维预测模型下的偏差校正问题。

2. 2606.28200 — Experimental Design When N Equals One

  • 作者: Wenxuan Guo, Tengyuan Liang
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文研究 N-of-1 试验(单个体时间序列实验)中估计多种处理效应的最优实验设计问题。设定一个马尔可夫框架,处理分配由时变转移矩阵控制,涵盖随机切换和周期切换两类结构化设计。在有限阶脉冲响应模型下,以 OLS 估计量的估计误差最小化为设计目标,提出实用的设计优化程序。建立了大 T 渐近理论,刻画两类设计的最优时间结构,证明 i.i.d. Bernoulli 设计的稳健性,并量化最优设计如何依赖于目标 estimand(累积效应 vs. 滞后特定效应)。模拟验证了所提设计的有效性和稳健性。对您有用:该工作直接连接因果推断中纵向/时间序列实验设计,其马尔可夫框架和渐近理论可迁移至您熟悉的非参数统计和因果推断估计理论,属于立即可做的方向(用 very_familiar 的高维渐近和因果推断工具即可理解并扩展其设计优化方法)。
  • 关键技术: Markov transition design, impulse-response model, OLS estimation error minimization, random-switch design, cycle-switch design, large-T asymptotic theory
  • 为什么对您有用: 直接连接 primary interest 中的因果推断(纵向/时间序列实验设计)和数学统计(渐近理论)。技术武器库中 very_familiar 的高维渐近和因果推断估计理论可直接用于理解并扩展其设计优化框架,例如将马尔可夫设计推广至更复杂的处理效应(如动态 treatment regimes)。立即可做:用 very_familiar 的非参数统计和因果推断工具即可复现并改进其渐近结果。

3. 2606.27952 — Robust estimation of occupation probabilities for coarsened multistate processes

  • 作者: Niklas Nyboe Maltzahn, Gergely Dániel Lukáts, Kjetil Røysland
  • 相关性 7/10 · novelty: application
  • 摘要: 本文针对多状态模型中状态占据概率(occupation probability)的估计问题,在两种粗化机制(右删失和基线暴露)下提出了增强逆概率加权(AIPW)估计量。识别所需的关键可交换性假设是随机粗化(coarsening at random),允许存在时变混杂,但不要求马尔可夫性质。估计量通过结合结果回归和倾向性得分模型,实现了双重稳健性:只要其中一个模型正确指定,估计量即一致。理论部分推导了估计量的渐近性质(包括影响函数和半参数效率界),并通过模拟研究验证了有限样本下的稳健性和效率。该工作将因果推断中的缺失数据与逆概率加权技术系统性地移植到了多状态生存分析中,对您而言,其AIPW构造和双重稳健性分析可直接迁移至您熟悉的因果推断(如纵向数据中的ATE估计)和半参数效率理论方向。
  • 关键技术: augmented inverse probability weighting (AIPW), coarsening at random, double robustness, influence function, multistate model, time-varying confounding
  • 为什么对您有用: 本文直接连接您的primary interest中的因果推断(纵向数据、时变混杂下的identification)和效率理论(AIPW估计量的影响函数与半参数效率界)。您武器库中very_familiar的'非参数统计'和'因果推断中的估计理论'可直接用于理解其双重稳健性机制,而moderately_familiar的'半参数理论'可进一步分析其效率界是否紧。中期可做:若想将本文的AIPW框架推广至更复杂的粗化模式(如区间删失),需先在moderately_familiar的'identification theory in causal inference'上深入理解coarsening at random的图模型条件。

4. 2606.27662 — Design-Aware Variance Reduction for Switchback Experiments: A Comparative Study

  • 作者: Sergei Pankratev
  • 相关性 7/10 · novelty: application
  • 摘要: 本文聚焦于在线平台常用的 switchback 实验(一种聚类随机化设计)中的方差缩减方法。在聚类和时间依赖结构下,标准 A/B 测试中的方差缩减技术(如 CUPED、基于 ML 的协变量调整 CUPAC、双重稳健估计量)的表现会发生变化。作者通过分层模拟框架,系统变化聚类数、聚类规模不平衡、组内自相关、携带效应和预测信号强度等关键参数,评估这些方法的有效性(假阳性率、置信区间覆盖率)和效率(标准误缩减、统计功效、最小可检测效应)。还包含跨聚类溢出效应的敏感性分析,以量化轻度干扰下的偏差和推断退化。主要输出是一张面向实践者的“机制地图”,指明在何种条件下 CUPED、CUPAC 或 DR 最有益,以及何时时间和聚类依赖及有限聚类效应限制了改进。该工作直接关联到您在因果推断中关于实验设计和估计方法的研究兴趣,特别是纵向设定下的方差缩减问题。
  • 关键技术: CUPED, CUPAC, doubly robust estimator, cluster-robust standard errors, switchback experiments, simulation-based inference
  • 为什么对您有用: 本文直接关联您 primary interest 中的因果推断(实验设计、估计方法),特别是纵向和聚类设定下的方差缩减。您武器库中 very_familiar 的 estimation theory in causal inference 和 moderately_familiar 的 semiparametric theory 可直接用于理解其 DR 估计量的理论性质。中期可做:若想深入分析其模拟框架的统计性质(如有限聚类下的偏差),需先在 moderately_familiar 的 M-estimation theory 上加强,以处理聚类依赖下的推断问题。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)

1. 2606.27789 — Robust and Scalable Sure Screening of Fixed effects in Ultrahigh-dimensional Linear Mixed Models

  • 作者: Abhik Ghosh, Magne Thoresen
  • 相关性 6/10 · novelty: new_method
  • 摘要: 针对超高维线性混合模型中固定效应协变量的筛选问题,提出了一种稳健且可扩展的确定筛选(sure screening)方法。该方法利用基于代理变量的变换来解耦随机效应引起的相关性,从而在变换后的回归模型中通过边际分析进行筛选。通过基于最小密度幂散度(minimum density power divergence)构建边际效用,实现了对数据污染和模型误设的稳健性,同时不牺牲可扩展性。所提出的DPD-SISP方法在一般条件下(允许非高斯误差和维度的非多项式增长)以指数高概率保留了所有相关协变量(确定筛选性质)。此外,通过影响函数和崩溃点分析,该方法展现出强稳健性。框架进一步扩展以纳入先验信息(条件筛选)、通过迭代细化减轻相关性引起的遮蔽,以及实现稳健的筛选后固定效应估计。模拟研究展示了其在理想设置下的竞争性能和在数据污染下的稳定性优势,并通过ADNI2研究的高维纵向数据说明了其实用性。该方法为超高维线性混合模型中的变量筛选提供了一个统一、稳健且可扩展的框架。
  • 关键技术: sure screening, minimum density power divergence, linear mixed models, proxy-based transformation, influence function, breakdown point
  • 为什么对您有用: 本文直接关联您在高维统计和假设检验方面的兴趣,特别是超高维设定下的变量筛选问题。您武器库中'高维渐近理论'和'非参数统计'可用于分析其确定筛选性质的理论保证,而'稳健估计'的思想可进一步拓展。中期可做:若想将类似思路推广至更复杂的相依结构(如空间或时间相关),需先在'半参数理论'上加强。

非参数 / 半参数 (nonparam_semipara, 1 篇)

1. 2606.28641 — Revisiting local regression: shape regularity, uniform rates, and the limits of random splits

  • 作者: Jérémy Bettinger, François Portier, Adrien Saumard
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 本文在点态和一致范数下分析局部平均估计量(如核估计、k-NN、树估计)的非渐近行为,目标函数为Lipschitz回归函数。作者基于VC类局部化集的一般偏差界,引入“形状正则局部映射”概念,要求平均集具有近似各向同性的几何形状。核心结论是:形状正则性既是达到最优收敛速率(至多对数因子)的充分条件,也是必要条件——必要性通过一个显式的各向异性例子非渐近地证明,此前仅在渐近理论中启发式理解。由此导出两个推论:第一,简单的k-最近邻规则天然满足形状正则性,即使在无界支撑上也达到最优速率;第二,流行的随机分裂条件(如CART树)虽保证一致性和单元直径收缩,但无法保证最优速率——盲建树的单元纵横比随深度指数发散,形状正则性以正概率失效,从而揭示障碍在于缺乏几何校正机制而非直径收缩过慢。最后,作者提出一种通过约束允许分裂来强制形状正则性的树构造,并证明其均匀偏差不等式,恢复Lipschitz函数的最优速率。
  • 关键技术: local averaging estimators, shape-regular local maps, VC class deviation bound, k-nearest neighbor, random-split trees, uniform deviation inequality
  • 为什么对您有用: 本文直接关联非参数与非参数理论(primary interest),其形状正则性刻画与均匀收敛速率结果对您熟悉的minimax界和局部估计理论有直接参考价值。技术上,您可以用very_familiar的非参数统计和minimax界工具验证其最优速率是否紧,或将其形状正则性条件推广到高维设定。中期可做:若将形状正则性与您moderately_familiar的HOIF结合,可能导出局部估计量的高阶影响函数展开。

数理统计 / 假设检验 (hypothesis_testing, 4 篇)

1. 2606.27899 — Optimal Estimators for Heavy-Tailed Mean Estimation via Convex Analysis

  • 作者: Bart P. G. van Parys, Bert Zwart
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 研究在对称矩类(已知偶函数 φ 的矩有界)下位置参数的最优估计问题。固定误差幅度 Δ 时,给出了任何可测估计量犯超过 Δ 的误差的最小最坏概率 β_n(Δ) 的精确大偏差刻画,其指数率恰好是平移类间的两点 Hellinger 指数 r(Δ)。该指数由一个单调 M-估计量非渐近地达到,该估计量通过一个两参数凸规划合成,拉格朗日对偶将估计函数的无限维搜索压缩为两个乘子,自然导出先验构造中假定的夹层形状。对于有界方差(φ(x)=x^2, B=σ^2),指数为 r(Δ)=½log(1+Δ²/σ²)。在固定置信度、最优幅度 Δ_n(β) 随 n 缩小的设定下,同一合成方法对若干具体类保持最优到主阶,且当 β↓0 时达到 Catoni 的常数 √2 和 Lee/Bhatt 等人的常数 L(α),从而证明这些常数是紧的。最不利分布简单,至多三点支撑。该文通过凸分析统一了重尾均值估计的最优性理论,对您在高维统计和假设检验中的 minimax 分析有直接的方法论连接。
  • 关键技术: large deviation characterization, Hellinger exponent, monotone M-estimator, Lagrangian duality, convex program synthesis, two-point least favorable distribution
  • 为什么对您有用: 该文直接连接您在高维统计和假设检验中的 minimax 下界兴趣,特别是重尾设定下最优估计的精确指数率刻画。您武器库中非常熟悉的 minimax bounds for estimation problems 和 nonparametric statistics 可直接用于验证其指数率是否紧,或推广到其他矩类。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以处理更一般的半参数模型下的重尾最优估计。

2. 2606.28597 — Focused median bias reduction

  • 作者: Davide Benussi, Ioannis Kosmidis, Alessandra Salvan, Nicola Sartori
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文针对光滑标量变换的焦点参数,提出了一种显式的中位数偏差校正估计量。现有方法通常需要求解非线性方程组,计算成本高且需完全指定 nuisance 参数化,而本文基于 Cornish-Fisher 展开,仅需参考参数化下的 MLE 或其渐近等价估计、变换的梯度和 Hessian,以及对数似然导数的期望乘积,即可得到显式校正。所得估计量达到三阶中位数无偏,且当焦点参数包含在参考参数化中时,可作为隐式中位数偏差校正估计量的一步近似。该方法改进了标准渐近推断,并与基于 hull 的置信程序自然结合,在中位数偏差控制下提供接近名义水平的有限样本覆盖率。通过焦点信息准则下的选择后推断、马氏距离、分位数等回归、圆形和分层模型中的标量焦点参数展示了框架的实用性。对您而言,该工作直接关联数学统计与假设检验兴趣,其显式校正思路可迁移至您熟悉的非参数统计或高维设定下的偏差校正问题。
  • 关键技术: Cornish-Fisher expansion, median bias reduction, third-order median unbiasedness, one-step approximation, hull-based confidence procedures
  • 为什么对您有用: 本文直接关联您的数学统计与假设检验兴趣,提出了一种显式的中位数偏差校正方法,避免了现有隐式方法的计算负担。您非常熟悉的非参数统计与高维渐近工具可用于评估该方法在更复杂模型(如高维或半参数设定)下的表现,这是中期可做的方向,需先在 moderately_familiar 的 M-估计理论上加强。

3. 2606.28324 — The multiply iterated law of the iterated logarithm: game-theoretic foundations of sequential detection boundaries

  • 作者: Akshay Balsubramani
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 本文在任意有效置信序列(anytime-valid confidence sequences)和 e-process 的框架下,将经典的混合检验构造重新解释为一个双人博弈:Learner 选择混合先验,Nature 自适应地产生均值为零的得分过程,其难度由累积生成函数(CGF)定价。核心贡献是推导出一条逐路径的 Gibbs-变分恒等式,无需期望算子,Ville 不等式、等化条件、GROW 刻画和鞍点公式均为其特例。在此基础上,论文证明重对数律(LIL)是这一序贯检测博弈的极小极大边界,而非任意的组合松弛;最优先验不是设计选择,而是迫使 Nature 在所有边界穿越时间上成本相等的等化策略,其闭式解给出尖锐的一阶迭代对数修正,系数为 3/2。在 log-log 尺度下,该等化策略恰好是尺度之尺度的 Jeffreys 先验,而 Erdős-Kolmogorov 积分检验是选择它的准则。Howard-Ramdas 混合与缝合构造、以及赌博置信序列均可视为该等化原理的实例。对您而言,本文为序贯假设检验提供了博弈论与信息论的新视角,其路径式恒等式和等化策略思想可能启发您在高维或因果推断中设计更锐利的序贯检验边界。
  • 关键技术: game-theoretic probability, Ville's inequality, law of the iterated logarithm (LIL), Gibbs-variational identity, Jeffreys prior, Erdős-Kolmogorov integral test
  • 为什么对您有用: 本文直接关联您对假设检验的兴趣,特别是序贯检验的边界理论。您武器库中的 minimax bounds 和 high-dimensional asymptotics 可用于验证本文 LIL 边界在高维设定下的紧性,或将其推广到更一般的得分过程。中期可做:需先熟悉 moderately_familiar 中的 e-process 和赌博置信序列构造,然后可尝试将等化策略思想应用于因果推断中的序贯敏感性分析。

4. 2606.28598 — Conformal Prediction with Macro-Coverage Guarantees

  • 作者: Aabesh Bhattacharyya, Tiffany Ding, Rina Foygel Barber
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文在分类问题中研究预测集(prediction set)的覆盖保证。传统边际覆盖(marginal coverage)仅保证平均覆盖,导致低概率类别被忽略;而类别条件覆盖(class-conditional coverage)在长尾分布下因校准点稀少而难以满足。作者引入宏观覆盖(macro-coverage),定义为各类别条件覆盖率的未加权平均,作为两者之间的折中。方法上,利用标签加权共形预测(label-weighted conformal prediction)构造预测集,在有限样本下保证宏观覆盖,并推广到任意类别分组的加权平均覆盖目标。进一步刻画了满足给定广义宏观覆盖目标的最小预测集形式,并提出相应的共形得分函数。在两个大规模图像分类数据集上验证了理论结果。对您而言,本文涉及共形预测的覆盖保证问题,与您在高维统计和假设检验方面的兴趣有交集,尤其是其有限样本保证和类别加权策略可启发您在高维分类或因果推断中处理罕见子组覆盖问题。
  • 关键技术: conformal prediction, macro-coverage, label-weighted conformal prediction, class-conditional coverage, finite-sample guarantee
  • 为什么对您有用: 本文属于假设检验与预测集覆盖的交叉方向,直接连接您对 hypothesis testing 的兴趣。您武器库中的 nonparametric statistics 和 minimax bounds 可用于分析其覆盖保证的紧性,而 higher-order U-statistics 的树宽视角或可评估其预测集构造的计算成本(如类别加权得分的计算复杂度)。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以理解其加权覆盖目标与影响函数的关系。

天体统计 (astrostats, 10 篇)

1. 2606.28446 — Domain-Informed Multi-View Self-Distillation for Astronomical Light-Curve Representation Learning with JEPA

  • 作者: Yicheng Rui
  • 相关性 7/10 · novelty: application
  • 摘要: 本文针对天文光变曲线(light curve)的不规则采样、复杂噪声和多物理时间尺度问题,提出了一种领域知识引导的多视图自蒸馏表示学习框架。该框架基于联合嵌入预测架构(JEPA),结合语义保持视图、不确定性感知的 tokenization 和多视图自蒸馏(LeJEPA 正则化)来训练编码器。在 LEAVES 数据集上训练后,在 StarEmbed 分类基准上,模型在 16 个分类指标中的 15 个上优于手工特征。在少样本线性探测中,每类 1 个样本时 macro-F1 达 42.56±7.21,每类 100 个样本时达 63.58±1.20。除变星分类外,学到的表示还支持相似性搜索、参数估计和零点漂移检测。在 PYRREGULAR 的 12 个异质不规则时间序列数据集上的跨域适应实验中,适应后的变体在 5 个数据集上达到或超越此前最优,而任何单一基线最多仅胜出 3 个。结果表明,领域信息引导的多视图自蒸馏是不规则时间序列表示学习的有效策略,且成功的表示学习需要领域特定的归纳偏置。作为一篇 astrostatistics 领域的应用型论文,本文清晰展示了天文数据(光变曲线)的结构、噪声和采样特性,以及模型设计如何针对这些特性进行适配,适合作为统计学家进入该领域的入门读物。
  • 关键技术: Joint-Embedding Predictive Architecture (JEPA), multi-view self-distillation, uncertainty-aware tokenization, irregular time series representation learning, cross-domain adaptation
  • 为什么对您有用: 本文属于 astrostatistics 的 gateway reading:它清晰阐述了天文光变曲线的数据特性(不规则采样、复杂噪声、多物理时间尺度)和模型设计(JEPA、多视图自蒸馏),适合作为统计学家了解该领域数据与模型结构的入门读物。武器库中的非参数统计和软件工程经验足以理解其方法框架,但若要深入改进其表示学习理论(如收敛性、泛化界),则需在 moderately_familiar 的 M-estimation 理论上补强。值得花时间读全文,以获取对天文时间序列数据结构和当前表示学习范式的直观认识。

2. 2606.25610 — The Galaxy's Guide to the Tokenizer: A Benchmark for Scientific Foundation Models

  • 作者: Sogol Sanjaripour, Michael J. Smith, Manuel Pérez-Carrasco, Juan Rafael Martínez-Galarza, Bahram Mobasher, Gabriela Canalizo
  • 相关性 6/10 · novelty: application
  • 摘要: 本文系统比较了四种 tokenization 策略(Affine、AIM、JetFormer、VQ-VAE)在统一 AstroPT 骨干框架下对天文图像(DESI Legacy Survey 64 万张星系图像)的表示学习影响。核心发现是重建质量与表示质量解耦:流模型 JetFormer 重建最优,VQ-VAE 在星系物理属性预测上表现最强,而 Affine 和 AIM 更好保留局部形态信息。没有单一方法在所有任务上一致最优。评估基于独立测量的物理量(红移、恒星质量等),使 benchmark 具有可解释性。对您而言,这是一篇优秀的入门级天文统计读物:数据规模、噪声结构、选择效应交代清晰,模型侧(tokenizer + transformer)的假设与评估指标透明,适合作为进入 astrostatistics 方向的起点。
  • 关键技术: tokenization strategies, VQ-VAE, flow-based generative model, transformer foundation model, astronomical imaging, representation quality vs reconstruction quality
  • 为什么对您有用: 本文属于 astrostatistics 的 gateway reading:数据侧(DESI Legacy Survey 的 64 万张图像、噪声与选择效应)和模型侧(tokenizer + transformer 的假设与评估指标)交代清晰,适合作为进入天文统计方向的入门读物。武器库中 'nonparametric statistics' 和 'high-dimensional asymptotics' 足以理解其评估框架,但核心机器(tokenizer 设计、flow-based 模型)不在当前武器库中,属于暂不可做方向。值得花时间读全文以了解天文数据结构和统计挑战。

3. 2606.28493 — The Role of Artificial Intelligence in the SKA Era

  • 作者: Philipp Denzel, Frank-Peter Schilling, Elena Gavagnin
  • 相关性 5/10 · novelty: survey
  • 摘要: 本文综述了人工智能在平方公里阵列天文台(SKAO)时代的关键作用。SKAO将产生PB级数据集和Tb/s级数据流,传统分析范式面临挑战。文章系统探讨了深度学习在自动源检测、射频干扰抑制、异常检测和参数推断中的应用,以及生成模型加速天空模拟、校准和成像的潜力。强化学习被用于动态调度和自主系统控制,联邦学习则应对SKA数据的分布式特性。文章强调可解释性、不确定性量化和物理信息归纳偏置对科学完整性的必要性。作为一篇综述,本文没有提出新方法,但为统计学家进入射电天文学领域提供了清晰的入口。
  • 关键技术: deep learning, generative models, reinforcement learning, federated learning, uncertainty quantification, physics-informed inductive biases
  • 为什么对您有用: 这是一篇面向外行的射电天文学AI综述,适合作为进入astrostatistics的入门读物。武器库中的非参数统计和高维渐近理论可用于理解SKA数据中的信号检测和参数推断问题,但本文不涉及具体统计方法,属于gateway-reading范畴。值得花时间读全文以了解SKA数据结构和分析需求,但短期内无法直接动手做研究。

4. 2606.25573 — argosim: a Python package for radio interferometric simulations

  • 作者: Ezequiel Centofanti, Emma Ayçoberry, Samuel Farrens, Samuel Gullin, Manal Bensahli, Jean-Luc Starck et al.
  • 相关性 5/10 · novelty: application
  • 摘要: 本文介绍 argosim,一个用于射电干涉观测模拟的 Python 包。该包采用模块化、轻量级设计,兼容主流操作系统。计算后端基于 JAX,因此具备高性能加速和完全可微分的优势。文章详细说明了从天线位置到清洁图像生成观测数据的主要模块和使用流程。argosim 是一个完全开源的项目,代码托管在 GitHub 上。作为射电天文学模拟工具,它提供了清晰的数据生成管线,但本身不涉及新的统计方法或理论贡献。对于希望进入射电干涉数据分析的统计学家,这是一个很好的入门工具,可以了解数据结构和噪声模型。
  • 关键技术: JAX-based simulation, radio interferometric imaging, modular simulation pipeline, differentiable programming
  • 为什么对您有用: 这是一篇 astrostatistics 方向的 gateway-reading 文章。对于不熟悉射电天文学的统计学家,argosim 提供了清晰的数据生成流程和噪声结构说明,是很好的入门读物。武器库中的软件开发和逆问题经验足以支撑理解其模拟管线,但本文不涉及新统计方法,属于工具介绍,值得花少量时间浏览以了解射电数据的基本特征。

5. 2606.25352 — M-EPDet: Real-Time Real-Bogus Classification and Transient Candidate Judgement for the EP-WXT Pipeline via Multi-Modal Data

  • 作者: Lang Chen, Yunfei Xu, Zhen Zhang, Dongyue Li, Hui Sun, Yuan Liu et al.
  • 相关性 5/10 · novelty: application
  • 摘要: 本文针对爱因斯坦探针卫星WXT望远镜的实时候选体筛选问题,提出M-EPDet三阶段后检测框架。第一阶段用ResNet基的Arm滤波器区分真实源与仪器伪影;第二阶段用双分支时-谱宇宙射线滤波器剔除宇宙射线事件;第三阶段用背景感知的贝叶斯块模块进行单次曝光变异性筛选。在轨数据测试显示,真实源召回率达98.31%,仪器伪影和宇宙射线剔除率分别为92.99%和98.18%,最终候选体量减少99.25%。系统已部署为轻量级实时服务,大幅降低人工检查负担。作为天文数据管道中的分类与筛选应用,本文清晰展示了数据流结构(候选体流、噪声类型、时变特征)和模型设计(ResNet、贝叶斯块),适合作为统计学家进入天文数据处理的入门读物。
  • 关键技术: ResNet, Bayesian Blocks, real-time classification, multi-modal data fusion, candidate vetting pipeline
  • 为什么对您有用: 本文属于astrostats的gateway reading:它清晰阐述了天文管道中的实际数据问题(候选体流、噪声类型、时变特征)和模型设计(ResNet、贝叶斯块),适合作为统计学家进入天文数据处理的入门读物。武器库中的非参数统计和软件工程经验可直接用于理解其贝叶斯块变点检测和管道架构,但核心方法(ResNet分类、宇宙射线特征工程)属于应用层面,不涉及新统计理论。值得花时间读全文以了解天文数据管道的典型结构,但无需深入技术细节。

6. 2606.28645 — GOATS: The next generation software infrastructure for time-domain astronomy at Gemini/NOIRLab. Application to alerts from Vera C. Rubin Observatory's Legacy Survey of Space and Time

  • 作者: Monika Soraisam, Louis Avner, Miguel Gómez, William Vacca, Bryan Miller, Andrew Stephens et al.
  • 相关性 4/10 · novelty: application
  • 摘要: 本文介绍GOATS,一个为Gemini天文台和NOIRLab构建的端到端软件基础设施,旨在统一和简化时域与多信使天文学(MMA/TDA)的后续观测工作流。当前MMA/TDA流程需要拼凑多个独立软件包和用户界面,GOATS通过集成ANTARES警报代理、Gemini望远镜触发、档案数据检索以及DRAGONS数据还原分析工具,实现了从目标选择到科学解释的一站式平台。系统成功在Rubin/LSST警报的实时后续观测演示中部署,能在检测后数分钟内触发观测并获取光谱,对多种超新星(Ia、IIP、Ib/c)进行了分类,红移范围0.05–0.35。GOATS通过自动化重复任务降低了使用门槛,让用户专注于科学结果解读。对您而言,这是一篇典型的astrostats gateway reading,清晰展示了天文时间域数据处理的实际工作流和数据管道结构,适合作为了解该领域数据挑战的入门读物。
  • 关键技术: alert broker integration, automated telescope triggering, pipeline data reduction, real-time follow-up workflow
  • 为什么对您有用: 本文属于astrostats gateway reading,清晰展示了天文时间域数据从警报产生到光谱获取的完整工作流和数据管道结构,适合作为了解该领域数据挑战的入门读物。武器库中'软件发展'的very_familiar经验可直接用于理解其系统架构,但核心是软件工程而非统计方法学,因此暂不可做后续方法学拓展。值得花时间读全文以建立对天文数据管道的直观认识。

7. 2606.28221 — Faraday Tomography with the SKA: A New Era of Cosmic Magnetism Studies

  • 作者: Miguel Carcamo, Anna M. M. Scaife, Jeroen Stil, Russ Taylor, Jennifer L. West, Tessa Vernstrom
  • 相关性 4/10 · novelty: survey
  • 摘要: 本文综述了平方千米阵列(SKA)在法拉第层析成像中的应用,系统介绍了法拉第旋转与法拉第测量合成技术的基本原理及其在宇宙磁场研究中的核心作用。文章聚焦于SKA最终部署阶段AA4(197面天线,最大基线40 km,频率覆盖350 MHz–15.4 GHz)以及前期AA*阶段(144面天线)的技术参数,详细说明了各波段(Band 1、2、5a、5b)的法拉第深度分辨率与最大可观测深度。文中讨论了法拉第测量合成与图像合成技术的协同效应,并通过模拟结果展示了SKA在高分辨率磁场观测中的潜力。此外,文章还探讨了超越基线配置的增强方案以及与其他天文台的协同观测策略。本文是一篇面向非天文学家的入门级综述,清晰阐述了数据生成过程(极化测量、频域采样)和模型假设(法拉第色散函数),适合统计学家快速了解该领域的基本问题与数据特征。
  • 关键技术: Faraday rotation measure synthesis, radio interferometry, polarization imaging, multi-wavelength astronomy
  • 为什么对您有用: 本文属于astrostats的gateway reading,适合作为统计学家进入宇宙磁场数据分析的入门读物。文章清晰交代了数据侧(极化测量、频域采样、噪声结构)和模型侧(法拉第色散函数的反问题),武器库中的非参数统计和逆问题工具可直接用于理解其反卷积问题。值得花时间读全文以评估后续是否可介入该方向的方法学改进。

8. 2606.27143 — Frequency Phase Transfer for Future Millimetre Arrays with Arbitrary Frequency Ratios

  • 作者: Senkhosi Simelane, Athol Kemball, Roger Deane
  • 相关性 4/10 · novelty: application
  • 摘要: 本文针对(亚)毫米波干涉阵列中由非色散对流层湍流引起的相位延迟问题,提出了一种新的频率相位传递(FPT)算法——相位包裹计数(PWC)。现有FPT算法在非整数频率比下会失效,导致残差相位出现跳跃不连续性。PWC通过显式处理相位包裹计数,适用于任意频率比,并澄清了跳跃不连续性的来源。作者基于新开发的HITOPS软件包,在事件视界望远镜(EHT)的模拟双频观测中验证了PWC的有效性,结果表明在真实大气条件和热噪声水平下,PWC利用86 GHz相位成功校准了230 GHz相位,在相干性和峰值流量恢复上均优于传统相位校准方法。本文是典型的应用型天文学方法论文,方法学新颖性有限(novelty_flag: application),但作为入门读物,它清晰阐述了天文学家关心的核心信号处理问题(大气相位延迟)及数据特点(干涉测量、双频观测、噪声结构),适合统计学家了解该领域的数据分析挑战。
  • 关键技术: Frequency Phase Transfer, phase-wrap counting, interferometric calibration, atmospheric phase delay correction
  • 为什么对您有用: 本文属于astrostats的gateway reading。它清晰阐述了天文学中一个具体的数据分析问题(大气相位延迟的校准),并给出了数据结构和噪声模型,适合作为统计学家进入该领域的入门读物。武器库中的'非参数统计'和'高维渐近理论'可用于分析相位估计的收敛性,但核心问题(相位包裹、信号处理)与当前武器库的直接交集有限,属于'暂不可做'——缺少干涉测量信号处理的专业知识。不过,本文值得花时间阅读全文,以了解天文学中一个典型的统计推断场景。

9. 2606.26635 — Single object observations: Large telescopes vs. multiple small telescopes

  • 作者: Sagi Ben-Ami, Eran Oded Ofek
  • 相关性 4/10 · novelty: application
  • 摘要: 本文比较了单目标观测中不同望远镜架构的成本效益,包括单台视宁度极限望远镜、单台衍射极限望远镜以及由小望远镜组成的阵列。以单位成本的巡天速度作为性能指标,研究发现:在背景主导的观测区域(可见光星等约20等以上),衍射极限望远镜比视宁度极限望远镜更具成本效益。对于未分辨的单目标观测,视宁度极限望远镜阵列通常优于单台大望远镜;但若匹配巡天速度,单台衍射极限望远镜仅在目标暗于20-24星等时优于小视宁度望远镜阵列。文章还讨论了望远镜阵列的最小尺寸和维护问题,并指出结论依赖于具体假设和系统参数。作为天文仪器设计的入门级读物,本文清晰阐述了观测目标、噪声来源(背景主导 vs. 源主导)和性能度量,适合统计学家理解天文数据采集的物理约束。
  • 关键技术: survey speed metric, background-dominated regime, diffraction-limited vs seeing-limited, telescope array cost model
  • 为什么对您有用: 本文属于astrostats的gateway reading,适合作为统计学家进入天文仪器设计的入门材料。它清晰阐述了观测数据的物理生成过程(信号 vs. 背景噪声)、性能度量(巡天速度/成本比)以及不同架构的权衡,这些是理解天文数据结构和选择偏差的基础。武器库中的非参数统计和逆问题经验可用于分析此类观测系统的信噪比特性,但本文本身不涉及统计方法创新,属于暂不可做的方向——核心机器(天文仪器物理建模)不在武器库中,但作为入门读物值得花时间阅读全文以建立领域直觉。

10. 2606.25817 — On-Sky Single-photon Time resolution of 35 ps with White Rabbit synchronization: towards the measurement of the size of a White Dwarf star

  • 作者: F. Izraelevitch-Patitucci, S. Tolilla, I. Ellafi, J. -P. Rivet, M. Hugbart, G. Labeyrie et al.
  • 相关性 4/10 · novelty: application
  • 摘要: 本文报告了 IC4Stars 项目的最新进展,旨在通过强度干涉测量法测量白矮星天狼星 B 的直径。研究团队在实验室中表征了单光子探测器、时间-数字转换器(TDC)和同步电子设备的性能。他们利用 White Rabbit 协议和 30 米电信光纤,在观测活动中实现了低于 35 ps RMS 的星上时间分辨率。开发了原始时间标签的数据采集系统,并设计了计算二阶相关函数的算法。这项工作展示了将高精度时间同步技术应用于天文强度干涉测量的可行性,为测量致密天体尺寸提供了关键技术验证。对于统计学家而言,本文清晰展示了天文观测中的数据采集、噪声处理和相关函数计算流程,是了解强度干涉测量这一统计密集型天文方法的良好入门读物。
  • 关键技术: Intensity Interferometry, White Rabbit synchronization, second-order correlation function, single-photon time resolution, time-to-digital converter (TDC)
  • 为什么对您有用: 本文属于 astrostatistics 的 gateway reading,清晰阐述了强度干涉测量的数据采集和二阶相关函数计算流程,适合作为统计学家进入该领域的入门材料。研究者武器库中的非参数统计和软件工程经验足以理解其数据处理管道,但核心的天文物理模型(如恒星直径与相关函数的关系)需要额外学习。值得花时间读全文以了解天文数据采集的独特挑战和统计需求。

经济理论 / 应用 (econ_theory, 1 篇)

1. 2606.27842 — Quantifying Demand Shocks in the Green and Digital Transition

  • 作者: Andrea Bastianin, Luca Rossini, Marco Zoso
  • 相关性 5/10 · novelty: application
  • 摘要: 本文利用网络搜索数据构建了钴、铜、镍三种关键金属的衍生需求月度指数,这些金属是绿色能源和数字转型技术的重要投入品。作者将这些指数纳入全球金属市场的结构向量自回归(SVAR)模型,并利用零约束、符号约束和幅度约束识别结构性冲击。该方法将金属价格中的供给冲击与多种需求侧驱动因素分离开来,并隔离出一种与金属密集型技术扩散相关的转型需求(TD)冲击。研究发现,转型需求冲击对价格产生持久影响,尤其是对铜和镍,而供给冲击和金属特定需求冲击的影响则更为即时且持久性较弱。该研究为理解绿色与数字转型对大宗商品市场的经济影响提供了实证框架。
  • 关键技术: Structural Vector Autoregression (SVAR), sign restrictions, magnitude restrictions, web search data index, demand shock identification
  • 为什么对您有用: 本文属于经济理论(应用因果推断)方向,提供了一个利用非传统数据(搜索指数)在SVAR框架下识别需求冲击的完整实证案例。您武器库中的'因果推断中的估计理论'和'识别理论'可直接用于审视其识别策略的稳健性(如符号约束的合理性)。该文是了解大宗商品市场因果推断应用的好入门读物,值得花时间阅读全文以学习其数据构建与识别策略。

流行病学 (epidemiology, 2 篇)

1. 2606.28033 — A joint meta-analysis framework for the accuracy of two diagnostic tests accounting for varying study designs

  • 作者: Vera Hudak, Nicky J. Welton, Efthymia Derezea, Hayley E. Jones
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对两种诊断测试准确性的联合元分析,提出一个贝叶斯分层模型。传统方法假设测试在给定疾病状态下条件独立,但该假设常不成立,导致联合使用时的准确性估计有偏。现有模型需要所有研究提供联合分类数据(两种测试结果加金标准),且计算不稳定。新模型通过研究特异性的对数优势比来建模条件依赖性,能容纳不报告联合分类数据的研究,并扩展到无金标准或部分验证的研究设计,无需假设参考标准无误差。通过两个实例元分析展示框架,表明忽略条件依赖性会在其显著时导致联合准确性估计严重偏倚。该参数化保持了计算稳定性,无需初始数据插补步骤。对您而言,本文是流行病学中诊断测试元分析的方法学进展,其贝叶斯分层建模思路可迁移到您熟悉的因果推断中处理测量误差或替代结局问题。
  • 关键技术: Bayesian hierarchical model, conditional dependence modeling, log-odds ratio parameterization, meta-analysis of diagnostic test accuracy, partial verification bias
  • 为什么对您有用: 本文属于流行病学应用方向,是您secondary interest中流行病学领域的扎实方法学工作。您的武器库中'非参数统计'和'因果推断中的估计理论'可用于评估其模型假设的稳健性,例如用非参数方法检验条件依赖性建模的充分性。中期可做:需先在moderately_familiar的'因果推断中的识别理论'上长肌肉,以将本文的贝叶斯框架与您熟悉的proximal causal inference中的negative control方法连接,处理更复杂的测量误差场景。

2. 2606.27971 — A beta-binomial model respecting randomization and its comparison to the standard beta-binomial model that ignores randomization for the meta-analysis of rare events

  • 作者: Tim Mathes, Maxi Schulz, Oliver Kuss
  • 相关性 4/10 · novelty: application
  • 摘要: 本文针对罕见事件 meta-analysis 中常用的 beta-binomial 模型 (BBM) 忽略随机化分组的问题,提出了一种尊重随机化的 common-beta BBM。核心思想是通过在估计模型参数时以研究四格表的总计数为条件,来保留随机化结构。通过模拟研究(反映 Cochrane 和非 Cochrane 综述的真实场景)比较了两种模型,发现忽略随机化在纳入研究样本量差异很大时会产生偏倚,但在异质性高时反而表现更好。结论是,在随机化平衡且研究规模相近时,标准 BBM 通常无偏;但由于忽略随机化可能带来生态学偏倚,且尊重随机化的 BBM 在模拟中表现相似,因此可优先推荐后者。对您而言,这是一篇流行病学 meta-analysis 方法学论文,展示了在罕见事件设定下如何通过条件似然保留试验设计结构,其建模思路(条件化充分统计量)与您熟悉的因果推断中条件于协变量的思想有相通之处,可作为流行病学应用领域的入门级方法学阅读材料。
  • 关键技术: beta-binomial model, conditional likelihood, meta-analysis, rare events, simulation study
  • 为什么对您有用: 本文属于流行病学 meta-analysis 方法学,是您的 secondary interest 之一。作为入门读物,它清晰阐述了罕见事件 meta-analysis 的数据结构(四格表、零单元格)和模型假设(beta-binomial vs. 条件似然),武器库中的非参数统计和因果推断估计理论足以理解其条件化思想。值得花时间读全文,因为其条件似然策略可能启发您在因果推断中处理稀疏数据或分组随机化时的 identification 问题。

其他 (other, 4 篇)

1. 2606.27614 — Structural Change Detection in Dynamic Systems

  • 作者: Wei Zhang, Fang Yao
  • 相关性 5/10 · novelty: application
  • 摘要: 本文针对由常微分方程控制的动态系统,提出一个检测与定位结构变化的统一框架。现有方法通常假设均值或线性趋势变化,而本文允许复杂非线性动力学,包括稳定与发散轨迹。方法核心是构造一个结合残差差异与归一化参数对比的检验统计量,同时捕捉模型拟合与参数偏移两方面的变化信号。候选变化点通过多尺度 seeded-narrowest-over-threshold 算法结合数据驱动阈值进行高效筛选,并引入基于保序样本分割与对称对比校准的 FDR 控制程序来精炼选择。理论方面建立了检测一致性、近 minimax 定位精度以及弱依赖下的有效 FDR 控制。模拟与 COVID-19 动力学、全球温度趋势等真实数据应用展示了方法在准确性与 FDR 控制上优于现有方法。本文属于应用导向的方法学工作,方法学 novelty 程度中等,核心工具(残差检验、多尺度扫描、FDR 控制)均为已有技术的组合与适配。
  • 关键技术: multiscale seeded-narrowest-over-threshold, false discovery rate control via sample splitting, residual-based discrepancy, normalized parameter contrast, ordinary differential equation dynamics
  • 为什么对您有用: 本文与您的 primary interest 中的 hypothesis testing 方向有直接关联,特别是结构变化检测这一经典检验问题。您的武器库中 'nonparametric statistics' 和 'high-dimensional asymptotics' 可用于分析其检验统计量的渐近性质,而 'minimax bounds for estimation problems' 可用于验证其声称的近 minimax 定位精度是否紧。中期可做:若想将方法推广到更复杂的因果结构变化场景(如干预后的动态系统变化),需先在 'identification theory in causal inference' 上长肌肉。

2. 2606.27654 — Modeling Educational Performance Using School Demographics and Teacher Characteristics

  • 作者: Brianna Reed, Paramahansa Pramanik
  • 相关性 4/10 · novelty: application
  • 摘要: 本文针对高维教育数据集中的稀疏性、分组预测变量和局部相关协变量问题,提出了一种自适应加权分组融合LASSO估计器。该方法在一个统一的惩罚回归框架内同时执行自适应变量选择、分组正则化和系数融合。开发了高效的ADMM算法,并建立了包括一致性、oracle性质和去偏渐近正态性在内的渐近性质。模拟研究表明,与现有惩罚方法相比,该方法在估计和预测性能上更优。应用于阿拉巴马州公立学校数学成绩数据,展示了改进的模型可解释性、预测准确性以及对最具影响力的机构预测因子的识别。
  • 关键技术: Adaptive Weighted Group Fused LASSO, ADMM algorithm, Oracle property, Debiased asymptotic normality, Group regularization
  • 为什么对您有用: 本文属于应用统计方法,与您的主要兴趣(因果推断、高维统计、半参理论)无直接关联。它提出的自适应加权分组融合LASSO是一种高维惩罚回归方法,但并未涉及因果识别或效率理论等核心方向。作为教育领域的应用,其方法论新颖性有限,主要贡献在于特定场景的模型改进。暂不可做,因为核心机器(高维惩罚回归的ADMM实现)不在武器库中,且与您的主要研究方向距离较远。

3. 2606.26324 — A unified approach to outlier identification for mixed-type data

  • 作者: Efthymios Costa, Christian Hennig
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文针对包含连续变量和有序变量的混合类型数据,提出了一种统一的异常值识别方法。该方法以多元高斯分布作为非异常值的参考分布,对有序变量假设其背后存在潜在高斯分布。算法基于稳健的最小协方差行列式(MCD)估计器来估计非异常值的高斯参数,并扩展以处理有序变量中未观测到的完整高斯信息。论文提供了一个崩溃定理,表明替换观测值不会阻止足够极端的异常值被识别。通过合成数据的模拟实验,该方法在各种污染类型下实现了高检测率和低误报率。最后,通过一个包含连续和有序属性的Airbnb数据集展示了其实用价值。
  • 关键技术: Minimum Covariance Determinant (MCD), latent Gaussian model, robust estimation, ordinal variable modeling
  • 为什么对您有用: 本文属于统计计算与稳健方法领域,与您的主要兴趣(统计计算、非参数/半参数理论)有间接关联。您武器库中的'非参数统计'和'高维渐近理论'可用于分析该MCD估计器在高维混合数据下的相合性,但核心的稳健估计框架并非您当前主攻方向。暂不可做:核心机器(MCD的算法细节与崩溃点理论)不在武器库中,且与您的主要兴趣(因果推断、U统计量)无直接交叉。

4. 2606.28053 — Global convergence analysis of mixtures of Exponential densities

  • 作者: Rajita Chandak, Kathryn Dullerud
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 本文研究 EM 算法在非高斯混合模型中的理论性质,具体针对两个指数分布混合的设定。目标是证明 EM 算法在该模型下的全局收敛性,并给出迭代次数上界。核心方法是利用指数分布族的特殊结构(如对数似然的凹性、更新映射的收缩性质),将经典高斯混合模型中的最小均值分离和信噪比条件推广到次指数分布情形。主要理论结果是:在适当条件下,EM 算法可在 O(log n) 次迭代内达到次指数收敛速率,且该速率不因偏离高斯假设而退化。模拟实验验证了理论结果。对您而言,本文属于统计计算中 EM 算法的收敛性分析,与您 primary interest 中的“statistical computing”方向有交集,但方法学工具(收缩映射、凹性分析)与您的技术武器库(非参、高维渐近)重叠有限,属于可读但不直接可用的工作。
  • 关键技术: EM algorithm, mixture of exponentials, global convergence analysis, contraction mapping, sub-exponential rate
  • 为什么对您有用: 本文属于统计计算中 EM 算法的理论分析,与您 primary interest 中的“statistical computing”方向有交集。但核心工具(收缩映射、凹性分析)不在您的 very_familiar 或 moderately_familiar 武器库中,且问题设定(指数混合的 EM 收敛性)与您主要关注的因果推断、高维统计、U-统计量等方向距离较远。暂不可做:缺乏 EM 算法收敛性分析所需的概率收缩技术。

🗂 其他论文(仅 LLM 评分,未生成摘要)

未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。

1. 2606.28540 — Choosing the threshold in extreme value analysis

  • 作者: Léo R. Belzile, Anthony C. Davison
  • 相关性 3/10
  • 评分理由: Extreme value threshold selection is unrelated to primary interests in causal inference, high-dim stats, or U-statistics.

2. 2606.28015 — Bayesian Simultaneous Credible Bands for Polynomial Regression

  • 作者: Fei Yang, Yang Han, Wei Liu, Ian Hall
  • 相关性 3/10
  • 评分理由: Bayesian credible bands for polynomial regression are unrelated to primary interests.

3. 2606.27638 — Fast Approximate MM-Estimation for Outlier Robust Model Selection

  • 作者: Martin Huang, Samuel Muller, Garth Tarr
  • 相关性 3/10
  • 评分理由: Robust model selection with MM-estimation, unrelated to primary interests in causal inference or high-dim statistics.

4. 2606.26309 — Variance Deltas for Visualizing and Explaining Posterior Uncertainty

  • 作者: Collin Cademartori
  • 相关性 3/10
  • 评分理由: Bayesian visualization of posterior uncertainty is not aligned with primary interests in causal inference or high-dimensional statistics.

5. 2606.26307 — Explainable Outlier Detection for Interval-valued Data

  • 作者: Catarina P. Loureiro, M. Rosário Oliveira, Paula Brito, Lina Oliveira
  • 相关性 3/10
  • 评分理由: Explainable outlier detection for interval-valued data is unrelated to the researcher's primary interests.

6. 2606.23972 — Inference and local influence diagnostics for unit-Lindley additive partially linear models

  • 作者: Hatice T. K. Akdur, Danilo V. Silva, Gilberto A. Paula
  • 相关性 3/10
  • 评分理由: Unit-Lindley regression models are a niche topic with no clear link to causal inference or high-dimensional statistics.

7. 2606.25790 — Group invariance of \(f\)-divergences and the Fisher--Rao distance

  • 作者: Frank Nielsen, Kazuki Okamura
  • 相关性 3/10
  • 评分理由: 研究 f-散度的群不变性和 Fisher-Rao 距离,属于信息几何领域,与 researcher 的核心兴趣(因果推断、高维统计)关联较弱。

8. 2606.28523 — A Scalable Path to Astrometric Exomoon Discoveries with the Nautilus Space Observatory

  • 作者: Kevin Wagner, Sumin Seung, Dániel Apai, Enrico Biancalani, Eduardo Bendek, Samantha Hasler et al.
  • 相关性 3/10
  • 评分理由: Astrostatistics gateway: focuses on exomoon detection via astrometry, but the abstract is too brief on data structure and statistical model for a statistician.

9. 2606.28101 — In-flight calibration of the Wide-field X-ray Telescope on board the Einstein Probe

  • 作者: Huaqing Cheng, Hai-Wu Pan, Yuan Liu, Jingwei Hu, Haonan Yang, Donghua Zhao et al.
  • 相关性 3/10
  • 评分理由: Astrostatistics gateway: in-flight calibration of X-ray telescope, mentions standard sources but no statistical methodology or data analysis exposition.

10. 2606.27565 — Searching for Extraterrestrial Intelligence with the SKA

  • 作者: Chenoa D. Tremblay, Alex Andersson, Joe Bright, Bárbara Cabrales, David DeBoer, Vishal Gajjar et al.
  • 相关性 3/10
  • 评分理由: SETI overview paper; mentions statistical/computational approaches but too broad and lacks concrete data/model exposition.

11. 2606.27414 — The Karl G. Jansky Very Large Array Sky Survey (VLASS). Data Products

  • 作者: Amy Kimball, Mark Lacy, Juergen Ott, John Tobin, Tierra Candelaria, Sergio Garza et al.
  • 相关性 3/10
  • 评分理由: Radio survey data products description; mentions computational challenges but no statistical methodology or analysis.

12. 2606.26895 — Cascade adaptive optics with a second stage based on a Zernike wavefront sensor for exoplanet observations II. Validation in broadband light on the ESO/GHOST testbed

  • 作者: A. Rahim, M. N'Diaye, A. Vigan, M. Kasper, J. Nousiainen, B. Engler et al.
  • 相关性 3/10
  • 评分理由: Adaptive optics validation; touches on wavefront sensing but no clear statistical problem or data exposition.

13. 2606.26072 — Observations of the Cosmic Dawn and Epoch of Reionization with the SKAO: Observational Lessons Learned from Precursors and Pathfinder Instruments

  • 作者: Eloy de Lera Acedo, James Aguirre, Dominic Anstey, Nichole Barry, Gianni Bernardi, Somnath Bharadwaj et al.
  • 相关性 3/10
  • 评分理由: Calibration and systematics in radio astronomy, touches on data modeling but too domain-specific for gateway reading.

14. 2606.25549 — Gravitational Light Deflection with SKA-VLBI and Its Application to Precision Tests of General Relativity

  • 作者: Y. J. Li, J. J. Li, Z. H. Lin, D. J. Liu, Y. W. Dong, C. J. Hao et al.
  • 相关性 3/10
  • 评分理由: Astrostatistics: tests general relativity with SKA-VLBI, but exposition is too specialized and lacks clear statistical methodology.

15. 2606.27046 — Conditional Leibniz Derivative Estimation with an Application to American Call Min-Options

  • 作者: Xingyu Ren, Michael C. Fu, Pierre L'Ecuyer
  • 相关性 2/10
  • 评分理由: Monte Carlo derivative estimation for finance, unrelated to researcher's primary or secondary interests.

16. 2606.26774 — End-to-end probabilistic hierarchical forecasting of large hierarchies via probabilistic top-down

  • 作者: Lorenzo Zambon, Dario Azzimonti, Giorgio Corani
  • 相关性 2/10
  • 评分理由: Probabilistic forecasting for retail, no connection to causal inference, high-dim stats, or semiparametric theory.

17. 2606.24300 — Prediction of spatio-temporal data on meshed surfaces using advection-diffusion SPDEs

  • 作者: Mike Pereira, Lucia Clarotto, Nicolas Desassis
  • 机构: Centre de Géosciences · Département mathématiques, informatique, sciences de la donnée et technologies du numérique · Mathématiques et Informatique Appliquées
  • 相关性 2/10
  • 评分理由: Spatio-temporal SPDE modeling on manifolds is far from the researcher's core areas.

18. 2606.24244 — When Surveys Become Conversations: Adaptive Matrix Validation for AI-Assisted Interviews

  • 作者: Tyler H. McCormick
  • 相关性 2/10
  • 评分理由: AI-assisted survey measurement validation is not relevant to the researcher's interests.

19. 2606.24076 — A Non-Stationary Spatio-Temporal Covariance Model with Dynamic Advection Effects for Rainfall Data

  • 作者: Pedro Nasevicius Ramos, Guilherme Ludwig
  • 相关性 2/10
  • 评分理由: Spatio-temporal covariance modeling for rainfall is not connected to primary interests.

20. 2606.23054 — Uncovering commuting flows in Bike Sharing Systems

  • 作者: Mohamadou Salifou
  • 机构: Laboratoire Interdisciplinaire Solidarités Sociétés Territoires
  • 相关性 2/10
  • 评分理由: 应用混合模型和逻辑回归分析共享单车通勤模式,属于应用统计,与 researcher 的 primary/secondary interests 无直接关联。

21. 2606.28136 — Differentiable design of the PIAA-ZWFS: a flexible wavefront sensor that approaches the fundamental limit

  • 作者: A. K. Taras, S. Y. Haffert, L. Desdoigts
  • 相关性 2/10
  • 评分理由: Unrelated: describes a wavefront sensor design for adaptive optics, purely engineering/optics with no statistics.

22. 2606.28051 — The performance of the TA\(\times\)4 surface detector array: 4.3 years of the first-half expansion

  • 作者: Telescope Array Collaboration, R. U. Abbasi, T. Abu-Zayyad, M. Allen, J. W. Belz, D. R. Bergman et al.
  • 机构: Loyola University Chicago · University of Utah · Osaka Metropolitan University · Hanyang University · Institute of Physics, Academia Sinica · The University of Tokyo · FZU ‒ Institute of Physics of the Academy of Sciences of the Czech Republic · Ensenada Institute of Technology 等
  • 相关性 2/10
  • 评分理由: Unrelated: reports performance of a cosmic-ray detector array, purely experimental physics with no statistical content.

23. 2606.27882 — On-sky Fibre-Target-Alignment of the 4MOST instrument: calibration and performance

  • 作者: Roland Winkler, Weijia Sun, Daniel Sablowski, Thomas Liebner, Ole Streicher, Steffen Frey et al.
  • 相关性 2/10
  • 评分理由: Pure instrumentation calibration paper for a specific telescope; no statistical methodology or data analysis problem.

24. 2606.27585 — Experimentally-determined performance limits for joint imaging and wavefront sensing with a photonic lantern

  • 作者: Aditya R. Sengupta, Vincent Chambouleyron, Rebecca Jensen-Clem, Emiel Por, Benjamin L. Gerard, Jordan Diaz et al.
  • 相关性 2/10
  • 评分理由: Wavefront sensor sensitivity analysis; engineering focus, no statistical methodology or data problem.

25. 2606.27262 — The SPOTLIGHT Multibeam Real-Time Transient Detection System

  • 作者: Ujjwal Panda, Jayanta Roy, Kshitij Bane, Chahat Dudeja, Sridhar Gajendran, Param Joshi et al.
  • 相关性 2/10
  • 评分理由: Real-time transient detection system description; engineering focus, no statistical methodology or data analysis problem.

26. 2606.27060 — The Line Emission Terahertz Observatory (LETO): Exploring the lifecycle of the ISM and the origins of water

  • 作者: Dimitra Rigopoulou, Peter Roelfsema, William Grainger, Chris Pearson, Boon-Kok Tan, Wouter Laauwen et al.
  • 相关性 2/10
  • 评分理由: Pure astrophysics mission description with no data/model exposition or statistical methodology.

27. 2606.26821 — Characterizing robotic positioners under the influence of changing gravity vectors for future spectroscopic surveys

  • 作者: Johannes Wüthrich, Guandi Zhao, Banan Yamani, Léonard Lebrun, Sean MacBride, Andrin Fazan et al.
  • 相关性 2/10
  • 评分理由: Mechanical engineering of fiber positioners, no statistical methodology.

28. 2606.26576 — Detectors for CLASS-W2: The second 90 GHz telescope of the Cosmology Large Angular Scale Surveyor

  • 作者: John W. Appel, Kyuyoung Bae, Charles L. Bennett, Michael K. Brewer, Sarah Marie Bruno, Carol Yan Yan Chan et al.
  • 相关性 2/10
  • 评分理由: CMB instrument detector report, no statistical methodology or data exposition.

29. 2606.26409 — In situ cryogenic characterization of proton damage in thick p-channel skipper CCDs

  • 作者: Brandon M. Roach, Brenda Cervantes Vergara, Alex Drlica-Wagner, Phoenix Alpine, Ana Martina Botti, Claudio Chavez et al.
  • 相关性 2/10
  • 评分理由: Pure detector engineering for astronomy, no statistical methodology or connection to primary interests.

30. 2606.26268 — A nonrelativistic radiative transfer module for Idefix

  • 作者: Nicolas Scepi, Geoffroy Lesur
  • 相关性 2/10
  • 评分理由: Numerical radiative transfer code, tangentially related to computing but no statistical inference.

31. 2606.26209 — Fast Simultaneous Surveys with On-the-Fly Mapping

  • 作者: Suman Chatterjee, Sarvesh Mangla, Sourabh Paul, Keith Grainge, Matthias Hoeft, Tamera Kassie et al.
  • 相关性 2/10
  • 评分理由: Survey mapping technique for radio astronomy, no statistical methodology or relevance.

32. 2606.25238 — Analysis of Laser-Satellite Deconfliction for Astronomical Observatories

  • 作者: Christoph Baranec, Reed Riddle, Yuhei Takagi, Jim Lyke
  • 相关性 2/10
  • 评分理由: Operational analysis of laser-satellite deconfliction; no statistical or methodological depth.

33. 2606.25017 — Low-frequency VLBI with the SKA-Low

  • 作者: R. Timmerman, E. L. Escott, T. Vernstrom, L. K. Morabito, C. Reynolds
  • 相关性 2/10
  • 评分理由: Pure astronomy instrumentation paper with no statistical methodology or data analysis exposition; irrelevant to all primary and secondary interests.

34. 2606.24116 — Confounding analysis of s-level designs with multi-block variables

  • 作者: Wenbo Hu, Zhiming Li
  • 相关性 1/10
  • 评分理由: Design of experiments with blocking is a distinct subfield unrelated to the researcher's work.

35. 2606.28180 — Radiation tolerance of a diamond radiation detector for space use

  • 作者: Yoshiyuki Ando, Shutaro Ueda, Ryota Heibatake, Kaito Ozawa, Makoto Arimoto, Tatsuya Sawano et al.
  • 相关性 1/10
  • 评分理由: Unrelated: focuses on radiation tolerance of diamond detectors for a CubeSat mission, no statistical or methodological content.

36. 2606.27664 — A Dual-Burst Geometrical Prescription for Concurrent Signaling

  • 作者: Naoki Seto
  • 相关性 1/10
  • 评分理由: SETI geometric prescription with no statistical or data analysis content; unrelated to all interests.

37. 2606.27590 — Laboratory characterization of a multi-photonic lantern optical waveguide using off-axis holography

  • 作者: Aditya R. Sengupta, Benjamin L. Gerard, Dominic Sanchez, Matthew DeMartino, Rebecca Jensen-Clem, Kevin Bundy et al.
  • 相关性 1/10
  • 评分理由: Optical waveguide characterization; pure engineering, no statistical or data analysis component.

38. 2606.26996 — How to access astronomical observation facilities ?

  • 作者: Michaël De Becker
  • 相关性 1/10
  • 评分理由: Telescope proposal guide, unrelated to any research interest.

39. 2606.26940 — VLBI with SKAMPI, the SKA-Mid MPIfR dish demonstrator

  • 作者: Jompoj Wongphechauxsorn, Niclas Alexander Esser, Tobias Winchen, Jan Wagner, Uwe Bach, Hans-Rainer Klöckner et al.
  • 相关性 1/10
  • 评分理由: Instrumentation report on VLBI fringe detection, no statistical content.

40. 2606.26365 — Extending the SKA Across Africa: The Case for a Continental African VLBI Network

  • 作者: Emmanuel K. Bempong-Manful, Jompoj Wongphechauxsorn, Jack Radcliffe, Melvin Hoare, Olga Bayandina, Pfesesani V. van Zyl et al.
  • 相关性 1/10
  • 评分理由: Radio telescope network planning, no statistical content or relevance to researcher's interests.

41. 2606.26282 — Low Thrust Electric Propulsion Mission Concepts For a 3-Meter Class Space Telescope

  • 作者: Yael M. Brynjegard-Bialik, Mohamed Nassif, Drew Latta, Neel Kunjur, Nicholas Rahaim, Paul DeTrempe et al.
  • 相关性 1/10
  • 评分理由: Space telescope mission concept, no statistical methodology or data analysis.

42. 2606.26214 — Nautilus Space Observatory: The Evolution of Planets and their Atmospheres

  • 作者: Ilaria Pascucci, Noah Tuchow, Yifan Zhou, Daniel Apai, Chaucer Langbert, Ana Glidden et al.
  • 相关性 1/10
  • 评分理由: Astronomy white paper on exoplanet evolution, no statistical methods or data analysis.

43. 2606.25664 — VLT Beyond 2030 and Call for White Papers

  • 作者: Céline Péroux, Antoine Mérand, Martyna Chruślińska
  • 相关性 1/10
  • 评分理由: Conference report on VLT future; no statistical or methodological content.

44. 2606.25637 — A Wideband Millimeter-wave Receiver at 210-350 GHz for LMT-FINER

  • 作者: Haoran Kang, Takafumi Kojima, Takeshi Sakai, Yoichi Tamura, Shun Ishii, Akio Taniguchi et al.
  • 相关性 1/10
  • 评分理由: Receiver hardware description; no statistical or data-analysis content.

45. 2606.26296 — Indigenizing the Drake Equation: how Indigenous methods can help us understand life in the Milky Way Galaxy

  • 作者: Hilding R. Neilson
  • 相关性 0/10
  • 评分理由: Philosophical/cultural discussion of Drake equation, completely unrelated to statistics.

Maintained by 陈星宇 · Homepage · Source on GitHub

评论