跳转至

2026-06-02 每日 arXiv 资讯

  • 高相关论文 16 篇 · 中相关 9 篇 · 其他 53 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 7 篇)

1. 2606.00754 — Causal Density Functions

  • 作者: Sridhar Mahadevan
  • 分类: stat.ME · cs.AI · cs.LG
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在因果推断框架下,本文提出因果密度函数(causal density functions),定义为干预分布与观测分布之间的 Radon-Nikodym 导数,作为衡量局部因果效应的密度比。核心 estimand 为 $ ho(X,Y)$,满足基本等式 \(E_{do}[f(Y)] = E_{obs}[f(Y) ho(X,Y)]\),从而将全局分布层面的因果强度比较转化为逐点的测度变换对象。作者基于此构造了 do-curve 与有向边评分的实用估计器,其本质是利用密度比重加权(类似 IPW 的测度变换视角)从观测数据还原干预期望,并声称该密度比可直接通过校验重加权后期望是否匹配干预期望来进行检验。实证部分在合成数据与真实扰动基准上评估了估计器表现。对您可能有用:本文将 do-calculus 的识别问题重新表述为 Radon-Nikodym 密度比估计,为因果效应的局部评分与校验提供了新视角,直接连接到您 primary interest 中的因果推断 identification 与 estimation 理论。
  • 关键技术: Radon-Nikodym derivative, density ratio estimation, interventional distribution reweighting, do-calculus identification, causal edge scoring
  • 为什么对您有用: 本文直接连接到您 primary interest 中因果推断的 identification 与 estimation 子方向,将 do-intervention 的分布变换形式化为 Radon-Nikodym 密度比,提供了一个不同于传统 IPW / g-formula 的局部测度变换视角。您武器库中 very_familiar 的因果推断估计理论可直接审视其密度比估计器的收敛性质与 semiparametric efficiency bound 是否可达,moderately_familiar 的 identification 理论可用来严格检验其 RN 导数在一般 DAG 下的可识别性条件是否完备。立即可做:用您熟悉的 semiparametric efficiency 理论分析该密度比估计器的效率界,并考察其校验逻辑是否可嵌入 higher-order influence function 的框架以改善高维情形下的收敛率。

2. 2606.00847 — Partial Identification under High-Dimensional Potential Outcomes and Confounders via Optimal Transport

  • 作者: Yunfeng Wang, Zhiheng Zhang, Zijun Gao
  • 分类: stat.ME
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在高维潜在结果与高维混杂的因果部分识别设定下,经典基于最优传输(OT)的 bounds 受到维度诅咒和收敛速率恶化的困扰,本文提出一种将传输问题分解为低维信号子空间与高维残差子空间的新估计量。核心机制是:信号子空间执行标准 OT,残差子空间的传输能量则通过 Sliced Wasserstein distance 恢复,而非像既有投影方法直接丢弃残差信息;作者给出了基于残差结构控制近似误差的可解释条件,并提供了数据驱动的信号维度选择规则。理论结果表明,在残差结构可控的条件下,该方法避免了纯投影方法的能量损失,同时在高维下保持计算可行性;实证上,估计量一致优于仅投影基线,产生更紧的因果 bounds。对您可能有用:本文将 OT 部分识别从低维推向高维,其信号-残差分解与 Sliced Wasserstein 工具为高维因果 bounds 的收敛率分析提供了新视角。
  • 关键技术: optimal transport partial identification, Sliced Wasserstein distance, signal-residual subspace decomposition, data-driven dimension selection, curse of dimensionality mitigation
  • 为什么对您有用: 本文直接推进了因果推断中高维部分识别(proximal/OT bounds)的设定,连接到您 primary interest 中的因果推断 identification 与高维统计。您武器库中的 minimax bounds for estimation problems 可用于审视其声称的收敛率改善是否紧,或用 higher-order U-statistics / HOIF 视角探索残差能量恢复的更精细估计。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以建立 Sliced Wasserstein 残差项的严格 semiparametric efficiency bound 或更高阶修正。

3. 2606.00965 — Design-based edge-level causal inference with machine learning assisted covariate adjustment

  • 作者: Haoyang Yu, Yilin Li, Lu Deng, Yong Wang, Xin Lu, Hanzhong Liu
  • 分类: stat.ME
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在有向网络的 dyadic interference 设定下,研究 edge-level outcome 的 design-based 因果推断,目标 estimand 为一般类别的边水平因果效应。构造了 Horvitz-Thompson 估计量并在温和 regularity 条件下建立其渐近正态性;通过识别网络依赖的可分解成分开发方差估计量,比经典方法大幅降低保守性。为提升效率引入协变量调整,但标准二折样本分割因共享节点诱导的边间依赖而失效,故提出三折样本分割与 cross-fitting 方案恢复条件独立性。在稳定性条件下,协变量调整估计量渐近正态且兼容线性调整与灵活 ML 方法;进一步引入校准步骤保证相对于未调整估计量无渐近效率损失。对您有用:本文的三折 cross-fitting 与校准步骤直接触及 efficiency theory 与 causal inference 交叉点,为处理复杂依赖结构下的 debiased ML 提供新范式。
  • 关键技术: design-based causal inference, Horvitz-Thompson estimator, dyadic interference, three-fold cross-fitting, variance decomposition under network dependence, efficiency calibration step
  • 为什么对您有用: 本文直接连接 causal inference 的 network interference 设定与 efficiency theory 的 cross-fitting/debiased ML 机制。研究者可用 very_familiar 的 minimax bounds 与 estimation theory 检验其声称的效率增益是否紧,或用 moderately_familiar 的 semiparametric theory 推导该 dyadic 依赖结构下的 semiparametric efficiency bound 以评估校准步骤的理论极限。Follow-up 判断:立即可做——用现有武器库即可检验其 variance estimator 的保守性界与 efficiency bound 的差距。

4. 2606.01669 — Beyond principal ignorability: Nonparametric sensitivity bounds for principal stratification

  • 作者: Xinyuan Chen, Michael O. Harhay, Fan Li
  • 分类: stat.ME
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在 principal stratification 框架下,目标是 principal causal effects (PCEs) 在 principal ignorability (PI) 假设可能违反时的非参数敏感性分析。本文引入基于未测量混杂的选择相对风险与结局相对风险参数化的 margin-free bounding factor,借此推导出每个 PCE 的 sharp 非参数 bounds。理论证明这些 bounds 在有或无 monotonicity 假设下均嵌套于 worst-case 非参数 bounds 之内,并进一步提出 Cornfield-type 条件与 principal E-values 以量化使目标 PCE 为零所需的最小未测量混杂联合强度。方法还推广至 principal generalized causal effects,将敏感性 bounds 与 falsification thresholds 拓展到乘积空间上的 pairwise comparison estimands。对您可能有用:本文为 principal stratification 的 PI 假设提供了严格的非参数敏感性框架,直接补充了您在因果推断 identification 与 sensitivity analysis 方向的工具箱。
  • 关键技术: principal stratification, principal ignorability, nonparametric sharp bounds, Cornfield-type sensitivity analysis, principal E-values, principal generalized causal effects
  • 为什么对您有用: 本文直接连接到您 primary interest 中因果推断的 sensitivity analysis 与 identification theory 子方向,聚焦于 principal stratification 下 PI 假设的非参数敏感性界。您 technical_arsenal 中 very_familiar 的 identification theory in causal inference 可直接用来审视其 bounding factor 的参数化设定是否完备,moderately_familiar 的 semiparametric theory 则可评估其 bounds 在半参数模型下的收紧潜力。follow-up 粗判:立即可做——用您熟悉的 identification 理论与 minimax 思维,可立刻着手验证该非参数 bounds 在特定半参数子模型下的 sharpness,或探索其与 HOIF 结合以获得更紧的估计。

5. 2606.01539 — Scalable Counterfactual Risk Estimation for Rare Events in Longitudinal Data

  • 作者: Xiaohui Yin, Avijit Mitra, Ying Zhou, Kun Chen, Hong Yu
  • 分类: stat.ME · cs.LG
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在纵向观测数据中,目标是估计时变处理对稀有生存结局的因果效应,核心estimand为基于g-formula的迭代条件期望(ICE)估计量。稀有结局导致各时间点严重的类别不平衡,使logistic回归等模型不稳定且收敛困难;同时ICE结合bootstrap方差估计在大样本下计算代价极高。本文提出一种针对纵向生存数据的子抽样与重加权(subsampling and reweighting)策略,可无缝嵌入ICE等现有g-formula估计量。该方法在大幅降低计算负担的同时保留了估计的一致性,并通过重加权缓解了稀有结局下的类别不平衡与估计不稳定。模拟与大规模EHR队列研究(SBDH与自杀风险)验证了其有效性。对您有用:本文直接触及纵向因果推断的计算瓶颈与稀有结局稳定性问题,为大规模EHR数据下的g-formula实现提供了计算-统计权衡的实用方案。
  • 关键技术: iterative conditional expectation (ICE) estimator, g-formula, subsampling and reweighting, longitudinal causal inference, rare outcome class imbalance, bootstrap variance estimation
  • 为什么对您有用: 本文直接连接纵向因果推断的g-formula估计与稀有结局设定,属于您primary interest中causal inference (longitudinal)的具体场景。从technical_arsenal看,您very_familiar的estimation theory in causal inference与software development可直接评估其subsampling-reweighting策略的一致性证明与算法实现细节。本文的novelty偏向计算-统计权衡(降低bootstrap计算量并缓解类别不平衡),而非新的semiparametric efficiency bound或sharper rate。立即可做:用您熟悉的因果推断估计理论与软件工程能力,可立即复现其算法并检验在更复杂moderator/mediation设定下的扩展性。

6. 2606.01659 — Data-Automated Policy Learning for Nonlinear Welfare

  • 作者: Chunrong Ai, Zeqi Wu, Zheng Zhang
  • 分类: econ.EM · stat.ME · stat.ML
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在观测数据的二值处理设定下,本文研究基于非线性福利准则的政策学习,其中非线性准则由包含潜在结果与中间参数(刻画结果分布高阶矩)的效用函数建模。中间参数与福利准则均依赖倾向得分,作者用机器学习方法估计倾向得分,并提出一种基于重新加权的去偏方法替代传统的正交化/交叉拟合去偏路径。针对无限维政策空间的复杂性,采用筛逼近(sieve approximation)与 K 抏交叉验证做模型选择,实现全自动化政策学习。理论上证明了所提政策的福利遗憾与平均福利遗憾均满足 oracle inequality,将现有结果从线性福利准则推广至非线性、从有限维政策空间推广至无限维、从已知倾向得分推广至机器学习估计。对您可能有用:该文在因果推断的政策学习框架下引入筛逼近与重新加权去偏,与您 semiparametric theory 及 M-estimation 的武器库直接对接。
  • 关键技术: nonlinear welfare criterion, reweighting-based debiasing, sieve approximation, oracle inequality, propensity score estimation, K-fold cross-validation
  • 为什么对您有用: 本文直接连接因果推断的政策学习与 semiparametric theory 子方向,其筛逼近处理无限维政策空间与重新加权去偏机制是核心看点。您武器库中 moderately_familiar 的 M-estimation theory 与 semiparametric theory 可直接攻其筛逼近收敛率与重新加权去偏的渐近分析口子,验证其声称的 oracle inequality 是否紧。follow-up 粗判:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以审视其去偏路径相对于 orthogonal score / DML 的效率损失与适用边界。

7. 2606.02234 — When Do Treatment Changes Identify Causal Effects?

  • 作者: Martin Huber
  • 分类: econ.EM · stat.ME
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究基于 treatment changes(处理变化)而非 treatment levels(处理水平)的因果识别假设及其与传统策略的关系。在给定可观测协变量的条件下,作者刻画了两个结构模型,其识别假设互不包含(non-nested),分别支撑基于处理变化与处理水平的识别。文中证明,基于处理变化的识别假设一般不嵌套于控制过去结果/处理/协变量的 selection-on-observables 或差分结果的 DID 方法;但在处理过程满足随机游走约束时,条件于处理变化等价于条件于处理水平与滞后处理。此等价性及非嵌套结果催生了联合两类方法的过度识别检验,并推导出结构双重稳健性:如双向固定效应回归等对结果与处理同时差分的估计量,在处理变化假设或平行趋势假设中任一成立时即可保持一致,无需两者同时成立。模拟与香烟需求实证验证了有限样本表现。对您可能有用:该 non-nested 识别结构与 structural double robustness 直接关联因果推断 identification theory 与 sensitivity analysis 子方向。
  • 关键技术: treatment-change identification, non-nested structural models, structural double robustness, random-walk treatment process, overidentification test, two-way fixed effects regression
  • 为什么对您有用: (1) 直接连接因果推断的 identification theory 与 sensitivity analysis 子方向——非嵌套识别假设的刻画为 sensitivity 分析提供了天然的结构化框架。(2) 用 technical_arsenal 中 very_familiar 的 identification theory in causal inference 可直接剖析其两个结构模型的假设松紧度与等价条件;moderately_familiar 的 semiparametric theory 可用于将 structural double robustness 推进到 semiparametric efficiency bound 层面。(3) 立即可做:用 very_familiar 的 identification theory 工具验证其 random-walk 等价条件在更一般动态处理机制下的适用边界,并构建基于 non-nested 假设的 semiparametric doubly robust estimator。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 2606.01554 — Fast Near-Optimal Estimation over Symmetric Norm Balls

  • 作者: Matey Neykov
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文研究信号被约束在已知基下的对称范数单位球内时的近最优欧几里得估计问题,假设范数可通过评估预言机访问。核心方法是基于对称范数的结构设计多项式时间算法,在Gaussian序列设定下实现near-minimax收敛率,并将该算法推广至随机设计、中等维度的线性回归设定(回归参数同样受对称范数约束)。理论结果给出了算法的计算复杂度与估计误差界,证明在多项式时间内可达到近乎minimax最优的速率。对您可能有用:本文将minimax估计与计算约束结合,为统计计算权衡提供了一个具体的对称范数设定下的可实现性结果。
  • 关键技术: symmetric norm ball estimation, evaluation oracle, near-minimax rate, polynomial-time algorithm, random-design linear regression, computational constraint
  • 为什么对您有用: 本文直接连接到统计计算权衡(computational-constrained statistics)这一子方向:在minimax最优性与多项式时间可达性之间给出了具体界,属于您作为outsier的gateway reading。您武器库中very_familiar的minimax bounds可直接用来验证其声称的near-minimax rate是否紧,moderately_familiar的M-estimation theory可用来审视其线性回归推广的收敛条件。Follow-up粗判:立即可做——用minimax bound工具检查其rate的紧性,并尝试将评估预言机模型与您熟悉的higher-order U-statistic计算复杂度(einsum/tensor contraction)做类比。

2. 2606.01554 — Fast Near-Optimal Estimation over Symmetric Norm Balls

  • 作者: Matey Neykov
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文研究信号被约束在已知基下的对称范数单位球内时的近最优欧几里得估计问题,假设范数可通过评估预言机访问。核心方法是基于对称范数的结构设计多项式时间算法,在Gaussian序列设定下实现near-minimax收敛率,并将该算法推广至随机设计、中等维度的线性回归设定(回归参数同样受对称范数约束)。理论结果给出了算法的计算复杂度与估计误差界,证明在多项式时间内可达到近乎minimax最优的速率。对您可能有用:本文将minimax估计与计算约束结合,为统计计算权衡提供了一个具体的对称范数设定下的可实现性结果。
  • 关键技术: symmetric norm ball estimation, evaluation oracle, near-minimax rate, polynomial-time algorithm, random-design linear regression, computational constraint
  • 为什么对您有用: 本文直接连接到统计计算权衡(computational-constrained statistics)这一子方向:在minimax最优性与多项式时间可达性之间给出了具体界,属于您作为outsier的gateway reading。您武器库中very_familiar的minimax bounds可直接用来验证其声称的near-minimax rate是否紧,moderately_familiar的M-estimation theory可用来审视其线性回归推广的收敛条件。Follow-up粗判:立即可做——用minimax bound工具检查其rate的紧性,并尝试将评估预言机模型与您熟悉的higher-order U-statistic计算复杂度(einsum/tensor contraction)做类比。

效率理论 / Debiased ML (efficiency_dml, 4 篇)

1. 2606.01674 — Higher-Order Efficient Estimators: A Review and Simulation-Based Benchmark Study

  • 作者: Zeyi Wang, Mark J. van der Laan
  • 分类: stat.ME
  • 相关性 10/10 · novelty: survey
  • 摘要: 在 semiparametric 模型下估计 treatment-specific mean(缺失数据/因果推断典型问题),目标是实现 second-order efficient estimation,以在 nuisance 函数收敛速率低于 n^{-1/4} 时仍保持 n^{-1/2}-CAN 与 asymptotic efficiency。本文系统比较了三种构造 second-order expansion 的路径:基于 basis truncation 的 HOIF estimator、基于 kernel smoothing 的 HOTMLE、以及基于 HAL(highly adaptive lasso)的 HOTMLE,剖析各自引入的 approximation/regularization burden。模拟在 controlled nuisance error 与递增 sectional variation complexity 下进行,结果显示 higher-order debiasing 能显著削减 first-order bias,但实际增益高度依赖 higher-order correction 的稳定性;HAL-based HOTMLE 表现最稳健,而 empirical HOIF 对 basis truncation 与 tuning 极为敏感。本文厘清了 higher-order 理论优势何时能转化为有限样本可见增益、何时被实现不稳定性抵消,对您深入理解 HOIF 的实操瓶颈与 HAL 的 higher-order 潜力非常有用。
  • 关键技术: higher-order influence functions, second-order efficient estimation, higher-order targeted minimum loss-based estimator, highly adaptive lasso, basis truncation, sectional variation norm
  • 为什么对您有用: 直接对标 primary interest 中的 efficiency theory(HOIF)与 semiparametric theory,系统梳理了 HOIF 与 HOTMLE 的理论-实操差距。您武器库中 moderately_familiar 的 HOIF 理论可直接用来审视本文对 basis truncation 敏感性的诊断是否触及根本(如 higher-order U-statistic projection 的方差膨胀),而 very_familiar 的 higher-order U-statistic 计算复杂度(treewidth/einsum)视角可用来分析 HOIF estimator 的计算瓶颈是否是 truncation 不稳定的深层原因。立即可做:用 very_familiar 的 U-statistic 计算框架复现或改进 HOIF 的 basis 选择与 tuning 策略。

2. 2606.01706 — Higher-Order Debiased Estimators for General Treatment Models

  • 作者: Yulin Zhang, Lin Liu, Zheng Zhang
  • 分类: econ.EM
  • 相关性 10/10 · novelty: new_theory
  • 摘要: 在非可分结构模型(non-separable structural models)设定下,目标是仅隐式定义于非线性估计方程的参数(如 QTE、分位数剂量反应函数),在 Hölder 平滑度假设下进行半参数估计。本文将 HOIF(高阶影响函数)从显式参数(ATE)推广到这类隐式 M/Z-估计参数,构造了相应的高阶去偏估计器。核心机制利用 U-process 理论推导估计器的统计性质,通过高阶修正项降低对 nuisance 参数复杂度的要求,在许多重要参数上放宽了现有方法所需的 Hölder 平滑度条件。主要理论结果给出了高阶估计器的收敛率与偏差控制,证明在低平滑度场景下优于基于一阶影响函数的估计器。对您可能有用:本文将 HOIF 推广至隐式参数,直接连接您 primary interest 中的 HOIF 与 M-估计理论,且其 U-process 工具与您的高阶 U-statistics 工作高度同源。
  • 关键技术: higher-order influence functions, U-process theory, non-separable structural models, M/Z-estimation for implicitly defined parameters, Hölder smoothness relaxation, higher-order debiased estimation
  • 为什么对您有用: 本文直接推进您 primary interest 中 HOIF 与 M-估计理论的交叉:将 HOIF 从显式 ATE 推向隐式 M/Z-估计参数,填补了半参数理论在低平滑度下对复杂 estimand 的空白。您武器库中 moderately_familiar 的 HOIF 与 M-估计理论可直接用来审视其 U-process 偏差控制与收敛率是否紧;同时 very_familiar 的高阶 U-statistics 计算复杂度视角(treewidth / einsum)可切入评估其高阶估计器的实际计算可行性。Follow-up 判断:立即可做——用您的高阶 U-statistics 计算框架分析其高阶修正项的 tensor contraction 成本,并验证其声称的平滑度放宽是否与 minimax rate 一致。

3. 2606.01011 — Semiparametric Efficiency of Residual Correlation Testing under Gaussian Additive Noise Models

  • 作者: Yin Tang, Yanyuan Ma, Bing Li
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 在 Gaussian additive noise model (GANM) 下研究条件独立性检验,设定为两变量对协变量的非线性回归残差服从独立双变量 Gaussian,目标 estimand 为残差相关系数 ρ,条件独立性等价于 ρ=0。作者基于拟合残差的 Pearson 相关系数构造检验统计量,并建立该框架下的 semiparametric efficiency theory。核心结论是:在 GANM 的半参数模型中,efficient influence function 导出的有效估计量恰好与普通残差 Pearson 相关系数估计量完全一致,即该简单估计量已达到 semiparametric efficiency bound。进一步推导了该检验的渐近分布与推断程序,模拟显示其具有近 oracle efficiency 与稳健的 Type I error 控制。对您有用:此结果为 semiparametric efficiency 理论提供了一个精巧的特例,可直接作为 HOIF 与 semiparametric 理论工具的对照分析对象。
  • 关键技术: semiparametric efficiency bound, efficient influence function, Gaussian additive noise model, residual Pearson correlation, conditional independence testing, nonlinear regression residuals
  • 为什么对您有用: 直接连接到 efficiency theory (semiparametric efficiency bounds) 这一核心 primary interest,展示了简单估计量达到效率界的罕见特例。可用 technical_arsenal 中 moderately_familiar 的 semiparametric theory 与 HOIF 工具验证其 efficient influence function 计算是否可推广至非 Gaussian 残差或更高阶修正场景。立即可做:用 very_familiar 的 semiparametric 理论复现其 efficiency bound 推导,并探索 HOIF 在此模型下是否产生非零高阶项。

4. 2606.01011 — Semiparametric Efficiency of Residual Correlation Testing under Gaussian Additive Noise Models

  • 作者: Yin Tang, Yanyuan Ma, Bing Li
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 在 Gaussian additive noise model (GANM) 下研究条件独立性检验,设定为两变量对协变量的非线性回归残差服从独立双变量 Gaussian,目标 estimand 为残差相关系数 ρ,条件独立性等价于 ρ=0。作者基于拟合残差的 Pearson 相关系数构造检验统计量,并建立该框架下的 semiparametric efficiency theory。核心结论是:在 GANM 的半参数模型中,efficient influence function 导出的有效估计量恰好与普通残差 Pearson 相关系数估计量完全一致,即该简单估计量已达到 semiparametric efficiency bound。进一步推导了该检验的渐近分布与推断程序,模拟显示其具有近 oracle efficiency 与稳健的 Type I error 控制。对您有用:此结果为 semiparametric efficiency 理论提供了一个精巧的特例,可直接作为 HOIF 与 semiparametric 理论工具的对照分析对象。
  • 关键技术: semiparametric efficiency bound, efficient influence function, Gaussian additive noise model, residual Pearson correlation, conditional independence testing, nonlinear regression residuals
  • 为什么对您有用: 直接连接到 efficiency theory (semiparametric efficiency bounds) 这一核心 primary interest,展示了简单估计量达到效率界的罕见特例。可用 technical_arsenal 中 moderately_familiar 的 semiparametric theory 与 HOIF 工具验证其 efficient influence function 计算是否可推广至非 Gaussian 残差或更高阶修正场景。立即可做:用 very_familiar 的 semiparametric 理论复现其 efficiency bound 推导,并探索 HOIF 在此模型下是否产生非零高阶项。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)

1. 2606.00578 — When Do Generalized Permutation Tests Achieve Optimal Power? A Dispersion Characterization

  • 作者: Yongmin Kim, Ilmun Kim
  • 分类: stat.ME
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在非均匀置换分布下研究广义 Monte Carlo 置换检验的渐近最优性,目标是在 difference-in-means 统计量下刻画检验达到 Pitman 局部最优功效的条件。作者引入个体层与配对层的两个标量散度指标,量化置换分布偏离完全随机化的程度;证明当两个散度渐近趋于零时,条件置换分布收敛至 Gaussian benchmark、临界值稳定、检验达到 Pitman 局部最优功效。反之,若散度不趋于零,置换分布不自平均、临界值未必稳定,最优功效一般无法保证。进一步在超越标准 Pitman 局部模型时,通过利用数据中的 nuisance 结构,精心选择的非均匀置换分布可严格优于均匀置换。对您可能有用:为置换检验的渐近理论提供了精确的散度刻画,直接连接 hypothesis testing 与 potential outcomes 框架下的随机化推断。
  • 关键技术: generalized Monte Carlo permutation test, Pitman local asymptotic power, dispersion characterization, conditional Gaussian benchmark, non-uniform permutation distribution, difference-in-means statistic
  • 为什么对您有用: 直接连接 hypothesis testing 子方向,为非均匀随机化推断提供了精确的渐近散度条件与功效刻画。用您 very_familiar 的 minimax bounds for estimation problems 与 moderately_familiar 的 M-estimation theory 可以审视其 Pitman 局部功效界是否紧,并探讨散度指标在更一般统计量(如高阶 U-statistic)下的推广。立即可做:用 very_familiar 的非参数统计与 minimax 工具即可动手验证其散度-功效对应关系在更广检验族中的普适性。

2. 2606.00887 — Hypothesis Testing for a Functional Parameter via Self-normalization

  • 作者: Yi Zhang, Xiaofeng Shao
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在时间序列非参数设定下,本文研究泛函参数(如边际 CDF、谱分布函数)的假设检验问题,核心难点是未知时间依赖结构导致传统 block bootstrap/subsampling 严重依赖带宽选择。作者提出 SS-SN(sample splitting + self-normalization)方法,将原本仅适用于有限维参数的无调参 SN 技术推广至泛函参数:通过样本分割构造泛函检验统计量,在简单与复合零假设下均获得 pivotal 极限分布,无需估计长期方差或选择带宽;同时在局部替代下推导了极限功效函数。模拟显示 SS-SN 检验在控制 size 方面显著优于依赖调参的方法,且功效具竞争力。对您有用:此方法为时间序列泛函检验提供了 tuning-free 的 pivotal 路径,直接呼应 hypothesis testing 与 nonparametric theory 交叉方向。
  • 关键技术: self-normalization, sample splitting, functional parameter hypothesis testing, pivotal limiting distribution, long-run variance avoidance, local alternatives power analysis
  • 为什么对您有用: 直接连接 primary interest 中的 hypothesis testing 与 nonparametric theory 子方向,处理泛函参数检验中长期方差估计/带宽选择的经典痛点。您武器库中 very_familiar 的 nonparametric statistics 与 minimax bounds 可用于审视其局部替代下的功效速率是否达到最优;moderately_familiar 的 M-estimation theory 可用于分析其复合零假设下泛函估计量的收敛细节。立即可做:用 very_familiar 的 minimax 视角验证其声称的功效优势是否在速率上紧,并可尝试将 SS-SN 思路迁移至高维或因果推断中泛函参数(如条件均值函数)的检验问题。

天体统计 (astrostats, 1 篇)

1. 2606.00768 — Bayesian estimation of spectral parameters of the 6.7-GHz methanol maser G339.884-1.259 from GRAO observations

  • 作者: Theophilus Ansah-Narh, Stephen Sottie, Nia Imara, Emmanuel Proven-Adzri
  • 分类: astro-ph.IM · physics.data-an · stat.AP
  • 相关性 8/10 · novelty: application
  • 摘要: 本文针对6.7-GHz甲醇脉泽谱的分解问题,在混合谱线且非高斯结构显著的设定下,目标是准确提取速度相干成分的物理参数。作者构建了基于Gaussian、Lorentzian和Voigt轮廓的贝叶斯谱分解框架,采用MCMC采样进行参数推断与模型比较,克服了传统Gaussian拟合缺乏不确定性量化且无法捕捉非高斯特性的缺陷。应用于GRAO观测的脉泽源G339.884-1.259,Voigt模型在AIC/BIC(≈1.98×10⁴/1.99×10⁴)、RMSE(≈11.1 Jy)和R²(0.985)上均最优,识别出7个速度成分;纯Gaussian/Lorentzian模型留有系统性残差,且偏高的reduced χ²提示未分辨的子结构与非理想噪声。对您而言,这是一篇展示贝叶斯模型比较与MCMC在天文谱线分解中应用的入门级实证案例,连接到astrostats的数据分析视角。
  • 关键技术: Bayesian spectral decomposition, MCMC sampling, Voigt profile fitting, AIC/BIC model comparison, reduced chi-squared diagnostic
  • 为什么对您有用: 本文属于astrostats入门读物:数据与模型(脉泽谱线、Voigt轮廓、MCMC)交代清晰,不假设天文术语背景,适合作为统计学家了解天文谱线分析的gateway阅读。武器库中的software development与M-estimation theory足以支撑进入此方向并复现其贝叶斯推断流程。值得花时间读全文以了解天文谱线数据中非高斯结构、混合成分与噪声建模的实际挑战。

📌 中相关论文(按主题分组)

因果推断 (causal_inference, 1 篇)

1. 2606.01184 — Topological Ignorability for Structural Causal Effects Beyond Means

  • 作者: Usef Faghihi
  • 分类: stat.ME · cs.AI
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在结构因果模型设定下,本文针对均值因果 estimand(如 ATE)无法捕捉干预对结局分布拓扑结构(分裂、环洞、分支)影响的情形,提出基于干预结局分布拓扑-几何摘要(density-superlevel Betti summaries、Euler signatures、persistent-homology summaries)的新型因果度量。核心识别条件为 topological ignorability:要求所选结构特征在给定协变量下不变,而非完整反事实分布不变;当摘要映射非单射时,该条件可在弱可忽略性失败时仍识别出目标结构特征。作者定义了协变量标准化拓扑-几何因果效应并给出实用估计器。在含隐藏混杂的合成与半合成基准(Wisconsin breast-cancer 协变量)中,弱可忽略性失效且协变量平衡后 ATE 仍偏,而有限 Betti 与 Euler 对比在 oracle、观测与加权分析间保持稳定。对您有用:本文将拓扑数据分析引入因果识别理论,为超越均值的结构性因果效应提供了新 estimand 与弱化识别假设的思路。
  • 关键技术: topological ignorability, density-superlevel Betti summaries, Euler signatures, persistent-homology summaries, covariate-standardized topological effect, partial identification via noninjective summaries
  • 为什么对您有用: 直接连接因果推断的 identification theory 子方向:topological ignorability 是对经典 weak ignorability 的结构性弱化,在非单射摘要下实现 partial identification,这为研究非均值 estimand 的识别条件提供了新视角。用您 very_familiar 的 estimation theory in causal inference 可以审视其标准化估计器的效率与稳健性,或用 moderately_familiar 的 identification theory 探讨非单射摘要下 topological ignorability 与经典可忽略性的等价/退化边界。中期可做:需先在 moderately_familiar 的 identification theory 上长肌肉(具体是 partial identification 与非参数模型下的拓扑特征可识别性),同时需补充 persistent homology 的基础计算知识才能深入评估其估计器的理论性质。

高维统计 / 随机矩阵 (high_dim_rmt, 3 篇)

1. 2606.01553 — Structural Change Detection in High-Dimensional Transformed Factor Models via Canonical Correlation Analysis

  • 作者: Lei Jia, Shouri Hu, Zhaoxing Gao
  • 分类: stat.ME · econ.EM
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在高维 transformed factor model 设定下,本文研究动态依赖公共因子诱导的结构变点的检测与估计问题,estimand 为变点位置及各 regime 的因子个数。核心机制利用公共因子的低秩 canonical-correlation 结构与零 canonical correlation 的噪声子空间之间的分离,构造 eigenvalue-ratio criterion 衡量估计噪声子空间的残差动态依赖以识别变点。因变点位置与 regime-specific 因子数均未知,提出交替迭代估计程序顺序更新直至收敛。在 mixing 与矩条件下建立估计量的渐近性质,收敛率显式依赖因子强度、截面维度与样本长度。对您有用:将 RMT 的 eigenvalue-ratio 与 CCA 结合用于高维因子模型变点检测,为高维时间序列的结构突变推断提供新路径。
  • 关键技术: canonical correlation analysis, eigenvalue-ratio criterion, transformed factor model, alternating iterative estimation, high-dimensional factor model, change-point detection
  • 为什么对您有用: 直接连接高维统计与 RMT 子方向:利用 CCA 的信号-噪声子空间分离与 eigenvalue-ratio 准则检测变点,是 RMT eigenvalue 方法在高维时间序列结构突变中的具体应用。technical_arsenal 中 high-dimensional asymptotics 可直接攻入本文的渐近收敛率分析,验证其因子强度依赖的 rate 是否紧;alternating iterative 程序的收敛保证可能需要 moderately_familiar 的 M-estimation theory 补充。立即可做:用 very_familiar 的高维渐近工具检查其 eigenvalue-ratio 的 phase transition 阈值与 minimax rate。

2. 2606.00478 — Online Sparse Regression with Expanding Observables

  • 作者: Ying Yang, Fang Yao
  • 分类: math.ST · stat.TH
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在在线高维线性回归设定下,目标是在候选特征集随时间逐步扩展(而非一开始就完全观测)时,实现变量选择与参数估计的 consistency,关键假设为稀疏性与逐步可观测性。本文提出 RAVAS(Recurrent Adaptive Variable Selection)算法,通过递归程序在样本量与特征集同时增长时动态更新选择;算法仅维护低维充分统计量并在线更新,内存与计算开销可控。理论方面,作者建立了模型选择一致性、估计误差界与特征覆盖率的保证,并发展了自适应在线调参策略。模拟与真实数据验证了方法在流式高维数据上的有效性。对您可能有用:该框架的在线充分统计量更新机制与稀疏回归误差界分析,可连接到高维统计与 semiparametric 理论中的 online debiased / one-step 更新思路。
  • 关键技术: online variable selection, expanding feature set, low-dimensional sufficient statistics, model selection consistency, adaptive online tuning, high-dimensional streaming regression
  • 为什么对您有用: 直接连接高维统计中的在线稀疏回归设定,特别是特征集随时间扩展这一新假设打破了传统 all-features-available 假设。您武器库中 very_familiar 的 minimax bounds for estimation 与 high-dimensional asymptotics 可直接用于审视其估计误差界是否紧,以及在线调参的理论保证是否可进一步 sharpen。立即可做:用 minimax bound 验证其声称的 estimation error rate 是否达到最优,或探索将 RAVAS 的在线充分统计量嵌入 online one-step / debiased 框架以获得在线 semiparametric efficiency。

3. 2606.00478 — Online Sparse Regression with Expanding Observables

  • 作者: Ying Yang, Fang Yao
  • 分类: math.ST · stat.TH
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在在线高维线性回归设定下,目标是在候选特征集随时间逐步扩展(而非一开始就完全观测)时,实现变量选择与参数估计的 consistency,关键假设为稀疏性与逐步可观测性。本文提出 RAVAS(Recurrent Adaptive Variable Selection)算法,通过递归程序在样本量与特征集同时增长时动态更新选择;算法仅维护低维充分统计量并在线更新,内存与计算开销可控。理论方面,作者建立了模型选择一致性、估计误差界与特征覆盖率的保证,并发展了自适应在线调参策略。模拟与真实数据验证了方法在流式高维数据上的有效性。对您可能有用:该框架的在线充分统计量更新机制与稀疏回归误差界分析,可连接到高维统计与 semiparametric 理论中的 online debiased / one-step 更新思路。
  • 关键技术: online variable selection, expanding feature set, low-dimensional sufficient statistics, model selection consistency, adaptive online tuning, high-dimensional streaming regression
  • 为什么对您有用: 直接连接高维统计中的在线稀疏回归设定,特别是特征集随时间扩展这一新假设打破了传统 all-features-available 假设。您武器库中 very_familiar 的 minimax bounds for estimation 与 high-dimensional asymptotics 可直接用于审视其估计误差界是否紧,以及在线调参的理论保证是否可进一步 sharpen。立即可做:用 minimax bound 验证其声称的 estimation error rate 是否达到最优,或探索将 RAVAS 的在线充分统计量嵌入 online one-step / debiased 框架以获得在线 semiparametric efficiency。

非参数 / 半参数 (nonparam_semipara, 4 篇)

1. 2606.00425 — Empirical Likelihood with Generative AI

  • 作者: Jiguang Li, Sid Kankanala, Veronika Rockova
  • 分类: stat.ME · stat.ML
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在 moment-restricted semiparametric 模型下,目标是利用辅助/合成数据(如生成式 AI 输出)进行参数识别与推断,假设 moment conditions 正确但 full likelihood 未知。核心方法是将 exponentially tilted empirical likelihood 嵌入非参数贝叶斯框架:先从 Dirichlet process 后验抽样,再投影到 moment-restricted 模型,得到 projection posterior,该过程天然支持并行计算。理论贡献包括在 vanishing-prior 与 persistent-prior 两种设定下建立了 projection posterior 的 Bernstein–von Mises 定理与一致性,明确了后验收敛率与渐近正态性。实证部分用 overnight news headlines 预测股票收益,展示 AI 合成数据作为间接先验正则化的有效性。对您可能有用:该文将 moment condition 推断与 AI synthetic data 结合,为 semiparametric efficiency 与 prior specification 提供了新视角。
  • 关键技术: exponentially tilted empirical likelihood, Dirichlet process mixture, projection posterior, Bernstein-von Mises theorem, moment-restricted model, Bayesian nonparametrics
  • 为什么对您有用: 直接连接 semiparametric theory 子方向:在 moment condition 设定下用 DP projection posterior 替代经典 EL 推断,且 BvM 定理覆盖 persistent-prior(对应 synthetic data 作为间接先验),这为 semiparametric efficiency bound 在贝叶斯框架下的实现提供了新路径。可用 very_familiar 的 minimax bounds / high-dimensional asymptotics 检验其声称的 BvM 收敛率是否在高维 moment 场景下仍然紧。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉(特别是 Bayesian semiparametric BvM 与 frequentist influence function 的桥接),才能将此 projection posterior 框架推广到高维 moment 或 causal inference 的 estimating equation 场景。

2. 2606.00715 — Rate-optimal neural boundary detection from unlabeled noisy images

  • 作者: Kyeongho Kim, Ilsang Ohn
  • 分类: stat.ME · stat.ML
  • 相关性 7/10 · novelty: sharper_rate
  • 摘要: 在无标签噪声图像设定下,目标是从原始强度观测中恢复未知目标区域,无需像素级标注或参数化强度分布假设。作者基于阈值化误分类损失的鲁棒 Gibbs 后验方法,提出了一种连续 hinge 型代理损失用于边界检测;该损失兼容梯度优化且可结合深度神经网络表征复杂边界。在温和分离假设下证明了该代理损失的 Fisher 一致性,并建立了将过量代理风险与估计区域的对称差误差联系起来的校准不等式。在分段光滑边界模型下,所得深度神经网络估计量达到了边界恢复的 minimax 最优速率(至多相差对数因子),且该分段光滑设定允许边界含角点与折点,突破了全局光滑边界模型的局限。对您可能有用:本文的 minimax rate 与校准不等式分析为非参数边界估计提供了清晰的理论框架,可直接连接到您对 minimax bounds 与非参数统计的核心兴趣。
  • 关键技术: Gibbs posterior, Fisher consistency, calibration inequality, minimax-optimal rate, hinge surrogate loss, deep neural network estimation
  • 为什么对您有用: 本文直接连接到您 primary interest 中的非参数理论与 minimax bounds:其分段光滑边界模型下的 minimax 最优速率与校准不等式证明,是经典的非参数估计效率分析。您武器库中 very_familiar 的 minimax bounds for estimation problems 与 nonparametric statistics 完全足以审视其速率证明的紧性与假设的必要性。Follow-up 判断:立即可做——您可直接用 minimax 理论验证其对数因子冗余是否可去,或探讨其分离假设在更一般逆问题设定下的可替代性。

3. 2606.01257 — Statistical Inference on Gradient Flows

  • 作者: Tongyu Li, Alexander Giessing
  • 分类: math.ST · stat.ME · stat.ML · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在经验风险最小化框架下,目标是沿梯度流整条优化路径对目标参数进行时间一致的统计推断,而非仅关注固定迭代步数的渐近行为。核心结果是证明了经验梯度流与总体梯度流之间的偏差在非负实轴上收敛为一个连续时间高斯过程,即 uniform CLT。基于此,作者提出了一种随梯度流同步演化的 algorithm-aware 协方差估计器,无需矩阵求逆、重采样或样本分割。理论上证明了该协方差估计器的时间一致收敛性,并据此构造了具有渐近有效覆盖率的置信区间。对您可能有用:该工作将优化动力学与 semiparametric inference 统一,为 data-dependent stopping time 下的 uncertainty quantification 提供了新视角。
  • 关键技术: uniform central limit theorem, continuous-time Gaussian process, algorithm-aware covariance estimator, empirical risk minimization, time-uniform inference, gradient flow dynamics
  • 为什么对您有用: 本文直接连接 semiparametric efficiency 与 estimation theory:将优化路径视为连续时间过程并建立 uniform CLT,本质上是在非标准 stopping rule 下做 influence-function 层面的推断。您可以用 very_familiar 的高维渐近工具检验其 Gaussian process 偏差结构在 high-dim regime 下是否仍成立,或用 moderately_familiar 的 M-estimation theory 推导该 algorithm-aware covariance estimator 的 semiparametric efficiency bound 是否可达。Follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以将此 uniform CLT 框架从 convex ERM 推广到非凸或 high-dimensional penalized 场景。

4. 2606.01257 — Statistical Inference on Gradient Flows

  • 作者: Tongyu Li, Alexander Giessing
  • 分类: math.ST · stat.ME · stat.ML · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在经验风险最小化框架下,目标是沿梯度流整条优化路径对目标参数进行时间一致的统计推断,而非仅关注固定迭代步数的渐近行为。核心结果是证明了经验梯度流与总体梯度流之间的偏差在非负实轴上收敛为一个连续时间高斯过程,即 uniform CLT。基于此,作者提出了一种随梯度流同步演化的 algorithm-aware 协方差估计器,无需矩阵求逆、重采样或样本分割。理论上证明了该协方差估计器的时间一致收敛性,并据此构造了具有渐近有效覆盖率的置信区间。对您可能有用:该工作将优化动力学与 semiparametric inference 统一,为 data-dependent stopping time 下的 uncertainty quantification 提供了新视角。
  • 关键技术: uniform central limit theorem, continuous-time Gaussian process, algorithm-aware covariance estimator, empirical risk minimization, time-uniform inference, gradient flow dynamics
  • 为什么对您有用: 本文直接连接 semiparametric efficiency 与 estimation theory:将优化路径视为连续时间过程并建立 uniform CLT,本质上是在非标准 stopping rule 下做 influence-function 层面的推断。您可以用 very_familiar 的高维渐近工具检验其 Gaussian process 偏差结构在 high-dim regime 下是否仍成立,或用 moderately_familiar 的 M-estimation theory 推导该 algorithm-aware covariance estimator 的 semiparametric efficiency bound 是否可达。Follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以将此 uniform CLT 框架从 convex ERM 推广到非凸或 high-dimensional penalized 场景。

数理统计 / 假设检验 (hypothesis_testing, 1 篇)

1. 2606.01465 — Comb Test: Histogram Uniformity Testing Based on Discrete Total Variation

  • 作者: Nikola Bani\'c, Neven Elezovi\'c
  • 分类: stat.ME
  • 相关性 7/10 · novelty: minor
  • 摘要: 在离散均匀性检验(histogram uniformity testing)设定下,本文针对梳状(交替型)偏离模式提出基于离散全变差(discrete total variation)的新检验 Comb Test,目标是在固定样本量 n 与 bin 数 k 的 multinomial 模型下检测非均匀性。核心机制是构造离散全变差统计量,其零分布通过动态规划精确计算,大样本情形则用 Gamma 近似配合 Monte Carlo 估计扩展。理论层面未给出 minimax power 或 rate 的刻画,仅通过数值实验表明对交替型偏离比 Pearson chi-square 检验最高提升约 67% power;实证应用于 ADC 交替微分非线性检测与科学数据舍入偏差检测。对您可能有用:若关注非经典偏离模式下的 goodness-of-fit 检验 power 分析,本文提供了一个具体统计量与计算方案。
  • 关键技术: discrete total variation, histogram uniformity testing, dynamic programming for exact null distribution, gamma approximation, Monte Carlo estimation, Pearson chi-square test
  • 为什么对您有用: 本文连接到 hypothesis testing 子方向,但仅针对特定交替型偏离提出一个计算便利的统计量,缺乏 minimax power 理论或 sharper rate 的数学刻画。用您 very_familiar 的 minimax bounds 工具可以审视该统计量在更广泛偏离类下的 power 表现,判断其 67% 提升是否仅在极窄的局部偏离下成立。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以建立该离散全变差统计量在一般非均匀偏离下的渐近 power 界与 minimax 性质。

🗂 其他论文(仅 LLM 评分,未生成摘要)

未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。

1. 2606.02200 — Random Set Quantile Estimation of Partially Identified Discrete Response Models

  • 作者: Shakeeb Khan, Tatiana Komarova, Denis Nekipelov
  • 分类: econ.EM
  • 相关性 7/10
  • 评分理由: Tangentially touches primary interest in semiparametric estimation and partial identification, but focuses on discrete choice econometric pathologies rather than the researcher's core high-dim/efficiency theory.

2. 2606.00574 — Prospects for Astrobiology and Technosignature Searches with the Vera C. Rubin Observatory Legacy Survey of Space and Time

  • 作者: Andjelka B Kovacevic, Nigel J. Mason, Aleksandra Ciprijanovic, Becky Long, Dominika Korczakowska, Maia Moore, Juulia Voulukka
  • 分类: astro-ph.IM · astro-ph.EP · physics.space-ph
  • 相关性 7/10
  • 评分理由: 提出基于 coherence 的异常检测框架处理 LSST 数据,数据结构(multiband variability)和模型(natural manifolds vs departures)阐述清晰,对统计学家是合格的 gateway reading

3. 2606.02140 — AstroSkyFlow: an astronomical sky image flow simulator for time domain survey validation and machine learning

  • 作者: Kexin Li, Yicheng Rui, Fabo Feng, Shuyue Zheng, Anton Pomazan, Yiyang Guo, Jie Zheng, Lin-Qiao Jiang
  • 分类: astro-ph.IM
  • 相关性 7/10
  • 评分理由: Astrostats gateway paper: clearly articulates the data simulation pipeline (noise, variability, sensor response) for time-domain surveys, making it accessible and methodologically relevant for a statistician.

4. 2606.00346 — Network knockoffs: controlling false discovery in dyadic space

  • 作者: Justin Van Ee, Yoichiro Kanno, Jacob Rash, Mevin Hooten
  • 分类: stat.ME · stat.AP
  • 相关性 6/10
  • 评分理由: Knockoff framework for dyadic regression touches high-dimensional FDR control and network structure, offering methodological overlap with high-dim stats.

5. 2606.00797 — Robust inference for risk heterogeneity under group imbalance

  • 作者: Mengqi Xu, Subha Maity, Joel Dubin
  • 分类: stat.ME · stat.AP · stat.ML
  • 相关性 6/10
  • 评分理由: Robust inference for risk heterogeneity touches semiparametric/estimation theory and has epidemiology application overlap, but core focus is biomedical risk modeling.

6. 2606.00858 — Change-Point Detection for Object-valued Time Series

  • 作者: Yi Zhang, Changbo Zhu, Xiaofeng Shao
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 6/10
  • 评分理由: Change-point detection for metric-space objects via self-normalization; touches nonparametric hypothesis testing but focused on object-valued time series.

7. 2606.00864 — Another Look at Bandwidth-free Inference: a Sample Splitting Approach

  • 作者: Yi Zhang, Xiaofeng Shao
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 6/10
  • 评分理由: Bandwidth-free inference via sample splitting for time series; touches hypothesis testing and semiparametric theory but is a niche econometrics correction.

8. 2606.01002 — Theoretical Analysis of Engression and Reverse Markov Engression

  • 作者: Jiaqi Huang, Gongjun Xu, Ji Zhu
  • 分类: stat.ME · cs.LG · math.ST · stat.TH
  • 相关性 6/10
  • 评分理由: Establishes nonasymptotic convergence bounds for conditional distribution learning (nonparametric theory overlap), but the core machinery is deep neural networks rather than the researcher's primary semiparametric/high-dim focus.

9. 2606.01346 — FlowSDR: Sufficient Dimension Reduction via Conditional Normalizing Flows

  • 作者: Yuexiao Dong, Kenichiro Mcalinn, Edoardo Airoldi, Lei Li
  • 分类: stat.ME · stat.ML
  • 相关性 6/10
  • 评分理由: Likelihood-based SDR via normalizing flows touches semiparametric/nonparametric theory and Fisher efficiency; moderate arsenal match.

10. 2606.01796 — LoopPerm-CPD: A Robust Loop Permutation Framework for Automatic Multiple Change-Point Detection in Longitudinal Data

  • 作者: Xuejun Sun, Oliver Li, Qianhui Zheng, Xiaojing Zheng, Fei Zou
  • 分类: stat.ME
  • 相关性 6/10
  • 评分理由: Longitudinal change-point detection in epi data touches secondary interest (epidemiology, longitudinal causal), but methodology is applied rather than theoretical.

11. 2606.02130 — Methods for adjusting for covariate measurement error in flexible modelling of functional form: designing a blinded, controlled neutral comparison simulation study

  • 作者: Anne C M Thi\'ebaut (CESP), Aris Perperouglou (GSK), Mohammed Sedki (IGR, CESP), Steve Ferreira Guerra (UBC), Paul Gustafson (UBC), Frank E Harrell, Willi Sauerbrei, Michal Abrahamowicz, Laurence S Freedman
  • 分类: stat.ME
  • 相关性 6/10
  • 评分理由: Measurement error correction overlaps with inverse problems with random noise and nonparametric statistics; simulation study design is a practical applied contribution.

12. 2606.00233 — Density Evolution: A Multiscale View of Density Estimation

  • 作者: Kisung You
  • 分类: math.ST · stat.TH
  • 相关性 6/10
  • 评分理由: Multiscale density estimation review overlaps with nonparametric statistics but is primarily a conceptual/pedagogical overview rather than novel theory.

13. 2606.01137 — Digital Maturity and Technical Efficiency in NHS Acute Trusts: Cross-Sectional Evidence from England

  • 作者: Ari Ercole
  • 分类: econ.EM
  • 相关性 6/10
  • 评分理由: Secondary interest match (econ theory application); uses Bayesian stochastic frontier analysis for hospital productivity, a real-data application with a causal identification angle, but methodology is standard.

14. 2606.01547 — JAXtronomy: A JAX port of lenstronomy

  • 作者: Alan Huang, Simon Birrer, Daniel Gilman, Natalie B. Hogg, Anowar J. Shajib, Aymeric Galan, Nan Zhang
  • 分类: astro-ph.IM · astro-ph.CO
  • 相关性 6/10
  • 评分理由: 引力透镜软件的 JAX 重实现,涉及计算优化与自动微分,与 statistical computing 兴趣有重叠,但主要是软件工程而非统计理论

15. 2606.00181 — Infinite-Dimensional Spherical Kernel ridge Regression

  • 作者: Beatrice Matteo, Almond Stoecker, Shahin Tavakoli
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: Infinite-dimensional nonparametric regression touches semiparametric/nonparametric theory, but the spherical data setting is niche and abstract is truncated.

16. 2606.00839 — Sequential multiple testing with multiple hypotheses and prior information on the hypothesis configuration

  • 作者: Yiming Xing
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: Sequential multiple testing with prior information; touches mathematical statistics/hypothesis testing but is narrowly focused on sequential design.

17. 2606.00878 — Anytime-valid testing with e-values and confirmatory adaptive designs

  • 作者: Werner Brannath, Lasse Fischer
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: Relates to hypothesis testing (primary interest), but focuses on anytime-valid e-values and adaptive clinical trial designs, which is a specific subfield with limited overlap with the researcher's core mathematical/high-dim testing interests.

18. 2606.01960 — Return-to-Baseline Testing via Empirically Calibrated e-processes

  • 作者: Marta Regis, Paulo Serra
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 5/10
  • 评分理由: Sequential testing for return-to-baseline using e-processes; touches hypothesis testing (primary) but focuses on anytime-valid inference rather than classical mathematical statistics.

19. 2606.01990 — Testing for Single-Population Ancestry in the Admixture Model

  • 作者: Holger Dette, Carola Sophia Heinzel, Zoe Lange, Peter Pfaffelhuber
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 5/10
  • 评分理由: Hypothesis testing in admixture models (primary interest), but the genetic application and specific model are tangential to the researcher's core focus.

20. 2606.02076 — Modelling multi-cancer screening data to infer on natural history of disease: when can valid, identifiable and precise inference be obtained?

  • 作者: MO Soares, J Lange, K Gogebakan, S Dias, NJ Welton, R Etzioni, AE Ades, S Palmer
  • 分类: stat.ME
  • 相关性 5/10
  • 评分理由: Epidemiology application with identification theory, but focuses on multistate models for cancer screening rather than the researcher's causal identification or semiparametric estimation theory.

21. 2606.01687 — Information and voting: Evidence from Peru's 2026 presidential election

  • 作者: Marcelo Gallardo, Nicolas Velarde, Cristina Gutarra
  • 分类: econ.EM
  • 相关性 5/10
  • 评分理由: Secondary interest match (econ theory application); natural experiment on information and voting with a Bayesian updating model, but lacks deeper causal inference methodology overlap.

22. 2606.00402 — A Distribution-Free Framework for Rewrite-Based Human-text Detection via Knockoff Filtering

  • 作者: Yi Liu
  • 分类: stat.ME · cs.AI · stat.AP
  • 相关性 4/10
  • 评分理由: Knockoff filtering for text detection has high-dim multiple testing elements, but the application domain and core machinery are distant from primary interests.

23. 2606.00436 — Weighted Conformal Clustering

  • 作者: Anirban Nath, YoonHaeng Hur, Genevera I. Allen
  • 分类: stat.ME · math.ST · stat.ML · stat.TH
  • 相关性 4/10
  • 评分理由: Conformal clustering for uncertainty quantification is tangential; lacks direct connection to causal inference, efficiency theory, or high-dim math stats.

24. 2606.00900 — Notes on Randomized Controlled Trials for Studying Social Media Harms

  • 作者: Chris Felton
  • 分类: stat.ME
  • 相关性 4/10
  • 评分理由: Discusses RCTs and causal inference concepts (local vs global interventions), but is primarily a conceptual/epidemiological note rather than a mathematical statistics or estimation theory paper.

25. 2606.01854 — A Uniform Improvement of the Benjamini-Hochberg Procedure using e-Closure

  • 作者: Jelle Goeman
  • 分类: stat.ME
  • 相关性 4/10
  • 评分理由: Multiple testing improvement via e-values; tangential to primary interests in causal inference and high-dimensional estimation theory.

26. 2606.02017 — PliableBVS: A flexible Bayesian variable selection method for modeling interactions with mandatory modifying variables

  • 作者: Theophilus Quachie Asenso, Zhi Zhao, Maren-Helene Langeland Degnes, Marie Cecilie Paasche Roland, Trond Melbye Michelsen, Manuela Zucknick
  • 分类: stat.ME · stat.AP · stat.ML
  • 相关性 4/10
  • 评分理由: Bayesian variable selection for high-dimensional interactions; methodological overlap with high-dim stats but Bayesian screening is outside core arsenal.

27. 2606.02410 — Optimal sequential two-stage Bayes Factor Design for two-arm clinical Phase II Trials with binary Endpoints

  • 作者: Riko Kelter
  • 分类: stat.ME · stat.AP
  • 相关性 4/10
  • 评分理由: Hypothesis testing design via Bayes factors touches mathematical statistics, but the clinical trial focus and simulation-free methodology are tangential to the researcher's core theory interests.

28. 2606.02144 — Sharp Support Thresholds for Smeariness of Absolutely Continuous Measures on Spheres

  • 作者: Susovan Pal
  • 分类: math.ST · stat.TH
  • 相关性 4/10
  • 评分理由: Smeary measures on spheres involves degenerate Hessians and non-standard CLTs, but is geometric statistics rather than core semiparametric/high-dim theory.

29. 2606.01295 — PSF-like Alpha-Particle Events in LSST Images

  • 作者: Guillem Megias Homar, Craig S. Lage, Pierre-Fran\c{c}ois L\'eget, Steven M. Kahn, Christopher W. Stubbs, S. R. Kulkarni, Ian S. Sullivan, James F. Bosch, Eli S. Rykoff
  • 分类: astro-ph.IM · physics.ins-det
  • 相关性 4/10
  • 评分理由: LSST 图像中 alpha-particle 事件的检测与特征描述,有数据但主要是仪器物理,统计方法论较弱,gateway 价值有限

30. 2606.00231 — On Asymptotic Outlier Rejection in Bayesian Mixed Poisson Regression Models Under Extreme Target and Covariate Values

  • 作者: Ilaria Pia, Jarno Vanhatalo
  • 分类: stat.ME
  • 相关性 3/10
  • 评分理由: Bayesian robustness for mixed Poisson regression is tangential to the researcher's primary interests in causal inference and high-dim math stats.

31. 2606.01090 — Measuring the Symmetry--Data Exchange Rate

  • 作者: Ahmed M. Adly
  • 分类: stat.ME · cs.LG
  • 相关性 3/10
  • 评分理由: Focuses on equivariance architectural priors and sample complexity scaling laws in ML, which is tangential to the researcher's specific high-dimensional statistics and causal inference interests.

32. 2606.01239 — Functional Clustering of Survival Data via Smoothed Log-Hazard Trajectories: A Risk-Dynamics Perspective

  • 作者: Anna De Magistris, Elvira Romano, Fabrizio Maturo
  • 分类: stat.ME · stat.ML
  • 相关性 3/10
  • 评分理由: Functional clustering of survival data via smoothed log-hazard trajectories; tangential to the researcher's primary interests in causal inference, high-dim stats, and efficiency theory.

33. 2606.01328 — Scale-Free Priors and Survival Dynamics: A Bayesian Framework for Conflict Duration

  • 作者: Tomasz F. Stepinski
  • 分类: stat.ME · physics.soc-ph
  • 相关性 3/10
  • 评分理由: Bayesian survival analysis for conflict duration; tangential to primary interests in causal inference and mathematical statistics.

34. 2606.01932 — Spatial Capture-Recapture With Penalized Regression Splines to Flexibly Model Wildlife Density and Distribution

  • 作者: Andrew E. Seaton, David L. Borchers, Milou Groenenberg, Ben Stevenson
  • 分类: stat.ME · stat.AP
  • 相关性 3/10
  • 评分理由: Wildlife spatial capture-recapture with penalized splines; unrelated to primary and secondary research interests.

35. 2606.02062 — Evaluating the role of correlation among markers in prediction models

  • 作者: Sergio Sabroso-Lasa, Luis Mariano Esteban, Tom\'as Alcal\'a-Nalvaiz, Francisco J. Jurado, N\'uria Malats
  • 分类: stat.ME
  • 相关性 3/10
  • 评分理由: Evaluating marker correlation in ROC-AUC prediction models; tangential applied biostatistics, no overlap with core theoretical interests.

36. 2606.02065 — Inverting Poisson-Laguerre tessellations

  • 作者: Thomas van der Jagt, Geurt Jongbloed, Martina Vittorietti
  • 分类: stat.ME · math.PR
  • 相关性 3/10
  • 评分理由: Inverse problems for random tessellations are mathematically interesting but fall outside the researcher's core causal inference, high-dim, or semiparametric estimation interests.

37. 2606.00343 — Polar Depth for Potentially Heavy-Tailed Data

  • 作者: Stephan Clemen\c{c}on, Carlos Fern\'andes, Pavlo Mozharovskyi, Anne Sabourin
  • 分类: math.ST · stat.CO · stat.ML · stat.TH
  • 相关性 3/10
  • 评分理由: Polar depth for heavy-tailed data is an extreme-value / depth concept; tangential to the researcher's core primary interests.

38. 2606.01530 — A flexible and robust approach to univariate Gaussian splitting using parameterised Gaussian mixtures

  • 作者: Dmitry Mikhin, Athena Xiourouppa
  • 分类: math.ST · stat.TH
  • 相关性 3/10
  • 评分理由: Gaussian mixture splitting via L2 minimization is nonparametric approximation but lacks direct connection to primary interests like efficiency or causal inference.

39. 2606.00327 — Cluster Analysis with Resampling for Validation and Exploration (CARVE)

  • 作者: Kai R. Wycik, Tiffany M. Tang, Tarek M. Zikry, Genevera I. Allen
  • 分类: stat.ME · cs.LG · stat.AP · stat.ML
  • 相关性 2/10
  • 评分理由: Resampling-based cluster validation is an applied ML/data analysis method, largely unrelated to the researcher's core theoretical interests.

40. 2606.01428 — Quantifying Evidential Rigor in Meta-Analytic Corpora: A Simulation-Characterized, Bias-Robust Bayesian Workflow with a Nutrition Case Study

  • 作者: Matt Hester
  • 分类: stat.ME · stat.AP
  • 相关性 2/10
  • 评分理由: Bayesian meta-analysis workflow for publication bias; unrelated to primary methodological interests.

41. 2606.02059 — ICCDesign: An R Package for the Design and Analysis of ICC-Based Reliability Studies with Continuous Responses

  • 作者: Ziyu Liu, Ruilin Ma, Yundan Zhang, Chenge Gao
  • 分类: stat.ME
  • 相关性 2/10
  • 评分理由: R package for ICC reliability study design; unrelated to primary and secondary interests.

42. 2606.02199 — A Contaminated Model for Overdispersed Multinomial Microbiome Count Data

  • 作者: Ockert van Heerden, Andri\"ette Bekker, Seite Makgai, Arno Otto, Antonio Punzo
  • 分类: stat.ME
  • 相关性 2/10
  • 评分理由: Proposes a contaminated Dirichlet-multinomial model for microbiome data; tangential to the researcher's primary interests in causal inference, high-dim theory, or efficiency theory.

43. 2606.00587 — Hashprice modulates the electricity demand response of Bitcoin miners

  • 作者: Subir Majumder
  • 分类: econ.EM · cs.ET · cs.SY · eess.SY
  • 相关性 2/10
  • 评分理由: Bitcoin mining electricity demand response is econ/empirical but lacks causal inference methodology or statistical theory overlap.

44. 2606.00811 — Certificates without Electrons? Theory and Evidence on Impacts from AI-Driven Power Demand

  • 作者: Dana Golden, Aruna Balasubramanian, Niranjan Balasubramanian
  • 分类: econ.EM · cs.AI
  • 相关性 2/10
  • 评分理由: Game-theoretic model of AI power demand and RECs is econ/energy policy; no overlap with causal inference estimation theory or mathematical statistics.

45. 2606.00164 — Astronomical Advantages of a Boost Mission to Facilitate HST Science into the 2030s: Imaging the Circumgalactic Medium of Galaxies

  • 作者: Matthew J. Hayes, Kate H. R. Rubin, Michelle A. Berg, Kevin France, Sally Oey, Ramona Augustin, Joseph N. Burchett, Cody A. Carr, Alison L. Coil, Sophia R. Flury, Cameron Hummels, Varsha P. Kulkarni, Stephan R. McCandliss, Matilde Mingozzi, Dylan Nelson, Zixuan Peng, Michael Rutkowski, Alberto Saldana-Lopez, Jason Tumlinson, Sarah Tuttle, Freeke van de Voort, Bart P. Wakker, Jessica K. Werk
  • 分类: astro-ph.IM · astro-ph.GA
  • 相关性 2/10
  • 评分理由: Pure astrophysics result about HST orbital boost and circumgalactic medium; fails gateway criteria: not accessible to a stats outsider, no clear data/model exposition for a statistician's entry.

46. 2606.00217 — Hubble Science in the 2030s White Paper: High-Contrast Optical and UV Spectroscopy with HST/STIS

  • 作者: K. Ward-Duong (Smith College), J. Debes (Space Telescope Science Institute), J. Aguilar (Space Telescope Science Institute), T. Currie (University of Texas - San Antonio), J. Lomax (United States Naval Academy), C. Xie (Johns Hopkins University), J. Hashimoto (Academia Sinica Institute of Astronomy & Astrophysics), J. Zhang (University of Hawai'i at Manoa), R. Michelson (Amherst College), E. Vrijmoet (Smith College, Five College Astronomy Department), C. Chen (Space Telescope Science Institute), E. Rickman (Space Telescope Science Institute), K. Hoch (Space Telescope Science Institute), K. Follette (Amherst College)
  • 分类: astro-ph.IM · astro-ph.EP · astro-ph.GA · astro-ph.SR
  • 相关性 2/10
  • 评分理由: Pure astrophysics/HST instrumentation white paper; fails gateway criteria: heavy astro jargon, no statistical data-analysis or modeling problem articulated for an outsider.

47. 2606.01989 — Polarized lines of the second solar spectrum (SrI, SrII, CaI, BaII) observed at the Pic du Midi Turret Dome spectropolarimeter with the slit orthogonal to the limb

  • 作者: Jean-Marie Malherbe (LIRA, PSL)
  • 分类: astro-ph.IM · astro-ph.SR
  • 相关性 2/10
  • 评分理由: Pure astrophysics observation paper lacking clear data/model exposition for an outsider; fails the astrostats gateway rubric.

48. 2606.00767 — The Effect of Choice of Metric and Scan Length on Reliability in Resting-State fMRI

  • 作者: Yu Huang, Philip T. Reiss, Seonjoo Lee, R. Todd Ogden
  • 分类: stat.ME
  • 相关性 1/10
  • 评分理由: Applied neuroimaging reliability study using dbICC; unrelated to primary or secondary interests.

49. 2606.02533 — Space-Filling One-Factor-At-A-Time Designs

  • 作者: Wei-Yang Yu, V. Roshan Joseph
  • 分类: stat.ME
  • 相关性 1/10
  • 评分理由: Experimental design for deterministic computer experiments is unrelated to the researcher's primary and secondary interests.

50. 2606.00463 — Some Thoughts on the Future of Technosignature Searches: Constraining the Fermi Paradox

  • 作者: Ian A. Crawford
  • 分类: astro-ph.IM · astro-ph.EP · physics.pop-ph
  • 相关性 1/10
  • 评分理由: 纯天文/物理推测论文,缺乏数据结构和统计模型 exposition,对统计学家无 gateway 价值

51. 2606.01644 — The Murchison Widefield Array Phase III upgrade: Sensitivity Doubled, Number of Baselines Quadrupled, Flexibility Enhanced, and EoR Observations Optimised

  • 作者: S. J. Tingay, M. Johnston-Hollitt, R. B. Wayth, T. A. Booler, J. Jones, Y. Wu, J. Gan, G. Sleap, A. McPhail, C. Wintle, A. Williams, C. J. Phillips, L. Verduyn, D. Emrich, P. Giersch, C. J. Riseley, S. Duchesne, C. M. Trott, D. Null, B. W. Myers, C. D. Nunhokee, N. Barry, L. Dressler, J. Ducharme, B. Hazelton, M. Lee, E. Lilleskov, M. Morales, J. Pober, Zhiqiang Shen, Xiang-ping Wu, Xiaoyu Hong, M. D. Filipovi\'c, S. E. Tremblay, M. Walker
  • 分类: astro-ph.IM · astro-ph.CO
  • 相关性 1/10
  • 评分理由: 射电望远镜硬件升级描述,纯仪器工程,无统计或数据建模内容

52. 2606.01769 — Design and development of Fabry-Perot based wavelength calibration system for PARAS-2 spectrograph

  • 作者: Shubhendra Nath Das, Kapil Kumar Bharadwaj, Abhijit Chakraborty, Kevikumar A. Lad, Jajaendra Siva Seshu Vera Prasad Neelam, Rishikesh Sharma, Nikitha Jithendran, Vishal Joshi
  • 分类: astro-ph.IM · astro-ph.EP
  • 相关性 1/10
  • 评分理由: 光谱仪波长校准系统的硬件设计,纯仪器工程,无统计方法论

53. 2606.00303 — Building a Global Astrotourism Community of Practice Through Astronomy for Development

  • 作者: Joyful E. Mdhluli (on behalf of the IAU Office of Astronomy for Development)
  • 分类: astro-ph.IM · physics.soc-ph
  • 相关性 0/10
  • 评分理由: 纯社会科学/旅游论文,无统计方法或天文数据建模内容,与研究者兴趣无关

Maintained by 陈星宇 · Homepage · Source on GitHub

评论