跳转至

2026-06-10 每日 arXiv 资讯

  • 高相关论文 10 篇 · 中相关 15 篇 · 其他 17 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 2 篇)

1. 2606.11013 — Empirical stratification for treatment effect heterogeneity with post-treatment variables

  • 作者: Chao Cheng, Rui Wang, Yichi Zhang
  • 分类: stat.ME
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在因果推断框架下研究 post-treatment variables(如非依从性、中间事件)对处理效应异质性的修饰作用,目标 estimand 为 empirical-stratum treatment effects (ETEs)。传统方法对 observed PV 做条件会引入内生选择偏差,principal stratification 的 principal causal effects 因 strata 不可观测需强假设才能 identification。本文提出 assumption-lean 的 empirical stratification:用 baseline covariates 预测 potential PV responses 构造 empirical scores,据此划分 empirical subgroups,所得 ETEs 在标准因果假设下即可 identification。进一步证明在 principal ignorability 下 average ETE 可恢复 PCEs,但违反该假设时 ETEs 仍保持信息量。提出 projected ETE curves 并基于 efficient influence function 构造 semiparametric efficient estimator,辅以两个实证应用。对您有用:将 principal stratification 的 identification 困难与 semiparametric efficiency theory 结合,为处理效应异质性提供了可识别的替代 estimand,直接连接到您的 causal inference (identification, estimation) 和 efficiency theory (EIF-based estimator) 两个 primary interest。
  • 关键技术: principal stratification, efficient influence function, semiparametric efficient estimator, principal ignorability, empirical score construction, projected ETE curves
  • 为什么对您有用: 直接连接到 causal inference 的 principal stratification / identification 子方向,以及 efficiency theory 的 EIF-based estimation。用 technical_arsenal 中 moderately_familiar 的 identification theory in causal inference 和 semiparametric theory 可攻其 identification 论证与 EIF 构造,very_familiar 的 estimation theory in causal inference 可攻其 estimator 实现与收敛性质验证。立即可做:用现有武器就能动手验证 ETEs 的 semiparametric efficiency bound 是否紧、以及 EIF-based estimator 的 n^{-1/2}-CAN 性质。

2. 2606.10497 — Minimum free energy randomized design to improve covariate balance

  • 作者: Haolin Chen, Jun Yu
  • 分类: stat.ME · math.ST · stat.TH
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在随机对照试验(RCT)的因果推断设定下,目标是估计处理效应,核心挑战在于协变量平衡与随机化鲁棒性之间的显式权衡。受热力学第二定律启发,本文提出最小自由能随机化设计准则,通过最小化协变量不平衡的同时最大化分配熵(量化对比与分配多样性)来实现该权衡。方法上,开发了计算高效的动态分配算法,并利用有限样本方差分解证明该策略在控制协变量不平衡的同时,防止未观测异质性主导均方误差。理论上证明了在给定设计约束下该方法保持 minimax efficiency;实证显示其统计效率与鲁棒性优于现有方法。对您有用之处:该文将 minimax efficiency bound 引入实验设计权衡,与您在因果推断估计理论及 minimax bounds 的 primary interest 直接对接。
  • 关键技术: minimum free energy design, finite-sample variance decomposition, dynamic allocation algorithm, minimax efficiency under design constraints, entropy maximization
  • 为什么对您有用: 连接到因果推断的实验设计与处理效应估计理论,特别是 RCT 中协变量平衡与随机化的权衡。您的 very_familiar 武器库中的 minimax bounds for estimation theory 可以直接用来审视其声称的 minimax efficiency 是否紧,或用 moderately_familiar 的 M-estimation theory 分析其动态分配算法的收敛性质。立即可做:用 minimax 理论验证其效率界,或用软件开发能力复现其动态分配算法并测试高维设定下的表现。

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)

1. 2606.11110 — Fixed-Threshold One-Bit Toeplitz Covariance Estimation under Sparse-Ruler Sampling

  • 作者: Zhiyong Cheng, Shengyao Chen
  • 分类: math.ST · cs.IT · math.IT · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在固定阈值一比特量化与确定性 sparse-ruler 采样设定下,研究 Toeplitz 协方差矩阵的估计问题;estimand 为算子范数误差下的协方差矩阵,关键假设为 nonzero threshold 下符号均值非零且 vertex reuse 引入 coherent one-vertex component。作者先证明一个维度无关的 Gaussian variance contraction 定理,适用于 hollow quadratic forms of bounded coordinate transforms,其方差由边权 Frobenius 范数控制而不依赖维度、支撑大小或最大度数。基于此构造 centered sparse-ruler Toeplitz estimator with pooled marginal calibration,oracle 主项为 γ₀L₁κ_obs√(φ(Ω)log d/n),φ(Ω)=∑q_s^{-1}。通过已知尺度 identity-neighborhood 子模型上的 spectral-packing lower bound 证明 √(φ(Ω)log d/n) 依赖是本质的,从而在非饱和 regime 下 oracle estimator 达到 minimax rate optimal。对您有用:维度无关的 variance contraction 定理与 minimax rate 结果直接对接您的高维统计与 minimax bound 兴趣,sparse-ruler 的确定性采样设计也触及统计计算中的采样-精度权衡。
  • 关键技术: sparse-ruler sampling, one-bit fixed-threshold quantization, hollow quadratic form variance contraction, dimension-free Gaussian variance bound, spectral-packing minimax lower bound, operator-norm covariance estimation
  • 为什么对您有用: 本文核心落在高维协方差估计的 minimax rate 理论,直接对接您 primary interest 中的高维统计与 minimax bound。您 very_familiar 的 minimax bounds for estimation problems 可直接验证其 spectral-packing lower bound 是否紧、φ(Ω) 依赖是否可改进;moderately_familiar 的 M-estimation theory 可用于审视 pooled marginal calibration 的渐近性质。Follow-up 判断:立即可做——用 minimax bound 工具检查 conditioning/curvature 常数的最优依赖是否可补全,或探索 random sparse-ruler 下的 rate 变化。

2. 2606.11110 — Fixed-Threshold One-Bit Toeplitz Covariance Estimation under Sparse-Ruler Sampling

  • 作者: Zhiyong Cheng, Shengyao Chen
  • 分类: math.ST · cs.IT · math.IT · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在固定阈值1-bit量化与确定性稀疏尺(sparse-ruler)采样组合下估计Toeplitz协方差矩阵,目标是operator-norm下的minimax rate。非零阈值使sign均值非零,产生coherent vertex component;centering后得到degenerate sparse-pair statistic。作者证明了一个dimension-free的Gaussian variance contraction定理,适用于bounded coordinate transforms的hollow quadratic forms,用edge weights的Frobenius norm控制任意确定性稀疏支撑,不依赖维度、支撑大小或最大度。构造了centered sparse-ruler Toeplitz estimator with pooled marginal calibration,oracle项为γ₀L₁κ_obs√(φ(Ω)log d/n),φ(Ω)=Σq_s⁻¹。通过spectral-packing lower bound在known-scale identity-neighborhood子模型上证明√(φ(Ω)log d/n)依赖是本质的,oracle estimator在非饱和regime下minimax rate optimal。对您有用:直接连接高维统计的minimax rate分析与RMT的operator-norm估计问题。
  • 关键技术: one-bit quantization with fixed threshold, sparse-ruler sampling, dimension-free Gaussian variance contraction, hollow quadratic forms of bounded coordinate transforms, spectral-packing minimax lower bound, pooled marginal calibration
  • 为什么对您有用: (1) 直接连接高维统计中Toeplitz协方差估计的operator-norm minimax rate问题,以及RMT中spectral估计的量化采样设定。(2) 用very_familiar中的minimax bounds for estimation problems可直接验证其spectral-packing lower bound声称的rate是否紧;moderately_familiar中的high-dimensional asymptotics可分析其dimension-free variance contraction定理的证明策略。(3) 立即可做——minimax lower bound构造和variance contraction定理的证明均在现有武器库范围内,可展开细读验证。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 2606.11183 — Nonparametric Riemannian Empirical Bayes, and Denoising Measurements on Manifolds

  • 作者: Adam Quinn Jaffe, Leonardo V. Santoro, Bodhisattva Sen
  • 分类: math.ST · math.DG · stat.ME · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在紧 Riemannian 流形上的非参数经验 Bayes 去噪设定中,latent 变量与观测均位于流形、似然取 Riemannian Gaussian 分布。作者推导了流形上的 Tweedie-Eddington 公式,将边际分布与"切向"Bayes 去噪器(surrogate oracle)联系起来——后者通过一阶近似绕开后验 Fréchet 均值的显式计算。低噪声下 surrogate oracle 几乎达到 Bayes 风险;数据驱动近似利用 Laplace-Beltrami 算子谱理论构造,给出有限样本收敛速率。关键发现:与欧氏近参数速率不同,流形速率因 Riemannian Gaussian 密度在 cut locus 处的奇性而变慢;圆周情形下建立了匹配 minimax 下界,证明问题具有真正的非参数收敛速率。对您而言,cut locus 奇性导致的 minimax rate 退化直接连接到您的 minimax bounds 专长,而 Tweedie 公式与 semiparametric efficiency 的联系也值得深挖。
  • ⚠️ 摘要不完整,待重跑(python -m research_news.rerun
  • 关键技术: Tweedie-Eddington formula on manifolds, Laplace-Beltrami spectral expansion, Riemannian Gaussian distribution, minimax lower bounds on manifolds, Fréchet mean and cut locus singularities, tangential Bayes denoiser
  • 为什么对您有用: 本文直接连接非参数理论中的 minimax rate 分析(流形上收敛速率因 cut locus 奇性从近参数退化为真正非参数速率)以及 astrostats 中的球面数据去噪(gamma ray burst 位置)。您 very_familiar 的 minimax bounds for estimation problems 可直接审视/推广其圆周 minimax 下界证明策略到更一般流形。中期可做:需先在 moderately_familiar 的 semiparametric theory 上补充 Laplace-Beltrami 谱理论与 Riemannian 几何基础,才能将 Tweedie-Eddington 公式与效率理论做深层对接。

2. 2606.11183 — Nonparametric Riemannian Empirical Bayes, and Denoising Measurements on Manifolds

  • 作者: Adam Quinn Jaffe, Leonardo V. Santoro, Bodhisattva Sen
  • 分类: math.ST · math.DG · stat.ME · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在紧 Riemannian 流形上的非参数经验 Bayes 去噪设定中,latent 变量与观测均位于流形、似然取 Riemannian Gaussian 分布。作者推导了流形上的 Tweedie-Eddington 公式,将边际分布与"切向"Bayes 去噪器(surrogate oracle)联系起来——后者通过一阶近似绕开后验 Fréchet 均值的显式计算。低噪声下 surrogate oracle 几乎达到 Bayes 风险;数据驱动近似利用 Laplace-Beltrami 算子谱理论构造,给出有限样本收敛速率。关键发现:与欧氏近参数速率不同,流形速率因 Riemannian Gaussian 密度在 cut locus 处的奇性而变慢;圆周情形下建立了匹配 minimax 下界,证明问题具有真正的非参数收敛速率。对您而言,cut locus 奇性导致的 minimax rate 退化直接连接到您的 minimax bounds 专长,而 Tweedie 公式与 semiparametric efficiency 的联系也值得深挖。
  • ⚠️ 摘要不完整,待重跑(python -m research_news.rerun
  • 关键技术: Tweedie-Eddington formula on manifolds, Laplace-Beltrami spectral expansion, Riemannian Gaussian distribution, minimax lower bounds on manifolds, Fréchet mean and cut locus singularities, tangential Bayes denoiser
  • 为什么对您有用: 本文直接连接非参数理论中的 minimax rate 分析(流形上收敛速率因 cut locus 奇性从近参数退化为真正非参数速率)以及 astrostats 中的球面数据去噪(gamma ray burst 位置)。您 very_familiar 的 minimax bounds for estimation problems 可直接审视/推广其圆周 minimax 下界证明策略到更一般流形。中期可做:需先在 moderately_familiar 的 semiparametric theory 上补充 Laplace-Beltrami 谱理论与 Riemannian 几何基础,才能将 Tweedie-Eddington 公式与效率理论做深层对接。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 2606.10767 — Two-Sample Homogeneity Test via Entropic Optimal Transport

  • 作者: Yiming Ma, Hang Liu, Weiwei Zhuang
  • 分类: stat.ME
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文提出基于熵最优传输(EOT)映射的两样本同质性检验方法,以单位球上均匀分布为公共参考分布,检验统计量为两个经验 EOT 映射的平方 L² 距离。在固定熵正则化参数下,作者证明了总体映射差异的可识别性,并建立经验映射差在零假设下的泛函中心极限定理,推导出 Gaussian 二次型零极限分布。对固定对立假设证明检验一致性,并在 contiguous alternatives 下刻画局部渐近功效。提出加权 multiplier bootstrap 校准非 pivotal 零分布并证明其有效性。模拟表明该方法对位置对立假设尤为有效,且能提供分布差异的诊断信息。对您有用:该工作将 EOT 映射引入两样本检验,其泛函 CLT 与二次型极限分布的理论框架与您在 hypothesis testing 和 nonparametric theory 的兴趣直接对接。
  • 关键技术: entropic optimal transport map, functional central limit theorem, Gaussian quadratic-form limit, contiguous alternatives, weighted multiplier bootstrap, L² map discrepancy
  • 为什么对您有用: (1) 直接连接 hypothesis testing 子方向——两样本同质性检验的 EOT 映射方法,泛函 CLT 和二次型极限分布是核心理论贡献;(2) 您的 nonparametric statistics 和 minimax bounds 武器可直接分析该检验的 minimax 功效界,moderately_familiar 的 M-estimation theory 可用于审视 EOT 映射估计的渐近性质;(3) 中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是 EOT 映射的 influence function 与 semiparametric efficiency bound 的关系),然后可攻该检验的 efficiency 界与 sharper rate 问题。

2. 2606.10977 — A Structural Separation Between Chernoff and Convex-Order Optimality in Robust Testing

  • 作者: G\"okhan G\"ul
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在鲁棒假设检验理论中,最不利分布(LFD)通常同时最大化所有Chernoff u-affinity并最小化所有f-divergence。本文揭示这一等价性在一般情形下失效的结构机制:分数幂函数族{x^u}_{u∈(0,1)}生成的锥严格小于凸函数锥,从而在fractional-moment dominance与convex-order dominance之间产生分离。作者在三点概率空间上构造了显式最小反例——凸紧不确定类、一致有界似然比条件下,单一分布对均匀最大化所有Chernoff泛函却未能最小化某个凸f-divergence。进一步证明两点空间上不可能出现此类分离,并讨论了等价性的充分条件(似然比的随机序)。最后指出moment cone几何中的一个开放刻画问题。对您研究假设检验最优性理论而言,此cone-separation视角提供了理解不同最优准则分歧的精确几何工具。
  • 关键技术: Chernoff u-affinity, f-divergence minimization, moment cone geometry, convex-order dominance, least favorable distributions, robust hypothesis testing
  • 为什么对您有用: 本文直接连接到您primary interest中"mathematical statistics (hypothesis testing)"子方向,具体是鲁棒检验的最优性理论——Chernoff bound与f-divergence两类最优准则的等价/分离条件。您武器库中"minimax bounds for estimation problems"的几何视角可迁移:moment cone的严格包含关系与估计问题中minimax rate的phase transition有结构相似性,可用minimax bound工具检验类似cone-separation是否在估计问题中出现。Follow-up判断:中期可做——需先在"moderately_familiar"的M-estimation theory上补充moment cone / convex order的具体技术细节,才能将此几何机制推广到更一般的检验/估计设定。

3. 2606.10977 — A Structural Separation Between Chernoff and Convex-Order Optimality in Robust Testing

  • 作者: G\"okhan G\"ul
  • 分类: math.ST · stat.TH
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在经典鲁棒假设检验中,最不利分布通常同时最大化所有 Chernoff u-affinity 并最小化所有 f-divergence。本文揭示该等价性在一般情形下失效的结构机制:分数幂函数族 {x^u}_{u∈(0,1)} 生成的锥严格小于凸函数锥,导致 fractional-moment dominance 与 convex-order dominance 之间产生分离。作者在三点概率空间上构造了显式最小反例:在凸紧不确定类与一致有界似然比条件下,存在单一分布对均匀最大化所有 Chernoff 泛函,却未能最小化某个凸 f-divergence。进一步证明在两点空间上此类分离不可能发生,并讨论了等价性的充分条件(如似然比的随机序)及矩锥几何中的开放刻画问题。对您研究假设检验与 minimax 理论的交叉可能有用。
  • 关键技术: Chernoff u-affinity, f-divergence, fractional-moment dominance, convex-order dominance, moment cone geometry, least favorable distributions
  • 为什么对您有用: 直接连接到 hypothesis testing 与 minimax 理论的交叉:本文用矩锥几何精确刻画了 Chernoff 最优与凸序最优之间的分离,这是鲁棒检验中 minimax 问题的结构性结果。您熟悉的 minimax bounds for estimation problems 与 nonparametric statistics 可直接用来审视该反例的紧性及充分条件的普适性。立即可做:用 very_familiar 的 minimax 工具验证三点空间反例的 minimax 性质,并探索该分离在高维或半参数模型中的延伸。

天体统计 (astrostats, 1 篇)

1. 2606.09974 — Flux-cube reconstruction from slitless spectroscopy

  • 作者: M. Griggio (Space Telescope Science Institute, Baltimore, MD, USA), R. E. Ryan Jr. (Space Telescope Science Institute, Baltimore, MD, USA), N. Pirzkal (Space Telescope Science Institute, Baltimore, MD, USA), T. L. Astraatmadja (Space Telescope Science Institute, Baltimore, MD, USA), S. Casertano (Space Telescope Science Institute, Baltimore, MD, USA), S. Perlmutter (E.O. Lawrence Berkeley National Laboratory, Berkeley, CA, USA, Department of Physics, University of California Berkeley, Berkeley, CA, USA), D. Rubin (Department of Physics and Astronomy, University of Hawai`i at M\=anoa, Honolulu, HI, E.O. Lawrence Berkeley National Laboratory, Berkeley, CA, USA), G. Aldering (E.O. Lawrence Berkeley National Laboratory, Berkeley, CA, USA), J. M. DerKacy (Space Telescope Science Institute, Baltimore, MD, USA), O. D. Fox (Space Telescope Science Institute, Baltimore, MD, USA), A. S. Fruchter (Space Telescope Science Institute, Baltimore, MD, USA), L. Galbany (Institute of Space Sciences, Institut d'Estudis Espacials de Catalunya), R. Hounsell (University of Maryland Baltimore County, Baltimore, MD, USA, NASA -- Goddard Space Flight Center, Greenbelt, MD, USA), A. M. Isaacs (School of Physics and Astronomy, University of Minnesota, Minneapolis, MN, USA), P. L. Kelly (School of Physics and Astronomy, University of Minnesota, Minneapolis, MN, USA), R. S. Kessler (Department of Physics, University of Chicago, Chicago, IL, USA, Fermi National Accelerator Laboratory, Batavia, IL, United States), B. M. Rose (Department of Physics and Astronomy, Baylor University, Waco, TX, USA), J. Roychowdhury (Department of Physics, Duke University, Durham, NC, USA), M. Sako (Department of Physics and Astronomy, University of Pennsylvania, Philadelphia, PA, USA), D. M. Scolnic (Department of Physics, Duke University, Durham, NC, USA), L. -G. Strolger (Space Telescope Science Institute, Baltimore, MD, USA), the Roman Supernova Cosmology Project Infrastructure Team
  • 机构: Space Telescope Science Institute · Lawrence Berkeley National Laboratory · University of California, Berkeley · University of Hawaiʻi at Mānoa · Institute of Space Sciences · Institut d'Estudis Espacials de Catalunya · Institute of Space Science - INFLPR Subsidiary · Goddard Space Flight Center 等
  • 分类: astro-ph.IM
  • 相关性 8/10 · novelty: application
  • 摘要: 本文解决无狭缝光谱数据中源混淆、高噪声和空间-光谱信息丢失的重建问题,目标是从多色散角二维观测重建三维通量立方体(flux-cube),无需红移或模板先验。核心方法是非参数、数据驱动的逐像素独立重建算法,利用多色散角信息解混叠,本质上是一个线性逆问题求解。在模拟 Roman Space Telescope 宽场无狭缝光谱图像上验证:多色散角重建的宿主星系模型可准确扣除宿主光,恢复 Ia 超新星光谱且偏差极小;对复杂星系可高保真重建通量立方体,成功测得红移并恢复连续谱与发射/吸收线。对您而言,这是天文数据处理中逆问题与非参数重建的典型案例,可作为 astrostats 入门阅读。
  • 关键技术: slitless spectroscopy reconstruction, multi-dispersion-angle deblending, non-parametric pixel-wise inversion, flux-cube estimation, host-galaxy subtraction, simulated Roman Space Telescope data
  • 为什么对您有用: 本文属于 astrostats gateway reading:数据结构(多色散角二维投影→三维通量立方体)和模型(逐像素线性逆问题、无模板先验)清晰,对统计学者友好,适合作为无狭缝光谱数据建模的入门。武器库中 inverse problems with random noise 可直接攻其重建算法的噪声与正则化分析;但本文侧重算法实现与模拟验证,统计理论深度有限,novelty 为 application 级。值得花时间读全文以了解天文数据侧,但不必期待方法学突破。

📌 中相关论文(按主题分组)

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)

1. 2606.10377 — Bidirectional Random Projections

  • 作者: Chao Lan, Luyuan Yang
  • 分类: math.ST · cs.LG · stat.TH
  • 相关性 7/10 · novelty: sharper_rate
  • 摘要: 在固定设计 OLS 回归设定下,本文分析双向随机投影(同时左乘 R∈ℝ^{n₁×n} 和右乘 W∈ℝ^{p×p₁})对 OLS 估计量 excess loss 的影响。核心 estimand 是基于压缩数据 (WXR, WY) 所得 OLS 估计量的期望 excess risk,并与单向投影 (XR, Y) 的已知界做对比。理论结果表明,双向与单向投影的 excess loss 差距近似为 O(p₁ + C/p₁),其中 C 与 n₁/n 成比例且在 n₁/n 较小时可为负值,意味着双向投影在特定维度比下反而更优。数值实验在真实数据上验证了该结论。对您可能有用:该工作将随机矩阵投影的 risk 分析从单向推广到双向,与您 high-dimensional asymptotics 和 RMT 的 primary interest 直接相关。
  • 关键技术: bidirectional random projection, expected excess loss bound, fixed-design OLS, random matrix theory, dimension reduction
  • 为什么对您有用: 本文直接连接到您 primary interest 中 high-dimensional statistics / Random matrix theory 子方向,分析双向投影下 OLS excess risk 的精确界。您武器库中 very_familiar 的 high-dimensional asymptotics 可直接用来审视其期望 excess loss bound 是否可改进为高概率界或 minimax rate;moderately_familiar 的 M-estimation theory 可用于将固定设计结论推广到随机设计或 semiparametric 设定。Follow-up 判断:立即可做——用您熟悉的 RMT 工具验证其界在 Marchenko-Pastur 极限下是否紧,并尝试给出高概率版本。

2. 2606.10377 — Bidirectional Random Projections

  • 作者: Chao Lan, Luyuan Yang
  • 分类: math.ST · cs.LG · stat.TH
  • 相关性 7/10 · novelty: minor
  • 摘要: 本文在固定设计下研究双向随机投影对 OLS 回归的影响,estimand 为 OLS 估计量的 excess risk。设定为样本 (X,Y) 同时被行投影 R∈ℝ^{n₁×n} 和列投影 W∈ℝ^{p×p₁} 压缩,目标估计量基于 (WXR, WY) 构建。核心结果是给出该估计量的 expected excess loss bound,并与单向行投影 (XR,Y) 的已知 bound 对比,gap 约为 O(p₁ + C/p₁),其中 C 依赖 n₁/n 且在 n₁/n 较小时可为负,意味着双向投影在某些参数区域反而优于单向投影。技术工具依赖随机投影的矩计算与期望损失展开。数值实验在真实数据上验证了理论预测的 gap 行为。对您研究高维统计与随机矩阵理论中投影降维的 risk bound 分析有直接参考价值。
  • 关键技术: bidirectional random projection, OLS excess risk bound, fixed-design regression, row and column random projection, expected loss analysis
  • 为什么对您有用: 本文直接涉及高维统计中的随机投影降维与 risk bound,属于您 primary interest 中 high-dimensional statistics / RMT 的投影估计量分析子方向。您武器库中 very_familiar 的高维渐近理论与 minimax bound 可直接用来审视本文的 expected excess loss bound 是否紧、是否可改进为高概率 bound 或 minimax rate。follow-up 判断:立即可做——用您熟悉的高维渐近工具验证并可能 sharpen 其 bound。

非参数 / 半参数 (nonparam_semipara, 7 篇)

1. 2606.10463 — Distributionally Robust PCA with Data-Adaptive Wasserstein Geometry

  • 作者: Chuang Xu, Andrew T. A. Wood, Yanrong Yang
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文在分布鲁棒优化框架下研究 PCA 子空间估计:目标是在经验测度的 Wasserstein 邻域内最小化最坏情形重构风险,其中邻域通过传输矩阵 G 刻画跨维度异质性不确定性;G 为标量×I 时退化为经典 PCA。通过对 minimax 优化问题的 dual characterization,作者提出可计算的 surrogate 目标——平方根经验重构误差加几何依赖的残差暴露惩罚项;exact 与 surrogate 估计量在 projector 层面渐近等价且一致收敛到总体 PCA 子空间。传输几何允许数据自适应,Wasserstein 半径通过 robust profile inference 校准为 n^{-1/2} 量级。主要理论结果包括 Grassmannian 局部渐近,其中显式出现由极限传输几何与校准水平决定的 Wasserstein 诱导漂移项。对您而言,该文的 minimax-over-ambiguity-set 思路与 Grassmannian 渐近工具可迁移到因果推断中分布偏移下的鲁棒 ATE 估计问题。
  • 关键技术: Wasserstein distributionally robust optimization, dual characterization of minimax problem, Grassmannian local asymptotics, robust Wasserstein profile inference, data-adaptive transport geometry, surrogate objective with residual exposure penalty
  • 为什么对您有用: 本文的 minimax-over-Wasserstein-ball 求解思路与 Grassmannian 渐近分析直接连接到您 primary interest 中的 minimax bounds 与 semiparametric theory 子方向;您 very_familiar 的 minimax estimation theory 可直接审视其 surrogate 与 exact 估计量的渐近等价性论证是否可推广到更一般的 M-estimation 场景。Follow-up 判断:中期可做——若想将 Wasserstein DRO + Grassmannian 渐近框架迁移到因果推断的分布偏移鲁棒估计,需先在 moderately_familiar 的 semiparametric theory 上补 Wasserstein DRO 的 dual 与 profile inference 机制(当前武器库缺这一块具体技术)。

2. 2606.11136 — Conformal Prediction for Dyadic Regression Under Complex Missingness

  • 作者: Robert Lunde, Minjie Yang, Elizaveta Levina, Ji Zhu
  • 分类: math.ST · stat.ME · stat.ML · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在二元回归设定下研究复杂缺失机制下的 conformal prediction 问题;estimand 为预测区间,关键假设包括联合可交换性(jointly exchangeable)和非参数 graphon 缺失模型。核心理论贡献:在比可交换性更弱的分布不变性条件下建立 conformal prediction 的超均匀性(super-uniformity),并通过新颖的双射论证处理样本为指标集随机子集的情形——现有理论未覆盖此设定。提出针对联合可交换数组的四种 conformal 程序(full / split / row-column / selective mask-conditional),并在非参数 graphon 缺失模型下建立 graphon-weighted conformal 的渐近有效性。首次在 MNAR(missing-not-at-random)假设下给出 weighted conformal prediction 渐近条件有效性的形式化证明,涵盖连续与离散响应。对您可能有用:MNAR 缺失下的条件有效性论证思路可迁移到因果推断中 selection bias / sensitivity analysis 的不确定性量化问题。
  • 关键技术: conformal prediction under distributional invariance, jointly exchangeable arrays, graphon-weighted conformal procedure, bijection argument for measure-preserving correspondence, mask-conditional validity, MNAR asymptotic conditional validity
  • 为什么对您有用: 连接到因果推断中 MNAR 缺失 / selection bias 子方向——paper 首次在 MNAR 下证明 weighted conformal 的渐近条件有效性,与 proximal CI 和 sensitivity analysis 中处理不可观测选择机制的结构相似。用 technical_arsenal 中 'minimax bounds for estimation problems'(very_familiar)可评估 graphon 估计误差对最终预测区间宽度的传导影响,或用 'semiparametric theory'(moderately_familiar)审视其 graphon 缺失模型的 identification 条件是否可进一步放松。Follow-up 粗判:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,将 graphon 缺失模型与 semiparametric efficiency bound 结合,审视 MNAR 下预测区间最优宽度。

3. 2606.10463 — Distributionally Robust PCA with Data-Adaptive Wasserstein Geometry

  • 作者: Chuang Xu, Andrew T. A. Wood, Yanrong Yang
  • 分类: math.ST · stat.ME · stat.TH
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文在分布鲁棒优化(DRO)框架下提出 Wasserstein 距离邻域内的主成分分析(PCA)方法,目标是在经验测度的 Wasserstein 球内最小化最坏情形重构风险。核心创新在于引入数据自适应的传输矩阵 G 来刻画不同维度上的异质性不确定性,当 G 为标量乘单位矩阵时退化为经典 PCA。通过对 minimax 优化问题的对偶刻画,作者提出可计算的代理目标函数:平方根经验重构误差加上几何依赖的残差暴露惩罚项。理论方面,证明了精确与代理估计量在 projector 层面渐近等价,且均对总体 PCA 子空间一致;Wasserstein 半径通过 robust Wasserstein profile inference 校准为 n^{-1/2} 量级,传输几何允许数据自适应。局部 Grassmann 渐近给出了由极限传输几何与校准水平决定的 Wasserstein 诱导漂移的显式表达。数值实验与真实数据表明,在结构化协变量偏移、中等污染及同分布设定下,该方法显著改善有限样本外样本表现。对您可能有用:Grassmann 渐近与 Wasserstein 诱导漂移的显式刻画,为半参数效率理论中研究鲁棒估计量的 influence function 提供了新视角。
  • 关键技术: Wasserstein distributionally robust optimization, dual characterization of minimax problem, Grassmannian asymptotics, robust Wasserstein profile inference, data-adaptive transport geometry, surrogate objective with residual exposure penalty
  • 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 子方向:Grassmann 渐近与 Wasserstein 诱导漂移的显式表达本质上是在刻画鲁棒估计量在子空间参数上的局部渐近行为,与 semiparametric efficiency bound / influence function 的思路相通。用您 very_familiar 的高维渐近理论可以直接分析其 Grassmann 渐近中的漂移项是否达到效率下界;用 moderately_familiar 的 M-estimation theory 可验证其代理目标的渐近等价性证明是否可推广到更一般的损失函数。立即可做:用高维渐近工具检查其 n^{-1/2} 校准与漂移项在随机矩阵极限下的行为。

4. 2606.11136 — Conformal Prediction for Dyadic Regression Under Complex Missingness

  • 作者: Robert Lunde, Minjie Yang, Elizaveta Levina, Ji Zhu
  • 分类: math.ST · stat.ME · stat.ML · stat.TH
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在二元回归设定下研究复杂缺失机制下的 conformal prediction 问题;estimand 为预测区间,关键假设包括联合可交换性(jointly exchangeable)和非参数 graphon 缺失模型。核心理论贡献:在比可交换性更弱的分布不变性条件下建立 conformal prediction 的超均匀性(super-uniformity),并通过新颖的双射论证处理样本为指标集随机子集的情形——现有理论未覆盖此设定。提出针对联合可交换数组的四种 conformal 程序(full / split / row-column / selective mask-conditional),并在非参数 graphon 缺失模型下建立 graphon-weighted conformal 的渐近有效性。首次在 MNAR(missing-not-at-random)假设下给出 weighted conformal prediction 渐近条件有效性的形式化证明,涵盖连续与离散响应。对您可能有用:MNAR 缺失下的条件有效性论证思路可迁移到因果推断中 selection bias / sensitivity analysis 的不确定性量化问题。
  • 关键技术: conformal prediction under distributional invariance, jointly exchangeable arrays, graphon-weighted conformal procedure, bijection argument for measure-preserving correspondence, mask-conditional validity, MNAR asymptotic conditional validity
  • 为什么对您有用: 连接到因果推断中 MNAR 缺失 / selection bias 子方向——paper 首次在 MNAR 下证明 weighted conformal 的渐近条件有效性,与 proximal CI 和 sensitivity analysis 中处理不可观测选择机制的结构相似。用 technical_arsenal 中 'minimax bounds for estimation problems'(very_familiar)可评估 graphon 估计误差对最终预测区间宽度的传导影响,或用 'semiparametric theory'(moderately_familiar)审视其 graphon 缺失模型的 identification 条件是否可进一步放松。Follow-up 粗判:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,将 graphon 缺失模型与 semiparametric efficiency bound 结合,审视 MNAR 下预测区间最优宽度。

5. 2606.10096 — Estimating the Wasserstein barycenter of one-dimensional distributions under sparse sampling

  • 作者: James Peng, Florian Stijven, Linbo Wang, Peter B. Gilbert
  • 分类: stat.ME
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在稀疏采样设定下(每个单元的真实分布仅通过少量i.i.d.样本观测),目标estimand是一维分布数据Wasserstein barycenter的quantile function——给定quantile level下单元级quantile的总体均值。朴素plug-in估计器(empirical Wasserstein barycenter)将经验分布视为真实分布,稀疏采样下偏差严重。本文提出marginal-constructed barycenter (MCB)估计器,绕过单元级分布与总体分布律的直接估计,转而刻画给定quantile level下潜在单元级quantile的分布;关键技术是证明该分布可由单元级CDF值的边际分布表示,后者通过binomial mixture方法估计,MCB取其均值。理论结果:MCB在给定条件下逐点一致且渐近正态;模拟显示稀疏采样下MCB显著优于empirical barycenter。应用:HVTN 502/503 HIV疫苗效力试验中汇总比较参与者内病毒序列特征分布。对您有用:binomial mixture的semiparametric估计策略与inverse problems with random noise有结构对应;渐近正态性结果可用semiparametric efficiency theory检验是否达到效率界。
  • 关键技术: Wasserstein barycenter, binomial mixture estimation, quantile function estimation, sparse sampling bias correction, pointwise asymptotic normality, marginal CDF distribution characterization
  • 为什么对您有用: 连接semiparametric theory子方向——binomial mixture估计边际CDF分布是典型semiparametric问题,MCB的渐近正态性涉及influence function推导;同时连接epidemiology子方向(HIV疫苗试验真实数据)。用moderately_familiar的semiparametric theory可检验MCB是否达到semiparametric efficiency bound,或用HOIF分析高阶修正能否进一步减偏;binomial mixture部分与very_familiar的inverse problems with random noise有结构对应。中期可做:需先在moderately_familiar的semiparametric theory上长肌肉(推导MCB的efficient influence function并检验效率界),但binomial mixture估计部分与现有武器库有直接接口。

6. 2606.10212 — Intrinsic Footpoint-invariant Riemannian Cross-covariance

  • 作者: Carlos Soto, Cheng Wang, Zipan Huang, Xiaoyu Chen
  • 分类: math.ST · stat.ML · stat.TH
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在 Riemannian 流形设定下,针对 SPD 矩阵与形状空间等非欧随机对象,传统协方差因曲率与基点依赖而失效,本文目标是构建内蕴且基点不变的 Riemannian 交叉协方差。核心机制是通过平行传输将切空间的局部变差映射至公共参考点,从而定义出不依赖坐标选择的二阶描述符(协方差与相关系数)。理论部分证明了该估计量继承了欧氏协方差的关键代数性质,并刻画了其渐近行为(如 CAN 性质)。数值实验在球面、SPD 流形及 Kendall 形状空间的心脏瓣膜真实数据上验证了估计量的有效性。本文为流形上的二阶学习提供了严格的渐近统计基础,对您在非参数估计理论方向有直接参考价值。
  • 关键技术: Riemannian manifold statistics, parallel transport, intrinsic cross-covariance, tangent space approximation, asymptotic normality, Kendall shape space
  • 为什么对您有用: 本文连接到非参数理论中流形上估计量的渐近性质这一子方向。您可用 very_familiar 的 minimax bounds for estimation problems 审视其声称的渐近性质是否达到最优速率,或用 moderately_familiar 的 M-estimation theory 探究其流形 M-估计的效率界。中期可做:需先在 moderately_familiar 的 M-estimation theory 上补充流形几何与局部切空间逼近的数学工具,才能深入其效率分析或拓展至流形上的高阶 U-statistic。

7. 2606.10212 — Intrinsic Footpoint-invariant Riemannian Cross-covariance

  • 作者: Carlos Soto, Cheng Wang, Zipan Huang, Xiaoyu Chen
  • 分类: math.ST · stat.ML · stat.TH
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在 Riemannian 流形设定下,针对 SPD 矩阵与形状空间等非欧随机对象,传统协方差因曲率与基点依赖而失效,本文目标是构建内蕴且基点不变的 Riemannian 交叉协方差。核心机制是通过平行传输将切空间的局部变差映射至公共参考点,从而定义出不依赖坐标选择的二阶描述符(协方差与相关系数)。理论部分证明了该估计量继承了欧氏协方差的关键代数性质,并刻画了其渐近行为(如 CAN 性质)。数值实验在球面、SPD 流形及 Kendall 形状空间的心脏瓣膜真实数据上验证了估计量的有效性。本文为流形上的二阶学习提供了严格的渐近统计基础,对您在非参数估计理论方向有直接参考价值。
  • 关键技术: Riemannian manifold statistics, parallel transport, intrinsic cross-covariance, tangent space approximation, asymptotic normality, Kendall shape space
  • 为什么对您有用: 本文连接到非参数理论中流形上估计量的渐近性质这一子方向。您可用 very_familiar 的 minimax bounds for estimation problems 审视其声称的渐近性质是否达到最优速率,或用 moderately_familiar 的 M-estimation theory 探究其流形 M-估计的效率界。中期可做:需先在 moderately_familiar 的 M-estimation theory 上补充流形几何与局部切空间逼近的数学工具,才能深入其效率分析或拓展至流形上的高阶 U-statistic。

统计计算 / 算法 (stat_computing, 2 篇)

1. 2606.10593 — Data compression for fast dimension reduction and clustering of high-dimensional discrete data

  • 作者: Silvia D'Angelo, Michael Fop
  • 分类: stat.ME · stat.CO
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文针对高维离散数据(binary / categorical / count)的聚类问题,提出一种确定性降维框架:通过 scaled positional encoding 定义加权求和,将每个观测压缩为低维连续表示。该映射具有 injective 性质,保证不同观测压缩后仍可区分;在温和正则条件下,压缩变量具有近似 Gaussian 表示,为模型聚类提供理论依据;同时证明聚类中心间距在压缩后得以保持,location-driven 结构可识别。模拟与实证(爱尔兰婴儿名记录、微生物组数据)显示聚类恢复精度好,且比常用降维+聚类流程有显著速度提升。对您而言,本文的确定性压缩映射与数值稳定性设计属于 statistical computing 方向的新算法贡献,但理论部分(injectivity + 近似正态 + 中心间距保持)偏 sanity-check 性质,未触及 minimax rate 或高维渐近理论。
  • 关键技术: scaled positional encoding, deterministic dimension reduction, injective mapping, approximate Gaussian representation, centroid separation preservation, model-based clustering
  • 为什么对您有用: 本文直接落在 statistical computing(数值方法与算法)这一 primary interest 上,提出了一种对离散数据数值稳定的确定性压缩方案。然而,理论保证(injectivity、近似正态、中心间距保持)属于较浅的 sanity-check 层面,未涉及 minimax bound 或 RMT 等研究者熟悉的深度理论工具;用 very_familiar 中的 minimax bounds 视角可以追问该压缩方案在更严苛高维设定下的信息损失下界,但这需要先在 moderately_familiar 的 M-estimation theory 上做延伸以建立更紧的 rate 结果。中期可做:若想深入,需先在 moderately_familiar 的 M-estimation theory 上长肌肉,才能给压缩映射的聚类误差建立 minimax-type 下界。

2. 2606.10559 — Deterministic Denominator Design for Localized Tamed Stochastic-Gradient Langevin Dynamics

  • 作者: Yiwei Zhou, Ziheng Chen
  • 分类: stat.ME · math.PR · stat.ML
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文研究 tamed stochastic-gradient Langevin dynamics (SGLD) 中确定性分母的设计问题。在 tamed SGLD 中,若分母使用与更新步相同的随机梯度样本,会改变条件均值漂移(mean-shift channel);本文提出在当前 oracle 样本抽取前固定状态依赖的包络函数作为确定性分母。设计流程:从 oracle score 构建低代价 proxy score → 用经验分位数选择激活阈值 → 加小校正层(calibration layer)。理论分析追踪三步误差传播:proxy 与阈值误差 → 包络误差 → 单步 SGLD 扰动 → 通过条件扰动桥(conditional perturbation bridge)给出平稳分布误差界。实验表明 proxy-quantile 分母接近 oracle score 行为,消除随机分母均值偏移,优于简单确定性 taming。对您可能有用:若关注采样算法的数值稳定性与误差传播分析,本文的 proxy-quantile 构造与条件扰动桥提供了一套可迁移的算法设计范式。
  • 关键技术: tamed SGLD, deterministic denominator design, proxy score construction, empirical quantile threshold, conditional perturbation bridge, calibration layer
  • 为什么对您有用: 本文属于统计计算中的 MCMC 采样算法设计,连接到 primary interest 的 statistical computing 子方向,但核心机器(Langevin dynamics、条件扰动桥、扩散逼近)不在武器库中。technical_arsenal 中的 software development 可用于实现该算法并复现实验,但理论分析所需的连续时间扩散过程与 perturbation bridge 工具需额外学习。中期可做:需先在 Langevin dynamics 理论与 Markov 过程平稳分布扰动分析上长肌肉,才能深入其误差传播框架;若仅关注算法实现与数值实验,则立即可做。

天体统计 (astrostats, 1 篇)

1. 2606.09938 — Commissioning of the Vera C. Rubin Observatory and Weak Gravitational Lensing

  • 作者: Pierre-Fran\c{c}ois L\'eget
  • 分类: astro-ph.IM · astro-ph.CO
  • 相关性 7/10 · novelty: survey
  • 摘要: 本文是 Vera C. Rubin Observatory 委员会进展报告,核心科学目标是利用弱引力透镜(cosmic shear)约束暗能量演化。LSSTCam 于 2025 年 4 月开始委员会,LSST 计划 2026 年启动;预计一年数据后 cosmic shear 精度可媲美 DESI,为暗能量是否随时间演化提供独立检验。作者强调 cosmic shear 对仪器系统误差(instrumental systematics)的控制要求极高,并概述了委员会阶段已取得的成功与正在解决的系统性问题。但作为 proceeding,本文未展开 PSF 估计、shear 校准、selection effects 等核心统计建模细节,也未给出 likelihood 或噪声模型的具体形式。对您而言,本文仅提供项目进展概览,不适合作为 astrostats 入门读物。
  • 关键技术: weak gravitational lensing, cosmic shear, instrumental systematics control, Dark Energy constraints, LSST commissioning
  • 为什么对您有用: (1) 本文属于 astrostats 方向,但仅是委员会进展报告,未展开 cosmic shear 的统计建模细节(PSF 重建、shear multiplicative/additive bias、selection effects),无法作为入门读物满足 gateway-reading 的可访问性与数据/模型清晰度要求;(2) 武器库中 inverse problems with random noise 与高维渐近理论可切入 weak lensing 系统误差分析,但本文技术密度不足以支撑具体问题发现;(3) 不值得花时间读全文——若想了解 cosmic shear 统计挑战,应转向 DES/KiDS 的 shear calibration methodology paper 或 LSST Science Book 数据分析章节。

经济理论 / 应用 (econ_theory, 1 篇)

1. 2606.11047 — Panel Data Estimation of Individual Demand in Markets with Many Consumers

  • 作者: Sarah Moon, Whitney K. Newey
  • 分类: econ.EM
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 本文研究在市场均衡价格存在联立性(simultaneity)的设定下,面板数据能否用于估计个体需求而非市场层面需求。考虑线性需求与随机系数需求模型,配合线性供给模型;关键假设是偏好随时间变化的异质成分与供给不可观测时变成分正交。核心发现:当每个市场消费者数量趋于无穷时,差分等常用面板方法的估计偏误消失,从而获得个体需求的一致估计;宏观效应可通过时间趋势或固定效应控制。理论贡献在于给出了大市场条件下面板估计偏误的渐近消失率与正交性条件,对您在因果推断中处理内生性(IV/联立性)与面板数据设定有直接参考价值。
  • 关键技术: panel data differencing, simultaneity bias, random coefficient demand model, large-market asymptotics, orthogonality condition
  • 为什么对您有用: 本文直接连接经济理论中的因果推断应用:在市场联立性设定下用面板方法做个体需求估计,偏误随消费者数增大而消失的结论为 IV/面板固定效应方法提供了新的理论正当性。用您 very_familiar 中的高维渐近理论可以分析其大市场偏误消失率的精确阶;若要深入随机系数模型的半参数效率界,则需在 moderately_familiar 的半参数理论/M-估计上长肌肉。判断:中期可做。

流行病学 (epidemiology, 1 篇)

1. 2606.10123 — Methods for adjusting for covariate measurement error in flexible modelling of functional form: results of a blinded, controlled neutral comparison simulation study

  • 作者: Mohammed Sedki (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Aris Perperoglou (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Anne C. M. Thi\'ebaut (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Steve Ferreira Guerra (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Paul Gustafson (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Frank E. Harrell Jr (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Willi Sauerbrei (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Michal Abrahamowicz (on behalf of the international STRengthening Analytical Thinking for Observational Studies), Laurence S. Freedman (on behalf of the international STRengthening Analytical Thinking for Observational Studies)
  • 机构: Centre d'études et de recherches internationales de Sciences Po
  • 分类: stat.ME
  • 相关性 7/10 · novelty: application
  • 摘要: 在流行病学协变量测量误差校正的非线性函数形式设定下,STRATOS倡议开展了一项盲法、多阶段中性比较模拟研究,评估6类校正方法(pointwise/系数SIMEX、贝叶斯、MI、RC)与4种灵活回归(B-splines、penalised splines、fractional polynomials、natural splines)的组合,共23种分析策略。模拟基于5种函数形式(J-shape、线性、两种阈值模型、饱和模型),覆盖不同样本量、重复子研究规模、误差量级与分布,采用经典加性误差与重复子研究校正设定。性能指标为暴露分布中央95%区间上估计函数的log MSE。Pointwise SIMEX整体最准确且最稳健;贝叶斯与RC配合PS/FP/NS表现次优;MI表现较差;无惩罚BS的贝叶斯估计最差。PS/FP/NS近似等价,BS一致劣于三者。无单一方法在所有场景占优,强调了敏感性分析的必要性。对您可能有用:测量误差校正+非线性函数估计的组合在proximal CI与semiparametric效率理论中有对应问题,但本文纯模拟比较无新理论贡献。
  • 关键技术: SIMEX (Simulation Extrapolation), Regression Calibration, Bayesian measurement error correction, Multiple Imputation for measurement error, penalised splines, fractional polynomials
  • 为什么对您有用: (1) 本文直接落在流行病学secondary interest,测量误差校正+非线性函数形式估计的组合与proximal CI中negative control的测量误差设定有概念联系;(2) 武器库中semiparametric theory与M-estimation theory可用来分析SIMEX/RC在非线性设定下的理论性质(本文未提供),这是一个可攻的口子;(3) 中期可做——需先在moderately_familiar的semiparametric theory上长肌肉,才能对SIMEX+penalised spline组合给出效率界或higher-order修正的理论分析;本文本身作为流行病学测量误差的gateway reading值得花时间读全文了解实际数据结构与模型设定。

其他 (other, 1 篇)

1. 2606.10563 — Predicting Current Outcomes From Historical Survey Data With Weighted Conformal Prediction

  • 作者: Chihoon Lee, Sungkyu Jung, Hyokyung G. Hong
  • 分类: stat.ME
  • 相关性 6/10

🗂 其他论文(仅 LLM 评分,未生成摘要)

未生成中文摘要的论文,按 LLM 评分由高到低排列,仅保留评分与简评,便于回溯查全。一般为相关性低于展示阈值者;个别历史页也含当时因单日摘要上限未展开的高分篇目(评分仍清楚标着)。

1. 2606.10866 — Adressing Separation: A Firth-corrected Joint Model for Longitudinal and Time-to-event Data with an Application on Dropout from Vocational Training

  • 作者: Sophie Potts, Viola Deutscher, Elisabeth Bergherr
  • 分类: stat.ME · stat.AP · stat.CO
  • 相关性 5/10 · novelty: minor
  • 评分理由: Joint longitudinal + time-to-event model touches longitudinal (primary interest keyword) but focuses on Firth correction for separation, not causal inference or semiparametric theory.

2. 2606.10712 — DIffuse X-ray Explorer (DIXE): Sky Survey Strategy and Collimator Response Demodulation

  • 作者: Jiejia Liu, Chunyang Jiang, Junjie Mao, Rui Huang, Ruixuan Tian, Wei Cui
  • 分类: astro-ph.IM · astro-ph.HE
  • 相关性 5/10 · novelty: application
  • 评分理由: Collimator response demodulation is an inverse problem (deconvolving coded-mask modulation to recover sky image), connecting to researcher's 'inverse problems with random noise' arsenal, but abstract does not detail the statistical methodology.

3. 2606.10409 — Robust Bayesian Predictive Model Selection using Bregman Divergence

  • 作者: Jongwoo Choi, Neil A. Spencer, Dipak K. Dey
  • 分类: stat.ME
  • 相关性 4/10
  • 评分理由: Bayesian model selection via Bregman scoring rules; adjacent to efficiency theory but primarily Bayesian predictive comparison, not a core match.

4. 2606.09933 — Patch-Level DINOv2 Scoring for Gravitational-Wave Glitch Detection: Breaking the Signal Dilution Barrier via Vector-Quantized Local Feature Indexing

  • 作者: Luca Cirfeta
  • 分类: astro-ph.IM · gr-qc
  • 相关性 4/10
  • 评分理由: Astrostats but poor gateway reading—ML-heavy ViT approach, inaccessible to outsider statistician, no clear data/model exposition.

5. 2606.10076 — Method to get Better Sky Maps in a GstLAL Low-Latency Analysis

  • 作者: Prathamesh Joshi, Becca Ewing, Chad Hanna, Zach Yarbrough, Jolien D. E. Creighton, Shomik Adhicary, Pratyusava Baral, Amanda Baylor, Kipp Cannon, Sarah Caudill, Michael W. Coughlin, Bryce Cousins, Heather Fong, Richard N. George, Shaon Ghosh, Patrick Godwin, Reiko Harada, Yun-Jing Huang, Rachael Huxford, James Kennington, Soichiro Kuwahara, Alvin K. Y. Li, Ryan Magee, Duncan Meacher, Cody Messick, Soichiro Morisaki, Debnandini Mukherjee, Wanting Niu, Alexander Pace, Cort Posnansky, Anarya Ray, Surabhi Sachdev, Shio Sakon, Stefano Schmidt, Urja Shah, Divya Singh, Ron Tapia, Leo Tsukada, Koh Ueno, Aaron Viets, Leslie Wade, Madeline Wade, Noah Zhang
  • 分类: astro-ph.IM · astro-ph.CO · gr-qc
  • 相关性 4/10
  • 评分理由: GW sky-map estimation is a statistical inference problem (parameter estimation from noisy strain data), but abstract is truncated and does not clearly articulate the statistical methodology or data/model structure.

6. 2606.10771 — On-sky demonstration of reinforcement learning for adaptive optics control

  • 作者: Jalo Nousiainen, Vincent Chambouleyron, Benoit Neichel, Sylvain Cetre, Jean-Francois Sauvage, Angelie Alagao, Markus Kasper, Jonathan Dray, Romain Fetick, Byron Engler
  • 分类: astro-ph.IM · cs.LG · cs.RO
  • 相关性 4/10
  • 评分理由: RL for adaptive optics control has a statistical computing angle (policy optimization under noise), but the paper is primarily an engineering on-sky demonstration, not a statistical methodology contribution.

7. 2606.11097 — A data-driven method for measuring corner-clipping probabilities in segmented particle detectors

  • 作者: Joaqu\'in de Jes\'us, Juan Manuel Figueira, Federico S\'anchez, Darko Veberi\v{c}
  • 分类: astro-ph.IM
  • 相关性 4/10
  • 评分理由: Data-driven method replacing Monte Carlo for estimating a detector bias probability has mild statistical-computing overlap, but the abstract is truncated, the problem is niche instrumentation physics, and it does not clearly meet the astrostats gateway criteria (accessibility, broader science question, full data/model exposition).

8. 2606.10224 — Spatial Prediction of Local Soil Erosion Distribution in the Wasserstein Space

  • 作者: Jiaming Qiu, Xiongtao Dai, Zhengyuan Zhu, Shuiqing Yin
  • 分类: stat.ME · stat.AP
  • 相关性 3/10
  • 评分理由: Applied soil-erosion spatial prediction in Wasserstein space; tangential domain-specific application.

9. 2606.10770 — Correcting Variable Importance Scored by Random Forests

  • 作者: Guancheng Zhou, Haiping Xu, Jason Liu, Donghui Yan
  • 分类: stat.ME · cs.LG
  • 相关性 3/10
  • 评分理由: RF variable importance correction is tangential to the researcher's causal inference and high-dim theory interests.

10. 2606.09906 — An information-geometric framework for mapping maximum potential biodiversity

  • 作者: Shinto Eguchi
  • 分类: stat.ME · q-bio.PE
  • 相关性 2/10
  • 评分理由: Biodiversity information-geometry paper; unrelated to primary/secondary interests.

11. 2606.10969 — A Functional Data Framework For Analyzing Shapes and Textures in Images

  • 作者: Issam-Ali Moindji\'e
  • 分类: stat.ME
  • 相关性 2/10
  • 评分理由: Functional data analysis for image shapes/textures is unrelated to the researcher's primary and secondary interests.

12. 2606.10108 — Exploring Exoplanets with Interferometry

  • 作者: Sascha P. Quanz, Bertrand Mennesson, Charles Beichman, Jonah T. Hansen, Felix A. Dannert, Andrea Fortier, Michael Ireland, Nicholas Beltsten, Eleonora Alei, Leonid Pogorelyuk, William O. Balmer, Denis Defr`ere, Gautam Vasisht, Malcolm Fridlund, Romain Laugier, Tiffany Kataria, Eugene Serabyn, Steve Ertel, H\'el`ene Rousseau, Kevin Wagner, Rhonda Morgan, Gerard T. van Belle, Gail H. Schaefer, Jean-Philippe Berger, Taro Matsuo, Ewan Douglas, John D. Monnier, Adrian M. Glauser, Dimitri Mawet, Michael R. Meyer
  • 分类: astro-ph.IM · astro-ph.EP · physics.ins-det
  • 相关性 2/10
  • 评分理由: Mission concept paper advocating interferometry for exoplanet characterization; no data-analysis or statistical methodology content, pure instrument/mission design.

13. 2606.10140 — Exploring the Orbital Stability of Large, Lightweight Mirrors around Exoplanets

  • 作者: Shauna M. Sallmen Eric J. Korpela
  • 分类: astro-ph.IM · astro-ph.EP · physics.pop-ph
  • 相关性 1/10
  • 评分理由: Orbital mechanics simulation of lightweight mirrors; physics/simulation paper with no statistical data-analysis or modeling angle.

14. 2606.10171 — The Case for High-Resolution Infrared Spectroscopy with the Habitable Worlds Observatory

  • 作者: Daniel Jaffe, Gregory Mace, Erica Sawczynec, Ueejeong Jeong, Caroline Morley
  • 分类: astro-ph.IM
  • 相关性 1/10
  • 评分理由: Instrument capability advocacy for high-resolution IR spectroscopy on HWO; no data side or statistical methodology exposition.

15. 2606.10750 — UnReal-B : Real-Space DFT Solver for Matter in Extreme Magnetic Fields

  • 作者: Bhalchandra S. Pujari, Andrey Tokarev, Dipanjan Mitra
  • 分类: astro-ph.IM · cond-mat.mtrl-sci
  • 相关性 1/10
  • 评分理由: Computational physics DFT solver for neutron star matter; no statistical content, pure numerical physics.

16. 2606.10760 — SUPPPPRESS: Prototyping and testing liquid-crystal vector vortex coronagraphs with reduced polarization leakage

  • 作者: Rico Landman, David Doelman, Jeroen Rietjens, Iva Laginja, Pierre Baudoz, Kristien Peeters, Chris van Dijk, Yuki Nishie, Yuta Watanabe, Alexander Eigenraam, Mario Vretenar, Joost van den Born, Rapha\"el Galicher, Johan Mazoyer, Axel Potier, Mariya Krasteva, Matteo Taccola, Felix Bettonvil, Frans Snik
  • 分类: astro-ph.IM · astro-ph.EP
  • 相关性 1/10
  • 评分理由: Optics/instrumentation paper on coronagraph polarization leakage; no data-analysis or statistical methodology.

17. 2606.11102 — The Ohio SETI Program -- The Last Decades

  • 作者: Abel M\'endez, Robert S. Dixon, Russell K. Childers
  • 分类: astro-ph.IM · physics.hist-ph · physics.ins-det
  • 相关性 1/10
  • 评分理由: Historical narrative about the Ohio SETI program; no statistical methodology, data-analysis question, or modeling content — purely tangential to all interests.

Maintained by 陈星宇 · Homepage · Source on GitHub

评论