跳转至

2026-05-12 每日 arXiv 资讯

  • 高相关论文 6 篇 · 中相关 6 篇 · 会议/Seminar 事件 0 条

⭐ 高相关论文(按主题分组)

因果推断 (causal_inference, 6 篇)

1. 2605.09849 — Proximal Causal Inference for Hidden Outcomes

  • 作者: Helen Guo, Ilya Shpitser, Elizabeth L. Ogburn
  • 相关性 10/10 · novelty: new_theory
  • 摘要: 在 proximal causal inference (PCI) 框架下,本文研究当结果变量完全不可观测时的因果效应识别与估计问题,利用特征值-特征向量结构重构潜在分布。首先在隐藏结果设定下证明了全数据律的非参数识别。随后基于影响函数(influence function)构建了因果效应的估计量,这是首个在不依赖无偏代理测量或部分观测条件下推导 IF 估计量的工作。该估计量具备多重稳健性(multiple robustness)和理想的渐近效率性质。仿真实验验证了方法在有限样本下的表现。对您有用:直接推进了您关注的 proximal CI 中的 identification 与 estimation 问题,并提供了基于 influence function 的效率理论新结果。
  • 关键技术: proximal causal inference, influence function, multiple robustness, eigenvalue decomposition, hidden outcomes, semiparametric efficiency
  • 为什么对您有用: 直接推进了您关注的 proximal CI 领域,在隐藏结果这一新设定下推导了 influence function 估计量并证明了多重稳健性与效率性质,对您研究 semiparametric efficiency bounds 和 proximal estimation 有直接参考价值。

2. 2605.09462 — Proximal Path-Specific Inference

  • 作者: Yang Bai, Sihan Wu, Baoluo Sun, Yifan Cui
  • 相关性 10/10 · novelty: new_theory
  • 摘要: 在存在 recanting witness(处理诱导的中介-结局混杂)及一般未观测混杂的设定下,本文研究路径特异性因果效应(path-specific effect)的非参数识别与估计。利用 proximal CI 框架中的代理变量和混杂桥函数(confounding bridge functions),提出了四种非参数识别策略。推导了该效应的 efficient influence function,并构建了具有四重稳健性(quadruply robust)与局部有效性的估计量。针对高维/非参数混杂参数,提出 proximal debiased machine learning (PDML) 方法,在机器学习收敛速率慢于 n^{-1/4} 时仍保证估计量具备 √n-相合性与渐近正态性。模拟与 CDC WONDER 出生数据的应用验证了方法的有效性。该文将 proximal CI 推广至多重中介的路径分析,对您在 proximal CI 与 mediation 交叉领域的研究具有直接参考价值,其四重稳健与 PDML 的结合也为 semiparametric efficiency 理论提供了新实例。
  • 关键技术: proximal causal inference, path-specific effect, confounding bridge function, efficient influence function, quadruply robust estimator, proximal debiased machine learning
  • 为什么对您有用: 直接推进了您 primary interest 中的 proximal CI 与 mediation 交叉方向;其推导的 EIF 与结合 debiased ML 的四重稳健理论,对您关注 semiparametric efficiency bounds 与 debiased ML 在复杂因果图下的应用极具参考价值,同时流行病学数据应用也契合您的 secondary interest。

3. 2605.09257 — Regularity, Phase Transitions, and Uniform Inference for Proximal Counterfactual Quantile Processes

  • 作者: Pengyun Wang
  • 相关性 10/10 · novelty: new_theory
  • 摘要: 在 proximal negative-control 框架下,本文研究反事实分布、分位数及下尾风险过程(continuum of thresholds y)的半参数推断,而非将每个阈值视为独立的 proximal 均值问题。对每个处理臂 a,反事实 CDF F_a(y) 由 primal bridge 方程 T_a h_{a,y}=g_{a,y} 与线性泛函 ℓ(h)=E{h(W,X)} 表示,对偶 bridge q_a 满足 E[1(A=a)q_a(Z,X)-1|W,X]=0。本文证明:对偶方程加上最小残差矩条件构成正则性精确边界——F_a(y) 路径可微当且仅当存在正则平方可积对偶 bridge,并给出 canonical gradient。通过奇异系统刻画得到 Picard 型相变:root-n 正则估计可行当且仅当 Σ(ℓ_{a,j}²/s_{a,j}²)<∞ 且残差矩有限;在此区域外,有限维效率界发散,Gaussian 逆基准给出更慢的 minimax rate。进一步建立 cross-fitted uniform doubly robust 展开、有限秩弱代理率条件、免密度同时分位数带(由 CDF 带反演)及 CVaR 推断,估计依赖 Tikhonov 正则化与保形等调投影。对您而言,该文将 proximal CI 的正则性理论推进到精确刻画(phase transition),直接连接您关注的 proximal CI 识别/估计与半参数效率界两个子方向,且 uniform DR 展开对纵向/多阈值场景有迁移价值。
  • 关键技术: proximal bridge equation, dual bridge regularity, Picard-type phase transition, canonical gradient / efficient influence function, cross-fitted uniform doubly robust expansion, Tikhonov regularization
  • 为什么对您有用: 直接推进 proximal CI 的半参数效率理论:给出路径可微的充要条件与 Picard 相变,连接您 primary interest 中的 proximal CI 与 semiparametric efficiency bounds;uniform DR 展开与分位数过程推断对 longitudinal / mediation 等多阈值场景可迁移。

4. 2605.10088 — Sample size and power calculations for causal inference with time-to-event outcomes

  • 作者: Chengxin Yang, Bo Liu, Fan Li
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在边际结构Cox比例风险模型下,目标estimand为marginal hazard ratio,采用IPW部分似然估计量,基于robust sandwich方差理论推导其渐近方差的解析形式。由此得到新的样本量公式,适用于任意预设效应量,对RCT仅需处理比例、效应量与事件率三个参数即可计算,修正了经典log-rank样本量公式的错误表征。对观察性研究,额外引入一个刻画组间协变量相似度的overlap coefficient即可;进一步提出适用于任意倾向得分平衡权重的方差膨胀方法,以校正基线方差。该工作对您在因果推断(IPW/倾向得分加权)与假设检验(功效与样本量计算)交叉领域的方法研究有直接参考价值,也为流行病学队列研究的生存分析因果推断提供了实用工具。
  • 关键技术: inverse probability weighted partial likelihood, robust sandwich variance, marginal structural Cox model, propensity score balancing weights, overlap coefficient, variance inflation factor
  • 为什么对您有用: 直接连接您primary interest中的因果推断(IPW、倾向得分加权)与假设检验(功效/样本量计算),同时为secondary interest中流行病学队列研究的生存分析因果推断提供了可迁移的样本量规划工具。

5. 2605.09264 — Nested Sensitivity Envelopes for Transported Quantile Treatment Effects

  • 作者: Pengyun Wang
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 在源研究存在未观测处理混杂且条件协变量下无法直接外推到目标人群的设定下,本文研究目标人群分位数处理效应(QTE)的敏感性分析;观测数据包含源样本(处理、结局、协变量)与目标样本(仅协变量)。作者施加两个边际敏感性约束:源处理分配的 odds-ratio 上界 Γ 与源-目标潜在结局分布漂移的条件似然比上界 Λ,对每个处理臂和阈值 y 推导出闭式 sharp 目标反事实 CDF 包络,该包络将源边际敏感性映射嵌套于目标结局漂移映射中,并在过程层面证明其 sharpness。半参数理论方面,在正则指标集上给出 canonical gradient(含观测性研究所需的源倾向得分贡献),构造 cross-fitted Neyman-orthogonal one-step 估计量并建立一致 Gauss 逼近;在含 active-set ties 或质量点的全指标集上,利用 Hadamard 方向可微性与 subsampling 进行有效推断。最后通过反转同时单调 CDF 带获得分位数与 QTE interval-hull 的诚实置信集,并将二维 (Γ,Λ) breakdown frontier 表述为 interval-hull 非拒绝的水平集推断。对您有用:该文将敏感性分析与 transportability 统一于半参数效率理论框架,canonical gradient 推导与 Neyman-orthogonal one-step 估计可直接迁移至您关注的 proximal CI 及纵向因果推断中的敏感性/外推问题。
  • 关键技术: marginal sensitivity model, odds-ratio confounding bound, likelihood-ratio transportability bound, canonical gradient, Neyman-orthogonal one-step estimator, Hadamard directional differentiability
  • 为什么对您有用: 直接推进您 primary interest 中的因果敏感性分析与半参数效率理论:将 odds-ratio 敏感性(源混杂)与似然比漂移(外推)嵌套,给出 sharp CDF 包络的闭式解与完整半参数推断(canonical gradient + cross-fitting + subsampling),方法框架可迁移至 proximal CI 与纵向设定下的敏感性分析。

6. 2605.09300 — Causal Stability Selection

  • 作者: Falco J. Bargagli-Stoffi, Omar Melikechi
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在标准因果识别假设与基础选择器正则条件下,本文研究条件平均处理效应(CATE)中效应修饰变量的选择问题。提出因果稳定性选择(Causal Stability Selection)算法,将交叉拟合的 CATE 估计与路径稳定性选择相结合,兼容任意处理效应估计器与基础选择器。该方法为选择集提供了非渐近的有限样本错误发现期望(EFP)上界,避免了数据自适应过程中的伪发现。理论证明,估计的选择概率以底层 CATE 估计器的收敛速度收敛至 oracle 概率,建立了处理效应估计与效应修饰变量发现的直接联系。实证部分在肿瘤学随机试验与母亲吸烟对婴儿出生体重的观察性数据中验证了方法。对您有用:该工作将有限样本错误控制与交叉拟合 CATE 结合,为高维因果异质性分析提供了严格的假设检验与变量选择视角。
  • 关键技术: causal stability selection, cross-fitted CATE estimation, stability selection, non-asymptotic error bound, effect modifier discovery
  • 为什么对您有用: 该论文将有限样本错误发现控制与交叉拟合 CATE 估计结合,直接契合您在因果推断(效应异质性/修饰变量)和假设检验(非渐近有限样本界)方面的核心兴趣,且观察性数据应用涉及流行病学队列。

📌 中相关论文(按主题分组)

因果推断 (causal_inference, 1 篇)

1. 2605.09741 — Adaptive discovery of effect modification in matched observational studies

  • 作者: Yu Gui, Dylan S Small, Zhimei Ren
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在匹配观察性研究中,目标是发现处理效应异质性(effect modification),即识别协变量定义的子群并应对未测量混杂。作者提出一种有限样本有效的子群选择程序,利用多重匹配对照(multiple matched controls)提升检验功效,并在子群水平上精确控制错误发现率(FDR)。该方法引入敏感性模型显式处理未测量混杂,确保在偏倚下的发现稳健性。模拟与大学教育经济回报的真实数据表明,该方法在FDR控制与功效上优于基线方法。该工作将因果敏感性分析与多重假设检验结合,直接契合您在因果推断(sensitivity analysis)和假设检验交叉方向的兴趣,且经济应用契合您的经济学次级兴趣。
  • 关键技术: effect modification, subgroup-level FDR control, sensitivity analysis for unmeasured confounding, matched observational studies, multiple hypothesis testing
  • 为什么对您有用: 将因果推断的敏感性分析与多重假设检验(FDR控制)结合,直接契合您在因果推断(sensitivity analysis)和假设检验交叉方向的兴趣,且经济回报的应用契合您的经济学次级兴趣。

非参数 / 半参数 (nonparam_semipara, 1 篇)

1. 2605.10406 — Multi-Fidelity Quantile Regression

  • 作者: Yixiang Liu, Yao Zhang
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在多保真度(multi-fidelity)设定下,针对高保真(HF)数据稀缺导致条件分位数估计困难的问题,本文提出一种两阶段模型无关的多保真度分位数回归方法。核心机制是局部分位数链接:将HF分位数表示为低保真(LF)分位数在协变量依赖水平上的函数,从而将估计目标转化为更平滑的水平函数;针对LF与HF分布形状差异较大的互补情形,引入校正步骤以提升鲁棒性。理论刻画了所提估计量比仅用HF数据的直接分位数回归收敛更快的条件,以及校正步骤带来进一步改进的时机;实验表明该方法能提供更准确的分位数估计和更紧的共形预测区间。对您有用:该文对非参数分位数估计收敛率的刻画直接契合您在半参数/非参数理论方面的兴趣,其多保真度框架也可迁移至流行病学或天体统计中昂贵观测与廉价代理数据结合的估计场景。
  • 关键技术: multi-fidelity quantile regression, local quantile link, nonparametric convergence rate, covariate-dependent level function, conformal prediction
  • 为什么对您有用: 直接契合您在半参数/非参数理论方面的兴趣(收敛率刻画),且多保真度框架可迁移至流行病学或天体统计中昂贵观测与代理数据结合的估计问题。

数理统计 / 假设检验 (hypothesis_testing, 4 篇)

1. 2605.09953 — Generalized Boundary FDR Control under Arbitrary Dependence: An Approach on Closure Principle

  • 作者: Yifan Zhang, Wentao Zhang, Changliang Zou, Haojie Ren
  • 相关性 7/10 · novelty: weaker_assumption
  • 摘要: 在多重检验框架下,传统 FDR 无法保证拒绝域边界处(最不显著)发现的可靠性,本文旨在任意依赖结构下控制广义边界错误发现率($k$-bFDR)。作者首先提出 $k$-bFDR 概念以控制最不显著的 $k$ 个发现的错误概率,并系统梳理其与传统 FDR 指标的理论联系;随后基于闭包原则(closure principle)构建了 Domino 统一框架,在任意依赖假设下保证 $k$-bFDR 的严格控制,且同时适用于 p-value 和 e-value。理论证明了 Domino 算法的有效性,数值实验与实际数据分析表明该方法在维持严格 $k$-bFDR 控制的同时能识别更可信的边界发现。该工作将多重检验的依赖假设从独立放松至任意依赖,直接推进了您关注的数学统计假设检验方向,且对高维统计推断中边界发现的可靠性控制具有重要价值。
  • 关键技术: multiple testing, boundary FDR (bFDR), closure principle, arbitrary dependence, e-values
  • 为什么对您有用: 直接推进您 primary interest 中的数学统计假设检验方向;通过闭包原则将多重检验的依赖假设从独立放松至任意依赖,对高维统计推断中边界发现的可靠性控制具有理论与应用价值。

2. 2605.12089 — Power Studies For Two-Sample and Goodness-of-Fit Methods For Multivariate Data

  • 作者: Wolfgang Rolke
  • 相关性 6/10 · novelty: application
  • 摘要: 在多元数据设定下,本研究比较了多种非参数两样本检验和拟合优度检验的检验功效,涵盖二维连续/离散数据及高维连续数据情形。基于大规模模拟实验评估不同检验方法的功效表现,发现无单一方法在所有零假设与备择假设组合下均占优。据此提出一个精简的方法组合,确保在所研究的案例中至少有一种方法具备良好功效。研究基于R包MD2sample和MDgof实现,提供了多元非参数检验功效的实证基准。该工作为方法学novelty较低的模拟应用研究,但对您在假设检验方向的模拟实验设计与计算工具有直接参考价值。
  • 关键技术: multivariate goodness-of-fit test, non-parametric two-sample test, power comparison, Monte Carlo simulation, R package MD2sample
  • 为什么对您有用: 直接关联您在假设检验方向的兴趣,提供多元非参数检验功效的实证基准与R计算工具,可作为模拟实验设计的参考。

3. 2605.09525 — Simultaneous false discovery rate control in location families

  • 作者: Zijun Gao, Wenjie Hu, Qingyuan Zhao
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 在 location family 的多重假设检验设定下,本文研究如何不仅对零假设,也对实际不显著的参数值控制错误发现率(FDR)。作者将 FDR 定义为关于位置参数的曲线,并提出 BH 过程的简单推广,使其在任意用户指定水平下控制该 FDR 曲线。核心理论结果表明,标准的 Benjamini-Hochberg (BH) 过程在控制零假设处 FDR 的同时,也自动实现了对整条 FDR 曲线的同时控制。数值模拟验证了理论结果并探讨了实际应用中的考量。该结论为多重检验中区分“统计显著”与“实际显著”提供了严格的理论支撑。对您有用:直接推进您在“数学统计(假设检验)”方向的兴趣,为 BH 过程在 location family 下的稳健性提供了更锐利的理论保证。
  • 关键技术: Benjamini-Hochberg procedure, False Discovery Rate curve, location families, simultaneous FDR control, multiple hypothesis testing
  • 为什么对您有用: 直接推进您在“数学统计(假设检验)”方向的兴趣,为 BH 过程在 location family 下区分统计显著与实际显著提供了更锐利的理论保证。

4. 2605.12103 — Informative Simultaneous Confidence Intervals for Graphical Group Sequential Test Procedures

  • 作者: Liane Kluge, Werner Brannath
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在成组序贯临床试验的多重假设检验设定下,研究如何在控制 family-wise error rate (FWER) 的前提下构建图形化检验程序及相应的同步置信区间。针对现有 Bonferroni-closure 类图形化序贯检验在利用先前阶段证据时策略不一致的问题,提出一种新检验策略:仅使用当前阶段的 repeated p-value 作为证据,同时利用先前阶段的证据来提升显著性水平,从而获得比现有方法更高的检验功效。针对传统兼容同步置信区间往往无法提供处理效应额外信息的缺点,将单阶段图形化检验的 informative simultaneous confidence intervals 推广至成组序贯试验。通过引入迭代算法计算 informative bounds,并扩展了评估数值计算边界精度的准则;所得边界相比原始检验仅有微小功效损失,且可在每阶段后计算,提供 median-conservative 的处理效应估计。对您研究多重假设检验的 FWER 控制策略和数值迭代算法计算置信界有直接参考价值。
  • 关键技术: graphical group sequential test, Bonferroni-closure test, family-wise error rate control, repeated p-value, informative simultaneous confidence intervals, iterative algorithm
  • 为什么对您有用: 涉及多重假设检验的 FWER 控制与数值迭代算法,与您 primary interest 中的 hypothesis testing 和 statistical computing 有方法学重叠,可借鉴其序贯设计下的置信界构造与数值精度评估思路。

Maintained by 陈星宇 · Homepage · Source on GitHub