跳转至

JRSSB — Vol 86 Issue 5 · 2026-06-20

  • 共 14 篇 · Journal of the Royal Statistical Society Series B
  • 目录核对 ✅ 14 篇全部抓到(对照 OpenAlex 41 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期内容大致聚成四条主线:因果推断与敏感性分析(处理相依删失、未观测混杂与分配异质性)、高维推断与动态结构(张量因子模型、协方差修正的 debiased Lasso)、非参数与半参数方法(方向数据测度传输、极值几何、神经网络与森林融合、张量非参回归、分组数据 sandwich boosting),以及假设检验与计算推断(高维图模型 minimax 检测、e-value 安全检验、微分系统 Green's matching、球面随机投影)。

因果推断主线在本期推进了三个不同维度的识别与推断难题:在删失机制失效时,Proximal survival analysis 引入负对照与正交得分实现相依右删失下生存函数的非参数识别与双重稳健估计;在未观测混杂下,Model-assisted sensitivity analysis 在 marginal sensitivity model 内利用加权分位数回归给出更宽松的 ATE bounds 及双重稳健估计函数;在匹配设计下,Covariate-adaptive randomization inference 放弃均匀置换假设,改用倾向得分差异调整置换概率以实现异质性分配下的随机化推断。三者共同指向对传统核心假设(独立删失、无混杂、均匀分配)的放松与修正。

非参数与半参数主线展现了工具与结构的深度结合:针对方向数据与极值数据,Nonparametric measure-transportation 与 Statistical inference for multivariate extremes 分别借最优传输与几何渐近框架重构分位概念与极限集估计,突破了传统分布假设;针对回归结构,Neural networks meet random forests 与 Broadcasted nonparametric tensor regression 将局部适应性(森林)与结构化非线性引入非参估计并推导 minimax 界;针对半参数效率,Sandwich boosting 在部分线性模型下通过 sandwich loss 实现协方差误设时的局部最优权重估计,Green's matching 则利用 Green 函数逆化微分算子达到动态系统参数的半参有效估计。

与因果推断及半参数效率最贴的是 Proximal survival analysis、Model-assisted sensitivity analysis 与 Covariate-adaptive randomization inference,它们分别从代理变量识别、分位数 bound 与自适应置换切入因果假设的放松;与半参数效率及高维推断最贴的是 Sandwich boosting、Green's matching 与 Correlation adjusted debiased Lasso,它们分别在误设权重、轨迹逆化与协方差误差修正下追求局部最优或偏倚消除。

因果推断 (causal_inference, 3 篇)

1. 10.1093/jrsssb/qkae037 · arXiv — Proximal survival analysis to handle dependent right censoring

  • 作者: Andrew Ying
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1414-1434
  • 相关性 9/10 · novelty: new_method
  • 摘要: 本文在生存分析框架下处理相依右删失问题,目标是在删失时间与失效时间可能通过未观测预后变量相关时识别生存函数。传统条件独立删失假设在实践中常因协变量无法完全捕捉关联而失效,本文利用近端因果推断(proximal causal inference)的思想,将观测到的协变量视为潜在关联的不完美代理变量。通过引入负对照变量(negative control),建立了非参数识别框架,并提出了基于正交得分的自适应估计量,允许使用机器学习方法进行灵活估计。理论给出该估计量在交叉拟合下相合、渐近正态且双重稳健的充分条件,并推导了半参数效率界。模拟和SEER-Medicare数据应用验证了有限样本性能。本文直接连接您对近端因果推断(proximal CI)的理论兴趣,并提供了生存分析中处理删失的新非参数识别工具。
  • 关键技术: proximal causal inference, negative control variables, doubly robust estimation, cross-fitting, nonparametric identification, survival analysis with dependent censoring
  • 为什么对您有用: 本文直接拓展了您primary interest中“proximal causal inference”的识别方法到生存分析中的相依删失问题——这是近端框架在时间-事件结局上的新应用。您的武器库中“非参数统计”和“因果推断中的估计理论”可以直接用于验证其识别假设的合理性,而“半参数理论”和“M估计理论”可以深入分析其双重稳健估计量的邻域。从follow-up看,属中期可做:需先在moderately_familiar的“identification theory in causal inference”上进一步熟悉negative control在时间相依数据中的构造,然后即可探索改进效率或扩展至多时间点删失的情形。

2. 10.1093/jrsssb/qkae034 · arXiv — Model-assisted sensitivity analysis for treatment effects under unmeasured confounding via regularized calibrated estimation

  • 作者: Zhiqiang Tan
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1339-1363
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在 marginal sensitivity model 的未观测混杂设定下,本文研究 ATE 的 sensitivity analysis。首先给出 sharp population bounds 与 doubly robust estimating functions 的新表示,并基于 weighted linear outcome quantile regression 提出更宽松的 population bounds(若 quantile model 正确则退化为 sharp bounds)。样本层面,对 propensity score 与 outcome mean/quantile regression 引入 regularized calibrated estimation(Lasso 惩罚配合特定 loss function),获得对 PS 或 outcome mean model 混配具有 DR 性质的 point estimator,以及仅要求 PS model 正确即可保证覆盖的 model-assisted CI;若 outcome mean 为线性模型,CI 亦具 DR 性质。对您可能有用:本文将 calibrated estimation 与 Lasso 结合用于 sensitivity analysis 的 DR/MR 理论,为 proximal CI 或高维 mediation 的 sensitivity 提供了可借鉴的 regularized DR 框架。
  • 关键技术: marginal sensitivity model, doubly robust estimation, regularized calibrated estimation, Lasso penalty, outcome quantile regression, model-assisted confidence interval
  • 为什么对您有用: 直接连接 causal inference 的 sensitivity analysis 子方向,在 marginal sensitivity model 下给出 DR estimator 与 model-assisted CI 的完整理论。用您 very_familiar 的 M-estimation 与 high-dimensional asymptotics 视角可以审视其 Lasso calibrated loss 的收敛性质与 DR 条件是否紧;其 relaxed bounds 退化为 sharp bounds 的条件也可用 minimax bound 验证。立即可做:用 very_familiar 的 estimation theory in CI 与 software development 复现其 R 包 RCALsa 并在 proximal CI 设定下尝试移植其 regularized calibrated DR 框架。

3. 10.1093/jrsssb/qkae033 · arXiv — Covariate-adaptive randomization inference in matched designs

  • 作者: Samuel D Pimentel, Yaxuan Huang
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1312-1338
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在匹配观察性研究设定下,目标是 constant additive treatment effect 的随机化推断;传统方法假设匹配集内处理分配为均匀随机,忽略了由 propensity score 差异刻画的分配异质性。本文提出 covariate-adaptive randomization inference,通过修改置换概率使其随估计的 propensity score 差异变化,从而无需剔除匹配对或建模结果变量。理论上证明了当 propensity score 估计样本量充分大时,该检验的 type I error 可任意接近名义水平;并对 difference-in-means estimator 给出了大样本行为刻画。此外,现有 sensitivity analysis 方法可自然推广至该框架。实证部分通过焊工基因损伤与右心导管化数据验证了匹配与协变量自适应随机化的结合效果。对您可能有用:该工作将 propensity score 异质性引入 Fisher randomization inference,为匹配设计下的推断提供了更精细的分配机制建模。
  • 关键技术: covariate-adaptive randomization inference, matched observational study, propensity score discrepancy, Fisher randomization test, sensitivity analysis, difference-in-means estimator
  • 为什么对您有用: 本文直接连接到 causal inference 中匹配设计与 sensitivity analysis 的子方向,将 propensity score 异质性嵌入 Fisher randomization framework,是对传统 permutation inference 的精细化修正。从 technical_arsenal 看,您在 identification theory in causal inference (moderately_familiar) 上的积累足以理解其分配机制修改的逻辑,而 M-estimation theory (moderately_familiar) 可用于审视其 difference-in-means estimator 的大样本行为是否可推广至更一般的 estimand。Follow-up 判断:立即可做——用 very_familiar 的 minimax bounds 工具分析该 covariate-adaptive permutation test 在有限样本下的 power 性质,或探索该 modified permutation distribution 下 semiparametric efficiency bound 的变化。

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)

1. 10.1093/jrsssb/qkae036 · arXiv — CP factor model for dynamic tensors

  • 作者: Yuefeng Han, Dan Yang, Cun-Hui Zhang, Rong Chen
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1383-1413
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在高维动态张量时间序列设定下,本文提出基于 CANDECOMP/PARAFAC (CP) 分解形式的张量因子模型,目标是对非正交加载向量及一维潜在动态因子过程进行 identification 与估计。核心估计器为高阶投影估计器,融合了 CP 模型的特殊结构与 Tucker 分解中常用的 higher order orthogonal iteration (HOOI) 思想进行迭代投影降维。理论贡献在于给出了该估计器的统计误差界,证明了利用 CP 模型特有结构相较于一般 Tucker 型因子模型在收敛率上的显著优势。模拟与实证进一步验证了有限样本性质。对您有用:本文的高阶投影估计器与误差界分析直接触及 higher-order U-statistics / tensor contraction 的计算与理论,可作为张量因子模型这一新方向的入门参考。
  • 关键技术: CP tensor decomposition, higher order orthogonal iteration (HOOI), high-order projection estimator, tensor factor model, statistical error bounds, dynamic tensor time series
  • 为什么对您有用: 本文直接连接到 primary interest 中的高维统计与 higher-order U-statistics(张量收缩计算)子方向:CP 分解的高阶投影估计器本质上依赖多模态的 tensor contraction 与迭代投影,其误差界分析涉及高维随机矩阵与 empirical process 工具。您武器库中 very_familiar 的 tensor contraction / einsum 计算可直接用来分析该估计器的计算复杂度与 contraction-order 优化,moderately_familiar 的 higher-order U-statistics 理论可用来审视其投影步骤的统计效率是否达到 minimax 或 semiparametric efficiency bound。Follow-up 判断:立即可做——用 einsum / treewidth 视角重算其 HOOI 迭代的 contraction cost,并尝试用 minimax bound 验证其声称的 sharper rate 是否紧。

2. 10.1093/jrsssb/qkae035 — Spherical random projection

  • 作者: Seungwoo Kang, Hee-Seok Oh
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Seoul National University · New Generation University College
  • 分类: vol 86 · issue 5 · pp 1364-1382
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文针对高维球面数据(sphere-valued data)提出了一种非线性降维方法——球面随机投影(Spherical Random Projection, SRP),将原始球面上的数据随机映射到低维子球面(subsphere)上。核心理论性质包括期望保持(expectation preservation)与距离集中(distance concentration),并由此推导出球面随机投影下的 Johnson–Lindenstrauss (JL) 引理类比版本,给出了距离畸变的精确概率界。应用方面,作者将 SRP 用于球面数据的聚类模型选择,并通过模拟与真实数据验证了降维后聚类结构的有效保留。对您可能有用:本文将经典 JL 随机投影从欧氏空间推广至球面流形,其距离集中与 JL 类比的分析框架可迁移至您关注的非参数/半参数流形估计及高维统计中的随机矩阵理论设定。
  • 关键技术: spherical random projection, distance concentration, Johnson-Lindenstrauss lemma, subsphere mapping, clustering model selection
  • 为什么对您有用: 直接连接到您的高维统计与随机矩阵理论(RMT)子方向:SRP 是经典欧氏 JL 投影在球面流形上的非线性推广,其距离集中分析属于您 very_familiar 的高维渐近理论范畴。用您熟悉的 minimax bounds / high-dimensional asymptotics 工具,可以审视其 JL 类比界在更一般流形(如 Stiefel 流形、Grassmann 流形)上的紧性与可推广性——这是一个立即可做的 follow-up 方向。

非参数 / 半参数 (nonparam_semipara, 4 篇)

1. 10.1093/jrsssb/qkae027 · arXiv — Broadcasted nonparametric tensor regression

  • 作者: Ya Zhou, Raymond K W Wong, Kejun He
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1197-1220
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在高维张量回归设定下,目标 estimand 为非线性张量响应模型中的系数函数,允许张量协变量维度随样本量发散。核心机制是引入 broadcasting 操作,将单变量函数分配至张量协变量的所有元素,从而以非参数方式建模非线性;配合 penalized estimation 与相应算法实现估计。理论证明估计量达到 desirable convergence rate,并给出 minimax lower bound,确认估计量在广泛场景下的最优性。数值实验验证理论并显示优于线性张量回归。对您有用:broadcasting 结构下的 penalized 非参数估计与 minimax rate 分析直接对接 nonparametric theory 与 minimax bounds 兴趣,且张量计算视角可与 higher-order U-statistics 的 tensor contraction / einsum 工具链产生联系。
  • 关键技术: tensor regression, broadcasting operation, nonparametric penalized estimation, minimax lower bound, diverging dimensionality, tensor contraction
  • 为什么对您有用: 直接对接 primary interest 中的 nonparametric theory 与 minimax bounds:本文的 minimax lower bound 证明与收敛率分析可用您 very_familiar 的 minimax bounds 工具审视其紧性。张量 broadcasting 结构与 penalized 算法的计算复杂度,可用您 very_familiar 的 tensor contraction / einsum 视角分析其计算瓶颈与优化空间。follow-up 判断:立即可做——用 minimax bound 工具验证其 rate 是否紧,并用 einsum / treewidth 视角审视其算法的计算代价。

2. 10.1093/jrsssb/qkae038 — Neural networks meet random forests

  • 作者: Rui Qiu, Shuntuo Xu, Zhou Yu
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: East China Normal University
  • 分类: vol 86 · issue 5 · pp 1435-1454
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究非参数回归问题,提出一种将随机森林的局部适应性融入神经网络的集成估计器。该方法在经典经验风险最小化框架下,利用随机森林提供的局部邻域信息对神经网络进行局部增强,从而同时获得随机森林的局部适应能力和神经网络的全局逼近能力。通过U-process理论和精心设计的网络结构,建立了估计器的非渐近误差界,并进一步将收敛速度提升至接近minimax最优率。此外,随机森林辅助的梯度学习使得网络训练更易实现。模拟研究和真实数据应用证实了该方法相比于单一模型在预测精度上的提升。本文的非渐近分析和minimax速率结果直接对应您非常熟悉的非参数统计和minimax界限理论,其中U-process技术也与您擅长的更高阶U-统计量有共同的分析框架。
  • 关键技术: nonparametric regression, random forest local enhancement, U-process theory, empirical risk minimization, nonasymptotic error bound, nearly minimax rate, gradient learning
  • 为什么对您有用: 本文直接切入非参数回归的minimax理论,属于您首要兴趣中的非参数与半参数理论子方向。您武器库中非常熟悉的'nonparametric statistics'和'minimax bounds for estimation problems'可以立即用于理解文中的收敛速率证明,并评估其紧性。此外,文中U-process的分析技巧与您掌握的higher-order U-statistics在工具上有共通性,可视为立即可做的理论阅读——无需额外学习新工具即可吸收核心贡献。

3. 10.1093/jrsssb/qkae026 · arXiv — Nonparametric measure-transportation-based methods for directional data

  • 作者: M Hallin, H Liu, T Verdebout
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1172-1196
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在超球面(directional data)的非参数设定下,本文基于最优传输(optimal transport)定义了新的分布函数与分位函数概念,在旋转对称性(rotational symmetry)假设下给出了闭式表达,并构造了有意义的分位轮廓与区域。其经验分布函数满足经典的 Glivenko–Cantelli 性质,由此导出完全分布自由的秩与符号概念,以及数据驱动的经纬线系统。基于这些非参数工具,作者构造了具有普遍一致性的均匀性检验与方向性 MANOVA 检验,模拟中表现优于现有所有竞争方法,并以太阳黑子数据作为实证。对您有用:本文将 measure transportation 引入非参数方向数据,其分位/秩构造与 Glivenko–Cantelli 收敛分析可直接对接您熟悉的非参数统计与 minimax 理论工具箱。
  • 关键技术: optimal transport on hypersphere, rotational symmetry, Glivenko-Cantelli property, distribution-free ranks and signs, universally consistent uniformity test, directional MANOVA
  • 为什么对您有用: 本文直接连接非参数统计与 minimax 估计理论(very_familiar),其超球面最优传输分位构造为非参数秩检验提供了新框架。您可用 minimax bound 工具验证其均匀性/MANOVA 检验的 rate 是否达到最优,或用 higher-order U-statistics 视角分析其经验分布函数的高阶收敛(moderately_familiar)。follow-up 判断:立即可做——用 very_familiar 的非参数与 minimax 武器即可着手分析其检验的效率界与收敛率。

4. 10.1093/jrsssb/qkae030 · arXiv — Statistical inference for multivariate extremes via a geometric approach

  • 作者: Jennifer L Wadsworth, Ryan Campbell
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1243-1265
  • 相关性 2/10 · novelty: new_method
  • 摘要: 在多变量极值分析设定下,目标是估计 light-tailed margins 下 scaled sample clouds 的 limit set shape,以捕捉任意形式的 simultaneous 或 non-simultaneous 极值依赖结构。方法核心是先通过非参数/半参数预处理估计 limit set,再在此基础上进行参数化拟合,从而构建一类由极值渐近理论驱动的尾部统计模型。理论性质上,该估计方法继承了极值渐近几何框架的 probabilistic guarantee,并支持通过拟合模型模拟实现向分布更深尾部的外推概率估计。模拟与两个环境数据集的应用表明,该方法在现有方法难以估计的小概率区域具有更强的竞争力。对您可能有用:本文的半参数预处理+参数化精修的两步估计策略,以及基于几何结构约束模型外推的思路,与半参数效率理论中 sieve / profile likelihood 的两步估计范式有结构相似性。
  • 关键技术: multivariate extremes, limit set shape estimation, semi-parametric pre-processing, parametric tail model, tail extrapolation via simulation, scaled sample clouds
  • 为什么对您有用: 本文连接到非参数/半参数理论子方向:其两步估计(非参预处理+参数精修)与半参数 sieve M-estimation 的 profile 步骤结构相似,可思考其半参数步是否满足 nuisance rate condition 以保证第二步的 n^{-1/2}-CAN 性质。用您 very_familiar 的 minimax bounds 工具可分析其非参极限集估计的收敛率是否达到最优;若要严格推导其两步估计的 influence function 与 semiparametric efficiency bound,需先在 moderately_familiar 的 semiparametric theory 上长肌肉。属于中期可做。

效率理论 / Debiased ML (efficiency_dml, 2 篇)

1. 10.1093/jrsssb/qkae039 — Correlation adjusted debiased Lasso: debiasing the Lasso with inaccurate covariate model

  • 作者: Michael Celentano, Andrea Montanari
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: University of California, Berkeley · Stanford Medicine · Stanford University
  • 分类: vol 86 · issue 5 · pp 1455-1482
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在高维线性回归设定下,目标是估计低维参数并构造近似无偏估计量以进行统计推断。传统 debiasing 方法(如 desparsified Lasso)依赖对协方差结构的精确估计或稀疏精度矩阵假设,通过残差回归实现正交化;当协方差模型估计不准时,这些方法的偏倚校正失效。本文提出 correlation adjusted debiased Lasso,在协方差模型估计误差既不可忽略也不与目标变量正交的 regime 下,仍能近乎消除偏倚。核心机制在于修正估计误差引入的额外相关性,而非简单依赖正交性假设;理论分析基于高维渐近框架,给出偏倚校正的精确刻画。主要理论结果证明该方法在非精确协方差模型下仍可获得近似无偏估计,对您在 debiased ML / semiparametric efficiency 方向的研究有用,尤其是当 nuisance 估计不完美时的 robust inference 问题。
  • 关键技术: debiased Lasso, residual regression orthogonalization, high-dimensional asymptotics, precision matrix estimation, bias correction under inaccurate nuisance model
  • 为什么对您有用: 直接连接到 efficiency_dml 中 debiased ML 的 robustness 问题:当 nuisance(此处为协方差模型/精度矩阵)估计不准且误差非正交时,传统 orthogonal score / one-step debiasing 失效,本文给出修正方案。用您 very_familiar 的高维渐近工具可直接分析其偏倚界是否达到 semiparametric efficiency bound;用 moderately_familiar 的 M-estimation 理论可审视其正交化构造在更一般 semiparametric 模型下的推广潜力。立即可做:用高维渐近和 minimax bound 验证其声称的偏倚消除率是否紧,并探索该 correlation adjustment 在一般部分线性模型 debiased ML 中的迁移性。

2. 10.1093/jrsssb/qkae032 · arXiv — Sandwich boosting for accurate estimation in partially linear models for grouped data

  • 作者: Elliot H Young, Rajen D Shah
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1286-1311
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在分组数据(组内可能存在依赖)的半参数部分线性模型设定下,目标是线性参数的精确估计。传统方法用加权最小二乘,权重由随机效应模型或GEE的参数化协方差给出;本文提出“sandwich loss”,其总体最小化者在参数协方差模型正确时与最优权重一致,但在模型错误设定时可带来任意大的估计精度提升。在较温和条件下,利用用户自选回归方法估计 nuisance 函数,所得系数具有渐近正态性,并在给定权重函数类中达到方差最小(半参数效率界意义上的局部最优)。进一步,通过新的 gradient boosting 方案(“sandwich boosting”)最小化 sandwich loss,将权重函数类从参数模型扩展到灵活的 ML 形式。模拟与真实数据验证了 sandwich loss 与 sandwich boosting 的有效性。对您可能有用:该文在分组依赖结构下给出了半参数局部效率结果,且 boosting 方案实质上是 nuisance 的 cross-fitting 式迭代优化,直接连接到 efficiency theory 与 debiased ML 方向。
  • 关键技术: sandwich loss, partially linear model, semiparametric efficiency bound, gradient boosting for nuisance, weighted least squares, grouped data dependence
  • 为什么对您有用: 本文直接连接到 efficiency theory(半参数效率界)与 debiased ML 方向:在分组数据的部分线性模型中,通过 sandwich loss 实现局部最小方差估计,并用 boosting 灵活估计 nuisance,是 DML 思想在异方差/依赖结构下的具体推进。用您 very_familiar 的 minimax bounds 与 estimation theory in causal inference 可以审视其声称的局部效率界是否紧,以及 sandwich loss 在因果部分线性模型(如 IV/longitudinal)中的迁移潜力。立即可做:用 very_familiar 的半参数效率工具验证其效率界推导,并尝试将 sandwich boosting 移植到 proximal CI 或 longitudinal 因果设定中处理依赖 nuisance。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)

1. 10.1093/jrsssb/qkae029 — Minimax detection boundary and sharp optimal test for Gaussian graphical models

  • 作者: Yumou Qiu, Bin Guo
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Peking University · Southwestern University of Finance and Economics
  • 分类: vol 86 · issue 5 · pp 1221-1242
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 本文在 Gaussian 图模型框架下,研究精度矩阵(precision matrix)某子块的假设检验问题。目标是在高维稀疏设定下,推导出能够被检验出的最小信号强度(minimax detection boundary),即精确的检测阈值。作者提出一个自适应阈值检验(thresholding test),通过数据驱动选择阈值,能够在某些设定下达到该 minimax 边界。推导了阈值统计量的渐近零分布,并证明该检验对稀疏弱信号具有高功效,优于现有的 Lmax 和 L2 检验。模拟验证了精确的尺寸控制和功效优势,并在一项脑影像连接组学数据中展示了实用性。该工作连接了高维假设检验与 minimax 最优性理论,对您在高维统计和假设检验方向的研究具有直接参考价值。
  • 关键技术: minimax detection boundary, thresholding test, precision matrix, Gaussian graphical model, sparse weak signals, asymptotic distribution of thresholding statistic
  • 为什么对您有用: 直接对应您在高维统计和假设检验(primary interest)中的 minimax 边界研究——本文给出了精度矩阵检验的精确可检测阈值,而非仅渐近率。您技术库中的 'minimax bounds for estimation problems'(very_familiar)可立即用于验证其边界是否紧致,或拓展至其他协方差结构。判断:本文为立即可做——所用工具(高维渐近、minimax 界)均在您非常熟悉的范围内,可快速吸收并考虑推广至因果推断中的图模型检验。

2. 10.1093/jrsssb/qkae011 — Safe testing

  • 作者: Peter Grünwald, Rianne de Heide, Wouter Koolen
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Leiden University · Centrum Wiskunde & Informatica · Mathematical Institute of the Slovak Academy of Sciences · Vrije Universiteit Amsterdam · University of Twente
  • 分类: vol 86 · issue 5 · pp 1091-1128
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在 optional continuation(可选继续抽样)设定下,本文研究基于 e-value 的假设检验理论,目标是在依赖先前结果决定是否继续试验的场景下保持 type-I error 控制。核心机制是 e-value 作为非负随机变量在 null 下期望为 1,允许跨研究乘法合并且不破坏 error guarantee;作者提出 growth rate optimality (GRO) 作为 optional continuation 下 power 的类比,并证明 GRO e-variable 取特殊先验下的 Bayes factor 形式。对含 nuisance parameter 的复合 null/alternative,给出了 GRO 构造方法,并以 safe t-test 和 2×2 列联表为例展示。主要理论结果是 GRO e-value 的存在性与表征,统一了 Fisher、Neyman 与 Jeffreys-Bayesian 三派视角;对您可能有用的是,e-value 的乘法合并与 optional stopping/continuation 性质为 sequential/adaptive 试验的 hypothesis testing 提供了新框架,直接连接 mathematical statistics (hypothesis testing) 子方向。
  • 关键技术: e-value, optional continuation, growth rate optimality (GRO), Bayes factor with special priors, composite null with nuisance parameters, safe t-test
  • 为什么对您有用: 直接连接 mathematical statistics (hypothesis testing) 子方向,为 adaptive/sequential 试验提供 type-I error 安全的新检验范式。technical_arsenal 中 minimax bounds for estimation problems 与 M-estimation theory 可用于分析 GRO e-variable 在复合 null 下的 optimality 界与 nuisance parameter 处理的效率损失。follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以将 e-value 框架推广到 semiparametric null/alternative(含 infinite-dimensional nuisance)并刻画其 efficiency bound。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1093/jrsssb/qkae031 · arXiv — Green’s matching: an efficient approach to parameter estimation in complex dynamic systems

  • 作者: Jianbin Tan, Guoyu Zhang, Xueqin Wang, Hui Huang, Fang Yao
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 5 · pp 1266-1285
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文针对一般阶微分算子(如运动动力学)的参数估计问题,提出 Green's matching 方法,一种计算可处理且统计有效的两步法。第一步采用非参数光滑方法(如样条或核估计)近似解轨迹,不依赖于导数估计;第二步利用 Green 函数将微分算子逆化,构造基于轨迹误差的目标函数来估计参数。该方法避免了传统方法需数值微分或伴随方法的高计算代价,且理论上证明参数估计达到统计最优性(半参有效或最小二乘最优),优于现有方法。作者在一般阶 ODE 和 PDE 系统中展示了方法的有限样本表现,并与多种基准方法对比。本文连接了数值计算与统计效率理论,为复杂动态系统的推断提供了新框架。对于统计计算方向的研究者,本文演示了 Green 函数如何作为连接微分方程与统计估计的桥梁,可借鉴到因果推断中动态处理效应的建模。
  • 关键技术: Green's function, two-step estimation, differential operator inversion, sieve estimation, statistical efficiency, nonparametric trajectory smoothing
  • 为什么对您有用: 本文直接关联到统计计算(数值方法)与半参效率理论两个 primary interest。核心 two-step 框架与 double machine learning 异曲同工,且证明的参数估计最优性可为因果推断中的连续时间处理效应估计提供新工具。您武器库中 very_familiar 的 'inverse problems with random noise' 可直接用于分析 Green 函数逆算子的统计性质;同时,您 moderately_familiar 的 semiparametric theory 可被提升以理解其效率界。follow-up 粗判:立即可做——现有的非参估计与逆问题工具足以复现并扩展其方法到部分线性动态系统或高维微分方程。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论