跳转至

JRSSB — Vol 86 Issue 2 · 2026-06-20

  • 共 10 篇 · Journal of the Royal Statistical Society Series B
  • 目录核对 ✅ 10 篇全部抓到(对照 OpenAlex 36 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期JRSSB 86(2)围绕因果推断、假设检验新框架、非参数与生成模型三条主线展开。因果推断方向有三篇:双负控制识别网络同伴效应、非代理干预定义路径效应、自适应bootstrap检验中介路径;假设检验方向同样有三篇:集成检验聚合弱检验(全局零假设)、Split Knockoff控制变换稀疏下的FDR、深度学习自动变点检测;非参数与生成模型方向有两篇:拟凸回归的最小二乘估计(形状约束)、去噪Markov模型统一连续与离散生成;此外还有一篇分层模式枚举器(空间填充设计)和一篇贝叶斯预测决策合成。

因果推断主线推进了三项不同切面的理论延展。第一篇利用双负控制变量(负控制结局与暴露)在proximal CI框架下非参数识别网络数据中的同伴效应,将negative-control思路从独立样本推广至ψ-网络依赖,并给出GMM估计量的一致性与渐近正态性。第二篇提出非代理干预(干预图的边而非节点)来定义路径特定因果效应,自然处理中间混杂且无需可干预性假设,并利用半参数效率理论构造高效非参数估计量(结合super learner),实现n-一致推断。第三篇针对中介分析中的复合零假设(无中介效应),设计自适应bootstrap过程调整抽样以控制第一类错误,显著提升检验功效,理论证明渐近I型错误控制。三篇从识别策略、效应定义到检验方法,覆盖了因果中介与网络效应的核心推断环节。

假设检验主线同样呈现三种不同路径。第一篇借鉴随机森林集成思想,提出聚合多个弱基检验的ensemble testing框架(用于全局零假设),在Bahadur效率下建立理论最优性,特别适用于全基因组测序中四类全局检验问题。第二篇针对变换稀疏参数(如TV、Fused LASSO)的选择问题,通过变量与数据双重拆分构造Split Knockoff,规避经典Knockoff所需的exchangeability,同时利用逆超鞅结构控制FDR。第三篇将离线变点检验中的CUSUM统计量重新表述为简单神经网络,再通过训练更宽网络自动学习检验统计量,在自相关或重尾噪声下显著优于传统方法,并提供误判率界。三篇分别应对缺乏一致最优检验的全局检验、结构化稀疏下的FDR控制、以及检验统计量的自动设计。

与因果推断方向最贴近的三篇(双负控制同伴效应、非代理干预中介、自适应bootstrap检验)可直接参考;若关注半参数效率理论,后两篇(高效估计与检验)值得优先阅读;假设检验方向中,Split Knockoff面向高维变换稀疏的FDR控制、集成检验面向复杂备择下的全局检验,对高维推断场景有直接价值。

因果推断 (causal_inference, 3 篇)

1. 10.1093/jrsssb/qkad132 · arXiv — Identification and estimation of causal peer effects using double negative controls for unmeasured network confounding

  • 作者: Naoki Egami, Eric J Tchetgen Tchetgen
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 487-511
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在观测网络数据中,因果同伴效应(peer effects)的识别与估计面临未测量网络混杂(如同质性偏倚与情境混杂)及网络依赖两大挑战。本文在 proximal CI 框架下,利用一对负控制结局与负控制暴露变量(double negative controls)非参数地识别因果同伴效应。作者提出广义矩估计(GMM)估计量,并在 ψ-网络依赖假设下证明了其一致性与渐近正态性,同时给出了稳健的一致方差估计量。该工作将 proximal causal inference 的 negative-control 思路从独立样本推广至网络依赖结构,对您在 proximal CI 与因果估计理论方向有直接参考价值。
  • 关键技术: proximal causal inference, double negative controls, peer effects identification, generalized method of moments, network dependence asymptotics, unmeasured network confounding
  • 为什么对您有用: 本文直接连接您 primary interest 中的 proximal CI 与因果估计理论,将 negative-control identification 从独立数据推广至网络依赖设定,填补了 proximal 框架在 network confounding 下的理论空白。您武器库中 very_familiar 的因果推断估计理论可直接审视其 GMM 估计量的效率性质(是否达到网络依赖下的 semiparametric efficiency bound),moderately_familiar 的 identification theory 可用来探讨其 double negative control 假设的脆弱性与替代识别策略。立即可做:用 very_familiar 的估计理论检查其 GMM 是否可改造成 one-step / DR 估计量以提升效率。

2. 10.1093/jrsssb/qkad130 · arXiv — Non-agency interventions for causal mediation in the presence of intermediate confounding

  • 作者: Iván Díaz
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 435-460
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文关注中介分析中由处理-中介交互和中介-结局混杂(中间混杂)导致的识别难题。传统方法需对图的节点施加干预,而本文提出一种新的干预类型——信息传递干预(干预图的边而非节点),用于定义路径特定因果效应。该干预无需假设非操纵性变量(如种族、基因)的可干预性,且能自然处理中间混杂,并证明其效应可分解为可识别路径成分。与基于随机化中介干预的机制检验不同,该方法能提供有效的统计检验。针对效应的协方差版本,作者利用半参数效率理论构造了一类高效非参数估计量,结合数据自适应回归(如 super learner),实现了 n-一致性和渐近正态性,无需参数模型假设。通过两个公开数据示例验证了方法的实用性。对您而言,该论文将中介分析与半参数效率前沿有机结合,可直接运用您熟知的非参数统计和因果推断估计技巧,并可进一步探索用高阶影响函数(HOIF)改进有限样本性能的潜力。
  • 关键技术: information transfer interventions, path-specific effects, efficient nonparametric estimation, semiparametric efficiency theory, data-adaptive regression, intermediate confounding
  • 为什么对您有用: 本文直接对应您primary interest中的causal inference(中介分析)和semiparametric efficiency theory。它提出了一种绕过中间混杂的新识别策略,并给出高效半参数估计量,其协方差版本效应可能引申出基于U-statistics的检验。由于您对HOIF(moderately_familiar)已有基础,这是一个中期可做的项目:先将一阶高效估计量推广到高阶,以改善有限样本性能,需要进一步熟悉HOIF具体构造技术。

3. 10.1093/jrsssb/qkad129 · arXiv — Adaptive bootstrap tests for composite null hypotheses in the mediation pathway analysis

  • 作者: Yinqiu He, Peter X K Song, Gongjun Xu
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 411-434
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文针对中介路径分析中的复合零假设检验问题,提出自适应自助(adaptive bootstrap)测试框架。传统乘积系数检验和联合显著性检验因复合零假设(即无中介效应)而过于保守、统计功效低下。该方法通过调整自助抽样过程,对复合零假设下的第一类错误进行有效控制,从而显著提升检验功效。理论方面证明了所提检验在复合零假设下的渐近第一类错误率控制,数值实验验证了其相比现有方法的优势。该方法直接服务于因果中介分析中暴露-中介-结果路径的推断,与您对因果推断中mediation和假设检验的兴趣高度契合,武器库中的估计理论(estimation theory in causal inference)可用于进一步分析该自助法的性质。立即可做:您可基于mediation分析的经验直接理解并复现该方法,并结合自己的高维U-统计量或敏感性分析思路拓展。
  • 关键技术: adaptive bootstrap testing, composite null hypothesis, product of coefficients test, joint significance test, mediation pathway analysis, type I error control
  • 为什么对您有用: 本文专注于因果推断中的mediation分析假设检验,您对causal inference(尤其mediation)和hypothesis testing均有直接兴趣。武器库中的estimation theory in causal inference及nonparametric statistics可帮助理解该自助法的理论基础,并可结合您的经验(如高维或敏感性分析)进一步改进。立即可做:方法可直接用于您的mediation应用或作为对照方法。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 10.1093/jrsssb/qkad133 · arXiv — Least squares estimation of a quasiconvex regression function

  • 作者: Somabha Mukherjee, Rohit K Patra, Andrew L Johnson, Hiroshi Morita
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: University of Florida
  • 分类: vol 86 · issue 2 · pp 512-534
  • 相关性 6/10 · novelty: new_theory
  • 摘要: 在多变量非参数回归设定下,目标是在误差仅需两阶矩且可依赖协变量的条件下,估计满足拟凸(及单调)形状约束的回归函数。作者证明了拟凸约束最小二乘估计量(LSE)的存在性,并将函数空间刻画为可通过混合整数二次规划(MIQP)求解的计算形式。理论方面,通过 sharp oracle inequality 给出有限样本风险界,允许误差条件方差与协变量相关且仅假设有限二阶矩。模拟与实证部分以日本胶合板生产函数和美国医院成本函数为例展示了估计量的优越表现。对您可能有用:该文的 sharp oracle inequality 与形状约束下的 minimax 界分析,可直接对接您熟悉的非参数 minimax bound 工具。
  • 关键技术: quasiconvex shape-constrained regression, mixed-integer quadratic programming (MIQP), sharp oracle inequality, finite sample risk bound, heteroskedastic error with two moments
  • 为什么对您有用: 本文连接到非参数理论中的形状约束估计子方向,其 sharp oracle inequality 提供了拟凸约束下风险界的精确刻画。您可用 very_familiar 的 minimax bounds for estimation problems 工具验证该 oracle inequality 是否紧贴 minimax rate,并探索拟凸约束类相较于凸约束类的 rate 变化。立即可做:用 minimax rate 分析直接评估其声称的 sharper rate 是否紧。

2. 10.1093/jrsssb/qkae005 · arXiv — From denoising diffusions to denoising Markov models

  • 作者: Joe Benton, Yuyang Shi, Valentin De Bortoli, George Deligiannidis, Arnaud Doucet
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 286-301
  • 相关性 3/10 · novelty: new_method
  • 摘要: 本文在连续状态空间扩散模型基础上,将去噪扩散生成模型推广至离散与一般状态空间,提出去噪 Markov 模型框架。核心 estimand 是逆向去噪过程的转移核,其依赖于对数密度导数(score)的估计;在非连续空间中,传统 score matching 不再适用,作者引入了基于 Fisher divergence 的原始 score matching 扩展。方法通过变分下界与 ELBO 推导出可计算的损失函数,并在先验-似然可采样但后验不可解的设定下,展示了近似后验模拟的应用。理论贡献在于统一了连续与离散去噪生成模型,并在多种数据类型上验证了生成与后验采样效果。对您可能有用:该框架将 score matching 从连续推广至离散,其 Fisher divergence 与变分推断的连接为 semiparametric 模型中的近似推断提供了新视角。
  • 关键技术: denoising Markov model, score matching extension, Fisher divergence, variational lower bound (ELBO), approximate posterior simulation
  • 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 中的 score matching 与 Fisher divergence 估计,以及 statistical computing 中的近似推断计算。您武器库中的 nonparametric statistics 与 minimax bounds 可用于分析离散空间下 Fisher divergence 估计量的收敛率与效率界,这是当前扩散模型文献中缺失的理论口子。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以建立离散 score matching 的 M-估计量渐近理论。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 10.1093/jrsssb/qkad131 · arXiv — Ensemble methods for testing a global null

  • 作者: Yaowu Liu, Zhonghua Liu, Xihong Lin
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Southwestern University of Finance and Economics · Columbia University · Harvard University
  • 分类: vol 86 · issue 2 · pp 461-486
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在全局零假设检验设定下,由于不存在一致最优势检验,研究如何利用先验/领域知识聚焦特定备择类以提升功效。本文借鉴随机森林的 ensemble 思想,提出聚合多个弱基检验的 ensemble testing 框架,以获得对全局零假设的稳健且强功效检验。将该框架应用于全基因组测序关联研究中的四类全局检验问题(针对不同备择类),分别为其构造具体 ensemble 检验并建立 Bahadur efficiency 下的理论最优性。模拟与真实 WGS 数据分析验证了 I 类错误控制与功效提升。对您有用:该框架为高维/复杂备择下的假设检验提供了类似 RF 的聚合机制与 Bahadur 效率理论,直接连接您对 hypothesis testing 与 minimax/efficiency 理论的兴趣。
  • 关键技术: global null testing, ensemble testing framework, random forest aggregation, Bahadur efficiency, whole-genome sequencing association tests, weak base tests aggregation
  • 为什么对您有用: 直接连接您 primary interest 中的 hypothesis testing 子方向,并在备择类最优性上使用了 Bahadur efficiency(与 minimax bound / efficiency theory 同属一脉)。用您 very_familiar 的 minimax bounds for estimation problems 视角,可以审视其 Bahadur efficiency 界是否紧、以及 ensemble 框架在更一般高维设定下的 minimax 飞跃是否可刻画。立即可做:用 minimax / efficiency 理论武器即可展开对其 Bahadur 最优性界与高维推广的分析。

2. 10.1093/jrsssb/qkad126 · arXiv — Controlling the false discovery rate in transformational sparsity: Split Knockoffs

  • 作者: Yang Cao, Xinwei Sun, Yuan Yao
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Hong Kong University of Science and Technology · Fudan University
  • 分类: vol 86 · issue 2 · pp 386-410
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在 transformational sparsity 设定下(参数本身不稀疏、但其线性变换稀疏,如 total variation / fused LASSO / trend filtering),目标是控制变量选择的 FDR。核心难点在于变换引入异质噪声,破坏了经典 Knockoff 所需的 exchangeability 条件。作者提出 Split Knockoff 方法:通过变量与数据双重拆分,将变换约束松弛为提升参数空间中的欧氏邻近约束,获得正交设计以构造正交 Split Knockoff;同时利用数据拆分构造新的逆超鞅结构,在无需 exchangeability 的条件下实现可证明的 FDR 控制且不牺牲 power。模拟与阿尔茨海默病结构 MRI 数据应用验证了方法的有效性。对您可能有用:该逆超鞅结构为高维假设检验中异质噪声下的 FDR 控制提供了新概率工具,且正交提升参数空间的构造思路可迁移至其他线性约束下的 inference 问题。
  • 关键技术: Split Knockoff construction, inverse supermartingale, variable and data splitting, transformational sparsity relaxation, FDR control under heterogeneous noise, orthogonal lifted parameter space
  • 为什么对您有用: 本文直接连接到 primary interest 中的 hypothesis testing(高维变量选择的 FDR 控制),其逆超鞅结构为异质噪声下 FDR 控制提供了新的概率工具。用 very_familiar 中的 high-dimensional asymptotics 与 minimax bounds 理论可以分析该 Split Knockoff 在不同 SNR / sparsity 下的 power 与 FDR 界的紧性,这是立即可做的 follow-up;若要进一步研究提升参数空间中正交设计的 semiparametric efficiency bound,则需在 moderately_familiar 的 semiparametric theory 上长肌肉。

3. 10.1093/jrsssb/qkae004 · arXiv — Automatic change-point detection in time series via deep learning

  • 作者: Jie Li, Paul Fearnhead, Piotr Fryzlewicz, Tengyao Wang
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 273-285
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在离线变点检测设定下,目标是自动生成针对不同数据行为与变点类型的检测方法,避免传统方法需针对特定噪声与变点假设手动设计的困境。核心机制是将许多现有变点存在性检验(如 CUSUM)重新表述为简单神经网络,从而通过训练更宽的神经网络来自动学习检验统计量。理论部分给出了该深度学习检测器的误判率界,并量化了其收敛性质与训练样本量的依赖关系。实证显示,在独立高斯噪声下该方法与 CUSUM 竞争力相当,而在自相关或重尾噪声下显著优于 CUSUM;加速度计数据的变点定位应用也表现良好。对您可能有用:该 paper 将经典检验统计量嵌入神经网络框架的思路,为非参数检验与假设检验的自动化设计提供了新视角。
  • 关键技术: offline change-point detection, neural network-based test statistic, CUSUM representation as neural network, error rate bound for trained classifier, heavy-tailed and auto-correlated noise, accelerometer data application
  • 为什么对您有用: 直接连接到 primary interest 中的 hypothesis testing 子方向,将经典 CUSUM 检验重构为神经网络并自动学习更优检验统计量的思路,为非参数/半参数检验的自动化设计提供了新范式。用 technical_arsenal 中 very_familiar 的 minimax bounds for estimation problems 与 moderately_familiar 的 M-estimation theory,可以分析其理论给出的误判率界是否紧、以及训练数据量与检测效率的 tradeoff。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格审视其神经网络检验统计量的 M-estimator 收敛性质与效率界。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1093/jrsssb/qkad125 — Stratification pattern enumerator and its applications

  • 作者: Ye Tian, Hongquan Xu
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Beijing University of Posts and Telecommunications · University of California, Los Angeles
  • 分类: vol 86 · issue 2 · pp 364-385
  • 相关性 2/10 · novelty: new_method
  • 摘要: 在计算机实验的空间填充设计设定下,目标是评估和排序一类设计(如基于正交阵列的拉丁超立方体和强正交阵列)的分层性质,关键假设是设计具有特定的组合结构。本文提出分层模式枚举器(stratification pattern enumerator)来刻画设计的分层性质,该枚举器计算简便且能高效排序设计。核心机制在于证明该枚举器是空间填充模式(space-filling pattern)的线性组合,据此开发出计算空间填充模式的高效算法,大幅降低了原先的计算瓶颈。此外,基于 Galois 域上的乘法表,建立了枚举器的下界并给出了达到下界的构造方法,所得设计在低维投影下具有优良的空间填充性质。对您可能有用:本文展示了组合数学与代数结构(Galois 域)如何用于破解统计计算中的组合爆炸问题,其算法优化思路对统计计算方向有参考价值。
  • 关键技术: space-filling pattern, stratification pattern enumerator, Galois field multiplication tables, orthogonal array-based Latin hypercube, minimum aberration criterion, combinatorial design construction
  • 为什么对您有用: 本文属于统计计算与实验设计交叉,核心贡献是利用代数结构(Galois 域)将组合搜索问题转化为线性组合计算,从而大幅降低计算复杂度,直接连接到您的 statistical computing 兴趣。您武器库中的 software development 和 computation of higher-order U-statistics(treewidth / tensor contraction)经验可以用来审视其算法复杂度优化是否可借鉴 tensor contraction 的图论视角做进一步加速。follow-up 粗判:中期可做——若想深入实验设计方向,需先在 moderately_familiar 的 M-estimation 或组合设计理论上长肌肉,但仅从算法优化角度阅读本文则立即可做。

其他 (other, 1 篇)

1. 10.1093/jrsssb/qkad109 · arXiv — Bayesian predictive decision synthesis

  • 作者: Emily Tallman, Mike West
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 2 · pp 340-363
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文在贝叶斯预测决策框架下研究模型不确定性问题,目标是在多候选模型集合中,将决策分析结果显式纳入模型评估、比较与组合的权重设定。核心方法 BPDS 建立在 Bayesian predictive synthesis 与经验目标导向模型分析之上,提出一种新的主观贝叶斯模型加权机制:权重不再仅依赖预测似然或边际似然,而是由决策损失函数(如投资组合收益或回归预测误差)驱动。理论贡献在于定义了决策导向的模型权重后验分布,并给出合成预测的更新规则;实证部分涵盖回归最优设计与金融时间序列预测的组合决策。对您而言,本文属于决策论与贝叶斯模型组合的交叉,与您关注的 semiparametric efficiency / debiased ML 等频率学派效率理论无直接交集,但决策加权思想可类比 DML 中的 loss-oriented aggregation。
  • 关键技术: Bayesian predictive synthesis, decision-analytic model weighting, subjective Bayesian model combination, predictive loss function, sequential portfolio optimization
  • 为什么对您有用: 本文连接的是贝叶斯模型组合与决策论,而非您 primary interest 中的频率学派效率理论或因果推断;其决策加权机制与 DML 的 orthogonal loss aggregation 有概念类比但技术路线完全不同。您武器库中的 semiparametric theory / M-estimation 无法直接攻入其主观贝叶斯框架,且缺乏 Bayesian predictive synthesis 的先验设定经验。中期可做:若想将决策损失驱动的模型加权引入频率学派框架(如用 influence function 定义 decision-oriented ensemble),需先在 moderately_familiar 的 M-estimation theory 上扩展决策损失下的效率界推导。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论