JRSSB — Vol 87 Issue 1 · 2026-06-20¶
- 共 11 篇 · Journal of the Royal Statistical Society Series B
- 目录核对 ✅ 11 篇全部抓到(对照 OpenAlex 12 篇)
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
JRSSB Vol 87 Issue 1 的 11 篇论文总体上围绕四条主线展开:因果推断与识别(3 篇)、假设检验与信号选择(3 篇)、非参数与半参数方法(2 篇),以及高维随机矩阵、置信推断和网络比对各 1 篇。因果推断主线覆盖了异质性分析、剂量-反应曲线和连续时间生存分析;假设检验主线聚焦于子群选择、多重数据分割聚合和自适应分辨率 FDR 控制;非参数主线则涉及多元异方差经验贝叶斯和连续索引图模型;其余工作分别处理矩阵尖峰协方差模型、扩展置信推断和网络对齐。
因果推断主线中,三篇论文从不同角度推进非参数因果推断。A nonparametric framework for treatment effect modifier discovery in high dimensions 提出模型无关的 TEM-VIP 参数,并给出一步估计、估计方程和 TMLE 三类渐近线性估计量,适用于连续、二值及时间事件结局,在高维协变量中筛选治疗效应修正因子。Debiased inference for a covariate-adjusted regression function 构造去偏局部线性估计量,在避免欠平滑的同时允许数据自适应 nuisance 估计,得到剂量-反应曲线的逐点与均匀置信带。Graphical criteria for the identification of marginal causal effects in continuous-time survival and event-history analyses 利用局部独立性图提供非参数识别条件,通过逆概率加权估计干预治疗强度对结局的因果效应,明确删失过程的因果假设对识别的影响。
假设检验主线包含三项工作。Isotonic subgroup selection 在多元单调回归下提出基于 martingale 的多重检验程序,实现均匀 Type I 误差控制且功效达到 minimax 最优率,并扩展到异质性治疗效应设定。Rank-transformed subsampling: inference for multiple data splitting and exchangeable p-values 通过秩变换子采样聚合多次随机化检验结果,在温和正则性下恢复渐近精确第一类错误率,显著提升功效,应用包括交叉拟合 DML 置信区间校准。Catch me if you can: signal localization with knockoff e-values 结合 e 值和线性规划设计自适应分辨率多重比较过程,在条件独立性检验中严格控制 FDR,适用于高维变量选择和基因组研究。这三篇论文的方法均可直接或经适配后用于因果推断中的子群发现、分割样本稳定性以及变量选择。
其余方向中,Multivariate, heteroscedastic empirical Bayes via nonparametric maximum likelihood 将 NPMLE 扩展至多元异方差去噪,建立 Oracle 不等式和有限样本界,其经验贝叶斯后验均值对大规模多重比较具有潜在应用;Continuously indexed graphical models 将高斯过程视为不可数无限图,通过核插值方法恢复依赖结构,为准实验设计中的时空因果推断提供图模型工具。对因果推断研究者,优先阅读因果识别主线三篇、knockoff e-values(用于高维因果变量选择)以及 rank-transformed subsampling(用于 DML 推断校准)最为直接相关。
因果推断 (causal_inference, 3 篇)¶
1. 10.1093/jrsssb/qkae084 · arXiv — A nonparametric framework for treatment effect modifier discovery in high dimensions¶
- 作者: Philippe Boileau, Ning Leng, Nima S Hejazi, Mark van der Laan, Sandrine Dudoit
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: Harvard University · Cancer Research And Biostatistics · Statistical Service · University of California, Berkeley
- 分类: vol 87 · issue 1 · pp 157-185
- 相关性 9/10 · novelty:
new_method - 摘要: 该研究提出一个非参数框架,用于在高维协变量中发现治疗效应修正因子(TEM)。现有方法受限于低维、弱相关或参数假设,本文通过定义模型无关的TEM变量重要性参数(TEM-VIP)来解决这些局限。核心贡献是推导了一阶估计(one-step)、估计方程(estimating equation)和针对目标最大似然(TMLE)三类估计量,并建立了它们的渐近线性性质,包括影响函数和收敛速率。该方法适用于连续、二值及时间事件结局,模拟表明在适中样本量下渐近性质近似满足。实证部分应用于乳腺癌临床试验的基因表达数据,识别出的TEM与已知治疗抵抗机制一致。对您而言,该框架将因果推断中的异质性分析和高维变量选择有机结合,基于影响函数的估计策略可供您在proximal CI或IV设置中借鉴。
- 关键技术:
treatment effect modifier,variable importance parameter (TEM-VIP),targeted maximum likelihood estimation (TMLE),one-step estimation,asymptotic linearity,influence function - 为什么对您有用: (1) 直接对应您主兴趣中的因果推断异质性分析和 high-dimensional 统计,提出了可处理高维协变量的非参数 TEM 识别与估计框架。 (2) 从您 weapon arsenal 中的 very_familiar 项(high-dimensional asymptotics, nonparametric statistics)可切入评估其 minimax 最优性;moderately_familiar 项(semiparametric theory)恰好覆盖 TMLE 和 one-step 的影响函数推导,您可借此加深对 double/debiased ML 类方法的理解。 (3) follow-up 判断:中期可做——需要先在 semiparametric theory 上强化 TMLE 和 one-step 的 influence function 计算,之后就能将这一框架迁移至 proximal causal inference 或 mediation 设定中。
2. 10.1093/jrsssb/qkae041 · arXiv — Debiased inference for a covariate-adjusted regression function¶
- 作者: Kenta Takatsu, Ted Westling
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 33-55
- 相关性 9/10 · novelty:
new_method - 摘要: 本文研究协变量调整回归函数(covariate-adjusted regression function)的非参数推断问题,该参数刻画连续暴露与结局之间经协变量调整后的平均关联,在因果假设下对应因果剂量-反应曲线。作者提出一种去偏局部线性估计量(debiased local linear estimator),并证明其在逐点收敛到均值为零的正态极限分布。基于该结果构建渐近有效的逐点置信区间以及均匀置信带(利用经验过程上确界的近似分布)。该方法不需要欠平滑(undersmoothing),允许使用数据自适应(data-adaptive)估计量估计 nuisance 函数,且估计量达到了两阶可微回归函数的最优收敛速度。通过数值模拟和空气污染暴露对心血管死亡率影响的实际数据分析验证了方法的实用性能。该工作直接连接至因果推断中的连续暴露剂量-反应曲线估计,且去偏机器学习的理论框架对您熟悉的非参数统计和因果推断估计理论具有直接借鉴意义。
- 关键技术:
Debiased local linear estimator,Data-adaptive nuisance estimation,Uniform confidence bands via empirical process,Causal dose-response curve,Optimal convergence rate for twice differentiable functions,Pointwise asymptotic normality - 为什么对您有用: 该论文直接对应您的首要兴趣方向:因果推断中的连续暴露剂量-反应曲线识别与估计,属于去偏机器学习(debiased ML)在非参数因果参数上的最新应用。您非常熟悉的非参数统计和因果推断估计理论(very_familiar)可直接用于理解和评述该方法的最优收敛速率证明与均匀推断构造。结合您中等熟悉的半参数理论(moderately_familiar),可以进一步探索该去偏估计量的效率界是否紧以及是否可扩展至高维协变量或纵向设定。立即可做:通过已有武器即可复现其数值实验并尝试推广至工具变量或中介分析场景。
3. 10.1093/jrsssb/qkae056 · arXiv — Graphical criteria for the identification of marginal causal effects in continuous-time survival and event-history analyses¶
- 作者: Kjetil Røysland, Pål C Ryalen, Mari Nygård, Vanessa Didelez
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 74-97
- 相关性 8/10 · novelty:
new_method - 摘要: 本文研究连续时间生存分析与事件历史分析中边际因果效应的非参数识别问题。目标是在干预治疗过程强度(即 hypothetical intervention on the intensity)下,从观测数据中识别对结果事件(如死亡或发病)的因果效应。作者提出了基于动态图(local independence graphs)的图形准则,用以验证识别性;该准则刻画了通过适当重加权(类似逆概率加权)来估计因果效应的充分条件。与离散时间因果图不同,连续时间设定需定义因果语义于计数过程的局部独立性模型。该方法不依赖参数生存模型,属于非参数识别范畴。论文还强调,删失过程的因果假设(超出通常的独立删失)必须通过图形显式检验,这是现有文献常忽略的。最后,通过人类乳头瘤病毒(HPV)检测与宫颈癌筛查的实际数据示例,展示了图形假设的可视化及重加权累积发病率估计。对您而言,本文直接关联您因果推断中识别理论的核心兴趣,其图形准则为非参数识别假设提供了可操作工具,可与您熟悉的非参数统计与因果估计方法结合,用于连续时间纵向因果分析。
- 关键技术:
local independence graphs,nonparametric identification,inverse probability weighting,dynamic causal DAGs,counting processes,graphical criteria for censoring - 为什么对您有用: 连接至您主要兴趣中的因果推断方向(特别是连续时间非参数识别),论文的核心图形准则可视为您熟悉因果推断估计理论的一个应用场景——您可以用非参数统计武器库中的逆概率加权与累积发病率估计方法直接验证和复现其实证结果。立即可做:您已掌握的非参数因果推断工具足以理解并扩展该图形准则至更复杂设定(如时变混杂或高维协变量)。
高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶
1. 10.1093/jrsssb/qkae088 · arXiv — Mode-wise principal subspace pursuit and matrix spiked covariance model¶
- 作者: Runshi Tang, Ming Yuan, Anru R Zhang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 232-255
- 相关性 8/10 · novelty:
new_method - 摘要: 本文提出 Mode-wise Principal Subspace Pursuit (MOP-UP) 框架,用于提取矩阵数据中行和列方向上的隐藏变异。为支撑该框架,作者引入一类矩阵变量尖峰协方差模型(matrix spiked covariance model),将经典向量尖峰模型推广到矩阵情形。MOP-UP 包含两个步骤:平均子空间捕获(ASC)作为初始化,在无噪声下能达到精确恢复;交替投影步骤进一步优化子空间估计。理论方面,作者推导了 MOP-UP 的收敛性和非渐近误差界,其中核心工具是新提出的块状矩阵特征值扰动界(blockwise eigenvalue perturbation bound),该界在经典扰动界失效时仍有效。模拟和真实数据实验验证了方法的有效性。最后讨论该方法向高阶张量的推广。本文对高维统计中矩阵 PCA 的非渐近分析和随机矩阵理论中的特征值扰动问题有直接参考价值。
- 关键技术:
Spiked covariance model,Matrix PCA,Subspace pursuit,Average projection operator,Blockwise eigenvalue perturbation bound,Alternating projection - 为什么对您有用: 本文直接对应您 primary interest 中的高维统计(随机矩阵理论),具体涉及矩阵值尖峰协方差模型的特征值扰动和子空间恢复。您熟悉的 nonparametric statistics 和 high-dimensional asymptotics 工具(武器库中 very_familiar 项)可用于检验其非渐近界的紧性,或将其推广到更一般的噪声结构。此外,矩阵PCA的扰动分析是您中期的 moderate_familiar 项(如HOIF、半参理论)的一个良好测试床。总体上,该论文的数学框架适合您立即动手进行理论验证或扩展(立即可做)。
非参数 / 半参数 (nonparam_semipara, 2 篇)¶
1. 10.1093/jrsssb/qkae040 · arXiv — Multivariate, heteroscedastic empirical Bayes via nonparametric maximum likelihood¶
- 作者: Jake A Soloff, Adityanand Guntuboyina, Bodhisattva Sen
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 1-32
- 相关性 7/10 · novelty:
new_method - 摘要: 本文处理多元异方差误差下的大规模去噪问题,目标是在未知先验分布的情况下通过经验贝叶斯实现近乎最优的去噪。作者将经典的单变量高斯位置混合NPMLE扩展至多元异方差设定,通过求解无限维凸优化问题来估计任意先验,并证明该问题可被有限维近似有效求解。经验贝叶斯后验均值具有低遗憾性质,即与已知真实先验下的Oracle后验均值非常接近。文中建立了Oracle不等式,表明该估计器在无先验知识时能达到近乎最优(至多对数因子)的去噪性能。还给出了NPMLE估计边际密度的平均Hellinger精度的有限样本界,并展示了其在解卷积问题中的自适应性和近最优性。方法在天文学和社会科学等领域的实际数据上得到验证。对于您的非参数/半参数理论兴趣,本文在经验贝叶斯框架下提供了NPMLE的扩展和理论保证,与您熟悉的非参数统计和minimax界技术高度契合。
- 关键技术:
nonparametric maximum likelihood,empirical Bayes,oracle inequality,convex optimization,deconvolution,Hellinger distance - 为什么对您有用: 本文属于非参数/半参数理论方向,与您对非参方法的核心兴趣高度吻合。您熟悉的minimax bounds for estimation problems和nonparametric statistics可直接用于理解或改进文中Oracle不等式的紧性;其中涉及的凸优化和有限维近似也与您的统计计算兴趣相关。这是一篇立即可做级论文——您现有武器库中的非参工具和最小最大界技术足以支撑您快速跟进该方法在因果推断或高维设定中的变体。
2. 10.1093/jrsssb/qkae086 · arXiv — Continuously indexed graphical models¶
- 作者: Kartik G Waghmare, Victor M Panaretos
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 211-231
- 相关性 4/10 · novelty:
new_method - 摘要: 本文提出连续索引高斯过程(GPU∈U)可视为一种具有不可数无限图的图模型,该图的特征由协方差核的再生性质决定,而非传统图模型中逆协方差矩阵的零元。作者绕过直接估计逆协方差函数的困难,开发了一种基于核的plug-in方法,将图恢复问题转化为有限分辨率下的稠密子图选择,并证明了在正则性条件下的收敛速率与有限样本保证。关键技术包括再生核Hilbert空间(RKHS)理论、集中不等式以及谱截断分析。模拟与两个实际数据应用验证了方法的有效性。该工作为连续时空随机过程的依赖结构估计提供了新框架,与研究者熟悉的非参数统计与高维渐近理论高度契合,其plug-in估计量及收敛性证明可被视作经典图模型理论到函数型数据的推广。
- 关键技术:
Gaussian processes,graphical models,reproducing kernel Hilbert space,plug-in estimation,convergence rates,concentration inequalities - 为什么对您有用: 该论文直接切入您主兴趣中的非参数统计方向:将图模型推广到连续索引高斯过程,使用再生核方法与谱分析。您武器库中非常熟悉(very_familiar)的非参数统计和minimax界可直接用于检验其收敛率的最优性或改进有限样本界。立即可做:可利用您已有的高阶U-统计量计算经验探索其网络重建中稀疏性结构的算法成本。
数理统计 / 假设检验 (hypothesis_testing, 3 篇)¶
1. 10.1093/jrsssb/qkae083 · arXiv — Isotonic subgroup selection¶
- 作者: Manuel M Müller, Henry W J Reeve, Timothy I Cannings, Richard J Samworth
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 132-156
- 相关性 7/10 · novelty:
new_method - 摘要: 本文研究子群选择问题:给定协变量-响应样本,目标是识别回归函数超过预定阈值的协变量子集。在多元 isotonic 回归(单调性约束)框架下,作者提出一种基于 martingale 检验和多重检验程序的计算可行方法,用于检验逻辑结构化的假设。该方法提供了非渐近的、均匀的 Type I error 控制,并且其 power 达到 minimax 最优率(仅差多对数因子)。方法还被扩展到分类、分位数回归和异质性治疗效应设定。数值实验验证了实践效果,R 包 ISS 已发布。本文对您的假设检验兴趣直接相关,提供了非参数单调设定下 subgroup selection 的理论保证和计算工具,您可利用 minimax bound 的非参数工具评估其最优性。
- 关键技术:
martingale tests,multiple testing procedures,isotonic regression,minimax optimal rate,Type I error control - 为什么对您有用: 本文针对 subgroup selection 提出假设检验方法,直接连接到您的 hypothesis testing 兴趣。方法基于非参数 isotonic 回归和使用 martingale 构造检验,您非常熟悉的 nonparametric statistics 和 minimax bounds 可以用于验证其最优性,甚至推广到其他形状约束。这是立即可做的方向:您可以用最小最大界分析其 power 的紧性,或设计更一般的单调性检验。
2. 10.1093/jrsssb/qkae091 · arXiv — Rank-transformed subsampling: inference for multiple data splitting and exchangeable p-values¶
- 作者: F Richard Guo, Rajen D Shah
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 256-286
- 相关性 6/10 · novelty:
new_method - 摘要: 本文研究如何聚合多次随机化检验(如数据分割)的结果,以解决单次随机化检验结果不稳定且损失功效的问题。提出的秩变换子采样(rank-transformed subsampling)方法在温和正则性条件下,为组合后的检验统计量或p值提供大样本推断。该方法通过秩变换去除子采样在备择假设下的一阶偏差,从而显著提升功效,而传统p值聚合方法往往过于保守。应用场景涵盖高维单峰检验、参数分位回归拟合优度检验、序贯随机试验中的无直接效应检验,以及交叉拟合双机器学习(cross-fit DML)置信区间的校准。理论证明秩变换子采样可使第一类错误率渐近精确达到名义水平,且功效优于普通子采样。此法与假设检验方向紧密相关,特别是多重数据分割与可交换p值框架,并可应用于校准交叉拟合DML置信区间,连接因果推断中的效率理论。
- 关键技术:
rank-transformed subsampling,exchangeable p-values,multiple data splitting,double machine learning (cross-fit),subsampling bias correction - 为什么对您有用: 连接假设检验中的多重数据分割与p值聚合问题(主要兴趣-math stat/testing),以及交叉拟合DML置信区间校准(因果推断/efficiency theory)。武器库中very_familiar的非参统计与因果推断估计理论可立即上手该框架,用于改进U-统计量的检验稳定性(需先提升moderately_familiar的高阶U-统计理论)。中期可做:将秩变换子采样用于高阶U-统计量的假设检验,以解决多重分裂的不稳定性。
3. 10.1093/jrsssb/qkae042 · arXiv — Catch me if you can: signal localization with knockoff e-values¶
- 作者: Paula Gablenz, Chiara Sabatti
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 56-73
- 相关性 5/10 · novelty:
new_method - 摘要: 该论文考虑多重假设检验中不同分辨率假设的自适应选择问题,例如在基因组关联研究中同时检验单个变异和一组变异的关联。传统方法在自适应搜索时难以控制错误发现率(FDR)。作者提出利用 e-values 和线性规划设计一种新的多重比较过程,能够适应性地选择报告假设的分辨率,同时严格控制 FDR。该方法结合了 knockoffs 和 group knockoffs 框架,用于检验条件独立性假设,从而适用于高维变量选择场景。在 UK Biobank 数据上的应用展示了其有效性。论文提供了理论上的 FDR 控制保证,并给出算法实现。对您而言,这项研究直接关联到您对假设检验和高维统计的兴趣,特别是多重比较和 FDR 控制中 e-value 方法的新视角。
- 关键技术:
e-values,linear programming,knockoffs,group knockoffs,false discovery rate control,conditional independence testing - 为什么对您有用: 该论文直接关联您的核心兴趣之一——假设检验中的多重比较问题,并涉及高维统计中变量选择的 FDR 控制。您非常熟悉的 high-dimensional asymptotics 可用来分析 e-value 方法在相关变量结构下的行为,比如验证其理论保证的紧致性。此外,knockoff 方法在因果推断的变量选择中也有应用,可作为连接点。基于您对假设检验和高维渐近的熟练程度,这篇论文的方法和理论可以立即可做——理解算法并复现模拟对其并非难事,且能为后续研究 e-value 在其他设定下的推广奠定基础。
其他 (other, 2 篇)¶
1. 10.1093/jrsssb/qkae082 · arXiv — Extended fiducial inference: toward an automated process of statistical inference¶
- 作者: Faming Liang, Sehwan Kim, Yan Sun
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 98-131
- 相关性 4/10 · novelty:
new_method - 摘要: 本文提出扩展置信推断(EFI),旨在复兴 Fisher 的置信推断目标——基于观测推断参数不确定性。核心机制是:用随机梯度 MCMC 对观测中实现的随机误差进行联合填补,再用稀疏深度神经网络(DNN)估计逆函数;稀疏 DNN 估计的一致性保证观测不确定性通过逆函数正确传播至参数,从而验证下游推断。在参数估计上,EFI 对异常值具有更高鲁棒性;在假设检验上,无需理论参考分布即可自动生成推断,绕开了传统渐近分布推导。该方法还延伸至半监督学习框架。对您而言,EFI 的"无需参考分布的自动化检验"与假设检验兴趣有交集,但其核心依赖 DNN 逆映射与 SG-MCMC,属于计算驱动而非数学统计驱动的推断范式。
- ⚠️ 摘要不完整,待重跑(
python -m research_news.rerun) - 关键技术:
extended fiducial inference,stochastic gradient MCMC,sparse deep neural network,inverse function estimation,fiducial distribution,semisupervised learning - 为什么对您有用: 本文与您 hypothesis testing 子方向有交集:EFI 声称无需理论参考分布即可自动化检验,绕开渐近分布推导。然而,其核心机器是稀疏 DNN 逆映射与 SG-MCMC 填补,属于计算驱动范式,您武器库中的 minimax bounds / U-statistics / semiparametric efficiency 等数学统计工具难以直接切入其理论分析。暂不可做:若要审视 EFI 检验的频率覆盖或效率性质,需要先长肌肉于 DNN 非参数估计的一致性率与 MCMC 收敛分析(moderately_familiar 中无此项),且本文未提供与 semiparametric efficiency bound 的对比,理论锐度不足。
2. 10.1093/jrsssb/qkae085 · arXiv — Alignment and comparison of directed networks via transition couplings of random walks¶
- 作者: Bongsoo Yi, Kevin O’Connor, Kevin McGoff, Andrew B Nobel
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 1 · pp 186-210
- 相关性 3/10 · novelty:
new_method - 摘要: 本文提出一种基于最优传输的网络比对方法 NetOTC,用于对齐和比较两个有向/无向、加权/未加权且顶点集大小可能不同的网络。方法将网络视为随机游走的转移矩阵,通过寻找两个随机游走的转移耦合使期望成本最小化,最优成本量化网络差异,最优运输计划给出顶点和边的对齐。与仅匹配边际分布的方法不同,NetOTC 耦合整个随机游走过程,从而同时捕获网络的局部和全局信息并保持边结构。该方法无需自由参数,不依赖随机化,具有理论性质并展示了实证表现。对于非参数统计与高维分析方向的学者,该工作将图比较转化为随机过程耦合问题,可能为网络数据的因果推断(如干预传播)提供结构化对齐工具。
- 关键技术:
optimal transport,random walk coupling,transition coupling,network alignment,graph comparison,Markov chain coupling - 为什么对您有用: 本文聚焦网络比对这一方法学问题,虽不直接属于您的主要兴趣方向,但其将图差异度量化转化为随机游走耦合的最小成本问题,属于统计计算与图模型交叉领域的创新。您武器库中的 nonparametric statistics 和 high-dimensional asymptotics 可用于分析该方法的收敛性;follow-up 可考虑将 NetOTC 与网络因果推断中的转移系统建模结合,这需要先在 moderately_familiar 的 semiparametric theory 上建立网络数据的处理框架,属于中期可做的方向。
Maintained by 陈星宇 · Homepage · Source on GitHub