JRSSB — Vol 86 Issue 1 · 2026-06-20¶

共 8 篇 · Journal of the Royal Statistical Society Series B
目录核对 ⚠️ 疑似漏 1 篇（对照 OpenAlex 26 篇）：10.1093/jrsssb/qkad009

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期论文聚焦于三大主线：假设检验与模型诊断的校准改进（含GRASP、去随机化knockoffs、带宽自由检验、网络SBM拟合优度及贝叶斯HPC）、因果推断在复杂时空结构下的识别与推断（动态SCM），以及估计与计算中的偏差校正（降偏M估计、空间置信区域）。整体呈现出强烈的“校准”导向——多篇论文致力于解决原有方法因数据复用、随机性或维度依赖导致的检验失真或估计偏差问题。

在假设检验与模型诊断主线中，本期集中推进了检验的有限样本校准与去随机化。针对原方法的双重数据使用或随机性干扰，多篇论文引入新机制重构p-value或e-value：贝叶斯HPC通过样本分裂隔离训练与评估以修正PPC的校准失效；去随机化knockoffs揭示knockoffs本质为e-BH过程，通过聚合多次生成的e-values消除变量选择的随机性并保证FDR控制；带宽自由检验则用样本分裂结合自标准化（SS-SN），将高维参数化为一维子问题以规避维度与时序依赖带来的尺寸扭曲。在非参与潜变量检验方面，GRASP对黑箱分类器构建容忍假设框架，利用随机化与得分实现分布自由的有限样本检验；网络SBM拟合优度检验则将潜变量估计与log-linear模型的Markov基结合，绕过块分配的不可识别性完成Monte Carlo检验。

在因果推断与估计主线中，本期关注时序依赖下的因果识别与通用降偏计算。动态SCM针对自回归过程中的时变混杂与空间依赖，以经验似然构造权重保证唯一解，通过动态匹配扩大可行集并开发标准化安慰剂检验克服对称性缺陷；降偏M估计则提供通用框架，利用估计函数导数的经验近似与自动微分实现偏差校正，并指出降偏惩罚目标函数与AIC的联系。此外，空间置信区域利用高斯随机场渐近分布与随机集inclusion原理，在未知场依赖结构下构造excursion set逻辑组合的置信子/超集。

对因果推断方向，动态SCM的经验似然加权与动态匹配机制最贴切，可直接迁移至面板因果识别理论；对高维变量选择方向，去随机化knockoffs的e-value聚合机制是解决选择随机性的核心推进；对半参数/非参检验方向，GRASP的容忍假设与分布自由有限样本检验、以及带宽自由检验的SS-SN维度化解策略，适合优先关注。

因果推断 (causal_inference, 1 篇)¶

1. 10.1093/jrsssb/qkad103 — Dynamic synthetic control method for evaluating treatment effects in auto-regressive processes¶

作者: Xiangyu Zheng, Song Xi Chen
期刊/来源: Journal of the Royal Statistical Society Series B
机构: Peking University
分类: vol 86 · issue 1 · pp 155-176
相关性 8/10 · novelty: new_method
摘要: 针对时变混杂和空间依赖下的处理效应评估问题，本文提出动态合成控制方法（Dynamic SCM），在自回归模型设定中利用微观面板数据。使用经验似然定义合成权重，保证唯一解且便于理论分析。通过动态匹配扩大可行匹配集合，并可基于预处理数据检验无混淆假设。推断方面开发了标准化安慰剂检验，克服传统检验的对称性缺陷。数值模拟和北京空气污染警报案例验证了方法的有效性。该工作将合成控制拓展到动态设定，为含时间相依结构的因果推断提供了新工具。对您而言，其经验似然加权和动态匹配思路可直接迁移到您熟悉的因果推断估计理论中。
关键技术: Synthetic Control Method, Empirical Likelihood, Dynamic Matching, Placebo Test, Auto-regressive Model
为什么对您有用: 本文属于因果推断中合成控制方法的前沿拓展，直接对应您 primary interest 中的处理效应估计和时序数据问题。您 very_familiar 的非参数统计和因果推断估计理论（如经验似然权重的渐近性质分析）可立即用于评估该方法的稳健性，或改进动态匹配下的假设检验。由于现有武器库已有扎实基础，此篇可作为立即可做的 follow-up 粗判——直接尝试在类似纵向数据中复现或扩展其方法。

数理统计 / 假设检验 (hypothesis_testing, 6 篇)¶

1. 10.1093/jrsssb/qkad106 · arXiv — GRASP: a goodness-of-fit test for classification learning¶

作者: Adel Javanmard, Mohammad Mehrabi
期刊/来源: Journal of the Royal Statistical Society Series B
分类: vol 86 · issue 1 · pp 215-245
相关性 7/10 · novelty: new_method
摘要: 本文研究二分类模型的拟合优度检验问题，不假设条件分布Y|X的参形式，将分类器视为黑箱。提出容忍假设检验框架，原假设为真实标签概率与预测概率之间的f-散度期望不超过阈值τ。核心方法是GRASP（Goodness-of-fit with Randomisation and Scoring Procedure），通过随机化和得分函数构造有限样本、分布自由的检验，无需依赖特征分布。进一步提出Model-X GRASP，在特征联合分布已知的model-X设定下利用该信息提升检验功效。方法在有限样本下控制第一类错误，并通过模拟和真实数据展示其功效优势。该工作连接您的假设检验兴趣，尤其是非参数检验的有限样本有效性。
关键技术: f-divergence, randomization test, scoring procedure, distribution-free inference, model-X framework
为什么对您有用: 该论文直接对应您的primary interest中的数学统计（假设检验）方向，属于非参数拟合优度检验的新方法。可调用您非常熟悉的非参数统计工具来理解其分布自由性质和功效分析，并考虑是否能在因果推断中的模型诊断场景（如倾向性得分模型检验）应用该方法。立即可做：用您已有的非参数理论功底即可复现和扩展其实验设计。

2. 10.1093/jrsssb/qkad085 — Derandomised knockoffs: leveraging e-values for false discovery rate control¶

作者: Zhimei Ren, Rina Foygel Barber
期刊/来源: Journal of the Royal Statistical Society Series B
机构: University of Pennsylvania · University of Chicago
分类: vol 86 · issue 1 · pp 122-154
相关性 7/10 · novelty: new_method
摘要: 在高维回归变量选择设定下，Model-X knockoffs 方法虽能控制 FDR，但因构造 knockoff 特征的随机性导致不同运行结果差异大。本文揭示 knockoffs 过程本质上是一个 e-BH (e-value Benjamini-Hochberg) 过程，并据此提出去随机化方法：通过聚合多次 knockoff 实现生成的 e-values 来消除随机性。理论证明该去随机化程序在无额外条件下仍保证 FDR 控制，而此前的方法无法给出此保证；实证显示该方法在保持与原 knockoffs 相当 power 的同时，大幅降低了选择变异性。对您有用：本文将 e-value/e-BH 这一新兴多重检验工具与 knockoffs 结合，为高维变量选择的可重复性提供了新视角。
关键技术: Model-X knockoffs, e-values, e-BH procedure, FDR control, derandomisation, multiple testing
为什么对您有用: 本文直接连接到 hypothesis testing 子方向，特别是高维多重检验中的 FDR 控制与 e-value 这一新兴工具。您武器库中的 minimax bounds for estimation problems 与 high-dimensional asymptotics 可用于审视 e-BH 在更复杂高维相依结构下的 power 行为与 FDR tightness。立即可做：用 very_familiar 的高维渐近理论分析 derandomised knockoffs 在不同 SNR/稀疏度设定下的 power rate。

3. 10.1093/jrsssb/qkad108 · arXiv — Another look at bandwidth-free inference: a sample splitting approach¶

作者: Yi Zhang, Xiaofeng Shao
期刊/来源: Journal of the Royal Statistical Society Series B
分类: vol 86 · issue 1 · pp 246-272
相关性 6/10 · novelty: new_method
摘要: 本文针对带宽自由检验（bandwidth-free tests）在多维时间序列参数检验中出现的严重尺寸扭曲问题，提出一种基于样本分裂（sample splitting）结合自标准化（self-normalization）的通用框架（SS-SN）。核心思想是通过随机分裂将高维原参数化为多个一维子问题，使每次检验仅需一个带宽自由统计量，从而避免传统方法因维度增大和时序依赖增强而导致的扭曲。具体构造了两种 SS-SN 统计量（基于组合或平均分裂），并推导了在原假设和局部备择下的极限分布。当检验维度随样本量增长时，对多元均值检验问题也给出了极限分布刻画。模拟表明该方法在小/中样本和中等维度下显著改善了尺寸控制。这一框架适用于均值检验、零自相关检验及变点检验等多种时间序列假设检验问题。对于您关注的假设检验理论和高维渐近，本文的样本分裂降低维度思路与您熟悉的高维渐近工具（如维度发散下的极限理论）直接吻合，且其分裂策略或可启发因果推断中的敏感度分析或多重检验问题。
关键技术: sample splitting, self-normalization, bandwidth-free inference, time series testing, dimension reduction
为什么对您有用: 本文直接针对多元时间序列假设检验中的尺寸扭曲问题，属于您主要兴趣中的『数学统计与假设检验』子方向。方法与您武器库中『high-dimensional asymptotics』高度匹配，可立即用于理解其维度发散下的极限分布推导；同时，其样本分裂策略与『higher-order U-statistics』中的投影降维思想有潜在类比，可借助『estimation theory in causal inference』中的交叉拟合（cross-fitting）经验评估其效率。判定：立即可做——您已有的高维渐近和假设检验知识足以深入理解本文并可能提出扩展（如推广到更一般的参数检验或因果推断中的假设检验场景）。

作者: Vishesh Karwa, Debdeep Pati, Sonja Petrović, Liam Solus, Nikita Alexeev, Mateja Raič et al.
期刊/来源: Journal of the Royal Statistical Society Series B
分类: vol 86 · issue 1 · pp 90-121
相关性 5/10 · novelty: new_method
摘要: 在网络数据的多种随机块模型（SBM、DCBM 等）设定下，本文构造了有限样本的贝叶斯与频率派 goodness-of-fit 检验。核心难点在于块分配（block assignment）为潜变量；当块分配已知时，这些模型均为 log-linear 形式，因此作者将块分配估计器与代数统计中 log-linear 模型检验的 Markov 基（Markov bases）机制结合，绕过潜变量带来的不可识别性。文中刻画了各 SBM 变体的 Markov 基与 marginal polytopes，阐明它们如何支撑 Monte Carlo 检验的构造及模型行为的理解。该方法可推广至离散数据上任意 log-linear 模型的有限混合，是代数统计工具在潜变量模型中的首次应用。对您有用之处在于：它为离散潜变量模型的有限样本精确检验提供了 Markov 基与 marginal polytope 这一代数几何视角，与您 hypothesis testing 和 semiparametric theory 的兴趣直接交汇。
关键技术: Markov bases, marginal polytopes, log-linear models, stochastic blockmodel, Monte Carlo goodness-of-fit test, algebraic statistics
为什么对您有用: 本文直接连接您 hypothesis testing 的核心兴趣，为离散潜变量模型提供了基于 Markov 基与 marginal polytope 的有限样本精确检验框架，而非依赖大样本渐近理论。您武器库中 semiparametric theory 与 M-estimation theory 的知识可以攻入的口子是：对比此代数统计精确检验与基于 influence function / score test 的渐近检验在有限样本下的功效差异与适用边界。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以系统比较代数统计路径与半参数渐近路径在潜变量模型检验中的互补与竞争关系。

5. 10.1093/jrsssb/qkad105 — Holdout predictive checks for Bayesian model criticism¶

作者: Gemma E Moran, David M Blei, Rajesh Ranganath
期刊/来源: Journal of the Royal Statistical Society Series B
机构: Rutgers, The State University of New Jersey · Columbia University · New York University
分类: vol 86 · issue 1 · pp 194-214
相关性 4/10 · novelty: new_method
摘要: 在贝叶斯模型检验设定下，目标是诊断模型拟合不足并指导模型修订，核心问题在于经典 posterior predictive check (PPC) 因数据被两次使用（既算后验预测又评估）导致 p-value 校准失效。本文提出 holdout predictive check (HPC)，将数据划分为训练集与 heldout 集，在训练集上算后验预测分布，并在独立 heldout 集上评估，从而将贝叶斯建模与频率派评估混合。理论上，作者证明了 HPC 的 p-value 是 properly calibrated 的，解决了 PPC 的双重使用偏差。实证覆盖经典回归、文本层级模型与因子分析。对您有用：HPC 的校准证明本质上是频率派假设检验框架在贝叶斯模型诊断中的应用，与您在 hypothesis testing 与 semiparametric theory 的兴趣直接相关。
关键技术: posterior predictive check, holdout predictive check, p-value calibration, Bayesian-frequentist hybrid assessment, data splitting
为什么对您有用: 本文直接连接 hypothesis testing 子方向：核心贡献是证明一种新检验的 p-value 校准性，属于频率派检验理论在贝叶斯诊断中的具体应用。用您 very_familiar 中的 minimax bounds / high-dimensional asymptotics 视角，可以审视 HPC 在高维或 semiparametric 模型下的校准性与 power 性质（当前论文仅在经典模型验证）。follow-up 判断：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将 HPC 校准理论推广到 semiparametric / high-dimensional 贝叶斯模型设定。

6. 10.1093/jrsssb/qkad104 · arXiv — Spatial confidence regions for combinations of excursion sets in image analysis¶

作者: Thomas Maullin-Sapey, Armin Schwartzman, Thomas E Nichols
期刊/来源: Journal of the Royal Statistical Society Series B
分类: vol 86 · issue 1 · pp 177-193
相关性 3/10 · novelty: new_method
摘要: 在多重空间场设定下，本文研究不同实验条件对应的渐近高斯随机场的 excursion set 交集/并集的置信区域构造问题，目标 estimand 为逻辑合取/析取定义的空间子集。核心方法利用高斯场的渐近分布与随机集的 inclusion 原理，构造出目标空间区域的置信子集与置信超集，无需假设不同场之间的依赖结构。技术工具涉及高斯随机场的 excursion 概率界、随机集的 Bonferroni-type inclusion 校正以及模拟校准。理论结果保证了所构造的子集/超集在名义水平下覆盖真实逻辑组合区域，仿真与 task-fMRI 实验证实了方法的有效性。对您有用之处：将随机集置信区域逻辑推广至多场组合，为高维/空间假设检验提供新视角。
关键技术: excursion set inference, Gaussian random field asymptotics, random set confidence regions, logical conjunction/disjunction of spatial sets, inclusion principle for random sets
为什么对您有用: 本文连接到 hypothesis testing 与 nonparametric statistics 子方向，将经典单场 excursion set 推广至多场逻辑组合的随机集置信推断。用 very_familiar 武器库中的 nonparametric statistics 与 minimax bounds 视角，可以审视其 inclusion 校正的紧性与是否可构造更优的置信区域边界。中期可做：需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将随机集的 inclusion 原理与半参数效率理论结合，探索更高效的逻辑组合场推断方法。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1093/jrsssb/qkad083 · arXiv — Empirical bias-reducing adjustments to estimating functions¶

作者: Ioannis Kosmidis, Nicola Lunardon
期刊/来源: Journal of the Royal Statistical Society Series B
分类: vol 86 · issue 1 · pp 62-89
相关性 7/10 · novelty: new_method
摘要: 本文提出一个通用的降偏M估计框架，针对渐近无偏的估计函数，通过估计函数贡献的导数经验近似偏差来实现偏差校正。方法既可以内隐地求解经验调整的估计方程，也可以外显地从原始M估计中减去估计偏差，适用于部分或完全指定的模型（包括似然和替代目标函数）。核心创新在于利用自动微分自动化偏差校正的代数推导，避免重抽样或对数似然导数乘积期望等传统方法的计算负担。如果M估计通过最大化目标函数进行，则总存在一个降偏惩罚目标函数，该目标函数与AIC等模型选择准则有联系，并可通过插件惩罚增强实现分类数据模型的有限估计。降偏M估计的推断和模型选择程序可直接沿用，无需额外调整。文章在多种常用模型（如Logistic回归、负二项回归）中通过模拟验证了方法的有限样本性能。对您而言，该工作将一般M估计的偏差校正计算自动化，可直接用于您关注的因果推断中M型估计量（如IPW、AIPW）的有限样本偏差改进。
关键技术: reduced-bias M-estimation, empirical bias adjustment, automatic differentiation, penalized objective, estimating functions
为什么对您有用: 该论文属于stat_computing方向，直接连接到您统计计算（算法自动化）的兴趣。您moderately_familiar中的M-estimation theory是理解本文偏差校正框架的核心工具，可借此深化对一般M估计量（如因果推断中的估计方程）有限样本性质的认识。follow-up粗判：中期可做——需先在M-estimation理论上巩固（moderately_familiar），从而将该框架移植到您熟悉的因果推断估计量（如IPW、AIPW）的偏差校正中。

Maintained by 陈星宇 · Homepage · Source on GitHub