跳转至

JRSSB — Vol 86 Issue 3 · 2026-06-20

  • 共 10 篇 · Journal of the Royal Statistical Society Series B
  • 目录核对 ✅ 10 篇全部抓到(对照 OpenAlex 21 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

JRSSB Vol 86 Issue 3 的 10 篇论文可归为四条主线:因果推断(第1–3篇)、假设检验与置信集(第6–8篇)、统计计算与贝叶斯(第4–5篇)、非参数/半参数方法(第9–10篇)。因果推断主线覆盖了因果模型的参数化模拟与似然推断、时空依赖实验政策评估以及预算约束下组合治疗的个体化规则;假设检验主线关注基于凸包的置信集、同时方向推断以及利用带标签异常值的分布外检验;统计计算主线涉及半参数张量因子分析和变分贝叶斯模型选择的理论保证;非参数主线包括极端值有向图估计和多元函数数据相似性度量。

因果推断主线的三篇各有所推进。Frugal parameterization 将因果效应参数置于模型核心,用 odds ratio 或 copula 补全剩余参数,使得干预分布等不可识别边际量也能进行似然推断(含全贝叶斯)。时空变系数决策过程(VCDP)将平均处理效应分解为直接和间接效应,通过核平滑与局部估计处理时间或空间依赖,给出渐近正态性。双编码器模型(DEM)针对组合治疗的最优 ITR,引入参数共享刻画处理主效应与交互效应,并将预算约束下的优化转化为多选择背包问题,提供 value reduction bound 和收敛速率改善。假设检验主线的三篇均强调稳健性和紧界。HulC 利用子集估计量的凸包构建置信集,仅需中位数偏差已知,在 bootstrap 失效的例子中仍有效,适应于任意收敛速率。Simultaneous directional inference 对参数符号提供 post hoc 同时置信界,通过方向选择后的 p 值调整得到比现有方法更紧的界,适用跨研究治疗效应评估。Integrative conformal p-values 利用带标签异常值构造共形 p 值,结合归纳式和转导式推理实现分布外检验的 FDR 控制。

统计计算与非参数主线各有显著理论推进。IP-SVD 算法在半参数张量因子分析(STEFA)中融入协变量基函数,在 sub-exponential 噪声下建立 loading matrices 与 core tensor 的收敛速率,且收敛快于纯 Tucker 分解。MFVB 的 Bernstein–von Mises 定理在允许模型误设下证明变分分布渐近正态,并推论 ELBO 作为模型选择准则与 BIC 一致,同时 CAVI 算法具有几何收敛速度。极端值有向树估计通过 max-linear Bayesian network 的双变量得分在噪声下一致返回有向生成树,为因果结构学习提供极端值视角。梯度同步化度量以函数梯度方向一致性捕捉动态功能连接,基于非参数导数估计建立渐近正态性,在脑功能数据分析中区分疾病状态。与因果推断、半参数效率方向最贴的论文可优先阅读第1、2、3篇(因果推断主线)及第4、9篇(半参数张量因子分析、极端值因果结构);假设检验方向可关注第6、7、8篇。

因果推断 (causal_inference, 3 篇)

1. 10.1093/jrsssb/qkad058 · arXiv — Parameterizing and simulating from causal models

  • 作者: Robin J Evans, Vanessa Didelez
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 535-568
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在因果推断中,即使目标分布(如干预分布)非参数可识别,对其进行似然推断或一般性模拟仍很困难,因为目标往往是反事实分布的边际量。本文提出'frugal parameterization',将因果效应参数置于模型核心,再围绕它构建剩余的非冗余参数化。对离散变量用 odds ratio 补全参数化,连续变量则用 copula,从而给出从因果模型模拟和拟合的一般配方。该方法支持对 ATE、ATT 等因果量进行参数化设定,并可直接用似然方法(含全贝叶斯)拟合。对您有用:frugal parameterization 为因果效应的 semiparametric / likelihood 推断提供了新的模型构建视角,与您在 semiparametric theory 和 identification theory 中的兴趣直接相连。
  • 关键技术: frugal parameterization, odds ratio parameterization, copula parameterization, causal likelihood inference, non-redundant parameterization, counterfactual distribution simulation
  • 为什么对您有用: 本文直接连接因果推断的 identification theory 与 semiparametric theory 子方向:它解决的是'已知非参数识别后,如何对因果效应做似然推断与模拟'这一模型构建问题,而您熟悉的 semiparametric efficiency bound 计算正需要这种明确的、非冗余的参数化结构来推导 influence function。用您 very_familiar 的 semiparametric theory(moderately_familiar)武器,可以立刻沿此框架推导 frugal parameterization 下各类因果量的 efficient influence function 与 semiparametric efficiency bound,判断其是否达到效率极限——属于立即可做的 follow-up。

2. 10.1093/jrsssb/qkad136 · arXiv — Policy evaluation for temporal and/or spatial dependent experiments

  • 作者: Shikai Luo, Ying Yang, Chengchun Shi, Fang Yao, Jieping Ye, Hongtu Zhu
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 623-649
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文提出时空变系数决策过程(Varying Coefficient Decision Process)模型,针对技术公司在时间/空间依赖实验中的政策评估问题。模型将平均处理效应分解为直接效应(DE)和间接效应(IE),分别刻画政策对目标单元的直接影响及其通过时空依赖对邻近单元的间接影响。作者设计了基于核平滑和局部估计的推断流程,并推导了估计量的渐近正态性和渐近功效。通过大量模拟和真实数据验证,方法在不同依赖强度下均能有效识别因果效应。该工作为纵向因果推断(时间序列)和空间因果推断提供了统一框架,对您关注的依赖数据分析(如longitudinal causal inference)有直接参考价值。
  • 关键技术: Varying Coefficient Decision Process, direct and indirect effect decomposition, temporal/spatio-temporal dependence, kernel-based local estimation, asymptotic inference for dependent data
  • 为什么对您有用: 本文聚焦时间/空间依赖实验中的因果推断,直接关联primary interest中的'longitudinal'和'identification theory in causal inference'。研究者可用其熟悉的非参数统计(核估计)和因果推断估计理论来理解此模型。这是一个'立即可做'的方向——核心方法(变系数模型、效应分解)在非常熟悉的武器库内,且数据分析和扩展的空间(如引入更高阶U统计量处理复杂依赖)也很大。

3. 10.1093/jrsssb/qkad141 · arXiv — Optimal individualized treatment rule for combination treatments under budget constraints

  • 作者: Qi Xu, Haoda Fu, Annie Qu
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 714-741
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在个体化治疗规则(ITR)设定下,目标是寻找多处理组合的最优分配策略,并在预算约束下最大化期望收益(value function)。本文提出双编码器模型(DEM),一种非参数结构,通过参数共享灵活刻画处理主效应与交互效应,从而提升估计效率。针对资源受限场景,将 ITR 优化嵌入多选择背包问题(multi-choice knapsack)求解。理论上给出了有/无预算约束下的 value reduction bound,并在 DEM 结构下证明了关于处理数量 K 的收敛速率改善。模拟与 PDX 实体瘤数据验证了方法优势。对您有用:DEM 的参数共享与交互效应建模思路可迁移至 longitudinal/mediation 的多处理组合因果推断设定。
  • 关键技术: individualized treatment rule, double encoder model, multi-choice knapsack, value reduction bound, nonparametric interaction modeling, convergence rate improvement
  • 为什么对您有用: 直接连接 causal inference 的 ITR estimation 子方向,特别是多处理组合与预算约束下的最优策略分配。DEM 的非参数参数共享结构可视为一种 sieve/结构化约束,您可用 very_familiar 的 minimax bound 工具审视其声称的收敛速率改善是否紧,或用 moderately_familiar 的 semiparametric theory 推导该模型下的 efficiency bound。立即可做:用 minimax 理论验证 rate improvement 的紧性。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 10.1093/jrsssb/qkad165 · arXiv — Estimating a directed tree for extremes

  • 作者: Ngoc Mai Tran, Johannes Buck, Claudia Klüppelberg
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 771-792
  • 相关性 3/10 · novelty: new_method
  • 摘要: 在极端值数据设定下,研究如何从观测节点估计根节点指向的有向生成树(如河流网络),目标 estimand 为 max-linear Bayesian network 的因果结构。核心方法基于 max-linear Bayesian network 的定性特征,构造双变量得分并据此返回有向生成树。理论证明在带噪声的 max-linear Bayesian network 模型下该估计量具有一致性,仿真与真实数据(河流流量)表现良好。对您可能有用:本文将极端值因果结构学习转化为有向树估计,其双变量得分与一致性证明框架可启发因果推断中结构学习的新思路。
  • 关键技术: max-linear Bayesian network, root-directed spanning tree, bivariate score estimation, structural consistency under noise, extreme value dependence
  • 为什么对您有用: (1) 连接到因果推断中的结构学习与 identification 理论(max-linear BN 的因果图估计),以及非参数/半参数理论中的极端值模型设定。(2) 用您 very_familiar 的 M-estimation 理论与 moderately_familiar 的因果 identification 理论可以审视其双变量得分的一致性证明是否可推广至更一般的半参数极端值模型。(3) 中期可做:需先在 moderately_familiar 的因果 identification 理论上补充极端值依赖结构(如 max-stable process)的背景,才能将本文的结构学习框架与您熟悉的因果估计理论对接。

2. 10.1093/jrsssb/qkad140 — Gradient synchronization for multivariate functional data, with application to brain connectivity

  • 作者: Yaqing Chen, Shu-Chin Lin, Yang Zhou, Owen Carmichael, Hans-Georg Müller, Jane-Ling Wang
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Rutgers, The State University of New Jersey · University of California, Davis · Pennington Biomedical Research Center · Louisiana State University
  • 分类: vol 86 · issue 3 · pp 694-713
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文针对多元函数数据,提出梯度同步化(gradient synchronization)度量,用于衡量配对平滑函数在时间变化下的相似性,核心是函数梯度方向的一致性比例。该度量可捕捉动态功能连接模式,区别于传统的静态Pearson相关。估计方法基于非参数导数估计(如核或样条)得到函数梯度,再计算同向梯度所占比例。作者建立了该估计量的渐近正态性,并推导了收敛速度,理论工具涉及经验过程与函数型数据分析。通过模拟研究和阿尔茨海默病神经影像学倡议(ADNI)的静息态fMRI数据,展示了梯度同步化在区分不同疾病状态(如正常、轻度认知障碍、阿尔茨海默病)方面的优越性。本文为非参数函数数据的相似性度量提供了新工具,与您的非参数统计和函数数据分析兴趣直接相关。
  • 关键技术: Gradient synchronization, Functional data analysis, Derivative estimation, Asymptotic normality, Dynamic functional connectivity, Resting-state fMRI
  • 为什么对您有用: 本文提出了一种新的非参数函数数据相似性度量,属于您primary interest中的nonparametric theory。您非常熟悉的nonparametric statistics(如核估计、渐近理论)可用于深入分析此方法的统计性质,例如带宽选择、收敛速度优化。由于方法基于导数估计,是您在非参数领域可立即理解和拓展的。立即可做:您可以评估其理论假设是否合理,或将其应用于其他纵向数据(如因果推断中的时间序列)。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 10.1093/jrsssb/qkad134 · arXiv — The HulC: confidence regions from convex hulls

  • 作者: Arun Kumar Kuchibhotla, Sivaraman Balakrishnan, Larry Wasserman
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 586-622
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文提出 HulC(Convex Hull of Estimates)方法,通过将数据分成若干子集并在每个子集上计算估计量,取这些估计量的凸包来构建置信集,目标 estimand 为任意参数 θ。该方法绕过了经典方法需要估计估计量极限分布的步骤,仅需估计量的(渐近)中位数偏差(median bias)已知即可保证覆盖有效性。与 bootstrap 相比,HulC 要求更弱的正则性条件并在 bootstrap 失效的例子中仍成立;与 sub-sampling 相比,HulC 不需要预先知道收敛速率。进一步提出 Adaptive HulC,利用 sub-sampling 完全从数据估计中位数偏差,实现 data-driven 推断。理论结果表明,在许多情况下 HulC 置信集宽度接近最优,并在参数、半参数和非参数设定下的多个挑战性推断问题中验证了方法。对您可能有用:HulC 为半参数/非参数估计量提供了一种无需分布估计的推断捷径,可直接应用于您关注的 semiparametric efficiency bound 下的估计量推断。
  • 关键技术: convex hull confidence set, median bias correction, sub-sampling for median bias estimation, distribution-free inference, weak regularity conditions, near-optimal width analysis
  • 为什么对您有用: 直接连接 hypothesis_testing 与 nonparametric/semiparametric theory 子方向:HulC 为那些难以获得极限分布或 bootstrap 失效的半参数估计量(如 debiased ML、one-step estimator)提供了仅需中位数偏差的推断捷径。用 very_familiar 中的 nonparametric statistics 与 minimax bounds 工具可以验证 HulC 在具体半参数问题中的宽度最优性;用 moderately_familiar 的 semiparametric theory 可将 HulC 与 efficient influence function 结合,构建无需分布估计的半参数有效置信集。立即可做:用 very_familiar 的 minimax bounds 检验 HulC 在高维 debiased estimator 上的宽度是否紧。

2. 10.1093/jrsssb/qkad137 · arXiv — Simultaneous directional inference

  • 作者: Ruth Heller, Aldo Solari
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 机构: Tel Aviv University · University of Milano-Bicocca
  • 分类: vol 86 · issue 3 · pp 650-670
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在 n>1 个参数的符号推断问题中,目标是提供 1-α 的 post hoc 同时置信界,对所有参数子集的正/负(或非正)参数数量给出同时保证。方法分两步:先用数据选择每个参数的假设检验方向(one-sided),再对选择行为进行 p-value 调整,用调整后的 p-value 对选定的 n 个单侧假设进行同时推断。在单侧 p-value 具有单调似然比密度且相互独立的假设下,调整计算直接可行,且算法至多多项式时间可完成。理论证明所提置信界比现有方法更紧(常大幅领先),并在跨研究/亚组治疗效应评估中展示应用:可给出有益研究数量的紧下界、有害研究数量的紧下界,同时推断单个研究的效应方向,且控制家族错误率 ≤0.05。对您有用:本文为多重假设检验中的方向推断提供了紧致的 post hoc 界,直接关联您 primary interest 中的 hypothesis testing 与高维参数同时推断。
  • 关键技术: post hoc confidence bounds, directional hypothesis testing, p-value selection adjustment, monotone likelihood ratio, simultaneous inference, family-wise error rate control
  • 为什么对您有用: 直接关联您 primary interest 中的 hypothesis testing 子方向,特别是高维/多重参数的同时推断与方向选择问题。您武器库中的 minimax bounds for estimation problems 与 M-estimation theory 可用于审视本文在相依或非单调似然比 p-value 结构下置信界紧致性的推广极限。立即可做:用 very_familiar 的高维渐近工具分析本文方法在 p-value 渐近相依(如高维回归系数)下的表现,或用 moderately_familiar 的 M-estimation theory 探索无单调似然比假设时的调整策略。

3. 10.1093/jrsssb/qkad138 · arXiv — Integrative conformal p-values for out-of-distribution testing with labelled outliers

  • 作者: Ziyi Liang, Matteo Sesia, Wenguang Sun
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 671-693
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文提出一种集成式共形 p 值方法用于分布外检验,利用带标签的异常值作为侧信息,这些信息在传统共形 p 值中常被忽略或丢弃。方法结合归纳式和转导式共形推理策略,自适应地加权共形 p 值,并自动从一类分类器和二类分类器集合中选出最强模型。进一步,结合条件校准策略可在多重检验中严格控制错误发现率。大量数值模拟表明所提方法优于现有方法。该方法为分布外检验提供了实用的 FDR 控制工具,与您对假设检验领域中多重比较和非参数方法的兴趣直接相关。
  • 关键技术: conformal inference, conformal p-values, conditional calibration, false discovery rate control, one-class classification
  • 为什么对您有用: 本文研究分布外检验中的 FDR 控制,属于假设检验的子方向。您擅长的非参数统计理论可以用于分析共形 p 值的分布性质和有效性,且共形推理框架与您熟悉的非参数技术高度兼容,因此可立即可做。

统计计算 / 算法 (stat_computing, 2 篇)

1. 10.1093/jrsssb/qkae001 · arXiv — Semi-parametric tensor factor analysis by iteratively projected singular value decomposition

  • 作者: Elynn Y Chen, Dong Xia, Chencheng Cai, Jianqing Fan
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 793-823
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在低秩张量分解框架下,本文引入半参数张量因子分析(STEFA)模型,目标是在 loading matrices 中融入辅助协变量,并假设噪声服从 sub-exponential 分布(弱于文献常见的 sub-Gaussian 假设)。核心算法 IP-SVD 通过迭代地将张量数据投影到协变量基函数生成的线性空间,再对各模态的矩阵化张量做 SVD 以提取因子。理论上,作者建立了 loading matrices 与 core tensor 的收敛速率,并证明在同等条件下 IP-SVD 相比纯 Tucker 分解具有更快的收敛速率与更高的估计精度。此外,文章基于 STEFA 模型提出了利用新协变量进行张量预测的多种方法。对您有用:IP-SVD 的迭代投影-矩阵化-SVD 流程与您在 higher-order U-statistics 中使用的 tensor contraction / einsum 视角天然对接,且弱化到 sub-exponential 噪声的理论分析可借鉴至高阶统计量的矩界推导。
  • 关键技术: low-rank tensor decomposition, iteratively projected SVD (IP-SVD), semi-parametric factor model, sub-exponential noise assumption, Tucker decomposition, tensor matricization
  • 为什么对您有用: 本文直接连接您 primary interest 中的 statistical computing(张量算法)与 higher-order U-statistics(tensor contraction 视角):IP-SVD 的模态矩阵化与投影操作可用您 very_familiar 的 einsum / tensor contraction 工具高效实现与复杂度分析,且 sub-exponential 噪声下的收敛率证明为您在 moderately_familiar 的高阶 U-统计量理论中推导矩界提供了直接可借鉴的弱假设技术。Follow-up 判断:立即可做——用您 very_familiar 的 treewidth / einsum 框架分析 IP-SVD 的计算复杂度,并尝试将 sub-exponential 矩界工具移植到高阶 U-统计量的投影方差控制中。

2. 10.1093/jrsssb/qkad164 · arXiv — Bayesian model selection via mean-field variational approximation

  • 作者: Yangfan Zhang, Yun Yang
  • 期刊/来源: Journal of the Royal Statistical Society Series B
  • 分类: vol 86 · issue 3 · pp 742-770
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 本文在均值场变分近似(MFVB)框架下研究贝叶斯模型选择问题,考虑潜变量和模型误设的一般设定。核心理论贡献是证明了MFVB变分分布的Bernstein–von Mises(BvM)定理:在可能的模型误设下,变分分布收敛到以最大似然估计为中心的正态分布。基于该定理,作者提出使用证据下界(ELBO)作为模型选择准则,并证明其渐近选出的模型与BIC一致。相比于BIC,ELBO对对数边际似然的近似误差更小,维度依赖性更优,且能完全整合先验信息。此外,还证明了坐标上升变分推断(CAVI)算法具有几何收敛速度,为实际迭代次数提供理论指导。本文对您统计计算方向(变分推断的理论保证)有直接参考价值,也为进一步分析高维变分推断的收敛性奠定了理论基础。
  • 关键技术: mean-field variational approximation, Bernstein–von Mises theorem, evidence lower bound (ELBO), coordinate ascent variational inference (CAVI), model misspecification
  • 为什么对您有用: 连接您统计计算兴趣中变分推断理论这一分支;您非常熟悉的高维渐近理论可用来检验本文BvM定理在参数维度增长时的紧性以及能否推广到非参数模型;立即可做:基于您已有的非参数统计和渐近分析工具,可尝试拓展ELBO模型选择一致性的理论到高维稀疏设定。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论