JRSSB — Vol 87 Issue 5 · 2026-05-26¶
- 共 16 篇 · Journal of the Royal Statistical Society Series B
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
JRSSB Vol 87 Issue 5 的 16 篇论文可归纳为三条主线:因果推断与识别(3 篇)、高维与选择性推断(4 篇)、以及非参数/半参数方法与模型(9 篇)。因果推断主线集中在工具变量 bounds 扩展与主分层分析;高维主线覆盖 lasso 符号恢复、变点检测、图模型检验与选择性置信区间;非参数/半参数主线则涵盖列子集选择、贝叶斯混合模型、函数数据深度、回归对称性、ODE 参数估计、多视角聚类、同行评审机制、预测推断与因子设计。
因果推断主线中,Covariate-assisted bounds on causal effects with instrumental variables 将经典 Balke-Pearl bounds 扩展至含协变量设定,通过引入 margin condition 和 influence function 一步估计器,在灵活估计 nuisance 时仍达到 n^{-1/2} 收敛率,并给出 bounds 的光滑近似。Semiparametric localized principal stratification analysis with continuous strata 处理连续中间变量下的主因果效应,利用 copula 主得分模型实现识别,再转向局部泛函替代参数,在消失带宽下达到 minimax 最优性,在固定带宽下达到半参数有效界,统一了半参数效率与 minimax 理论。高维主线中,An optimal design framework for lasso sign recovery 直接最大化 lasso 符号恢复概率,理论证明符号已知时正相关设计最优,符号未知时正交设计最优。Detection and inference of changes in high-dimensional linear regression with nonsparse structures 在 p≫n 且允许非稀疏结构的设定下,通过扫描局部协方差的大偏差检测变点,优于 ℓ1 正则化方法。Goodness-of-fit tests for high-dimensional Gaussian graphical models via exchangeable sampling 利用条件抽样生成 exchangeable 副本,在任意维度下精确控制 type-I error。Improving the false coverage rate adjusted confidence intervals 改进 FCR 控制置信区间,在单向选择下均匀优于原方法。非参数/半参数主线中,A statistical view of column subset selection 在 proportional regime 下将 CSS 与主变量选择统一为 semiparametric MLE。Bayesian mixture models with repulsive and attractive atoms 利用 Palm calculus 给出交互原子后验的闭式表达式。Regularized halfspace depth for functional data 通过 RKHS 正则化规避无限维退化,兼具形状与幅度排序。Estimating maximal symmetries of regression functions via subgroup lattices 在子群格上执行不变性检验,将对称性降维推广至非线性回归。Ordinary differential equation models for a collection of discretized functions 提出 functional moment method,在稀疏/稠密采样下均给出 ODE 参数收敛率。Product centred Dirichlet processes for Bayesian multiview clustering 用乘积中心 Dirichlet 过程显式控制跨视角划分相依性。Isotonic mechanism for exponential family estimation in machine learning peer review 扩展 isotonic mechanism 至指数族,利用排序约束调整评审分数。SymmPI: predictive inference for data with group symmetries 引入分布等变变换,在群对称性下构建有限样本覆盖保证的预测区间。Orthogonalized moment aberration for mixed-level multi-stratum factorial designs 提出无模型的正交化矩偏差准则,适用于部分松弛正交块结构。
与因果推断最贴的论文是 Covariate-assisted bounds on causal effects with instrumental variables 和 Semiparametric localized principal stratification analysis with continuous strata;与半参数效率最贴的是 A statistical view of column subset selection 和 Semiparametric localized principal stratification analysis with continuous strata;与高维推断最贴的是 An optimal design framework for lasso sign recovery、Detection and inference of changes in high-dimensional linear regression with nonsparse structures 和 Goodness-of-fit tests for high-dimensional Gaussian graphical models via exchangeable sampling。
因果推断 (causal_inference, 2 篇)¶
1. 10.1093/jrsssb/qkaf028 — Covariate-assisted bounds on causal effects with instrumental variables¶
- 作者: Alexander W Levis, Matteo Bonvini, Zhenghao Zeng, Luke Keele, Edward H Kennedy
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1508-1527
- 相关性 9/10 · novelty:
new_method - 摘要: 在观测性研究中,当工具变量(IV)与处理存在基线混杂时,本文将经典 Balke-Pearl ATE bounds 扩展至包含协变量的设定以收紧估计区间。由于 ATE bounds 属非光滑泛函,标准 semiparametric efficiency theory 无法直接适用;作者引入新的 margin condition,构造了基于 influence function 的 one-step estimator,在灵活估计 nuisance 时仍可达到 parametric convergence rate (\(n^{-1/2}\)-CAN)。此外,作者提出了 bounds 的光滑近似估计,并将框架扩展至连续型结局。理论证明了估计器的渐近正态性,模拟与实证(教育对工资的效应)验证了方法优势。对您而言,本文将 IV bounds 转化为非光滑泛函的效率理论问题,直接连接了您的 causal inference (IV/sensitivity) 与 efficiency theory (IF) 两个核心方向。
- 关键技术:
instrumental variable bounds,nonsmooth functional estimation,margin condition,influence function-based estimator,smooth approximation,parametric convergence rate - 为什么对您有用: 本文直接连接 causal inference 的 IV bounds/sensitivity 设定与 efficiency theory 的非光滑泛函估计。您可以用 moderately_familiar 中的 semiparametric theory 审视其 margin condition 的必要性,或用 very_familiar 的 estimation theory in causal inference 检查其 one-step estimator 在高维 IV 设定下的拓展潜力。立即可做:用您 very_familiar 的 minimax bounds 工具验证其 margin condition 下的 \(n^{-1/2}\) rate 是否 minimax optimal,或尝试将光滑近似思路迁移到 proximal CI bounds 的估计中。
2. 10.1093/jrsssb/qkaf034 — Semiparametric localized principal stratification analysis with continuous strata¶
- 作者: Yichi Zhang, Shu Yang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1655-1677
- 相关性 8/10 · novelty:
new_theory - 摘要: 在连续中间变量的主分层框架下,目标是估计主因果效应(PCE),但面临无限主分层、不可识别与非正则性难题。作者利用基于 copula 的主得分模型在弱主可忽略性假设下实现 PCE 的识别;随后转向局部泛函替代参数,该参数统计正则且在带宽趋于零时逼近 PCE。通过考虑 oracle 场景替代,简化了局部泛函替代的完整有效影响函数(EIF),得到计算简便的估计量。证明了估计量的双重稳健性与渐近正态性:在消失带宽下达到 PCE 非参数估计的 minimax 最优性,在固定带宽下达到局部泛函替代的半参数有效界。对您有用:本文将半参数有效界与 minimax 理论统一于连续主分层因果推断,且 ACTG 175 数据集为流行病学因果应用提供实例。
- 关键技术:
principal stratification,copula-based principal score,local functional substitute,efficient influence function,double robustness,minimax optimality - 为什么对您有用: 本文直接推进了连续中间变量主分层这一因果推断子方向的理论,并在局部泛函替代参数上给出了 minimax 最优率与半参数有效界。您可用 moderately_familiar 的 'semiparametric theory' 与 'identification theory in causal inference' 来审视其 oracle EIF 简化与弱主可忽略性识别策略,并探索更一般化推广。中期可做:需先在 moderately_familiar 的 'semiparametric theory' 上长肌肉,以推导更复杂设定(如 longitudinal / proximal)下局部泛函替代的 EIF 及 minimax 界。
高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶
1. 10.1093/jrsssb/qkaf026 — An optimal design framework for lasso sign recovery¶
- 作者: Jonathan W Stallrich, Kade Young, Maria L Weese, Byran J Smucker, David J Edwards
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1457-1480
- 相关性 7/10 · novelty:
new_method - 摘要: 在超饱和设计(p>n)框架下,目标是最大化 lasso 在解路径上的 sign recovery 概率,关键设定为 active factors 的效应符号已知或未知两种情形。作者提出新的设计准则直接最大化 lasso sign recovery 概率,而非传统准则(如与正交设计的接近度)。理论证明:当 active factors 符号未知时,正交设计是 sign recovery 的最优结构;当符号已知且为正时,具有常数小正相关的设计是最优结构——这解释了此前经验观察到的正相关设计优势。提出计算高效的两阶段设计搜索算法:先用启发式准则筛选候选设计,再在其中选取最大化 lasso sign recovery 概率者。主要结果给出了 sign recovery 概率的显式界与最优设计结构刻画,对您在高维 lasso support recovery 的 minimax 理论与设计-估计交互理解方面有直接参考价值。
- 关键技术:
lasso sign recovery probability,supersaturated design optimality,orthogonal design structure,positive correlation design,two-stage design search algorithm,support recovery bound - 为什么对您有用: 直接连接高维统计中 lasso sign/support recovery 的理论问题,属于 p>n 设定下的估计-设计交互。您 very_familiar 的 minimax bounds 工具可用来检验本文 sign recovery 概率界是否紧,以及正交/正相关设计结构的最优性是否可从 minimax 角度重新刻画。中期可做:需先在实验设计理论(特别是 supersaturated design 的准则体系)上补充背景,才能将 minimax 视角系统嵌入此问题。
非参数 / 半参数 (nonparam_semipara, 6 篇)¶
1. 10.1093/jrsssb/qkaf023 — A statistical view of column subset selection¶
- 作者: Anav Sood, Trevor Hastie
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1382-1403
- 相关性 7/10 · novelty:
new_theory - 摘要: 在 proportional asymptotic regime (p/n → γ > 0) 下,本文将计算机科学中的 column subset selection (CSS) 与统计学中的 principal variable selection 统一为同一 semiparametric model 的 maximum-likelihood estimation,证明两者等价。在该 semiparametric 模型下,建立 CSS estimate 在高维 proportional regime 中的 consistency 条件(涉及 signal strength 与 subset size 的关系)。利用此统一框架,作者展示了三项实用方法:(1) 仅依赖 summary statistics 的高效 CSS;(2) missing/censored data 下的 CSS;(3) 以 likelihood-ratio hypothesis testing 框架选择子集大小 k。主要理论贡献是 semiparametric MLE 视角下 CSS consistency 的充分条件及子集大小的 LR test。对您有用:本文同时触及 semiparametric theory、high-dimensional proportional asymptotics 与 hypothesis testing 三个 primary interest,其 semiparametric 模型设定为 CSS 的 efficiency bound 分析提供了自然入口。
- 关键技术:
semiparametric MLE for CSS,proportional asymptotic regime consistency,principal variable selection equivalence,likelihood-ratio test for subset size,missing/censored data CSS,summary-statistics-based CSS - 为什么对您有用: 本文将 CSS 问题嵌入 semiparametric model 做 MLE,直接连接您 primary interest 中的 semiparametric theory 与 high-dimensional proportional regime,同时子集大小选择用 hypothesis testing 框架也命中您的 mathematical statistics interest。用 very_familiar 的 high-dimensional asymptotics 工具可直接审视其 proportional regime consistency 证明是否可进一步给出 minimax rate 或 efficiency bound;moderately_familiar 的 semiparametric theory 则是切入其 MLE 框架做 semiparametric efficiency 分析的钥匙。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉(特别是该模型下的 efficient influence function 与 efficiency bound 计算),才能将本文的 consistency 结果推进到 n^{-1/2}-CAN 与 semiparametric efficiency 的完整理论。
2. 10.1093/jrsssb/qkaf027 — Bayesian mixture models with repulsive and attractive atoms¶
- 作者: Mario Beraha, Raffaele Argiento, Federico Camerlenghi, Alessandra Guglielmi
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1481-1507
- 相关性 5/10 · novelty:
new_theory - 摘要: 本文在 Bayesian nonparametric mixture model 设定下,研究随机概率测度原子间存在排斥或吸引交互时的先验构造与后验分析,目标是给出交互原子情形下后验、边际与预测分布的 closed-form 表达式——此前仅有 i.i.d. 原子(如 Dirichlet process)的已知结果。核心技术工具是 Palm calculus theory,通过 Palm 分布与 Campbell 定理将交互点过程的联合密度分解为可计算的乘积形式,从而绕过对原子点过程具体分布的假设。文章将框架特化到 Poisson、Gibbs、determinantal point process 与 shot-noise Cox process 四类,并基于所得解析量设计了新的 MCMC 后验采样算法。对您可能有用:Palm calculus 作为点过程交互结构的解析工具,可为 semiparametric efficiency bound 计算中涉及无穷维参数的扰动分析提供新的技术视角。
- 关键技术:
Palm calculus,Gibbs point process,determinantal point process,shot-noise Cox process,Bayesian nonparametric mixture,closed-form predictive distribution - 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 子方向:Palm calculus 提供了处理无穷维随机测度交互结构的解析框架,与 semiparametric 模型中无穷维 nuisance 参数的扰动分析有结构相似性。用 technical_arsenal 中 very_familiar 的 nonparametric statistics 与 moderately_familiar 的 semiparametric theory 可以审视:交互原子先验是否改变后验收缩率或影响 semiparametric efficiency bound 的可达性。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,特别是无穷维参数空间上的后验收缩率与 Bernstein–von Mises 定理,才能将 Palm calculus 工具迁移到 semiparametric efficiency 问题。
3. 10.1093/jrsssb/qkaf030 — Regularized halfspace depth for functional data¶
- 作者: Hyemin Yeon, Xiongtao Dai, Sara Lopez-Pintado
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1553-1575
- 相关性 3/10 · novelty:
new_method - 摘要: 在函数数据深度设定下,经典 Tukey 半空间深度因无限维退化而失效,本文提出正则化半空间深度以规避退化。核心机制是将半空间投影方向约束在具有小 RKHS 范数的子空间上,通过调节正则化参数可在形状与幅度之间切换排序侧重点。理论方面证明了等距不变性、中心极大性、相对于最深点的单调性、上半连续性及一致性;同时提出基于该深度的异常值检测方法,能同时识别形状与幅度异常,适用于一般 L² 空间(含非光滑轨迹)。数值与实证表明该方法在各类异常检测中表现良好。对您可能有用:本文的 RKHS 正则化投影机制与您熟悉的非参数统计和 minimax 理论有直接联系,可作为函数数据深度领域的入门参考。
- 关键技术:
Tukey halfspace depth,RKHS regularization,functional data depth,isometry invariance,consistency proof,outlier detection - 为什么对您有用: 本文连接到非参数统计与 RKHS 理论这一子方向,RKHS 范数约束投影方向的技术与您 very_familiar 的非参数统计和 minimax bounds 直接相关,可用来思考该正则化深度在函数空间中的 minimax 收敛率是否可达。follow-up 粗判:立即可做——用 minimax bound 工具分析正则化参数选择的理论最优性。
4. 10.1093/jrsssb/qkaf031 — Estimating maximal symmetries of regression functions via subgroup lattices¶
- 作者: Louis G Christie, John A D Aston
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1576-1618
- 相关性 2/10 · novelty:
new_method - 摘要: 在连续回归函数设定下,目标是估计搜索群 G 作用于特征空间时回归函数的最大对称性——即 G 中使回归函数不变的唯一最大子群,从而消除对称性导致的变异模式。核心机制是在 G 的子群格(subgroup lattice)上策略性地执行不变性假设检验,逐层判定哪些子群保持回归函数不变,进而定位最大不变子群。该框架将线性降维中利用对称性的工具(如旋转不变性下的 PCA)推广到非线性回归语境,提供了 group-theoretic 维度的非线性降维路径。理论结果证明:当所选子群格有限时,即使某些子群本身无限,最大不变子群的估计仍具有一致性。实证部分在合成数据及两组天文数据(卫星磁场强度测量、太阳黑子分布)上展示了对称性估计对建模精度的改善。对您有用之处在于:不变性检验在子群格上的策略性部署连接了 hypothesis testing 与 nonparametric regression,而天文数据应用可作为 astrostats 入门阅读。
- 关键技术:
subgroup lattice invariance testing,maximal symmetry estimation,nonlinear dimension reduction via group action,consistency under finite lattice,regression function invariance - 为什么对您有用: 本文核心连接到 hypothesis testing(子群格上的不变性检验策略)与 nonparametric statistics(连续回归函数的对称性估计),天文应用(磁场/太阳黑子)属于 astrostats secondary interest。用 very_familiar 的 nonparametric statistics 与 minimax bounds 可分析其不变性检验的 power 与收敛速率是否达到最优,用 moderately_familiar 的 M-estimation theory 可审视一致性证明的 regularity 条件可否放松到更一般的损失函数。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以将此对称性估计框架从纯非参数回归推广到 semiparametric partial invariance 设定。
5. 10.1093/jrsssb/qkaf036 — Ordinary differential equation models for a collection of discretized functions¶
- 作者: Lingxuan Shao, Fang Yao
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1707-1724
- 相关性 2/10 · novelty:
new_method - 摘要: 本文研究从离散采样函数集合中估计常微分方程(ODE)模型参数的问题,设定覆盖稀疏到稠密采样设计,且ODE允许非线性与非Lipschitz动力学。核心提出"functional moment method":将ODE参数估计转化为函数矩条件求解,同时恢复离散观测的个体轨迹。理论方面,该方法在稀疏/稠密采样下均给出参数估计的收敛率,并处理了非Lipschitz情形下解的存在唯一性难题。实证在社会学、物理与流行病学数据上验证了方法适用性。对您而言,该文的ODE参数估计框架可视为semiparametric理论在动态系统的新应用场景,functional moment条件与您熟悉的M-estimation/semiparametric效率理论有直接对接口。
- 关键技术:
functional moment method,ODE parameter estimation,non-Lipschitz dynamics,sparse-to-dense sampling design,curve recovery for discretized functions - 为什么对您有用: 本文连接到semiparametric & nonparametric theory子方向:functional moment method本质上是一类广义M-estimator,其收敛率分析可直接用您very_familiar的minimax bounds工具审视是否达到最优率。用您moderately_familiar的M-estimation理论可攻其参数估计的asymptotic normality与效率界问题——中期可做:需先在semiparametric efficiency bound计算上长肌肉,以判断functional moment estimator是否达到semiparametric efficiency bound。
6. 10.1093/jrsssb/qkaf021 — Product centred Dirichlet processes for Bayesian multiview clustering¶
- 作者: Alexander Dombowsky, David B Dunson
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1331-1352
- 相关性 2/10 · novelty:
new_method - 摘要: 在多视角聚类设定下,目标是获取同一实体集在不同数据类型下的相依但非等价的划分,核心难点在于划分空间的复杂性使得传统相依性建模不可行。提出CLIC(CLustering with Independence Centring)先验,由新型层次先验——乘积中心Dirichlet过程(PCDP)诱导,用单一参数显式控制跨视角划分的相依性,在独立划分与等价划分之间桥接。理论方面:证明了PCDP有限逼近的精度,推导了划分分布的闭式边际与联合表达式。计算方面:设计了边际Gibbs采样器进行后验推断。在合成数据与流行病学应用中准确刻画视角特异划分并推断相依水平。对您可能有用:其划分空间的相依性建模思路可启发因果推断中多干预变量下异质性处理的联合结构识别。
- 关键技术:
Product centred Dirichlet process,multiview clustering,partition dependence modeling,finite approximation accuracy,marginal Gibbs sampler,closed-form partition distribution - 为什么对您有用: 本文属于非参数理论中的Bayesian process prior构造,附带流行病学(secondary interest)的数据应用。武器库中的'nonparametric statistics'(very_familiar)可用来审视其划分空间的逼近精度,但研究者擅长的frequentist minimax与semiparametric efficiency视角与本文的Bayesian先验推断范式差异较大,难以直接找到理论攻击口子。暂不可做:核心机器(Dirichlet process构造与Bayesian partition空间推断)不在武器库核心区,若要深入需先长肌肉于Bayesian nonparametric先验收敛理论。
数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶
1. 10.1093/jrsssb/qkaf029 — Detection and inference of changes in high-dimensional linear regression with nonsparse structures¶
- 作者: Haeran Cho, Tobias Kley, Housen Li
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1528-1552
- 相关性 8/10 · novelty:
new_method - 摘要: 在高维线性回归变点检测中,现有方法多假设段内回归系数或其差(differential parameters)精确稀疏;本文在 p≫n 且允许非稀疏结构、非高斯误差及时间依赖的设定下,以差分参数及变点位置为 estimand。作者证明回归系数及其差的精确稀疏性并非多变点检测一致性的必要条件,提出通过扫描局部协方差(regressors 与 response 之间)的大偏差来检测变点,该策略在统计与计算上均优于基于 ℓ1 正则化的局部对比方法。进一步,提出多变点分割后的推断工具,用于对非稀疏差分参数进行直接推断。理论分析在超高压维度下给出了检测一致性及推断的渐近性质,宏观经济数据实证验证了方法有效性。对您而言,本文在非稀疏高维设定下的变点推断直接关联您的高维假设检验与推断理论兴趣,且宏观经济应用契合 econ_theory 次级兴趣。
- 关键技术:
change point detection,local covariance scanning,differential parameter inference,nonsparse high-dimensional regression,post-segmentation inference - 为什么对您有用: (1) 直接关联您的高维假设检验(变点检测即序贯/多重检验)与高维统计推断(非稀疏差分参数的 post-segmentation inference)兴趣,宏观经济数据应用契合 econ_theory 次级兴趣。(2) 您的 very_familiar 武器库中的 "high-dimensional asymptotics" 与 "minimax bounds" 可用于审视本文检测一致性界是否紧,或用 moderately_familiar 的 "M-estimation theory" 分析其局部协方差扫描估计量的渐近行为。(3) 中期可做——需先在 moderately_familiar 的 "M-estimation theory" 或高维推断(如 debiased 方法)上长肌肉,以将本文推断框架扩展到更一般的半参数变点模型。
2. 10.1093/jrsssb/qkaf032 — Goodness-of-fit tests for high-dimensional Gaussian graphical models via exchangeable sampling¶
- 作者: Xiaotong Lin, Weihao Li, Fangqiao Tian, Dongming Huang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1619-1635
- 相关性 7/10 · novelty:
new_method - 摘要: 本文在低维与高维设定下研究 Gaussian graphical model 的 goodness-of-fit 检验,目标是在给定 sufficient statistics 条件下生成 exchangeable copies 以构建 exact finite-sample test。核心机制是利用条件抽样算法生成与原样本 exchangeable 的副本,从而在任意维度下保证 type-I error 的精确控制;检验统计量可灵活选取,作者探讨了多种候选并证明在两种信号模式下——dense pattern(大量小非零元素)与 strong pattern(至少一个大元素)——所提检验达到 rate-optimal。模拟显示在 precision matrix 偏离 null 由大量小非零项驱动时,该方法比现有检验有显著功率优势。对您有用:该框架将 conditional exchangeability 与高维 minimax rate 结合,直接对接您的高维假设检验与 minimax bound 兴趣。
- 关键技术:
exchangeable sampling via conditioning on sufficient statistics,exact finite-sample error control,rate-optimal goodness-of-fit test,dense vs strong signal patterns in precision matrix,Gaussian graphical model goodness-of-fit - 为什么对您有用: 直接对接您 primary interest 中的 hypothesis testing 与 high-dimensional statistics:本文在高维 GGM 检验中给出了 minimax rate-optimal 的理论结果,且 dense/strong 两种信号模式的区分与您熟悉的 minimax bound 分析高度契合。用您 very_familiar 的 minimax bounds for estimation problems 工具即可审视其 rate-optimality 证明是否紧;conditional exchangeability 抽样框架的算法实现也落在您 statistical computing 兴趣内。判断:立即可做——用 minimax 理论背景可直接评估其 rate claim,并尝试将 exchangeable sampling 框架迁移到其他高维结构检验问题。
3. 10.1093/jrsssb/qkaf024 — Improving the false coverage rate adjusted confidence intervals¶
- 作者: Tzviel Frostig, Yoav Benjamini
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1404-1421
- 相关性 6/10 · novelty:
new_method - 摘要: 在选择性推断框架下,针对经阈值筛选后被选参数的置信区间构造,传统同时置信区间过于保守。本文提出改进的 false coverage-statement rate (FCR) 控制置信区间:内侧端点沿用 Benjamui & Yekutieli (2005) 的 FCR-adjusted CI,外侧端点退回标准无调整 CI,区间中心为收缩估计量(shrunk estimator)。在单向选择下,该改进在 FCR 控制上均匀优于原方法;双向选择亦有推广方案。理论证明独立估计量下的 FCR 控制,模拟显示依赖结构下仍具鲁棒性。对您有用:若研究 selective inference / post-selection CI 的效率理论,此收缩构造提供了一个可分析 semiparametric efficiency bound 的具体实例。
- 关键技术:
false coverage-statement rate (FCR),selective inference,shrunk estimator,post-selection confidence interval,uniform improvement - 为什么对您有用: 直接连接 hypothesis testing 子方向中的 selective inference / post-selection CI 构造,收缩估计量的均匀改进可视为效率理论在 FCR 控制下的具体体现。用 very_familiar 的 minimax bounds 工具可验证其声称的 uniform improvement 是否在更广 semiparametric 模型下成立,属于立即可做的 follow-up。
4. 10.1093/jrsssb/qkaf025 — Isotonic mechanism for exponential family estimation in machine learning peer review¶
- 作者: Yuling Yan, Weijie J Su, Jianqing Fan
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1422-1456
- 相关性 4/10 · novelty:
new_theory - 摘要: 本文研究机器学习会议同行评审中的信息 elicitation 与估计问题,目标是在作者提供多篇投稿的排序约束下,对评审分数进行调整与估计,假设评审分数服从指数族分布且具体分布形式未知。核心方法是扩展 isotonic mechanism 至指数族,利用作者排序作为单调约束进行 isotonic regression,产生既遵循排序又贴近原始分数的调整分数。理论证明:当作者效用是调整分数的凸可加函数时,如实排序是最优策略;对指数族子类,如实报告仅在 elicitation 涉及 pairwise comparison 时成立,从而论证排序的最优性。估计方面,调整分数相比原始分数显著提升精度,且在 ground-truth 分数有界总变差条件下达到 near-minimax optimality。对您可能有用:本文的 near-minimax rate 与 total variation bounded 设定直接连接 nonparametric minimax theory,isotonic regression 的约束估计视角可启发 causal inference 中单调约束下的 semiparametric 估计。
- 关键技术:
isotonic regression,exponential family distribution,minimax optimality under TV constraint,truthful information elicitation,pairwise comparison elicitation,convex additive utility - 为什么对您有用: 本文连接 nonparametric minimax estimation(primary interest)与 mechanism design 中的 truthful elicitation,isotonic regression 在 TV-bounded 条件下的 near-minimax rate 可用您 very_familiar 的 minimax bounds 工具直接验证其紧性。排序约束下的 isotonic 估计与 causal inference 中单调干预效应的 semiparametric 估计有结构相似性,可用 moderately_familiar 的 semiparametric theory 探索其 influence function 与效率界。Follow-up 判断:立即可做——用 minimax theory 验证 TV-bounded 下的 rate 紧性,并尝试将 isotonic constraint 引入 causal monotone response model 的估计。
5. 10.1093/jrsssb/qkaf022 — SymmPI: predictive inference for data with group symmetries¶
- 作者: Edgar Dobriban, Mengxin Yu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1353-1381
- 相关性 3/10 · novelty:
new_method - 摘要: 本文研究在数据分布具有一般群对称性(如置换群、旋转群)及任意观测模型(如部分特征缺失)下的预测推断问题,目标是构建具有有限样本覆盖保证的预测区间。核心方法 SymmPI 引入“分布等变变换”(distributionally equivariant transformations)概念,利用群对称性处理数据并保持分布不变性,从而在分布不变假设下证明覆盖有效性,并在分布偏移下刻画性能退化,将近期 conformal prediction 结果作为特例回收。技术工具包括群等变性、conformal prediction 框架扩展、网络顶点预测中的图自同构群不变性。实证与模拟显示 SymmPI 在两层层级模型和网络数据中优于现有方法。对您可能有用:该框架将 conformal prediction 的置换不变性推广到一般群对称,与您在 hypothesis testing 和 semiparametric theory 中对不变性检验的兴趣直接相连。
- 关键技术:
conformal prediction,distributional equivariance,group symmetry invariance,coverage under distribution shift,network vertex prediction,graph automorphism group - 为什么对您有用: 本文将 conformal prediction 的置换不变性推广到一般群对称(如旋转、图自同构),直接连接到您在 hypothesis testing 中对不变性检验的兴趣,以及 semiparametric theory 中利用对称性简化效率界计算的思路。您可以用 very_familiar 的高维渐近工具分析 SymmPI 在高维/网络设定下的覆盖率渐近行为,或用 moderately_familiar 的 semiparametric theory 探究群等变约束下的效率界。立即可做:用 very_familiar 武器(minimax bounds / high-dimensional asymptotics)分析该方法的渐近覆盖保证与效率。
其他 (other, 2 篇)¶
1. 10.1093/jrsssb/qkaf035 — Least squares for cardinal paired comparisons data¶
- 作者: Rahul Singh, George Iliopoulos, Ori Davidov
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1678-1706
- 相关性 3/10
- 摘要: 在 cardinal paired comparison 数据的图模型设定下,本文严格分析最小二乘估计量的渐近性质,目标 estimand 为各项目的 merit/rank 参数,关键 regularity 假设基于比较图的连通性与稀疏性条件。作者提出基于图论的必要且充分条件,保证估计量的强一致性、渐近正态性及 rank 估计的指数收敛率;对含协变量模型给出完整理论,包括协变量可安全省略的识别条件;在大规模稀疏比较图情形下也给出相应渐近结果。主要理论贡献是将图连通性条件与估计量渐近行为精确挂钩,而非仅给出充分条件。对您可能有用的是其"图性质→统计性质"的刻画思路——与您用 treewidth 分析 higher-order U-stat 计算复杂度的结构有类比性,可作为 M-estimation 渐近理论在图结构数据上的参考案例。
- 关键技术:
least squares estimation for paired comparisons,graph-based necessary and sufficient conditions
2. 10.1093/jrsssb/qkaf033 — Orthogonalized moment aberration for mixed-level multi-stratum factorial designs with partially-relaxed orthogonal block structures¶
- 作者: Ming-Chung Chang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 5 · pp 1636-1654
- 相关性 1/10 · novelty:
new_method - 摘要: 在多层级因子设计设定下,本文提出一种无模型的统一方法——正交化矩偏差(orthogonalized moment aberration),用于比较分配到异质实验单元的因子水平组合的相似性,关键结构假设为部分松弛正交块结构。该方法的核心机制是利用核函数评估设计矩阵的行而非列,从而绕开列空间分析,适用于广泛的混合水平常规/非常规因子设计。方法具有灵活性:通过选择不同核函数可适配多种场景,特定核函数选择可退化为文献中已知的最小偏差准则。尽管方法本身不依赖特定模型,其合理性通过线性混合效应模型和高斯过程模型给出了理论验证。理论与数值结果表明,该方法在贝叶斯框架下能生成具有高 D-efficiency 的多层级因子设计。本文属于纯实验设计理论,与您关注的因果推断估计、半参数效率界或高阶 U-统计量无直接交集。
- 关键技术:
orthogonalized moment aberration,kernel function on design matrix rows,partially-relaxed orthogonal block structure,minimum aberration criterion,D-efficiency,Gaussian process model justification - 为什么对您有用: 本文属于实验设计理论,与您 primary interest 中的因果推断估计理论、半参数效率界或高维统计无直接交集。您的武器库(高阶 U-统计量计算、minimax bounds、半参数理论)无法直接攻入本文的实验设计组合优化口子。暂不可做:核心机器(正交块结构组合设计理论)不在武器库里。
Maintained by 陈星宇 · Homepage · Source on GitHub