Biometrika — Vol 111 Issue 2 · 2026-06-20¶

共 20 篇 · Biometrika
目录核对 ✅ 20 篇全部抓到（对照 OpenAlex 21 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期内容大致聚成四条主线：一是因果推断的多结局与非参数识别，涉及未观测混杂下的平行结局识别、多变量后验归因、基于核岭回归的因果曲线估计，以及双重稳健泛函的机器学习模型选择；二是多重检验与选择性推断，涵盖e-values加权、加权BH程序、群不变性检验的子群选择，以及选择-条件推断与直接方法的功效比较；三是高维与随机矩阵的扰动推断，聚焦信号加噪声模型的准后验估计与网络模型varimax旋转的渐近正态性；四是假设检验的边界约束与效率增益，讨论非凸边界下的似然推断、方差分量检验中Wald与LRT的几何差异，以及协变量调整对数秩检验的效率保证。此外，非参数预测误差估计（时间序列与点过程交叉验证）、核插值泛化下界、保形生存分析及变点序贯检验等零散但扎实的理论工作亦各有推进。

因果推断主线本期在“多结局”设定上形成了有趣的共振：两篇论文从不同角度切入多变量结局以突破传统单结局框架的局限。Promises of parallel outcomes 利用多个结局间的对称条件独立性，在未观测混杂下实现了非参数识别，避开了传统负控制变量对不对称角色的要求；Retrospective causal inference 则在回顾性归因中联合条件化多个效应变量，以无混杂与单调性假设推导多变量后验因果效应的识别方程。在估计端，Kernel methods for causal functions 为剂量响应等非参数因果曲线给出了RKHS闭式解与有限样本收敛率；Selective machine learning 则从双重稳健泛函出发，以对扰动敏感度的“伪风险”为准则，为 nuisance 参数的机器学习模型选择提供了具备 oracle 性质的交叉验证框架。

多重检验与选择性推断主线本期密集探讨了数据驱动权重与选择机制的功率损耗。在权重构造上，E-values as unnormalized weights 证明用独立 e-values 作权重可免于传统确定性归一化约束，提升功效；τ-censored weighted BH 则针对交叉加权的信息泄露，提出留一法与部分信息法构造权重以避免过拟合并保证 FDR 控制；More efficient exact group invariance testing 用策略性固定子群替代随机抽样，在群不变性检验中实现类似 t 到 Z 检验的效率跃升。在推断框架上，On selection and conditioning 从理论上对比了选择-条件推断与直接控制错误率的方法，明确指出后者在功效上始终不弱于前者，质疑了数据雕刻等选择推断的功率代价。

对于侧重因果识别与半参数效率的研究者，Promises of parallel outcomes 与 Retrospective causal inference 对多结局设定的拓展、Selective machine learning 对双重稳健泛函 nuisance 选择的 oracle 理论，以及 Kernel methods for causal functions 的非参数收敛率最值得优先阅读；关注高维推断与假设检验边界的读者，则可重点看 An eigenvector-assisted estimation 的准后验稳健推断、On varimax asymptotics 的 entrywise 扰动分析，以及 Likelihood-based inference under nonconvex boundary 与 An anomaly arising 对非凸/退化边界下 LRT 极限分布的刻画。

因果推断 (causal_inference, 3 篇)¶

1. 10.1093/biomet/asae008 · arXiv — Promises of parallel outcomes¶

作者: Ying Zhou, Dingke Tang, Dehan Kong, Linbo Wang
期刊/来源: Biometrika
机构: University of Toronto
分类: vol 111 · issue 2 · pp 537-550
相关性 9/10 · novelty: new_method
摘要: 在未观测混杂下，本文提出利用多个结局（parallel outcomes）进行因果效应识别与估计的新框架。核心假设是多个结局在给定处理和混杂下条件独立，且各结局在该假设中角色对称。理论证明：在至少三个平行结局的非参数设定下，ATE 可被非参数识别；参数设定下则在线性结构方程模型（LSEM）族中给出估计工具。方法避开了传统 proxy/IV 方法对 negative control 变量的不对称角色要求，以多结局间的对称条件独立性替代。对您可能有用：此框架拓展了 proximal CI 的识别工具箱，将多结局条件独立性与 LSEM 结合，为未观测混杂下的非参数识别提供了新路径。
关键技术: parallel outcomes, conditional independence assumption, nonparametric identifiability, linear structural equation models, unmeasured confounding
为什么对您有用: 直接连接到 causal inference 的 identification 与 unmeasured confounding 子方向，与 proximal CI 的 negative control 设定形成对比（对称 vs 不对称角色）。用您 very_familiar 的 identification theory in causal inference 可直接审视其非参数识别的 completeness 条件是否隐含且可验证；LSEM 下的参数估计部分可用 moderately_familiar 的 semiparametric theory 探索能否向半参数/鲁棒估计拓展。判断：立即可做——用现有 identification theory 武器即可切入审查其识别逻辑与 completeness 要求。

2. 10.1093/biomet/asad056 — Retrospective causal inference with multiple effect variables¶

作者: Wei Li, Zitong Lu, Jinzhu Jia, Min Xie, Zhi Geng
期刊/来源: Biometrika
机构: Renmin University of China · City University of Hong Kong · Peking University · Beijing Technology and Business University
分类: vol 111 · issue 2 · pp 573-589
相关性 9/10 · novelty: new_theory
摘要: 在回顾性因果推断（由果推因）框架下，当存在多个效应变量时，目标是基于观测证据条件化，定义并识别多变量后验因果效应（包括总效应、干预效应与直接效应）。作者引入了无混杂与单调性假设，在此条件下证明了多变量后验因果效应的可识别性，并给出了显式的识别方程。方法将单效应变量的后验因果效应推广至多变量情形，通过联合条件化多个结局提升了归因推断的精度。理论结果通过两个实例展示了在医疗诊断与责任归因等场景的应用。对您有用：本文将因果识别理论从单结局拓展至多结局后验归因，直接关联您 primary interest 中的因果识别理论（identification theory）与多结局设定。
关键技术: retrospective causal inference, posterior causal effects, multivariate identification equations, no confounding assumption, monotonicity assumption, causal attribution
为什么对您有用: 本文直接推进了您 primary interest 中的因果识别理论（identification theory），将单效应变量的后验因果效应拓展至多效应变量联合条件化的归因场景。您武器库中 moderately_familiar 的 identification theory in causal inference 可直接用来审视其无混杂与单调性假设的必要性，或探索放宽假设后的半参数识别边界。立即可做：用您 very_familiar 的因果推断估计理论，为本文的识别方程构造半参数有效估计量并分析其 influence function。

3. 10.1093/biomet/asad052 · arXiv — Order-based structure learning without score equivalence¶

作者: Hyunwoong Chang, James J Cai, Quan Zhou
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 551-572
相关性 8/10 · novelty: new_method
摘要: 在因果结构学习中，为了确保有向无环图（DAG）的可识别性，通常假设所有节点变量的误差方差相等。本文提出一个经验贝叶斯框架，通过近似每个节点排序的后验概率（即最佳DAG模型的后验）来构造基于排序的MCMC采样器，从而实现高效后验计算。在高维设定下，他们证明了该模型在允许异质误差方差时仍具有强选择一致性，并理论分析了采样器的混合行为。此外，还提出一种快速迭代的自顶向下算法，以近似求解结构学习问题，并用于初始化MCMC。模拟结果表明所提方法优于多种现有算法，并通过单细胞真实数据研究展示了实际优势。该工作对因果推断中的DAG结构学习提供了新的视角，尤其在处理高维数据和异质方差时具有理论保证，可能适用于纵向或中介分析中的图估计。
关键技术: empirical Bayes formulation, order-based MCMC, strong selection consistency, iterative top-down algorithm, DAG structure learning, heterogeneous error variances
为什么对您有用: 本文直接属于因果推断中的结构学习子方向，特别是高维DAG估计，与研究者的主要兴趣高度吻合。研究者可以利用其熟悉的high-dimensional asymptotics理论来验证本文的强选择一致性条件是否最优，并尝试用非参数统计工具进一步放宽同方差假设。从技术储备看，研究者对high-dimensional asymptotics和causal inference estimation theory非常熟悉，可以立即通过理论分析参与这项工作，属于立即可做的范畴。

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)¶

1. 10.1093/biomet/asad058 — An eigenvector-assisted estimation framework for signal-plus-noise matrix models¶

作者: Fangzheng Xie, Dingbo Wu
期刊/来源: Biometrika
机构: Indiana University Bloomington
分类: vol 111 · issue 2 · pp 661-676
相关性 9/10 · novelty: new_method
摘要: 本文研究信号加噪声矩阵模型（如spiked covariance模型）下信号部分的估计问题。目标是从观测矩阵中利用主特征向量构造渐近无偏的估计方程，但直接求解不稳定且对模型误设不鲁棒。作者提出准后验分布方法：指数化一个准则函数，其最大化等价于估计方程估计，从而得到数值稳定的估计量。该方法可纳入异方差信息，无需完整指定样本分布，且对噪声矩阵分布误设具有稳健性。计算上采用MCMC采样，数值稳定性优于现有基于优化的方法，并能直接进行不确定性量化。在温和正则条件下，准后验置信集具有正确的频率覆盖概率。合成数据和ENZYMES网络数据实验验证了方法的有效性。对您有用：连接高维统计中随机矩阵特征向量扰动分析与统计计算中MCMC后验推断，尤其对高维逆问题中估计与不确定性的结合有借鉴。
关键技术: eigenvector-assisted estimation, quasi-posterior distribution, MCMC sampler, signal-plus-noise matrix model, asymptotically unbiased estimating equation
为什么对您有用: 本文直接关联高维统计-随机矩阵理论中信号+噪声矩阵的特征向量估计问题，与您的primary interest中'high-dimensional statistics (Random matrix theory)'高度吻合。您very_familiar中的'高维渐近理论'和'软件开发'均可用于理解其理论证明与实现其MCMC算法，例如验证特征向量扰动界的sharpness或扩展至您的因子模型问题。粗判：立即可做——借助您对高维渐近和编程的掌握，即可复现实验并评估其准后验方法的实际表现。

2. 10.1093/biomet/asad061 · arXiv — On varimax asymptotics in network models and spectral methods for dimensionality reduction¶

作者: J Cape
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 609-623
相关性 6/10 · novelty: new_theory
摘要: 本文在潜在空间随机图模型框架下，研究 varimax 因子旋转的渐近性质。作者将谱方法得到的节点嵌入（低维表示）进行 varimax 旋转后，证明了旋转向量的渐近多元正态性。关键假设是网络稀疏性、矩阵秩的合理设定，以及 entrywise 矩阵扰动分析的适用条件。方法上依托奇异值分解与谱截断，结合 Rohe & Zeng (2023) 对 varimax 旋转统计一致性的新理解，将经典因子分析与现代网络分析联系起来。数值实验验证了理论结果。该工作为基于矩阵分解的降维推断提供了坚实的渐近基础，尤其适用于混合隶属度随机块模型等网络模型。对您而言，其中 entrywise 扰动分析与随机矩阵理论的技术可迁移至高维统计中的谱推断问题。
关键技术: Varimax rotation, entrywise matrix perturbation, spectral embedding, asymptotic multivariate normality, latent space random graph models, singular value decomposition
为什么对您有用: 本文聚焦高维网络模型中谱方法的渐近性质，直接关联您的「高维统计（随机矩阵理论）」兴趣，其中 entrywise 扰动分析是您 very_familiar 的高维渐近工具可以攻克的细节。这是一篇中期可读的论文：需要先巩固随机矩阵 entrywise 扰动理论（如 Cape 等人的工作）才能完全消化证明细节，但核心直觉与渐近结论对理解谱方法在因果推断（如网络干预）中的可能应用有启发性。

非参数 / 半参数 (nonparam_semipara, 5 篇)¶

1. 10.1093/biomet/asad042 · arXiv — Kernel methods for causal functions: dose, heterogeneous and incremental response curves¶

作者: R Singh, L Xu, A Gretton
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 497-516
相关性 9/10 · novelty: new_method
摘要: 在一般测度空间（处理和协变量可离散/连续）的非参数因果推断设定下，目标是估计剂量响应曲线、异质性响应曲线及增量响应曲线等因果函数。作者基于核岭回归提出估计量，利用 RKHS 的分解性质得到闭式解，避免了数值迭代。理论方面，通过对广义核岭回归的原创性分析，证明了估计量的有限样本一致收敛速率。方法进一步扩展到反事实分布及前门/后门准则识别的因果函数。仿真与美国 Job Corps 政策评估实证表明其在非线性高维设定下达到 state-of-the-art 表现。对您可能有用：该工作为非参数因果曲线提供了 RKHS 闭式解与有限样本收敛率，可直接对接您对 semiparametric/nonparametric theory 与因果估计效率的关注。
关键技术: kernel ridge regression, RKHS decomposition property, uniform consistency with finite-sample rates, dose response curve estimation, incremental response curve, front-door and back-door identification
为什么对您有用: 直接对接 primary interest 中的 semiparametric & nonparametric theory 与 causal inference 的非参数估计设定。您 technical_arsenal 中的 very_familiar 项 'nonparametric statistics' 与 'estimation theory in causal inference' 完全覆盖本文的 RKHS 估计与收敛率分析框架，可直接审视其 finite-sample rate 是否达到 minimax optimal 或与 HOIF（moderately_familiar）的 higher-order 修正存在衔接空间。判断：立即可做——用 very_familiar 的 minimax bounds 工具验证其收敛率紧性，或用 moderately_familiar 的 HOIF 探索该 kernel estimator 的 higher-order 修正与效率界差距。

2. 10.1093/biomet/asad048 · arXiv — Kernel interpolation generalizes poorly¶

作者: Yicheng Li, Haobo Zhang, Qian Lin
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 715-722
相关性 6/10 · novelty: new_theory
摘要: 本文研究核回归中完美插值（即训练损失为零）的泛化性能。在温和条件下，作者证明对于一大类核函数，核插值的泛化误差存在 Ω(n^{-ε}) 的下界，其中 ε>0 可任意小。该下界意味着无论样本量多大，泛化误差都无法以多项式速率收敛到零，即核插值泛化性能差。证明利用了核函数的特征值衰减性质与 Fano 不等式构造，将泛化下界转化为一个先验分布的区分困难问题。该结果直接反驳了深度学习中“良性过拟合”现象在核方法中的简单类比，表明核插值不具备与过参数化神经网络类似的泛化优势。对您而言，本文的非参数 minimax 下界技巧与您熟悉的 minimax 下界武器完美匹配，值得精读以评估其下界是否紧以及能否推广到其他核类。
关键技术: kernel interpolation, generalization error lower bound, Fano's inequality, eigenvalue decay, minimax lower bound
为什么对您有用: 本文直接触及非参数统计中泛化理论的核心问题，与您对 minimax 下界（very_familiar）的专长高度重合。您可以立即用熟悉的覆盖数/打包数技巧验证下界的紧性，或者尝试放松原文对核函数的假设（例如允许更慢的特征值衰减）。该结果也可能启发您思考高维核方法或 U-统计量中的类似下界问题。粗判：立即可做——用 very_familiar 的 minimax 下界工具就能展开阅读和批判。

3. 10.1093/biomet/asad076 — Conformalized survival analysis with adaptive cut-offs¶

作者: Yu Gui, Rohan Hore, Zhimei Ren, Rina Foygel Barber
期刊/来源: Biometrika
机构: University of Chicago · University of Pennsylvania
分类: vol 111 · issue 2 · pp 459-477
相关性 4/10 · novelty: new_method
摘要: 在 Type-I 右删失生存数据设定下，目标是构建生存时间的有效且高效的 lower predictive bound (LPB)。本文扩展 Candès et al. (2023) 的加权 conformal inference 方法，将固定删失阈值子集化步骤替换为协变量依赖、数据自适应的子集化，以更好捕捉删失机制的异质性。核心机制为：自适应子集化后，利用 weighted conformal inference 的重加权修正分布偏移；理论证明若删失机制或条件分位数之一被良好估计，LPB 可达到 nearly exact marginal coverage，且在条件分位数情形下进一步获得 approximate conditional coverage。实证与模拟表明，相比固定阈值方法，自适应 cut-off 产生的 LPB 更不保守、信息更精确。对您可能有用：此方法在删失数据下的 conformal prediction 框架，为半参数/非参数条件分位数估计与分布偏移修正提供了新视角。
关键技术: weighted conformal inference, adaptive covariate-dependent subsetting, distribution shift correction, conditional quantile estimation, right-censored survival data, lower predictive bound
为什么对您有用: 本文连接到非参数理论与效率理论（半参数效率界）中的条件分位数估计与分布偏移修正，属于删失数据下 conformal prediction 的前沿。用您 very_familiar 的非参数统计与 minimax bounds 视角，可以审视其声称的 nearly exact coverage 与 approximate conditional coverage 的理论紧致性，以及条件分位数估计误差对最终 coverage 的定量影响。中期可做：需先在 moderately_familiar 的半参数理论（特别是删失数据下的效率界与 influence function）上长肌肉，才能深入分析其重加权步骤的效率损失与最优性。

4. 10.1093/biomet/asad053 — Estimation of prediction error in time series¶

作者: Alexander Aue, Prabir Burman
期刊/来源: Biometrika
机构: University of California, Davis
分类: vol 111 · issue 2 · pp 643-660
相关性 4/10 · novelty: new_method
摘要: 在平稳时间序列设定下，本文目标是估计一步与多步预测误差的 bias-variance 分解分量，填补了独立数据下 Efron (2004) 方法在序列依赖情形的空白。核心机制是对平方预测误差的 bias-variance 分解提出近似框架，进而推导出适用于一大类预测器（涵盖线性/非线性、参数/非参数模型，以因果可逆 ARMA 与非参数 AR 为代表例）的若干估计量。方法无需依赖 bootstrap 重抽样，而是通过解析近似直接量化依赖结构对 prediction error 各分量的影响，理论上适用于高维向量序列。模拟显示有限样本表现良好，且可直接用于以预测为目的的模型选择。对您可能有用：本文的非参数 AR 模型下 prediction error 估计框架，可为 longitudinal causal inference 中序列依赖数据的 outcome prediction 评估提供解析工具。
关键技术: bias-variance decomposition approximation, time series prediction error estimation, nonparametric autoregressive processes, causal invertible ARMA, analytical bias correction
为什么对您有用: 本文连接到非参数理论子方向，具体处理了非参数 AR 过程下 prediction error 的解析估计，这是独立数据下 Efron covariance/df 估计在序列依赖的推广。研究者武器库中 very_familiar 的非参数统计与 minimax bounds 可直接审视本文非参数 AR 设定下估计量的收敛率是否达到 minimax optimal，以及 bias 近似阶是否紧。立即可做：用 very_familiar 的非参数统计工具验证本文非参数 AR 情形下各估计量的渐近性质与最优性。

5. 10.1093/biomet/asad041 — A cross-validation-based statistical theory for point processes¶

作者: Ottmar Cronie, Mehdi Moradi, Christophe A N Biscio
期刊/来源: Biometrika
机构: Chalmers University of Technology · University of Gothenburg · Umeå University · Aalborg University
分类: vol 111 · issue 2 · pp 625-641
相关性 4/10 · novelty: new_method
摘要: 本文针对一般点过程，提出了基于交叉验证的统计理论框架。通过点过程 thinning 技术将数据分为训练集和验证集，并定义预测误差度量两个点过程间的差异，从而评估模型预测能力。该框架可统一多种现有方法，并建立了大样本理论性质。特别地，将非参强度估计视为 Papangelou 条件强度估计，应用于核强度估计的带宽选择，并证明基于独立 thinning 的交叉验证方法在带宽选择上显著优于现有方法。对您而言，本文的交叉验证思路可推广至您熟悉的非参估计问题，例如用类似方法为其他核估计或模型选择提供新工具。
关键技术: cross-validation for point processes, thinning-based data splitting, prediction errors for point processes, Papangelou conditional intensity, kernel intensity estimation, bandwidth selection
为什么对您有用: 本文拓展了交叉验证在非参估计中的应用，直接关联您的非参统计兴趣方向。您非常熟悉非参统计工具（如核估计、带宽选择），可立即可用本文的 thinning 交叉验证框架在您自己的非参模型中检验其性能。中期可做的方向：将本文概念与您擅长的 minimax 界工具结合，分析该交叉验证方法的理论最优性。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1093/biomet/asad055 · arXiv — Selective machine learning of doubly robust functionals¶

作者: Y Cui, E J Tchetgen Tchetgen
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 517-535
相关性 9/10 · novelty: new_method
摘要: 在半参数模型下，针对具有双重稳健（doubly robust）估计函数的有限维泛函（如 ATE），本文提出了一种选择性机器学习框架以进行 nuisance 参数的模型选择。核心机制是引入基于双重稳健性启发的新定义“伪风险”（pseudo risk）作为选择准则，该准则旨在最小化泛函估计对 nuisance 参数扰动的敏感性，从而实现偏差缩减。作者对多折交叉验证版选择准则建立了 oracle 性质，证明经验准则的表现几乎与事先已知各候选学习器对伪风险的 oracle 一致。仿真与实际数据应用展示了该方法在 ATE 估计中从候选机器学习器集合里进行 nuisance 模型选择的有效性。对您可能有用：本文为 DML / debiased ML 中的 nuisance 模型选择提供了理论化的偏差缩减视角，直接连接到效率理论与半参数推断。
关键技术: doubly robust estimating function, pseudo risk for model selection, multi-fold cross-validation oracle property, bias reduction in semiparametric functional estimation, nuisance parameter selection, average treatment effect estimation
为什么对您有用: 本文直接连接到效率理论（semiparametric efficiency / debiased ML）中的 nuisance 参数选择问题，填补了 DML 框架下如何系统化挑选 nuisance learner 的理论空白。研究者可用 very_familiar 中的 minimax bounds 工具审视该 pseudo risk 准则的收敛率是否达到极小化最优，或结合 moderately_familiar 的 HOIF / semiparametric theory 探索在更高阶影响函数下该选择准则的扩展。判断：立即可做——用 very_familiar 的 minimax 估计理论即可动手分析其 oracle property 的 rate tightness。

数理统计 / 假设检验 (hypothesis_testing, 8 篇)¶

1. 10.1093/biomet/asad045 · arXiv — Covariate-adjusted log-rank test: guaranteed efficiency gain and universal applicability¶

作者: Ting Ye, Jun Shao, Yanyao Yi
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 691-705
相关性 8/10 · novelty: new_method
摘要: 针对右删失生存数据临床随机对照试验，提出一种协变量调整的对数秩检验方法，适用于协变量自适应随机化（如分层区组随机化和Pocock-Simon最小化）和简单随机化。检验统计量具有简单的显式公式，基于非参数地利用协变量与结局的相关性，且保证相对于未调整对数秩检验的渐近效率增益。理论证明该检验在多种随机化方案下渐近正态且保持名义I类错误率，而传统未调整检验在协变量自适应随机化下方差估计可能不一致。模拟研究验证了该方法的I类错误控制和功效优势。该工作将临床试验中协变量调整的效率增益思想从估计推广到检验，并给出了统一的适用性理论，对从事非参数假设检验和半参数效率理论的研究者具有直接参考价值。
关键技术: covariate adjustment, log-rank test, covariate-adaptive randomization, asymptotic efficiency gain, nonparametric adjustment formula
为什么对您有用: 直接连接假设检验中协变量调整的效率问题，属于核心兴趣子方向。可以用非常熟悉的非参数统计渐近理论（随机化检验的方差估计与中心极限定理）快速理解其论证结构，并评估调整项是否达到半参数效率界（半参数理论属 moderately_familiar 武器）。立即可做：无需新技能即可消化并部分复现理论结果，甚至可尝试将调整公式推广到其他秩检验。

2. 10.1093/biomet/asad062 — Likelihood-based inference under nonconvex boundary constraints¶

作者: J Y Wang, Z S Ye, Y Chen
期刊/来源: Biometrika
机构: National University of Singapore · University of Pennsylvania
分类: vol 111 · issue 2 · pp 591-607
相关性 7/10 · novelty: new_theory
摘要: 在参数空间受非凸边界约束的设定下，研究 MLE 与 LRT 的大样本性质；关键 regularity 假设为真实参数落在非凸约束区域的边界点上。核心机制是利用凸分析中的 tangent cone 与 normal cone 对非凸约束做局部凸化近似，从而将经典凸边界下的 Chernoff–Self 型极限分布推广到非凸场景；MLE 的收敛速率与极限分布由 tangent cone 上的投影决定，LRT 的极限分布则表现为正态向量在局部凸化锥上的二次型。文中还提出基于多面体锥投影的一般 Monte Carlo 算法来逼近该非标准极限分布。五个实例（stereotype logistic、遗传关联、基因–环境交互、成本约束回归、公平约束回归）验证了理论。对您有用：将 Chernoff–Self 边界检验理论从凸约束拓展到非凸，直接丰富了 hypothesis testing 与 M-estimation 在约束空间下的效率与极限分布工具箱。
关键技术: nonconvex boundary constraint, tangent cone projection, Chernoff–Self limiting distribution, likelihood ratio test under constraint, Monte Carlo limiting distribution approximation, local convexification via normal cone
为什么对您有用: 直接连接 hypothesis testing 子方向：将经典凸边界下 LRT 的 Chernoff–Self 理论拓展到非凸约束，填补了约束参数空间中极限分布与 inference 的空白。用您 very_familiar 的 M-estimation theory 与 moderately_familiar 的 minimax / semiparametric theory 可以攻的口子：非凸约束下 MLE 的局部凸化近似是否可以进一步给出 semiparametric efficiency bound 或更高阶的 Bahadur 展开。立即可做：用 very_familiar 的 M-estimation 与 minimax 工具验证文中 tangent cone 近似在更复杂半参数约束下的可推广性，并尝试推导非凸约束下 one-step/debiased estimator 的极限分布。

3. 10.1093/biomet/asad050 · arXiv — More efficient exact group invariance testing: using a representative subgroup¶

作者: N W Koning, J Hemerik
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 441-458
相关性 7/10 · novelty: new_method
摘要: 本文研究分布在代数群变换（如排列、符号翻转）下不变性的检验问题。由于完整群规模巨大，基于全群检验计算不可行，传统做法是随机抽取一个子集。本文提出用策略选择的固定子群替代随机子集，在广义位置模型中证明由此得到的检验对更低的信噪比仍能保持一致性，并将这一功率提升类比为t检验到Z检验的效率增益。在多重检验（如基于排列的FDR控制）中，该方法能大幅减少所需排列次数而保持相同功效。本文还给出了子群选择的具体准则和理论保证。对您而言，这一工作直接连通假设检验中的精确检验与多重检验，您可以用非常熟悉的非参数统计理论分析该方法在不同群结构（如图对称群）下的功率边界。
关键技术: group invariance testing, permutation test, representative subgroup, multiple testing, exact test
为什么对您有用: （1）本文主题是假设检验中的群不变性检验，属于您 primary interest 中的 hypothesis testing 和 nonparametric 范畴；（2）您非常熟悉的非参数统计、minimax 下界工具可以直接用来刻画该方法的检验一致性区域，例如在更复杂的群结构（如图对称群）下分析其最优性；（3）立即可做：用非参数渐近理论和反事实分布刻画该方法的功率函数，无需额外技术储备。

4. 10.1093/biomet/asad057 · arXiv — E-values as unnormalized weights in multiple testing¶

作者: Nikolaos Ignatiadis, Ruodu Wang, Aaditya Ramdas
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 417-439
相关性 6/10 · novelty: new_method
摘要: 本研究探讨如何结合p-values和e-values设计多重检验程序，目标是在每个假设同时可获得两类统计量时构造更灵活的加权方法。传统加权多重检验要求权重确定性地加和为假设总数，本文证明当权重是独立于p-values的e-values时，无需此归一化条件，从而允许数据驱动的权重具有更大变异性。该独立性在元分析中自然成立：用主数据集计算p-values，用独立辅助数据集计算e-values。此外，论文展示了在单个数据集上通过样本分裂等技巧构造独立e-values和p-values的方法，无需依赖外部数据。理论证明所提程序能在弱假设下控制错误发现率，且当非零假设的e-values远大于1时功效显著提升。对您而言，本研究将e-values框架引入多重检验，直接关联您对假设检验理论的主要兴趣，并提供了加权方法的新视角，您可以用minimax理论评估其最优性。
关键技术: e-values, p-values, weighted multiple testing, data-driven weights, independent construction, meta-analysis
为什么对您有用: 该论文属于假设检验领域，直接对应您的主要兴趣中的‘hypothesis testing’子方向。您熟悉多重检验的经典理论（如BH过程），而本文提出的e-values加权机制开辟了非归一化权重的理论路径，您可以用very_familiar中的minimax bounds工具分析其功效的sharpness，或探索将其与您掌握的U-statistics构造相结合。follow-up判档为立即可做：您已有的假设检验理论储备足以理解并批判本文，且可能启发新的加权方法设计。

5. 10.1093/biomet/asad047 — τ-censored weighted Benjamini–Hochberg procedures under independence¶

作者: Haibing Zhao, Huijuan Zhou
期刊/来源: Biometrika
机构: Shanghai University of Finance and Economics
分类: vol 111 · issue 2 · pp 479-496
相关性 6/10 · novelty: new_method
摘要: 本文研究在独立零假设下利用辅助信息进行多重检验的加权Benjamini–Hochberg（BH）程序，目标是在有限样本下控制错误发现率（FDR）。针对Ignatiadis & Huber（2021）提出的交叉加权方法因折叠内平衡而导致功效损失的问题，作者提出了两种新的数据驱动权重构造方法。第一种为留一法，通过计算权重关于p值的下确界来屏蔽单个p值在权重中的信息，从而避免过拟合。第二种为部分信息法，利用每个p值自身的部分信息及条件分布构造权重，并据此建立FDR控制的理论保证。此外，文章还提出了两种估计零比例的方法，并将其融入权重以进一步提升检验功效。理论证明主要依赖于p值独立的假设与条件分布技巧。本文直接对应研究者的“假设检验”兴趣方向，其中的留一法与屏蔽技巧可推广至更复杂的依赖结构或与半参数推断结合，具有参考价值。
关键技术: weighted Benjamini–Hochberg, τ-censored, data-driven weights, leave-one-out, cross-weighting, false discovery rate control
为什么对您有用: 该论文直接对准主要兴趣中的“假设检验”子方向，专注于有限样本下FDR控制的新方法。研究者非常熟悉的高维渐近与非参数工具可用于评估该方法在依赖p值或高维稀疏检验场景下的稳健性，且文中屏蔽信息的技巧与交叉验证思想可迁移至因果推断中的多重比较问题（例如mediator筛选中控制FDR）。从follow-up看，这项工作属于立即可做范围——利用very_familiar的高维渐近理论分析其扩展方向，或直接开发软件实现该程序。

6. 10.1093/biomet/asad078 · arXiv — On selection and conditioning in multiple testing and selective inference¶

作者: Jelle J Goeman, Aldo Solari
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 393-416
相关性 5/10 · novelty: new_theory
摘要: 本文研究多重假设检验中的选择-条件推断方法（selective inference）。这类方法分两步：先根据数据从全假设宇宙中选出一个子集，再条件于该选择事件对子集内的假设进行推断。作者将选择和条件推断视为一个整体框架，与直接在全假设空间上控制错误率（如FWER或FDR）的多重测试方法进行理论比较。主要结论是：直接方法在统计功效上始终不弱于（有时严格优于）选择-条件方法，即使假设空间是无穷大或仅隐含定义（如数据分裂）时也成立。作者通过数据分裂、数据雕刻（data carving）和基于polyhedral lemma的lasso后选择推断等案例，展示了转向无条件/非选择视角可能带来的功率增益。该理论统一了多种常见选择性推断方法，并揭示了条件推断在控制信息利用上的根本局限。对您而言，这是一篇直接对话假设检验子方向的理论文章，可丰富您对多重比较与条件推断关系的理解。
关键技术: selective inference, post-selection inference, polyhedral lemma, data carving, multiple testing, false discovery rate
为什么对您有用: 本文直接关联您的首要兴趣——数学统计中的假设检验，提供了一个关于选择性推断与直接多重测试比较的统一理论框架。您可以运用熟悉且亲密的非参统计工具来审视该框架的普适性，例如检验其在非参数多组比较中的推广。结论已清晰，属于立即可做的理论阅读，无需额外工具储备。

7. 10.1093/biomet/asad044 — An anomaly arising in the analysis of processes with more than one source of variability¶

作者: H S Battey, Peter McCullagh
期刊/来源: Biometrika
机构: Imperial College London · University of Chicago
分类: vol 111 · issue 2 · pp 677-689
相关性 5/10 · novelty: new_theory
摘要: 在含多个变异来源（如随机效应/方差分量）的模型中，Wald 统计量常对方差分量的显著性给出糟糕评估，本文旨在解析这一异常现象的几何根源。通过两个简单模型（含嵌套/交叉方差分量结构），作者指出参数空间在零假设边界处呈现非典型几何（如参数空间边界非光滑、信息矩阵在边界处退化），导致 Wald 统计量的标准 χ² 渐近失效。相比之下，似然比检验（LRT）因自洽地反映了边界约束与参数空间的非标准几何，其渐近分布（如混合 χ²）能正确校准检验水平。结论呼应 Dickey (2020)：方差分量推断应始终使用 LRT 而非 Wald。对您有用：本文揭示了边界假设下 Wald 与 LRT 渐近行为的差异，直接关联您对 hypothesis testing 与 semiparametric theory 的兴趣。
关键技术: Wald statistic, likelihood-ratio test, variance component testing, boundary hypothesis geometry, mixed chi-squared asymptotics, parameter space singularity
为什么对您有用: 本文直接关联您 primary interest 中的 hypothesis testing 子方向，聚焦方差分量边界假设下 Wald 与 LRT 的渐近失效/自洽问题，属于经典数学统计的精细分析。您 very_familiar 中的 minimax bounds 与 moderately_familiar 中的 M-estimation theory 可直接攻入本文的几何异常论证——例如用 M-estimation 的边界条件理论验证其非典型几何是否可推广至 semiparametric 边界假设。Follow-up 判断：立即可做——用您熟悉的 M-estimation 与渐近理论工具，可立刻展开对更复杂 blocking/longitudial 设计下类似几何异常的推广分析。

8. 10.1093/biomet/asad079 — The state of cumulative sum sequential changepoint testing 70 years after Page¶

作者: Alexander Aue, Claudia Kirch
期刊/来源: Biometrika
机构: University of California, Davis · Otto-von-Guericke-Universität Magdeburg
分类: vol 111 · issue 2 · pp 367-391
相关性 3/10 · novelty: survey
摘要: 本文回顾了 Page (1954) 提出累积和（CUSUM）控制图以来，序贯变点检测在七十年间的发展，聚焦于非参数在线序贯变点检验。设定为：观测序列在未知时间点发生分布变点，目标是在维持预设 Type-1 error（而非传统最小化平均游程长度 ARL）的前提下尽快报警。核心机制梳理了从经典 CUSUM、Page 检验到基于累积过程的非参数检验（如 MOSUM、CUSUM of residuals）的演进，重点阐述了在回归与时间序列（弱依赖）等复杂模型下，如何通过泛函中心极限定理（FCLT）与渐近临界值设计实现误差控制。主要理论贡献是系统总结了非参数序贯检验的渐近理论框架与收敛性质（如 under null 的分布极限、under alternative 的检测延迟界）。对您有用：本文为序贯假设检验与变点检测提供了清晰的非参数渐近理论入口，直接补充了 mathematical statistics 中 hypothesis testing 的非参数序贯视角。
关键技术: sequential changepoint detection, CUSUM control chart, nonparametric online monitoring, Type-1 error control, functional central limit theorem, average run length
为什么对您有用: 本文直接连接到 primary interest 中的 mathematical statistics (hypothesis testing) 子方向，系统梳理了非参数序贯检验的渐近理论与 Type-1 error 控制逻辑，而非传统的 ARL 最小化。研究者武器库中的 nonparametric statistics 与 minimax bounds 视角可直接切入本文所总结的渐近临界值与检测延迟界分析，评估其 rate 是否紧。Follow-up 判断：立即可做——用 very_familiar 的 nonparametric statistics 与 minimax bounds 工具即可审视文中非参数检验的渐近效率与 rate 紧性。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1093/biomet/asad049 · arXiv — Deep Kronecker network¶

作者: Long Feng, Guang Yang
期刊/来源: Biometrika
分类: vol 111 · issue 2 · pp 707-714
相关性 2/10 · novelty: new_method
摘要: 本文针对医学影像数据（MRI、fMRI、CT等）样本量小、模型可解释性要求高的特点，提出深度Kronecker网络（Deep Kronecker Network）。该方法假设系数具有Kronecker乘积结构，隐式施加分段光滑约束，可同时处理矩阵与张量表示的图像数据，适用于离散与连续响应变量。在结构上，它可等价表达为全卷积网络，并与Zhou等（2013）的张量回归框架之间建立了联系——后者对张量系数施加CANDECOMP/PARAFAC低秩结构。作者在阿尔茨海默病神经影像学倡议（ADNI）的真实MRI数据上进行了分类和回归分析，展示了方法的有效性。从统计计算角度看，Kronecker乘积结构天然适合用einsum等张量收缩库高效实现，与您熟悉的高阶U-统计量计算中的张量网络优化有技术重合。
关键技术: Kronecker product, deep convolutional network, tensor regression, piecewise smooth coefficient, low sample size medical imaging
为什么对您有用: 本文属于统计计算方向的新方法，与您technical_arsenal中very_familiar的computation of higher-order U-statistics (treewidth / tensor contraction / einsum)直接相关——Kronecker乘积结构可借助einsum张量收缩库高效实现，且其计算复杂度分析可借鉴张量网络代价模型。您的einsum编程能力使您立即可做：可以尝试实现该网络的快速推理或反向传播，或比较其与标准卷积网络的计算效率。此外，本文的应用场景（小样本、可解释性）对您可能关注的流行病学影像数据有参考价值。

Maintained by 陈星宇 · Homepage · Source on GitHub