Biometrika — Vol 113 Issue 2 · 2026-05-26¶

共 14 篇 · Biometrika

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

这一期《Biometrika》共14篇论文，整体上可归纳为四条主线：因果推断与敏感性分析（2篇）、高维随机矩阵与因子模型（4篇）、非参数/半参数方法与流形推断（3篇）、假设检验与决策理论（3篇），另有2篇分属极值相依与点过程谱分析。因果推断与高维随机矩阵两条主线最为突出，前者聚焦于识别策略与鲁棒性量化，后者则围绕spike检测、重尾张量因子与多视角子空间分离展开。

在因果推断主线中，两篇论文分别从识别与敏感性两个方向推进。Assumption-lean post-integrated inference 将负控制结局推广为代理-控制结局，在隐藏中介与混杂下实现投影直接效应的非参数识别，估计量兼具双重稳健性与半参数有效性，并用随机森林与单细胞CRISPR数据验证。Calibrated sensitivity models 则直接处理敏感性分析中基准校准的误读问题，将未测量混杂约束为已测量混杂的倍数，在doubly robust非参数条件下构造ATE bounds的有效估计量，并纳入已测量混杂估计的不确定性，发现鲁棒性可能比标准方法更强或更弱。两篇共同指向因果推断中识别与敏感性分析的精细化。

高维随机矩阵主线有四篇，覆盖logistic回归、PCA、因子模型与多视角子空间。Diaconis–Ylvisaker prior penalized likelihood 在proportional asymptotics下证明DY-penalized MLE始终存在，并构造了渐近无偏的rescaled estimator与调整Z统计量。Estimating the number of significant components 利用非spike特征值的Marchenko-Pastur型rigidity构造惩罚项，在独立与时间序列数据下均一致，且允许bulk异质性。Tail-robust factor modelling 针对重尾张量时间序列，仅需$(2+2\epsilon)$阶矩，通过截断与张量分解两步法实现估计，收敛速率显式依赖$\epsilon$。A spectral framework for multi-view subspace learning 分析投影矩阵乘积的谱扰动，结合旋转bootstrap与RMT工具将观测谱划分为joint、individual与噪声三部分，为多视角子空间分离提供了可操作的谱诊断。

非参数/半参数主线中，Inferring manifolds using Gaussian processes 将流形重构转化为局部回归问题，利用局部协方差矩阵收敛性为GP先验提供依据，实现概率式流形插值与去噪。Asymptotics for a class of parametric martingale posteriors 为参数化martingale posterior建立了predictive CLT与Bernstein–von Mises定理，大幅加速推断且避免MCMC。Spectral estimation for point processes and random fields 将点过程与随机场的谱估计统一到multitaper-DFT框架，在不规则域上保持经典收敛性质。假设检验主线中，Treatment choice with nonlinear regret 推翻了线性后悔下单点规则本质完备的经典结论，聚焦均方后悔推导出闭式最优处理分数。Asymptotic validity and finite-sample properties of approximate randomization tests 给出了非渐近bound量化近似随机化检验的size偏差。Robust universal inference 将有限样本有效推断拓展至误设定模型，为pseudo-true参数构建置信集。

与因果推断方向最贴的优先看：Assumption-lean post-integrated inference、Calibrated sensitivity models。与半参数效率方向最贴的：Assumption-lean post-integrated inference（双重稳健与半参有效）、Calibrated sensitivity models（doubly robust下的效率界）。与高维随机矩阵方向最贴的：Diaconis–Ylvisaker prior penalized likelihood、Estimating the number of significant components、Tail-robust factor modelling、A spectral framework for multi-view subspace learning。

因果推断 (causal_inference, 2 篇)¶

1. 10.1093/biomet/asag004 — Assumption-lean post-integrated inference with surrogate-control outcomes¶

作者: Jin-Hong Du, Kathryn Roeder, Larry Wasserman
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_method
摘要: 在数据整合与潜在异质性设定下，本文研究如何对投影直接效应（projected direct-effect estimands）进行假设-精简（assumption-lean）的半参数推断。通过因果视角，作者利用负控制结局（negative-control outcomes）实现直接效应的非参数识别，并将负控制推广为代理-控制结局（surrogate-control outcomes）以应对隐藏中介、混杂与调节变量。所提估计量具有双重稳健性，在嵌入有误或模型错配下仍一致且半参数有效，并给出有限样本线性展开与均匀集中界。实证部分用随机森林与单细胞 CRISPR 数据验证方法。对您有用：本文将 proximal CI 的 negative-control 框架拓展至 surrogate-control，结合 DR 与 cross-fitting，直接对接您在 proximal CI 与半参数效率理论上的兴趣。
关键技术: negative-control outcomes, surrogate-control outcomes, doubly robust estimation, semiparametric efficiency, uniform concentration bounds, projected direct-effect estimands
为什么对您有用: 本文直接推进 proximal CI 的 negative-control 设定，将识别与估计拓展至 surrogate-control outcome，是您 proximal CI 与半参数效率理论子方向的近期前沿。您武器库中的 semiparametric theory 与 estimation theory in causal inference 可直接审视其 DR estimator 的 influence function 构造与 uniform concentration bound 的紧性。立即可做：用 very_familiar 的 minimax bounds 与 moderately_familiar 的 HOIF 视角，检验其声称的 efficiency 是否达到 bound，或探索 higher-order IF 是否能进一步收紧 finite-sample bias。

2. 10.1093/biomet/asag001 — Calibrated sensitivity models¶

作者: A McClean, Z Branson, E H Kennedy
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_method
摘要: 在因果推断敏感性分析中，传统敏感性参数（量化未测量混杂程度）常难以解释；本文提出 calibrated sensitivity models，将未测量混杂直接约束为已测量混杂的倍数，解决 benchmarking 中校准估计误读与不确定性忽略的问题。针对三种校准敏感性模型，作者在 doubly robust 非参数条件下构造了 ATE bounds 的 efficient estimator，建立参数效率与渐近正态性。纳入已测量混杂估计的不确定性后，发现因果分析对未测量混杂的鲁棒性可能比标准方法提示的更强或更弱——取决于校准倍数与估计精度。实证以母亲吸烟对婴儿出生体重的影响为例。本文直接连接您 primary interest 中的 causal inference sensitivity analysis 与 semiparametric efficiency theory。
关键技术: doubly robust estimation, semiparametric efficiency bound, calibrated sensitivity analysis, benchmarking uncertainty, ATE bounds under confounding, asymptotic normality
为什么对您有用: 本文直接命中您 primary interest 中 causal inference 的 sensitivity analysis 子方向，同时涉及 semiparametric efficiency bounds（efficient estimator 在 DR 条件下的参数效率）。您 very_familiar 的「estimation theory in causal inference」可直接切入其 efficient estimator 构造与 influence function 推导；moderately_familiar 的「semiparametric theory」可验证其声称的 parametric efficiency 是否紧。Follow-up 判断：立即可做——用您熟悉的 DR/IF 工具即可探索将 calibrated sensitivity 框架推广到 longitudinal 或 mediation 设定，或用 HOIF 分析 bound estimator 的 higher-order 行为。

高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)¶

1. 10.1093/biomet/asag014 — Diaconis–Ylvisaker prior penalized likelihood for $ p/n\to\kappa\in(0,1) $ logistic regression¶

作者: P Sterzinger, I Kosmidis
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_theory
摘要: 在 logistic 回归的 proportional asymptotics 设定下（p/n → κ ∈ (0,1)，协变量为多元正态且线性预测量渐近方差为 γ²），本文研究 Diaconis–Ylvisaker (DY) 先验 penalized likelihood estimator 的渐近行为。MLE 在高维下仅对狭窄的 (κ, γ) 组合存在，而 DY-penalized MLE 始终存在且可直接用标准 MLE 程序计算。作者构造了一个 rescaled estimator 实现渐近 aggregate bias 为零，并定义了 adjusted Z-statistics 与 rescaled penalized likelihood ratio statistic，使其在 null 下恢复标准渐近分布。文中还研究了 shrinkage 性质、与其它 proportional asymptotics 方法（如 debiased / corrected MLE）的对比，并提出含 intercept 模型的扩展猜想。对您有用：本文提供了 logistic 回归在 p/n → κ 下的精确渐近校正框架，直接连接到您的高维渐近与 efficiency theory 兴趣，且其 rescaled estimator 的构造思路可类比 debiased ML 的 bias-correction 逻辑。
关键技术: Diaconis-Ylvisaker prior penalized likelihood, proportional asymptotics (p/n → κ), rescaled estimator with zero aggregate bias, adjusted Z-statistic, penalized likelihood ratio statistic, high-dimensional logistic regression
为什么对您有用: 本文直接触及您的高维渐近（proportional asymptotics）与 efficiency theory（bias correction / adjusted inference）两个 primary interest 子方向。您武器库中 very_familiar 的 'high-dimensional asymptotics' 与 moderately_familiar 的 'semiparametric theory' 可直接用来审视其 rescaled estimator 的 influence function 结构是否与 one-step / debiased ML 等价，以及其 adjusted Z-statistic 的渐近方差是否达到 semiparametric efficiency bound。Follow-up 判断：立即可做——用您熟悉的高维渐近工具验证其 bias-correction 机制的 influence function 展开，并对比 Sur & Candès (2019) 等 corrected MLE 路线的效率性质。

2. 10.1093/biomet/asaf092 — Estimating the number of significant components in high-dimensional principal component analysis¶

作者: Bo Zhang, Zhixiang Zhang, Guangming Pan
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 8/10 · novelty: weaker_assumption
摘要: 在高维 PCA spiked covariance 设定下（p, n → ∞），目标是估计显著成分的数量。作者提出基于 explained variance ratio 与非 spike 样本特征值 rigidity 性质的新惩罚方法，利用随机矩阵理论中非 spike 特征值的 rigidity（Marchenko-Pastur 型）构造惩罚项以区分 spike 与非 spike。与 AIC/BIC 及现有高维方法相比，该估计量不仅在独立数据下一致，还在某些时间序列数据下保持一致性，且允许 population eigenvalues bulk 的异质性，弱化了现有文献条件。模拟验证了有限样本表现。对您可能有用：该文将 RMT rigidity 直接用于模型选择，与您的高维统计与 RMT primary interest 直接对接。
关键技术: explained variance ratio, sample eigenvalue rigidity, Marchenko-Pastur law, spiked covariance model, penalized model selection, high-dimensional PCA
为什么对您有用: 本文直接连接您的高维统计与 RMT primary interest，利用非 spike 特征值的 rigidity（Marchenko-Pastur 型）构造 spike 数量估计，属于 RMT 在高维 inference 的典型应用。您 very_familiar 的高维渐近理论可直接攻读本文的 consistency 证明；若想拓展到时间序列或更一般依赖结构，需在 moderately_familiar 的 M-estimation 理论上补充依赖数据的 empirical process 工具。立即可做：用您熟悉的高维渐近与 RMT 武器验证其 rigidity-based penalty 的阈值选择是否紧，并可考虑将该方法推广到您熟悉的 inverse problems with random noise 设定。

3. 10.1093/biomet/asaf093 — Tail-robust factor modelling of vector and tensor time series in high dimensions¶

作者: Matteo Barigozzi, Haeran Cho, Hyeyoung Maeng
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 5/10 · novelty: weaker_assumption
摘要: 在高维向量与张量时间序列的因子模型设定下，本文解决重尾数据导致极端观测时的估计问题，假设仅存在 $(2+2\epsilon)$ 阶矩（$\epsilon\in(0,1)$）。核心方法是将数据截断（truncation）与张量分解的两步法结合，无需迭代求解即可实现。理论证明了估计量的一致性与渐近正态性，收敛速率显式依赖于 $\epsilon$，刻画了重尾与截断水平的交互影响；同时提出了因子数的一致选择准则。实证在宏观经济数据集上验证了方法表现。对您有用之处在于：张量时间序列因子模型与您的高维统计/随机矩阵理论兴趣直接相连，且截断机制下的渐近理论为重尾设定提供了新的 rate 分析视角。
关键技术: tensor factor decomposition, data truncation for heavy tails, moment condition (2+2epsilon), asymptotic normality under weak moments, factor number selection criterion, two-step estimation
为什么对您有用: 直接连接您的高维统计与随机矩阵理论兴趣，特别是因子模型在重尾弱矩条件下的 rate 分析。您武器库中 very_familiar 的高维渐近与 minimax bound 可直接用于检验本文声称的 $\epsilon$-依赖 rate 是否紧，以及截断阈值的最优性——属于立即可做的 follow-up。张量分解的两步法也触及您 moderately_familiar 的 M-estimation 理论，可进一步分析其 influence function。

4. 10.1093/biomet/asaf088 — A spectral framework for multi-view subspace learning using the product of projections¶

作者: R Sergazinov, A Taeb, I Gaynanova
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 4/10 · novelty: new_theory
摘要: 在多视角高维数据设定下，目标是识别共享(joint)与独特(individual)信号子空间，关键regularity假设涉及信号秩与环境维度之比、真实子空间间主夹角及噪声水平。本文通过分析各视角估计子空间投影矩阵之乘积的谱扰动，严格量化了可靠分离joint与individual子空间的条件。估计算法结合旋转bootstrap与随机矩阵理论(Marchenko-Pastur类工具)将观测谱划分为joint、individual与噪声三部分，并提供诊断图可视化谱分割。模拟与多组学数据应用表明子空间估计精度及下游预测优于现有方法。对您可能有用：本文将RMT谱扰动分析引入多视角子空间分离，为高维RMT在多模态数据结构识别中的应用提供了清晰框架。
关键技术: product of projection matrices, spectral perturbation analysis, random matrix theory, rotational bootstrap, principal angles between subspaces, multi-view subspace separation
为什么对您有用: 本文直接连接高维统计与随机矩阵理论(RMT)在多视角数据中的应用，用投影矩阵乘积的谱扰动严格量化子空间分离条件，属于primary interest中RMT方向的实质性推进。您武器库中very_familiar的高维渐近理论可直接攻其谱扰动分析部分，moderately_familiar的M-estimation理论可切入其bootstrap推断环节。立即可做：用您熟悉的高维渐近与RMT工具验证/扩展其谱分割阈值在不同噪声结构下的紧性。

非参数 / 半参数 (nonparam_semipara, 5 篇)¶

1. 10.1093/biomet/asag011 — Inferring manifolds using Gaussian processes¶

作者: David B Dunson, Nan Wu
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 4/10 · novelty: new_method
摘要: 本文研究从噪声数据中推断低维 Riemannian 流形的问题，目标是获得流形本身的概率估计而非仅做坐标降维。核心方法利用局部协方差矩阵的理论性质，将全局流形重构转化为局部回归问题，进而用 Gaussian process (GP) 进行概率式流形插值与重构。理论贡献包括刻画局部协方差矩阵在流形附近的收敛行为，为 GP 先验的选取提供依据；估计的流形可在数据点间插值并用于去噪。该方法在非参数流形估计中引入了 GP 的贝叶斯不确定性量化，对您在非参数统计与 semiparametric theory 方向的兴趣有直接连接。
关键技术: local covariance matrix, Gaussian process regression, manifold reconstruction, local-to-global reduction, Riemannian manifold estimation, probabilistic interpolation
为什么对您有用: 本文直接连接到您的 nonparametric statistics 与 semiparametric theory 兴趣：局部协方差矩阵的收敛分析本质上是非参数局部回归的 minimax 问题，GP 先验选取可从 semiparametric efficiency 视角审视。您 very_familiar 的 minimax bounds 与 inverse problems with random noise 工具可直接用于分析该局部回归步骤的收敛率是否达到 minimax optimal。立即可做：用 minimax bound 验证文中局部协方差矩阵估计的收敛率是否紧，并探索是否可用 HOIF 改进其 semiparametric efficiency。

2. 10.1093/biomet/asag007 — Asymptotics for a class of parametric martingale posteriors¶

作者: E Fong, A. Yiu
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 2/10 · novelty: new_theory
摘要: 在 martingale posterior 框架下，使用 plug-in parametric predictive densities 与 SGD 构建参数化 martingale posterior，研究其大样本渐近性质。核心贡献是两个基于 martingale limit theory 的 CLT：第一个是 predictive CLT，允许用正态近似做 hybrid sampling，将 predictive resampling 大幅加速且完全避免 MCMC；第二个是首次为 martingale posterior 建立 Bernstein–von Mises 定理，保证 posterior 在大样本下自动达到 frequentist 覆盖与效率。模拟与真实数据验证了理论结果。BvM 结果对您研究 semiparametric efficiency bounds 有参考价值——它刻画了 posterior 何时自动达到 efficient rate，与经典 semiparametric BvM 问题同构。
关键技术: martingale posterior, predictive resampling, Bernstein-von Mises theorem, martingale central limit theorem, stochastic gradient descent, hybrid normal-approximation sampling
为什么对您有用: (1) 连接到 efficiency theory 子方向：BvM 定理刻画 posterior 是否达到 efficient rate，是 semiparametric efficiency 的 Bayesian 侧对应问题；(2) 用 technical_arsenal 中的 "semiparametric theory" 可以审视其 BvM 条件能否推广到 semiparametric 设定（当前仅 parametric，推广路径尚不明）；(3) 中期可做——需先在 "M-estimation theory" 上补 martingale limit theory 工具链，才能将 BvM 推广到 semiparametric martingale posterior。

3. 10.1093/biomet/asaf089 — Spectral estimation for point processes and random fields¶

作者: J P Grainger, T A Rajala, D J Murrell, S C Olhede
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 2/10 · novelty: new_method
摘要: 本文针对空间点过程与随机场的联合谱分析问题，提出了一套基于 multitaper 的统一推断框架，estimand 为跨不同观测类型（格点数据、点过程、随机采样）的 partial association 谱度量。核心机制是耦合离散与连续 data taper 并结合 tapered DFT，在非 Cartesian 乘积域上构造不规则域 taper，实现快速计算；估计量具有大有限域与渐近性质，并提供了基于谱的显著性检验方法。理论贡献在于将点过程与随机场的谱估计统一到同一 multitaper-DFT 框架，并在不规则域下保持了经典谱估计的收敛性质。对您可能有用：该框架的 taper 设计与 DFT 快速实现思路，可迁移到高维统计中随机矩阵谱估计或逆问题的数值计算场景。
关键技术: multitaper spectral estimation, tapered discrete Fourier transform, coupled discrete-continuous data taper, irregular domain taper, partial association spectral measure, fast Fourier implementation
为什么对您有用: 本文连接到非参数谱估计与统计计算（primary interest 的 stat_computing / nonparam_semipara 子方向）。用您 very_familiar 的 inverse problems with random noise 与 software development 武器，可以直接攻其 taper 构造与快速 DFT 实现的数值细节，验证不规则域下谱估计的收敛率是否与经典 minimax rate 一致。follow-up 判断：立即可做——用 very_familiar 的 minimax bounds 与数值方法工具即可展开对谱估计率的理论验证与计算实现。

4. 10.1093/biomet/asag015 — Characterizing extremal dependence on a hyperplane¶

作者: P Wan
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 1/10 · novelty: new_theory
摘要: 本文研究 d 维渐近相依变量的极值相依结构，将分析对象映射到与对角向量 𝟙 垂直的 (d−1) 维超平面上的随机向量。核心设定是 multivariate extremes 中的 asymptotic dependence，关键假设为变量间存在非平凡极值相依而非渐近独立。方法上，通过将极值相依刻画转化为超平面上的线性向量空间问题，使得 PCA 等基于线性运算的统计技术可直接用于降维近似 tail dependence；同时证明广泛使用的 Hüsler–Reiss 族对应于该超平面上的一个 Gaussian 族。主要理论结果给出了超平面表征的完备性以及 Hüsler–Reiss 与 Gaussian 的等价刻画。对您而言，本文将极值相依嵌入线性空间的思路与 semiparametric / nonparametric theory 中投影与降维的思想有结构相似性，可作为非参数极值统计的入门参考。
关键技术: extremal dependence characterization, hyperplane projection, principal component analysis for tail dependence, Hüsler-Reiss parametric family, multivariate extreme value theory
为什么对您有用: 本文属于非参数/半参数理论方向的极值统计子领域，将极值相依映射到超平面的线性空间表征与您熟悉的 minimax bounds / semiparametric projection 思路有结构类比，但极值统计的具体概率工具（regular variation、extreme value limit theorem）不在您的 very_familiar 武器库中。判断为中期可做：若想在极值相依的 estimation / inference 上做 semiparametric efficiency 或 minimax rate 方面的 follow-up，需先在 moderately_familiar 的 semiparametric theory 之外补上 regular variation 与 multivariate extremes 的基础概率工具。

5. 10.1093/biomet/asag021 — Palm distributions of superposed point processes for statistical inference¶

作者: M Beraha, F Camerlenghi, L Ghilotti
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 1/10 · novelty: new_theory
摘要: 本文研究独立点过程叠加（superposition）的 Palm 分布，目标是在一般空间点过程设定下给出叠加过程 Palm 分布的混合表示，关键假设是各子过程独立且具有已知 Palm 分布与矩测度。核心结果：叠加过程的 Palm 分布可写成各子过程 Palm 分布与矩测度的加权混合，形式简洁；进一步推广到高阶 Palm 分布与多过程叠加情形。两个统计应用：(1) 对被污染（corrupted）点过程做 minimum contrast 估计；(2) 对 shot noise Cox 过程推导高阶 Palm 分布的显式表达，并在有限叠加情形给出 Janossy 密度的可计算形式，从而开启 likelihood-based 推断。对您可能有用：Palm 分布与高阶矩测度的混合表示为高阶 U-statistic 在空间点过程上的投影提供了新视角，且 Janossy 密度的可计算性直接关联 likelihood-based 推断的计算复杂度问题。
关键技术: Palm distribution, superposition of point processes, moment measures, minimum contrast estimation, shot noise Cox process, Janossy density
为什么对您有用: 本文连接到非参数/半参数理论中的空间点过程推断，特别是高阶 Palm 分布的显式表达与 Janossy 密度的可计算形式。您武器库中 higher-order U-statistics 的 treewidth / tensor contraction 视角可直接攻 Janossy 密度计算复杂度这一口子——判断其组合求和结构是否可被 einsum 优化。follow-up 判断：立即可做——用 very_familiar 的 higher-order U-statistic 计算工具分析 Janossy 密度的求和与收缩结构。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)¶

1. 10.1093/biomet/asag008 — Treatment choice with nonlinear regret¶

作者: Toru Kitagawa, Sokbae Lee, Chen Qiu
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 8/10 · novelty: new_theory
摘要: 在 Manski (2004) 统计处理选择框架下，现有文献聚焦福利后悔的均值（线性后悔），本文提出最小化非线性变换后悔的均值，并证明对非线性后悔单点规则不再具有本质完备性——这推翻了线性后悔下单点规则本质完备的经典结论。聚焦均方后悔（mean-square regret），作者推导出有限样本下 Bayes 与 minimax 最优规则的闭式处理分数（treatment fractions），并将框架拓展至极限实验（limit experiments），使处理分数可解读为支持处理的证据强度。在正态回归模型与样本量计算中进行了应用示范。对您而言，本文将决策论处理选择与 minimax 最优性、极限实验直接挂钩，是数学统计与因果推断交叉处的新理论贡献。
关键技术: nonlinear regret transformation, essential completeness of singleton rules, finite-sample Bayes optimal rules, minimax optimal treatment fractions, limit experiments, mean-square regret
为什么对您有用: 本文直接连接您 primary interest 中的数学统计（决策论/假设检验）与因果推断（处理选择框架）。核心理论结果——非线性后悔下单点规则不再本质完备——可用您 very_familiar 的 minimax bounds 工具验证其 minimax 规则的紧性，并探索该框架在 semiparametric 模型下的拓展。立即可做：用 minimax 理论背景即可深入阅读，并尝试将闭式分数推广到更一般的非线性后悔函数类或半参数设定。

2. 10.1093/biomet/asaf085 — Asymptotic validity and finite-sample properties of approximate randomization tests¶

作者: Panos Toulis
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 6/10 · novelty: new_theory
摘要: 本文研究近似随机化检验（approximate randomization tests）的渐近有效性有限样本性质，核心 estimand 是检验的 size（第一类错误率），设定为数据在变换下具有不变性或通过 studentization 实现渐近有效的框架。主要理论贡献是一个非渐近（nonasymptotic）bound，量化近似随机化检验的 size 与理想化无噪声随机化检验 size 之间的偏差。基于此 bound，推导出数据不变性下近似随机化检验有效性的新条件；若不变性不成立，则可借助已有 studentization 结果保证渐近有效性。文中通过线性回归显著性检验等例子阐明小样本下随机化检验的行为，并指出先前理论结果（如 studentization 渐近有效性）在有限样本下的局限。非渐近 bound 的推导思路与 minimax 理论中的 concentration inequality 工具相通，对您在 hypothesis testing 方向的工作有直接参考价值。
关键技术: approximate randomization test, nonasymptotic size bound, studentization, data invariance, finite-sample validity, concentration inequality
为什么对您有用: 本文直接落在您 primary interest 的「mathematical statistics (hypothesis testing)」子方向，非渐近 bound 的技术路线与您 very_familiar 的 minimax bounds for estimation problems 可直接对接——从 estimation 的 minimax bound 转向 testing 的 nonasymptotic size bound，工具链高度重叠。用 minimax / concentration 工具验证其声称的 nonasymptotic bound 是否紧、是否可进一步 sharpen rate，是立即可做的 follow-up。

3. 10.1093/biomet/asaf070 — Robust universal inference for misspecified models¶

作者: Beomjo Park, Sivaraman Balakrishnan, Larry Wasserman
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 6/10 · novelty: new_method
摘要: 在模型误设定下，推断目标为真实分布向假设模型的 KL 投影（pseudo-true parameter）。本文基于 universal inference 框架，通过翻转 split-sample 相对拟合检验构建该投影的置信集。所得置信集在有限样本下具有精确或近似有效性，仅需弱正则条件且不依赖渐近展开。论文分析了置信集的收缩速率，并指出其有限样本有效性的代价是区间宽度通常大于渐近有效区间。实证部分包含模拟与基于 CausalEffectPairs 数据集的线性因果发现。对您有用：本文将 finite-sample valid 推断拓展至 misspecified 模型，直接触及 hypothesis testing 与 estimation theory 交叉，且因果发现应用与您的 causal inference 兴趣相连。
关键技术: universal inference, split-sample likelihood ratio, model misspecification, pseudo-true parameter, finite-sample validity, KL projection
为什么对您有用: 直接连接 hypothesis testing（universal inference 的 misspecification 推广）与 causal inference（因果发现应用）。您 very_familiar 的 minimax bounds 可用来验证其置信集收缩速率是否紧（universal inference 常被批评 sub-optimal），moderately_familiar 的 M-estimation theory 可分析 pseudo-true parameter 的投影性质。立即可做：用 minimax bounds 评估其速率与信息下界的 gap，或用 M-estimation 理论对比其 pseudo-true target 与 semiparametric efficient target 的差异。

Maintained by 陈星宇 · Homepage · Source on GitHub