跳转至

Biometrika — Vol 113 Issue 2 · 2026-05-18

  • 共 14 篇 · Biometrika

因果推断 (causal_inference, 2 篇)

1. 10.1093/biomet/asag001 — Calibrated sensitivity models

  • 作者: A McClean, Z Branson, E H Kennedy
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 9/10 · novelty: new_theory
  • 摘要: 在因果推断的敏感性分析中,传统敏感性参数难以解释,本文在 calibrated sensitivity model 框架下,目标是将未测量混杂的程度直接约束为已测量混杂的倍数,以提升可解释性。针对平均处理效应(ATE)的边界估计,作者提出了三种校准敏感性模型,并构建了 doubly robust 风格的非参数条件下的 efficient estimator。通过纳入已测量混杂估计的不确定性,推导了 ATE 边界的统计推断方法,证明了估计量的 parametric efficiency 与渐近正态性。理论与实证表明,考虑校准不确定性后,因果分析对未测量混杂的稳健性可能与标准方法得出的结论不同。该文对您有用:直接推进了您关注的 causal inference (sensitivity analysis) 方向,且其 DR 条件下的 semiparametric efficiency bound 推导对 efficiency theory 研究有直接参考价值。
  • 关键技术: calibrated sensitivity analysis, doubly robust estimation, semiparametric efficiency bound, partial identification bounds, influence function
  • 为什么对您有用: 直接推进您关注的 causal inference (sensitivity analysis) 子方向,且其 DR 条件下的 semiparametric efficiency bound 推导与效率理论兴趣高度契合,提供了将不确定性纳入校准推断的新理论框架。

2. 10.1093/biomet/asag004 — Assumption-lean post-integrated inference with surrogate-control outcomes

  • 作者: Jin-Hong Du, Kathryn Roeder, Larry Wasserman
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 在存在潜在异质性(如未测量协变量)的高维数据整合设定下,本文研究整合后假设检验的偏差问题,目标是在负对照假设下识别直接效应。作者将负对照扩展为代理-对照结局(surrogate-control outcomes),在存在隐藏中介、混杂和调节变量时,推导了投影直接效应的非参数可识别性。基于此构建半参数推断框架,给出了偏差量化、有限样本线性展开及一致集中不等式。提出的双重稳健估计量在模型误设与嵌入有误差时仍保持一致性与半参数有效性,且支持机器学习数据自适应估计。该工作将 proximal CI 的负对照思想推广至高维整合场景,对您在 proximal CI 及半参数效率理论的研究有直接借鉴价值。
  • 关键技术: surrogate-control outcomes, negative-control identification, doubly robust estimation, semiparametric efficiency, finite-sample linear expansion, uniform concentration bounds
  • 为什么对您有用: 直接推进了您关注的 proximal CI(负对照)方向,在存在未观测混杂的高维数据整合下给出了投影直接效应的非参数识别与双重稳健半参数有效估计,理论工具(线性展开、DR)与您的效率理论兴趣高度契合。

高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)

1. 10.1093/biomet/asaf092 — Estimating the number of significant components in high-dimensional principal component analysis

  • 作者: Bo Zhang, Zhixiang Zhang, Guangming Pan
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 9/10 · novelty: weaker_assumption
  • 摘要: 在高维 PCA 的 spiked population 设定下,目标是估计显著主成分(spiked eigenvalues)的个数 K,允许维度 p 与样本量 n 同时趋向无穷。提出一种基于解释方差比(explained variance ratio)与样本协方差矩阵非 spiked 特征值刚性(rigidity)的新型惩罚方法。利用随机矩阵理论中非 spiked 特征值的收敛性质构建惩罚项,从而区分信号与噪声特征值。相比 AIC/BIC 等现有方法,该估计量在独立数据下允许总体特征值散布(bulk heterogeneity)的更弱条件,且在部分时间序列数据下仍保持相合性。理论上证明了估计量在 p/n 趋向常数下的相合性,仿真验证了其有限样本表现。对您有用:直接推进您关注的 RMT 在高维推断中的应用,特别是利用特征值刚性放松了传统假设,方法可迁移至高维因子模型或时间序列的降维推断。
  • 关键技术: spiked population model, eigenvalue rigidity, random matrix theory, explained variance ratio, high-dimensional PCA, bulk eigenvalue heterogeneity
  • 为什么对您有用: 直接推进您 primary interest 中的高维统计与随机矩阵理论(RMT),利用特征值刚性(rigidity)显著放松了 spiked model 估计的假设条件,且将适用性拓展至时间序列,对高维因子模型推断有直接借鉴价值。

2. 10.1093/biomet/asag014 — Diaconis–Ylvisaker prior penalized likelihood for $ p/n\to\kappa\in(0,1) $ logistic regression

  • 作者: P Sterzinger, I Kosmidis
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在 $p/n \to \kappa \in (0,1)$ 的高维 logistic 回归中,研究 Diaconis–Ylvisaker (DY) 先验惩罚极大似然估计的渐进行为,设定协变量为独立多元正态且线性预测变量渐近方差为 $\gamma^2$。构造了具有零渐近总偏差的重缩放估计量,并定义了调整 Z 统计量与重缩放惩罚似然比统计量,使其在原假设下呈现标准渐近分布。与仅在狭窄 $(\kappa, \gamma)$ 范围内存在的 MLE 不同,DY 惩罚 MLE 始终存在且无需额外计算成本即可使用标准 ML 程序求解,从而将推断扩展至 MLE 失效区域。文中还研究了估计量的收缩性质,提出了未知常数的估计方法,并给出包含截距项模型的结果猜想。对您有用:该文在 $p/n \to \kappa$ 比例渐近框架下解决了高维 MLE 失效时的偏差校正与假设检验问题,直接契合您对高维统计推断与假设检验的兴趣。
  • 关键技术: proportional asymptotics, Diaconis-Ylvisaker prior, penalized likelihood, bias correction, adjusted Z-statistic, likelihood ratio test
  • 为什么对您有用: 直接契合您对高维统计($p/n \to \kappa$ 比例渐近)与假设检验的兴趣,提供了 MLE 失效区域下的偏差校正与有效检验统计量构造方法。

3. 10.1093/biomet/asaf093 — Tail-robust factor modelling of vector and tensor time series in high dimensions

  • 作者: Matteo Barigozzi, Haeran Cho, Hyeyoung Maeng
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 5/10 · novelty: weaker_assumption
  • 摘要: 在高维向量与张量时间序列的因子模型设定下,本文研究数据存在重尾(极端观测)时的稳健估计问题,仅要求 $(2+2\epsilon)$ 阶矩存在。提出将数据截断(data truncation)与两步张量分解相结合的非迭代方法,避免了复杂的数值优化搜索。在放宽传统轻尾假设的条件下,证明了估计量的一致性与渐近正态性,其收敛速率显式依赖于 $\epsilon$,刻画了重尾与截断水平对估计精度的影响。同时提出了确定因子个数的一致性准则。宏观经济数据的应用展示了方法的有效性;对您而言,该文在因子模型中放松矩假设的技巧及张量分解算法,直接关联您的高维统计与RMT兴趣,且宏观经济数据集对您的经济理论应用方向有参考价值。
  • 关键技术: high-dimensional factor model, tensor decomposition, data truncation, asymptotic normality under weak moments, number of factors selection
  • 为什么对您有用: 直接关联您的高维统计与RMT兴趣(因子模型与特征值分析),放松矩假设的理论技巧及非迭代张量分解算法对统计计算有借鉴意义,且附带宏观经济数据集契合您的经济理论应用方向。

4. 10.1093/biomet/asaf088 — A spectral framework for multi-view subspace learning using the product of projections

  • 作者: R Sergazinov, A Taeb, I Gaynanova
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 4/10 · novelty: new_theory
  • 摘要: 在高维多视图数据设定下,本文研究如何从噪声观测中可靠区分共享与特有信号子空间,关键正则条件涉及信号秩与环境维度的比率、真实子空间间的主角及噪声水平。方法核心基于各视图估计子空间投影矩阵乘积的谱扰动分析,严格量化了投影乘积谱的扰动如何影响子空间分离。估计算法结合旋转自助法与随机矩阵理论,将观测谱划分为联合、独立与噪声子空间,并提供诊断图可视化该划分。理论给出了子空间可识别性的严格条件,模拟与多组学真实数据表明其在子空间估计精度及下游预测任务上优于现有方法。对您有用:本文将 RMT 谱方法与投影扰动理论结合用于高维子空间推断,直接契合您对高维统计与 RMT 的核心兴趣,且旋转自助法与谱划分技巧可迁移至其他高维推断问题。
  • 关键技术: random matrix theory, spectral perturbation analysis, product of projections, rotational bootstrap, multi-view subspace separation
  • 为什么对您有用: 直接契合您对高维统计与随机矩阵理论(RMT)的兴趣;文中利用 RMT 与谱扰动理论进行高维子空间推断的框架,以及旋转自助法的计算实现,对您研究高维推断与统计计算具有直接借鉴价值。

非参数 / 半参数 (nonparam_semipara, 3 篇)

1. 10.1093/biomet/asag011 — Inferring manifolds using Gaussian processes

  • 作者: David B Dunson, Nan Wu
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 在 Riemannian 流形学习设定下,目标是基于带噪样本重构潜在低维流形并进行插值去噪,假设流形光滑且局部采样充分。核心方法利用样本局部协方差矩阵的理论性质,将全局流形重构问题转化为局部回归问题,进而使用高斯过程(GP)实现概率流形重构与插值。理论上证明了局部协方差矩阵特征结构在流形附近的收敛性,为 GP 先验的合理性提供了保证;实证表明该方法不仅能输出低维坐标,还能直接估计流形并对原始数据去噪。对您有用:该工作将非参数流形估计转化为局部回归的理论技巧,以及 GP 在流形重构中的计算框架,对非参数理论及统计计算方向有直接借鉴意义。
  • 关键技术: Gaussian process regression, local covariance matrix, manifold learning, Riemannian manifold reconstruction, local regression
  • 为什么对您有用: 该工作将非参数流形估计转化为局部回归的理论技巧,以及 GP 在流形重构中的计算框架,对非参数理论及统计计算方向有直接借鉴意义。

2. 10.1093/biomet/asaf089 — Spectral estimation for point processes and random fields

  • 作者: J P Grainger, T A Rajala, D J Murrell, S C Olhede
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文针对空间点过程、格点随机场与随机采样空间过程的联合谱分析问题,提出了一套基于耦合离散-连续数据锥(multitaper)与离散傅里叶变换(DFT)的统一推断框架。核心方法是将离散与连续数据锥配对,结合 DFT 实现对不同观测形式的一致谱估计,并推广至非笛卡尔积的不规则区域,构造不规则域数据锥与锥化 DFT。理论部分给出了估计量的渐近性质与大有限域性质,以及偏关联(partial association)估计及其显著性检验方法;计算上讨论了快速实现。实证部分用大规模生态数据集展示了方法实用性。对您而言,锥化谱估计的渐近理论与快速 DFT 实现与非参数理论及统计计算兴趣有方法重叠,但与因果推断/高维/RMT等核心方向距离较远。
  • 关键技术: multitaper spectral estimation, coupled discrete-continuous data tapers, tapered discrete Fourier transform, irregular domain data tapers, partial association estimation, spatial point process spectral analysis
  • 为什么对您有用: 锥化谱估计的渐近理论与快速算法实现与您在非参数理论和统计计算方面的兴趣有方法重叠;偏关联检验涉及假设检验,但整体与您核心方向(因果推断、RMT、效率理论)距离较远,属于边缘相关。

3. 10.1093/biomet/asag015 — Characterizing extremal dependence on a hyperplane

  • 作者: P Wan
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 本文在多元极值统计设定下,研究 d 维渐近相依变量的极值相依结构,将其刻画为对角向量 1 的正交超平面上的随机向量。核心假设为变量间渐近相依(非渐近独立),关键正则性条件围绕规则变差性质展开。方法上,将极值相依分析从单纯形转移到线性向量空间,使得线性运算(如投影、内积)可直接应用于尾部相依结构;作为示范,作者在超平面上执行主成分分析以获得尾部相依的低维近似。理论结果证明,广泛使用的 Hüsler–Reiss 参数族恰好对应超平面上的高斯分布族,给出了该模型的简洁几何刻画。对您而言,该工作将非线性流形上的统计问题转化为线性空间问题的思路,可借鉴到 semiparametric theory 中高维参数投影与降维的构造。
  • 关键技术: regular variation on hyperplane, extremal dependence characterization, principal component analysis for tail dependence, Hüsler–Reiss parametric family, Gaussian family on orthogonal complement
  • 为什么对您有用: 将非线性流形上的相依结构映射到线性空间再做推断的思路,与 semiparametric theory 中投影、效率界计算有方法论上的可迁移性;Hüsler–Reiss 与高斯族的等价刻画为高维模型提供了新的参数化视角。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 10.1093/biomet/asaf070 — Robust universal inference for misspecified models

  • 作者: Beomjo Park, Sivaraman Balakrishnan, Larry Wasserman
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在模型误设设定下,本文研究数据生成分布到假设模型之投影的置信集构建问题,仅需弱正则条件。方法基于 universal inference 框架,通过反转一族基于样本分割的相对拟合检验来构建置信集。在多种投影分布下,该方法能提供精确或近似的有限样本有效置信集,避免了传统似然比检验在误设下失效的问题。理论进一步分析了所得置信集向目标参数收缩的速率。模拟研究及在线性因果模型(CausalEffectPairs数据集)上的因果发现应用验证了方法的有效性。对您有用:该工作直接推进您在假设检验方向的兴趣,提供了误设下有限样本有效的检验新视角,且其 split-sample 机制与 debiased ML/cross-fitting 的稳健性思想有共通之处。
  • 关键技术: universal inference, split-sample test, model misspecification, finite-sample validity, projection distribution
  • 为什么对您有用: 直接推进您在假设检验方向的兴趣,提供了误设下有限样本有效的检验新视角;其 split-sample 机制与 debiased ML/cross-fitting 的稳健性思想有共通之处,且因果发现应用契合您的因果推断兴趣。

2. 10.1093/biomet/asaf085 — Asymptotic validity and finite-sample properties of approximate randomization tests

  • 作者: Panos Toulis
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 本文研究近似随机化检验在数据存在噪声或近似变换下的有限样本性质与渐近有效性,关注检验实际水平与名义水平的偏差。核心贡献是给出了近似随机化检验与理想(无噪声)随机化检验之间水平差异的非渐近界。基于此界,推导了在数据分布满足不变性时近似随机化检验有效的充分条件;若不变性不成立,则可通过合适的 studentization 保证渐近有效性。理论结果在线性回归显著性检验等例子中得到说明,澄清了随机化检验在小样本下的行为并弥补了先前理论的不足。对您有用:直接推进您关注的假设检验有限样本理论,且随机化检验是因果推断中Fisher随机化推断的基础,其非渐近界对理解小样本因果检验的稳健性有直接参考价值。
  • 关键技术: approximate randomization test, nonasymptotic bound, studentization, finite-sample validity, data invariance
  • 为什么对您有用: 直接推进您关注的数学统计假设检验有限样本理论;随机化检验是因果推断Fisher随机化检验的基础,非渐近界对评估小样本因果检验稳健性有直接参考价值。

3. 10.1093/biomet/asag008 — Treatment choice with nonlinear regret

  • 作者: Toru Kitagawa, Sokbae Lee, Chen Qiu
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 在统计处理选择(statistical treatment choice)框架下,传统文献最小化福利遗憾(welfare regret)的均值,本文研究最小化遗憾的非线性变换之均值(如均方遗憾),在有限样本与极限实验设定下推导最优决策规则。核心发现是:对非线性遗憾,单点规则(singleton rules)不再本质完备(not essentially complete),即随机化规则可严格优于确定性规则。针对均方遗憾,作者推导出有限样本下 Bayes 与 minimax 最优规则的闭式处理分数(treatment fractions),该分数可解释为支持处理的证据强度。方法基于 Savage-Manski 决策论框架,并扩展至极限实验(limit experiments),应用于正态回归模型与样本量计算。对您有用:将遗憾从一阶矩推广至二阶矩的决策论分析,与您在 mathematical statistics / hypothesis testing 的兴趣直接相关,且'随机化规则优于确定性规则'的结论对处理选择理论具有基础性贡献。
  • 关键技术: nonlinear regret, essentially complete class, Bayes optimal treatment fraction, minimax optimal rule, limit experiment, welfare regret
  • 为什么对您有用: 直接推进您在 mathematical statistics (hypothesis testing / decision theory) 方向的兴趣:非线性遗憾下随机化规则严格优于确定性规则的理论结果,以及闭式 minimax/Bayes 分数,为处理选择与检验问题提供了新的决策论视角与 sharper finite-sample 界。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1093/biomet/asag007 — Asymptotics for a class of parametric martingale posteriors

  • 作者: E Fong, A. Yiu
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 本文研究参数鞅后验(parametric martingale posteriors)的渐近性质,设定为用一步向前预测密度替代传统似然与先验,并结合随机梯度下降(SGD)进行参数推断。基于鞅极限理论,文章证明了两个核心 CLT:一是预测 CLT,据此提出基于正态近似的混合采样算法,显著加速了预测重采样过程;二是 Bernstein–von Mises (BvM) 定理,这是首次为鞅后验建立该结果,为其提供了频率派最优覆盖的渐近保证。该方法完全避免了 MCMC 且天然支持并行计算。对您有用:鞅极限理论在 BvM 定理中的推导以及无 MCMC 的并行采样加速算法,对您在统计计算(数值与算法)和数理统计(渐近性质)方面的兴趣有直接参考价值。
  • 关键技术: martingale posterior, predictive resampling, Bernstein-von Mises theorem, martingale central limit theorem, stochastic gradient descent
  • 为什么对您有用: 鞅极限理论推导 BvM 定理及正态近似混合采样算法,直接关联您在统计计算(无 MCMC 并行算法)和数理统计(渐近理论)方面的兴趣,提供了频率派性质保证的新视角。

其他 (other, 1 篇)

1. 10.1093/biomet/asag021 — Palm distributions of superposed point processes for statistical inference

  • 作者: M Beraha, F Camerlenghi, L Ghilotti
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 2
  • 相关性 2/10
  • 摘要: { "topic": "other", "summary_zh": "本文研究独立点过程叠加(superposition)的 Palm 分布表征问题,在独立叠加设定下建立了 Palm 分布的混合表示定理,其分量依赖各子过程的 Palm 分布与矩测度。基于该表征,作者给出两类统计应用:一是对被污染点过程的最小对比估计(minimum contrast estimation),二是对 shot noise Cox 过程推导高阶 Palm 分布的显式表达式。在有限叠加情形下,进一步得到了 Janossy 密度的可计算表达式,从而可用于新的似然推断策略。理论结果还推广至多过程叠加与高阶 Palm 分布。对您而言,高阶 Palm 分布的推导思路与您关注的高阶 U-统计量理论在"高阶矩结构分解"上有方法论上的类比价值,且该文在点过程推断中的混合表示技术可迁移至其他具有叠加结构的随机模型分析。", "key_techniques": ["Palm distribution", "superposition of point processes", "minimum contrast estimation", "shot noise Cox processes", "Janossy density", "higher-order Palm distributions"], "why

Maintained by 陈星宇 · Homepage · Source on GitHub