跳转至

Biometrika — Vol 113 Issue 1 · 2026-05-18

  • 共 24 篇 · Biometrika

因果推断 (causal_inference, 7 篇)

1. 10.1093/biomet/asaf044 — Proximal indirect comparison

  • 作者: Zehao Su, Helene C Rytgaard, Henrik Ravn, Frank Eriksson
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 10/10 · novelty: new_method
  • 摘要: 在间接比较(目标试验缺失处理组,需从源试验借用)设定下,目标是识别存在未观测、偏移的效应修饰因子时的目标人群平均因果效应。传统条件可移植性假设难以满足,本文基于代理变量(两试验中的调整代理和源试验中的重加权代理)给出了新的 proximal identification 结果。提出的估计器对桥函数的误指具有双重稳健性,并在桥函数估计量温和一致的条件下达到 n^{-1/2}-CAN(渐近正态)。理论核心在于利用 proxy 结构绕过未观测效应修饰因子的可移植性瓶颈,并构建 DR 估计量保证模型部分误指下的有效性。实证部分通过两项体重管理试验展示了代理变量的选择与方法的实际应用。对您有用:直接推进了您关注的 proximal CI 理论在 transportability 场景下的拓展,其桥函数与 DR 估计器的构建思路对半参数效率理论有直接参考价值。
  • 关键技术: proximal causal inference, indirect comparison, bridge functions, double robustness, transportability
  • 为什么对您有用: 直接推进了您关注的 proximal CI 理论在 transportability 场景下的拓展,其桥函数与 DR 估计器的构建思路对半参数效率理论有直接参考价值,同时流行病学试验的应用也契合您的 secondary interest。

2. 10.1093/biomet/asag005 — On the consistency of bootstrap for matching estimators

  • 作者: Ziming Lin, Fang Han
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 9/10 · novelty: weaker_assumption
  • 摘要: 在因果推断的最近邻匹配估计框架下,目标是估计 ATE,经典结论表明固定匹配数 M 时朴素 bootstrap 不一致(Abadie & Imbens 2008)。本文证明,只要匹配数 M 随样本量发散,朴素 bootstrap 对原始匹配估计量即可保持一致性。其核心在于发散的 M 改变了估计量的渐近线性表示与偏差阶数,使 bootstrap 经验过程能够正确逼近真实抽样分布。该结果将此前的不一致性完全归因于固定 M 的局限,而非匹配估计量本身的固有缺陷。对您有用:修正了因果推断匹配方法中一个著名的推断难题,为发散参数下的半参数 bootstrap 理论与因果推断估计提供了新视角。
  • 关键技术: nearest neighbor matching, bootstrap consistency, average treatment effect, diverging number of matches, asymptotic linear representation
  • 为什么对您有用: 直接回应了因果推断匹配估计中著名的 Abadie-Imbens bootstrap 不一致问题,通过放松固定匹配数假设提供了新的渐近理论,对您在因果推断估计理论与半参数推断方面的研究有直接启发。

3. 10.1093/biomet/asaf073 — Post-selection inference for causal effects after causal discovery

  • 作者: Ting-Hsuan Chang, Zijian Guo, Daniel Malinsky
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 在基于条件独立性检验的因果发现(如PC算法)选出DAG后,如何对平均因果效应(ATE)进行有效的post-selection推断,避免同一数据用于选图和估计导致的置信区间失效及目标泛函错配问题。提出一种基于重抽样与筛选的推断框架,通过在因果发现过程中引入随机变动的中间检验统计量,多次执行选图算法。随后,将基于各个选中图构建的估计量与置信区间取并集,形成最终的置信集。证明了该并集置信集对固定的总体真实因果效应参数具有渐近正确的覆盖概率,而非针对数据依赖的选择泛函。该方法在多元高斯与PC算法设定下展开,但框架具有模块化通用性,对您在因果推断中处理图结构不确定性及post-selection假设检验有直接参考价值。
  • 关键技术: post-selection inference, causal discovery, PC algorithm, resampling and screening, union confidence intervals, conditional independence tests
  • 为什么对您有用: 直接关联您在因果推断(identification与估计)和假设检验(post-selection inference)的核心兴趣;解决了因果发现后ATE推断的有效性问题,为处理调整集不确定性提供了新的理论保证与计算框架。

4. 10.1093/biomet/asaf084 — Bounds on causal effects in $ 2^{K} $ factorial experiments with noncompliance

  • 作者: M Blackwell, N E Pashley
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 8/10 · novelty: weaker_assumption
  • 摘要: 在 2^K 因子实验且存在不依从(noncompliance)的设定下,目标是识别与估计依从者平均因果效应(CATE),而传统 IV 方法依赖随机化对处理接受的强假设(如多处理单调性)。本文在放宽对不依从机制假设的条件下,针对有界结局变量推导了 CATE 的非参数识别界。核心方法是将严格的单调性假设放松为更弱的偏序约束,并通过线性规划求解可行区域内的极值以构建最紧的界。理论结果给出了弱假设下 CATE 的可行界,避免了传统 IV 估计因假设过强而导致的偏误风险。对您有用:直接关联您 primary interest 中的因果推断(IV、sensitivity analysis),提供了在多处理因子设计下放松 IV 核心假设并进行 partial identification 的理论框架。
  • 关键技术: instrumental variables, partial identification bounds, complier average causal effect, factorial design, noncompliance
  • 为什么对您有用: 直接关联 primary interest 中的因果推断(IV、sensitivity analysis),展示了在多处理因子设计下如何放松传统 IV 单调性假设并推导 partial identification bounds。

5. 10.1093/biomet/asaf078 — Planning for gold: Hypothesis screening with split samples for valid powerful testing in matched observational studies

  • 作者: William Bekerman, Abhinandan Dalal, Carlo del Ninno, Dylan S Small
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在匹配观察性研究中,针对存在未测量混杂且处理影响未知数量结局的设定,目标是筛选对隐藏偏倚更具鲁棒性的因果假设并进行有效检验。本文提出一种基于样本分割的假设筛选方法,将数据分为计划样本与分析样本:前者用于探索性假设筛选,后者用于严格推断,从而在允许未知数量受影响结局的情况下兼顾探索性与推断有效性。核心技术结合了针对未测量混杂的敏感性分析与多重假设筛选机制,确保在放宽无混杂假设下仍保持检验的势与有效性。理论证明了该分割筛选策略的误差控制与势性质,模拟与孟加拉国洪水影响的应用表明其在较高未测量混杂容忍度下显著提升检验势。该工作直接结合了因果推断中的敏感性分析与假设检验的样本分割策略,为您在匹配设计下处理未测量混杂的检验问题提供了新思路。
  • 关键技术: sample splitting, hypothesis screening, sensitivity analysis, matched observational studies, unmeasured confounding
  • 为什么对您有用: 直接结合了您 primary interest 中的因果推断(敏感性分析、未测量混杂)与假设检验(样本分割、检验势),为匹配观察性研究下的有效推断提供了新方法与理论保证。

6. 10.1093/biomet/asaf042 — Structural restrictions in local causal discovery: identifying direct causes of a target variable

  • 作者: Juraj Bodik, Valérie Chavez-Demoulin
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 本文研究在单一观测环境下(无需干预)仅从联合分布中识别目标变量直接原因的局部因果发现问题,核心目标是局部 parent 集的 identification。与全局 DAG 学习或不变因果预测(ICP)不同,该方法仅对目标变量的数据生成过程施加假设(如非线性高斯等),而对其他变量的机制几乎不作限制。作者在此宽松条件下给出了局部因果结构可识别性的新理论结果,并提出了两种从有限样本中估计直接原因的算法。理论证明了无需多环境或干预数据即可实现局部识别的条件,实证显示算法在基准与真实数据上表现稳健。对您有用:该工作为因果推断的 identification 提供了仅依赖观测数据的局部结构学习新视角,其放松全局假设的思路可借鉴至 proximal CI 等观测性因果框架。
  • 关键技术: local causal discovery, direct causes identification, observational distribution, DAG identifiability, nonlinear Gaussian assumption
  • 为什么对您有用: 直接关联您 primary interest 中的因果 identification;其仅依赖单一观测环境且放松全局假设的局部识别思路,对研究观测性数据(如 proximal CI)下的因果识别具有理论借鉴价值。

7. 10.1093/biomet/asaf047 — Leveraging external data for testing experimental therapies with biomarker interactions in randomized clinical trials

  • 作者: B Ren, F Ferrari, S Fortini, S Ventz, L Trippa
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在随机对照试验中,目标是检验实验疗法是否在任意生物标志物亚群中均无疗效,设定允许外部数据(历史试验/EHR)存在未测量混杂和协变量偏移。提出一种置换检验程序,利用外部数据提升对异质性处理效应的检验功效,同时无需对外部数据做无混杂等严格假设即可严格控制一类错误。证明了该置换检验在可解释的最优性准则下具有最优性,并通过渐近结果和模拟验证了其有限样本表现。实证部分基于胶质母细胞瘤临床试验的个体患者数据进行了回顾性分析。对您有用:该文将置换检验与外部数据整合结合,在放松外部数据无混杂假设下严格保证 Type I error,对您在因果推断中处理外部数据偏差及假设检验方向的研究有直接参考价值。
  • 关键技术: permutation test, heterogeneous treatment effects, external data integration, type I error control, unmeasured confounding, subgroup analysis
  • 为什么对您有用: 直接连接到因果推断(异质性处理效应与外部数据整合)和假设检验(置换检验的最优性与一类错误控制)两个核心兴趣;展示了在放松外部数据无混杂假设下如何保证检验的严谨性,对处理真实世界数据偏差的因果检验方法有启发。

高维统计 / 随机矩阵 (high_dim_rmt, 4 篇)

1. 10.1093/biomet/asaf081 — Thinning a Wishart random matrix

  • 作者: A Dharamshi, A Neufeld, L L Gao, D Witten, J Bien
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 9/10 · novelty: new_method
  • 摘要: 本文研究在仅能获取汇总统计量(样本均值与服从 Wishart 分布的样本协方差矩阵)时的数据细化(data thinning,即样本拆分的推广)问题。针对 Wishart 分布缺乏 thinning 策略的理论空白,作者提出了一种将 Wishart 随机矩阵分解为具有独立同分布高斯行的矩阵平方根算法。基于该分解,仅凭原始汇总统计量即可生成两个或多个独立的 N_p(μ,Σ) 数据矩阵。这些独立矩阵可直接用于 train-test 范式或推导独立汇总统计量,且能无损重组还原原始样本均值与协方差。核心贡献在于揭示了 Wishart 矩阵的分解结构,为隐私保护或仅存汇总数据场景下的推断提供了新工具。对您有用:该工作提出的 Wishart 矩阵分解算法与理论,直接契合您在随机矩阵理论与统计计算方面的兴趣,为仅基于汇总统计量的高维推断提供了新颖的计算视角。
  • 关键技术: Wishart distribution, data thinning, matrix square root decomposition, sample splitting, summary statistics inference
  • 为什么对您有用: 直接契合您在随机矩阵理论(Wishart 矩阵分解)与统计计算(矩阵算法、数据拆分)方面的核心兴趣,为仅基于汇总统计量的高维推断提供了新颖的计算工具与理论视角。

2. 10.1093/biomet/asaf087 — High-dimensional covariance estimation by pairwise likelihood truncation

  • 作者: A. Casa, D Ferrari, Z Huang
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在高维稀疏协方差矩阵估计问题中,目标是在维度 p 随样本量 n 指数增长的设定下获得协方差矩阵的一致估计。方法基于截断成对似然(truncated pairwise likelihood),仅保留对应非零协方差元素的成对似然项。截断选择准则通过最小化成对似然与全似然得分之间的 L₂ 距离,辅以 L₁ 惩罚来排除无信息项。与现有正则化方法不同,该准则选择整个成对似然对象而非收缩单个协方差参数,从而保持成对似然估计方程的无偏性。理论结果表明,所得估计量具有一致性,且收敛至 oracle MLE(即已知非零协方差结构时的极大似然估计),即使维度指数增长亦成立。对您有用:该工作在高维协方差估计中提出了新的截断似然框架,与您的高维统计兴趣直接相关,且 oracle 收敛性质与估计方程无偏性对高维推断中的效率理论和 debiased 方法有方法论启发。
  • 关键技术: pairwise likelihood truncation, L2 score distance minimization, L1 penalty selection, oracle maximum likelihood estimator, sparse covariance estimation, unbiased estimating equations
  • 为什么对您有用: 与您的高维统计(primary)直接相关;截断似然保持估计方程无偏性并达到 oracle 收敛,对高维推断中的效率理论和 debiased 思路有方法论启发。

3. 10.1093/biomet/asaf082 — Sparse higher-order partial least squares for simultaneous variable selection, dimension reduction and tensor denoising

  • 作者: Kwangmoon Park, Sündüz Keleş
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在张量响应偏最小二乘(PLS)模型 𝒴=ℬ×₁X+ℱ 设定下,本文研究高维预测变量 X 与高维稀疏噪声张量响应 𝒴 下低秩稀疏系数张量 ℬ 的估计与变量选择问题。作者指出,当预测变量维度 d₁ 与响应张量维度 dₘ 增长快于样本量 n 时,现有张量 PLS 估计量无法保证一致性。为此,提出稀疏高阶偏最小二乘(SHOPLS)估计量及配套算法,同步实现变量选择、降维与张量去噪。理论上,在高维机制下建立了该估计量的渐近保证(包括估计一致性与变量选择相合性)。实证与单细胞 Hi-C 数据应用验证了方法优势。该文的高维张量回归渐近理论与迭代算法对您在高维统计(张量系数的高维推断)及统计计算(张量算法设计)方面的兴趣有直接参考价值,但需注意其“高阶”指张量阶数而非高阶 U 统计量。
  • 关键技术: tensor-response regression, sparse partial least squares, high-dimensional asymptotics, variable selection consistency, sufficient dimension reduction
  • 为什么对您有用: 该文处理 d≫n 下高维张量系数的估计与变量选择,其高维渐近理论与张量计算算法直接契合您在高维统计和统计计算方面的兴趣;需注意其“高阶”指张量结构而非高阶 U 统计量。

4. 10.1093/biomet/asaf071 — Regression graphs and sparsity-inducing reparameterizations

  • 作者: J Rybak, H S Battey, K Bharath
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 在高维协方差模型中,研究正定约束下稀疏性如何通过重新参数化自然呈现,重点关注因果排序下的联合响应图与稀疏结构的对应关系。利用一般线性群的 Iwasawa 分解,结合图模型理论,揭示了原始尺度上的结构如何诱导重新参数化后的稀疏性,并将链图模型(包含无向图和 DAG 作为特例)纳入统一框架。提出近似零的图模型解释:若变量间的直接回归效应可忽略且仅通过长路径显现,则该关系可声明为零。理论表明,在重新参数化后强制稀疏化等价于忽略长路径的间接效应,模拟实验验证了该策略在特定机制下的优势。对您而言,该文将 Iwasawa 矩阵分解引入图模型因果排序的做法,直接连接了您对统计计算(矩阵分解)与因果推断(DAG、因果排序)的交叉兴趣,并为高维协方差估计提供了新的代数视角。
  • 关键技术: Iwasawa decomposition, joint-response graphs, chain-graph models, sparsity-inducing reparameterization, positive definite covariance constraints
  • 为什么对您有用: 直接连接您对统计计算(矩阵分解的代数方法)与因果推断(DAG、因果排序)的交叉兴趣,为高维协方差稀疏建模提供了基于李群分解的新视角。

非参数 / 半参数 (nonparam_semipara, 5 篇)

1. 10.1093/biomet/asaf074 — Identification and estimation of interaction effects in nonparametric additive regression

  • 作者: Seung Hyun Moon, Byeong U Park, Enno Mammen, Young Kyung Lee
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 8/10 · novelty: new_theory
  • 摘要: 在非参数可加回归框架下,本文提出一种新的交互效应参数化形式,目标是将协变量的联合效应与主效应完全分离。新方法通过使交互效应在 L^2 意义下与主效应正交,避免了传统模型中交互项与主项的混淆,从而保证了交互效应的可解释性。基于此正交分解,作者发展了相应的估计方法,并在温和的正则条件下推导出估计量的渐近 L^2 收敛速率。模拟与实证分析进一步验证了方法的有效性。该文的 L^2 正交分解思路与半参数效率理论中的正交投影思想一脉相承,其渐近速率推导直接契合您对非参数理论的核心兴趣。
  • 关键技术: nonparametric additive regression, L^2 orthogonal decomposition, interaction effect identification, asymptotic L^2 error rates, projection onto main effects
  • 为什么对您有用: 本文将交互效应与主效应做 L^2 正交分解的思路,与半参数效率理论中的正交性(如 orthogonal score)异曲同工,其渐近 L^2 速率的推导直接契合您对非参数/半参数理论的核心兴趣。

2. 10.1093/biomet/asaf086 — Geodesic optimal transport regression

  • 作者: Changbo Zhu, Hans-Georg Müller
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 2/10 · novelty: new_method
  • 摘要: 在非欧度量空间回归设定下,针对预测变量与响应变量均为非欧随机对象的场景,本文提出测地最优传输回归模型。该方法将经典多元回归推广至非欧空间,核心机制是定义“测地最优传输”,将分布空间的最优传输概念扩展至一般测地度量空间,并沿测地线刻画最优传输映射。模型覆盖了2-Wasserstein空间、带Fisher-Rao度量的Hilbert球面以及黎曼流形(如球面、SPD矩阵)等具有实际统计意义的空间。实证分析展示了其在温度分布与人类死亡率数据上的应用效果。对您有用:该工作拓展了非参数回归理论至非欧流形与度量空间,若您关注非参数理论或处理流行病学中的分布数据(如文中的死亡率分布),其测地最优传输与流形回归的构造思路具有方法迁移价值。
  • 关键技术: geodesic optimal transport, non-Euclidean regression, 2-Wasserstein space, Fisher-Rao metric, Riemannian manifold, random objects
  • 为什么对您有用: 拓展了非参数回归理论至非欧流形与度量空间,若您关注非参数理论或处理流行病学中的分布数据(如文中的死亡率分布),其测地最优传输与流形回归的构造思路具有方法迁移价值。

3. 10.1093/biomet/asaf077 — Extremal correlation coefficient for functional data

  • 作者: M Kim, P Kokoszka
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 2/10 · novelty: new_method
  • 摘要: 本文在 Banach 空间正则变差框架下,提出一种衡量成对函数型数据极端相依性的新相关系数。该系数具有类似 Pearson 相关系数的界与性质,但专门针对曲线对象且仅聚焦极端曲线的尾部相依。作者基于正则变差理论构造了估计量,并通过严格的渐近分析证明了其一致性。模拟研究与金融、气候函数型数据的实证进一步验证了方法的有效性。对您而言,该文在 Banach 空间非参数理论及渐近分析的处理,可为函数型相依性度量提供理论参考,且金融数据应用契合您的经济理论次级兴趣。
  • 关键技术: regular variation in Banach spaces, functional data analysis, extremal dependence, asymptotic consistency, tail dependence coefficient
  • 为什么对您有用: 涉及 Banach 空间非参数理论与渐近分析,与您 primary interest 中的 semiparametric/nonparametric theory 相关;同时金融函数型数据应用契合您 secondary interest 中的 econ theory 数据集。
  • 作者: David Bolin, Jonas Wallin
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 2/10 · novelty: new_theory
  • 摘要: 在空间回归模型(高斯随机场)下,研究协变量平滑性误设对广义最小二乘(GLS)估计量的影响,设定为 infill asymptotics。理论证明 GLS 估计量在此误设下具有反直觉性质:若协变量过粗糙,即使与响应变量高度相关,其回归系数也会随样本量增加收敛至零;在特定条件下估计量甚至会发散至无穷。这种由平滑性差异导致的偏差被称为空间自混淆(spatial self-confounding),会严重低估粗糙协变量的重要性。为修正此偏差,作者提出在回归中加入平滑步骤,并在理论和气温/降水数据中验证了其有效性。对您有用:该文揭示了空间混淆下的非标准渐近行为,对您在因果推断中处理空间未观测混淆及半参数模型误设下的偏差分析有直接启发。
  • 关键技术: spatial regression, generalized least squares (GLS), infill asymptotics, covariate smoothness misspecification, spatial self-confounding, Gaussian random field
  • 为什么对您有用: 揭示了空间混淆下的非标准渐近行为(系数收敛至零或发散),对您在因果推断中处理空间未观测混淆及半参数模型误设下的偏差分析有直接启发。

5. 10.1093/biomet/asag002 — Generalized Fréchet means with random minimizing domains and its strong consistency

  • 作者: Jaesung Park, Sungkyu Jung
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 0/10 · novelty: new_theory
  • 摘要: 本文提出了广义 Fréchet 均值(generalized Fréchet means)的统一框架,用于刻画度量空间中随机元素的特征,其核心设定是最小化代价函数的解。该框架的关键创新在于允许经验广义 Fréchet 均值的最小化域是随机的,且可以与总体版本的最小化域不同。这一灵活性将 Fréchet 均值框架的适用性扩展到非欧几里得数据的序列降维等多种统计场景。作者在较弱的正则性条件下建立了广义 Fréchet 均值的强一致性定理。作为应用,文章验证了超球面上主测地线分析(principal geodesic analysis)的一致性。对您研究非参数理论中 M-估计量在非欧空间的大样本性质可能提供新的理论工具与视角。
  • 关键技术: generalized Fréchet mean, random minimizing domain, strong consistency, M-estimation on metric spaces, principal geodesic analysis
  • 为什么对您有用: 扩展了非参数理论中 M-估计的框架,放松了最小化域固定的假设,对研究非欧空间上的非参数估计一致性有直接参考价值。

数理统计 / 假设检验 (hypothesis_testing, 7 篇)

1. 10.1093/biomet/asaf083 — A frequentist local false discovery rate

  • 作者: Daniel Xiang, Jake A Soloff, William Fithian
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在多重检验框架下,针对 Efron 的贝叶斯局部错误发现率(lfdr)依赖先验设定的局限,本文定义了基于样本空间中原假设相对频率的频率学派 lfdr,无需先验分布。该频率 lfdr 保留了贝叶斯版本的核心性质:给定检验统计量 t 时原假设为真的条件概率、校准的预测概率,以及在 Type I 错误权重为 λ 的加权分类损失下,阈值为 1/(1+λ) 的最优可分拒绝规则。重要的是,这些性质不要求检验统计量独立。频率 lfdr 可通过参数或非参数方法高效估计,且在独立性假设下可有限样本控制相关误差准则。相比于 FDR 衡量拒绝域的平均质量,频率 lfdr 刻画了拒绝域内发现质量的异质性,允许更细粒度分析。对您有用:直接推进您在 mathematical statistics (hypothesis testing) 方向的兴趣,提供了无先验假设下的最优检验规则理论,且其非参数估计部分与 semiparametric theory 紧密相关。
  • 关键技术: local false discovery rate, multiple testing, weighted classification loss, separable rejection rule, nonparametric estimation, empirical Bayes
  • 为什么对您有用: 直接推进您在 mathematical statistics (hypothesis testing) 方向的兴趣,提供了无先验假设下的最优检验规则理论,且其非参数估计部分与 semiparametric theory 紧密相关。

2. 10.1093/biomet/asaf079 — Uniform inference in linear mixed models

  • 作者: Karl Oskar Ekvall, Matteo Bottai
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在线性混合模型(LMM)中,当随机效应协方差矩阵接近或处于参数空间边界(奇异或近似奇异)时,经典渐近理论失效,本文研究方差-协方差参数的 uniform inference 问题。核心工具是对 score function 线性组合的密度与标准正态密度之差给出有限样本定量界,且该界关于参数一致(uniform in the parameter),由此可评估充分样本量并导出参数个数与随机效应个数随样本量发散时的渐近理论。模型涵盖独立聚类与具有发散交叉随机效应(crossed random effects)个数的复杂设定。模拟表明所提置信域在方差近零或相关近±1的边界情形下仍具接近名义水平的覆盖概率,且实现简便。边界处 uniform inference 与假设检验紧密相关,参数/随机效应个数发散的设定连接高维统计,对您在 hypothesis testing 与 high-dimensional statistics 交叉方向有直接参考价值。
  • 关键技术: uniform inference, boundary of parameter space, finite-sample density approximation, score function linear combinations, crossed random effects, diverging number of parameters
  • 为什么对您有用: 参数空间边界处的 uniform inference 是假设检验中的经典难题,本文的有限样本定量界和参数发散设定下的渐近理论直接连接您在 hypothesis testing 与 high-dimensional statistics 的 primary interests,且 crossed random effects 的处理对纵向/聚类因果推断模型也有方法迁移价值。

3. 10.1093/biomet/asaf075 — Higher criticism for rare and weak non-proportional hazard deviations in survival analysis

  • 作者: A Kipnis, B Galili, Z Yakhini
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 7/10 · novelty: new_theory
  • 摘要: 在右删失生存数据设定下,针对未知且稀疏时间区间内的非比例风险(non-proportional hazard)偏离,本文提出基于大量精确超几何检验 p 值的高阶批判(higher criticism, HC)检验方法。该方法通过聚合各时间点超几何检验的 p 值构造 HC 统计量,对稀有且微弱的局部风险差异高度敏感。理论上,在两组失败率仅在少数未知时刻存在差异的稀有-微弱(rare and weak)框架下,证明了该检验的渐近功效存在相变(phase transition)现象,且相变边界与正态/泊松均值设定下的经典 HC 相变一致。相较于 log-rank 检验及其变体,本文方法达到渐近全功效的区域更大,仿真与基因表达数据实证亦显示其对稀有微弱非比例风险差异的检验功效显著提升。对您有用:本文将高维稀疏信号检测的 HC 相变理论拓展至生存分析,直接契合您对假设检验与高维统计的兴趣,其 p 值聚合与相变分析思路对稀有-微弱因果效应的检验具有方法迁移价值。
  • 关键技术: higher criticism, exact hypergeometric test, non-proportional hazards, asymptotic power phase transition, rare and weak signal detection
  • 为什么对您有用: 直接契合您在数学统计(假设检验)与高维统计方面的核心兴趣;本文将高维稀疏信号检测的 HC 相变理论拓展至右删失生存数据,其渐近功效相变分析与 p 值聚合机制对研究稀有-微弱因果效应的检验具有方法迁移价值。

4. 10.1093/biomet/asaf066 — Model-free selective inference under covariate shift via weighted conformal p -values

  • 作者: Ying Jin, Emmanuel J Candès
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 6/10 · novelty: new_method
  • 摘要: 本文研究协变量偏移下的无模型选择性推断问题,目标是在测试单元协变量X已知而响应Y缺失时,选择响应大于指定阈值的单元并控制错误发现率(FDR),且不依赖数据分布与预测模型假设。作者利用任意预测模型构造了一类校准的加权保形p值(weighted conformal p-values),保证了检测大响应时的第一类错误控制。由于这些p值不满足经典多重检验所需的正相依性(PRDS),传统BH程序失效,因此提出了加权保形选择程序,在有限样本下严格实现FDR控制。该方法不仅适用于预测辅助的候选选择,还推广至多重个体处理效应(ITE)的推断以及分布偏移下的异常检测,并在因果推断和药物发现数据集上验证了有效性。对您有用:该文将保形推断与多重检验结合,为个体处理效应的有限样本FDR控制提供了新视角,直接关联您对因果推断(ITE推断)与假设检验的兴趣。
  • 关键技术: weighted conformal p-values, selective inference, false discovery rate (FDR) control, covariate shift, individual treatment effect inference
  • 为什么对您有用: 直接关联您对因果推断(个体处理效应 ITE 推断)与假设检验的兴趣;提供了在协变量偏移下无需模型假设即可控制有限样本 FDR 的新方法,可迁移至流行病学或经济学中的异质性因果效应筛选。

5. 10.1093/biomet/asaf080 — Harnessing the collective wisdom: fusion learning using decision sequences from diverse sources

  • 作者: Trambak Banerjee, Bowen Gang, Jianliang He
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文提出一种整合排序与阈值框架(integrative ranking and thresholding),用于融合来自多个多重检验程序的证据。核心创新是将各研究的二元检验决策转化为复合 e-values,从而在数据源异质(部分仅报告拒绝集合、部分报告汇总统计量)的元分析设定下实现跨研究推断融合。在各项研究各自控制 FDR 的前提下,理论证明融合后框架仍保证整体 FDR 水平;方法对输入形式高度灵活,可处理仅披露 rejection set 的场景。技术工具依赖 e-value 的复合性质与排序阈值程序的 FDR 封闭性分析。对您在多重检验与假设检验方向的研究有直接参考价值,尤其是 e-value 作为融合工具在异质数据源下的理论保证机制。
  • 关键技术: compound e-values, integrative ranking and thresholding, false discovery rate control, meta-analysis fusion learning, multiple testing combination
  • 为什么对您有用: 直接关联您 primary interest 中的假设检验方向;e-value 融合框架为异质数据源的多重检验组合提供了新理论工具,其 FDR 封闭性证明思路可迁移至高维推断等场景。

6. 10.1093/biomet/asaf091 — Characteristic-function-based tests for spatial randomness

  • 作者: Yiran Zeng, Dale L Zimmerman
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 3/10 · novelty: new_method
  • 摘要: 本文针对任意维矩形/立方体区域内的空间点模式,提出了一种基于特征函数的完全空间随机性(CSR)检验方法。检验统计量定义为经验特征函数与均匀特征函数之间的加权 L_2 距离,无需边缘效应校正,且与 Ripley's K 函数存在理论联系。在 Cauchy 权函数下,作者开发了高效算法推导检验统计量的渐近零分布,实现了快速计算。通过结合不同尺度参数构建 Bonferroni 综合检验,该方法在异质性、聚集性和规则性设定下,尤其是大样本时,功效优于传统 L-test 和 Clark-Evans test。对您有用:该文将特征函数引入空间假设检验并推导渐近分布,直接契合您对数学统计假设检验的兴趣,其渐近分布算法也可为非参数检验的统计计算提供借鉴。
  • 关键技术: characteristic function, weighted L2 distance, asymptotic null distribution, Cauchy weight function, Bonferroni-corrected omnibus test, spatial point process
  • 为什么对您有用: 直接契合您在数学统计(假设检验)方向的兴趣,展示了特征函数在构建检验统计量及推导渐近零分布中的技术路线;其空间随机性检验框架也可迁移至天文空间数据(astrostats)或流行病学聚集性分析。

7. 10.1093/biomet/asaf050 — A family of toroidal diffusions with exact likelihood inference

  • 作者: E García-Portugués, M Sørensen
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 1/10 · novelty: new_theory
  • 摘要: 针对连续时间多变元角度数据(环面数据),本文构造了一类具有显式转移概率密度的扩散过程,从而实现精确似然推断,避免了离散化近似。所提扩散过程具有时间可逆性,且可适配任意预设的平稳分布(包括多峰混合分布)。基于显式转移密度,作者推导了渐近似然理论,支持单样本推断及k组扩散过程的线性假设检验(含同质性检验)。此外,该模型允许精确且直接的扩散桥模拟,并提出了具有类似性质的圆形跳跃过程。数值实验与实证应用(蚂蚁运动同质性检验、蛋白质骨架桥模拟)验证了方法的有效性。对您而言,该文在精确似然与线性假设检验方面直接关联您的数学统计与假设检验兴趣,同时环面数据建模在天文统计(如天体角位置/运动方向数据)中极具应用潜力。
  • 关键技术: exact likelihood inference, toroidal diffusion process, diffusion bridge simulation, asymptotic likelihood theory, linear hypothesis testing, time-reversible diffusion
  • 为什么对您有用: 直接关联您的数学统计与假设检验兴趣(精确似然下的线性假设与同质性检验),且环面扩散模型在天文统计(天体角位置/方向数据)中有直接应用价值。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1093/biomet/asaf057 — Decomposing Gaussians with unknown covariance

  • 作者: A Dharamshi, A Neufeld, L L Gao, J Bien, D Witten
  • 期刊/来源: Biometrika
  • 分类: vol 113 · issue 1
  • 相关性 3/10 · novelty: new_theory
  • 摘要: 在协方差矩阵未知的多元高斯设定下,本文研究如何将数据信息分解为独立或可处理的依赖部分,以替代传统样本分割。作者提出一个通用分解算法,将已有已知协方差下的分解方法统一为特例,并推广至未知协方差情形(n>1)。对于 n=1 的情形,文章从理论上证明在未知协方差下将信息分解为独立部分是不可能的,转而提出将其分解为具有可解条件分布的依赖部分。该分解策略自然推广至高斯过程,并应用于模型选择与选择后推断。理论上给出了 n=1 时独立分解的不可能性证明及依赖分解的条件分布解析式;实证上在脑电图数据中展示了其在无法使用传统样本分割时的推断价值。对您有用:该工作为纵向数据或高斯过程中的条件推断提供了新的数学统计工具,其分解算法与选择后推断框架可直接迁移至您感兴趣的统计计算与推断问题中。
  • 关键技术: multivariate Gaussian decomposition, sample splitting alternative, conditional distribution tractability, post-selection inference, Gaussian process
  • 为什么对您有用: 该论文在未知协方差的高斯设定下重新审视了样本分割与信息分解,其严格的不可能性证明与依赖分解算法直接关联您在统计计算与数学统计方面的兴趣,且高斯过程的应用对纵向数据的因果推断与推断计算有迁移价值。

Maintained by 陈星宇 · Homepage · Source on GitHub