Biometrika — Vol 113 Issue 2 · 2026-06-20¶

共 15 篇 · Biometrika
目录核对 ⚠️ 疑似漏 16 篇（对照 OpenAlex 30 篇）：10.1093/biomet/asag007、10.1093/biomet/asaf089、10.1093/biomet/asag008、10.1093/biomet/asaf070、10.1093/biomet/asag015 等

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期Biometrika第113卷第2期共收录15篇论文，覆盖因果推断、高维推断与随机矩阵、非参数半参数方法、统计计算等方向。因果推断是本期的核心主线，6篇论文分别从多值/连续处理、动态处理、工具变量、敏感性分析等角度推进识别与效率理论；高维推断与随机矩阵有2篇，分别提出基于秩统计量的谱检验和针对异配时序网络的动态聚类方法；假设检验另有1篇聚焦分布自由的多重比较FDR控制；非参数半参数方法有3篇，涉及删失功能数据、流形上的后验推断、多类别均值比率估计；统计计算2篇分别推广切片采样至黎曼流形和提出基于Picard映射的并行MCMC加速方案。

在因果推断主线中，各篇围绕弱化或绕过传统强假设展开：多治疗比较下提出兼容性参数与弱容忍正性的识别策略（Comparing causal parameters with many treatments and positivity violations）；连续治疗设定分别以平均导数效应为标量参数（Parameterizing the effect of a continuous treatment using average derivative effects）和构建连续边际结构模型的有效非参估计（Nonparametric efficient estimation of marginal structural models with continuous time-varying treatments），均给出双稳健或半参有效工具；动态处理效应通过递归平衡与高维协变量平衡实现渐近推断（Dynamic covariate balancing）；LATE的随机化推断引入studentized AR统计量保证有限样本精确性和异质处理效应下的渐近有效性（Randomization-based confidence sets for the local average treatment effect）；敏感性分析则从最坏情形转向平均情形，以倾向得分比率二阶矩约束导出更紧边界（An average-case sensitivity analysis for unmeasured confounding）。

高维与随机矩阵方向，Wilcoxon–Wigner随机矩阵基于归一化秩统计量构造谱检验，不依赖分布假设且对极端值稳健（Testing for latent structure via the Wilcoxon–Wigner random matrix of normalized rank statistics）；动态聚类则针对异配随机块模型提出核去偏求和后谱聚类，允许节点隶属度随时间平滑变化（Dynamic clustering for heterophilic stochastic block models with time-varying node memberships）。非参数半参数方面，稀疏删失功能数据的FPCA采用局部对数似然直接获得正半定协方差算子（Functional principal component analysis for sparse censored data）；序列Gibbs后验通过分步调参实现伯恩斯坦-冯-米塞斯定理，在PCA等流形参数上恢复名义覆盖率（Sequential Gibbs posteriors with applications to principal component analysis）；多类别均值比率估计在样本与类别双重扰动下通过可解释约束和惩罚实现全可识别（Estimating ratios of means of multicategory data observed with sample and category perturbations）。

与因果推断方向最贴合的是前述6篇论文，其中连续治疗边际结构模型和平均导数效应工作专注于半参效率；高维统计与随机矩阵方向推荐谱检验和动态聚类两篇；半参数效率与伯恩斯坦-冯-米塞斯理论可关注序列Gibbs后验和删失FPCA的效率分析。

因果推断 (causal_inference, 6 篇)¶

1. 10.1093/biomet/asag017 · arXiv — Comparing causal parameters with many treatments and positivity violations¶

作者: A McClean, Y Li, S Bae, M McAdams DeMarco, I Díaz, W Wu
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_method
摘要: 在多治疗比较研究中，传统的 treatment-specific means 需要严格的 positivity 假设（每个个体有非零概率接受每种治疗），这在治疗数量多时往往不成立。本文提出基于动态随机干预的因果参数，并引入一个兼容性标准：若条件治疗均值对某一治疗大于另一治疗，则对应的因果参数也应更大。许多标准参数不满足该标准，但本文证明仅需较弱的 positivity 假设即可识别出满足该标准的参数。具体给出两个简单例子：trimmed 和 smooth-trimmed treatment-specific means。对 smooth-trimmed 均值，作者发展了双重稳健 (doubly robust) 估计量，在非参数条件下达到参数收敛率。最后通过纽约州透析机构数据验证方法。该工作直接关联您 primary interest 中的因果推断（尤其是多治疗比较与 positivity violation 的识别和估计），且双重稳健估计量是 debiased ML 的核心工具。
关键技术: positivity violation, dynamic stochastic interventions, doubly robust estimation, trimmed treatment-specific means, smooth-trimmed treatment-specific means, causal parameter comparability criterion
为什么对您有用: 本文聚焦于因果推断中多治疗比较时 positivity 假设不满足的问题，这正是您 primary interest 中“因果推断（identification, estimation, sensitivity analysis）”的活跃子方向。文中提出的 smooth-trimmed treatment-specific means 及其双重稳健估计量可直接利用您 very_familiar 中的“estimation theory in causal inference”进行理解和扩展。这是立即可做的工作：您的现有武器库足以复现并可能推广其估计量（如结合 cross-fitting 或更高效的 nuisance 函数估计）。

2. 10.1093/biomet/asag016 · arXiv — Dynamic covariate balancing: estimating treatment effects over time with potential local projections¶

作者: Davide Viviano, Jelena Bradic
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_method
摘要: 本文研究面板数据中动态处理（treatment）随时间变化时的因果效应估计与推断问题。假设处理分配基于高维协变量、过去结果和过去处理历史，且结果和时变协变量依赖于所有过去处理的完整轨迹，允许处理效应异质性。方法上提出一种递归平衡策略：先通过局部投影（local projections）将潜在结果期望投影到过去历史上，再对每一期的可观测特征进行动态协变量平衡，以消除因非实验和序列分配而产生的混淆偏差。该方法在高维场景（特征数远超样本量）下仍能建立渐近正态的推断保证，无需稀疏性假设。数值实验和实证应用展示了该方法相对现有动态处理效应估计器的优势。对于您在纵向因果推断和高维协变量平衡方面的研究具有直接参考价值，尤其是其中的投影-平衡两步框架可与您的非参数估计工具结合。
关键技术: dynamic treatment effects, covariate balancing, local projections, high-dimensional panel data, sequential g-formula, inference under many covariates
为什么对您有用: 该论文直接对应您的因果推断（纵向/面板数据方向）与高维统计的兴趣点。方法上使用的协变量平衡和局部投影技术，与您非常熟悉的非参数统计和高维渐近工具高度匹配；其中的推断理论部分可利用您的M估计和半参理论进一步剖析。基于您当前的武器库，该方法的识别条件、估计量构造和渐近理论均可在短期内深入理解并延展至更一般的动态处理设定（如带有未观测混杂的情形），属于立即可做的跟进方向。

3. 10.1093/biomet/asag010 · arXiv — Randomization-based confidence sets for the local average treatment effect¶

作者: P M Aronow, Haoge Chang, Patrick Lopatto
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_theory
摘要: 在带有非依从性的随机化实验设定下，目标是构造局部平均处理效应（LATE）的置信集。核心方法是对 Imbens & Rosenbaum (2005) 的随机化推断程序进行改进，采用 studentized Anderson–Rubin (AR) 统计量作为检验统计量。理论证明：在处理效应同质性假设下，所得置信集具有有限样本精确性（finite-sample exact）；当处理效应异质时，置信集对 LATE 仍保持渐近有效性。论文提供了该程序的均匀分析（uniform analysis），并给出了构造置信集的高效算法。对您有用：此工作为 IV / LATE 的随机化推断提供了有限样本与渐近双重保障，直接连接到您因果推断中 IV 估计与假设检验的兴趣。
关键技术: randomization inference, local average treatment effect, studentized Anderson-Rubin statistic, finite-sample exact inference, uniform asymptotic validity, noncompliance
为什么对您有用: 本文直接连接到因果推断中 IV / LATE 的 identification 与 estimation 子方向，以及假设检验子方向。您武器库中 very_familiar 的因果推断估计理论可直接审视其 studentized AR 统计量的渐近展开，moderately_familiar 的 M-estimation 理论可用于验证其均匀有效性声明的紧致性。Follow-up 粗判：立即可做——用您熟悉的 minimax / uniform convergence 工具即可展开分析其异质性下的渐近界是否可进一步 sharpen。

4. 10.1093/biomet/asag026 — Nonparametric efficient estimation of marginal structural models with continuous time-varying treatments¶

作者: A Martin, M Santacatterina, I Díaz
期刊/来源: Biometrika
机构: New York University
分类: vol 113 · issue 2
相关性 9/10 · novelty: new_method
摘要: 在纵向时间变化处理设定下，本文目标是连续/多值处理的 marginal structural model (MSM) 的因果效应非参数估计。现有 MSM 方法主要依赖离散处理与参数模型，缺乏可扩展的非参数估计器。作者基于非参数识别函数的一阶 von Mises 展开，推导出 efficient influence function 与 semiparametric efficiency bound，并结合 data-adaptive 回归（含 ensemble learning）与 cross-fitting 构建估计器。理论证明在条件满足时，估计器具有 sequential double robustness、n^{-1/2}-CAN 且可达非参数效率界。仿真与 COVID-19 流动性数据实证支持了方法性质。对您有用：本文将 semiparametric efficiency theory 与 longitudinal causal inference 结合，直接关联您 primary interest 中的 longitudinal CI 与 efficiency theory。
关键技术: marginal structural model, efficient influence function, von Mises expansion, sequential double robustness, cross-fitting, semiparametric efficiency bound
为什么对您有用: 本文直接推进您 primary interest 中 longitudinal causal inference 与 efficiency theory 的交叉：连续时间处理 MSM 的 EIF 与 efficiency bound 推导是典型的 semiparametric efficiency 问题。您武器库中 moderately_familiar 的 semiparametric theory 与 identification theory 正好可以攻本文的 identification 与 EIF 推导细节，而 very_familiar 的 estimation theory in causal inference 可直接审视其 sequential DR 估计器的收敛条件。Follow-up 判断：中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉（特别是 longitudinal g-formula 下的 tangent space 计算），才能完整复现并可能用 HOIF 做更高阶修正。

5. 10.1093/biomet/asag012 — Parameterizing the effect of a continuous treatment using average derivative effects¶

作者: Oliver J Hines, Karla Diaz-Ordaz, Stijn Vansteelandt
期刊/来源: Biometrika
机构: Columbia University · Royal Statistical Society · Statistical Research (United States) · University College London · University College Ghent · Ghent University
分类: vol 113 · issue 2
相关性 8/10 · novelty: new_method
摘要: 本文针对连续治疗的因果效应，提出使用平均导数效应（average derivative effect, ADE）作为标量参数，替代传统的剂量反应函数或shift干预，以避免强重叠假设。通过刻画ADE的Riesz表示子，作者建立了一类加权ADE估计量，并推导了最小化非参数效率界的最优权重，从而将二元治疗的最优加权结果系统扩展到连续治疗设定。估计量避免了对条件密度函数的直接估计，允许灵活使用现代机器学习方法，且具有双稳健性质。理论推导证明了所提估计量的半参有效性和渐近正态性；模拟和真实数据分析（华法林剂量效应）验证了有限样本表现。该工作为连续治疗下的因果推断提供了一种可解释且统计高效的框架，对您的半参效率理论和因果推断估计方向有直接参考价值。
关键技术: Average derivative effects, Riesz representer, Efficient influence function, Optimal weighting, Double robustness, Cross-fitting
为什么对您有用: 本文直接涉及您的核心兴趣——因果推断中连续治疗的识别与估计，且与半参效率理论紧密相连。技术层面，您熟悉的非参数统计和半参估计理论（尤其Riesz表示子和有效影响函数）足以理解和复现本文方法，并可立即用于拓展至proximal causal inference或敏感性分析中的连续暴露设定。follow-up粗判：立即可做，因为所用工具均在您非常熟悉的非参和估计论范围内。

6. 10.1093/biomet/asag030 · arXiv — An average-case sensitivity analysis for unmeasured confounding¶

作者: Yao Zhang, Qingyuan Zhao
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 8/10 · novelty: new_method
摘要: 在观测性研究的因果推断中，敏感性分析对于评估未测量混杂的影响至关重要。现有边际敏感性模型通常考虑最坏情况的参数（logit差异），这可能导致保守的推断。本文提出一种平均情形敏感性模型，通过约束倾向得分比率的二阶矩来参数化未测量混杂的平均强度，而非最坏情况。作者将对应的敏感性分析转化为优化问题，推导出平均潜在结果的sharp闭式上下界。基于有效影响函数（EIF），他们构造了一步估计量以实现高效估计，并采用multiplier bootstrap构建同时置信带以覆盖整个敏感性曲线。真实数据分析表明，该平均情形分析能提供更紧的边界，并有助于利用观测协变量校准结果。该工作直接关联您对因果推断中敏感性分析的兴趣，其基于EIF的估计框架与您的半参数理论和debiased ML技术高度契合。
关键技术: marginal sensitivity model, propensity score ratio, second moment parameter, sharp closed-form bounds, one-step estimator, efficient influence function, multiplier bootstrap
为什么对您有用: 本文直接切入您primary interest中的因果推断敏感性分析子方向，提出一种替代最坏情况的新平均情形模型，理论上有更紧的边界。所用EIF估计器和bootstrap技术完全落在您very_familiar的'estimation theory in causal inference'范围内，无需额外工具即可理解方法细节。立即可做：您可借鉴其EIF推导框架，探索将平均情形模型推广至其他estimand（如ATT或mediation）的闭式界。

高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)¶

1. 10.1093/biomet/asag003 · arXiv — Testing for latent structure via the Wilcoxon–Wigner random matrix of normalized rank statistics¶

作者: Jonquil Z Liao, Joshua Cape
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 7/10 · novelty: new_method
摘要: 本文针对大型对称数据矩阵中潜在结构（如社区检测、主子矩阵检测）的检验问题，提出一类基于归一化秩统计量的对称随机矩阵——Wilcoxon–Wigner随机矩阵。其构造无需数据分布假设，且对极端值不敏感，计算效率高。理论方面，作者证明了该矩阵的最大特征值和对应特征向量具有渐近正态分布，且中心化和尺度参数可显式计算。基于此，建立了无参数、无分布假设的谱检验方法，适用于两类检验问题。数值实验验证了方法的有效性，并与传统信号加噪声的独立元素随机矩阵谱方法进行了对比。该工作将非参数秩统计量与随机矩阵谱理论结合，为高维假设检验提供了新工具，尤其适用于数据分布未知或存在异常值的场景。对您而言，该论文直接关联您的高维随机矩阵理论兴趣，同时利用秩统计量这一非参数工具，与您熟悉的‘高维渐近理论’和‘非参数统计’武器高度匹配，易于深入。
关键技术: Wilcoxon-Wigner random matrix, normalized rank statistics, spectral method, Gaussian fluctuation, community detection, principal submatrix detection
为什么对您有用: 该论文直接契合您的高维随机矩阵理论（RMT）兴趣，特别是谱方法在假设检验中的应用，并且利用了非参数秩统计量来克服数据分布假设限制。您的‘高维渐近理论’和‘非参数统计’武器可直接用于理解其渐近分布推导，并可探索将该矩阵构造推广至其他检验问题（如网络结构变化检测）。立即可做：基于您已有的RMT和秩统计知识，可尝试将该方法应用于您关注的因果推断中的网络数据检验。

2. 10.1093/biomet/asag018 · arXiv — Dynamic clustering for heterophilic stochastic block models with time-varying node memberships¶

作者: K Z Lin, J Lei
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 3/10 · novelty: new_method
摘要: 本文考虑时序网络中节点成员随时间逐渐变化的随机块模型，目标是每个时间点的社区结构恢复，但单个时间点的网络信号很弱。作者提出kernel-debiased sum of squares方法，通过对邻接矩阵进行核加权去偏后求和，再进行谱聚类来估计社区。理论部分通过新颖的偏差-方差分解证明了该方法即使在异配网络中也能实现一致的社区检测，且不要求社区间连接概率的时间平滑性。还证明了基于节点变化速度跨时间对齐社区的可识别性，并开发了数据自适应的带宽选择程序。模拟和基因共调控网络的动态分析验证了方法的有效性。本文与您在高维统计和谱方法方面的兴趣直接相关，其去偏聚合思路可迁移到其他高维问题中的信号积累。
关键技术: kernel-debiased sum of squares, spectral clustering, bias-variance decomposition, heterophilic stochastic block models, time-varying node memberships, data-adaptive bandwidth selection
为什么对您有用: 本文连接您在高维统计（随机矩阵理论）中的谱聚类和社区检测兴趣，提供了一个去偏聚合框架处理弱信号多时间点的挑战。您的武器库中very_familiar的high-dimensional asymptotics可用于评估其偏差-方差分解的渐近性质，nonparametric statistics则有助于理解核方法的带宽选择。总的说来，立即可做——用熟悉的谱分析和渐近工具就能深入理解或扩展其理论。

非参数 / 半参数 (nonparam_semipara, 3 篇)¶

1. 10.1093/biomet/asag023 — Functional principal component analysis forsparse censored data¶

作者: Caitrin Murphy, Eric Laber, Rhonda Merwin, Brian Reich, Jake Koerner
期刊/来源: Biometrika
机构: Duke University · North Carolina State University
分类: vol 113 · issue 2
相关性 5/10 · novelty: new_method
摘要: 针对稀疏且存在删失的功能数据（测量仪器范围截断导致观测值被限制在预设区间内），本文扩展了经典FPCA框架，以无偏估计潜在过程的均值和协方差函数。采用局部对数似然最大化平滑估计均值函数和协方差曲面，该过程直接产生正半定的协方差算子，避免了事后移除负特征值的步骤。基于删失数据构建了条件得分预测器，并嵌入广义功能线性模型。建立了均值、协方差及得分估计量的收敛速度，理论分析表明删失校正的必要性。模拟实验证实相比忽略删失的朴素方法，所提估计量偏差更低、预测性能更优。实际案例利用1型糖尿病个体的删失功能血糖数据分类饮食失调诊断，展示了方法的实用性。对您而言，该文的局部似然平滑技术和收敛率推导与您熟悉的非参数估计理论及估计理论高度契合，可直接迁移至其他删失功能数据场景。
关键技术: functional principal component analysis, local likelihood maximization, covariance smoothing, positive semidefinite covariance, score prediction, convergence rates, generalized functional linear model
为什么对您有用: 该文直接触及您primary interest中的非参数统计与估计理论，特别是处理删失数据时的非参数平滑方法。您very_familiar武器库中的非参数统计和minimax界工具可以立即用于评估其收敛速度是否最优，或设计更高效的平滑核。粗判：立即可做——您无需学习额外技术即可理解并扩展该方法。

2. 10.1093/biomet/asag020 · arXiv — Sequential Gibbs posteriors with applications to principal component analysis¶

作者: Steven Winter, Omar Melikechi, David B Dunson
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 4/10 · novelty: new_method
摘要: 本文针对Gibbs后验（先验乘指数损失函数，含单一调参参数）在实际中无法实现名义频率覆盖的问题，提出序列化Gibbs后验，将数据分成多个子集依次更新，每个子集各配一个调参参数。作者证明，在欧氏空间和流形上满足易验证条件时，序列Gibbs后验具有后验集中性并服从Bernstein-von Mises定理，因而渐近置信区域能达到名义覆盖率。作为副产品，文中给出了传统似然贝叶斯后验在流形上的首个Bernstein-von Mises定理。方法在PCA上做了演示，通过调节子集参数实现更好的不确定性量化。该工作直接连接Bernstein-von Mises理论与非参数贝叶斯，对您在半参数渐近效率方面的兴趣有参考价值。
关键技术: Gibbs posterior, Bernstein-von Mises theorem, sequential updating, posterior concentration, manifold-valued parameter, principal component analysis
为什么对您有用: 本文处理Gibbs后验不确定性量化这一半参数/非参数理论中的基础问题，其Bernstein-von Mises结果与您对mathematical statistics和semiparametric theory的兴趣直接相关。您从very_familiar中的nonparametric statistics和minimax bounds角度，可以审视其集中率是否最优，以及调参参数选择是否影响效率。目前可立即可做：利用您对渐近理论和非参后验的熟悉程度，评估其条件在实际PCA问题中的可验证性，并比较与传统贝叶斯PCA的后验行为。

3. 10.1093/biomet/asag009 — Estimating ratios of means of multicategory data observed with sample and category perturbations¶

作者: David S Clausen, Sarah V Teichman, Amy D Willis
期刊/来源: Biometrika
机构: University of Washington
分类: vol 113 · issue 2
相关性 3/10 · novelty: new_method
摘要: 在多类别数据（如微生物组计数）中，当存在未知的样本特异性与类别特异性扰动时，目标是估计跨协变量组的均值比率（partially identifiable estimand）。作者通过施加可解释的参数约束实现 full identifiability，并在损失函数上加入渐近可忽略且约束不变的惩罚项以消除稀疏观测下的偏差与估计量不存在问题。估计采用快速坐标下降算法，假设检验采用 augmented Lagrangian 算法与 model-robust score test，保证小样本及分布假设违背下的有效推断。模拟与结直肠癌微生物关联 meta-analysis 展示了方法灵活性。对您可能有用：该文的 partial identification + 约束恢复 full identification 机制，以及约束下 penalized M-estimation 的渐近理论，可直接迁移到因果推断中负控制设定下的部分识别问题。
关键技术: partial identification, penalized M-estimation, coordinate descent, augmented Lagrangian, model-robust score test, constraint-invariant penalty
为什么对您有用: 本文的 partial identification 通过参数约束恢复 full identification 的思路，直接连接到 proximal CI / sensitivity analysis 中部分识别与约束收紧的子方向；其约束下 penalized M-estimation 的渐近分析可用您 very_familiar 的 M-estimation theory 与 moderately_familiar 的 semiparametric theory 工具攻入。follow-up 判断：中期可做——需先在 moderately_familiar 的 identification theory 上长肌肉，以将此类约束识别框架系统化地嵌入因果推断的负控制 / IV 设定中。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶

1. 10.1093/biomet/asag013 · arXiv — Design-based causal inference for incomplete block designs¶

作者: Taehyeon Koo, Nicole E Pashley
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 8/10 · novelty: new_theory
摘要: 在有限总体、设计基（design-based）因果推断框架下，本文研究不完全区组设计（incomplete block design, IBD）与平衡不完全区组设计（BIBD）的处理效应估计问题，核心 estimand 为区组内处理对比，无需减少处理臂数量。作者提出两种设计基估计量，推导其精确性质与有限总体中心极限定理（finite-population CLT），并构造保守方差估计量以保证稳健推断。文中系统对比了设计基估计量与线性模型基估计量的差异，模拟与实例验证了 IBD 估计量的实用性。对您可能有用：本文为设计基因果推断在复杂随机化方案下的推断理论提供了严格结果，可直接补充您对有限总体假设检验与估计理论的兴趣。
关键技术: design-based causal inference, finite-population central limit theorem, incomplete block design, balanced incomplete block design, conservative variance estimation, potential outcomes framework
为什么对您有用: 本文直接连接到您 primary interest 中因果推断的估计理论与假设检验子方向，在有限总体设计基框架下给出了严格的 CLT 与方差估计结果。您 very_familiar 中的估计理论在因果推断中的工具可直接用来审视其估计量的效率性质（如与 semiparametric efficiency bound 的对比），moderately_familiar 的 M-estimation 理论也可用来分析其与线性模型基估计量的差异。follow-up 判断：立即可做——用您熟悉的估计理论与 minimax 视角即可评估其设计基估计量的效率边界与保守方差估计的紧性。

2. 10.1093/biomet/asag025 · arXiv — Finding distributions that differ, with false discovery rate control¶

作者: Yonghoon Lee, Edgar Dobriban, Eric J Tchetgen Tchetgen
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 7/10 · novelty: new_theory
摘要: 在多重比较设定下，研究如何从参考分布样本与多个比较组样本中识别出与参考分布不同的比较组分布。目标 estimand 为真实差异组的集合，核心假设为各组样本间的可交换性。提出 batch conformal p-value 概念，证明其满足正回归依赖性（PRDS），从而通过 Benjamini–Hochberg 程序实现精确的、分布自由的 FDR 控制。证明 PRDS 的关键技术是引入了一种在可交换性下构造具有几乎必然支配性秩向量的归纳方法。模拟显示该方法虽为分布自由，但在已知正态分布的设定下功效可比，且优于基于 conformal OOD 检测的直接方法。对您可能有用：该归纳秩向量支配技术为非参数假设检验中的 FDR 控制提供了新的数学工具，可直接连接到您对 mathematical statistics 与 hypothesis testing 的核心兴趣。
关键技术: batch conformal p-value, positive regression dependence (PRDS), Benjamini-Hochberg procedure, inductive rank-vector dominance under exchangeability, distribution-free FDR control
为什么对您有用: 本文直接连接到您 primary interest 中的 mathematical statistics (hypothesis testing) 子方向，其核心 novelty——归纳构造几乎必然支配秩向量以证明 PRDS——是一个纯粹的非参数概率/组合技术，您武器库中 very_familiar 的 nonparametric statistics 完全足以攻入并拓展该证明思路（例如探究该支配结构在更一般半参数/高维设定下的失效边界）。follow-up 粗判：立即可做。

统计计算 / 算法 (stat_computing, 2 篇)¶

1. 10.1093/biomet/asag006 · arXiv — Geodesic slice sampling on Riemannian manifolds¶

作者: Alain Durmus, Samuel Gruffaz, Mareike Hasenpflug, Daniel Rudolf
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文提出了一种在黎曼流形上进行近似采样的马尔可夫链蒙特卡洛（MCMC）方法，称为测地线切片采样（geodesic slice sampling）。该方法将经典的切片采样从欧几里得空间推广到任意黎曼流形，通过将直线抽象为测地线来实现。算法针对定义在流形上的概率测度（如Stiefel和Grassmann流形上的后验分布）设计，且对目标分布可逆，并在全变差距离下收敛。数值实验表明，与现有流形MCMC方法相比，该方法对高度各向异性的目标密度具有稳健性，无需使用梯度信息或预处理。理论保证包括转移核的不可约性和几何遍历性。该工作对您统计计算方向的算法研究具有直接参考价值，且流形MCMC在贝叶斯高阶因果推断或矩阵值参数估计中有潜在应用。
关键技术: Geodesic slice sampling, Riemannian manifold MCMC, Hit-and-run slice sampling, Reversible Markov chain, Stiefel manifold, Grassmann manifold
为什么对您有用: 本文直接属于统计计算（MCMC方法）这一主要兴趣子方向，且提出了一种理论完整、实现稳健的通用流形采样器。您的技术武器库中'软件发展'一项可立即用于实现并验证该算法在贝叶斯因果推断（如结构因果模型中的参数后验）上的表现。但目前暂不可做：您缺乏对流形MCMC收敛理论和Riemannian几何工具的熟悉程度，需先花时间掌握相关概率论和微分几何基础。

2. 10.1093/biomet/asag022 · arXiv — Parallel computations for Metropolis Markov chains with Picard maps¶

作者: S Grazzi, G Zanella
期刊/来源: Biometrika
分类: vol 113 · issue 2
相关性 5/10 · novelty: new_method
摘要: 本文研究针对零阶（gradient-free）Metropolis MCMC 的并行化算法，核心设定是目标分布 π 为 ℝ^d 上的 log-concave 密度，仅依赖点wise log-π 计算。作者引入基于 Picard map 的并行迭代机制：对 random-walk Metropolis，使用 O(√d) 个处理器可在 O(√d) 次并行迭代内生成接近 π 的样本，相比串行实现获得 √d 倍加速。进一步，算法变体用 O(d) 处理器在 O(1) 并行迭代内从近似测度 π_r 采样。实证验证涵盖高维回归、梯度不可用的流行病学模型及精准医学应用。对您而言，该工作在统计计算与数值算法方向提供了 MCMC 并行化的新思路，且流行病学与精准医学的应用案例可作为 secondary interest 的数据集参考。
关键技术: Picard map iteration, parallel Metropolis-Hastings, log-concave sampling, gradient-free MCMC, approximate target measure π_r
为什么对您有用: 本文直接连接统计计算（数值方法与算法）子方向，并涉及流行病学模型应用。从技术武器看，您 very_familiar 的高维渐近理论可用来审视其 O(√d) 加速率在更一般分布（非 log-concave）下是否成立或可改进，moderately_familiar 的 M-estimation 理论可分析近似测度 π_r 对后续推断的影响。Follow-up 判断：中期可做——需先在 moderately_familiar 的 M-estimation / semiparametric 理论上长肌肉，以严格量化 π_r 近似对 semiparametric efficiency bound 的偏差；若仅关注算法实现与流行病学数据应用，则立即可做。

Maintained by 陈星宇 · Homepage · Source on GitHub