AoAS — Vol 19 Issue 4 · 2026-06-19¶
- 共 14 篇 · Annals of Applied Statistics
- 目录核对 ⚠️ 疑似漏 29 篇(对照 OpenAlex 43 篇):10.1214/25-aoas2101、10.1214/25-aoas2089、10.1214/25-aoas2077、10.1214/25-aoas2103、10.1214/25-aoas2079 等
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
这一期14篇论文大致可归为四条主线:因果推断与中介分析、形状约束与非参数建模、贝叶斯框架下的复杂数据结构推断、以及高维特征筛选。因果推断方面,两篇分别处理连续处理的modified treatment policy效应估计与剂量探索设计;形状约束与非参数主线涵盖疾病进展时间对齐(BPTR)、截断多尺度空间过程以及变系数单指数面板模型;贝叶斯方法渗透进流行病多源数据推断、多状态模型、空间因子分析、多模态影像整合等应用;高维部分则有一篇针对单细胞聚类特征筛选的EM-test。
因果推断一线,Modified treatment policy effect estimation with weighted energy distance绕开条件密度建模的困难,转而通过weighted energy distance平衡协变量分布来构造MTP权重,使估计不依赖密度估计稳定性;DEMO将中介分析嵌入Phase 1-2临床试验,通过贝叶斯模型选择无活性剂量、适应性随机化候选剂量,并基于受限平均生存时间选择最优剂量,为利用生物标志物优化剂量提供了一条因果路径。
形状约束与非参数建模一线,Studying the long-term natural history of diseases提出Bernstein多项式时间对齐(BPTR),在单调性约束下从短期纵向数据估计个体进展速率和真实发作时间,避免对进展曲线的参数假设;Clipped multiscale spatial processes用截断多尺度高斯过程统一plot与subplot尺度,建模多物种植被覆盖的二元数据,保留细尺度信息;The dynamic interplay of clan culture and socioeconomic factors on fertility提出变系数单指数面板模型并嵌入潜在分组结构,同时估计指数投影方向、变系数函数与分组归属,以刻画宗族文化与生育率的交互效应。
贝叶斯复杂数据结构推断一线,Inferring epidemics from multiple dependent data构建半随机状态空间模型(确定性近似大规模传播+随机性保留罕见事件),用pseudo-marginal MCMC从多源依赖观测推断流行曲线与严重度指标;Estimation for multistate models subject to reporting delays and incomplete event adjudication采用两步M-估计处理报告延迟与事件裁定不完全,用thinning和imputed likelihood处理观测过程偏倚;Mapping food insecurity in the Brazilian Amazon将空间随机效应纳入项目因子分析模型,预测潜在因子并识别热点,R包spifa提供实现;Multiobject data integration in the study of primary progressive aphasia对灰质结构图像和功能连接网络联合回归言语率,用集成先验联合建模两种对象间的关联;此外,A finite population parametric Bayesian bootstrap for quick counts用鞅引导的迭代填补进行有限总体不确定性量化,Sequence interaction model以生成式建模处理无负样本的TCR-肽结合预测。
高维假设检验一线,Feature screening for clustering analysis of count data对每个特征拟合两成分混合模型并计算似然比统计量,在单细胞RNA-seq中筛选聚类相关基因,具备sure screening性质和选相一致性。
与因果推断最直接相关的是前两篇;半参数效率方向可重点关注BPTR、clipped GP和变系数单指数面板模型;高维方向则只看EM-test一篇;其余多篇在贝叶斯复杂数据建模上各有侧重,适合需要处理多源依赖、空间、多模态或有限总体推断的读者。
因果推断 (causal_inference, 2 篇)¶
1. 10.1214/24-aoas1991 · arXiv — Modified treatment policy effect estimation with weighted energy distance¶
- 作者: Ziren Jiang, Jared D. Huling
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 8/10 · novelty:
new_method - 摘要: 在连续处理的因果推断设定下,本文研究 modified treatment policy (MTP) 效应的估计问题;目标 estimand 是对观测处理值做某种修改后的效应,其 identification 依赖条件密度构造的权重,但常受 positivity violation 与密度估计不稳定的困扰。作者首先证明:为控制混杂,MTP 权重应使加权后数据协变量分布平衡到一个可用观测数据刻画的未观测目标人群分布。基于此洞察,引入基于 weighted energy distance 的协变量分布不平衡度量,并据此构造新的权重估计方法与修改幅度选择工具。理论方面,新方法绕过了条件密度建模的困难,直接通过分布距离最小化实现平衡;实证上,应用于机械通气功率对院内死亡率的影响研究。对您有用:本文为连续处理/ MTP 设定提供了不依赖条件密度的平衡权重新路径,直接关联因果推断的 identification 与 estimation 子方向。
- 关键技术:
modified treatment policy,weighted energy distance,covariate balancing weights,continuous treatment effect,distribution imbalance measure,positivity violation avoidance - 为什么对您有用: 本文直接推进因果推断中连续处理/MTP的identification与estimation,绕开条件密度建模而用分布距离构造平衡权重,与您primary interest中的因果推断estimation theory紧密相连。您武器库中的semiparametric theory与M-estimation theory(moderately_familiar)可以用来分析此权重估计量的渐近性质(如n^{-1/2}-CAN与效率界),这是一个中期可做的follow-up:需先在M-estimation theory上长肌肉以严格刻画其influence function与semiparametric efficiency bound。
2. 10.1214/25-aoas2099 · arXiv — DEMO: Dose exploration, monitoring, and optimization using biological and clinical outcomes¶
- 作者: Cheng-Han Yang, Peter F. Thall, Ruitao Lin
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 1/10 · novelty:
new_method - 摘要: 本文提出一种名为DEMO的剂量探索、监测与优化设计,旨在利用一个实值生物标志物(如药效学活性或免疫效应)作为剂量与临床结局(肿瘤反应、毒性、生存时间)之间的中介变量。设计框架在Phase 1-2基础上扩展,首先通过贝叶斯模型选择识别并剔除无生物活性的剂量,然后对候选剂量进行适应性随机化,并根据长期随访数据选择最优剂量以最大化受限平均生存时间。该方法使用了多元剂量-结局模型,明确纳入从剂量到临床结局的因果路径。系统校准算法用于确定决策阈值。模拟研究表明,相比忽略生物变量的设计,DEMO可带来实质性改进。本文为因果推断中的中介分析和临床试验设计提供了实用框架,尤其适用于利用生物标志物优化剂量选择的问题。
- 关键技术:
Bayesian model selection,adaptive randomization,dose-finding design,mediation analysis in clinical trials,restricted mean survival time,simulation-based calibration - 为什么对您有用: 本文直接关联到您对因果推断中mediation的兴趣,具体利用生物标志物作为中介变量来改善剂量选择。您的technical arsenal中的identification theory in causal inference可用于分析该设计中中介效应的可识别性条件。目前属于中期可做:您需要先熟悉贝叶斯模型选择和临床试验自适应设计框架(moderately_familiar中的identification theory),但一旦掌握,即可扩展更严谨的因果中介估计方法。
非参数 / 半参数 (nonparam_semipara, 2 篇)¶
1. 10.1214/25-aoas2092 — Studying the long-term natural history of diseases using a shape-restricted nonparametric temporal realignment method¶
- 作者: Joshua L. Warren, Ottavia Prunas, Liangbo Linus Shen
- 期刊/来源: Annals of Applied Statistics
- 机构: Yale University · University of Basel · University of California, San Francisco
- 分类: vol 19 · issue 4
- 相关性 7/10 · novelty:
new_method - 摘要: 在慢性病自然史推断中,由于疾病发作时间未知且长期随访不可行,目标是利用短期纵向数据同时估计个体特异性的疾病进展速率、真实发作时间以及随时间单调递增的进展函数。本文提出 Bernstein Polynomial Temporal Realignment (BPTR),一种形状受限的非参数回归方法,通过层次框架捕捉个体变异,放宽了现有方法对进展曲线的强参数假设。BPTR 利用 Bernstein 多项式的单调性约束来估计进展函数,并纳入协变量以解释进展速率和发作时间的异质性。模拟显示 BPTR 在复杂生成设定下能准确估计关键参数;应用于地理萎缩(AMD)纵向数据,给出了疾病长期进展的新见解。对您有用:此处的 Bernstein 多项式形状约束与单调非参数估计,以及层次结构的个体特异性参数推断,直接连接到非参数/半参数理论中的受限 M-估计与效率研究。
- 关键技术:
Bernstein polynomial regression,shape-restricted monotone estimation,hierarchical temporal realignment,individual-specific onset time estimation,nonparametric M-estimation - 为什么对您有用: 本文连接到非参数理论中的形状受限估计(monotone regression via Bernstein polynomials),属于您 primary interest 的非参数/半参数理论子方向。您武器库中的 nonparametric statistics 与 minimax bounds 可直接攻入其理论缺口——BPTR 目前缺乏对单调 Bernstein 估计量的收敛率与 semiparametric efficiency bound 的严格分析,用 minimax rate 工具可验证其估计效率是否达到最优。follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是带形状约束的 semiparametric efficiency bound 计算),才能补上本文缺失的理论性质。
2. 10.1214/25-aoas2088 — Clipped multiscale spatial processes for multivariate plant cover data¶
- 作者: Wilson J. Wright, Peter N. Neitlich, Mevin B. Hooten
- 期刊/来源: Annals of Applied Statistics
- 机构: University of Missouri · Colorado State University · National Park Service · The University of Texas at Austin
- 分类: vol 19 · issue 4
- 相关性 2/10 · novelty:
new_method - 摘要: 在多物种植被覆盖度监测设定下,目标是对点截距法产生的多尺度、多变量二元数据进行空间建模,关键假设是底层存在截断(clipped)多尺度空间高斯过程。核心方法为 clipped multiscale spatial GP:将 subplot 级细尺度空间结构与 plot 级粗尺度结构统一在同一 GP 框架下,并通过跨物种协方差刻画群落结构;计算上采用贝叶斯 MCMC 并设计了高效算法以应对多变量空间 GP 的似然计算瓶颈。主要理论贡献在于展示了 clipped GP 模型如何避免传统方法因聚合 subplot 数据而丢失细尺度信息的问题,实证结果显示该模型能更灵敏地检测重金属污染对植被的影响。对您可能有用:本文的多尺度 GP 结构与您熟悉的 inverse problems with random noise 及高维渐近理论有潜在方法论交叉,可作为空间过程建模的入门阅读。
- 关键技术:
clipped Gaussian process,multiscale spatial model,multivariate binary data,Bayesian MCMC,point intercept method,interspecies correlation - 为什么对您有用: 本文属于空间过程建模的应用方法论论文,与您 primary interest 中的 nonparametric / semiparametric theory 有弱交叉(GP 属非参模型),但核心是生态数据建模而非效率理论或因果推断。从 technical_arsenal 看,您 very_familiar 的 inverse problems with random noise 可作为理解 clipped GP 隐变量推断的切入点,但本文缺乏 minimax / efficiency 层面的理论结果,武器库中的 higher-order U / HOIF 等无法直接攻入其理论缺口。follow-up 粗判:中期可做——若想进入多尺度空间 GP 的效率理论,需先在 moderately_familiar 的 M-estimation theory 上长肌肉以建立 clipped GP 的渐近理论;若仅作为生态数据分析的 gateway reading,本文数据结构和模型设定清晰,值得花时间读全文了解多变量二元空间数据的建模范式。
数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶
1. 10.1214/25-aoas2102 — Feature screening for clustering analysis of count data with an application to single-cell RNA-sequencing¶
- 作者: Changhu Wang, Zihao Chen, Ruibin Xi
- 期刊/来源: Annals of Applied Statistics
- 机构: King University · Peking University · Statistical and Applied Mathematical Sciences Institute · Department of Mathematical Sciences
- 分类: vol 19 · issue 4
- 相关性 3/10 · novelty:
new_method - 摘要: 针对高维聚类分析中的特征筛选问题,以单细胞RNA测序数据为例,目标是识别与细胞亚型相关的基因。提出EM-test方法,对每个特征独立检验其边际分布是否为混合分布(即不同聚类下条件分布相同),通过EM算法拟合两成分混合模型并基于似然比统计量进行检验。该方法在一般参数设定下具有sure independence screening性质和选相一致性,计算效率高。模拟实验表明EM-test能准确筛选聚类相关特征,并显著提升下游聚类性能。在31名患者的免疫单细胞数据集应用中,EM-test不仅检测到已知细胞亚型,还发现了一种与病毒免疫反应相关的新型单核细胞亚型。本文连接您在高维假设检验和流行病学数据分析方面的兴趣,EM-test的混合分布检验思想可为其他高维特征筛选问题提供参考。
- 关键技术:
feature screening,EM-test,mixture model likelihood ratio test,sure independence screening,clustering for high-dimensional count data,single-cell RNA-seq - 为什么对您有用: 本文的核心假设检验方法(混合分布检验)直接连接您的 hypothesis_testing 兴趣,且以 scRNA-seq 实证数据属于 epidemiology 应用。您 very_familiar 中的 high-dimensional asymptotics 工具可立即用于分析 EM-test 的渐近性质(如检验统计量的极限分布、sure screening 条件的理论验证),适合作为立即可做的 follow-up。
经济理论 / 应用 (econ_theory, 1 篇)¶
1. 10.1214/25-aoas2085 — The dynamic interplay of clan culture and socioeconomic factors on fertility: Evidence from China¶
- 作者: Cong Li, Yitao Wang, Jiguo Cao, Jinhong You, Hua Liu
- 期刊/来源: Annals of Applied Statistics
- 机构: Xi'an Jiaotong University · Simon Fraser University · Shanghai University of Finance and Economics
- 分类: vol 19 · issue 4
- 相关性 4/10 · novelty:
new_method - 摘要: 在省级面板数据设定下,研究宗族文化对中国生育率的因果效应及与社会经济因素的交互作用,estimand 为宗族文化对出生人口的 varying-coefficient 单指数系数及潜在分组结构。方法上提出 varying-coefficient single-index panel data model 并嵌入 latent group structure,通过 penalized / iterative 算法同时估计单指数投影方向、变系数函数与分组归属,收敛性质依赖 group-specific kernel/sieve 平滑与 penalty 强度选择。实证基于 28 省面板数据,发现宗族文化总体促进生育但效应递减,且存在显著省际分组异质性及性别偏好差异。对您可能有用:该文将 latent group structure 引入半参数面板模型,为 longitudinal causal inference 中处理异质性处理效应提供了可借鉴的模型框架。
- 关键技术:
varying-coefficient single-index model,latent group structure estimation,panel data semiparametric modeling,penalized profile likelihood,kernel/sieve smoothing - 为什么对您有用: 本文连接到经济理论(中国省级面板数据与生育率决定模型)与纵向因果推断(longitudinal setting 下的异质性效应)。您武器库中的 semiparametric theory 与 M-estimation theory(moderately_familiar)可直接攻其 varying-coefficient single-index estimator 的理论性质(如收敛率、分组一致性)这一口子。Follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格推导该 penalized grouped estimator 的渐近性质与效率界。
流行病学 (epidemiology, 3 篇)¶
1. 10.1214/25-aoas2015 · arXiv — Inferring epidemics from multiple dependent data via pseudo-marginal methods¶
- 作者: Alice Corbella, Anne M. Presanis, Paul J. Birrell, Daniela De Angelis
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 7/10 · novelty:
new_method - 摘要: 在流行病学监测设定下,目标是从多个相互依赖的 noisy surveillance 数据集推断未观测的传播与严重程度动态(estimand 包括每日新感染数、case-hospitalisation risk 等)。作者提出一种半随机状态空间模型:对大规模传播动态使用确定性近似以降维,而对罕见严重事件(住院/ICU)保留随机性。在此框架下,开发基于 pseudo-marginal MCMC 的精确参数推断算法,通过模拟验证,并应用于英格兰 2017-18 流感季的多个依赖监测数据集重建传播动态与严重度指标。对您可能有用:该文展示了如何在依赖多源数据下做联合因果/机制推断,pseudo-marginal 方法处理了 intractable likelihood 的计算瓶颈。
- 关键技术:
pseudo-marginal MCMC,semi-stochastic state-space model,deterministic approximation for transmission dynamics,joint modeling of dependent surveillance data,intractable likelihood inference - 为什么对您有用: (1) 连接到流行病学应用因果推断子方向:多源依赖数据下的机制推断与 severity risk estimation,是 epi 领域典型的 identification + estimation 联合问题。(2) 武器库中
software development与estimation theory in causal inference可直接攻其 pseudo-marginal 算法的实现与理论性质分析口子(如 particle filter 的方差对 MCMC mixing 的影响)。(3) 立即可做:用 very_familiar 的 estimation theory 与 software development 重现其算法并探索 particle 数量对 posterior 的影响;若想深入其半随机模型的 semiparametric efficiency,需先在 moderately_familiar 的 semiparametric theory 上长肌肉。
2. 10.1214/25-aoas2083 — Personalized risk prediction for cancer survivors: A generalized Bayesian semiparametric model of recurrent events with competing outcomes¶
- 作者: Nam Hoai Nguyen, Seung Jun Shin, Elissa B. Dodd-Eaton, Jing Ning, Wenyi Wang
- 期刊/来源: Annals of Applied Statistics
- 机构: The University of Texas MD Anderson Cancer Center · Statistics Korea · Korea University
- 分类: vol 19 · issue 4
- 相关性 5/10 · novelty:
application - 摘要: 针对癌症幸存者发生第二次原发性癌症(SPC)的风险预测问题,本文提出一个贝叶斯半参数框架,将多种竞争性癌症类型视为独立的非齐次泊松过程,并调整首次癌症类型和诊断年龄等协变量。该方法对基线风险函数采用半参数建模(如样条或分段常数),通过贝叶斯推断得到后验分布。利用一个具有丰富家族多原发肿瘤史的队列数据,推导了包括肺癌、肉瘤、乳腺癌等在内的多种SPC的发病风险曲线(penetrance curves),并给出个体化风险估计。预测性能验证:第二原发肺癌的AUC达到0.89,肉瘤0.91,乳腺癌0.76,其余癌种合并0.68,表明模型有良好的判别能力。本文的方法是流行病学中竞争风险复发事件建模的一次扎实应用,对您感兴趣的流行病学应用数据集和纵向因果推断方向有直接参考价值。
- 关键技术:
Bayesian semiparametric model,non-homogeneous Poisson process,competing risks,penetrance curves,ROC curve validation,covariate-adjusted risk prediction - 为什么对您有用: 本文涉及流行病学中的竞争风险预测,直接对应您的secondary interest中的流行病学应用与数据集。您可以用very_familiar中的nonparametric statistics理解其半参数基线风险的设定,并用software development技能复现或扩展其模型(如加入因果干预变量)。立即可做:您当前的武器库足以评估该模型假设(如独立泊松过程)的合理性,甚至尝试引入因果框架。
3. 10.1214/25-aoas2072 · arXiv — Mapping food insecurity in the Brazilian Amazon using a spatial item factor analysis model¶
- 作者: Erick A. Chacón-Montalván, Luke Parry, Emanuele Giorgi, Patricia Torres, Jesem Douglas Yamall Orellana, Paula Moraga et al.
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 2/10 · novelty:
application - 摘要: 本文针对巴西亚马逊地区食物不安全评估中样本独立假设不现实的问题,提出空间项目因子分析模型,通过纳入空间随机效应刻画食物获取的社会经济空间依赖性。模型可预测未采样位置的潜在因子并识别不安全热点,采用贝叶斯MCMC进行推断,并在R包spifa中实现。应用在Ipixuna家庭感知数据上,展示了热点识别和区域优先级排序的实际效果。该方法可推广至其他空间潜在变量研究。对您而言,这是一篇应用导向的流行病学论文,展示了空间建模在公共卫生数据分析中的价值,可作为入门读物理解空间依赖性在latent variable问题中的处理思路。
- 关键技术:
Bayesian spatial modeling,item factor analysis,MCMC,spatial random effects,R package - 为什么对您有用: 本文属于流行病学/公共卫生应用(secondary interest),直接关联您在流行病学应用上的兴趣。方法学上使用空间随机效应处理依赖结构,与您技术库中'inverse problems with random noise'和'estimation theory in causal inference'有潜在概念联系,但核心推断工具(贝叶斯MCMC)不在您的熟悉范围内。暂不可做深度技术迁移,但可作为流行病学空间数据分析的入门案例,值得花时间阅读全文以理解应用场景与建模流程。
其他 (other, 5 篇)¶
1. 10.1214/25-aoas2068 · arXiv — Estimation for multistate models subject to reporting delays and incomplete event adjudication with application to disability insurance¶
- 作者: Kristian Buchardt, Christian Furrer, Oliver Sandqvist
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 6/10 · novelty:
new_method - 摘要: 在多状态模型(multi-state model)设定下,目标是在存在右删失、左截断、报告延迟(reporting delay)与事件裁定不完全(incomplete adjudication)时估计转移强度等参数,将后两者视为部分外生。核心方法为两步 M-估计(two-step M-estimation):第一步用 thinning 技巧推导报告延迟对观测过程的效应(替代现有 Poisson 模型结果),第二步对裁定不完全提出 imputed likelihood 方案,允许事件历史与裁定过程存在依赖、允许未报告事件与多事件类型。在标准可识别性、可积性与光滑性条件下证明了估计量的一致性与渐近正态性,并验证了 percentile bootstrap 的有效性。仿真与残疾保险数据应用展示了有限样本表现与实用潜力。对您可能有用:本文的 M-估计渐近理论与 bootstrap 验证框架,可作为研究 longitudinal causal inference 中类似删失/延迟机制下估计量性质的参考。
- 关键技术:
two-step M-estimation,thinning of point processes,imputed likelihood,multistate life-history models,percentile bootstrap,asymptotic normality of M-estimators - 为什么对您有用: 本文主要处理保险/临床场景下多状态模型的报告延迟与裁定不完全问题,与您 primary interest 中的 longitudinal causal inference 有场景重叠(事件历史数据常见类似观测缺失机制),但核心是参数 M-估计而非 semiparametric/efficiency 理论。您武器库中 M-estimation theory(moderately_familiar)可直接理解其渐近正态性证明口子;若想将类似延迟/裁定机制引入 longitudinal CI 的 semiparametric efficiency bound 分析,则需先在 semiparametric theory 上长肌肉。Follow-up 判断:中期可做——若要迁移至 CI 效率理论,需先强化 semiparametric theory 与 identification theory。
2. 10.1214/25-aoas2082 · arXiv — Spatial hyperspheric models for compositional data¶
- 作者: Michael R. Schwob, Mevin B. Hooten, Nicholas M. Calzada, Timothy H. Keitt
- 期刊/来源: Annals of Applied Statistics
- 分类: vol 19 · issue 4
- 相关性 3/10 · novelty:
new_method - 摘要: 本文针对组合数据的空间分析问题,提出了一种基于平方根变换和方向分布的新模型,以克服传统log-ratio变换或Dirichlet回归的强假设(如严格正分量、负相关)。作者将椭圆对称角度高斯(ESAG)分布截断到非负象限,从而允许零分量和正相关,并保持生成性。在空间超球面回归模型中,引入了固定和随机多变量空间效应,并包含一个用于传播前期模型(如机器学习分类)不确定性的项。通过模拟研究和真实的Downy Woodpecker生物声学信号分类数据验证了模型性能。本文的方法在生态学中处理有分类不确定性传播的组合数据时具有应用价值,且对您研究流行病学中空间组合暴露数据(如饮食成分)的分析有启发意义。
- 关键技术:
elliptically symmetric angular Gaussian (ESAG) distribution,square-root transformation,truncation to non-negative orthant,spatial hyperspheric regression,multivariate spatial random effects,uncertainty propagation from classifier - 为什么对您有用: 本文虽不直接属于您的核心兴趣(因果推断、高维统计),但其空间组合数据建模与不确定性传播机制在流行病学中的空间暴露数据(如污染物组分)分析中有潜在借鉴价值。从技术武器库看,您熟悉的非参和高维工具暂不直接适用于本文的截断方向分布框架,但若未来涉足空间组合数据,可将其视为方法储备。本文属于中等相关度的应用方法论文。
3. 10.1214/25-aoas2066 — A finite population parametric Bayesian bootstrap for quick counts¶
- 作者: Carlos E. Rodríguez, Stephen G. Walker, Ramsés H. Mena
- 期刊/来源: Annals of Applied Statistics
- 机构: Universidad Nacional Autónoma de México · The University of Texas at Austin
- 分类: vol 19 · issue 4
- 相关性 3/10 · novelty:
minor - 摘要: 在有限总体推断设定下,本文提出基于有限总体 Bayesian bootstrap 与鞅后验分布的参数化贝叶斯推断新方法,目标是实现对有限总体中任意待估量的不确定性量化。核心机制是:利用鞅引导的预测模型对未观测部分的总体数据进行迭代填补,再基于完整总体(观测+填补)计算目标量,重复多次以捕获后验不确定性。方法在墨西哥选举"快速计票"数据(2021年公投与2017年州长选举)上进行了实证评估,并与文献中既有方法及贝叶斯基线做了对比。本文属于贝叶斯有限总体推断与选举数据的应用,方法学 novelty 有限(novelty_flag: minor)。对您而言,若关注选举数据集或贝叶斯 bootstrap 在有限总体中的计算实现,可作为应用参考,但与您核心的 semiparametric efficiency / causal inference 理论无直接交集。
- ⚠️ 摘要不完整,待重跑(
python -m research_news.rerun) - 关键技术:
finite population Bayesian bootstrap,martingale posterior distribution,predictive imputation under martingale,parametric Bayesian finite population inference - 为什么对您有用: 本文属于选举数据的应用统计,与您 primary interests(causal inference / semiparametric efficiency / high-dim)无直接理论连接,仅在经济理论/流行病学 secondary 的"数据集"层面有微弱交集(选举数据可视作经济理论的应用数据源)。武器库中的 very_familiar(minimax bounds / semiparametric theory)无法攻入此贝叶斯 bootstrap / 鞅后验的框架,moderately_familiar 的 M-estimation 也无直接口子。follow-up 判断:暂不可做——核心机器(鞅后验 / Bayesian bootstrap)不在武器库中,且理论 novelty 低,不值得展开读全文。
4. 10.1214/25-aoas2114 — Sequence interaction model with applications to TCR-peptide binding¶
- 作者: Ran Liu, Xinyi Tang, Xiaodan Fan
- 期刊/来源: Annals of Applied Statistics
- 机构: Beijing Normal University · Hang Seng University of Hong Kong · University of Hong Kong · Chinese University of Hong Kong
- 分类: vol 19 · issue 4
- 相关性 2/10 · novelty:
application - 摘要: 本文针对T细胞受体与抗原肽的结合预测问题,提出了一种概率生成模型——序列交互模型(SIM)。该模型仅利用正样本(结合对)进行训练,解决了实际数据中缺乏负样本的困难。SIM通过交互得分矩阵揭示结合偏好,并能够区分贡献性残基与非贡献性残基。模型在模拟数据、配对序列数据和实验结构数据上进行了验证,展示了良好的预测性能。方法上,SIM以生成式建模替代判别式分类,避免了负样本构造偏差。总体而言,这是一项面向特定生物学问题的应用统计工作,在模型验证策略上有一定创新。对于统计计算和软件开发者,其仅正样本学习的建模思路可作为参考,但与因果推断、高维U统计等核心兴趣方向直接关联较弱。
- 关键技术:
Probabilistic generative model,Positive-only training,Interaction score matrix,Sequence interaction modeling,Model validation on paired data - 为什么对您有用: 本文涉及生成式建模与仅正样本学习,在流行病学中暴露-反应关系(如抗原-抗体)建模可能有迁移价值,但当前武器库中无直接对口工具。该问题的残基重要性识别与因果中介分析中的成分识别有形式相似性,但所需工具(变分推断、生成模型诊断)不在 researcher 的 very_familiar 或 moderately_familiar 列表中。暂不可做:核心推理机制依赖生成式概率模型与序列比对技术,缺乏可直接攻入的统计理论接口。
5. 10.1214/25-aoas2071 — Multiobject data integration in the study of primary progressive aphasia¶
- 作者: Rene Gutierrez, Aaron Scheffler, Rajarshi Guhaniyogi, Maria Luisa Gorno-Tempini, Maria Luisa Mandelli, Giovanni Battistella
- 期刊/来源: Annals of Applied Statistics
- 机构: Texas A&M University System · Texas A&M Health Science Center · Texas A&M University · Cancer Research And Biostatistics · University of California, San Francisco · Harvard University
- 分类: vol 19 · issue 4
- 相关性 2/10 · novelty:
application - 摘要: 本文针对原发性进行性失语症(PPA)的多模态影像数据整合问题,目标是通过灰质结构图像和功能磁共振脑连接网络联合回归言语率指标,识别与神经退行性模式显著相关的脑区。方法层面提出一个新颖的贝叶斯对象响应回归框架,对网络系数和结构系数构建集成先验,以利用脑连接体的网络信息并联合建模两种对象间的关联。该框架能够量化不确定性,通过后验概率判断脑区是否与言语率指标积极相关。实证结果揭示了PPA相关脑区的新见解,加深了对神经退行性模式的理解。补充材料提供了后验计算细节和额外结果。这篇文章对您可能有用:它展示了多模态数据整合在流行病学/神经影像应用中的贝叶斯建模路径,与您次要兴趣中的流行病学应用领域相关,且其先验设计和计算流程可作为您在统计计算与软件开发方面的拓展案例。
- 关键技术:
Bayesian object response regression,integrated prior,brain connectome network,gray matter imaging,uncertainty quantification - 为什么对您有用: 本文属于流行病学/神经影像应用方向,是您的次要兴趣之一。虽然核心方法非您主要武器库,但该文整合多模态对象的贝叶斯建模思路可用于因果推断中的多数据源融合问题;您非常熟悉的软件开发技能可直接用于复现其MCMC算法,评估计算效率;中期可做:若需将此类方法推广至因果参数估计,需先补强您的moderately_familiar项——贝叶斯分层模型与后验推断工具。总体而言,本文作为应用范例值得一读,但并非立即可迁移至您的主攻方向。
Maintained by 陈星宇 · Homepage · Source on GitHub