AoAS — Vol 18 Issue 1 · 2026-06-24¶

共 41 篇 · Annals of Applied Statistics
目录核对 ✅ 41 篇全部抓到（对照 OpenAlex 42 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

第一期《统计年鉴》（AoAS Vol 18 Issue 1）共41篇，覆盖多个方向，可归纳为四条主线：因果识别与处理效应异质性（5篇，涉及多中介检验、异质性处理效应森林、存活因果效应、动态反事实预测、测量误差校准）、假设检验与后选择推断（6篇，涵盖可交换性检验、时变效应检验、密度匹配规则、后选择推断、可复制性度量、弱信号包含控制）、半参数/非参与功能数据分析（7篇左右，包括分布式比例似然比、部分功能线性回归、图像回归潜在亚组、功能时间序列预测、功能ANOVA、时空强度、非平稳空间预测）、统计计算方法与优化（6篇，含张量判别分析、相关回归、在线监测、纤维取向估计、公平算法比较、贝叶斯时空水平集）。此外还有流行病学应用和少量天文学、经济行为、地球科学等其他主题。

其中因果推断主线最为集中：Testing for the causal mediation effects of multiple mediators using the kernel machine difference method 将单中介差分法扩展至多中介，应对非线性中介效应；What makes forest-based heterogeneous treatment effect estimators work? 通过消融实验揭示倾向得分局部中心化对HTE森林性能的决定性作用；A Bayesian machine learning approach for estimating heterogeneous survivor causal effects 在生存结局被死亡截断下，用BART建模主分层中的始终存活者因果效应；Nonnegative tensor completion for dynamic counterfactual prediction 利用低秩张量补全实现多国家政策干预的非参数反事实预测；Using simultaneous regression calibration 解决多个膳食成分测量误差的联合校准问题，采用控制喂养研究开发标记物。这几篇共同推进了异质性因果效应、中介分析和反事实预测的实用方法，尤其关注非线性、高维和复杂数据结构的灵活性。

假设检验与后选择推断是另一条突出主线：A simple and flexible test of sample exchangeability 提出V test检验多维样本可交换性，适用于基因组学；Selective inference for sparse multitask regression 为多任务稀疏回归提供基于精炼选择事件的条件置信区间；Weak signal inclusion under dependence 在高维弱信号场景下控制假阴性比例，允许任意协方差依赖；Quantifying replicability of multiple studies in a meta-analysis 利用留m个研究的外部学生化残差度量可复制性；此外，Retrospective varying coefficient association analysis 在纵向二值性状中检验时变遗传效应，Density‑based matching rule 在子群分类中推导最优似然比规则。这些工作覆盖了从多元可交换性到稀疏选择推断、从依赖结构下的弱信号保留到元分析可复制性，方法工具涉及渐近分布、相位图和经验零假设。

半参数/非参与功能数据分析主线也值得关注：Distributed proportional likelihood ratio model 在分布式网络下共享回归参数但允许异质baseline密度；A partially functional linear regression framework 整合高维遗传与功能型成像数据，用RKHS建模非线性效应并嵌入ℓ0惩罚；Latent subgroup identification in image‑on‑scalar regression 利用有限混合模型识别脑图像-临床指标关联中的亚群；Bayesian adaptive and interpretable functional regression 用B样条与Horseshoe先验推断产前PM₂.₅暴露的时变效应窗口。这些论文展示了半参数/非参模型在异质性、分布式、功能数据及环境流行病学中的灵活应用。

对于因果推断方向的研究者，最直接相关的是causal_inference类五篇，尤其是多中介KMD方法、HTE森林消融实验、以及张量补全反事实预测；关注半参数效率的读者可优先阅读分布式比例似然比和部分功能线性回归；高维与假设检验方向则推荐选择性推断和弱信号包含控制两篇。

因果推断 (causal_inference, 5 篇)¶

1. 10.1214/23-aoas1814 — Testing for the causal mediation effects of multiple mediators using the kernel machine difference method in genome-wide epigenetic studies¶

作者: Jincheng Shen, Joel Schwartz, Andrea A. Baccarelli, Xihong Lin
期刊/来源: Annals of Applied Statistics
机构: University of Utah · Columbia University · Harvard University
分类: vol 18 · issue 1
相关性 9/10 · novelty: new_method
摘要: 在多中介因果中介分析中，针对多个中介变量（如基因区域内DNA甲基化探针）的联合自然间接效应（NIE）检验问题，本文提出核机器差分（KMD）方法。该方法将经典单中介的difference method扩展至多中介情形，利用核机器回归灵活建模中介变量对结局的线性、非线性及非参数效应，避免显式指定中介对暴露和混杂的依赖关系以及中介间的相关结构。检验统计量通过比较包含与不包含中介变量的核机器回归拟合之差构建，在原假设下其渐近分布为加权卡方，可采用Satterthwaite近似或置换法计算p值。模拟表明，当存在非线性中介效应时，KMD相比基于线性假设的联合乘积系数法具有更稳健的尺寸控制和显著更高的检验功效。应用方面，在Normative Aging Study中检验吸烟行为通过DNA甲基化影响肺功能的因果路径，识别出多个显著介导的CpG区域。对您而言，该框架为高维中介分析的假设检验提供了新的非参数途径，可结合您熟悉的非参数统计与因果推断identification理论，进一步探讨检验的最优性。
关键技术: kernel machine difference (KMD) method, difference method for multiple mediators, causal mediation analysis, natural indirect effect (NIE), Satterthwaite approximation, epigenome-wide association study
为什么对您有用: 直接对应您primary interest中的因果推断中介分析子方向，特别是多中介/高维中介的假设检验问题。您very familiar arsenal中的非参数统计（核机器回归）和minimax下界技术能立即用于评估KMD检验的power optimality：例如，可将检验问题形式化为假设检验的minimax框架，并利用半参数效率界分析其最优可检测效应量。立即可做：您现有的非参数和因果推断工具足以开展这类理论分析。

2. 10.1214/23-aoas1799 · arXiv — What makes forest-based heterogeneous treatment effect estimators work?¶

作者: Susanne Dandl, Christian Haslinger, Torsten Hothorn, Heidi Seibold, Erik Sverdrup, Stefan Wager et al.
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 8/10 · novelty: survey
摘要: 本文旨在厘清异质处理效应（HTE）估计中各式森林方法成功的关键计算元素。作者将因果森林（Athey et al. 2019）与模型森林（Seibold et al. 2018）统一到加性模型 L2 损失下的同一参数框架，从而分离不同组件。通过模拟研究比较原始方法及其混合版本，揭示在随机试验和观察性研究中各组件的贡献。核心发现：当存在混杂时，对处理指示变量进行局部倾向得分中心化是保证良好性能的主要驱动力；对结果的局部中心化作用较弱，可被同时考虑预后和预测变量的分裂准则替代。文章并未提出新估计量或新理论，而是通过系统消融实验提炼出实践指导。对您而言，论文直接触及因果森林这一流行 HTE 方法的黑箱，但属于实验性总结，理论深度有限。
关键技术: causal forest, model-based forest, local centering, propensity score weighting, split selection
为什么对您有用: 论文主题属于因果推断中HTE估计的实证方法比较，与您的primary interest方向直接相关。您的武器库中estimation theory in causal inference和nonparametric statistics已足以理解其设计思路和模拟逻辑。这是一篇高质量的survey/消融实验，可快速建立对因果森林各组件的直觉，但并非新理论或方法，暂不可据此直接动手推进研究。

3. 10.1214/23-aoas1792 · arXiv — A Bayesian machine learning approach for estimating heterogeneous survivor causal effects: Applications to a critical care trial¶

作者: Xinyuan Chen, Michael O. Harhay, Guangyu Tong, Fan Li
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 8/10 · novelty: new_method
摘要: 该论文针对生存结局被死亡截断（truncated by death）时处理效应异质性估计的难题，提出一种灵活的贝叶斯机器学习方法。采用主分层（principal stratification）框架，聚焦于始终存活层（always-survivors）中的平均因果效应和异质性因果效应。方法上，使用贝叶斯加性回归树（BART）对潜在结局和潜层成员模型进行非参数建模，避免了参数形式的错误设定。在ARDS Network ARMA试验数据分析中，发现低潮气量治疗对急性肺损伤患者“回家时间”结局有总体益处，但效应存在显著异质性，主要由生理性别和肺泡-动脉氧梯度驱动。该论文将贝叶斯非参数方法与因果推断中的主分层框架相结合，对于处理死亡截断的实际临床数据具有直接价值。对您而言，这是一篇连接因果推断（principal stratification）与流行病学应用（critical care trial）的实证文章，可用您的因果推断理论工具评估其识别假设的强度。
关键技术: Bayesian additive regression trees (BART), principal stratification, survivor causal effects, heterogeneous treatment effects, truncation by death
为什么对您有用: 该论文涉及您primary interest中的因果推断子方向——主分层框架下的幸存者因果效应，直接与截断结局的处理效应估计相关。您武器库中very familiar的因果推断估计理论（非参数统计、minimax界）可用于评估该方法在不同假设下的识别性，而moderately familiar的识别理论（identification theory）正是理解其主分层假设的基础。follow-up：立即可做，因为您已熟练掌握因果推断核心工具，可以对该方法进行敏感性分析或将其扩展到带有负对照（negative control）的截断场景。

4. 10.1214/23-aoas1787 — Nonnegative tensor completion for dynamic counterfactual prediction on COVID-19 pandemic¶

作者: Yaoming Zhen, Junhui Wang
期刊/来源: Annals of Applied Statistics
机构: City University of Hong Kong · Chinese University of Hong Kong
分类: vol 18 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文研究 COVID-19 大流行中社会流动性限制政策的动态反事实预测问题。在面板数据设定下，每个国家/地区在每一时刻只能实施一种政策，目标是在低秩张量分解框架下补全缺失的反事实结果。方法核心为一种非负张量补全方法，利用低秩 CP 分解同时刻画政策强度的顺序性（有序约束）和疫情时间演变的平滑性（平滑约束）。估计量通过块坐标下降求解，并在温和条件下证明了渐近一致性。应用于真实 COVID-19 数据集，揭示了不同政策对病毒传播的影响，且优于标准矩阵补全方法。对您有用：张量补全为非参数反事实预测提供了柔性工具，直接关联您的因果推断（反事实预测）和统计计算（张量分解/einsum 复杂度）兴趣。
关键技术: nonnegative tensor completion, low-rank CP decomposition, counterfactual prediction, ordinal constraint, smoothness constraint, block coordinate descent
为什么对您有用: 本文属于因果推断中反事实预测的具体应用，与您的 primary interest 中 counterfactual prediction 直接吻合。其低秩张量分解的计算模式可映射到您 very_familiar 的 tensor contraction / einsum 工具集上，例如用树宽分析刻画分解代价或设计更高效的交替算法。基于当前武器库，本文可立即可做：您能利用高阶 U-统计量的计算视角剖析该张量补全 estimand 的算法复杂度，甚至提出改进的收缩策略。

5. 10.1214/23-aoas1782 — Using simultaneous regression calibration to study the effect of multiple error-prone exposures on disease risk utilizing biomarkers developed from a controlled feeding study¶

作者: Yiwen Zhang, Ran Dai, Ying Huang, Ross Prentice, Cheng Zheng
期刊/来源: Annals of Applied Statistics
机构: University of Wisconsin–Milwaukee · University of Nebraska Medical Center · Cape Town HVTN Immunology Laboratory / Hutchinson Centre Research Institute of South Africa · Fred Hutch Cancer Center
分类: vol 18 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文针对饮食流行病学中多个膳食成分自报数据存在系统测量误差的问题，提出利用控制喂养研究开发生物标记物进行联合回归校准的新方法。传统联合回归校准要求所有暴露均有客观生物标记物，但实际中极少成分有现成标记物；先前为单成分开发的标记物不适用于多成分联合校准。作者证明了单成分标记物在联合校准中的无效性，并设计了基于控制喂养研究的新的生物标记物开发流程，使得多个误差暴露的联合校准成为可能。估计量通过广义矩估计或似然方法构造，并推导了渐近正态分布及其方差公式（利用delta方法和M-估计理论）。模拟研究验证了有限样本下的偏差校正效果和覆盖概率。应用部分利用WHI队列数据分析了钠和钾摄入对心血管疾病的联合效应，发现钠的正关联和钾的负关联。该方法对因果推断中多暴露测量误差校正问题具有直接的方法学价值，是流行病学因果研究中的实用工具。
关键技术: joint regression calibration, measurement error correction, controlled feeding study biomarker, asymptotic distribution theory, M-estimation, delta method
为什么对您有用: 本文直接针对因果推断中多暴露测量误差校正这一核心方法学问题，尤其适用于流行病学队列研究（如饮食-疾病关联）。您对因果推断非常熟悉，其估计理论（M-估计、渐近方差）可立即用于理解并复现该方法；若进一步考虑高维暴露（如数十种营养素），可调用 high-dimensional asymptotics 武器进行扩展分析。该论文的实证数据和分析流程也为流行病学应用提供了参考。综上，这篇处于方法论与应用交叉点的论文立即可读，且方法可迁移至您自身的因果推断研究工作。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶

1. 10.1214/23-aoas1815 · arXiv — Weak signal inclusion under dependence and applications in genome-wide association study¶

作者: X. Jessie Jeng, Yifei Hu, Quan Sun, Yun Li
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 7/10 · novelty: new_method
摘要: 在 high-dimensional sparse inference 设定下，本文研究如何在 underpowered 场景中保留那些无法被单独从噪声中分离的弱信号，目标是对 false negative proportion 进行用户指定水平的控制。作者提出 FNC (False Negative Control) screening 方法，核心创新在于允许变量间存在任意协方差依赖结构，并通过一个与现有 phase diagram 兼容的参数来校准整体依赖程度。理论分析利用高维渐近理论，显式刻画了协方差依赖、信号稀疏度与信号强度三者的联合效应，构建了新的 phase diagram 来展示方法在信号不可分情形下仍能高效保留候选变量集的能力。有限样本模拟显示 FNC screening 在适应指定 FNC 水平方面优于现有方法，应用于两阶段 GWAS 流程时在有限样本下获得显著 power 提升。对您而言，这是高维变量筛选中 false negative control 的新视角，phase diagram 的分析框架与您熟悉的高维渐近理论直接相关。
关键技术: false negative control screening, high-dimensional phase diagram, arbitrary covariance dependence calibration, asymptotic joint effect characterization, two-stage GWAS procedure
为什么对您有用: 本文直接涉及您 primary interest 中的 high-dimensional statistics，特别是 phase diagram 分析框架和高维稀疏推断中的依赖结构处理。您武器库中的 high-dimensional asymptotics 和 minimax bounds for estimation problems 可以直接用来审视本文声称的 FNC screening 效率——phase diagram 的阈值刻画是否紧、依赖校准参数的渐近理论是否严谨。立即可做：用您 very_familiar 的高维渐近理论验证其 phase diagram 边界的 sharpness，或尝试用 minimax 视角分析 FNC 筛选的最优性。

非参数 / 半参数 (nonparam_semipara, 7 篇)¶

1. 10.1214/23-aoas1779 — Distributed proportional likelihood ratio model with application to data integration across clinical sites¶

作者: Chongliang Luo, Rui Duan, Mackenzie Edmondson, Jiasheng Shi, Mitchell Maltenfort, Jeffrey S. Morris et al.
期刊/来源: Annals of Applied Statistics
机构: Washington University in St. Louis · Harvard University · University of Pennsylvania · Children's Hospital of Philadelphia · Center for Clinical Research (United States)
分类: vol 18 · issue 1
相关性 7/10 · novelty: new_method
摘要: 在分布式研究网络的隐私约束下，目标是估计跨站点共享的回归参数，同时允许各站点有异质性的 baseline density。作者采用 Proportional Likelihood Ratio Model (PLRM) 这一半参数模型，各站点保留 site-specific baseline function，仅共享回归参数，从而在 borrowing information 与尊重异质性之间取得平衡。提出的分布式算法仅需单轮通信，核心是各站点本地计算 sufficient statistics 并上传，中心节点通过 profile likelihood 或类似方法完成估计。理论部分证明了估计量的 consistency 和 asymptotic normality，但未给出 semiparametric efficiency bound 或 influence function 的显式刻画。实证部分通过模拟和 CHOP 儿科避免性住院的真实数据验证了方法的有效性。对您而言，这是一个 semiparametric model 在分布式隐私约束下的应用实例，但理论深度相对有限。
关键技术: semiparametric model, proportional likelihood ratio model, distributed algorithm, privacy-preserving estimation, data integration, profile likelihood
为什么对您有用: (1) 连接到 semiparametric theory 这一 primary interest 子方向，PLRM 是 GLM 的半参数推广，涉及 infinite-dimensional nuisance参数的估计问题。(2) 您武器库中的 semiparametric theory（moderately_familiar）可以用来分析该估计量是否达到 efficiency bound——本文未给出 influence function 或 efficiency 讨论，这是一个可切入的理论口子。(3) 中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉，推导 PLRM 在分布式设定下的 efficient influence function 和 one-step estimator。

2. 10.1214/23-aoas1808 — A partially functional linear regression framework for integrating genetic, imaging, and clinical data¶

作者: Ting Li, Yang Yu, J. S. Marron, Hongtu Zhu
期刊/来源: Annals of Applied Statistics
机构: Shanghai University of Finance and Economics · University of North Carolina at Chapel Hill
分类: vol 18 · issue 1
相关性 6/10 · novelty: application
摘要: 本文提出部分功能线性回归（PFLR）框架，整合高维遗传、成像与临床数据，用于阿尔茨海默病（AD）的路径分析。成像数据（海马体表面）被视为功能型协变量，嵌入再生核希尔伯特空间（RKHS）以建模其非线性效应；遗传变量（数十万SNP）则通过ℓ0惩罚进行变量选择，实现模型联合估计与选择。应用ADNI数据集，识别关键遗传变异及基线海马体表面对13项未来认知评分的影响。结果显示，海马体与遗传数据对认知评分具有异质性效应，且双侧海马体值与认知缺陷严重程度负相关；多基因效应显著，APOE4仅解释一小部分变异。分析揭示了认知评分间共享的遗传病因，但疾病分类内存在更大遗传异质性。对您有用：该半参数功能线性模型结合高维变量选择，是典型的半参数框架应用，其估计策略（RKHS嵌入+ℓ0惩罚）可迁移至您熟悉的高维非参数和M-estimation工具箱。
关键技术: partially functional linear regression, reproducing kernel Hilbert space (RKHS), ℓ0-penalized variable selection, high-dimensional genomics, hippocampus surface imaging data
为什么对您有用: （1）属于流行病学领域的应用论文（ADNI数据），连接secondary_interests中的epidemiology，展示了如何整合多模态生物标志物与临床结局。（2）方法部分涉及nonparametric statistics（RKHS）和high-dimensional asymptotics（ℓ0惩罚），您熟悉的武器库可直接理解其估计与选择性质。（3）立即可做：您可用现有的非参数理论和高维渐近技能复现并扩展该模型，例如引入双稳健估计或考虑因果推断中的混杂调整。

3. 10.1214/23-aoas1797 · arXiv — Latent subgroup identification in image-on-scalar regression¶

作者: Zikai Lin, Yajuan Si, Jian Kang
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 3/10 · novelty: application
摘要: 研究问题是在 image-on-scalar 回归设定下，识别潜在亚群，使得组内脑活动与临床指标的关联同质、组间异质，且组分配依赖于个体协变量。目标 estimand 是 group-specific、spatially varying 的回归系数函数，关键假设是潜在亚群结构的 finite mixture 形式。方法提出 LASIR 模型，引入 latent subgroup indicator 和 group-specific spatially varying effects，使用 stochastic EM 算法进行推断；理论部分未给出估计量的渐近性质（如 consistency 或收敛率），主要依赖 simulation 和实证验证。实证结果显示在 ABCD 数据上能识别出有科学意义的亚群，软件已开源。对您而言，这是一个 semi-parametric mixture model 的应用案例，但方法学 novelty 有限。
关键技术: finite mixture model, stochastic EM algorithm, image-on-scalar regression, spatially varying coefficients, latent subgroup identification
为什么对您有用: 连接到 semiparametric theory 的 mixture model 设定，但本文核心是算法与实证应用，未触及 efficiency bound 或 influence function 等理论工具。您武器库中的 semiparametric theory 和 M-estimation theory 可用于分析其估计量的渐近性质（当前缺失），属于可填补的理论空白。判断为中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉，才能给出该 mixture estimator 的 efficiency bound 或 inference framework。

4. 10.1214/23-aoas1795 — Network-level traffic flow prediction: Functional time series vs. functional neural network approach¶

作者: Tao Ma, Fang Yao, Zhou Zhou
期刊/来源: Annals of Applied Statistics
机构: Texas State University · Peking University · University of Toronto
分类: vol 18 · issue 1
相关性 2/10 · novelty: application
摘要: 本文研究网络级交通流量预测问题，目标是同时对多个地点进行连续时间预测，将24小时交通流量视为函数曲线而非离散时间点。提出了两种函数型方法：网络集成函数型时间序列模型（Network-integrated functional time-series model）和函数型神经网络模型（functional neural network），利用历史函数曲线预测未来多天的曲线。在对比实验中纳入了函数型变系数模型、稀疏VAR以及传统AR模型作为基准。实证结果表明，网络集成函数型时间序列模型在预测精度上显著优于其他模型。本文是应用统计工作，方法本身属于函数型数据分析在交通领域的直接应用，理论上无重大突破。对您而言，本文可视为非参数/半参数方法在时空预测中的应用案例，技术武器库中的“非参数统计”足以理解其平滑与预测机制，但由于缺乏因果推断或高维理论元素，与您核心兴趣方向关联较弱，暂不宜深入跟进。
关键技术: functional time series, functional neural network, network-integrated functional model, functional varying coefficient model, sparse VAR
为什么对您有用: 本文涉及函数型数据分析，属于您的非参数/半参数兴趣子方向。技术武器库中“非参数统计”可直接用于理解函数型平滑与预测机制。但本文是纯应用工作，理论贡献有限，且不涉及因果推断或高维统计，因此与您的主要兴趣方向关联较弱。评价：暂不可做（缺少与核心武器如因果识别、U-统计量的直接接口）。

5. 10.1214/23-aoas1770 · arXiv — Sensitivity analysis of wind energy resources with Bayesian non-Gaussian and nonstationary functional ANOVA¶

作者: Jiachen Zhang, Paola Crippa, Marc G. Genton, Stefano Castruccio
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 2/10 · novelty: application
摘要: 本文研究风能资源模拟中的敏感性分析问题，目标是在贝叶斯框架下量化天气模型输入参数（如行星边界层方案、空间分辨率）对风速及阈值超越概率等输出的空间异质性影响。核心方法是 latent Gaussian functional ANOVA 模型，结合 nonstationary Gaussian Markov random field (GMRF) 对连续潜过程进行近似，以捕捉大范围模拟域上的局部敏感性。理论层面利用 GMRF 的稀疏结构实现高效计算，并处理非高斯响应（如阈值超越）通过潜高斯框架。实证结果表明非局部 PBL 方案和高分辨率对复杂山地风速估计至关重要，但对沙特规划风电场的影响较小（至多 1.4%）。对您而言，这是贝叶斯非参数/半参数方法在环境统计中的应用案例，展示了 GMRF 近似与 functional ANOVA 的结合。
关键技术: functional ANOVA, latent Gaussian model, nonstationary GMRF, Bayesian sensitivity analysis, spatial process modeling
为什么对您有用: (1) 连接到 nonparametric theory 中的 spatial process modeling 与 GMRF 近似技术，属于应用导向的方法论文献。(2) 您武器库中的 nonparametric statistics 与 high-dimensional asymptotics 可用于审视其 GMRF 近似的理论性质，但本文核心是贝叶斯计算而非频率派推断。(3) 暂不可做：本文是成熟贝叶斯方法的应用，方法学 novelty 有限，且不涉及您熟悉的 minimax 界、efficiency bound 或 U-statistics 理论；若想进入环境统计领域可作为背景阅读，但不是方法学突破口。

6. 10.1214/23-aoas1800 — A nonseparable first-order spatiotemporal intensity for events on linear networks: An application to ambulance interventions¶

作者: Andrea Gilardi, Riccardo Borgoni, Jorge Mateu
期刊/来源: Annals of Applied Statistics
机构: University of Milano-Bicocca · Universitat Jaume I
分类: vol 18 · issue 1
相关性 2/10 · novelty: new_method
摘要: 本文研究线性网络（道路网络）上的时空点过程强度估计问题，目标是在非可分假设下估计时空强度函数 λ(s,t)，应用于米兰急救车调度数据。方法采用半参数-非参数混合策略：时间维度通过 Poisson 回归半参数估计，空间维度通过 network kernel density estimation 非参数估计，引入权重项捕捉时空交互以实现非可分性。理论贡献在于将传统平面区域点过程方法推广至线性网络约束域，解决了网络距离度量与边界校正问题。实证结果表明非可分模型在 AIC 和拟合优度检验上优于可分模型及平面近似方法。对您而言，这是半参数/非参数理论在特殊空间结构上的应用实例，展示了核密度估计在非欧空间中的推广。
关键技术: network kernel density estimation, spatio-temporal point process, non-separable intensity function, semiparametric Poisson regression, linear network geometry
为什么对您有用: 本文属于非参数理论在特殊空间结构（线性网络）上的应用，与您 primary interest 中的 semiparametric & nonparametric theory 相关。从 technical_arsenal 角度，您 very_familiar 的 nonparametric statistics 和 minimax bounds 可以用来分析 network KDE 的收敛速率问题——现有文献中线性网络上核估计的理论性质可能仍有 minimax optimality 的研究空间。中期可做：需先在 moderately_familiar 的 semiparametric theory 上补充效率理论视角，审视该估计量的 semiparametric efficiency bound 是否可达；核心缺的是点过程理论（Campbell theorem、second-order properties）和空间统计的专门工具。

7. 10.1214/23-aoas1813 — Land-use filtering for nonstationary spatial prediction of collective efficacy in an urban environment¶

作者: J. Brandon Carter, Christopher R. Browning, Bethany Boettner, Nicolo Pinchak, Catherine A. Calder
期刊/来源: Annals of Applied Statistics
机构: The University of Texas at Austin · The Ohio State University
分类: vol 18 · issue 1
相关性 1/10 · novelty: application
摘要: 本文研究城市环境中集体效能(collective efficacy)的空间插值问题，目标是利用土地利用数据对非平稳空间过程进行预测。核心方法是将潜在空间过程进行维度扩展，并通过土地利用分区定义的滤波器连接潜在多元空间过程与观测到的有序评分。估计采用贝叶斯MCMC算法，重点处理了参数可识别性问题、计算效率优化以及细尺度空间预测。该模型属于非平稳空间统计框架，通过引入外部协方差调节变量处理空间异质性。对您而言，这是空间统计与社会科学数据结合的应用案例，展示了非平稳建模的技术路线。
关键技术: nonstationary spatial process, dimension expansion, land-use filtering, MCMC computation, ordinal spatial prediction, parameter identifiability
为什么对您有用: 本文属于应用导向的空间统计工作，novelty在于非平稳空间过程的构造性建模策略。对您的primary interests（因果推断、半参数理论、效率理论）直接关联较弱，但展示了如何处理空间异质性和参数可识别性问题——这在空间因果推断中可能遇到。follow-up判断：暂不可做——核心是贝叶斯空间模型与MCMC，不在您的武器库中；若想进入空间统计方向，需先补充Gaussian process与贝叶斯计算基础。

数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶

1. 10.1214/23-aoas1817 · arXiv — A simple and flexible test of sample exchangeability with applications to statistical genomics¶

作者: Alan J. Aw, Jeffrey P. Spence, Yun S. Song
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 8/10 · novelty: new_method
摘要: 本文提出一种名为 V test 的非参数检验方法，用于检验多元样本的可交换性（即样本联合分布在排序下不变）以及特征独立性（给定样本可交换性）。该方法基于样本协方差矩阵的某种二次型构造检验统计量，利用大样本渐近分布控制第一类错误，适用于任意维度的数据。相比基于随机矩阵理论的非监督分层检验（如 Tracy-Widom 型检验），V test 在多种实际场景中具有更优的检验功效。通过模拟和 1000 Genomes Project 数据验证，展示了其在遗传学中评估样本可交换性和优化 LD 分块等下游任务中的实用性。方法以 R 和 Python 软件包形式提供。对于您假设检验方向的研究，这是一种直接、可运行的检验工具，且其理论分析（渐近分布推导）可与您熟悉的高维随机矩阵理论（Marchenko-Pastur 定律）进行对比验证。
关键技术: V test, sample exchangeability, large-sample asymptotics, random matrix theory comparison, genetic stratification
为什么对您有用: 本文核心是假设检验（您的 primary interest），具体为可交换性检验，与您熟悉的假设检验理论直接对口。您可以利用 minimax bounds 分析该检验在非参数备择下的最优性，或利用 high-dimensional asymptotics（Marchenko-Pastur 定律）推导其渐近分布。该论文方法成熟、软件可用，属于立即可做：您可以用 very_familiar 的高维渐近工具重推其检验统计量的极限分布，或设计更敏感的变体。

2. 10.1214/23-aoas1798 — Retrospective varying coefficient association analysis of longitudinal binary traits: Application to the identification of genetic loci associated with hypertension¶

作者: Gang Xu, Amei Amei, Weimiao Wu, Yunqing Liu, Linchuan Shen, Edwin C. Oh et al.
期刊/来源: Annals of Applied Statistics
机构: University of Nevada, Reno
分类: vol 18 · issue 1
相关性 7/10 · novelty: new_method
摘要: 在纵向二值表型的遗传关联分析设定下，目标是检验遗传变异对疾病风险的时变效应是否存在。作者提出 RVMMAT（retrospective varying coefficient mixed model association test），用 smoothing splines 建模时变遗传效应，通过 double penalized quasi-likelihood 估计参数，并采用 retrospective approach 构建检验统计量以获得对模型误设的稳健性。核心创新在于将 retrospective variance component test 扩展至 varying coefficient 框架，并用 Cauchy combination 方法整合多个时间点的效应进行联合检验。理论部分证明了 retrospective 方法在 misspecified random effects 下的 type I error 保护，模拟显示其在 case-control ascertainment 下比标准 mixed model test 更稳健，且比 constant-effect 方法有更高的 power。对您有用之处在于：这是一个将 nonparametric smoothing（spline）与 robust score test 结合的案例，可借鉴到 longitudinal causal inference 中 time-varying treatment effect 的检验问题。
关键技术: varying coefficient mixed model, smoothing splines, penalized quasi-likelihood, retrospective variance component test, Cauchy combination method, score test robustness
为什么对您有用: 本文连接到您 primary interest 中的 hypothesis testing 与 longitudinal 数据分析。技术核心是 retrospective score test——这是一种在 mixed model misspecification 下仍能保证 type I error 的方法，与您熟悉的 M-estimation theory 和 semiparametric efficiency 理论有交集。follow-up 判断：中期可做——您熟悉 minimax bounds 和 nonparametric theory，但需先在 moderately_familiar 的 M-estimation theory 上补充 quasi-likelihood 的渐近理论，才能分析该方法的 efficiency loss 或提出改进。

3. 10.1214/23-aoas1812 — Density-based matching rule: Optimality, estimation, and application in forensic problems¶

作者: Hana Lee, Yumou Qiu, Alicia Carriquiry, Danica Ommen
期刊/来源: Annals of Applied Statistics
机构: Iowa State University · King University · Peking University
分类: vol 18 · issue 1
相关性 7/10 · novelty: new_method
摘要: 研究问题是在多子群总体中判断两观测是否来自同一子群的匹配检验问题，目标是最小化两类决策错误概率。作者在已知密度函数条件下推导出似然比形式的 optimal matching rule，证明了其在错误概率意义下的最优性。估计方面采用参数密度估计的 plug-in 策略，将训练数据估计的密度代入最优规则公式。文中阐明了该规则与法庭科学中现有方法（score-based approach、classification）的联系与区别，并给出 ROC 曲线下的理论比较。模拟与玻璃碎片真实数据表明，所提方法在 ROC 曲线和识别匹配对的 power 上优于现有方法。对您而言，这是一个将经典似然比检验思想应用于非标准匹配问题的案例，涉及 density estimation 与 decision rule 的交互。
关键技术: likelihood ratio test, optimal decision rule, plug-in density estimation, matching hypothesis testing, ROC curve comparison, forensic statistics
为什么对您有用: 本文属于假设检验与统计决策理论的交叉，连接到您 primary interest 中的 hypothesis testing。核心技术是经典似然比检验在多子群匹配问题中的推广，您用 very_familiar 的 nonparametric statistics 和 minimax bounds 可以分析 plug-in 密度估计对最优决策规则的收敛性影响，或探讨非参数密度估计下的 minimax regret。follow-up 判定：立即可做——用熟悉的 nonparametric statistics 和 minimax 理论可分析非参数设定下 matching rule 的收敛速率与最优性。

4. 10.1214/23-aoas1796 · arXiv — Selective inference for sparse multitask regression with applications in neuroimaging¶

作者: Snigdha Panigrahi, Natasha Stewart, Chandra Sripada, Elizaveta Levina
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 6/10 · novelty: new_method
摘要: 本文针对稀疏多任务回归中的后选择推断问题，提出了一个条件推断框架。研究设定为多个相关响应变量共享同一组高维特征（如脑连接组数据与多项认知任务得分），目标是在通过稀疏惩罚联合选择特征后，对所选特征进行有效的统计推断。方法的核心是精炼选择事件，构造一个可处理的选择调整似然函数，从而得到一组近似估计方程，通过单一凸优化问题求解，进而生成具有近似正确覆盖率的置信区间。与数据切分等常见替代方法相比，该方法在模拟和青少年脑认知发展（ABCD）研究数据上均得到更紧的置信区间。多任务学习结合选择性推断比单任务方法更准确地恢复真实信号。本文的推断机制依赖于对选择事件的渐近近似，与广义线性模型框架兼容。对于您来说，本文展示了在高维假设检验（借选择推断形式）中如何结合优化与似然理论，您可从 M-estimation 理论（moderately familiar）出发分析其估计方程的一致性，或将其后选择推断思路延伸至因果推断中的变量选择问题。
关键技术: selective inference, multi-task learning, sparsity-inducing penalty, conditional likelihood, convex optimization, post-selection inference
为什么对您有用: 直接连接您的 primary interest 中的『假设检验』子方向，具体是后选择推断这一主题。技术上：您 moderately familiar 的『M-estimation 理论』可以直接用于分析本文基于估计方程的条件推断方法的一致性，而您 very familiar 的『high-dimensional asymptotics』则有助于理解其在高维稀疏模型下的渐近性质。follow-up 粗判：中期可做——需先在『M-estimation theory』上加强（本文的估计方程框架正是 M-estimation 的一种），才能将类似的条件推断思想迁移到您更关心的因果推断或高维 U-statistics 的后选择推断场景。

5. 10.1214/23-aoas1806 — Quantifying replicability of multiple studies in a meta-analysis¶

作者: Mengli Xiao, Haitao Chu, James S. Hodges, Lifeng Lin
期刊/来源: Annals of Applied Statistics
机构: University of Colorado Anschutz Medical Campus · University of Minnesota · Pfizer (United States) · University of Arizona
分类: vol 18 · issue 1
相关性 4/10 · novelty: new_method
摘要: 在系统评价与元分析（SRMA）中，评估研究结果的可复制性是一个关键但缺乏严格方法的课题。本文提出一种新的可复制性度量——基于留m个样本（leave-m-studies-out）的外部学生化残差，旨在区分可复制性与异质性。作者将元分析中每个研究的残差标准化后，通过逐一剔除m个研究重新拟合，得到外部残差；其绝对值大小反映了该组研究对整体结论的异常影响。文中为该度量构造了检验统计量，并推导了其渐近分布，证明在零假设（所有研究均可复制）下统计量依分布收敛到标准正态。通过大规模模拟和三个真实元分析数据集（如医学干预效果）验证了该方法的有限样本性能，并与传统Q统计量比较，显示其能更灵敏地识别不可复制研究。最后建议将可复制性评估纳入SRMA的常规敏感性分析。对您而言，该检验统计量可视为一种基于重组子样本的U统计量，您的higher-order U-statistics工具能直接分析其渐近方差与投影表现，属于立即可做的交叉方向。
关键技术: leave-m-studies-out, externally standardized residuals, replicability measure, test statistic for replicability, sensitivity analysis in meta-analysis
为什么对您有用: 本文与您的hypothesis testing兴趣直接相关：提出了一个区分异质性与可复制性的新检验统计量。您的higher-order U-statistics（very_familiar）正好可以用于分析该统计量——它将m个研究视为一组子集，本质上是一个m阶U统计量的置换检验版本，您可以用投影理论推导其渐近正态性的更紧条件，甚至用treewidth/einsum框架计算其计算成本。这是立即可做的方向：只需将leave-m-out设计转化为U统计量的核函数，现有武器即可给出新视角。

统计计算 / 算法 (stat_computing, 7 篇)¶

1. 10.1214/23-aoas1804 — Tensor mixture discriminant analysis with applications to sensor array data analysis¶

作者: Xuesong Hou, Qing Mai, Hui Zou
期刊/来源: Annals of Applied Statistics
机构: University of Minnesota · Florida State University
分类: vol 18 · issue 1
相关性 4/10 · novelty: new_method
摘要: 针对传感器阵列数据常以低阶张量（矩阵）形式呈现、且化学浓度对测量有复杂影响的问题，提出张量混合判别分析（TMDA）。TMDA 将每类化学物质的分布建模为张量正态分布的有限混合，利用张量结构降低参数维度以改善小样本估计，同时混合成分刻画浓度异质性。采用 EM 算法进行参数估计，其中 E 步估计后验概率，M 步通过张量正态的充分统计量更新均值与协方差。该方法可视为对非正态测量的一种近似，在两类传感器阵列数据上（电子鼻与电子舌）相较于线性判别分析、支持向量机等表现出更优的分类精度。论文提供了张量混合模型在分类任务上的一个实际应用案例，对熟悉张量运算与 EM 算法的研究者而言，可作为了解传感器数据统计分析的一个入门实例。
关键技术: Tensor normal distribution, Mixture model, Expectation-Maximization algorithm, Discriminant analysis, Sensor array data
为什么对您有用: 本文涉及张量建模与 EM 算法，直接关联您'统计计算'兴趣下的数值方法方向。您熟悉的'tensor contraction / einsum'武器可用于分析其 EM 算法的计算复杂度，比如评估张量运算的树宽与收缩成本。这是一篇应用为主的方法论文，作为入门级阅读可帮您快速了解传感器阵列数据的统计建模范式，但核心机器学习工具（SVM 等）对比对您现有工作帮助有限，属于短期即可消化的外部案例。

2. 10.1214/23-aoas1785 · arXiv — Applied regression analysis of correlations for correlated data¶

作者: Jie Hu, Yu Chen, Chenlei Leng, Cheng Yong Tang
期刊/来源: Annals of Applied Statistics
机构: University of Science and Technology of China · University of Warwick · Temple University
分类: vol 18 · issue 1
相关性 4/10 · novelty: new_method
摘要: 本文针对一般相关数据的相关性分析，提出了一种新的回归建模方法。传统方法主要局限于纵向数据或特殊结构的序列相关，而该方法通过引入一种广义z变换，将正定相关矩阵转换为无约束向量，且变换是阶序不变的，从而可借助最大似然进行协变量驱动的回归建模。方法的优势在于同时保持了变换的可逆性和对相关结构的保序性，使得参数估计和推断在无约束空间中流畅进行。在教室数据（高度不平衡的多水平聚类数据）和疟疾免疫反应数据（纵向但观测时间点缺失）上的实证分析中，该方法揭示了之前未被发现的组内和组间相关模式。从统计计算角度看，该变换的核心是一个数值稳定的映射，可嵌入标准优化框架。该方法对您在流行病学数据分析（属于您的 secondary interest）中遇到的复杂相关结构具有直接应用价值，同时变换技巧也可推广至其他有约束参数的统计优化问题。
关键技术: generalized z-transformation, correlation matrix regression, order-invariant transformation, maximum likelihood estimation, multilevel data, longitudinal data
为什么对您有用: 该论文属于统计计算方向（数值方法与算法），直接对接您的 primary interest。广义z变换作为约束转无约束的核心技巧，可立即利用您武器库中非常熟悉的 software development 技能将其实现为一个通用软件包，并在多种相关数据（如流行病学队列数据）上测试。中期来看，若您在 moderately_familiar 的 semiparametric theory 上进一步深入，可以分析该变换是否会影响半参数效率（例如变换后的 MLE 是否达到信息下界），这是有进一步理论价值的问题。目前立即可做的是利用现有软件工具复现变换并应用于您手头的数据集。

3. 10.1214/23-aoas1803 — Online monitoring of air quality using PCA-based sequential learning¶

作者: Xiulin Xie, Nicole Qian, Peihua Qiu
期刊/来源: Annals of Applied Statistics
机构: Florida State University · University of Florida
分类: vol 18 · issue 1
相关性 3/10 · novelty: new_method
摘要: 针对空气污染监测中臭氧浓度数据高维、序列相关、时变分布等复杂特征，本文提出一种基于主成分分析（PCA）与顺序学习的在线统计过程控制（SPC）方法。该方法首先用PCA对高维空气污染和气象数据进行降维，提取主要变异方向；再通过顺序学习逐时刻更新模型，以适应过程分布的非平稳性，无需传统SPC的独立同分布假设。在仿真和休斯顿-加尔维斯顿-布雷佐里亚地区实际臭氧监测数据上，该方法比现有SPC图表更有效捕捉异常，且能处理非参数数据分布。论文着重于算法实现与实证表现，理论分析相对有限。对您而言，本文是统计计算中在线自适应方法与高维降维结合的一个应用案例，虽不直接对应您的核心理论兴趣，但可作为环境监测领域数据分析流程的参考，并可能启发您在统计计算工具开发（如软件实现或算法效率评估）方面的新想法。
关键技术: principal component analysis, sequential learning, statistical process control, online monitoring, nonparametric distribution handling
为什么对您有用: 1) 本文连接您的‘统计计算’兴趣子方向——在线算法与高维降噪在环境监测中的应用。2) 您武器库中的‘高维渐近’理论可用于验证PCA特征值估计的相合性；‘软件开发’技能可复现或改进该方法。3) 当前属于中期可做：您对非参统计和高维渐近已熟悉，但SPC专用理论（如控制限校准、ARL计算）并非专长，需在相应工具箱上补充少量背景即可动手。

4. 10.1214/23-aoas1781 — Estimating fiber orientation distribution with application to study brain lateralization using HCP D-MRI data¶

作者: Seungyong Hwang, Thomas C. M. Lee, Debashis Paul, Jie Peng
期刊/来源: Annals of Applied Statistics
机构: University of California, Davis
分类: vol 18 · issue 1
相关性 3/10 · novelty: new_method
摘要: 本文针对扩散磁共振成像（D-MRI）中的纤维取向分布（FOD）估计问题，提出了一种计算可扩展的块状James–Stein（BJS）估计器。BJS通过利用相邻体素之间的局部平稳性进行分块收缩，在保持估计精度的同时大幅降低计算成本。该方法基于经典James–Stein原理，采用分块策略实现并行化处理，适用于大规模体素数据。应用部分将BJS用于人类连接组计划（HCP）的D-MRI数据，重建超级纵束（SLF）并计算半球不对称性的偏侧化分数。通过ANOVA模型分析偏侧化分数与性别和手性的关系，发现显著的手性效应，表明左利手与右利手个体的SLF偏侧化可能存在差异。论文提供了完整的开源代码与示例脚本，便于复现和推广。对您而言，该工作展示了从原始成像数据到结构化特征提取再到统计推断的完整流程，其计算可扩展的估计器设计与软件实践直接对应您的统计计算与软件开发兴趣。
关键技术: Blockwise James–Stein estimator, Fiber orientation distribution, Diffusion-weighted MRI, Tractography, Lateralization score, ANOVA
为什么对您有用: 本文与您的统计计算（可扩展算法）及软件开发兴趣直接对接，特别是BJS估计器的分块收缩设计体现了计算效率与统计精度的权衡。您可以使用非常熟悉的minimax下界工具分析BJS在不同正则性假设下的最优速率，或利用高维渐近理论研究体素数量增长时的相变行为——这些工具均为您当前武器库中的强势项，因此对该方法的理论分析立即可做：只需明确FOD的非参数模型，即可套用经典的非参数minimax框架。该文应用流程虽涉及D-MRI物理背景，但不妨碍您直接切入其方法论核心，值得花时间阅读全文以吸收其算法思想与软件设计。

5. 10.1214/23-aoas1778 · arXiv — On the fair comparison of optimization algorithms in different machines¶

作者: Etor Arza, Josu Ceberio, Ekhiñe Irurozki, Aritz Pérez
期刊/来源: Annals of Applied Statistics
机构: Télécom Paris · University of the Basque Country · Basque Center for Applied Mathematics
分类: vol 18 · issue 1
相关性 2/10 · novelty: new_method
摘要: 本文研究在不同机器上公平比较优化算法性能的问题。目标是在只有文献中算法A的目标值和运行时间、而新算法B在自己机器上运行时，如何统计检验算法B是否优于算法A。作者提出两步法：首先，利用回归模型根据算法A在某机器上的运行时间估计其在另一机器上的运行时间，并调整模型使得低估概率可控。然后，引入改进的单侧符号检验，通过修正p值来控制第一类错误。理论部分证明该检验的渐近合理性，模拟和案例研究展示方法有效。对您来说，本文连接统计计算中的实验设计和算法比较子方向，其回归+检验框架可迁移到高维计算实验的效率比较问题。
关键技术: runtime estimation model, one-sided sign test, modified p-value, empirical regression, fair comparison benchmark
为什么对您有用: 连接统计计算子方向中算法比较的实验设计问题，属于您primary interest的统计计算。您武器库中的数值方法和软件开发经验可用于理解或扩展其回归模型（如用非参数回归替代线性模型）。中期可做：需先熟悉优化算法比较的常见基准测试实践。

6. 10.1214/23-aoas1794 · arXiv — A Bayesian spatio-temporal level set dynamic model and application to fire front propagation¶

作者: Myungsoo Yoo, Christopher K. Wikle
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 2/10 · novelty: new_method
摘要: 该论文提出了一种基于水平集（level set）的贝叶斯时空动态模型，用于预测野火前沿边界传播。与以往依赖强参数化传播速率公式的方法不同，该模型结合了力学驱动的水平集动态模型和随机时空动态模型来描述前沿速度，实现了数据驱动的学习和不确定性量化。方法采用符号距离函数表示复杂边界随时间的变化，并通过马尔可夫链蒙特卡洛（MCMC）进行后验推断。模拟研究和对2017-2018年Thomas火及2017年Haypress火的真实数据验证表明，该方法能有效预测火界演化并提供概率性预报。该论文属于统计计算方向，展示了贝叶斯动态建模与数值方法的深度结合，为处理复杂时空过程的不确定性提供了可参考的技术路线。
关键技术: level set method, signed distance function, Bayesian spatio-temporal dynamic model, Markov chain Monte Carlo, uncertainty quantification, data-driven velocity learning
为什么对您有用: 本文属于统计计算（Bayesian动态模型与数值方法）方向，展示了水平集法与MCMC在时空建模中的协同。研究者武器库中“inverse problems with random noise”可部分用于理解随机速度场建模，但MCMC和时空过程目前不在熟悉范围内（moderately_familiar缺此项），因此暂不可直接复现或扩展，中期需先补足贝叶斯计算与时空模型基础。对关注不确定性量化或大规模动态系统统计计算的学者，本文提供了一个很好的入门案例。

7. 10.1214/23-aoas1802 — A novel estimator of Earth’s curvature (Allowing for inference as well)¶

作者: David R. Bell, Olivier Ledoit, Michael Wolf
期刊/来源: Annals of Applied Statistics
机构: University of Zurich
分类: vol 18 · issue 1
相关性 0/10 · novelty: application
摘要: 本文研究地球曲率的统计估计与推断问题，目标参数是曲率（半径的倒数），在正态噪声假设下利用商业航班飞行时间数据构建估计量。核心方法是构造一个基于飞行距离-时间关系的非线性回归模型，通过最小二乘估计曲率参数，并推导估计量的渐近正态性以进行假设检验。关键技术工具包括 delta method、稳健标准误估计、以及针对异方差性的推断方法。主要实证结果：在显著性水平下正式拒绝 flat-Earth 模型（曲率为零），同时不拒绝球形地球模型（曲率约为 π/20,000km）。对您可能有用的是，这是一个将经典统计推断应用于非传统问题的有趣案例，展示了 estimation theory 与 hypothesis testing 在实际数据上的完整应用流程。
关键技术: nonlinear least squares, delta method, robust standard errors, hypothesis testing, asymptotic normality
为什么对您有用: (1) 本文属于 gateway-reading 范畴——将经典 estimation theory 和 hypothesis testing 应用于一个新颖且有趣的实际问题，适合作为教学或科普素材。(2) 武器库完全够用：very_familiar 中的 estimation theory 和 software development 可以直接复现和扩展这个分析。(3) 值得一读全文：虽然方法学 novelty 有限，但数据收集、模型设定、推断流程的完整展示对 statistical computing 和应用统计有参考价值，且写作风格可能适合作为科普或教学案例。

天体统计 (astrostats, 1 篇)¶

1. 10.1214/23-aoas1810 · arXiv — A continuous multiple hypothesis testing framework for optimal exoplanet detection¶

作者: Nathan C. Hara, Thibault de Poyferré, Jean-Baptiste Delisle, Marc Hoffmann
期刊/来源: Annals of Applied Statistics
机构: University of Geneva · Mathematical Sciences Research Institute · Université Paris Dauphine-PSL · Centre de Recherche en Mathématiques de la Décision
分类: vol 18 · issue 1
相关性 8/10 · novelty: new_method
摘要: 针对系外行星检测问题，本文提出了一个连续多重假设检验框架，目标是在已知干扰信号的情况下，同时计数行星数量并估计其参数，同时控制误报与漏报。作者从决策理论出发，推导了在给定相对误报/漏报代价或期望误报数约束下的最优检测准则，该准则等价于贝叶斯证据计算得到的后验概率。为了确保模型误设定下的鲁棒性，论文引入了模型批评方法，对后验概率进行修正。在两个模拟系外行星搜索场景中，所提准则显著优于现有常用检测准则。此外，该框架还可推广至混合模型成分识别和连续参数情形的贝叶斯假发现率控制，为高维天文学检测问题提供了统一的统计解决方案。本文对天体统计领域的关键问题进行了清晰的统计表述，方法本身也关联到用户熟悉的多重假设检验和贝叶斯推断，是进入该方向的优质入门读物。
关键技术: multiple hypothesis testing, Bayesian evidence calculation, model criticism, false discovery rate control, mixture model identification
为什么对您有用: 本文是astrostatistics领域的gateway论文，清晰阐述了系外行星检测中的统计挑战（信噪比低、干扰信号复杂）以及贝叶斯假发现率控制方法，统计学家无需天文学背景即可理解核心设定和结论。用户的技术武器库中非常熟悉的非参数统计与假设检验理论足以覆盖本文的主要方法框架，而文中对连续参数假设检验的处理也可与用户关注的higher-order U-statistics或semiparametric theory产生迁移（例如将连续检验视为无穷维参数空间上的决策问题）。因此本文值得全文阅读，是了解天文学数据模型与统计需求的最佳入口之一。

经济理论 / 应用 (econ_theory, 2 篇)¶

1. 10.1214/23-aoas1801 · arXiv — Change point detection in dynamic Gaussian graphical models: The impact of COVID-19 pandemic on the U.S. stock market¶

作者: Beatrice Franzolini, Alexandros Beskos, Maria De Iorio, Warrick Poklewski Koziell, Karolina Grzeszkiewicz
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 7/10 · novelty: application
摘要: 本文开发了一个动态高斯图模型（DGGM）框架，用于检测美国行业股票组合之间相关性的突变点，重点分析了COVID-19 pandemic期间的依赖结构性变化。模型将时间分割为多个区间，每个区间对应一个稀疏高维图，并通过贝叶斯随机变化点方法将变化点的数量和位置、图结构与随机波动率均视为后验推断对象。为处理高维参数空间的计算困难，作者利用隐马尔可夫模型形式，结合序贯蒙特卡洛（SMC）与马尔可夫链蒙特卡洛（MCMC）实现高效后验采样。模拟和实证分析表明，该方法能够有效识别疫情对应的突变点，并揭示行业间相关性在不同阶段的稀疏模式变化。该工作兼具方法创新与金融应用价值，对经济时间序列的结构变化分析有参考意义，但核心是贝叶斯推断框架，与您当前武器库的重叠有限。
关键技术: Dynamic Gaussian graphical models, Random change points, Bayesian multivariate stochastic volatility, Sequential Monte Carlo (SMC), Markov chain Monte Carlo (MCMC), Sparsity in graph recovery
为什么对您有用: 该论文聚焦于经济时间序列中高维依赖结构的突变点检测，直接关联您经济理论与应用的次级兴趣，且应用了SMC+MCMC等统计计算方法。不过，其贝叶斯非参图模型推断的核心工具（MCMC、变分推断）不在您当前武器库的‘熟悉’范畴内，而您的高维渐近知识虽可用于理解图恢复的统计挑战，但无法直接复现或改进算法。因此，该方向暂不可做，但本文可作为入门阅读，帮您了解金融时间序列图模型的应用场景和计算需求。

2. 10.1214/23-aoas1786 — A behavioral approach to repeated Bayesian security games¶

作者: William Caballero, Jake Cooley, David Banks, Phillip Jenkins
期刊/来源: Annals of Applied Statistics
机构: United States Air Force Academy · Duke University · U.S. Air Force Institute of Technology
分类: vol 18 · issue 1
相关性 1/10 · novelty: application
摘要: 本文研究重复安全博弈中的防御策略，对手被建模为有限理性学习者（experience-weighted attraction learning），而非标准博弈论中的完全理性玩家。作者采用对抗风险分析视角，通过贝叶斯推理将重复博弈分解为多臂老虎机问题，并提出一类 cost-function approximation 策略来求解。理论贡献主要是框架构建而非统计推断：没有估计量的渐近性质或效率界分析，核心是贝叶斯决策规则与 EWA 学习模型的结合。实证部分通过国防相关案例的模拟实验展示策略效果，属于行为经济学与决策分析的交叉应用。对您而言，这是了解行为经济学学习模型在序贯决策中应用的入门材料，但方法学与您的 primary interests（因果推断、半参数效率、高维统计）重叠有限。
关键技术: experience-weighted attraction learning, adversarial risk analysis, multi-arm bandit, Bayesian sequential decision, cost-function approximation policy
为什么对您有用: 本文属于 secondary interest 中经济理论的应用方向，涉及行为经济学学习模型与序贯贝叶斯决策。技术层面与您的 primary interests（因果推断、半参数效率、高维统计）几乎无交集，没有 identification theory、效率界或估计量收敛性质的内容。武器库方面，您的 very_familiar 工具（非参数统计、minimax bounds、高维渐近）在此无用武之地，moderately_familiar 的 semiparametric theory 也无法切入。follow-up 判断：暂不可做——核心机器（博弈论均衡分析、EWA 学习动力学、bandit 算法 regret 分析）不在武器库中，且与您当前研究主线偏离较远。若想进入此方向，需先补强 bandit 理论与行为经济学基础。

流行病学 (epidemiology, 5 篇)¶

1. 10.1214/23-aoas1788 — Dynamic risk prediction for cervical precancer screening with continuous and binary longitudinal biomarkers¶

作者: Siddharth Roy, Anindya Roy, Megan A. Clarke, Ana Gradissimo, Robert D. Burk, Nicolas Wentzensen et al.
期刊/来源: Annals of Applied Statistics
机构: Division of Cancer Epidemiology and Genetics · University of Maryland, Baltimore County · Cancer Institute (WIA) · Memorial Sloan Kettering Cancer Center · Albert Einstein College of Medicine
分类: vol 18 · issue 1
相关性 7/10 · novelty: application
摘要: 本文针对宫颈癌前病变筛查中的动态风险预测问题，利用纵向测量的连续型（HPV DNA甲基化）和二元型（细胞学）生物标志物，建立联合风险模型。模型采用共享随机效应将两种标志物与区间删失的发病时间关联，并通过离散化时间尺度得到闭式似然，避免高维积分。方法还整合了抽样权重以处理分层抽样数据，并能提供即时和五年风险估计，辅助HPV阳性女性的临床分流决策。应用于实际队列数据后，相比传统细胞学方法显著改善了风险分层效果。该工作展示了纵向生物标志物在癌症筛查中的实用价值，其建模思路对流行病学研究中处理多模态纵向数据有参考意义。
关键技术: joint model with shared random effects, interval-censored time-to-event, discretized time scale, sampling weights, dynamic risk prediction
为什么对您有用: 本文属于流行病学领域的应用统计工作，与您的 secondary interest 直接匹配，可作为了解纵向生物标志物预测建模流程的入口读物。您掌握的 M-estimation 和 estimation theory 可帮助审视其参数假设的稳健性；文中处理区间删失和抽样权重的方法也可迁移至因果推断中的时间依赖性数据场景。值得花时间读全文以熟悉流行病学实际数据结构和分析框架。

2. 10.1214/23-aoas1809 · arXiv — Composite scores for transplant center evaluation: A new individualized empirical null method¶

作者: Nicholas Hartman, Joseph M. Messana, Jian Kang, Abhijit S. Naik, Tempie H. Shearon, Kevin He
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 6/10 · novelty: new_method
摘要: 本文研究医疗质量评估中传统方法因忽略未观测混杂导致的过度离散而偏向识别大型中心为异常的问题。作者提出一种个性化经验零假设方法，将风险调整后标准分数的边际方差建模为有效样本量的光滑函数，仅利用公开的中心层面统计量构建复合评价分数。方法的核心是通过经验零假设稳健估计中心间的过度离散程度，从而更准确地识别真正偏离全国标准的中心。模拟研究表明，相比常规方法，该方法在分类中心质量时具有更低的错误率。对全美肾移植中心的实际评估结果显示，新方法与已有方法在中心排序上存在实质性差异。本文为流行病学中的提供者评估提供了一种可推广的统计框架，值得关注其中处理未观测混杂的思想。
关键技术: risk-adjusted quality measures, individualized empirical null, overdispersion modeling, effective sample size modeling, composite evaluation score, center-level statistics
为什么对您有用: 本文是医疗质量评估领域的应用统计工作，详细展示了风险调整和过度离散的统计处理，适合作为流行病学应用的入门读物。研究者的非参数统计与假设检验知识足以理解其核心方法（经验零假设与方差建模），无需额外背景。该工作展示的新颖调整思路可能启发类似问题（如医院评价），中期可考虑将其迁移到其他流行病学结局的质量评估中，值得花时间阅读全文。

3. 10.1214/23-aoas1805 · arXiv — Bayesian adaptive and interpretable functional regression for exposure profiles¶

作者: Yunan Gao, Daniel R. Kowal
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 6/10 · novelty: new_method
摘要: 本文旨在利用功能回归模型推断产前每日PM2.5暴露对儿童4年级阅读成绩的时变效应，并识别关键暴露窗口。数据来自北卡罗来纳州大型队列（n较大）。模型采用B样条基展开与动态收缩先验（如Horseshoe型），使回归系数曲面既能捕捉平滑变化又能适应局部突变。后验推断通过高效MCMC实现，并配套决策分析框架从后验分布中提取关键窗口。模拟结果显示，该方法在点估计精度、区间覆盖率和窗口选择上均优于现有方法。实证分析表明，早期和晚期妊娠阶段的暴露对阅读成绩最不利。本文是一篇高质量环境流行病学应用，完整展示了功能数据回归在暴露-健康关联中的分析流程。
关键技术: B-spline basis expansion, dynamic shrinkage priors, Bayesian functional regression, decision analysis for critical windows, MCMC, adaptive smoothing
为什么对您有用: 直接连接流行病学（环境暴露与教育结局）这一副兴趣，提供了大规模队列和功能回归分析流程，可作为应用参考。从技术角度，研究者可用非参数统计（very_familiar）中的样条基理解模型核心，但贝叶斯动态先验和MCMC计算不在武器库中，暂不可做进一步的算法改进；作为流行病学网关阅读，值得花时间读全文了解数据和窗口选择策略。

4. 10.1214/23-aoas1807 — Modeling the visibility distribution for respondent-driven sampling with application to population size estimation¶

作者: Katherine R. McLaughlin, Lisa G. Johnston, Xhevat Jakupi, Dafina Gexha-Bunjaku, Edona Deva, Mark S. Handcock
期刊/来源: Annals of Applied Statistics
机构: Oregon State University · Development Fund
分类: vol 18 · issue 1
相关性 5/10 · novelty: application
摘要: 本文针对RDS（响应者驱动抽样）中人口规模估计的难题，提出了一种改进的 successive sampling PSE 框架。核心是通过 visibility 分布建模来处理自报网络大小的测量误差，并引入招募人数模型来平滑度分布。方法在科索沃三个隐藏人群（如注射吸毒者）的真实数据上验证了性能，展示了如何替代有偏的自报度数。该框架可扩展至患病率估计，为流行病学中的 hidden population 研究提供了更稳健的统计工具。
关键技术: visibility modeling, successive sampling population size estimation, measurement error model, respondent-driven sampling, network degree smoothing
为什么对您有用: (1) 本文是流行病学中隐藏人群（HIV/吸毒者等）抽样方法的经典应用，作为入门读物脉络清晰，方法论自洽； (2) 研究者当前的武器库（非参数、M估计、因果推断）不直接覆盖RDS的加权估计与贝叶斯分层模型，需补充依赖网络结构的抽样理论才能独立进入该方向； (3) 若非有流行病学合作数据需要处理，本文仅属方向性了解，不必精读全文。

5. 10.1214/23-aoas1793 — Bayesian projections of total fertility rate conditional on the United Nations sustainable development goals¶

作者: Daphne H. Liu, Adrian E. Raftery
期刊/来源: Annals of Applied Statistics
机构: University of Washington
分类: vol 18 · issue 1
相关性 3/10 · novelty: application
摘要: 本文针对高生育率国家，在联合国可持续发展目标（SDGs）背景下，提出一个条件贝叶斯分层模型，用于概率性地预测总和生育率（TFR）。模型将女性教育程度和避孕普及率作为加速生育率下降的关键机制，这两者均直接受政策影响。作者设定了到2030年实现全民中等教育和普遍获取计划生育服务的SDG情景，量化政策干预对生育率下降的潜在加速效应。方法上，采用贝叶斯推断结合时间序列和分层结构，捕捉国家间异质性并生成含不确定性的投影。实证部分展示了不同政策强度下的TFR预测轨迹，为政策制定者提供量化的概率区间。本文属于应用导向的研究，但其条件预测框架隐含了因果对比（干预 vs. 自然趋势），可启发流行病学中基于政策场景的因果效应评估设计。
关键技术: Bayesian hierarchical model, probabilistic projection, policy intervention scenarios, fertility estimation
为什么对您有用: 本文连接流行病学中政策干预效果的量化评估，属于次要兴趣的应用层级。研究者可用其熟悉的因果推断工具（如IV、中介分析）审视该模型中“政策→TFR”的识别假设是否站得住。中期可做：需先在贝叶斯分层模型和人口学投影领域积累一定经验，再尝试引入结构因果模型进行灵敏度分析。

其他 (other, 8 篇)¶

1. 10.1214/23-aoas1791 — ANOPOW for replicated nonstationary time series in experiments¶

作者: Zeda Li, Yu (Ryan) Yue, Scott A. Bruce
期刊/来源: Annals of Applied Statistics
机构: Baruch College · Texas A&M University
分类: vol 18 · issue 1
相关性 3/10 · novelty: new_method
摘要: 提出一种新颖的ANOPOW（analysis of power）模型，用于实验研究中重复非平稳时间序列的二阶时变频率模式比较，目标是在局部平稳Cramér谱表示下估计组效应作为时间和频率的函数。采用贝叶斯框架，对每个时变函数效应施加独立的二维二阶随机游走（RW2D）先验，实现灵活自适应平滑。利用非平稳序列的分段平稳近似获得局部周期图估计，再通过集成嵌套拉普拉斯近似（INLA）以低计算成本得到后验分布，同时允许灵活利用局部周期图的大样本分布特性提升精度。通过地震信号和ADHD儿童瞳孔直径两个真实数据应用展示模型效果。对您而言，INLA是一种高效的贝叶斯计算方法，与统计计算（numerical methods）兴趣直接相关，可作入门材料了解其在新模型中的应用。
关键技术: ANOPOW, Cramér spectral representation, locally stationary process, RW2D prior, Integrated Nested Laplace Approximations (INLA), piecewise stationary approximation
为什么对您有用: 本文核心是统计计算中的INLA近似推断方法，与您对统计计算（numerical methods）的兴趣直接相连；武器库中“software development”可用于实现INLA软件包，但需先理解INLA内部机制。由于当前武器库缺乏时间序列谱分析和INLA的专门知识，建议先以gateway reading身份精读，若未来决定在贝叶斯计算方法上深入，可将INLA学习列为中期目标（需在“moderately_familiar”中新增贝叶斯计算技能），目前暂不可直接转化。

2. 10.1214/23-aoas1761 · arXiv — RZiMM-scRNA: A regularized zero-inflated mixture model framework for single-cell RNA-seq data¶

作者: Xinlei Mi, William Bekerman, Anil K. Rustgi, Peter A. Sims, Peter D. Canoll, Jianhua Hu
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 3/10 · novelty: application
摘要: 该文针对单细胞RNA-seq数据的高维性、高丢失率（dropout）和批次效应，提出一个正则化零膨胀混合模型框架（RZiMM-scRNA），同时实现细胞亚群聚类和基于重要性评分的差异表达基因识别。模型用零膨胀分量显式建模dropout，通过正则化处理高维特征，并纳入批次效应校正项。模拟实验表明，在亚群区分度较低时，RZiMM-scRNA在聚类准确性和生物标志物检测精度上优于Seurat、SC3等流行方法。两套脑肿瘤（星形细胞瘤及胶质母细胞瘤）真实数据分析成功识别出与生物医学文献一致的少突胶质细胞亚群。该方法的主要贡献在于提供统一的聚类与差异表达框架，但其统计工具（混合模型、正则化、重要性评分）与您主攻的因果推断、高维理论技术路线差异较大，可视为流行病学/基因组学应用的一个参考案例。
关键技术: zero-inflated mixture model, regularization, importance score for biomarker detection, batch effect correction, clustering
为什么对您有用: 本文属于生物医学统计应用，涉及肿瘤异质性研究，与secondary interest中的流行病学应用有一定关联（但缺乏因果推断）。该文方法学（零膨胀混合模型、正则化、重要性评分）不在您当前技术库的核心范围内，且未涉及因果推断或高维理论中的关键工具（如U-statistics、效率理论），因此直接借鉴价值有限。可作为理解scRNA-seq数据分析挑战的入门素材，但暂不可做——核心工具（混合模型、批量效应校正）不在您非常熟悉或中等熟悉的武器库中。

3. 10.1214/23-aoas1818 — Learning healthcare delivery network with longitudinal electronic health records data¶

作者: Jiehuan Sun, Katherine P. Liao, Tianxi Cai
期刊/来源: Annals of Applied Statistics
机构: University of Illinois Chicago · Brigham and Women's Hospital · Harvard University
分类: vol 18 · issue 1
相关性 3/10 · novelty: application
摘要: 本文研究如何从纵向电子健康记录（EHR）数据中学习医疗交付网络（HDN），核心目标是在考虑患者异质性和时间动态的情况下估计医疗事件之间的触发关系。作者在多元Hawkes过程（mvHP）框架下提出covariate-adjusted random effects（CARE）模型，通过随机效应捕捉患者层面的时变背景强度，同时纳入协变量调整。估计方面采用penalized likelihood方法实现固定效应选择和网络稀疏化，并移除冗余随机效应。模拟研究表明该方法在网络结构恢复上表现良好，且忽略患者异质性会导致估计偏差。实证分析应用于2型糖尿病患者的EHR数据，所得HDN与临床实践一致。本文属于方法驱动的应用统计工作，核心工具是点过程与penalized estimation，与您primary interests中的因果推断或高维统计理论连接较弱。
关键技术: multivariate Hawkes process, random effects modeling, penalized likelihood estimation, longitudinal EHR analysis, sparse network learning
为什么对您有用: 本文属于流行病学方向的纵向数据分析应用，使用Hawkes过程建模事件间触发关系，但并非因果推断框架（无treatment/confounding/identification讨论）。对您而言，若想进入EHR数据分析领域，本文可作为入门读物了解数据结构和常见建模思路，但武器库中的因果推断、高维理论、semiparametric efficiency等工具在此无直接用武之地。follow-up判断：暂不可做——核心机器（点过程理论、随机效应模型的计算方法）不在武器库中，且本文的方法学novelty有限，不值得花时间深读全文。

4. 10.1214/23-aoas1780 — Bayesian multiple instance classification based on hierarchical probit regression¶

作者: Danyi Xiong, Seongoh Park, Johan Lim, Tao Wang, Xinlei Wang
期刊/来源: Annals of Applied Statistics
机构: Southern Methodist University · Sungshin Women's University · Seoul National University · Southwestern Medical Center · The University of Texas Southwestern Medical Center · The University of Texas at Arlington
分类: vol 18 · issue 1
相关性 2/10 · novelty: application
摘要: 本文研究多实例学习（MIL）中的 bag-level 分类问题，目标是在 instance 对 bag 标签的贡献机制未知的设定下，同时实现 bag 标签预测和 primary instance 识别。提出 MICProB 方法，采用嵌套 probit 回归结构：内层模型预测 primary instances（决定 bag 标签的关键实例），外层模型基于识别出的 primary instances 预测 bag-level 响应。通过 Gibbs sampler 进行后验推断，支持 fully integrated Bayesian prediction。与现有 CS 领域优化方法相比，MICProB 在模型可解释性、参数推断的透明性以及协变量效应解释方面具有明显优势，在 15 个基准方法中表现竞争力。本文属于贝叶斯分层模型在 MIL 问题中的应用，方法学 novelty 有限，但为统计社区提供了可解释的 MIL 替代方案。
关键技术: hierarchical probit regression, Gibbs sampling, multiple instance learning, Bayesian posterior inference, primary instance identification
为什么对您有用: 本文与您的主要研究兴趣（因果推断、高维统计、效率理论）关联较弱，属于贝叶斯分层模型在特定学习问题上的应用。技术工具（Gibbs sampler、probit link）属于标准贝叶斯推断范畴，未涉及 semiparametric efficiency、debiasing、或高维渐近理论。对您而言：暂不可做——本文的核心机器（贝叶斯分层模型、MIL 设定）不在您的 primary interests 范围内，且没有连接到您的 technical_arsenal（如 higher-order U-statistics、minimax bounds、causal identification）。除非您对 MIL 的统计建模本身有兴趣，否则不建议深入阅读。

5. 10.1214/23-aoas1789 · arXiv — Bayesian model-based clustering for populations of network data¶

作者: Anastasia Mantziou, Simón Lunagómez, Robin Mitra
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 2/10 · novelty: application
摘要: 本文针对网络数据群体（populations of networks）提出一个贝叶斯聚类框架，同时推断聚类成员、每个聚类的网络代表（network representative）以及代表的社区结构。方法受两项应用驱动：计算机科学中的人类移动路径模式研究（大学校园内个体移动网络），以及神经科学中脑区关系网络分析。模型中每个聚类由单一网络代表刻画，代表内部的社区结构通过随机块模型（SBM）建模。通过贝叶斯推断，可同时获得聚类分配和代表网络的后验分布，提供直观且可解释的聚类特征。在人类移动研究中，聚类揭示了具有相似移动模式的个体群组，其代表网络易于解读；在脑网络研究中，模型识别出一个具有特殊网络属性的受试者子集。模拟研究验证了方法在聚类准确性和代表网络恢复方面的性能。本文属于应用统计方法开发，侧重于网络数据聚类的贝叶斯建模，与您的主要理论兴趣（因果推断、高维统计、U-统计量等）关联较弱。
关键技术: Bayesian clustering, network data, community detection, stochastic block model, Markov chain Monte Carlo
为什么对您有用: 本文主题为网络数据的贝叶斯聚类，主要涉及应用统计建模，而非您主要关注的因果推断、高维理论或效率理论。虽然方法中包含MCMC等计算元素，但未触及您武器库中的核心工具（如高阶U-统计量、半参数效率界等）。该文对您相关度较低，可能仅作为统计计算或应用领域（如神经科学网络分析）的扩展阅读，但缺乏直接可迁移的方法学连接。属暂不可读范畴——核心工具（贝叶斯网络模型、SBM推断）不在您当前的熟练列表中。

6. 10.1214/23-aoas1784 — Generative machine learning methods for multivariate ensemble postprocessing¶

作者: Jieyu Chen, Tim Janke, Florian Steinke, Sebastian Lerch
期刊/来源: Annals of Applied Statistics
机构: Karlsruhe Institute of Technology · Technische Universität Darmstadt
分类: vol 18 · issue 1
相关性 2/10 · novelty: new_method
摘要: 多发集合天气预报中，集合预报通常存在系统性偏差，需要经过后处理才能得到可靠的概率预测。针对实际应用中至关重要的多变量依赖结构建模问题，现有两阶段方法（先边际后依赖）具有难以引入额外预测变量等共同局限。本文提出一种基于生成式机器学习的非参数多元后处理方法，直接通过生成神经网络输出多变量预测分布的样本。该模型通过优化一个适当的评分函数来训练生成网络，该评分函数度量生成样本与观测数据在给定外生输入变量条件下的差异，无需对单变量分布或多变量依赖作参数假设。在德国多个气象站的气温和风速预测案例研究中，该生成模型在表示空间依赖结构方面显著优于现有基准方法。尽管本文聚焦于气象应用，其非参数分布回归的思路对多元非参数建模有一定参考价值，但黑箱式生成机制与研究者擅长的理论分析框架差异较大。
关键技术: generative neural network, proper scoring rule, ensemble postprocessing, nonparametric distributional regression, multivariate dependencies
为什么对您有用: 本文属于现代非参数分布回归，与您的非参数统计兴趣有细微关联，但生成模型的黑箱性质削弱了经典理论工具的适用性。您的武器库中缺乏深度生成模型训练与评分函数优化等核心技术，因此目前难以直接介入。若未来您拓展至生成式模型的理论（如统计-计算权衡视角），本文可作为入门应用背景读物，但当前暂不可做。

7. 10.1214/23-aoas1783 — A quantitative linguistic analysis of a cancer online health community with a smooth latent space model¶

作者: Mengque Liu, Xinyan Fan, Shuangge Ma
期刊/来源: Annals of Applied Statistics
机构: Xi'an Jiaotong University · Renmin University of China · Yale University
分类: vol 18 · issue 1
相关性 2/10 · novelty: new_method
摘要: 本文研究在线健康社区（OHC）帖子的语言分析，以理解患者情绪与疾病状态。现有方法多聚焦单个词或简单共现网络，忽略网络权重和时变结构。针对LUNGevity肺癌支持社区的21028篇帖子，作者提出两部分的潜在空间模型（two-part latent space model），能够处理带权重的词共现网络。进一步考虑网络随时间存在未知变点，提出惩罚融合（penalized fusion）方法同时估计变点位置和区间内网络结构。数据识别出多个变点，对应患者情绪状态在COVID-19疫情期间的显著变化。网络结构在变点前后差异明显，实证结果与临床直觉一致。该方法的变点检测与网络建模思路可用于流行病学中时序健康数据的网络分析，但本文未涉及因果识别或高维统计。
关键技术: latent space model, weighted co-occurrence network, change point detection, penalized fusion
为什么对您有用: 本文的变点检测方法在纵向网络分析中具有通用性，可考虑迁移到流行病学队列中的时序暴露-结局网络分析。武器库中“nonparametric statistics”可用于评估变点估计对模型误设的稳健性，但该方法未涉及因果识别或高维统计，目前暂不可直接将其工具移植到自身工作，需先熟悉 identification theory 才能引入网络变点与因果中介的交叉方向。总体属于应用生态学类的入门读物，对流行病学应用有参考价值但非核心。

8. 10.1214/23-aoas1790 · arXiv — Inferring changes to the global carbon cycle with WOMBAT v2.0, a hierarchical flux-inversion framework¶

作者: Michael Bertolacci, Andrew Zammit-Mangion, Andrew Schuh, Beata Bukosa, Jenny A. Fisher, Yi Cao et al.
期刊/来源: Annals of Applied Statistics
分类: vol 18 · issue 1
相关性 1/10 · novelty: application
摘要: 该论文开发了WOMBAT v2.0，一个分层贝叶斯通量反演框架，用于推断大气CO₂通量的长期趋势和季节循环变化。方法核心是引入空间变化的时间序列分解（STL类分解），同时施加物理约束（如质量守恒），从而实现对通量时空模式的灵活建模。框架基于分层贝叶斯模型，通过MCMC或变分推断得到全部未知量的后验分布。应用OCO-2卫星和地面直接观测数据，估计2015–2020年全球CO₂通量变化。主要发现包括：热带生态系统在研究期内从净源转变为净汇，全球生态系统CO₂通量季节振幅增加8%，北温带和北寒带季节循环分别提前0.4–0.7和0.4–0.9天。该工作提供了一个完整的统计反演系统，对有噪声观测的反问题（您武器库中的‘inverse problems with random noise’）有直接的方法论参考价值。
关键技术: hierarchical Bayesian model, spatially varying time-series decomposition, flux inversion, OCO-2 satellite data assimilation, physical constraints (mass conservation)
为什么对您有用: 本文处理的核心问题是大气CO₂通量反演——一个典型的带有随机噪声的反问题，您对此类问题（‘inverse problems with random noise’）非常熟悉。论文的分层贝叶斯框架和时空分解技术可以直接转化为您自己在因果推断或U统计量计算中反问题建模的工具。从follow-up角度看，您可以立即基于对反问题的理解批评或改进其先验设定（非常熟悉），中期可以考虑将其空间变系数模型与您的higher-order U-statistics的树宽计算框架结合（需在‘theory of higher-order U-statistics’上长肌肉），目前不需要新工具。该文作为入门读物不错，但方法学新颖性一般（应用型），值得花时间读以获取反问题应用的实战感觉。

Maintained by 陈星宇 · Homepage · Source on GitHub