StatMed — Vol 45 Issue 15-17 · 2026-06-24¶

共 3 篇 · Statistics in Medicine

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

StatMed Vol 45 Issue 15-17 收录的三篇论文聚焦于两个主线：一是小样本/罕见病场景下的因果推断方法漏洞与改进（两篇），二是统计计算与深度学习可解释性在脑图像分析中的结合（一篇）。因果推断主线中，两篇论文均指向有限样本下参数估计与推断的可靠性问题，并分别从回归标准化和倾向性评分两个经典框架切入；计算主线则通过空间统计（克里金插值）增强CNN的区域识别可解释性。

因果推断主线：第一篇《Caveats on Using Firth's Penalization in the Model‐Based Regression Standardization for Rare Diseases》揭示Firth惩罚在参数g-formula中的副作用——其将预测概率向0.5收缩，破坏标准化估计的一致性，并给出截距校正与添加协变量两种修正方案。第二篇《Improving Variance and Confidence Interval Estimation in Small‐Sample Propensity Score Analyses: Bootstrap Versus Asymptotic Methods》系统比较了sandwich方差估计与bootstrap在IPTW/AIPW中的小样本表现，发现sandwich极不稳定，并提出分层bootstrap（strata-based bootstrap）以规避准分离失效问题。两篇共享罕见病/小样本、PS或g-formula框架、以及逼近有限样本下推断准确性的共同关切。

统计计算主线：《Interpretable ROI Identification in Brain Image Analysis: Overcoming CNN Black Box Challenges With Kriging‐Enhanced Adaptive Sampling》将克里金插值用于空间不确定性量化，替代大量模型训练以降低计算负担，同时保持CNN预测精度，并在创伤性脑损伤数据中识别出生物学一致的ROI，为统计方法与深度学习解释性的交叉提供了具体实现。

与因果推断方向最贴的两篇（Firth惩罚与PS方差估计）建议优先阅读；半参数效率与高维主题本次未涉及，但上述两篇在参数g-formula、IPTW/AIPW框架下的小样本行为分析对因果识别与推断研究者具有直接参考意义。

因果推断 (causal_inference, 2 篇)¶

1. 10.1002/sim.70644 — Caveats on Using Firth's Penalization in the Model‐Based Regression Standardization for Rare Diseases¶

作者: Sotaro Hashibe, Wataru Hongo, Tomohiro Shinozaki
期刊/来源: Statistics in Medicine
机构: Janssen (Belgium) · Tokyo University of Technology · Tokyo University of Science · Japan Graduate School of Education University · Novartis (Japan) · Tokyo University of Information Sciences · Department of Health
分类: vol 45 · issue 15-17
相关性 7/10 · novelty: application
摘要: 研究在罕见病场景下，基于模型的回归标准化（即参数g-formula）中使用Firth惩罚导致的边际效应估计偏倚问题。Firth惩罚逻辑回归虽能解决（准）完全分离导致的参数估计不收敛，但其将预测概率向0.5收缩的特性会破坏标准化估计的一致性，使得预测事件率偏离观测率。作者以骨科手术部位感染（SSI）数据为例，通过实证分析展示了该偏倚的大小，并提出了两种简单修正方法：截距校正与添加协变量。利用模拟研究比较了修正后的Firth方法与倾向性评分方法的有限样本表现，并应用到吸烟与SSI关联的评估中。对您有用：这篇工作直接连接primary interest中的causal inference（参数g-formula的finite-sample问题），同时也属于epidemiology中的罕见病应用，您可用very_familiar的估计理论工具分析其修正方法的渐近偏倚，或利用software development能力复现并扩展模拟。
关键技术: Firth penalized likelihood, parametric g-formula, regression standardization, rare disease, separation, bias correction
为什么对您有用: 直接连接到因果推断中的标准化/g-formula方法在罕见病小样本下的实际偏倚问题，属于您primary interest中identification and estimation的具体子方向。利用您very_familiar的估计理论经验，可以推导修正后estimator的渐近偏倚阶数，并与传统g-formula比较。此外，该文提供了公开的实证数据（SSI数据库），您可立即复现并扩展其模拟设计，属于立即可做的follow-up。

2. 10.1002/sim.70643 · arXiv — Improving Variance and Confidence Interval Estimation in Small‐Sample Propensity Score Analyses: Bootstrap Versus Asymptotic Methods¶

作者: Baoshan Zhang, Sean M. O'Brien, Yuan Wu, Laine E. Thomas
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 15-17
相关性 7/10 · novelty: application
摘要: 该文聚焦于小样本倾向性评分（PS）分析中方差估计与置信区间构建的准确性问题。当前常用的sandwich方差估计和bootstrap方法在中等至大样本下已有比较，但小样本（如罕见病研究、外部对照试验）中渐近性质可能失效，且bootstrap重估PS时容易因准分离而失效。作者通过蒙特卡洛模拟，系统比较了IPTW和AIPW估计量下sandwich与bootstrap（固定PS vs 重估PS）的表现，涵盖不同样本量、治疗率与结局率。主要发现：sandwich估计在小样本下的表现极不稳定，固定PS并不一定比重估PS更保守；而分层bootstrap（strata-based bootstrap）可有效避免准分离问题，并给出更可靠的方差和置信区间。以LIMIT-JIA试验为例，不同方法的结果足以改变统计结论。该文直接服务于因果推断中PS估计量的实际推断需求，您熟悉的非参数统计和因果推断估计理论可帮助评估小样本下各方法的适用条件，并可立即迁移到您自己的应用中。
关键技术: propensity score, sandwich variance estimator, bootstrap, inverse probability of treatment weighting (IPTW), augmented inverse probability of treatment weighting (AIPW), Monte Carlo simulation
为什么对您有用: 该研究直接属于您因果推断子方向中的倾向性评分应用评估，与您关注的估计理论和实际推断密切相关。您精通的非参数统计和因果推断估计理论可帮助理解小样本下sandwich与bootstrap失效的机制，从而在实际数据分析中更自信地选择方差估计方法。从武器库看，这篇论文的问题是立即可做的：您已经非常熟悉因果推断的估计方法，可以直接将这里的模拟发现作为小样本PS分析的操作指南，甚至复现并扩展其比较（如引入bootstrap校正后的置信区间）。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1002/sim.70653 — Interpretable ROI Identification in Brain Image Analysis: Overcoming CNN Black Box Challenges With Kriging‐Enhanced Adaptive Sampling¶

作者: HyunAh Lee, Jihnhee Yu, Soyun Park, Zohi Sternberg
期刊/来源: Statistics in Medicine
机构: University at Buffalo, State University of New York · Bristol-Myers Squibb (Germany) · Bristol-Myers Squibb (Belgium)
分类: vol 45 · issue 15-17
相关性 6/10 · novelty: application
摘要: 该论文针对脑图像分析中CNN黑箱问题，提出自适应空间关键区域识别（ASKRI）框架。目标是在不牺牲预测精度的情况下，提高ROI识别的可解释性和计算效率。方法核心包括：基于香农熵的自适应采样、概率-均值驱动的候选区域选择、以及块到块克里金插值用于空间不确定性量化。ASKRI通过克里金插值替代大量模型训练，显著降低计算负担，并与CNN无缝集成。在创伤性脑损伤（TRACK-TBI）数据集上，该框架识别出与衰老相关的空间一致且生物学意义的区域。论文将空间统计中的克里金法引入深度学习解释性任务，为统计计算在医学图像分析中的应用提供新思路。
关键技术: adaptive sampling, Shannon entropy, kriging interpolation, block-to-block kriging, probability-mean-driven selection, CNN interpretability
为什么对您有用: 该工作属于统计计算方向，涉及adaptive sampling与空间插值的算法设计，对您的primary interest中'statistical computing (numerical methods, algorithm)'有参考价值。武器库中'nonparametric statistics'可以用于分析其kriging平滑参数的选择，但论文本身偏向应用，方法论增量有限。暂不可做：核心方法（block kriging与熵驱动的自适应采样）不是您目前常规工具，且缺乏与U统计或因果推断的直接接口。可作为拓宽统计计算视野的入门阅读，不急于深入。

Maintained by 陈星宇 · Homepage · Source on GitHub