SMMR — Vol 35 Issue 5 · 2026-06-19¶
- 共 11 篇 · Statistical Methods in Medical Research
- 目录核对 ✅ 11 篇全部抓到(对照 OpenAlex 11 篇)
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
本期共11篇论文,按方法主题可归纳为三条主线:因果识别与稳健估计(3篇)、复杂删失数据下的生存分析与变换模型(5篇)、半参数建模与贝叶斯推断(4篇,部分与上两线重叠)。另有一篇图像聚类方法与其他两类关联较弱。
因果识别与稳健估计是本期最集中的方向。第1篇针对倾向性评分分层估计器在正确指定后仍存在的残差混杂,将其重新解释为分段常数回归,并用核平滑修正以消除混杂,进而构造不依赖逆概率加权的双重稳健估计器,借助M估计论分析渐近性质与半参数效率。第2篇将非参数经验似然引入因果推断,替代传统参数假设,与IPW结合,利用机器学习实现约束方程构建置信区间,教程性展示了流行病学环境下的实用推断。第3篇面向随机对照试验中的likely responder亚组分析,采用贝叶斯两阶段方法——第一阶段用贝叶斯模型识别亚组,第二阶段将后验传播到治疗效应估计,从而纠正朴素方法中忽略第一阶段不确定性的校准偏差。三篇均聚焦于因果参数估计中的稳健性(对模型偏误、假设限制、不确定性传播的应对),但切入点不同:分层修正、非参数似然、贝叶斯传播。
复杂删失数据下的生存分析是篇幅最多的方向,涉及多种删失类型和缺失机制。第4篇处理生物标志物评估中的非随机缺失(nonignorable missingness),利用工具变量解决识别问题,将IPW嵌入pseudo partial likelihood的score方程,估计time-dependent AUC的协变量效应。第9篇在双截断(doubly truncated)数据下考虑single-index模型,将最大秩相关目标线性化得到闭式估计量,避免迭代优化,并证明n^{-1/2}-CAN性质。第10篇针对信息性部分区间删失(informative partly interval-censored)与协变量测量误差,联合建模变换模型,用I-splines近似非参数函数,通过四阶段data augmentation实现贝叶斯推断。第11篇针对区间删失数据与时变协变量,采用部分线性变换模型,用单调B样条基逼近未知单调函数,开发嵌套混合EM算法,并引入得分检验评估比例风险假设的充分性。此外,第5篇从ICH E9(R1) estimand框架出发,对比非比例风险下AHR、CIR、RMTL ratio的检验功效,为疫苗效力试验提供选择依据;第6篇则是平滑变换模型的R教程(tram包),覆盖Weibull、Cox参数化及扩展,可作为上述方法的应用参考。这组论文的共同工具是变换模型、样条逼近以及IPW/贝叶斯对缺失与删失的处理。
半参数与贝叶斯方法在多个方向交织:除上述第1、9、10、11篇涉及半参数效率或贝叶斯半参数框架外,第7篇关注贝叶斯临床试验样本量确定,提出可解释的折扣权重(线性化技术使权重代表“借力信息百分比”),以解决稳健共轭先验中借力程度非单调、难以解释的问题。第8篇的模型基图像聚类方法利用协变量调整的函数型潜类别混合模型,虽不属于前述主线,但亦展示了半参数混合建模在非侵入式筛查中的应用。
对于因果推断方向的研究者,最直接相关的为第1、2、3篇——分别对应倾向性评分分层修正、经验似然因果推断、贝叶斯亚组异质性处理效应。对半参数生存/删失数据方向,第4、9、10、11篇集中处理复杂删失与缺失,其中第9、10、11进一步涉及变换模型与样条基函数。半参数效率方面,第1篇与第9篇均可在M估计或秩相关框架下与现有理论对接。
因果推断 (causal_inference, 3 篇)¶
1. 10.1177/09622802261432998 — Eliminating residual confounding in the stratified estimator via smoothing along with the propensity score¶
- 作者: Naoto Tsujimoto, Satoshi Hattori
- 期刊/来源: Statistical Methods in Medical Research
- 分类: vol 35 · issue 5 · pp 1091-1108
- 相关性 8/10 · novelty:
new_method - 摘要: 针对倾向性评分分层估计器在正确指定倾向性评分后仍存在的残差混杂问题,本文提出了一种基于核平滑的修正方法。作者首先将分层估计器重新解释为倾向性评分上的分段常数结果回归估计量,从而揭示了残差混杂的来源。通过引入核平滑,构建了无残差混杂的估计器,保留了分层估计器原有的稳健性和简洁性。进一步提出了双重稳健估计器,该估计器不依赖逆概率加权,在结果回归或倾向性评分之一正确指定时仍保持一致性。理论分析证明了所提估计量的渐近正态性和一致性。该方法直接与您的因果推断估计理论兴趣相连,特别是利用您熟悉的M估计论分析其双重稳健性和半参数效率。
- 关键技术:
kernel smoothing,propensity score stratification,residual confounding,doubly robust estimation,outcome regression with piecewise constant function - 为什么对您有用: 本文直接解决因果推断中倾向性评分分层估计器的残差混杂问题,提出核平滑修正和双重稳健版本,与您的因果推断估计理论兴趣紧密相关。您可以用M估计理论武器验证其双重稳健性条件和渐近效率,立即可做。中期可做:若推广至高维协变量,需学习高维倾向性评分方法(您目前为moderately_familiar)。
2. 10.1177/09622802261435966 — Implementing empirical likelihood within the causal inference framework to study causal effects of air pollution on reproductive development¶
- 作者: Sima Sharghi, Kevin E Stoll, Sally W Thurston, Emily Barrett, Brent Johnson
- 期刊/来源: Statistical Methods in Medical Research
- 机构: Akron Children's Hospital · University of Rochester · Gavekal Intelligence Software (France) · Rutgers Sexual and Reproductive Health and Rights
- 分类: vol 35 · issue 5 · pp 1109-1142
- 相关性 7/10 · novelty:
application - 摘要: 本文在因果推断框架下,利用非参数经验似然(EL)研究空气污染(PM2.5、NO2)对生殖发育(肛门-生殖器距离)的因果效应。在随机对照试验不可行的观测研究中,传统参数方法假设受限,而EL不依赖参数分布假设,通过约束方程构建置信区间。作者作为教程,详细解释了经典IPW方法和基于机器学习的EL算法实现。模拟研究表明,EL在有限样本下具有竞争性的覆盖率和区间长度。应用于真实流行病学数据,分析了孕期空气污染物暴露与新生儿肛门-生殖器距离的关联。该工作提供了一个实用的因果推断工具,尤其适合流行病学研究中处理混杂变量时避免强参数假设的情形。对于您而言,本文连接了因果推断方法与流行病学应用,展示了非参数推断在实际数据分析中的操作流程。
- 关键技术:
Empirical likelihood,Causal inference framework,Nonparametric confidence intervals,Simulation study - 为什么对您有用: 本文属于流行病学情境下的因果推断应用,与您的二级兴趣epidemiology直接相关。您对非参数统计和因果推断估计理论非常熟悉(very_familiar),可快速理解EL的约束推断原理。但EL的因果解释和具体置信区间构造并非您当前核心工具箱,可视为中期可做的拓展方向——需在M-estimation(moderately_familiar)的基础上深入EL相关理论。
3. 10.1177/09622802261427026 · arXiv — A Bayesian likely responder approach for the analysis of randomized controlled trials¶
- 作者: Annan Deng, Carole Siegel, Hyung G Park
- 期刊/来源: Statistical Methods in Medical Research
- 分类: vol 35 · issue 5 · pp 998-1010
- 相关性 5/10 · novelty:
application - 摘要: 本文针对随机对照试验中的likely responder(LR)框架,提出一种两阶段贝叶斯方法来识别治疗效应超过临床阈值的子群体,并对其进行子组特异性推断。传统LR框架及数据驱动子组分析常忽略第一阶段模型估计的不确定性,导致后续推断的校准偏差。作者在第一阶段利用贝叶斯模型进行子组识别,并将后验分布传播到第二阶段,用于子组内治疗效应估计与置信区间构建。模拟研究表明,该方法相比朴素两阶段方法能产生更准确的区间覆盖。应用于一项国际COVID-19治疗试验,展示了不同数据驱动子组间治疗效应的显著异质性。该方法为个性化医疗中的亚组分析提供了更严谨的不确定性量化途径,与因果推断中异质性处理效应的估计问题直接相关。
- 关键技术:
Bayesian two-stage estimation,uncertainty propagation,subgroup identification,likely responder framework,randomized controlled trial analysis - 为什么对您有用: 本文属于因果推断中的异质性处理效应估计方向,具体针对LR框架的不确定性传播问题。您非常熟悉的估计理论(尤其M-estimation和模拟方法)可用于推导该两阶段贝叶斯估计量的渐近性质并评估其效率。整体方法较为简单,属于立即可读并可尝试复现的应用型工作。
非参数 / 半参数 (nonparam_semipara, 2 篇)¶
1. 10.1177/09622802261432834 — Linearized maximum rank correlation estimation of doubly truncated data¶
- 作者: Peijie Wang, Qihao Wang, Jianguo Sun
- 期刊/来源: Statistical Methods in Medical Research
- 机构: Jilin University · Jilin Medical University · University of Missouri
- 分类: vol 35 · issue 5 · pp 1011-1031
- 相关性 6/10 · novelty:
new_method - 摘要: 在双截断(doubly truncated)数据设定下,本文针对 single-index model 提出了一种线性化最大秩相关(linearized maximum rank correlation, LMRC)估计量,目标是估计 index 参数而无需指定未知 link function 或误差分布。核心机制在于将传统 MRC 优化目标线性化,从而获得 closed-form 估计量,避免了迭代求解和非凸优化。理论证明估计量具有 consistency 与 n^{-1/2}-CAN(渐近正态)性质,模拟与 AIDS 真实数据应用验证了方法实用性。对您可能有用:该工作在截断数据下实现了 semiparametric single-index 的 closed-form 估计,其渐近正态性推导涉及 U-statistic 投影技术,与您对 higher-order U-statistics 与 semiparametric theory 的兴趣直接相关。
- 关键技术:
doubly truncated data,single-index model,maximum rank correlation,U-statistic projection,closed-form estimator,asymptotic normality - 为什么对您有用: 本文连接到 semiparametric theory(single-index model 的无 link function 估计)与 higher-order U-statistics(MRC 的线性化本质上是秩 U-statistic 的投影近似)两个子方向。您武器库中的 U-statistic projection / M-estimation theory(moderately_familiar)可以直接攻入其渐近正态性证明的细节,验证 closed-form 估计量是否达到 semiparametric efficiency bound。Follow-up 粗判:中期可做——需先在 moderately_familiar 的 M-estimation theory 与 semiparametric efficiency bound 计算上长肌肉,以评估该 LMRC 估计量的效率损失并探索是否可用 HOIF 去补。
2. 10.1177/09622802261432830 — A Bayesian transformation model for informative partly interval-censored data with covariates subject to measurement error¶
- 作者: Jingjing Jiang, Chunjie Wang
- 期刊/来源: Statistical Methods in Medical Research
- 机构: Changchun University of Technology
- 分类: vol 35 · issue 5 · pp 1032-1045
- 相关性 6/10 · novelty:
new_method - 摘要: 在生存分析设定下,目标是线性变换模型中回归参数与未知变换函数的估计,同时处理协变量测量误差与 informative partly interval-censored (IPIC) 截断。作者提出联合建模框架,将测量误差子模型与 IPIC 机制纳入同一似然,避免忽略二者导致的估计偏误。非参数变换函数与危险率函数用 I-splines 近似,通过四阶段 data augmentation 设计 MCMC 算法完成贝叶斯后验推断。模拟对比了 naive 方法与所提贝叶斯方法,验证了纠偏有效性,并附有实际数据应用。对您可能有用:本文的 I-spline 贝叶斯半参数推断与 data augmentation 策略,为处理复杂截断与测量误差联合建模提供了可参考的计算框架。
- 关键技术:
linear transformation model,informative partly interval censoring,covariate measurement error,joint modeling,I-spline approximation,data augmentation MCMC - 为什么对您有用: 本文连接到 semiparametric theory 子方向(I-spline 近似未知变换函数的半参数贝叶斯推断),但核心是贝叶斯 MCMC 计算而非经典 semiparametric efficiency / influence function 路线。用 technical_arsenal 中的 M-estimation theory 可以尝试从频率派视角重新审视该联合模型的 identification 与效率界,但本文本身未触及效率理论。中期可做:若想从 semiparametric efficiency bound 角度分析该 IPIC + measurement error 联合模型的效率极限,需先在 moderately_familiar 的 semiparametric theory 上长肌肉(具体是带测量误差与 informative censoring 的效率界推导),当前武器库偏向频率派与高维,贝叶斯 MCMC 部分需额外投入。
流行病学 (epidemiology, 5 篇)¶
1. 10.1177/09622802261432996 — Addressing nonignorable missing data and heterogeneity in prognostic biomarker assessment¶
- 作者: Xinran Huang, Ruosha Li, Jing Ning, for the Alzheimer’s Disease Neuroimaging Initiative
- 期刊/来源: Statistical Methods in Medical Research
- 机构: The University of Texas Health Science Center at Houston · The University of Texas MD Anderson Cancer Center
- 分类: vol 35 · issue 5 · pp 1078-1090
- 相关性 7/10 · novelty:
application - 摘要: 在带有 time-to-event 结局的生物标志物评估设定下,目标是估计协变量对 time-dependent AUC 的影响,同时处理生物标志物的 nonignorable missing data。对缺失概率假设参数模型,利用 instrumental variable 解决 nonignorable missingness 导致的 identification 问题。将 inverse probability weighting (IPW) 嵌入 pseudo partial likelihood 的 score equation 中进行估计与推断,并证明所提估计量的 n^{-1/2}-CAN 渐近性质。模拟评估了有限样本表现,并应用于 ADNI 阿尔茨海默病数据库。对您可能有用:本文提供了一个在流行病学数据中用 IV 解决 nonignorable missingness identification 的具体应用案例。
- 关键技术:
time-dependent AUC,nonignorable missing data,instrumental variable identification,inverse probability weighting (IPW),pseudo partial likelihood,asymptotic normality - 为什么对您有用: (1) 直接连接到流行病学数据集(ADNI)与因果推断中的 IV 方法——具体是用 IV 解决 nonignorable missing 的 identification,而非经典 treatment-effect IV;(2) 您 very_familiar 的 estimation theory in causal inference 与 IPW 机制可直接审视其 score equation 构造与渐近性质推导;(3) 立即可做:用您熟悉的 semiparametric efficiency bound 工具可检验该 IPW+pseudo-likelihood 估计量是否达到效率界,或探索非参数 IV 替代其参数缺失概率模型。
2. 10.1177/09622802251412833 — Vaccine efficacy estimands and power considerations¶
- 作者: Andrea Callegaro, Nathan W. Bean
- 期刊/来源: Statistical Methods in Medical Research
- 机构: GlaxoSmithKline (Netherlands)
- 分类: vol 35 · issue 5 · pp 962-979
- 相关性 6/10 · novelty:
application - 摘要: 在 ICH E9(R1) 框架下,本文研究疫苗效力试验中当比例风险假设(PH)不成立时的多种 estimand,包括平均风险比(AHR)、累积发病率比(CIR)及受限平均损失时间比(RMTL ratio)。核心机制是对比这三种非 PH 下仍具临床可解释性的 estimand 的检验功效,并在 HPV 三期疫苗试验数据上进行实证。理论结果表明,在经典预防性疫苗试验设定下,AHR 与 CIR 的功效表现相近,而 RMTL ratio 的预期功效较低。对您可能有用:本文是流行病学因果/疗效估计中 estimand 选择的实操参考,展示了生存分析非 PH 设定下不同 estimand 的功效差异。
- 关键技术:
estimand framework (ICH E9(R1)),average hazard ratio,cumulative incidence ratio,restricted mean time lost ratio,power comparison under non-proportional hazards,vaccine efficacy trial design - 为什么对您有用: 本文直接连接到流行病学(secondary interest)中的因果/疗效估计与试验设计问题,聚焦 ICH E9(R1) estimand 框架在非 PH 生存数据下的具体实现与功效对比。从 technical_arsenal 角度,用您 very_familiar 的 high-dimensional asymptotics / minimax bounds 工具,可以对本文三种 estimand 在更复杂高维协变量或 semiparametric 模型下的效率界做 sharper rate 分析,这是一个潜在口子。Follow-up 粗判:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以推导非 PH 下这些 estimand 的 semiparametric efficiency bound 并验证其功效排序的理论紧性。
3. 10.1177/09622802251414595 · arXiv — Smooth transformation models for survival analysis: A tutorial using R¶
- 作者: Sandra Siegfried, Bálint Tamási, Torsten Hothorn
- 期刊/来源: Statistical Methods in Medical Research
- 分类: vol 35 · issue 5 · pp 980-997
- 相关性 4/10 · novelty:
survey - 摘要: 本文是生存分析中平滑变换模型(smooth transformation models)的教程性综述,重点关注 R 系统 tram 包的使用。该框架通过统一的最大似然方法涵盖多种生存模型,包括 Weibull 模型和 Cox 比例风险模型的完全参数化版本,并扩展至非比例风险、相依删失、聚类观测及个性化医学等复杂场景。教程以直肠癌随机对照试验数据为例,展示了如何在 R 中无缝完成生存分析任务。文章并未提出新理论或新方法,而是系统阐述现有模型族的统一表达与软件实现,为应用研究者提供实用的导航工具。对您而言,这是一篇流行病学应用方向的入门级综述,可作为快速了解生存分析现代计算工具的参考,方法学新颖度较低。
- 关键技术:
smooth transformation models,maximum likelihood estimation,Cox proportional hazards model (parametric version),R package tram,interval-censored data,clustered survival data - 为什么对您有用: 本文属流行病学应用方向,适合作为生存分析计算工具的入门读物。武器库中的‘software development’一项可直接用于理解 tram 包的结构与接口,但本篇无新方法学挑战。若今后需在因果推断中处理删失数据(例如 IV 或 longitudinal 场景中的依赖删失),本文可作为基础参考,但当前暂不可做直接扩展,因核心兴趣(因果推断、高维统计)未触及。
4. 10.1177/09622802261432816 · arXiv — Bayesian sample size determination using robust commensurate priors with interpretable discrepancy weights¶
- 作者: Lou E Whitehead, James MS Wason, Oliver Sailer, Haiyan Zheng
- 期刊/来源: Statistical Methods in Medical Research
- 分类: vol 35 · issue 5 · pp 1046-1062
- 相关性 3/10 · novelty:
new_method - 摘要: 本文针对临床试验中利用历史数据进行贝叶斯样本量确定的实际问题,聚焦于稳健共轭先验(robust commensurate prior)方法中折扣权重的不单调性问题。在多重历史数据源背景下,样本量与折扣权重之间呈现高度非线性关系,导致权重难以解释,不利于领域专家在试验设计阶段合理设定借力程度。作者首先推导了解析样本量公式,解决非单调性问题,然后提出一种线性化技术,使得样本量随权重均匀变化,从而将权重解释为'借力信息百分比'。这一改进使权重更具可解释性,有助于在贝叶斯框架下更方便地通过专家意见设定折扣因子。模拟和实例表明,该方法能保持合理的试验操作特性(如检验效能和I型错误率)。对于流行病学中涉及历史数据整合的临床试验设计,本文提供了实用的样本量计算工具。
- 关键技术:
Bayesian robust commensurate prior,discounting factor,analytical sample size formula,linearization technique,sample size determination - 为什么对您有用: 本文属于流行病学 secondary interest 中临床试验设计的应用方法研究,直接针对历史数据借力时的样本量计算难点。您的技术储备中非常熟悉非参数统计和软件开发,可基于该线性化技巧开发易用的样本量计算软件;中期可借 moderately_familiar 的 M-estimation 理论评估该方法的频率性质。该文作为流行病学领域的入口读本,清晰说明了数据结构和专家意见的融合方式,值得花时间阅读以了解贝叶斯样本量确定的实践模式。
5. 10.1177/09622802251393631 — Model-based clustering of multiple images incorporating covariates¶
- 作者: Ying Cui, Jeong Hoon Jang, Robert G Mannino, Amita K Manatunga
- 期刊/来源: Statistical Methods in Medical Research
- 机构: Emory University · The University of Texas Medical Branch at Galveston · Golden Gate University
- 分类: vol 35 · issue 5 · pp 945-961
- 相关性 2/10 · novelty:
application - 摘要: 本文针对多幅图像的无监督聚类问题,提出一种在聚类成员分配中同时调整协变量效应的方法。核心策略是将每幅图像表示为二维函数型数据,并建立函数型潜类别混合模型(functional latent class mixed model),充分利用图像的结构信息同时处理高维性。该方法应用于患者自拍的手指甲照片颜色强度矩阵,以识别贫血风险的亚组,并调整图像元数据(如拍摄条件)对聚类成员的影响。研究在低收入资源地区便携式贫血筛查的场景下,发现识别出的三个簇分别对应不同的贫血风险水平(0%、79%、86% 的受试者被临床诊断为贫血)。结论表明该方法有潜力支持基于智能手机的非侵入式贫血筛查。对您而言,这是一个流行病学领域的应用型工作,展示了函数型数据分析在医学影像聚类中的实际流程。
- 关键技术:
functional latent class mixed model,two-dimensional functional data,model-based clustering,covariate-adjusted clustering - 为什么对您有用: 本文属于流行病学(贫血筛查)的应用论文,是您的次级兴趣方向。方法本身并非您熟悉的因果推断或高维统计核心工具,且函数型潜类别混合模型不在您的 technical_arsenal 中(目前无法直接攻击该方法学的口子)。但作为流行病学应用,本文清楚展示了智能手机图像数据的采集结构、噪声来源以及聚类流程,可作为入门性读物了解该领域的数据结构与建模思路。鉴于您没有函数型数据或潜类别模型的强工具储备,不值得花大量时间精读全文,但可略读以拓展视野。
其他 (other, 1 篇)¶
1. 10.1177/09622802261433000 — Penalized estimation of linear transformation models for interval-censored data with time-dependent covariates¶
- 作者: Minggen Lu, Yahui Zhang, Chin-Shang Li, Guogen Shan
- 期刊/来源: Statistical Methods in Medical Research
- 机构: University of Nevada, Reno · University of Florida · University of Rochester Medical Center
- 分类: vol 35 · issue 5 · pp 1063-1077
- 相关性 5/10 · novelty:
new_method - 摘要: 本文针对区间删失数据下含时变协变量的部分线性变换模型,研究高效估计策略。未知单调函数用单调B样条基逼近,实现灵活的半参建模。开发了一种计算高效的嵌套混合EM算法,将Newton法与 isotonic regression 整合以联合估计回归参数和单调变换函数。为支持大样本推断,提出了回归参数的方差-协方差估计程序,并引入得分检验评估比例风险假设在变换模型族中的充分性。数值实验与现有方法的比较表明提出方法在有限样本下性能良好。最后,将方法应用于国家阿尔茨海默症协调中心数据展示实践价值。对您而言,该文的半参估计框架与您熟悉的非参统计(B样条、单调约束)及软件实现经验直接对接,得分检验部分也与假设检验兴趣相连。
- 关键技术:
monotone B-spline,nested hybrid EM algorithm,isotonic regression,score test,interval censoring,time-dependent covariates,partially linear transformation model - 为什么对您有用: 该文处理区间删失重复测量的半参模型,与您初级兴趣中纵向数据因果推断(处理时变协变量)有方法学相通性;您非常熟悉的非参统计工具(单调B样条)和软件开发经验可助您快速理解其嵌套混合EM算法的实现;该文的得分检验也与假设检验兴趣一致。结论:立即可做——您能用very_familiar的非参统计和软件开发技能直接复现或扩展其方法。
Maintained by 陈星宇 · Homepage · Source on GitHub