SMMR — Vol 34 Issue 11 · 2026-06-24¶

共 7 篇 · Statistical Methods in Medical Research
目录核对 ✅ 7 篇全部抓到（对照 OpenAlex 7 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

这一期共 7 篇论文，覆盖贝叶斯方法、生存/时间‑事件模型、半参数纵向方法以及临床试验设计等方向。主线可归纳为三条：贝叶斯框架下的异质性与信息借力（第 2、3、6 篇）、时间‑事件分析的新模型（第 2、4 篇）、以及半参数方法与动态分类的比较（第 1 篇）。其余两篇分别为双二元终点精确功效计算（第 5 篇）和分类变量插补方法比较（第 7 篇），属于实用工具类工作。

贝叶斯异质性与数据整合是本期最集中的主题。第 2 篇（Bayesian subgroup identification）将半参数混合模型用于生存数据，通过 MCMC 同时估计亚组分类和治疗效应，直接处理异质性和不确定性。第 3 篇（Bayesian clustering prior with overlapping indices）针对多源外部数据的借用作贝叶斯先验设计，利用重叠指数和 k‑means 聚类在一致性与鲁棒性间平衡，拓展了历史数据利用的框架。第 6 篇（Bayesian dose optimization with backfill）同样采用贝叶斯借力机制降低亚治疗剂量风险，兼顾毒性和疗效，并处理延迟结局。这三篇虽应用场景不同（亚组识别、外部数据整合、剂量探索），但核心都通过贝叶斯结构刻画数据异质性或信息借用。时间‑事件分析方面，第 2 篇与第 4 篇（Competing risks with two time scales）共同关注生存数据，后者处理年龄和诊断后时间两个尺度，用二维 P‑样条对 cause‑specific hazard 作非参平滑，并给出高效计算方案。第 1 篇（半参数动态分类比较）聚焦不规则稀疏曲线，比较生长曲线、变系数模型等五种方法，发现随机效应隐式整合历史信息的函数回归在动态判别上优于显式自回归方法，高度稀疏时变系数模型占优——这为纵向半参数建模提供了选择依据。

因果推断方向最直接的工作是第 2 篇（贝叶斯亚组识别）和第 1 篇（半参数动态分类，其方法也可用于因果中介的动态预测）；半参数效率方面可关注第 1 篇与第 4 篇（双时间尺度非参平滑）；高维不突出，但第 7 篇（PMM 插补）对纵向缺失数据场景有实用参考。

因果推断 (causal_inference, 1 篇)¶

1. 10.1177/09622802251367442 — A Bayesian approach towards the identification of latent subgroups¶

作者: Ethan M Alt, Peter Yi Guan, Larry Leon, Amarjot Kaur, Yue Shentu, Guoqing Diao et al.
期刊/来源: Statistical Methods in Medical Research
机构: University of North Carolina at Chapel Hill · Merck & Co., Inc., Rahway, NJ, USA (United States) · George Washington University
分类: vol 34 · issue 11 · pp 2133-2144
相关性 6/10 · novelty: new_method
摘要: 该论文旨在临床试验中利用生存时间结局识别治疗效应的异质性亚组。假设一个半参数混合模型，其中亚组特定基线风险为分段常数，亚组内治疗效应恒定，亚组归属概率由患者预后因素决定。采用贝叶斯方法进行推断，通过MCMC采样同时估计模型参数和亚组分类概率，从而自然计入分类不确定性。模拟研究和一项HIV临床试验的真实数据分析展示了该方法的实用性，相较于传统亚组分析方法能够更有效地揭示潜在的亚组结构。该方法为因果推断中治疗效应异质性的识别提供了一种灵活的贝叶斯半参数框架。对于关注因果推断中生存数据异质性分析的您，本文的建模思路和贝叶斯计算流程具有直接参考价值。
关键技术: semiparametric mixture model, proportional hazards, piecewise constant baseline hazard, Bayesian inference, subgroup identification, heterogeneity of treatment effect
为什么对您有用: 本文直接关联您的 primary interest 中因果推断的治疗效应异质性子方向，尤其针对生存时间结局。您的武器库中 'estimation theory in causal inference' 和 'nonparametric statistics' 可用于审视其模型假设的稳健性（如分段常数基线的敏感性），而 'semiparametric theory' 可尝试推导其估计量的半参效率界。立即可做：您可以用非常熟悉的非参数统计和因果推断估计理论复现其模拟并探讨偏差-方差权衡。

非参数 / 半参数 (nonparam_semipara, 1 篇)¶

1. 10.1177/09622802251374288 — A comparison of semi-parametric statistical modeling approaches to dynamic classification of irregularly and sparsely sampled curves¶

作者: Ruben Deneer, Zhuozhao Zhan, Edwin Van den Heuvel, Astrid GM van Boxtel, Arjen-Kars Boer, Natal AW van Riel et al.
期刊/来源: Statistical Methods in Medical Research
机构: Radboud University Nijmegen · Catharina Ziekenhuis · Eindhoven University of Technology · Amsterdam University Medical Centers
分类: vol 34 · issue 11 · pp 2202-2218
相关性 6/10 · novelty: application
摘要: 本文针对不规则且稀疏采样的曲线数据，研究了多种半参数统计建模方法在动态二分类问题中的性能比较。具体比较的方法包括生长曲线、条件生长曲线、变系数模型、广义功能线性模型和纵向判别分析。研究模拟数据表明，通过随机效应隐式整合历史信息的函数回归方法在动态判别能力上优于显式建模历史信息（如自回归项）的方法。在高度稀疏情况下，变系数模型和分位数回归相比函数回归更具优势。结果还显示，结果类别不平衡对历史与非历史方法的影响相似，较低的事件率降低性能。最后，将函数回归和变系数模型应用于心脏术后并发症诊断的真实临床数据，验证了实际效果。该研究对您在半参数纵向建模和动态预测方面的兴趣（特别是纵向数据的半参数方法）有直接参考价值。
关键技术: varying-coefficient model, generalized functional linear model, longitudinal discriminant analysis, growth charts, conditional growth charts, random effects
为什么对您有用: 本文直接涉及您primary interest中的“semiparametric and nonparametric theory”，具体聚焦于纵向数据动态分类的半参数建模比较。您武器库中的“非参数统计”和“semiparametric theory”（moderately_familiar）可用来理解并审视其方法优劣；后续可考虑将类似的变系数模型或函数回归框架扩展至因果推断中的纵向效应估计（如时变处理）。此篇属于应用比较类，可作为中期可做的参考：需先在“半参数理论”上巩固对函数型数据建模的理解。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1177/09622802251362642 — Imputation of incomplete ordinal and nominal data by predictive mean matching¶

作者: Peter C Austin, Stef van Buuren
期刊/来源: Statistical Methods in Medical Research
机构: University of Toronto · Sunnybrook Hospital · Sunnybrook Research Institute · Netherlands Organisation for Applied Scientific Research · Utrecht University
分类: vol 34 · issue 11 · pp 2163-2182
相关性 3/10 · novelty: application
摘要: 本文通过模拟实验系统比较了预测均值匹配（PMM）与多项/有序逻辑回归在插补非二元分类变量（名义和有序型）时的表现。设定基于链式方程的多重插补框架，分析模型为线性或逻辑回归，变化样本量（500–5000）、缺失率（5%–50%步长5%）和类别数（3–6）。核心发现是PMM在统计推断质量（偏差、覆盖、均方误差）上与参数法相当甚至更优，且计算时间节省2–6倍。该结论对不同样本量和缺失率场景稳健。文章未提出新理论，但为实践者提供了明确的替代方案——PMM可替代参数分类插补，尤其适合大规模缺失数据场景。对您而言，若在因果推断或流行病学应用中处理含缺失分类变量的纵向数据，本文的仿真证据可直接指导插补方法选择，且其计算效率优势与您软件开发的兴趣吻合。
关键技术: Predictive mean matching, Multiple imputation by chained equations (MICE), Multinomial logistic regression, Ordinal logistic regression, Simulation-based comparison
为什么对您有用: 本文属于统计计算中的缺失数据处理方法比较，直接连接到您的 secondary interest 中的流行病学以及 primary interest 中统计计算的算法评估。您武器库中 very_familiar 的『软件』项目经验可立即复现或扩展其模拟框架，例如测试不同缺失机制或分析模型。立即可做：基于您已有的 R 或 Python 模拟能力，可复现本文结果并补充高维或因果估计器（如 IPW、AIPW）对插补方法敏感性的分析。

流行病学 (epidemiology, 3 篇)¶

1. 10.1177/09622802251367439 · arXiv — Bayesian clustering prior with overlapping indices for effective use of multisource external data¶

作者: Xuetao Lu, J Jack Lee
期刊/来源: Statistical Methods in Medical Research
分类: vol 34 · issue 11 · pp 2111-2132
相关性 4/10 · novelty: new_method
摘要: 本文针对多来源外部数据在临床试验中的借用问题，提出了一种基于重叠指数的贝叶斯聚类先验方法。外部数据常存在异质性，传统的先验合成可能导致信息扭曲。方法通过引入两个重叠指数（重叠聚类指数和重叠证据指数），结合K-means聚类算法，在数据一致性和对未来数据的鲁棒性之间取得平衡，从而识别最优聚类结果。基于此框架，作者发展了贝叶斯聚类MAP先验及其鲁棒版本。模拟研究和真实数据分析表明，在存在异质性时，该方法优于常用的先验方法。该方法不需要前瞻性研究数据，可同时应用于试验设计和数据分析阶段。文章提供了一个处理多源异质性数据整合的实用框架，对流行病学中利用外部对照或历史数据的研究设计有参考价值。
关键技术: Bayesian clustering prior, overlapping clustering index, overlapping evidence index, K-means clustering, meta-analytic predictive (MAP) prior, prior synthesis
为什么对您有用: 本文属于流行病学领域中的临床试验统计方法论文，提出的贝叶斯聚类先验框架可帮助处理多来源外部数据的异质性，这在实际流行病学研究中很常见（如多中心试验或真实世界数据整合）。您的武器库中的估计理论和因果推断方法可用于评估该框架在因果设定下的性质，但核心的贝叶斯先验合成工具目前不在武器库中，因此暂不可直接应用。建议作为入门阅读，了解外部数据借用的常见问题和解决思路，为后续可能的方法扩展做铺垫。

2. 10.1177/09622802251367443 · arXiv — Competing risks models with two time scales¶

作者: Angela Carollo, Hein Putter, Paul HC Eilers, Jutta Gampe
期刊/来源: Statistical Methods in Medical Research
分类: vol 34 · issue 11 · pp 2145-2162
相关性 3/10 · novelty: new_method
摘要: 本文针对竞争风险模型中涉及两个时间尺度（如年龄和诊断后时间）的罕见情境，提出一种双变量平滑模型。方法利用二维P样条对cause-specific hazard进行非参数平滑，并通过与Poisson回归的等价性将估计转化为广义线性模型，借助广义线性数组模型（GLAM）实现高效计算。针对SEER数据中年龄诊断时的开放分组问题，采用二维惩罚复合链接模型进行数据反分组预处理。以乳腺癌死亡数据为例，区分乳腺癌死亡与其他原因死亡，展示了模型在真实流行病学数据上的应用。该方法提供了R包TwoTimeScales，便于复现。对您而言，本文属于流行病学中竞争风险分析的实用工具，与您的secondary interest in epidemiology（应用数据集与生存分析）直接相关。您熟悉的非参数统计与软件开发技能足以理解和复现其核心方法，适合作为流行病学应用的入门阅读。
关键技术: two-dimensional P-splines, generalized linear array models, penalized composite link model, cause-specific hazards, Poisson regression equivalence
为什么对您有用: 连接epidemiology子方向：竞争风险模型在癌症生存数据中的应用。您technical_arsenal中的nonparametric statistics可完全覆盖二维样条的理论理解，software development可直接用于复现或改进R包TwoTimeScales；阅读门槛低，属于立即可做的gateway reading，无需补充新工具。

3. 10.1177/09622802251368697 — Exact power and sample size in clinical trials with two co-primary binary endpoints¶

作者: Gosuke Homma, Takuma Yoshida
期刊/来源: Statistical Methods in Medical Research
机构: Astellas Pharma (Japan) · Astellas Pharma (United Kingdom) · Kagoshima University
分类: vol 34 · issue 11 · pp 2183-2201
相关性 2/10 · novelty: new_method
摘要: 本文针对临床试验中两个共同主要二元终点的情形，即要求两个终点均显著才能判定治疗有效，提出精确的功效和样本量计算方法。现有方法依赖于近似公式或蒙特卡洛积分，本文则基于二元二项分布的精确累积分布函数导出闭式表达式。该方法适用于任意统计检验（如卡方检验、Fisher精确检验），并显式考虑了终点间的相关性，从而在样本量计算中利用相关性降低所需样本量。数值模拟表明，在不同参数设定下，本文计算出的样本量对应的实际功效与目标功效非常接近。最后，文章将该方法应用于一项复发性或难治性嗜酸性肉芽肿性多血管炎的临床试验设计。对于流行病学或临床试验领域的实际应用，该方法提供了更准确的试验规划工具，可避免近似方法的偏差。
关键技术: exact power calculation, bivariate binomial distribution, co-primary binary endpoints, sample size determination, correlation between binary endpoints
为什么对您有用: 本文属于流行病学中临床试验设计的应用统计方法，与您的次要兴趣（流行病学应用）直接相关。尽管该论文未涉及因果推断或高维统计，但其对二元终点相关性的精确处理思路可以启发生存分析或多重结局场景下的合并检验问题。您的技术库中“非参数统计”和“统计计算”可帮助您快速理解该方法的数值实现，并可考虑将其推广到有序分类或多维名义终点。作为流行病学领域的入门级方法论文，值得阅读以了解临床试验设计的现代方法。

其他 (other, 1 篇)¶

1. 10.1177/09622802251374290 — A robust Bayesian dose optimization design with backfill and randomization for phase I/II clinical trials¶

作者: Yingjie Qiu, Mingyue Li
期刊/来源: Statistical Methods in Medical Research
机构: Southwestern Medical Center · The University of Texas Southwestern Medical Center
分类: vol 34 · issue 11 · pp 2219-2234
相关性 3/10 · novelty: new_method
摘要: 本文针对一期/二期临床试验的剂量优化问题，提出了一种稳健贝叶斯设计框架，允许在探索高剂量时继续入组低剂量患者（backfill策略），以收集更多安全性和活性数据。该框架不假定剂量-反应曲线的参数形式，而是通过跨剂量层级借力信息（robust borrowing），降低亚治疗剂量给药风险。设计同时评估毒性和疗效，并处理延迟结局带来的决策不确定性。模拟研究表明，相比传统设计，新方法能提升最优剂量选择的准确性，改善患者安全性，减少接受亚治疗剂量的人数，并缩短试验周期。对您而言，本文虽不直接对应主要兴趣，但其贝叶斯借力机制在流行病学中的剂量-反应因果推断或临床试验优化中有参考价值，可作为了解临床试验设计前沿的入门材料。
关键技术: Bayesian dose optimization, robust borrowing, joint toxicity-efficacy modeling, backfill cohorts, delayed outcomes handling, Phase I/II design
为什么对您有用: 本文属于流行病学中临床试验设计领域，与您的次要兴趣流行病学（应用、数据集、因果推断）相关。虽然您当前武器库中缺乏贝叶斯计算工具（不属于very_familiar或moderately_familiar），但本文的非参数借力思路可迁移到因果推断中的剂量-反应建模，例如利用cross-fitting或borrowing思想处理多剂量比较。由于贝叶斯框架不在您的核心技术上，短期内直接复现或扩展该方法挑战较大，但可作为流行病学方向的参考读物，帮助您理解临床剂量优化中统计设计的实际需求。

Maintained by 陈星宇 · Homepage · Source on GitHub