StatMed — Vol 45 Issue 10-12 · 2026-06-24¶

共 21 篇 · Statistics in Medicine

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期内容围绕生存分析与复合终点、因果推断与试验设计、以及高维数据建模三条主线展开。生存分析方向集中探讨了非比例风险设定下的效应度量与检验，涉及 Win Ratio、RMST 及 Win Odds 等指标的性质比较、协变量调整及加权推断。因果推断方向则覆盖了从识别策略（竞争事件、调查权重）到动态治疗策略（SMART 设计）的全链条，并延伸至纵向数据中的依从性与携带效应问题。高维建模方向主要关注潜在变量模型中的降维、变量选择及多源数据整合，工具上多依赖贝叶斯框架与正则化方法。

生存分析与复合终点主线在本期分量颇重，核心在于突破比例风险假设的限制。针对非比例风险场景，Win Ratio as an Effect Size Measure 系统比较了 Win Ratio 与 RMST 对早期或晚期治疗效益的敏感度差异，并提供了非参数推断方法；Predicting Win‐Loss Probabilities 则在比例胜率模型下通过耦合生存模型实现了胜率的动态预测。在推断效率上，协变量调整是本期另一焦点：Covariate Adjustment for the Win Odds 利用影响函数构建了半参数有效估计量，Improving Power of the Win Ratio 提出了基于协变量距离的加权方案，二者均旨在通过利用基线信息提升检验功效。此外，Sequential Multiple Assignment Randomized Trials Based on RMST 将 SMART 设计中的生存效应度量转向 RMST，避开了比例风险假设，进一步完善了该场景下的工具箱。

因果推断主线在识别策略与试验设计上均有推进。在识别层面，Illustrating Implications of Misaligned Causal Questions 深入剖析了竞争事件场景下受控直接效应与可分离直接效应的异质性，指出了传统删失方法的局限；Moving Toward Best Practice 则聚焦复杂抽样调查，提出了结合调查权重的倾向分数加权估计量及其方差估计。在试验设计层面，SMART 设计是本期亮点：A Novel Group Sequential Design 引入序贯筛选机制以优化自适应治疗策略的早期决策，Sequential Multiple Assignment Randomized Trials Based on RMST 则补充了生存结局下的中期分析方法。针对纵向与复杂暴露，A Latent‐factor MCACE Model 利用因子模型解决了多维结局下的依从性问题，Penalized GEE for Complex Carry‐Over 则通过惩罚 GEE 实现了交叉设计中复杂携带效应的识别。

对于关注因果推断与半参数效率的研究者，建议优先阅读 Covariate Adjustment for the Win Odds（半参数效率理论应用）与 Illustrating Implications of Misaligned Causal Questions（因果识别与竞争风险）。对于高维与机器学习方向，Variable Selection in Mixed‐Effects Models（高维正则化）与 Robust Heterogeneity Adjustment for Gaussian Graphical Model（图模型与异质性）提供了具体的计算工具。

因果推断 (causal_inference, 8 篇)¶

1. 10.1002/sim.70535 · arXiv — Illustrating Implications of Misaligned Causal Questions and Statistics in Settings With Competing Events and Interest in Treatment Mechanisms¶

作者: Takuya Kawahara, Sean McGrath, Jessica G. Young
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 10-12
相关性 8/10 · novelty: application
摘要: 在存在竞争事件的生存分析中，研究者常关注不捕捉竞争事件影响的治疗直接效应。传统方法将竞争事件视为删失，识别的是受控直接效应（controlled direct effect），其隐含假设为竞争事件被消除这一临床不现实的场景。本文引入可分离直接效应（separable direct effect）作为更贴合实际因果问题的替代概念，并通过模拟和实证数据系统比较两者的差异。模拟显示，两类直接效应可能取值不同甚至符号相反，且受各自识别条件（如无未测量混杂、可分离性假设）违背的影响程度也不对称。实证部分利用雌激素治疗与前列腺癌死亡率的随机试验数据，对比了逆概率删失加权估计量与专门针对可分离直接效应构建的加权估计量的表现。该工作为竞争事件下直接效应估计的选择提供了直观指导，尤其适用于流行病学中药物安全性评价或机制研究的因果推断实践。
关键技术: competing events, controlled direct effect, separable direct effect, inverse probability of censoring weighting, weighted estimators
为什么对您有用: （1）直接连接研究者secondary interests中的流行病学应用因果推断，特别是竞争事件下的直接效应识别与估计问题。（2）研究者很熟悉的identification theory in causal inference可直接用于分析可分离直接效应的识别条件及其与受控直接效应的偏差来源。（3）立即可做：研究者无需新工具即可理解本文的比较框架，并可进一步探索在实际队列中将该思路扩展到更复杂的纵向设定或敏感性分析。

2. 10.1002/sim.70555 · arXiv — Moving Toward Best Practice When Using Propensity Score Weighting in Survey Observational Studies¶

作者: Yukang Zeng, Fan Li, Guangyu Tong
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 10-12
相关性 8/10 · novelty: new_method
摘要: 在复杂抽样调查观测数据的设定下，本文研究如何在倾向分数加权中正确纳入调查权重以进行总体层面因果推断，目标是 ATE 及其变体（如 treated/controlled/overlap population 的 treatment effects）。作者在 balancing weights 框架下提出了一套统一的加权估计量和 augmented weighting 估计量（类似 AIPW），覆盖四种目标总体。理论上利用 M-estimation 理论推导了闭式 sandwich 方差估计量，保证了估计量的渐近正态性和方差估计的一致性。通过大规模模拟和两个真实数据分析，比较了所提方法与现有替代方法的有限样本表现。对您在因果推断的 identification 与 estimation 理论方向有直接参考价值，尤其是 survey setting 下的总体推断问题。
关键技术: propensity score weighting, survey weights integration, balancing weights framework, augmented weighting estimator, M-estimation sandwich variance, complex survey data
为什么对您有用: 直接连接因果推断中的加权估计与复杂抽样设计，涉及 identification（目标总体定义）和 estimation（方差估计）两个核心环节。您熟悉的 M-estimation theory（moderately_familiar）可直接用于验证其 sandwich variance 推导，estimation theory in causal inference（very_familiar）足以评估其估计量性质。立即可做：用 very_familiar 的因果推断估计理论审视其框架，或将其作为 survey-weighted causal inference 的入门文献。

3. 10.1002/sim.70532 — A Latent‐factor MCACE Model for Multidimensional Outcomes and Treatment Noncompliance with Application to a Longitudinal Trial of Arthritis Health Journal¶

作者: Lulu Guo, Yi Qian, Diane Lacaille, Hui Xie
期刊/来源: Statistics in Medicine
机构: Dana-Farber Cancer Institute · University of British Columbia · Research Canada · Arthritis Research Centre of Canada · Simon Fraser University
分类: vol 45 · issue 10-12
相关性 7/10 · novelty: new_method
摘要: 该论文针对具有非依从性的纵向随机对照试验（RCT）中的多维结局，提出了一种潜在因子多变量依从者平均因果效应（MCACE）模型。研究问题是在干预组中部分受试者未依从治疗时，如何高效估计干预对多个结局的因果效应。方法核心是结合主分层框架和因子回归模型：在每个依从类型（complier/noncomplier）内，用潜在因子将高维结局降维到少数潜变量，并建立分层回归。这一降维不仅缓解了多重检验问题，还通过减少参数数量改善了低依从率下的弱工具变量问题。模拟结果表明所提模型在统计功效和I类错误控制上均优于传统的单变量CACE分析。实证应用（关节炎健康杂志试验）识别出两个关键因子（自我效能和与医疗提供者互动），并发现干预对两者均有显著有益效果。该工作与您感兴趣的纵向因果推断、工具变量和主分层方向紧密相关，且其降维思路可与您熟悉的非参数方法结合。
关键技术: principal stratification, complier average causal effects (CACE), latent factor regression model, dimension reduction for multiple outcomes, longitudinal RCT with noncompliance
为什么对您有用: （1）直接连接因果推断中的非依从性与主分层子方向，并处理纵向多维结局——这是您核心兴趣之一。（2）您的武器库中“因果推断中的估计理论”可用于分析该参数因子模型的渐近性质（如因子个数选择、CACE估计的收敛速率），而“识别理论”可用于评价潜在因子假设对CACE识别的充分性。（3）粗判：立即可做——该方法使用的因子模型和分层回归对您来说没有超出武器库的障碍，您可以快速复现模拟或尝试半参数化扩展（如用非参数因子替换参数因子）。

4. 10.1002/sim.70559 — A Bayesian Causal Model for Matrix‐Valued Exposures With Applications to Radiotherapy Planning¶

作者: Zijin Liu, Zhihui (Amy) Liu, Jennifer Dang, Charles Catton, Himanshu R. Lukka, Peter Chung et al.
期刊/来源: Statistics in Medicine
机构: University Health Network · University of Toronto · Princess Margaret Cancer Centre · Public Health Ontario · Juravinski Cancer Centre
分类: vol 45 · issue 10-12
相关性 7/10 · novelty: application
摘要: 本文针对放疗计划中矩阵型暴露（剂量体积直方图DVH）与毒性结局之间的因果效应估计问题，提出贝叶斯三成分联合模型。由于DVH数据高维且高度相关，传统因果模型难以直接应用。模型采用多线性主成分分析（MPCA）进行降维，相比传统PCA更有效地提取矩阵信息。估计使用Hamiltonian Monte Carlo算法。通过模拟研究展示了模型在估计平均因果效应上的表现，并可将剂量效应映射回原始DVH矩阵以解释结果。对您的启示：本文为高维矩阵型暴露的因果推断提供了贝叶斯框架，可连接流行病学应用中处理复杂暴露数据的实际需求。
关键技术: Bayesian causal model, multilinear principal component analysis (MPCA), Hamiltonian Monte Carlo, matrix-valued exposures, dimension reduction
为什么对您有用: 本文直接对应您的主要兴趣——因果推断，尤其针对高维、矩阵型暴露的因果效应估计，这是传统因果方法较少涉及的场景。您的武器库中的'高维渐近'和'估计理论'可用于分析MPCA降维后的估计性质；但贝叶斯建模和MPCA本身并非您熟悉的技术，因此属于'中期可做'：需要先在 moderately_familiar 的'M-估计理论'上熟悉贝叶斯推断的渐近性质，或学习矩阵分解理论。此外，本文属于流行病学应用（放疗毒性），可作为进入该领域的入门阅读。

5. 10.1002/sim.70561 · arXiv — Penalized GEE for Complex Carry‐Over in Repeated‐Measures Crossover Designs¶

作者: Nelson Alirio Cruz, Oscar Orlando Melo, Kalliopi Mylona
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 10-12
相关性 6/10 · novelty: new_method
摘要: 本文针对交叉设计中反复出现的复杂携带效应问题，提出了惩罚半参数广义估计方程（GEE）方法。首先推导了复杂携带效应（随处理顺序和交互作用变化）的可识别性条件，这是以往文献中缺失的。随后给出了理论保证：在扩展sandwich方差公式的基础上，证明了惩罚估计量的函数分量具有渐近正态性，并将微不足道的携带效应向零压缩，从而在实践中识别出重要效应。仿真和真实数据分析显示，当存在复杂携带效应时，该方法比忽略或假设简单携带效应的模型具有更好的估计精度。该工作是对重复测量交叉设计中复杂携带效应建模的首个一般化方法。对您而言，交叉设计是因果推断中重要的纵向试验设计，而GEE与惩罚估计的结合为处理序列效应提供了新工具，直接关联您对纵向因果推断的既有兴趣。
关键技术: penalized GEE, sandwich variance estimator, semiparametric estimation, carry-over effect identification, cross-fitting (implied by GEE)
为什么对您有用: (1) 交叉设计是因果推断中常用的纵向试验设计，携带效应识别直接影响ATE的估计质量，与您'causal inference (longitudinal)'兴趣点直接对应。 (2) 武器库中'estimation theory in causal inference'和'非参数统计'可用来审视其惩罚半参数框架的识别条件是否可移植到proximal CI等更复杂的设定中。 (3) 中期可做：若想延伸该框架至存在unmeasured confounding的交叉设计，需要先在'moderately_familiar'的identification theory in causal inference上更深入（如negative control或proximal假设的扩展）。

6. 10.1002/sim.70564 — A Novel Group Sequential Design for Sequential Multiple Assignment Randomized Trial¶

作者: Xueqing Liang, Shijie Yu, Minggang Yin, Siyu Zhu, Yixin Luo, Yuxuan Yang et al.
期刊/来源: Statistics in Medicine
机构: Southern Medical University
分类: vol 45 · issue 10-12
相关性 6/10 · novelty: new_method
摘要: 在序贯多分配随机试验（SMART）框架下，本文提出一种新的组序贯设计，旨在高效识别最优自适应治疗策略（ATS）子集，同时允许在中期分析中早期终止疗效较差的治疗臂。现有SMART的中期分析多依赖全局检验，无法在识别最优子集的同时进行无效策略的提前停止。新设计通过引入alpha spending函数和多重比较调整，在控制族系I类错误的前提下，允许对多个ATS进行序贯筛选。模拟研究表明，所提设计在保持检验效能的同时显著降低了所需样本量，并提高了正确选择最优ATS的概率。该方法连接了因果推断中的动态治疗策略优化与临床试验的序贯监测，为实际多阶段随机试验提供了操作性工具。对您而言，本文可作为因果推断在纵向试验设计中应用的一个具体案例，尤其适用于流行病学或临床实践中动态方案评估的场景。
关键技术: group sequential design, sequential multiple assignment randomized trial (SMART), adaptive treatment strategies (ATS), interim analysis, alpha spending function, multiple testing adjustment
为什么对您有用: 本文聚焦于SMART中的最优ATS选择，直接对应您因果推断兴趣中动态治疗策略（longitudinal/dynamic treatment regimes）的子方向。您可以利用技术武器库中‘estimation theory in causal inference’中关于策略价值函数估计的效率理论，分析该设计下ATS估计量的渐近性质或提出去偏估计。但当前状态为暂不可做，因为组序贯检验的核心工具（alpha spending函数、边界计算）不在您的武器库中，需先补充序贯分析文献。不过，作为应用方向的知识储备，本文值得阅读以理解临床试验中的实践需求。

7. 10.1002/sim.70563 — Sequential Multiple Assignment Randomized Trials Based on Restricted Mean Survival Time¶

作者: Jianhong Pan, Shijie Yu, Minggang Yin, Yuxuan Yang, Chongyang Duan
期刊/来源: Statistics in Medicine
机构: National Medical Products Administration · Southern Medical University
分类: vol 45 · issue 10-12
相关性 6/10 · novelty: new_method
摘要: 在 SMART 设计框架下，目标是估计自适应治疗策略（ATS）的受限平均生存时间（RMST），无需比例风险假设。作者提出了固定权重与动态权重的 RMST 估计量，推导了其方差-协方差结构，并构建了 ATS 之间两两比较与全局检验的置信区间和假设检验方法。进一步将 interim analysis 整合进 SMART 设计，针对生存数据缺乏 independent-increment property 的情况，发展了 I 类错误控制方法。模拟显示估计量表现良好，interim 设计可减少样本量或试验时长。对您在 longitudinal causal inference 与假设检验方向有直接参考价值。
关键技术: SMART design, restricted mean survival time (RMST), adaptive treatment strategies, interim analysis, type I error control, weighted estimator
为什么对您有用: 本文直接连接到您 primary interest 中的 longitudinal causal inference（SMART 是典型的 longitudinal adaptive intervention 设计）与 hypothesis testing（多重比较与 interim analysis 的错误控制）。您武器库中的 identification theory in causal inference 与 semiparametric theory 可用于审视其估计量的 identification 条件与效率性质——例如，动态权重 RMST 估计量是否达到 semiparametric efficiency bound，或是否存在更优的 one-step / TMLE 类构造。属于立即可做：用 very_familiar 的 estimation theory in causal inference 即可评估其估计量性质，或用 moderately_familiar 的 semiparametric theory 探索效率改进空间。

8. 10.1002/sim.70569 — Predicting Win‐Loss Probabilities for Composite Time‐to‐Event Outcomes Under The Proportional Win‐Fractions Regression Model¶

作者: Lu Mao
期刊/来源: Statistics in Medicine
机构: University of Wisconsin–Madison
分类: vol 45 · issue 10-12
相关性 4/10 · novelty: new_method
摘要: 在复合时间-事件结局的 win ratio 分析框架下，目标是预测任意给定协变量配对在时间 t 的 win/loss/tie 概率，核心 estimand 是时间依赖的绝对 win-loss probability。作者将 proportional win-fractions (PW) 模型与 time-to-first-event 模型（如 Cox）耦合，前者刻画 win ratio，后者推断 tie probability，从而在绝对尺度上重建 win/loss 概率。估计量基于 plug-in 原理，通过两个子模型的参数估计组合而成；方差估计采用 robust sandwich variance，并提供了 residual-based diagnostics 用于检验 PW 模型的比例性假设。模拟与 HF-ACTION 试验数据分析表明，当模型假设近似成立时预测准确，但比例性违反会导致偏差；绝对概率随 biomarker 增加呈现边际递减模式，尽管 win ratio 恒定。对您而言，这是 longitudinal/生存分析背景下因果效应量化方法的一个具体应用，展示了如何从相对效应延伸到绝对概率预测。
关键技术: proportional win-fractions model, win ratio for composite endpoints, plug-in estimation, robust sandwich variance, residual-based model diagnostics, Cox model coupling
为什么对您有用: 本文连接到因果推断中 longitudinal/生存分析背景下的效应量化问题，展示了如何从相对效应（win ratio）延伸到绝对概率预测。从技术武器库看，本文的核心是参数模型耦合与 plug-in 估计，属于 very_familiar 的 estimation theory 范畴；但 PW 模型本身是较专门的生存分析工具。Follow-up 判断：中期可做——若想深入，需在 moderately_familiar 的 semiparametric theory 上补充 PW 模型的效率理论研究（如 semiparametric efficiency bound 是否可达），或探索更灵活的非参数/机器学习方法来放松比例性假设。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶

1. 10.1002/sim.70553 — Variable Selection in Mixed‐Effects Location‐Scale and Location‐Shift Models¶

作者: Moritz Berger, Maria Iannario
期刊/来源: Statistics in Medicine
机构: Heidelberg University · University Hospital Heidelberg · Central Institute of Mental Health · Federico II University Hospital · University of Naples Federico II
分类: vol 45 · issue 10-12
相关性 4/10 · novelty: application
摘要: 本文针对有序响应（Likert量表）数据的混合效应位置-尺度模型和位置-移位模型，提出了一种变量选择方法。模型同时考虑了均值（位置）、变异（尺度）和聚类随机效应，以刻画响应中由子群体导致的异方差性和聚类内相关性。为降低模型复杂度，作者采用自适应融合LASSO型正则化对模型各部分（位置、尺度、随机效应）的系数进行同时选择。通过SHARE（欧洲健康、老龄与退休调查）数据案例和模拟研究验证了该方法在产生稳定参数估计和可解释结果方面的有效性。该方法本质上是一种高维正则化变量选择技术在广义线性混合模型上的扩展，适用于具有复杂方差结构的纵向或聚类有序数据。对您而言，该文涉及的高维变量选择正则化方法与您的高维统计兴趣直接相关，其中的自适应融合LASSO可视为统计计算中一款可复现的算法实现。
关键技术: adaptive fused LASSO, location-scale model, cumulative logit model for ordinal responses, mixed-effects model regularization, variable selection in high-dimensional GLMM
为什么对您有用: 本文直接关联到您的高维统计（正则化变量选择）兴趣方向，您对其中的high-dimensional asymptotics和软件实现（very_familiar）已经足够熟练，因此可以立即可做：尝试将该自适应融合LASSO框架移植到因果推断中的高维协变量筛选或工具变量选择场景，以处理具有聚类结构的纵向数据。此外，文中正则化方法在混合效应模型上的实现细节也值得作为统计计算领域的参照。

非参数 / 半参数 (nonparam_semipara, 1 篇)¶

1. 10.1002/sim.70554 — Win Ratio as an Effect Size Measure Under Non‐Proportional Hazards: A Comparison With Difference in Restricted Mean Survival¶

作者: Yuan Wu, Xiaofei Wang, Zhiguo Li
期刊/来源: Statistics in Medicine
机构: Duke University
分类: vol 45 · issue 10-12
相关性 5/10 · novelty: new_method
摘要: 本文在非比例风险假设下，比较了win ratio与限制平均生存时间差（RMST）作为单生存结局的效应量度量。win ratio最初用于优先多重结局，此处被重新用作单结局的效应量。作者基于非参数最大似然估计（NPMLE）和样条筛MLE的plug-in估计，通过bootstrap对右删失和区间删失数据实施win ratio的推断。还引入了分层win ratio以控制混杂。模拟发现，win ratio对早期治疗效益更敏感，RMST更敏感于晚期效应，而分层win ratio在混杂存在时维持名义I类错误。最后用多发性骨髓瘤的无进展生存期数据演示。该文为流行病学中的生存分析提供了实用的效应量选择指导。
关键技术: bootstrap inference, nonparametric maximum likelihood estimator, sieve maximum likelihood estimator, win ratio, restricted mean survival time, interval censoring
为什么对您有用: 该文属于流行病学应用方向（secondary interest），为非比例风险生存数据提供了可替换的效应量度量与推断策略。研究者'very_familiar'中的非参数统计和软件技能可直接用于理解或复现其中的NPMLE和bootstrap流程。虽非理论突破，但作为流行病学应用实例值得通读。

数理统计 / 假设检验 (hypothesis_testing, 4 篇)¶

1. 10.1002/sim.70602 · arXiv — Covariate Adjustment for the Win Odds: Application to Cardiovascular Outcomes Trials¶

作者: Cyrill Scheidegger, Simon Wandel, Tobias Mütze
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 10-12
相关性 7/10 · novelty: new_method
摘要: 本文研究临床试验中 win odds 这一处理效应估计量的协变量调整方法，目标是在保持 type I error 控制的前提下提升检验功效。作者建立 win odds 与 marginal probabilistic index 之间的理论联系，后者已有成熟的协变量调整理论，从而将 semiparametric efficiency 理论迁移至 win odds 场景。核心估计量采用 influence function 方法构造，理论分析表明在预后性协变量条件下可提升估计精度与检验功效，但小样本下存在轻微的 type I error 膨胀。实证部分基于 CANTOS 和 HF-ACTION 试验数据的模拟研究验证了方法的有效性。对您在假设检验与效率理论方向有一定参考价值。
关键技术: win odds estimation, marginal probabilistic index, covariate adjustment, influence function, semiparametric efficiency, pairwise comparison
为什么对您有用: 本文连接到您 primary interest 中的效率理论与假设检验，展示了如何将 semiparametric efficiency 理论迁移至一个非标准估计量（win odds）。技术上，您可以用 very_familiar 的 minimax bounds 和 estimation theory 工具分析该估计量的效率性质，或用 moderately_familiar 的 semiparametric theory 审视其 influence function 构造是否达到 efficiency bound。Follow-up 判定：立即可做——武器库完全覆盖，可直接审视其理论推导或拓展至其他 pairwise comparison 估计量。

2. 10.1002/sim.70577 — Adaptive Designs in Trials With Time‐to‐Event Endpoints and Covariate Adjustment¶

作者: Daniel Backenroth, Ting Ye
期刊/来源: Statistics in Medicine
机构: Johnson & Johnson (United States) · University of Washington
分类: vol 45 · issue 10-12
相关性 7/10 · novelty: application
摘要: 本文研究 time-to-event 临床试验中结合 covariate-adjusted log-rank test 的自适应设计，目标是解决设计阶段效率增益估计与实际增益不一致的实际难题。核心 estimand 是 treatment effect on survival，在 proportional hazards 及协变量 prognostic 假设下，比较 information-based interim monitoring 与 blinded event target adjustment (BETA) 两种策略。方法上利用 covariate-adjusted log-rank test 的方差缩减性质，通过 interim 时点的方差估计来调整最终分析时机或样本量，涉及 repeated testing 的 type I error 控制与 operational trade-off。模拟发现回归系数随随访时间增加，导致方差缩减潜力被 BETA 低估；information-based 方法在强 prognostic 协变量下可加速试验但操作负担重。对您而言，这是假设检验与试验设计交叉的应用工作，novelty 在方法整合而非新理论。
关键技术: covariate-adjusted log-rank test, information-based interim monitoring, blinded event target adjustment (BETA), variance reduction via covariate adjustment, repeated testing with type I error control, time-to-event clinical trial design
为什么对您有用: 本文连接到 hypothesis testing 在临床试验的具体应用场景，涉及 repeated testing 与效率-操作 trade-off。从 technical_arsenal 角度，您 very_familiar 的 minimax bounds 与 estimation theory 对评估文中声称的 efficiency gain 是否紧可能有帮助，但核心是试验操作层面而非数学统计深度。follow-up 判断：暂不可做——这是面向 FDA/EMA 监管框架的应用方法学，核心机器（adaptive design 操作细节、监管约束）不在武器库内，且数学统计创新有限。

3. 10.1002/sim.70562 — Improving Power of the Win Ratio Analysis through Distance‐based Weights¶

作者: Md Rejuan Haque, Madison Hyer, Lai Wei, Xueliang Pan, Guy Brock
期刊/来源: Statistics in Medicine
机构: The Ohio State University Wexner Medical Center
分类: vol 45 · issue 10-12
相关性 4/10 · novelty: new_method
摘要: 在临床试验复合终点的分析框架下，目标是提升 win ratio 检验的统计功效。本文提出一种基于协变量距离的加权方法：对每对比较的 win/loss 赋予权重，权重由两样本协变量向量的距离决定，核心思想是利用协变量与结局的关联性来增强信号。估计量仍为加权 win ratio，作者通过大量模拟和真实数据分析验证方法性能。结果显示：当协变量与结局相关时，加权方法功效显著提升；无关联时退化为原始 win ratio 的表现。对您在假设检验功效优化方面的兴趣有参考价值。
关键技术: win ratio method, distance-based weighting, composite endpoint analysis, covariate adjustment, power improvement
为什么对您有用: 本文涉及假设检验功效优化，属于您 primary interest 中 hypothesis testing 的范畴。技术层面主要依赖距离度量和加权估计，您武器库中 very_familiar 的 nonparametric statistics 和 estimation theory 足以理解并批判性审视该方法。follow-up 判断：立即可做——可用 minimax bounds 视角分析该加权策略的理论最优性，或用 higher-order U-statistics 理论刻画其渐近分布的高阶修正项。

4. 10.1002/sim.70557 — A Unified Framework for Statistical Inference and Power Analysis of Single and Comparative Fβ Scores¶

作者: Chih‐Yuan Hsu, Qi Liu, Yu Shyr
期刊/来源: Statistics in Medicine
机构: Vanderbilt University Medical Center
分类: vol 45 · issue 10-12
相关性 2/10 · novelty: new_method
摘要: 针对机器学习模型性能评估广泛使用的 Fβ 分数及其比较缺乏严格统计推断的问题，本文提出了 psF1 统一框架。该框架基于 Fβ 分数的精确概率分布推导，同时提供大样本近似以处理较大样本量，实现了区间估计、假设检验以及功效和样本量计算。通过大量模拟验证了框架在不同灵敏度、精确度和样本量场景下的准确性与稳健性，并在实际生物医学分类任务中展示了实用性。关键工具包括对 Fβ 分数分布的精确刻画、正态近似以及 Monte Carlo 验证。本文为分类器评估提供了可靠的 uncertainty quantification 和样本量规划工具，对假设检验的应用方向有直接借鉴意义。
关键技术: exact probability distribution, large-sample approximation, hypothesis testing for Fβ score, power analysis, confidence interval estimation, Monte Carlo simulation
为什么对您有用: 本文直接涉及 hypothesis testing 在分类器性能评价中的具体应用，其提供的精确分布推断和功效分析方法可与研究者熟悉的 high-dimensional asymptotics 和软件发展能力结合，用于扩展至其他复合性能指标或改进计算效率。由于研究者具备非参数统计和软件开发背景，理解并复现该框架（或在其基础上增加更灵活的近似方法）属于立即可做的工作。

流行病学 (epidemiology, 6 篇)¶

1. 10.1002/sim.70525 · arXiv — Test‐Negative Designs With Multiple Testing Sources¶

作者: Mengxin Yu, Nicholas P. Jewell
期刊/来源: Statistics in Medicine
分类: vol 45 · issue 10-12
相关性 7/10 · novelty: application
摘要: 本文研究测试阴性设计（TND）在评估疫苗效力时面临的多来源测试问题。传统 TND 仅纳入有症状者测试，但实际中（如 COVID-19 和埃博拉）测试结果可能来自接触者追踪等无症状来源，直接聚合样本会导致偏倚。作者以埃博拉疫苗试验为背景，提出一种简单方法，利用有症状者和接触者追踪两种测试来源的数据，共同估计疫苗效力（假设效力相同），并检验同质性假设。方法基于似然框架，结合两组测试-阳性和测试-阴性数据，给出共同效力的估计量及同质性检验。模拟或试验数据显示该方法在偏倚控制上优于聚合分析。本文对流行病学中的观察性疫苗效力研究具有方法学参考价值，尤其适合研究者关注流行病学数据集和因果推断的 secondary interest。
关键技术: test-negative design, multiple testing sources, vaccine efficacy estimation, likelihood-based estimation, homogeneity test
为什么对您有用: 本文直接涉及流行病学中的观察性因果推断（TND 是评估疫苗效力的常见设计），与您的 secondary interest 'epidemiology (application, data sets, causal inference)' 高度吻合。您很熟悉的 'estimation theory in causal inference' 可用于理解该估计量的偏差-方差性质，且 'identification theory in causal inference' 能帮助厘清假设（如同质性）是否可检验。这是一篇应用型方法论文，立即可读，可作为流行病学因果推断方法的补充读物。

2. 10.1002/sim.70571 — Robust Heterogeneity Adjustment for Gaussian Graphical Model With Latent Variables¶

作者: Linxi Li, Rong Li, Shuangge Ma, Qingzhao Zhang
期刊/来源: Statistics in Medicine
机构: Xiamen University · Xiamen University of Technology · Renmin University of China · Connecticut Department of Public Health
分类: vol 45 · issue 10-12
相关性 6/10 · novelty: application
摘要: 本文针对潜变量高斯图模型在生物数据应用中面临的两大挑战——未观测亚群异质性（如肿瘤亚型、细胞聚类）和异常值——提出了稳健性扩展方法。方法将混合模型集成到潜变量GGM框架中，同步实现网络结构估计（去除潜变量共享效应后）、异常值检测和子群识别。算法基于EM框架，在模拟实验和乳腺癌数据中均表现出对高比例异常值的稳健性。该方法为流行病学数据分析中处理异质性和隐藏结构提供了实用工具。对您而言，图模型估计与条件独立结构学习是因果推断中网络分析的基础，该工作可启发异质性流行病学队列中的因果结构学习。
关键技术: latent variable Gaussian graphical model, mixture model, outlier detection, EM algorithm, robust estimation
为什么对您有用: 本文直接关联到 secondary interest 中的流行病学应用——异质性调整的图模型可用于分析流行病学队列数据中的未观测亚群结构。研究者可用非常熟悉的 high-dimensional asymptotics 分析该方法的相合性和估计速率，或用软件开发能力复现/扩展其算法。立即可做：基于现有武器库即可着手进行方法验证或扩展。

3. 10.1002/sim.70566 — Delayed Exposures and Pre‐Exposure Periods in Self‐Controlled Case Series Studies¶

作者: Heather Whitaker, Yonas Ghebremichael Weldeselassie, Paddy Farrington
期刊/来源: Statistics in Medicine
机构: National Security Agency · The Open University · University of Warwick
分类: vol 45 · issue 10-12
相关性 5/10 · novelty: application
摘要: 该论文聚焦于自控病例系列（SCCS）方法中一个关键假设的违背问题：SCCS通常要求暴露不应依赖于事件发生，但在疫苗安全性监测等场景中，暴露（如疫苗接种）常因不良事件而延迟，导致估计偏误。作者系统评估了在SCCS模型中引入暴露前窗口（pre-exposure period）作为调整手段的效果。在简化的参数化设定下，他们推导了相对发病率估计的显式偏差表达式，揭示了暴露延迟方向、窗口长度与估计偏误之间的解析关系。通过广泛模拟，进一步验证了该调整在更真实场景（如不同事件率、暴露延迟机制）下的表现。基于理论分析和模拟结果，作者给出了实用的敏感性分析建议：若延迟暴露仍在观察期内结束，通常无需调整；若暴露被推至观察期终点之后，则需纳入暴露前窗口；极端情况下应改用事件依赖暴露的SCCS模型而非标准版本。三个实际疫苗安全性例子（麻疹腮腺炎风疹疫苗与特发性血小板减少性紫癜、轮状病毒疫苗与肠套叠等）演示了这些建议的操作流程。对您而言，本文提供了一个流行病学中因果推断方法的经典应用案例——SCCS本身是病例交叉设计的变体，其暴露延迟问题与纵向因果推断中的time-varying confounding和treatment switching具有内在联系，可作为您理解真实流行病学数据分析流程的入门读物。
关键技术: self-controlled case series (SCCS), pre-exposure window adjustment, event-dependent exposure model, sensitivity analysis for delayed exposures, simulation-based bias assessment
为什么对您有用: 本文属于流行病学领域的因果推断应用，与您的次要兴趣（流行病学：应用、数据集、因果推断应用）直接匹配。SCCS方法本质上是条件泊松回归，其暴露延迟问题可映射到您非常熟悉的因果推断中的识别与敏感性分析框架，尤其是纵向设定下“暴露依赖事件”的反事实建模。从武器库看：您对非参数统计和估计理论的掌握足以理解SCCS的假设和偏差结构，但SCCS特有的“个体自身对照”设计及其与条件似然的关系需要额外学习。值得花时间读全文——本文提供了一个低门槛的流行病学方法案例，能帮助您快速进入流行病学数据分析的思维习惯，且实际例子中的数据结构（事件时间、暴露窗口）可直接迁移至您关注的疫苗安全性等应用场景。

4. 10.1002/sim.70568 — A Modified Normalized Power Prior Approach for Bayesian Adaptive Borrowing in Item Response Theory Models¶

作者: Qiang Zhang, Wei Xiong, Min Wang, Keying Ye, Zifei Han
期刊/来源: Statistics in Medicine
机构: Central University of Finance and Economics · University of International Business and Economics · The University of Texas at San Antonio
分类: vol 45 · issue 10-12
相关性 4/10 · novelty: new_method
摘要: 在项目反应理论（IRT）模型中，针对小样本和主观响应不稳定带来的估计不确定性，提出一种基于近似标准化幂先验（NPP）的贝叶斯自适应历史数据借用方法。该方法将借用权重视为随机参数，通过全贝叶斯数据扩充策略联合估计能力参数与项目参数，并利用Gibbs采样高效实现。当历史数据与当前数据一致时自动增强借用，冲突时自动降权，相比无借用方法有效降低方差与均方误差，且覆盖率稳定。模拟实验覆盖不同测验长度、项目区分度及历史-当前一致性场景，结果稳健。应用于心理健康调查数据，获得更精确的能力估计且量表校准不变。方法已集成至R包NPP中公开发布。该工作为流行病学潜在变量建模提供了可复用的计算框架，您的software development工具可直接用于评估或扩展该包。
关键技术: Normalized Power Prior, Bayesian adaptive borrowing, Item Response Theory, Gibbs sampling, Full Bayesian data augmentation, R package NPP
为什么对您有用: 本文是流行病学（心理健康测量）的应用论文，对统计局外人相对友好：清晰交代了IRT模型结构和自适应借用的贝叶斯机制。您用software development这一very_familiar技能，可以直接审视其R包实现效率，或将其Gibbs采样框架移植到因果推断中的borrowing问题（如proximal CI需要整合历史对照组）。作为入门读物，值得花时间通读全文，尤其关注其数据扩充策略和R包设计。

5. 10.1002/sim.70547 — Defining Utility as a Measure of Preference Under Uncertainty in Phase I– II Oncology Dose Finding Trials¶

作者: Andrew Hall, Duncan Wilson, Stuart Barber, Sarah R. Brown
期刊/来源: Statistics in Medicine
机构: University of Leeds · Leeds Trinity University
分类: vol 45 · issue 10-12
相关性 3/10 · novelty: new_method
摘要: 该论文聚焦于肿瘤剂量发现试验中寻找最优剂量的决策问题，提出一种基于贝叶斯决策理论的新框架R2DT（参考点依赖决策理论剂量发现）。该框架将von Neumann-Morgenstern效用理论扩展到临床判断，通过引入参考点区分收益与损失区域，并允许风险态度在两种区域间变化，从而更灵活地刻画医生对疗效和毒性的偏好。在模拟研究中，R2DT在候选剂量接近最小可接受疗效和最大可接受毒性阈值时，识别最优剂量的概率显著高于传统方法。该方法本质上是效用函数的设计创新，并未改变试验的序贯结构或剂量分配规则。该工作属于proof-of-concept，尚未在真实临床试验中验证。对于流行病学中的药物安全性研究，该效用框架可推广到多维度风险-收益权衡问题，但当前需先掌握贝叶斯决策与蒙特卡洛模拟技术。
关键技术: Bayesian decision theory, von Neumann-Morgenstern utility, reference-dependent utility, dose-finding trial design, simulation study
为什么对您有用: 本文属于流行病学次级兴趣下的临床试验设计方向，直接涉及药物剂量-毒性/疗效的权衡。研究者现有的估计理论和软件工具可用于评估效用函数的不确定性，但核心的贝叶斯决策与风险态度建模技术不在当前武器库中，因此暂不可做——需先补充贝叶斯决策理论与序贯试验设计的知识。不过，若未来关注药物因果效应的多准则决策，本文可作为入门阅读。

6. 10.1002/sim.70531 — A Tutorial on Bayesian Multi‐Study Factor Analysis With Applications in Nutrition and Genomics¶

作者: Mavis Liang, Blake Hansen, Alejandra Avalos‐Pacheco, Roberta De Vito
期刊/来源: Statistics in Medicine
机构: Brown University · Johannes Kepler University of Linz · Harvard University · Center for Systems Biology · Sapienza University of Rome
分类: vol 45 · issue 10-12
相关性 3/10 · novelty: survey
摘要: 本教程系统介绍了七种贝叶斯多研究因子分析模型，用于整合来自多个生物医学研究的高维数据。模型包括扰动因子分析（PFA）、基于非局部 spike-and-slab 先验的贝叶斯因子回归（MOM-SS）、子空间因子分析（SUFA）、贝叶斯多研究因子分析（BMSFA）及其变分推断实现（CAVI）、谱训练贝叶斯潜在分析（BLAST）和组合多研究因子分析（Tetris），并与两种基准方法（堆叠FA、单独FA）进行比较。通过大量模拟评估了各方法在计算效率、载荷估计精度和因子数量推断上的表现。论文提供了完整的分析工作流和 R 代码（包括 bmfaToolkits 包），并在营养学和基因组学真实数据集上演示了应用。作为教程，本文强调可操作性和方法选择指导，而非理论创新。对于您而言，尽管因子分析不属于您的主要研究方向，但多研究整合中的信号分离思想与因果推断中的异质性处理有相通之处；且教程中详细的 R 实现和软件包开发思路对您的统计计算兴趣有参考价值。
关键技术: Bayesian factor analysis, multi-study integration, spike-and-slab priors, variational inference, subspace factor analysis, spectral training
为什么对您有用: 本文属于流行病学应用（营养与基因组学）中的统计方法教程，满足您的 secondary interest 中流行病学数据集的关注；教程提供的完整 R 工作流和软件包开发可作为您统计计算兴趣的入门参考。不过，您的技术武器库（如高维渐近、U-统计量、半参效率）与因子分析的直接交叉点有限，因此属于中期可读材料：若想从方法学层面切入多研究整合问题，需先在 moderately_familiar 的 semiparametric theory 基础上延伸理解因子模型的识别性。

其他 (other, 1 篇)¶

1. 10.1002/sim.70570 — Simultaneous Representation Learning of Multi‐Omics and Clinical Outcome Data via a Supervised Knowledge‐Guided Bayesian Factor Model¶

作者: Qiyiwen Zhang, Changgee Chang, Chong Jin, Li Shen, Qi Long
期刊/来源: Statistics in Medicine
机构: University of Pittsburgh · Indiana University Bloomington · New Jersey Institute of Technology · University of Pennsylvania
分类: vol 45 · issue 10-12
相关性 4/10 · novelty: application
摘要: 本文在多组学与临床结局整合分析设定下，目标是同时学习低维潜在表示并预测临床表型，采用有监督的贝叶斯因子模型框架。核心方法为两层自适应收缩的层次先验，分别识别活跃数据模态与活跃特征，同时融入外部生物网络知识作为先验图结构。理论贡献较弱，主要依赖 MCMC 后验推断，未给出频率学派意义下的收敛率或效率界；声称对先验图中的噪声边具有鲁棒性，但缺乏严格的理论刻画。实证部分通过模拟与 ADNI 阿尔茨海默病多组学数据展示方法优于现有整合方法，属于应用导向的方法学工作。对您而言，本文属于生物统计应用范畴，与 primary interests 的理论工具（效率理论、高维推断、半参数理论）距离较远。
关键技术: Bayesian factor model, hierarchical shrinkage prior, multi-omics integration, knowledge-guided prior, MCMC posterior inference
为什么对您有用: 本文属于生物统计应用型工作，与您 primary interests 中的高维统计理论、效率理论、半参数理论等方向的技术内核（minimax rate、influence function、debiasing）无直接对接。技术武器库中的 very_familiar 工具（minimax bounds、high-dimensional asymptotics）难以在此类贝叶斯因子模型框架下找到切入点——本文缺乏频率学派意义下的理论分析。follow-up 判断：暂不可做——核心机器（贝叶斯层次模型的频率学派理论分析）不在武器库中，且应用场景（多组学整合）非您当前关注焦点。

Maintained by 陈星宇 · Homepage · Source on GitHub