跳转至

StatMed — Vol 45 Issue 10-12 · 2026-06-19

  • 共 29 篇 · Statistics in Medicine

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期论文大致聚成四条主线:一是因果推断与纵向/删失数据的结合,涉及中介分析、异质性效应、平台试验偏差及效应尺度选择;二是半参数/非参数建模与效率提升,涵盖张量回归、辅助信息权重调整、多层BART变量选择及微生物组生成模型;三是复杂试验设计与多重检验,聚焦历史对照借用、RMST序贯设计及安全性FDR控制;四是流行病学与生存分析的复杂结构处理,包括联合模型、区间删失、网络Meta不一致性及空间功能聚类。

因果推断与纵向删失主线在本期推进了多种复杂设定下的效应识别与估计。区间删失生存数据的中介分析通过筛极大似然分解路径特定效应;纵向亚组异质性处理效应采用惩罚EM算法同时识别亚组与估计变系数;平台试验非同期对照在中期分析下的偏差被显式校正;渐进性疾病试验则引入时间尺度目标参数与两步估计框架以捕捉传统均值差异遗漏的效应,并推导了半参数效率界。此外,胜率悖论揭示了复合终点分层汇总指标的重加权反转风险。

半参数与非参数主线在效率提升和高维结构刻画上有具体推进。风险模型准确度评估利用影响函数构建辅助变量权重调整,使子采样下的分类指标估计逼近最优效率;张量分位数回归对张量估计本身施加正则化以处理非光滑损失;多层变量选择将BART非参数拟合与协方差分解结合以缓解集群层共线性;微生物组组成数据则通过logistic-tree normal模型利用树结构聚合与潜变量高斯结构联合刻画稀疏性与协方差。

对因果推断与半参数效率方向最贴的论文是:区间删失中介分析(筛MLE分解PSE)、渐进性疾病时间尺度参数(两步估计与效率界)、亚组变系数处理效应(惩罚EM),以及子采样风险模型准确度评估(IF-权重调整逼近最优效率)。高维与复杂结构方向优先看张量分位数回归与多层BART变量选择。

因果推断 (causal_inference, 7 篇)

1. 10.1002/sim.70583 — Mediation Analysis of Failure Time Data Under Interval Censoring

  • 作者: Yanpeng Shi, Shuwei Li
  • 期刊/来源: Statistics in Medicine
  • 机构: Guangzhou University
  • 分类: vol 45 · issue 10-12
  • 相关性 8/10 · novelty: new_method
  • 摘要: 本文针对区间删失生存数据(如阿兹海默症进展时间)提出一种中介分析方法,目标是分解暴露(如APOE-4基因)对生存时间的直接和间接效应。在反事实框架下假设顺序可忽略性,采用广义线性模型和样条比例风险模型刻画通过多个中介变量的路径特定效应(PSE)。效应定义基于生存概率和限制平均生存时间,避免了比例风险模型对罕见结果的依赖。估计方法采用筛极大似然(sieve MLE)同时估计所有未知参数,理论性质与模拟均支持其可行性。实证分析量化了APOE-4等位基因对阿兹海默症风险的中介效应。对您而言,本文紧密连接因果推断中的中介分析方向,并为区间删失数据下的因果路径估计提供了一个实用工具,与您对半参数理论和识别理论(moderately_familiar)的兴趣重合。
  • 关键技术: survival mediation analysis, proportional hazards model, interval censoring, sieve maximum likelihood, restricted mean survival time, counterfactual framework
  • 为什么对您有用: 本文直接对应您主要兴趣中的‘mediation’子方向,且处理区间删失生存数据这一常见但复杂的数据结构。您可在semiparametric theory(moderately_familiar)的武器加持下,思考该方法能否通过双机器学习(DML)提升效率,或者将其扩展至高维中介变量。鉴于您对识别理论和半参数方法已有基础,评估该方法的渐近效率或设计更优的估计量属于‘中期可做’——需先加强对半参数效率界与debiased ML的熟悉。

2. 10.1002/sim.70600 — Varying Treatment Effects in Subgroups: A Unified Framework for Longitudinal Data Analysis

  • 作者: Pu Zhang, Xinsheng Zhang, Jiao Jin, Jiakun Jiang
  • 期刊/来源: Statistics in Medicine
  • 机构: Beijing Normal University · Fudan University
  • 分类: vol 45 · issue 10-12
  • 相关性 8/10 · novelty: new_method
  • 摘要: 在纵向数据设定下,本文目标是估计亚组特异性的、随时间变化的处理效应(subgroup-varying coefficient),克服现有两步法需预设亚组数或相关结构的限制。提出半参数亚组变系数模型,将亚组分配、亚组数与处理效应均视为未知,通过惩罚 EM 算法同时完成亚组识别与效应估计。理论方面证明了估计量的一致性与渐近正态性,但摘要未给出具体的收敛速率或半参数效率界。实证通过癫痫药物与原发性胆汁性肝硬化两个临床数据验证了方法的亚组发现与时间动态处理敏感性。对您可能有用:该文将纵向因果效应的异质性建模为半参数变系数问题,与您 primary interest 中的 longitudinal causal inference 及 semiparametric theory 直接相连。
  • 关键技术: semiparametric varying-coefficient model, penalized EM algorithm, subgroup identification, longitudinal treatment effect heterogeneity, asymptotic normality
  • 为什么对您有用: 本文连接到您 primary interest 中的 longitudinal causal inference 与 semiparametric theory,具体处理了纵向设定下亚组异质性处理效应的联合识别与估计问题。您武器库中 moderately_familiar 的 semiparametric theory 与 M-estimation theory 可直接攻其理论部分(如渐近正态性证明与惩罚项对收敛速率的影响),但摘要未展示效率界或 sharper rate,理论深度可能有限。中期可做:若想在此方向深入,需先在 moderately_familiar 的 longitudinal identification theory 上长肌肉,以审视其模型在因果 identification 层面的假设是否过强。

3. 10.1002/sim.70585 · arXiv — On the Inclusion of Non‐Concurrent Controls in Platform Trials With an Interim Analysis

  • 作者: Pavla Krotka, Martin Posch, Marta Bofill Roig
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文研究平台试验中利用非同期对照(non-concurrent controls)时引入中期分析对处理效应估计的影响。目标是在存在时间趋势的情况下,仍能无偏估计第二个试验臂的处理效应。采用频繁主义回归模型,以阶跃函数调整时间趋势,并考虑对第一臂进行中期分析。发现若不调整,中期分析会引入第二臂点估计的边际偏差和条件偏差,且偏差大小依赖于设计参数。为此提出一个新估计量,同时校正中期分析偏差和时间趋势偏差。模拟表明新估计量大幅降低偏差和I类错误膨胀,并相比仅使用同期对照获得功效提升。对您可能有用:该问题属于纵向临床试验中的因果推断偏差调整,可直接运用您在因果推断估计理论中的经验来理解偏差机制或改进方法。
  • 关键技术: frequentist regression model, time trend adjustment (step function), interim analysis, bias correction estimator, platform trial, non-concurrent controls
  • 为什么对您有用: 直接关联您的因果推断研究,特别是纵向设计中基于时间趋势的偏差调整问题。您非常熟悉的‘estimation theory in causal inference’中的偏差分解思路可用于分析此处的边际偏差与条件偏差结构。立即可做:将类似偏差校正框架移植到您熟悉的IV或proximal CI设定中,处理非同期观测带来的时间混杂。

4. 10.1002/sim.70595 · arXiv — Copas‐Heckman‐Type Sensitivity Analysis for Publication Bias in Rare‐Event Meta‐Analysis Under Generalized Linear Mixed Models

  • 作者: Yi Zhou, Taojun Hu, Yuji Sakamoto, Ao Huang, Xiao‐Hua Zhou, Satoshi Hattori
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在罕见事件 meta-analysis 的 contrast-based GLMM 框架下,目标是针对 publication bias (PB) 进行 sensitivity analysis,设定为研究特异性真实效应与潜在 Gaussian 选择变量相关。核心方法将经典 Copas-Heckman 选择模型从 normal-normal 随机效应迁移至 GLMM,通过 latent Gaussian 变量对研究样本量的选择机制建模,从而在无需 continuity correction 的情况下修正 PB。估计与推断依赖标准软件即可低计算成本实现,模拟与真实数据(odds ratio / proportion 的罕见事件)验证了方法在修正 PB 上的有效性。对您可能有用:本文为 causal inference 中 sensitivity analysis(特别是 selection bias / unmeasured confounding)提供了 GLMM 下 Copas-Heckman 框架的扩展思路。
  • 关键技术: Copas-Heckman selection model, generalized linear mixed models, rare-event meta-analysis, sensitivity analysis for publication bias, latent Gaussian selection variable
  • 为什么对您有用: 本文直接连接到 causal inference 的 sensitivity analysis 子方向,将经典 Copas-Heckman 选择模型从 NN 模型推广至 GLMM,为处理 selection bias 提供了新设定。用您 very_familiar 的 M-estimation theory 与 moderately_familiar 的 identification theory 可以审视该框架下 latent Gaussian 变量的 identification 条件是否完备,以及 estimator 的渐近性质。立即可做:用现有武器即可检查其 identification 与 estimation 的理论缺口。

5. 10.1002/sim.70580 — When Better is Worse: A Paradox of the Win Ratio and Net Treatment Benefit

  • 作者: Valerie R. Fu
  • 期刊/来源: Statistics in Medicine
  • 机构: Agri Processing Services (United States)
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_theory
  • 摘要: 本文研究胜率(Win Ratio)和净治疗效益在优先组合终点分析中的悖论:即当治疗对每个组分端点(两个二元端点)的边际成功概率均更高时,整体分层汇总指标却可能反向,出现胜率低于1、净效益为负的现象。作者通过精确的2×2列联表展示这一反直觉结果,并归因于次级端点仅在初级平局层中被引入,从而产生重加权,使治疗表现较差的层被放大。文中对净效益进行分解,以隔离导致反转的平局层贡献,并提出最小诊断报告以改善可解释性。这一悖论对使用胜率作为治疗效益指标的应用研究(如心血管试验、流行病学队列)具有重要警示意义,同时与因果推断中复合端点处理及权重问题直接相关。
  • 关键技术: Win ratio, net treatment benefit, prioritized composite endpoints, hierarchical pairwise comparisons, tie-stratum decomposition
  • 为什么对您有用: 本文直接连接因果推断中复合端点的治疗效益评估,揭示了胜率在边际改善下仍可能反转的识别问题,这与您moderately_familiar的因果推断识别理论(特别是复合端点的加权机制)高度相关。同时,胜率本质上是基于pairwise比较的U-统计量,您对higher-order U-statistics的非常熟悉程度(treewidth/tensor contraction/einsum)可立即用于解析胜率计算的组合结构,并量化次级端点重加权的偏差。此悖论的诊断方法为后续立即可做的工作:可结合您的U-统计计算框架,提出更稳健的复合端点汇总统计量。

6. 10.1002/sim.70576 — Sample Size Determination for Comparing Slopes in Cluster Randomized Trials With Longitudinal Measurements

  • 作者: Jijia Wang, Song Zhang, Chul Ahn
  • 期刊/来源: Statistics in Medicine
  • 机构: Southwestern Medical Center · The University of Texas Southwestern Medical Center
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在具有纵向测量的整群随机试验中,目标是比较干预组与对照组在时间上的斜率差异,即治疗效果随时间的变化趋势。基于广义估计方程(GEE)在独立工作相关结构下,推导出闭合形式的样本量公式,无需迭代计算。该方法高度灵活,允许不平衡随机化、任意真实相关结构、通过观测概率和缺失模式表示的各种缺失数据场景,以及群组大小变异。模拟显示,该方法能使经验功效和I类错误率接近名义水平,且稳健性良好。实际临床试验实例展示了其应用便利性。对您而言,该工作直接关联到因果推断中整群随机试验的设计环节,特别是纵向设定下干预效果的检验,其闭合公式可用于快速规划试验规模,且易于编程实现。
  • 关键技术: generalized estimating equation (GEE), closed-form sample size formula, cluster randomized trials, longitudinal data, missing data patterns
  • 为什么对您有用: 本文针对纵向整群随机试验中斜率比较的样本量计算,这是因果推断中设计阶段的核心问题之一,具体关联到您对longitudinal因果推断和临床试验设计的兴趣。您熟悉的estimation theory in causal inference和software development工具可直接用于验证、扩展其公式或实现为软件包,属于立即可做的follow-up(编写R/Python函数并对比模拟)。

7. 10.1002/sim.70591 — Time‐Scale Target Parameters and Two‐Step Estimation in Longitudinal Trials for Progressive Diseases

  • 作者: Florian Stijven, Craig Mallinckrodt, Geert Molenberghs, Ariel Alonso, Samuel P. Dickson, Suzanne B. Hendrix
  • 期刊/来源: Statistics in Medicine
  • 机构: KU Leuven · TetraLogic Pharmaceuticals (United States) · Hasselt University
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对阿尔茨海默等渐进性疾病临床试验中治疗效应的量化困境:传统均值差异在疾病早期可能很小,但对应着有意义的进展减缓。作者引入时间尺度目标参数(如节省的时间或进展减缓百分比),在随机化试验的常规假设下可识别,且即使非随机化也可在附加假设下定义。提出两步估计框架:第一步使用标准纵向数据分析方法(如线性混合模型)获得汇总统计量,第二步基于这些统计量对目标参数进行推断;第二步已实现为R包TCT。推导了估计量的渐近分布和半参效率界,并通过模拟验证其有限样本表现。在阿尔茨海默症II/III期临床试验中应用,揭示了传统方法未能捕捉的治疗效应。该工作直接服务于纵向因果推断中的效应尺度选择问题,您的因果推断估计理论和识别理论经验可立即评估其识别假设和效率界是否最优。
  • 关键技术: two-step estimation, time-scale target parameters, longitudinal clinical trials, identification under randomization, asymptotic efficiency
  • 为什么对您有用: 本文属于纵向因果推断中效应尺度的方法创新,与您 primary interest 中的纵向试验因果推断紧密相关。您武器库中 very_familiar 的 estimation theory in causal inference 可直接用于评估其两步估计量的识别条件和半参效率;moderately_familiar 的 identification theory 可进一步分析非随机化下的敏感性假设。立即可做:用您的因果推断视角检查其识别假设的充分性与效率界。

非参数 / 半参数 (nonparam_semipara, 4 篇)

1. 10.1002/sim.70582 — Regularized Tensor Quantile Regression With Applications to Neuroimaging Data Analysis

  • 作者: Matthew Pietrosanu, Dengdeng Yu, Ivan Mizera, Bei Jiang, Linglong Kong
  • 期刊/来源: Statistics in Medicine
  • 机构: Statistical Research (United States) · The University of Texas at San Antonio · Charles University
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文提出带张量协变量的正则化线性分位数回归模型,目标参数为响应变量条件分位数对张量协变量的低秩张量效应分解系数。核心机制是对张量估计本身施加正则化而非直接对其分解参数正则化,并针对分位数损失函数的非光滑性分别处理算法收敛与估计量统计性质。理论部分给出了估计量的收敛速率,模拟与神经影像实证展示了在违背传统回归假设时的优越性与可解释性。对您可能有用:该文的张量效应估计与正则化策略,可为您用 einsum / tensor contraction 视角分析高阶统计量计算复杂度提供新的张量回归应用场景。
  • 关键技术: tensor quantile regression, low-rank tensor decomposition, tensor-level regularization, non-smooth loss convergence analysis, neuroimaging tensor covariates
  • 为什么对您有用: 本文连接到您 primary interest 中的 statistical computing(张量计算)与 semiparametric/nonparametric theory(分位数回归属于非参数 M-estimation)。您武器库中 very_familiar 的 computation of higher-order U-statistics (treewidth / tensor contraction / einsum) 可直接攻入本文张量分解参数估计的计算瓶颈——分析其算法中张量收缩的 einsum 复杂度与最优收缩顺序是立即可做的 follow-up。此外,分位数损失下的收敛速率分析可与您 moderately_familiar 的 M-estimation theory 对接,验证其声称的速率是否在更弱条件下仍紧。

2. 10.1002/sim.70587 — Incorporating Auxiliary Information into Assessment of Accuracy and Discrimination of Risk Models When Some Predictors are Missing

  • 作者: Ruth M. Pfeiffer, Thilo R. Loeb, Yei Eun Shin
  • 期刊/来源: Statistics in Medicine
  • 机构: National Institutes of Health · National Cancer Institute · Technical University of Munich · Seoul National University
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在队列子采样(如 case-cohort / nested case–control)验证风险预测模型时,部分 predictor 仅对子样本观测,导致经典加权估计量方差过大。本文提出利用全队列辅助信息修正已知采样权重,以提升 TPR/FPR、AUC、PPV/NPV 等分类准确度与判别度指标的估计效率。核心机制是将 influence function 作为辅助变量构建高效权重调整,并与启发式辅助变量做效率对比;同时推导了包含权重估计步骤的解析方差公式。模拟显示,多重插补在插补模型误设时产生偏差,而 IF-权重调整保持无偏且效率接近最优。对您有用:本文将 influence function 用于非标准缺失/子采样下的效率提升,与您 semiparametric efficiency 及 IF 工具直接相关。
  • 关键技术: influence function as auxiliary variable, sampling weight adjustment, case-cohort / nested case-control validation, AUC / TPR / FPR estimation, analytic variance estimation with estimated weights, multiple imputation vs weighted estimation
  • 为什么对您有用: 本文直接连接到您 primary interest 中 semiparametric efficiency / influence function 的应用:在 case-cohort 子采样缺失下,用 IF 构造辅助变量做权重调整以逼近 semiparametric efficiency bound,是经典的 one-step / IF 效率提升思路在风险模型验证指标上的具体实现。用您 very_familiar 的 influence function 计算与 moderately_familiar 的 semiparametric theory 即可攻入:可考虑将此 IF-权重调整框架推广到您熟悉的 causal inference estimand(如 ATE 的 IPW 加权在 missing treatment/confounder 子采样下的效率提升)。立即可做

3. 10.1002/sim.70593 — Multi‐Level Variable Selection Using a BART ‐Enhanced Mixed‐Effects Framework

  • 作者: Keming Zhang, Yaoyao Li, Jungang Zou, Sijian Wang, Bernadette A. Fausto, Liangyuan Hu
  • 期刊/来源: Statistics in Medicine
  • 机构: Brown University · Rutgers, The State University of New Jersey · Environmental and Occupational Health Sciences Institute · Columbia University · Thomas Jefferson University
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在分层/多层数据设定下,目标是同时进行个体层与集群层协变量的变量选择,传统混合效应模型依赖强参数假设,难以捕捉非线性与交互效应。本文提出全贝叶斯统一框架:固定效应部分用 BART(Bayesian Additive Regression Trees)做非参数变量选择,随机效应部分通过协方差分解与置换策略识别相关预测变量。针对集群层协变量在集群内恒定导致的近共线性与选择不稳定问题,进一步提出两步法分离个体与集群层贡献以缓解共线性。模拟与阿尔茨海默病多层数据实证展示了方法鲁棒性;对您而言,BART 与协方差分解结合的非参数多层建模思路可为 semiparametric theory 下的分层因果推断估计提供参考。
  • 关键技术: BART variable selection, mixed-effects model, covariance decomposition, permutation-based selection, two-step collinearity mitigation, hierarchical Bayesian inference
  • 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 子方向,将 BART 非参数灵活性与多层随机效应结构结合,突破了传统参数混合模型的限制。用 very_familiar 中的 nonparametric statistics 与 software development 可以直接复现并检验其两步法在近共线性下的选择稳定性,甚至用 moderately_familiar 的 semiparametric theory 探究该 BART-enhanced 框架下固定效应估计的收敛率与影响函数。立即可做:用 very_familiar 武器即可动手复现模拟与实证,并尝试推导 BART 固定效应部分的 semiparametric efficiency bound。

4. 10.1002/sim.70584 · arXiv — A Tree‐Based Model for Addressing Sparsity and Taxa Covariance in Microbiome Compositional Count Data

  • 作者: Zhuoqun Wang, Jialiang Mao, Li Ma
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在微生物组高维稀疏组成数据设定下,目标是提出一个能同时刻画 taxa 协方差结构、稀疏性与跨样本异质性的生成模型。本文提出 logistic-tree normal (LTN) 模型,利用树结构对稀疏计数进行有效聚合,并在树的分裂节点处用多元 logistic-normal 分布联合建模相对丰度。潜变量 Gaussian 结构使得高维协方差上的稀疏或低秩假设可被直接嵌入;计算上,通过 Pólya-gamma 数据增广实现共轭的 blocked Gibbs sampling,保证了贝叶斯推断的可扩展性。实证与模拟表明,LTN 通过充分刻画跨样本异质性即可自然生成恰当的零比例,无需显式零膨胀组件,验证了测序数据零膨胀常源于未建模异质性的观点。对您可能有用:LTN 的树结构聚合与潜变量 Gaussian 嵌入为高维组成数据的 semiparametric 推断提供了新的模型基座。
  • 关键技术: logistic-normal distribution, tree-based decomposition, Pólya-gamma augmentation, blocked Gibbs sampling, compositional mixed-effects model, sparsity-inducing covariance prior
  • 为什么对您有用: 本文连接到 semiparametric & nonparametric theory 中高维组成数据的协方差建模与稀疏推断子方向。您武器库中的 very_familiar 'computation of higher-order U-statistics (treewidth / tensor contraction / einsum)' 可直接切入 LTN 树结构聚合的计算复杂度分析——树拓扑下的潜变量 Gaussian 积分本质上与 tensor contraction 的最优执行顺序同构,可用 treewidth 视角量化 Gibbs sampling 的计算瓶颈。follow-up 粗判:立即可做——用 very_familiar 的 treewidth/einsum 工具分析 LTN 在不同树拓扑下的计算代价,并探索是否可优化 Pólya-gamma 增广中的矩阵/tensor 运算。

数理统计 / 假设检验 (hypothesis_testing, 3 篇)

1. 10.1002/sim.70605 — Testing Random Effects in Nonlinear Mixed‐Effects Models

  • 作者: Germaine Uwimpuhwe, Reza Drikvandi, Shelley A. Blozis
  • 期刊/来源: Statistics in Medicine
  • 机构: Durham University · University of California, Davis
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: new_method
  • 摘要: 在非线性混合效应模型(NLMM)下,检验特定随机效应是否必要(即对应方差分量是否为零),estand 为边界上的方差分量。因参数空间边界导致经典 LR/score 检验的 χ² 渐近分布失效,正确渐近分布为 χ² 混合但混合权重在多相关随机效应下不可解。本文提出非参数框架,不假设随机效应与误差的正态性或任何特定分布,构造基于置换程序的检验统计量以逼近有限样本分布,并获得 distribution-free 的方差分量估计。方法允许用户根据数据特征选择估计方式,可检验全部或任意子集随机效应,并提供 R 包 TestREnlme 实现。对您有用:该工作将边界假设检验与 permutation inference 结合,为 longitudinal/clustered 数据的模型选择提供了避开渐近混合权重计算的新路径。
  • 关键技术: boundary hypothesis testing, permutation test, nonlinear mixed-effects model, variance component testing, distribution-free estimation, finite-sample distribution approximation
  • 为什么对您有用: 直接连接 hypothesis testing 与 longitudinal causal/semiparametric 的边界检验难题:参数空间边界上的方差分量检验是 mixed-effects 模型中的经典硬问题,本文用 permutation 避开 χ² 混合权重不可解的困境。用 very_familiar 的 nonparametric statistics 与 minimax bounds 视角可以审视其 permutation 统计量在何种 signal strength 下具备 power 保证,并评估其 distribution-free 估计的效率损失。立即可做:用 very_familiar 的非参数检验理论分析其 permutation 统计量的渐近 power 与局部替代性质。

2. 10.1002/sim.70592 — Synergy Area With FDR ‐Controlled Evaluation ( SAFE ) to Robustly Assess Safety Profile in Clinical Trials

  • 作者: Tianyu Zhan, Yabing Mai, Yihua Gu, Thao Doan, Xun Chen
  • 期刊/来源: Statistics in Medicine
  • 机构: AbbVie (United States)
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在临床试验安全性评估设定下,目标是识别具有真实安全性风险的 Synergy Area(SA),同时控制跨多个 SA 的错误发现率(FDR)。本文提出两层 SAFE 框架:第一层在每个临床定义的 SA 内基于实质性证据进行稳健检验,第二层对所有 SA 的潜在发现进行 FDR 控制。模拟表明 SAFE 能在名义水平下同时控制层内和跨 SA 的错误率;在 DataCelerate 平台的真实历史试验数据案例中,SAFE 相比直接方法能筛除极端数据并得出更稳健的安全性结论。对您可能有用:该框架本质是分层多重检验问题,其 FDR 控制逻辑与高维假设检验中的 group-wise / hierarchical FDR 方法有结构相似性。
  • 关键技术: false discovery rate (FDR) control, hierarchical / two-layer testing, synergy area (SA) grouping, robust evidence aggregation, clinical trial safety profile
  • 为什么对您有用: 本文属于临床试验安全性评估的应用方法,核心是分层 FDR 控制的多重检验框架。对您而言,它连接到 hypothesis testing 子方向中的 hierarchical FDR / group-wise multiple testing 逻辑。您武器库中的 minimax bounds 与高维渐近理论可直接用于分析该框架在 SA 数量增多或层内检验数高维时的 power 与 FDR 收敛性质,这是一个立即可做的理论延伸口子。

3. 10.1002/sim.70589 — Two‐Stage Double‐Arm Trial Optimal Design of Restricted Mean Survival Time With Sculpted Critical Region

  • 作者: Jiashan He, Ruitao Lin, Yaxian Chen, K. F. Lam
  • 期刊/来源: Statistics in Medicine
  • 机构: The Ohio State University · The University of Texas MD Anderson Cancer Center · Innovative Biologics (United States) · Metropolitan University · University of Hong Kong
  • 分类: vol 45 · issue 10-12
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文针对两阶段双臂临床试验,提出基于受限平均生存时间(RMST)的最优设计方法,并引入"雕刻临界区"(sculpted critical region)以提升检验效率。检验拒绝原假设的条件同时要求两组RMST差和实验组RMST值超过特定临界值,该临界值由基于累积样本量的自适应概率截断函数确定,并利用了RMST估计的渐近正态性。与仅基于RMST差的传统检验相比,新方法在相同I类错误和把握度下所需样本量更小。模拟显示,在两阶段最小化型和最优型设计中,该方法相比log-rank检验和简单RMST差检验均能降低总样本量、提前中期分析时间并减少期望样本量。方法可自然推广至多阶段序贯设计。论文还讨论了生存参数偏离假设时I类错误的全局稳健性,并通过真实临床试验数据和R包ScuRMST展示了实用性。该设计将非参数RMST估计与序贯检验相结合,直接对应您对hypothesis testing的兴趣,且R包便于快速复现与拓展。
  • 关键技术: restricted mean survival time, sculpted critical region, adaptive probability cutoff function, two-stage design, asymptotic normality, minimax and optimal design
  • 为什么对您有用: 本文核心是两阶段序贯检验的新方法,直接关联您primary interest中的hypothesis testing子方向。RMST作为生存函数积分是非参数估计量,可从您very_familiar的nonparametric statistics视角切入分析其渐近性质。立即可做:您可基于提供的R包复现模拟,或尝试用minimax框架评估该设计的有限样本最优性。

流行病学 (epidemiology, 13 篇)

1. 10.1002/sim.70567 · arXiv — Dynamic Borrowing From Historical Controls via the Synthetic Prior With Covariates in Randomized Clinical Trials

  • 作者: Daniel E. Schwartz, Yuan Ji, Li Wang
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本文针对随机对照试验中的历史对照信息借用问题,提出一种新的贝叶斯方法SPx(synthetic prior with covariates),旨在减少新试验中对照组样本量。方法核心是使用贝叶斯模型平均来平衡历史数据与新试验数据之间多种可能的关系,从而动态决定对历史数据的信任或折减程度。SPx仅需试验级别的汇总统计量,无需患者级数据,因此适用性更广。通过模拟和一个类风湿关节炎临床试验的应用,展示SPx能在保持频率学派性质的前提下显著缩小对照组规模。该方法为历史信息借用提供了一种灵活且自动化的框架,尤其适合早期临床试验设计。
  • 关键技术: Bayesian model averaging, synthetic prior, dynamic borrowing
  • 为什么对您有用: (1)本文属于流行病学/临床试验中的方法学应用,与研究者的次要兴趣‘流行病学(应用、数据集、因果推断)’直接相关。(2)SPx中的协变量调整机制可视为一种条件于协变量的非参数借力方式,与研究者非常熟悉的非参数统计和估计理论有潜在联系,可以用最小化最大界(minimax bound)框架分析其频率学派效率。(3)当前研究者武器库中缺少贝叶斯模型平均工具,但可用已有的非参数估计理论评估方法性质,此为中期可做——需先熟悉贝叶斯模型平均的收敛性理论。

2. 10.1002/sim.70560 — Interrupted Time Series Methods for Nonrandom Sampling Study Designs With Known Sampling Weights

  • 作者: Thuy V. Lu, Joshua D. Grill, Daniel L. Gillen, Maricela Cruz
  • 期刊/来源: Statistics in Medicine
  • 机构: University of California, Irvine · Kaiser Permanente Washington Health Research Institute · University of Washington
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: new_method
  • 摘要: 本论文针对非随机抽样设计(已知抽样权重)下的中断时间序列(ITS)方法进行扩展。研究背景是加州大学尔湾分校的 Consent-to-Contact 注册研究中,通过 Facebook 和传统邮寄广告招募来自高地区剥夺指数(ADI)社区的参与者,旨在估计边际干预效应并评估 ADI 分层的效应修饰。作者将已知抽样权重引入 Robust‐Multiple Interrupted Time Series 模型,并提出两种方差估计量:一种量化未知变点相关的不确定性,另一种额外校正均值模型设定偏差。仿真结果表明,该方法在主要和次要终点上具有良好性能,且相对简单随机抽样设计在次要终点上功效更高。该方法为纵贯因果推断中处理非随机样本提供了实用工具,对流行病学中基于注册研究的干预效果评估有直接价值。
  • 关键技术: interrupted time series, known sampling weights, robust M-estimation, variance estimation for misspecified models, change point detection, nonrandom sampling design
  • 为什么对您有用: (1) 该论文直接对应流行病学中的因果推断问题——使用中断时间序列设计评估干预效果,并调整非随机抽样偏差,与您的次要兴趣“流行病学(应用数据集、因果推断)”高度吻合。 (2) 您可以从 moderately_familiar 的 M-estimation theory 出发,分析该方差估计量的一致性条件,或利用 very_familiar 中的非参数统计评估其对模型设定偏差的敏感度。 (3) 中期可做:若您先在 moderately_familiar 的 M-estimation theory 上加深理解,可进一步探索抽样权重未知或误设时该方法的拓展。

3. 10.1002/sim.70598 · arXiv — Correcting Measurement Error and Zero Inflation in Functional Covariates for Scalar‐on‐Function Quantile Regression

  • 作者: Caihong Qin, Lan Xue, Ufuk Beyaztas, Roger S. Zoh, Mark Benden, Jeff Goldsmith et al.
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 7/10 · novelty: application
  • 摘要: 本文研究标量-函数分位回归中功能协变量同时存在测量误差和零膨胀的问题,典型场景为可穿戴设备记录的步数数据中零值可能来自不佩戴、久坐或连接问题。现有方法无法同时处理这两类误差,因此作者提出一个新的建模框架,引入一个随个体和时间变化的有效性指示变量,明确区分结构零和真实值。该方法通过基展开和线性混合模型结合最大似然迭代估计潜在功能协变量和零膨胀概率,然后使用联合分位回归评估校正后的协变量对响应的影响。模拟表明,该方法显著优于仅处理测量误差的方法,且联合估计在多个分位水平上比单独拟合分位回归有实质性改进。在儿童肥胖研究中的应用显示,校正零膨胀和测量误差后的步数与能量消耗高度一致,支持将其作为体力活动的代理指标。对您的流行病学子兴趣(特别是数据集和因果应用)而言,这是一个清晰的处理复杂功能数据误差的应用案例,其建模思路和数据分析流程具有参考价值。
  • 关键技术: functional data analysis, measurement error models, zero-inflated models, basis expansion, linear mixed models, quantile regression
  • 为什么对您有用: 本文属于流行病学领域的应用研究,涉及可穿戴设备数据中的零膨胀和测量误差矫正,与您的次级兴趣“流行病学(数据集、因果应用)直接相关。文中使用的基展开和线性混合模型与您非常熟悉的非参数统计和高维渐近工具较为贴近,可作为流行病学复杂数据建模的入门读物。武器库中的非参数建模能力足以支撑理解核心方法,但若要在类似框架下进一步引入因果推断或半参数效率理论,需先在identification theory上加强,属于中期可做。

4. 10.1002/sim.70579 — Joint Frailty Mixture Cure Model for Recurrent Event Data With Dependent Censoring: An MCEM Approach

  • 作者: Nasrin Sultana, Moudud Alam, Md Hasinur Rahaman Khan
  • 期刊/来源: Statistics in Medicine
  • 机构: University of Dhaka · Bangladesh Agricultural Research Institute · Dalarna University
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: new_method
  • 摘要: 在复发事件数据中,当存在治愈分数与依赖性删失时,目标是同时估计治愈概率、复发强度与生存时间。本文提出多元联合脆弱混合治愈模型,通过共享脆弱项捕捉未观测异质性并诱导依赖删失,模型同时纳入协变量、事件发生时间与潜在治愈状态。治愈概率部分分别采用互补对数-对数与 logistic 链接函数,以刻画每次复发后的治愈机会。估计方法基于 Monte Carlo EM (MCEM) 算法完成似然推断,避免了脆弱项积分的解析困难。模拟显示 MCEM 估计量无偏且一致,真实数据(结直肠癌术后再入院)中依赖脆弱模型的 AIC 优于同质脆弱模型。对您而言,本文提供了流行病学队列中依赖删失与复发事件的联合建模范例,可作为理解 frailty 诱导删失机制的入门阅读。
  • 关键技术: joint frailty model, mixture cure model, dependent censoring, Monte Carlo EM algorithm, recurrent event data, complementary log-log link
  • 为什么对您有用: 本文属于流行病学应用与模型构建,直接连接 epidemiology secondary interest 中依赖删失与复发事件的建模问题。您武器库中的 M-estimation theory (moderately_familiar) 可用于审视其 MCEM 似然推断的收敛性与渐近性质,但本文未触及 semiparametric efficiency 或高维推断。作为 gateway reading,本文对依赖删失机制的建模思路有清晰展示,适合快速浏览模型设定与数据结构,但无需深读理论证明。

5. 10.1002/sim.70493 · arXiv — An Overview and Recent Developments in the Analysis of Multistate Processes

  • 作者: Malka Gorfine, Richard J. Cook, Per Kragh Andersen, Terry M. Therneau, Pierre Joly, Hein Putter et al.
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: survey
  • 摘要: 本文在 STRATOS Initiative 下系统综述了多状态模型在疾病进程生命史数据分析中的建模与拟合方法,目标 estimand 涵盖 transition intensity、marginal regression 参数及 state occupancy probability。核心机制包括:基于计数过程的 intensity-based 模型与 Aalen-Johansen 估计;pseudo-value 框架将 state occupancy 等函数转化为可直接回归的响应变量,实现直接边际效应估计;通过 random effects / frailty 建模进程内部历史依赖与个体间异质性,并扩展至疾病进程与动态标记的联合模型。文章还梳理了间歇观察与随机删失下的似然构造,并列出 R/SAS 等可用软件生态。主要贡献是方法论整合与软件指引,对您有用之处在于:pseudo-value 方法本质上是一阶 influence function 的 one-step 估计视角,可直接对接您 semiparametric efficiency 与 causal mediation 的理论武器。
  • 关键技术: multistate models, counting process intensity, pseudo-value estimation, Aalen-Johansen estimator, frailty and random effects, joint models for longitudinal markers
  • 为什么对您有用: (1) 直接连接 epidemiology secondary interest 中的多状态生命史数据与 causal inference:多状态模型是 longitudinal causal mediation 与 competing risk 的自然载体,pseudo-value 则是边际参数 direct estimation 的核心工具。(2) 您 technical_arsenal 中的 semiparametric theory 与 estimation theory in causal inference 可以直接攻入 pseudo-value 的 efficiency bound 分析——当前文献对 pseudo-value 的 semiparametric efficiency 性质讨论尚不充分,这是一个立即可做的理论切入点。(3) 判断:立即可做——用 very_familiar 的 minimax bounds 与 moderately_familiar 的 semiparametric theory 即可对 pseudo-value 在多状态设定下的 efficiency 属性做系统梳理与潜在改进。

6. 10.1002/sim.70550 — BCH‐GEE Approach to Examine the Association Between Time‐Varying Food Environment Classes and Multi‐Level Health Outcomes

  • 作者: Kelsey A. L. Alexovitz, Brisa N. Sánchez, Emma V. Sanchez‐Vaznaugh
  • 期刊/来源: Statistics in Medicine
  • 机构: Drexel University · San Francisco Department of Public Health · San Francisco State University
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_method
  • 摘要: 该文聚焦于时变潜类别与多水平健康结局之间的关联估计问题。常用方法(如模态类别赋值)因分类误差引入偏倚,而现有偏差校正方法(如BCH或ML三步法)在处理多水平重复横截面数据时计算困难。作者提出BCH-GEE方法:先利用潜变量过渡分析建模时变类别,再通过BCH三步法校正分类误差,最后采用加权GEE估计类别与多水平结局的关联。模拟表明该方法有效消除了分类误差导致的偏倚,且适用于多时间点和多水平数据结构。将该方法应用于加州8年间学校周边不健康食品环境类别与五年级学生BMI的关联研究,发现高密度不健康食品店环境与更高BMI相关。对于您的流行病学应用兴趣(尤其是重复测量数据与潜变量建模),该方法提供了实用的偏差校正框架。
  • 关键技术: latent transition analysis, BCH adjustment, weighted generalized estimating equations (GEE), classification error correction, multilevel repeated cross-sectional design
  • 为什么对您有用: 该论文属于流行病学中的纵向数据关联分析,您熟悉的“estimation theory in causal inference”可直接用于解析BCH-GEE的识别条件和偏差校正机制。follow-up 粗判:立即可做——可基于现有估计理论评估该方法的渐进性质,或将其扩展到包含时变混杂的因果效应估计中(如G-computation与GEE结合)。

7. 10.1002/sim.70596 · arXiv — A Bayesian Location‐Scale Joint Model for Time‐To‐Event and Multivariate Longitudinal Data With Association Based on Within‐Individual Variability

  • 作者: Marco Palma, Omar El Makkaoui, Ruth H. Keogh, Siobhán B. Carr, Rhonda Szczesniak, David Taylor‐Robinson et al.
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: application
  • 摘要: 本文提出一个贝叶斯位置-尺度联合模型,用于同时建模时间-事件终点与多个纵向标记物,关联基于各标记物的个体内变异性。纵向子模型采用混合效应位置-尺度模型,同时刻画均值、个体内方差及标记物间的相关性;生存子模型使用比例风险模型,基线风险通过样条灵活设定,并通过随机效应将纵向信息(包括个体内变异)共享给生存结局。相比传统假设恒定方差的联合模型,该方法能更真实地反映纵向过程中变异性的变化及其对事件风险的影响。模拟研究显示所提模型在参数估计和预测方面具有良好表现,优于标准联合模型。文章将模型应用于英国囊性纤维化登记的女性成人数据,评估肺功能(FEV1)和营养不良(BMI)随时间的变化及其与死亡风险的关联。本文作为流行病学实际数据应用,展示了处理纵向和生存终点中个体内变异性的完整分析流程,对您在该方向的数据分析实践有直接参考价值。
  • 关键技术: Bayesian joint model, location-scale model, within-individual variability, mixed-effects model, proportional hazards, random effects sharing
  • 为什么对您有用: 本文连接您的 secondary interest 流行病学,使用英国囊性纤维化登记的真实数据,展示了如何将个体内变异性作为纵向与生存结局的关联桥梁,是典型的流行病学联合模型应用。您的武器库中缺少贝叶斯 MCMC 计算经验(暂不可做),但该文的建模思路(随机效应刻画个体内变异)可与您 causal inference 中纵向数据的时变混杂识别方法进行对比,作为应用案例值得阅读全文。

8. 10.1002/sim.70603 · arXiv — Model‐Assisted Bayesian Estimators of Transparent Population Level Summary Measures for Ordinal Outcomes in Randomized Controlled Trials

  • 作者: Lindsey E. Turner, Carolyn T. Bramante, Thomas A. Murray
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: application
  • 摘要: 在随机对照试验中,有序结局较二元结局能提升统计效率,但传统比例优势模型下的比值比在比例优势假定违反时不够透明——它无法清晰反映对结局各成分的加权方式。本文针对有序结局定义了三种透明的群体水平总结测量:加权几何均值比值比、加权几何均值相对风险、加权均值风险差,并基于非比例优势模型开发了模型辅助贝叶斯估计量。该估计量借助贝叶斯bootstrap实现协变量调整后的边缘化,从而得到稳健的群体水平估计。此外,提出了一套权重方案,使得总结测量在结局顺序颠倒(最好→最差 vs. 最差→最好)下具有不变性。模拟研究显示,基于这些总结测量的检验与比例优势方法相比表现良好。文章还以COVID-OUT试验为例进行了实证分析,展示了非比例优势效应下该方法的实用性。该工作对流行病学中RCT的因果推断有直接参考价值,但其核心工具(贝叶斯bootstrap)与您武器库中熟悉的半参效率理论或debiased ML方法不同,暂时无法直接迁移。
  • 关键技术: Bayesian bootstrap, nonproportional odds model, marginalization via Bayesian bootstrap, weighted geometric mean, risk difference
  • 为什么对您有用: 本文属于流行病学领域的RCT分析方法论文,正好对应您的次要兴趣——流行病学中的因果推断应用。但方法学核心是贝叶斯bootstrap和边缘化技巧,与您非常熟悉的‘因果推断中的估计理论’(如debiased ML、高效影响函数)路径不同,武器库中缺少贝叶斯非参数bootstrap的深度理解(属于moderately_familiar之外),因此暂不可做——除非您先补充贝叶斯bootstrap理论与RCT边缘化估计的关系。

9. 10.1002/sim.70597 · arXiv — Bayesian Spatial Functional Data Clustering: Applications in Disease Surveillance

  • 作者: Ruiman Zhong, Erick A. Chacón‐Montalván, Paula Moraga
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对疾病监测中的区域聚类问题,提出了一种贝叶斯空间功能聚类模型。模型利用随机生成树(random spanning trees)将空间域划分为连续子区域,并以潜在高斯模型描述每个子区域的疾病风险演化函数(如趋势、季节、平滑模式等)。该方法将随机生成树的应用扩展到响应变量属于指数族的情形,支持非高斯似然。模型允许每个簇内的参数独立设定,提高了灵活性。在贝叶斯推断中,论文采用组合采样(composition sampling)与INLA计算边际分布,避免了可逆跳跃MCMC的计算瓶颈,提升了混合性和可行性。通过模拟研究和COVID-19(美国)、登革热(巴西)的真实数据应用,展示了模型在揭示空间疾病时空动态方面的能力。该工作为流行病学空间数据分析提供了实用的聚类工具,对您关注的应用驱动型流行病学工作有一定的参考价值,但方法学核心(贝叶斯INLA/随机生成树)与您的技术工具箱距离较远,目前暂不可直接迁移。
  • 关键技术: random spanning trees, latent Gaussian models, integrated nested Laplace approximation (INLA), composition sampling, spatial functional clustering, exponential family response
  • 为什么对您有用: 本文聚焦于流行病学中的疾病风险动态聚类,属于您secondary_interests中的流行病学应用方向。您在对应用论文评估时,可借鉴其数据处理和空间建模思路,但论文所依赖的贝叶斯INLA和随机生成树不在您当前的technical arsenal中,难以直接复现或改进;属于暂不可做的方向。不过,作为入门读物了解空间流行病学方法是有价值的。

10. 10.1002/sim.70573 — Proportional Hazards Regression for Interval‐Censored Outcomes With an Interval‐Censored Covariate

  • 作者: Dongdong Li, Yue Song, Wenbin Lu, Huldrych F. Günthard, Roger Kouyos, Rui Wang
  • 期刊/来源: Statistics in Medicine
  • 机构: Harvard University · Harvard Pilgrim Health Care · North Carolina State University · University of Zurich · University Hospital of Zurich
  • 分类: vol 45 · issue 10-12
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对区间删失结局和区间删失协变量同时存在的比例风险回归问题,提出一种估计与推断方法。研究动机来自HIV治疗中断后病毒反弹时间的预测,需要利用ART开始后病毒抑制时间(区间删失)来预测病毒反弹时间(区间删失)。方法采用非参数基线风险函数,通过剖似然估计回归系数,并建立了渐近正态性等大样本性质。为处理同一患者多次治疗中断的重复观测,方法进一步推广到聚类数据情形。模拟研究验证了有限样本性能,在瑞士苏黎世原发HIV感染队列中的应用发现,ART后病毒抑制时间越长,病毒反弹风险越高。对您来说,这篇论文展示了处理复杂删失结构的方法学进步,与您的流行病学次级兴趣及非参数生存分析经验直接相关。
  • 关键技术: interval censoring, proportional hazards model, nonparametric baseline hazard, profiling likelihood, clustered data, asymptotic normality
  • 为什么对您有用: 本文针对流行病学中的区间删失问题提出了新的回归方法,与您的流行病学次级兴趣高度吻合。您熟悉的非参数统计和M估计理论可直接用于评估该方法在更一般删失机制下的表现。这是一个中期可做的方向:需熟悉区间删失的渐近理论和剖似然技巧(属于您中等熟悉的M估计范畴),但武器库足以支撑后续改进。

11. 10.1002/sim.70614 · arXiv — Influence Analyses of “Designs” for Evaluating Inconsistency in Network Meta‐Analysis

  • 作者: Kotaro Sasaki, Hisashi Noma
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 4/10 · novelty: new_method
  • 摘要: 本文针对网络荟萃分析(NMA)中一致性假设的评估问题,指出传统基于检验的方法存在统计功效不足、处理多臂试验困难等缺陷。作者提出了一套基于影响诊断的替代框架,通过‘逐设计剔除’(leave-one-design-out)分析,量化每个‘设计’(design)对整体结果的驱动力。具体提出了四种新诊断量:平均学生化残差、MDFFITS、Cooks距离的变体及DfBetas的变体,并综合为O值用于优先级排序。此外,还构建了基于剔除框架的置换检验。在抗高血压药物NMA的真实数据及模拟研究中,新方法能准确定位潜在的不一致性来源。该方法为传统检验提供了补充视角,尤其适用于探索偏倚来源和敏感性分析。对您而言,本文的连接点在于:流行病学中证据合成方法的一致性问题与因果推断中的无混杂假设类似,其诊断思路可迁移至您关注的观测研究敏感性分析;您熟悉的非参数估计和M估计理论可用于验证这些诊断量的统计性质,属于立即可做的方向。
  • 关键技术: network meta-analysis, influence diagnostics, leave-one-design-out, studentized residual, MDFFITS, O-value
  • 为什么对您有用: (1) 直接对应您的secondary interest中的流行病学应用,提供了网络荟萃分析中评估不一致性的新方法学框架,替代传统检验; (2) 您掌握的estimation theory和nonparametric statistics可立即用于分析这些诊断量的稳健性和渐近性质(例如,用influence function解释leave-one-out估计的偏差); (3) 立即可做:您可以用自己的软件开发和因果推断知识实现并扩展这些诊断方法到纵向或复杂设计中。

12. 10.1002/sim.70572 — Innovative Clinical Trial Approach for Evaluating Digital Medical Devices Under European Fast‐Track Regulatory Frameworks

  • 作者: Moreno Ursino, Sandrine Boulet, Corinne Collignon, Florence Francis‐Oliviero, Edouard Lhomme, Raphaël Porcher et al.
  • 期刊/来源: Statistics in Medicine
  • 机构: Inserm · Université Paris Cité · Sorbonne Paris Cité · Santé Publique France · Université de Bordeaux · Centre Hospitalier Universitaire de Bordeaux · Bordeaux Population Health · Institut national de recherche en sciences et technologies du numérique 等
  • 分类: vol 45 · issue 10-12
  • 相关性 2/10 · novelty: application
  • 摘要: 针对欧盟快速审批框架下数字医疗设备(DMD)的临床评估,本文提出一个统计分析框架,整合临床试验数据和真实世界数据(RWD)。框架包含三个关键步骤:(1) 临床试验数据的中期分析,支持临时监管授权并允许收集RWD;(2) 临床试验数据的最终分析;(3) 元分析合并临床试验数据和RWD,前提是已获得临时授权。文中引入若干指标以优化中期分析及临时申请的时机。通过广泛的模拟研究评估框架性能,并建议配合DMD广泛使用后的上市后评估(类似IV期研究)。本文直接连接您对流行病学应用和因果推断中结合RCT与观测数据的兴趣。
  • 关键技术: interim analysis, meta-analysis, real-world data, clinical trial design, simulation study
  • 为什么对您有用: 本文属于流行病学领域的应用性工作,关注真实世界数据在医疗器械审批中的统计整合,与您对因果推断的应用兴趣(流行病学队列研究)高度相关。您可以使用熟悉的因果推断估计理论(如倾向得分、双重稳健估计)来审视RWD与试验数据合并时的混杂调整,属于中期可做:需要先在识别理论(moderately_familiar)上进一步提升,以设计更严谨的因果识别策略。

13. 10.1002/sim.70594 — Authors' Response to Comments by Di Tanna et al.

  • 作者: Heejung Bang, Hongwei Zhao
  • 期刊/来源: Statistics in Medicine
  • 机构: University of California, Davis · University of Utah · Utah Department of Health
  • 分类: vol 45 · issue 10-12
  • 相关性 0/10 · novelty: minor
  • 摘要: 本文是对 Di Tanna 等人评论的回应,讨论在成本-效果分析 (CEA) 中进行 meta 分析 (MA) 的方法学问题。作者首先承认原始论文中已指出的局限性,包括研究可组合性、货币协调以及成本与效果间相关性的处理。针对评论者提出的四点意见,作者逐一回应:强调可组合性对于 MA 的重要性,但指出在 CEA 中严格标准会导致纳入研究过少,因此其原例仅作统计演示;同时说明原始分析未进行货币转换是出于演示目的,并引用 Bagepally 等人的指南作为规范参考。在相关性方面,作者指出其方法通过 bootstrap 楔形区间和置信椭圆考虑了成本与效果的联合分布,但未使用双变量 meta 模型以降低数据需求。最后,作者呼吁生物统计学家与卫生经济学家合作,发展更系统的 CEA 合并框架,并承认其方法仅作为初步原型。本文未提出新统计方法,也未提供新数据集或模拟验证。对于关注流行病学应用的研究者,本文可作为 meta 分析在卫生经济评估中实际问题的入门讨论,但技术贡献有限。
  • 关键技术: meta-analysis, cost-effectiveness analysis, incremental cost-effectiveness ratio (ICER), bootstrap confidence interval, sensitivity analysis
  • 为什么对您有用: 本文属于流行病学应用领域的 meta 分析方法论讨论,与您的次要兴趣(流行病学应用)直接相关。虽然本文未提供新方法或数据,但所讨论的合并成本与效果数据的问题——如何处理研究间异质性、货币转换、相关性——是流行病学中因果推断(如 IV 或中介分析)中常见的数据组合难题。您目前的技术库中,非参数统计和基于估计的因果推断方法可用来改进此类合并估计的稳健性,例如用权重或非参数 bootstrap 替代简单的矩估计。这篇文章适合作为入门读物,了解 CEA 中 meta 分析的实际痛点,但因其缺乏理论深度和技术细节,不值得深入阅读全文。

其他 (other, 2 篇)

1. 10.1002/sim.70601 — Longitudinal Sparse Single‐Omics Factor Analysis for High‐Dimensional Blood Biomarkers in Alzheimer's Disease

  • 作者: Haotian Zou, Rima Kaddurah‐Daouk, Sheng Luo, Alzheimer's Disease Neuroimaging Initiative
  • 期刊/来源: Statistics in Medicine
  • 机构: Duke University
  • 分类: vol 45 · issue 10-12
  • 相关性 6/10 · novelty: application
  • 摘要: 在阿尔茨海默病(AD)纵向高维稀疏组学数据设定下,目标是识别哪些组学视图与MCI患者痴呆发病时间显著关联。本文提出纵向稀疏单组学因子分析(LS-SOFA)框架,对每个组学视图用视图特异的潜在因子与特征权重矩阵建模,并通过functional principal component analysis(FPCA)捕捉时间动态。提取的FPC scores被纳入生存模型以检验各组学视图与痴呆风险的关联,同时提出基于协方差的估计算法以降低大规模数据的计算与内存开销。模拟显示LS-SOFA在纵向估计精度与假设检验稳定性上优于竞争方法;ADNI数据应用发现血浆脂质组学与血清代谢组学在FDR校正后显著关联。对您可能有用:该框架将FPCA降维与生存模型检验结合,为流行病学队列中高维纵向数据的因果/关联筛选提供了一种计算可行的pipeline。
  • 关键技术: functional principal component analysis, sparse factor analysis, covariance-based estimation, survival model integration, FDR adjustment
  • 为什么对您有用: (1) 连接到流行病学(epidemiology)子方向——ADNI队列中高维纵向组学与痴呆发病时间的关联筛选;(2) 武器库中 high-dimensional asymptotics 与 minimax bounds 可用于审视其 covariance-based 估计在高维稀疏设定下的理论保证(当前论文偏算法/应用,缺严格高维理论);(3) 属于 gateway-reading:对想进入 AD 流行病学高维数据分析的统计学者是好入门读物,数据结构与 pipeline 清晰,但方法学 novelty 为应用级,不值得花时间深读理论细节。

2. 10.1002/sim.70578 · arXiv — Fiducial Confidence Intervals for Agreement Measures Among Raters Under a Generalized Linear Mixed Effects Model

  • 作者: Soumya Sahu, Thomas Mathew, Dulal K. Bhaumik
  • 期刊/来源: Statistics in Medicine
  • 分类: vol 45 · issue 10-12
  • 相关性 4/10 · novelty: application
  • 摘要: 本文在三级设计(多个评分者、多个受试者、多次测量时间点)下,基于广义线性混合模型推广了经典一致性相关系数(CCC)。提出使用fiducial推断方法构造CCC的置信区间,通过模型线性化适配fiducial框架。模拟结果显示该方法在覆盖概率和期望宽度上优于传统的Fisher Z变换方法,甚至在中等样本量下表现更优。两个真实应用来自临床试验(膝关节炎疼痛评估)和神经影像学(皮质脊髓束成像),展示了方法的实用性。虽然方法学创新属于经典推断框架的扩展,但其对离散/连续响应数据的统一处理在流行病学评分者一致性分析中具有直接应用价值。
  • 关键技术: fiducial inference, generalized linear mixed effects model, concordance correlation coefficient, confidence interval construction, Fisher Z-transformation
  • 为什么对您有用: 本文连接流行病学中的评分者间一致性评估,属于您的secondary interest(流行病学应用)。研究方法基于经典统计推断(置信区间),与您的primary interest 'mathematical statistics & hypothesis testing'有交叉。您可以用非常熟悉的 'estimation theory in causal inference' 中的效率比较框架来审视该方法相对于Fisher Z的效率增益,或利用 'software development' 技能将其实现为通用R包。该文方法无需额外工具即可在流行病学数据上复现,属于立即可做的应用型工作。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论