跳转至

SMMR — Vol 35 Issue 3 · 2026-06-19

  • 共 14 篇 · Statistical Methods in Medical Research
  • 目录核对 ✅ 14 篇全部抓到(对照 OpenAlex 14 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期《SMMR》第35卷第3期的14篇论文整体聚焦于生存分析与删失数据处理纵向数据与联合建模、以及假设检验与贝叶斯借用三条主线。生存分析方向集中了约半数论文,覆盖右删失分位数比较、区间删失动态预测、患病-死亡模型区分度、非比例风险治愈模型、相对生存监控(CUSUM)等子问题;纵向数据方向包括聚类、特征选择、多有序响应联合建模;假设检验则涉及生存分位数检验和成分数据置换检验。此外,贝叶斯方法在联合模型特征选择与真实世界数据借力中反复出现,半参数方法(copula PCA、ODE风险建模)和生物信息学工具(基因网络分析)各有一篇代表。

生存分析与删失数据处理是本期的核心主线。针对右删失数据,临床设计单/多分位数比较一文用Bootstrap替代核密度估计简化方差估计,推导了功效公式并重新分析不满足PH假设的III期试验。基于ODE的分布回归将风险函数参数化为自治常微分方程,通过吸引子和相图刻画不同协变量值对应的定性风险形状(上升、驼峰等),后验渐近正态性支持快速近似推断。非比例风险治愈模型扩展GTDL模型同时允许时变风险和治愈分数,用胃癌数据展示长期幸存者场景。相对生存CUSUM监控将时序监控拓展至超额风险框架,利用对数似然比累积和检测注册数据中存活分布的变点。区间删失方面,患病-死亡模型区分性能比较了忽略区间删失与多种处理区间删失的实现(msm、SmoothHazard),证实参数估计与区分度评估均需考虑删失机制;纵向标记动态预测则提出适应区间删失结构的AUC与Brier score,对比联合模型与landmark方法。

纵向数据与贝叶斯借力构成另一条显眼主线。纵向聚类用权重递减的离散随机概率测度(狄利克雷过程先验)自动识别轨迹组,特别适用于儿童肥胖轨迹检测。联合模型贝叶斯特征选择将修正的BSGS先验引入纵向风险因子与CVD事件的联合模型,刻画组内特征相关性,实证中收缩压、血糖等被选中。多元有序纵向数据联合分位数回归用伪复合拉普拉斯分布构造似然,处理多响应非正态误差。混合贝叶斯先验提出EQPS-鲁棒MAP方法,通过倾向得分分层消除基线差异,再分层动态调整外部RWD权重,并用等价概率权控制偏倚,在药物开发中整合国内外数据。其余论文如成分数据置换检验(PERLOG用成对对数比降维后置换)、聚类竞争风险缺失事件类型(加权惩罚偏似然与多重插补)、截断高斯copula PCA(处理零膨胀微生物组数据)则分别贡献了假设检验、缺失数据处理与高维降维的工具。

对于因果推断方向,可优先关注混合贝叶斯先验(倾向得分分层与外部数据借力)、聚类竞争风险缺失事件类型(原因别比例风险脆弱模型)和联合模型贝叶斯特征选择(纵向暴露-事件关联);半参数方向可看截断高斯copula PCA(半参数降维)与基于ODE的分布回归;高维方向可关注copula PCACiFGNA基因网络分析(KL散度量化通路差异)。

非参数 / 半参数 (nonparam_semipara, 2 篇)

1. 10.1177/09622802251412844 · arXiv — Truncated Gaussian copula principal component analysis with application to pediatric acute lymphoblastic leukemia patients’ gut microbiome

  • 作者: Lei Wang, Yang Ni, Irina Gaynanova
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 443-455
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对微生物组数据的高维、偏态及零膨胀特点,提出一种基于截断潜高斯copula模型的半参数主成分分析方法。该方法通过潜变量框架将观测到的零膨胀计数数据与潜在高斯变量连接,并引入截断机制处理零值,从而在非高斯设定下仍能有效估计主成分得分与载荷。与传统的基于高斯假定的PCA以及忽略零膨胀的copula PCA相比,新方法在多种变换设定下的模拟研究中均得到更准确的得分和载荷估计。在实际应用中,该方法被用于分析儿童急性淋巴细胞白血病患者化疗前的肠道微生物组数据,所得主成分得分与后续化疗期间不良事件的关联最强,为预测感染风险提供了有力工具。本文的方法融合了半参数copula建模与高维降维技术,对处理类似结构的高维生物医学数据具有借鉴意义。对于您而言,该文直接连接流行病学中微生物组数据的分析需求,而您武器库中的“非参数统计”与“高维渐近”可用于评估该方法的收敛性质或探索更高效的理论界。
  • 关键技术: truncated Gaussian copula, semiparametric PCA, latent variable model, zero-inflated count data, score and loading estimation
  • 为什么对您有用: 本文属于流行病学应用(肠道微生物组与化疗不良事件关联),是您secondary interest中明确列出的领域。方法上涉及半参数copula模型,您moderately_familiar的“半参数理论”可用于评估其是否达到最优估计效率(如影响函数推导),而very_familiar的“高维渐近”与“非参数统计”可用于分析其在高维稀疏设定下的相合性。中期可做:需先在“半参数理论”上补全这一方向的工具(当前moderately_familiar),才能系统研究该方法的理论性质。

2. 10.1177/09622802251412840 · arXiv — Hazard-based distributional regression via ordinary differential equations

  • 作者: Jose A Christen, Francisco J Rubio
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 571-587
  • 相关性 3/10 · novelty: new_method
  • 摘要: 在参数生存回归框架下,本文目标是克服传统比例风险/加速失效时间模型中基线风险形状受限的问题,通过自治常微分方程(ODE)系统对风险函数建模,关键假设是ODE参数可由协变量经变换线性预测映射。核心机制是利用ODE系统的吸引子与相图解释性,将不同协变量值映射到定性不同的风险形状(如上升、下降、驼峰型),而非仅依赖单一基线风险;估计采用贝叶斯MCMC并行计算对数后验,并推导了后验渐近正态性条件以支持快速近似推断。实证部分用交叉生存曲线的临床试验数据与癌症复发数据展示了干预效应如何随患者特征改变风险动态。对您可能有用:ODE参数化风险模型为半参数/非参数生存分析提供了一个结构化替代方案,其渐近正态性推导与贝叶斯计算工具对统计计算方向有参考价值。
  • 关键技术: ODE-based hazard modeling, autonomous system attractors, Bayesian MCMC parallelization, posterior asymptotic normality, transformed linear predictors, crossing survival curves
  • 为什么对您有用: 本文连接到非参数/半参数理论(结构化风险建模替代传统半参数Cox模型)与统计计算(ODE求解与并行贝叶斯推断)。用您 very_familiar 的 M-estimation 理论与高维渐近工具可以审视其后验渐近正态性条件的紧性与一般化潜力,用 software development 经验可评估其并行计算框架的可扩展性。中期可做:需先在 moderately_familiar 的 M-estimation 理论上长肌肉,以将此ODE参数化框架的渐近理论从贝叶斯后验推广到频率学派M-估计量的极限理论。

数理统计 / 假设检验 (hypothesis_testing, 2 篇)

1. 10.1177/09622802251415363 · arXiv — Designing clinical trials for the comparison of single and multiple quantiles with right-censored data

  • 作者: Beatriz Farah, Olivier Bouaziz, Aurélien Latouche
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Indian Council of Agricultural Research · Mathématiques Appliquées à Paris 5 · Brain Mapping Foundation · Centre d'Etudes et De Recherche en Informatique et Communications
  • 分类: vol 35 · issue 3 · pp 626-636
  • 相关性 5/10 · novelty: application
  • 摘要: 本文针对右删失数据下的生存分析,考虑两组间分位数比较的临床试验设计问题,基于Kosorok(1999)提出的分位数相等检验,推导了新的功效计算公式,适用于单个分位数以及多个分位数(J个分位数)的同时比较。在零假设下,单分位数检验统计量渐近服从正态分布,多分位数检验统计量渐近服从自由度为J的卡方分布。检验统计量的方差依赖于失效时间密度函数在待检验分位数处的估计;本文提出用重抽样方法(bootstrap)替代原方法的核密度估计来估计该密度,简化了实际应用。通过模拟研究验证了所提功效公式的准确性,并将检验方法应用于一项不满足比例风险假设的III期随机临床试验的重新分析。本文为以生存分位数为终点的临床试验提供了实用的设计和分析工具,尤其适用于比例风险假设不成立的场景。对您而言,该工作直接关联假设检验功效分析及重抽样技术,且分位数比较框架可迁移至因果推断中分位数处理效应的假设检验问题。
  • 关键技术: quantile comparison test, power analysis, resampling-based density estimation, survival analysis, right-censored data, Kosorok test
  • 为什么对您有用: 本文直接涉及假设检验中的分位数检验和功效公式,贴合您对数学统计与假设检验的兴趣。您非常熟悉的非参数密度估计和重抽样方法可用于评估或改进本文的密度估计策略(如比较核密度估计与bootstrap的有限样本表现),这是立即可做的研究方向。此外,临床试验中分位数终点的比较思路可迁移至因果推断中的分位数处理效应及其检验,属于中期可拓展的交叉点。

2. 10.1177/09622802251413737 — A permutation test of differences between externally or internally defined groupings in compositional data sets

  • 作者: Nikola Štefelová, Javier Palarea-Albaladejo, Josep Antoni Martín-Fernández
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Universitat de Girona
  • 分类: vol 35 · issue 3 · pp 601-625
  • 相关性 5/10 · novelty: new_method
  • 摘要: 针对成分数据(compositional data)中的组间差异检验问题,提出一种基于成对对数比(pairwise logratio)的非参数置换检验方法 PERLOG。该方法将高维成分数据降维为所有成对对数比的集合,再通过置换检验判断分组是否显著,适用于外部因子定义的分组和内部特征(如零模式)产生的分组。与传统的多元检验(如 MANOVA 型检验)相比,PERLOG 不依赖分布假设,更适合成分数据的闭合性和相对信息结构。模拟研究表明该方法在控制第一类错误和检验功效上表现稳健。实例分析使用运动行为与时间使用流行病学数据,展示了实际应用场景。该方法在方法论层面提供了一种简单有效的成分数据分组检验工具,但对检验的渐近理论(如功率函数、替代假设下的一致性)未作深入探讨。对您而言,如果您关注假设检验在非标准数据类型(如成分数据)中的扩展,该文可作为应用案例;但其理论深度有限,不涉及您熟悉的 minimax 界或高阶 U 统计工具。
  • 关键技术: permutation test, pairwise logratio, compositional data, zero pattern grouping
  • 为什么对您有用: 本文属于假设检验在成分数据中的应用,与您的 primary interest 中“mathematical statistics (hypothesis testing)”方向相关,但方法学创新停留在非参数置换检验层面,未涉及渐近效率或 minimax 理论。您对非参数统计非常熟悉,可快速理解置换流程,但成分数据的闭合性结构(对数比变换)是您武器库中较少接触的领域;如果您想进入该方向,需要先熟悉成分数据的基本几何(如 Aitchison 空间)。总体而言,本文是中等相关度的应用型方法论文,适合作为假确实验设计的参考资料,但不值得深度阅读。

流行病学 (epidemiology, 8 篇)

1. 10.1177/09622802251414594 — Cluster analysis for longitudinal data and its application in the detection of adiposity trajectories

  • 作者: Asael Fabian Martínez, Ivonne Ramírez-Silva, Ruth Fuentes-García
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Universidad Autónoma Metropolitana · Instituto Nacional de Salud Pública · Universidad Nacional Autónoma de México
  • 分类: vol 35 · issue 3 · pp 588-600
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文针对纵向数据聚类问题,提出一种基于离散随机概率测度的混合模型,该测度权重按递减顺序构造,无需协变量且假设个体测量间独立。方法利用狄利克雷过程先验,通过后验推断自动识别潜在的轨迹组,同时提供了一个融合估计组的简单程序以避免过多分组。与传统的基于增长曲线或混合效应模型的方法不同,本文的方法不依赖协变量调整,简化了建模步骤。方法的核心机制是权重递减的离散随机概率测度,使得先验倾向于少数主导簇,从而更好地捕捉稀疏聚类结构。通过模拟和墨西哥儿童POSGRAD队列数据,作者展示了方法有效检测出肥胖轨迹的簇,并给出了各轨迹的临床解释。本研究对流行病学中纵向数据聚类应用具有参考价值,尤其在儿童生长发育轨迹分析中。
  • 关键技术: Dirichlet process mixture, discrete random probability measure with decreasing weights, Bayesian nonparametric clustering, longitudinal trajectory clustering, posterior inference for mixture models
  • 为什么对您有用: 本论文属于流行病学应用(连接到secondary interest:epidemiology),利用纵向聚类方法识别儿童肥胖轨迹,提供了一个实际数据分析案例。武器库中非参数统计(very_familiar)可辅助理解其混合模型框架,但贝叶斯非参数推断(MCMC后验计算)不在当前武器库内,因此暂不可做方法层面的直接拓展,可作为入门流行病学数据分析的阅读材料。

2. 10.1177/09622802251414939 · arXiv — Bayesian feature selection in joint models with application to a cardiovascular disease cohort study

  • 作者: Mirajul Islam, Michael J Daniels, Zeynab Aghabazaz, Juned Siddique
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 637-652
  • 相关性 4/10 · novelty: application
  • 摘要: 在心血管疾病(CVD)队列研究的联合模型设定下,目标是识别纵向风险因子轨迹特征与 CVD 事件时间的关联,核心假设为双层(组间/组内)稀疏结构及组内特征相关性。本文将 Bayesian sparse group selection (BSGS) 先验首次引入联合模型,并对其进行修正以刻画组内特征相关性,从而在组水平(纵向风险因子)与组内水平(轨迹特征)同时实现双层变量选择。修正先验在保留重要特征的选择能力上与 BSGS 相当,但在排除组内不重要特征时更高效,理论支撑依赖于贝叶斯后验收敛性质及相关性调整的先验结构。模拟与 ARIC 队列(n>15000,7 次测量)实证表明收缩压、舒张压、血糖和总胆固醇为关键风险因子,且其轨迹的不同特征与 CVD 死亡相关。对您可能有用:本文提供了流行病学纵向队列中联合模型贝叶斯双层选择的完整应用范式,可作为 epi 数据集与因果/纵向建模的入门参考。
  • 关键技术: joint model for longitudinal and survival data, Bayesian sparse group selection prior, bi-level variable selection, within-group correlation adjustment, posterior shrinkage
  • 为什么对您有用: 本文属于流行病学应用范畴,连接到 epidemiology 的纵向队列因果/关联建模子方向。(1) 作为 gateway reading:ARIC 队列数据结构(纵向+事件时间)清晰展示了流行病学中联合模型的典型数据形态与建模需求,对不熟悉 epi 数据的研究者是较好的入门读物;(2) 武器库支撑:研究者的 very_familiar(软件开发)与 moderately_familiar(M-estimation theory, semiparametric theory)足以支撑进入此方向,但本文核心是贝叶斯先验构造而非半参数效率理论,方法论迁移口子有限;(3) 值得花时间读全文吗:若关注 epi 真实数据集与纵向-生存联合建模的应用范式,值得浏览数据与模型设定部分;若寻求方法论 novelty 或与自身效率理论的直接对接,则不必深读。

3. 10.1177/09622802251415022 · arXiv — Statistical methods for clustered competing risk data when the event types are only available in a training dataset

  • 作者: Yujie Wu, Ce Yang, Molin Wang
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 667-677
  • 相关性 4/10 · novelty: application
  • 摘要: 该论文针对聚类竞争风险数据,其中事件类型仅在训练数据集中可用而主研究中缺失,目标为估计暴露对原因别风险的影响。提出基于原因别比例风险脆弱模型的加权惩罚偏似然方法,权重由训练集上拟合的分类模型预测事件类型概率得到。同时提出多重插补方法,基于分类模型预测对缺失事件类型进行插补。推导了两种方法的解析方差,并通过大量模拟评估有限样本性质。以耳鸣与代谢性、感觉性及代谢+感觉性听力损失之间的关联为实例进行应用。该方法为流行病学中缺失数据与聚类结构共存下的竞争风险分析提供了实用工具,与您对流行病学应用数据集的次要兴趣直接相关。
  • 关键技术: cause-specific proportional hazards frailty model, weighted penalized partial likelihood, multiple imputation, clustered competing risks, classification model for event type prediction
  • 为什么对您有用: 本文是流行病学中竞争风险分析的应用工作,直接对应您的次要兴趣 epidemiology(应用数据集与因果推断)。文中对缺失事件类型的处理(权重与插补)可迁移至因果推断中缺失结局或处理变量的场景,您对 estimation theory in causal inference 的熟悉程度有助于理解其因果解释。作为 gateway reading,该文清楚展示了真实数据的分析流程与模型假设,值得花时间阅读全文以积累流行病学分析模式。

4. 10.1177/09622802251412838 — Joint modeling of composite quantile regression for multiple ordinal longitudinal data with its applications to a dementia dataset

  • 作者: Shuqing Liang, Lina Bian, Qi Yang, Yuzhu Tian, Maozai Tian
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Khulna University · Northwest Normal University · Renmin University of China
  • 分类: vol 35 · issue 3 · pp 507-536
  • 相关性 4/10 · novelty: new_method
  • 摘要: 针对多元有序纵向数据的联合建模问题,传统均值回归在处理非正态误差时表现不佳。本文提出了基于复合分位数回归(CQR)的联合相对CQR方法,利用伪复合非对称拉普拉斯分布(PCALD)和潜变量模型构造似然,并通过MCMC算法进行参数估计。该方法能够同时处理多个有序响应变量之间的相关性,并提供比均值回归更稳健的估计。蒙特卡洛模拟验证了方法的有效性,并在一个痴呆症纵向数据集上进行了实证分析。研究展示了CQR在医学纵向数据中的实用性,尤其适用于多结局、非正态误差的场景。对您而言,这篇文章可作为流行病学中多响应纵向数据分析的参考案例,但核心工具(分位数回归)并非您当前武器库的重点,属于中期可拓展方向。
  • 关键技术: composite quantile regression, pseudo composite asymmetric Laplace distribution, latent variable model, MCMC, multivariate ordinal longitudinal data
  • 为什么对您有用: 本文属于流行病学应用论文,涉及多响应有序纵向数据的联合建模,与您二级兴趣中流行病学的数据集和分析方法契合。您的'identification theory in causal inference'和'estimation theory in causal inference'可帮助检验该方法是否可用于因果中介分析或多重代理结果,但分位数回归和MCMC工具不在当前武器库核心(very_familiar)中,属中等熟悉领域。因此,这是一篇值得了解但暂不可直接迁移研究的应用文章,需要先补充分位数回归和潜变量建模的基础。

5. 10.1177/09622802251414586 · arXiv — A hybrid prior Bayesian method for combining domestic real-world data and overseas data in global drug development

  • 作者: Keer Chen, Zengyue Zheng, Pengfei Zhu, Shuping Jiang, Nan Li, Jumin Deng et al.
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 552-570
  • 相关性 3/10 · novelty: new_method
  • 摘要: 本文针对全球化药物开发中整合国内真实世界数据(RWD)与海外临床试验数据的统计挑战,提出一种混合贝叶斯框架EQPS鲁棒MAP先验(rMAP)。方法分三步:首先通过倾向得分分层消除基线协变量差异;然后构建分层MAP先验动态调整外部数据权重;最后引入等价概率权重量化数据冲突风险,控制偏倚。模拟和回顾性案例分析(以Risankizumab治疗银屑病为例)显示,EQPS-rMAP在控制异质性和偏差方面优于传统MAP、PSMAP和经验贝叶斯MAP方法,同时降低样本量需求。与您对流行病学中RWD整合和因果推断中外部数据利用的兴趣直接相关,其倾向得分分层和动态借力策略值得关注。
  • 关键技术: Meta-Analytic Predictive (MAP) prior, propensity score stratification, equivalence probability weights, dynamic borrowing, hybrid Bayesian framework
  • 为什么对您有用: 本文属于流行病学中真实世界数据整合的应用,与您对因果推断中外部数据异质性控制的兴趣紧密相连。您非常熟悉的'estimation theory in causal inference'武器可直接用于评价其倾向得分分层的合理性(如平衡性检验和偏差校正)。但完整的动态借力方法基于Bayesian先验,不在当前武器库中,成为中期可做的方向——需要先系统学习Bayesian自适应设计框架。

6. 10.1177/09622802251414429 — A non-proportional hazards cure model with an application to gastric cancer data analysis

  • 作者: N Balakrishnan, M Mar Fenoy, M Carmen Pardo
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: McMaster University · Universidad Complutense de Madrid
  • 分类: vol 35 · issue 3 · pp 653-666
  • 相关性 3/10 · novelty: application
  • 摘要: 论文针对存在治愈患者(长期幸存者)的生存数据,提出一种非比例风险治愈模型,扩展了 MacKenzie (1996) 的 GTDL 模型。新模型同时允许非比例风险假设和治愈分数,通过时变 logistic 形式刻画风险函数。推断采用极大似然估计,并通过 Monte Carlo 模拟评估有限样本性能。应用于胃癌真实数据,展示模型在存在长期幸存者时的拟合优度和解释能力。对您而言,本文提供了流行病学中癌症生存数据的分析范例,其治愈模型可作为间接评估治疗效果的建模工具,值得作为流行病学应用的入门读物。
  • 关键技术: Cure model, GTDL (generalized time-dependent logistic) model, Non-proportional hazards, Maximum likelihood estimation, Monte Carlo simulation, Gastric cancer data analysis
  • 为什么对您有用: 本文属于流行病学应用(secondary interest),提供一个含治愈分数的生存分析建模框架,可用于治疗效果的长期评估。武器库中的‘nonparametric statistics’虽不能直接检验模型参数假设,但可辅助检验比例风险假设是否偏离。作为 gateway reading,本文对流行病学数据分析的读者友好,值得花时间阅读全文,但若想深入方法改进,需先熟悉 survival analysis 的 EM 算法和 cure model 辨识性工具。

7. 10.1177/09622802251411540 · arXiv — Monitoring time to event in registry data using CUSUMs based on relative survival models

  • 作者: Jimmy Huy Tran, Jan Terje Kvaløy, Hartwig Kørner
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 488-506
  • 相关性 2/10 · novelty: application
  • 摘要: 本文研究基于健康注册数据监测疾病生存时间分布是否随时间发生变化的统计监控问题,核心 estimand 为超额风险(excess hazard)的变点,关键假设为总风险等于人群基础风险加疾病超额风险且死因信息缺失/不确定。作者提出基于生存对数似然比的 CUSUM 控制图方法,将传统时间-事件监控扩展至相对生存(relative survival)框架下的超额风险设定。该方法在监控过程中动态纳入人群基础风险的时间演变及由协变量解释的超额风险变化,利用 log-likelihood ratio 构建累积和检验统计量。理论部分讨论了该监控程序的统计性质与实际挑战,实证部分展示了其在癌症注册数据中的应用。对您可能有用:本文展示了在流行病学注册数据中处理死因缺失时如何用相对生存框架做变点监控,是因果/生存推断与监控方法交叉的应用案例。
  • 关键技术: CUSUM control chart, relative survival model, excess hazard modeling, log-likelihood ratio, time-to-event surveillance
  • 为什么对您有用: 本文属于流行病学应用与数据集方向,展示了在癌症注册数据(死因缺失)下用相对生存模型做变点监控的完整 pipeline,是了解注册数据结构与生存监控方法的入门级读物。您的武器库(M-estimation 理论、软件开发)足以支撑理解与复现该方法,但核心是 CUSUM 监控理论而非您主攻的因果/效率理论。值得花时间读全文以了解流行病学注册数据的实际结构(风险因素、人群生命表、缺失模式),但方法学 novelty 程度有限(novelty_flag = application)。

8. 10.1177/09622802251412855 · arXiv — Discrimination performance in illness-death models with interval-censored disease data

  • 作者: Marta Spreafico, Anja J Rueten-Budde, Hein Putter, Marta Fiocco
  • 期刊/来源: Statistical Methods in Medical Research
  • 分类: vol 35 · issue 3 · pp 469-487
  • 相关性 2/10 · novelty: application
  • 摘要: 本文研究 illness-death 模型中,疾病状态被区间删失(仅在预定随访时点可诊断)时,模型区分性能(time-specific AUC)的评估问题。模拟数据基于 Weibull 转移风险设定,疾病状态按规则间隔删失;比较了忽略区间删失的时依二元标记 Cox 模型与三种处理区间删失的 illness-death 模型实现(msm 包的 piecewise-constant 模型、SmoothHazard 包的 Weibull 和 M-spline 模型)。真实数据来自 2232 名高级别软组织肉瘤患者,关注术后远处转移这一区间删失终点。模拟和实证结果表明,不仅参数估计需考虑区间删失,区分性能的评估也应纳入区间删失信息,否则 AUC 估计可能偏误。对您而言,本文提供了流行病学实际数据中处理区间删失终点的完整分析流程(包括模型比较和诊断性能评价),可作为将存活分析技术与因果推断结合的入门案例。
  • 关键技术: illness-death model, interval-censored data, time-dependent AUC, Cox model, piecewise-constant hazards, M-splines
  • 为什么对您有用: 本文属于流行病学应用方向,具体展示了区间删失生存数据下疾病进展模型与区分性能评估的实践。您武器库中“非参数统计”与“因果推断估计理论”可用于分析其 AUC 估计的半参效率或提出去偏方法;“高阶 U 统计”可能为时间依赖 AUC 的方差估计提供更紧的展开。作为入门读物,本文清晰刻画了数据生成机制和模型假设,适合快速进入流行病学方法领域;但核心区间删失似然与 piecewise-constant 建模不在您当前工具集中,因此暂不可做直接的方法扩展,需先积累 interval-censored 数据分析经验。

其他 (other, 2 篇)

1. 10.1177/09622802251412849 — Dynamic prediction of interval-censored failure time data with longitudinal marker

  • 作者: Yang-Jin Kim
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Sookmyung Women's University
  • 分类: vol 35 · issue 3 · pp 456-468
  • 相关性 4/10 · novelty: application
  • 摘要: 本文研究区间删失失效时间数据与纵向标记的联合建模与动态预测问题,目标 estimand 为反映区间删失结构的动态 AUC 与 Brier score。设定中事件时间不可精确观测而仅落入区间,纵向标记通过联合模型或 landmark 方法与生存风险关联。核心方法提出针对区间删失结构的动态预测精度度量,并对比了联合模型与 landmark 方法的预测表现。理论部分未给出 n^{-1/2}-CAN 或效率界等严格渐近性质,主要依赖模拟与实证验证。实证分析将方法应用于认知评分重复测量预测痴呆发生的数据集。对您而言,本文属于纵向因果/生存分析的应用延伸,但缺乏半参数效率或高阶 U 统计量等理论深度。
  • 关键技术: joint model of longitudinal and survival data, interval-censored failure time, dynamic AUC, dynamic Brier score, landmark prediction
  • 为什么对您有用: 本文连接到 causal inference 的 longitudinal 子方向(纵向标记与生存数据的联合动态预测),但方法学 novelty 有限(仅提出区间删失下的 AUC/Brier 调整,无效率界或新估计量理论)。用您 very_familiar 的 estimation theory in causal inference 可以审视其 landmark 与联合模型的识别假设是否可嵌入半参数框架,但核心机器(区间删失似然/联合模型渐近理论)不在武器库中。判断:暂不可做——缺乏区间删失生存分析的理论基础,且本文理论贡献不足以支撑深入跟进。

2. 10.1177/09622802251411550 — CiFGNA: Comprehensive information-based functional gene network analysis

  • 作者: Heewon Park, Seiya Imoto, Satoru Miyano
  • 期刊/来源: Statistical Methods in Medical Research
  • 机构: Sungshin Women's University · Cardiovascular Institute Hospital
  • 分类: vol 35 · issue 3 · pp 537-551
  • 相关性 1/10 · novelty: application
  • 摘要: 针对异质性基因网络可解释性差的问题,该文提出CiFGNA方法,通过概率密度函数刻画表型间基因互作的差异,并利用KL散度量化每条边的差异程度。基于边得分排序后,计算每个功能通路的富集分数,以评估通路中是否存在显著集中的表型特异性互作。方法同时考虑了基因表达水平和网络拓扑结构,与仅基于基因集的传统富集分析相比提升了准确性。模拟实验和抗癌药物敏感性分析表明,CiFGNA能有效识别癌症相关通路,并区分耐药与敏感表型的关键分子(如CD52、EPCAM、TNFRSF12A)。该文属于生物信息学应用型工作,方法学工具较为常规(KL散度+富集检验)。与您的核心兴趣(因果推断、高维U统计等)无直接方法论连接,统计理论深度有限,不建议作为重点研读论文。
  • 关键技术: Kullback–Leibler divergence, gene set enrichment analysis, edge ranking, probability density estimation
  • 为什么对您有用: 本文不直接服务于您的primary interests(因果推断、高维统计、效率理论等),也不属于secondary interests(astrostats、econ、epi)。其方法本质是差值度量加富集检验,未使用您熟悉的U统计树宽或einsum工具。统计新颖性不足,属于常规应用,暂不可做任何follow-up。不建议投入时间。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论