SMMR — Vol 35 Issue 2 · 2026-06-19¶

共 13 篇 · Statistical Methods in Medical Research
目录核对 ✅ 13 篇全部抓到（对照 OpenAlex 13 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期《SMMR》第35卷第2期的13篇论文可大致归纳为三条主线：因果识别与推断、纵向/生存数据的联合建模与动态预测、以及高维/复杂数据下的计算与聚类方法。因果推断方向共3篇，分别处理网络干扰下的聚类混杂（混合效应模型）、时间变化工具变量对持续治疗的因果效应（2SLS扩展）、以及RCT删失结局的广义成对比较（伪观测值法）。纵向联合建模与预测是本期最密集的板块，包括多篇流行病学应用：死亡风险动态预测（基于更新入院过程）、子抽样设计下的landmarking动态预测（条件似然与IPW）、多个纵向标记与生存时间的两阶段贝叶斯联合模型、以及引入潜在疾病年龄的非线性联合模型。此外，还有一篇Binary Emax模型处理非可忽略缺失的剂量-反应分析。高维/计算方向涉及EM算法与Lasso结合的正则化线性混合模型（EMLMLasso）、基于变分贝叶斯的多视图聚类与特征选择（iClusterVB）、以及污染正态混合模型对多变量轨迹的聚类。半参数/非参数领域有一篇functional varying-coefficient Cox模型，假设检验方向则关注集群随机试验中小集群数下RMST伪值回归的方差校正。

在因果推断主线中，Joint mixed-effects models一文通过贝叶斯联合模型同时建模结局与暴露，以聚类级随机效应消除未测量混杂，并直接标准化获得处理效应，核心突破在于同时处理网络干扰和聚类混杂，无需无干扰假设。Two stage least squares with time-varying instruments将经典2SLS扩展到时变工具变量，为纵向数据中持续治疗的因果效应提供了工具变量解法，放松了无未测量混杂假设，并通过模拟展示了扩展2SLS在多种模型误设下的稳健性。这两篇与Generalized pairwise comparisons using pseudo-observations（侧重RCT中删失数据的Win Ratio估计）共同构成了本期因果推断的三种不同场景：聚类网络、纵向时变工具、以及随机化试验的删失结局。

纵向/生存联合建模是本期数量最多的主线，多篇论文围绕如何利用纵向过程预测事件风险或刻画疾病进程。Dynamic prediction of death risk given a renewal hospitalization process指出入院的时间分布（而非仅入院次数）影响死亡风险，采用更新过程模型揭示了入院集中度与风险的关系。Dynamic prediction by landmarking with data from cohort subsampling designs提供了在资源受限的子抽样设计下进行动态预测的两类实用估计（条件似然与IPW），表明少量子样本即可接近全队列精度。A two-stage joint modeling approach针对高维纵向标记与生存时间，提出两阶段贝叶斯方法：第一阶段分别估计每个标记与事件的单标记联合模型（避免信息性脱落），第二阶段将预测值作为时变协变量拟合Cox模型，并用多重插补处理不确定性。Joint model with latent disease age引入潜在疾病年龄作为时间尺度，规避参考时间不确定，虽改善幅度小但思路新颖。Robust Emax model fitting则在剂量-反应分析中处理非可忽略缺失，使用惩罚似然与修正EM算法。

高维计算与聚类方向，EMLMLasso将EM与glmnet结合，实现高维线性混合模型的变量选择，尤其在p>n场景下优于现有方法，但未提供理论性质。iClusterVB采用变分贝叶斯实现多视图混合数据聚类与特征选择，计算效率高，但理论深度有限。Grouped multi-trajectory modeling通过污染正态混合模型捕捉组内异常观测，适用于异质纵向轨迹的聚类。半参数方面，Functional varying-coefficient Cox model结合局部平滑与部分似然，估计变系数与函数型协变量效应，提供了收敛性与渐近正态性理论。

假设检验方向仅一篇，但针对集群随机试验中小集群数的常见问题给出实用解决方案：Restricted mean survival time in cluster randomized trials比较了四种夹心方差偏差校正，推荐Fay-Graubard校正与t分布组合，有效控制I型错误率。

对于因果推断方向的研究者，Joint mixed-effects models和Two stage least squares with time-varying instruments最贴近核心兴趣，前者处理网络干扰与聚类混杂，后者关注纵向工具变量；Generalized pairwise comparisons using pseudo-observations也可作为RCT中删失结局的补充参考。半参数/效率方向可关注Functional varying-coefficient Cox model中非参平滑与部分似然结合的技术路径。高维方向EMLMLasso虽无新理论，但提供了一种现成的计算实现。

因果推断 (causal_inference, 3 篇)¶

1. 10.1177/09622802251403355 · arXiv — Joint mixed-effects models for causal inference in clustered network-based observational studies¶

作者: Vanessa McNealis, Erica EM Moodie, Nema Dean
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 283-300
相关性 9/10 · novelty: application
摘要: 本文研究在聚类网络观测研究中，当存在网络干扰（network interference）和未测量的聚类级混杂（unmeasured cluster confounding）时，如何识别和估计因果效应。作者提出一个贝叶斯联合混合效应模型（joint mixed-effects model），同时对结局变量和暴露变量建模，并利用直接标准化（direct standardisation）获得平均处理效应的估计。该方法不依赖无干扰假设，通过将聚类级随机效应同时纳入结局和暴露模型来消除未测量的聚类混杂。模拟比较显示，联合模型相比线性混合效应和固定效应模型能实现无偏估计，而忽略干扰或混杂的方法则存在偏倚。应用部分采用美国国家青少年健康纵向研究（Add Health）数据，分析家庭环境对学业成绩的影响。对您而言，本文涉及的网络干扰与聚类混杂问题在纵向因果推断和流行病学实践中常见，但方法学上偏参数贝叶斯，与您熟悉的非参数/半参数因果推断工具有距离，适合作为应用场景的参考。
关键技术: Bayesian joint modeling, mixed-effects models, network interference, direct standardisation, causal inference in observational studies
为什么对您有用: 本文处理因果推断中网络干扰和未测量聚类混杂的识别问题，直接连接到您primary interest中的causal inference (identification, sensitivity analysis)子方向。若您希望进入网络干扰领域，可先用estimation theory in causal inference工具审视其识别假设的合理性（如无个体水平未测量混杂是否可信），并对比更非参数的方法（如bounded逆概率加权）。中期可做：需先在moderately_familiar中的identification theory in causal inference上深入理解现有的interference识别框架（如基于暴露映射的假设），才能评估本文方法的优势与局限。

2. 10.1177/09622802251404064 · arXiv — Two stage least squares with time-varying instruments: An application to an evaluation of treatment intensification for type-2 diabetes¶

作者: Daniel Tompsett, Stijn Vansteelandt, Richard Grieve, John Robson, Manuel Gomes
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 346-369
相关性 9/10 · novelty: application
摘要: 本文针对纵向数据中随时间变化的治疗策略，扩展了经典的两阶段最小二乘法（2SLS）到时间变化工具变量设定，目标是在存在未测量混杂时估计持续治疗的因果效应。与通常假设无未测量混杂的g-methods不同，该方法利用工具变量来放松该假设。通过模拟研究比较了标准2SLS与扩展2SLS在不同模型设定（包括误设定）下的表现，发现扩展2SLS在多种场景中偏差较小且覆盖更稳定。还在一项2型糖尿病治疗强化的观察性研究中展示了方法的实际应用，利用医生处方偏好的外生性构造时间变化工具变量。该工作对您有用之处在于：直接对应您对工具变量和纵向因果推断的兴趣，且流行病学应用属于您的次级兴趣领域，可作为临床效评估的实用方法参考。
关键技术: instrumental variables, two-stage least squares, time-varying treatments, simulation study, time-varying instruments
为什么对您有用: 该论文处理时间变化工具变量下的因果效应估计，直接关联您的主要兴趣之一——因果推断中的IV方法，以及次级兴趣中的流行病学应用（糖尿病治疗评估）。从武器库看，您对因果推断中的估计理论非常熟悉，可以快速理解并评估扩展2SLS的计量性质。该文为典型的应用型研究，属于流行病学领域的真实数据分析，不会带来方法学障碍，属于立即可读的范畴。

3. 10.1177/09622802251406536 — Generalized pairwise comparisons using pseudo-observations for time-to-event censored data in a randomized controlled trial setting¶

作者: Stephanie Pan, Prasad Patil, Janice Weinberg, Sara Lodi, Michael P LaValley
期刊/来源: Statistical Methods in Medical Research
机构: Boston University
分类: vol 35 · issue 2 · pp 413-425
相关性 6/10 · novelty: new_method
摘要: 本文针对随机对照试验（RCT）中带有删失时间-事件结局的广义成对比较（GPC）方法，其核心参数是处理效应的Win Ratio（WR）。现有GPC方法在删失比例较高时会产生大量不确定对，导致WR估计偏倚。作者提出利用基于Kaplan-Meier估计的伪观测值替代删失观测，从而确定每对治疗的胜负。仿真比较了相等脱落和不等脱落情景，显示新方法在不等脱落下能降低偏倚和均方根误差，但统计功效未改善；在相等脱落下与原方法（Gehan、Latta）结果相当。最后用两个重建的RCT数据集演示了该方法的实际表现。该工作直接涉及因果推断中处理效应的估计问题，对您研究RCT中的因果参数估计和删失数据处理有参考价值。
关键技术: Generalized pairwise comparisons (GPC), pseudo-observations, Win Ratio, Kaplan-Meier estimator, bias correction under censoring
为什么对您有用: 本文属于因果推断框架下RCT处理效应的估计方法，特别是处理删失引起的偏倚问题，与您的因果推断兴趣中的估计理论紧密相关。您非常熟悉的非参数统计和因果推断估计工具可直接用于评估该方法的理论性质（例如渐近一致性、影响函数），属于“立即可做”的分析：可以基于U-statistic或影响函数推导伪观测GPC的渐近分布，或比较其与现有方法的效率。

非参数 / 半参数 (nonparam_semipara, 1 篇)¶

1. 10.1177/09622802251406527 — Functional varying-coefficient Cox model and its application¶

作者: Fansheng Kong, Maozai Tian, Zhihao Wang, Man-lai Tang
期刊/来源: Statistical Methods in Medical Research
机构: Renmin University of China · Xinjiang University of Finance and Economics · University of Hertfordshire
分类: vol 35 · issue 2 · pp 301-312
相关性 5/10 · novelty: new_method
摘要: 在生存分析设定下，本文针对同时含变系数协变量与函数型协变量的复杂生存数据，提出了 functional varying-coefficient Cox 模型，目标是估计随时间或其它变量变化的非参数系数函数及函数型项。核心估计机制基于局部多项式/样条等非参数平滑结合 Cox 部分似然，通过迭代算法求解变系数与函数型协变量效应；理论部分给出了估计量的收敛性质与渐近正态性。模拟研究评估了有限样本表现，并在 ADNI（阿尔茨海默病神经影像）数据上进行了实证应用。对您可能有用：本文的变系数 Cox 模型属于半参数/非参数理论范畴，其部分似然与非参数平滑结合的估计路径可作为 semiparametric M-estimation 的具体案例参考。
关键技术: varying-coefficient Cox model, functional covariate smoothing, partial likelihood estimation, local polynomial / B-spline, asymptotic normality
为什么对您有用: 本文连接到 semiparametric & nonparametric theory 子方向，具体是变系数 Cox 模型的部分似然估计与渐近理论。用您 technical_arsenal 中 moderately_familiar 的 M-estimation theory 可以审视其估计量的渐近性质推导是否可进一步优化（如效率界）。Follow-up 粗判：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉以深入审视其理论推导的紧致性，但作为非参数生存分析的案例阅读立即可做。

数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶

1. 10.1177/09622802251406581 — Restricted mean survival time in cluster randomized trials with a small number of clusters: Improving variance estimation of the intervention effect from the pseudo-values regression¶

作者: Floriane Le Vilain-Abraham, Solène Desmée, Jennifer A Thompson, Jean-Claude Lacherade, Elsa Tavernier, Etienne Dantan et al.
期刊/来源: Statistical Methods in Medical Research
机构: Université de Tours · Inserm · Centre Hospitalier Universitaire de Tours · Clinical Investigation Center Plurithematic Tours · methodS in Patient-centered outcomes and HEalth ResEarch · Nantes Université · London School of Hygiene & Tropical Medicine · Centre Hospitalier Départemental Vendée
分类: vol 35 · issue 2 · pp 426-455
相关性 4/10 · novelty: application
摘要: 在集群随机试验（CRT）中，当集群数量较少（<50）时，传统的GEE夹心方差估计量会导致干预效应推断的I型错误率膨胀。本文针对受限平均生存时间（RMST）的伪值回归，评估了四种夹心方差偏差校正方法（Fay-Graubard、Mancl-DeRouen、Kauermann-Carroll、Morel）以及使用Student t分布替代正态分布进行Wald检验。模拟显示，Fay-Graubard校正与t分布的组合在非比例风险和比例风险下均能有效控制I型错误率，而其他校正方法在集群数极少时仍存在偏差。作者将该方法应用于DEMETER试验，分析特殊气管导管对呼吸机相关性肺炎的预防效果。该工作为小样本CRT提供了实用的推断策略，直接连接您的假设检验和统计计算兴趣。
关键技术: pseudo-values regression, GEE sandwich variance estimator, Fay and Graubard bias correction, Student t distribution, cluster randomized trials, finite-sample correction
为什么对您有用: 本文聚焦于小集群数场景下方差估计的有限样本校正，直接对应您primary interest中的假设检验和统计计算。方法涉及GEE夹心方差的理论偏差与校正，您可运用M估计理论和更一般的方差稳健推断经验（moderately_familiar中的semiparametric theory）来评估其校正的机制。中期可做：将该偏差校正逻辑推广至更复杂的因果推断设定（如具有多水平混杂的cluster-level IV），需先提升您moderately_familiar中的identification theory（理解cluster-level干预效应识别的特定假设）。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1177/09622802251399913 · arXiv — The use of the EM algorithm for regularization problems in high-dimensional linear mixed-effects models¶

作者: Daniela CR Oliveira, Fernanda L Schumacher, Victor H Lachos
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 240-254
相关性 8/10 · novelty: application
摘要: 本文针对高维线性混合效应模型（LMM）中的固定效应变量选择问题，提出EMLMLasso算法。该算法将EM算法与glmnet包中的Lasso回归结合，利用EM迭代处理随机效应方差分量，同时通过加权最小二乘损失调用glmnet进行稀疏估计，并内置交叉验证自动选择调优参数。在p>n的高维场景下，EMLMLasso在仿真和真实数据中均展现出比glmmLasso和splmm更优的变量选择稳健性和预测精度。方法本身扩展至岭回归或弹性网惩罚，实现简单且通用性强。本文主要贡献在于将成熟的EM框架与高效正则化软件结合，为LMM提供一种实用的计算方案，但并未提供新的理论性质（如收敛率或一致选择性）。对于您从事统计计算和算法开发的方向，该工作展示了如何将主流优化工具（glmnet）嵌入EM迭代来扩展模型适用范围，可直接借鉴其软件集成思路。
关键技术: EM algorithm, Lasso regularization via glmnet, Linear mixed-effects models, Automatic tuning parameter selection, High-dimensional variable selection
为什么对您有用: 该文连接您的统计计算兴趣（数值算法）与高维统计中的LMM正则化问题。您的武器库中software development一项可直接用于复现或改进EMLMLasso（例如替换为更快的Lasso求解器或支持随机效应选择），属于立即可做的follow-up。此外，文中实验设计（仿真与真实数据对比）可作为应用类论文的方法学参考，但理论深度有限。若您关注实际LMM中的计算瓶颈，本文提供了清晰的工程方案。

流行病学 (epidemiology, 5 篇)¶

1. 10.1177/09622802251404065 · arXiv — Dynamic prediction of death risk given a renewal hospitalization process¶

作者: Telmo Pérez-Izquierdo, Irantzu Barrio, Cristobal Esteban
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 370-393
相关性 6/10 · novelty: application
摘要: 本文针对慢性病患者提出动态预测死亡风险的通用框架，目标是在给定入院历史下估计死亡概率。方法基于死亡与入院过程的联合建模，避免因选择存活者导致的偏倚。作者强调该框架不要求入院时间独立或间隙时间独立，适用于任意入院过程模型。特别地，研究采用更新过程模型（renewal model）来刻画入院，发现入院的时间分布影响死亡风险，而不仅仅是入院次数——这与泊松模型仅考虑次数的预测结果不同。作者利用西班牙一家医院512名COPD患者的前瞻性队列（中位随访4.7年）进行实证分析，结果显示入院越集中死亡风险越高，且随着入院次数增加风险比持续上升。该研究为纵向复发事件与生存数据的联合建模提供了实际应用范例，可供流行病学或医学统计中类似问题的分析借鉴。
关键技术: joint model, renewal process, dynamic prediction, recurrent event analysis, survival analysis, prospective cohort study
为什么对您有用: 本文属于流行病学领域的应用研究，直接连接到您次要兴趣中的流行病学（应用数据集与分析模式）。您武库中非常熟悉的非参数统计与估计理论可以用于评估该联合模型的假设稳健性（如更新过程假设是否合理）和估计效率。这篇论文可以立即可读，作为了解纵向复发事件与生存数据联合建模的入门案例，数据结构和分析思路对您未来处理类似的纵向因果推断问题亦有参考价值。

2. 10.1177/09622802251403279 — Dynamic prediction by landmarking with data from cohort subsampling designs¶

作者: Yen Chang, Anastasia Ivanova, Demetrius Albanes, Jason P Fine, Yei Eun Shin
期刊/来源: Statistical Methods in Medical Research
机构: University of North Carolina at Chapel Hill · National Cancer Institute · University of Pittsburgh · Seoul National University · New Generation University College · National University College
分类: vol 35 · issue 2 · pp 268-282
相关性 6/10 · novelty: application
摘要: 在队列研究资源受限的设定下，目标是利用子抽样设计（如 nested case-control）收集的纵向数据，对健康事件进行 landmarking 动态预测。本文提出了两种基于子抽样数据的 landmarking 估计方法：条件似然法与逆概率加权（IPW）法，并讨论了两种方法在不同场景下的选择依据。模拟结果表明，所提方法仅需全队列一小部分数据，即可达到与全队列分析相近的预测精度。实证分析使用了 PLCO 癌症筛查试验的真实 nested case-control 数据。对您可能有用：本文为流行病学队列研究中的纵向因果推断与动态预测提供了子抽样下的 IPW/条件似然工具。
关键技术: landmarking dynamic prediction, inverse-probability weighting (IPW), conditional likelihood estimation, nested case-control subsampling, cohort subsampling design
为什么对您有用: 本文属于流行病学应用方向，聚焦于队列子抽样设计下的动态预测，是理解 nested case-control 数据结构与 IPW 修正的入门级实证读物。您武器库中的 IPW 与因果推断估计理论足以完全覆盖本文的方法论核心，无需额外长肌肉。作为 gateway reading，本文清晰展示了流行病学纵向数据中子抽样偏倚的修正方式，值得花时间快速浏览其 PLCO 数据结构与 IPW 实现细节，但方法论 novelty 较低，不建议深读理论。

3. 10.1177/09622802251403356 · arXiv — Robust Emax model fitting: Addressing nonignorable missing binary outcome in dose–response analysis¶

作者: Jiangshan Zhang, Vivek Pradhan, Yuxi Zhao
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 255-267
相关性 4/10 · novelty: new_method
摘要: 在药物开发的剂量-反应分析中，本文针对 Binary Emax 模型下非可忽略缺失（nonignorable missing）二元结局的参数估计与分离（separation）问题提出解决方案。核心方法是基于惩罚似然（penalized likelihood）结合 Ibrahim-Lipsitz 型修正 EM 算法：对缺失机制引入不可忽略模型，同时对导致似然无穷大的分离问题施加非信息 Jeffreys 先验以消除偏差。模拟与 Phase II 临床试验数据表明，该方法在偏差与均方误差上优于监管推荐的 NRI（non-responder imputation）策略，并提供了 R 包 ememax。对您可能有用：本文展示了在流行病学/临床试验二元结局中处理非可忽略缺失与分离问题的具体计算方案，可作为理解此类数据结构与应用因果/半参数缺失数据方法的入门案例。
关键技术: Binary Emax model, nonignorable missing data, penalized likelihood, Jeffreys prior, modified EM algorithm, separation correction
为什么对您有用: (1) 连接到流行病学/临床试验的因果推断与缺失数据子方向：非可忽略缺失是因果 identification 中的经典难题，本文给出了参数模型下的具体处理框架；(2) 武器库中 estimation theory in causal inference 与 software development 可直接攻入：可用半参数/效率理论审视其参数模型假设是否过强，并评估其 R 包的计算稳定性；(3) 立即可做：用 very_familiar 的缺失数据 identification 理论与软件开发能力，可复现其模拟并尝试用 IPW/DR 方法在相同设定下做对比。

4. 10.1177/09622802251406588 · arXiv — A two-stage joint modeling approach for multiple longitudinal markers and time-to-event data¶

作者: Taban Baghfalaki, Reza Hashemi, Catherine Helmer, Helene Jacqmin-Gadda
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 2 · pp 330-345
相关性 3/10 · novelty: new_method
摘要: 本文针对多个纵向标记与生存时间的联合建模中计算困难（高维标记导致长运行时间或不收敛）的问题，提出一种新颖的两阶段贝叶斯方法。第一阶段分别估计每个标记与事件的单标记联合模型（而非标准两阶段中的单独混合效应模型），从而获得标记轨迹的预测当前值和/或斜率，避免因信息性脱落产生的偏差。第二阶段将所有这些预测作为时变协变量，拟合Cox比例风险模型，并采用多重插补处理第一阶段预测的不确定性。通过模拟研究和PBC2公开数据验证方法性能，并实际应用于17个纵向标记预测痴呆风险。开发的R包TSJM已开源，便于推广。本文对您有用在于：纵向数据与生存结果的联合建模是流行病学和因果推断中常见问题，文中两阶段策略为高维标记场景提供实用解法，且R包可直接用于您分析的队列研究数据。
关键技术: two-stage Bayesian joint model, multiple imputation, informative dropout, proportional hazards model, longitudinal marker predictions, R package TSJM
为什么对您有用: 直接连接到您次要兴趣中的流行病学应用，尤其涉及纵向标记与生存结局的联合建模（因果推断中的纵向数据情景）。可从武器库中的 estimation theory in causal inference 出发，评估两阶段方法在控制时变混杂中的适用性；也可借助 software development 经验审查 TSJM 包的实现与扩展潜力。该文方法立即可用于复现或对比您自己的纵向因果分析流程。

5. 10.1177/09622802251399917 · arXiv — Joint model with latent disease age: Overcoming the need for reference time¶

作者: Juliette Ortholand, Nicolas Gensollen, Stanley Durrleman, Sophie Tezenas Du Montcel
期刊/来源: Statistical Methods in Medical Research
机构: Allen Institute for Brain Science · Institut national de recherche en sciences et technologies du numérique · Institut du Cerveau · Sorbonne Université · Hôpital Saint-Antoine
分类: vol 35 · issue 2 · pp 225-239
相关性 3/10 · novelty: application
摘要: 本文针对神经退行性疾病进展建模中参考时间难以定义的问题，提出了一种联合非线性混合效应模型。该模型引入潜在疾病年龄作为时间尺度，纵向子模型采用非线性混合效应描述疾病进程，生存子模型基于潜在疾病年龄设定Weibull分布。作者在模拟数据和肌萎缩侧索硬化症(ALS)患者队列数据上验证了模型性能，并与标准联合模型进行对比。结果显示，在ALS功能评分绝对偏差和死亡预测的累积AUC上，新模型有统计显著的改善（p值极小），但改善幅度很小。该研究展示了如何通过潜在变量规避参考时间不确定性，为疾病异质性分析提供了新工具。对您而言，该文是流行病学纵向-生存联合建模的实例，其潜在变量思想可延伸至因果推断中未观测混杂的调整；您对M-estimation和软件开发的熟悉有助于理解和实现此类模型。
关键技术: Joint non-linear mixed-effect model, latent disease age, Weibull survival sub-model, longitudinal and survival data integration, ALS cohort analysis
为什么对您有用: 本文属于流行病学应用，直接处理纵向数据和生存数据的联合建模，这是因果推断中纵向中介和生存结局的常见场景。您的'非参数统计'和'M-估计理论'功底可用来分析该模型估计量的渐近性质，而'软件开发'经验可帮助您快速复现或扩展其代码。作为入门读物，该文方法清晰但偏向应用，值得花时间阅读全文以了解潜在变量建模在医学数据中的具体实现；武器库中包含的逆问题与随机噪声工具可进一步用于探讨潜在年龄的非参数识别。

其他 (other, 2 篇)¶

1. 10.1177/09622802251406584 — A fast integrative clustering and feature selection approach for high-dimensional multiview data¶

作者: Abdalkarim Alnajjar, Helen Bian, Zihang Lu
期刊/来源: Statistical Methods in Medical Research
机构: Queen's University · McGill University
分类: vol 35 · issue 2 · pp 313-329
相关性 5/10 · novelty: new_method
摘要: 本文针对高维多视图异质数据的聚类与特征选择问题，提出基于变分贝叶斯推断的 iClusterVB 方法，设定涵盖连续、分类与计数等混合数据类型。核心机制利用变分推断逼近联合后验分布，在整合多视图信息的同时通过稀疏先验实现高维特征选择，避免了 MCMC 的高计算成本。模拟与三组癌症真实数据应用表明该方法在聚类准确性与特征筛选上优于六种竞争方法，且能识别与不同生存概率关联的癌症亚型。对您而言，本文主要价值在于提供了一个高维多视图聚类的 R 软件实现与数据集参考，但理论深度有限，未涉及 minimax 界或收敛率分析。
关键技术: variational Bayesian inference, multiview integrative clustering, sparse feature selection prior, mixed-type data modeling, cancer subtype identification
为什么对您有用: 本文属于高维聚类的方法与应用工作，与您核心的 causal inference / RMT / efficiency 理论方向无直接交集。变分推断作为一种计算近似工具，与您 stat_computing 兴趣中的数值方法有弱关联，但本文未讨论变分下界的收敛率或计算-统计权衡。作为应用类文章，它提供了癌症多视图数据集及 R 包，可作为流行病学或生物统计数据的参考来源。暂不可做：核心理论机器（minimax / influence function / RMT）无法切入此变分贝叶斯框架，且本文缺乏可跟进的理论缺口。

2. 10.1177/09622802251404054 — Grouped multi-trajectory modeling using finite mixtures of multivariate contaminated normal linear mixed model¶

作者: Tsung-I Lin, Wan-Lun Wang
期刊/来源: Statistical Methods in Medical Research
机构: National Chung Hsing University · China Medical University · National Taipei University · National Cheng Kung University
分类: vol 35 · issue 2 · pp 394-412
相关性 3/10 · novelty: new_method
摘要: 本文针对多变量纵向轨迹的建模与聚类问题，提出有限混合多变量污染正态线性混合模型（FM-MCNLMM）及其扩展版 EFM-MCNLMM，后者允许混合权重依赖伴随协变量。模型假设每个子群内部存在典型与异常两类个体，通过污染正态分布（multivariate contaminated normal）捕捉组内异质性与离群观测，核心估计方法为基于 AECM（alternating expectation conditional maximization）的 ML 估计。模拟与 ADNI 阿尔茨海默病队列数据分析展示了方法在处理多模态、非典型观测及异质进展模式时的实用性。对您而言，本文展示了纵向数据聚类中处理离群值的一种参数化方案，但理论深度有限。
关键技术: finite mixture model, multivariate contaminated normal distribution, linear mixed model, AECM algorithm, concomitant covariate mixing weights, longitudinal trajectory clustering
为什么对您有用: 本文涉及纵向数据聚类与混合模型，与您 primary interest 中的 longitudinal causal inference 有数据结构上的交集，但方法学上属于参数化 EM 族，未触及 semiparametric efficiency 或 minimax 等您熟悉的工具。用您 very_familiar 的软件开发能力可以复现其 AECM 算法，但理论层面缺乏可攻的口子。中期可做：若想将此类模型嵌入 longitudinal causal framework（如 time-varying treatment 的 subgroup effect），需先在 moderately_familiar 的 identification theory 上长肌肉，但本文本身不提供理论切入点，不建议深读。

Maintained by 陈星宇 · Homepage · Source on GitHub