StatMed — Vol 45 Issue 13-14 · 2026-06-19¶
- 共 37 篇 · Statistics in Medicine
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
本期论文主要聚成三条主线:一是因果推断的复杂设定与稳健估计,涉及纵向/修改治疗策略、缺失/删失数据、中介分解与敏感性分析等,约占半数篇幅;二是临床试验设计与假设检验,覆盖非劣效性框架、自适应随机化、复发/多状态终点及功效分析;三是半参数/非参数与计算方法,聚焦sieve估计、异方差建模与变分推断加速。此外,流行病学应用与高维转移学习零星穿插。
因果推断主线本期推进的核心是“偏离传统假设的识别与多重稳健估计”。在纵向与修改治疗策略(MTP)设定下,LMTP与MTP-SNMM两篇分别从非参数有效影响函数(双稳健/同时推断)与结构嵌套均值(g-estimation/部分未测混杂)切入,刻画时变异质性效应;针对数据缺陷,缺失处理与Triply Robust、删失/截断死亡下的SACE贝叶斯推断,均通过融合更多nuisance模型或层级建模放宽MAR/可交换性依赖;中介与分解方面,有序中介mPAF、半竞争风险随机干预、医疗支出分布偏移三篇,将归因分解或差异拆解扩展至多路径/时变混杂/零膨胀支出结构;外推与敏感性分析则直接参数化条件可交换性违反(偏离参数)与未测混杂,绕过对未测变量分布的强假设。
临床试验与检验主线集中探讨“非标准终点与设计约束下的推断校准”。非劣效性检验统一框架与ROCI设计样本量闭式公式,分别系统梳理了活性对照历史信息借用与灵活建模下的第一类错误/功效;终点重构方面,平均发生率(AH)替代HR、受限无事件时间(RMT-IF)的DR估计、以及效用加权复发/终端事件非参数检验,均避开比例风险或Markov假设,提供基于影响函数或U-statistic的推断;自适应设计下,响应自适应随机化(DBCD)与安全性驱动RAR(SAFER)推导了脱落修正样本量与伦理-功效权衡的操作特征。
半参数/计算主线本期在“深度非参逼近与异方差/方差成分高效计算”上有所推进。区间删失部分线性变换模型采用sieve MLE结合DNN逼近非线性效应与单调样条基准风险,达到minimax-optimal收敛;右删失模回归神经网络(WMRNN)与异方差VarGuid框架,分别以IPCW加权与迭代重加权+局部分组处理删失与条件方差建模;混合效应位置-尺度模型(MELS)则用变分消息传递(VMP)加速方差成分估计,辅以稳健M估计的sandwich推断;高维生存转移学习通过C-index源检测与debiasing步骤实现l1误差界。
与因果推断/半参数效率最贴的论文适合优先看:关注半参数有效性与多重稳健的LMTP、Triply Robust与mPAF三篇;关注复杂时变结构识别的MTP-SNMM与半竞争风险随机干预两篇;关注sieve与DNN结合的渐近理论的区间删失部分线性变换模型一篇。
因果推断 (causal_inference, 12 篇)¶
1. 10.1002/sim.70083 · arXiv — Global Sensitivity Analysis for Studies Extending Inferences From a Randomized Trial to a Target Population¶
- 作者: Issa J. Dahabreh, James M. Robins, Sebastien J‐P. A. Haneuse, Sarah E. Robertson, Jon A. Steingrimsson, Miguel A. Hernán
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 9/10 · novelty:
new_method - 摘要: 在将随机试验的因果推断外推(generalizing/transporting)至目标人群的设定下,目标 estimand 为目标人群 ATE;核心识别条件是随机化与非随机化个体间的条件可交换性(conditional exchangeability),即无未测量效应修饰因子。本文提出全局敏感性分析方法,直接用潜在结果(counterfactual)分布参数化该条件可交换性的违反程度,无需指定未测量效应修饰因子的具体分布或其与协变量的关系。方法通过引入偏离参数(departure parameter)构建偏差模型,给出目标人群 ATE 在不同偏离程度下的估计区间,从而绕过对未测量变量分布的强假设。实证部分使用嵌套队列中的稳定缺血性心脏病试验数据,比较冠状动脉手术加药物治疗与单纯药物治疗。对您可能有用:该全局敏感性框架可直接嵌入您在因果推断识别与敏感性分析方向的工作,尤其适用于 transportability 场景下对 unmeasured effect modifier 的稳健性评估。
- 关键技术:
transportability of randomized trials,conditional exchangeability,global sensitivity analysis,counterfactual outcome distribution parameterization,departure parameter,nested trial design - 为什么对您有用: 本文直接连接因果推断的敏感性分析子方向,针对 transportability/generalization 场景下 unmeasured effect modifier 的条件可交换性违反问题。您武器库中 very_familiar 的因果推断估计理论可立即用于分析该偏离参数下的 estimator 性质(如构造 one-step / DR estimator 并推导 influence function)。立即可做:用 semiparametric efficiency bound 工具推导该全局敏感性模型下 ATE estimator 的效率界,或扩展至 longitudinal / mediation 设定。
2. 10.1002/sim.70604 — Estimating Effects of Longitudinal Modified Treatment Policies ( LMTPs ) on Rates of Change in Health Outcomes¶
- 作者: Anja Shahu, Weijie Xia, Ying Wei, Daniel Malinsky
- 期刊/来源: Statistics in Medicine
- 机构: Columbia University
- 分类: vol 45 · issue 13-14
- 相关性 9/10 · novelty:
new_method - 摘要: 本文针对纵向数据中健康结局的变化速率,扩展了纵向修正治疗策略(LMTP)方法,以估计暴露依赖干预对结局轨迹的因果效应。研究设定中,暴露和混杂随时间变化,结局在多次随访中测量,目标估计量为干预对结局变化速率的无条件因果效应。方法核心是利用非参数有效影响函数(EIF)构建估计量,该估计量满足双鲁棒性和半参数效率,并采用交叉拟合(cross-fitting)降低过拟合偏倚。基于EIF的渐近正态性,作者提出了同时置信区间框架,可对因果效应曲线进行整体推断,并构造了全局和局部假设检验。模拟研究显示,该推断框架在有限样本中具有良好覆盖率和检验水平。应用于哥伦比亚脑健康数据库(CBDB),探究血压干预对痴呆进展速率的影响。本文对您有价值:它展示了纵向因果推断中基于EIF的非参数方法,与您对半参数效率理论和纵向因果推断的兴趣直接相关,技术路线上运用了您熟悉的非参数统计和因果推断估计工具。
- 关键技术:
longitudinal modified treatment policy,efficient influence function,simultaneous confidence intervals,cross-fitting,nonparametric estimation,hypothesis testing - 为什么对您有用: 本文直接连接您的 longitudinal causal inference 兴趣子方向,在半参数效率理论(moderately_familiar)中运用了有效影响函数构造双鲁棒估计量,这与您的 very_familiar 非参数统计和因果推断估计理论无缝衔接。您可基于现有工具(nonparametric statistics, causal inference estimation theory)立即可做:复现方法框架并拓展至其他暴露依赖干预、或引入高阶U统计量进行更精细的推断(如变化速率的非参数检验)。
3. 10.1002/sim.70586 · arXiv — Structural Nested Mean Models for Modified Treatment Policies¶
- 作者: Zach Shahn
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 9/10 · novelty:
new_method - 摘要: 在时间变化的因果推断设定下,本文研究基于自然处理的修改处理策略(MTP)效应的估计问题,目标 estimand 是 MTP 下的结构嵌套均值参数。作者将经典的结构嵌套均值模型(SNMM)推广至 MTP 设定,填补了 Díaz et al. (2023) 多重稳健估计之后关于效应异质性刻画的空白。核心机制是在 Richardson & Robins (2013) 的 SWIGs 可交换性条件下,以及平行趋势假设下,分别构建 MTP-SNMM 的 g-estimation 识别与估计框架,从而允许在存在部分未观测混杂时研究时间变化的异质性 MTP 效应。理论结果给出了 MTP-SNMM 的识别公式与 g-estimation 方程,实证部分通过模拟验证了估计器的表现。对您可能有用:本文将 SNMM 这一 semiparametric theory 中的经典工具拓展到 MTP 设定,直接丰富了 longitudinal causal inference 中处理异质性效应的工具箱。
- 关键技术:
structural nested mean models,modified treatment policies,g-estimation,multiply robust estimation,SWIGs identification,parallel trends assumption - 为什么对您有用: 本文直接连接到 primary interest 中的 longitudinal causal inference 与 identification theory 子方向,将 SNMM 从静态干预推广到 MTP 设定,填补了效应异质性刻画的空白。研究者武器库中 moderately_familiar 的 identification theory in causal inference 与 semiparametric theory 可以直接用来审视本文 g-estimation 方程的识别逻辑与估计效率。立即可做:用 very_familiar 的 estimation theory in causal inference 检视其 g-estimation 的效率性质,或用 moderately_familiar 的 semiparametric theory 探究 MTP-SNMM 是否能达到 semiparametric efficiency bound。
4. 10.1002/sim.70630 — Causal Inference in the Presence of Missing Outcome and Treatment Variables: Triply Robust Estimator and Sensitivity Analysis¶
- 作者: Hyunman Sim, Won Kyung Lee, Christoph Lange, Woojoo Lee
- 期刊/来源: Statistics in Medicine
- 机构: Jeonbuk State Institute · Jeonbuk National University · Seoul National University · Veterans Health Service Medical Center · Harvard University
- 分类: vol 45 · issue 13-14
- 相关性 8/10 · novelty:
new_method - 摘要: 在观测数据中存在结局或处理变量缺失的设定下,目标是估计因果效应(ATE),同时依赖无未测量混杂(NUC)与缺失随机(MAR)假设。本文提出了一种 triply robust estimator,融合了结局模型、处理模型与缺失数据模型;该估计量在三个模型中至少有两个被正确设定时仍保持一致性,相较于传统 doubly robust 方法放宽了对模型依赖的容错要求。然而,NUC 与 MAR 假设本质上不可检验,若被违背则估计仍有偏;为此,作者进一步提出了一套针对未测量混杂的 sensitivity analysis 框架,用于量化违背 NUC 时对因果效应估计的潜在影响。理论给出了 triply robust 的 consistency 保证,实证通过真实数据展示了敏感性分析的实用性。对您可能有用:本文将缺失数据机制引入因果估计的 robustness 理论,并配套了 sensitivity analysis,直接连接到您 primary interest 中的因果推断敏感性分析与估计理论。
- 关键技术:
triply robust estimation,missing data mechanism (MAR),sensitivity analysis for unmeasured confounding,causal effect identification with missingness,nuisance model misspecification robustness - 为什么对您有用: 本文直接推进了您 primary interest 中因果推断的估计理论与敏感性分析:在缺失数据下将 doubly robust 扩展为 triply robust,并配套了 NUC 违背的 sensitivity analysis。您武器库中 very_familiar 的因果推断估计理论可直接审视其 triply robust 的 influence function 构造是否达到 semiparametric efficiency bound,以及 moderately_familiar 的 identification theory 可用来推敲其 NUC+MAR 联合违背下的非参数识别边界。Follow-up 判断:立即可做——用您熟悉的 semiparametric 理论验证其效率性质,或用 HOIF 视角探索更高阶的 robustness。
5. 10.1002/sim.70636 — Robust Estimation of Population Attributable Fractions in the Presence of Multiple Ordered Mediators¶
- 作者: Han‐Chi Peng, Woojoo Lee, An‐Shun Tai
- 期刊/来源: Statistics in Medicine
- 机构: National Yang Ming Chiao Tung University · Seoul National University · National Tsing Hua University
- 分类: vol 45 · issue 13-14
- 相关性 8/10 · novelty:
new_method - 摘要: 本文针对存在多个有序中介变量时的人口归因分数(PAF)估计问题。传统PAF方法无法有效分解各中介路径对疾病负担的贡献,而本文提出了路径特异性mPAF,以量化特定中介路径的归因比例。估计方面,作者构建了一个多重稳健估计量,只要暴露模型、中介模型和结局模型三者中至少两个正确指定,即可得到mPAF的一致估计。该估计量的渐近性质被正式建立,并通过模拟验证了其对模型误设的稳健性。应用部分利用TCGA肺癌数据分析吸烟对死亡率的介导效应,发现肺鳞癌中总PAF的10.43%主要来自直接通路(10.22%),而肺腺癌中TTK基因表现为负贡献。本文的方法为因果中介分析中的归因分解提供了新的识别与估计框架,与您的因果推断(中介分析)和半参估计兴趣紧密相连,同时与流行病学应用方向高度契合。
- 关键技术:
multiply robust estimation,path-specific population attributable fraction,M-estimation,ordered mediators,mediation analysis - 为什么对您有用: 本文直接对应您的因果推断子方向——中介分析 (mediation),且提出了多重稳健估计策略,属于M-estimation框架。您现有的“estimation theory in causal inference”和“M-estimation theory”储备可以迅速理解并复现该方法,属于立即可做的范畴:可以进一步研究该多重稳健估计量的半参效率界,或将其推广至时变中介/纵向设定。此外,该论文的TCGA肺癌数据也可作为流行病学二次兴趣的入门样例。
6. 10.1002/sim.70628 · arXiv — Randomized Interventional Effects in Semicompeting Risks, With Application to a Hematopoietic Cell Transplantation Study¶
- 作者: Yuhao Deng, Rui Wang, Tao Zhang, Xiang Zhan
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 8/10 · novelty:
new_method - 摘要: 该论文在竞争风险框架下研究了半竞争风险数据中的中介效应分解问题,其中中间事件(复发)和终点事件(死亡)均受右删失影响。作者将随机干预方法(randomized interventional approach)扩展到时间-事件结局,通过从参考分布中随机抽取中间事件过程(边际或条件于时变混杂)来定义直接和间接效应。给出了识别公式,讨论了识别假设的变体,并采用非参数最大似然估计(NPMLE)进行估计,同时提出了一种包含潜在脆弱性(frailty)的敏感性分析方法。在造血干细胞移植研究中,以移植物抗宿主病(GVHD)作为时变混杂,分析了匹配无关供体 vs. 单倍体相合供体对死亡的影响中复发的介导作用。该方法与您在中介分析、纵贯数据和敏感性分析方面的因果推断兴趣高度相关,且非参数估计技术可以直接利用您对非参数统计和因果估计理论的熟悉度来理解和复现。
- 关键技术:
randomized interventional approach,nonparametric maximum likelihood estimation,semicompeting risks,sensitivity analysis with latent frailty,time-varying confounding,causal mediation identification - 为什么对您有用: 本文涉及因果推断中的中介分析(mediation)和敏感性分析(sensitivity),直接对应您的首要兴趣“causal inference (identification, estimation, sensitivity analysis, IV, mediation, longitudinal)”。使用的非参数最大似然估计(NPMLE)属于您非常熟悉的“nonparametric statistics”和“estimation theory in causal inference”武器,可以立即可做:您完全有能力检验其识别假设的充分性、尝试用交叉拟合(cross-fitting)改进估计量,或将其敏感性分析框架推广到更复杂的纵贯数据结构(如重复测量的中介)。此外,该文对时变混杂的处理方法也值得在您的纵向因果推断工作中参考。
7. 10.1002/sim.70606 · arXiv — Assessing Racial Disparities in Healthcare Expenditures via Mediator Distribution Shifts¶
- 作者: Xiaxian Ou, Xinwei He, David Benkeser, Razieh Nabi
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 8/10 · novelty:
application - 摘要: 本文研究美国医疗支出中的种族差异,将差异定义为协变量调整后的种族间结果分布差异,并通过中介变量分布偏移进行分解。框架将总差异分为两部分:一部分归因于中介变量(如社会经济地位、保险获取、健康行为、健康状况)分布差异,另一部分为均衡中介后仍存在的残差差异。方法上,基于influence function导出渐近线性估计量,并结合超级学习器和两阶段模型(针对零膨胀右偏支出数据)实现灵活机器学习估计。利用2009-2016年MEPS数据,发现非西班牙裔白人与西班牙裔之间差异最大,社会经济地位和健康状况是最大贡献因子,保险获取对西班牙裔群体影响显著,而健康行为贡献极小。残差差异在各组比较中均存在,尤其在涉及非西班牙裔白人时更明显。本文虽为应用论文,但其渐近线性估计框架及其与flexible ML的结合方式可直接迁移至您关注的causal mediation和semiparametric efficiency研究。
- 关键技术:
influence function,super learner,mediation decomposition,two-part model,asymptotically linear estimator,zero-inflated data - 为什么对您有用: 本文直接对应您的causal inference子方向中的mediation分解和semiparametric效率理论:其influence function-based estimator框架可用您非常熟悉的estimation theory in causal inference工具展开(可立即推导该estimator在给定nuisance估计率下的收敛性)。此外,数据集为real-world流行病学/卫生经济学大样本(MEPS),可作为您探索epidemiology应用场景的优质入门案例。follow-up判断:立即可做——您的very_familiar工具包(非参、minimax bound、因果推断估计理论)已足够支撑对该 estimator 的rate分析或推广。
8. 10.1002/sim.70634 · arXiv — Cost‐Effectiveness Analyses for Sequential Multiple Assignment Randomized Trials¶
- 作者: Lina M. Montoya, Elvin H. Geng, Harriet F. Adhiambo, Eliud Akama, Starley B. Shade, Assurah Elly et al.
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 7/10 · novelty:
new_method - 摘要: 在 SMART(序贯多重分配随机试验)设计下,目标是估计嵌入动态治疗策略的增量成本效益比(ICER)。研究在非参数模型设定下,提出基于 TMLE 的 ICER 估计器,并利用 influence curve 构造置信区间进行统计推断。核心机制是沿用 TMLE 的 targeted learning 框架,先通过初始估计与扰动模型更新得到目标参数的一致且有效估计,再基于 influence function 的渐近正态性实现 ICER 的区间估计。模拟与 ADAPT-R 试验的 HIV 护理依从性数据展示了方法在实际成本效益评估中的表现。对您可能有用:本文将 TMLE / influence function 推广到 SMART 下的成本效益参数,为纵向因果推断中的复合参数估计提供了新实例。
- 关键技术:
TMLE,influence curve-based inference,incremental cost-effectiveness ratio,dynamic treatment regime,SMART design - 为什么对您有用: 直接连接到 causal inference 的 longitudinal / DTR 子方向,展示了 TMLE 与 influence function 在 SMART 复合参数(ICER)上的具体应用。用您 very_familiar 的 semiparametric efficiency 与 TMLE 框架即可直接审视其 influence function 推导是否达到效率界,属于立即可做的阅读与验证层级。
9. 10.1002/sim.70599 · arXiv — Doubly Robust Estimators of the Restricted Mean Time in Favor Estimands in Individual‐ and Cluster‐Randomized Trials¶
- 作者: Xi Fang, Bingkai Wang, Guangyu Tong, Liangyuan Hu, Shuangge Ma, Fan Li
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 7/10 · novelty:
new_method - 摘要: 在多状态生存过程(如复发/序贯事件)的随机试验中,目标是估计不受比例风险或 Markov 假设限制的 restricted mean time in favor of treatment (RMT-IF)。现有非参数方法假设协变量独立删失且不支持 CRT,本文在 AIPW 框架下提出 doubly robust (DR) 估计量:结合阶段特异 outcome regression 与组别特异 censoring model,任一 nuisance 模型正确即可保证一致性。进一步将框架拓展至 CRT,定义 cluster-level 与 individual-level 两种平均 RMT-IF estimands 以处理 informative cluster size,并构造考虑簇内相关性的 DR 估计量。推断采用 model-agnostic jackknife 方差估计,模拟与两个 RCT 实例验证了有限样本表现。对您有用:本文将 AIPW/DR 方法从标准 RMST 推广至有序多状态 RMT-IF,为纵向/复发因果生存分析提供了新 estimand 与估计框架。
- 关键技术:
augmented inverse-probability weighting (AIPW),doubly robust estimation,restricted mean time in favor of treatment (RMT-IF),cluster-randomized trial (CRT) inference,jackknife variance estimation,multi-state survival process - 为什么对您有用: 直接连接因果推断的 longitudinal/生存设定与 DR 估计理论,为多状态复发事件的因果 estimand 提供了 AIPW 框架下的 DR 解法。用您 very_familiar 的 estimation theory in causal inference 与 moderately_familiar 的 semiparametric theory 可以直接审视其 DR 估计量是否达到 semiparametric efficiency bound,以及 jackknife 在 CRT 下的理论性质。立即可做:用 semiparametric efficiency 理论验证其 influence function 是否为有效 influence function,并探讨 cross-fitting 下能否进一步改善有限样本表现。
10. 10.1002/sim.70574 — Mediation Analysis With Bayesian Nonlinear Joint Models: Evaluation of the Treatment Causal Pathways Between Tumor Growth Kinetics and Overall Survival¶
- 作者: Georgios Kazantzidis, Francois Mercier, Virginie Rondeau
- 期刊/来源: Statistics in Medicine
- 机构: Roche (Switzerland) · Inserm · Bordeaux Population Health
- 分类: vol 45 · issue 13-14
- 相关性 7/10 · novelty:
new_method - 摘要: 在肿瘤生长动力学中介导抗癌治疗对总生存期(OS)影响的因果路径设定下,目标是识别与估计自然直接效应(NDE)、自然间接效应(NIE)及处理效应比例(PTE)。本文构建了一个贝叶斯非线性联合模型框架,将描述肿瘤生长抑制(TGI)的非线性纵向子模型与参数生存子模型通过多种生物学驱动的链接函数连接,并探索处理效应对肿瘤缩小与再生长速率的不同参数化形式对中介量的影响。方法采用贝叶斯层级联合模型进行推断,通过边际效应计算随时间变化的NDE/NIE/PTE,并在不同中介水平与样本量下通过模拟评估了中介量的偏差、覆盖概率与可识别性。对IMBrave150 III期试验的应用表明肿瘤动力学仅部分中介处理效应,PTE随时间变化。对您可能有用:本文将贝叶斯非线性联合模型引入纵向中介分析,为纵向因果推断的中介路径识别与估计提供了一个具体的生物统计应用范式。
- 关键技术:
Bayesian joint model,nonlinear longitudinal sub-model,natural direct/indirect effect,proportion of treatment effect,tumor growth inhibition model,mediation analysis - 为什么对您有用: 本文直接连接到因果推断中的中介分析(mediation)与纵向因果推断子方向,处理了纵向生物标志物中介生存结局的因果分解问题。从技术武器库看,用您very_familiar的软件开发能力可以复现其贝叶斯MCMC推断流程,但本文核心依赖贝叶斯层级模型与非线性TGI参数化,您对semiparametric theory与HOIF的moderately_familiar武器无法直接攻入其非参数/半参数效率界或高阶影响函数的理论缺口——若想在此类纵向中介问题上做理论推进(如给出NDE/NIE的半参数效率界或debias方法),需先在moderately_familiar的semiparametric theory上长肌肉。当前判断:中期可做。
11. 10.1002/sim.70620 — Exploring Sensitive Biomarkers Associated With Short‐Term Responses and Long‐Term Outcomes Using Bayesian Additive Regression Trees¶
- 作者: Zixuan Yao, Satoshi Morita
- 期刊/来源: Statistics in Medicine
- 机构: Kyoto University
- 分类: vol 45 · issue 13-14
- 相关性 6/10 · novelty:
application - 摘要: 本文提出了一种两阶段亚组分析方法,用于识别对长期治疗结果具有预测价值的短期生物标志物反应。在第一阶段,利用贝叶斯加性回归树(BART)通过反事实建模估计每个患者基于短期反应的预测性条件处理效应(PCTE);第二阶段根据PCTE构建患者亚组,分析观察到的长期结果以识别敏感亚群。作者在局部晚期或转移性乳腺癌随机临床试验数据上进行了应用,并通过大量模拟研究验证了方法的操作特征。该方法的贡献在于为临床医生利用早期反应指导继续治疗决策提供了统计支持。本文属于应用类工作,方法论创新有限(主要是BART的灵活性),但完整的模拟和实证分析具有参考价值。
- 关键技术:
Bayesian additive regression trees,counterfactual modeling,predictive conditional treatment effects,subgroup analysis,two-stage analysis - 为什么对您有用: 本文直接关联因果推断中个体处理效应异质性和精准医学子方向,其反事实建模框架与研究者非常熟悉的因果推断估计理论和非参数统计工具无缝对接。研究者可利用非常熟悉的非参数回归和因果推断估计立即复现或改进该两阶段方法;若需进一步推导PCTE的半参数有效推断(如影响函数),则要求先巩固 moderately_familiar 中的半参数理论。
12. 10.1002/sim.70588 · arXiv — Bayesian Inference for Cluster‐Randomized Trials With Multivariate Outcomes Subject to Both Truncation by Death and Missingness¶
- 作者: Guangyu Tong, Chenxi Li, Eric Velazquez, Michael O. Harhay, Fan Li
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
new_method - 摘要: 在集群随机化试验(CRT)中,针对脆弱人群(如老年/临终关怀),目标是在 truncation by death 与多重异质性缺失(已知存活、已知死亡、存活状态未知)并存下识别并估计 survivor average causal effect(SACE)。本文提出贝叶斯框架,通过多变量结局(bivariate continuous outcome)联合建模,在 posterior 中区分个体级与集群级 SACE;缺失机制按存活/死亡/未知状态分层处理,避免了单一缺失假设的局限。模拟显示关键参数低偏差、高覆盖;实证来自老年 CRT 数据。对您可能有用:本文处理 truncation by death 下 SACE 的识别与估计策略,直接关联因果推断中 mediation/longitudinal 的复合缺失设定。
- 关键技术:
survivor average causal effect,truncation by death,cluster-randomized trials,Bayesian multivariate outcome modeling,heterogeneous missing data mechanisms,principal stratification - 为什么对您有用: 本文直接触及因果推断中 truncation by death 下 SACE 的识别与估计,属于 primary interest 的 causal inference(identification, estimation)子方向。从 technical_arsenal 角度,可用 identification theory in causal inference(moderately_familiar)审视其 principal stratification 下的可识别性假设是否可放松或用 semiparametric 方法替代贝叶斯全参数模型。follow-up 判断:中期可做——需先在 moderately_familiar 的 identification theory 上长肌肉,以将此贝叶斯框架转化为 semiparametric / efficiency-bound 导向的估计器。
非参数 / 半参数 (nonparam_semipara, 3 篇)¶
1. 10.1002/sim.70641 — WMRNN: Weighted Modal Regression Neural Networks for Right Censored Data¶
- 作者: Xiaogang Wang, Wenjie Chang, Feipeng Zhang, Caiyun Fan
- 期刊/来源: Statistics in Medicine
- 机构: North Minzu University · Xi'an Jiaotong University · Shanghai International Studies University · Shanghai University of International Business and Economics
- 分类: vol 45 · issue 13-14
- 相关性 4/10 · novelty:
new_method - 摘要: 本文针对右删失生存数据,提出加权模回归神经网络(WMRNN),目标是估计给定协变量下响应变量的条件模(conditional mode)。方法在模回归框架下嵌入深度神经网络以捕捉非线性关系,并在损失函数中采用逆概率删失加权(IPCW)处理随机删失,无需预设函数形式。WMRNN对不对称、尖峰或重尾分布的生存数据具有适应性,且不要求删失变量与协变量独立。模拟与两个真实数据案例表明其在预测最可能结局上的表现优于传统方法。对您而言,本文展示了IPCW与神经网络结合在非参数生存分析中的应用,可作为semiparametric理论中IPCW估计量的非线性扩展案例参考。
- 关键技术:
modal regression,inverse probability of censoring weighting (IPCW),deep neural network,conditional mode estimation,right-censored survival data - 为什么对您有用: 本文连接到semiparametric & nonparametric theory子方向,核心是IPCW这一经典semiparametric工具与DNN的非线性结合。用您very_familiar的inverse problems with random noise视角,可以审视IPCW权重估计误差在神经网络损失函数中的传播与收敛性质,当前论文缺乏对WMRNN的渐近理论(如收敛率、影响函数)分析。follow-up判断:中期可做——需先在moderately_familiar的M-estimation theory上长肌肉,以建立神经网络模回归估计量的渐近性质与semiparametric efficiency bound。
2. 10.1002/sim.70609 · arXiv — Interpretable Deep Regression Models With Interval‐Censored Failure Time Data¶
- 作者: Changhui Yuan, Shishun Zhao, Shuwei Li, Xinyuan Song, Zhao Chen, The Alzheimer's Disease Neuroimaging Initiative
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 4/10 · novelty:
new_method - 摘要: 在区间删失生存数据设定下,目标是对部分线性变换模型中的参数与非参数成分进行估计与推断,关键假设包括变换模型的单调性及非参数成分的平滑条件。方法上,对关键协变量效应保留参数化建模以保证可解释性,对冗余协变量的非线性效应用 DNN逼近,同时用单调样条逼近累积基准风险函数,构成 sieve MLE。计算上开发了结合 EM 与 SGD 的算法以保证估计的可行性与收敛。理论上证明了参数估计的渐近性质,并显示 DNN 非参数估计达到 minimax-optimal 收敛速率。对您可能有用:本文将 sieve M-estimation 与 DNN 非参数逼近结合于半参数生存模型,其 minimax 收敛证明与 EM-sieve 计算框架可直接连接到您的 semiparametric theory 与 stat computing 兴趣。
- 关键技术:
partially linear transformation model,sieve maximum likelihood estimation,monotone splines,deep neural network approximation,EM algorithm with stochastic gradient descent,minimax-optimal convergence rate - 为什么对您有用: 本文直接连接到您的 semiparametric theory 兴趣,特别是部分线性模型中的 sieve M-estimation 与 minimax rate 理论。您武器库中的 minimax bounds for estimation problems 与 M-estimation theory(moderately_familiar)可以直接用来审视本文声称的 minimax-optimal rate 是否紧,以及 sieve 空间选取对 rate 的影响。Follow-up 判断:立即可做——用 very_familiar 的 minimax bound 工具验证其非参数 DNN 收敛速率的紧性,并可用 moderately_familiar 的 M-estimation 理论检查其参数部分渐近正态性的 influence function 推导是否遗漏了 higher-order 修正。
3. 10.1002/sim.70626 — A Nested Copula Model for Recurrent Gap Times With a Dependent Terminal Event¶
- 作者: Yuanjia Duan, Miao Han, Liuquan Sun
- 期刊/来源: Statistics in Medicine
- 机构: Shanghai University of Finance and Economics · Academy of Mathematics and Systems Science · University of Chinese Academy of Sciences
- 分类: vol 45 · issue 13-14
- 相关性 2/10 · novelty:
new_method - 摘要: 在复发事件与依赖性终止事件(如死亡)共存的纵向生存分析设定下,目标是估计协变量对复发间隔时间(gap times)的效应以及复发事件与终止事件间的相关性。本文提出嵌套 copula 模型:内层用 Archimedean copula 捕获复发间隔时间间的内部相关性,外层用一般双变量 copula 建模复发事件与终止事件的依赖结构,作为 frailty 模型的 copula 对应物并提升可解释性。参数与半参数两种估计方法被发展,证明了估计量的 consistency 与 n^{-1/2}-CAN 性质,并提供了基于似然的 copula 选择程序。模拟验证了有限样本表现,最后应用于 Bellvitge Hospital 结直肠癌临床数据。对您有用之处:该半参数 copula 估计框架为纵向因果推断中处理依赖性终止事件的 censoring 提供了新的依赖结构建模工具。
- 关键技术:
nested copula model,Archimedean copula,semiparametric estimation,asymptotic normality,likelihood-based model selection,recurrent gap times - 为什么对您有用: 本文直接连接到 primary interest 中的 longitudinal causal inference 子方向——依赖性终止事件(dependent censoring/death)是纵向因果推断中 identification 与 estimation 的核心难点,其嵌套 copula 结构为刻画 censoring 依赖提供了比 frailty 更灵活的半参数工具。用您 very_familiar 的 M-estimation theory 与 moderately_familiar 的 semiparametric theory 可以直接审视其 CAN 证明与半参数效率界是否可达,判断该 copula 模型在纵向因果设定下能否被嵌入 orthogonal score / TMLE 框架以实现 debiased 估计。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,具体是将 copula 依赖结构转化为 influence function 的推导,以评估其半参数效率下界。
效率理论 / Debiased ML (efficiency_dml, 1 篇)¶
1. 10.1002/sim.70629 · arXiv — Rank‐Based Transfer Learning for High‐Dimensional Survival Data With Application to Sepsis Data¶
- 作者: Nan Qiao, Haowei Jiang, Cunjie Lin
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 6/10 · novelty:
new_method - 摘要: 在转移学习框架下研究高维生存数据的 transformation model,目标是利用外部源数据集改善目标数据集(MSSA 贓毒症)的系数估计与预测精度。方法基于 C-index 构造可转移源数据集的检测指标,通过转移步骤借力源信息,再经 debiasing 步骤消除偏差;估计器具有 l1-estimation error bound,且源检测算法具备 detection consistency。模拟与 MIMIC-IV 真实数据验证了估计与预测精度及实际优势。对您可能有用:本文将 debiased 思路嵌入转移学习,与您 primary interest 中的 efficiency theory / debiased ML 及高维估计理论直接相关。
- 关键技术:
transfer learning,debiased estimation,l1-estimation error bound,C-index based detection,transformation model for survival data,detection consistency - 为什么对您有用: 直接连接您 primary interest 中的 efficiency theory / debiased ML 与高维统计:本文在高维生存模型中显式构造 debiasing 步骤并给出 l1-error bound,是 debiased 思想在转移学习场景的具体实例。用您 very_familiar 的高维 asymptotics 与 minimax bound 工具可以审视其 error bound 是否紧,或用 moderately_familiar 的 M-estimation 理论分析其 debiasing 步骤的 influence function 性质。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以推导该 debiased estimator 的 semiparametric efficiency bound 并判断是否达到 CAN。
数理统计 / 假设检验 (hypothesis_testing, 7 篇)¶
1. 10.1002/sim.70615 — Nonparametric Tests for Treatment Effect Leveraging Information on Recurrent and Terminal Events and Physiological Decline¶
- 作者: Lantian Xu, Susan Murray
- 期刊/来源: Statistics in Medicine
- 机构: University of Michigan
- 分类: vol 45 · issue 13-14
- 相关性 7/10 · novelty:
new_method - 摘要: 在渐进性疾病临床试验设定下,本文针对处理效应提出一种两样本非参数检验,目标参数为跨多个随访窗口的受限、效用调整无事件时间(utility-adjusted event-free time)的纵向轮廓差异。核心机制是将纵向生理功能指标(如肺功能)编码为健康历史状态并赋予效用权重,从而将复发事件、终端事件与纵向衰退整合为单一检验统计量。检验统计量的渐近极限分布由投影与U-statistic理论给出,并提供了有限样本方差公式与图形化分析工具。模拟显示当处理同时改善事件率与生理功能时,引入效用权重可显著提升检验功效;COPD临床试验数据展示了其实用性。对您可能有用:该文将纵向协变量编码为效用状态并融入U-statistic检验的思路,为higher-order U-statistic在因果/生存分析中的构造提供了具体应用场景。
- 关键技术:
two-sample nonparametric test,utility-adjusted event-free time,U-statistic asymptotic theory,recurrent and terminal events,longitudinal health history state,restricted mean survival time extension - 为什么对您有用: 本文直接连接到 hypothesis testing 与 epidemiology 应用:在流行病学队列的复发-终端事件设定下,用U-statistic构造非参数检验。您武器库中 very_familiar 的 higher-order U-statistics (treewidth / einsum) 可直接切入其检验统计量的计算复杂度分析,moderately_familiar 的 U-statistic 理论可验证其渐近投影步骤是否可进一步精细化。Follow-up 判断:立即可做——用您熟悉的 U-statistic 计算框架审视其统计量的 einsum 表达与计算成本,并探索是否可用 HOIF 提升功效。
2. 10.1002/sim.70590 — Confidence Set for the Cluster of a Spatial Scan Statistic¶
- 作者: Junho Lee
- 期刊/来源: Statistics in Medicine
- 机构: Louisiana State University
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
new_method - 摘要: 在空间聚类检测中,传统扫描统计量仅输出点估计(最可能簇),无法量化不确定性。本文针对Poisson与Normal模型,提出基于似然比检验p值的置信集构造框架:将每个候选簇视为一个假设,通过二分搜索算法高效计算使得p值≥α的临界阈值,从而筛选出包含真实簇的集合并保证经验覆盖接近名义水平。方法引入两种可视化工具——置信热图(各空间单元被包含于真实簇的概率)与置信包络线(不确定性边界),显著提升解释性。仿真与宫颈癌死亡率数据集表明该方法对非圆形簇、多簇情形稳健。对您有用:直接连接您的主要兴趣——假设检验中的置信区间构造(似然比p值方法)与统计计算(二分搜索),同时作为流行病学应用(癌症数据)符合您的二级兴趣,可提供分析流程参考。
- 关键技术:
spatial scan statistic,likelihood ratio test,p-value-based confidence set,binary search algorithm,confidence heatmap,confidence envelope - 为什么对您有用: 本文直接关联您对假设检验的兴趣——基于似然比p值构造置信集;同时以流行病学癌症数据为实例,符合您二级兴趣中的应用场景。您武器库中“nonparametric statistics”中的似然比检验理论可支撑对本文理论基础的深入理解,“software development”技能可直接用于复现或扩展算法(如多簇检测)。立即可做:方法概念清晰且实现简单,您可在仿真中复现,或将其思想迁移至因果推断中ATE的置信集构造。
3. 10.1002/sim.70624 — Design and Analysis of Randomized Clinical Trials With Average Hazard: Practical Guidance and Tools for Implementation¶
- 作者: Miki Horiguchi, Lu Tian, Satoshi Hattori, Hajime Uno
- 期刊/来源: Statistics in Medicine
- 机构: Dana-Farber Cancer Institute · Stanford University · Osaka Gakuin University · The University of Osaka
- 分类: vol 45 · issue 13-14
- 相关性 4/10 · novelty:
new_method - 摘要: 在随机化临床试验的时间-事件结局分析中,传统 Cox hazard ratio (HR) 作为效应量度存在局限,本文以 average hazard (AH) 作为替代 estimand,AH 定义为生存函数的泛函,即在给定时间窗内的平均发生率。虽然 AH 的非参数推断程序(基于 influence function 的 \(n^{-1/2}\)-CAN 估计)已建立,但其在 RCT 主分析中的设计与实施指南仍缺乏。本文提出基于 AH 的试验设计框架(样本量计算、检验效能),并给出确定分析时点的工具。同时发布 R 包 survAHtools 支持实际应用。对您有用之处在于:AH 作为 survival function 的泛函,其非参数推断与 semiparametric efficiency 理论直接相关,且该工作为时间-事件结局的 hypothesis testing 提供了超越 log-rank/Cox 的替代路径。
- 关键技术:
average hazard ratio,nonparametric inference for survival function functional,influence function,sample size calculation for time-to-event,log-rank test alternative - 为什么对您有用: 本文连接到 hypothesis testing 与 semiparametric theory 子方向:AH 作为 survival function 的泛函,其推断依赖 influence function 与非参数估计理论,属于您熟悉的 nonparametric statistics 与 minimax 范畴。用 very_familiar 的 nonparametric statistics 与 moderately_familiar 的 semiparametric theory 可以审视 AH estimator 的 efficiency bound 是否已达 semiparametric efficiency,以及其与 HR 在不同 censoring/misspecification 机制下的 minimax 风险对比。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以严格推导 AH 的 semiparametric efficiency bound 并与现有 influence-function-based estimator 对比。
4. 10.1002/sim.70611 — Sample Size Determination for Response‐Adaptive Randomization With Recurrent Event Responses and Unequal Follow‐Up Time¶
- 作者: Junjiang Zhong, Xianggao Hu, Jingya Gao, Siu Hung Cheung
- 期刊/来源: Statistics in Medicine
- 机构: Xiamen University of Technology · University of Science and Technology Beijing · Chinese University of Hong Kong
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
minor - 摘要: 在响应自适应随机化(DBCD)框架下,针对复发事件响应的临床试验,研究给定检验功效下的样本量确定问题,关键假设为复发事件遵循特定计数过程且允许因患者脱落导致的不等随访时间。核心方法基于 DBCD 下的渐近分布推导,将脱落机制引入随访时间分布,从而修正样本量公式与治疗分配比例的理论表达式。理论结果量化了忽略脱落对所需样本量的低估程度及对分配比例的影响;模拟与临床实例验证了修正公式的实用性。对您可能有用:该文将自适应设计与不等随访/脱落机制结合做功效与样本量推导,属于 hypothesis_testing 与临床试验设计的交叉,可对比经典固定设计下的功效分析框架。
- 关键技术:
response-adaptive randomization,doubly biased coin design (DBCD),sample size determination,asymptotic distribution under adaptive allocation,unequal follow-up time modeling,dropout impact quantification - 为什么对您有用: 本文连接到 hypothesis_testing 子方向中的临床试验功效与样本量确定,但技术层面主要依赖 DBCD 的渐近分布与计数过程,未涉及高维/半参数效率界或 minimax 等您熟悉的武器。用 very_familiar 中的 minimax bounds 或 high-dimensional asymptotics 无法直接攻破此文的口子,因其核心是固定维数下自适应设计的渐近方差修正。follow-up 判断:暂不可做——核心机器(自适应随机化下复发事件计数过程的渐近理论)不在武器库里,且该文 novelty_flag 为 minor,属于已有 DBCD 框架的增量式样本量公式修正,无需优先展开阅读。
5. 10.1002/sim.70639 — Simulation‐Based Power Analysis for Time‐Dependent Area Under Receiver Operating Characteristic Curve Using Approximate Bayesian Computation¶
- 作者: Sunwoo Han, Deukwoo Kwon
- 期刊/来源: Statistics in Medicine
- 机构: Florida International University · University of Arkansas for Medical Sciences
- 分类: vol 45 · issue 13-14
- 相关性 2/10 · novelty:
application - 摘要: 本文提出一个基于模拟的统计功效分析框架,用于评估生物标志物对生存结局的 prognostic accuracy,以 time-dependent AUC 为度量。核心分为两步:(1) 利用 Approximate Bayesian Computation (ABC) 结合现有信息估计失效和删失分布,生成伪删失生存数据;(2) 通过迭代蒙特卡洛模拟估计所需样本量、效应量及统计功效。框架支持单组或交错入组设计、连续或二分类生物标志物等常见临床试验复杂性。模拟研究表明该方法能在多种设定下准确一致地估计上述量。最后通过难治性大 B 细胞淋巴瘤真实试验说明实用性。对您而言,本文将假设检验的 power analysis 与模拟计算方法结合,属于假设检验子方向的应用拓展;您若熟悉生存分析中的非参数方法,可进一步评估 ABC 在此类设计中的效率。
- 关键技术:
Approximate Bayesian Computation,Time-dependent AUC,Monte Carlo power simulation,Survival analysis with censoring,Staggered entry design - 为什么对您有用: 本文直接连接假设检验中的 power calculation 方向,同时也涉及流行病学临床试验的统计设计。您 very_familiar 中的 software development 可用于复现该模拟框架并拓展至其他检验场景;但核心的 ABC 方法及生存数据删失机制不在您当前武器库中,属于暂不可做方向——需补充 ABC 理论和生存分析模拟技术才能独立推进。
6. 10.1002/sim.70618 · arXiv — A General Framework for Designing and Evaluating Active‐Controlled Trials with Non‐Inferiority Objectives¶
- 作者: Antonio Olivas‐Martinez, Fei Gao, Holly Janes
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 2/10 · novelty:
new_method - 摘要: 非劣效性试验(active-controlled non-inferiority trial)在缺乏安慰剂对照组时,需依赖历史数据估计活性对照效应,并假设该效应可推广至目标人群;传统非劣效准则要求新干预保留活性对照效应的固定比例,而替代准则基于相对于假设安慰剂的充分疗效。本文提出一个统一框架,将现有分析方法(包括传统与替代成功准则)纳入同一体系,并系统比较各方法的第一类错误、检验功效和对活性对照效应误设的稳健性。在HIV预防试验设计实例中,该框架识别出比常用方法更高效、更稳健的检验方法,并展示了替代准则的实际优势。该工作为严格设计非劣效性试验提供了综合工具包。对您而言,框架中对检验准则的Type I error和power的系统比较直接对应假设检验兴趣,其中对历史数据假设的敏感性分析思路可迁移至因果推断中的识别假设检验问题。
- 关键技术:
Non-inferiority margin,Active control effect,Hypothetical placebo,Type I error control,Power analysis,Sensitivity to effect misspecification - 为什么对您有用: 本文专注非劣效性假设检验的框架设计,直接关联您的hypothesis_testing兴趣,尤其是Type I error和power的系统评估。框架中对历史数据依赖和活性对照效应误设的敏感性处理,与因果推断中identification假设的稳健性检验有相通之处(如proximal CI中negative control假设的敏感性分析)。您可立即可用very_familiar的nonparametric statistics和hypothesis testing知识理解并吸收其比较方法论;若需深入应用于因果推断场景,可在moderately_familiar的identification theory上进一步延伸。
7. 10.1002/sim.70619 — Sample Size Calculation for the ROCI Design¶
- 作者: Henry Bern, James Carpenter, Mahesh Parmar, Ian R. White, Matteo Quartagno
- 期刊/来源: Statistics in Medicine
- 机构: MRC Clinical Trials Unit at UCL · University College London
- 分类: vol 45 · issue 13-14
- 相关性 2/10 · novelty:
application - 摘要: 该论文针对持续干预反应(ROCI)设计中非劣效性试验的样本量计算问题,提出了一种基于正态近似的计算方法,以替代当前耗时的模拟方法。在ROCI设计中,研究者常需通过模拟估计样本量,而本文推导了正态近似的闭式公式,显著降低了计算资源需求。方法中采用分数多项式回归建模干预-反应曲线,并讨论了如何通过考虑模型选择不确定性来可靠估计分布参数(如处理效应方差)。研究表明,正态近似方法不仅计算高效,且在合理的参数设定下结果与模拟一致。本文的框架可推广至其他使用灵活建模(如样条、机器学习)的临床试验设计。对您而言,该论文连接了您在假设检验(特别是非劣效性检验)和统计计算(数值方法效率比较)方面的兴趣,但其核心贡献更偏向临床设计应用,而非理论深度。
- 关键技术:
normal approximation,fractional polynomial regression,sample size calculation,non-inferiority trial,simulation-based approach - 为什么对您有用: 论文涉及非劣效性试验的样本量计算,属于假设检验在临床设计中的应用,与您'数学统计与假设检验'的主要兴趣有直接连接。但本文方法较为常规(正态近似),未涉及更高级的统计计算权衡(如信息-计算差距),且您的技术武器库中'非参数统计'和'高维渐近'等项在此处并不直接匹配——该文使用的分数多项式回归较为经典,不需要非参数或高维工具。因此,这是一篇领域内实用性的应用论文,若您对临床试验设计有具体需求可作为参考,但暂不属于立即可攻的理论方向。
统计计算 / 算法 (stat_computing, 3 篇)¶
1. 10.1002/sim.70640 — Fast Estimation and Valid Statistical Inference for Mixed‐Effect Location‐Scale Models Using Variational Inference¶
- 作者: Brian Ping‐Huan Wu, Donald Hedeker
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
new_method - 摘要: 本文针对混合效应位置-尺度模型(MELS)在密集纵向数据中建模方差成分时计算量大的问题,提出一种快速变分消息传递(VMP)算法。作者利用简化Laplace近似推导非共轭分量的更新公式,并以稳健M估计框架构建sandwich估计量,从而实现有效的频率推断。模拟实验表明估计量准确且一致,真实数据分析表明算法在数秒内即可得到与极大似然估计(MLE)相当的点和区间估计,远超MLE(数分钟)和MCMC(数小时)。该方法为密集纵向数据的模型选择和推断提供了计算高效且可靠的替代方案。对您而言,该工作直接对应您对统计计算中数值方法和算法的兴趣,其使用的稳健M估计框架与您的M估计理论基础相通,而VMP实现也可借助您的软件开发经验快速掌握。
- 关键技术:
Variational Message Passing,Laplace approximation,robust M-estimation,sandwich estimator,mixed-effects location-scale model - 为什么对您有用: 本文连接您的统计计算(算法)方向,具体面向纵向数据中方差成分建模的数值效率问题。武器库中
M-estimation理论(moderately familiar)可直接用于理解与验证其sandwich推断的渐近性质,而软件开发(very familiar)则可用于复现和扩展该VMP算法。中期可做:需先补强变分推断的具体技术细节(如ELBO推导、消息传递收敛性),方可进一步将该算法迁移至因果推断中处理时间变动效应的方差结构。
2. 10.1002/sim.70632 — Variance‐Guided Regression for Heteroscedastic Data With a Grouping‐Based Extension for Nonlinear Prediction¶
- 作者: Sibei Liu, Min Lu
- 期刊/来源: Statistics in Medicine
- 机构: University of Miami
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
new_method - 摘要: 该文针对异方差数据提出 VarGuid 框架,包含两个独立模块:一为迭代重加权回归(IRR)估计稀疏全局均值-方差线性模型,二为双凸人工分组算法在保留线性骨干基础上添加分组局部截距修正以实现非线性预测。该方法明确区分了协变量依赖的条件方差建模和残差非线性结构,并给出了全局估计器的预测风险保证。模拟和实证研究表明其能在真实数据上提升样本外预测精度,应用涵盖中低收入国家健康相关生活质量与乳腺癌淋巴结评估的基因组预测。对您而言,该文的算法设计与软件实现思路(迭代加权、分组预测)可作为您统计计算兴趣中数值方法与算法开发的一个具体案例,且其健康与基因组学应用与您的流行病学次级兴趣有连接。
- 关键技术:
iteratively reweighted regression,biconvex clustering,heteroscedasticity modeling,sparse regression,group-based prediction - 为什么对您有用: 本文属于统计计算方法(算法开发与数值优化)而非因果推断或高维理论核心,但其 IRR 与分组预测的算法架构可作为您统计计算兴趣中数值方法设计的参考。武器库中'software development'非常熟悉项可直接迁移到复现或扩展其 R 包实现;不过该文未涉及您熟悉的 minimax 界或 U-statistic 分析框架,因此属于中期可做——需先在 moderately_familiar 的 M-estimation 理论上补强才能对该方法的收敛速率做更深入的理论分析。作为应用导向的方法论文,其流行病学数据应用(健康生活质量、基因组)值得快速浏览以判断数据集和分析流程是否有可借用之处。
3. 10.1002/sim.70621 — Computationally Efficient Approach to Operational Prior Specification in Phase I Clinical Trials¶
- 作者: Weishi Chen, Pavel Mozgunov
- 期刊/来源: Statistics in Medicine
- 机构: University of Cambridge · MRC Biostatistics Unit
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
new_method - 摘要: 在 Phase I 临床试验的 model-based design 设定下,目标是高效标定多参数模型的 operational prior,避免传统 grid search 在多参数时模拟成本乘积级增长的问题。核心提出 cyclic calibration 方法,将多参数联合标定的计算复杂度从乘积级降至加和级;同时基于 scenario complexity(真实毒性概率的复杂度度量)对模拟场景进行筛选缩减,进一步降低模拟次数。理论/实证表明,组合两种策略可在保持与 grid search 相近 operational characteristics(如试验安全性与 MTD 选择准确率)的前提下,实现超过 500 倍的计算加速。对您有用:若未来在因果推断或高维估计的 simulation-based calibration / sensitivity analysis 中遇到多参数 grid search 瓶颈,cyclic 结构与 scenario reduction 思路可直接借鉴。
- 关键技术:
cyclic calibration,scenario complexity reduction,simulation-based parameter calibration,model-based Phase I design,computational cost reduction - 为什么对您有用: 直接连接 stat_computing 与 causal inference 的 simulation-based sensitivity analysis:多参数 prior / sensitivity 参数的 grid search 是因果推断仿真中常见瓶颈,cyclic calibration 的加和级替代乘积级思路可迁移。用 very_familiar 中的 software development 与高维 asymptotics 经验即可评估该 cyclic 策略在更复杂 estimators(如 debiased ML 超参数标定)下的适用性。立即可做:用 very_familiar 的软件开发能力复现 cyclic calibration 并在因果推断仿真场景中测试加速效果。
流行病学 (epidemiology, 8 篇)¶
1. 10.1002/sim.70610 — Cluster Trials Inference With CARE ¶
- 作者: Sergey Alexeev, Rachael L. Morton
- 期刊/来源: Statistics in Medicine
- 机构: UNSW Sydney · Cooperative Trials Group for Neuro-Oncology
- 分类: vol 45 · issue 13-14
- 相关性 6/10 · novelty:
application - 摘要: 本文针对集群随机试验中因集群大小与结构异质性导致的统计推断扭曲问题,提出CARE(Clarify, Apply, Refine, Evaluate)协议,目标是通过设计基准(design-based benchmark)提升分析的可信度与透明性。作者在实际数据中重新分配处理组别、并在合成数据中系统变化不平衡程度进行模拟,发现目前推荐的方法(如Targeted Maximum Likelihood Estimation和小样本校正的广义估计方程)未针对此类异质性优化。CARE协议将推断锚定在设计基准上,提供了一条有层次、可迭代的路径来纳入假设更丰富的方法(如TMLE),从而使不同试验间的结果更具可比性。该协议的核心步骤包括:明确估计目标、应用设计基准进行初始推断、基于模拟结果精炼模型假设、以及最终评估所选方法的稳健性。主要结论是CARE协议可系统增强集群试验推断的透明度和可信度,且模拟证据表明其在异质性场景下优于现有推荐做法。对于您而言,这篇论文连接了流行病学领域中的集群试验应用场景,您武器库中的「非参数统计」和「因果推断估计理论」可直接用于分析设计基准的理论性质及TMLE在该类设定下的有限样本表现。
- 关键技术:
targeted maximum likelihood estimation (TMLE),generalized estimating equations (GEE),design-based inference,simulation-based calibration,cluster-randomized trials - 为什么对您有用: 本文连接了流行病学集群试验的应用因果推断方向,重点关注实际数据分析中因集群异质性导致的推断扭曲问题;您武器库中「非参数统计」和「因果推断估计理论」(均 very_familiar)可直接用于评估设计基准的合理性、分析TMLE在该类异质性设定下是否仍保持 n^{-1/2}-CAN 性质及覆盖率的有限样本表现;立即可做——您已有的理论工具足以理解该协议并为其提供方法论层面的支持或改进建议。
2. 10.1002/sim.70627 · arXiv — Empirical Comparison of Win Ratio and Joint Frailty Models for Recurrent Event Endpoints With Applications in Oncology and Cardiology¶
- 作者: Adrien Orué, Derek Dinart, Laurent Billot, Carine Bellera, Virginie Rondeau
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
application - 摘要: 本文比较了两种分析含复发性非致命事件和死亡的综合终点的方法:联合脆弱模型(JFM)和非参数胜率比(LWR)。JFM通过共享脆弱性连接复发和死亡的风险,输出协变量调整的组分特异性风险比,模型假设为比例风险与伽马脆弱性。LWR是一种基于优先级的成对比较,汇总所有观测事件得到方向性处理效应,无需分布假设。通过模拟研究(变化脆弱性方差和事件率)以及肿瘤学和心脏病学两个临床数据集,评估了两种方法在功效、估计精度和解释性上的表现。结果显示JFM在统计功效上系统性优于LWR,并能提供组分特异性估计;LWR则提供一个全局度量。文章指出未来方向包括改进LWR对删失的处理以及形式化因果估计量。本文对您作为流行病学应用方向的入门阅读有价值,展示了复杂终点分析中的实操细节和模拟设计。
- 关键技术:
joint frailty model,win ratio,composite endpoint,simulation study,recurrent event analysis - 为什么对您有用: 本文属于流行病学应用领域(次要兴趣),具体涉及临床试验中复合终点的统计方法。研究者若想进入这一方向,本文可作为入门读物,了解JFM和LWR的操作流程、模拟设置及数据解读。但武器库中目前缺乏生存分析与脆弱模型的直接工具,暂不可做(需要补充比例风险模型和共享脆弱性的基础知识)。
3. 10.1002/sim.70625 · arXiv — Time‐Varying Treatment Effect Models in Stepped‐Wedge Cluster‐Randomized Trials With Multiple Interventions¶
- 作者: Zhe Chen, Wei Wang, Yingying Lu, Scott D. Halpern, Katherine R. Courtright, Fan Li et al.
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 5/10 · novelty:
new_method - 摘要: 在阶梯楔形集群随机试验(SW-CRT)的多干预设定下,本文研究当真实处理效应随暴露时间异质时,传统常数效应估计量的偏差问题。核心机制是:在可交换组内相关结构下,作者推导出常数效应估计量的期望值,证明其收敛于一个由设计决定的暴露时间特异性效应的加权平均,且权重通常非均匀、不对应自然estimand。随后考察两种修正模型——时变固定效应模型与随机效应模型(将时变效应建模为对总体均值的随机偏离),并在并发与因子SW设计下通过模拟比较其表现。模拟显示忽略时间异质性会导致暴露时间平均效应的估计偏差与覆盖率不足;在时变固定效应模型下,并发与因子设计的功效在不同效应曲线形状下总体可比。实证分析PONDER试验数据,三种模型均显示无处理效应但精度不同。对您可能有用:本文为SW-CRT中time-varying treatment effect的identification与estimand定义提供了具体框架,直接连接到纵向因果推断中time-varying效应的敏感性分析。
- 关键技术:
stepped-wedge cluster-randomized trial,exchangeable correlation structure,time-varying treatment effect estimand,design-dependent weighted average,mixed-effects model - 为什么对您有用: (1) 直接连接到流行病学因果推断中SW-CRT设计的time-varying treatment effect设定,以及纵向因果推断中效应异质性的estimand问题。(2) 本文对常数效应估计量偏差的解析推导,可用您very_familiar的高维渐近理论或moderately_familiar的M-estimation理论来验证其加权平均收敛结果的紧性,或进一步推导更复杂相关结构下的偏差表达式。(3) 中期可做:若想将此框架推广至更一般的semiparametric longitudinal CI设定(如带中介或IV的SW设计),需先在moderately_familiar的semiparametric理论或identification theory上长肌肉,以构建更灵活的estimand与efficient influence function。
4. 10.1002/sim.70635 — Spatially Correlated Analysis of Infectious Disease Outcomes Based on Bayesian Functional Hierarchical Models¶
- 作者: Shaopei Ma, Keming Yu, Jianxin Pan, Man‐Lai Tang, Wolfgang Karl Härdle, Maozai Tian
- 期刊/来源: Statistics in Medicine
- 机构: University of International Business and Economics · Brunel University of London · Beijing Normal-Hong Kong Baptist University · Hong Kong Baptist University · University of Hertfordshire · Humboldt-Universität zu Berlin · Renmin University of China
- 分类: vol 45 · issue 13-14
- 相关性 4/10 · novelty:
new_method - 摘要: 在区域级传染病(COVID-19)计数数据设定下,目标是解决跨区域时间错位、空间依赖与计数过度分散三重挑战下的轨迹估计与预测。本文提出贝叶斯函数层级模型:先用曲线预处理对齐各区域爆发时间,再以负二项分布处理过度分散,用非参基函数刻画时间动态,并通过 Leroux CAR 先验自适应建模空间相关性。后验推断与多步预测依赖作者开发的 Gibbs sampler。模拟与美国各州 COVID-19 数据显示,该模型在估计精度与预测精度上优于替代方案,并能提前预测滞后爆发州的病例激增。对您可能有用:该文展示了流行病学空间-时间数据中非参基函数与空间先验的联合建模范式,可作为理解 epi 领域贝叶斯层级模型结构的入门阅读。
- 关键技术:
Bayesian hierarchical model,Negative-Binomial overdispersion,nonparametric basis functions,Leroux conditional autoregressive prior,Gibbs sampler,curve alignment preprocessing - 为什么对您有用: (1) 本文属于流行病学应用,连接 secondary interest 的 epi 数据集与空间-时间因果/预测建模;(2) 武器库中 nonparametric statistics 与 software development 可直接审视其基函数选择与 Gibbs sampler 实现细节,但贝叶斯空间先验(CAR/Leroux)不在 very/moderately_familiar 列表中;(3) 作为 gateway reading 值得花时间读全文以了解 epi 领域如何处理空间依赖与时间错位——中期可做:若想在 epi 空间建模上深入,需先在 moderately_familiar 的 semiparametric theory 之外长肌肉于贝叶斯空间先验理论。
5. 10.1002/sim.70608 — Variable Selection for Illness‐Death Processes Under Dual Observation Schemes¶
- 作者: Xianwei Li, Liqun Diao, Richard J. Cook
- 期刊/来源: Statistics in Medicine
- 机构: University of Waterloo
- 分类: vol 45 · issue 13-14
- 相关性 4/10 · novelty:
new_method - 摘要: 在 illness-death 过程框架下,研究慢性病进展与死亡的联合建模,其中疾病进展时间受区间 censoring、死亡时间受右 censoring,形成 dual observation scheme。目标是通过 penalized observed data likelihood 对 multiplicative intensity 模型中的不同回归系数集进行变量选择。核心机制是创新地构造 EM 算法来优化分层惩罚似然,不同转移强度(健康→疾病、健康→死亡、疾病→死亡)的系数使用不同 penalty function,且 E-step 与 M-step 可用现有软件实现。模拟验证了有限样本表现,并在 NACC 队列的痴呆数据中展示了应用价值。对您可能有用:该文为流行病学队列数据中的 interval-censored 多态过程建模与变量选择提供了完整 pipeline。
- 关键技术:
illness-death process,interval-censored progression,penalized observed data likelihood,multiplicative intensity model,EM algorithm with stratified penalties,variable selection for transition-specific coefficients - 为什么对您有用: 本文属于流行病学应用与因果推断的交叉:illness-death 模型是纵向多态过程的经典设定,dual observation scheme 下的区间 censoring 处理对您关注的 longitudinal causal inference 有直接参考价值。您武器库中的 M-estimation theory 与 semiparametric theory 可用于审视其 penalized likelihood 的渐近性质(如 oracle property 是否成立、不同 penalty 下的收敛率)。follow-up 判断:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格推导该 EM-penalized estimator 的渐近效率与 influence function。
6. 10.1002/sim.70631 — Evaluation and Inference of Pool Testing Costs Using a Probabilistic Perspective¶
- 作者: Bernardo S. Scaldaferri, Rosangela H. Loschi, Murilo S. Costa
- 期刊/来源: Statistics in Medicine
- 机构: Universidade Federal de Minas Gerais · Universidade do Estado de Minas Gerais · Universidade Federal do Espírito Santo
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
application - 摘要: 在 Dorfman 两阶段混池检测(pool testing)设定下,目标是评估检测相对成本(所需测试数与样本数之比)的概率分布,关键假设为各池阳性概率服从 Beta-Binomial 模型且先验 prevalence 已知。作者将池阳性概率的先验设为 Beta 分布,推导出相对成本的精确分布及累积概率 P(relative cost > 1),同时给出整体混池流程的 sensitivity 与 specificity 解析表达式。通过数值分析比较了不同 prevalence、池大小及金标准测试精度下的成本风险,并在真实流行病学数据上进行了应用。对您可能有用:本文为流行病学大规模筛查提供了成本-精度的概率决策框架,可直接迁移至 epi secondary interest 的应用场景。
- 关键技术:
Dorfman pool testing,Beta-Binomial model,prior prevalence distribution,sensitivity and specificity of pooled procedure,cost distribution derivation - 为什么对您有用: 本文属于 epidemiology secondary interest 的应用型工作,提供了混池检测成本与精度的概率评估框架,适合作为 epi 数据分析场景的入门读物。从 technical_arsenal 看,本文的 Beta-Binomial 推导与 minimax bounds / 高维渐近理论无直接交集,但 very_familiar 中的 software development 可直接复现其数值实验与分布计算。Follow-up 判断:立即可做——用 very_familiar 的软件开发能力即可复现并扩展其成本分布计算,但理论深度有限,无需动用 HOIF 或 semiparametric 等武器。
7. 10.1002/sim.70623 — Variable Selection in Multistate Models for Correlated Data With Application in a COVID ‐19 Vaccination Study¶
- 作者: Jason Mao, Yang Li, Wanzhu Tu
- 期刊/来源: Statistics in Medicine
- 机构: Indiana University Health · Indiana University – Purdue University Indianapolis
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
minor - 摘要: 在多状态模型(MSM)框架下,目标是对具有组内相关性的转移时间数据进行变量选择与参数估计,核心假设是同一个体在不同状态间的转移时间存在相关性。方法上,通过对似然函数重新参数化,并用光滑的双曲正切函数(hyperbolic tangent)近似惩罚项来实现稀疏性,避免了 L1 惩罚的非光滑性带来的数值优化困难。模拟研究评估了变量选择准确性与参数估计效率,并将该方法应用于 COVID-19 疫苗接种者的四状态(健康、感染、急诊/住院、死亡)护理转移观察性数据。对您可能有用:本文展示了流行病学队列中多状态转移建模与惩罚变量选择的完整 pipeline,但理论深度较浅,未涉及 semiparametric efficiency 或高维 inferential guarantee。
- 关键技术:
multistate model,correlated transition times,likelihood reparameterization,hyperbolic tangent penalty,variable selection - 为什么对您有用: 本文属于流行病学应用方向,连接到 epidemiology secondary interest 中的队列数据与因果/转移建模。(1) 作为 gateway reading,本文对多状态模型的结构与似然重参数化有清晰展示,数据结构(四状态转移)与组内相关性设定对统计建模有参考价值,但理论部分较常规,未触及 efficiency bound 或高维 inference;(2) 武器库中的 M-estimation theory 可直接审视其似然重参数化与惩罚估计的收敛性,但本文未提供此类理论结果;(3) 综合判断:本文是可读的流行病学应用入门,但方法学 novelty 有限(novelty_flag = minor),不值得花时间读全文理论细节,仅需浏览应用部分了解多状态数据结构。
8. 10.1002/sim.70607 · arXiv — Bayesian Sparse Regression for Microbiome–Metabolite Data Integration¶
- 作者: Kai Jiang, Satabdi Saha, Christine B. Peterson
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
new_method - 摘要: 在微生物组-代谢物数据整合设定下,目标是针对组成性微生物组协变量与高缺失率代谢物响应变量进行变量选择与回归估计,假设缺失机制分为低丰度与技术缺失两类。核心方法为贝叶斯稀疏回归,对代谢物缺失采用双机制建模(MNAR + MAR),对微生物组组成性特征引入专用贝叶斯先验以规避标准变量选择方法的失效。模拟表明该方法在缺失值插补与相关微生物组预测变量选择上均优于忽略组成性或单一缺失机制的方案,并在结直肠癌队列数据上进行了实证分析。对您可能有用:该文提供了流行病学队列中处理组成性协变量与MNAR缺失的贝叶斯建模范式,可作为因果推断中处理类似数据结构的参考。
- 关键技术:
Bayesian sparse regression,compositional data prior,dual missingness mechanism modeling,MNAR imputation,variable selection under compositionality - 为什么对您有用: 本文属于流行病学应用(结直肠癌队列),处理了组成性协变量与MNAR缺失这两个在因果推断与流行病学数据中极常见的结构问题,对您在 epi 方向的 applied causal work 有直接数据集与建模参考价值。从 technical_arsenal 看,您 very_familiar 的 estimation theory in causal inference 可直接审视其贝叶斯先验在 identification 上的隐含假设(如 MNAR 的可识别性条件),但若要严格从 semiparametric efficiency 角度改进其插补与选择机制,需先在 moderately_familiar 的 semiparametric theory 上长肌肉以构造 orthogonal score。粗判:中期可做。
其他 (other, 3 篇)¶
1. 10.1002/sim.70616 · arXiv — On the Interplay Between Prior Weight and Variance of the Robustification Component in Robust Mixture Prior Bayesian Dynamic Borrowing Approach¶
- 作者: Marco Ratta, Gaëlle Saint‐Hilary, Mauro Gasparini, Pavel Mozgunov
- 期刊/来源: Statistics in Medicine
- 分类: vol 45 · issue 13-14
- 相关性 3/10 · novelty:
new_method - 摘要: 在 Bayesian dynamic borrowing 的 Robust Mixture Prior (RMP) 设定下,目标是研究混合先验中 robustification component 的权重与方差联合选取对 hybrid-control 随机化试验后验推断的影响。本文指出当前实践仅调权重而固定方差(如 unit-information variance)的做法有局限,证明在参数空间特定区域,大量权重-方差组合可产生几乎相同的后验推断,且使用大方差 robust component 并不必然触发 Lindley's paradox。进一步理论表明,大方差设定能改善渐近 type I error 控制,并增强 RMP 对 robustification component 位置参数设定的鲁棒性。基于这些结果,作者提出了一套实用的超参数 elicitation 流程。对您可能有用:本文对 Bayesian prior elicitation 与 Lindley's paradox 的渐近分析,可为因果推断中贝叶斯敏感性分析或半参数模型先验选取提供参考视角。
- 关键技术:
robust mixture prior,Bayesian dynamic borrowing,Lindley's paradox,asymptotic type I error control,hyper-parameter elicitation,unit-information variance - 为什么对您有用: 本文主要涉及 Bayesian prior elicitation 与临床试验动态借用,与您 primary interests(因果推断、高维/效率理论、U-statistics)的直接技术重叠有限;其渐近 type I error 与 Lindley's paradox 分析虽与 hypothesis testing 有弱关联,但未触及您熟悉的 minimax 或 semiparametric efficiency 框架。武器库中 very_familiar 的 minimax bounds 与 moderately_familiar 的 M-estimation theory 并非攻此 paper 贝叶斯 elicitation 问题的自然口子。follow-up 粗判:暂不可做——核心机器(贝叶斯先验 elicitation 与 Lindley's paradox 的精细渐近分析)不在武器库中,若要深入需先补 Bayesian asymptotics 与 prior calibration 的专门文献。
2. 10.1002/sim.70612 — Safety‐Driven Response Adaptive Randomization: An Application in Noninferiority Oncology Trials¶
- 作者: Maria Vittoria Chiaruttini, Lukas Pin, Sofía S. Villar
- 期刊/来源: Statistics in Medicine
- 机构: University of Padua · University of Cambridge · MRC Biostatistics Unit
- 分类: vol 45 · issue 13-14
- 相关性 2/10 · novelty:
new_method - 摘要: 本文在非劣效性肿瘤临床试验设定下,提出基于安全性数据的响应自适应随机化(RAR)设计 SAFER,目标 estimand 为非劣效性疗效差异,同时最小化不良事件率。核心机制是利用早期可观测的安全性终点(而非延迟的疗效终点)动态调整分配比例,并根据安全性与疗效的观测关联强度控制适应速度。理论贡献主要在操作特征层面:模拟显示 SAFER 在保持统计功效的同时降低不良事件率,且适应速度可随终点时间对齐度灵活调节。方法学 novelty 属于新设计框架而非新推断理论;对您可能有用之处在于该设计在因果推断的 longitudinal/IV 设定中处理延迟疗效与早期代理变量的思路可作类比。
- 关键技术:
response-adaptive randomization,noninferiority trial design,safety-driven allocation,dynamic allocation proportion,operating characteristics simulation - 为什么对您有用: 本文连接到因果推断的 longitudinal 设定中处理延迟疗效终点与早期代理变量(安全性信号)的 trade-off,但核心是临床试验设计而非推断理论。用 technical_arsenal 中的 identification theory in causal inference 可尝试将 SAFER 的动态分配机制形式化为一个 sequential decision 的 identification 问题,但收益有限。follow-up 判断:暂不可做——核心机器(贝叶斯自适应设计/顺序决策理论)不在武器库里,且本文缺乏严谨的渐近理论或效率界分析供 minimax/semipara 工具切入。
3. 10.1002/sim.70633 — Effect Size Rules of Thumb for One‐Dimensional Functional Data With an Application to Gait Analysis¶
- 作者: Todd Pataky, Alessia Pini, Ezio Preatoni, Lina Schelin
- 期刊/来源: Statistics in Medicine
- 机构: Kyoto University · Kyoto University of Education · Università Cattolica del Sacro Cuore · University of Bath · Umeå University
- 分类: vol 45 · issue 13-14
- 相关性 1/10 · novelty:
application - 摘要: 本文针对一维功能数据的效应量解释问题,指出广泛使用的Cohen/Sawilowsky准则不适用于功能数据,因为相同效应量在功能数据中更易出现。作者提出(i)与Cohen准则概率一致的功能效应量准则,以及(ii)一个可适配任意实验场景的概率一致性框架。利用全髋关节置换步态数据集进行验证,发现不同准则的解释结果差异显著:使用传统准则得出'中'和'极小'效应,而调整后的准则得出'极大'效应。因此建议仅在先验功效分析中采用通用准则,在事后解释时应使用所提出框架以获得有意义的跨研究比较。虽然本工作不直接涉及因果推断或高维统计,但其中稳健效应量构建的思想对纵向功能数据的效应量报告具有参考价值。
- 关键技术:
functional data analysis,Cohen's d effect size,two-sample testing,probabilistic consistency,power analysis - 为什么对您有用: 本文讨论的功能数据效应量规则与高维/函数型数据的统计推断相关,可连接到研究者对高维统计和假设检验的兴趣。研究者'非常熟悉'的'nonparametric statistics'武器可用于理解其概率一致性框架的理论基础,例如利用函数估计的收敛性进行效应量校准。follow-up粗判:中期可做,需先在'moderately_familiar'的M-estimation理论中熟悉函数型数据操作,即可扩展为更一般的效应量框架。
Maintained by 陈星宇 · Homepage · Source on GitHub