SMMR — Vol 35 Issue 4 · 2026-06-19¶

共 14 篇 · Statistical Methods in Medical Research
目录核对 ✅ 14 篇全部抓到（对照 OpenAlex 14 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期14篇论文主要围绕三条主线展开：因果推断与处理效应估计（5篇，涉及纵向中介分析中治疗依赖有序混杂的单调性识别、稀缺资源分配的条件生存获益动态IPTW、子组协变量平衡的倾向得分加权与核光滑、利用时序分层先验改进因果发现的有限样本性能、部分嵌套随机试验的最大最小设计优化）；假设检验方法与推断框架（5篇，包括混合治愈模型中治愈率的鞅差相关非参数检验、Cox比例风险模型Schoenfeld样本量公式在Wald检验下的渐近有效性条件、自适应富集设计中基于p值反演的置信区间与中位数无偏估计、利用汇总统计的疾病进展似然比检验、三臂有序终点试验中基于win概率的秩方法等效性/非劣效性检验）；以及高维与复杂数据建模（4篇，含多fMRI图模型联合估计的贝叶斯集成一致性、张量集成学习的分块策略与PCS框架、非等离散计数数据的gamma‑count贝叶斯模型与罚复杂性先验、区间删失竞争风险缺失原因的直接似然sieve MLE）。

因果推断主线中，有序治疗依赖混杂的中介分析通过单调性假设将中介效应识别至分层敏感性参数，避免了后处理条件化偏误；条件生存获益一文将IPTW与生存模型动态扩展，为等待列表患者实时计算个体化获益；子组平衡加权方法直接优化权重（G‑SBPS）并引入核光滑（kG‑SBPS）以在多个协变量变换上实现平衡，增强对倾向得分模型误设的稳健性；时序因果发现利用变量时间序贯分层先验缩小PC算法搜索空间，理论证明有限样本下误差累积减少；部分嵌套试验设计采用最大最小准则在类内相关系数等参数范围内最大化最坏情况功效，并开发了R Shiny工具辅助样本量计算。

假设检验主线中，治愈率检验以鞅差相关度量治愈指示变量与协变量的相关性，结合置换与卡方近似构造非参数检验；Schoenfeld公式一文在Wald检验框架下重新推导，表明渐近有效性要求风险集比例性（各时间点at‑risk比等于随机化比例），并指出强alternative下该条件可能严重违背；自适应富集设计通过p值反演和多种样本空间排序构造条件/无条件置信区间及中位数无偏估计，覆盖水平稳健；疾病进展似然比检验仅需组均值与方差等汇总统计即可检验治疗延缓进展的效果，功效优于现有Wald型检验；三臂试验秩方法基于win概率，通过Fisher‑z、MOVER‑logit、logit‑arcsinh三种变换构造同时置信区间，适用于有序终点。

与因果推断方向最贴的是前五篇因果推断论文；假设检验方向可优先关注第7–11篇；高维与复杂数据方向可留意第6篇（多图模型联合估计）、第12篇（张量集成学习）、第13篇（贝叶斯非等离散计数模型）和第14篇（区间删失竞争风险直接似然）。

因果推断 (causal_inference, 5 篇)¶

1. 10.1177/09622802261418211 · arXiv — Mediation analysis in longitudinal intervention studies with an ordinal treatment-dependent confounder¶

作者: Mikko Valtanen, Tommi Härkänen, Matti Uusitupa, Jaakko Tuomilehto, Jaana Lindström, Kari Auranen
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 4 · pp 773-794
相关性 9/10 · novelty: weaker_assumption
摘要: 本文研究纵向干预研究中，存在有序治疗依赖混杂变量（post-treatment confounder）时的因果中介分析。在标准中介分析中，若混杂变量受治疗影响且为有序变量，传统的非参数识别将失效。作者提出在单调性假设（monotonicity assumption）下——即治疗仅沿一个方向影响该混杂变量——中介效应可识别至分层特异性敏感性参数，并给出了对应的非参数经验表达式。该假设的可逆性可通过观察数据边际分布进行检验。实证部分利用芬兰糖尿病预防研究数据，评估生活方式干预对避免2型糖尿病的效果中体重减少的中介作用，同时将其他健康相关变化视为治疗依赖混杂。方法上避免了后处理条件化偏误，将中介视为函数实体、将时间-事件结局定义为受限无病时间。本文连接了您对纵向因果推断和敏感性分析的兴趣，其中单调性假设的渐近性质（如半参数效率界）可能值得进一步探讨。
关键技术: monotonicity assumption, post-treatment confounding, mediation analysis, longitudinal mediator, time-to-event outcome, sensitivity parameters
为什么对您有用: 本文直接连接您的 primary interest 中的因果推断子方向——纵向中介分析和治疗依赖混杂下的识别。您的 identification theory（moderately familiar）可以直接用于理解单调性假设的严格含义，而您的 estimation theory（very familiar）则可评估该敏感性参数方法的有限样本表现。基于当前装备，您可以立即用非参数 bootstrap 和交叉拟合验证其识别公式的鲁棒性（立即可做）；若想进一步推导半参数效率界，则需先巩固半参数理论（moderately familiar）中的 influence function 计算。

2. 10.1177/09622802261420699 — Estimating conditional survival benefit for the allocation of scarce resources¶

作者: Ilaria Prosepe, Nan van Geloven, Hans de Ferrante, Andries E Braat, Hein Putter
期刊/来源: Statistical Methods in Medical Research
机构: Leiden University Medical Center · Eurotransplant · Eindhoven University of Technology
分类: vol 35 · issue 4 · pp 812-826
相关性 8/10 · novelty: application
摘要: 在稀缺医疗资源（如肝移植）分配情境下，本文聚焦于条件生存获益（conditional survival benefit）的估计，即个体接受治疗与否的期望生存差异。面临三个挑战：时依混杂、多时间尺度（治疗等待时间和日历时间）以及多版本治疗。基于先前将横截面与逆概率治疗加权（IPTW）相结合的工作，作者提出一种动态估计策略，对任何时刻可接受治疗的等待患者计算条件生存获益，并明确给出识别假设。方法核心是扩展的IPTW结合生存模型，以处理治疗分配随健康标记动态变化。模拟研究显示，与简化方法相比，新估计量偏差更小，方差可接受。在Eurotransplant肝移植数据中的应用表明，该方法可用于指导实际分配决策。对您可能有用：本文连接了因果推断中的纵向时依混杂和多版本处理问题，与您的causal inference兴趣高度相关，且所用的IPTW和生存模型可借助您非常熟悉的因果推断估计理论直接理解和扩展。
关键技术: Inverse probability of treatment weighting (IPTW), Conditional survival benefit, Time-dependent confounding, Multiple time scales, Multiple versions of treatment, Simulation-based evaluation
为什么对您有用: 本文处理的是因果推断中纵向时依混杂和稀缺资源分配的现实问题，直接关联您的primary interest（causal inference, longitudinal）。技术方面，您非常熟悉的因果推断估计理论（IPTW、识别假设）可以立即用于评估和扩展本文方法。立即可做：您可使用现有的软件开发和因果推断经验复现并改进其估计量，例如引入交叉拟合或双重稳健估计。

3. 10.1177/09622802251415157 — Parametric and nonparametric propensity score weighting analysis with subgroup covariate balance¶

作者: Yan Li, Yong-Fang Kuo, Liang Li
期刊/来源: Statistical Methods in Medical Research
机构: The University of Texas MD Anderson Cancer Center · Data Management (Italy)
分类: vol 35 · issue 4 · pp 736-751
相关性 8/10 · novelty: new_method
摘要: 本文聚焦于观察性研究中子组平均处理效应的估计，现有倾向得分加权方法依赖于正确指定的倾向得分模型，模型误设导致子组协变量失衡和处理效应偏差。作者提出了一种在子组内实现协变量均值平衡的倾向得分加权方法（G-SBPS），通过优化权重直接控制子组平衡。进一步引入非参数核回归对倾向得分进行光滑化，得到核化版本（kG-SBPS），可在丰富函数类中改进协变量变换的均值平衡，增强对模型误设的稳健性。数值实验表明，两种方法在子组协变量平衡和子组处理效应估计上均优于现有方法。文章还使用右心导管插管和糖尿病自我管理训练两个真实数据集进行了应用演示。该工作直接连接您对因果推断中估计方法的兴趣（特别是倾向得分加权与子组异质性），且非参数核回归的引入与您熟悉的非参数统计工具高度契合，属于立即可读的实证方法。
关键技术: propensity score weighting, subgroup covariate balance, kernel regression, inverse probability weighting, subgroup average treatment effect
为什么对您有用: 直接关联因果推断中子组处理效应估计的实际需求，您熟悉的非参数统计和因果推断估计理论（非常熟悉项）可立即用于理解并可能改进该方法的渐近性质。该论文属于应用导向的方法论文献，适合作为中期可读的参考（读完即可尝试在自有数据或模拟中实现），无需额外工具。

4. 10.1177/09622802261422162 · arXiv — Improving finite sample performance of causal discovery by exploiting temporal structure¶

作者: Christine W. Bang, Janine Witte, Ronja Foraita, Vanessa Didelez
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 4 · pp 867-886
相关性 7/10 · novelty: new_method
摘要: 本研究聚焦因果发现算法在有限样本下的不稳定性问题，利用时序结构（tiered background knowledge）提升其准确性与稳健性。目标是在纵向或队列数据中识别变量间的因果图，利用变量在时间上的顺序作为先验分层信息。方法基于PC算法，将变量按时间先后分层（tier），限制边只能从较早层指向较晚层，从而减少搜索空间和统计错误累积。作者给出了算法在有限样本下更优的理论性质证明，并通过与标准PC、FCI等算法的模拟比较证实其有限样本表现提升。最后应用于儿童队列数据（IDEFICS研究），分析饮食、体力活动等对健康结局的因果结构。该工作直接关联因果推断中的结构学习方向，尤其对流行病学纵向数据的因果发现具有实用价值。
关键技术: PC algorithm, tiered background knowledge, causal structure learning, finite-sample robustness, conditional independence testing, cohort study
为什么对您有用: 本文属于因果推断中的结构学习方法改进，直接匹配您的‘因果推断’兴趣子方向（尤其是纵向数据下的因果发现）。您武器库中‘非常熟悉’的‘因果推断中的估计理论’和‘软件开发’可用来复现其算法并检验小样本一致性，而‘中等熟悉’的‘识别理论’可用于评估tier假设的合理性。对于实践应用（如流行病学队列分析），这是一篇立即可读的入门应用论文，无需额外武器即可进入，属于‘立即可做’的阅读和代码复现。

5. 10.1177/09622802251409388 — Efficient design of partially nested randomized trials: A maximin approach¶

作者: Math JJM Candel, Gerard JP van Breukelen
期刊/来源: Statistical Methods in Medical Research
机构: Maastricht University
分类: vol 35 · issue 4 · pp 695-712
相关性 5/10 · novelty: application
摘要: 针对两治疗组部分嵌套随机试验（一个治疗组存在聚类而对照组无聚类）的连续结局，提出优化受试者数量或研究预算的设计。该方法采用最大最小准则，在类内相关系数、效应量等未知参数的合理范围内保证最坏情况下的统计功效，并同时优化治疗组与对照组的分配比例及聚类大小/数量。推导了当聚类数或聚类大小受实际约束时的最大最小设计方案，通过实证例子展示了相比等分配设计可显著降低研究预算。开发了用户友好的R Shiny应用以简化样本量计算。虽然本文属于应用设计优化，但其稳健设计思想可与因果推断中的敏感性分析结合，且R Shiny工具的构建对您的统计软件开发兴趣有直接参考价值。
关键技术: maximin design, partially nested randomized trial, sample size optimization, power analysis, cluster randomized trial
为什么对您有用: 论文直接关联您在因果推断中对随机试验设计的兴趣，特别是部分嵌套聚类试验的样本量规划。您非常熟悉的最小最大下界（minimax bounds）思想可迁移至参数maximin设计的稳健性评估，但实际功率公式涉及聚类RCT特有的方差结构（如ICC），您当前武器库中缺少临床试验功率分析的具体技术。因此暂不可直接攻击，但可作为入门阅读了解聚类RCT的设计考量，为处理集群随机因果推断数据提供背景。

高维统计 / 随机矩阵 (high_dim_rmt, 1 篇)¶

1. 10.1177/09622802261432804 — Joint estimation of multiple graphical models for an fMRI study of brain connectivity networks¶

作者: Lizhe Sun, Xiaojuan Han, Aiying Zhang
期刊/来源: Statistical Methods in Medical Research
机构: Shanxi University of Finance and Economics · University of Virginia
分类: vol 35 · issue 4 · pp 925-942
相关性 7/10 · novelty: new_method
摘要: 该文提出一个联合估计多个高维图模型（graphical models）的框架，以分析fMRI任务条件下脑连接网络的变化与相似性。方法核心是通过混合贝叶斯集成技术融合不同模型，并结合一系列条件独立性检验推断网络结构。理论部分建立了模型选择的一致性，数值模拟表明该方法在准确性和鲁棒性上优于现有方法。最后应用于情绪加工任务的fMRI动态功能连接分析，发现皮层下-小脑模块在情绪加工时内部及模块间连接减弱，揭示其在情绪处理中的关键作用。该工作为高维图模型联合估计提供了一种可验证一致性的贝叶斯集成途径，对您的高维统计兴趣（特别是网络结构推断）以及流行病学fMRI数据分析均有参考价值。
关键技术: Bayesian integration, conditional independence test, multiple graphical models, high-dimensional consistency, fMRI functional connectivity
为什么对您有用: 直接对应您的高维统计兴趣中的图模型估计问题，且其一致性证明可用您极为熟悉的高维渐近工具（very_familiar中的high-dimensional asymptotics）进行推敲与延伸。该文还提供了真实的fMRI数据应用，属于流行病学/神经科学实证场景，您可借鉴其分析管道来理解实际应用中图模型联合估计的挑战。综合评价：立即可做——使用您已掌握的高维渐近与非参数统计知识即可评估其理论证明的严谨性，并考虑将其贝叶斯集成思路扩展到因果网络推断。

非参数 / 半参数 (nonparam_semipara, 1 篇)¶

1. 10.1177/09622802261420820 — Regression analysis of interval-censored competing risks data with missing causes of failure: A direct likelihood approach¶

作者: Yichen Lou, Yuqing Ma, Liming Xiang, Jianguo Sun
期刊/来源: Statistical Methods in Medical Research
机构: Nanyang Technological University · Jiangsu Hengrui Medicine (China) · University of Missouri
分类: vol 35 · issue 4 · pp 795-811
相关性 3/10 · novelty: new_method
摘要: 在区间删失竞争风险数据设定下，当失败原因存在缺失时，目标是估计回归参数与累积发生函数；现有两阶段估计方法存在效率损失与计算代价问题。本文提出基于混合模型框架的直接似然方法，将竞争风险与原因缺失机制同时纳入似然函数，采用 sieve MLE 进行估计，简化了估计流程并提升了效率。理论上证明了 sieve MLE 估计量的 consistency 与 asymptotic normality，且方法可推广至其他竞争风险模型框架。模拟与阿尔茨海默病数据应用验证了方法性能。对您可能有用：本文的 sieve MLE 与 asymptotic normality 证明路径可作为 semiparametric theory 与 M-estimation 的具体案例参考。
关键技术: sieve maximum likelihood estimation, mixture model for competing risks, interval censoring, missing cause of failure, asymptotic normality
为什么对您有用: 本文连接到 semiparametric theory 与 M-estimation 子方向，其 sieve MLE 的 consistency/normality 证明是您 moderately_familiar 中 M-estimation theory 的直接应用场景。用您 very_familiar 的高维渐近理论或 moderately_familiar 的 HOIF，可以追问该 sieve MLE 是否达到 semiparametric efficiency bound，或能否构造 one-step/debiased 估计量以提升效率。中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉（具体为 semiparametric efficiency bound 的计算与 influence function 推导），以验证并可能改进其效率性质。

数理统计 / 假设检验 (hypothesis_testing, 5 篇)¶

1. 10.1177/09622802261421453 · arXiv — Covariate hypothesis tests for the cure rate in mixture cure models based on martingale difference correlation¶

作者: Blanca E Monroy-Castillo, María Amalia Jácome, Ricardo Cao, Ingrid Van Keilegom
期刊/来源: Statistical Methods in Medical Research
分类: vol 35 · issue 4 · pp 887-911
相关性 7/10 · novelty: new_method
摘要: 在混合治愈模型（mixture cure model）框架下，本文提出非参数假设检验方法，用以判断协变量是否影响治愈率（cure rate）。核心思想：利用鞅差相关（martingale difference correlation）度量治愈指示变量与协变量之间的相关性，构建检验统计量。为逼近零分布，本文采用两种方式：置换检验（permutation test）和卡方近似（chi-square test），后者基于渐近分布理论。进一步，通过部分鞅差相关（partial martingale difference correlation）将方法推广至两个协变量的情况，控制其他变量的影响。仿真研究表明该方法在不同治愈率和样本量下具有良好的检验功效和尺寸控制。最后，应用于类风湿关节炎数据集，展示了实际效用。这篇文章与您对假设检验的理论兴趣直接对接，且其非参数框架可借助您熟悉的非参数统计工具进行拓展。
关键技术: Mixture cure model, Martingale difference correlation, Permutation test, Chi-square approximation, Partial martingale difference correlation
为什么对您有用: 本文所提出的非参数检验方法直接对应您对数学统计中假设检验的兴趣，特别是在混合治愈模型这一生存分析分支中检验协变量对治愈率的影响。您的武器库中'nonparametric statistics'可用来理解其检验统计量的构造和渐近性质，并可能进一步优化检验功效或扩展至高维协变量情形。属中期可做：需要先补充混合治愈模型和鞅差相关的技术细节，但核心非参数工具已就位。

2. 10.1177/09622802261427024 — Asymptotic validity of Schoenfeld’s sample size formula for the Cox proportional hazards model via the Wald test approach¶

作者: Se Yoon Lee
期刊/来源: Statistical Methods in Medical Research
机构: Mitchell Institute · Texas A&M University
分类: vol 35 · issue 4 · pp 681-694
相关性 6/10 · novelty: new_theory
摘要: 本文重新审视 Cox 比例风险模型下经典的 Schoenfeld 样本量公式，目标 estimand 为 log hazard ratio，关键假设为风险集比例性（risk set proportionality）。作者指出经典基于 score test 的推导在 null 下计算 Fisher information 忽略了该条件的必要性；转而在 Wald test 框架下严格证明，该公式的渐近有效性依赖于风险集比例性——即各观测时间点处理组与对照组 at-risk 人数之比等于随机化比例。此性质在 null 或低事件率下大样本时成立，但在强 alternative 下可能严重违背，导致效率大幅损失。模拟表明 simulation-based power analysis 在违背该假设时仍稳健。ADAURA 试验的回顾性分析显示，simulation-based 方法可在维持 type I error 与 CI coverage 的前提下缩短试验时长。对您可能有用：本文对生存分析 hypothesis testing 的样本量规划做了严谨的渐近理论澄清，指出了经典公式在 alternative 下的效率损失机制。
关键技术: Wald test framework, Schoenfeld sample size formula, risk set proportionality, Fisher information under null vs alternative, simulation-based power analysis, Cox proportional hazards model
为什么对您有用: 本文直接连接到 hypothesis testing 子方向，聚焦生存分析中样本量公式的渐近有效性条件与效率损失机制。用您 very_familiar 的 minimax bounds / estimation theory 视角，可以审视其声称的效率损失是否可被精确量化为一个 sharper rate bound，而非仅靠模拟展示。follow-up 粗判：中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉，以将 risk set proportionality 违背下的非正则 M-estimator 渐近分布做严格推导。

3. 10.1177/09622802261423180 — Confidence intervals and point estimates for treatment effects in adaptive enrichment designs¶

作者: Jinyu Zhu, Andrew Titman, Fang Wan
期刊/来源: Statistical Methods in Medical Research
机构: Lancaster University
分类: vol 35 · issue 4 · pp 827-846
相关性 6/10 · novelty: new_method
摘要: 针对自适应富集设计中因中期分析导致的亚组选择问题，本文提出一套基于 p 值反演方法的治疗效应推断框架。该方法通过定义多种样本空间排序（如似然排序、Wald排序等）构造无条件或条件于所选亚组的置信区间，同时利用 p 值函数导出中位数无偏估计量和条件矩估计量。模拟结果表明，新方法能够稳健地达到名义覆盖水平，而基于最大似然估计的朴素置信区间存在严重覆盖不足。在转移性结直肠癌治疗交互作用试验的重分析中，方法展示了实用性。该框架适用于一般性两阶段两组设计，为适应性设计下的有效推断提供了通用工具，与您的假设检验兴趣中的条件推断和置信区间构造直接相关。
关键技术: p-value inversion, sample space ordering, median-unbiased estimation, conditional inference, adaptive enrichment design
为什么对您有用: 本文属于假设检验与区间估计的方法论工作，直接与您 primary interests 中的 mathematical statistics & hypothesis testing 子方向衔接。其核心难点 — 在亚组选择后对 treatment effect 进行 valid 推断 — 涉及的条件推断和 p 值反转技术，可与您非常熟悉的 minimax bounds 思路对比：相比贝叶斯或 bootstrap 方法，这里通过样本空间排序实现 exact conditional inference，可以尝试用您在高维渐近中的经验去分析其 finite-sample 性质是否可拓展到更复杂的选择规则。中期可做：需要在 moderately_familiar 的 M-estimation 理论上进一步深化，以便将现有方法推广到更一般的两阶段设计中。

4. 10.1177/09622802261424515 — Likelihood ratio test for the disease progression model to measure saved time in Alzheimer’s disease¶

作者: Guogen Shan, Yahui Zhang, Zhixin Tang, Aidong Adam Ding
期刊/来源: Statistical Methods in Medical Research
机构: University of Florida · Universidad del Noreste
分类: vol 35 · issue 4 · pp 912-924
相关性 3/10 · novelty: application
摘要: 本文针对阿尔茨海默病随机试验中治疗效果评估，提出一种基于疾病进展模型的似然比检验，用于衡量新治疗相比安慰剂所‘节省的时间’。传统方法需要患者级数据的投影估计，而该方法仅需汇总统计（如均值和方差），无需个体数据。具体而言，他们假定疾病进展符合线性或非线性轨迹，利用安慰剂组曲线和治疗组末次访问数据构建参数模型，并通过似然比统计量检验治疗是否延缓疾病进展。模拟研究表明，当安慰剂组后期进展较慢时，所提LR检验在统计功效上优于现有Wald型检验。最后，使用donanemab III期试验的汇总数据展示实际应用。该方法将经典假设检验工具扩展到汇总统计场景，为无法获取个体数据的临床试验分析提供了可行途径。对您而言，该研究直接连接您的假设检验兴趣，同时属于流行病学中的应用案例，您可借鉴其构建检验的思路，在类似场景中运用您熟悉的渐近理论评估其表现。
关键技术: Likelihood ratio test, Wald test, disease progression model, saved time, projection approach, summary statistics
为什么对您有用: 本文属于假设检验在临床试验中的最新应用，直接对应您的‘数理统计与假设检验’兴趣，同时涉及阿尔茨海默病评估，契合您的‘流行病学’二级兴趣。您已熟练掌握的假设检验理论（如LR检验的渐近分布）可立即用于验证该方法在不同进展模型下的表现，甚至推广到非参设定。总体而言，您可基于现有统计软件重现其模拟与数据分析，属于立即可做的尝试，无需额外工具。

5. 10.1177/09622802261417216 — Rank-based methods for assessing equivalence/non-inferiority with assay sensitivity in a three-arm trial with ordinal endpoints¶

作者: Shi-Fang Qiu, Dai-Min Li, Wai-Yin Poon
期刊/来源: Statistical Methods in Medical Research
机构: Chongqing University of Technology · Chinese University of Hong Kong
分类: vol 35 · issue 4 · pp 752-772
相关性 3/10 · novelty: new_method
摘要: 本文针对三臂试验（含阳性对照、阴性对照和试验组）中评估等效性/非劣效性并确保assay sensitivity的问题，提出了基于win概率的非参数方法，适用于有序终点。Win概率定义为试验组个体相对于对照组个体获得更好结局的概率，无需参数假设即可量化处理效应。作者通过构造同时置信区间（SCI）实现假设检验，具体给出了Fisher-z变换、MOVER结合logit变换、以及logit与arcsinh变换等三种SCI构造方法。模拟研究表明这些方法的经验覆盖率接近名义水平，并基于区间估计与假设检验的对偶性讨论了样本量确定。示例来自术后恶心呕吐预防研究。该文将非参数排序推断推广到具有有序分类结局的临床试验设计中，填补了该场景下方法学的空白。对您而言，win概率实质上是一种U统计量，可直接用您熟悉的higher-order U-statistics理论深入分析其渐近方差和置信区间效率。
关键技术: win probability, simultaneous confidence intervals, Fisher-z transformation, MOVER (method of variance estimates recovery), logit transformation, sample size determination
为什么对您有用: 该论文的方法核心——win概率——是一种特殊的U统计量，与您非常熟悉的higher-order U-statistics计算（treewidth / tensor contraction / einsum）直接对应，可以立即用U统计量的渐近理论分析其方差估计和置信区间覆盖率的精确性；同时，该非参数方法与您moderately_familiar中的M-estimation理论相通，可用于推导其样本量公式的渐近有效性。由于您已掌握U统计量的理论工具（very_familiar），对该文的深入分析和扩展到更复杂设计（如分层序贯试验）属于立即可做的follow-up方向。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1177/09622802261424654 — An ensemble approach to tensor learning¶

作者: Jiaxin He, Jialiang Li
期刊/来源: Statistical Methods in Medical Research
机构: National University of Singapore · Duke-NUS Medical School
分类: vol 35 · issue 4 · pp 847-866
相关性 7/10 · novelty: new_method
摘要: 本文针对张量回归建模中CP分解秩选择不确定性与张量结构空间异质性的问题，提出张量集成学习（TEL）方法。通过设计不同的张量分块策略，将张量划分为互不相交的块，构建候选模型池；并利用可预测性、可计算性与稳定性（PCS）框架为候选模型赋予权重，实现模型集成。该方法同时处理了块结构和CP秩的双重不确定性。模拟实验表明TEL在不同张量复杂度下均优于单一模型。两个真实数据应用（青光眼眼底图像管理与阿尔茨海默病神经影像认知预测）进一步验证了TEL的预测优势。张量分解与集成策略是统计计算的核心技术，与您在高阶U-统计量中使用的张量收缩/einsum工具有直接的算法关联。
关键技术: CP decomposition, tensor partition, model ensemble, veridical data science (PCS) framework, tensor regression, block-wise modeling
为什么对您有用: 本文聚焦张量回归中的集成学习，直接对接您的统计计算兴趣，尤其是高阶U-统计量计算中熟悉的张量收缩/einsum复杂度分析。您可立即利用einsum库检验TEL中分块策略的计算代价，甚至探索将集成思想引入U-统计量估计——属于立即可做方向，武器库中的treewidth/einsum工具可直接支撑。

流行病学 (epidemiology, 1 篇)¶

1. 10.1177/09622802261416088 — Flexible Bayesian modeling of non-equidispersed counts with penalized complexity priors in disease incidence studies¶

作者: Mahsa Nadifar, Hossein Baghishani, Thomas Kneib, Afshin Fallah
期刊/来源: Statistical Methods in Medical Research
机构: University of Shahrood · University of Göttingen · Imam Khomeini International University
分类: vol 35 · issue 4 · pp 713-735
相关性 3/10 · novelty: new_method
摘要: 本文针对流行病学计数数据常偏离等离散性（过度/欠离散）且具有空间、时间及非线性结构的问题，提出gamma-count结构加性回归模型。模型关键创新在于对离散参数引入惩罚复杂性先验（PC prior），使其在数据支持等离散时自然向基础泊松模型收缩，同时对非线性、空间和时间效应的光滑方差使用尺度依赖的PC超先验。在潜在高斯框架下，利用集成嵌套拉普拉斯近似（INLA）实现高效近似贝叶斯推断，避免了MCMC的计算负担。模拟研究覆盖欠离散、等离散和过度离散三种场景，表明PC先验加尺度依赖超先验能精准估计离散参数和光滑效应，预测评分优于传统Poisson和负二项模型。实证应用包括德国喉癌死亡率、美国佐治亚州COVID-19发病率及爱荷华州肺癌发病率，结果显示模型拟合优度竞争或更优，且能揭示可解释的非线性和空间结构。本文是流行病学中处理非等离散计数数据的实用建模范例，其PC先验策略对于您在设计空间因果推断或分层结构中的方差参数先验时具有概念迁移价值。
关键技术: penalized complexity priors, integrated nested Laplace approximations (INLA), gamma-count regression, structured additive regression, spatial and temporal effects, latent Gaussian model
为什么对您有用: 本文属于您secondary interest中流行病学的应用方向，具体展示了如何处理非等离散计数数据并同时建模空间与时间结构，正是流行病学数据常见特征。您的技术武器库中'非参数统计'和'软件发展'两个very_familiar项可直接用于理解模型中的非线性效应估计和INLA实现，阅读门槛较低，是进入流行病学统计文献的优质入门材料。中期可尝试将本模型扩展至因果推断设定（例如空间干预下的平均因果效应），但需在流行病学识别假设（如无混杂、干扰处理）上进一步搭建——这属于moderately_familiar的'因果推断识别理论'范畴，值得花时间读全文以积累建模直觉。

Maintained by 陈星宇 · Homepage · Source on GitHub