跳转至

JRSS-C — Vol 74 Issue 1 · 2026-06-20

  • 共 12 篇 · Journal of the Royal Statistical Society Series C
  • 目录核对 ✅ 12 篇全部抓到(对照 OpenAlex 12 篇)

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期内容主要围绕四条方法论主线展开:一是半参数/非参数与高维稀疏推断,涉及可加模型缺失数据处理、高维图模型稀疏估计及逻辑回归偏倚收缩;二是贝叶斯建模与逆问题计算,涵盖复值潜在变量逆问题、时空噪声输入GAM、Dirichlet过程空间混合及经验贝叶斯先验设定;三是复杂时间序列与动态预测,聚焦局部平稳Wavelet预测、环形数据隐半马尔可夫状态分割及生存分析动态神经网络;四是流行病学中的结构化模型与因子分解,包括生存模型新因子投影度量、函数型因子源解析及造血系统图模型推断。

半参数/非参数与高维稀疏推断主线中,本期重点推进了缺失与部分观测设定下的结构恢复与变量选择。BAMMO一文在5G吞吐量预测中,通过componentwise boosting直接拟合带缺失协变量的可加模型,绕过预插补步骤,并沿solution path构建SOIL变量重要性度量;造血系统一文则面对高维部分观测的RT-qPCR数据,以penalized graphical model嵌入外部协变量实现网络稀疏推断。两者均直面高缺失/部分观测痛点,分别从非参数可加结构与图模型稀疏惩罚切入。此外,稀疏数据逻辑回归一文通过非任意经验贝叶斯设定先验均值,以收缩思路修正小样本OR偏倚,与高维稀疏下的参数恢复逻辑形成呼应。

复杂时间序列与动态预测主线中,本期聚焦非平稳性、复杂状态空间与非线性时变风险的建模工具。局部平稳预测一文针对方差随时间递增的经济序列,基于Wavelet自动谱估计直接建模原始序列,突破了经典平稳假设;环形数据一文提出非齐次隐半马尔可夫模型,以EM算法增广推断协变量调制下的状态停留时间;tdCoxSNN则将时间依赖Cox模型与神经网络结合,处理纵向图像等时变协变量对生存结局的非线性影响。三者分别从频域局部平稳、离散状态空间增广及深度生存网络角度,处理传统时间序列或生存模型难以涵盖的时变动态与非线性机制。

对于关注因果推断、半参数效率与高维方向的读者,BAMMO与造血系统两文最贴切:前者在缺失观测下直接拟合可加模型并重构变量重要性度量,后者在高维部分观测图模型中嵌入外部信息进行稀疏M估计,均涉及半参数结构下的目标参数恢复与效率考量。生存模型新因子度量一文通过投影方法在正确模型框架下剥离新因子增量贡献,其投影思路对因果推断中处理混杂与增量效应评估具有直接参考价值。

非参数 / 半参数 (nonparam_semipara, 1 篇)

1. 10.1093/jrsssc/qlae054 — Predicting 5G throughput with BAMMO, a boosted additive model for data with missing observations

  • 作者: Tate Jacobson, Jie Ding, Hui Zou
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: Oregon State University · University of Minnesota
  • 分类: vol 74 · issue 1 · pp 249-273
  • 相关性 4/10 · novelty: new_method
  • 摘要: 在5G毫米波网络吞吐量预测问题中,目标是在协变量存在高比例缺失(包括训练时的随机缺失与部署时的自选择缺失)的设定下估计可加性模型的预测函数。本文提出BAMMO(Boosted Additive Model for Missing Observations),通过componentwise boosting算法逐分量拟合可加模型,在训练阶段自然融入缺失协变量而不需预先插补。作者进一步开发了针对BAMMO的sparsity oriented importance learning(SOIL)扩展,利用整个boosting solution path而非单一选定模型来度量变量重要性。模拟与5G实测数据表明,BAMMO在高缺失率下预测精度优于插补+boosting等竞争方法,且计算时间更短。对您可能有用:BAMMO的componentwise boosting + 缺失值自然融入机制可作为非参数可加模型估计的一个工程化实现参考,其变量重要性路径分析思路也可迁移到因果推断中mediation分析的变量筛选环节。
  • 关键技术: componentwise boosting, additive model estimation, missing data without imputation, sparsity oriented importance learning, solution path variable importance
  • 为什么对您有用: 本文连接到非参数/半参数理论(可加模型的boosting估计)以及统计计算(缺失值处理与算法效率)两个子方向。用您very_familiar中的software development与nonparametric statistics可以直接复现BAMMO算法并验证其宣称的效率优势;其SOIL变量重要性度量也可用moderately_familiar的M-estimation理论审视其理论性质(如一致性)。立即可做:用very_familiar武器即可复现并做benchmark对比,或在因果mediation设定中尝试将SOIL用于treatment/mediator筛选。

统计计算 / 算法 (stat_computing, 1 篇)

1. 10.1093/jrsssc/qlae046 — A Bayesian complex-valued latent variable model applied to functional magnetic resonance imaging

  • 作者: Chase J Sakitis, D Andrew Brown, Daniel B Rowe
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: Marquette University · Clemson University
  • 分类: vol 74 · issue 1 · pp 100-125
  • 相关性 5/10 · novelty: new_method
  • 摘要: 本文研究设计矩阵未知且参数为复数时的线性回归估计问题,目标 estimand 为复值潜在变量线性模型中的系数与潜在设计矩阵,关键假设为贝叶斯先验设定与 fMRI 信号模型。核心方法提出一种贝叶斯复值潜在变量线性模型,将未知设计矩阵视为潜在参数联合推断,以避免经典最小二乘中矩阵转置乘导致的病态逆问题;推断采用 MCMC 采样,用先验正则化替代显式惩罚项。模拟与实验 fMRI 数据表明,该贝叶斯方法在病态设计矩阵下比正则化最小二乘更稳定地恢复复值信号。对您可能有用:该文将逆问题与随机噪声下的复值参数估计结合,与您熟悉的 inverse problems with random noise 及贝叶斯计算直接相关。
  • 关键技术: Bayesian latent variable model, complex-valued linear regression, ill-conditioned inverse problem, MCMC sampling, fMRI image reconstruction
  • 为什么对您有用: 本文属于 stat_computing 与 inverse problems 交叉,直接连接您 very_familiar 中的 inverse problems with random noise:将未知设计矩阵的病态逆问题转化为贝叶斯联合推断,提供了一个具体计算框架。武器库中 very_familiar 的 inverse problems 与 software development 足以支撑理解与复现该模型。属于 gateway-reading:文章对 fMRI 复值信号建模与病态逆问题的阐述较为清晰,适合作为统计计算与复值推断的入门读物;值得花时间读全文以评估贝叶斯正则化在病态逆问题中的数值稳定性细节。

经济理论 / 应用 (econ_theory, 1 篇)

1. 10.1093/jrsssc/qlae043 · arXiv — Automatic locally stationary time series forecasting with application to predicting UK gross value added time series

  • 作者: Rebecca Killick, Marina I Knight, Guy P Nason, Matthew A Nunes, Idris A Eckley
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 74 · issue 1 · pp 18-33
  • 相关性 5/10 · novelty: application
  • 摘要: 本文研究英国GVA(ABML序列)的预测问题,核心设定是时间序列方差随时间递增(通胀导致)的非平稳性,即使经变换或通胀调整后仍难以用经典平稳假设方法处理。作者采用局部平稳(locally stationary)时间序列框架,直接对原始GVA建模,推进了近期基于局部平稳Wavelet的预测方法。关键技术包括局部平稳Wavelet估计、自动谱估计与预测区间构造,方法在COVID期间高波动段仍保持良好预测精度。实证结果显示该方法在UK GVA数据上优于传统平稳假设预测器。对您而言,这是经济数据应用中非平稳时间序列预测的实例,展示了局部平稳建模的实际价值。
  • 关键技术: locally stationary wavelet, automatic spectrum estimation, nonstationary time series forecasting, wavelet-based prediction interval
  • 为什么对您有用: 本文属于经济理论secondary interest的应用型文章,使用UK GVA真实数据集展示了局部平稳时间序列预测方法,对关注经济数据集与模型的研究者有参考价值。从技术武器库看,本文核心是Wavelet-based局部平稳谱估计与预测,与您very_familiar的高维渐近理论及moderately_familiar的M-estimation理论无直接重叠,无法用现有武器切入其方法学改进。作为gateway reading,本文清晰展示了经济时间序列非平稳建模的数据结构与预测挑战,但方法学novelty有限(主要是已有局部平稳Wavelet预测方法的推进与自动化),不值得花时间深读全文,建议仅浏览数据与预测区间构造部分。

流行病学 (epidemiology, 4 篇)

1. 10.1093/jrsssc/qlae051 · arXiv — tdCoxSNN: Time-dependent Cox survival neural network for continuous-time dynamic prediction

  • 作者: Lang Zeng, Jipeng Zhang, Wei Chen, Ying Ding
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 74 · issue 1 · pp 187-203
  • 相关性 4/10 · novelty: new_method
  • 摘要: 该论文针对年龄相关性黄斑变性(AMD)的进展预测,提出了一种时间依赖Cox生存神经网络(tdCoxSNN)用于连续时间动态预测。方法在时间依赖Cox模型基础上,利用神经网络捕捉时变协变量对生存结局的非线性影响。同时,通过将卷积神经网络(CNN)与生存网络结合,tdCoxSNN可直接处理纵向眼底图像作为输入。作者通过模拟研究以及两个真实数据集(AMD研究和胆汁性肝硬化数据集)评估了方法,并与联合建模(joint modelling)和里程碑(landmarking)方法进行了比较。结果表明tdCoxSNN在预测性能上表现优异。该工作展示了深度学习在生存分析动态预测中的应用,对流行病学纵向数据建模具有参考价值。对于您而言,这篇论文连接了流行病学应用数据集及方法,虽然不直接涉及因果推断,但其纵向数据处理和预测框架可启发类似研究。
  • 关键技术: Time-dependent Cox model, Convolutional neural network, Survival neural network, Longitudinal image data, Dynamic prediction
  • 为什么对您有用: 本文属于流行病学应用,使用纵向图像数据进行动态生存预测,与您的secondary interest流行病学直接匹配。您可以使用technical_arsenal中的'estimation theory in causal inference'来对比该预测方法中的时序建模与因果推断中的g-computation估计量的异同,或使用'nonparametric statistics'评估神经网络估计的非参数性质。立即可做:利用very_familiar中的'software development'和统计理解,您可快速复现或评估该方法的代码,并探讨其扩展至因果生存分析的可能性。

2. 10.1093/jrsssc/qlae052 — Sparse inference of the human haematopoietic system from heterogeneous and partially observed genomic data

  • 作者: Gianluca Sottile, Luigi Augugliaro, Veronica Vinciotti, Walter Arancio, Claudia Coronnello
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: University of Palermo · University of Trento · National Academies of Sciences, Engineering, and Medicine · Institute for Biomedical Research and Innovation · Ri.MED · National Research Council · Analysis Group (United States)
  • 分类: vol 74 · issue 1 · pp 204-228
  • 相关性 3/10 · novelty: application
  • 摘要: 在造血干细胞分化为成熟红细胞与血小板的过程中,目标是推断共享前体细胞到特定谱系的基因调控网络。设定为高维、部分观测的 RT-qPCR 基因表达数据,并引入外部基因组数据作为协变量。作者构建了专用的图模型框架,通过稀疏推断处理高维与缺失数据问题,同时将外部信息嵌入网络估计。核心估计器基于 penalized graphical model / sparse M-estimation,利用 L1-type penalty 实现结构稀疏性,并在部分观测设定下完成参数恢复。主要实证结果展示了从异质性基因组数据中恢复造血谱系调控网络的有效性。对您可能有用:本文提供了流行病学/基因组学中高维部分观测图模型的应用案例,其稀疏推断与缺失数据处理机制可迁移至因果推断中的 latent variable 网络恢复。
  • 关键技术: sparse graphical model, penalized likelihood estimation, partial observation handling, RT-qPCR data modeling, external covariate integration
  • 为什么对您有用: 本文属于流行病学/基因组学应用,连接到 epidemiology 的 applied causal / network inference 子方向。武器库中 very_familiar 的 high-dimensional asymptotics 与 moderately_familiar 的 M-estimation theory 可直接攻其稀疏图模型的理论性质缺口(如部分观测下的 model selection consistency / minimax rate)。follow-up 粗判:中期可做——需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以补全部分观测下 penalized graphical model 的收敛性分析。

3. 10.1093/jrsssc/qlae045 · arXiv — Measuring the impact of new risk factors within survival models

  • 作者: Glenn Heller, Sean M Devlin
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 74 · issue 1 · pp 83-99
  • 相关性 3/10 · novelty: new_method
  • 摘要: 本文针对转移性前列腺癌生存模型中引入新生物标志物(循环肿瘤细胞数量、疾病侵袭性标记)时,如何准确评估其对风险评分区分度影响的问题。传统做法是比较两个Cox等尺度变换模型:一个包含新旧因子,另一个仅含标准因子;但作者指出,若全模型正确,简化模型必然误设,导致比较无效。为此,他们提出一种基于投影的方法,将新因子对风险评分区分度的贡献投影到标准因子构成的空间上,从而在正确模型框架下估计其增量影响。该方法避免了因模型误设而产生的偏差,并保留了尺度变换模型的解释性。基于真实前列腺癌数据集的分析表明,两个新生物标志物能显著提升模型区分度,但目前仍缺乏足够好的模型用于临床风险分层。对您而言,本文提出的投影方法框架可类比于因果推断中的投影式识别策略(如proximal causal inference中的negative control投影),且其处理模型比较的思路可直接迁移至流行病学队列研究中评估新暴露因素的增量预测价值。
  • 关键技术: projection-based impact estimation, scale-transformation models, model misspecification avoidance, survival model discrimination, risk score evaluation, biomarker incremental value
  • 为什么对您有用: 本文属于流行病学应用(前列腺癌生存模型),连接您对流行病学数据集和因果推断中层间效应比较的兴趣。其核心投影方法可视为一种避免模型误设的正交化手段,与您武器库中「estimation theory in causal inference」的投影/正交化思路相通(如部分线性模型的正交得分),您可立即尝试将该投影框架推广至因果中介分析中直接与间接影响的比较,属于立即可做的方向。

4. 10.1093/jrsssc/qlae053 — Modelling particle number size distribution: a continuous approach

  • 作者: Israel Martínez-Hernández, Carolina Euán, Wesley S Burr, Melanie Meis, Marta Blangiardo, Monica Pirani
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: Lancaster University · Trent University · Consejo Nacional de Investigaciones Científicas y Técnicas · Universidad de Buenos Aires · Fundación Ciencias Exactas y Naturales · MRC Centre for Environment and Health · Imperial College London
  • 分类: vol 74 · issue 1 · pp 229-248
  • 相关性 2/10 · novelty: application
  • 摘要: 本文在环境流行病学设定下,研究颗粒物粒径分布(PNSD)的源解析问题,目标是将PM按粒径和时间的复杂依赖结构分解为潜在污染源及其贡献量。作者提出一种 functional factor model,将 PNSD 视为连续函数型数据,同时刻画粒径维度与时间维度的交叉依赖。方法通过函数型主成分提取源谱,模拟显示源识别准确,实证分析伦敦7年小时级PNSD数据识别出6个明确源。对您可能有用:该文提供了流行病学中函数型因子模型的完整应用案例,可作为函数型数据依赖结构建模的入门参考。
  • 关键技术: functional factor model, functional principal component analysis, source apportionment, cross-dependency modelling, particle number size distribution
  • 为什么对您有用: 本文属于流行病学与环境健康的应用工作,连接到 epidemiology 的空气污染源解析方向。武器库中的 nonparametric statistics 与 M-estimation theory 可用于审视其函数型因子估计的收敛性质与假设检验问题,但本文核心是函数型数据建模而非因果推断或高维理论。作为 gateway-reading:本文对函数型因子模型的应用流程展示清晰,数据结构(小时级、粒径连续)与模型假设交代明确,适合作为流行病学函数型数据建模的入门读物,值得花时间读全文以了解该领域的数据特征与建模惯例。

其他 (other, 5 篇)

1. 10.1093/jrsssc/qlae044 — A noisy-input generalized additive model for relative sea-level change along the Atlantic coast of North America

  • 作者: Maeve Upton, Andrew Parnell, Andrew Kemp, Erica Ashe, Gerard McCarthy, Niamh Cahill
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: National University of Ireland, Maynooth · Tufts University · Rutgers, The State University of New Jersey · Planetary Science Institute
  • 分类: vol 74 · issue 1 · pp 34-82
  • 相关性 4/10 · novelty: application
  • 摘要: 本文针对北美大西洋海岸的相对海平面变化,提出了一种贝叶斯噪声输入时空广义加性模型。模型通过一个单变量样条捕获区域共同信号,用随机斜率和截距表示局部长期线性趋势,再用时空样条刻画剩余的非线性局部变化。代理记录和仪器记录及其测量误差共同输入模型,并采用噪声输入方法处理代理数据的年代不确定性。结果显示,1800年前冰川均衡调整主导区域海平面变化,1900年后人为强迫成为主要因素。该模型为分解长时间尺度区域海平面变化的分量驱动因素提供了概率性框架。虽然本文不直接涉及您的核心统计兴趣(如因果推断或高维理论),但其处理时空依赖和测量误差的贝叶斯建模思路,对统计计算中的数值方法应用有一定参考价值。
  • 关键技术: Bayesian generalized additive model, noisy-input modeling, spatial-temporal spline, proxy record uncertainty, glacial isostatic adjustment
  • 为什么对您有用: 本文属于环境统计应用,与您的主要兴趣因果推断或高维理论无直接交集;但模型中的噪声输入处理与统计计算中的数值不确定性量化有共性。作为应用论文,它展示了贝叶斯方法在气候科学中的典型工作流,可视为了解该领域数据结构的入门读物。暂不可做:缺乏与您武器库中高阶U统计或半参数理论的具体连接,核心兴趣方向未涉及。

2. 10.1093/jrsssc/qlae048 — Determining the prior mean in Bayesian logistic regression with sparse data: a nonarbitrary approach

  • 作者: Masahiko Gosho, Ryota Ishii, Kengo Nagashima, Hisashi Noma, Kazushi Maruo
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: University of Tsukuba · Keio University Hospital · The Institute of Statistical Mathematics
  • 分类: vol 74 · issue 1 · pp 126-141
  • 相关性 3/10 · novelty: new_method
  • 摘要: 本文聚焦稀疏数据下逻辑回归中优势比(OR)最大似然估计的偏倚问题,提出一种非任意经验贝叶斯方法来确定回归系数的先验均值。先验均值为观测对数OR与对数OR的准期望之差,可解释为向零收缩的统计量。该方法通过数据增强技术分别适用于正态先验和对数F先验,计算简便且无需额外调参。模拟研究表明,所提方法的OR偏倚始终小于MLE,且通常比传统的零均值先验引起的偏倚更小。两个真实数据案例验证了方法的实际可操作性。对您而言,该方法属于稀疏数据分析中先验指定的实用技巧,虽不直接对应您的主要兴趣方向,但其处理小样本偏倚的收缩思路可与您熟悉的因果推断中处理样本不均的问题形成对照,不过其工具性有限,属于领域外的一般方法学贡献。
  • 关键技术: data augmentation, empirical prior mean, sparse data bias correction, shrinkage estimator, log-F prior
  • 为什么对您有用: 本文处理稀疏数据下逻辑回归的偏倚问题,属于应用统计范畴,与您的核心兴趣(因果推断、高维、U统计等)无直接交集。武器库中'nonparametric statistics'或'estimation theory in causal inference'的可迁移性不强,因为方法依赖贝叶斯先验特定形式而非您擅长的半参数率论。follow-up判断:暂不可做——核心缺失贝叶斯模型选择与稀疏Logistic领域的专门经验,且该方向非您当前重点,仅作背景了解即可。

3. 10.1093/jrsssc/qlae042 — Mixtures of Dirichlet processes for joint spatial modelling of transcranial magnetic stimulation mapping data

  • 作者: Osafu Augustine Egbon, Christian Heumann, Diego Carvalho Nascimento, Francisco Louzada
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: Universidade Federal de São Carlos · Universidade de São Paulo · Institute of Physics · Institute of Mathematics and Computer Science · Ludwig-Maximilians-Universität München · University of Atacama
  • 分类: vol 74 · issue 1 · pp 1-17
  • 相关性 3/10 · novelty: application
  • 摘要: 本文开发了Dirichlet过程混合模型用于经颅磁刺激(TMS)映射数据的联合空间建模,目标是从多个患者的皮层响应中区分共享空间模式与患者特异性模式。模型采用Metropolis-Hastings within Gibbs的马尔可夫链蒙特卡洛算法进行推断。研究分析了3名健康受试者的TMS数据,发现手部初级运动皮层一致地成为引发最优响应的关键区域,但该区域的兴奋性模式在不同患者间存在显著差异。文章的贡献在于提出一种贝叶斯非参数方法来处理TMS数据的复杂空间结构和患者间异质性。然而,该方法主要沿用标准贝叶斯非参数工具(如Dirichlet过程混合),并未引入新的理论或计算突破。对于您的主要兴趣(因果推断、高维统计、效率理论等),本文方法学上缺乏直接关联,但展示了空间混合模型在神经科学中的应用,可能对您的二级兴趣(如流行病学中的空间建模)有间接参考价值。
  • 关键技术: Dirichlet process mixture model, Markov Chain Monte Carlo, Metropolis-Hastings within Gibbs sampler, Spatial modelling
  • 为什么对您有用: 本文属应用统计工作,与您的主要兴趣(因果推断、高维、效率理论等)无直接技术关联。它涉及nonparametric statistics中的贝叶斯非参数方法,但您武器库中的'nonparametric statistics'更偏向频繁传统,贝叶斯非参数不在此列,且无'higher-order U-statistics'或'semiparametric theory'的切入点。因此,作为gateway-reading价值较低:没有清晰阐述数据结构和模型假设的统计学难点,且TMS数据规模很小(3人)。您不需要花时间读全文,除非您对脑成像的空间建模应用感兴趣。

4. 10.1093/jrsssc/qlae049 · arXiv — Nonhomogeneous hidden semi-Markov models for toroidal data

  • 作者: Francesco Lagona, Marco Mingione
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 74 · issue 1 · pp 142-166
  • 相关性 2/10 · novelty: application
  • 摘要: 本文提出非齐次隐半马尔可夫模型(NHHSMM),用于对双变量环形(toroidal)时间序列进行潜在状态分割,并同时估计时变协变量对各状态停留时间(survival)的影响。模型是环形密度混合,参数依赖半马尔可夫链演化且受协变量调制,非齐次隐马尔可夫模型与隐半马尔可夫模型均为其特例。估计基于EM算法,通过隐过程的有效增广(augmentation)实现计算。实证拟合亚得里亚海风浪方向时间序列,模型清晰描述了海况动态的潜在状态并捕捉了天气条件对状态持续期的影响。对您而言,本文展示了环形数据与半马尔可夫结构的建模思路,但方法论上属于特定领域应用,理论novelty有限。
  • 关键技术: hidden semi-Markov model, toroidal density mixture, EM algorithm with latent augmentation, survival regression with time-varying covariates, von Mises distribution
  • 为什么对您有用: 本文属于海洋环境统计的应用建模,与您primary interests(因果推断、高维/效率理论、U-statistics)无直接方法论交集,亦不属于astrostats/econ/epi等secondary gateway领域。技术武器库中的M-estimation theory与EM算法虽可理解其估计框架,但缺乏理论深度与迁移口子。暂不可做:核心机器不在武器库(环形数据特殊似然结构与半马尔可夫链理论),且无值得深挖的统计理论或计算tradeoff问题,不建议花时间读全文。

5. 10.1093/jrsssc/qlae050 · arXiv — Extending the Dixon and Coles model: an application to women’s football data

  • 作者: Rouven Michels, Marius Ötting, Dimitris Karlis
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 74 · issue 1 · pp 167-186
  • 相关性 1/10 · novelty: minor
  • 摘要: 本文在 Dixon-Coles 双 Poisson 足球比分模型设定下,目标是构建更灵活的进球数联合分布以捕捉低比分(0-0, 0-1, 1-0, 1-1)的相依性。作者证明 Dixon-Coles 的概率转移机制是 Sarmanov 多参数族的一个特例,并在此基础上提出新模型:通过 Sarmanov 族引入更广泛的相依结构,同时将边际分布从 Poisson 替换为其他离散分布(如负二项等)以适应过度离散。理论贡献主要是将已有模型嵌入更广的参数族框架,实证部分将新模型应用于女子足球数据,发现其低比分与过度离散特征与男子足球不同,新模型在预测精度上有所提升。对您而言,本文展示了 Sarmanov 族在离散双变量建模中的结构化扩展方式,但方法学 novelty 较有限。
  • 关键技术: Dixon-Coles model, Sarmanov family of bivariate distributions, double Poisson model, overdispersion modeling, discrete marginal distributions
  • 为什么对您有用: 本文与您的 primary interests(因果推断、高维、半参数效率等)无直接交集,Sarmanov 族扩展属于参数化相依建模,不涉及 semiparametric efficiency 或 minimax 等您关心的理论工具。作为经济理论(体育博彩市场数据/模型)的 secondary 应用,它提供了女子足球比分数据集和具体的 likelihood-based 建模流程,但分析模式偏经典参数 MLE,对您武器库中 very_familiar 的非参数/高维工具没有可攻的口子。follow-up 判断:暂不可做——核心是参数化 likelihood 拟合与预测,您武器库中的 semiparametric / U-statistic / efficiency theory 不适用,且无需补课进入此方向。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论