跳转至

JRSS-C — Vol 75 Issue 1 · 2026-05-18

  • 共 12 篇 · Journal of the Royal Statistical Society Series C

非参数 / 半参数 (nonparam_semipara, 3 篇)

1. 10.1093/jrsssc/qlaf031 — Analysing opportunity cost of care work using mixed effects random forests under aggregated auxiliary data

  • 作者: Patrick Krennmair, Nora Würz, Timo Schmid
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 1-20
  • 相关性 2/10 · novelty: new_method
  • 摘要: 在小区域估计(SAE)框架下,传统混合效应随机森林(MERF)依赖总体单元级辅助数据,本文目标是在仅可获得汇总辅助信息时实现点估计与不确定性推断。所提方法通过校准权重(calibration weights)自适应地整合汇总辅助变量,免除了对单元级总体数据的访问限制。估计量结合了随机森林的非参数灵活性与混合效应模型对层级结构的刻画,并基于校准权重构建了方差估计与区间推断。模拟研究表明该方法在汇总数据场景下表现稳健,实证基于德国社会经济面板(SOEP)与普查数据估计了护理工作的机会成本。对您而言,该文展示了非参数树模型在层级数据中的计算适配策略,且其经济数据集(SOEP)应用对经济理论方向有直接参考价值。
  • 关键技术: mixed effects random forests, small area estimation, calibration weights, aggregated auxiliary data, uncertainty estimation
  • 为什么对您有用: 展示了非参数/半参数模型(MERF)在受限辅助数据下的统计计算与算法适配方案,且实证使用的SOEP数据集对您的经济理论应用方向有数据参考价值。

2. 10.1093/jrsssc/qlaf034 — Mixed additive modelling of global alien species co-invasions of plants and insects

  • 作者: Martina Boschi, Rūta Juozaitienė, Ernst C Wit
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 57-78
  • 相关性 1/10 · novelty: new_method
  • 摘要: 在全球外来物种共入侵的动态网络设定下,目标是利用混合可加关系事件模型(REM)描述物种(发送者)-区域(接收者)-时间三元组的潜在风险率。方法核心在于引入时变与随机效应的半参数可加结构,并通过 case-control 采样实现高效推断,证明其似然函数等价于退化逻辑回归。该采样策略使大规模动态网络模型可在标准计算机上秒级估计,显著提升计算效率。此外,文章提出了基于累积鞅残差的 REM 拟合优度检验框架,并基于 R 包 mgcv 实现了算法。对您可能有用:其 case-control 计算加速策略与基于鞅残差的拟合优度检验框架,对您在统计计算(算法效率)与假设检验方向的方法开发有直接参考价值。
  • 关键技术: relational event model, mixed additive model, case-control sampling, degenerate logistic regression, cumulative martingale-residuals, goodness-of-fit test
  • 为什么对您有用: 文章提出的基于 case-control 采样的计算加速方案与基于鞅残差的拟合优度检验框架,直接对应您在统计计算(算法效率)与假设检验方向的兴趣,方法可迁移至其他大规模事件流数据。

3. 10.1093/jrsssc/qlaf036 — A functional regression model for heterogeneous BioGeoChemical Argo data in the Southern Ocean

  • 作者: Moritz Korte-Stapff, Drew Yarger, Stilian Stoev, Tailen Hsing
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 79-99
  • 相关性 0/10 · novelty: application
  • 摘要: 本文在南大洋 Argo 数据设定下,目标是利用丰富的温度与盐度深度剖面,对稀疏的氧气数据建立函数回归模型以刻画三者的联合依赖关系。为处理海洋锋面造成的空间异质性,模型引入了空间混合成分,同时对混合权重与数据本身的空间依赖性进行建模。核心估计机制结合了函数回归与空间混合模型,实现了对稀疏功能数据的网格预测并改进了锋面位置估计。所提方法在计算上可扩展至 Argo 数据规模,交叉验证与模型解释均验证了其有效性。对您而言,本文虽为环境统计应用,但其处理稀疏功能数据与空间异质性的函数回归及混合模型技术,可为非参数/半参数理论及统计计算在类似不规则空间数据上的应用提供参考。
  • 关键技术: functional regression, spatial mixture model, sparse functional data, spatial dependence modeling, cross-validation
  • 为什么对您有用: 本文虽属环境统计应用,但其针对稀疏功能数据的函数回归与空间混合建模方法,与您关注的非参数/半参数理论及统计计算(大规模数据算法)有方法论交叉,可提供异质空间数据建模的计算思路。

统计计算 / 算法 (stat_computing, 2 篇)

1. 10.1093/jrsssc/qlaf042 — Functional Gaussian graphical regression models for air quality data

  • 作者: Rita Fici, Gianluca Sottile, Luigi Augugliaro, Ernst C Wit
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 225-246
  • 相关性 2/10 · novelty: new_method
  • 摘要: 在部分可分函数数据设定下,本文研究多变量函数响应与函数协变量之间的条件依赖及响应间的图结构。提出函数高斯图回归模型,将条件高斯图模型扩展至函数空间;采用双重惩罚估计器同时推断精度矩阵与回归系数矩阵。针对图估计器的惩罚参数选择,提出一种新的联合 Kullback-Leibler 交叉验证准则,可同时优化精度和回归矩阵,尤其适用于多子群总体。模拟与实证表明该方法在 KL 散度和图恢复率上表现良好。对您而言,虽然本文应用场景为空气质量,但其针对图模型设计的联合 KL-CV 准则和双重惩罚计算策略,对您在统计计算(图模型惩罚参数选择)和高维推断方面有方法迁移价值。
  • 关键技术: functional Gaussian graphical model, doubly penalized estimator, joint Kullback-Leibler cross-validation, partial separability, graph recovery
  • 为什么对您有用: 涉及高维图模型的双重惩罚估计与计算(惩罚参数选择),其联合 KL-CV 准则对您在统计计算方向上的图模型推断与算法设计有直接参考价值,尽管应用场景(空气质量)本身非核心关注点。

2. 10.1093/jrsssc/qlaf039 — Extended-support beta regression for [0, 1] responses

  • 作者: Ioannis Kosmidis, Achim Zeileis
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 139-157
  • 相关性 2/10 · novelty: minor
  • 摘要: 针对包含边界点(0和1)的有界响应变量,提出 XBX 回归模型(扩展支撑 beta 回归的连续混合)。其核心是扩展支撑 beta 分布(在 (0,1) 两侧具有相同超越率的截断四参数 beta 分布),证明了 beta 回归和异方差双限 Tobit 回归分别是其在某参数趋于 0 和无穷时的特例。为克服 beta 与正态分布相似性导致的不可识别问题,对该参数施加指数分布收缩先验。采用 Gauss-Laguerre 求积近似实现基于似然的估计与推断,并在 R 包 betareg 中实现。行为经济学实验数据应用表明,XBX 回归能同时捕捉理性行为概率与损失厌恶均值。对您而言,该文展示了处理边界观测的参数回归技巧及求积计算方案,对涉及受限因变量的经济理论建模与统计计算有参考价值,但方法学理论深度较浅。
  • 关键技术: extended-support beta distribution, two-limit Tobit model, Gauss-Laguerre quadrature, shrinkage prior for identifiability, maximum likelihood estimation
  • 为什么对您有用: 涉及统计计算中的 Gauss-Laguerre 求积算法与 R 软件实现,以及经济理论中的双限 Tobit 模型与行为经济学数据集,对受限因变量的计算与经济应用有参考价值,但缺乏因果推断或高阶理论。

经济理论 / 应用 (econ_theory, 3 篇)

1. 10.1093/jrsssc/qlaf041 — Estimating the consumption-based carbon footprint: a small area model as a tool for place-based policies

  • 作者: Lorenzo Mori, Maria Rosaria Ferrante
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 202-224
  • 相关性 2/10 · novelty: application
  • 摘要: 在家庭消费调查与宏观经济数据设定下,目标是估计个人碳足迹(CFP)并实现局部区域可靠推断,关键假设为 CFP 服从广义第二类 Beta 分布(GB2)。方法上,首先利用转换因子矩阵桥接生产与消费的宏观经济分类体系;其次通过分布拟合选定 GB2 作为 CFP 的最优边际分布;最后提出基于 GAMLSS 的小区域估计模型(SAE-GAMLSS),在 GB2 分布假设下对局部人均 CFP 进行位置、尺度与形状参数的联合估计。实证结果表明该模型能提供可靠的局部 CFP 估计以支持地方政策制定。对您而言,本文提供了宏观经济与家庭消费数据集的应用案例,但方法学创新有限(GAMLSS 为成熟框架),主要价值在于经济/环境数据建模思路的借鉴。
  • 关键技术: Small Area Estimation (SAE), GAMLSS, Generalized Beta Distribution of the Second Kind (GB2), conversion factor matrix
  • 为什么对您有用: 涉及家庭消费与宏观经济数据集,属于经济理论(应用模型与数据)的次要兴趣,但方法学(SAE-GAMLSS)为成熟框架,理论创新有限,主要提供数据应用视角。

2. 10.1093/jrsssc/qlaf032 — Computing multidimensional composite indicators for small areas in presence of missing variables: a data integration approach

  • 作者: Angelo Moretti, Alejandra Arias-Salazar
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 21-42
  • 相关性 2/10 · novelty: application
  • 摘要: 在小区域估计设定下,研究当人口普查中部分变量完全缺失时,如何结合辅助调查数据估算多维贫困综合指标的问题。目标参数为多维贫困指数,其部分构成变量在主数据源(普查)中完全不可观测。提出两种数据整合方法来生成缺失变量:一是基于广义线性混合模型(GLMM)的方法,二是两步插补技术。核心技术工具依赖混合效应模型与条件插补,未涉及半参数效率界或交叉拟合等现代缺失数据理论。基于哥伦比亚2018年人口普查与家庭调查的实证及模拟表明,两种方法均可有效重构缺失变量并计算小区域指标。对您而言,该文提供了经济调查数据整合与插补的实证案例,但方法学创新度有限,主要属于应用统计工作。
  • 关键技术: small area estimation, data integration, generalized linear mixed model, two-step imputation, multidimensional poverty index
  • 为什么对您有用: 提供了经济调查数据(哥伦比亚普查与家庭调查)整合与插补的实证案例,对处理缺失数据的统计计算流程有一定参考价值,但缺乏您关注的核心理论深度。

3. 10.1093/jrsssc/qlaf043 — Urban mapping in Dar es Salaam using Angle-Based Joint and Individual Variation Explained

  • 作者: Rachel J Carrington, Ian L Dryden, Madeleine Ellis, James O Goulding, Simon P Preston, David J Sirl
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 247-269
  • 相关性 1/10 · novelty: application
  • 摘要: 本文研究城市贫困制图问题,设定为利用卫星图像、手机通话记录等非传统数据与调查数据联合识别剥夺指数。核心方法采用 Angle-Based Joint and Individual Variation Explained (AJIVE),通过基于角度的 SVD 分解提取多视图数据的联合与个体低维结构,并将 AJIVE 得分作为多视图回归的预测变量。实证表明非传统数据能有效识别剥夺区域,加入调查数据可进一步提升预测精度。对您而言,本文偏应用,但 AJIVE 的多视图矩阵分解技术与高维统计的子空间估计有方法重叠,且达累斯萨拉姆剥夺数据集对经济理论或流行病学的应用因果工作有数据集价值。
  • 关键技术: AJIVE, multiview data integration, low-dimensional structure extraction, multiview regression, matrix factorization
  • 为什么对您有用: AJIVE的多视图矩阵分解技术与高维统计的子空间估计有方法重叠,且其城市剥夺指数数据集对经济理论或流行病学的应用因果研究具有数据集价值。

流行病学 (epidemiology, 2 篇)

1. 10.1093/jrsssc/qlaf040 — Spatiotemporal dynamic quantile regression models with applications to particulate matter concentration data

  • 作者: Miaorou Liu, Zhen Yu, Keming Yu, Fansheng Kong, Maozai Tian
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 158-201
  • 相关性 2/10 · novelty: minor
  • 摘要: 本文在时空依赖数据设定下提出时空动态分位数回归模型 (STDQM),通过引入潜高斯过程刻画空间过程的时间演化,目标是 PM2.5 浓度的条件分位数估计。为适应更复杂的数据结构,核心方法将标准分位数回归的非对称 Laplace 分布 (ALD) 推广至广义非对称 Laplace 分布 (GALD)。模型结合潜高斯过程处理时空协方差结构,采用 MCMC 进行参数估计与推断。大量模拟研究表明,相较于现有替代方法,该模型在推断质量和预测精度上均有提升。实证分析了意大利伦巴第 2016-2021 年 PM2.5 的影响因素与时空演化。对您而言,该文提供了流行病学/环境健康相关的时空数据集,且 GALD 分位数回归的半参数扩展可作方法参考,但缺乏因果推断与效率理论深度。
  • 关键技术: quantile regression, latent Gaussian process, generalized asymmetric Laplace distribution, spatiotemporal modeling, MCMC
  • 为什么对您有用: 提供了流行病学/环境健康相关的时空数据集(PM2.5),其基于 GALD 的分位数回归方法对半参数建模有参考价值,但缺乏因果推断与效率理论。

2. 10.1093/jrsssc/qlaf033 — A partially pooled network scale-up method model: detailed estimation of child sexual exploitation material trafficking prevalence in Philippine municipalities

  • 作者: Albert Nyarko-Agyei, Scott Moser, Rowland G Seymour, Ben Brewster, Sabrina L Li, Esther Weir et al.
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 43-56
  • 相关性 0/10 · novelty: application
  • 摘要: 本文在多区域隐藏人群规模估计的设定下,针对传统网络规模校正法(NSUM)需对每个地理区域单独调查导致成本高昂的问题,提出一种部分池化NSUM模型。该模型采用分层贝叶斯框架,通过部分池化跨区域聚合数据,在不增加样本量的前提下实现参数的借力估计。核心方法利用层级先验结构对市级流行率进行收缩估计,从而改善小区域估计的精度与稳定性。实证基于菲律宾全国调查数据,展示了该模型在估计儿童性剥削材料贩卖流行率上的有效性。对您而言,该文虽无因果推断或半参数效率理论贡献,但其分层贝叶斯部分池化策略对流行病学中多区域隐藏人群估计(如HIV高危人群)具有数据集与方法借鉴价值。
  • 关键技术: Network Scale-Up Method (NSUM), hierarchical Bayesian model, partial pooling, small area estimation
  • 为什么对您有用: 属于次要兴趣中的流行病学应用方向;虽然缺乏您关注的核心理论(如半参数效率或因果推断),但其处理多区域隐藏人群调查数据的分层贝叶斯部分池化方法,对流行病学横断面调查中的小区域估计问题有直接的方法借鉴意义。

其他 (other, 2 篇)

1. 10.1093/jrsssc/qlaf037 — Similarity-based random partition distribution for clustering functional data

  • 作者: Tomoya Wakayama, Shonosuke Sugasawa, Genya Kobayashi
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 100-119
  • 相关性 1/10 · novelty: new_method
  • 摘要: 在贝叶斯非参数框架下,针对功能性空间数据的聚类问题,本文提出了基于相似性的广义 Dirichlet 过程(SGDP)类型随机划分分布,以克服传统 Dirichlet 过程导致过度聚类的缺陷。核心机制是在随机划分概率中引入成对相似性信息(pairwise similarity),从而抑制冗余聚类产生并融入空间结构先验。文章推导了 SGDP 类型分布的划分概率及相关理论性质。实证部分将该方法应用于东京 500m 网格的逐时人口流动数据,验证了其在捕捉复杂时空动态模式上的有效性。该文侧重贝叶斯非参数聚类应用,对您关注的频率学派半参数效率界及影响函数理论直接参考有限,但若涉及纵向/空间数据的潜变量划分建模可作间接借鉴。
  • 关键技术: generalized Dirichlet process, random partition distribution, pairwise similarity, Bayesian nonparametrics, functional data clustering
  • 为什么对您有用: 该文属于贝叶斯非参数聚类应用,与您主攻的频率学派半参数效率理论及因果推断关联较弱,仅在空间/纵向数据潜结构划分建模思路上有极间接参考。

2. 10.1093/jrsssc/qlaf038 — Joint spatiotemporal modelling of zooplankton and whale abundance in a dynamic marine environment

  • 作者: Bokgyeong Kang, Erin M Schliep, Alan E Gelfand, Christopher W Clark, Christine A Hudak, Charles A Mayo et al.
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 120-138
  • 相关性 0/10 · novelty: application
  • 摘要: 本文研究动态海洋环境中浮游动物与露脊鲸丰度的联合时空建模,目标是在多源异构数据下联合估计捕食者与猎物的空间分布强度。方法上,对浮游动物采用地统计学模型,对鲸鱼采用点过程模型,二者通过潜变量的条件-边际规范进行关联。针对不同物种的多源数据,提出了一种新的数据融合策略,构建了复杂的多层贝叶斯层级模型。模拟表明,联合建模相比独立建模能更有效地识别模型未知量并提升分布估计精度。尽管本文属于生态学应用,其多源数据融合与潜变量关联结构的设计思路对您在流行病学或经济学的多源数据因果推断建模可能有一定参考价值,但方法学创新偏向应用贝叶斯时空模型,理论深度较弱。
  • 关键技术: joint species distribution modelling, geostatistical model, point pattern model, latent conditional-marginal specification, data fusion
  • 为什么对您有用: 本文主要属于生态/时空统计应用,与您核心的因果推断/高维/效率理论兴趣直接关联较弱;其多源数据融合与潜变量关联结构对流行病学多源数据建模仅有微弱参考价值,方法学novelty偏向应用。

Maintained by 陈星宇 · Homepage · Source on GitHub