跳转至

JRSS-C — Vol 75 Issue 1 · 2026-06-20

  • 共 4 篇 · Journal of the Royal Statistical Society Series C
  • 目录核对 ⚠️ 疑似漏 7 篇(对照 OpenAlex 11 篇):10.1093/jrsssc/qlaf039、10.1093/jrsssc/qlaf036、10.1093/jrsssc/qlaf038、10.1093/jrsssc/qlaf040、10.1093/jrsssc/qlaf037 等

本期导览

自动生成:归纳本期主要主题与脉络,不打分、不排名

本期内容围绕“小区域与细粒度估计”这一核心设定展开,四篇论文均致力于在数据不完整或样本受限的现实约束下提取空间/网络局部参数。具体可归纳为三条主线:一是小区域估计中的数据融合与辅助信息适配,涉及“多维贫困指数”与“护理机会成本”两篇;二是网络/动态事件建模下的局部风险与规模推断,涵盖“共入侵动态”与“NSUM部分池化”两篇;三是机器学习与贝叶斯层级模型在传统统计框架中的嵌入与校准。

在数据融合与辅助信息适配主线中,两篇论文分别处理了单元级数据缺失的不同形态。“多维贫困指数”篇面对普查中构成变量完全缺失的困境,采用GLMM单步法与两步插补实现普查-调查数据融合以估计MPI;“护理机会成本”篇则针对MERF需要单元级总体辅助数据的强假设,提出仅依赖聚合级辅助信息的校准权重策略,将汇总统计量融入偏移量校正。两者均未给出估计量的渐近性质或效率界分析,侧重于方法构建与模拟/实证可行性验证。

在网络/动态事件建模主线中,两篇论文分别从时变风险率与隐藏人群规模切入局部推断。“共入侵动态”篇将sender-receiver入侵建模为混合加性关系事件模型(REM),利用case-control sampling将连续时间似然退化为逻辑回归以实现计算降维;“NSUM部分池化”篇则在贝叶斯层级框架下对多区域NSUM参数施加先验共享,通过跨区域数据聚合降低小区域估计方差。两者均利用结构化模型(REM网络内生效应/层级先验)与采样/池化策略应对局部参数推断的样本稀疏问题。

对聚焦因果推断与半参数效率的研究者而言,“护理机会成本”篇的校准权重与聚合辅助信息融合策略、以及“NSUM部分池化”篇的跨区域参数部分池化机制,为受限数据下的偏移量校正与方差缩减提供了可迁移的思路,与半参数框架下的约束推断最贴;若关注高维/网络设定下的计算与推断降维,“共入侵动态”篇的case-control采样似然退化路径值得优先看。

流行病学 (epidemiology, 2 篇)

1. 10.1093/jrsssc/qlaf034 · arXiv — Mixed additive modelling of global alien species co-invasions of plants and insects

  • 作者: Martina Boschi, Rūta Juozaitienė, Ernst C Wit
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 57-78
  • 相关性 3/10 · novelty: application
  • 摘要: 在生态入侵的动态网络设定下,目标是刻画外来物种(sender)入侵特定区域(receiver)的时变风险率,数据为 1880–2005 年植物与昆虫的共入侵记录。作者将入侵事件建模为 relational event model(REM),在 sender–receiver 对的 baseline hazard 上叠加 time-varying covariate、endogenous network effect 与 random effect,形成 mixed additive REM。推断利用 case–control sampling 将连续时间 REM 似然退化为退化 logistic regression 似然,使大规模动态网络模型可在秒级完成估计;模型拟合优度通过 cumulative martingale-residual 检验评估,实现依托 R 包 mgcv。实证揭示了植物与昆虫共入侵的驱动因素及 confounding 修正效果。对您而言,本文提供了一个将生存分析 / 动态网络模型应用于流行病学 / 生态学数据的具体案例,case–control 似然等价技巧在计算上有参考价值。
  • 关键技术: relational event model, case–control sampling likelihood equivalence, mixed additive hazard model, cumulative martingale-residual goodness-of-fit, degenerate logistic regression, mgcv (R package)
  • 为什么对您有用: 本文属于流行病学/生态学应用方向,提供了外来物种入侵的动态网络数据集与建模框架,可作为 gateway reading 了解 REM 在生态数据中的应用模式。从技术武器库看,mgcv 的 semiparametric additive model 与 martingale-residual 检验均在 moderately_familiar(semiparametric theory / M-estimation)范围内,case–control 似然等价技巧与 very_familiar 的软件开发直接对接。Follow-up 判断:中期可做——若想将 REM 框架迁移到流行病学因果推断(如传染病传播网络),需先在 moderately_familiar 的 semiparametric theory 上补充 dynamic network hazard 的 identification 与 efficiency bound 理论。

2. 10.1093/jrsssc/qlaf033 — A partially pooled network scale-up method model: detailed estimation of child sexual exploitation material trafficking prevalence in Philippine municipalities

  • 作者: Albert Nyarko-Agyei, Scott Moser, Rowland G Seymour, Ben Brewster, Sabrina L Li, Esther Weir et al.
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: University of Nottingham · University of Birmingham
  • 分类: vol 75 · issue 1 · pp 43-56
  • 相关性 3/10 · novelty: application
  • 摘要: 在隐藏人群规模估计设定下,目标是利用网络规模放大法(NSUM)在多个地理区域间进行部分参数共享,以获得市级 CSEM 人口贩卖流行率估计。传统 NSUM 需对每个区域独立调查,成本高昂;本文提出部分池化(partially pooled)NSUM 模型,采用层级贝叶斯框架,通过区域间参数的先验共享在不增加样本量前提下提升小区域估计精度。核心机制为贝叶斯层级建模与部分池化,利用跨区域数据聚合降低小区域估计方差,但未给出具体的收敛率或 minimax 界分析。实证结果表明该模型在菲律宾市级数据上能产出较精确的隐藏人群流行率估计,对流行病学与公共卫生中的小区域估计问题有应用价值。对您可能有用:本文展示了层级贝叶斯部分池化在流行病学小区域估计中的应用模式,可作为因果推断与流行病学交叉方向的实证数据参考。
  • 关键技术: network scale-up method (NSUM), hierarchical Bayesian model, partial pooling, small-area estimation, prevalence estimation of hidden populations
  • 为什么对您有用: 本文属于流行病学(secondary interest)的实证应用,提供了国家级隐藏人群调查数据集与小区域估计的分析流程,可作为流行病学因果推断或估计方法的 gateway reading。您的武器库(层级贝叶斯与 M-estimation)足以支撑进入此方向,但本文缺乏 semiparametric efficiency 或 minimax 理论,方法学 novelty 有限。是否值得花时间读全文:若对流行病学小区域估计的数据结构与建模范式感兴趣,可快速浏览其模型设定与数据描述部分,但无需深入理论细节。

其他 (other, 2 篇)

1. 10.1093/jrsssc/qlaf032 — Computing multidimensional composite indicators for small areas in presence of missing variables: a data integration approach

  • 作者: Angelo Moretti, Alejandra Arias-Salazar
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 机构: Utrecht University · Universidad de Costa Rica
  • 分类: vol 75 · issue 1 · pp 21-42
  • 相关性 5/10 · novelty: application
  • 摘要: 在小区域估计设定下,目标参数为多维贫困指数(MPI),当人口普查中部分构成变量完全缺失时,如何借助辅助样本调查进行数据融合以估计该指标。文中提出两种缺失变量生成方法:基于广义线性混合模型(GLMM)的单步法与两步插补技术,并在模拟与哥伦比亚 Antioquia 地区 2018 普查及家计调查数据上比较其表现。理论贡献主要限于方法对比与模拟验证,未给出估计量的渐近性质(如 MSE 界或一致性收敛率)或 semiparametric efficiency 分析。实证结果表明两种方法在小区域 MPI 估计中均可行,但未明确展示相对于经典 SAE 方法的 rate 优势。对您而言,本文展示了普查-调查数据融合在流行病学/经济政策指标中的实际应用模式,但方法学 novelty 较低。
  • 关键技术: small area estimation, generalized linear mixed model, two-step imputation, data integration, multidimensional poverty index
  • 为什么对您有用: 本文属于经济理论/流行病学方向的实证应用,展示了普查与抽样调查数据融合以构造小区域复合指标的模式,但未涉及 causal identification 或 semiparametric efficiency 理论。武器库中的 M-estimation theory 与 semiparametric theory 可用于为这类 GLMM / 插补估计量建立更严格的渐近理论(当前论文缺失此部分),但本文本身方法学 novelty 有限。中期可做:若想在小区域数据融合方向做理论深化,需先在 moderately_familiar 的 M-estimation theory 上长肌肉,为 GLMM + 插补的两步估计量建立 influence function 与 MSE 界。

2. 10.1093/jrsssc/qlaf031 · arXiv — Analysing opportunity cost of care work using mixed effects random forests under aggregated auxiliary data

  • 作者: Patrick Krennmair, Nora Würz, Timo Schmid
  • 期刊/来源: Journal of the Royal Statistical Society Series C
  • 分类: vol 75 · issue 1 · pp 1-20
  • 相关性 5/10 · novelty: new_method
  • 摘要: 在小区域估计(SAE)框架下,目标是利用层级数据与随机森林估计空间细粒度指标,传统 mixed effects random forests (MERF) 需要单元级总体辅助数据,本文放宽了这一强假设。提出的方法仅依赖聚合级辅助信息,通过校准权重自适应地将总体汇总统计量融入 MERF 的偏移量校正步骤,同时给出了基于 bootstrap 的不确定性估计。模拟研究表明,在仅可获得聚合辅助数据的现实场景下,该方法在点估计与 MSE 估计上优于需要单元级数据的传统 MERF。实证部分利用德国 SOEP 与普查汇总数据估计了护理工作的机会成本。对您可能有用:本文的校准权重与聚合辅助信息融合策略,可迁移至因果推断中仅有汇总级 negative-control 或代理变量数据的 proximal CI 设定。
  • 关键技术: mixed effects random forests, small area estimation, calibration weighting, aggregated auxiliary data, bootstrap uncertainty estimation, unit-level population data assumption relaxation
  • 为什么对您有用: 本文连接到因果推断中 proximal CI / IV 设定下仅有聚合级(而非单元级)辅助/代理数据的 identification 与 estimation 问题。研究者可用 very_familiar 中的 minimax bounds 工具分析该校准权重估计量的收敛率,或用 moderately_familiar 的 semiparametric theory 探究聚合辅助信息下的效率界。Follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以建立聚合数据下 MERF 校准估计量的半参数效率界。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论