JRSSB — Vol 87 Issue 4 · 2026-06-20¶
- 共 16 篇 · Journal of the Royal Statistical Society Series B
- 目录核对 ⚠️ 疑似漏 1 篇(对照 OpenAlex 18 篇):10.1093/jrsssb/qkaf015
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
本期内容主要围绕四条方法主线展开:高维与选择性假设检验、共形预测与条件覆盖、因果推断的稳健性与自适应设计,以及半参数/非参数推断与统计计算优化。高维检验主线包含超高维均值检验与广义线性模型部分惩罚检验两篇;共形预测主线集中了四篇论文,探讨选择条件覆盖、错误覆盖率控制及分布自由的条件覆盖保证;因果推断主线关注观察性设计的敏感性提升与异质性处理效应的自适应实验;半参数/非参数与计算主线则涵盖半参数后验修正、依赖性度量凸性理论、模块化贝叶斯反馈切断,以及变分近似解析梯度、海量数据多分辨率子抽样、贝叶斯惩罚经验似然采样和增强不变流形学习。
高维与选择性假设检验主线在本期推进了计算-理论间隙的闭合与检验灵活性的拓展。超高维均值检验通过多重投影整合信息与符号翻转组随机对称化,在弱矩与一般协方差结构下实现经验似然检验的渐近刻画与计算加速;部分惩罚检验则利用局部线性近似算法在两步内收敛至oracle估计,闭合了非凸惩罚下局部极小解的理论-计算间隙,使检验统计量获得卡方极限分布。选择性检验方面,顺序蒙特卡洛检验基于“用赌注检验”框架构造检验鞅,允许在任意停时下获得有效p值/e值,突破了经典方法需预设停止规则的限制。
共形预测主线本期密集探讨了选择与条件覆盖的有限样本保证,反复切入了“选择后推断”这一共同问题。选择条件覆盖将Mondrian共形预测推广至多测试单元,在置换不变选择规则下实现有限样本精确条件覆盖;错误覆盖率控制则结合共形交换性与单调约束,借鉴BH过程掩蔽思想构造阈值,首次实现对信息性预测集的有限样本FCR控制;条件覆盖将条件覆盖重表述为对协变量偏移的覆盖,在有限维偏移类下获精确有限样本覆盖,在无限维类下量化误差界限。这三篇均致力于在非参数分布自由框架下,解决选择偏移或协变量偏移带来的覆盖失效问题。
因果推断与半参数效率主线本期在设计与推断两端推进了稳健性保障。观察性分组设计提出在处理个体具有block内极值响应的条件化策略,结合加权忽略策略提升区分真实效应与未测量偏差的设计敏感性;自适应实验则统一富集设计与响应自适应随机化,顺序调整数据收集以增强识别最大处理效应子组的统计效率。半参数后验修正从常规后验出发,借助贝叶斯自举对边缘后验进行一步修正,在平均因果效应等泛函上达到渐近有效性且仅需后处理步骤;依赖性度量的凸性理论统一刻画了零独立性与最大功能性公理,保证样本估计量的渐近无偏性与中心极限定理。
对因果推断与半参数效率方向最贴的是“半参数后验修正”与“观察性分组设计条件化策略”,前者提供了一步后验修正的渐近有效推断,后者增强了敏感性分析的稳健性;对高维假设检验方向最贴的是“部分惩罚检验”与“超高维均值经验似然检验”,分别闭合了非凸惩罚的计算-理论间隙与放宽了弱矩及协方差结构限制;对选择性推断与共形预测方向最贴的是“选择条件覆盖”、“FCR控制”与“条件覆盖保证”,系统推进了选择偏移与协变量偏移下的有限样本覆盖理论。
因果推断 (causal_inference, 2 篇)¶
1. 10.1093/jrsssb/qkaf007 — A conditioning tactic that increases design sensitivity in observational block designs¶
- 作者: Paul R Rosenbaum
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: University of Pennsylvania
- 分类: vol 87 · issue 4 · pp 1085-1099
- 相关性 8/10 · novelty:
new_method - 摘要: 在观察性分组设计中,每个block包含一个处理个体和J−1个对照,但非随机分配。要区分真实处理效应与未测量偏差,需进行敏感性分析。现有方法通过加权忽略响应范围小的block来提升设计敏感性(即从数据中区分效应与偏差的能力)。本文提出新条件化策略:在给定处理个体具有block内最大或最小响应的条件下,使用条件统计量,进一步增大了设计敏感性。理论方面导出了渐近设计敏感性的表达式,模拟和实例验证了有限样本下的功效提升。方法也涉及自适应推断,并提供R包weightedRank实现。该策略直接增强了观察性研究中处理效应推断的稳健性,对因果推断中敏感性分析的方法工具箱是一个重要补充。
- 关键技术:
design sensitivity,conditional statistic,observational block design,sensitivity analysis,weighted rank test - 为什么对您有用: 直接对接因果推断中的敏感性分析兴趣子方向,提出了一种通过条件化处理个体响应序位来提升设计敏感性的新策略。研究者可用自己熟悉的非参数统计工具验证其渐近设计敏感性是否最优或可进一步推广到纵向分组设计。立即可做:用加权秩检验和模拟代码即可复现和扩展。
2. 10.1093/jrsssb/qkaf006 · arXiv — Adaptive experiments toward learning treatment effect heterogeneity¶
- 作者: Waverly Wei, Xinwei Ma, Jingshen Wang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1055-1084
- 相关性 8/10 · novelty:
new_method - 摘要: 本文聚焦于通过自适应实验设计来学习处理效应异质性,目标是在实验中识别出具有最大处理效应的子组。传统方法多依赖观察性数据或事后的随机对照试验分析,而本文提出了一种响应自适应实验框架,顺序性地根据累积证据调整数据收集机制,以增强估计的统计效率。该框架统一了自适应富集设计和响应自适应随机化设计,并补充了电商A/B测试和临床试验中的随机化设计。理论结果表明,该设计在识别异质性处理效应方面相比静态设计具有更优的统计性质。通过模拟研究(合成电商数据和临床试验数据)验证了方法的有效性。这篇论文对您因果推断中实验设计方向有直接启发,特别是将自适应机制与异质性学习相结合的新思路。
- 关键技术:
response-adaptive randomization,adaptive enrichment designs,treatment effect heterogeneity,sequential experimentation,A/B testing - 为什么对您有用: 本文直接属于因果推断中的实验设计子方向,特别是处理效应异质性的自适应识别。您非常熟悉的非参数统计和因果推断估计理论(如子组均值估计、逆概率加权)可以立即应用于验证和扩展本文提出的自适应框架;例如,将子组定义从简单协变量划分扩展到更复杂的非参数规则,并重新推导渐近效率。基于现有武器库,可以立即可做:在您的 causal inference 工具集中加入自适应实验设计组件,用于处理异质性研究。
非参数 / 半参数 (nonparam_semipara, 3 篇)¶
1. 10.1093/jrsssb/qkaf005 · arXiv — Semiparametric posterior corrections¶
- 作者: Andrew Yiu, Edwin Fong, Chris Holmes, Judith Rousseau
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1025-1054
- 相关性 8/10 · novelty:
new_method - 摘要: 本文提出一种新的半参数推断方法,通过修正后验分布来估计低维目标泛函(如积分平方密度、缺失数据均值、处理组平均因果效应),而不受完整贝叶斯形式主义的限制。核心思想是从完整数据生成分布的常规后验出发,借助贝叶斯自举(Bayesian bootstrap)对每个感兴趣泛函的边缘后验进行修正,得到具有校准频率性质的一步后验(one-step posterior)。作者给出了该后验达到渐近有效性的条件,并在多个经典例子(包括平均因果效应)上验证了理论结果。该方法计算简洁,仅需在任意后验采样算法后附加一个高效的后处理步骤,无需修改原有采样过程。在ACIC 2016因果推断竞赛数据上,该方法通过传播贝叶斯不确定性超越了现有最优方法。对您来说,该工作直接连接半参数推断和因果推断中的平均处理效应估计,并且其理论分析(频率性质校准)可以用您熟悉的非参数统计和minimax界工具深入评估。
- 关键技术:
Bayesian bootstrap,posterior correction,one-step posterior,semiparametric inference,frequentist calibration,causal effect estimation - 为什么对您有用: 该工作直接对接您的两个primary interest子方向:半参数理论中的泛函估计和因果推断中的ATE估计。从技术武器库看,您熟悉的nonparametric statistics和minimax bounds可以用于剖析其所提一步后验的最优性,而semiparametric theory(moderately familiar)则可评估其效率界是否紧。立即可做的方向:利用您已有的因果推断估计论软件复现该方法,并对比现有DML/倾向评分方法在有限样本下的表现。
2. 10.1093/jrsssb/qkaf018 — Convexity and measures of statistical association¶
- 作者: Emanuele Borgonovo, Alessio Figalli, Promit Ghosal, Elmar Plischke, Giuseppe Savaré
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: Decision Sciences (United States) · Bocconi University · ETH Zurich · University of Chicago · Culture Resource
- 分类: vol 87 · issue 4 · pp 1281-1304
- 相关性 7/10 · novelty:
new_theory - 摘要: 在非参数依赖性度量设定下,本文研究零独立性(度量在独立时为零且仅在独立时为零)、信息细化单调性与最大功能性(度量仅在确定性依赖时取最大值)等公理性质的统一刻画。核心发现是凸性扮演中心角色:凸性加一种严格性是零独立性的充要条件,凸性加 Dirac 测度上的严格凸性是最大功能性的充要条件。作者将此框架应用于基于 Csiszár f-divergence、最优传输、核方法以及 Chatterjee 相关系数的依赖性度量族,并证明凸性保证了样本估计量的渐近无偏性。理论结果包括:在独立假设下证明了估计量的中心极限定理,并在任意依赖下给出收敛速率。对您可能有用:本文为非参数假设检验与依赖性度量的效率理论提供了凸分析视角的统一框架。
- 关键技术:
Csiszár divergence,optimal transport divergence,Chatterjee correlation coefficient,convex analysis on probability measures,asymptotic unbiasedness,central limit theorem under independence - 为什么对您有用: 直接连接非参数理论中的依赖性度量与假设检验子方向,用凸分析统一了零独立性与最大功能性的刻画,为构造和筛选满足特定公理的度量提供了理论准则。用您 very_familiar 的 minimax bounds 工具可以验证本文在任意依赖下给出的收敛速率是否紧,或用 moderately_familiar 的 M-estimation theory 分析其估计量的影响函数与半参数效率界。立即可做:用 minimax 理论检查收敛速率的紧性,并推导其半参数效率下界。
3. 10.1093/jrsssb/qkaf012 — A general framework for cutting feedback within modularized Bayesian inference¶
- 作者: Yang Liu, Robert J B Goudie
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: University of Cambridge · MRC Biostatistics Unit
- 分类: vol 87 · issue 4 · pp 1171-1199
- 相关性 4/10 · novelty:
new_theory - 摘要: 在模块化贝叶斯推断(modularized Bayesian inference)框架下,当 DAG 模型中某些子模块存在 misspecification 时,目标是定义“模块”并构建切断反馈的 cut distribution 以避免错误模块污染全局推断。本文首次给出模块的严格形式化定义及其性质,提出基于 DAG 结构的模块识别与排序方法,并通过顺序分裂技术将经典的两模块 cut inference 推广到任意多模块情形。核心理论结果证明:所构建的 cut distribution 不仅切断了反馈路径,而且在 KL 散度下是满足该切断条件的最优近似。该方法为复杂 DAG 中局部 misspecification 提供了系统性保护机制,对您在因果推断 DAG 结构下处理模型 misspecification 与敏感性分析可能有用。
- 关键技术:
modularized Bayesian inference,cut distribution,Kullback-Leibler divergence,directed acyclic graph,sequential splitting,model misspecification - 为什么对您有用: 本文直接连接因果推断中 DAG 模型的 misspecification 问题,为 proximal CI / IV 等结构化因果模型提供了贝叶斯视角下切断错误反馈的系统性框架。用您 very_familiar 中的 M-estimation theory 与 moderately_familiar 中的 identification theory in causal inference,可以审视其 KL 散度最优近似在半参数/非参数设定下的推广可行性(当前框架仍偏参数贝叶斯)。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,以将 cut distribution 的 KL 最优性从参数贝叶斯推广到半参数/非参数边界推断。
数理统计 / 假设检验 (hypothesis_testing, 6 篇)¶
1. 10.1093/jrsssb/qkaf004 — Randomized empirical likelihood test for ultra-high dimensional means under general covariances¶
- 作者: Yuexin Chen, Lixing Zhu, Wangli Xu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: Renmin University of China · Beijing Normal University
- 分类: vol 87 · issue 4 · pp 1001-1024
- 相关性 9/10 · novelty:
new_method - 摘要: 本文针对超高维均值检验问题,在数据分布仅需弱矩条件下,提出了一种校准经验似然检验方法,该方法通过多重投影整合信息,并利用符号翻转组的随机对称化方法确定临界值,从而在保持渐近显著性水平的同时允许一般协方差结构和超高维数据。方法的核心机制包括:基于经验似然的检验统计量,其渐近分布在不同场景下被完整刻画;通过随机投影选择来提升检验功效,且功效函数与投影项在渐近意义下关联,可指导投影选择以适配不同场景。为克服经验似然优化计算负担,引入了拟牛顿算法降低计算成本。模拟研究表明,相比已有检验,所提方法在多种设定下表现优越。本文直接连接您对数理统计中假设检验和高维统计的兴趣,且您在高维渐近性方面的深厚积累可助您快速理解其理论细节并评估方法优劣。
- 关键技术:
calibrated empirical likelihood,multiple projections,random symmetrization (sign flips),quasi-Newton optimization,ultra-high dimensional means - 为什么对您有用: 本文直接针对假设检验这一您的首要兴趣,具体处理超高维均值检验,属于高维统计中的核心问题。您的technical_arsenal中'high-dimensional asymptotics'(very_familiar)可用来快速把握其渐近理论框架,而'minimax bounds'(very_familiar)可辅助评价其检验功效的最优性。该方法的随机对称化临界值构造思路也可迁移至高维因果推断中的敏感性分析(您另外关切的子领域)。立即可做:您完全有能力用现有高维渐近工具复现或扩展其理论结果。
2. 10.1093/jrsssb/qkaf010 · arXiv — Strong oracle guarantees for partial penalized tests of high-dimensional generalized linear models¶
- 作者: Tate Jacobson
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1150-1170
- 相关性 8/10 · novelty:
new_method - 摘要: 本文研究高维广义线性模型中线性假设的部分惩罚检验问题。由于估计量是非凸折叠凹惩罚目标的局部极小值,实际计算解与理论保证的未知局部最小值之间存在差距。作者引入局部线性近似算法计算全模型和简化模型估计,并证明该算法在两步内以压倒性概率收敛到oracle估计。利用oracle估计的渐近性质,证明检验统计量在大样本下近似卡方分布,从而闭合理论-计算间隙。模拟显示LLA检验与oracle检验高度一致,且优于其他高维推断方法。对您而言,该工作直接服务于高维假设检验的兴趣,其闭合理论-计算间隙的思路可迁移到其他非凸惩罚问题。
- 关键技术:
local linear approximation (LLA),folded-concave penalization,oracle property,partial penalized tests,high-dimensional inference - 为什么对您有用: 本文直接作用于您的高维假设检验兴趣,特别是高维GLM中检验统计量的理论保证。您熟悉的高维渐近工具(very_familiar)可用来验证其渐近卡方分布的推导,但LLA算法的收敛性分析涉及非凸优化的细节,需先在M-estimation理论(moderately_familiar)上加强才能深入复现或推广。中期可做:若投入时间掌握折叠凹惩罚的oracle理论,可进一步将类似框架迁移到因果推断中的高维变量选择检验。
3. 10.1093/jrsssb/qkaf014 · arXiv — Sequential Monte Carlo testing by betting¶
- 作者: Lasse Fischer, Aaditya Ramdas
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1200-1220
- 相关性 7/10 · novelty:
new_method - 摘要: 该论文研究顺序蒙特卡洛检验问题,目标是在固定观测数据集下,通过依次生成置换或重抽样数据集来检验原假设(原数据集与重抽样数据可交换),并允许在任意时刻停止而不损失有效性。方法基于“用赌注检验”(testing by betting)框架,构造了一个针对可交换性假设的检验鞅(test martingale),使得在任何停时下都能得到有效的p值或e值。作者推导了对数最优赌博策略的闭式表达,使得财富过程(wealth process)具有显式形式,并证明了重抽样风险的控制保证。与Besag和Clifford的经典方法相比,新方法不预先指定停止规则,且在零假设和备择假设下平均停止更早,同时保持了统计检验力。该方法在模拟和实际数据中展现出优秀的性能。对您而言,该工作直接关联到您的主要兴趣之一的假设检验方向,特别是顺序检验和任意有效推断(anytime-valid inference),您熟悉的高维渐近理论和U统计量技巧可用于扩展此类鞅方法到更复杂的检验问题。
- 关键技术:
sequential Monte Carlo test,testing by betting,test martingale,anytime-valid inference,e-value,log-optimal betting strategy - 为什么对您有用: (1) 直接关联您的首要兴趣——假设检验(mathematical statistics & hypothesis testing),且序贯推断与anytime-valid方法是当前热点。 (2) 您非常熟悉的非参数统计和逆问题方法可用于分析该检验鞅的渐近性质,例如通过U统计量的投影技巧处理重抽样数据的依赖结构。 (3) 中期可做:该文的鞅构造基于可交换性,您可以尝试将类似赌博策略扩展到更复杂的因果推断或高维假设检验中(需先巩固您 moderately_familiar 的鞅理论,但目前已足够直接读此文获取灵感)。
4. 10.1093/jrsssb/qkaf016 · arXiv — Confidence on the focal: conformal prediction with selection-conditional coverage¶
- 作者: Ying Jin, Zhimei Ren
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1239-1259
- 相关性 6/10 · novelty:
new_method - 摘要: 在 conformal prediction 框架下,研究数据驱动选择程序(如 top-K、优化选择)选出 focal unit 后的 selection-conditional coverage 问题;目标 estimand 是给定选择事件下预测集的条件覆盖概率,关键假设是选择规则对校准集置换不变。核心方法将 Mondrian Conformal Prediction 推广至多测试单元与非等变分类器,构造具有有限样本精确条件覆盖的预测集,并针对 top-K、基于 conformal p-value 等现实选择规则给出高效计算实现。理论结果保证在任意置换不变选择规则下条件覆盖的有限样本精确性,实证通过药物发现与健康风险预测验证。对您有用:此工作为 post-selection inference 提供了 conformal 路径的精确有限样本解,与您在 hypothesis testing 及 selection bias 下推断的兴趣直接相连。
- 关键技术:
conformal prediction,selection-conditional coverage,Mondrian conformal prediction,permutation-invariant selection rule,finite-sample exact coverage,post-selection inference - 为什么对您有用: 本文直接连接您 primary interest 中的 hypothesis testing 与 causal inference 里的 selection bias / post-selection inference 问题,为数据驱动选择后的不确定性量化提供了 conformal 路径的有限样本精确解。您武器库中 very_familiar 的 nonparametric statistics 与 minimax bounds 理论可以用来分析其条件覆盖的保守性/效率损失,或将其与 semiparametric efficiency bound 视角下的 post-selection 估计做对比。follow-up 判断:立即可做——用 very_familiar 的非参/高维工具即可切入分析其条件覆盖效率或拓展至高维设定。
5. 10.1093/jrsssb/qkae120 · arXiv — Selecting informative conformal prediction sets with false coverage rate control¶
- 作者: Ulysse Gazin, Ruth Heller, Ariane Marandon, Etienne Roquain
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: Laboratoire de Probabilités et Modèles Aléatoires · Laboratoire de Probabilités, Statistique et Modélisation · Tel Aviv University · Turing Institute · The Alan Turing Institute
- 分类: vol 87 · issue 4 · pp 909-929
- 相关性 6/10 · novelty:
new_method - 摘要: 本文在监督学习(分类与回归)中考虑选择性推断问题:当分析者仅关注那些“有信息量”的共形预测集(如预测集足够小或排除空值等)时,需要控制所选样本上的错误覆盖率(FCR)。作者提出 InfoSP 和 InfoSCOP 两类程序,通过结合共形预测的交换性和单调约束,首次实现了对信息性预测集的有限样本 FCR 控制。技术上利用共形分位数的顺序统计量构造选择性调整阈值,并借鉴 Benjamini-Hochberg 过程的掩蔽思想。理论证明在任意单调约束下 FCR 均被严格控制在名义水平以下;模拟与真实数据实验展示了程序的实用性。对您而言,该工作直接关联假设检验中的选择性推断方向,且其非参数、分布自由的框架可用您熟知的非参数统计工具(如分位数匹配、交换性论证)进行理解和扩展——立即可做。
- 关键技术:
conformal prediction,false coverage rate (FCR) control,selective inference,monotone constraints,Benjamini-Hochberg masking,finite sample guarantee - 为什么对您有用: 连接到您假设检验兴趣中的选择性推断子方向(FCR 控制),与多重比较、后选择推断紧密相关。您已有的非参数统计武器可直接攻击其证明结构(例如检验共形分位数交换性假设的合理性),无需额外工具——属于立即可做的范畴。
6. 10.1093/jrsssb/qkaf008 · arXiv — Conformal prediction with conditional guarantees¶
- 作者: Isaac Gibbs, John J Cherian, Emmanuel J Candès
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1100-1126
- 相关性 6/10 · novelty:
new_method - 摘要: 本文研究分布自由预测集的条件覆盖问题,目标是在有限样本下同时保证条件覆盖率和边际覆盖率。现有方法无法在有限样本中实现精确的条件覆盖,多数仅能保证对协变量的边际覆盖或限于预设子组。作者通过将条件覆盖重新表述为对一类协变量偏移的覆盖,定义了在边际与条件有效性之间插值的问题谱。对于有限维偏移类(如有限子组集合),该方法能同时对所有偏移获得精确的有限样本覆盖;对于更灵活的无限维类,则提供覆盖误差的量化界限,并通过可解释的超参数供实践者控制误差。方法可直接嵌入现有分割共形推断流程,无需分布假设即可量化黑箱算法的不确定性。本文与假设检验中有限样本保证的思路紧密相连,可用于因果推断中个体处理效应的预测区间构造,而研究者熟悉非参数理论及高效推断,可进一步探讨此类预测集的最小最大最优性。
- 关键技术:
split conformal prediction,distribution-free prediction sets,conditional coverage,covariate shift,finite-sample guarantees - 为什么对您有用: 本文涉及分布自由的条件覆盖问题,与 hypothesis testing 的有限样本保证直接相关,其方法可用于因果推断中个体处理效应的预测区间(如 CATE 的置信区间),属于 '非参数统计' 与 '假设检验' 方向。研究者已掌握 minimax 界和非参数工具,可对本文提出的方法进行最优性分析——评估其覆盖误差在 minimax 意义下是否紧(立即可做,因 minimax 界和 nonparametric statistics 均为 very_familiar)。此外,分共形推断的实现与软件工具(split conformal)也可直接借用于实际数据分析。
统计计算 / 算法 (stat_computing, 4 篇)¶
1. 10.1093/jrsssb/qkaf001 · arXiv — Analytic natural gradient updates for Cholesky factor in Gaussian variational approximation¶
- 作者: Linda S L Tan
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 930-956
- 相关性 7/10 · novelty:
new_method - 摘要: 本文在 Gaussian 变分近似框架下,针对 Fisher 信息矩阵求逆的高维困难以及精度矩阵自然梯度更新不保证正定性的问题,提出解析式自然梯度更新方法。核心思路是对协方差矩阵或精度矩阵的 Cholesky 因子直接推导解析梯度,同时引入稀疏约束以刻画不同的后验相关结构。算法采用带动量的随机归一化自然梯度上升,适用于广义线性混合模型和深度神经网络。理论推导表明该更新能自动保持正定性,且计算复杂度与参数维度成线性关系。数值实验验证了在多种高维场景下收敛速度优于传统梯度更新。对您而言,本文是统计计算中变分推断算法的重要进展,其解析梯度推导思路可推广至其它结构化参数化变分族。
- 关键技术:
natural gradient,Cholesky decomposition,Gaussian variational approximation,Fisher information matrix,stochastic optimization with momentum,sparsity constraints - 为什么对您有用: 本文属于统计计算(数值方法与算法)方向,是您 primary interest 中明确列出的子领域。您非常熟悉的软件开发能力可用于复现并扩展该算法(例如集成到现有变分推断库中),且本文对 Cholesky 因子的解析处理为结构化协方差估计提供了新工具。立即可做:利用您擅长的软件实现该算法并进行数值对比测试。
2. 10.1093/jrsssb/qkaf017 — Multi-resolution subsampling for linear classification with massive data¶
- 作者: Haolin Chen, Holger Dette, Jun Yu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 机构: Beijing Institute of Technology · Ruhr University Bochum
- 分类: vol 87 · issue 4 · pp 1260-1280
- 相关性 6/10 · novelty:
new_method - 摘要: 在 massive data 的线性分类设定下,目标是构造一个在计算与统计效率间取得平衡的 subsample-based estimator,核心假设是数据可按空间分区且远离分类边界的区域仅需 summary measures 即可保留全局信息。本文提出 multi-resolution subsampling 策略:对远离分类边界的区域仅提取 summary measures(如均值、协方差)以捕获全局信息,对边界附近区域则保留局部 subsample 点以精确估计分类面。理论上证明了该 estimator 比纯 subsample-based estimator 更 efficient(更小方差),并建立了其渐近性质与现有 subsampling 方法(如 leverage-based sampling)的显式联系。模拟与真实数据验证了方差缩减效果。对您有用:该策略的 summary-measure + local-subsample 双层结构,与您在 higher-order U-statistics 中用 tensor contraction / einsum 做多阶信息提取的计算分层思想有结构相似性。
- 关键技术:
multi-resolution subsampling,summary measures for global information,linear classification,asymptotic efficiency comparison,data partitioning near classification boundary - 为什么对您有用: 直接连接 stat_computing 与 efficiency theory:本文的核心贡献是证明 summary measures + local subsample 的组合 estimator 在渐近方差上严格优于纯 subsample estimator,触及您关注的 semiparametric efficiency 与计算约束下的统计效率权衡。用您 very_familiar 的 minimax bounds / high-dimensional asymptotics 工具可以验证其声称的 efficiency gain 是否在更一般模型下仍成立。follow-up 判断:立即可做——用 very_familiar 的 M-estimation theory 与 minimax bounds 框架即可动手分析该 multi-resolution estimator 在非凸损失或其他分类模型下的效率界。
3. 10.1093/jrsssb/qkaf009 · arXiv — Bayesian penalized empirical likelihood and Markov Chain Monte Carlo sampling¶
- 作者: Jinyuan Chang, Cheng Yong Tang, Yuanzheng Zhu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 1127-1149
- 相关性 6/10 · novelty:
new_method - 摘要: 本文提出贝叶斯惩罚经验似然(BPEL)框架,旨在解决传统经验似然(EL)推断中的计算瓶颈。BPEL通过惩罚拉格朗日乘子实现约束降维,使EL能灵活适应多种模型条件(如高维参数)。为替代EL中复杂的约束优化,作者设计并验证了两种MCMC采样方案(随机游走Metropolis和Hamiltonian Monte Carlo),证明采样方法可快速收敛到后验全局最优。理论上证明了BPEL后验的相合性和渐近正态性。模拟和实证研究显示BPEL在参数估计和假设检验中优于传统优化方法,尤其在高维设定下更稳健。该方法与您的统计计算(MCMC算法设计)和高维非参推断(惩罚经验似然)兴趣高度相关,尤其是其以采样替代凸优化的思路为复杂推断提供了新计算途径。
- 关键技术:
Bayesian penalized empirical likelihood,Markov Chain Monte Carlo,Penalized Lagrange multipliers,Empirical likelihood,Posterior consistency,Sampling-based inference - 为什么对您有用: 本文连接您的统计计算(MCMC采样设计)和高维统计推断(惩罚经验似然处理高维约束)兴趣。您非常熟悉非参统计和高维渐近,可据此分析BPEL的渐近性质;但将BPEL应用于因果推断(如IV过度识别检验)需先掌握MCMC诊断与收敛性工具,属于中期可做(需在MCMC采样上长肌肉)。
4. 10.1093/jrsssb/qkaf003 · arXiv — Augmentation invariant manifold learning¶
- 作者: Shulei Wang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 978-1000
- 相关性 3/10 · novelty:
new_method - 摘要: 本文针对自监督表示学习中数据增强技术缺乏理论理解的问题,在一般非线性设定下建立了一个低维乘积流形框架来建模数据增强变换。基于该框架提出了一种新的表示学习方法——增强不变流形学习(Augmentation Invariant Manifold Learning),通过将其重构成随机优化问题来设计高效算法。该方法同时利用了流形的几何结构和增强数据的不变性,并给出了显式的理论保证。理论分析刻画了数据增强在学习过程中的作用,揭示了为何和如何利用增强数据学习到的表示能提升下游k近邻分类器的性能,并指出更复杂的数据增强会带来更大的下游改进。模拟和真实数据实验验证了方法的有效性。对您而言,本文涉及非参数流形学习和随机优化算法设计,与您的非参数统计和统计计算兴趣直接相关,可作为跨界至现代表示学习理论的阅读入口。
- 关键技术:
manifold learning,data augmentation,self-supervised representation learning,low-dimensional product manifold,stochastic optimization,k-nearest neighbour classifier - 为什么对您有用: 本文主题属于统计计算和非参数理论(流形学习),连接到您的主要兴趣子方向。您的‘非参数统计’武器库可直接分析其流形估计的收敛速率;‘软件开发’技能可复现其实验并扩展至其他下游任务。判定:立即可做,无需额外工具提升。
其他 (other, 1 篇)¶
1. 10.1093/jrsssb/qkaf002 · arXiv — Two-phase rejective sampling and its asymptotic properties¶
- 作者: Shu Yang, Peng Ding
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 87 · issue 4 · pp 957-977
- 相关性 3/10 · novelty:
new_method - 摘要: 本文在有限总体辅助信息不可用的情况下,提出了两阶段拒绝抽样(TPRS)方法。该方法在第一阶段测量样本单元的辅助变量,第二阶段对结果变量实施拒绝抽样。作者探索了在TPRS下双倍扩展估计量和回归估计量的渐近设计性质,证明TPRS能显著提高双倍扩展估计量的效率,使其接近回归估计量的效率。进一步,对协变量重要性不同的情况调整设计,并推广到多相抽样。渐近结果从总体均值推广到由一般估计方程定义的参数。该论文为抽样设计提供了一般的渐近理论框架。研究者的主要兴趣包括数学统计中的渐近理论、M估计等,本文的渐近分析对理解两阶段抽样下的推断具有直接借鉴意义。
- 关键技术:
two-phase rejective sampling,double expansion estimator,regression estimator,asymptotic design properties,estimating equations - 为什么对您有用: 本文属于抽样设计与渐近性质研究,直接连接研究者的'数学统计'兴趣中的渐近理论。研究者熟悉的'非参数统计'中的渐近分析工具可类比到本文的抽样设计渐近分析(但需注意设计基础 vs 模型基础的区别)。此主题可作为中期可读:研究者需补充survey抽样的设计基础才能完全掌握,但核心渐近结果可直接启发因果推断中两阶段抽样的效率问题。
Maintained by 陈星宇 · Homepage · Source on GitHub