JRSSB — Vol 88 Issue 1 · 2026-05-26¶
- 共 15 篇 · Journal of the Royal Statistical Society Series B
本期导览¶
自动生成:归纳本期主要主题与脉络,不打分、不排名。
这一期JRSSB的15篇论文大致可归纳为四条主线:因果推断与中介分析、半参数/非参数方法与效率理论、高维与随机矩阵方法、以及假设检验与变点检测。因果推断方向集中了3篇,分别处理principal stratification中的连续后处理变量、跨principal strata的中介效应识别与多重稳健估计,以及利用外部对照数据增强RCT亚组效应估计。半参数/非参数方向覆盖了充分降维的列选择推广、Wasserstein生成回归、流形上的经验似然、带动态协变量的排序模型、以及时变协变量下的删失分位数回归。高维与随机矩阵方向包括预训练Lasso与低秩混合模型下的最优聚类。假设检验与变点检测方向有双重稳健条件独立性检验、多层随机点积图的估计与在线变点检测,以及基于计算几何的在线多变量变点检测。此外,还有一篇关于自动微分与概率编程简化去偏推断的论文,以及一篇关于删失生存数据判别度量的有效非参数估计。
在因果推断主线中,三篇论文分别从不同角度推进了识别与估计的稳健性。Principal stratification with continuous post-treatment variables一文针对连续型后处理变量导致的无限多principal strata,提出用working model逼近因果效应曲面,并基于efficient influence function构造双重稳健估计量。Identification and multiply robust estimation in causal mediation analysis across principal strata则进一步将中介效应识别扩展到跨principal strata设定,推导了非参数有效影响函数,并构造了多重稳健估计量——在四类模型误设组合下仍保持一致性,且允许使用data-adaptive机器学习实现非参数有效估计。Harmonized estimation of subgroup-specific treatment effects in randomized trials关注RCT亚组分析,通过投影约束使结合外部对照数据的亚组估计均值与RCT-only总体效应保持一致,方法不依赖特定外部对照融合方式,可修饰任意初始亚组估计量。这三篇共同体现了对识别假设放松与估计稳健性的追求。
在半参数/非参数主线中,A unified generalization of the inverse regression methods via column selection打破了高阶逆回归方法在高维下的维度瓶颈,通过对矩阵参数进行列选择实现稀疏化,将SAVE/DR等方法统一推广到高维设定。Wasserstein generative regression则提出同时估计回归函数与条件分布的生成式框架,用深度神经网络建模条件生成器,通过最小化Wasserstein距离并施加回归约束训练,并给出了非渐近误差界。Empirical likelihood for manifolds将经验似然理论适配到流形数据,证明了Wilks定理成立,避免了传统Wald检验在流形上估计渐近方差矩阵的困难,并推广至双样本检验、Fréchet方差推断等场景。Statistical ranking with dynamic covariates在Plackett–Luce框架下允许协变量在不同比较间变化,给出了MLE存在性与可识别性的充要条件,收敛率由图序列的渐近连通度决定。Censored quantile regression with time-dependent covariates则扩展了删失分位数回归以处理时变协变量,建立了递归估计量的渐近性质。
对于因果推断与半参数效率方向的研究者,建议优先关注:Principal stratification with continuous post-treatment variables(因果效应曲面的非参数识别与半参数估计)、Identification and multiply robust estimation in causal mediation analysis across principal strata(跨principal strata的中介效应多重稳健估计)、Harmonized estimation of subgroup-specific treatment effects in randomized trials(RCT亚组效应的外部对照增强估计)、以及Efficient nonparametric estimators of discrimination measures with censored survival data(删失生存数据判别度量的有效非参数估计)。对于高维与随机矩阵方向,Pretraining and the lasso(预训练Lasso的共同系数支持恢复)和Optimal clustering by Lloyd’s algorithm for low-rank mixture model(低秩混合模型下的最优聚类)值得关注。
因果推断 (causal_inference, 3 篇)¶
1. 10.1093/jrsssb/qkaf049 — Principal stratification with continuous post-treatment variables: nonparametric identification and semiparametric estimation¶
- 作者: Sizhu Lu, Zhichao Jiang, Peng Ding
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 239-260
- 相关性 9/10 · novelty:
new_method - 摘要: 在 principal stratification 框架下,针对连续型 post-treatment 变量导致的无限多 principal strata 问题,目标是实现 causal effect surface 的 nonparametric identification 与 semiparametric estimation。作者提出用 working model 逼近潜在的因果效应曲面,推导出对应模型参数的 efficient influence function (EIF)。基于 EIF 构造了 doubly robust (DR) estimator,并在 R 包 continuousPCE 中实现。理论部分证明了在连续 strata 下的 identification 条件及 DR estimator 的 n^{-1/2}-CAN 性质。实证与模拟验证了 DR estimator 在模型误设下的鲁棒性。对您可能有用:本文将 principal stratification 从 binary 推广到 continuous,其 EIF 推导与 DR 构造直接对接您 primary interest 中的因果推断 identification/estimation 与 semiparametric efficiency theory。
- 关键技术:
principal stratification,efficient influence function,doubly robust estimation,nonparametric identification,causal effect surface,working model approximation - 为什么对您有用: 直接对接 causal inference 中的 principal stratification / mediation 设定,以及 semiparametric efficiency theory 中的 EIF 推导与 DR 构造。您 very_familiar 的 estimation theory in causal inference 与 moderately_familiar 的 semiparametric theory / identification theory 完全可以攻破本文的 EIF 推导与 identification 证明细节。立即可做:用 very_familiar 的因果推断估计理论审视其 DR estimator 在高维/复杂 setting 下的拓展可能性,或用 moderately_familiar 的 HOIF 探索连续 strata 下更高阶的修正。
2. 10.1093/jrsssb/qkaf037 — Identification and multiply robust estimation in causal mediation analysis across principal strata¶
- 作者: Chao Cheng, Fan Li
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 1-22
- 相关性 9/10 · novelty:
new_method - 摘要: 在存在治疗后事件(如不依从、死亡)的因果中介分析框架下,目标是识别总体及各主层(principal stratum,由治疗后事件的联合潜在值定义)的自然中介效应。作者推导了每个中介估计量的非参数有效影响函数(EIF),并基于此构造了多重稳健(multiply robust)估计量——在四类模型误设组合下仍保持一致性,且当所有 nuisance 模型正确时达到半参数有效。进一步利用 data-adaptive ML 构建非参数有效估计量以避免参数模型误设,并提供了针对关键识别假设的敏感性分析方法。理论与模拟及两个真实流行病学/临床数据示例验证了方法性能。对您有用:本文将 principal stratification 与 mediation 的 EIF/MR/debiased ML 系统结合,直接推进了您关注的因果中介识别与半参数有效估计理论。
- 关键技术:
principal stratification,natural mediation effects,efficient influence function,multiply robust estimation,debiased machine learning,sensitivity analysis - 为什么对您有用: (1) 直接命中因果推断中的中介分析与主层设定,以及效率理论中的 EIF 与多重稳健/debiased ML。(2) 用您 moderately_familiar 的 "HOIF (Higher-Order Influence Functions)" 可以攻击本文的一个潜在口子:当高维 nuisance 估计器收敛率达不到 n^{-1/4} 时,用 HOIF 做高阶偏差修正以恢复 √n-CAN。(3) 立即可做:用 very_familiar 的因果推断估计理论复现其 MR 推导,并尝试将框架扩展到 longitudinal mediation setting。
3. 10.1093/jrsssb/qkaf045 — Harmonized estimation of subgroup-specific treatment effects in randomized trials: the use of external control data¶
- 作者: Daniel Schwartz, Riddhiman Saha, Steffen Ventz, Lorenzo Trippa
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 143-170
- 相关性 7/10 · novelty:
new_method - 摘要: 在 RCT subgroup 分析设定下,目标是利用外部对照 (EC) 数据增强 subgroup-specific ATE 的估计,同时保持与 RCT-only overall effect 的 coherence。提出 harmonized estimator:对任何结合 RCT+EC 数据的 subgroup 估计(如线性回归)施加约束,使加权 subgroup 估计均值恰好等于 RCT-only overall effect,本质上是一个 projection-based constrained estimation。方法不依赖特定 EC 融合方式,可修饰任意初始 subgroup 估计;analytic 结果表明 EC 数据在 subgroup 小样本场景下降低方差且不破坏 coherence。Oncology case study 展示实际效用,但 paper 未给出 semiparametric efficiency bound 或 influence function 分析。对您在 causal inference 的 estimation/identification 子方向有直接参考价值,尤其是外部数据融合下的约束估计思路。
- 关键技术:
harmonized estimation,external control data integration,subgroup-specific treatment effect,coherence constraint,constrained projection estimation - 为什么对您有用: 直接连接 causal inference 的 estimation 子方向——RCT+外部数据融合的 treatment effect 估计。用 technical_arsenal 中 'estimation theory in causal inference' 可攻其口子:paper 未推导 harmonized estimator 的 influence function 与 semiparametric efficiency bound,这是一个立即可做的理论延伸——用 very_familiar 的 estimation theory 工具即可分析其效率性质并判断是否达到 bound。
高维统计 / 随机矩阵 (high_dim_rmt, 2 篇)¶
1. 10.1093/jrsssb/qkaf050 — Pretraining and the lasso¶
- 作者: Erin Craig, Mert Pilanci, Thomas Le Menestrel, Balasubramanian Narasimhan, Manuel A Rivas, Stein-Erik Gullaksen et al.
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 261-281
- 相关性 7/10 · novelty:
new_method - 摘要: 在高维线性模型设定下,本文探讨“预训练”范式能否提升 Lasso 的表现,目标 estimand 为分层或多响应模型中的共同系数与组特有系数。提出先在大规模数据集上拟合 Lasso 以估计共同系数,再在较小数据集(子集或相关但不同的响应)上微调组特有系数。理论证明在适当假设下,预训练 Lasso 对共同系数的支持恢复(support recovery)优于传统在单组上拟合的 Lasso。该框架将预训练与微调的思想引入高维稀疏回归,实现了共同特征与个体特征的分离识别。主要理论结果为分层设定下共同系数支持恢复的优越性;实证展示了多响应与分层模型的改进。对您研究高维统计中稀疏估计的渐近性质与计算实现可能提供新视角。
- 关键技术:
Lasso pretraining,support recovery,stratified model,fine-tuning,high-dimensional sparse regression - 为什么对您有用: 本文连接到高维统计中的稀疏估计与支持恢复理论,以及统计计算中的算法实现。您可用 very_familiar 的高维渐近理论审视其支持恢复的假设条件与理论边界,或用 software development 经验复现/扩展其预训练框架。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格推导预训练 Lasso 的渐近分布或 minimax rate,当前武器库可支撑复现与初步理论审视。
2. 10.1093/jrsssb/qkaf041 — Optimal clustering by Lloyd’s algorithm for low-rank mixture model¶
- 作者: Zhongyuan Lyu, Dong Xia
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 43-65
- 相关性 6/10 · novelty:
new_theory - 摘要: 本文研究矩阵观测聚类问题,提出低秩混合模型(LrMM),假设总体中心矩阵为低秩,目标是在此设定下刻画聚类的计算与统计极限。核心方法是将 Lloyd 算法与低秩近似结合:一旦初始化良好,算法快速收敛并达到指数级聚类误分率,且该速率 minimax 最优;初始化由基于张量的谱方法提供。与经典 GMM 不同,LrMM 的 minimax 最优聚类误分率由分离强度(中心矩阵间最小距离)决定,而计算难度由信号强度(中心矩阵最小非零奇异值)刻画;文中给出证据表明当信号强度不足时,即使分离强度足够,任何多项式时间算法均无法一致聚类。最后讨论了 LrMM 下估计与聚类的有趣差异。对您有用:本文在低秩矩阵混合设定下明确展示统计阈值与计算阈值的分离,是 stat-computational tradeoff 方向的 gateway reading。
- 关键技术:
Lloyd's algorithm with low-rank approximation,tensor-based spectral initialization,minimax optimal clustering error rate,computational lower bound for polynomial-time algorithms,signal strength vs separation strength,low-rank mixture model - 为什么对您有用: 本文直接连接 stat-computational tradeoff 子方向:明确给出统计阈值(分离强度)与计算阈值(信号强度)的分离,并给出多项式时间不可能的证据,对 outsider 可读性较好(阈值陈述精确、gap 显式)。用您 very_familiar 的高维渐近分析与 minimax bound 工具可验证其 minimax rate 的紧性;但多项式时间不可能的证据部分(可能涉及平均-case hardness 或低-degree barrier)需先在 moderately_familiar 的计算下界工具上长肌肉。中期可做:先补低-degree polynomial / SQ lower bound 基础,再审视其计算下界是否可 sharper。
非参数 / 半参数 (nonparam_semipara, 5 篇)¶
1. 10.1093/jrsssb/qkaf038 — A unified generalization of the inverse regression methods via column selection¶
- 作者: Yin Jin, Wei Luo
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 23-42
- 相关性 5/10 · novelty:
new_method - 摘要: 在充分降维(SDR)问题中,高阶逆回归方法(SAVE/DR等)在总体水平优于SIR,但其中间矩阵参数列数过多,在高维设定下遭遇维度瓶颈。本文提出对矩阵参数进行列选择(column selection),仅用一小部分列做SDR估计,打破高阶逆回归使用全环境矩阵的惯例。通过快速列选择程序,统一地将这些方法及其集成推广到高维稀疏设定,形式上类似稀疏SIR且无需额外假设。这是文献中首次成功将高阶逆回归方法从维度限制中解放出来的尝试,数值模拟和真实数据验证了方法的有效性。对您而言,本文的高维稀疏SDR策略连接到半参数理论和高维统计兴趣,列选择机制也涉及统计-计算权衡考量。
- 关键技术:
sufficient dimension reduction,higher-order inverse regression,column selection,sparse SIR,high-dimensional sparse estimation - 为什么对您有用: 本文连接到半参数理论中的SDR估计问题和高维统计中的稀疏降维设定。武器库中'high-dimensional asymptotics'和'nonparametric statistics'可用来分析列选择估计量的收敛率;'computation of higher-order U-statistics (treewidth / tensor contraction)'视角可审视其矩阵参数计算复杂度。中期可做:需先在'semiparametric theory'上长肌肉(SDR的半参数效率界),才能深入分析列选择对估计效率的影响。
2. 10.1093/jrsssb/qkaf053 — Wasserstein generative regression¶
- 作者: Shanshan Song, Tong Wang, Guohao Shen, Yuanyuan Lin, Jian Huang
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 330-351
- 相关性 4/10 · novelty:
new_method - 摘要: 本文提出 Wasserstein 生成回归(WGR),在统一框架下同时估计回归函数与条件分布:目标 estimand 为条件生成器 G(x,ε)(ε~Uniform[0,1]),使得 G 产生的样本分布逼近真实条件分布 F_{Y|X},同时 G 的均值函数满足回归约束。方法用深度神经网络建模 G,通过最小化 Wasserstein 距离并施加回归一致性约束来训练。理论贡献:在 DNN 近似理论的标准 smoothness 与网络架构假设下,推导了非渐近误差界(给出依赖样本量 n、网络深度 L、宽度 W 的显式收敛 rate),并证明了条件分布估计的 distributional consistency。数值实验覆盖多变量响应与预测区间构造,对比 GAN-type 与 kernel 条件密度方法。对您可能有用:条件分布估计是因果推断 counterfactual distribution 的核心组件,WGR 的非渐近界可为后续 semiparametric efficiency 分析提供 rate 基准。
- 关键技术:
Wasserstein distance minimization,deep neural network approximation theory,conditional generator,nonasymptotic error bounds,distributional consistency,prediction interval construction - 为什么对您有用: 本文落在非参数理论这一 primary interest 上,非渐近误差界与 minimax rate 的关系值得审视。研究者可用 very_familiar 的 minimax bounds 工具检验其 DNN 近似框架下的收敛率是否紧,并判断是否达到已知的最优 rate。中期可做:若要将 WGR 嵌入因果推断的条件分布估计(如 proximal CI 的 bridge function 估计或 IV 设定下的 counterfactual distribution),需先在 moderately_familiar 的 semiparametric theory 上推导 influence function 与 efficiency bound,再评估 WGR 是否能作为 nuisance estimator 达到 cross-fitting + orthogonal 所需的 rate 要求。
3. 10.1093/jrsssb/qkaf043 — Empirical likelihood for manifolds¶
- 作者: Daisuke Kurisu, Taisuke Otsu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 91-119
- 相关性 4/10 · novelty:
new_theory - 摘要: 在非欧几里得度量空间(特别是流形)上的 Fréchet 均值及相关总体对象的推断问题中,本文发展了流形数据的非参数似然理论。作者将经验似然(EL)理论适配到流形数据,证明了 EL 统计量满足 Wilks 定理(即 -2 log EL 渐近服从 χ² 分布),从而避免了传统 Wald 检验在流形上需要估计渐近方差矩阵的困难。进一步将该方法推广至双样本检验、Fréchet 方差推断、准贝叶斯推断、局部 Fréchet 回归及 Fréchet 均值集估计。模拟与实证表明 EL 方法在流形推断中优于传统 Wald 检验。对您有用:本文将经典非参数假设检验工具(EL)拓展至流形结构,直接呼应您在非参数理论与假设检验方向的兴趣,且为处理非欧数据提供了无需协方差矩阵估计的推断捷径。
- 关键技术:
empirical likelihood,Fréchet mean,Wilks' theorem,non-Euclidean manifold,quasi-Bayesian inference,local Fréchet regression - 为什么对您有用: 直接连接到您 primary interest 中的非参数理论与假设检验,将经典的经验似然推断框架从欧氏空间推广至流形上的 Fréchet 均值。您武器库中 very_familiar 的 "nonparametric statistics" 和 moderately_familiar 的 "M-estimation theory"(Fréchet 均值本质上是 M-估计)完全足以攻破本文的理论推导口子,特别是可以审视其 Wilks 定理在流形曲率约束下的适用边界。属于立即可做——用您熟悉的非参数渐近理论即可复现并探索其 EL 统计量在更复杂流形上的性质。
4. 10.1093/jrsssb/qkaf048 — Statistical ranking with dynamic covariates¶
- 作者: Pinjun Dong, Ruijian Han, Binyan Jiang, Yiming Xu
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 221-238
- 相关性 2/10 · novelty:
new_theory - 摘要: 本文在 Plackett–Luce 框架下研究带动态协变量的统计排序模型,目标参数为各对象的偏好得分,关键假设为比较图的设计满足渐近连通性条件。与以往固定协变量模型不同,本文允许协变量在不同比较间变化,MLE 的唯一存在性与模型可识别性被给出充要条件刻画。算法上提出交替最大化法求解 MLE;理论上在比较图与协变量设计的适当假设下,建立 MLE 的一致收敛率,该率由图序列的渐近连通度决定,并构造了使假设几乎必然成立的随机设计。实证部分用赛马与网球数据验证模型。对您可能有用:该文的 MLE 收敛率与图连通度挂钩的 minimax-type 分析思路,可迁移到您熟悉的因果推断中网络/图结构下的估计问题。
- 关键技术:
Plackett-Luce model,alternating maximization,MLE uniform consistency,graph asymptotic connectivity,dynamic covariates - 为什么对您有用: 本文连接到您 primary interest 中的 semiparametric/nonparametric theory 与 estimation theory in causal inference 子方向——图结构约束下 MLE 收敛率的刻画与您熟悉的 minimax bounds 工具直接对话。用您 very_familiar 的 minimax bounds for estimation problems 可验证本文声称的由图连通度决定的收敛率是否紧,或可推广到因果推断中带网络干预的估计场景。中期可做:需先在 moderately_familiar 的 M-estimation theory 上长肌肉,以严格处理交替最大化算法的非凸收敛分析。
5. 10.1093/jrsssb/qkaf042 — Censored quantile regression with time-dependent covariates¶
- 作者: Chi Wing Chu, Tony Sit, Zhiliang Ying
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 66-90
- 相关性 1/10 · novelty:
new_method - 摘要: 本文提出一类新的带时变协变量的删失分位数回归模型,用于右删失生存数据。现有文献要么假设独立删失机制,要么在纵向设定下处理数据;本文扩展框架使得传统时变协变量设定可被恰当处理,并推广分位数定义以提供动态解释视角。作者建立递归估计量的渐近性质(一致性、渐近正态性),数值模拟验证方法有效性。对您可能有用:本文在 semiparametric 分位数回归框架下处理时变协变量与删失机制,与您在 semiparametric theory 和 causal inference longitudinal 设定中的兴趣有直接连接。
- 关键技术:
censored quantile regression,time-dependent covariates,recursive estimation,right-censored failure time,asymptotic normality,dynamic quantile definition - 为什么对您有用: 本文直接连接到您 primary interest 中的 semiparametric theory(分位数回归的渐近性质)和 causal inference longitudinal 设定(时变协变量在生存/事件时间分析中的处理)。您武器库中的 M-estimation theory(moderately_familiar)可直接用来分析该递归估计量的渐近性质和效率界;若要进一步推导 semiparametric efficiency bound 或构造 one-step/debiased 版本,则需在 semiparametric theory 上长肌肉。中期可做:用 M-estimation theory 验证其渐近性质,再尝试推导 influence function 和效率界。
效率理论 / Debiased ML (efficiency_dml, 1 篇)¶
1. 10.1093/jrsssb/qkaf044 — Efficient nonparametric estimators of discrimination measures with censored survival data¶
- 作者: Marie Skov Breum, Torben Martinussen
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 120-142
- 相关性 3/10 · novelty:
new_method - 摘要: 在右删失生存数据下,本文研究判别度量(concordance index 与 cumulative-dynamic time-dependent AUC)的有效非参数估计;estimand 为线性评分规则的系数向量,定义为无删失设定下的非参数量,避免评分规则依赖删失分布。提出 debiased estimator:通过构造 efficient influence function 并用 data-adaptive 方法拟合 nuisance functions,实现 n^{-1/2}-CAN 且达到 semiparametric efficiency bound;估计量不依赖删失模型的正确设定即可保持一致性。模拟对比现有方法,并以脑癌数据做实证展示。对您有用:直接连接 efficiency theory / debiased ML 方向——展示了删失数据下判别度量的 influence function 构造与 debiasing 实现路径。
- 关键技术:
debiased estimation,efficient influence function,data-adaptive nuisance estimation,concordance index,time-dependent AUC,censored survival data - 为什么对您有用: 本文核心落在 efficiency theory / debiased ML 方向:在删失数据下为判别度量构造 efficient influence function 并用 data-adaptive nuisance fitting 实现 semiparametric efficient estimation,与您关注的 debiased ML 框架直接对接。用 technical_arsenal 中 moderately_familiar 的 semiparametric theory 可以分析其 influence function 构造与收敛性论证;very_familiar 的 minimax bounds 可用于验证其声称的 efficiency 是否紧。Follow-up 判断:中期可做——需先在 moderately_familiar 的 semiparametric theory 上长肌肉(特别是删失数据下 influence function 的推导),之后可扩展到 longitudinal causal setting 下的类似判别度量 debiased 估计。
数理统计 / 假设检验 (hypothesis_testing, 2 篇)¶
1. 10.1093/jrsssb/qkaf047 — Doubly robust conditional independence testing with generative neural networks¶
- 作者: Yi Zhang, Linjun Huang, Yun Yang, Xiaofeng Shao
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 195-220
- 相关性 8/10 · novelty:
weaker_assumption - 摘要: 本文研究给定协变量 Z 时随机向量 X 与 Y 的条件独立性检验(CI testing)问题,核心 estimand 是条件独立原假设的检验统计量,关键假设为 GNN 逼近误差乘积衰减快于 n^{-1/2}。方法通过生成式神经网络(GNN)从边际条件分布 X|Z 与 Y|Z 中抽样,避免显式估计条件分布。提出的检验统计量具有双重稳健性:只要两个逼近误差乘积 ε_X ε_Y = o(n^{-1/2}),统计量即保留 oracle 检验(使用真实条件分布)的渐近零分布与局部替代效力,放宽了传统要求单个误差 o(n^{-1/2}) 的假设。理论推导了原假设与局部替代下的渐近性质及 bootstrap 一致性。对您而言,CI 检验是因果图发现与识别的基础,此处的双重稳健性与 semiparametric orthogonal score 思路高度同构,为非参因果检验提供了新视角。
- 关键技术:
conditional independence testing,doubly robust test statistic,generative neural network sampling,product error rate condition,oracle test property,bootstrap consistency - 为什么对您有用: 直接命中 hypothesis testing 与 causal inference (因果图发现) 的交叉地带,其 double robustness 结构与 semiparametric efficiency theory (orthogonal score) 紧密相连。可以用 moderately_familiar 中的 HOIF (Higher-Order Influence Functions) 视角审视其 product error rate 条件,探索能否通过高阶偏差修正将误差乘积条件进一步放宽至更弱的 n^{-1/2+k} 形式。中期可做——需先在 moderately_familiar 的 HOIF 与 semiparametric theory 上长肌肉,以推导高阶 orthogonal score 是否能在此 CI 检验框架下进一步削弱对 GNN 逼近误差的率要求。
2. 10.1093/jrsssb/qkaf051 — Multilayer random dot product graphs: estimation and online change point detection¶
- 作者: Fan Wang, Wanshan Li, Oscar Hernan Madrid Padilla, Yi Yu, Alessandro Rinaldo
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 282-312
- 相关性 3/10 · novelty:
new_method - 摘要: 在多层随机点积图(MRDPG)模型下,研究多层网络的边概率估计与在线变点检测问题;设定为跨层共享节点集与潜在位置、但各层允许不同连接矩阵。估计方面采用 tensor 分解方法,证明其优于现有 spectral 方法;变点检测方面提出在线框架,在固定与随机潜在位置两种情形下设计 tensor 算法,provably 最小化检测延迟并控制误报率。在随机潜在位置情形下,基于密度核估计提出非参数变点检测算法,适用于包括 stochastic block model 在内的广泛网络设定。主要理论结果给出了检测延迟的 minimax 性质与误报率控制界。对您可能有用的是:tensor 分解方法与您 higher-order U-statistics 的 tensor contraction/einsum 视角有弱连接,且非参数变点检测的 kernel density 方法属于 nonparametric theory 子方向。
- 关键技术:
tensor decomposition for network estimation,online change point detection,density kernel estimator,random dot product graph,minimax detection delay,stochastic block model - 为什么对您有用: 本文连接到 hypothesis_testing 子方向(在线变点检测即 sequential testing)与 nonparam_semipara 子方向(kernel density 非参数检测器)。tensor 分解方法与您 technical_arsenal 中 'computation of higher-order U-statistics (treewidth / tensor contraction / einsum)' 有弱连接——可尝试用 einsum / tensor contraction 视角分析其 tensor 算法的计算复杂度与 contraction-order 优化。中期可做:需先在 moderately_familiar 的 semiparametric theory 上长肌肉,才能将非参数变点检测的效率界与 semiparametric efficiency bound 做系统对比。
其他 (other, 2 篇)¶
1. 10.1093/jrsssb/qkaf052 — Simplifying debiased inference via automatic differentiation and probabilistic programming¶
- 作者: Alex Luedtke
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 313-329
- 相关性 9/10 · novelty:
new_method - 摘要: 在非参数/半参数模型下,目标是自动构造 semiparametric efficient estimator,无需手动推导 efficient influence function (EIF)。核心机制是提出 Dimple 算法:将统计 functional 分解为满足 novel pathwise differentiability 条件的 primitives 组合,再利用 automatic differentiation (AD) 自动计算 EIF,并由该组合结构自动识别需估计的 nuisance 参数。软件层面,各 primitive 可独立实现并在不同 estimation 问题间复用,用户仅需几行代码即可从参数定义跳到 efficient estimation。理论保证依赖于 primitive 的 pathwise differentiability 与 composition 规则,实证通过多个经典因果/半参数例子展示。对您可能有用:此工作将 EIF 推导与 nuisance 识别完全自动化,直接连接到 efficiency theory 与 statistical computing 两个 primary interests。
- 关键技术:
automatic differentiation,efficient influence function,pathwise differentiability,nuisance parameter identification,one-step efficient estimator,probabilistic programming - 为什么对您有用: 本文直接连接到 efficiency theory (semiparametric efficiency bounds) 与 statistical computing (numerical methods & software) 两个 primary interests,将 EIF 推导与 nuisance 识别从手工分析转为 AD 自动计算。用您 very_familiar 的 software development 与 estimation theory in causal inference 武器即可直接复现/扩展 Dimple 框架(例如加入 cross-fitting 或 HOIF primitive),属于立即可做的 follow-up:为 higher-order U-statistics / HOIF 设计可组合的 primitive 并接入其 einsum 计算后端,是一个自然延伸。
2. 10.1093/jrsssb/qkaf046 — Online multivariate changepoint detection: leveraging links with computational geometry¶
- 作者: Liudmila Pishchagina, Gaetano Romano, Paul Fearnhead, Vincent Runge, Guillem Rigaill
- 期刊/来源: Journal of the Royal Statistical Society Series B
- 分类: vol 88 · issue 1 · pp 171-194
- 相关性 3/10
- 摘要: 在 p 维数据流的在线变点检测设定下,目标是精确计算单变点的似然比检验(LR)统计量,而传统顺序实现因计算成本过高而无法在线使用。本文通过将 LR 统计量的在线更新与计算几何(动态凸包/半平面交集维护)建立深刻联系,提出了精确计算该统计量的准线性时间算法。该几何视角自然允许精确恢复稀疏 LR 统计量(即仅假设部分维度发生变点)。对 p<3 给出了二分变体算法,复杂度 provably 为 O(n log n p+1);对 p>5 提出了近似算法,复杂度为 O(n p~ log n p~+1)。在高斯情形下给出了所提程序的统计保证,并在仿真与 NBA 数据上验证了计算与统计性能。对您有用:这是统计计算与算法复杂度交叉的典型范例,将统计量的计算复杂度映射到几何结构,与您用 treewidth/einsum 分析 U-stat 计算成本的思路有精神上的共鸣。
- 关键技术:
online changepoint detection,likelihood ratio test,computational geometry,dynamic convex hull
Maintained by 陈星宇 · Homepage · Source on GitHub