Biometrika — Vol 110 Issue 4 · 2026-06-20¶

共 15 篇 · Biometrika
目录核对 ✅ 15 篇全部抓到（对照 OpenAlex 19 篇）

本期导览¶

自动生成：归纳本期主要主题与脉络，不打分、不排名。

本期论文聚焦于复杂设定下的因果识别与半参数推断，大致聚成三条主线：一是因果推断在未测量混杂、无效工具变量及多源异质数据下的识别与效率提升，涵盖proximal mediation、无效IV的G-estimation、点过程IV、目标人群OTR、选择偏差软校准及有偏源融合提取等六篇；二是半参数/非参数效率界与复杂对象的估计理论，包括反事实密度估计、数据融合效率界、矩阵函数平滑特征向量、流形强度函数与Fréchet均值等五篇；三是假设检验与计算方法，涉及线性SEM祖先回归检验、Granger因果估计量抽样分布及流式纵向数据推断三篇。

因果识别与半参数效率主线本期推进极深，核心在于放宽经典无混杂假设并维持估计的鲁棒性与效率：面对未测量混杂，Proximal mediation与点过程IV分别借助negative-control代理与频域去卷积实现NDE/NIE及点过程治疗效应的识别；面对工具变量失效，无效IV的G-estimation通过投影机制与多数有效规则构造了双稳健的半参有效估计量；面对数据异质与偏差，目标人群OTR利用汇总统计量校准AIPW，有偏源融合提取仅凭汇总统计量即可自动剔除有偏源并达到Oracle渐近效率，软校准则通过混合效应模型惩罚结构缓解了高维下的极端权重问题。这些工作几乎无一例外地依赖efficient influence function与one-step修正来构筑多重鲁棒性或局部有效性。

半参数/非参数估计主线则将效率界与鲁棒估计向更复杂的estimands与几何结构拓展：反事实密度估计证明了密度泛函效率界与均值估计的等价性，借此给出cross-fitting下的doubly robust-style估计量；数据融合效率界刻画了多源分布信息拼接下的效率增益，并给出正交化one-step构造；在非参数对象上，矩阵函数特征向量的√2-estimation解决了符号与排序的indeterminacy以达n^{-1/2}-consistency，流形强度函数与Fréchet均值等变估计则将经典核密度与MRE理论推广至Riemannian几何。假设检验与计算主线中，祖先回归将因果结构学习转化为回归系数与条件独立的检验以保证Type I error，Granger因果估计量分布推导填补了原假设下广义χ²分布的空白，流式QIF推断则实现了纵向数据递归更新下的相合性与渐近正态性。

对因果推断与半参数效率方向最贴的论文首推无效IV的G-estimation、Proximal mediation与数据融合效率界三篇，它们直接推进了invalid IV、negative control及多源融合下的influence function推导与多重/局部鲁棒估计构造；反事实密度估计与目标人群OTR两篇则在非参数密度泛函与协变量汇总设定下拓展了doubly robust与calibrated AIPW的适用边界，适合优先看。

因果推断 (causal_inference, 7 篇)¶

1. 10.1093/biomet/asad015 · arXiv — Proximal mediation analysis¶

作者: Oliver Dukes, Ilya Shpitser, Eric J Tchetgen Tchetgen
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 973-987
相关性 10/10 · novelty: new_theory
摘要: 在 proximal causal inference 框架下，本文目标是当存在未测量混杂时，通过 negative-control 代理变量对自然直接效应 (NDE) 和自然间接效应 (NIE) 进行 identification。设定放宽了标准无混杂假设，允许协变量仅为潜在混杂机制的代理。作者提出三个独立的 proximal identification 结果，分别对应不同代理变量结构下的 NDE/NIE 识别公式。随后构建半参数推断框架，推导出自然直接/间接效应的 influence function，进而得到 locally efficient 且 multiply robust 的估计量。对您有用：本文将 proximal CI 从总效应拓展到中介分析，直接连接您 primary interest 中的 proximal CI 与 mediation 交叉方向。
关键技术: proximal identification, natural direct/indirect effects, multiply robust estimation, locally efficient influence function, semiparametric inference, negative control proxies
为什么对您有用: 本文直接推进您 primary interest 中 proximal CI 与 mediation 的交叉领域，给出了 NDE/NIE 的 identification 公式与 multiply robust estimator。您武器库中 moderately_familiar 的 semiparametric theory 与 identification theory 足以攻入本文的 influence function 推导细节，并可进一步探讨其 robustness 条件失效时的 sensitivity analysis。中期可做：需先在 moderately_familiar 的 semiparametric theory（特别是 mediation 的 influence function 推导）上长肌肉，即可展开对其 multiply robust 性质与效率界的深入分析。

2. 10.1093/biomet/asad011 · arXiv — Semiparametric efficient G-estimation with invalid instrumental variables¶

作者: B Sun, Z Liu, E J Tchetgen Tchetgen
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 953-971
相关性 9/10 · novelty: new_method
摘要: 本文针对工具变量分析中多个候选工具变量可能部分违反排除限制或外生性假设的问题，提出了一类新的G-estimator。研究设定允许analyst事先指定至少γ个工具变量是有效的（γ ≤ K），但无需知道具体哪些有效。方法通过构造基于残差的G-estimating equation，并引入将无效工具变量影响投影到有效工具变量空间的机制，利用半参效率理论推导了有效影响函数，从而得到半参有效的因果效应估计量。估计量具有双稳健结构，在满足多数有效规则的条件下保持一致性和渐近正态性。模拟研究与UK Biobank数据分析表明，相比两阶段最小二乘法、SVM等现有方法，新方法在存在无效工具变量时偏差更小、置信区间覆盖更稳健。对您有用：直接连接到causal inference中IV方法的方向，所用半参效率理论是您moderately_familiar的领域，可尝试将其推广到proximal CI或纵向数据设定。
关键技术: G-estimation, semiparametric efficiency bound, invalid instruments, majority rule, efficient influence function
为什么对您有用: 本文直接匹配您primary interest中的causal inference（IV方法）和efficiency theory（半参效率界）。技术核心基于G-estimation和有效影响函数，可借助您very_familiar的estimation theory in causal inference快速理解并复现核心证明；同时moderately_familiar的semiparametric theory允许您评估其效率推导并尝试扩展至proximal CI或纵向数据。整体而言，立即可做：您能用现有武器库中的因果推断估计理论深入阅读本文，并可能实现代码或提出后续扩展。

3. 10.1093/biomet/asad008 · arXiv — Ancestor regression in linear structural equation models¶

作者: C Schultheiss, P Bühlmann
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 1117-1124
相关性 8/10 · novelty: new_method
摘要: 本文针对线性结构方程模型提出一种新的因果发现方法——祖先回归。该方法通过线性模型中的统计检验来区分任意给定变量的祖先与非祖先节点，核心机制是检验回归系数与条件独立关系。与PC算法等方法不同，祖先回归即使在不可识别的高斯设定下也能提供渐近有效的Type I error控制，但以降低统计功效为代价。文中还构造了一个渐近有效的拟合优度p值，用于检验多变量数据是否来自线性SEM。理论贡献在于将假设检验框架引入因果结构学习，并给出名义错误控制的显式保证。该工作直接连接您对因果推断中可识别性与假设检验的兴趣，尤其适合评估线性因果结构学习中推断的可靠性。
关键技术: Ancestor regression, Linear structural equation models, Hypothesis testing for causal discovery, Type I error control, Goodness-of-fit p-value
为什么对您有用: 本文聚焦线性结构方程模型中的因果结构学习，属于您主要兴趣中的因果推断子方向。您非常熟悉的“estimation theory in causal inference”可直接用于评估该方法的检验性质，例如在高维或弱工具变量场景下的稳健性。基于目前武器库，可立即可做：利用假设检验知识批判性分析其Type I error控制与功效的取舍，并尝试扩展至更一般的半参数模型。

4. 10.1093/biomet/asad005 — An instrumental variable method for point processes: generalized Wald estimation based on deconvolution¶

作者: Zhichao Jiang, Shizhe Chen, Peng Ding
期刊/来源: Biometrika
机构: Sun Yat-sen University · University of California, Davis · University of California, Berkeley
分类: vol 110 · issue 4 · pp 989-1008
相关性 8/10 · novelty: new_method
摘要: 在未观测混杂下，本文研究点过程（point process）治疗与结局的因果效应识别与估计问题，目标 estimand 为基于潜在结局定义的因果参数，关键假设为二值工具变量（IV）及点过程的平稳性与独立性。核心机制是将经典 Wald 估计推广至点过程框架：先对意图治疗效应（ITT）在治疗与结局上做 Fourier 变换，再在频域上执行除法运算，从而将时域上的因果效应估计转化为去卷积（deconvolution）问题，称为 generalized Wald estimation。估计策略直接借用成熟的去卷积方法（如频域截断或核平滑），在点过程模型设定下获得参数的非参数识别与一致估计。主要理论贡献是给出了点过程因果效应的非参数识别公式及去卷积估计的收敛框架。对您有用：本文将 IV-Wald 估计从经典实值变量拓展至点过程，其 Fourier 域去卷积视角为 longitudinal/事件时间数据的 IV 方法提供了新切入点。
关键技术: instrumental variable, Wald estimation, deconvolution, Fourier transform, point process, potential outcomes
为什么对您有用: 本文直接连接到 primary interest 中因果推断的 IV 估计子方向，将经典 Wald 估计拓展至点过程治疗/结局，填补了事件数据 IV 方法的空白。从 technical_arsenal 看，识别理论部分可用您 moderately_familiar 的 identification theory in causal inference 直接切入；估计部分的去卷积技术涉及频域截断与核平滑，属于 nonparametric statistics 的经典反问题，您 very_familiar 的 inverse problems with random noise 可直接攻其收敛率分析。Follow-up 判断：立即可做——用您熟悉的 nonparametric minimax 理论可立即审视其去卷积估计是否达到最优收敛率，或探讨更复杂 IV 设定（如连续 IV）下的识别与估计。

5. 10.1093/biomet/asad020 · arXiv — Targeted optimal treatment regime learning using summary statistics¶

作者: J Chu, W Lu, S Yang
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 913-931
相关性 7/10 · novelty: new_method
摘要: 在源人群与目标人群存在异质性、且仅可获得目标人群协变量汇总统计量（如矩信息）的设定下，本文研究面向目标人群的最优治疗规则（OTR）学习问题，目标 estimand 为目标人群的 value function。核心方法提出一个校准的增广逆概率加权（calibrated AIPW）估计量，通过利用汇总统计量构建校准权重来调整人群分布差异，并在预指定规则类内最大化该估计量以学习 OTR。在半/非参数 nuisance 函数估计下，该估计量具有一致性与渐近正态性，且 value 估计量的方差可被一致估计，实现了类似 cross-fitting / doubly robust 的保护。对您可能有用：该文在 transportability / generalizability 框架下仅依赖汇总统计量的 AIPW 构造与渐近理论，直接连接到因果推断的 identification 与 semiparametric efficiency 理论。
关键技术: calibrated AIPW estimator, optimal treatment regime learning, transportability with summary statistics, doubly robust estimation, semiparametric nuisance estimation, value function asymptotic normality
为什么对您有用: 本文直接连接到因果推断的 transportability / generalizability 子方向，处理仅依赖汇总统计量（矩信息）的 identification 与 estimation 问题。研究者武器库中 semiparametric theory 与 identification theory in causal inference（moderately_familiar）可直接切入该文 AIPW 估计量的 influence function 推导与效率界分析。中期可做：需先在 moderately_familiar 的 semiparametric theory 上长肌肉，推导仅依赖汇总统计量时 value function 的 semiparametric efficiency bound，验证该 calibrated AIPW 是否达到该界。

6. 10.1093/biomet/asad016 · arXiv — Soft calibration for selection bias problems under mixed-effects models¶

作者: Chenyin Gao, Shu Yang, Jae Kwang Kim
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 897-911
相关性 7/10 · novelty: new_method
摘要: 该文针对非概率样本、缺失数据或因果推断中的选择偏差问题，提出一种软校准（soft calibration）方案。传统硬校准在协变量维数高时易产生极端权重，而软校准假设结果变量和选择指示变量服从混合效应模型：对固定效应施加精确校准，对随机效应施加近似校准。软校准估计量与最佳线性无偏预测（BLUP）有内在联系，从而比硬校准具有更高的估计效率；同时，该方法可被解释为一种惩罚倾向得分权重估计，其中惩罚项来源于混合效应模型的结构。作者推导了软校准估计量的渐近分布和相合方差估计。通过模拟研究和BMI筛查对儿童肥胖影响的真实数据分析，展示了该方法相比已有竞争方法的优势。对您而言，该文直接关联您主要兴趣中的因果推断估计方法，特别是选择偏差的校准技术；文中利用混合效应结构校准的思路，可望迁移至更复杂的纵向或工具变量设定中的灵敏度分析，而您对因果推断估计理论的熟悉程度足以立即动手探索这类扩展。
关键技术: calibration weighting, mixed-effects models, best linear unbiased prediction (BLUP), penalized propensity score weighting, asymptotic distribution, variance estimation
为什么对您有用: 本文主题属于您主要兴趣中的因果推断估计（selection bias/calibration），直接对接您在因果推断理论方面的技术储备。您武器库中的“estimation theory in causal inference”可以帮助快速理解软校准的渐近性质，并进一步将其推广至近端因果推断或工具变量框架下的类似问题。结合您对非参统计的熟悉程度，立即可对该方法的效率界进行半参数敏感性分析。

7. 10.1093/biomet/asad013 · arXiv — A robust fusion-extraction procedure with summary statistics in the presence of biased sources¶

作者: Ruoyu Wang, Qihua Wang, Wang Miao
期刊/来源: Biometrika
机构: Chinese Academy of Sciences · Academy of Mathematics and Systems Science
分类: vol 110 · issue 4 · pp 1023-1040
相关性 6/10 · novelty: new_method
摘要: 针对多个数据源汇总信息中可能存在的有偏源，提出一种鲁棒融合-提取方法。该方法无需预先知道哪些源是无偏的，仅依赖各源的汇总统计量（如点估计和标准误）即可实现一致估计。估计量具有相合性和渐近正态性，且渐近等价于仅使用无偏源的Oracle估计量。当数据源数量和参数维度随样本量发散时，理论性质依然成立。该方法还能以趋于1的概率一致选择出无偏数据源，从而自动规避有偏源。应用场景包括元分析（如牙周病治疗评估）和孟德尔随机化（如头颈癌风险因素研究），后者直接对应工具变量因果推断。对于您的因果推断兴趣，该方法的自动偏差检测和稳健融合机制可为敏感性分析或IV荟萃分析提供新工具。
关键技术: robust data fusion, summary statistics, biased source detection, meta-analysis, Mendelian randomization, oracle equivalence
为什么对您有用: 该方法直接应用于孟德尔随机化（IV）和元分析的汇总数据融合，与您的因果推断（IV、敏感性分析）、流行病学应用兴趣高度吻合。您熟悉的高维渐近和非参数理论可用于分析其当参数维度发散时的性质（立即可做），而方法中的无偏源选择策略也可借助您对M估计和筛选理论的理解进一步优化。总体而言，这是一篇可立即转入深入阅读的方法论文，其理论框架易于用您的武器库进行延伸。

非参数 / 半参数 (nonparam_semipara, 5 篇)¶

1. 10.1093/biomet/asad017 · arXiv — Semiparametric counterfactual density estimation¶

作者: E H Kennedy, S Balakrishnan, L A Wasserman
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 875-896
相关性 9/10 · novelty: new_theory
摘要: 在非参数因果推断设定下，本文研究反事实密度及泛函（密度逼近与密度间距离）的估计问题，目标 estimand 包括 L2 投影与 KL 投影下的密度泛函。核心机制是证明非参数效率界与特定反事实均值估计问题的等价性，从而将密度估计与均值估计的理论打通；在此基础上提出 doubly robust-style 估计量，通过 cross-fitting 在大非参数模型下达到 n^{-1/2}-CAN 及 semiparametric efficiency bound。模型选择与聚合方法亦被给出，保证在多模型候选下的最优效率。实证部分用 HIV 患者 CD4 计数数据展示反事实密度及密度效应的估计。对您可能有用：本文将密度泛函的效率界转化为均值估计问题，直接连接到 semiparametric efficiency 与 causal inference 的交叉点。
关键技术: semiparametric efficiency bound, doubly robust estimation, counterfactual density estimation, cross-fitting, L2 / KL density projection, influence function
为什么对您有用: 本文直接连接到 primary interest 中的 semiparametric efficiency theory 与 causal inference estimation：它给出了反事实密度泛函的效率界，并将其等价于均值估计的效率界，这是对 semiparametric theory 在因果分布推断中的系统性推进。用您 very_familiar 的 minimax bounds 与 estimation theory in causal inference 可以直接审视其效率界是否紧、DR 估计量是否达到最优率。Follow-up 判断：立即可做——用 very_familiar 的非参数效率理论工具即可复现其界并探索更泛化的泛函类（如高阶矩泛函）的效率界。

2. 10.1093/biomet/asad018 — √2-estimation for smooth eigenvectors of matrix-valued functions¶

作者: Giovanni Motta, Wei Biao Wu, Mohsen Pourahmadi
期刊/来源: Biometrika
机构: Texas A&M University · University of Chicago
分类: vol 110 · issue 4 · pp 1077-1098
相关性 7/10 · novelty: new_method
摘要: 在局部平稳或时变协方差/谱密度矩阵的设定下，目标是恢复随时间或频率平滑变化的 eigenvector 函数，核心困难是 eigenvector 符号与排序的 indeterminacy 导致估计轨迹不连续。作者提出 √2-estimation：比较相邻两点 eigenvector 的距离，若大于 √2 则翻转符号；对 coalescing eigenvalues 则额外匹配与局部 signing。在 eigenvalue gap 非零时，该方法恢复的 smooth eigenvector estimator 达到 n^{-1/2}-consistency；在 coalescing 点附近通过匹配也保持连续性并给出收敛速率。模拟与真实多元时间序列数据验证了方法必要性。对您可能有用：该文处理的高维矩阵函数 eigendecomposition 与 RMT 及高维渐近理论紧密相关，其 eigenvector 连续性修正策略可迁移至高维协方差估计的 inference 场景。
关键技术: time-varying covariance matrix, eigenvector sign correction, coalescing eigenvalues matching, local stationarity, n^{-1/2}-consistency, spectral density matrix estimation
为什么对您有用: 本文连接到高维统计与 RMT 中 eigenvector estimation 的子方向：时变协方差矩阵的 eigendecomposition 是高维渐近分析的基础构件，而 eigenvector indeterminacy 是实际计算与 inference 中常被忽视的痛点。您武器库中 high-dimensional asymptotics 与 minimax bounds 可直接用于验证该文声称的收敛速率是否紧，或推广至高维 p>n 设定下 eigenvector sign-flipping 的理论分析。立即可做：用 very_familiar 的高维渐近工具检查其 n^{-1/2}-rate 在 p 固定设定下的 minimax optimality。

3. 10.1093/biomet/asad012 — Nonparametric estimation of the intensity function of a spatial point process on a Riemannian manifold¶

作者: S Ward, H S Battey, E A K Cohen
期刊/来源: Biometrika
机构: Imperial College London
分类: vol 110 · issue 4 · pp 1009-1021
相关性 5/10 · novelty: new_theory
摘要: 本文研究 Riemannian 流形上空间点过程强度函数的非参数估计，目标 estimand 为强度函数 λ(s)，核心假设为 Poisson 过程及流形上的光滑性条件。作者提出基于流形上核函数的估计器，并给出其一阶渐近分析（偏差-方差分解与逐点收敛速率）。数值实验表明，允许带宽随局部曲率自适应调整可在有限样本下显著改善估计精度，且在其他生成机制下也表现稳健。对您可能有用：本文将经典非参数密度估计推广至流形几何，其偏差-方差分析与 minimax 理论框架直接对接您的 nonparametric statistics 武器库。
关键技术: kernel estimation on Riemannian manifold, first-order asymptotic analysis, curvature-adaptive bandwidth, Poisson point process intensity, bias-variance decomposition
为什么对您有用: 本文直接连接到 primary interest 中的 nonparametric statistics 与 minimax bounds：流形上的核估计偏差-方差分解是经典非参数理论的几何推广，您可用 very_familiar 的 minimax 理论验证其逐点收敛速率是否达到局部 minimax 下界。立即可做：用 minimax bound 工具分析该估计器的全局收敛速率是否紧，并探讨曲率自适应带宽下的最优性。

4. 10.1093/biomet/asad014 · arXiv — Equivariant estimation of Fréchet means¶

作者: A McCormack, P D Hoff
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 1055-1076
相关性 4/10 · novelty: new_theory
摘要: 本文研究 Riemannian 流形上 Fréchet 均值的等变估计问题，estimand 为流形上的总体 Fréchet 均值，设定为参数模型且流形具有等距群（isometry group）对称结构。核心机制是利用等距群的对称性定义等变估计量，并在群作用使得参数空间轨道结构满足特定条件时，推导出最小风险等变估计量（MRE）的一般形式；对具有径向递减密度的分布，给出了 Fréchet 均值的显式表达及 MRE 的具体公式。当等距群相对于参数族不够大、MRE 不存在时，提出自适应等变估计量，通过数据选择子模型以恢复 MRE 的存在性。模拟显示自适应估计量优于 MLE 和样本 Fréchet 均值。对您可能有用：该工作将经典等变估计理论拓展至非欧空间，为流形数据的低维/非参数估计提供了新的最优性视角。
关键技术: Frechet mean on Riemannian manifolds, isometry group equivariance, minimum risk equivariant estimator (MRE), radially decreasing density, adaptive equivariant estimation
为什么对您有用: 本文连接到非参数/半参数理论中流形数据的估计最优性问题，具体涉及 Riemannian 流形上的等变估计与 MRE 理论。研究者武器库中 minimax bounds for estimation problems 可直接用于审视该 MRE 在流形设定下的风险界是否达到 minimax 下界，或探讨等距群对称性如何改变 minimax rate。立即可做：用 very_familiar 的 minimax 理论工具分析该等变估计量的 minimax 性质，或将其与半参数效率界做对比。

5. 10.1093/biomet/asad006 — A subsampling perspective for extending the validity of state-of-the-art bootstraps in the frequency domain¶

作者: Haihan Yu, Mark S Kaiser, Daniel J Nordman
期刊/来源: Biometrika
机构: Iowa State University
分类: vol 110 · issue 4 · pp 1099-1115
相关性 3/10 · novelty: weaker_assumption
摘要: 在频域谱均值统计量的 bootstrap 推断设定下，目标是解决过去 25 年频域 bootstrap 仅在特定线性过程或 ratio 统计量下有效、无法一般性捕捉极限方差的问题。本文引入 subsampling 作为一种新重抽样形式，在比任何现有频域 bootstrap 更弱的条件下实现方差估计的一致性；无需常见的 mixing 假设，仅需谱均值统计量本身存在分布极限的同等条件即可成立。核心机制是将 subsampling 与当前最先进的频域 bootstrap（如 sieve / periodogram-based bootstrap）非平凡地链接，从而将后者所需的矩和 block 假设削减过半，使其假设要求降至与目标极限分布存在性等价。此外，文章填补了时间序列 subsampling 在频域统计量分布逼近（而非仅方差估计）上的理论空白。对您可能有用：若未来在 longitudinal causal inference 或 semiparametric efficiency 的推断中遇到依赖谱结构的复杂估计量，此 subsampling 链接思路可提供更弱假设下的方差/分布逼近路径。
关键技术: subsampling, frequency domain bootstrap, spectral mean statistics, distributional limits under weak conditions, variance estimation consistency, time series resampling
为什么对您有用: 本文直接连接 nonparametric / semiparametric theory 中的弱假设推断问题，将频域 bootstrap 的有效性条件降至与极限分布存在性等价，这对依赖谱结构或 mixing 条件的 semiparametric 估计量推断有方法论启发。研究者武器库中 very_familiar 的 minimax bounds 与 nonparametric statistics 可直接审视本文声称的更弱条件是否真正紧；moderately_familiar 的 M-estimation theory 可用于评估 subsampling 链接机制在更一般 semiparametric M-estimator 上的推广潜力。立即可做：用 very_familiar 的 minimax 视角验证其弱假设界是否紧，并思考 subsampling 链接思路在 longitudinal causal inference 的 debiased estimator 方差估计中的迁移。

效率理论 / Debiased ML (efficiency_dml, 1 篇)¶

1. 10.1093/biomet/asad007 · arXiv — Efficient estimation under data fusion¶

作者: Sijia Li, Alex Luedtke
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 1041-1054
相关性 9/10 · novelty: new_theory
摘要: 在多源数据融合设定下，本文研究有限维光滑参数的半参数有效估计，其中各数据源分别对齐目标分布的不同组成部分（如条件分布或边际分布）。核心贡献是刻画了融合多源数据所带来的效率增益，具体表现为半参数效率界的降低，并给出了达到该效率界的一般性估计量构造方法。估计量基于 one-step 修正与 efficient influence function，利用各数据源的似然贡献进行正交化设计。数值模拟与 HIV 疫苗试验实证显示，所提估计量相较于自然替代方案有显著的效率提升。对您有用：本文直接推进了半参数效率界与 debiased/one-step 估计理论在数据融合因果推断中的应用。
关键技术: semiparametric efficiency bound, one-step estimation, efficient influence function, data fusion identification, orthogonal score construction
为什么对您有用: 本文直接连接 primary interest 中的 efficiency theory（半参数效率界刻画与达到）与 causal inference 的多源数据设定。您 very_familiar 的 estimation theory in causal inference 与 moderately_familiar 的 semiparametric theory 完全足以攻入本文的 influence function 求导与 one-step 估计量构造。Follow-up 判断：立即可做——可用您熟悉的 semiparametric efficiency 工具验证其 bound 在特定 fusion 结构下是否紧，或拓展至 longitudinal / proximal CI 的多源融合场景。

数理统计 / 假设检验 (hypothesis_testing, 1 篇)¶

1. 10.1093/biomet/asad009 · arXiv — Sampling distribution for single-regression Granger causality estimators¶

作者: A J Gutknecht, L Barnett
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 933-952
相关性 3/10 · novelty: new_theory
摘要: 本文针对单回归Granger因果估计量（single-regression Granger causality estimator）的抽样分布进行了理论推导。此前该估计量的分布未知，本文证明在Granger因果为零的原假设下，该估计量收敛到广义χ²分布，并且可以用Γ分布进行良好近似。作者进一步将结果推广到Geweke谱因果在给定频带上的平均值，并给出了广义χ²和Γ近似的显式参数表达式。基于该分布，提出了Neyman-Pearson检验方法，并讨论了在实际场景中的应用。论文还简要说明了如何将分析扩展到条件Granger因果、点频率谱因果以及状态空间Granger因果等重要情形。这一结果填补了Granger因果推断中关键估计量分布理论的空白，为时间序列因果假设检验提供了严格的统计基础。对于您而言，该工作直接关联到您对假设检验（hypothesis testing）和因果推断（causal inference）的兴趣，尤其是其中的渐近分布理论可类比于U统计量的广义χ²分布结果。
关键技术: generalized χ² distribution, Γ approximation, Neyman-Pearson test, spectral Granger causality, single-regression estimator
为什么对您有用: 本文深入分析了Granger因果估计量的抽样分布，这是时间序列因果推断中的基础假设检验问题，直接对应您对hypothesis testing和causal inference的兴趣。您可以用very_familiar中的非参数统计和高维渐近工具来评估其Γ近似的精度，或从higher-order U-statistics的视角（广义χ²分布与U统计量谱的联系）理解其分布结构。该论文成果可在理解后直接应用于时间序列因果检验的实证分析（立即可做）。

统计计算 / 算法 (stat_computing, 1 篇)¶

1. 10.1093/biomet/asad010 · arXiv — Statistical inference for streamed longitudinal data¶

作者: Lan Luo, Jingshen Wang, Emily C Hector
期刊/来源: Biometrika
分类: vol 110 · issue 4 · pp 841-858
相关性 5/10 · novelty: new_method
摘要: 本文针对流式纵向数据（如可穿戴设备），参与者固定而时间点发散，传统全量重分析方法计算负担大的问题，提出了一种动态更新点估计和标准误的推断框架。核心方法是将基于纵向数据的二次推断函数（QIF）的扩展推断函数向量分解为数据批次的汇总统计量之和，从而实现递归更新，无需访问全部历史数据。该框架保持了QIF的统计效率优势，同时大幅降低了计算成本。作者证明了当数据批次数发散时，流式估计量具有相合性和渐近正态性，即使独立参与者数固定。模拟实验表明该方法优于假设批次间独立的传统流式方法。最后应用于NHANES加速计数据，分析体力活动与疾病的关系，展示了实用性。对您而言，该方法可直接迁移到因果推断中纵向队列数据的在线处理（如在线更新治疗效应估计量），属于统计计算与纵向数据分析的交叉方向。
关键技术: Streaming estimation, Quadratic inference function (QIF), Recursive updating, Estimating equations, Longitudinal data, Block-wise decomposition
为什么对您有用: 本文主题是流式纵向数据的统计推断，直接关联到研究者在统计计算和纵向数据分析方面的兴趣，并可延伸至因果推断中的在线估计问题。利用您对因果推断估计理论的熟悉（very_familiar中的estimation theory in causal inference），可以立即将流式更新思路应用于在线DR-ATE估计等变体——立即可做。若希望深入理解QIF的渐近理论，则需先提升M-estimation理论（moderately_familiar），属于中期可做方向。

Maintained by 陈星宇 · Homepage · Source on GitHub