跨篇综合 · 非参数 / 半参数¶
子方向: 非参数 / 半参数
期刊范围: core
聚合期刊论文数: 7
生成日期: 2026-06-02
本页由跨篇综合自动生成:从近期期刊精读里归纳反复出现的开放问题、张力与迁移空位。不打分、不排名,每条点名来源论文 [k],供你自己判断。
一、这个子方向的全景¶
这批论文共同追问:在高维、逆问题或流式等复杂设定下,非参数/半参数泛函(如导数、条件期望特征、分布函数值、逆密度加权期望)能否实现根号n速率的可靠推断(置信区间/带)?主流路线有三条:①去偏/投影校正([1]乘性权重去偏、[5]先验+投影逆映射、[6]Voronoi分段多项式无调参拟合);②极小极大下界与风险刻画([2]凸对偶统一下界、[4]特征值衰减揭示SIR困境、[6]Fano下界定光滑性门槛);③强近似与在线/bootstrap推断([3]RKHS-SGD的sup-norm高斯逼近、[7]近似鞅的三阶Gaussian mixture耦合)。整体停在:泛函推断的“根号n-CAN”上界已有多种构造,但下界紧性、半参效率界可达性、以及高阶偏差校正(HOIF)对有限样本推断的实质性改进,均处于刚被提出但未闭环的阶段。
二、反复出现的开放问题¶
① 半参效率界是否可达? 需证/估:现有根号n一致估计量(如DLL、Voronoi匹配)的渐近方差是否达到半参效率下界。点名:[1](明确future work要推导DLL效率界并据此改进)、[6](明确future work要推导逆密度加权期望的效率界并比较Voronoi估计量方差)。卡在:去偏/无调参构造虽消除了高维nuisance偏差,但方差结构是否最优缺乏理论闭环。 ② 高阶偏差校正(HOIF)能否实质性改善弱信号/有限样本推断? 需证/算:用k阶U-统计量或三阶矩匹配替代一阶/二阶近似,能否在弱特征值(λ_d极小)或非参数局部多项式推断中收紧置信区间/降低风险对弱信号的依赖。点名:[4](提出用k阶U-统计量估计Cov[E(X|Y)]以降低对λ_d依赖)、[7](提出三阶耦合与HOIF结合改进debiased ML分布近似)、[1](迁移线索指出二阶导数推断需双核加权去偏接高阶U-统计量理论)。卡在:高阶项的degeneracy处理与计算复杂度(O(m^2)协方差)缺乏系统工具。 ③ 多点/高维/同时推断的可行性及协方差结构计算。 需估/算:从单点x_0边际推断扩展到多点联合置信带或高维可加泛函时,如何控制FWER/FDR及计算估计量协方差。点名:[1](开放问题:多重推断控制FWER/FDR;future work:平均导数泛函需算多网格点协方差)、[5](future work:多点联合推断推导协方差结构)、[3](开放问题:高维下sup-norm bootstrap是否一致)。卡在:多点泛函的协方差计算面临高阶U-统计量或非独立经验过程的组合爆炸。 ④ minimax下界的紧性(匹配上界)缺失。 需证:现有下界构造(SIR风险、逆密度加权期望光滑性门槛、Wicksell逆问题速率)是否存在匹配的可达估计量。点名:[4](承认仅证下界未提供上界)、[6](下界假设类与上界一致但未证完全无光滑性密度下的紧性)、[5](future work要补全minimax速率下界证明)。卡在:下界构造依赖特定先验/假设类(如GP先验、紧支集),上界估计量难以在同等约束下达到同等速率。
三、张力 / 矛盾¶
① 对协变量/ nuisance分布光滑性要求的根本分歧。 [6]宣称对协变量密度“无需任何光滑性”(仅需inf f>0)即可达根号n,而[1]要求nuisance协变量能被稀疏非线性函数逼近(强非线性依赖致权重不稳定),[4]与[5]则依赖GP先验或Hölder指数(γ>1/2)控制偏差。这反映了“免光滑性调参”与“用光滑性控制高维偏差”两条路线在假设上的直接冲突,调和点可能在:密度无光滑性时,nuisance函数的光滑性或稀疏性是否足以保根号n。 ② SIR失效原因的模型设定冲突。 [4]将链接函数f视为GP先验导出特征值指数衰减(λ_d~e^{-θd}),解释SIR失效;而经典SIR理论(Li 1991)依赖线性条件均值(LCE)无特征值衰减分析。GP先验与LCE在本质上是冲突的假设,这意味着SIR困境的数学解释目前绑定在贝叶斯先验上,频率学派LCE设定下是否必然存在同等衰减尚未定论。 ③ 分布近似阶数的收益与条件矛盾。 [7]宣称三阶Gaussian mixture耦合比二阶获得更紧近似(误差降至n^{-3/2}量级),但承认这依赖特定三阶矩结构匹配,且DML的cross-fitting破坏鞅结构致三阶无法直接应用;而[3]的SGD推断仅用二阶展开。三阶改进的“必要条件”与“实际可用设定(如DML)”之间存在错配,构成方法推广的张力。
四、迁移空位(接研究者武器库)¶
① 空位:多点泛函/平均导数推断的协方差计算爆炸。 [1]要算多网格点DLL估计量的协方差以构造平均导数置信区间,[5]要算多点IIP联合后验协方差。武器:高阶U-统计量计算(einsum/tensor contraction优化Hoeffding分解)。第一步:将[1]中多网格点DLL估计量写成二阶U-统计量形式,用einsum推导其treewidth,将协方差计算从O(m^2)降至线性。 ② 空位:SIR及半参数估计中弱信号特征值(λ_d)依赖的高阶校正。 [4]提出用k阶U-统计量替代切片平均估计Cov[E(X|Y)]以校正高阶bias并降低对λ_d依赖,但未实施。武器:高阶U-统计量渐近理论(degeneracy处理)与半参数HOIF。第一步:在[4]的SIR设定中,将条件协方差估计量构造为三阶U-统计量,计算其degeneracy阶数与渐近方差对λ_d的依赖幂次,对比切片平均的一阶依赖。 ③ 空位:非参数局部多项式/逆问题泛函的minimax下界刻画。 [5]需补Wicksell问题minimax速率下界,[6]需验证光滑性门槛下界在更广假设类的紧性。武器:minimax下界(Le Cam两点法/凸对偶/Fano)。第一步:用[2]的凸对偶框架(将两点下界对偶化为估计器风险上界),对[5]中Wicksell逆问题的分布函数泛函构造modulus of continuity,去掉Hölder假设直接证下界紧性。 ④ 空位:DML/cross-fitting破坏鞅结构下的高阶分布近似。 [7]指出三阶耦合无法直接用于DML估计量(非鞅),[1]的去偏估计量也面临nuisance估计误差的非鞅残差。武器:高阶U-统计量理论(退化U-统计量的正交分解)与近似鞅耦合。第一步:将[1]的DLL估计量或典型DML估计量分解为精确鞅+高阶退化U-统计量残差,套用[7]的近似鞅三阶耦合框架,推导Gaussian mixture近似的误差界。
本页聚合的论文¶
- [1] Decorrelated Local Linear Estimator: Inference for Non-linear Effects in High-dimensional Additive Models — JMLR (2026-05-26)
- [2] Dualizing Le Cam’s method for functional estimation I: General theory — Annals of Statistics (2026-05-26)
- [3] Scalable inference for nonparametric stochastic approximation in reproducing kernel Hilbert spaces — Annals of Statistics (2026-05-26)
- [4] On the structural dimension of sliced inverse regression — Annals of Statistics (2026-05-26)
- [5] Semiparametric Bernstein–von Mises phenomenon via Isotonized Posterior in Wicksell’s problem — Annals of Statistics (2026-05-26)
- [6] Multivariate root-n-consistent smoothing parameter-free matching estimators and estimators of inverse density weighted expectations — Annals of Statistics (2026-05-26)
- [7] Yurinskii’s coupling for martingales — Annals of Statistics (2026-05-26)
Maintained by 陈星宇 · Homepage · Source