Near-optimal inference in adaptive linear regression¶

作者: Koulik Khamaru, Yash Deshpande, Tor Lattimore, Lester Mackey, Martin J. Wainwright
来源: Annals of Statistics
主题: 效率理论 / Debiased ML
相关性: 9/10
链接: https://doi.org/10.1214/24-aos2450

核心问题与动机¶

本文解决的是自适应数据收集下的线性回归推断问题。在自适应实验（如多臂老虎机、主动学习）中，协变量的选择依赖于历史数据，这破坏了经典回归中样本独立同分布或外生性的假设。这种依赖性导致即使是最简单的普通最小二乘法（OLS）估计量也会呈现非正态的渐近行为，从而使得基于渐近正态性的假设检验和置信区间失效。已有方法通常假设数据是固定设计或独立同分布的，无法处理自适应机制引入的分布畸变。

主要贡献¶

提出了一类在线去偏估计器，专门用于修正自适应数据收集下最小二乘估计的分布异常。
证明了该估计器在温和的自适应条件下具有渐近正态性，并据此构建了渐近精确的置信区间。
建立了自适应线性回归问题的极小极大下界，为评估估计器性能提供了基准。
证明了在多种自适应收集条件下，所提在线去偏估计器能够达到极小极大下界，即具备近最优性。

方法框架¶

模型设定：线性回归 $y_t = \langle x_t, \theta^* \rangle + \epsilon_t$，其中 $x_t$ 是基于历史信息 $\mathcal{H}{t-1} = {x_i, y_i}{i=1}^{t-1}$ 自适应选择的协变量，$\epsilon_t$ 为鞅差序列。
关键假设：
有界条件方差：自适应策略下的条件协方差矩阵 $\Sigma_t = \mathbb{E}[x_t x_t^\top | \mathcal{H}_{t-1}]$ 行为良好。
最小特征值增长：累积设计矩阵 $\sum_{t=1}^n x_t x_t^\top$ 的最小特征值需以足够快的速率增长，以保证参数的可识别性。
方法步骤：
计算 OLS 估计量 $\hat{\theta}_n$。
构造在线去偏修正项：利用数据集的协方差结构（特别是条件协方差 $\Sigma_t$ 的累积），对 OLS 估计量进行方向性缩放，使得在信息积累较多的方向上修正力度更精准。
在线去偏估计量形式大致为：$\tilde{\theta}n = \hat{\theta}_n + \text{Correction}(\hat{\theta}_n, {x_t, y_t}{t=1}^n)$，其构造依赖于对自适应协方差逆的在线近似。

主要理论结果¶

渐近正态性：在温和的正则化条件下，在线去偏估计量满足 $\sqrt{n}(\tilde{\theta}_n - \theta^) \xrightarrow{d} \mathcal{N}(0, \Sigma^)$，其中 $\Sigma^*$ 依赖于自适应策略的极限协方差结构，从而支持有效的假设检验。
极小极大下界：证明了在自适应线性回归设定下，任何估计量的均方误差（或推断宽度）受限于一个由自适应机制信息结构决定的极小极大下界。
近最优性：在特定自适应条件（如条件协方差矩阵收敛）下，在线去偏估计量的方差达到极小极大下界，证明其统计效率是最优的。

实验 / 数值仿真¶

实验设计：在三种典型的自适应场景下进行仿真：多臂老虎机、自回归时间序列估计、带探索的主动学习。
评估指标：置信区间的覆盖率与平均宽度。
主要发现：传统基于 OLS 的正态近似置信区间在自适应设定下覆盖率严重不足；而本文的在线去偏估计器能够实现标称水平的覆盖率，且区间宽度更窄，验证了理论中“在信息积累多的方向上估计更锐利”的论断。

与研究者兴趣的关联¶

效率理论与去偏机器学习：本文是 Debiased ML/效率理论在非独立同分布（自适应/序贯）设定下的直接推进，提供了极小极大下界和达到该下界的渐近有效估计。
因果推断：自适应数据收集（如序贯实验、bandit 算法）是当前因果推断中处理动态治疗分配的前沿场景，本文的在线去偏方法可直接用于自适应情境下的平均处理效应（ATE）推断。
假设检验：解决了自适应设计下检验统计量非正态的痛点，为序贯假设检验提供了新的渐近有效工具。

局限性与开放问题¶

高维扩展：当前理论主要针对低维线性回归（$p \ll n$），如何将在线去偏与高维正则化（如 Lasso）结合，处理 $p \gg n$ 的自适应高维回归是一个重要的开放问题。
半参数/非参数扩展：模型限于线性回归，对于自适应数据收集下的半参数模型（如部分线性模型）或非参数推断，在线去偏的构造及效率界仍待探索。
更一般的自适应机制：理论依赖于对条件协方差 $\Sigma_t$ 的某些收敛或正则性假设，对于极端非平稳或高度非线性的自适应策略，下界与去偏方法的有效性仍是开放问题。

Maintained by 陈星宇 · Homepage · Source on GitHub