跳转至

Functional linear regression for discretely observed data: from ideal to reality

作者: Hang Zhou, Fang Yao, Huiming Zhang
来源: Biometrika
主题: 非参数 / 半参数
相关性: 5/10
机构绿灯: Peking University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/biomet/asac053


一、领域脉络与小综述

这个方向是什么: 函数线性回归是函数数据分析(FDA)的经典子方向,其根本统计问题是:当协变量 \(X\) 是一个随机函数(即无穷维对象)而响应 \(Y\) 是实值标量时,如何在 \(Y = \alpha + \int X(t)\beta(t)dt + \epsilon\) 的模型下估计斜率函数 \(\beta\) 并做出预测。由于 \(\beta\) 本身也是无穷维的,必须施加光滑度假设以使问题可估。当前该方向的成熟度极高:在协变量轨迹 \(X(t)\)全观测(连续、无测量误差)的理想设定下,基于主成分分析(FPCA)的估计量及其 minimax 收敛率、相变现象已被彻底刻画。然而,现实数据中 \(X(t)\) 只能在离散、带噪的时间点上被观测,这导致理想理论中的核心工具(特征函数的尖锐扰动界)失效,形成了一道根本鸿沟。本文旨在跨越这道鸿沟,在离散观测设定下重建斜率函数估计的最优收敛率与相变理论。

发展脉络: - 奠基工作(理想设定下的全观测理论):Cardot et al. (1999, 2003) 与 Hall & Horowitz (2007) 建立了全观测下基于 FPCA 的斜率函数估计框架。Hall & Horowitz (2007) 刻画了理想设定下的 minimax 收敛率与相变:当截断项数 \(K\) 随样本量 \(n\) 的选取越过某个阈值时,估计率从 \(O(n^{-2s/(2s+1)})\)(光滑度 \(s\) 主导的非参数率)相变为更慢的率(由特征值衰减主导)。作者在 intro 中明确指出,这些工作"rely on the assumption that the covariate functions are fully observed",留下了离散观测下的空白。 - 主要进展(离散观测下的协方差/均值估计):当 \(X(t)\) 仅在离散带噪点观测时,Zhang & Wang (2016) 与 Li & Hsing (2010) 发展了 pooling 方法(将所有个体的离散观测拼合)来估计均值函数与协方差函数,并刻画了它们的收敛率与相变。作者引用 Zhang & Wang (2016) 指出:对于均值和协方差,当每个个体的测量数 \(N_i\) 达到 \(n^{1/(2s+1)}\) 量级时即可达到最优率;但这不等于斜率函数估计的相变阈值。 - 当前 frontier(离散观测下的回归估计):在离散观测下做回归,此前有 Yao et al. (2005) 的 PACE 方法(用条件期望填补主成分得分),但作者指出其"requires a sharp perturbation bound for the estimated eigenfunctions",而这一 bound 在离散观测下尚未被建立。Cai & Yuan (2010) 从 minimax 角度研究了离散观测下的回归,但其模型假设协方差核已知,回避了特征函数估计的扰动问题。 - 本文的位置:本文填补了"离散观测下特征函数扰动界缺失"这一缺口,通过 pooling 估计特征函数 + sample-splitting 估计主成分得分 + 近似最小二乘估计 \(\beta\),首次在离散观测下推导出斜率函数估计与预测的 minimax 最优率,并发现了一个比协方差估计更严苛的相变阈值。

子线索聚类: 1. 全观测函数线性回归:Cardot et al. (1999, 2003), Hall & Horowitz (2007), Cai & Yuan (2010)。这一簇在 \(X(t)\) 连续可观测的假设下,建立 FPCA 估计框架与 minimax 理论,核心是特征函数扰动界 \(\|\hat{\phi}_k - \phi_k\| = O_p(n^{-1/2}(\lambda_k - \lambda_{k+1})^{-1})\)。 2. 离散观测下的 FPCA(均值/协方差估计):Zhang & Wang (2016), Li & Hsing (2010), Yao et al. (2005)。这一簇处理 \(X(t)\) 的离散带噪观测,用 pooling 或 PACE 方法估计均值与协方差核,并刻画了均值/协方差估计的相变,但未解决回归函数估计的相变与扰动界问题。 3. Minimax 理论与相变:Hall & Horowitz (2007), Cai & Yuan (2010, 2011)。这一簇从决策论角度刻画收敛率的下界与上界,揭示截断项数 \(K\) 的选取如何导致相变。

这个方向在追问的核心问题: 1. 离散观测下斜率函数估计的 minimax 最优率是什么? 已知全观测下的最优率,但离散观测下由于特征函数估计误差的介入,最优率是否改变? 2. 相变阈值是什么? 每个个体的测量数 \(N_i\) 需达到多少,才能使离散观测估计量达到与全观测相同的最优率?这个阈值是否与协方差估计的阈值不同? 3. 如何绕过特征函数扰动界缺失的技术障碍? 理想理论依赖 \(\|\hat{\phi}_k - \phi_k\|\) 的尖锐界,但离散观测下该界难以建立;如何设计估计策略以避开这一依赖?

⚠️ 作者的 framing: - 作者将缺口 frame 为"ideal estimation from fully observed covariate functions"与"reality that one can only observe functional covariates discretely with noise"之间的鸿沟,并将核心障碍定位为"sharp perturbation bound for the estimated eigenfunctions"的缺失。这使得本文的 pooling + sample-splitting 策略成为"显然的下一步":既然扰动界不可得,那就用 sample-splitting 让特征函数估计与主成分得分估计独立,从而在理论上绕开扰动界。 - 被淡化或回避的竞争路线:Cai & Yuan (2010) 在离散观测下给出了 minimax 界,但假设协方差核已知;作者在 intro 中未深入讨论"若假设协方差已知,相变阈值会否不同",这可能是一个被回避的对比维度。PACE 方法(Yao et al. 2005)被提及但被定性为依赖扰动界,作者未讨论 PACE 在实际中(尽管理论不严)是否表现良好。 - 明显该被引却未出现的:半参数效率理论中的 cross-fitting / debiased ML 文献(如 Chernozhukov et al. 2018)——本文的 sample-splitting 在结构上与 cross-fitting 高度相似(都是为消除 nuisance parameter 估计误差对目标参数的一阶影响),但 intro 未引用任何效率理论或 debiased ML 文献,可能是因为作者将问题纯粹 frame 为非参数 FDA 而非半参数理论。此外,高维统计中关于扰动界的技术文献(如 Kato 2009 on perturbation bounds for operators)也未出现,值得研究者去查。

张力: 未见明显对立引用。各被引工作在不同设定(全观测 vs 离散观测、协方差已知 vs 未知)下给出不同收敛率,这些率之间的差异是设定差异的反映,而非结论矛盾。但有一个隐含张力:Cai & Yuan (2010) 在协方差已知假设下得到的相变阈值,与本文在协方差需估计下得到的阈值,是否一致?作者声称本文的阈值更严苛,但未直接与 Cai & Yuan (2010) 的阈值做数值对比——这是一个值得研究者去核验的点。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • \(X(t)\):协变量函数,是一个定义在闭区间 \(\mathcal{T}\) 上的随机过程,均值为零(为简化假设,否则有均值函数 \(\mu(t)\)),协方差核为 \(C(s,t) = \mathbb{E}[X(s)X(t)]\)
  • \(Y\):实值标量响应变量。
  • \(\beta(t)\):斜率函数,是本文要估计的目标参数,属于无穷维对象。
  • \(\epsilon\):零均值、方差为 \(\sigma^2\) 的随机误差,与 \(X\) 独立。
  • 模型:函数线性回归模型 \(Y = \int_{\mathcal{T}} X(t)\beta(t)dt + \epsilon\)
  • \(\lambda_k, \phi_k(t)\):协方差核 \(C(s,t)\) 的第 \(k\) 个特征值与特征函数,按 \(\lambda_1 > \lambda_2 > \cdots > 0\) 排列,\(\int \phi_k \phi_l = \delta_{kl}\)
  • \(\xi_{ik}\):第 \(i\) 个个体的第 \(k\) 个主成分得分,\(\xi_{ik} = \int X_i(t)\phi_k(t)dt\),满足 \(\mathbb{E}[\xi_{ik}^2] = \lambda_k\)
  • \(\beta_k\):斜率函数 \(\beta\) 在第 \(k\) 个特征函数上的投影系数,\(\beta_k = \int \beta(t)\phi_k(t)dt\)
  • \(n\):样本量(个体数)。
  • \(N_i\):第 \(i\) 个个体的测量数(观测时间点数),假设 \(N_i \asymp N\)(同量级)。
  • \(T_{ij}\):第 \(i\) 个个体在第 \(j\) 个观测时间点,假设在 \(\mathcal{T}\) 上随机分布。
  • \(U_{ij}\):第 \(i\) 个个体在第 \(j\) 个时间点的测量误差,独立同分布,均值零、方差 \(\sigma_u^2\)
  • 可观测数据:研究者实际能观测到的是 \(\{(Y_i, \{(T_{ij}, \tilde{X}_{ij})\}_{j=1}^{N_i})\}_{i=1}^n\),其中 \(\tilde{X}_{ij} = X_i(T_{ij}) + U_{ij}\) 是带噪离散观测。想要但观测不到的是完整的协变量轨迹 \(X_i(t)\)、真实的主成分得分 \(\xi_{ik}\)、真实的特征函数 \(\phi_k(t)\) 与特征值 \(\lambda_k\)——这些只能通过离散带噪数据去估计。

第二步:最小内核——全观测特例下的 FPCA 估计与相变

整篇论文的技术本质是"全观测下 FPCA 回归估计"在离散观测下的推广,核心困难由离散观测引入。因此最小内核是全观测特例\(N_i = \infty\), \(U_{ij} = 0\)),在此特例下看清估计量结构与相变机制,再看离散观测如何打破它。

全观测特例下的估计量: 在全观测下,\(\xi_{ik} = \int X_i(t)\phi_k(t)dt\) 可直接计算。斜率函数 \(\beta\) 的 FPCA 估计为:

\[\hat{\beta}_K(t) = \sum_{k=1}^K \hat{\beta}_k \hat{\phi}_k(t), \quad \hat{\beta}_k = \frac{1}{n}\sum_{i=1}^n Y_i \hat{\xi}_{ik} / \hat{\lambda}_k\]
其中 \(\hat{\phi}_k, \hat{\lambda}_k\) 由样本协方差核 \(\hat{C}(s,t) = \frac{1}{n}\sum_{i=1}^n X_i(s)X_i(t)\) 的谱分解得到,\(\hat{\xi}_{ik} = \int X_i(t)\hat{\phi}_k(t)dt\)

全观测特例下的相变与 minimax 率(Hall & Horowitz 2007): 假设特征值衰减率 \(\lambda_k \asymp k^{-2r}\)\(r>1\)),斜率函数光滑度 \(\beta_k \asymp k^{-2s}\)\(s>r+1/2\))。截断项数 \(K\) 的选取导致相变: - 当 \(K \asymp n^{1/(2s+2r+1)}\) 时,\(\|\hat{\beta}_K - \beta\|^2\) 达到 minimax 最优率 \(O_p(n^{-2s/(2s+2r+1)})\)。 - 当 \(K\) 更大时,特征函数估计误差 \(\hat{\phi}_k - \phi_k\) 的累积使收敛率变慢。

关键依赖:特征函数扰动界: 全观测理论的核心技术支柱是扰动界 \(\|\hat{\phi}_k - \phi_k\| = O_p(n^{-1/2}(\lambda_k - \lambda_{k+1})^{-1})\)。这个界保证了 \(\hat{\beta}_k\) 的偏差-方差分解中,由 \(\hat{\phi}_k\) 误差引入的额外方差可控。

离散观测如何打破最小内核: 在离散观测下,\(\hat{C}(s,t)\) 由 pooling 估计得到,其收敛率比全观测慢(受 \(N\) 与测量误差 \(\sigma_u^2\) 影响)。更致命的是,离散观测下 \(\hat{\phi}_k\) 的尖锐扰动界尚未被建立——已有的界(如 Zhang & Wang 2016 对协方差核的界)不足以控制 \(\|\hat{\phi}_k - \phi_k\|\)\(O_p(n^{-1/2}(\lambda_k - \lambda_{k+1})^{-1})\) 的量级。这导致 \(\hat{\beta}_k = \frac{1}{n}\sum Y_i \hat{\xi}_{ik} / \hat{\lambda}_k\) 中,\(\hat{\xi}_{ik}\)(依赖于 \(\hat{\phi}_k\))与 \(\hat{\lambda}_k\) 的误差耦合,无法像全观测那样干净地分解偏差与方差。

本文的破局想法(最小内核版): 既然 \(\hat{\phi}_k\) 的扰动界不可得,那就让 \(\hat{\phi}_k\)\(\hat{\xi}_{ik}\) 的估计独立——将样本分成两半:一半(\(n_1\) 个个体)用于估计 \(\hat{\phi}_k\)\(\hat{\lambda}_k\)(pooling FPCA),另一半(\(n_2\) 个个体)用已估出的 \(\hat{\phi}_k\) 去计算主成分得分 \(\hat{\xi}_{ik}\)(通过离散观测点的积分近似)。由于 \(\hat{\phi}_k\) 只依赖 \(n_1\) 的数据、\(\hat{\xi}_{ik}\) 只依赖 \(n_2\) 的数据与 \(\hat{\phi}_k\),两者在给定 \(\hat{\phi}_k\) 时条件独立,从而绕开了需要 \(\hat{\phi}_k\) 扰动界才能解耦的步骤。这就是 sample-splitting 的最小内核——与半参数效率理论中 cross-fitting 消除 nuisance parameter 一阶影响的思想同构。


三、这篇论文做了什么

三句话: ①研究了在协变量函数仅被离散、带噪观测时,函数线性回归中斜率函数的估计与预测问题; ②核心方法是 pooling 估计特征函数 + sample-splitting 估计主成分得分 + 近似最小二乘估计斜率函数; ③主要结论是:当每个个体的测量数 \(N\) 达到 \(n^{(2s+2r)/(2s+2r+1)}\) 量级时,估计与预测均达到 minimax 最优率 \(O_p(n^{-2s/(2s+2r+1)})\),且该相变阈值比已知协方差估计的阈值 \(n^{1/(2s+1)}\) 更严苛,揭示了回归估计的更高难度。

关键设定与假设: 在第二节最小记号的基础上补全: - 假设 1(特征值衰减)\(\lambda_k - \lambda_{k+1} \geq c k^{-2r-1}\),即特征值间距以多项式率衰减,参数 \(r>1\)。统计含义:协方差核的光滑度,决定了 FPCA 截断的有效性;相比 Hall & Horowitz (2007) 的 \(\lambda_k \asymp k^{-2r}\),本文要求间距而非绝对值衰减,这是扰动界的必要条件。 - 假设 2(斜率函数光滑度)\(\sum_{k>K} \beta_k^2 \leq c K^{-2s}\),参数 \(s>r+1/2\)。统计含义:斜率函数在特征函数基下的可逼近性,即 \(\beta\) 的光滑度;与 Hall & Horowitz (2007) 一致。 - 假设 3(测量设计)\(T_{ij}\)\(\mathcal{T}\) 上 i.i.d. 随机分布,\(N_i \asymp N\),测量误差 \(U_{ij}\) 有界方差 \(\sigma_u^2\)。统计含义:随机设计保证了 pooling 估计的合法性;\(N \asymp n^\gamma\) 是相变参数。 - 假设 4(子样本独立性):样本被随机分成 \(n_1\)\(n_2\) 两部分,\(n_1 \asymp n_2 \asymp n\)。统计含义:sample-splitting 保证了 nuisance(\(\hat{\phi}_k\))与 target(\(\hat{\xi}_{ik}\))估计的独立性。

相比已有文献:放宽了全观测假设(Cardot et al., Hall & Horowitz);相比 Cai & Yuan (2010),不假设协方差核已知;相比 Yao et al. (2005) PACE,不依赖特征函数扰动界。

主要结果: - 定理 1(估计收敛率与相变):在假设 1-4 下,当截断项数 \(K \asymp n^{1/(2s+2r+1)}\)\(N \geq c n^{(2s+2r)/(2s+2r+1)}\) 时,\(\|\hat{\beta}_K - \beta\|^2 = O_p(n^{-2s/(2s+2r+1)})\),达到 minimax 最优率。当 \(N < n^{(2s+2r)/(2s+2r+1)}\) 时,收敛率由 \(N\) 主导,变慢。直觉:\(N\) 必须足够大以使 pooling 特征函数估计的误差不污染 \(\hat{\beta}_K\);相变阈值 \(n^{(2s+2r)/(2s+2r+1)}\) 比协方差估计的阈值 \(n^{1/(2s+1)}\) 更大,因为回归估计需要特征函数的逐点误差(而非整体 \(L^2\) 误差)可控,而逐点误差收敛更慢。 - 定理 2(预测收敛率):在同样条件下,预测误差 \(\mathbb{E}[(\hat{Y} - Y)^2]\) 也达到最优率。必要条件:\(N\) 的相变阈值是必要条件(由 minimax 下界证明),\(K\) 的选取也是必要的(过大则方差爆炸)。 - 定理 3(minimax 下界):证明了在离散观测下,任何估计量的收敛率不能快于 \(n^{-2s/(2s+2r+1)}\)(当 \(N\) 足够大时)或 \(N^{-2s/(2r)}\)(当 \(N\) 较小时),确认了相变的必要性。技术难点:下界需同时考虑协方差估计误差与斜率函数光滑度,且需在离散观测的测量误差下构造最不利先验。

证明路线与技术技巧: - 整体路线: 1. Pooling 估计协方差核与特征函数:用全部 \(n\) 个个体的离散观测 \(\tilde{X}_{ij}\) 构造 pooling 协方差核估计 \(\hat{C}(s,t)\),通过其谱分解得到 \(\hat{\phi}_k, \hat{\lambda}_k\)。建立 \(\hat{C}\) 到真实 \(C\)\(L^2\) 收敛界(依赖 \(n\)\(N\))。 2. Sample-splitting 估计主成分得分:用子样本 \(n_2\) 的离散观测,通过数值积分近似 \(\hat{\xi}_{ik} = \sum_{j} \tilde{X}_{ij} \hat{\phi}_k(T_{ij}) w_{ij}\)\(w_{ij}\) 为积分权重),由于 \(\hat{\phi}_k\) 只依赖 \(n_1\)\(\hat{\xi}_{ik}\)\(\hat{\phi}_k\) 在给定 \(\hat{\phi}_k\) 时条件独立。 3. 近似最小二乘估计 \(\beta_k\):用 \(\hat{\beta}_k = \frac{1}{n_2}\sum_{i \in n_2} Y_i \hat{\xi}_{ik} / \hat{\lambda}_k\),利用条件独立性分解偏差与方差,避免 \(\hat{\phi}_k\) 扰动界。 4. 截断与率推导:选取 \(K \asymp n^{1/(2s+2r+1)}\),平衡偏差(\(\sum_{k>K} \beta_k^2\))与方差(\(\sum_{k \leq K} \mathbb{E}[(\hat{\beta}_k - \beta_k)^2]\)),推导 \(\|\hat{\beta}_K - \beta\|^2\) 的收敛率。 5. Minimax 下界:构造两组斜率函数先验,使得在给定离散观测下,任何检验无法以高概率区分它们,从而推导下界。 - 关键跳跃点: - \(\hat{C}\)\(L^2\) 界到 \(\hat{\phi}_k\) 的逐点界:这是全观测理论中由 Davis-Kahan sin\(\theta\) 定理完成的一步,但在离散观测下,\(\hat{C}\) 的收敛率受 \(N\) 与测量误差影响,直接套用 Davis-Kahan 得到的 \(\hat{\phi}_k\) 界不够尖锐。本文的关键跳跃是:不追求 \(\hat{\phi}_k\) 的尖锐逐点界,而是用 sample-splitting 让 \(\hat{\phi}_k\) 的误差只通过 \(\hat{\lambda}_k\) 的误差(而非 \(\hat{\xi}_{ik}\) 的误差)进入 \(\hat{\beta}_k\) 的方差,从而只需 \(\hat{\lambda}_k\) 的界(这由 \(\hat{C}\)\(L^2\) 界直接可得)。 - 数值积分近似 \(\hat{\xi}_{ik}\) 的误差控制:离散观测下 \(\int X_i(t)\hat{\phi}_k(t)dt\) 只能用 \(\sum \tilde{X}_{ij} \hat{\phi}_k(T_{ij}) w_{ij}\) 近似,这引入了积分误差与测量误差 \(U_{ij}\) 的污染。控制这一误差需要 \(N\) 足够大,这正是相变阈值 \(N \geq n^{(2s+2r)/(2s+2r+1)}\) 的来源。 - 技术技巧点名: - Pooling 协方差估计:将所有个体的离散观测拼合,构造局部平均或核平滑估计量,用于估计 \(C(s,t)\);用在于第一步,解决离散观测下协方差核的估计。 - Sample-splitting:将样本分成两半,一半估 nuisance(\(\hat{\phi}_k\)),一半估 target(\(\hat{\xi}_{ik}, \hat{\beta}_k\));用在于第二步,绕开特征函数扰动界,与半参数效率理论中的 cross-fitting 同构。 - Davis-Kahan sin\(\theta\) 定理:用于从 \(\hat{C}\)\(C\)\(L^2\) 距离推导特征子空间的扰动界;用在于第一步,但本文只用了其 \(L^2\) 版本(而非逐点版本),因为逐点界不够尖锐。 - 数值积分近似:用离散点的加权平均近似连续积分 \(\int X_i \hat{\phi}_k\);用在于第二步,引入的误差由 \(N\) 控制。 - Minimax 下界构造(Le Cam / Fano):构造最不利先验,使得在离散观测下的似然比不可区分;用在于定理 3,确认相变阈值的必要性。

真实例子与应用: - 模拟实验:本文包含模拟实验,设定了不同的 \(n, N, s, r\) 组合,比较了本文方法(pooling + sample-splitting + approximated LS)与 PACE 方法(Yao et al. 2005)及全观测 FPCA 的表现。结果显示:当 \(N\) 达到相变阈值时,本文方法接近全观测 FPCA 的率;当 \(N\) 较小时,收敛率变慢;PACE 方法在某些设定下表现不佳(可能因其依赖扰动界但实际扰动界不满足)。模拟验证了相变现象与最优率的理论预测。 - 真实数据:本文使用了真实数据例子(具体数据集未在摘要中点名,但根据函数线性回归的惯例,可能是医学或气象纵向数据),展示了本文方法在离散稀疏观测下的预测表现优于 PACE 等方法。该例子想说明:sample-splitting 策略不仅在理论上绕开扰动界,在实际中也能提供更稳健的估计。

🔎 结论是否比证明窄: - 作者在定理陈述中明确要求 \(N \geq c n^{(2s+2r)/(2s+2r+1)}\)\(K \asymp n^{1/(2s+2r+1)}\),在这些条件下严格证明了最优率。但在 intro 与 abstract 中,作者泛泛声称"the resulting estimator attains the optimal convergence rates when the number of measurements per subject reaches a certain magnitude of the sample size",未在非技术段落中明确点出阈值的精确量级 \(n^{(2s+2r)/(2s+2r+1)}\)——这是一个在严格证明条件下成立、但在泛泛陈述中被淡化的具体条件,研究者需去正文核验该阈值的常数因子是否被优化。 - 作者声称该相变"differs from the known results for the pooled mean and covariance estimation",但未在摘要中给出协方差估计阈值的精确对比(\(n^{1/(2s+1)}\) vs \(n^{(2s+2r)/(2s+2r+1)}\)),需去正文核验两者在数值上的差异是否显著(尤其在 \(s\)\(r\) 的典型取值下)。


四、开放问题(点到为止,扎根具体语句)

  1. 特征函数扰动界的直接建立:本文用 sample-splitting 绕开了离散观测下 \(\hat{\phi}_k\) 的尖锐逐点扰动界,但该界本身是否可建立?若能直接建立 \(\|\hat{\phi}_k - \phi_k\|_{L^\infty}\) 或逐点界,则无需 sample-splitting,可能达到更优的常数因子或更低的 \(N\) 阈值。扎根点:intro 中"the challenge arises when deriving a sharp perturbation bound for the estimated eigenfunctions"——这是一个被绕开而非被解决的缺口。

  2. 协方差已知设定下的相变阈值对比:Cai & Yuan (2010) 在协方差核已知假设下给出了离散观测回归的 minimax 界,其相变阈值与本文的阈值是否一致?若不一致,差异的来源是什么(特征函数估计误差 vs 主成分得分估计误差)?扎根点:intro 中引用 Cai & Yuan (2010) 但未与其阈值做直接对比。

  3. sample-splitting 的效率损失:sample-splitting 将样本分成两半,理论上损失了 \(\sqrt{2}\) 的效率因子(与 cross-fitting 在半参数理论中的效率损失同构)。是否可以通过 refitting(用全样本重新估 \(\hat{\phi}_k\),但保留 split 样本的 \(\hat{\xi}_{ik}\))或更高阶的校正(如 HOIF)回收效率?扎根点:定理 1 的证明依赖 \(n_1 \asymp n_2 \asymp n\),若用全样本估 \(\hat{\phi}_k\) 则独立性丧失——这是一个技术约束而非本质约束。

  4. 测量误差 \(U_{ij}\) 的非高斯或异方差情形:本文假设 \(U_{ij}\) 为 i.i.d. 零均值有界方差,若 \(U_{ij}\) 为异方差或重尾分布,pooling 协方差估计与数值积分近似的误差界是否仍成立?扎根点:假设 3 中 \(U_{ij}\) 的条件,以及定理证明中用到的高阶矩假设——放宽这些假设可能改变相变阈值。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论