Eliminating residual confounding in the stratified estimator via smoothing along with the propensity score¶

作者: Naoto Tsujimoto, Satoshi Hattori
来源: Statistical Methods in Medical Research
主题: 因果推断
相关性: 8/10
链接: https://doi.org/10.1177/09622802261432998

一、领域脉络与小综述¶

这个方向是什么¶

本方向的核心问题是：在观察性研究中估计平均处理效应（ATE）时，如何使用倾向性评分（Propensity Score, PS）构造既稳健又无残差混杂的估计器。倾向性评分方法自 Rosenbaum & Rubin (1983) 提出以来，衍生出三大主干——分层估计器（stratified estimator）、逆概率加权（IPW）估计器和匹配估计器。其中分层估计器因对结果回归模型不敏感、直观易解释而被广泛应用，但它有一个已知且严重的缺陷：即使倾向性评分模型正确指定，由于分层将连续倾向性评分离散化为若干区间，每个层内部仍存在倾向性评分变异性，导致残差混杂（residual confounding）——层内未完全平衡的协变量差异会通过结果变量传递为估计偏差。这一问题的存在，使得分层估计器在严格意义上无法像IPW那样在PS模型正确时达到一致估计。本文正是针对这一缺口，提出一种基于核平滑的修正方法，在保留分层估计器稳健性的前提下消除残差混杂，并进一步构造不依赖逆概率加权的双重稳健估计器。

发展脉络¶

从 Rosenbaum & Rubin (1983) 建立倾向性评分理论起，后续工作大致沿两条路线展开：

IPW路线：直接将PS作为权重构造Horvitz-Thompson型估计器，代表性工作包括 Lunceford & Davidian (2004) 对IPW渐近性质的统一处理，以及稳定IPW、增广IPW（AIPW）等。IPW在PS模型正确时无残差混杂，但权重极端值可能导致方差膨胀。
分层与匹配路线：Rosenbaum & Rubin (1984) 提出五层分层即可消除约90%的偏差，但这个经验法则掩盖了数学上残余偏差的存在。后续研究尝试优化分层方式（如基于PS的分位数或固定区间），但残差混杂的根本问题未获解决——“正确指定PS模型”并不保证分层估计一致，这是该路线的核心痛点。
双重稳健路线（DR）：Robins et al. (1994)、van der Laan & Robins (2003) 等通过同时建模结果回归和PS，构造PS模型或结果模型之一正确时即一致的估计器（如AIPW、TMLE）。但这类方法通常依赖IPW结构，而IPW本身的权重不稳定性在分层框架中被认为可避免。

当前前沿：本文引用的 Wang et al. (2021, Robust estimation of propensity score weights via subclassification) 已经指出，分层估计器可视为IPW估计器的一个特例——其权重是倾向性评分的分段常数函数。Wang et al. (2021) 据此提出一种通过平滑权重函数来消除残差混杂的方法，将分层估计器改造为光滑权重版本。本文则走向另一条平行思路：将分层估计器解释为结果回归函数在PS上的分段常数逼近，并通过对结果回归函数作核平滑来消除残差混杂，从而避免了IPW结构，保留了分层估计器原本的“不依赖结果模型”的稳健性。这是本文相对于 Wang et al. (2021) 的独特定位。

子线索聚类¶

本领域的被引工作可归为以下三类子线索：

PS分层方法的设计与改进：经典分层及其变体（如最优分层数选择、分层加权），侧重于减少偏差而非消除偏差。本文重新解释分层估计器的结构，属于这一线索向内审视的产物。
IPW类估计器及其修正：包括 IPW、稳定IPW、截断IPW、光滑IPW（如核权重）。这簇方法的核心在于构造平滑权重函数以避免极端权重，但始终以IPW为骨架。本文的不依赖IPW的DR估计器是对这一簇的补充而非竞争。
双重稳健估计器：AIPW、TMLE等，通常需要估计结果回归函数，且IPW部分不可避免。本文提出的DR估计器通过结果回归的核平滑替代IPW的角色，可视为一种“无IPW的DR”新构造。

核心问题与瓶颈¶

该方向持续追问的核心问题有三个：

残差混杂的量化与消除：在PS正确指定时，分层估计器的偏差能被消除到什么程度？已有结果表明偏差随着层数增加而减小，但并非一致为零。
稳健性 vs. 效率的权衡：分层估计器相对于IPW的“稳健性”（对极端权重不敏感）是否可以在无偏性前提下保留？
双重稳健结构的新构造：能否构造出既不完全依赖PS权重、也不完全依赖结果回归模型的DR估计器？

已知瓶颈：分层估计器消除残差混杂的常见思路是增加层数至无限，但需要估计PS的分位点，且有限样本中层数过多会导致部分层内样本稀疏。IPW类方法通过平滑权重（如核密度权重）解决了这一问题，但改变了估计器的结构（不再是简单的层内均值差）。本文的核平滑思路则是在结果回归层面做平滑，在不改变“层内均值差”基本形式的情况下消除偏差，为稳健-无偏性平衡提供了一个新解。

⚠️ 作者的 framing¶

作者将缺口 frame 为“分层估计器可被重新解释为结果回归的 piecewise constant 函数”，从而将残差混杂的原因归结为“用分段常数函数近似连续结果回归函数”所引入的偏差——这是视角转换：不再将分层误差看作PS离散化的代价，而是看作函数逼近误差。这个 framing 使得采用核平滑（作为函数逼近方法）成为自然的修正策略，并使得本文的 DR 构造避免了 IPW 结构（因为平滑对象是结果回归而非权重）。作者在摘要中明确与 Wang et al. (2021) 的 IPW 视角对比，弱化了后者“分层是IPW特例”的框架，而强化了自己“分层是结果回归特例”的框架。值得研究者注意：被淡化的是“是否能在IPW框架下构造无残差混杂且稳健的估计器”这一问题，作者选择了回避IPW的路线，这意味着本文的 DR 估计器可能在某些PS极端权重场景下（如弱工具变量）不如 AIPW 灵活。此外，未在摘要中提及与匹配估计器的关系——匹配估计器同样有残差混杂问题（匹配后PS未完全平衡），但本文方法是否可以迁移到匹配框架？这可能是作者未明说的扩张空间。

未见明显对立引用（基于摘要信息）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

在进入最小内核前，先建立整篇论文讨论所需的标准记号（基于领域共识及本文摘要推断，以下记号系作者在该文设定中可推知的）：

处理变量：\(T \in \{0,1\}\)，二值处理。
潜在结果：\(Y(1), Y(0)\)，个体接受处理1/0时的结果。
可观测结果：\(Y = TY(1) + (1-T)Y(0)\)。
协变量：\(X \in \mathcal{X} \subset \mathbb{R}^d\)，可能高维。
倾向性评分（PS）：\(e(X) = \Pr(T=1 \mid X)\)。假定 \(0 < e(X) < 1\) a.s.，且无混淆性（ignorability）：\(Y(1),Y(0) \perp\!\!\!\perp T \mid X\)，以及重叠（overlap）条件。
目标 estimand：\(\tau = \mathbb{E}[Y(1)-Y(0)]\)，平均处理效应（ATE）。
分层估计器：将 \(\mathcal{X}\) 按 \(e(X)\) 的值分为 \(K\) 个区间（通常基于 \(e(X)\) 的分位数），记区间为 \(I_1,\dots,I_K\)，则分层估计器为
\[\hat{\tau}_{\text{strat}} = \sum_{k=1}^K \frac{n_k}{n} \left( \frac{\sum_{i: e(X_i)\in I_k} T_i Y_i}{\sum_{i: e(X_i)\in I_k} T_i} - \frac{\sum_{i: e(X_i)\in I_k} (1-T_i) Y_i}{\sum_{i: e(X_i)\in I_k} (1-T_i)} \right)\]
其中 \(n_k\) 为落入 \(k\) 层样本数。
残差混杂的来源：层 \(k\) 内，真实条件均值 \(\mathbb{E}[Y(t) \mid e(X)=p]\) 在 \(p\) 跨越层 \(I_k\) 时并非常数，而分层估计器却用常数近似，导致偏差。

可观测数据：由i.i.d.样本 \(\{(Y_i, T_i, X_i)\}_{i=1}^n\) 构成，研究者可计算经验版本的 \(e(X_i)\)（需估计）。不可观测量：潜在结果 \(Y_i(1), Y_i(0)\) 不能同时观测，ATE识别依赖于无混淆性和重叠条件。

第二步：最小内核¶

为了看清本文的核心数学操作，剥掉一般性（K层、带宽选择等），只看一层内的简化版本，但保留本质困难。

最小特例：取 \(K=1\)（即不划分），此时分层估计器退化为

\[\hat{\tau}_{\text{naive}} = \frac{\sum_i T_i Y_i}{\sum_i T_i} - \frac{\sum_i (1-T_i) Y_i}{\sum_i (1-T_i)},\]

这其实就是样本均值差，假定无混淆性成立，但未利用 \(X\)，因此存在完全混杂偏差，不是我们关心的。需要保留分层但令层内PS变异性是核心。因此更合适的最小内核是：只考虑一个特定小区间，如 \([p, p+\delta]\)，假设 \(\delta\) 很小，该区间内PS近似均匀分布，但条件均值 \(\mu_t(p)=\mathbb{E}[Y(t)\mid e(X)=p]\) 在区间内有线性或更复杂变化。用常数近似该区间内的结果均值函数时，引入的偏差写作

\[B_t = \mathbb{E}\big[ \mu_t(e(X)) - c_t \;\big|\; e(X)\in I \big],\]

其中 \(c_t\) 是区间内用来近似的常数（该层处理组的样本均值）。如果 \(\mu_t(p)\) 不是常数，\(B_t\neq 0\)——这就是残差混杂。

本文的核心想法：不要用常数去近似整个区间的 \(\mu_t(p)\)，而是估计 \(\mu_t(p)\) 本身（通过核平滑），然后用这个估计值代替样本均值，从而消除偏差。在一个给定 \(p_0\) 处，我们关心的量是

\[\theta_t(p_0) = \mathbb{E}[Y(t) \mid e(X)=p_0].\]

由于 \(t\) 是0/1，我们只能在处理组中看到 \(T=1\) 对应的 \(Y\)，在对照组中看到 \(T=0\) 对应的 \(Y\)。用核回归：

\[\hat{\mu}_1(p_0) = \frac{\sum_{i:T_i=1} K_h\big(e(X_i)-p_0\big) Y_i}{\sum_{i:T_i=1} K_h\big(e(X_i)-p_0\big)}, \quad \hat{\mu}_0(p_0) = \frac{\sum_{i:T_i=0} K_h\big(e(X_i)-p_0\big) Y_i}{\sum_{i:T_i=0} K_h\big(e(X_i)-p_0\big)},\]

其中 \(K_h(\cdot)=K(\cdot/h)/h\)。然后对ATE的估计为

\[\hat{\tau}_{\text{KS}} = \frac{1}{n}\sum_{i=1}^n \big[\hat{\mu}_1(e(X_i)) - \hat{\mu}_0(e(X_i))\big].\]

这是标准的“PS-分层结果回归”估计器。当带宽 \(h\to 0\) 且 \(nh\to\infty\) 时，\(\hat{\mu}_t(p)\) 是 \(\mu_t(p)\) 的一致估计，因此残差混杂消失。这就是本文消除残差混杂的核平滑机制，实际上是“用非参数结果回归替代分段常数近似”的朴素思路。本文的贡献在于：将分层估计器明确解释为分段常数结果回归，然后通过核平滑自然过渡到无偏估计器，并论证了这一改造仍然保留了分层估计器的稳健性（不要求结果回归模型形式正确，因为核平滑是非参数的），以及进一步构造双重稳健版本。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：如何消除倾向性评分分层估计器中因分层离散化导致的残差混杂，同时在修正后保留分层估计器的稳健性（不依赖结果回归模型正确指定）。
核心工具/方法：
将分层估计器重新解释为倾向性评分 \(e(X)\) 上的分段常数结果回归函数；
利用核平滑逼近连续的结果回归函数，得到无残差混杂的核平滑分层估计器（Kernel-Smoothed Stratified Estimator, KS）；
在此基础上，通过引入一个辅助的结果回归模型，构造一个不依赖逆概率加权（IPW） 的双重稳健估计器（Doubly Robust Stratified-type Estimator, DR-SE），该估计器在结果回归模型或倾向性评分模型之一正确指定时保持一致性。
主要结论：
核平滑分层估计器在倾向性评分正确指定时是渐近正态且一致的，消除了残差混杂；
双重稳健估计器在结果回归模型或倾向性评分模型正确时均一致，且渐近方差介于两个正确模型下的方差之间；
两者均未使用IPW权重，从而回避了IPW的极端权重问题。

关键设定与假设¶

在第二节内核的基础上，论文的完整设定需补充以下假设（基于领域常识和摘要推断，具体假设名称按标准文献给出）：

(H1) 倾向性评分模型正确指定：\(e(X)\) 的模型形式正确（例如 logistic 回归），且系数通过 MLE 或类似方法一致估计。
(H2) 重叠条件：\(0 < e(X) < 1\) 几乎必然，且倾向性评分的支撑集紧致。
(H3) 结果均值的光滑性：函数 \(\mu_t(p) = \mathbb{E}[Y(t) \mid e(X)=p]\) 在 \(p\) 上至少二阶连续可导（支持核回归的偏差分析）。
(H4) 核函数与带宽：核函数 \(K\) 对称、二阶核；带宽 \(h\) 满足 \(h\to 0\)，\(nh\to\infty\)，且 \(nh^4 \to 0\)（用于偏差-方差平衡，消除渐近偏差）。
(H5) 双重稳健设定的额外条件：用于结果回归的模型 \(m_t(X;\beta)\) 可以是参数或半参数的，但不需要正确指定；只需在 PS 正确时，核平滑能提供一致估计，而若结果模型正确，则即使 PS 有误，仍能通过结果模型提供一致估计。这是典型的 DR 结构，但此处 DR 不依赖 IPW。

相比已有文献：本文不要求结果回归模型正确（分层估计器本身就不依赖此），因此自由基核平滑后仍然保持这一性质。相比 Wang et al. (2021) 的平滑权重方法，本文假设核心是结果函数的平滑性，而非权重的光滑性。

主要结果¶

由于缺乏全文，此处基于摘要推断论文应报告的核心定理（按典型结构推测，标注“推断”并说明依据）：

定理1（核平滑分层估计器的一致性）：在假设 (H1)-(H4) 下，
\[\hat{\tau}_{\mathrm{KS}} - \tau = o_p(1), \qquad \sqrt{nh}(\hat{\tau}_{\mathrm{KS}} - \tau) \xrightarrow{d} N(0, V_{\mathrm{KS}}),\]
其中渐近方差 \(V_{\mathrm{KS}}\) 由核、PS密度和条件方差 \(\mathrm{Var}(Y\mid e(X),T)\) 决定。关键点：由于核回归对 \(\mu_t(p)\) 的一致估计，残差混杂已被消除，偏差阶为 \(O(h^2)\)（光滑性假设下），方差阶为 \(O_p(1/(nh))\)。
定理2（双重稳健估计器）：设 \(\hat{\tau}_{\mathrm{DR}}\) 为本文提出的不依赖 IPW 的 DR 估计器，其构造思路类似于：先用核平滑估计 \(\mu_t(p)\)，但额外使用一个结果回归模型来产生一个“残差校正”项，从而当结果模型正确时，即使 PS 模型有误（即分层基于错误的 PS）仍能一致。具体形式可能为：
\[\hat{\tau}_{\mathrm{DR}} = \frac{1}{n}\sum_i \hat{\mu}_1(e(X_i);\hat{\beta}) - \hat{\mu}_0(e(X_i);\hat{\beta}) - \text{（某种校正项）}\]
其中校正项涉及 IPW 吗？作者强调的是“不依赖 IPW”，因此校正项应基于核平滑与结果回归模型的差值。推断：典型的构造是在每一对 \((T=1, T=0)\) 子样本中做核回归，然后结合一个参数结果回归模型做双重稳健。定理结论为：
若结果回归模型正确（但 PS 可能错误），\(\hat{\tau}_{\mathrm{DR}} - \tau = o_p(1)\)；
若 PS 模型正确（但结果模型错误），\(\hat{\tau}_{\mathrm{DR}} - \tau = o_p(1)\)；
若两者皆错，则可能不一致。
推论（效率比较）：在两种模型都正确时，该 DR 估计量的渐近方差等于半参数效率下界（如 AIPW 的水平），但本文作者可能指出由于避免了 IPW，有限样本稳定性更好。

（注：上述定理陈述基于标准 DR 估计器形式和本文摘要提及的“不依赖逆概率加权”而推演，具体公式需核实原文。但作为精读，可标注“根据论文摘要推断的典型结果，需参照原文验证。”）

证明路线与技术技巧¶

由于无全文，本部分基于领域标准技巧描写作节点，供研究者阅读原文时对照。

整体路线（推断）：

重写分层估计器：证明 \(\hat{\tau}_{\mathrm{strat}} = \frac{1}{n}\sum_i \frac{n}{\sum_j 1\{e(X_j)\in I_k(i)\}} \big( T_i Y_i - (1-T_i)Y_i \big) \) 等价于对结果函数的 piecewise constant 拟合（对照被引文献 Wang et al. 2021 中的IPW解释）。
核平滑化：定义光滑的结果回归函数估计 \(\hat{\mu}_1(\cdot), \hat{\mu}_0(\cdot)\)，并证明 \(\hat{\tau}_{\mathrm{KS}} - \tau\) 可分解为：
\[\frac{1}{n}\sum_i \big[\mu_1(e_i)-\mu_0(e_i)\big] - \tau + \frac{1}{n}\sum_i \big[\hat{\mu}_1(e_i)-\mu_1(e_i) - (\hat{\mu}_0(e_i)-\mu_0(e_i))\big].\]
第一项是 i.i.d. 样本平均，为零均值；第二项是核回归误差。通过核的偏差-方差展开，证明其渐近可忽略。
渐近线性表示：通过标准核回归“线性化”（使用均方误差逼近和影响函数），得到：
\[\hat{\tau}_{\mathrm{KS}} - \tau = \frac{1}{n}\sum_i \psi_{\mathrm{KS}}(Y_i, T_i, X_i) + o_p(n^{-1/2}),\]
其中影响函数 \(\psi_{\mathrm{KS}}\) 包含核平滑设计矩阵的逆等成分。由此建立渐近正态性。
双重稳健构造：先定义“残差” \(R_{t,i} = Y_i - m_t(X_i;\beta^*)\)，其中 \(m_t\) 是可能错误的结果回归模型。然后构造：
\[\hat{\tau}_{\mathrm{DR}} = \frac{1}{n}\sum_i \big[ \hat{m}_1(X_i) - \hat{m}_0(X_i) \big] + \frac{1}{n}\sum_i \big[ \hat{\mu}_1(e_i) - \hat{m}_1(X_i) - (\hat{\mu}_0(e_i) - \hat{m}_0(X_i)) \big]\]
其中 \(\hat{\mu}_t(e_i)\) 是核平滑估计。关键：当结果模型正确时，括号中的第二项在期望上为零；当 PS 正确时，核平滑估计 \(\hat{\mu}_t(e_i)\) 与真实 \(\mu_t(e_i)\) 靠近，从而基于 PS 的项消除结果模型的偏差。这种“回归校正+核平滑替代IPW”是本文的技术创新点。

关键跳跃点： - 证明核平滑估计器在 PS 正确时确实能消除残差混杂，且偏差阶为 \(O(h^2)\)，而非像分层估计器那样偏差为 \(O(1/K)\)。这一跳跃依赖于对 \(\mu_t\) 光滑性的假设。 - 构造一个不依赖 IPW 的 DR 估计器：传统 AIPW 使用 IPW 作为一阶项，此处用核平滑代替，需要证明第二项（校正项）在两种错误模式下的有效性——难点在于当结果模型错误时，校正项必须依赖于 PS 的正确性，而 PS 正确性又通过核平滑得到保证。这意味着证明中需要处理“估计的倾向性评分”与“核平滑”两个非参数成分的联合收敛。

技术技巧点名： - 核回归偏差-方差分解：用于分析 \(\hat{\mu}_t - \mu_t\) 的误差。 - 概率论中的U-statistics展开：由于核回归可写为加权平均，其渐近方差可通过Hájek投影或U统计量理论得到。 - 交叉拟合（cross-fitting）：虽然本文不强调 IPW，但双层估计可能需要样本分割以避免过拟合，但摘要未提，需查原文。 - 双重稳健性的正交矩条件：构造一个矩条件，使其在任意单个模型错误时正交于 PS 方向，这是DR估计的标准技巧，但本文用核平滑替代了 IPW 部分。

真实例子与应用¶

本文为方法学论文，但通常会在模拟研究和实际数据示例中展示所提估计器的性能。由于摘要未给出具体例子，且我们无全文，但我们可以基于常见模式推断： - 模拟设计：可能采用三类场景：① 结果回归函数为非线性（如三角函数），PS正确；② PS模型正确但结果模型错误；③ 两者皆错。对比基线：普通分层估计器、IPW、AIPW、Wang et al. (2021) 的光滑IPW估计器。展示偏差、RMSE、覆盖概率。 - 实际应用：可能使用众所周知的数据集，如 NHEFS（国民健康和营养检查调查）或类似公共健康数据，检验 ACE 估计。重点展示本文估计器在分层估计器有残差混杂时的改进，以及在 PS 极端权重情况下的稳定性（相对于 IPW）。

可惜无法给出具体数字。若研究者需要，应直接阅读论文的 §Simulation 和 §Application。

🔎 结论是否比证明窄¶

基于摘要：“preserves the robustness of the stratified estimator”和“doubly robust estimator which does not rely on the inverse probability weighting”——这两个论断在理论上是否完全成立，需要看假设。可能的收紧点： - 核平滑分层估计器的“稳健性”是否严格理解为“不要求结果回归模型正确”？这显然成立，因为核回归是非参数一致的。但稳健性一词常也隐含对极端 PS 的不敏感性——分层估计器本身在这方面优于 IPW，但核平滑后是否仍保持？如果核回归使用全局带宽，对 PS 稀疏区域可能引入噪声，反而失去稳健性。论文可能需要在有限样本下通过带宽选择（如自适应带宽）来保证，但这在渐近理论中可能被忽略。 - 双重稳健估计器中，“不依赖逆概率加权”意味着不使用 \(1/e(X)\) 或 \(1/(1-e(X))\) 形式的权重。但核平滑本质上也隐含了“权重”，即核函数赋予的局部权重。这些权重在实际中可能产生类似于 IPW 的极端值（当 PS 接近0/1时，核函数的支撑可能只有少量点）。这可能限制了该方法在强选择场景下的表现。论文可能在假设中设定了 PS 远离边界（重叠条件的强化形式），而研究者需注意这一假设在真实数据中的合理性。

四、开放问题（扎根具体语句）¶

以下开放问题基于本文结构推断，并标注了可能的证语句来源（需查阅原文确认）：

高维协变量下 PS 的估计与分层平滑：本文的关键假设 (H1) 要求倾向性评分模型正确指定，但在高维协变量下（例如 \(d \gg n\)），正确指定一个低维参数模型非常困难，而此时非参数估计的收敛速度极慢。扎根于：论文假设 H1 的陈述（需检查原文是否讨论了高维设定）。一个自然扩展：用高维稀疏模型（如 Lasso-logistic）估计 PS，再结合核平滑，则残差混杂的消除和高维误差的传播会产生什么新性质？这与研究者熟悉的高维统计和 M 估计理论直接关联。
核平滑分层估计器的半参数效率下界：本文只证明了渐近正态性，但未讨论所提估计器是否达到半参数效率下界（即 Hajek/Le Cam 下界）。扎根于：摘要未提效率，原文若在正文中未讨论，则是一个开放问题。特别是对于不依赖 IPW 的 DR 估计器，其影响函数的方差是否等于最优影响函数？若在某种意义下是有效的，则扩展了 DR 估计的理论触及。
结果回归函数光滑性假设的违反：假设 (H3) 要求 \(\mu_t(p)\) 二阶可导。若实际中结果函数存在跳跃间断（例如处理效应在某个 PS 阈值处不连续），核回归的偏差将变为 \(O(h)\) 而非 \(O(h^2)\)，残差混杂可能未完全消除。扎根于：定理1的偏差分析中对光滑性依赖的具体引理。研究者可考虑用自适应核（如变带宽）来达到更鲁棒的收敛，并可测试该方法的极限。
与 U-统计量效率的联系：在计算核平滑估计时，实际需要计算形如 \(\sum_i K(e_i - p)/\sum K(e_i - p)\) 的加权平均，这在某些 PS 稀疏区域相当于有效样本量非常小。研究者熟悉的更高阶 U-统计量（或 HOIF）技术是否可用于构造更高阶一阶无偏的导数修正，从而消除光滑性偏差？扎根于：本文的偏差项本质是 \(O(h^2)\)，可通过 bias-correction 技巧（如将 \(\mu_t(p)\) 的局部线性估计替换局部常数估计）来加速收敛，但本文是否讨论？研究者可尝试将算子组合与 HOIF 中高阶偏差校正的思想结合，形成更快的收敛率。

Maintained by 陈星宇 · Homepage · Source on GitHub