On the statistical role of inexact matching in observational studies¶

作者: Kevin Guo, Dominik Rothenhäusler
来源: Biometrika
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：观察性因果推断中的匹配方法，根本问题在于如何从非随机化的数据中构造出近似随机实验的样本结构，从而消除或控制由可观测混杂带来的偏差，并给出不依赖参数模型假设的随机化推断。当前该方向已高度成熟，拥有大量应用实践与渐近理论，但核心张力集中在“非精确匹配”这一普遍现实操作上：当协变量连续或维度较高时，精确匹配几乎不可能，非精确匹配必然残留混杂偏差。这个偏差在统计上有多大、是否会摧毁后续的随机化推断、以及此时匹配的真正统计角色是什么，正是本文切入的子问题。

发展脉络： - 奠基工作：Rubin (2008) [3] 建立了“设计优于分析”的范式，主张匹配应在不看结果数据的前提下近似随机实验，从而为无模型假设的推断提供基础。Stuart (2010) [1] 对匹配方法做了系统综述，确立了匹配在偏差消除与推断设计上的双重角色。 - 主要进展与渐近理论：Abadie & Imbens (2006, 2012) [11] 建立了匹配估计量的渐近分布理论，揭示了非精确匹配偏差的 \(O(1/n^{k/d})\) 收敛阶（\(k\) 为函数光滑度，\(d\) 为维数），并指出当维数较高时偏差不可忽略。Savje (2019) [17] 证明了无替换匹配的不一致性。Ferman (2017) [6] 在处理组固定、控制组发散的设定下，指出匹配估计量有偏但不一致，并借助近似对称的随机化检验提供推断。Lin, Ding & Han (2021) [12] 证明若让匹配邻居数 \(M\) 随样本发散，最近邻匹配可达到半参数有效界与双重鲁棒性，将匹配与 DML 联结。 - 当前 frontier 与推断困境：Bai et al. (2019) [5] 严格分析了配对随机化实验中推断的渐近行为，要求配对内偏差衰减快于 \(n^{-1/2}\)。Pashley et al. (2020) [7] 与 Branson (2021) [14] 指出，非精确匹配后，处理分配在匹配集内的条件分布高度不可解，除非匹配是精确的。Pimentel & Huang (2022) [15] 提出协变量自适应随机化推断，通过倾向得分差异调整置换概率以修正非精确性。Shah & Peters (2018) [4] 证明了连续变量下条件独立性检验的无假设有效性是不可能的，Kim et al. (2021) [13] 试图通过局部置换检验在光滑类下建立条件独立性检验的效力界。 - 本文的位置：本文不试图修补随机化检验的置换概率（如 [15]），也不试图让匹配本身达到一致性或半参数有效性（如 [12]）。它直接承认非精确匹配残留偏差并摧毁标准随机化推断，转而在局部误设框架下，证明匹配的真正统计角色是为后续的参数调整提供对模型误设的鲁棒性。

子线索聚类： 1. 匹配的渐近一致性及偏差阶：Abadie & Imbens 系列 [11]、Savje [17]、Ferman [6]、Lin et al. [12]。这一簇在算匹配估计量的偏差收敛阶与一致性条件，核心发现是维数灾难下偏差衰减慢于 \(n^{-1/2}\)。 2. 匹配后的随机化推断有效性：Rubin [3]、Bai et al. [5]、Pashley et al. [7]、Branson [14]、Pimentel & Huang [15]。这一簇在问：非精确匹配后，能否仍把处理分配当成条件随机化来做置换检验？核心发现是条件分布不可解，且偏差若大于标准误量级则推断失效。 3. 条件独立性检验与局部置换的统计计算边界：Shah & Peters [4]、Kim et al. [13]。这一簇从更根本的统计检验视角指出，连续协变量下无假设有效的条件独立性检验不存在，局部置换检验需对分布加光滑约束才有力。

这个方向在追问的核心问题： 1. 非精确匹配残留的偏差在渐近意义上到底有多大？它是否必然摧毁 \(n^{-1/2}\) 速率的推断？ 2. 非精确匹配后，处理分配的条件分布能否被近似为某种已知随机化设计，从而支撑无模型假设的推断？ 3. 如果非精确匹配既不能消除偏差也不能支撑无模型推断，它在统计上还有什么正当角色？ 4. 匹配+回归调整的组合策略，其鲁棒性收益能否被严格量化，而不只是作为经验推荐？

⚠️ 作者的 framing： - 作者的说法：作者把缺口 frame 成“非精确匹配常遗留统计上有意义的偏差，且使标准随机化检验渐近无效”，从而让“匹配后追加模型化调整并量化其对误设的鲁棒性”成为显然的下一步。作者主张匹配的首要统计角色从“消除偏差/支撑无模型推断”转变为“提供模型鲁棒性”。 - 被淡化或回避的竞争路线：Pimentel & Huang (2022) [15] 的协变量自适应随机化推断路线（通过修改置换概率来挽救随机化检验）未被作为主要对比对象；Lin et al. (2021) [12] 的发散 \(M\) 匹配达到半参数有效性的路线也未在正文中正面交锋。作者选择了局部误设框架来凸显参数调整的鲁棒性，而未讨论半参数/双重鲁棒路线是否能在不依赖参数模型假设下达到类似甚至更优的鲁棒性。 - 明显该被引/该存在却没出现的：半参数理论中关于局部误设与鲁棒性估计的经典工作（如 Van der Vaart 1991 的局部渐近实验，或 Robins et al. 2008 [10] 的 HOIF 鲁棒性理论）未在 intro 中出现。对于一位熟悉半参数与 minimax 的研究者，这是值得去查的缺口：本文的局部误设框架与半参数局部渐近实验框架的数学结构是否有深层对应？

张力：未见明显对立引用。各被引工作在不同设定下得出不同结论（如 [6] 在固定处理组设定下说匹配有偏但随机化检验可用，[5] 要求偏差衰减快于 \(n^{-1/2}\)，[4] 说连续下无假设有效检验），但这些是设定差异而非同一设定下的矛盾结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(n\)：样本量（匹配后的样本量，或总样本量，视设定而定）。
\(Z_i \in \{0, 1\}\)：处理分配指示变量，\(Z_i=1\) 为处理，\(Z_i=0\) 为控制。
\(X_i \in \mathbb{R}^d\)：可观测协变量向量。
\(Y_i\)：可观测结果变量。
\(Y_i(1), Y_i(0)\)：潜在结果，不可观测；可观测结果 \(Y_i = Z_i Y_i(1) + (1-Z_i) Y_i(0)\)。
\(\tau\)：目标 estimand，平均处理效应 \(\tau = E[Y(1) - Y(0)]\) 或条件平均处理效应的某个版本。
\(M\)：匹配集结构（如配对匹配下，\(M\) 为匹配对集合），将处理单元与控制单元按 \(X\) 的相近性配对。
\(\mu_z(x) = E[Y(z) \mid X=x]\)：条件期望函数（结果模型），\(z \in \{0,1\}\)。
\(e(x) = P(Z=1 \mid X=x)\)：倾向得分。
\(\Delta_i = Y_i(1) - Y_i(0)\)：个体处理效应，不可观测。
\(B_i\)：匹配对内的混杂偏差（非精确匹配残留），定义为配对内控制单元与处理单元在潜在结果 \(Y(0)\) 上的期望差异。
\(\delta\)：局部误设参数，刻画真实模型与工作模型的偏离幅度，通常 \(\delta = O(n^{-1/2})\)。
可观测数据：\((X_i, Z_i, Y_i)\) for \(i=1,\ldots,n\)。研究者观测到协变量、处理分配与结果，但无法观测 \(Y_i(1), Y_i(0)\) 或 \(\Delta_i\)。匹配操作基于 \((X_i, Z_i)\) 构造匹配集 \(M\)，然后基于 \(M\) 与 \(Y_i\) 做推断。

模型：数据生成机制为 \((X_i, Y_i(1), Y_i(0), Z_i)\) 的联合分布 \(P\)。在观察性设定下，\(Z_i\) 依赖 \(X_i\)（非随机化），但假设无未观测混杂（ignorability）：\(Z_i \perp\!\!\!\perp (Y_i(1), Y_i(0)) \mid X_i\)。结果模型 \(\mu_z(x)\) 与倾向得分 \(e(x)\) 未知。局部误设框架下，真实分布 \(P\) 属于一个围绕工作模型 \(P_0\) 的局部邻域 \(\{P: \text{某种距离}(P, P_0) \le \delta\}\)，\(\delta = O(n^{-1/2})\)。

第二步：最小内核

整篇论文的核心数学困难与证明本质，可以在一维协变量 \(d=1\)、配对匹配、线性结果模型、局部误设的最简特例上看清。

最简特例设定： - \(X_i \in \mathbb{R}\)，一维连续协变量。 - 配对匹配：每个处理单元 \(i\)（\(Z_i=1\)）匹配一个控制单元 \(j(i)\)（\(Z_{j(i)}=0\)），使得 \(|X_i - X_{j(i)}|\) 最小。 - 结果模型为线性：真实模型 \(\mu_0(x) = \alpha + \beta x + \gamma x^2\)（二次），工作模型（分析时假设的模型）为 \(\mu_0^{\text{work}}(x) = \alpha + \beta x\)（线性，误设了二次项）。 - 局部误设：二次项系数 \(\gamma = \delta / \sqrt{n}\)，即误设幅度随样本量缩小，属于局部误设邻域。

要证的命题退化成什么： 1. 非精确匹配偏差的渐近量级：配对内混杂偏差 \(B_i = E[Y_i(0) - Y_{j(i)}(0) \mid X_i, X_{j(i)}] = \mu_0(X_i) - \mu_0(X_{j(i)})\)。在 \(d=1\) 且 \(X\) 有密度时，最近邻距离 \(|X_i - X_{j(i)}|\) 的期望量级为 \(O(1/n)\)（一维下匹配距离收敛快），因此 \(B_i \approx \beta (X_i - X_{j(i)}) + \gamma (X_i^2 - X_{j(i)}^2)\)。线性项偏差 \(\beta (X_i - X_{j(i)})\) 量级 \(O(1/n)\)，远小于 \(n^{-1/2}\)，渐近可忽略；但误设项偏差 \(\gamma (X_i^2 - X_{j(i)}^2)\) 量级为 \((\delta/\sqrt{n}) \cdot O(1/n) = O(\delta / n^{3/2})\)，若 \(\delta\) 为常数则仍可忽略，但若误设幅度更大（如 \(\gamma = O(1)\)，非局部误设），则误设偏差量级 \(O(1/n)\)，仍小于 \(n^{-1/2}\)。关键在于：当维数 \(d\) 升高时，匹配距离收敛阶从 \(O(1/n)\) 变为 \(O(n^{-k/d})\)，误设偏差的量级随之膨胀，在高维下可达到 \(O(n^{-1/2})\) 甚至更大，从而摧毁渐近推断。 2. 匹配+回归调整对误设的鲁棒性：在匹配后做回归调整 \(\hat{\tau}_{\text{adj}} = \frac{1}{n_1} \sum_{i: Z_i=1} [Y_i - Y_{j(i)} - (\hat{\mu}_1(X_i) - \hat{\mu}_0(X_{j(i)}))]\)，其中 \(\hat{\mu}_z\) 为工作模型下的拟合值。在局部误设 \(\gamma = \delta/\sqrt{n}\) 下，回归调整消除了线性部分偏差，残留的误设偏差为 \(\gamma\) 的高阶项。匹配操作使得 \(X_i\) 与 \(X_{j(i)}\) 极为相近，从而即使工作模型误设了 \(\gamma x^2\)，在 \(X_i\) 与 \(X_{j(i)}\) 之间误设项的差异 \(\gamma (X_i^2 - X_{j(i)}^2)\) 也被匹配距离的微小性所压制。这就是匹配提供鲁棒性的最小内核：匹配压缩了协变量差异，从而压缩了模型误设在配对间的作用空间。

为什么成立：匹配使得 \(X_i - X_{j(i)}\) 很小，任何光滑函数 \(f\) 在 \(X_i\) 与 \(X_{j(i)}\) 之间的差异 \(f(X_i) - f(X_{j(i)})\) 被 \(|X_i - X_{j(i)}|\) 与 \(f\) 的导数控制。即使 \(f\) 是工作模型误设的部分（如二次项），只要 \(f\) 光滑且匹配距离足够小，误设导致的偏差就被匹配距离的收敛阶所压制。在局部误设 \(\delta = O(n^{-1/2})\) 下，误设偏差被压制到低于 \(n^{-1/2}\)，从而渐近推断仍有效。没有匹配时，回归调整的误设偏差量级为 \(\delta \cdot O(1) = O(n^{-1/2})\)，直接威胁推断；有了匹配，误设偏差量级降为 \(\delta \cdot O(\text{匹配距离}) = o(n^{-1/2})\)，鲁棒性增益正是匹配距离的收敛阶。

三、这篇论文做了什么¶

三句话： ①研究了观察性因果推断中非精确协变量匹配的统计角色，聚焦于其残留偏差对随机化推断的影响及匹配后模型化调整的鲁棒性。 ②核心工具是局部误设框架与随机化检验的渐近分析。 ③主要结论是：非精确匹配常遗留统计上有意义的偏差使标准随机化检验渐近无效，但在局部误设框架下，匹配使后续参数分析对模型误设的敏感度降低，其首要统计角色是提供模型鲁棒性而非消除偏差。

关键设定与假设： - 局部误设框架：真实分布 \(P\) 属于围绕工作模型 \(P_0\) 的局部邻域，误设幅度 \(\delta = O(n^{-1/2})\)。这是本文的核心设定，区别于固定误设（误设幅度为常数）或无误设（真实模型等于工作模型）的已有文献。统计含义：允许模型误设存在，但误设随样本量缩小，从而在渐近分析中与随机波动 \(n^{-1/2}\) 同阶竞争，揭示误设对推断的精确影响。 - Ignorability：\(Z \perp\!\!\!\perp (Y(1), Y(0)) \mid X\)，无未观测混杂。这是匹配与回归调整的识别基础，本文未放宽。 - 匹配设定：非精确配对匹配或匹配集，匹配基于协变量 \(X\) 的距离（如最近邻）。假设匹配算法将处理单元与控制单元配对，使得配对内协变量差异 \(|X_i - X_{j(i)}|\) 收敛，但收敛阶依赖于维数 \(d\) 与光滑度 \(k\)（如 \(O(n^{-k/d})\)）。 - 光滑性假设：结果模型 \(\mu_z(x)\) 与倾向得分 \(e(x)\) 属于某个光滑函数类（如 Hölder 类 \(\mathcal{H}(k, L)\)），光滑度 \(k\) 有限。这是匹配距离收敛阶的必要条件，也是偏差阶推导的基础。 - 随机化检验设定：在匹配集 \(M\) 内，假设处理分配 \(Z_i\) 在精确匹配下可视为条件随机化（\(Z_i\) 在配对内独立且等概率），但在非精确匹配下此假设不成立，因为 \(X_i \neq X_{j(i)}\) 导致倾向得分差异。

主要结果： 1. 定理：非精确匹配偏差的渐近量级与随机化检验的失效（对应 Theorem 1 / Section 2）： - 陈述：在非精确匹配下，配对内混杂偏差 \(B_i\) 的期望量级为 \(O(n^{-k/d})\)（\(k\) 为光滑度，\(d\) 为维数）。当 \(d > 2k\) 时，偏差衰减慢于 \(n^{-1/2}\)，从而标准随机化检验（基于配对内等概率置换）渐近无效，因为偏差主导了标准误。 - 直觉：匹配距离收敛阶 \(O(n^{-k/d})\) 决定了偏差阶。高维下匹配距离收敛慢，偏差残留大，超过随机波动的 \(n^{-1/2}\) 量级，随机化检验的 size 控制失效。 - 必要条件：ignorability、光滑度 \(k\)、维数 \(d\)、最近邻匹配。 - 解决的技术难点：将匹配估计量的偏差分解为配对内混杂偏差的累积，并利用匹配距离的收敛阶（Abadie & Imbens 2006 的结果）将偏差阶绑定到 \(n^{-k/d}\)。

定理：局部误设下匹配+回归调整的鲁棒性增益（对应 Theorem 2 / Section 3，核心定理）：
陈述：在局部误设框架下（真实结果模型 \(\mu_0(x) = \mu_0^{\text{work}}(x) + \delta \cdot g(x)\)，\(\delta = O(n^{-1/2})\)，\(g\) 为误设函数），匹配后回归调整估计量的误设偏差量级为 \(\delta \cdot O(n^{-k/d})\)，而纯回归调整（无匹配）的误设偏差量级为 \(\delta \cdot O(1) = O(n^{-1/2})\)。匹配将误设偏差从 \(O(n^{-1/2})\) 降阶到 \(o(n^{-1/2})\)（当 \(k/d > 0\) 时），从而在局部误设下保护了渐近推断的有效性。
直觉：匹配压缩了配对内协变量差异，使得误设函数 \(g\) 在配对间的差异 \(g(X_i) - g(X_{j(i)})\) 被匹配距离压制，从而误设对估计量的影响从 \(O(1)\) 降阶到 \(O(\text{匹配距离})\)。
必要条件：局部误设 \(\delta = O(n^{-1/2})\)、误设函数 \(g\) 光滑、匹配距离收敛阶 \(O(n^{-k/d})\)。
解决的技术难点：在局部误设下将估计量的偏差分解为工作模型偏差与误设偏差，并利用匹配距离的微小性将误设偏差绑定到匹配距离的收敛阶。关键在于：局部误设使得误设偏差与随机波动同阶竞争，而匹配将误设偏差降阶到低于随机波动，从而恢复推断有效性。
推论/命题：匹配后回归调整的渐近分布与置信区间（对应 Section 3 推论）：
陈述：在局部误设下，匹配后回归调整估计量达到 \(n^{-1/2}\) 速率的渐近正态分布，且置信区间覆盖真实参数（覆盖概率趋近于标称水平），而纯回归调整的置信区间在局部误设下覆盖概率偏离标称水平（因为误设偏差 \(O(n^{-1/2})\) 未被消除）。
直觉：匹配消除了误设偏差对渐近分布的干扰，使得估计量的渐近分布只由随机波动决定。

证明路线与技术技巧： - 整体路线： 1. 建立非精确匹配偏差的量级：利用匹配距离的收敛阶（Abadie & Imbens 2006），将配对内混杂偏差 \(B_i\) 的期望绑定到 \(O(n^{-k/d})\)，并证明当 \(d > 2k\) 时偏差超过 \(n^{-1/2}\)。 2. 证明随机化检验的渐近失效：在非精确匹配下，配对内处理分配的条件分布偏离等概率随机化（倾向得分差异），且偏差超过标准误量级，导致置换检验的 size 膨胀。 3. 局部误设框架下的偏差分解：将真实结果模型分解为工作模型 + 误设项，将匹配后回归调整估计量的偏差分解为工作模型偏差（被回归调整消除）与误设偏差（被匹配距离压制）。 4. 误设偏差的降阶绑定：利用匹配距离 \(|X_i - X_{j(i)}|\) 的微小性与误设函数 \(g\) 的光滑性，将误设偏差 \(g(X_i) - g(X_{j(i)})\) 绑定到 \(\|g'\| \cdot |X_i - X_{j(i)}| = O(n^{-k/d})\)，从而总误设偏差 \(\delta \cdot O(n^{-k/d}) = o(n^{-1/2})\)。 5. 渐近分布与覆盖概率：在误设偏差可忽略后，估计量的渐近分布由随机波动主导，达到 \(n^{-1/2}\) 速率正态分布，置信区间覆盖真实参数。

关键跳跃点：
从匹配距离收敛阶到误设偏差降阶的绑定：这是本文的核心跳跃。难点在于：误设函数 \(g\) 未知且可能复杂，如何保证 \(g(X_i) - g(X_{j(i)})\) 被匹配距离压制？作者利用了 \(g\) 的光滑性（导数有界）与匹配距离的收敛阶，通过 Taylor 展开将 \(g(X_i) - g(X_{j(i)})\) 绑定到 \(\|g'\| \cdot |X_i - X_{j(i)}|\)。这一步要求 \(g\) 光滑且匹配距离收敛阶已知，是证明的关键假设。
局部误设框架的引入：将误设幅度设为 \(\delta = O(n^{-1/2})\)，使得误设偏差与随机波动同阶竞争，从而在渐近分析中精确量化误设的影响。这是本文区别于固定误设文献的关键设定选择。
技术技巧点名：
局部渐近实验：用 \(\delta = O(n^{-1/2})\) 的局部误设参数化真实分布围绕工作模型的邻域，使得误设偏差在渐近分析中与随机波动同阶，从而精确量化鲁棒性增益。这是 Le Cam 局部渐近实验思想在匹配+回归调整问题中的应用。
Taylor 展开 / 光滑函数的线性化：将误设函数 \(g\) 在配对内协变量差异上 Taylor 展开，绑定 \(g(X_i) - g(X_{j(i)})\) 到匹配距离与 \(g\) 的导数，实现误设偏差的降阶。
匹配距离收敛阶的利用：直接引用 Abadie & Imbens (2006) 的匹配距离收敛阶 \(O(n^{-k/d})\)，作为偏差阶与误设偏差降阶的锚点。
随机化检验的渐近 size 分析：通过计算非精确匹配下置换检验的 size 膨胀，证明偏差超过 \(n^{-1/2}\) 时 size 失控。这依赖于 Bai et al. (2019) [5] 的配对随机化推断框架与 Pashley et al. (2020) [7] 的条件分布不可解性分析。

真实例子与应用：本文为纯理论论文，无真实数据例子或模拟实验。所有结论以定理与渐近分析呈现，未提供数值验证。作者在文中明确声明其贡献是理论性的，旨在重新定位非精确匹配的统计角色，而非提供新的匹配算法或实证应用。

🔎 结论是否比证明窄： - 局部误设框架的必要性：定理 2 的鲁棒性增益结论严格在局部误设 \(\delta = O(n^{-1/2})\) 下证明。若误设幅度为常数（固定误设），误设偏差量级为 \(O(n^{-k/d})\)，当 \(d > 2k\) 时仍可能超过 \(n^{-1/2}\)，此时匹配的鲁棒性增益不足以保护推断。作者在文中明确指出这一点（Section 3 讨论），但泛泛 claim "匹配的首要统计角色是提供模型鲁棒性"时，未严格限定此结论仅在局部误设下成立。研究者应核验：在固定误设下，匹配是否仍提供有意义的鲁棒性增益（偏差降阶但可能仍超过 \(n^{-1/2}\)），还是鲁棒性增益仅在局部误设下才有渐近意义。 - 光滑性假设的约束：误设函数 \(g\) 的光滑性（导数有界）是定理 2 的必要条件。若误设函数不光滑（如阶跃函数），Taylor 展开绑定失效，鲁棒性增益结论可能不成立。作者未讨论此情形。

四、开放问题（点到为止，扎根具体语句）¶

固定误设下的鲁棒性界：本文的鲁棒性增益在局部误设 \(\delta = O(n^{-1/2})\) 下严格证明（定理 2），但在固定误设（\(\delta = O(1)\)）下，误设偏差量级为 \(O(n^{-k/d})\)，当 \(d > 2k\) 时仍超过 \(n^{-1/2}\)。能否在固定误设下建立匹配+回归调整的鲁棒性界（偏差降阶但可能仍超过 \(n^{-1/2}\)），并给出此时置信区间的覆盖概率偏离量？扎根在 Section 3 对局部误设框架必要性的讨论与定理 2 的条件。
半参数模型下的局部误设与鲁棒性：本文在参数工作模型（线性回归）下建立鲁棒性增益。能否将局部误设框架推广到半参数工作模型（如部分线性模型 \(Y = \tau Z + \beta^T X + g(W)\)，\(g\) 非参数），并在匹配后用半参数估计（如双重机器学习）做调整，量化匹配对半参数估计误设的鲁棒性增益？扎根在 intro 中对参数分析的聚焦与对半参数路线的回避。
匹配距离收敛阶的最优性：本文依赖 Abadie & Imbens (2006) 的最近邻匹配距离收敛阶 \(O(n^{-k/d})\)。能否通过其他匹配策略（如发散 \(M\) 匹配 Lin et al. 2021 [12]、或协变量自适应匹配 Pimentel & Huang 2022 [15]）改善匹配距离收敛阶，从而在更高维下仍保证误设偏差降阶到 \(o(n^{-1/2})\)？扎根在定理 2 对匹配距离收敛阶的依赖与 [12]、[15] 未被正面讨论。
误设函数不光滑时的鲁棒性：定理 2 要求误设函数 \(g\) 光滑（导数有界）。若误设函数为阶跃或不连续（如处理效应异质性在某个协变量阈值处突变），Taylor 展开绑定失效。能否用其他绑定技术（如局部 Lipschitz 或变分界）在不光滑误设下建立鲁棒性增益？扎根在定理 2 的光滑性假设与证明中 Taylor 展开的关键步骤。

提醒：要确认第 2 条（半参数模型下的局部误设）是不是真 gap，去读半参数局部渐近实验与鲁棒性估计的近期约 5 篇 intro（如 Van der Vaart 1991、Robins et al. 2008 [10] 的后续工作）——若都指向局部误设下半参数估计的鲁棒性界是未解问题 = 共识（真 gap），若已有解决则本文的参数框架是特例 = 机会（推广到半参数）。

Maintained by 陈星宇 · Homepage · Source on GitHub

On the statistical role of inexact matching in observational studies¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论