跳转至

Asymptotic Properties of Empirical Quantile-Based Estimators

作者: Julien Chhor, Xavier D'Haultfœuille, Jérémy L'Hour, Martin Mugnier
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2607.00219


一、领域脉络与小综述

这个方向是什么

本文研究的核心问题是:如何对形如 θ₀ = E[F_Y⁻¹ ∘ F_Z(X)] 的参数进行统计推断。这类参数出现在 Athey & Imbens (2006) 的 "changes-in-changes" (CIC) 因果推断模型中,用于估计分位数处理效应。具体来说,CIC 模型利用两期(处理前/后)和两组(处理组/对照组)的重复截面数据,在非参数设定下识别处理效应的整个分布。其关键识别步骤涉及分位数-分位数变换(quantile-quantile transform),最终的平均处理效应(ATE)就表达为上述形式。该方向当前的核心瓶颈是:现有渐近理论对变量分布施加了过强的有界性和光滑性假设,限制了其在工资、价格、利润等无界经济变量上的应用。

发展脉络

  1. 奠基工作:Athey & Imbens (2006)

    • 做了什么:提出了 CIC 模型,证明了 plug-in 估计量 ˆθ 的渐近正态性,并给出了一个相合的方差估计量。
    • 留下什么口子:其证明依赖于三个关键假设:(a) 所有变量有界支撑;(b) 每个变量有连续可微密度;(c) 密度在支撑上有上下界。作者自己承认这些假设对许多经济变量(如工资)过于严格。
  2. 主要进展(两条子线索)

    • 子线索 1:放宽假设的尝试
      • de Chaisemartin & D'Haultfœuille (2018):在证明一个相关泛函的 Hadamard 可微性时,仍然依赖于变量有界和密度有下界的假设。本文作者指出,当变量无界时,Hadamard 可微性失效,因为 F ↦ ∫ g dFg 无界时关于上确界范数不连续。
      • Sun & Tchetgen (2025):提出了一个去偏且半参数有效的 CIC 估计量,可以灵活地包含连续协变量。但本文作者指出,他们的结果依赖于一个高层条件(Assumption 4(a)),而本文的工作表明,即使在无协变量的情况下,建立弱且低层的渐近正态性条件也非平凡。
    • 子线索 2:相关过程的收敛性
      • Beare & Kaji (2026):在类似本文的弱条件下,建立了 ˆF ∘ ˆG⁻¹ 过程在 L¹([0,1]) 上的依分布收敛。但本文作者指出,他们研究的量是 ∫₀¹ [ˆF_Y⁻¹ ∘ ˆF_Z] dˆF_X,这涉及 ˆF_X 带来的额外随机性,并非 Beare & Kaji (2026) 结果的直接推论。
    • 子线索 3:L-统计量的渐近理论
      • Mason & Shorack (1992):在更简单的设定下(F_XF_Z 已知),证明了 L-统计量 √n 一致且渐近正态的充要条件是某个积分(类似于本文的 E[η²])有限。这为本文猜想 E[ε² + η²] < ∞ 可能是 ˆθ 渐近正态的充要条件提供了理论基础。
  3. 当前 Frontier 与本文位置

    • 当前 frontier 是在尽可能弱的条件下(允许无界变量、密度可趋于 0 或无穷)建立 ˆθ 的渐近正态性,并提供可靠的方差估计。
    • 本文的位置:本文是第一个在无界变量假设下,系统性地建立 ˆθ√n 一致性与渐近正态性,并给出相合方差估计量的工作。它填补了 Athey & Imbens (2006) 理论中的一个关键空白,并揭示了该问题在技术上的核心困难(Hadamard 可微性失效,无法直接套用标准 L-统计量结果)。

子线索聚类

  1. CIC 模型及其扩展:Athey & Imbens (2006), de Chaisemartin & D'Haultfœuille (2018), Sun & Tchetgen (2025)。这一簇关注 CIC 模型的识别、估计和推断,以及向模糊 DID、含协变量情形的推广。
  2. 分位数-分位数过程与 L-统计量:Beare & Kaji (2026), Mason & Shorack (1992), Shorack & Wellner (1986)。这一簇研究 ˆF ∘ ˆG⁻¹ 这类过程的渐近性质,以及 L-统计量的渐近理论,为本文提供了技术工具和理论基准。
  3. 变带宽核密度估计:Jones (1990), Terrell & Scott (1992), Chhor & Carpentier (2025)。这一簇研究带宽随位置变化的核密度估计量,本文将其用于估计 f_U,并利用其在边界附近自动收缩带宽的特性,来处理 f_U 可能发散的问题。

这个方向在追问的核心问题

  1. 弱假设下的渐近正态性:在允许变量无界、密度可趋于 0 或无穷的条件下,ˆθ 是否仍然 √n 一致且渐近正态?需要什么样的正则条件?
  2. 渐近方差的可靠估计:当密度可能取任意小值时,如何构造一个不依赖逆密度加权的、相合的方差估计量?
  3. 条件的必要性:渐近正态性所需的条件在多大程度上是必要的?是否存在一个清晰的阈值,超过该阈值后 √n 收敛和正态性就会失效?
  4. 面板数据情形的处理:当 YZ 在同一单元上观测(相关)时,如何调整估计和推断方法?

⚠️ 作者的 framing

  • 作者的缺口 frame:作者将缺口 frame 为 "Athey & Imbens (2006) 的假设过于严格,限制了方法在无界经济变量上的应用"。因此,本文的贡献被定位为 "在更弱条件下获得类似结果",并 "揭示这些条件在某种意义上是必要的"。
  • 被淡化/回避的竞争路线
    • Sun & Tchetgen (2025) 的去偏方法:作者承认其处理了协变量,但将其结果归为 "高层条件",并强调本文的工作表明即使在无协变量时建立低层条件也非平凡。这实际上是在暗示,Sun & Tchetgen (2025) 的假设可能并不容易验证,而本文提供了更透明、更易检验的条件。
    • Bootstrap 方法:作者在模拟中包含了 Bootstrap,但并未将其作为主要理论贡献。在正文中,作者指出当条件不满足时,Bootstrap 的表现也很差,暗示了基于渐近正态性的推断在边界情况下的根本性困难。
  • 什么明显该被引/该存在、却没出现在 intro 里?:intro 中未提及任何关于半参数效率界的讨论。对于 θ₀ 这个泛函,其半参数效率界是什么?本文的 ˆθ 是否达到了这个界?Sun & Tchetgen (2025) 声称他们的估计量是半参数有效的,但本文的估计量呢?这是一个值得研究者去查的问题:本文的方差表达式是否与半参数效率界一致?如果不一致,差距有多大?

张力

未见明显对立引用。各工作之间是互补关系:Athey & Imbens (2006) 奠基,de Chaisemartin & D'Haultfœuille (2018) 扩展,Sun & Tchetgen (2025) 引入去偏和协变量,Beare & Kaji (2026) 研究相关过程,Mason & Shorack (1992) 提供 L-统计量的理论基础。本文则是在更弱的假设下统一和深化了这些结果。


二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号

    • X, Y, Z:三个随机变量。在 CIC 模型中,Y 是处理组后处理结果,Z 是处理组前处理结果,X 是对照组前处理结果。
    • F_W:随机变量 W 的累积分布函数 (cdf)。
    • F_W⁻¹F_W 的左连续广义逆,即分位数函数。
    • U := F_Z(X):一个潜在变量,是 X 经过 Z 的分布函数变换后的结果。它是不可观测的,因为 F_Z 未知。
    • θ₀ := E[F_Y⁻¹ ∘ F_Z(X)] = E[F_Y⁻¹(U)]:目标参数,即平均处理效应。
    • (Y_i)_{i=1,...,n₁}, (X_i)_{i=1,...,n₂}, (Z_i)_{i=1,...,n₃}:三个独立同分布样本,分别来自 F_Y, F_X, F_Z。样本量分别为 n₁, n₂, n₃
    • N := min(n₁, n₂, n₃):用于定义收敛速度的有效样本量。
    • ˆF_WF_W 的经验分布函数。
    • ˆF_W⁻¹F_W 的经验分位数函数。
    • ˆθ := (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(ˆF_Z(X_i))θ₀ 的 plug-in 估计量。
    • λ_k := lim_{N→∞} N/n_k:样本量比例极限,k=1,2,3
  • 模型

    • 数据生成机制由三个独立的 i.i.d. 样本 (Y_i), (X_i), (Z_i) 描述。它们分别服从分布 F_Y, F_X, F_Z
    • 目标参数 θ₀F_Y⁻¹ ∘ F_Z(X) 的期望。这是一个关于三个分布的泛函。
    • 已知F_Y, F_X, F_Z 是未知的,但它们是连续的(Assumption 2(i)-(ii))。
    • 要估的对象θ₀
  • 可观测数据

    • 可观测(Y_i), (X_i), (Z_i) 这三个样本。研究者可以计算它们的经验分布函数 ˆF_Y, ˆF_X, ˆF_Z
    • 不可观测(潜在)
      • U = F_Z(X):因为 F_Z 未知,所以 U 是潜在变量。
      • F_Y⁻¹(U):因为 U 不可观测,所以即使 F_Y 已知,这个量也是潜在的。
    • 关键识别假设θ₀ 的识别依赖于 U = F_Z(X) 这个关系。在 CIC 模型中,这来自于处理组和对照组在无处理时的潜在结果分布相同的假设。

第二步:讲最小内核

本文的核心数学困难在于:当变量无界时,泛函 (F_Y, F_X, F_Z) ↦ ∫ F_Y⁻¹ ∘ F_Z dF_X 不再是 Hadamard 可微的。因此,不能直接使用 Delta 方法。作者需要找到一种新的线性化方法。

最简特例:考虑一个极度简化的情形,其中 F_Z已知的。这意味着 U = F_Z(X) 是可观测的。那么 θ₀ = E[F_Y⁻¹(U)],而 ˆθ = (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(U_i)

在这个特例下,问题退化为一个带随机权重的 L-统计量问题。ˆθ 可以写成: ˆθ = ∫₀¹ ˆF_Y⁻¹(t) dˆF_U(t),其中 ˆF_UU 的经验分布函数。

核心思路:即使在这个简化情形下,标准 L-统计量理论(如 Shorack & Wellner, 1986, Chapter 19)也不直接适用,因为那些理论通常假设权重函数(这里是 dˆF_U)是已知的或具有更简单的结构。这里的权重 dˆF_U 本身是随机的,且与 ˆF_Y⁻¹ 相关。

关键想法:作者将 ˆθ - θ₀ 分解为两部分: ˆθ - θ₀ = [∫₀¹ ˆF_Y⁻¹(t) dF_U(t) - ∫₀¹ F_Y⁻¹(t) dF_U(t)] + [∫₀¹ ˆF_Y⁻¹(t) d(ˆF_U - F_U)(t)] =: T₁ + T₂

  • T₁ 的线性化T₁F_Y 的估计误差带来的。作者证明,在尾部条件下,T₁ 可以线性化为 (1/n₁) Σ η_i,其中 η_i = -∫₀¹ [1{F_Y(Y_i) ≤ t} - t] f_U(t) dF_Y⁻¹(t)。这本质上是一个关于 F_Y 的 von Mises 展开,但需要处理积分边界和尾部行为。
  • T₂ 的线性化T₂F_U 的估计误差带来的。作者证明,T₂ 可以线性化为 (1/n₂) Σ ε_i,其中 ε_i = -∫₀¹ [1{U_i ≤ t} - F_U(t)] dF_Y⁻¹(t) = θ₀ - F_Y⁻¹(U_i)。这个线性化相对直接,因为 ˆF_U 是标准经验分布函数。

为什么这个特例抓住了核心:即使 F_Z 已知,证明 T₁ 的线性化也需要处理无界变量带来的技术困难。T₁ 的线性化是本文证明中最具技术挑战性的部分之一。当 F_Z 未知时,还会多出一个 T₃ 项,它对应于 F_Z 的估计误差,其处理方式与 T₁ 类似,但需要更复杂的工具(如加权分位数过程)。因此,理解 F_Z 已知的特例,就抓住了本文证明的核心思想:ˆθ 的误差分解为三个独立样本的估计误差之和,并分别对每一项进行线性化,最终证明其渐近正态性


三、这篇论文做了什么

三句话

  1. 研究了什么问题:在允许变量无界、密度可趋于 0 或无穷的弱条件下,研究形如 θ₀ = E[F_Y⁻¹ ∘ F_Z(X)] 的参数的 plug-in 估计量 ˆθ 的渐近性质,并构造相合的方差估计量。
  2. 核心工具/方法:利用加权/未加权的经验过程与分位数过程理论(Csörgő et al., 1986; Shorack & Wellner, 1986)、Beta 分布的性质、L-统计量的刻画(Hecker, 1976),以及一种新颖的、带宽随 u(1-u) 变化的核密度估计量。
  3. 主要结论:在 Assumptions 1-2 下,ˆθ√N 一致且渐近正态的(Theorem 1)。在 Assumptions 1, 3, 4 下,提出的方差估计量 ˆσ² 是相合的(Theorem 2)。模拟表明,渐近正态性的条件在某种意义上是紧的,且新方差估计量优于 Athey & Imbens (2006) 的估计量。

关键设定与假设

  • Assumption 1 (Sampling):三个样本独立同分布且相互独立,样本量比例收敛到正常数。这是标准的多样本设定。
  • Assumption 2 (Smoothness)
    • (i) F_Z 绝对连续,密度 f_Z 支撑在 [z, ¯z] 上(允许无界)。
    • (ii) F_Y 连续,且 |F_Y⁻¹(t)| ≤ C_Y t^{-d₁}(1-t)^{-d₂}。这控制了 Y 的尾部行为。d₁, d₂ 越大,Y 的尾部越厚。相比 Athey & Imbens (2006):这是对无界变量的显式允许,且用多项式尾部控制代替了有界支撑假设。
    • (iii) F_U 绝对连续,密度 f_U 连续,且 f_U(u) ≤ C_U u^{-b₁}(1-u)^{-b₂}。这控制了 U 的密度在边界附近的行为。b₁, b₂ 越大,f_U 在边界处发散得越快。相比 Athey & Imbens (2006):允许密度在边界处发散,而不是要求有下界。
    • (iv) b₁ + d₁ < 1/2b₂ + d₂ < 1/2。这是核心的尾部条件,它限制了 YU 的尾部不能同时太厚。相比 Athey & Imbens (2006):这是全新的、更弱的条件。Athey & Imbens (2006) 的假设 (a)-(c) 隐含了 b₁ = b₂ = d₁ = d₂ = 0,显然满足此条件。
  • Assumption 3 (Bandwidth conditions):对变带宽核密度估计的带宽序列 ε_n 的条件。要求 ε_n → 0, nε_n → ∞,且 (log(n)/√n)^{1/2 - b_j - d_j} = o(ε_n)。这确保了带宽在边界处收缩得足够慢,以控制偏差,但又足够快,以控制方差。
  • Assumption 4 (Smoothness for variance estimation):对 Assumption 2 的加强。
    • (ii) 要求 F_Y⁻¹ 可微,且其导数有类似的多项式尾部控制。
    • (iii) 要求函数 g(s,t) = (s∧t)^{2b₁}(¯s∧¯t)^{2b₂} f_U(s) f_U(t) 是 β-Hölder 连续的。这是一个光滑性条件,用于控制核密度估计的偏差。
    • (iv) (b₁ ∨ b₂) + (d₁ ∨ d₂) < 1/2。比 Assumption 2(iv) 略强,要求 bd 的最大值之和小于 1/2。

主要结果

  • Theorem 1 (Asymptotic Normality of ˆθ)

    • 陈述:在 Assumptions 1 和 2 下,√N(ˆθ - θ₀) → N(0, σ²),其中 σ² = (λ₁ + λ₃)E[η²] + λ₂E[ε²]
    • 直觉:渐近方差由三部分组成,分别对应 Y, X, Z 三个样本的估计误差。ηε 是影响函数(influence function)的近似。
    • 必要条件b₁ + d₁ < 1/2b₂ + d₂ < 1/2。Proposition 1 表明,在 F_Y⁻¹ 可微且边界行为被 (4) 式控制时,这个条件是 E[ε² + η²] < ∞ 的必要条件,从而也是渐近正态性的必要条件。这是本文的一个关键洞察√n 收敛和正态性对 YU 的尾部有联合约束。
    • 解决的技术难点:克服了 Hadamard 不可微性,通过精细的分解和加权经验过程理论,将 ˆθ - θ₀ 线性化为三个独立影响函数之和。
  • Theorem 2 (Consistency of Variance Estimator ˆσ²)

    • 陈述:在 Assumptions 1, 3, 4 下,ˆσ² → σ² in probability。
    • 直觉ˆσ² 由两部分组成:(N/n₂) Σ ˆε_i² 估计 λ₂E[ε²],另一部分估计 (λ₁+λ₃)E[η²]。估计 E[η²] 的关键是 Lemma 2,它给出了一个不涉及逆密度加权的表达式。然后,作者用样本分裂和变带宽核密度估计来 plug-in 这个表达式。
    • 解决的技术难点:避免了 Athey & Imbens (2006) 方差估计量中出现的逆密度加权项,该加权项在密度可能取任意小值时难以处理。变带宽核密度估计量 ˆf_U 的带宽 h_{n,u} = ε_n u(1-u)u→0u→1 时收缩,这恰好补偿了 f_U(u) 可能发散的行为,从而在不要求 ˆf_U 一致相合的情况下,得到了 ∫ f_U dF_Y⁻¹ 这类泛函的相合估计。

证明路线与技术技巧

  • 整体路线(Theorem 1)

    1. 分解:将 ˆθ - θ₀ 分解为 T₁ + T₂ + T₃,分别对应 F_Y, F_U, F_Z 的估计误差。
    2. 线性化 T₁:利用积分变换和分部积分,将 T₁ 转化为 ∫ [G_{n₁} - I] dΛ 的形式,其中 G_{n₁}(F_Y(Y_i)) 的经验分布函数,dΛ = f_U dF_Y⁻¹。然后证明 T₁ 可以近似为 (1/n₁) Σ η_i关键技巧:使用 Beta 分布的性质和加权经验过程结果(Csörgő et al., 1986)来控制边界项和余项。
    3. 线性化 T₂:通过分部积分和证明 ∫ [ˆF_U ∘ G_{n₁} - F_U ∘ G_{n₁}] dF_Y⁻¹ ≈ ∫ [ˆF_U - F_U] dF_Y⁻¹,将 T₂ 线性化为 (1/n₂) Σ ε_i关键技巧:利用经验过程 V_{n₂} = √n₂(ˆF_U ∘ F_U⁻¹ - I) 的连续性,证明 R₅ = ∫ (V_{n₂} ∘ F_U ∘ G_{n₁} - V_{n₂} ∘ F_U) dF_Y⁻¹ 的期望趋于 0。
    4. 线性化 T₃:这是最复杂的部分。首先将 T₃ 转化为一个 L-统计量 J₂ 加上余项。J₂ 的形式为 ∫ [H_{n₃}⁻¹(x) - E[H_{n₃}⁻¹(x)]] f_U(x) dF_Y⁻¹(x),其中 H_{n₃}(F_Z(Z_i)) 的经验分布函数。关键技巧:利用 Hecker (1976) 对 L-统计量的刻画,证明 J₂ 是渐近正态的。处理 T₃ 的余项需要用到 Lemma 8,该引理建立了 H_{n₃}⁻¹ ∘ G_{n₁} 的矩性质。
    5. 合并:由于三个样本独立,(1/√n₁) Σ η_i, (1/√n₂) Σ ε_i, 和 √n₃ J₂ 是渐近独立的,它们的加权和收敛到正态分布。
  • 关键跳跃点

    • T₁ 的线性化:从 ∫ F_Y⁻¹ d(F_U ∘ G_{n₁})∫ [G_{n₁} - I] dΛ 的转换,以及证明所有边界项和余项(R₁R₄)都是 o_P(1)。这依赖于对 YU 尾部行为的精细控制。
    • T₃ 的线性化:将 T₃ 转化为 L-统计量 J₂ 的过程,以及证明 R₆R₉ 四个余项都是 o_P(1)。这需要 Lemma 8 来建立 H_{n₃}⁻¹ ∘ G_{n₁} 的矩性质,并利用 Beta 分布的性质。
  • 技术技巧点名

    • 加权经验/分位数过程:用于处理 T₁T₃ 中的余项,特别是 Csörgő et al. (1986) 的 Corollary 4.3.1,用于控制加权分位数过程的 sup-norm。
    • Beta 分布:用于计算 E[|Y_(1)|], E[|Y_(n₁)|] 等矩,以及 Lemma 8 中 H_{n₃}⁻¹ 的期望和绝对偏差。
    • L-统计量刻画:Hecker (1976) 的结果用于处理 T₃ 线性化后得到的 L-统计量 J₂
    • 变带宽核密度估计:用于估计 f_U,其带宽 h_{n,u} ∝ u(1-u) 是处理 f_U 在边界发散的关键。
    • 样本分裂:用于方差估计,以确保 ˆf_U^{(1)}, ˆf_U^{(2)}, ˆF_Y^{(1)}, ˆF_Y^{(2)} 之间的独立性,从而简化证明。

真实例子与应用

本文为纯理论,无实证例子。但包含蒙特卡洛模拟。

  • 模拟设计:数据生成过程(DGP)被精心设计,以精确控制 Assumption 2 中的参数 (b₁, b₂, d₁, d₂)Y 的生成使用 F_Y⁻¹(t) = -t^{-d₁} + (1-t)^{-d₂}U 服从 Beta(1-b₁, 1-b₂) 分布,Z 为标准正态,X = F_Z⁻¹(U)
  • 模拟目的
    1. 验证 Theorem 1 的紧性:通过改变 (b₂, d₂) 的值,观察 ˆθ 的收敛速度。图 1 显示,当 b₂ + d₂ < 0.5 时,log(IQR(ˆθ))log(N) 的斜率接近 -1/2√n 收敛);当 b₂ + d₂ ≥ 0.5 时,斜率明显偏离 -1/2,收敛速度变慢。这支持了 Assumption 2(iv) 在某种意义上是必要的。
    2. 验证渐近正态性:图 2 显示,当 (b₂, d₂) = (0.2, 0.2)(满足条件)时,√N(ˆθ - θ₀)/σ 的分布接近标准正态;当 (b₂, d₂) = (0.3, 0.3)(不满足条件)时,即使 N=10,000,分布也明显左偏,偏离正态。
    3. 比较方差估计量:表 1 比较了六种置信区间的覆盖率和平均长度。结果显示:
      • 当条件满足时,所有方法(包括 Bootstrap)的覆盖率都接近 95%。
      • 本文提出的方差估计量("No split" 列)表现良好,与 Bootstrap 相当。
      • Athey & Imbens (2006) 的估计量("AI" 列)覆盖率略低。
      • 使用恒定带宽的变体("Unif" 列)覆盖率显著偏低,尤其是在 (b₂, d₂) = (0.2, 0.2) 时,即使 N=10,000 也只有 85%。这有力地证明了变带宽的必要性。
      • 当条件不满足时,所有方法的覆盖率都很差,且不随 N 增加而改善,进一步支持了条件的必要性。

🔎 结论是否比证明窄

  • Theorem 1 的陈述√N(ˆθ - θ₀) → N(0, σ²)。证明中要求 min(λ₁, λ₃) > 0。这意味着 n₁n₃ 都必须与 N 同阶增长。如果 λ₃ = 0(即 n₃ 相对于 n₁, n₂ 增长慢得多),定理不直接适用。但作者在正文中说明,如果 F_Z 已知(即 U 可观测),则 λ₃ 设为 0 时结论仍成立。这暗示了 λ₃ > 0 可能只是一个技术条件,而非本质要求。这是一个值得注意的窄结论:定理的正式陈述排除了 n₃ 增长慢于 n₁n₂ 的情形,但作者通过非正式讨论暗示了更广的适用性。
  • Proposition 1:声称 Assumption 2(iv) 是 E[ε² + η²] < ∞ 的必要条件。但该命题依赖于一个额外的假设 (4),即 f_U(u) F_Y⁻¹'(u) ≥ C u^{-b₁-d₁-1}(1-u)^{-b₂-d₂-1}。这个假设要求 F_Y⁻¹ 可微,并且其导数在边界处有下界。如果这个假设不成立,E[ε² + η²] < ∞ 是否仍然需要 b_k + d_k < 1/2?作者在正文中将其表述为 "in some sense, sharp",并引用 Mason & Shorack (1992) 在更简单设定下的充要条件来支持这一猜想。这是一个被作者明确标记为 "conjecture" 的结论,其严格证明可能需要更强的条件。

四、开放问题

  1. 充要条件E[ε² + η²] < ∞ 是否是 ˆθ√n 一致且渐近正态的充要条件?本文的 Proposition 1 和模拟提供了支持性证据,但严格的证明(在比 Assumption 2 更弱的条件下)仍然是一个开放问题。扎根点:Proposition 1 的陈述和其后的讨论("We could thus expect that here as well...")。

  2. 半参数效率ˆθ 是否是 θ₀ 的半参数有效估计量?其渐近方差 σ² 是否达到了半参数效率界?Sun & Tchetgen (2025) 声称他们的去偏估计量是有效的,但本文的 ˆθ 是一个简单的 plug-in 估计量。比较两者的效率,或推导 θ₀ 在本文设定下的效率界,是一个自然且重要的后续问题。扎根点:Introduction 中引用了 Sun & Tchetgen (2025),但未讨论效率问题。

  3. 协变量的纳入:如何将本文的弱假设结果扩展到包含协变量的情形?Sun & Tchetgen (2025) 处理了协变量,但依赖于高层条件。能否在类似本文的低层条件下,为含协变量的 CIC 模型建立渐近理论?扎根点:Introduction 中对 Sun & Tchetgen (2025) 的讨论("their result holds under a high-level condition...")。

  4. 更一般的泛函:本文的方法能否推广到其他涉及分位数-分位数变换的泛函,例如 Vuong & Xu (2017) 和 Wüthrich (2020) 中非参数工具变量分位数回归中的目标参数?扎根点:Introduction 第一段。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论