Asymptotic Properties of Empirical Quantile-Based Estimators¶

作者: Julien Chhor, Xavier D'Haultfœuille, Jérémy L'Hour, Martin Mugnier
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2607.00219

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的核心问题是：如何对形如 θ₀ = E[F_Y⁻¹ ∘ F_Z(X)] 的参数进行统计推断。这类参数出现在 Athey & Imbens (2006) 的 "changes-in-changes" (CIC) 因果推断模型中，用于估计分位数处理效应。具体来说，CIC 模型利用两期（处理前/后）和两组（处理组/对照组）的重复截面数据，在非参数设定下识别处理效应的整个分布。其关键识别步骤涉及分位数-分位数变换（quantile-quantile transform），最终的平均处理效应（ATE）就表达为上述形式。该方向当前的核心瓶颈是：现有渐近理论对变量分布施加了过强的有界性和光滑性假设，限制了其在工资、价格、利润等无界经济变量上的应用。

发展脉络¶

奠基工作：Athey & Imbens (2006)
- 做了什么：提出了 CIC 模型，证明了 plug-in 估计量 ˆθ 的渐近正态性，并给出了一个相合的方差估计量。
- 留下什么口子：其证明依赖于三个关键假设：(a) 所有变量有界支撑；(b) 每个变量有连续可微密度；(c) 密度在支撑上有上下界。作者自己承认这些假设对许多经济变量（如工资）过于严格。
主要进展（两条子线索）：
- 子线索 1：放宽假设的尝试
  - de Chaisemartin & D'Haultfœuille (2018)：在证明一个相关泛函的 Hadamard 可微性时，仍然依赖于变量有界和密度有下界的假设。本文作者指出，当变量无界时，Hadamard 可微性失效，因为 F ↦ ∫ g dF 在 g 无界时关于上确界范数不连续。
  - Sun & Tchetgen (2025)：提出了一个去偏且半参数有效的 CIC 估计量，可以灵活地包含连续协变量。但本文作者指出，他们的结果依赖于一个高层条件（Assumption 4(a)），而本文的工作表明，即使在无协变量的情况下，建立弱且低层的渐近正态性条件也非平凡。
- 子线索 2：相关过程的收敛性
  - Beare & Kaji (2026)：在类似本文的弱条件下，建立了 ˆF ∘ ˆG⁻¹ 过程在 L¹([0,1]) 上的依分布收敛。但本文作者指出，他们研究的量是 ∫₀¹ [ˆF_Y⁻¹ ∘ ˆF_Z] dˆF_X，这涉及 ˆF_X 带来的额外随机性，并非 Beare & Kaji (2026) 结果的直接推论。
- 子线索 3：L-统计量的渐近理论
  - Mason & Shorack (1992)：在更简单的设定下（F_X 和 F_Z 已知），证明了 L-统计量 √n 一致且渐近正态的充要条件是某个积分（类似于本文的 E[η²]）有限。这为本文猜想 E[ε² + η²] < ∞ 可能是 ˆθ 渐近正态的充要条件提供了理论基础。
当前 Frontier 与本文位置：
- 当前 frontier 是在尽可能弱的条件下（允许无界变量、密度可趋于 0 或无穷）建立 ˆθ 的渐近正态性，并提供可靠的方差估计。
- 本文的位置：本文是第一个在无界变量假设下，系统性地建立 ˆθ 的 √n 一致性与渐近正态性，并给出相合方差估计量的工作。它填补了 Athey & Imbens (2006) 理论中的一个关键空白，并揭示了该问题在技术上的核心困难（Hadamard 可微性失效，无法直接套用标准 L-统计量结果）。

子线索聚类¶

CIC 模型及其扩展：Athey & Imbens (2006), de Chaisemartin & D'Haultfœuille (2018), Sun & Tchetgen (2025)。这一簇关注 CIC 模型的识别、估计和推断，以及向模糊 DID、含协变量情形的推广。
分位数-分位数过程与 L-统计量：Beare & Kaji (2026), Mason & Shorack (1992), Shorack & Wellner (1986)。这一簇研究 ˆF ∘ ˆG⁻¹ 这类过程的渐近性质，以及 L-统计量的渐近理论，为本文提供了技术工具和理论基准。
变带宽核密度估计：Jones (1990), Terrell & Scott (1992), Chhor & Carpentier (2025)。这一簇研究带宽随位置变化的核密度估计量，本文将其用于估计 f_U，并利用其在边界附近自动收缩带宽的特性，来处理 f_U 可能发散的问题。

这个方向在追问的核心问题¶

弱假设下的渐近正态性：在允许变量无界、密度可趋于 0 或无穷的条件下，ˆθ 是否仍然 √n 一致且渐近正态？需要什么样的正则条件？
渐近方差的可靠估计：当密度可能取任意小值时，如何构造一个不依赖逆密度加权的、相合的方差估计量？
条件的必要性：渐近正态性所需的条件在多大程度上是必要的？是否存在一个清晰的阈值，超过该阈值后 √n 收敛和正态性就会失效？
面板数据情形的处理：当 Y 和 Z 在同一单元上观测（相关）时，如何调整估计和推断方法？

⚠️ 作者的 framing¶

作者的缺口 frame：作者将缺口 frame 为 "Athey & Imbens (2006) 的假设过于严格，限制了方法在无界经济变量上的应用"。因此，本文的贡献被定位为 "在更弱条件下获得类似结果"，并 "揭示这些条件在某种意义上是必要的"。
被淡化/回避的竞争路线：
- Sun & Tchetgen (2025) 的去偏方法：作者承认其处理了协变量，但将其结果归为 "高层条件"，并强调本文的工作表明即使在无协变量时建立低层条件也非平凡。这实际上是在暗示，Sun & Tchetgen (2025) 的假设可能并不容易验证，而本文提供了更透明、更易检验的条件。
- Bootstrap 方法：作者在模拟中包含了 Bootstrap，但并未将其作为主要理论贡献。在正文中，作者指出当条件不满足时，Bootstrap 的表现也很差，暗示了基于渐近正态性的推断在边界情况下的根本性困难。
什么明显该被引/该存在、却没出现在 intro 里？：intro 中未提及任何关于半参数效率界的讨论。对于 θ₀ 这个泛函，其半参数效率界是什么？本文的 ˆθ 是否达到了这个界？Sun & Tchetgen (2025) 声称他们的估计量是半参数有效的，但本文的估计量呢？这是一个值得研究者去查的问题：本文的方差表达式是否与半参数效率界一致？如果不一致，差距有多大？

张力¶

未见明显对立引用。各工作之间是互补关系：Athey & Imbens (2006) 奠基，de Chaisemartin & D'Haultfœuille (2018) 扩展，Sun & Tchetgen (2025) 引入去偏和协变量，Beare & Kaji (2026) 研究相关过程，Mason & Shorack (1992) 提供 L-统计量的理论基础。本文则是在更弱的假设下统一和深化了这些结果。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- X, Y, Z：三个随机变量。在 CIC 模型中，Y 是处理组后处理结果，Z 是处理组前处理结果，X 是对照组前处理结果。
- F_W：随机变量 W 的累积分布函数 (cdf)。
- F_W⁻¹：F_W 的左连续广义逆，即分位数函数。
- U := F_Z(X)：一个潜在变量，是 X 经过 Z 的分布函数变换后的结果。它是不可观测的，因为 F_Z 未知。
- θ₀ := E[F_Y⁻¹ ∘ F_Z(X)] = E[F_Y⁻¹(U)]：目标参数，即平均处理效应。
- (Y_i)_{i=1,...,n₁}, (X_i)_{i=1,...,n₂}, (Z_i)_{i=1,...,n₃}：三个独立同分布样本，分别来自 F_Y, F_X, F_Z。样本量分别为 n₁, n₂, n₃。
- N := min(n₁, n₂, n₃)：用于定义收敛速度的有效样本量。
- ˆF_W：F_W 的经验分布函数。
- ˆF_W⁻¹：F_W 的经验分位数函数。
- ˆθ := (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(ˆF_Z(X_i))：θ₀ 的 plug-in 估计量。
- λ_k := lim_{N→∞} N/n_k：样本量比例极限，k=1,2,3。
模型：
- 数据生成机制由三个独立的 i.i.d. 样本 (Y_i), (X_i), (Z_i) 描述。它们分别服从分布 F_Y, F_X, F_Z。
- 目标参数 θ₀ 是 F_Y⁻¹ ∘ F_Z(X) 的期望。这是一个关于三个分布的泛函。
- 已知：F_Y, F_X, F_Z 是未知的，但它们是连续的（Assumption 2(i)-(ii)）。
- 要估的对象：θ₀。
可观测数据：
- 可观测：(Y_i), (X_i), (Z_i) 这三个样本。研究者可以计算它们的经验分布函数 ˆF_Y, ˆF_X, ˆF_Z。
- 不可观测（潜在）：
  - U = F_Z(X)：因为 F_Z 未知，所以 U 是潜在变量。
  - F_Y⁻¹(U)：因为 U 不可观测，所以即使 F_Y 已知，这个量也是潜在的。
- 关键识别假设：θ₀ 的识别依赖于 U = F_Z(X) 这个关系。在 CIC 模型中，这来自于处理组和对照组在无处理时的潜在结果分布相同的假设。

第二步：讲最小内核¶

本文的核心数学困难在于：当变量无界时，泛函 (F_Y, F_X, F_Z) ↦ ∫ F_Y⁻¹ ∘ F_Z dF_X 不再是 Hadamard 可微的。因此，不能直接使用 Delta 方法。作者需要找到一种新的线性化方法。

最简特例：考虑一个极度简化的情形，其中 F_Z 是已知的。这意味着 U = F_Z(X) 是可观测的。那么 θ₀ = E[F_Y⁻¹(U)]，而 ˆθ = (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(U_i)。

在这个特例下，问题退化为一个带随机权重的 L-统计量问题。ˆθ 可以写成： ˆθ = ∫₀¹ ˆF_Y⁻¹(t) dˆF_U(t)，其中 ˆF_U 是 U 的经验分布函数。

核心思路：即使在这个简化情形下，标准 L-统计量理论（如 Shorack & Wellner, 1986, Chapter 19）也不直接适用，因为那些理论通常假设权重函数（这里是 dˆF_U）是已知的或具有更简单的结构。这里的权重 dˆF_U 本身是随机的，且与 ˆF_Y⁻¹ 相关。

关键想法：作者将 ˆθ - θ₀ 分解为两部分： ˆθ - θ₀ = [∫₀¹ ˆF_Y⁻¹(t) dF_U(t) - ∫₀¹ F_Y⁻¹(t) dF_U(t)] + [∫₀¹ ˆF_Y⁻¹(t) d(ˆF_U - F_U)(t)] =: T₁ + T₂。

T₁ 的线性化：T₁ 是 F_Y 的估计误差带来的。作者证明，在尾部条件下，T₁ 可以线性化为 (1/n₁) Σ η_i，其中 η_i = -∫₀¹ [1{F_Y(Y_i) ≤ t} - t] f_U(t) dF_Y⁻¹(t)。这本质上是一个关于 F_Y 的 von Mises 展开，但需要处理积分边界和尾部行为。
T₂ 的线性化：T₂ 是 F_U 的估计误差带来的。作者证明，T₂ 可以线性化为 (1/n₂) Σ ε_i，其中 ε_i = -∫₀¹ [1{U_i ≤ t} - F_U(t)] dF_Y⁻¹(t) = θ₀ - F_Y⁻¹(U_i)。这个线性化相对直接，因为 ˆF_U 是标准经验分布函数。

为什么这个特例抓住了核心：即使 F_Z 已知，证明 T₁ 的线性化也需要处理无界变量带来的技术困难。T₁ 的线性化是本文证明中最具技术挑战性的部分之一。当 F_Z 未知时，还会多出一个 T₃ 项，它对应于 F_Z 的估计误差，其处理方式与 T₁ 类似，但需要更复杂的工具（如加权分位数过程）。因此，理解 F_Z 已知的特例，就抓住了本文证明的核心思想：将 ˆθ 的误差分解为三个独立样本的估计误差之和，并分别对每一项进行线性化，最终证明其渐近正态性。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在允许变量无界、密度可趋于 0 或无穷的弱条件下，研究形如 θ₀ = E[F_Y⁻¹ ∘ F_Z(X)] 的参数的 plug-in 估计量 ˆθ 的渐近性质，并构造相合的方差估计量。
核心工具/方法：利用加权/未加权的经验过程与分位数过程理论（Csörgő et al., 1986; Shorack & Wellner, 1986）、Beta 分布的性质、L-统计量的刻画（Hecker, 1976），以及一种新颖的、带宽随 u(1-u) 变化的核密度估计量。
主要结论：在 Assumptions 1-2 下，ˆθ 是 √N 一致且渐近正态的（Theorem 1）。在 Assumptions 1, 3, 4 下，提出的方差估计量 ˆσ² 是相合的（Theorem 2）。模拟表明，渐近正态性的条件在某种意义上是紧的，且新方差估计量优于 Athey & Imbens (2006) 的估计量。

关键设定与假设¶

Assumption 1 (Sampling)：三个样本独立同分布且相互独立，样本量比例收敛到正常数。这是标准的多样本设定。
Assumption 2 (Smoothness)：
- (i) F_Z 绝对连续，密度 f_Z 支撑在 [z, ¯z] 上（允许无界）。
- (ii) F_Y 连续，且 |F_Y⁻¹(t)| ≤ C_Y t^{-d₁}(1-t)^{-d₂}。这控制了 Y 的尾部行为。d₁, d₂ 越大，Y 的尾部越厚。相比 Athey & Imbens (2006)：这是对无界变量的显式允许，且用多项式尾部控制代替了有界支撑假设。
- (iii) F_U 绝对连续，密度 f_U 连续，且 f_U(u) ≤ C_U u^{-b₁}(1-u)^{-b₂}。这控制了 U 的密度在边界附近的行为。b₁, b₂ 越大，f_U 在边界处发散得越快。相比 Athey & Imbens (2006)：允许密度在边界处发散，而不是要求有下界。
- (iv) b₁ + d₁ < 1/2 且 b₂ + d₂ < 1/2。这是核心的尾部条件，它限制了 Y 和 U 的尾部不能同时太厚。相比 Athey & Imbens (2006)：这是全新的、更弱的条件。Athey & Imbens (2006) 的假设 (a)-(c) 隐含了 b₁ = b₂ = d₁ = d₂ = 0，显然满足此条件。
Assumption 3 (Bandwidth conditions)：对变带宽核密度估计的带宽序列 ε_n 的条件。要求 ε_n → 0, nε_n → ∞，且 (log(n)/√n)^{1/2 - b_j - d_j} = o(ε_n)。这确保了带宽在边界处收缩得足够慢，以控制偏差，但又足够快，以控制方差。
Assumption 4 (Smoothness for variance estimation)：对 Assumption 2 的加强。
- (ii) 要求 F_Y⁻¹ 可微，且其导数有类似的多项式尾部控制。
- (iii) 要求函数 g(s,t) = (s∧t)^{2b₁}(¯s∧¯t)^{2b₂} f_U(s) f_U(t) 是 β-Hölder 连续的。这是一个光滑性条件，用于控制核密度估计的偏差。
- (iv) (b₁ ∨ b₂) + (d₁ ∨ d₂) < 1/2。比 Assumption 2(iv) 略强，要求 b 和 d 的最大值之和小于 1/2。

主要结果¶

Theorem 1 (Asymptotic Normality of ˆθ)：
- 陈述：在 Assumptions 1 和 2 下，√N(ˆθ - θ₀) → N(0, σ²)，其中 σ² = (λ₁ + λ₃)E[η²] + λ₂E[ε²]。
- 直觉：渐近方差由三部分组成，分别对应 Y, X, Z 三个样本的估计误差。η 和 ε 是影响函数（influence function）的近似。
- 必要条件：b₁ + d₁ < 1/2 和 b₂ + d₂ < 1/2。Proposition 1 表明，在 F_Y⁻¹ 可微且边界行为被 (4) 式控制时，这个条件是 E[ε² + η²] < ∞ 的必要条件，从而也是渐近正态性的必要条件。这是本文的一个关键洞察：√n 收敛和正态性对 Y 和 U 的尾部有联合约束。
- 解决的技术难点：克服了 Hadamard 不可微性，通过精细的分解和加权经验过程理论，将 ˆθ - θ₀ 线性化为三个独立影响函数之和。
Theorem 2 (Consistency of Variance Estimator ˆσ²)：
- 陈述：在 Assumptions 1, 3, 4 下，ˆσ² → σ² in probability。
- 直觉：ˆσ² 由两部分组成：(N/n₂) Σ ˆε_i² 估计 λ₂E[ε²]，另一部分估计 (λ₁+λ₃)E[η²]。估计 E[η²] 的关键是 Lemma 2，它给出了一个不涉及逆密度加权的表达式。然后，作者用样本分裂和变带宽核密度估计来 plug-in 这个表达式。
- 解决的技术难点：避免了 Athey & Imbens (2006) 方差估计量中出现的逆密度加权项，该加权项在密度可能取任意小值时难以处理。变带宽核密度估计量 ˆf_U 的带宽 h_{n,u} = ε_n u(1-u) 在 u→0 或 u→1 时收缩，这恰好补偿了 f_U(u) 可能发散的行为，从而在不要求 ˆf_U 一致相合的情况下，得到了 ∫ f_U dF_Y⁻¹ 这类泛函的相合估计。

证明路线与技术技巧¶

整体路线（Theorem 1）：
1. 分解：将 ˆθ - θ₀ 分解为 T₁ + T₂ + T₃，分别对应 F_Y, F_U, F_Z 的估计误差。
2. 线性化 T₁：利用积分变换和分部积分，将 T₁ 转化为 ∫ [G_{n₁} - I] dΛ 的形式，其中 G_{n₁} 是 (F_Y(Y_i)) 的经验分布函数，dΛ = f_U dF_Y⁻¹。然后证明 T₁ 可以近似为 (1/n₁) Σ η_i。关键技巧：使用 Beta 分布的性质和加权经验过程结果（Csörgő et al., 1986）来控制边界项和余项。
3. 线性化 T₂：通过分部积分和证明 ∫ [ˆF_U ∘ G_{n₁} - F_U ∘ G_{n₁}] dF_Y⁻¹ ≈ ∫ [ˆF_U - F_U] dF_Y⁻¹，将 T₂ 线性化为 (1/n₂) Σ ε_i。关键技巧：利用经验过程 V_{n₂} = √n₂(ˆF_U ∘ F_U⁻¹ - I) 的连续性，证明 R₅ = ∫ (V_{n₂} ∘ F_U ∘ G_{n₁} - V_{n₂} ∘ F_U) dF_Y⁻¹ 的期望趋于 0。
4. 线性化 T₃：这是最复杂的部分。首先将 T₃ 转化为一个 L-统计量 J₂ 加上余项。J₂ 的形式为 ∫ [H_{n₃}⁻¹(x) - E[H_{n₃}⁻¹(x)]] f_U(x) dF_Y⁻¹(x)，其中 H_{n₃} 是 (F_Z(Z_i)) 的经验分布函数。关键技巧：利用 Hecker (1976) 对 L-统计量的刻画，证明 J₂ 是渐近正态的。处理 T₃ 的余项需要用到 Lemma 8，该引理建立了 H_{n₃}⁻¹ ∘ G_{n₁} 的矩性质。
5. 合并：由于三个样本独立，(1/√n₁) Σ η_i, (1/√n₂) Σ ε_i, 和 √n₃ J₂ 是渐近独立的，它们的加权和收敛到正态分布。
关键跳跃点：
- T₁ 的线性化：从 ∫ F_Y⁻¹ d(F_U ∘ G_{n₁}) 到 ∫ [G_{n₁} - I] dΛ 的转换，以及证明所有边界项和余项（R₁ 到 R₄）都是 o_P(1)。这依赖于对 Y 和 U 尾部行为的精细控制。
- T₃ 的线性化：将 T₃ 转化为 L-统计量 J₂ 的过程，以及证明 R₆ 到 R₉ 四个余项都是 o_P(1)。这需要 Lemma 8 来建立 H_{n₃}⁻¹ ∘ G_{n₁} 的矩性质，并利用 Beta 分布的性质。
技术技巧点名：
- 加权经验/分位数过程：用于处理 T₁ 和 T₃ 中的余项，特别是 Csörgő et al. (1986) 的 Corollary 4.3.1，用于控制加权分位数过程的 sup-norm。
- Beta 分布：用于计算 E[|Y_(1)|], E[|Y_(n₁)|] 等矩，以及 Lemma 8 中 H_{n₃}⁻¹ 的期望和绝对偏差。
- L-统计量刻画：Hecker (1976) 的结果用于处理 T₃ 线性化后得到的 L-统计量 J₂。
- 变带宽核密度估计：用于估计 f_U，其带宽 h_{n,u} ∝ u(1-u) 是处理 f_U 在边界发散的关键。
- 样本分裂：用于方差估计，以确保 ˆf_U^{(1)}, ˆf_U^{(2)}, ˆF_Y^{(1)}, ˆF_Y^{(2)} 之间的独立性，从而简化证明。

真实例子与应用¶

本文为纯理论，无实证例子。但包含蒙特卡洛模拟。

模拟设计：数据生成过程（DGP）被精心设计，以精确控制 Assumption 2 中的参数 (b₁, b₂, d₁, d₂)。Y 的生成使用 F_Y⁻¹(t) = -t^{-d₁} + (1-t)^{-d₂}，U 服从 Beta(1-b₁, 1-b₂) 分布，Z 为标准正态，X = F_Z⁻¹(U)。
模拟目的：
1. 验证 Theorem 1 的紧性：通过改变 (b₂, d₂) 的值，观察 ˆθ 的收敛速度。图 1 显示，当 b₂ + d₂ < 0.5 时，log(IQR(ˆθ)) 对 log(N) 的斜率接近 -1/2（√n 收敛）；当 b₂ + d₂ ≥ 0.5 时，斜率明显偏离 -1/2，收敛速度变慢。这支持了 Assumption 2(iv) 在某种意义上是必要的。
2. 验证渐近正态性：图 2 显示，当 (b₂, d₂) = (0.2, 0.2)（满足条件）时，√N(ˆθ - θ₀)/σ 的分布接近标准正态；当 (b₂, d₂) = (0.3, 0.3)（不满足条件）时，即使 N=10,000，分布也明显左偏，偏离正态。
3. 比较方差估计量：表 1 比较了六种置信区间的覆盖率和平均长度。结果显示：
  - 当条件满足时，所有方法（包括 Bootstrap）的覆盖率都接近 95%。
  - 本文提出的方差估计量（"No split" 列）表现良好，与 Bootstrap 相当。
  - Athey & Imbens (2006) 的估计量（"AI" 列）覆盖率略低。
  - 使用恒定带宽的变体（"Unif" 列）覆盖率显著偏低，尤其是在 (b₂, d₂) = (0.2, 0.2) 时，即使 N=10,000 也只有 85%。这有力地证明了变带宽的必要性。
  - 当条件不满足时，所有方法的覆盖率都很差，且不随 N 增加而改善，进一步支持了条件的必要性。

🔎 结论是否比证明窄¶

Theorem 1 的陈述：√N(ˆθ - θ₀) → N(0, σ²)。证明中要求 min(λ₁, λ₃) > 0。这意味着 n₁ 和 n₃ 都必须与 N 同阶增长。如果 λ₃ = 0（即 n₃ 相对于 n₁, n₂ 增长慢得多），定理不直接适用。但作者在正文中说明，如果 F_Z 已知（即 U 可观测），则 λ₃ 设为 0 时结论仍成立。这暗示了 λ₃ > 0 可能只是一个技术条件，而非本质要求。这是一个值得注意的窄结论：定理的正式陈述排除了 n₃ 增长慢于 n₁ 和 n₂ 的情形，但作者通过非正式讨论暗示了更广的适用性。
Proposition 1：声称 Assumption 2(iv) 是 E[ε² + η²] < ∞ 的必要条件。但该命题依赖于一个额外的假设 (4)，即 f_U(u) F_Y⁻¹'(u) ≥ C u^{-b₁-d₁-1}(1-u)^{-b₂-d₂-1}。这个假设要求 F_Y⁻¹ 可微，并且其导数在边界处有下界。如果这个假设不成立，E[ε² + η²] < ∞ 是否仍然需要 b_k + d_k < 1/2？作者在正文中将其表述为 "in some sense, sharp"，并引用 Mason & Shorack (1992) 在更简单设定下的充要条件来支持这一猜想。这是一个被作者明确标记为 "conjecture" 的结论，其严格证明可能需要更强的条件。

四、开放问题¶

充要条件：E[ε² + η²] < ∞ 是否是 ˆθ 为 √n 一致且渐近正态的充要条件？本文的 Proposition 1 和模拟提供了支持性证据，但严格的证明（在比 Assumption 2 更弱的条件下）仍然是一个开放问题。扎根点：Proposition 1 的陈述和其后的讨论（"We could thus expect that here as well..."）。
半参数效率：ˆθ 是否是 θ₀ 的半参数有效估计量？其渐近方差 σ² 是否达到了半参数效率界？Sun & Tchetgen (2025) 声称他们的去偏估计量是有效的，但本文的 ˆθ 是一个简单的 plug-in 估计量。比较两者的效率，或推导 θ₀ 在本文设定下的效率界，是一个自然且重要的后续问题。扎根点：Introduction 中引用了 Sun & Tchetgen (2025)，但未讨论效率问题。
协变量的纳入：如何将本文的弱假设结果扩展到包含协变量的情形？Sun & Tchetgen (2025) 处理了协变量，但依赖于高层条件。能否在类似本文的低层条件下，为含协变量的 CIC 模型建立渐近理论？扎根点：Introduction 中对 Sun & Tchetgen (2025) 的讨论（"their result holds under a high-level condition..."）。
更一般的泛函：本文的方法能否推广到其他涉及分位数-分位数变换的泛函，例如 Vuong & Xu (2017) 和 Wüthrich (2020) 中非参数工具变量分位数回归中的目标参数？扎根点：Introduction 第一段。

Maintained by 陈星宇 · Homepage · Source on GitHub