Asymptotic Properties of Empirical Quantile-Based Estimators¶
作者: Julien Chhor, Xavier D'Haultfœuille, Jérémy L'Hour, Martin Mugnier
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2607.00219
一、领域脉络与小综述¶
这个方向是什么¶
本文研究的核心问题是:如何对形如 θ₀ = E[F_Y⁻¹ ∘ F_Z(X)] 的参数进行统计推断。这类参数出现在 Athey & Imbens (2006) 的 "changes-in-changes" (CIC) 因果推断模型中,用于估计分位数处理效应。具体来说,CIC 模型利用两期(处理前/后)和两组(处理组/对照组)的重复截面数据,在非参数设定下识别处理效应的整个分布。其关键识别步骤涉及分位数-分位数变换(quantile-quantile transform),最终的平均处理效应(ATE)就表达为上述形式。该方向当前的核心瓶颈是:现有渐近理论对变量分布施加了过强的有界性和光滑性假设,限制了其在工资、价格、利润等无界经济变量上的应用。
发展脉络¶
-
奠基工作:Athey & Imbens (2006)
- 做了什么:提出了 CIC 模型,证明了 plug-in 估计量
ˆθ的渐近正态性,并给出了一个相合的方差估计量。 - 留下什么口子:其证明依赖于三个关键假设:(a) 所有变量有界支撑;(b) 每个变量有连续可微密度;(c) 密度在支撑上有上下界。作者自己承认这些假设对许多经济变量(如工资)过于严格。
- 做了什么:提出了 CIC 模型,证明了 plug-in 估计量
-
主要进展(两条子线索):
- 子线索 1:放宽假设的尝试
- de Chaisemartin & D'Haultfœuille (2018):在证明一个相关泛函的 Hadamard 可微性时,仍然依赖于变量有界和密度有下界的假设。本文作者指出,当变量无界时,Hadamard 可微性失效,因为
F ↦ ∫ g dF在g无界时关于上确界范数不连续。 - Sun & Tchetgen (2025):提出了一个去偏且半参数有效的 CIC 估计量,可以灵活地包含连续协变量。但本文作者指出,他们的结果依赖于一个高层条件(Assumption 4(a)),而本文的工作表明,即使在无协变量的情况下,建立弱且低层的渐近正态性条件也非平凡。
- de Chaisemartin & D'Haultfœuille (2018):在证明一个相关泛函的 Hadamard 可微性时,仍然依赖于变量有界和密度有下界的假设。本文作者指出,当变量无界时,Hadamard 可微性失效,因为
- 子线索 2:相关过程的收敛性
- Beare & Kaji (2026):在类似本文的弱条件下,建立了
ˆF ∘ ˆG⁻¹过程在L¹([0,1])上的依分布收敛。但本文作者指出,他们研究的量是∫₀¹ [ˆF_Y⁻¹ ∘ ˆF_Z] dˆF_X,这涉及ˆF_X带来的额外随机性,并非 Beare & Kaji (2026) 结果的直接推论。
- Beare & Kaji (2026):在类似本文的弱条件下,建立了
- 子线索 3:L-统计量的渐近理论
- Mason & Shorack (1992):在更简单的设定下(
F_X和F_Z已知),证明了 L-统计量√n一致且渐近正态的充要条件是某个积分(类似于本文的E[η²])有限。这为本文猜想E[ε² + η²] < ∞可能是ˆθ渐近正态的充要条件提供了理论基础。
- Mason & Shorack (1992):在更简单的设定下(
- 子线索 1:放宽假设的尝试
-
当前 Frontier 与本文位置:
- 当前 frontier 是在尽可能弱的条件下(允许无界变量、密度可趋于 0 或无穷)建立
ˆθ的渐近正态性,并提供可靠的方差估计。 - 本文的位置:本文是第一个在无界变量假设下,系统性地建立
ˆθ的√n一致性与渐近正态性,并给出相合方差估计量的工作。它填补了 Athey & Imbens (2006) 理论中的一个关键空白,并揭示了该问题在技术上的核心困难(Hadamard 可微性失效,无法直接套用标准 L-统计量结果)。
- 当前 frontier 是在尽可能弱的条件下(允许无界变量、密度可趋于 0 或无穷)建立
子线索聚类¶
- CIC 模型及其扩展:Athey & Imbens (2006), de Chaisemartin & D'Haultfœuille (2018), Sun & Tchetgen (2025)。这一簇关注 CIC 模型的识别、估计和推断,以及向模糊 DID、含协变量情形的推广。
- 分位数-分位数过程与 L-统计量:Beare & Kaji (2026), Mason & Shorack (1992), Shorack & Wellner (1986)。这一簇研究
ˆF ∘ ˆG⁻¹这类过程的渐近性质,以及 L-统计量的渐近理论,为本文提供了技术工具和理论基准。 - 变带宽核密度估计:Jones (1990), Terrell & Scott (1992), Chhor & Carpentier (2025)。这一簇研究带宽随位置变化的核密度估计量,本文将其用于估计
f_U,并利用其在边界附近自动收缩带宽的特性,来处理f_U可能发散的问题。
这个方向在追问的核心问题¶
- 弱假设下的渐近正态性:在允许变量无界、密度可趋于 0 或无穷的条件下,
ˆθ是否仍然√n一致且渐近正态?需要什么样的正则条件? - 渐近方差的可靠估计:当密度可能取任意小值时,如何构造一个不依赖逆密度加权的、相合的方差估计量?
- 条件的必要性:渐近正态性所需的条件在多大程度上是必要的?是否存在一个清晰的阈值,超过该阈值后
√n收敛和正态性就会失效? - 面板数据情形的处理:当
Y和Z在同一单元上观测(相关)时,如何调整估计和推断方法?
⚠️ 作者的 framing¶
- 作者的缺口 frame:作者将缺口 frame 为 "Athey & Imbens (2006) 的假设过于严格,限制了方法在无界经济变量上的应用"。因此,本文的贡献被定位为 "在更弱条件下获得类似结果",并 "揭示这些条件在某种意义上是必要的"。
- 被淡化/回避的竞争路线:
- Sun & Tchetgen (2025) 的去偏方法:作者承认其处理了协变量,但将其结果归为 "高层条件",并强调本文的工作表明即使在无协变量时建立低层条件也非平凡。这实际上是在暗示,Sun & Tchetgen (2025) 的假设可能并不容易验证,而本文提供了更透明、更易检验的条件。
- Bootstrap 方法:作者在模拟中包含了 Bootstrap,但并未将其作为主要理论贡献。在正文中,作者指出当条件不满足时,Bootstrap 的表现也很差,暗示了基于渐近正态性的推断在边界情况下的根本性困难。
- 什么明显该被引/该存在、却没出现在 intro 里?:intro 中未提及任何关于半参数效率界的讨论。对于
θ₀这个泛函,其半参数效率界是什么?本文的ˆθ是否达到了这个界?Sun & Tchetgen (2025) 声称他们的估计量是半参数有效的,但本文的估计量呢?这是一个值得研究者去查的问题:本文的方差表达式是否与半参数效率界一致?如果不一致,差距有多大?
张力¶
未见明显对立引用。各工作之间是互补关系:Athey & Imbens (2006) 奠基,de Chaisemartin & D'Haultfœuille (2018) 扩展,Sun & Tchetgen (2025) 引入去偏和协变量,Beare & Kaji (2026) 研究相关过程,Mason & Shorack (1992) 提供 L-统计量的理论基础。本文则是在更弱的假设下统一和深化了这些结果。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
X, Y, Z:三个随机变量。在 CIC 模型中,Y是处理组后处理结果,Z是处理组前处理结果,X是对照组前处理结果。F_W:随机变量W的累积分布函数 (cdf)。F_W⁻¹:F_W的左连续广义逆,即分位数函数。U := F_Z(X):一个潜在变量,是X经过Z的分布函数变换后的结果。它是不可观测的,因为F_Z未知。θ₀ := E[F_Y⁻¹ ∘ F_Z(X)] = E[F_Y⁻¹(U)]:目标参数,即平均处理效应。(Y_i)_{i=1,...,n₁}, (X_i)_{i=1,...,n₂}, (Z_i)_{i=1,...,n₃}:三个独立同分布样本,分别来自F_Y,F_X,F_Z。样本量分别为n₁, n₂, n₃。N := min(n₁, n₂, n₃):用于定义收敛速度的有效样本量。ˆF_W:F_W的经验分布函数。ˆF_W⁻¹:F_W的经验分位数函数。ˆθ := (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(ˆF_Z(X_i)):θ₀的 plug-in 估计量。λ_k := lim_{N→∞} N/n_k:样本量比例极限,k=1,2,3。
-
模型:
- 数据生成机制由三个独立的 i.i.d. 样本
(Y_i),(X_i),(Z_i)描述。它们分别服从分布F_Y,F_X,F_Z。 - 目标参数
θ₀是F_Y⁻¹ ∘ F_Z(X)的期望。这是一个关于三个分布的泛函。 - 已知:
F_Y,F_X,F_Z是未知的,但它们是连续的(Assumption 2(i)-(ii))。 - 要估的对象:
θ₀。
- 数据生成机制由三个独立的 i.i.d. 样本
-
可观测数据:
- 可观测:
(Y_i),(X_i),(Z_i)这三个样本。研究者可以计算它们的经验分布函数ˆF_Y,ˆF_X,ˆF_Z。 - 不可观测(潜在):
U = F_Z(X):因为F_Z未知,所以U是潜在变量。F_Y⁻¹(U):因为U不可观测,所以即使F_Y已知,这个量也是潜在的。
- 关键识别假设:
θ₀的识别依赖于U = F_Z(X)这个关系。在 CIC 模型中,这来自于处理组和对照组在无处理时的潜在结果分布相同的假设。
- 可观测:
第二步:讲最小内核¶
本文的核心数学困难在于:当变量无界时,泛函 (F_Y, F_X, F_Z) ↦ ∫ F_Y⁻¹ ∘ F_Z dF_X 不再是 Hadamard 可微的。因此,不能直接使用 Delta 方法。作者需要找到一种新的线性化方法。
最简特例:考虑一个极度简化的情形,其中 F_Z 是已知的。这意味着 U = F_Z(X) 是可观测的。那么 θ₀ = E[F_Y⁻¹(U)],而 ˆθ = (1/n₂) Σ_{i=1}^{n₂} ˆF_Y⁻¹(U_i)。
在这个特例下,问题退化为一个带随机权重的 L-统计量问题。ˆθ 可以写成:
ˆθ = ∫₀¹ ˆF_Y⁻¹(t) dˆF_U(t),其中 ˆF_U 是 U 的经验分布函数。
核心思路:即使在这个简化情形下,标准 L-统计量理论(如 Shorack & Wellner, 1986, Chapter 19)也不直接适用,因为那些理论通常假设权重函数(这里是 dˆF_U)是已知的或具有更简单的结构。这里的权重 dˆF_U 本身是随机的,且与 ˆF_Y⁻¹ 相关。
关键想法:作者将 ˆθ - θ₀ 分解为两部分:
ˆθ - θ₀ = [∫₀¹ ˆF_Y⁻¹(t) dF_U(t) - ∫₀¹ F_Y⁻¹(t) dF_U(t)] + [∫₀¹ ˆF_Y⁻¹(t) d(ˆF_U - F_U)(t)]
=: T₁ + T₂。
T₁的线性化:T₁是F_Y的估计误差带来的。作者证明,在尾部条件下,T₁可以线性化为(1/n₁) Σ η_i,其中η_i = -∫₀¹ [1{F_Y(Y_i) ≤ t} - t] f_U(t) dF_Y⁻¹(t)。这本质上是一个关于F_Y的 von Mises 展开,但需要处理积分边界和尾部行为。T₂的线性化:T₂是F_U的估计误差带来的。作者证明,T₂可以线性化为(1/n₂) Σ ε_i,其中ε_i = -∫₀¹ [1{U_i ≤ t} - F_U(t)] dF_Y⁻¹(t) = θ₀ - F_Y⁻¹(U_i)。这个线性化相对直接,因为ˆF_U是标准经验分布函数。
为什么这个特例抓住了核心:即使 F_Z 已知,证明 T₁ 的线性化也需要处理无界变量带来的技术困难。T₁ 的线性化是本文证明中最具技术挑战性的部分之一。当 F_Z 未知时,还会多出一个 T₃ 项,它对应于 F_Z 的估计误差,其处理方式与 T₁ 类似,但需要更复杂的工具(如加权分位数过程)。因此,理解 F_Z 已知的特例,就抓住了本文证明的核心思想:将 ˆθ 的误差分解为三个独立样本的估计误差之和,并分别对每一项进行线性化,最终证明其渐近正态性。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在允许变量无界、密度可趋于 0 或无穷的弱条件下,研究形如
θ₀ = E[F_Y⁻¹ ∘ F_Z(X)]的参数的 plug-in 估计量ˆθ的渐近性质,并构造相合的方差估计量。 - 核心工具/方法:利用加权/未加权的经验过程与分位数过程理论(Csörgő et al., 1986; Shorack & Wellner, 1986)、Beta 分布的性质、L-统计量的刻画(Hecker, 1976),以及一种新颖的、带宽随
u(1-u)变化的核密度估计量。 - 主要结论:在 Assumptions 1-2 下,
ˆθ是√N一致且渐近正态的(Theorem 1)。在 Assumptions 1, 3, 4 下,提出的方差估计量ˆσ²是相合的(Theorem 2)。模拟表明,渐近正态性的条件在某种意义上是紧的,且新方差估计量优于 Athey & Imbens (2006) 的估计量。
关键设定与假设¶
- Assumption 1 (Sampling):三个样本独立同分布且相互独立,样本量比例收敛到正常数。这是标准的多样本设定。
- Assumption 2 (Smoothness):
- (i)
F_Z绝对连续,密度f_Z支撑在[z, ¯z]上(允许无界)。 - (ii)
F_Y连续,且|F_Y⁻¹(t)| ≤ C_Y t^{-d₁}(1-t)^{-d₂}。这控制了Y的尾部行为。d₁, d₂越大,Y的尾部越厚。相比 Athey & Imbens (2006):这是对无界变量的显式允许,且用多项式尾部控制代替了有界支撑假设。 - (iii)
F_U绝对连续,密度f_U连续,且f_U(u) ≤ C_U u^{-b₁}(1-u)^{-b₂}。这控制了U的密度在边界附近的行为。b₁, b₂越大,f_U在边界处发散得越快。相比 Athey & Imbens (2006):允许密度在边界处发散,而不是要求有下界。 - (iv)
b₁ + d₁ < 1/2且b₂ + d₂ < 1/2。这是核心的尾部条件,它限制了Y和U的尾部不能同时太厚。相比 Athey & Imbens (2006):这是全新的、更弱的条件。Athey & Imbens (2006) 的假设 (a)-(c) 隐含了b₁ = b₂ = d₁ = d₂ = 0,显然满足此条件。
- (i)
- Assumption 3 (Bandwidth conditions):对变带宽核密度估计的带宽序列
ε_n的条件。要求ε_n → 0,nε_n → ∞,且(log(n)/√n)^{1/2 - b_j - d_j} = o(ε_n)。这确保了带宽在边界处收缩得足够慢,以控制偏差,但又足够快,以控制方差。 - Assumption 4 (Smoothness for variance estimation):对 Assumption 2 的加强。
- (ii) 要求
F_Y⁻¹可微,且其导数有类似的多项式尾部控制。 - (iii) 要求函数
g(s,t) = (s∧t)^{2b₁}(¯s∧¯t)^{2b₂} f_U(s) f_U(t)是 β-Hölder 连续的。这是一个光滑性条件,用于控制核密度估计的偏差。 - (iv)
(b₁ ∨ b₂) + (d₁ ∨ d₂) < 1/2。比 Assumption 2(iv) 略强,要求b和d的最大值之和小于 1/2。
- (ii) 要求
主要结果¶
-
Theorem 1 (Asymptotic Normality of
ˆθ):- 陈述:在 Assumptions 1 和 2 下,
√N(ˆθ - θ₀) → N(0, σ²),其中σ² = (λ₁ + λ₃)E[η²] + λ₂E[ε²]。 - 直觉:渐近方差由三部分组成,分别对应
Y,X,Z三个样本的估计误差。η和ε是影响函数(influence function)的近似。 - 必要条件:
b₁ + d₁ < 1/2和b₂ + d₂ < 1/2。Proposition 1 表明,在F_Y⁻¹可微且边界行为被 (4) 式控制时,这个条件是E[ε² + η²] < ∞的必要条件,从而也是渐近正态性的必要条件。这是本文的一个关键洞察:√n收敛和正态性对Y和U的尾部有联合约束。 - 解决的技术难点:克服了 Hadamard 不可微性,通过精细的分解和加权经验过程理论,将
ˆθ - θ₀线性化为三个独立影响函数之和。
- 陈述:在 Assumptions 1 和 2 下,
-
Theorem 2 (Consistency of Variance Estimator
ˆσ²):- 陈述:在 Assumptions 1, 3, 4 下,
ˆσ² → σ²in probability。 - 直觉:
ˆσ²由两部分组成:(N/n₂) Σ ˆε_i²估计λ₂E[ε²],另一部分估计(λ₁+λ₃)E[η²]。估计E[η²]的关键是 Lemma 2,它给出了一个不涉及逆密度加权的表达式。然后,作者用样本分裂和变带宽核密度估计来 plug-in 这个表达式。 - 解决的技术难点:避免了 Athey & Imbens (2006) 方差估计量中出现的逆密度加权项,该加权项在密度可能取任意小值时难以处理。变带宽核密度估计量
ˆf_U的带宽h_{n,u} = ε_n u(1-u)在u→0或u→1时收缩,这恰好补偿了f_U(u)可能发散的行为,从而在不要求ˆf_U一致相合的情况下,得到了∫ f_U dF_Y⁻¹这类泛函的相合估计。
- 陈述:在 Assumptions 1, 3, 4 下,
证明路线与技术技巧¶
-
整体路线(Theorem 1):
- 分解:将
ˆθ - θ₀分解为T₁ + T₂ + T₃,分别对应F_Y,F_U,F_Z的估计误差。 - 线性化
T₁:利用积分变换和分部积分,将T₁转化为∫ [G_{n₁} - I] dΛ的形式,其中G_{n₁}是(F_Y(Y_i))的经验分布函数,dΛ = f_U dF_Y⁻¹。然后证明T₁可以近似为(1/n₁) Σ η_i。关键技巧:使用 Beta 分布的性质和加权经验过程结果(Csörgő et al., 1986)来控制边界项和余项。 - 线性化
T₂:通过分部积分和证明∫ [ˆF_U ∘ G_{n₁} - F_U ∘ G_{n₁}] dF_Y⁻¹ ≈ ∫ [ˆF_U - F_U] dF_Y⁻¹,将T₂线性化为(1/n₂) Σ ε_i。关键技巧:利用经验过程V_{n₂} = √n₂(ˆF_U ∘ F_U⁻¹ - I)的连续性,证明R₅ = ∫ (V_{n₂} ∘ F_U ∘ G_{n₁} - V_{n₂} ∘ F_U) dF_Y⁻¹的期望趋于 0。 - 线性化
T₃:这是最复杂的部分。首先将T₃转化为一个 L-统计量J₂加上余项。J₂的形式为∫ [H_{n₃}⁻¹(x) - E[H_{n₃}⁻¹(x)]] f_U(x) dF_Y⁻¹(x),其中H_{n₃}是(F_Z(Z_i))的经验分布函数。关键技巧:利用 Hecker (1976) 对 L-统计量的刻画,证明J₂是渐近正态的。处理T₃的余项需要用到 Lemma 8,该引理建立了H_{n₃}⁻¹ ∘ G_{n₁}的矩性质。 - 合并:由于三个样本独立,
(1/√n₁) Σ η_i,(1/√n₂) Σ ε_i, 和√n₃ J₂是渐近独立的,它们的加权和收敛到正态分布。
- 分解:将
-
关键跳跃点:
T₁的线性化:从∫ F_Y⁻¹ d(F_U ∘ G_{n₁})到∫ [G_{n₁} - I] dΛ的转换,以及证明所有边界项和余项(R₁到R₄)都是o_P(1)。这依赖于对Y和U尾部行为的精细控制。T₃的线性化:将T₃转化为 L-统计量J₂的过程,以及证明R₆到R₉四个余项都是o_P(1)。这需要 Lemma 8 来建立H_{n₃}⁻¹ ∘ G_{n₁}的矩性质,并利用 Beta 分布的性质。
-
技术技巧点名:
- 加权经验/分位数过程:用于处理
T₁和T₃中的余项,特别是 Csörgő et al. (1986) 的 Corollary 4.3.1,用于控制加权分位数过程的 sup-norm。 - Beta 分布:用于计算
E[|Y_(1)|],E[|Y_(n₁)|]等矩,以及 Lemma 8 中H_{n₃}⁻¹的期望和绝对偏差。 - L-统计量刻画:Hecker (1976) 的结果用于处理
T₃线性化后得到的 L-统计量J₂。 - 变带宽核密度估计:用于估计
f_U,其带宽h_{n,u} ∝ u(1-u)是处理f_U在边界发散的关键。 - 样本分裂:用于方差估计,以确保
ˆf_U^{(1)},ˆf_U^{(2)},ˆF_Y^{(1)},ˆF_Y^{(2)}之间的独立性,从而简化证明。
- 加权经验/分位数过程:用于处理
真实例子与应用¶
本文为纯理论,无实证例子。但包含蒙特卡洛模拟。
- 模拟设计:数据生成过程(DGP)被精心设计,以精确控制 Assumption 2 中的参数
(b₁, b₂, d₁, d₂)。Y的生成使用F_Y⁻¹(t) = -t^{-d₁} + (1-t)^{-d₂},U服从Beta(1-b₁, 1-b₂)分布,Z为标准正态,X = F_Z⁻¹(U)。 - 模拟目的:
- 验证 Theorem 1 的紧性:通过改变
(b₂, d₂)的值,观察ˆθ的收敛速度。图 1 显示,当b₂ + d₂ < 0.5时,log(IQR(ˆθ))对log(N)的斜率接近-1/2(√n收敛);当b₂ + d₂ ≥ 0.5时,斜率明显偏离-1/2,收敛速度变慢。这支持了 Assumption 2(iv) 在某种意义上是必要的。 - 验证渐近正态性:图 2 显示,当
(b₂, d₂) = (0.2, 0.2)(满足条件)时,√N(ˆθ - θ₀)/σ的分布接近标准正态;当(b₂, d₂) = (0.3, 0.3)(不满足条件)时,即使N=10,000,分布也明显左偏,偏离正态。 - 比较方差估计量:表 1 比较了六种置信区间的覆盖率和平均长度。结果显示:
- 当条件满足时,所有方法(包括 Bootstrap)的覆盖率都接近 95%。
- 本文提出的方差估计量("No split" 列)表现良好,与 Bootstrap 相当。
- Athey & Imbens (2006) 的估计量("AI" 列)覆盖率略低。
- 使用恒定带宽的变体("Unif" 列)覆盖率显著偏低,尤其是在
(b₂, d₂) = (0.2, 0.2)时,即使N=10,000也只有 85%。这有力地证明了变带宽的必要性。 - 当条件不满足时,所有方法的覆盖率都很差,且不随
N增加而改善,进一步支持了条件的必要性。
- 验证 Theorem 1 的紧性:通过改变
🔎 结论是否比证明窄¶
- Theorem 1 的陈述:
√N(ˆθ - θ₀) → N(0, σ²)。证明中要求min(λ₁, λ₃) > 0。这意味着n₁和n₃都必须与N同阶增长。如果λ₃ = 0(即n₃相对于n₁, n₂增长慢得多),定理不直接适用。但作者在正文中说明,如果F_Z已知(即U可观测),则λ₃设为 0 时结论仍成立。这暗示了λ₃ > 0可能只是一个技术条件,而非本质要求。这是一个值得注意的窄结论:定理的正式陈述排除了n₃增长慢于n₁和n₂的情形,但作者通过非正式讨论暗示了更广的适用性。 - Proposition 1:声称 Assumption 2(iv) 是
E[ε² + η²] < ∞的必要条件。但该命题依赖于一个额外的假设 (4),即f_U(u) F_Y⁻¹'(u) ≥ C u^{-b₁-d₁-1}(1-u)^{-b₂-d₂-1}。这个假设要求F_Y⁻¹可微,并且其导数在边界处有下界。如果这个假设不成立,E[ε² + η²] < ∞是否仍然需要b_k + d_k < 1/2?作者在正文中将其表述为 "in some sense, sharp",并引用 Mason & Shorack (1992) 在更简单设定下的充要条件来支持这一猜想。这是一个被作者明确标记为 "conjecture" 的结论,其严格证明可能需要更强的条件。
四、开放问题¶
-
充要条件:
E[ε² + η²] < ∞是否是ˆθ为√n一致且渐近正态的充要条件?本文的 Proposition 1 和模拟提供了支持性证据,但严格的证明(在比 Assumption 2 更弱的条件下)仍然是一个开放问题。扎根点:Proposition 1 的陈述和其后的讨论("We could thus expect that here as well...")。 -
半参数效率:
ˆθ是否是θ₀的半参数有效估计量?其渐近方差σ²是否达到了半参数效率界?Sun & Tchetgen (2025) 声称他们的去偏估计量是有效的,但本文的ˆθ是一个简单的 plug-in 估计量。比较两者的效率,或推导θ₀在本文设定下的效率界,是一个自然且重要的后续问题。扎根点:Introduction 中引用了 Sun & Tchetgen (2025),但未讨论效率问题。 -
协变量的纳入:如何将本文的弱假设结果扩展到包含协变量的情形?Sun & Tchetgen (2025) 处理了协变量,但依赖于高层条件。能否在类似本文的低层条件下,为含协变量的 CIC 模型建立渐近理论?扎根点:Introduction 中对 Sun & Tchetgen (2025) 的讨论("their result holds under a high-level condition...")。
-
更一般的泛函:本文的方法能否推广到其他涉及分位数-分位数变换的泛函,例如 Vuong & Xu (2017) 和 Wüthrich (2020) 中非参数工具变量分位数回归中的目标参数?扎根点:Introduction 第一段。
Maintained by 陈星宇 · Homepage · Source on GitHub