Identification and Estimation of Semiparametric Multilayered Sample Selection Models¶
作者: Dongwoo Kim
主题: 非参数 / 半参数
相关性: 9/10
链接: https://arxiv.org/abs/2605.25519
一、核心问题与贡献¶
①研究了多层样本选择模型(先参与决策,再进行有序或无序分类排序)在无排除变量下的识别与估计问题。②核心工具是基于选择机制非线性构造的多指标控制函数,以及利用对称多项式进行降维的 sieve plug-in 估计量。③主要结论是:非参数有序选择产生双指标控制函数需至少3个连续协变量才能点识别,而多项 logit 的非线性自动保证识别;在可交换性下,初等对称多项式可实现降维;提出的两步 sieve 估计量具有 \(\sqrt{n}\) 一致性、渐近正态性及同方差下的半参数有效性。
二、基础设定¶
- 核心概念与符号:
- \(D_i \in \{0, 1, \dots, K\}\):选择变量(0为不参与,\(k \ge 1\) 为类别)
- \(Y_{ik}^* = \alpha_k + X_i\beta_k + V_{ik}\):潜在结果,\(\beta_k\) 为目标 estimand
- \(h_k(x)\):非参数有序选择中的阈值函数;\(u_k(x)\):多项选择中的效用函数
- \(\lambda_k(\cdot)\):选择偏差函数(控制函数)
- \(H_k(x) = (h_k(x), h_{k+1}(x))\):有序选择的双指标映射
- \(e_\ell\):非选中概率的第 \(\ell\) 阶初等对称多项式
- 关键假设:
- Assumption 1 (iv)-(v):Jacobian 矩阵满秩与左零空间张成条件(核心非线性识别条件)。含义:阈值函数对连续协变量的响应不能共线,且在不同取值点需提供“方向不同”的非线性变异。相比经典 Heckman 模型依赖排除变量的线性变异,此假设用非线性替代了排除变量。
- Assumption 3 (Exchangeability):联合分布对非选中类别指标置换不变。含义:未选中类别间的偏好冲击对称。放宽了 MNL 的 IIA 假设与 own-shock 假设,允许结果误差依赖于所有偏好冲击。
- Assumption 7:第一阶段非参估计率 \(\|\hat{g}_k - g_{k0}\|_\infty = o_p(n^{-1/4})\)。含义:标准的半参数 \(n^{-1/4}\) 收敛条件,保证第一阶段误差在第二阶段渐近可忽略。
- 问题背景:经典 Heckman 二元选择框架无法处理多层选择(参与+排序),若强行套用会将组内效应与组间成分效应混淆。最相关文献:1) Escanciano et al. (2016) / Kim & Lee (2025) 证明了二元选择中非线性可替代排除变量,本文将其推广至多指标情形,发现指标维数跃升导致识别条件质变;2) Dahl (2002) 提出基于选择概率的半参数修正,本文用初等对称多项式为其提供了维数降阶的严格理论依据;3) Kroft et al. (2024) 在多层选择下给出偏识别界,本文通过施加非线性/结构假设实现了点识别。
三、主要定理 / 核心结果¶
- Proposition 1 (Non-identification under injectivity):
- 原文陈述:若 \(H_k(x)\) 在条件支撑集上单射,则 \(\beta_k\) 不可识别:对任意 \(\beta\),存在 \(\tilde{\lambda}\) 使得 \(m_k(x) = x\beta + \tilde{\lambda}(H_k(x))\) 几乎必然成立。
- 直观解释:当连续协变量维数 \(d_c \le 2\) 时,从 \(\mathbb{R}^{d_c}\) 到 \(\mathbb{R}^2\) 的光滑映射常泛单射,此时控制函数 \(\tilde{\lambda}\) 可完全吸收 \(x\) 的变异,\(\beta_k\) 无法从 \(\lambda_k\) 中剥离。
- 技术难点:构造了针对任意 \(\beta\) 的匹配 \(\tilde{\lambda}\),证明了不可识别是维数灾难的内蕴性质。
-
局限:仅证明了充分性(单射导致不可识别),必要性(非单射是否一定可识别)依赖后续命题。
-
Proposition 2 & 4 (Point-identification):
- 原文陈述:在 Assumption 1/2 下(至少 \(L+1\) 个连续协变量及非线性张成条件),\(\beta_k\) 和 \(\lambda_k\) 被点识别。
- **直观
Maintained by 陈星宇 · Homepage · Source on GitHub