Identification and Estimation of Semiparametric Multilayered Sample Selection Models¶

作者: Dongwoo Kim
主题: 非参数 / 半参数
相关性: 9/10
链接: https://arxiv.org/abs/2605.25519

一、核心问题与贡献¶

①研究了多层样本选择模型（先参与决策，再进行有序或无序分类排序）在无排除变量下的识别与估计问题。②核心工具是基于选择机制非线性构造的多指标控制函数，以及利用对称多项式进行降维的 sieve plug-in 估计量。③主要结论是：非参数有序选择产生双指标控制函数需至少3个连续协变量才能点识别，而多项 logit 的非线性自动保证识别；在可交换性下，初等对称多项式可实现降维；提出的两步 sieve 估计量具有 \(\sqrt{n}\) 一致性、渐近正态性及同方差下的半参数有效性。

二、基础设定¶

核心概念与符号：
\(D_i \in \{0, 1, \dots, K\}\)：选择变量（0为不参与，\(k \ge 1\) 为类别）
\(Y_{ik}^* = \alpha_k + X_i\beta_k + V_{ik}\)：潜在结果，\(\beta_k\) 为目标 estimand
\(h_k(x)\)：非参数有序选择中的阈值函数；\(u_k(x)\)：多项选择中的效用函数
\(\lambda_k(\cdot)\)：选择偏差函数（控制函数）
\(H_k(x) = (h_k(x), h_{k+1}(x))\)：有序选择的双指标映射
\(e_\ell\)：非选中概率的第 \(\ell\) 阶初等对称多项式
关键假设：
Assumption 1 (iv)-(v)：Jacobian 矩阵满秩与左零空间张成条件（核心非线性识别条件）。含义：阈值函数对连续协变量的响应不能共线，且在不同取值点需提供“方向不同”的非线性变异。相比经典 Heckman 模型依赖排除变量的线性变异，此假设用非线性替代了排除变量。
Assumption 3 (Exchangeability)：联合分布对非选中类别指标置换不变。含义：未选中类别间的偏好冲击对称。放宽了 MNL 的 IIA 假设与 own-shock 假设，允许结果误差依赖于所有偏好冲击。
Assumption 7：第一阶段非参估计率 \(\|\hat{g}_k - g_{k0}\|_\infty = o_p(n^{-1/4})\)。含义：标准的半参数 \(n^{-1/4}\) 收敛条件，保证第一阶段误差在第二阶段渐近可忽略。
问题背景：经典 Heckman 二元选择框架无法处理多层选择（参与+排序），若强行套用会将组内效应与组间成分效应混淆。最相关文献：1) Escanciano et al. (2016) / Kim & Lee (2025) 证明了二元选择中非线性可替代排除变量，本文将其推广至多指标情形，发现指标维数跃升导致识别条件质变；2) Dahl (2002) 提出基于选择概率的半参数修正，本文用初等对称多项式为其提供了维数降阶的严格理论依据；3) Kroft et al. (2024) 在多层选择下给出偏识别界，本文通过施加非线性/结构假设实现了点识别。

三、主要定理 / 核心结果¶

Proposition 1 (Non-identification under injectivity)：
原文陈述：若 \(H_k(x)\) 在条件支撑集上单射，则 \(\beta_k\) 不可识别：对任意 \(\beta\)，存在 \(\tilde{\lambda}\) 使得 \(m_k(x) = x\beta + \tilde{\lambda}(H_k(x))\) 几乎必然成立。
直观解释：当连续协变量维数 \(d_c \le 2\) 时，从 \(\mathbb{R}^{d_c}\) 到 \(\mathbb{R}^2\) 的光滑映射常泛单射，此时控制函数 \(\tilde{\lambda}\) 可完全吸收 \(x\) 的变异，\(\beta_k\) 无法从 \(\lambda_k\) 中剥离。
技术难点：构造了针对任意 \(\beta\) 的匹配 \(\tilde{\lambda}\)，证明了不可识别是维数灾难的内蕴性质。
局限：仅证明了充分性（单射导致不可识别），必要性（非单射是否一定可识别）依赖后续命题。
Proposition 2 & 4 (Point-identification)：
原文陈述：在 Assumption 1/2 下（至少 \(L+1\) 个连续协变量及非线性张成条件），\(\beta_k\) 和 \(\lambda_k\) 被点识别。
**直观

Maintained by 陈星宇 · Homepage · Source on GitHub

Identification and Estimation of Semiparametric Multilayered Sample Selection Models¶

一、核心问题与贡献¶

二、基础设定¶

三、主要定理 / 核心结果¶

评论