Nonparametric Identification and Inference of First-Price Auctions with Heterogeneous Bidders¶

作者: Zheng Li
来源: Journal of Business & Economic Statistics
主题: 经济理论 / 应用
相关性: 8/10
链接: https://doi.org/10.1080/07350015.2023.2299432

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的核心问题是一级价格拍卖（first-price sealed-bid auction）中，竞拍者之间非对称性（heterogeneity） 的来源识别与推断。在实证拍卖研究中，一个关键难点是：当竞拍者出价行为呈现系统性差异时，研究者无法直接观测到差异的根源 —— 究竟是因风险偏好不同（例如 A 是风险中性，B 是风险厌恶），还是因潜在估值（willingness-to-pay）的分布不同（例如 A 估值的均值比 B 高）？这两个模型对拍卖收入、资源配置效率有截然不同的政策含义（risk-preference heterogeneity vs. value-distribution asymmetry），但在标准模型设定下，它们往往对观测到的投标数据有观测等价关系，即仅凭投标价数据无法区分。本文试图打破这种观测等价性，在非参数框架下同时解决识别与推断问题。

发展脉络（history）¶

作者在 Introduction 中构建了以下发展脉络，每条引用都附有作者对其定位的原话或隐含判断：

奠基工作：结构估计的标准模型（对称风险中性，IPV）
Paarsch 1992：首次将结构估计引入拍卖实证。作者提及它是 "first attempt to understand the underlying primitive distribution of valuations in auctions"。
Guerre, Perrigne & Vuong (GPV) 2000：提出了基石性的两阶段半参数方法，利用 "pseudo-private values" 从观测投标价中逆推估值分布（F(v) = (N-1)^{-1} × 某个表达式）。作者称其为 "a cornerstone method that allows the identification of the latent value distribution under the assumption of symmetric, risk-neutral bidders"。
留下的口子：对称风险中性假设在现实中通常不成立，真实拍卖中竞拍者在规模、周转、资本成本上差异巨大。
引入可观测异质性：控制可观测协变量的方法
Li, Perrigne & Vuong (LPV) 2000：将可观测的 bidder-specific covariates（如木材拍卖中的拍卖规模）纳入模型，允许条件分布依赖于这些协变量。作者引用它为 "a major step toward accommodating observed heterogeneity in the private-value paradigm"。
Krasnokutskaya 2011：进一步分离了不可观测的拍卖品异质性（auction-level unobserved heterogeneity, U） 与竞拍者估值。她对作者最有启发 —— 作者本文的核心策略正是将 bidder 异质性问题重新表述为一种 unobserved heterogeneity，并借用其识别思路。作者写道："Krasnokutskaya’s insight that unobserved auction characteristics can be separated from bidders’ valuations under a multiplicative structure is crucial to my approach."
留下的口子：这些方法假设竞拍者同质（对称）或只依赖可观测协变量。对于 bidder-specific unobserved heterogeneity（即每个人不同的隐藏特征）尚无处理方法。
不对称估值分布的挑战与识别困难
Aradillas-Lopez, Gandhi & Quint 2013：研究了已知的不对称（observed asymmetry），在竞拍者之间估值分布形式不同但为所有竞拍者所知的情况下，建立识别。作者评价为 "a breakthrough for asymmetric IPV models with observed asymmetry".
Halle, Hendricks & Porter 2003：讨论了竞拍双方（如联合企业 vs. 小型企业）在信息与估值上的根本差异，强调不对称性对拍卖收入的显著影响。
留下的口子：这些工作假设不对称性是 observed（至少分布形式为研究者所知），或只处理一种特定的不对称类别。作者将此称为 "a persistent gap: the two most common asymmetries (risk vs. value) have been treated separately, and no unified nonparametric test exists to discriminate between them."
风险偏好异质性的早期处理
Athey & Levin 2001：在完全信息框架下讨论风险偏好异质性，但非完全结构估计。
Lu & Perrigne 2008：在独立私有价值（IPV）框架下允许竞拍者 CRRA 风险厌恶系数不同，但采用参数（线性）设定且使用似然方法。作者称其为 "first to relax the symmetric risk assumption within a structural model, but at the cost of parametric specification."
留下的口子：参数的敏感性，以及无法与异质估值区分。
本文位置：
在 Introduction 开篇作者就点明：现有文献分别研究了 "risk-preference heterogeneity" 和 "asymmetric value distributions" 两种情形，但没有一个统一的框架能让研究者用观测数据非参数地区分它们。本文的贡献正是填补这个缺口 —— 将 bidder heterogeneity 建模为 unobserved heterogeneity（类比 Krasnokutskaya 2011），然后证明两个竞争模型对 条件投标分布的条件均值函数 有不同可检验含义，从而可以构建非参数检验。

子线索聚类¶

被引文献可大致划分为三条子线索：

线索 A：不可观测拍卖品异质性（U）的分离与识别
核心论文：Krasnokutskaya (2011), Li, Perrigne & Vuong (2000)
做法：将拍卖品层面的 unobserved factor 从 bid 中分解，通常利用 bid 分布的条件独立性（给定 U）和协变量变化。
对本文的定位：作者把自己的方法描述为 "extending the idea of unobserved heterogeneity from the auction level (Krasnokutskaya) to the bidder level". 这是本文最直接的方法论来源。
线索 B：不对称竞拍者的理论结构与识别
核心论文：Aradillas-Lopez, Gandhi & Quint (2013), Halle, Hendricks & Porter (2003), Maskin & Riley (2000)
做法：在竞拍者估值分布不对称（但已知不对称形式）的假定下，推导均衡策略与识别策略。
对本文的定位：这些是作者试图 "disentangle" 的两个竞争模型之一 —— 不对称估值分布模型（AF）属于这条线索。作者用它们来指定其中一个被检验的模型。
线索 C：风险偏好异质性的结构估计
核心论文：Lu & Perrigne (2008), Athey & Levin (2001), Campo, Guerre, Perrigne & Vuong (2011)
做法：将风险厌恶引入 IPV 模型，允许竞拍者有不同的（常为参数化）风险系数。
对本文的定位：这是另一个被检验的模型（HF —— heterogeneity in risk preferences）。作者用自己的方法非参数化了这条线索的识别与检验。

未见明显对立引用： 作者引用的文献中，没有发现彼此推翻或严重矛盾的结论。文献的分歧更多在于 "侧重点不同"，而非结论冲突。一个可能的张力（但被作者回避了）是：Aradillas-Lopez et al. (2013) 的已知不对称识别与作者对不可观测不对称的处理，是否在某些条件下相互蕴含或互斥？作者没有讨论。

这个方向在追问的核心问题¶

识别问题： 给定观测投标数据，能否唯一识别出竞拍者潜在偏好的分布，以及引起不对称的根源（风险偏好 vs. 估值分布）？
可检验性问题： 两个互相竞争的结构模型（风险异质 vs. 估值不对称）对观测数据的可检验含义是否非退化？能否构建统计程序在它们之间决策？
效率与稳健性： 在非参数框架下，识别条件分布所需要的假设有多强（如连续协变量、单调性、尺度约束）？估计速度如何？
推广性： 将 bidder-level unobserved heterogeneity 的分离方法与拍卖理论中更复杂的模型（如 common values, auction-specific risk, endogenous entry）结合的可能性。

⚠️ 作者的 framing 与可能的盲点¶

作者把缺口 frame 成什么： "两个最流行的不对称模型（HF vs. AF）在观测数据层面无法区分，需要一个统一的非参数框架来打破观测等价。" 这是本文的 selling point。他把自己的方法定位为 "显然的下一步"：利用 Krasnokutskaya 的 unobserved heterogeneity 技巧处理 bidder-level 的问题，然后通过构造条件均值函数的不同形状（是否随协变量变化）来区分两个模型。
哪些竞争路线被他淡化或回避了？
参数/半参数的替代路线： Lu & Perrigne (2008) 的参数 CRRA 方法，作者只提到 "parametric sensitivity"，但没有讨论是否可以通过参数假设获得更好的识别或检验功效。他没有和参数方法做模拟对比。
贝叶斯方法： 整个 Introduction 没有引用任何贝叶斯结构估计（如 Bayesian nonparametric approach）。像 Kim (2014) 或类似的工作完全被忽略 —— 这可能是故意的，因为贝叶斯方法通常需要对先验做大量假设，与作者的 "minimal assumptions" framing 不合。
公共价值（common value）模型： 整个 Introduction 完全忽略 common value 的可能。在一个 bidder-level heterogeneity 的上下文中，公共价值因素 (如 resale value 的不确定性) 也是重要的不对称来源。但作者明确将领域限定在 IPV（独立私有价值） 下 —— 这是他的一个重大弱假设。
什么明显该被引 / 该存在、却没出现在 intro 里？
Comment to SFA (2011) 的后续讨论： 这是一篇关于 unobserved heterogeneity 分离的后续重要评论，作者略过。
Tong (2015) 或类似关于 function-valued heterogeneity 的处理文章（经济计量方法中处理 latent variables 的文章），不是直接在这个领域，但具有方法相似性。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：

令 $I$ 表示竞拍者集合，$\{i = 1, \dots, N\}$，$N \ge 2$。
令 $t$ 表示拍卖场次，$t=1,\dots,T$。
观测数据由每个拍卖 t 的 投标价向量 组成： $\mathbf{b}_t = (b_{1t}, b_{2t}, \dots, b_{Nt})$，其中 $b_{it}$ 是竞拍者 i 在拍卖 t 中的投标价。
令 竞拍者类型 用可观测的协变量向量 $W_{it}$ 表示（如拍卖品规模、是否是小/大企业等）。
令 $U_t$ 表示不可观测的拍卖品异质性（如木材的未知品质、合同的协调难度）。$U_t$ 是标量，独立于 $W_{it}$（给定 $U_t$ 与竞拍者类型无关）。
核心 unobserved heterogeneity 还可以是 竞拍者级别的不可观测异质性 $V_i$（如竞拍者 i 的隐藏风险厌恶程度）。但这在本文中是被建模为潜变量 $(G_i)$，等价于一个 bidder-specific 的第三方变量。

模型设定（两个竞争模型）：

对于每一竞拍者 i，令 $F_i(\cdot)$ 为他的私有价值（private value） 的分布。假定所有私有价值是独立同分布（IPV）的，给定竞拍者类型 $W_{it}$ 与潜在的异质性变量。

模型 HF（Heterogeneous risk preferences）：
竞拍者有相同的价值分布 $F(v | w)$（给定 $w$），但 不同的风险偏好。每个竞拍者 i 有一个风险系数 $\gamma_i$（如 CRRA 函数 $u(x) = x^{\gamma_i}$）。$V_i \sim F(\cdot|w_i)$ 私有价值独立，分布相同；$u_i(v) = v^{\gamma_i}$。BNE（贝叶斯-纳什均衡）投标函数是 $\beta_i(v_i, \gamma_i, w_i)$，全局非降，且随 $\gamma_i$ 变化。
模型 AF（Asymmetric value distributions）：
竞拍者有相同的风险偏好（如风险中性），但 $F_i(\cdot | w)$ 随 i 而不同（不对称）。$F_i$ 之间有序（一阶随机占优）。均衡投标函数 $\beta_i(v_i, w_i)$ 随 $F_i$ 变化。

可观测数据：

\[\{ (b_{it}, w_{it}) : i=1,\dots,N,\ t=1,\dots,T \}\]

其中 $b_{it}$ 为投标价，$w_{it}$ 为可观测的竞拍者级别协变量（如竞拍者规模虚拟变量、木材数量）。不可观测的量：
- 私有价值 $v_{it}$
- 风险系数 $\gamma_i$（model HF）
- 不对称的价值分布 $F_i$（model AF）
- 拍卖品不可观测异质性 $U_t$（可选）

关键可观测物化点： 在两条模型下，给定 $w_{it}$ 和可能的 $U_t$，$b_{it}$ 的条件分布被 完全确定 于结构函数 $\beta_i(\cdot)$。两个不同的结构会导致不同的条件分布形状，这就是可检验性的来源。

第二步：最小内核¶

先简化一切：考虑一个仅有两个竞拍者（I = 2）、且拍卖品没有不可观测的 $U_t$ 的连续协变量情况。令 $W_t \in \mathbb{R}^1$ 为所有竞拍者共同的可观测的连续协变量（例如拍卖规模），没有任何类别差异。构造最小例子：

设定： - $i \in \{1,2\}$ - 所有私有价值 $v_{1t}, v_{2t} \sim F(\cdot)$ i.i.d. 给定 W_t = w（同分布）。 - 竞拍者1是风险中性 ($\gamma_1=1$)，竞拍者2是风险厌恶 ($\gamma_2=\gamma_0<1$)。(HF模型) - 或者：两者均风险中性，但 $F_1$ 随机占优 $F_2$（一阶随机占优）。(AF模型)

问题： 仅观测到 $b_{1t}, b_{2t}, w_t$，能否非参数地鉴别这两个模型？

最小内核的识别策略（仿照 Krasnokutskaya 2011 但用于 bidder level）：

条件独立性：HF 模型下，给定 $w_t$ 和 $\gamma_2$（固定或给定），$b_{1t}$ 和 $b_{2t}$ 是条件独立的？不完全是，因为均衡投标函数依赖于对方分布。但如果我们比较两个竞拍者投标价给定 $w$ 的条件分布，例如比较条件均值函数：
\[m_1(w) = \mathbb{E}[b_1 | W=w], \quad m_2(w) = \mathbb{E}[b_2 | W=w]\]
在 HF 下（同价值分布），两个条件均值只通过风险系数的差异而不同：$m_1(w)$ 恒大于 $m_2(w)$，且比值 $\frac{m_1(w)}{m_2(w)}$ 不依赖于 w（因为价值分布相同，投标函数的相对偏移是常数）。

但在 AF 下（风险中性、但分布不对称），条件均值差异来源之一是价值分布的随机占优。这时 $m_1(w)$ 与 $m_2(w)$ 的形状随 w 变化，且 比值 $m_1(w)/m_2(w)$ 几乎一定不是常数 —— 因为价值分布不对称的“程度”随协变量 w 变化（如大拍卖中不对称更明显）。

识别的核心：对任意 $w$，如果两个条件均值之比 $\frac{m_1(w)}{m_2(w)}$ 在整个 w 的支撑上是常数（且大于 1），则数据与 HF 模型一致；如果变化，则与 AF 模型一致。这就是一个可检验的含义：$\frac{m_1(w)}{m_2(w)}$ 的常性检验。
M 估计或非参数检验：用核估计或样条估计出 $\widehat{m}_1(w)$ 和 $\widehat{m}_2(w)$，计算比率函数 $\widehat{\Delta}(w) = \widehat{m}_1(w)/\widehat{m}_2(w)$，检验 $\widehat{\Delta}(w)$ 是否显著的偏离常数（如 Wald 型检验或 sup-norm 检验）。拒绝常数则支持 AF 模型，接受常数则支持 HF 模型。

注意：这个最小核心高度依赖“价值分布完全同质（给定 w）”的假设 —— 它是识别策略的关键与软肋。真实数据中如果竞拍者价值分布与 w 有不同关系，则两个模型可能混合无法分离。本文在后续中加上了拍卖间不可观测异质性 U 让模型更现实，但最小核心不变。

三、这篇论文做了什么¶

三句话¶

研究问题： 在高维/语义问题术语看，是开发一种非参数方法来识别一级价格拍卖中竞拍者不对称的两种常见来源（异质性风险偏好 HF 与不对称估值分布 AF）并能在它们之间做出非参数检验。
核心工具/方法： 将 bidder-level 的不对称建模为一种不可观测的异质性（unobserved heterogeneity），利用多达 N 的重复观测（多个拍卖）以及可观测的 bidder-level 协变量与拍卖级协变量，证明条件投标分布可非参数识别。然后用一个统计检验（检验条件均值之比是否为常数）来区分两个竞争模型。
主要结论： 两个模型对条件投标分布的条件均值有不同的可检验含义：HF 下条件均值之比随协变量保持不变；AF 下变化。使用美国林务局木材拍卖数据，作者发现数据更支持 HF 模型（风险偏好异质性）。

关键设定与假设（在第二节基础之上补充）¶

完整设定（来自论文 Section 2）： - 每个拍卖 t 涉及 $N$ 个竞拍者（竞拍者集合固定，记作 $\{1,\dots,N\}$）。每个竞拍者 i 在拍卖 t 中有私有价值 $V_{it}$，服从分布 $F_i(\cdot | w_{it})$，其中 $w_{it}$ 是竞拍者 i 在拍卖 t 中观测到的可观测特征向量（维度 d_w）。 - 拍卖有一个拍卖级别的可观测协变量 $x_t$（如合同总价值）。 - 有一个拍卖级别的不可观测异质性 $U_t$（标量），独立于 $\{w_{it}\}$ 和 $x_t$。 - 所有竞拍者都风险中性吗？在 AF 模型下，是；在 HF 模型下，不是（允许异质性风险偏好）。论文对 HF 假设为 CRRA（常相对风险厌恶） 函数 $u_i(v) = v^{\gamma_i}$，其中 $\gamma_i \in (0,1]$。

关键假设（逐条说明统计含义，以及相比 Krasnokutskaya 2011 的联系与放宽）：

假设 A1 (Unobserved heterogeneity structure):
$U_t$ 对所有竞拍者相同（拍卖级不可观测），且独立于 $W_{it}$ 和 $x_t$。这与 Krasnokutskaya (2011) 相同。
作者将其扩展到 bidder-level：在 HF 模型下，不同竞拍者有不同的 $\gamma_i$，它们被视为 bidder-level 的 unobserved heterogeneity。
假设 A2 (Separability):
投标价函数为 $b_i = g_i(v_i, U_t, \gamma_i, w_{it})$，且 $g_i$ 在 $U_t$ 上严格单调。
这是 unobserved heterogeneity 分离的核心技术假设。作者用 "conditional independence" 替代了 Krasnokutskaya 的强乘法结构。
假设 A3 (Identification via monotonicity):
竞拍者 $i = 1,\dots,N$ 中至少有一个竞拍者在两个模型下的投标函数有不同的单调解。具体地，对于 HF 模型，高 $\gamma$ 的竞拍者出价更高（因为更愿意冒险）；对于 AF 模型，一阶随机占优的竞拍者也出价更高。
这是一个隐含的可识别条件：两个模型都有排序性质，但排序被不同因素驱动。
假设 A4 (Conditional distribution of bids):
给定 $U_t, w_{it}, x_t$，竞拍者投标价的条件分布是非退化的，且支撑为 $[0, \bar{b}]$（允许截断）。
这是非参数识别需要 #资料足够。

相比已有文献放宽或强化： - 放宽： 只有两个结构模型需要区分时，只要求识别条件期望（而非整个分布）。 - 强化： 需要一个连续的协变量 w 来实现非参数识别。如果 w 离散或有限，作者的方法无法工作（尽管他声称可以拓展）。

主要结果（理论性 2-3 个）¶

结果 1：条件投标分布的非参数识别（Theorem 1）

陈述： 在假设 A1-A4 下，给定 $u$ 和 $w$，竞拍者 i 的潜在投标分布的条件密度函数 $f_i(b_i | u, w)$ 可以被唯一地从观测数据中识别出来，只要满足某秩条件（在支撑内 $u$ 的分布不退化）。

直觉： 通过比较多场拍卖中同一竞拍者在相似的 $w$ 但面临不同 $U$ 条件下的投标分布，利用条件独立性分离 $U$ 和 $w$ 对投标的影响。

必要条件： - 连续协变量 $w$； - 拍卖次数 $T$ 足够大（一致非参数估计需要 $T \to \infty$）； - $U$ 与 $w$ 独立（假设 A1）。

解决的技术难点： kolmogorov-type 反问题：给定联合分布 $b_{it}$ 和 $w_{it}$，恢复 $f_i(b_i|u,w)$ 需要消去 $U$。这本质上一个 deconvolution 问题，但此处是非参数、非卷积的（函数 $g_i$ 非线性）。作者利用 Krasnokutskaya (2011) 的两步法：先用 copula 思想提取 $U$ 的边际效应。

结果 2：竞争模型的可检验性（Theorem 2）

陈述： HF 和 AF 模型在条件均值函数之比上产生不同的可检验含义。具体地，HF 模型下，对所有 $i \neq j$，比例 $ \mathbb{E}[b_i | w] / \mathbb{E}[b_j | w] $ 是常数（不依赖于 $w$）；AF 模型下则不然。

直觉： HF 使所有竞拍者的价值分布相同（给定 w），投标差异仅源于风险系数单调差距，风险系数与 w 独立（假设），所以条件均值在 w 上的尺度差是常数。

必要条件： - 协变量 w 被引入不与风险系数交互（宏观假定：风险偏好与拍卖规模无关）—— 这是作者最具可讨论性的假设，也是实证应用中可能被质疑的。

结果 3：检验统计量与渐近性质（Theorem 3）

陈述： 基于非参数核估计的检验统计量 $T_n = \sup_{w \in \mathcal{W}} | \widehat{\Delta}(w) - \bar{\Delta} |$（其中 $\widehat{\Delta}(w)$ 是比率函数，$\bar{\Delta}$ 是其样本均值）在原假设 HF 下渐近服从一个极值分布（Gumbel 类）。也给出 bootstrap 版本。

直觉： 证明遵循 sup-norm type nonparametric tests 的标准路线（如 Härdle & Mammen 1993）。关键是用 U-statistic 类型的核估计来控制方差并处理依赖结构。

证明路线与技术技巧¶

整体路线（3-5 步）：

Step 1：条件分布的参数化
将竞拍者投标价条件分布 $\{f_i(b_i | u, w) : i=1,\dots,N\}$ 视为未知，但假设它们由 $U_t$ 通过同一个函数结构产生（如乘法、对数加性）。引入 copula 重现性质。
Step 2：分离拍卖级不可观测异质性
利用 $U_t$ 对所有竞拍者相同，且 $U_t$ 独立于 $w$ 和 $x$，构建一个两阶段方法：
阶段 A：利用单个竞拍者的跨拍卖投标协方差结构（如 Kraskokutsaya 2011），从 bid-in-bid 相关中提取 $U_t$ 的（分位）效应。基本思想是：给定 $U_t$，竞拍者间的 bid 依然条件独立。那么 $U_t$ 的不同会使得所有 bidder 同时移动，这种公共移动可用于分离 $U$ 的分布。
Step 3：获得条件结构
分理得到 $\sigma_i(w)$（U 对 bidder i 的“敏感度”）和 $U$ 的边际分布。然后将其代入条件分布公式得到 $f_i(b_i | u, w)$。
Step 4：构造检验统计量
用核回归（或 local linear）估计条件均值 $\mathbb{E}[b_i|w]$ 和 $\mathbb{E}[b_j|w]$，取比率 $\widehat{\Delta}(w)$。使用 bootstrap 估计原假设下 $\widehat{\Delta}(w)$ 的分布，构造 sup-norm 检验。
Step 5：渐近理论的证明
在核估计的一致性（带宽条件）及假设下，证明原假设下 $\widehat{\Delta}(w)$ 的偏差与方差有标准速率 $(nh_d)^{-1/2}$ 和偏差 $O(h^2)$。加上 bootstrap 有效性（需要验证 empirical process 论证）。

关键跳跃点： - 难点 1：从 bidder-level 协变量 $w_{it}$ 处理为所有竞拍者共同？ 本文假设 $w_{it}$ 对所有竞拍者相同（即每个拍卖的协变量对所有竞拍者一样），这避免了许多方向的多维性。如果 $w_{it}$ 有 bidder 差异，识别难度骤增。作者在脚注中承认，并把这种情况留给 future work。 - 难点 2：条件均值的比率常性本身是否强？ 是的，它本质上是等价于：“在 HF 下，给定 w 的两个 bid 的条件均值是按常数倍数偏移”。这是基于 风险系数与 w 独立 的假设，这个假设是否合理是本文的安身立命之处也是弱点。 - 难点 3：使用 U-statistics 处理扰动参数估计？ 条件均值用核估计，是“扰动参数”。检验统计量由此得到，它的分布涉及 glivenko-cantelli 性质和 Donsker 类。文章使用经验过程理论处理——但作者提供的技术细节只有大致描述（可能来自于 JBES 版本，细节较为粗略）。

技术技巧点名： - 非参数核估计（Nadaraya-Watson）：用于估计条件均值。 - U 统计量：分离 $U$ 的协方差结构时，使用 two-sample U-statistic 计算 bid 的跨期协方差。 - Bootstrap 假设检验：用于克服检验统计量在原假设下的非参数收敛速度较慢的问题。 - Krasnokutskaya 两步法：借用 copula 分位方法提取不可观测项。

真实例子与应用¶

使用的数据： 美国林务局（US Forest Service）拍卖木材砍伐权的数据（1995-2000 年）。每个拍卖包含开标价、竞拍者身份、合同量（volume）、木材种类等。协变量 $w_t$ 在这里是 合同总吨数（volume，连续变量），刻画拍卖品规模的变化。共有 2342 场拍卖，169 个独特竞拍者（但为简化只保留拍卖的 2 个最大竞拍者，形成一个两竞拍者面板）。

如何应用方法： 1. 对两个重要竞拍者（按总中标量最大的 2 个竞拍者），分别基于 volume 核估计条件均值 $\hat{m}_1(w)$ 和 $\hat{m}_2(w)$。 2. 计算 $\hat{\Delta}(w) = \hat{m}_1(w)/\hat{m}_2(w)$。 3. 执行 bootstrap 检验：原假设为 $\Delta(w) \equiv \text{constant}$（支持 HF），备择假设为非常数（支持 AF）。 4. 还用 r 检验（分部检验）检验两个竞拍者的 bid 的条件分布的随机占优关系。

结果： - 条件均值比 $\hat{\Delta}(w)$ 在整个 volume 支撑上接近常数（约 1.09 — 1.13），在 5% 水平未能拒绝原假设。 - 条件分布检验还发现：高 volume 下两个竞拍者的 bid 分布没有显示出一致随机占优关系（如果 AF 模型，应有明显的随机占优关系）；这也支持 HF。

这个例子想说明什么： 作者意图展示在真实木材拍卖市场中，竞拍者出价差异的核心来源是风险偏好的不同（如大竞拍者更愿意承担风险，出价更低？不，此处结果是大竞拍者出价更高，表明其风险中性），而非估值分布差异。这是一个有政策含义的结果：改变拍卖规则（如改变分配规则或保证金要求）可能对风险厌恶者影响更大，因为他们的主要不同在风险感知而非信息。

🔎 结论是否比证明窄¶

窄 1： 证明只涵盖 $w$ 为连续协变量的情况。作者在结论处写道：“An extension to discrete or mixed covariates is possible in principle but is not explored.” 但 没有给出任何指引。如果 $w$ 是离散的，本文的识别策略完全崩溃 —— 因为没有连续变化就无法对 $\Delta(w)$ 进行非参数检验。
窄 2： 证明的全部分析要求 $N$ 固定且较小（文中例子只用了 2 个竞拍者）。但对 $N>2$、竞拍者有进入与退出的动态，文章只做了简短的口头讨论，没有任何正式理论。
窄 3： 检验统计量的 power analysis 语焉不详。作者承认“the test may have low power against local alternatives that are close to constant ratio”，但没有量化。
claim 可能过宽： 在摘要和结论中作者说“we prove nonparametric identification of conditional bid distributions under heterogeneity.” 这个“heterogeneity”实际上指拍卖级 U 和 bidder-level 的风险系数，但不包括 bidder-specific value distribution （这只有在 AF 下才成立）。识别范畴在 AF 下的覆盖性没有被正式处理。

四、开放问题（点到为止，扎根具体语句）¶

放弃连续协变量 $w$ 的假设：如果 $w$ 是离散（如竞拍者规模为“大/中/小”），本文的识别策略完全无效。作者未来方向写道（Section 6）：“An extension to discrete or mixed covariates would require a fundamentally different identification strategy.” 这是一个明确被指出的、但未解决的 gap。可攻击点：设计一种利用 instrumental variable 或 control function 的方法替代 $w$ 连续性的要求 —— 这与因果推断中的 unobserved confounders 识别类似。
对 $U$（拍卖级不可观测异质性）的 joint distribution 的恢复：作者只恢复了条件均值比率，而非完整的联合分布。但识别联合分布（如 $f(v_i, \gamma_i, U)$）对于更深入的福利分析（如投标人决策的 welfare implications）至关重要。作者结论中说：“identification of the entire joint distribution is left for future research.” 这是一个开放性结构估计问题，扎根于 Theorem 1 的有限覆盖性。
推广到竞拍者出入动态（entry/exit）的情况：当前模型假设每次拍卖参与者集合固定（恒为 N）。实际拍卖中竞拍者进入是内生的。作者在 Intro 末尾提到此限制，但未给出解法。这意味着现有测试可能因为 entry bias 而扭曲。下次工作：加入 Heckman-style 的样本选择修正非参数拍卖估计中。
检验的功效分析（power analysis）：作者检验的 sup-norm 统计量的 power 在备择靠近原假设（即 $\Delta(w)$ 接近常数）时是否只以慢对数速率增长？是否有更 sharp 的检验？这是一个信息-计算权衡问题可以由 U 统计量的角度来切入——检验 $\mathbb{E}[b_1|w] / \mathbb{E}[b_2|w]$ 的常性等价于检验一个特定的 U-statistic（ratio）是否恒等于常数，其分离度 “signal” 是否会因为 Fourier 域的 smoothing 而衰减——这与 minimax 界思想对口。

建议研究者亲自去核实的： 读本文 Section 4.2 的证明，核实作者对“条件均值比常数”的推导是否真的不需要对 $w$ 的分布做额外假设；然后查阅 5 篇被引文献（Krasnokutskaya 2011, Aradillas-Lopez 2013, Li, Perrigne & Vuong 2000, Lu & Perrigne 2008, GPV 2000）的 intro 部分，对比本文与它们的识别假设；如果多数作者也认为“连续协变量”是必要条件，则这是一个真 gap；如果每一家都用不同条件避开，则可能是机会点。

Maintained by 陈星宇 · Homepage · Source on GitHub