Testing firm conduct¶

作者: Marco Duarte, Lorenzo Magnolfi, Mikkel Sølvsten, Christopher Sullivan
来源: Quantitative Economics
主题: 经济理论 / 应用
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：在不完全竞争市场（如寡头定价、纵向合约）中，反垄断与政策评估的前提是弄清企业到底在遵循何种行为模式（conduct，如 Bertrand 竞争、合谋、纵向定价等）。这个子方向要解决的根本统计问题是：在模型必然误设的条件下，如何基于可观测的市场数据与工具变量（IV），对两个非嵌套的结构模型进行统计检验与选择，并保证推断在 IV 强度不足时依然可靠。当前成熟度：实证中广泛使用 RV 检验与 Cox 检验，但对其在弱 IV 下的退化性与推断失效问题，直到近五年才有了严格的诊断与修正框架，仍处于从"经验性使用"向"严格推断"过渡的阶段。

发展脉络： 1. 奠基工作：Vuong (1989) 提出了非嵌套模型选择的似然比检验框架，开启了"两个模型谁更接近真实 DGP"的统计检验路线。但 Vuong 检验在退化（两模型距真实 DGP 的 Kullback-Leibler 距离相等）时推断失效。 2. 主要进展（修正退化性）：Shi (2015) 与 Schennach 和 Wilhelm (2017) 分别针对 Vuong 检验的退化性提出修正（Shi 提出一步非退化检验控制 uniform size；Schennach-Wilhelm 提出无需预检验的参数似然选择检验）。Rivers 和 Vuong (2002) 将模型选择从似然比推广到基于矩条件（GMM）的设定，使得在误设下比较矩拟合度成为可能，这成为 IO 领域检验 conduct 的标准工具。 3. 弱 IV 诊断的进展：Stock 和 Yogo (2005) 为线性 IV 回归建立了弱 IV 诊断框架（基于第一阶段回归 F 统计量与 Wald 检验的 size distortion 界）；Andrews 等 (2019) 将弱 IV 推断扩展至异方差与聚类数据，并实证表明弱 IV 在 AER 发表的 IV 研究中仍普遍存在。 4. 当前 frontier 与本文位置：实证 IO 领域（Backus 等 2021; Bergquist 和 Dinerstein 2020; Miller 和 Weinberg 2017; Villas-Boas 2007）大量使用 RV 检验、AR 检验或 Cox 检验来判别 conduct，但几乎无人诊断所用 IV 在模型选择语境下是否过弱。本文填补的口子是：将 RV 统计量的退化性与 IV 强度直接挂钩，定义"模型选择中的弱 IV"，并把 Stock-Yogo 诊断框架从单一模型推断扩展至非嵌套模型选择。

子线索聚类： - 线索 A：非嵌套模型选择检验的统计理论。Vuong (1989) → Shi (2015) → Schennach 和 Wilhelm (2017)。这一簇在似然框架下解决退化性与 size 控制。 - 线索 B：弱 IV 的诊断与推断理论。Stock 和 Yogo (2005) → Andrews 等 (2019) → Hansen 和 Lee (2019)（为聚类数据提供渐近理论）。这一簇在线性 IV 回归中解决弱 IV 识别与 size distortion。 - 线索 C：IO 实证中的 conduct 检验应用。Villas-Boas (2007) → Miller 和 Weinberg (2017) → Bergquist 和 Dinerstein (2020) → Backus 等 (2021)。这一簇用各种检验（RV, Cox, AR, estimation-based）判别企业行为，但作者指出他们普遍忽略了 IV 强度对检验 power 的影响。

这个方向在追问的核心问题： 1. 在模型误设下，如何对非嵌套结构模型进行有 size 保证与 power 保证的选择检验？ 2. 检验统计量的退化性（矩条件拟合度无差异）在什么条件下发生，如何与识别条件（IV 强度）建立定量联系？ 3. 当 IV 弱时，检验的渐近分布如何退化、size distortion 有多大，如何给出可操作的诊断门槛？ 4. 在聚类 / 异方差等复杂抽样下，上述推断与诊断是否依然成立？

⚠️ 作者的 framing（这是作者的说法）： - 作者把缺口 frame 成：实证者用 RV 检验判别 conduct，但退化性导致标准正态推断失效，而实证者对此毫无诊断；本文通过定义"模型选择中的弱 IV"，将退化性归结为 IV 弱，并提供 Stock-Yogo 式诊断，使 RV 检验成为"显然的下一步"。 - 被淡化或回避的竞争路线：Shi (2015) 与 Schennach-Wilhelm (2017) 的非退化修正被引用，但作者强调它们是似然框架下的修正，而 RV 是矩框架，暗示矩框架更适用于结构模型（因结构模型常只有矩条件而无完整似然）。但作者未直接比较：在矩框架下，是否可以直接套用 Shi 的修正思路（如局部参数化退化点）来构造非退化检验，而非绕道 Stock-Yogo 诊断？ - 什么明显该被引 / 该存在、却没出现在 intro 里？：在弱 IV 下，AR 检验是标准的有 size 保证的推断方法；Bergquist 和 Dinerstein (2020) 明确用 AR 检验补充估计。作者在 intro 提到了 AR 检验作为替代路线，但未讨论在模型选择语境下，AR 检验是否可直接改造为非嵌套模型选择检验（例如，对两个模型分别做 AR 检验再比较）。这是一个值得研究者去查的问题：AR 路线是否在弱 IV 下比修正的 RV 更有 size 保证，但 power 更低？

张力：未见明显对立引用。Shi (2015) 与 Schennach-Wilhelm (2017) 解决同一问题（退化性）但方法不同，作者对它们的定位是"似然框架下的修正"，未直接与本文的"矩框架下的弱 IV 诊断"对立，而是互补。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(t\)：市场 / 时期索引，\(t = 1, \dots, T\)。
\(j\)：产品索引，\(j = 1, \dots, J\)。
\(s_t\)：可观测的市场份额向量（\(J\) 维），来自需求侧。
\(p_t\)：可观测的价格向量（\(J\) 维），内生变量。
\(x_t\)：可观测的产品特征向量（外生或部分内生）。
\(z_t\)：工具变量向量（\(L\) 维），排除约束，只通过价格进入市场。
\(w_t\)：外生变量向量（包含 \(x_t\) 与 \(z_t\) 的子集）。
\(\xi_t\)：不可观测的需求冲击（\(J\) 维），与价格相关（内生性来源）。
\(\omega_t\)：不可观测的供给冲击（\(J\) 维），与价格相关。
\(\theta\)：需求参数（如随机系数 Logit 中的系数）。
\(\mathcal{M}_0, \mathcal{M}_1\)：两个非嵌套的 conduct 模型（如 Bertrand vs. 纵向定价），各自隐含一个供给侧均衡条件，生成矩条件。
\(g(\cdot)\)：矩函数。\(g_0(w_t, z_t; \theta, \mathcal{M}_0)\) 与 \(g_1(w_t, z_t; \theta, \mathcal{M}_1)\) 分别为两模型下的矩向量。
\(Q_0, Q_1\)：两模型在最优权重下的矩拟合度（GMM 目标函数值），即 \(Q_k = E[g_k]' W^{-1} E[g_k]\)，\(W\) 为最优权重矩阵。
\(\Delta\)：核心 estimand：\(\Delta = Q_0 - Q_1\)，衡量两模型矩拟合度的差异。\(\Delta > 0\) 意味 \(\mathcal{M}_1\) 更接近真实 DGP；\(\Delta < 0\) 意味 \(\mathcal{M}_0\) 更接近。
\(\hat{\Delta}\)：RV 检验统计量：样本矩拟合度差异 \(\hat{Q}_0 - \hat{Q}_1\)。
\(V\)：\(\hat{\Delta}\) 的渐近方差。
退化性：当 \(\Delta = 0\) 时，\(\hat{\Delta}\) 的渐近分布从 \(\sqrt{T}(\hat{\Delta} - \Delta)/\sqrt{V} \to N(0,1)\) 退化为 \(\sqrt{T}\hat{\Delta}\) 收敛到非正态分布（因 \(V=0\)），标准正态临界值失效。

模型：数据生成机制为真实 DGP（既非 \(\mathcal{M}_0\) 也非 \(\mathcal{M}_1\)，模型误设）。需求侧通过 BLP 型随机系数 Logit 生成份额 \(s_t\)；供给侧由真实 conduct 生成价格 \(p_t\)。研究者有两个候选 conduct 模型，各自给出供给侧矩条件 \(E[g_k] = 0\)（部分矩因误设不为零）。IV \(z_t\) 满足排除约束：\(E[\xi_t | z_t] = 0\)，但 \(E[\xi_t | p_t] \neq 0\)。

可观测数据：研究者观测到 \((s_t, p_t, x_t, z_t)\)，\(t=1,\dots,T\)。不可观测的是 \((\xi_t, \omega_t)\) 与真实 conduct。需求参数 \(\theta\) 通过 BLP 算法从需求侧矩估计；供给侧矩条件 \(g_k\) 依赖 \(\theta\) 与 conduct 假设，用于模型选择。

第二步：最小内核——弱 IV 导致退化性的最简特例

剥掉 BLP 需求侧、多产品、聚类等复杂性，考虑单一内生变量、单一 IV、线性矩条件的最简特例：

设 \(y_t = \beta p_t + \epsilon_t\)，\(p_t = \pi z_t + v_t\)，\(E[z_t \epsilon_t] = 0\)，\(E[z_t v_t] = 0\)。
两模型给出不同 \(\beta\) 值：\(\mathcal{M}_0\): \(\beta = \beta_0\)；\(\mathcal{M}_1\): \(\beta = \beta_1\)（\(\beta_0 \neq \beta_1\)）。
矩条件：\(g_0(z_t) = z_t(y_t - \beta_0 p_t)\)；\(g_1(z_t) = z_t(y_t - \beta_1 p_t)\)。
矩拟合度：\(Q_k = (E[g_k])^2 / E[g_k^2]\)（最优权重下）。
\(\Delta = Q_0 - Q_1 = \frac{(E[z_t \epsilon_t] - \beta_0 E[z_t p_t])^2}{E[g_0^2]} - \frac{(E[z_t \epsilon_t] - \beta_1 E[z_t p_t])^2}{E[g_1^2]}\)。

关键洞察：当 \(\pi \to 0\)（IV 弱，\(E[z_t p_t] = \pi E[z_t^2] \to 0\)）时： - \(E[g_k] \to E[z_t \epsilon_t]\)（对两模型相同，因 \(E[z_t \epsilon_t] = 0\) 在真实 DGP 下成立）。 - \(Q_0 \to 0\)，\(Q_1 \to 0\)，\(\Delta \to 0\)。 - 退化性发生：\(\Delta = 0\)，RV 统计量 \(\hat{\Delta}\) 的渐近方差 \(V \to 0\)，标准正态推断失效。

本文最小内核的数学命题：在上述最简特例中，退化性（\(\Delta = 0\)）等价于 IV 对两模型矩条件的识别力为零（即 \(E[z_t p_t] = 0\)）。更一般地，本文定义"模型选择中的弱 IV"为：两模型矩条件差异的识别力弱（局部参数化：\(\sqrt{T} E[\nabla g] \to \ell\)，\(\ell\) 有界但非零），并证明在此局部弱 IV 下，\(\sqrt{T}\hat{\Delta}\) 收敛到非正态分布（依赖 nuisance 参数），标准 RV 检验的 size distortion 可任意大。Stock-Yogo 式诊断的核心：计算一个基于样本矩的统计量（如最大特征值或 F 统计量的变体），其临界值由"弱 IV 下 RV 检验的 size distortion 不超过 10%"决定。

三、这篇论文做了什么¶

三句话： 1. 研究了在模型误设下用 RV 检验选择非嵌套 conduct 模型时，弱 IV 导致统计量退化与推断失效的问题。 2. 核心工具是：定义"模型选择中的弱 IV"（基于矩条件差异的局部识别力），推导弱 IV 下 RV 统计量的渐近分布，并将 Stock-Yogo 诊断框架扩展至模型选择。 3. 主要结论：退化性等价于弱 IV；弱 IV 下 RV 检验 size distortion 可任意大；Stock-Yogo 式诊断可操作地检测弱 IV；实证中常见 IV 集在纵向 conduct 检验中部分过弱，强 IV 支持制造商定价。

关键设定与假设： - 设定：GMM 矩条件 \(E[g_k(w_t, z_t; \theta, \mathcal{M}_k)] = 0\)，\(k=0,1\)。需求参数 \(\theta\) 从需求侧一致估计（第一步 GMM），供给侧矩条件用估计的 \(\hat{\theta}\) 代入（两步 GMM）。 - 假设 1（矩条件连续可微）：\(g_k\) 对 \(\theta\) 与内生变量连续可微，保证局部线性化有效。 - 假设 2（IV 排除约束）：\(E[\xi_t | z_t] = 0\)，\(E[\omega_t | z_t] = 0\)（标准 BLP 排除约束）。 - 假设 3（聚类 / 异方差）：允许聚类抽样（Hansen 和 Lee 2019 的渐近理论），矩条件在聚类内相关、聚类间独立。 - 假设 4（局部弱 IV 参数化）：\(E[\nabla_z g_k] = C_k / \sqrt{T}\)，\(C_k\) 为常数矩阵。这是本文的核心假设，将弱 IV 定义为"矩条件对 IV 的敏感度随 \(T\) 衰减至零"，类比 Staiger 和 Stock (1997) 的局部弱 IV 参数化。相比已有文献（Stock-Yogo 在线性 IV 回归中的参数化），本文将此参数化从单一模型的识别条件扩展至两模型矩条件差异的识别条件。 - 假设 5（非嵌套）：\(\mathcal{M}_0\) 与 \(\mathcal{M}_1\) 不共享所有矩条件（非嵌套），保证 \(\Delta\) 有定义。

主要结果：

定理 1（退化性与弱 IV 的等价性）： - 陈述：在模型误设下，RV 统计量退化（\(\Delta = 0\) 且 \(V = 0\)）当且仅当 IV 对两模型矩条件差异无识别力（即 \(E[\nabla_z (g_0 - g_1)] = 0\)）。 - 直觉：退化性意味着两模型的矩拟合度无差异；这只有在 IV 无法区分两模型的矩条件时才发生（IV 弱到无法反映 conduct 差异对均衡价格的影响）。 - 必要条件：矩条件对 IV 的导数存在且连续；模型误设下 \(E[g_k] \neq 0\)。 - 解决的技术难点：在非线性矩条件（BLP 供给侧矩）下，退化性不再像线性情形那样简单等价于"第一阶段回归系数为零"，需要通过矩条件的 Jacobian（对内生变量的导数）与 IV 的相关性来刻画识别力。

定理 2（弱 IV 下 RV 统计量的渐近分布）： - 陈述：在局部弱 IV 参数化（假设 4）下，\(\sqrt{T}\hat{\Delta}\) 收敛到一个非正态分布，其均值与方差依赖 nuisance 参数（\(C_0, C_1\)，即两模型矩条件对 IV 的局部敏感度）与最优权重矩阵的估计误差。 - 直觉：弱 IV 下，\(\hat{\Delta}\) 的波动主要由 IV 的随机波动驱动（而非矩拟合度的真实差异），导致分布偏离正态；权重矩阵的估计误差在弱 IV 下被放大（因矩条件接近零，权重矩阵的逆不稳定）。 - 必要条件：局部弱 IV 参数化；聚类 / 异方差下的稳健权重矩阵估计。 - 解决的技术难点：在两步 GMM（需求参数 \(\hat{\theta}\) 代入供给侧矩）下，\(\hat{\theta}\) 的估计误差与弱 IV 的交互效应需要被计入渐近分布；作者通过 Delta 方法展开，将 \(\hat{\Delta}\) 的渐近表达式分解为"矩条件差异的主项"与"\(\hat{\theta}\) 估计误差的修正项"，在弱 IV 下主项与修正项的量级相同（均为 \(O(1/\sqrt{T})\)），无法忽略修正项。

定理 3 / 应用结果（Stock-Yogo 式弱 IV 诊断）： - 陈述：基于样本矩的 Jacobian 矩阵（对 IV 的导数），构造一个诊断统计量（类似第一阶段回归 F 统计量，但针对矩条件差异），其临界值由"弱 IV 下 RV 检验的 size distortion 不超过 10%"的 worst-case 计算决定。 - 直觉：诊断统计量衡量"IV 对两模型矩条件差异的识别力"；若识别力低于临界值，则 RV 检验在弱 IV 下的 size distortion 超过 10%，推断不可靠。 - 必要条件：需要指定"弱 IV 的具体阈值"（如 \(\ell\) 的范围），类比 Stock-Yogo 的"最大 size distortion 为 10%"的阈值。 - 解决的技术难点：在线性 IV 回归中，Stock-Yogo 的临界值可通过 Wald 检验的 size distortion 公式直接计算；在非线性 GMM 矩条件下，size distortion 依赖 nuisance 参数（\(C_0, C_1\)），需要通过数值模拟或渐近逼近计算 worst-case size distortion，作者提供了具体的计算步骤与临界值表。

证明路线与技术技巧：

整体路线：
步骤 1：定义局部弱 IV 参数化（\(E[\nabla_z g_k] = C_k / \sqrt{T}\)），将退化性参数化。
步骤 2：对 RV 统计量 \(\hat{\Delta}\) 进行 Delta 方法展开，分解为"矩条件差异的主项"与"\(\hat{\theta}\) 估计误差的修正项"。
步骤 3：在局部弱 IV 下，推导 \(\sqrt{T}\hat{\Delta}\) 的渐近分布（非正态，依赖 nuisance 参数）。
步骤 4：基于渐近分布，计算 RV 检验在弱 IV 下的 worst-case size distortion。
步骤 5：构造诊断统计量（基于样本矩的 Jacobian），计算 size distortion ≤ 10% 的临界值。
关键跳跃点：
引理：退化性与弱 IV 的等价性。难点在于：在非线性矩条件下，退化性（\(\Delta = 0\)）不再简单等价于"第一阶段回归系数为零"，需要通过矩条件的 Jacobian 与 IV 的相关性来刻画。作者通过隐函数定理（均衡价格作为 conduct 与 IV 的函数）将 conduct 差异转化为价格差异，再通过矩条件将价格差异转化为矩拟合度差异，最终建立等价性。
引理：两步 GMM 下 \(\hat{\theta}\) 估计误差与弱 IV 的交互效应。在强 IV 下，\(\hat{\theta}\) 的估计误差对 \(\hat{\Delta}\) 的影响是 \(O_p(1/T)\)（可忽略）；在弱 IV 下，影响量级升至 \(O_p(1/\sqrt{T})\)，必须计入渐近分布。作者通过Delta 方法展开 + 交互项的渐近逼近解决。
技术技巧点名：
Delta 方法：用于展开 \(\hat{\Delta}\) 对 \(\hat{\theta}\) 的依赖，分离主项与修正项。
局部参数化：类比 Staiger-Stock (1997) 与 Stock-Yogo (2005)，将弱 IV 参数化为 \(\sqrt{T}\)-局部，使渐近分布非退化但非正态。
隐函数定理：用于建立 conduct 差异 → 价格差异 → 矩拟合度差异的映射，证明退化性与弱 IV 的等价性。
稳健权重矩阵估计：允许异方差与聚类，使用 Hansen 和 Lee (2019) 的聚类渐近理论保证权重矩阵的一致性。
Worst-case size distortion 计算：类比 Stock-Yogo，通过数值模拟或渐近逼近计算 nuisance 参数空间上的最大 size distortion。

真实例子与应用： - 数据 / 场景：Villas-Boas (2007) 的纵向 conduct 检验数据（美国超市咖啡市场），检验"制造商定价"（vertical pricing，\(\mathcal{M}_1\)）vs. "Bertrand 竞争"（\(\mathcal{M}_0\)）。 - 怎么用上去：用 PyBLP 估计需求参数，用 pyRVtest（作者提供的 Python 包）计算 RV 统计量与弱 IV 诊断统计量。IV 集包括：其他市场价格（常用 IV）、成本 shifters（如咖啡豆价格）、零售商特定 IV。 - 得到什么结果： - "其他市场价格"作为 IV 时，诊断统计量低于临界值（弱 IV），RV 检验无 power（无法拒绝 \(\Delta = 0\)）。 - "成本 shifters + 零售商特定 IV"作为 IV 时，诊断统计量高于临界值（强 IV），RV 检验拒绝 \(\Delta = 0\)，支持制造商定价假说（\(\Delta > 0\)）。 - 想说明什么： - 验证理论：实证中常见 IV 集（如其他市场价格）在模型选择语境下可能过弱，导致 RV 检验无 power；弱 IV 诊断可操作地检测这一问题。 - 展示相对 baseline 的优势：标准 RV 检验（不诊断弱 IV）在弱 IV 下可能给出误导性结论（如误拒或误接受）；本文的诊断框架可避免此类错误。

🔎 结论是否比证明窄： - 作者在定理 2 中严格证明了局部弱 IV 下 \(\sqrt{T}\hat{\Delta}\) 的渐近分布，但诊断统计量的临界值计算依赖数值模拟或渐近逼近，未给出闭式表达。作者在文中承认临界值的计算是"基于渐近逼近的 worst-case 计算"，并提供了模拟步骤，但未严格证明逼近误差的界。这是一个值得研究者注意的点：临界值的计算是否有更严格的界（如 minimax lower bound on size distortion）？ - 作者在 intro 中 claim "RV 检验在模型误设下有优势"，但严格证明只覆盖了"矩条件连续可微 + 非嵌套 + 局部弱 IV 参数化"的情形，对矩条件不连续可微（如离散 conduct 模型）或嵌套模型的情形未证明。

四、开放问题（点到为止，扎根具体语句）¶

诊断统计量临界值的 minimax 界：本文的临界值基于渐近逼近的 worst-case size distortion 计算（Section 4），未给出 size distortion 的 minimax lower bound。扎根点：定理 3 的临界值计算步骤，以及作者承认"基于渐近逼近"的语句。可追问：在局部弱 IV 参数化下，RV 检验的 size distortion 是否有 minimax lower bound（类似 Staiger-Stock 在线性 IV 中的界）？
矩条件不连续可微时的退化性与弱 IV：本文假设矩条件连续可微（假设 1），但 IO 中常见离散 conduct 模型（如合谋 vs. 竞争的离散切换），矩条件可能不连续可微。扎根点：假设 1 的陈述，以及 intro 中"RV 检验在模型误设下有优势"的 claim（未覆盖不连续情形）。可追问：在矩条件不连续可微时，退化性与弱 IV 的等价性是否成立？RV 统计量的渐近分布如何？
AR 检验在模型选择中的改造：intro 提到 AR 检验作为替代路线（Bergquist 和 Dinerstein 2020 用 AR 检验补充估计），但未讨论在模型选择语境下改造 AR 检验的可能性。扎根点：intro 第 6 页对 AR 检验的提及。可追问：在弱 IV 下，对两模型分别做 AR 检验再比较，是否比修正的 RV 检验有更好的 size 保证？power 损失多大？
嵌套模型选择中的弱 IV 诊断：本文聚焦非嵌套模型，但实证中常需比较嵌套模型（如 Bertrand vs. 合谋，合谋是 Bertrand 的特例）。扎根点：假设 5（非嵌套）的陈述，以及 intro 中"RV 检验适用于非嵌套模型选择"的定位。可追问：在嵌套模型选择中，退化性（\(\Delta = 0\) 在较小模型为真时必然发生）与弱 IV 的关系如何？Stock-Yogo 式诊断是否可扩展？

（要确认某条是否真 gap，建议读 Shi (2015)、Schennach-Wilhelm (2017)、Andrews 等 (2019) 近期的 intro——若都指向"弱 IV 下模型选择的 size 控制"或"不连续矩条件的推断"，则为共识；若互相打架，则为机会。）

Maintained by 陈星宇 · Homepage · Source on GitHub

Testing firm conduct¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论