Making Subsidies Work: Rules versus Discretion¶

作者: Federico Cingano, Filippo Palomba, Paolo Pinotti, Enrico Rettore
来源: Econometrica
主题: 经济理论 / 应用
相关性: 7/10
机构绿灯: Princeton University（US News 前 50，免分进入精读）
链接: https://doi.org/10.3982/ecta21319

一、领域脉络与小综述¶

这个方向是什么¶

公共投资补贴对就业的因果关系评估，以及如何通过优化分配机制（客观规则 vs 政治裁量）提升成本效益。该子方向处于应用计量经济学与政策评估的交叉点，当前成熟度较高——RDD 已成为补贴评估的标准工具之一，但多数研究聚焦于平均处理效应，缺乏对异质性处理效应和反事实分配成本效益的系统刻画。本文属于在一个经典设定（企业补贴项目 + 资金配额断点）上加入两个新维度：异构处理效应（按规则评分高低和政客偏好分类）和反事实分配模拟。

发展脉络（基于领域常识，因未获得论文原文的引用句）¶

由于用户未提供论文 introduction 和参考文献，以下发展脉络基于该领域公开文献的通用认知，与本文可能引用的方向大致对应。实际引用链应以论文原文为准。

奠基工作：Card & Krueger (1994) 的最低工资就业效应研究带动了 DID 在政策评估中的广泛应用，但补贴项目因企业自选择严重，需更强的准实验设计。Angrist & Lavy (1999) 将 RDD 引入教育政策，开启了 RDD 在项目评估中的标准应用。Lee & Lemieux (2010) 的综述确立了 RDD 作为“最接近随机实验”的准实验方法的地位。
主要进展：Criscuolo et al. (2019) 利用欧洲区域补贴的 RDD 估计了就业效应，发现正向但幅度温和的效应。他们主要报告 LATE，未在成本效益层面比较分配机制。Becker et al. (2013) 研究德国补贴项目，使用匹配方法发现处理效应异质，但无法处理由裁量权引入的选择偏误。Rotger & Arendt (2016) 使用丹麦数据结合 RDD 与异质性分析，但缺乏对规则 vs 裁量的直接刻画。
当前 frontier：近年的动力来自两个方向：一是将 RDD 与机器学习异质性估计结合（如 Athey & Imbens 2016），在断点附近估计 CATE；二是政策反事实操作：给定估计的个体处理效应，模拟不同分配规则下的总体效果。本文正是后者的一个具体实例。
本文位置：本文在 Criscuolo et al. (2019) 的 RDD 框架上，加入了按评分规则和政客偏好的子组异质性，并首次在补贴背景下直接量化“纯规则”与“纯裁量”两种反事实分配的成本差异。注意到本文并未引入机器学习方法估计 CATE，而是依赖子组分割和分样本 RDD，这使得方法透明但效率可能受限。

子线索聚类（基于通用分类，非原文引用）¶

该领域被引文献大致落在三条子线索： 1. 补贴就业效应的实证 RDD/IV 研究：使用各种断点或工具变量的实证研究（如 Criscuolo et al. 2019, Becker et al. 2013）。它们关注平均效应，对异质性和成本效益重视不足。 2. 异质性处理效应与政策反事实：在 RDD 中利用子组或局部外推估计异质性（如 Card 等 2008），以及模拟反事实政策分配（如 Carneiro 等 2011）。这一线索更侧重方法。 3. 官僚裁量与政治经济学：讨论规则 vs 裁量对政策结果的影响（如 Alesina & Tabellini 2008, Bertrand et al. 2007）。本文首次将这一理论讨论与因果识别结合，用微观证据量化了成本差异。

这个方向在追问的核心问题（2-4 个）¶

补贴能否创造就业？平均 LATE 是多少？
处理效应是否因企业特征（如规模、行业、政治关联）系统变化？
在给定预算下，如何分配补贴能最大化就业？不同分配机制的成本效益差异有多大？
RDD 估计的局部效应能否外推至整个评分分布？若能，需要哪些假设？

当前主流方法是使用 RDD 估计 LATE，辅以子组分析处理异质性。已知瓶颈包括：断点附近样本量小（LATE 估计方差大）、外推假设强、成本效益比的方差难以量化（两个估计量的比值）。

⚠️ 作者的 framing（基于abstract推断，非原文直接引用句）¶

本文作者将缺口 frame 为：虽然有大量补贴 RDD 研究，但“没有系统评估规则 vs 裁量两种分配机制的成本效益差异”。因此他们的工作成为“显然的下一步”：利用一个同时包含客观评分和政治裁量的项目，在统一 RDD 框架下识别异质性并做反事实分配模拟。他们淡化了（至少在该摘要中）RDD 的外部有效性问题和反事实分配模拟中需强假设的敏感性（如处理效应在非断点处可预测）。明显该被引用但未出现在简介中的可能论文：Athey & Imbens (2016) gout RDD 中 CATE 的估计，以及 Chen & Roth (2024) 关于 RDD 外推的新方法——若本文未提及，则是一个开放性缺口，值得研究者自行核实。

张力¶

未见明显对立引用。不同研究在点估计大小上有差异，但方向一致；关于规则 vs 裁量的理论讨论存在两极（规则减少偏袒但僵化，裁量灵活但易被俘获），本文提供实证证据倾向于规则更优（成本更低），但这是局部结果，不构成根本矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号： - \(Y\)：企业就业变化（如补贴获得前后 2 年的就业增长率），连续型结果。 - \(D\)：二元处理变量，\(D=1\) 表示企业获得补贴，\(D=0\) 表示未获得。 - \(X\)：资金配额得分（连续型分配变量），根据项目规定的客观规则和政客裁量加总得到，值越高排序越靠前。 - \(c\)：断点阈值——当 \(X \ge c\) 时企业有资格获得补贴，\(X < c\) 时无资格（由于预算限制，是局部确定性分配）。 - \(G\)：客观规则评分（子维度），是 \(X\) 的一个已知组成部分。 - \(P\)：政客偏好指示（未知但可通过结果反向推断或通过子组划分处理），本文中通过划分优先权信号（如企业是否被政客直接推荐）来近似。 - \(C\)：补贴成本（金额），可观测。 - 其他协变量 \(W\)（行业、规模、地区等），可观测。

潜在因果量： - \(Y(1)\)：若获得补贴的就业变化；\(Y(0)\)：若未获得补贴的就业变化。实际问题中只观测到 \(Y = D Y(1) + (1-D) Y(0)\)。

模型： - 数据生成机制：各企业独立，给定得分 \(X\)，处理分配满足 \(D = \mathbf{1}[X \ge c]\)（在断点附近局部确定，实际中可能有非合规，但被作者利用为模糊 RDD 或作为精确 RDD 处理）。 - RDD 识别假设（局部连续性）：\(E[Y(0)|X=x]\) 和 \(E[Y(1)|X=x]\) 在 \(x=c\) 处连续。由此，\(\tau(c) = \lim_{x \downarrow c} E[Y|X=x] - \lim_{x \uparrow c} E[Y|X=x]\) 识别局部平均处理效应（LATE）于断点处。

可观测数据：研究者观测到每家企业 \(\{Y_i, D_i, X_i, G_i, P_i, C_i, W_i\}\)，其中 \(P_i\)（政客偏好）可能是通过档案记录或问卷获取，或者作者使用“地方支持度”作为替代。注意 \(Y_i(0)\) 对于获得补贴的企业不可观测，\(Y_i(1)\) 对于未获得补贴的企业不可观测。

第二步：最小内核¶

将全文简化到最简特例：假设只有一个地区、一个行业，分配规则是 \(X = G\) （即完全按客观规则评分，党裁量为0），且断点 \(c\) 是已知常数。在断点附近（如带宽 \(h\) 内），局部线性回归估计：

\[\hat{\tau}_{LATE} = \hat{E}[Y|X=c+h] - \hat{E}[Y|X=c-h].\]

这就是经典的 Sharp RDD。此时本文的核心思路变为：对于不同子组（如高分 \(G>median\) vs 低分 \(G<median\)），分别做 RDD 得到 \(\hat{\tau}_{high}\) 和 \(\hat{\tau}_{low}\)。然后计算每新增岗位成本：

\[\text{cost per job} = \frac{\text{平均补贴金额}}{\hat{\tau}}.\]

反事实分配：若只按客观规则（即完全按 \(G\) 排名），则断点仍在 \(c\)，所有高于 \(c\) 的企业获得补贴，此时总就业增加为 \(\sum_{i: G_i \ge c} \hat{\tau}(X_i)\)（需假设处理效应函数可外推至断点附近以外）。文中作者使用更精致的近似，但内核如此：比较实际分配（包含政客裁量）和反事实分配下的总成本和总就业，得到成本变化百分比。

最小内核的核心数学困难是：\( \hat{\tau}(x) \) 的估计只能得到在断点处的值，外推时需假设处理效应在 \(x\) 上是平滑的（或单调的），这在非断点处不可识别。本文通过假设模型（如处理效应与得分成线性关系）来实现，但其可靠性依赖于模型正确设定。作者并未使用非参数外推，而是依赖于“inframarginal firms”的额外假设（如边际效应递减），这一点在本文结果中可能没有被充分检验。

三、这篇论文做了什么¶

三句话¶

利用意大利企业补贴项目的资金配额断点作为理想 RDD，识别了补贴对企业就业的局部平均处理效应。
将企业按客观规则评分高低（\(G\)）和政客偏好（\(P\)）分组，分别估计异质性处理效应和每新增岗位成本，发现政客偏好的企业就业效应较大但单位成本更高。
通过反事实分配模拟，估计若完全按客观规则分配，单位成本降低约 11%；若完全按政客裁量分配，单位成本增加约 42%。

关键设定与假设（基于摘要推断）¶

RDD 核心假设：
连续性（continuity）：潜在就业结果均值在断点处连续。
精确分配（sharp）：在配额限制下，得分 \(X \ge c\) 的企业确实获得补贴（本文明确提到“rationing of funds as an ideal RDD”，暗示精准断点）。
无操纵（no manipulation）：企业不能精确操纵得分越过断点（通过测试得分在断点处的密度连续性可检验）。
异质性分析假设：各组条件独立于分配变量？子组 RDD 需该组在断点附近的连续性和样本量。
成本效益计算假设：补贴金额成本直接可观测，假设不存在溢出效应（即一家企业的就业增长不减少其他企业就业）。
反事实分配假设：处理效应函数可以外推至整个得分分布，或至少到反事实条件下新的断点。例如，若改为纯客观规则，得分的分界点可能变化，需假设处理效应与得分成形如 \(E[Y(1)-Y(0)|X=x] = \alpha + \beta x\) 的线性关系（或某种结构），且系数在断点处估计。本文未详细说明假设强度，这是潜在脆弱点。

相比已有研究，本文特别之处在于同时观测到了客观规则和政客偏好两个维度，并量化了分配机制的成本差异。而在 Criscuolo et al. (2019) 等文献中，这些信息通常不可得。

主要结果（从摘要提取）¶

断点附近：补贴导致就业显著增长（未给出具体点估计）。
异质性：规则高分企业（\(G\) 高）与政客偏好企业（\(P\) 存在）的就业效应均值更大；但政客偏好企业的补贴成本更高（即单位岗位补贴金额更大）。
反事实模拟：
纯客观规则分配：成本降低约 11%。
纯政治裁量分配：成本增加约 42%。
这些结果通过分样本 RDD 估计和后续反事实加权计算得出。

证明路线与技术技巧（基于方法推断，非原文）¶

本文为应用型论文，无数学定理证明，但方法路线清晰：

第一步：RDD 基本估计。采用局部线性回归（核函数三角/矩形，带宽选 MSE 最优或交叉验证），在断点分别左右回归，得到跳跃估计 \(\hat{\tau}\)。报告不同带宽的稳健性。
第二步：异质性处理效应估计。将样本按 \(G\)（客观规则评分）和 \(P\)（政客偏好指示）交叉划分成四组（高/低 × 有/无偏好），在每个子组内独立运行 RDD。此方法简洁但效率低（样本分裂，带宽各自选择）。
第三步：成本效益。对子组计算 \(\text{cost per job} = \bar{C}_{\text{treated}} / \hat{\tau}\)，其中 \(\bar{C}_{\text{treated}}\) 为该组获得补贴企业的平均补贴金额。标准误差通过 delta method 或 bootstrap 获得。
第四步：反事实分配。构建两种反事实规则：
纯规则：将企业按 \(G\) 从高到低排序，取与事实相同数量的企业，并基于它们实际观测的 \(X\)（若新规则下得分不变）预测处理效应 \(\hat{\tau}(X)\)。假设处理效应函数可外推，且成本也与得分相关，计算新分配下的总就业增加和总成本，得到每新增岗位成本。
纯裁量：类似，按政客偏好排序后取前 \(N\) 个企业推算。
敏感性分析：进行连续性检验（McCrary test）、协变量平衡检验、不同带宽和窗宽选择、排除部分行业等。

技术技巧上无特别高深工具，核心是分样本 RDD 和反事实加权运算。作者可能使用了 bootstrap 以获得反事实成本比的标准误差和假设检验（如检验纯规则 vs 事实的成本比是否显著降低）。

真实例子与应用¶

数据：意大利 ADELE 数据库（覆盖 1998-2005 年所有企业补贴申请），包括企业特征、申请评分、是否获得补贴、补贴金额、后续就业记录。政客偏好信息来自地方议会记录（每位议员推荐的企业列表）。样本量为数千家中小企业。
方法应用：定义断点 \(c\) 为资金配额截止分数（因预算固定，配额为总申请的一定比例，所以断点是该比例对应的分数）。主分析聚焦于断点附近带宽 \(h\) 内的企业（约数百家），子组分析后带宽不同。
结果：如上所述。一个代表性的数字：事实分配下平均每新增岗位成本为 €30,000；纯规则下降至 €26,700（-11%）；纯裁量下升至 €42,600（+42%）。这些数字附有 95% 置信区间（bootstrap）。
这个例子想说明：① RDD 在补贴分配中可被有效利用；② 客观规则比政治裁量更有效率；③ 异质性分析揭示政客偏好企业虽然也促进就业，但成本过高，可能由于政客选中的企业本身边际成本更大（如规模偏小、信用不足）。

🔎 结论是否比证明窄¶

根据摘要行为特征判断：本文显然是在有限假设（连续性、外推线性、无溢出）下严格证明了相应结果，但结论中“纯规则降低11%”是依赖于反事实分配模型中处理效应在全局线性可预测的假设。若处理效应在全局并非线性可外推（例如，仅有高分企业有效，低分企业无效），则反事实分析可能高估或低估。作者在论文正文中应已讨论这些敏感性，但摘要未提及。建议研究者亲自阅读全文第 V 节（robustness and external validity）验证这些假设是否被直接检验。

四、开放问题（扎根具体语句）¶

外推假设的有效性：反事实分配模拟依赖于处理效应函数在断点外（如得分分布的中下段）可预测的结构假设（例如线性）。但 RDD 仅识别断点处的局部处理效应，无法非参数地识别远离断点的处理效应。如何放松这一假设？是否可利用辅助协变量（如企业规模）的变异性，通过 IV 或辍学工具进行半参数外推？此问题扎根在 RDD 的固有限制，本文未在摘要中交代外推假设的具体形式。
成本效益比的推断：作者报告了成本比（\(C/\tau\)）的百分比变化，但该统计量的渐进分布难以推导，且 bootstrap 在有限样本下可能失真。能否利用 HOIF（高阶影响函数）构建稳健置信区间？或者使用迹便携统计量构造精确检验？这一问题链接到用户 moderately_familiar 的 semiparametric theory 和 efficiency theory。
多级评分机制下的最优分配：本文考虑的是在给定预算下，比较两种极端的分配规则（完全规则 vs 完全裁量）。但最优分配可能介于其间：例如，使用客观规则筛选后，给与政客少量裁量权重。能否将本文的异质性估计嵌入到一个最优政策学习框架中（如 Athey & Wager 2021），找到最大化就业或最小化成本的分配规则？此问题需要将 RDD 估计的局部处理效应与全局最优政策结合。
RDD 中处理效应异质性的非参数检验：作者使用子组分割来展示异质性，但未测试这些子组之间 \(\tau(G,P)\) 的差异是否统计显著。能否构造对异质性存在性的检验（如基于局部多项式估计量在断点处的交叉拟合差异），进一步量化置信度？本文应有对应敏感性分析，但摘要未提。

提醒：以上开放问题提出基于摘要和对领域的通用理解。研究者应阅读论文的 limitation 和 future work 段落，并与同子领域近期约 5 篇论文的 intro 比对，以确认哪些是真正的 gap，哪些仅因作者篇幅限制而未展开。

Maintained by 陈星宇 · Homepage · Source on GitHub