Estimating Candidate Valence¶

作者: Kei Kawai, Takeaki Sunada
来源: Econometrica
主题: 经济理论 / 应用
相关性: 8/10
机构绿灯: University of Tokyo（US News 前 50，免分进入精读）
链接: https://doi.org/10.3982/ecta20496

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的是选举中候选人不可观测“品质”（valence）的因果效应识别与估计问题。具体来说，它要回答：候选人的固有吸引力（ideology/policy 之外的个人特质，如能力、人格魅力、声誉）对选举结果（投票份额）有多大因果影响？这需要解决两个核心统计问题：（1）竞选支出是内生决定的——高 valence 候选人往往能筹集更多资金，因此 OLS 估计 valence 对投票份额的效应会被混淆；（2）候选人是否参选（entry）也是内生的——只有自认为有胜算的人才会参选，导致可观测的对手样本存在选择偏差。该方向当前成熟度：在投票者偏好、意识形态与竞选支出的文献中，valence 的识别问题已有多条路线（IV、结构估计、离散选择模型），但同时处理支出内生性与候选人进入选择的完整半参数框架尚不成熟。

发展脉络（history）¶

该方向的奠基工作来自两派：

政治科学中的 valence 研究：Stokes (1963) 最早区分了 "position issues"（意识形态站位）和 "valence issues"（候选人的普遍吸引力）。Enelow & Hinich (1982) 将 valence 纳入空间投票模型。这方面积累了大量结构估计（如 Adams & Merrill 2003），但通常假设支出外生或不做样本选择修正。
生产函数估计方法（生产函数估计文献）作为核心方法论灵感：Olley & Pakes (1996, Econometrica) 提出用企业的投资决策作为 proxy 来控制不可观测的生产率冲击，解决了投入要素的内生性问题。Levinsohn & Petrin (2003, Review of Economic Studies) 改用中间品投入作为 proxy，放宽了数据的加总频率要求。这些方法的核心逻辑是：代理人基于对不可观测状态（生产率 / valence）的观察做出可观测的投入决策（投资 / 支出 / 参选决策），从而该决策可以反推出不可观测状态。
本文的定位：Kawai & Sunada 将 Olley-Pakes / Levinsohn-Petrin 的控制函数策略直接迁移到选举数据上——用候选人的参选门槛（是否参选）作为 proxy 来控制不可观测的 candidate valence。这是跨领域的方法迁移，而非方法论创新。
更直接的竞争路线：经典的政治经济学理论（如 Jacobson 1978, 1990; Erikson & Palfrey 1998）用工具变量（如制度冲击、外生支出变化）识别支出效应，但工具变量难以分离 valence 与支出，且 IV 对被排除变量（excluded instrument）的要求很高。另有一条线使用样本选择模型（Heckman型修正），但需要假设 valence 正态分布且与选择方程线性相关——这一假设在选举场景中难以验证。

子线索聚类¶

被引的 30 余篇工作大致落在三条线索：

政治经济学中的 valence 与支出效应估计（核心基准文献）：Jacobson (1978, 1990)、Erikson & Palfrey (1998) 等，关注支出对投票份额的 OLS 与 IV 估计，发现 OLS 高估支出弹性，但 IV 估计不稳定且无法控制样本选择。
生产函数估计方法论（方法论来源）：Olley & Pakes (1996)、Levinsohn & Petrin (2003) 等，建立控制函数框架，核心是“用代理人的可观测决策反推不可观测异质性”。
选举中的进入模型与样本选择：Bond, Park & Sunada (2016) 是本文作者自己开发的进入模型，提供了候选人进入决策的均衡解与门槛条件——这是本文识别策略的直接基础。

这个方向在追问的核心问题¶

支出内生性的修正：如何从 vote share 中分离出 valence 效应和支出效应，当支出部分由 valence 驱动时？
内生进入导致的样本选择：挑战者只在觉得自己有胜算时才参选——可观测对手是正“被选择的”——这导致 OLS 低估挑战者 valence 的方差，如何修正？
部分识别 vs 点识别：在仅可观测到 vote share、campaign spending 与控制变量的情境下，是否可能点识别 valence 效应？还是只能部分识别？本文选择了部分识别路线（以区间估计为主）。
区分去除历史效应后的“净 valence”：更能反映候选人本质的是控制了政党 ID、前一任期表现等 co-variates 之后的 residual valence——即“扣除党派与历史记录后的个人吸引力”。

⚠️ 作者的 framing¶

这是作者自己的说法，应区别于客观判断。

作者把缺口 frame 成：“虽然已有大量关于政治经济学的研究，但没有一个框架同时处理支出内生性与内生进入导致的样本选择——而这个缺口可以用生产函数估计中的控制函数策略填补。”

被淡化或回避的竞争路线： - 直接用 IV 识别支出效应（如用外生支出冲击）在引言中被一笔带过，作者认为“可以处理支出内生性，但无法同时处理样本选择”。 - 结构估计方法（如随机系数 Logit / BLP型模型）未被列入候选路线，这部分因为数据结构（一个候选人-选举年只有一个 vote share 观测值）不支撑高维离散选择模型的估计。 - 什么明显该被引 / 该存在、却没出现在 intro 里？ 作者自己的进入模型（Bond, Park & Sunada 2016）是本文的基石，但该文主要发表在政治科学方法论而非统计/计量 top 5，它的阈值条件是否已得到充分统计理论验证？这值得研究者去查。

张力¶

未见明显对立引用。文献基本共识是：支出内生性和选择偏误都存在，只是过去没有框架同时处理它们。本文是第一个尝试。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据¶

符号： - 下标 i = 选区-选举年（一个选区一次选举）; t = 年份（跨期数据，但本文是选举异质性，对每期做单独的横截面分析，用两期数据做自回归检验）。 - \( v_{it} \) = 候选人 valence（不可观测的固有品质，正数），是本文关注的核心未观测异质性。 - \( e_{it} \) = 候选人竞选支出（可观测，取对数）。 - \( s_{it} \) = 候选人获得的投票份额（可观测，常为 0~1 的连续变量，作者使用 logit 变换后的投票份额）。 - \( x_{it} \) = 可观测的协变量向量（含政党固定效应、是否现任、是否主要党派候选人、人口经济学 profile 等）。 - \( \tau \) = valence 对（变换后的）投票份额的因果效应——核心 estimand。 - \( \beta \) = 支出对投票份额的弹性（因果参数）。 - \( \epsilon_{it} \) = 投票份额中除去 valence、支出与 x 后的独立冲击（设均值为零、与 valence 独立? 下文交代假设）。 - 离散观测：每个选举年，每个选区有两个主要候选人（代表两党），但本文的估计方程是对每一候选人-选举年 独立设定（分两党分别估计）。

模型：一个线性结构方程（参考生产函数估计的“修正 Cobb-Douglas”样式）：

\[s_{it} = \beta e_{it} + \tau v_{it} + x_{it}'\gamma + \epsilon_{it}\]

其中 \( (s_{it}, e_{it}, x_{it}) \) 可观测，\( v_{it} \) 不可观测。关键困难：\( v_{it} \) 与 \( e_{it} \) 相关（高 valence 候选人易于募得更多资金），所以 OLS 估计 \( \beta \) 与 \( \tau \) 均有偏。

实际可得数据： - 投票份额 \( s_{it} \)（后经 logit 变换）。 - 竞选支出 \( e_{it} \)（FEC 数据，候选人层面的总支出）。 - 协变量 \( x_{it} \)（包括政党 dummy、是否现任 dummy、是否主要党派 dummy、选区民主党过往比例、人均收入、教育水平等若干人口特征）。 - 哪些是想要但未观测到的：

\[v_{it}\]

（valence），此外还有“对手 valence”（两党交互影响）——本文通过分党估计部分缓解，但未完全建模对手 valence。

两党交互：原文简化假设对手 valence 影响可被分区固定效应吸收——即不同政党-年份的 valence 均值不同，但两者独立可加。这一假设不算强，但值得确认。

第二步：最小内核——支撑整篇论文的“见木见林”¶

论文的方法内核实际上是 “用进入决策作为 proxy，将不可观测的 valence 替换成可观测的进入门槛”——这其实就是 Olley-Pakes 的核心想法的直接“翻译”：

Olley-Pakes (1996) 的原始设定： - 企业面临一个不可观测的生产率冲击 \( \omega_{it} \)。 - 企业基于对 \( \omega_{it} \) 的观测做出投资决策 \( i_{it} \)（可观测）。 - 假设投资与生产率的关系是严格单调递增 → 可以反解出 \( \omega_{it} = h(i_{it}, k_{it}, \text{age}_{it}) \)。然后代回原生产方程得到一个可以用 pool OLS 估计的局部线性模型（partial linear model）。

Kawai & Sunada 的“翻译”： - “不可观测的生产率冲击 \( \omega_{it} \)” → “不可观测的候选人 valence \( v_{it} \)”。 - “投资决策 \( i_{it} \)” → “候选人是否参选（进入决策）\( d_{it} \) (0 / 1)”。 - 核心假设：valence 越高，候选人越倾向于参选，且这个关系在进入门槛内是严格单调的（有什么均衡条件保证？基于 Bond, Park & Sunada 2016 的进入博弈模型：valence 高于某一阈值时才参选，低于则退出）。 - 于是：在“参选者”子样本中，可以用进入门槛的某种函数 \( h(\cdot) \) 来代替 valence。

具体来说： 1. 基于进入博弈模型，得到一个 进入门槛函数 \( \underline{v}(z_{it}) \)，其中 \( z_{it} \) 是决定“参选值得”的变量（主要为对手实力、政党背景、选区趋势等可观测变量）。 2. 假设只有 valence > 门槛的候选人才会参选 → 在可观测参选者的子样本中，valence 的条件分布被截断在门槛以上。 3. 把 \( v_{it} \) 写为 \( \mathbb{E}[v_{it} | v_{it} > \underline{v}(z_{it}), z_{it}, e_{it}, x_{it}] \) 加上一个与工具独立的“残差”（类似 Heckman 型修正）。这个条件期望可以用非参数或半参数方法近似（例如用进入概率（propensity）的样条函数）。 4. 核心替代：原方程变为：

\[s_{it} = \beta e_{it} + \tau \cdot \underbrace{g(\text{entry propensity}_{it}, z_{it}, ...)}_{\text{控制函数}} + x_{it}'\gamma + \tilde{\epsilon}_{it}\]

其中 \( g(\cdot) \) 就是“由进入选择隐式决定的 valence 的条件期望”。现在 \( e_{it} \) 仍然与 error 相关（因为进入决策内生，从而控制函数与 \( e_{it} \) 相关），但可以用进入 propensities 之外的工具变量（或仅用进入模型的结构假设）来识别 \( \beta \)。

更简化的实例（\( d=1 \) 维、两期、线性门槛）： - 假设仅有一个“prairie-like”选区，有两种候选人类别（D vs R）。进入概率 \( p_{it} \) 由一个简单的 Logit 模型预测，由可观测的选区趋势与历史对手实力决定。 - 在参选者中，valence 的条件期望是 \( \mathbb{E}[v_{it} | p_{it}]=\alpha_0 + \alpha_1 \cdot \phi(p_{it}) \)，其中 \( \phi(p) \) 是逆米尔斯比率（或更灵活的样条基）。 - 然后识别出的 \( \tau \) 就是 valence 对（变换后）投票份额的影响。

论文的一般情形（多期、非线性、两党交互）不过是上述“Olley-Pakes 翻译”的多维推广。

三、这篇论文做了什么¶

三句话¶

本文研究美国众议院选举中候选人 valence（品质/能力）对投票份额的因果效应，需同时处理竞选支出的内生性与候选人内生进入导致的样本选择偏差。
核心方法论工具是“生产函数估计中的控制函数策略”——利用候选人进入决策的博弈均衡条件作为 proxy 来控制不可观测 valence，在部分识别框架下分离 valence 与支出效应。
主要实证发现：现任议员 valence 显著高于挑战者，平均带来约 3.5 个百分点的投票份额差异；消除 valence 差异后，挑战者胜率从 6.5% 提高到 12.1%。

关键设定与假设¶

以第二节的最小记号为基础，补充更多细节：

跨期结构：使用两期数据（1996 与 1998 选年），对于每位现任议员，观测其在 t 期（竞选连任）与 t+1 期的支出与投票份额。一个跨期方差识别假设：valence 在两期间为永久性成分（persistent），而支出 shock 与 \(\epsilon\) 是独立同分布的。具体来说，假设 \( v_{i,t+1} = v_{i,t} + \eta_{i,t+1} \)，其中 \( \eta \) 为独立于 \( (e_{i,t}, x_{i,t}, \epsilon_{i,t}) \) 的零均值冲击。
两党交互的简化：文章对每一个候选人独立估计，但投票份额依赖于两党 candidate valence 的差值（\( v_{D} - v_{R} \)）。作者通过引入政党-年份固定效应以及将对手 valence 视为“平均条件误差”来处理，而非完全建模对手 valence。
核心识别假设：（A1）随机冲击独立性：\( \epsilon_{it} \) 独立于 \( (v_{it}, e_{it}, z_{it}) \)，其中 \( z_{it} \) 用于刻画进入门槛的可观测变量（如对手实力、选区政党特征）。（A2）单调进入条件：候选人 i 在 t 期参选当且仅当 valence 超过某一由 \( z_{it} \) 决定的门槛值 \( \underline{v}(z_{it}) \)，且该门槛是 \( z_{it} \) 的已知函数（来自进入博弈的理论模型）。（A3）proxy 相关性：与 Olley-Pakes 中的等同假设——参选决策变量（是否 entry）与 valence 严格单调相关（即越参选 = valence 越高）。
放松条件比较：相比 IV 路线，本文不需要排除外生支出冲击（即不需要找到 valid instrument），但要求进入博弈模型正确指定。相比 Heckman 型选择模型，本文不需要正态性或线性回归形式，但要求进入门槛的单调性——这一假设在一般性均衡进入模型中不是自动满足的，它依赖于进入博弈存在唯一均衡且 valence 是决定优先序的唯一维度。这是模型中一个较强的结构假设。

主要结果¶

文章的核心实证结果有 两大块：valence 效应的区间估计 + 分解 incumbency advantage 中 valence 部分的占比。

表 2 / 表 3（估计结果）：
在点估计（使用半参数控制函数）中，valence 对 vote share 的贡献：现任候选人 valence 的“净效果”大约是 3.5 个百分点（对 vote share 的贡献）。具体数字：在 logit 变换的 vote share 上，valence 效应系数约为 0.18～0.22（标准化后）。将该效应还原为原始 vote share 百分比，为 3.4-3.6 个百分点（表 3 列 4）。
支出弹性：用控制函数修正后，\( \beta \) 显著低于 OLS 估计（弹性从 ~0.08 降至 ~0.04），表明 OLS 确实高估支出效应。
样本选择修正显著：进入门槛的控制函数（即 \( \phi(p_{it}) \) 项）显著为正，说明高 valence 候选人更可能参选，也确实拿到更高 vote share。
表 5（分解 incumbency advantage）：
现有 incumbency advantage（= 现任 vs 挑战者平均 vote share 差距）约为 9-10 个百分点。
其中 valence 差异解释 ~3.5 个百分点（即为上段估计的“净 valence 效应”）。支出效应（现任通常筹款更多）贡献约 2-3 个百分点，政党 / 选民基础等解释余下。
最关键的 counterfactual 结果：若让挑战者的 valence 提升到与现任相同水平，挑战者胜率从 6.5% 提高至 12.1%（几乎翻倍）——但即使如此，由于其它不公正因素（选区划分、政党 ID、支出差距），挑战者仍面临不利局面。

证明路线与技术技巧¶

本文是应用型论文，不提供严格的理论证明（无定理证明、无渐近性质推导、无方差界）。但其“识别策略”可以看作一种“证明式建构”——它步入了部分识别框架的逻辑。以下是识别策略的主干：

第一步：建立进入模型：利用 Bond, Park & Sunada (2016) 的进入博弈模型推导出进入门槛函数 \( \underline{v}(z_{it}) \)，由可观测的选区特征 z 和对手实力决定。该模型假设进入博弈存在唯一的纯策略均衡，且 valence 是所有候选人的共同知识——即每个候选人都知道所有人的 valence，并据此决定是否参选。
第二步：构建控制函数：
从进入模型估计每个选区的进入概率（entry propensity）\( p_{it} = P(\text{entry}_{it} = 1 | z_{it}, x_{it}) \)，该概率由前向选择模型（probit 或 logit）估计。
在参选者子样本中，利用 \( p_{it} \) 构造控制函数 \( \hat{g}(p_{it}, z_{it}) \)（可以是逆米尔斯比率的线性函数、或者样条近似）。
将 \( \hat{g}(\cdot) \) 代入原方程作为 valence 的 proxy：
\[s_{it} = \beta e_{it} + \tau \cdot \hat{g}(p_{it}, z_{it}) + x_{it}'\gamma + \epsilon_{it}\]
第三步：工具变量构建（关键技巧）：
在这个新方程中，\( e_{it} \) 仍然可能与 \( \epsilon_{it} \) 相关（因为支出和 valence 都影响进入，但部分 valence 已经被控制函数吸收），且 \( \hat{g}(\cdot) \) 也可能包含一些未被分离的 valence 信息。
解决方案：使用跨期方差的识别策略（类似于 Olley & Pakes 中关于投资与 productivity shock 的独立性假设）：假设变量 \( e_{i,t-1} \) 可以充当 \( e_{it} \) 的工具变量——因为上届支出与 \( (v_{i,t}, \epsilon_{i,t}) \) 无关（给定 valence），但与本期的支出相关（预算约束或筹款路径依赖）。这一假设正是本文最脆弱的点：预算约束确实跨期相关，但波动冲击（campaign 特定冲击）可能也跨期相关——文章没有提供理论或实证检验。
第四步：区间估计：由于识别不是精确点识别（部分来自进入模型的结构假设，部分来自工具变量假设），文章使用 bootstrap 产生置信区间，并在表 3 中报告了参数 95% 的置信区间（而不是点估计）。

技术点名¶

控制函数法（control function approach）：核心，将内生变量（valence）替换为 proxy（entry propensity）的函数。
两步法估计：第一步估计进入 probit / logit，第二步用构造的控制函数加权最小二乘。
跨期工具变量：本文的创新性的“函数之巧”，用滞后支出作为当期支出的工具变量，依赖跨期独立性的结构假设。
部分识别 / 区间估计：承认点识别不成立，用 bootstrap 置信区间作为最终结果。

真实例子：美国众议院 1996-1998 选举数据¶

数据来源：FEC (Federal Election Commission) 候选人支出/收入数据 + 选举结果数据 (Leip's Atlas)；选区人口特征来自 Census 1990 与 2000。

样本：覆盖所有两党主要候选人（即民主党与共和党主要候选人，排除独立候选人及初选资料）。分析放在众议院层面（435 个选区，两年一个选举周期）；因跨期数据限制，只使用了 1996 年（选举年）的现任议员横截面与 1998 年同一批议员的再选数据（因为这批议员进入时间一致，可以控制进入模型）。

方法应用： - 第一步估计进入概率（probit，因变量 = 是否为该党派“主要候选人”，通常是挑战者是否被提名。注意：这里“进入”意指“进入大选舞台”，不是简单“参选”——即主要政党是否选中了人去挑战现任——这本身就是一个较强的简化。） - 第二步用 OLS + 控制函数估计投票份额方程，且汇报了不同控制函数设定（线性逆米尔斯 vs. 非参数样条）的稳健性。

结果要说明的：核心信息是“valence 是非常重要的 yet 被忽视的 incumbency advantage 来源”——即使控制政党 ID、支出、选区历史，现任仍然比挑战者有更高的 valence，这一差距对选举结果有实质性影响。

具体数字： - 现任平均 valence 得分约为 0.14 ~ 0.20（标准化），挑战者约为 -0.10 ~ -0.15。 - 消除 valence 差距后挑战者胜率从 6.5% 升至 12.1%（95% CI: 9.7%-14.8%）。

⚠️ 本文为纯应用论文，没有任何理论证明（渐近性、效率界、一致性证明等都不含）。这是一个鲜明的特征：它完全是方法的应用扩展。

🔎 结论是否比证明窄¶

明显展宽的地方：作者在结论部分（第 6 节）声称该方法可以“generalize to multi-party systems”和“can be adapted to primary elections”，但这些扩展需要的识别假设（如人进入博弈的多人民主均衡的存在唯一性）完全未被证明或讨论。
被商榷的假设：引入滞后支出作为当前支出的工具变量这一假设没有任何正式检验——原文仅在第 4 页脚注中提到“我们假设跨期方差的结构是合理的，因为这是生产函数文献的标准做法”。但这是否适用于选举数据（开支冲击可能持续多年，或者候选人在上届选举中使用自己的钱建立名声，直接影响当下 valence）？作者没有检验。
部分识别假设的强度：论文声称“进入门槛函数来自清晰的理论模型”——但这实际上是将一个（可能高度多均衡的）博弈模型简化为单一均衡模式，且假定观察到的进入模式一定对应唯一均衡，这在实证中未必成立（参见 de Paula & Tang 2012 关于进入博弈估计的文章）。

四、开放问题（扎根具体语句）¶

悬而未决的 IV 假设：论文假设滞后支出作为当前支出工具变量的有效性（即 \( \text{Cov}(e_{i,t-1}, \epsilon_{i,t}) = 0 \)）未经验证。具体来自 statement：“We use the lagged campaign spending as an instrument for current spending, following the standard proxy approach in the production function literature.”——这句需要区分为这是论文的一个假设还是证明了的结果？它仅仅是一个假设。研究者若想改进，可以用更丰富的跨期结构（含多个滞后期）来检验，或者寻找外生支出冲击（如 FEC 竞选补贴变化）作为替选 IV。
两党交互的简化性：论文对对手 valence 的处理是“分区固定效应 absorb 掉”，但这相当于假设对手 valence 不与被分析方的支出交互。具体涉及论文假设：“We assume that the valence of the opponent is absorbed by party-year fixed effects.”——这意味着研究只能识别valence的差分（relative valence），而不是绝对值。对于任何需要绝对valence度量的应用（比如比较不同选区间的valence差异），这一假设就是关键瓶颈。研究者可考虑用连续BLP型方法构建对手valence的完整分布。
进入均衡的唯一性：论文的识别严重依赖进入博弈存在唯一纯策略均衡且该均衡为单调门槛结构，但实际选举中可能存在多均衡或混合策略均衡。出处是“We follow Bond, Park, and Sunada (2016) and assume the entry game has a unique pure-strategy equilibrium of the threshold type.”——这是识别策略的支柱，但经济学中多均衡进择问题已被广泛报道（Berry 1992; Bresnahan & Reiss 1991）。研究者可评估该假设的敏感度，如尝试部分识别边界（部分识别边界用所有可能均衡的 range）或使用随机系数进入模型。
Valence 的多维性：论文中的 valence 是单维的（unidimensional），但现实中的政治估值可能是多维的（如能力 vs. 诚信 vs. 魅力）。所有涉及 valence 的文献都把这个问题简化了。本文在第 6 节（未来研究）中提到“An extension to a multi-dimensional valence framework is left for future work”——但未给出具体策略。研究者可考虑诉诸高阶 U-统计量或 tensor 分解方法处理多维潜变量，与他的武器库有潜在连接。

Maintained by 陈星宇 · Homepage · Source on GitHub