The Economics of Partisan Gerrymandering¶

作者: Anton Kolotilin, Alexander Wolitzky
来源: Econometrica
主题: 经济理论 / 应用
相关性: 1/10
机构绿灯: MIT（US News 前 50，免分进入精读）
链接: https://doi.org/10.3982/ecta23609

一、领域脉络与小综述¶

这个方向是什么 选区划分优化是在给定选民分布与选举规则（通常是赢者通吃）下，设计者如何将选民分割到等人口选区以最大化某政党期望席位份额的数学问题。它本质上是一个受不确定性（选民投票行为的随机性）驱动的组合分区优化问题。当前该方向在经济学与政治科学中已形成较成熟的规范模型，并与信息设计理论建立了形式化联系，但在计算复杂性（寻找最优分区的算法难度）与实证结构估计上仍处于探索期。

发展脉络 由于本次输入未包含完整 introduction 与 bibliography，以下脉络基于摘要提及的关键词与该领域公认的经典工作重建： - 奠基工作：Owen & Grofman (1988) 与 Sherstyuk (1998) 将选区划分形式化为一个空间匹配/优化问题，证明了在确定性或特定对称假设下最优策略的形式，但未系统处理双重不确定性。 - 主要进展（Matching Slices）：Friedman & Holden (2008) 提出了“matching slices”策略（将极端选民配对，温和选民隔离），在只有总体不确定性的设定下给出了最优解。这留下了一个口子：现实中选民有个体层面的随机波动，纯总体不确定性模型无法涵盖传统的“packing-and-cracking”策略。 - 信息设计框架引入：Kamenica & Gentzkow (2011) 建立了 Bayesian persuasion 框架，将“选择信号分割”统一为优化后验分布的凸化问题。Kolotilin (2018) 等人将其拓展至更一般的接收者偏好与连续状态。 - 本文的位置：Kolotilin & Wolitzky (2024) 将选区划分（选民组合分区）映射为信息设计（状态信号分区），引入了双重不确定性（总体 \(\delta_d\) 与个体 \(\epsilon_i\)），统一了“matching slices”与“packing-and-cracking”这两种先前看似互斥的策略，并提供了结构估计。

子线索聚类 1. 组合分区优化线：关注选区几何与选民匹配的纯数学结构（如 Friedman & Holden 的切片匹配、Sherstyuk 的最优配对），假设不确定性结构简单或已知。 2. 信息设计/机制设计线：关注不确定性下的最优信号揭示（如 Bayesian persuasion），将设计者的工具抽象为“选择后验分布”，忽略组合约束。 3. 实证与检测线：利用选举数据反推选区划分意图或效应（如 Best et al. 的结构估计、Erikson 的席位-投票曲线），通常缺乏统一的理论模型来指导参数识别。

这个方向在追问的核心问题 1. 在赢者通吃规则与双重不确定性下，最大化期望席位的最优分区数学形式是什么？ 2. 总体不确定性与个体不确定性的相对大小，如何定性地改变最优策略的形态（从配对到隔离）？ 3. 现实选举数据中，哪种不确定性占主导？这能否作为识别选区操纵意图的实证基础？

⚠️ 作者的 framing（这是作者的说法） - 作者将缺口 frame 为：既有理论要么只处理总体不确定性（得出 matching slices），要么只凭直觉描述 packing-and-cracking，缺乏一个包含双重不确定性的统一模型。通过引入信息设计映射，本文成为“显然的下一步”。 - 被淡化或回避的路线：计算复杂性。作者假设设计者能无成本地实现任何选民分区（“设计者将选民分配到选区”），完全回避了在地理约束与连续性约束下寻找最优分区是一个 NP-hard 组合优化问题这一已知事实（如 Altman 1997 的复杂性结果）。 - 明显该被引却未在摘要中出现的：关于选区划分计算复杂性的计算机科学文献（如 Packer & Altman, 或近期的 SoS/SDP 松弛方法），以及高维/连续选民类型下的半参数估计方法。

张力 Friedman & Holden (2008) 的“matching slices”（配对极端、隔离温和）与传统的“packing-and-cracking”（隔离对手、配对己方）在直觉上与操作上是相反的。本文通过引入不确定性主导类型的区分，消解了这一张力：两者在不同参数区间下各自最优，不存在逻辑对立。

二、这篇论文做了什么¶

三句话 ① 研究了一个党派设计者在面临总体（选区级）与个体（选民级）双重不确定性时，如何将选民分配到等人口选区以最大化期望席位份额。② 核心工具是将选区划分（选民组合）映射为信息设计（状态信号分割），利用 Bayesian persuasion 的凸化技术求解。③ 主要结论是“segregate-pair”策略最优：弱选区包含单一类型选民，强选区包含两种类型；个体不确定性主导时少数党采用 packing-and-cracking，总体不确定性主导时采用 matching slices。

关键设定与假设 - 选民类型 \(\theta \in \{L, M, R\}\)（或连续分布）：代表选民的基础偏好，是可观测的分区依据。 - 双重不确定性：选区级总体冲击 \(\delta_d\)（方差 \(\sigma_A^2\)），选民级个体冲击 \(\epsilon_i\)（方差 \(\sigma_I^2\)）。投票行为由 \(u_i = \theta_i + \delta_d + \epsilon_i\) 决定（假设可加性）。 - 赢者通吃：选区中支持设计者的选民比例 \(> 0.5\) 则赢得该选区席位。 - 等人口约束：每个选区包含相同数量的选民 \(n\)。 - 信息设计映射：设计者选择选区中各类型选民的比例，等价于选择一个信号 \(s\)（选区构成），该信号揭示了总体状态 \(\delta_d\) 的后验分布。设计者的目标函数是期望席位份额，等价于后验概率的某种函数的期望。 - 统计含义：可加性冲击与赢者通吃意味着，选区构成（信号）通过改变后验分布的均值与方差来影响胜率。个体不确定性 \(\sigma_I^2\) 使得胜率函数对信号构成呈凹性（对多数党）或凸性（对少数党），而总体不确定性 \(\sigma_A^2\) 则引入了凸化动机。

主要结果 - Theorem (Segregate-Pair Optimality)：在任何双重不确定性设定下，最优选区划分必然是 segregate-pair 形式——弱选区（设计者胜率较低的选区）只包含一种选民类型（隔离），强选区（胜率较高的选区）包含两种选民类型（配对）。 - 直觉：弱选区是设计者的“弃子”，在其中放入异质选民只会增加方差、意外翻盘的概率，因此隔离以锁定损失；强选区需要凑够胜率，配对可以利用总体冲击的凸化效应或个体冲击的均值效应。 - Corollary (Idiosyncratic Dominance, \(\sigma_I^2 \gg \sigma_A^2\))： - 若设计者是多数党（平均支持率 \(>50\%\)），最优策略是 Uniform districting（所有选区构成相同，即完全配对）。因为凹性下，方差是敌人，均匀分配最小化方差，锁定所有选区胜率。 - 若设计者是少数党，最优策略是 Packing-and-cracking：隔离对手选民到一个弱选区，配对己方温和选民与部分对手选民到强选区。因为凸性下，方差是朋友，制造波动以在强选区中碰运气翻盘。 - Corollary (Aggregate Dominance, \(\sigma_A^2 \gg \sigma_I^2\))：最优策略为 Matching slices（隔离温和选民 \(M\)，配对极端选民 \(L\) 与 \(R\)）。因为总体冲击使得胜率函数在后验均值处呈凸性，设计者希望创造后验均值的极端波动，配对极端类型能最大化这种波动。

证明路线与技术技巧 - 整体路线： 1. 将选民分配问题重写为信息设计问题：选区构成 \(s\) 是关于总体冲击 \(\delta_d\) 的信号。 2. 计算给定信号 \(s\) 下的胜率函数 \(P(\text{win}|s)\)，利用中心极限定理（或正态假设），将其表示为后验均值与方差的函数。 3. 分析胜率函数的凸凹性：个体不确定性使得 \(P(\text{win}|s)\) 对选区构成呈凹性（多数党）或凸性（少数党）；总体不确定性使得 \(P(\text{win}|s)\) 对后验均值呈凸性。 4. 应用 Bayesian persuasion 的标准结论（Kamenica & Gentzkow 2011）：目标函数的凸凹性决定了最优信号结构是“完全揭示”（隔离）还是“混同”（配对）。 5. 结合等人口约束与类型分布，推导出具体的 segregate-pair 组合。 - 关键跳跃点：从“选区划分的组合问题”跳跃到“信号分割的凸分析问题”。难点在于，选区划分受限于选民类型的总体分布（必须把所有选民分完），而信息设计通常只受限于先验分布。作者通过构造特定的信号分布（满足 Bayes plausibility \(\int \pi(s) \mu(s) ds = \mu_0\)），将组合约束转化为对信号分布的矩约束。 - 技术技巧点名： - Bayesian persuasion / 信息设计：用于将分区选择转化为后验分布选择，核心是利用目标函数的凸性/凹性判定最优信号的离散度。 - 凸分析：判定胜率函数 \(P(\text{win}|s)\) 的曲率，直接决定了 segregate 还是 pair 占优。 - 正态近似 / CLT：在个体冲击 \(\epsilon_i\) 的加性假设下，选区内的总投票数服从正态分布，使得胜率可写成 probit 函数的形式，便于分析凸凹性。

真实例子与应用 - 数据：美国众议院选区级选举数据（precinct-level returns）。 - 方法：结构估计。利用选区投票结果的方差分解，估计总体不确定性方差 \(\sigma_A^2\) 与个体不确定性方差 \(\sigma_I^2\) 的相对大小。 - 结果：实证估计显示，在近期美国选举中，个体不确定性 \(\sigma_I^2\) 主导总体不确定性 \(\sigma_A^2\)。 - 说明什么：验证了理论的 Corollary 1——现实中少数党若操纵选区，应采用 packing-and-cracking；多数党应采用 uniform districting。这为法庭检测 gerrymandering 提供了参数识别依据：若观察到少数党采用 matching slices（总体不确定性主导下的最优策略），则与实证参数不符，可能存在其他动机或约束。

🔎 结论是否比证明窄 - 摘要中 claim “Segregate-pair districting is optimal for the gerrymanderer”，但证明严格依赖于投票行为的可加性假设（\(u_i = \theta_i + \delta_d + \epsilon_i\)）与正态分布。若投票行为是非可加的（如交互效应 \(\theta_i \times \delta_d\)），或分布具有厚尾，胜率函数的凸凹性可能不再单调，segregate-pair 的全局最优性无法保证。此处的 claim 比证明的适用域宽。

三、开放问题（点到为止）¶

计算复杂性缺口：本文假设设计者能无成本求解组合分区优化，但给定地理连续性约束，寻找最优 segregate-pair 分区是 NP-hard。要证什么：在多项式时间内，能否找到近似最优的 segregate-pair 分区？或者证明存在不可逾越的 stat-computational gap？（扎根于：摘要中“assigns voters to equipopulous districts”的无成本假设，与 Altman 1997 等关于分区复杂性的已知结果之间的张力）。
非可加性投票模型：若选民投票行为存在交互（如 \(\theta_i \times \delta_d\)），胜率函数的凸凹性如何变化？最优策略是否仍为 segregate-pair？（扎根于：证明中对 \(u_i = \theta_i + \delta_d + \epsilon_i\) 的依赖）。
半参数识别：结构估计中使用了正态假设来分解 \(\sigma_A^2\) 与 \(\sigma_I^2\)。若放松分布假设，仅假设可加性，能否利用高阶矩或半参数方法非参数识别这两个方差？（扎根于：实证部分对正态分布的依赖）。

四、最核心、最简单的例子 / 数学问题¶

最简特例：2 类型选民、2 选区、纯个体不确定性

设选民只有两种类型：A（支持设计者，概率 \(p_A > 0.5\)）与 B（反对，概率 \(p_B < 0.5\)）。总体有 \(2n\) 个选民，\(n\) 个 A，\(n\) 个 B。设计者必须将他们分到 2 个等人口选区（各 \(n\) 人）。无总体冲击 \(\delta_d=0\)，只有个体冲击 \(\epsilon_i\)。

多数党情形（\(p_A > 0.5\)）：胜率函数 \(P(\text{win}| \text{选区有 } k \text{个A})\) 是关于 \(k\) 的凹函数（因为 \(p_A>0.5\) 时，binomial/probit 概率在均值处最陡，边缘效应递减）。凹性下，设计者厌恶方差，希望每个选区的胜率尽可能确定。最优策略：Uniform districting（完全配对）。每个选区放 \(n/2\) 个 A 和 \(n/2\) 个 B。两选区胜率相同且稳定，期望席位最大化。
少数党情形（假设设计者支持 B，\(p_B < 0.5\)，但总体中 A 占多数）：胜率函数 \(P(\text{win}| \text{选区有 } k \text{个B})\) 是关于 \(k\) 的凸函数（在 \(p_B<0.5\) 的低概率区，增加一个 B 带来的边际胜率递增）。凸性下，设计者喜欢方差，希望创造极端选区，碰运气翻盘。最优策略：Packing-and-cracking（隔离对手，配对己方）。把所有 A 放入选区 1（Packing，0 个 B，必输），把所有 B 放入选区 2（Cracking，\(n\) 个 B，胜率波动大，有翻盘概率）。

核心数学内核：这篇论文的本质是利用目标函数（胜率）在不确定性参数下的凸凹性，判定组合分区（信号结构）的离散度。凹性 \(\to\) 混同（配对/均匀）；凸性 \(\to\) 分离（隔离/极端）。整篇论文的一般性设定（3 类型、双重不确定性）只是在这个凸凹性判定上加入了更复杂的分层（个体冲击决定对选区构成的凸凹性，总体冲击决定对后验均值的凸凹性），从而推导出“弱选区分离、强选区配对”的混合策略。

Maintained by 陈星宇 · Homepage · Source on GitHub

The Economics of Partisan Gerrymandering¶

一、领域脉络与小综述¶

二、这篇论文做了什么¶

三、开放问题（点到为止）¶

四、最核心、最简单的例子 / 数学问题¶

评论