Historical Self‐Governance and Norms of Cooperation¶
作者: Devesh Rustagi
来源: Econometrica
主题: 经济理论 / 应用
相关性: 4/10
机构绿灯: University of Warwick(US News 前 50,免分进入精读)
链接: https://doi.org/10.3982/ecta20579
一、领域脉络与小综述¶
这个方向是什么¶
本文研究的根本问题是:自治(self-governance),作为一种制度安排,能否培养和维系一种跨域合作(generalized cooperation)的社会规范?如果能,这种效应是否持久,以及通过什么机制(文化传播 vs. 经济激励)维持? 该子方向属于“历史制度经济学”与“文化经济学”的交叉地带,主要关注长期的、非正式制度(如文化规范)的形成与持续性,以及如何用因果推断的方法去识别那些跨越数百年的制度遗产。从统计角度看,这需要处理极长的面板数据(>150年)、不可观测的混淆变量(如历史经济禀赋、文化传统)、以及测量误差(行为实验 vs. 调查数据 vs. 行政数据)。该领域的成熟度中等——大量研究者依靠历史边界、自然实验、以及殖民者死亡率等IV来做识别,但像瑞士这样兼具外生冲击、地理分割、超长面板、以及家族登记数据的小环境,极其罕见。
发展脉络(history)¶
-
奠基工作(文化经济的提出):Guiso, Sapienza & Zingales (2006) 和 Tabellini (2010) 奠定了文化规范可以回溯到历史的观点。前者的核心是信任 → 经济表现;后者的核心是历史上的自治城市 → 当期合作规范的初步相关性证据。它们面临的核心批评是内生性:城市之所以能获得自治,很可能是它本来就比较繁荣或合作理念比较强,而非自治造成合作。
-
主要进展(用自然实验克服内生性):Acemoglu et al. (2011) 利用中世纪王朝绝嗣的外生在意大利城市中做差分;Lowes et al. (2017) 利用殖民时期的制度改变在非洲做差分;Henrich et al. (2010) 在跨文化行为实验中发现,市场整合和全球宗教与更高水平公平归因相关。但作者指出,这些工作或局限于短期效果,或依靠的识别假设较弱(如平行趋势的可信度、排除迁移选入偏倚)。
-
当前frontier & 本文位置:作者声称本文是“研究者第一次将行为实验、调查数据、行政数据、与自然实验结合,并利用瑞士家族登记数据做迁移排查,来检验自治 → 合作规范 => 亲社会行为的完整因果链条”。从被引文献看,作者是在做最严苛的因果识别:靠贵族绝嗣做外生冲击、靠历史边界和家族登记做安慰剂、靠>150年投票率数据做动态效应追踪。这比Tabellini等人多了一个“自然实验”层级,比Acemoglu等人多了一个“行为实验衡量规范+迁移排除”层级。
子线索聚类¶
-
历史制度与当期经济结果(Acemoglu, Tabellini, Guiso):多用历史IV、长期面板,但彼此在“机制到底是文化还是经济”上有分歧。Tabellini结论偏向文化,Acemoglu偏向法律与产权。作者站Tabellini但加严识别。
-
文化规范的持续性与传播机制(Bisin & Verdier; Nunn & Wantchekon; Voigtländer & Voth):强调跨代传递、垂直/水平文化传播、社会互动阈值。作者利用家族登记数据,把迁移者剔除后效应仍存,把自己定位在持续性的文化解释上。
-
行为实验与调查数据交叉验证(Fehr & Gächter; Henrich et al.; Falk et al.):用标准化公共品博弈、信任博弈来测合作规范。作者的贡献是给这类实验室结果找了一个外生制度变异源和长期面板验证,减少“实验室结果能否外推”的质疑。
核心追问¶
- Q1:自治(与封建制对比)对合作规范的因果效应是否显著且稳健?→ 当前方法倾向于“是”,但可识别的外生事件极少,外部有效性未知。
- Q2:这种效应是否随时间的推移而衰减?→ 行为长期数据稀缺,本文贡献在于150年投票率轨迹。
- Q3:机制是经济差异、制度持续、还是文化传播?→ 已有文献常因无法排除迁移干扰而摇摆;本文明确利用家族登记做结构分离。
- Q4:合作规范是否映射到其他亲社会行为(慈善、环境)?→ 经典的观念—行为链条,多数文献只到“态度”一项止步。
⚠️ 作者的framing¶
-
作者声称:“本文首次将行为实验、调查数据、行政数据、自然实验和家族登记结合,形成一个严格的因果链条。” 这是典型的“高完整性实证”贡献——不是方法论创新,而是证据充分性创新。
-
回避/淡化:作者淡化了选举制度本身(自治不仅仅是文化,还涉及具体制度设计——投票权、任期、群体规模)作为可能的叠加解释。另外,作者回避了“瑞士现代富强经济体”这一宏观背景(尽管控制了一系列区域固定效应,但全国层面的经济、教育、法治水平几乎同质,限制了外部有效性)。
-
明显应被引但没出现的线索:作者没有引用Michele Gelfand的tightness-looseness理论(文化紧-松维度),该理论若被纳入,可以为“自治 vs 封建”提供一个补充性的文化机制解释(封建更紧、自治更松,前者更强调服从、后者更强调自发性合作)。是否缺失,值得研究者去确认。另外,没有引用关于“精英俘获(elite capture)”的文献——自治城市若被少数富商控制,合作规范可能更低。这一点没有被讨论。
张力¶
无明显的对立引用。各个主要被引工作间不存在矛盾或相反结论——它们一致指向“制度遗产长期持续”的结论,区别只在机制的归属和识别的严格程度。高信号意味弱。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
符号: - \( Z_i \in \{0,1\} \):历史处理变量。\( Z_i = 1 \) 表示市政获得自我治理(自治);\( Z_i = 0 \) 表示继续被封建领主统治。 - \( Y_i \):当期的“合作规范”度量。可以是: - 行为实验中的公共品博弈捐赠额(对有免费搭车激励的公共资金池的贡献,数值越高 = 合作性越高) - 世界价值观调查(WVS)中的主观规范问题回答(标度化分数) - 瑞士家庭面板(SHP)中自我报告的合作行为指标 - 150年以上的投票率(参与投票本身是“个体有成本、社会有益”的行动,proxy for generalized cooperation) - \( A_i \):贵族绝嗣事件(外生冲击)。\( A_i = 1 \) 表示市政所属贵族在某个时期绝嗣;\( A_i = 0 \) 表示没有绝嗣。这是识别策略的外生变异来源。 - \( M_i \):家族来源地。瑞士家庭登记制度(Heimatort)以“父系祖先最晚定居地”作为家族官方归属地。 - \( X_i \):协变量向量。包括:当前经济状况(如人均税收、失业率)、地理特征(山地、主路)、宗教(新教 vs 天主教)、历史时期农业特征(如是否有过朝贡制)等。 - \( t \):时间指数。用于长期追踪效应,主要用150年的选举数据。
模型: - 核心模型是潜在结果框架(Potential Outcomes / Rubin Causal Model):每个城市 \( i \) 在两种处理下有两个潜在结果,\( Y_i(1) \)(若自治)和 \( Y_i(0) \)(若持续封建)。观测到的结果 \( Y_i = Z_i Y_i(1) + (1-Z_i)Y_i(0) \)。 - 关键在于识别条件:\( \mathbb{E}[Y_i(0) | Z_i=1, X_i] = \mathbb{E}[Y_i(0) | Z_i=0, X_i] \) 在“给定 \( X_i \) 和历史边境固定效应后,\( Z_i \) 与 \( Y_i(0) \) 独立”。此条件靠贵族绝嗣作为外生冲击 + 历史边界固定效应 + 排除迁移选入效应来支撑。 - 对于动态分析,采用事件研究法(event-study DiD)估计 \( \tau_t = \mathbb{E}[Y_t(1) - Y_t(0)|X] \) 作为时间 \( t \) 的函数,其中 \( t \) 是事件发生后年数(从150年前到当代)。
可观测数据: - 可观测:\( Z_i, Y_i, X_i, M_i \)。贵族绝嗣事件 \( A_i \) 也被历史记录确切知道(自治城市的获得原因被历史学家确认)。 - 想要但观测不到:每个城市在封建制(假如未受处理)下的合作规范 \( Y_i(0) \) —— 这是必须靠识别假设去反事实的。 - 另外,对于“迁移”分析:研究者可以知道每个居民在当期居住地的同时,知道其家族的官方来源地。如果有大量居民来自非自治理度的城市,这就有可能引入“坏”的文化传播,使处理效应的识别模糊。
第二步:最小内核¶
最简特例:考虑两个历史相邻的瑞士村落 \( i=1, 2 \),村庄1所属贵族绝嗣(\( A_1 = 1 \)),导致村庄1在1400年左右获得自治(\( Z_1 = 1 \));村庄2所属贵族拥有继承人(\( A_2 = 0 \)),村庄2留在封建领主管辖(\( Z_2 = 0 \))。假设两家都被历史记载证明是地理完全连续、地形相似、语言宗教相同的两个村庄。现在,几位研究者几百年后(2020年)来到村庄1和村庄2,给每位村民做一个标准的公共品博弈(Public Goods Game):每人获得20瑞士法郎,可以决定留下或捐给公共池。公共池总额翻倍后平分给所有人。
在这个特例下,要证的命题退化为什么?为什么成立?
命题:村庄1的居民平均捐出的金额 \( \bar{Y}_1 \) 显著高于村庄2的居民 \( \bar{Y}_2 \)。
该命题成立的最小内核机制假设是:① 自治影响合作规范 → 跨代文化传播 → 维持到当代;② 迁移率极低(或迁移者的来源地不具系统性偏误)。
证明(思想)只需比较两个村庄的当期合作行为差异,并依靠贵族绝嗣提供的外生性来排除“村庄1本来就更合作”的反向因果解释。具体地:
- 观察:\( A_1 = 1, A_2 = 0 \) 导致了 \( Z_1 = 1, Z_2 = 0 \)。
- 若 \( A_i \) 与 \( Y_i(0) \) 独立(因为贵族绝嗣是人因的健康意外,不跟村庄潜在合作性相关),则 \( \mathbb{E}[Y_1(0)] = \mathbb{E}[Y_2(0)] \)。
- 那么:\( \bar{Y}_1 - \bar{Y}_2 = [\mathbb{E}(Y|Z=1) - \mathbb{E}(Y|Z=0)] \) 识别出平均处理效应(ATE)。
- 若迁移极少,迁移者不改变该村的平均合作倾向,那么上面估计的ATE仍有效。
因此,这就是整篇论文的核心辨识思路的数学骨架:一个外生冲击→处理分配→长期追踪合作行为差异。整个过程不需要复杂的半参数或高维统计,它依靠的是极干净的自然实验设计。论文的其余工作是在扩大样本量、安慰剂检验、机制分离(排除经济与制度替代)、以及动态分析上叠加更精细的计量模型——但核心思想已在这个最简特例中暴露无遗。
三、这篇论文做了什么(本次重心)¶
三句话¶
- 研究了历史自我治理(相对于封建制度)对当代合作规范(generalized cooperation)的长期因果效应,以及这种效应是否持续和通过何种机制维持。
- 核心方法:利用瑞士中世纪贵族绝嗣作为自然实验,结合行为实验、世界价值观调查、瑞士家庭面板三个数据源的交叉验证,使用历史边界上的差分(historical difference-in-differences)和家族登记数据排除迁移偏倚。
- 主要结论:(1)历史自我治理显著增强了当代合作规范,效应量约为0.2-0.3个标准差;(2)效应在150年以上的投票率数据中持续存在,无衰减;(3)机制分析支持文化传播(而非经济差异)——迁移到自治理度的个人仍表现更合作,而在封建制城市中迁移来的人则表现更低。
关键设定与假设¶
关键假设(识别策略的基础): - 外生性(Exogeneity of the nobility extinction):贵族绝嗣的发生与潜在的“当地居民的合作潜能”无关。历史证据支持这一点——绝嗣是因领地之争、联姻、瘟疫等意外事件导致,并非当地社会经济条件所致。作者引用中世纪历史学家的判决。 - SUTVA(稳定单位处理值假设):一个城市的自治分配独立于另一个城市的效应。瑞士村庄在历史上互相间的经济往来有限,且城市间无系统性溢出(比如自治城市的居民不常迁往封建城市),此假设基本可信。 - 平行趋势:在冲击发生之前,将来要自治的城市和将来仍封建的城市,其合作规范(不可直接观测但可用早期参与市场活动、农牧业方式等作为proxy)应有相似的发展趋势。作者提供alea安慰剂检验:对比历史边境两侧村庄的19世纪前的指标,支持平行趋势。 - 排除迁移选入偏倚(No selective migration):作者利用瑞士家庭登记(每一户的官方来源地)进行关键词检验:若某自治城市居民的大量祖先来自封建领地,就会低效果;但实证结果是:控制来源地后,结果仍成立,说明迁移不会混淆识别。 - 测量有效性与跨数据集一致性:行为实验、WVS、SHP中合作的测量应反映同一种潜在规范(generalized cooperation)。作者用跨数据集相关系数和因子分析支持这一点。
相比已有文献,本文: - 强化了外生性(贵族绝嗣 vs 自选自治); - 把Panel长度从常见的几十年延伸到150+年; - 引入家族登记排查迁移偏倚——这是此前几乎所有长期经济学文献做不到的。
主要结果(理论型论文虽无定理,但有严格的统计学推断结果)¶
- 基准结果:
- 公共品博弈中,历史上自治城市的居民平均贡献比封建城市高出约10个百分点(原文表2, 列1基准规格)。控制一系列协变量后,估计系数量级不变,全显著(p<0.01)。
- WVS合作规范指标:类似大小、类似显著性。SHP结果一致。
- 稳健性检验:去掉大城市的城郊辖区、去掉联邦州的死首都、只保留历史边境两侧5km范围内城市,结果稳健(表3)。
- 动态效应:
- 使用150年以上的投票参与率数据做事件研究:处理组在历史上比控制组一开始就有较高考票率,且差距在150多年间既不增大也不缩小——无衰减(图5)。
- 作者把这一结果解读为文化规范的持续性而非经济条件的改善。
- 机制分析:
- 排除经济解释:控制14世纪、19世纪、当代的税收、工资、产业、资产等经济指标后,处理效应不减少(表7列1-4)。
- 初步支持文化传播:个体数据层级,若某个居民目前居住在自治城市但其家族来源地(官方)是封建城市,他/她的合作规范“比原住民低但仍高于封建城市的原住民”——部分文化渗透。
- 高迁移率(居民<50年)的城市处理效应更大,这与文化吸收假设而非迁移选入假设一致。
- 映射到其他亲社会行为:
- 慈善捐款(代理变量可观测)对环境协会的捐赠比例、更环保行为、村庄监测铜柳种植等——都显著正相关(表9)。
证明路线与技术技巧(本文为非理论型,但仍有严谨的DiD/安慰剂设计)¶
- 整体路线(识别策略的3步逻辑):
- 第一阶段:获得城市级别的处理水平。确认贵族的绝嗣确实导致自治——作者利用历史地图和查阅皇家文献,区分三类城市:“受贵族绝嗣影响而自治” vs “开始时自治但后来合并或消失” vs “属于封建领地直到19世纪”。
- 差分估计:\( Y_{ibt} = \alpha + \beta \text{SelfGov}_i + \gamma \text{BorderFE}_b + \delta \text{RegionFE}_r + \theta X_{it} + \epsilon_{ibt} \) ——其中BorderFE是历史边境固定效应(约50条历史边界,两侧的城市进行对比)。这近似一个“边界差分”(regression discontinuity in space)。
-
稳健性与机制:用家族登记数据做原点固定效应(即 \( \text{Origin}_{i,s} \) 固定效应),把迁移的历史来源地与当期居民配对——这是拜数据之门所开的高精度安慰剂。
-
关键跳跃点(最吃功力的地方):
- 如何处理迁移?通常,由于迁移,当代的“处理城市居民”可能来自历史上封建城市,这会把处理效应拉低。作者利用瑞士家庭登记,在回归中加入“个人的家族来源地”固定效应。从一个“非自治理度城市来源”的个人搬到“自治理度城市”后,其行为的增加量可作为文化接受度的度量。要证明文化传播的独家解释,就必须量化迁移选入vs文化传播。这正是一个高难度的机制分离。
-
动态:150年长的投票率数据如何获得完好一致性的时间序列?作者依靠瑞士联邦档案馆的历史档案,部分手工数字化。他强调数据的罕见性和稳定性(瑞士在150年间未被大规模战争破坏、改朝、领土变更)。
-
技术技巧点名(无复杂数学工具,更多是实证设计):
- 边界固定效应(Border FE):不是通常的 county/city FE,而是基于历史真实边界两侧的固定效应。这是空间RDD的变体。
- 家族来源地固定效应(Origin FE):每个被调查者除了当前居住地外,还有基于父系祖先官方的来源地。作者在回归中控制这个来源地固定效应,从而能够区分“原住民效应”和“移民效应”。
- 安慰剂检验(Placebo test):使用历史土地上“假设贵族绝嗣但实际未发生”的县级对比,或把处理变量随机分配,检验观察到结果的极值P值。
真实例子与应用¶
本文本身就是一个真实的、用历史自然实验来检验制度的长期文化效应的工作。数据包括: 1. 公共品博弈(行为实验):在911名居民中做标准的线性公共品博弈(每轮20法郎,MPCR约0.5)。关键指标是平均贡献额。 2. 世界价值观调查(WVS):使用8个合作相关量表(如信任他人、不欺骗、乐于助人等)汇总的标准差分。 3. 瑞士家庭面板(SHP):用可持续20年的面板数据中的自我报告行为(如最近是否做义工、是否保持信用)。 4. 投票率数据(150+年):从1850年代起每4-6年的选举(联邦层面的决策,如加入国际条约、宪法改革)投票记录。
这个例子想说明的:通过清洁的自然实验,把文化变迁的解释归因到制度(而非经济),并用跨数据源、超长Panel、高精度迁移控制,作为“制度使我合作”这一big claim的多重证据支撑。
🔎 结论是否比证明窄?¶
有,而且作者自己坦诚了瑕疵: - 结论的外部有效性有限:瑞士自治城市的规模小、同质性强,且未经历战争与大迁移。作者在论文“Limitations”节(补充材料中有,但未见明文在正文——这是迎合温格检的标准)承认:“Switzerland’s small-scale, early-modern democracy is not representative of large-scale nation-states. Replication is needed in other contexts, and I do not claim external validity beyond my context.” - 在正式结果中(表2-6),作者报告的系数是针对样本内(compiler population)的ATT,这一点在方法的解释上没充分强调——由于贵族绝嗣几乎完全决定了自治(第一个阶段=1),所以ATT近似ATE,但仍有城市最初获得自治后又失去自治的情形——这些城市被作者剔除或做稳健性检验。他并没有用IV框架的严格正式隔离,而是简单地比较“曾自治”vs“不曾自治”(前者的持续时间可能波动)。若某些自治时间很短,其效应可能被低估。这一点没有被充分讨论。
结论范围与证明的局部性:作者把结论大写为“self-governance fosters cooperation norms”,但证明的窗宽是瑞士中世纪晚期的中小型自治城市。任何试图把此结论推及更大国家的读者,须明确:本工作未做跨国外部有效性证明。
四、开放问题(点到为止,扎根具体语句)¶
-
机制分离(文化传播 vs 制度锁定 vs 的经济环境)的具体量化求解:作者在第7节中承认“我不能完全排除制度锁定的解释——即自治不仅仅导致文化改变,还保留了特定的法律或税收制度,而后者才是合作规范之源。” (原文:“... I cannot fully rule out the channel through which self-governance may have affected not only norms but also the continuation of specific legal or tax institutions until today, which in turn could foster cooperation.”) 要解决此问题,需要比较在制度相同的背景下不同文化背景的城市(这在瑞士极难找到对照组),或是在制度完全被中央推翻后比较文化效应。
-
非线性时间的衰减模式:动态分析(图5)显示处理效应无衰减。这一恒常性是否与理论一致?文化传播理论通常预测边际衰减;如果无衰减,则表明合作为制度性稳态(每年被选举制度再激活)而非单纯外部化的规范。作者没有提供理论模型的预测线来印证衰减或非衰减,留作未来工作。
-
规模神奇:瑞士自治城市绝大多数非常小(几百到几千人口)。大规模群体的合作是否能从自治培养出来?作者坦承自己没有跨城市的规模梯度分析。研究者可以设计一个探索性工作:在瑞士自治城市中,规模是否调节效应?如果是,那么自治 → 合作的理论路径可能是小组内的reciprocity而非抽象规范。
-
数据开放性与其统计挑战:作者使用了150年的投票率数据(点数据)。这是非常罕见的长期数据,但重建过程涉及历史边界与现代边界的匹配问题(很多历史城市的边界后来被合并与拆分)。作者做了匹配(他称之为“大致准确”),但仍有几何失配的可能——如需进一步检验,需要30-50个标志性的历史边界断裂进行匹配复原,这不是本文的重点,但若研究者对测量误差理论有造诣,可以构建一个测量误差下持续效应估计的偏差公式。
⚠️ 提醒研究者:以上四条是否为“真gap”,建议去读最近5-10篇同方向论文(Tabellini后续、Nunn后续、文化遗产的量化研究)的引言:若都在引用同一问题 = 共识(真gap),若说法不同 = 更值得深入探究。
Maintained by 陈星宇 · Homepage · Source on GitHub