Sequential Sensitivity Analysis for Multiple Assumptions: A Framework for Understanding Racial Disparity in Police Use of Force¶

作者: Thomas Leavitt, Jake Bowers, Luke Miratrix
主题: 其他
相关性: 8/10
链接: https://arxiv.org/abs/2605.21893

一、核心问题与贡献¶

①研究了警察武力使用种族差异因果推断中，样本选择偏倚（拦截歧视）与混杂偏倚（遭遇偏倚）联合违反对推断结论的影响问题。②核心方法是构建顺序敏感性分析框架，通过参数 \(\rho\) 对缺失数据进行增广以固定分配空间，再通过参数 \(\Gamma\) 在该空间上构造倾斜检验统计量进行最坏情况推断。③主要贡献在于揭示了两种偏倚机制的乘性交互作用，证明在合理的拦截歧视水平下武力差异显著，但该结论对遭遇偏倚的微小偏离极度脆弱。

二、基础设定¶

核心概念与符号：
\(Z_i \in \{0,1\}\)：平民种族（1=少数族裔，0=白人），基于暴露定义而非警察感知。
\(S_i(z), Y_i(z)\)：潜在拦截与潜在武力结果。
Principal Strata：基于 \((S_i(1), S_i(0))\) 划分的主层，包含 AS (Always-Stop), OMS (Only-Minority-Stop), OWS (Only-White-Stop), NS (Never-Stop)。
\(\rho_g\)：层 \(g\) 内 OMS 遭遇的比例，作为拦截歧视强度的下界参数。
\(\Gamma\)：层内遭遇少数族裔概率的几率比界限，作为遭遇偏倚强度的参数。
\(\tau\)：平民种族对武力的平均因果效应 (ACE)，即目标估计量。
关键假设：
Assumption 1 (No interference)：SUTVA 假设，潜在结果仅依赖自身遭遇的种族。
Assumption 2 (No-Force-Without-Stop)：结构零假设 \(Y_i(z) \le S_i(z)\)，保证未拦截者武力必为0。
Assumption 3 (Use-of-force depends only on race within principal strata)：主层内非种族属性对武力结果无异质性，将高维非种族属性降维为主层标签。
Assumption 4 (No-Only-White-Stops)：单调性假设 \(S_i(1) \ge S_i(0)\)，排除了 OWS 层，使得缺失数据仅为白人未被拦截的遭遇。相比 Knox et al. (2020) 保留了相同假设，但本文将其与遭遇偏倚联合处理。
No-Bias-in-Encounters：条件可忽略性 \(\phi_{g,i} = \phi_{g,j}\)，通过 \(\Gamma \ge 1\) 放松。
问题背景：针对 Knox et al. (2020) 仅处理拦截歧视（样本选择）而忽略遭遇偏倚（分配机制）的不足，以及 Fryer (2018, 2019) 假设条件可忽略性不现实的缺陷。与 Knox et al. (2020) 的区别在于引入了 \(\Gamma\) 维度进行联合敏感性分析；与 Rosenbaum 经典敏感性分析的区别在于处理了样本选择导致的缺失数据与分配机制的交互。

三、主要定理 / 核心结果¶

核心发现的量化描述：
基线 (\(\rho=0, \Gamma=1\))：种族差异约 2.30 个百分点 (S.E. \(\approx\) 0.0026)，拒绝无武力歧视原假设。
联合敏感性：当 \(\rho=0\) 时，\(\Gamma \approx 1.06\) 即可使结论反转；当 \(\rho=0.34\) (Knox et al. 合理界) 时，\(\Gamma \approx 1.33\) 时 95% CI 包含 0。
地理校准：使用人口普查数据限制层内 \(\Gamma\) 上限，临界点仅微升至 \(\Gamma \approx 1.36\) (\(\xi=0\)) 或 \(1.37\) (\(\xi=0.25\))。
与 baseline 的对比：相比仅做 \(\rho\) 敏感性分析（假设 \(\Gamma=1\)）或仅做 \(\Gamma\) 敏感性分析（假设 \(\rho=0\)），联合分析揭示了乘性交互：微小的 \(\rho\) 增加能抵消 \(\Gamma\) 的收缩效应，但随 \(\Gamma\) 增大，拒绝域沿 \(\rho\) 轴扩张后收缩，呈现非线性边界。
结论的稳健性：结论对遭遇偏倚极度脆弱。\(\Gamma=1.33\) 意味着同层内遭遇少数族裔的概率可从 0.50 变至 0.58，这种微小差异在 77% 的层内人口统计上是可行的。

四、证明框架 / 方法设计¶

识别策略与估计量设计：
识别：\(\tau_g = \bar{y}_g(1) - (1-\rho_g)\bar{y}^{AS}_g(0)\)。核心在于 \((1-\rho_g)\) 项修正了由于 OMS 层白人未被拦截导致的零膨胀。
估计量：增广差值估计量 \(\hat{\tau}^{\rho_g}_g = \hat{\bar{y}}_g(1) - \hat{\bar{y}}^{\rho_g}_g(0)\)，通过向白人组追加 \(\tilde{n}^{\rho_g}_{g,0,OMS}\) 个零实现。
假设检验：构造倾斜统计量 \(\hat{\tau}^{tilt}(\rho; \Gamma, \tau_0, d)\)，对复合原假设 \(H_0: \tau = \tau_0\)，在 \(\Gamma\) 约束的最坏分配机制下，将中心化差值向零收缩。
核心假设的可信度分析：
Assumption 4 (No-Only-White-Stops) 在现实中可能过强（存在仅因白人而拦截的情况），违反将引入额外缺失数据类型，破坏增广逻辑。
No-Bias-in-Encounters 不可检验，但通过地理校准（Census block-group demographics）为 \(\Gamma\) 提供了物理上限，增强了敏感性参数的现实约束力。
稳健性检验策略：顺序参数化。\(\rho\) 固定分配空间 \(\Omega_\rho\)，\(\Gamma\) 在此空间上界定最坏情况。两者不可分离：\(\Gamma\) 的意义依赖于 \(\rho\) 确定的样本量。
计算/实现细节：Lemma 1 给出了任意后分层设计下分配概率的上下界闭式解，避免了枚举 \(\Omega_\rho\)。倾斜统计量的方差估计采用 Fogarty (2018, 2023) 的保守方差上界，结合 CLT 构造渐近有效检验。

五、与研究者兴趣的关联¶

连接子方向：Causal inference -> Sensitivity analysis -> Multiple untestable assumptions / Selection bias + Confounding bias。
可借鉴的核心思路：
多假设联合敏感性分析的顺序参数化策略：当存在多个不可检验假设（如样本选择+混杂）时，它们对估计量的影响通常不是简单叠加，而是交互的。本文通过"先固定一个假设确定样本空间，再在样本空间上扰动另一个假设"的顺序逻辑，为处理多重偏倚提供了可迁移的分析框架。
主层框架下的缺失数据增广：将选择偏倚转化为主层结构（OMS），通过追加零结果将不可识别的 ACE 转化为对敏感性参数 \(\rho\) 的函数，这一技巧可推广至其他有结构零的截断/筛选场景。
值得精读的关键参考文献：
Knox et al. (2020), "Administrative records mask racially biased policing", APSR. 理由：本文的直接基础，定义了警察武力推断中的主层结构和 \(\rho\) 参数化。
Fogarty (2023), "Sensitivity analysis for matched observational studies", JRSS-B. 理由：本文倾斜统计量的理论来源，提供了在 \(\Gamma\) 约束下复合原假设的渐近有效检验方法。
Heng & Small (2021), "Higher-dimensional criticism...", JASA. 理由：提供了利用观测协变量交互作用约束层内 \(\Gamma\) 的思路，本文将其发展为利用地理人口统计约束 \(\Gamma\) 的校准方法。

六、延伸思考与练习¶

假设扰动：若修改 Assumption 4 (No-Only-White-Stops)，允许存在 Only-White-Stop (OWS) 层，此时缺失数据不仅包含白人未被拦截的遭遇，还包含少数族裔未被拦截的遭遇。结论会如何变化？技术上需要什么新工具？需要双向增广数据（同时追加白人零和少数族裔零），且 \(\rho\) 参数化需扩展为二维（OMS和OWS比例），倾斜统计量的构造需处理更复杂的分配空间。
开放问题：如何将此顺序敏感性框架推广到连续型处理变量或纵向/多阶段因果推断场景？在多阶段下，每一阶段都有选择偏倚和混杂偏倚，偏倚的交互将呈高维嵌套结构。
理解检测题：假设在某个层 \(g\) 中，观测到 10 个少数族裔遭遇（3个使用武力）和 5 个白人遭遇（1个使用武力）。若设定 \(\rho_g = 0.5\)，请计算增广后的差值估计量 \(\hat{\tau}^{\rho_g}_g\)。若此时 \(\Gamma = 2\)，倾斜统计量中的收缩因子将如何作用于该差值？（考察对数据增广机制和倾斜统计量方向性收缩的理解）

Maintained by 陈星宇 · Homepage · Source on GitHub