Estimating the likelihood of arrest from police records in presence of unreported crimes¶

作者: Riccardo Fogliato, Arun Kumar Kuchibhotla, Zachary Lipton, Daniel Nagin, Alice Xiang et al.
来源: Annals of Applied Statistics
主题: 流行病学
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本方向聚焦于利用行政记录（如警方数据）与调查数据（如犯罪受害调查）的整合，校正因选择性报告（underreporting）导致的估计偏差。其核心统计问题是：当感兴趣的结果（如是否犯罪、是否被逮捕）存在系统性缺失，且缺失机制依赖于协变量时，如何从有偏的管理数据中恢复出总体的（或条件）概率。这一问题的成熟度属于“方法成熟但应用场景对统计假设高度敏感”的阶段——已有大量的缺失数据理论（逆概率加权、多重插补、双重稳健估计），但将之用于特定的、有复杂设计（survey design + 多层聚类）的行政记录时，参数形式的选择、权重构造、方差估计仍是实质性的挑战。

发展脉络（history）¶

奠基工作：调查抽样的理论框架。上世纪，Survey sampling学派（如 Lohr, 2007）建立了逆概率加权作为处理复杂抽样（不等概率、分层、整群）的标准方法。核心思想是：每个样本被抽中概率的倒数构成权重，使得加权后的估计能够代表总体。此阶段的方法假设缺失仅源于抽样设计。
主要进展1：处理“模型错误指定”。进入21世纪，Buja, Berk, Brown等（2014, 2016, 2018）与Rubin-Bleuer & Kratina (2005) 的工作极大地推动了“模型作为近似”的观点。他们指出：在观测研究中，线性回归模型几乎总是被错误指定的，其参数应被理解为一种“统计泛函”（statistical functional）——即在给定联合分布下由最小化某种极限目标函数所定义的量。这对于本方向的影响是：当用逻辑回归估计报案概率或逮捕概率时，得到的系数也应当被解释为近似（而非真实的因果参数），其标准误差应使用模型鲁棒的“三明治估计量”。同时，Rubin-Bleuer & Kratina 将两阶段抽样（从总总体抽样本，再从样本中获取信息）的理论框架形式化，证明了在特定条件下（如以无放回简单随机抽样）可以“忽略”抽样设计，直接使用基于模型的推断。
主要进展2：将调整用于“犯罪黑数”。最近5-10年，Buil-Gil等人（2020, 2021）与Fogliato等人（2021、本工作）将上述理论与犯罪学中的“黑数”问题（未报案的犯罪）结合。Fogliato等（2021）首先发现，如果简单以逮捕作为犯罪的代理（proxy），由于不同种族报案率不同，会导致对犯罪率的种族差异估计产生偏差。他们的工作揭示了：用于评估司法决策（如逮捕）的行政数据，其选择性报告本身就是一个需要被建模的、与结果相关的偏差源，而不能被简单忽略。
本文的位置：本工作直接回应Fogliato et al. (2021)中遗留的缺口。该文已明确指出逮捕作为代理存在偏差（例如部分暴力犯罪的报案率不足一半），但这篇2021年的工作并未提供一个通用的方法论框架去调整这种偏差。本文填补了这一缺口：提出了一个两步参数回归估计量，将报案概率（从调查数据估计）融入逮捕概率（从警方数据估计）的估计中。它属于“应用特定领域的缺失数据问题”这一子方向，位于“识别问题已基本被框架化（Missing at Random假设及其变种）”与“开发具体、可操作的计算方案（两步加权/模型调整）”之间的过渡地带。

子线索聚类¶

被引文献大致落在三条子线索上：

缺失数据与抽样理论（统计学核心）：包括 Rubin-Bleuer & Kratina (2005), Lohr (2007), Kang & Schafer (2007), Azur et al. (2011). 这一簇探讨了在复杂抽样或数据缺失下进行推断的正式框架、权重的作用、以及双重稳健性的实质。
模型稳健推断（统计方法论）：包括 Buja et al. (2014, 2016), Berk et al. (2018). 这一簇指出参数模型总是近似，强调报告模型鲁棒的标准误与正确的参数解释，并指出回归参数应视为“统计泛函”。
犯罪黑数与警方数据偏差（应用犯罪学）：包括 Fogliato et al. (2021), Cernat et al. (2021), Buil-Gil et al. (2020, 2021), Xie & Baumer (2019). 这一簇聚焦于“未报案犯罪”这一具体现象，描述其量级、社会人口学特征、空间分布差异，以及如何利用犯罪调查（NCVS, CSEW）去估计它。大部分工作停留在描述性分析或模拟，本文是第一个提出直接调整逮捕概率估计的完整方法框架的。

这个方向在追问的核心问题¶

**C1 (识别): ** 如何仅从观察到的人口特征（协变量）、报案行为（调查中）和逮捕记录（管理中）识别“真实”的逮捕概率？关键假设是什么（如：可忽略的报案机制给定协变量）？
**C2 (估计): ** 当生活概率的估计是带有权的（来自调查数据）、且与非独立观测（警方数据）结合时，如何构造估计量并计算其正确方差？
**C3 (偏差来源): ** 在逮捕概率的种族差异估算中，被调整的“未报案”偏差有多大？在不同类型的暴力犯罪中，其方向和量级是否一致？
**C4 (稳健性): ** 在满足什么假设下，两步估计量是相合的？当其中一个模型（报案或逮捕模型）被错误指定时，它是否仍然具有稳健性（如在双重稳健属性意义下）？

⚠️ 作者的 framing¶

作者的说法: 作者将现有工作的缺口 frame 成： “现有方法（如 Fogliato et al., 2021）已揭示了逮捕作为 proxy 的偏差，但并未提供一个系统性的调整方法”；而“本文通过两步参数回归方法，提供了一种直接的、可行的调整方案”。
被淡化/回避的竞争路线: 作者明确回避了使用半参数或非参数方法来识别效率界或提供双重稳健估计量。他们选择了一个更强的参数模型假设（逻辑回归）。这使得方法直接落地，但代价是放弃了效率最优性或对模型误设的更强稳健性。他们弱化了“如何构建一个对报案模型误设也稳健的联合估计量”这一问题，并承认“若模型误设，结果可能对误设敏感”。
明显该被引/该存在、却没出现在intro里:
- 高效率因果推断（Doubly Robust / Debiased ML）：如用于调整测量误差的目标最小损失估计 (TMLE) 或双重机器学习 (DML)。这些现代半参数方法能提供一种嵌套的、对模型误设更稳健的估计，应该是本文方法最自然的竞争者或更优的替代。作者完全没有提及如何比较或超越这些方法。
- 缺失非随机（MNAR）建模：本文最关键的识别假设是“给定协变量后，报案机制是可忽略的（MAR）”。一个敏感的统计研究者会问：如果报案与否还与犯罪严重性、对报警的预期成败等不可观测因素有关（MNAR），结果会怎样？论文没有讨论敏感性分析或提供选择模型的方法，这是一个重要的缺引方向。
- 局部平均处理效应 (LATE) 或工具变量 (IV)：可以想象，使用警方对特定地区的不同响应强度（作为自然实验，工具是什么报案率？）作为工具，可以识别出对“不得不报案”那一部分人口的处理效应思路。完全没有提及。

张力¶

未见明显对立引用。但需要注意的是，Buja等人的“模型作为近似”观点（方法稳健）与作者采用的“用参数逻辑回归做精确调整”的做法之间存在一种温和的张力：前者警告不要过度信任参数系数，而后者高度依赖于逻辑回归对报案和逮捕函数形式的准确近似。作者在方法部分承认了这一点（提及需要解释系数），但并未在实证中探讨当逻辑模型对“逮捕”的尾部行为建模很糟糕时的后果。

二、最核心、最简单的例子 / 数学问题¶

第一步：将符号、模型、可观测数据交代清楚¶

符号：
- \( i = 1, \dots, N_v \): 暴力的犯罪事件总数（此概念上存在，但实际不可观测，因为许多未报案）。
- 可观测数据1 (NIBRS，警方记录): 一个大小为 \( N_v \) 的子集，即 被警方记录下来的犯罪事件（记为 \( R_i = 1 \)）。我们只能观测到这个集合。对于这些事件，我们观测到：
  - \( A_i \in \{0,1\} \): 是否有逮捕发生（0=否, 1=是）。
  - \( X_i \in \mathbb{R}^d \): 协变量（犯罪类型、受害者特征、发生地点、犯罪者种族等）。即：可观测数据 = \(\{ (A_i, X_i) : R_i = 1 \}\)。对于 \( R_i = 0 \)（未报案事件），我们观测不到 \( A_i \)。
- 可观测数据2 (NCVS，犯罪受害调查): 另一个独立的数据集，包含 \( N_s \) 个受害者（样本）的响应。这个调查询问了他们的受害经历，并能知道这个经历是否被报告给了警方。对于每个样本 \( j = 1, \dots, N_s \)：
  - \( Y_j \in \{0,1\} \): 该经历是否被警方记录（1=是，0=否）。
  - \( Z_j \in \mathbb{R}^{d'} \): 协变量（与 \( X \) 可能有部分重叠，如受害者种族、犯罪类型、地点类型）。此调查还带有抽样权重 \( w_j \)（逆抽样概率），使得加权样本可以代表美国整体人口。注意，NCVS只告诉我们哪些犯罪被报告了，但不知道这些犯罪是否导致了逮捕（警方数据没有与之直接匹配）。
- 参数/求目标：
  - \( \pi(z) = \mathbb{P}(Y_j = 1 | Z_j = z) \): 给定协变量下，犯罪被报告给警方的概率。
  - \( \theta(x) = \mathbb{P}(A_i = 1 | X_i = x, R_i = 1) \): 在已报案的犯罪事件中，给定协变量下发生逮捕的概率（直接从NIBRS数据可得）。
  - \( \theta^*(x) = \mathbb{P}(A = 1 | X = x) \): 所有犯罪事件（无论是否报案）中，给定协变量下发生逮捕的概率。这是目标estimand。
模型（关键假设）：
- 可忽略的报告机制： 给定协变量 \( X \)，报案状态 \( R \) 与逮捕结果 \( A \) 条件独立。即：\( A \perp \!\!\! \perp R \mid X \)。这个假设很重要：它意味着那些未报案的犯罪中，其逮捕概率与已报案且具有相同 \( X \) 的犯罪中的逮捕概率是相同的 ( \( \mathbb{P}(A=1 | X=x, R=0) = \mathbb{P}(A=1 | X=x, R=1) \) )。这是识别的基础。
- 参数模型假设：
  - \( \pi(z) = \sigma(\alpha^\top z) \)，这是一个逻辑模型，\( \alpha \) 在NCVS数据上通过带权最大似然估计。
  - \( \theta(x) = \sigma(\beta^\top x) \) 或 \( \mathbb{P}(A=1 | X=x, R=1) = \sigma(\beta^\top x) \)，这是一个逻辑模型，在NIBRS数据上通过最大似然估计。
可观测数据： 我们观测到的是两个含偏的数据集的组合：
- 一个样本是有偏的 （NIBRS）：仅包含 \( R=1 \) 的子集，并且它的组合（加权方式）不一定能通过 \( X \) 的代表样本得到校正。
- 另一个样本是代表总体的 （NCVS）：基于有反转概率的抽样设计，能给出 \( \mathbb{P}(R=1 | X) \) 的相合估计。
- 我们没有直接观测到所有犯罪是否被逮捕。理论上需要将所有犯罪的暴力发生总数计数，并把它们分解成：被记录并逮捕的、被记录未逮捕的、未记录但若被记录会逮捕的等等。这是不可能的；只能用假设去识别。

第二步：讲最小内核¶

最小内核是一个特例：暴力犯罪只有一种类型（如抢劫），且所有犯罪者和犯罪地点特征协变量都相同（\( X \) 是常数）。 此外，假设报案率 \( \pi \) 已知（从完美的调查估计得到）。

在这个特例下： - 不知道的 = \( N_v \)：所有暴力犯罪总数。 - 可观测的 = \( N_{\text{recorded}} \)：被警方记录的案件数，以及其中的逮捕数 \( N_{\text{arrest}} \). - 直接估计（有偏的）：逮捕的概率 = \( \frac{N_{\text{arrest}}}{N_{\text{recorded}}} \)。这是有偏的，因为失败的报案（\( R=0 \)）使得分母变小了。 - 修正估计：因为我们知道报案率 \( \pi \)（所有犯罪的 \( \pi \) 比例被记录），所以所有犯罪的总数是 \( N_v = \frac{N_{\text{recorded}}}{\pi} \)。因此，调整后的逮捕概率是：

\[\theta^* = \frac{N_{\text{arrest}}}{N_v} = \frac{N_{\text{arrest}}}{N_{\text{recorded}} / \pi} = \pi \cdot \theta_{obs}\]

其中 \( \theta_{obs} = \frac{N_{\text{arrest}}}{N_{\text{recorded}}} \) 是直接观察的逮捕率。 - 核心思想：由于 \( \pi < 1 \)，且\( \theta_{obs} < 1 \)， \( 0 < \pi < 1 \)，则 \( \theta^* = \pi \theta_{obs} < \theta_{obs} \)。（这就是本文说“逮捕概率显著降低”的根本原因——分母扩大了，但分子不变。）

当协变量非恒定且报案率取决于协变量时，我们只是把这个简单的乘法学说扩展成更精细的回归：对于每一类犯罪特征 \( x \)，其调整后的逮捕概率为：

\[\theta^*(x) = \mathbb{P}(A=1 | X=x) = \mathbb{P}(A=1 | X=x, R=1) \cdot \mathbb{P}(R=1 | X=x) = \theta(x) \cdot \pi(x)\]

即：在每个协变量组内，逮捕概率是“已报案下的逮捕率”乘以“报案率”。 整个论文就是如何从有偏样本中估计 \( \theta(x) \) 和 \( \pi(x) \) 并报告它们的乘积及其方差。

三、这篇论文做了什么¶

三句话¶

研究问题: 如何利用全国犯罪受害调查（NCVS）校正因大量未报案犯罪导致的、从警方记录（NIBRS）中估计的逮捕概率的系统性偏差。
核心方法: 提出了一个两步参数回归估计：第一步用带权逻辑回归从NCVS估计报案概率 \( \pi(x) \)；第二步，在NIBRS数据中，要么通过将 \( \pi(x) \) 作为权重（inverse probability weighting, IPW），要么将其作为协变量（调整估计），重新拟合逮捕概率的回归模型。
主要结论: 调整未报案犯罪后，逮捕概率显著降低（约降低40%-60%不等）；在控制了犯罪特征等协变量后，白人与黑人犯罪者的逮捕率差异变得很小（约1-2个百分点的差异）。

关键设定与假设¶

补充设定的符号（基于之前的简化表示法）：
- 第一阶段（报案模型）： 在NCVS数据上拟合：
  \[Y_j \sim \text{Bernoulli}(\pi_j), \quad \pi_j = \sigma(\tilde{X}_j^\top \alpha)\]
  其中 \( \tilde{X}_j \) 是用于建模报案的协变量集合。参数 \( \alpha \) 通过带抽样权重 \( w_j \) 的逆概率加权最大似然（IPW-MLE）估计。权重 \( w_j \) 使得NCVS估计可以代表美国总体人口。
- 第二阶段（逮捕模型）： 在NIBRS数据的子集（\( R=1 \)）上，作者讨论了三种模型变体（模型1、模型2、模型3）。最核心的变体（模型3）是：
  - 模型3（调整协变量）：用逻辑回归直接建模：
    \[A_i \sim \text{Bernoulli}(\tilde{\theta}_i), \quad \tilde{\theta}_i = \sigma(\tilde{X}_{1,i}^\top \beta_1 + \tilde{X}_{2,i}^\top \beta_2 + \hat{\pi}_i)\]
    这里，\( \hat{\pi}_i \) 是第一阶段的预测（报案概率）被直接放入作为逮捕模型的协变量。这样做的直觉是：同一犯罪在报案概率高的人群中，被记录和导致逮捕的结果会更高；但直接用 \( \hat{\pi} \) 调整可以吸收这种滤波器效应。整个逮捕概率的估计定义为： \( \hat{\theta}^* = \hat{\pi}_i \cdot \hat{\theta}_i \)（即预测乘积）。
关键假设（除之前说的可忽略性 + 参数正确性）
- 支持性假设（Positivity/Overlap）： 对于NIBRS数据中的每个 \( x \)，在NCVS中其样本量足够且报案模型能提供一个非无穷、非零的 \( \pi(x) \)。否则IPW版本的权重会爆炸。
- 方差结构： 方差计算是基于 “两层抽样设计 + 两步估计” 的Rubin-Bleuer & Kratina (2005) 框架的推广。这考虑到了：第一阶段估计本就含有不确定性（模型+抽样），第二阶段得自另一个含误差的样本，且第一、二阶段的依赖结构需要小心处理。方法是通过泰勒展开/Delta方法或重抽样（Bootstrap）——但他们主要使用了稳健的三明治方差，假设这两步的M估计量是渐近联合正态的。
- 相比已有文献： 相比仅使用行政数据的方法（如直接计算逮捕率），本文放宽了“所有犯罪均被记录”的假设；相比仅使用调查数据的方法，本文提供了逮捕概率的条件估计，而不仅仅是犯罪的泛估计。相比Fogliato等（2021），本文放宽了“只发现偏差但不调整”的局限。

主要结果¶

定理型结果（论文中主要是渐近性质引用而非新证明）： 作者指出已知两步估计量在弱条件下是相合且渐近正态的（主要引用Rubin-Bleuer & Kratina 2005, 以及Buja 2019系列中的结果）。他们强调：第一，由于权重来自IPW-MLE，估计量是渐近无偏的；第二，方差估计可以通过“逆概率加权 + Delta方法 + 调查抽样方差”的组合来完成。
核心实证发现（关键量化结论）：
1. 整体逮捕概率显著降低（未调整 vs. 调整后）：从NIBRS直接计算的各种暴力犯罪的逮捕率约是 30%-50%（如抢劫40%）。在调整未报案后，所有犯罪的真实逮捕概率降到了10%-25%。
2. 种族差异绝对值极小：在对犯罪特征（如武器使用、受害者类型等）和未报案进行联合调整后，黑人犯罪者与白人犯罪者之间逮捕概率的差异很小（约1-2个百分点）。这是核心结论，驳斥了“逮捕系统中存在大规模系统性种族歧视”的说法（至少未报告犯罪在这类暴力中不是主要原因）。
3. 稳健性: 分别比较了 模型1 (仅有π(x)作为权重) 和 模型3 (π(x)作为协变量) 的结果，得到一致的结论。且在 模型3 中加入不同协变量集合时，种族差异系数变化不大，这增强了发现的稳健性。

证明路线与技术技巧¶

整体路线（结合理论与实证）：
1. 估计报案模型：用NCVS数据中的逻辑回归（带 weights 参数）估计 \( \hat{\pi} \)。这保证了其估计代表全国总体犯罪（未报案+已报案）的报案模式。
2. 修正逮捕模型：在NIBRS数据上，估计 \( \hat{\theta} \)（已报案下的逮捕概率），并引入 \( \hat{\pi} \) 作为调整因素（模型3）或权重（模型2）。
3. 推导调整后的Estimand: \( \hat{\theta^*}(x) = \hat{\pi}(x) \cdot \hat{\theta}(x | \hat{\pi}) \)。
4. 估计方差: 利用Delta方法 或调查抽样的删补法（jackknife） 来计算标准误和置信区间。他们采用了两步M估计量渐近理论中的“三明治方差”方法，考虑了第一阶段模型的估计方差以及第二阶段样本的抽样方差；对NCVS相当重视。
5. 交叉核验: 用不同的建模方案（模型1、2、3）进行敏感性分析，验证结论的一致性。
关键跳跃点：如何将理论上的识别公式θ*(x) = θ(x)π(x)转化为可操作的回归估计？
- 这个“跳跃”并不在于数学的深奥，而在于连接并处理两种不同数据源的实践智慧：
  - 直接作为权重（模型2）：θ*(x) 可通过 E[ A * R / π(x) ] / E[ R / π(x) ]（IPW）来估计。对于每个NIBRS事件i，权重是1/π(x_i)。它使得加权后的搜索数据NIBRS可以“代表”所有犯罪。
  - 直接作为协变量（模型3）：这是在 逻辑-线性框架下，将θ*(x)直接分解为 σ(βx + γ * logit(π(x))) 上式是实现。
- 难点在于得到var(θ*(x))：它不仅包含了NIBRS数据的采样不确定性，还包含了第一阶影响π的估计的不确定性，以及θ估计影响的π 。本质上是propensity score ( π )和 outcome regression (θ)之间的时序误差传播。作者没有推导一个新的方差公式，而是指出这是经典的两阶段推断问题（引用 Rubin-Bleuer & Kratina 2005），使用三明治估计量即可。
技术技巧点名：
- 带权 Logistic 回归（IPW-MLE）：用于第一阶段，给出总体代表性的报案概率。
- 模型作为近似 (Buja et al., 2014, 2016) 思想：承认逻辑模型是近似的，并为参数做出校正解释（即用三明治标准误差）。
- 三明治方差估计：用以同时处理模型误设和两步估计的误差传播。
- Delta方法：用于得到公布的逮捕概率的方差估计。
- 调查加权（Survey weights）：使用NCVS的采样权重来确保第一步回归是总体表示性的。
- 无本地的介绍但利用了许多“已发表”的两阶段结果的渐近理论。

真实例子与应用¶

数据： NIBRS（2006-2015），全美近16州的警方记录，包含暴力犯罪（性侵、抢劫、严重/简单攻击）和犯罪者种族及其他特征。NCVS（2003-2020），全国受害调查，问卷报告中包含受害者对事件的描述及是否报告警方；权重使结果能代表全美受害特征。
怎么应用：
1. 在NCVS数据上，用 Z (受害者种族、犯罪类型、致伤情况、地州、报案年份等) 作为协变量，估计每个观测的π(x)。
2. 在NIBRS数据上，合并π(x)的预测值，并使用模型3的调整逻辑回归（其中π_hat作为一项协变量）来估计逮捕概率。将种族（白人/黑人犯罪者）作为关键解释变量。
3. 计算调整后的逮捕概率（= π_hat * θ_hat）以及种族间的差异（边际效应，例如给定犯罪的特征后，黑人/白人犯罪者的逮捕率之差）。
结果：
- 调整后，暴力犯罪的逮捕率从未报案时约40%降至约12%-25%。
- 种族差异：在原始NIBRS数据中，白人犯罪者逮捕率略高（如1.3%）；在调整后，这一差异极弱（多数在统计意义上不显著，绝对值<1%），结论是：种族差异小到可忽略，不构成系统性歧视的证据（在逮捕概率这一维度上）。
例子想说明： 验证理论公式θ* = π * θ在实际中的应用可行性；展示调整前后估计的“极端敏感性”，从而强调如果不考虑“未报案的犯罪”，警方证据将严重夸大逮捕实际的频率；并且通过对种族差异的控制分析，降低了公民对警方逮捕行为中系统性种族偏见的担忧（在这类暴力犯罪里）。

🔎 结论是否比证明窄¶

是，明确比证明窄。
窄点1：假设的强度
- 论文主张：“本研究提供了一个修正方案，能更准确地估计所有犯罪的逮捕概率”。
- 实际证明的条件：
  - 识别要求 (A ⊥ R | X)，即未报案犯罪中的逮捕行为（不好测量）完全由可观测协变量解释。如果被捕后愿意报警，与未被捕但想掩盖的受害者行为不同，这个假设就崩溃了。作者承认这是一个很强的不可检验假设。如果它被违反，上述的分析曲解了本质。
- 窄点2：参数模型的形式
- 结论：逮捕概率减少了（非零的π导致的）。
- 证明所需的：逻辑模型是正确的，或许在重要协变量上无误。若逮捕为死亡性的函数估计不受支持，调整后的估计也将是扭曲的。
- 窄点3：结论只覆盖“暴力犯罪”——无法轻易推广到破坏公物、财产犯罪等（其报案率和逮捕过程可能完全不同）。

四、开放问题（点到为止，扎根具体语句）¶

如何放松“可忽略报告假设”？ 论文说明“鉴于许多抢劫案，受害者和犯罪者之间可能达不成熟悉的相互作用，因此很难用不可观测因素来解释报案差异……主要的不可观测变量效应可能较小。” ——但具体的敏感性分析没有做。这是一个开放问题：假设A（逮捕）与R（报案）在给定协变量后仍然相关（MNAR或某种形式的锁定问题），如何识别或评估偏差的范围？扎根点： 文章 Limitations 部分对“(A ⊥ R | X)”假设的讨论。
如果模型错误指定怎么办？ 论文引用Buja et al. (2014, 2016)来说明回归系数要看成“统计泛函”。那么，作者是否能证明，当逮捕或报案模型以“任意光滑函数形式被误设”时，该两步估计量的偏差界（而非仅仅是相合性）？是否存在更稳健的估计方法（如使用条件概率的Nonparametric匹配，或TMLE）能提供额外的保护（双重稳健）? 扎根点： 论文Limitations中提到“的估计可能对模型误设敏感”。该位置未提供一个正式的误设界限（如基于Riesz representation）。
如何将城市/警局的随机效应纳入模型？ 论文写道“我们没有考虑城市或部门层面的效应……这可能驱动了许多差异”。承认不纳入效应会导致对种族差异的估计产生偏差，因为不同城市（有不同的警力、资源、社区关系）会同时影响不同种族犯罪的报案和逮捕行为。扎根点： 作者明确将这项视为未来研究的Limitation：“In this work, we have employed a model that does not account for city-or agency-level effects, which may drive many of the disparities”
当警察报告的变量本身也有不准确性时如何是好？ 警察记录何种犯罪可能带有偏见，nibrs 的编码也不一定精确（其描述了犯罪的初始触发）；翻阅检查一些数据的引用（Cernat et al., 2021 说了一些关于犯罪位置的调查可能更准）。如何将“警方数据中的错误分类”（例如，严重攻击被视为简单攻击）作为另一个测量误差层加入到模型里？扎根点： 文献综述中引用了Cernat et al. (2021)对警方数据质量的认识，以及Fogliato et al. (2021)中的偏差讨论，但论文本身没有对警方分类误差做出调整。

Maintained by 陈星宇 · Homepage · Source on GitHub