Effects of adolescent victimization on offending: Flexible methods for missing data and unmeasured confounding¶

作者: Mateo Dulce Rubio, Edward H. Kennedy, Valerio Baćak, Daniel S. Nagin
来源: Annals of Applied Statistics
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向要回答的根本问题是：在观测性纵向研究中，暴露（如青少年受害）对结局（如日后犯罪）是否存在因果效应（ATT，Average Treatment Effect on the Treated）？ 核心统计挑战来自两个现实约束：一是暴露和结局往往存在非随机缺失；二是无法保证无未观测混杂（unmeasured confounding）。研究者需要在同时处理缺失数据和潜在混杂的框架下，得到可靠的因果效应估计并进行敏感性分析。当前成熟度：方法论上已有处理单一挑战的成熟工具（如双稳健估计处理缺失，或敏感性分析处理混杂），但很少有方法同时处理缺失数据下的 ATT 估计与风险比（risk-ratio）尺度的敏感性分析——这正是本文的切入点。

发展脉络¶

奠基工作： 暴力循环（cycle of violence）的实证基础由 Widom (1989a, 1989b) 奠定，她证明受虐儿童长大后更可能犯罪；但 Widom et al. (2015) 在同一 30 年追踪中发现，只看不同数据源（父母报告、孩子报告、官方记录）会得出矛盾结论，暗示 detection/surveillance bias 严重干扰估计——这表明缺失数据与测量误差是这一方向必须解决的隐患。

主要进展： - Currie & Tekin (2012) 使用 Add Health 数据，应用多种统计方法（包括匹配、固定效应、工具变量），发现虐待显著增加犯罪概率，且效应随虐待形式数量增加。但作者自己指出，他们的工具变量（邻里特征）可能不满足排他性。 - Mersky et al. (2012) 使用芝加哥纵向研究，区分儿童期与青少年期虐待，发现青少年期虐待对成人犯罪效应较弱。这为效应异质性（受害年龄）描述提供证据，但未处理缺失数据。 - Wright & Fagan (2013) 引入邻域调节效应，发现暴力循环在更贫困社区中更弱，提示调节变量可能改变因果关系强度。 - Kennedy (2022) 系统总结了非参数有效估计与双稳健机器学习（debiased ML）框架，为因果推断中的双稳健估计提供了统一理论：EIF 是构造高效、根号n一致估计量的关键。

当前 frontier： 本文定位在“在缺失数据与未观测混杂并存下，对 ATT 进行双稳健估计 + 风险比敏感性分析”。这一组合是前人未做的。

本文的位置： 将 Kennedy (2018) 关于缺失暴露数据下平均处理效应（ATE）的双稳健估计方法扩展到对 ATT 的估计，且同时允许暴露和结局均存在缺失。此外，作者提出了一种基于风险比的敏感性分析方法，与常规的基于平均处理效应（如均差）的敏感性分析不同，更适用于犯罪率这种 0/1 结局。

子线索聚类¶

这些被引文献大致落在三条子线索上：

线索一：纯实质性问题（青少年受害→犯罪）：Widom (1989a/b)、Widom et al. (2015)、Currie & Tekin (2012)、Mersky et al. (2012)、Wright & Fagan (2013)。这簇工作主要关注社会学/犯罪学问题，应用经典统计方法（匹配、回归、固定效应），对缺失数据与混杂的处理较粗糙。
线索二：处理方法论（缺失数据 + 混杂控制的因果推断）：Kennedy (2018, 2022)、Hines et al. (2021)、Kennedy et al. (2016)。这簇工作发展双稳健估计、有效影响函数、非参数效率界，并强调双稳健性（DR）和交叉拟合（cross-fitting）。
线索三：敏感性分析方法论（诊断未观测混杂的稳健性）：Rosenbaum (2002) 的匹配敏感性分析、VanderWeele & Ding (2017) 的 E-value。本文的风险比敏感性分析属于这一簇。

这个方向在追问的核心问题¶

暴露与结局均有缺失时，ATT 能否被非参数识别并高效估计？ —— 当前主流方法是针对 ATE 或单一变量缺失，对 ATT 和双重缺失的推广在本文之前是开着的。
效应是否在子群体（按年龄、性别、社会背景）中异质？ —— 证据存在但统计推断方法薄弱（多数是描述性分层，而非正式异质性检验）。
暴露-结局关系在风险比（RR）尺度上对未观测混杂有多敏感？ —— 主流敏感性分析在 RR 尺度上的系统方法较少，且多假设缺失数据是可忽略的（MAR）。
核心测量误差 vs 实际因果：暴力循环理论是否受到检测偏倚污染？ —— 这是 Widom et al. (2015) 核心批评。

⚠️ 作者的 framing¶

作者把缺口 frame 成：（1）缺失数据和未观测混杂同时存在时，缺乏针对 ATT 的双稳健估计量；（2）缺乏适用于风险比（而非均差）的敏感性分析方法。 因此本文自然成为“显然的下一步”：给已有的 Kennedy (2018) 双稳健 ATE 估计器加上一个 ATT 版本，并绑上一个新的 RR 敏感性分析。

被淡化的竞争路线： - 工具变量（IV）方法（如 Currie & Tekin 2012 用的邻里特征 IV）被作者回避，理由是 IV 的排他性约束太强——但 IV 在犯罪学中很常用。 - 作者没有讨论遗传工具变量（如孟德尔随机化） 或 家庭固定效应（同胞比较） 等替代方案。这些文献（如 Caspi et al. 2002 关于 MAOA 基因）并非无关但未被提及。 - 监测偏倚 / 报告偏倚（Widom et al. 2015 核心问题） 被作者完全避开：本文假设暴露和缺失均由调查问卷（自报）决定，未考虑受害者可能不报告或被误报。

什么明显该被引/该存在、却没出现在 intro 里？ - 关于连续暴露（多形式受害、暴露严重程度） 的因果推断方法。作者只处理二元暴露，但 Mersky et al. (2012) 和 Currie & Tekin (2012) 都指出多形式受害会放大效应。 - 关于时空效应（年龄与队列的交叉） 的正式检验。作者讨论了年龄异质性，但没有引用 Proper inference for treatment effect curves (Kennedy et al. 2017) 这类处理连续调节变量方法。 - E-value (VanderWeele & Ding, 2017) 是敏感性分析标准工具，但作者用的是风险比敏感性分析而非 E-value。两种方法没有直接比较。

张力¶

未见明显对立引用。 唯一的张力线索是 Widom et al. (2015) 和 Mersky et al. (2012) 之间的证据冲突（早期 vs 青少年期受害谁效应急性强），但作者未将此作为主线。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号： - \(A_i\)：二元暴露变量（0=未受害，1=受害），潜在的存在物——本文将它视为测量得到的（self-reported survey）。 - \(Y_i\)：二元结局变量（0=未犯罪，1=犯罪）。同样由调查测得。 - \(X_i\)：\(d\)维协变量向量（如：年龄、性别、父母教育、社会地位等），完全观测（无缺失）。 - \(R_{A,i}\)：暴露缺失指示器（1=观察到 \(A_i\)，0=缺失）。 - \(R_{Y,i}\)：结局缺失指示器（1=观察到 \(Y_i\)，0=缺失）。 - \(W_i\)：影响缺失过程的变量（可能包含部分 \(X_i\) 和 \(Y_i\)），用于 MAR 假设；但本文不构造显式的缺失模型，而是通过直接推导 EIF 来避免。 - ATT（Average Treatment Effect on the Treated）：\(\text{ATT} = \mathbb{E}[Y_i(1) - Y_i(0) \mid A_i = 1]\)，其中 \(Y_i(a)\) 是接受暴露水平 \(a\) 下的潜在结局。ATT 是 estimand。 - \(p(X)\)：倾向得分，\(p(X) = P(A = 1 \mid X)\)。 - \(\mu_a(X)\)：结果回归，\(\mu_a(X) = \mathbb{E}[Y \mid A = a, X]\)。 - \(\pi_A(X)\)：暴露被观测的概率，\(\pi_A(X) = P(R_A = 1 \mid X)\)。 - \(\pi_Y(X, A)\)：结局被观测的概率，\(\pi_Y(X, A) = P(R_Y = 1 \mid X, A)\)。

模型： - 数据生成机制（潜在结果框架）：对每个个体 \(i\)，存在潜在结局向量 \((Y_i(1), Y_i(0))\)。实际观测到的结局 \(Y_i = A_i Y_i(1) + (1-A_i) Y_i(0)\)。 - 缺失机制： - 暴露缺失：\(R_{A,i}\) 仅依赖于 \(X_i\)（非依赖于潜在结局或 \(A\) 本身），即 MAR。 - 结局缺失：\(R_{Y,i}\) 依赖于 \(X_i\) 和观测到的 \(A_i\)，但不依赖于 \(Y_i\) 本身（给定 \(X, A\) 后，缺失是随机的）。也是 MAR。 - 未观测混杂：模型不假设无混杂（即允许存在影响 \(A\) 和 \(Y\) 但 \(X\) 未能捕捉的未观测变量 \(U\)）。这是敏感性分析要处理的问题。

可观测数据： 研究者实际看到的是：

\[\{ (A_i^{\text{obs}}, Y_i^{\text{obs}}, X_i) \}_{i=1}^n\]

其中： - \(A_i^{\text{obs}} = A_i\) 当 \(R_{A,i}=1\)，否则为缺失（记为 NA）。 - \(Y_i^{\text{obs}} = Y_i\) 当 \(R_{Y,i}=1\)，否则为缺失。 - \(X_i\) 永远被观测到。

研究者观测不到的： - 缺失的暴露值与结局值（当 \(R_A=0\) 或 \(R_Y=0\)）。 - 所有潜在结局 \(Y_i(0)\) 对 \(A_i=1\) 的个体，这是反事实的。 - 任何未观测混杂变量 \(U\)（这是敏感性分析要容忍的关键缺失）。

第二步：讲最小内核¶

为了理解本文的核心方法，我们剥掉一切细节，只看最简特例： - 协变量只有一个 \(X\)（一维，比如社会阶层的标准分数）。 - 数据为完整数据（无缺失：\(R_A = R_Y = 1\) 恒成立）。 - 目的是估计对受害人群的 ATT。

此时，可观测数据为 \(\{(A_i, Y_i, X_i)\}_{i=1}^n\)。经典的双稳健 ATT 估计（无缺失）是：

\[\hat{\tau}_{DR} = \frac{1}{\sum_i A_i} \sum_{i=1}^n \left[A_i \left(Y_i - \hat{\mu}_0(X_i)\right) - \frac{\hat{p}(X_i)(1-A_i)}{1 - \hat{p}(X_i)} \left(Y_i - \hat{\mu}_0(X_i)\right) \right]\]

其中： - \(\hat{p}(X)\) 是通过回归（如 logistic）估计的倾向得分 \(P(A=1 | X)\)。 - \(\hat{\mu}_0(X)\) 是通过回归估计的 \(E[Y | A=0, X]\)。

直觉：第一项 \(A_i (Y_i - \hat{\mu}_0(X_i))\) 是仅在受害组内比较观测结局与预测的未受害结局；第二项是对未受害组的某种“校正”，用一个权重调整未受害组使其与受害组在 \(X\) 上平衡。当倾向得分和结果回归之一正确时，估计量无偏（双稳健）。如果两个都正确，它达到半参数效率。

现在加上缺失数据（本文的真实情况）。

最小缺失情况：只有结局有缺失（暴露全观测）。即 \(R_A = 1\) 恒成立，但 \(R_Y\) 可能为 0。此时本文的双稳健 ATT 估计将退化为：

\[\hat{\tau}_{DR, miss-Y} = \frac{1}{\sum_i A_i} \sum_{i=1}^n \left[ \frac{A_i R_{Y,i}}{\hat{\pi}_Y(X_i, A_i=1)} (Y_i - \hat{\mu}_0(X_i)) - \frac{\hat{p}(X_i)(1-A_i) R_{Y,i}}{\hat{\pi}_Y(X_i, A_i=0)(1 - \hat{p}(X_i))} (Y_i - \hat{\mu}_0(X_i)) \right]\]

这里引入了两个新项：\(\hat{\pi}_Y(X, A)\) 是结局被观测的概率的估计。本质上，每个观测到的数据点被 IPW 加权（逆概率加权） 以弥补同类缺失的数据，同时组合了回归估计。这种加权+回归的组合保持了双稳健性：只要缺失模型（\(\pi_Y\)）或结果模型（\(\mu_0\)）之一正确，ATT 的估计是一致的；若两者都正确，则效率达到半参数下界。

核心数学困难：当 暴露和结局都缺失 时，计算 ATT 需处理三个设计矩阵： 1. 暴露缺失概率 \(\pi_A(X)\)； 2. 条件于暴露的结局缺失概率 \(\pi_Y(X, A)\)； 3. 暴露与结果本身的联合分布。

本文的 EIF 推导中需要处理由这些条件概率构成的联合似然，以及它们与 ATT 估计之间的得分函数——这一步产生多维 nuisance 函数的交叉项，是技术关键。在最小特例下，EIF 形式会退化为上面显示的加权形式。

三、这篇论文做了什么¶

三句话¶

研究了：在纵向面板数据（Add Health）中，估计青少年受害（二进制 0/1）对日后犯罪（二进制 0/1）的 ATT，并处理暴露与结局同时存在缺失的挑战。
核心方法：推导了一个对 ATT 的新双稳健估计量，该估计量结合了倾向得分加权（用于缺失与混杂）、结果回归（用于建模反事实），以及一种基于风险比的敏感性分析方法（用于评估未观测混杂的稳健性）。
主要结论：
ATT 估计：若所有受害青少年均未受害，犯罪率将下降 3.86 个百分点（95% CI: [0.28, 7.45]），效应随受害年龄增大而减弱；
效应主要由非暴力犯罪（nonviolent offending）驱动；
敏感性分析：当未观测混杂的风险比因子（\(RR_{U,A}\) 或 \(RR_{U,Y}\)）超过 ~1.4-1.5 时，原结论不再稳健。

关键设定与假设¶

完整记号扩展（在第二节基础上补充）： - 潜在结果框架：\(Y_i(1), Y_i(0)\) 对应是否受害下的犯罪。 - ATT 参数：\(\tau = \mathbb{E}[Y(1) - Y(0) \mid A=1]\)。 - 可观测数据：\(\{ (R_{A,i} A_i^{\text{obs}}, R_{Y,i} Y_i^{\text{obs}}, X_i) \}_{i=1}^n\)。注意：暴露值可能缺失，但缺失指示器 \(R_{A,i}\) 是可观测的；结局值可能缺失且有独立缺失指示器 \(R_{Y,i}\)。 - 协变量：\(X_i\) 全程完全观测。

识别条件： 1. 条件无混杂（Consistency & Positivity）：\(Y = Y(A)\) 且 \(P(A=a | X) > 0\) 对 \(a=0,1\)。 2. 条件可忽略性（Ignorability）：\(Y(1), Y(0) \perp\!\!\!\perp A \mid X\)（无未观测混杂）。然而，本文的敏感性分析将放松这一假设——允许残存混杂。 3. 缺失机制：对暴露，MAR：\(R_A \perp A \mid X\)。对结果，MAR：\(R_Y \perp Y \mid (X, A)\)。 4. 重叠性（Overlap）：对每个协变量值 \(x\)，有 \(P(A=a , R_A=1, R_Y=1 | X) > 0\)？——作者没有明确写这一条，但从 EIF 分母看是隐含的。

相比已有文献的放宽/强化： - 相比 Kennedy (2018)：Kennedy (2018) 假设只有暴露缺失，且暴露缺失是 MAR（依赖协变量）。本文放宽为暴露与结局均可缺失，且缺失概率可依赖于暴露状态；但强化了结局缺失不依赖于结局本身（MAR 而非 MNAR）。 - 相比 Currie & Tekin (2012)：他们用多种方法（回归、匹配、IV）控制混杂，但没有处理缺失（Add Health 中的暴露缺失率达约 9-12%）。本文首次在 Add Health 的完整人群中处理缺失，并对 ATT 给出双稳健估计。

主要结果¶

定理 3.1：双稳健 ATT 估计量的 EIF 与一致性¶

定理陈述（直觉版）：
假设满足上述识别条件（MAR，重叠性，且倾向得分/结果模型与缺失模型均一致估计），则本节给出的双稳健 ATT 估计量是渐近正态的，且对不正确的模型部分具有稳健性——具体而言：

\[\hat{\tau}_{DR} = \frac{1}{n_1} \sum_{i=1}^n \frac{R_{A,i} R_{Y,i} A_i}{\hat{\pi}_A(X_i) \hat{\pi}_Y(X_i, A_i)} \left( Y_i - \hat{\mu}_0(X_i) \right) - \frac{1}{n_1} \sum_{i=1}^n \frac{R_{A,i} R_{Y,i} (1-A_i) \hat{p}(X_i)}{\hat{\pi}_A(X_i) \hat{\pi}_Y(X_i, 0)(1-\hat{p}(X_i))} \left( Y_i - \hat{\mu}_0(X_i) \right)\]

其中 \(n_1 = \sum A_i\)。

直觉解释：两个加权求和：第一行只在受害且暴露与结局均被观测到的个体上计算其观测结局与预测的未受害结局的残差（复权缺失数据下的反事实估计）；第二行对未受害且结局被观测到的个体加权（用倾向得分平衡协变量）。只要（i）倾向得分模型 \(\hat{p}\) 与缺失模型 \(\hat{\pi}_A, \hat{\pi}_Y\) 中至少有一块正确，且（ii）结果回归 \(\hat{\mu}_0\) 与缺失模型 \(\hat{\pi}_Y\) 中至少有一块正确，则 \(\hat{\tau}_{DR}\) 依然一致。

定理 4.1：敏感性分析的偏差公式¶

偏差公式：假设未观测混杂变量 \(U\)（1个或高维）既影响暴露 \(A\) 又影响结局 \(Y\)。则在给定 \(X\) 下，观测到的 ATT 与真实 ATT 的偏差可以表达为：

\[\text{Bias} = \mathbb{E}^* \left[ \frac{\text{Cov}(A, Y \mid X, R_A=1, R_Y=1)}{\text{Var}(A \mid X, R_A=1, R_Y=1)} \right] - \tau\]

这里 \(\mathbb{E}^*\) 是针对 未被观测到的 U 的积分。作者将此偏差参数化为两个风险比：

\[RR_{U,A} = \frac{P(A=1 \mid X, U=1)}{P(A=1 \mid X, U=0)}, \quad RR_{U,Y} = \frac{P(Y=1 \mid X, A=1, U=1)}{P(Y=1 \mid X, A=1, U=0)}\]

当 \(RR_{U,A} > 1\) 且 \(RR_{U,Y} > 1\) 时，偏差为正（即观测到的 ATT 高估了真实效应）；反之偏差为负（低估）。

关键数值结果：要使得观测到的 ATT 点估计（3.86pp）变为零效应（即真实 ATT = 0），需要同时满足 \(RR_{U,A} \geq 1.4\) 和 \(RR_{U,Y} \geq 1.4\)（或单方向更强）。这个“阈值”定义为 Sensitivity Threshold \(\Theta\)：若 \(RR_{U,A} \times RR_{U,Y} < \Theta\)，则观测到的 ATT 仍然显著为正。

实证结果¶

数据：Add Health Wave I & II（1994–1996 年全美代表性样本）。暴露（任何形式的严重受害，包括抢劫、被持械威胁等）在 Wave I 测量；犯罪（通用 Delinquency Scale，含暴力与非暴力）在 Wave II 测量。共有 13,233 名青少年纳入分析，其中约 10.5% 报告受害；暴露缺失率约 10%，结局缺失率约 20%。

ATT 估计：ATT = 3.86 个百分点（95% CI: [0.28, 7.45]）。即，若所有吸毒青少年均未受害，其总体犯罪率将下降 3.86pp。

异质性分析： - 按受害年龄分层：14–16 岁受害的青少年效应最强（7.4pp），17–20 岁即下降至 2.0pp 左右（p=0.07 获交互检验不显著，但趋势明显）。 - 按性别：男性受害者中 ATT 为 4.8pp，女性中 2.1pp，但置信区间高度重叠。

敏感性分析： - 风险比阈值 \(\Theta \approx 1.45\)（点估计）和 1.25（置信下限）。即，要使观测到的 ATT 被归零，需要同时有 \(RR_{U,A} \geq 1.4\) 和 \(RR_{U,Y} \geq 1.4\)。作者论证：这种强度的混杂（约 1.4 倍增加）在职业流行病学/犯罪学中属于 “中等强度”，提示原结果可能是稳健的——但并非极端稳健。

效应分解： - 非暴力犯罪：ATT = 4.2pp（95% CI: [1.8, 6.5]），显著。 - 暴力犯罪：ATT = 1.1pp（95% CI: [-1.2, 3.4]），不显著。 - 表明受害对青少年主要是增加轻微违法行为（非暴力）而非暴力攻击。

这个例子想说明什么：验证了即使在暴露与结局均有缺失的真实世界纵向数据中，应用双稳健估计仍能获得有统计显著性的 ATT 估计，且效应主要由非暴力犯罪驱动；同时展示风险比敏感性分析在犯罪学这类低基率（violence low base rate）场景下优于均差敏感性分析（因 risk ratio 对基率不敏感）。

证明路线与技术技巧¶

整体路线（5 步）：
半参数模型构建：将数据生成过程描述为完全非参数模型（无参数约束），但允许存在缺失（MAR）。
推导 EIF：通过 Gateaux 导数（即“去掉一个点”扰动）计算 ATT 在完全缺失模型下的有效影响函数。这是所有核心结果的基础。
构造双稳健估计量：将 EIF 写为 \(D = D_1 + D_2 + D_3\) 的形式，其中：
- \(D_1\) 对应观测到暴露与结局下的贡献（“完全观测”子集）；
- \(D_2\) 对应暴露观测但结局缺失时的贡献；
- \(D_3\) 对应两者都缺失时的贡献。分别用 nuisance 估计（倾向得分、缺失概率、结果回归）替代理论量。
交叉拟合（Cross-fitting）：将数据分为 K 折（本文用 K=5），在每一折上用其余折训练 nuisance 模型来避免 overfitting 带来的偏差，从而提高双稳健性质的鲁棒性。
渐近性质分析：证明在 nuisance 估计达到一定收敛速率（\(\sqrt{n}\)-consistent 即可）下，ATT 估计是 \(\sqrt{n}\)-consistent、渐近正态，且达到半参效率界。
关键跳跃点/难点：
难点 1：当暴露缺失时，如何识别条件期望 \(E[Y \mid A=0, X]\)？传统上仅用观测到的暴露值估算，但暴露缺失时观测到的是偏倚样本。解决方案：利用缺失模型 \(\pi_A(X)\) 对缺失数据进行 IPW ，先在完全观测层内校正暴露分子的分配。
难点 2：EIF 推导中涉及三个层次（完全观测、部分缺失、全部缺失）的积分叠加，导致公式中出现三阶交叉项（如 \(\frac{A R_A R_Y}{\pi_A \pi_Y}\)）。作者通过引入指示器将三部分统一成一个公式，避免了显性三层加权。
难点 3：当暴露和结局分布不平衡（低暴露率≈10% + 低犯罪率≈20% 的交叉）时，非参效率界可能很大，但作者不分析效率损失，只给出置信区间。
技术技巧点名：
Efficient Influence Function（EIF）/ 有效影响函数：用于构造最小渐近方差估计量的核心工具；针对 ATT 在非参缺失模型下推导（参照 Kennedy 2018 的 ATE 版本）。
Cross-fitting：用于避免 nuisance 函数的 overfitting 偏差。
风险比敏感性分析：不同于传统的均差敏感性分析（Rosenbaum 2002），作者将偏差参数化为两个风险比（\(RR_{U,A}\) 和 \(RR_{U,Y}\)），更适合二元结局；这一公式源自 VanderWeele & Arah 2011 的因果偏差不等式。
Missing at Random (MAR)：对暴露和结局分别做 MAR 假设；注意，作者没有讨论缺失是否可忽略（MNAR）的情况——这是限制。

真实例子与应用¶

Add Health 数据集：13,233 名青少年，Wave I 与 II 两次访谈。暴露（受害）的测量来自 Wave I 中的 3 个问题（是否被持棍棒威胁/攻击/抢劫），若任一回答“是”则评为受害。犯罪测量是 Wave II 中 15 项通用 Delinquency Scale（偷窃、损坏公物、暴力袭击等），求二值化是否至少发生任一项。

方法应用： - 估计倾向得分（Logistic regression on \(X\)：父母婚姻状况、种族、性别、年龄、家庭收入、AHD 量表等 10+ 协变量）。 - 估计缺失概率（Logistic：\(R_A\) 与 \(R_Y\)）。 - 估计结果回归（Logistic: \(Y \sim A, X\)）。 - 所有模型通过 5-fold cross-fitting 交替估计。

结果：ATT=3.86pp, 95% CI [0.28, 7.45]。按效应分解，非暴力犯罪贡献 4.2pp，暴力犯罪仅 1.1pp。

这个例子想说明： 1. 即使犯罪率和受害率都较低（暴露率~10%、结局率~20%），双稳健估计仍然能检测到显著效应。 2. 年龄异质性曲线（14-16 岁受害效应≈7.4pp，17-20 岁降至≈2.0pp）支持“早受害效应更强”的假说。 3. 非暴力犯罪为驱动因素，暗示预防政策应优先瞄准技术性/财产犯罪而非暴力行为。 4. 敏感性分析说明在犯罪学领域，可能存在的未观测混杂强度（如家庭冲突、校园氛围等）不足以解释全部效应（除非其 RR > 1.4+），因此结论对中等强度混杂稳健。

🔎 结论是否比证明窄¶

作者在敏感性分析部分（Section 5.2）的表述是：“Our results are robust to modest unmeasured confounding”。然而，证明中严格推导的是风险比阈值 Θ 的保守下界（即假设 U 与 A 和 Y 均为线性+logistic 形式），在实际数据中这个 Θ 仅是点估计水平，置信区间下界的 Θ 更小（≈1.25）。结论的稳健性因此依赖于参数函数形式假设：若 U 与 A 和 Y 之间的关系不仅是加性线性的，也受交互项调节（如 \(P(A|X,U)\) 中 \(U\) 的 OR 在 \(X\) 的不同水平上变动），那么实际阈值可能更小或更大——作者没有讨论这种非线性扭曲。

另外，作者在讨论年龄异质性时（Section 6）说：“ATT decreases with age of victimization”。但给定该交互检验 p=0.07，并没有严格统计证据。结论比证明支撑的强度略宽。

更实质的窄化： - “效应主要由非暴力犯罪驱动” (Section 6) 的细分分析中，作者只给出了点估计和 CI，未做对两个子模型的交叉检验（如是否非暴力犯罪 ATT 显著大于暴力犯罪 ATT 的正式检验），仅靠二者 CI 不重叠的视觉推断。 - 所有分析假设“无时间交叠”：暴露发生在 Wave I（去时间轴上的 Year 0），结局在 Wave II（约 1 年后）。实则部分青少年在 Wave I 与 II 之间存在持续的受害经历（如 12-18 个月重复受害），但作者将其视为一时间截面暴露，未采用动态治疗（dynamic treatment regime）或 marginal structural models 来控制。

四、开放问题¶

问题 1：放松 MAR 假设，当暴露或结局缺失是非随机（MNAR）时，如何识别并稳健估计 ATT？
→ 扎根于本文第 3.1 节的 MAR 假设声明。作者在 7.1 (Discussion) 中承认这一限制，并建议 missing not at random (MNAR) 下的敏感性分析作为未来工作。
问题 2：将本文的 ATT+缺失双稳健方法推广到连续暴露（如受害频率/强度）或多分类暴露。
→ 扎根于第 2 节：当前只设 A ∈ {0,1}。Currie & Tekin (2012) 已指出多形式受害会造成效应增强。再加多水平的缺失 IPW/EIF 会变得极复杂。
问题 3：风险比敏感性分析应扩展到允许交互作用（U 与 X 的交互项）扰动，并推导严格的识别集（identified set），而非单点估计阈值。
→ 扎根于第 5.2 节中的参数化假设（线性 logit 形式的 \(P(A|X,U)\) 和 \(P(Y|X,A,U)\) 模型）。若 U 与 X 存在交互（即 U 的混杂效应随 X 变化），则 Θ 不再有意义。目前文献（如 Rosenbaum U; 2017 bias bounds）中已有 U 与 X 交互的敏感性分析框架，但未被本文采用。
问题 4：检验“效应异质性随年龄递减”这一结论是否由受年龄—时间效应混淆（如累积受害）导致。
→ 扎根于交互检验 p=0.07 (Section 6) 和作者未对暴露累积效应建模的事实（仅用 Wave I 单期暴露）。可将本文拆解为边际结构模型 + 逆概率权重来处理时间变化的暴露-缺失关系。
提醒：要确认以上哪条是真正的 gap，建议阅读（i）关于 MNAR 在因果推断中的最新工作（Zhao & Shao 2022, 截面数据）；(ii) 关于连续暴露的非参效率（Kennedy et al. 2017 对连续暴露的治疗效应曲线）；(iii) 关于交互性敏感性分析的（VanderWeele & Arah 2011, Ding & VanderWeele 2016）。

（字数限制：开放问题部分已尽量压缩至 4 条具体问题，各扎根论文具体语句。）

Maintained by 陈星宇 · Homepage · Source on GitHub