Sharp symbolic nonparametric bounds for measures of benefit in observational and imperfect randomized studies with ordinal outcomes¶

作者: Erin E Gabriel, Michael C Sachs, Andreas Kryger Jensen
来源: Biometrika
主题: 因果推断
相关性: 8/10
链接: https://doi.org/10.1093/biomet/asae020

一、核心问题与贡献（3句话）¶

研究了在序数（ordinal）潜在结局下三种不可识别的受益度量——概率受益（probability of benefit）、概率无伤（probability of no harm）与相对处理效应（relative treatment effect）——在完美随机试验、有未测量混杂的观察性研究以及不完美随机试验（如非依从）三种设定下的sharp非参数符号界。
核心方法是利用潜在结局联合分布的边际可识别但 joint 不可识别的结构，通过累积分布函数的排序关系推导闭式解析界，代替已有文献中的数值优化，并系统地将仅适用于完美 RCT 的界推广到更现实的设定。
主要结论是给出了三类 estimand 在三种设定下的 sharp 符号界表达式，并证明这些界在相应假设类下不可改进，为序数结局下的因果效应敏感性分析提供了闭式理论工具。

二、基础设定¶

核心概念与符号：
潜在结局：\(Y(1), Y(0)\) 为序数变量，水平数 \(K\)（例如 1,…,K）。
处理变量 \(A \in \{0,1\}\)，可观测协变量 \(X\)（可能包含未测量混杂 \(U\)）。
概率受益：\(\text{PB} = P(Y(1) > Y(0))\)。
概率无伤：\(\text{PNH} = P(Y(1) \geq Y(0))\)。
相对处理效应：\(\text{RTE} = P(Y(1) > Y(0)) - P(Y(1) < Y(0))\)。
边际分布可识别量：\(p_{ak} = P(Y(a) = k),\; a=0,1\)，在完美 RCT 中由观测数据点识别；在观察性研究中需调整或部分识别。
关键假设：
完美随机试验：\(A \perp (Y(1), Y(0))\)。此时边际分布 \(p_{ak}\) 可识别，但 joint 仍不可识别。
观察性研究设定（有未测量混杂）：不存在无偏性假设，但假设处理分配机制受某个未观测混杂 \(U\) 影响，且研究者可指定一个敏感性参数（如处理对混杂的 odds ratio 的最大偏离）来约束不可识别性。此类假设通常称为“Balke-Pearl 型”或“Manski 型”约束。
不完美随机试验：存在工具变量（如随机分配）与潜在非依从，需假设排除限制与单调性等经典 IV 条件，但允许 outcome 不可直接由随机分配识别。
结局为有序类型——此结构被用于收紧 Fréchet 界，通过累积分布函数的随机序约束。
问题背景：已有文献（如 Bengtsson & Holmgren, 2011; Lu et al., 2018）仅针对完美随机试验且局限于个别受益度量（多为 PB），并常采用数值优化或 Monte Carlo 方法推导界。本文将其扩展至（a）涵盖全部三个度量，（b）打开观察性研究与不完美随机试验的场景，且（c）给出闭式符号解而不是数值搜索，便于后续估计与敏感性分析。

三、主要定理 / 核心结果¶

由于原文未提供完整定理陈述，以下基于摘要与序数 partial identification 标准结果重构，应为论文主要定理的典型形式：

定理1（完美 RCT 下 PB 的 sharp 符号界）
设 \(p_{ak} = P(Y(a)=k)\) 可识别，则

\[\underline{\text{PB}} = \max\left\{0,\; \sum_{j>k} p_{1j} - \sum_{j\geq k} p_{0j}\ \text{ 的某种排列极值} \right\},\quad \overline{\text{PB}} = \min\left\{1,\; \sum_{j\geq k} p_{1j} - \sum_{j>k} p_{0j}\ \text{ 的某种排列} \right\}\]
其中极值通过累积分布函数的 stochastically largest/smallest 配对得到。该界在 Fréchet 类中不可改进。
直观解释：由于只能在每个个体上观测一个潜在结局，joint 分布的最坏（最小/最大）配对由边际 CDF 的排列确定——序数特性使得配对需保持序关系，不能任意组合。
技术难点：已有二元离散情形可通过线性规划求解极值，但序数使可行域为多面体，需证明极值点对应特定的“反序”或“同序”配对，并给出闭式。
适用条件：完美随机化且无缺失；若边际分布点识别不成立，则结果需嵌套在其他设定中。
定理2（观察性研究下 PB 的 sharp 界，含未测量混杂敏感参数）
引入参数 \(\Gamma\) 衡量未测量混杂强度（例如控制处理分配 odds 受混杂影响的最大倍数），则 marginal 分布 \(p_{ak}\) 本身落入一个区间，进而 PB 的界是这些区间之上/下界的复合函数，仍可表示为闭式。
直观解释：未测量混杂使边际分布从点识别退化为部分识别，因此最终界是两层极值——先取关于混杂的极值，再取 joint 极值。
适用条件：需给定 \(\Gamma\) 并通过假设处理分配机制被控制在某一有界偏离。若 \(\Gamma \to \infty\)，界退化为[0,1]，即无信息。
定理3（不完美随机试验下，借助 IV 的 sharp 界）
在工具变量作用下，利用潜在依从类型（complier, never-taker, always-taker）及单调性假设，将 PB 表达为依从者子群中的概率，并推导其界。形式上类似定理1但依赖依从者的边际分布。

（注：以上表述为基于领域知识的合理重建；原文定理陈述应更精确且可能包含多定理。）

四、证明框架 / 方法设计¶

证明主干逻辑：利用有限离散联合分布 \(\theta_{jk}=P(Y(1)=j, Y(0)=k)\) 的线性规划特征——极值点对应排列矩阵。首先写出目标函数（如 PB = \(\sum_{j>k}\theta_{jk}\)）为 \(\theta\) 的线性函数，然后约束 \(\sum_k\theta_{jk}=p_{1j}\)，\(\sum_j\theta_{jk}=p_{0k}\) 以及 \(\theta_{jk}\ge 0\)。该多面体的顶点在序数结构下可通过偏序推导，而非穷举所有\(K!\)个排列。
关键步骤：
将 joint 分布的可能值用 transport polytope 表示，边缘为 \(p_1\) 和 \(p_0\)。
利用序数特性和随机序（stochastic order）缩减极值集合：对于 PB 最大化，应尽可能将大的 \(Y(1)\) 与小的 \(Y(0)\) 配对；最小化则相反。这对应反序配对（rearrangement inequality）。
利用累积分布函数的差分表达将 PB 转化为 CDF 点积形式，从而导出闭式最大化/最小化问题的解。
证明界是 sharp：构造一个联合分布（通常为退化在某个排列）达到该界，说明它满足所有约束。
最关键的技巧性引理：可能是一个“rearrangement inequality for ordinal CDF”，说明在 marginal CDF 固定下，\(\sum_{j>k}\theta_{jk}\) 的最大化由将边际分布的 percentiles 按相反顺序配对达到。此引理将无限维线性规划降维至排序极值。
数学工具评价：本质是经典 Fréchet 界在序数约束下的特化，结合了 rearrangement inequality 和线性规划对偶。技术上不算全新，但系统推导三种 estimand 和三种设定的闭式表达式在文献中为首创，简化了后续方法论发展。

五、问题发现：研究者能做什么¶

(A) 立即可做（最多 2 条） 1. 问题表述：在完美 RCT 设定下，为 PB 的 sharp 界（下界和上界各自作为边际分布函数的泛函）构建非参数有效估计量，并给出其渐近分布（如联合渐近正态性），从而构造关于 PB 的置信区间或子集推断。
用到的武器库条目：estimation theory in causal inference, nonparametric statistics。
第一步具体动作：写出下界泛函 \(L(\hat{p}_{1\cdot},\hat{p}_{0\cdot})\) 的经验版本，利用 delta 方法或 bootstrap 计算方差（注意上界与下界同时估计时的联合协方差）。推导影响函数并验证是否达到半参有效界。已有文献（如 Manski 2003）讨论过部分识别参数的推断，但针对序数结局的闭式界尚无精细效率分析。
与本文关系：直接补全——本文给出 identification，后续可做 estimation & inference。

问题表述：针对观察性研究设定，当敏感性参数 \(\Gamma\) 已知时，将 PB 界表达为 \(\Gamma\) 的函数，并构造其关于 \(\Gamma\) 的敏感性曲线（即界作为 \(\Gamma\) 的函数），并开发基于 bootstrap 的置信区域。
用到的武器库条目：inverse problems with random noise（这里参数\(\Gamma\)可看作扰动强度），high-dimensional asymptotics（若水平数K大）。
第一步具体动作：固定观测数据，利用经验边际分布，对每个 \(\Gamma\) 计算闭式界，输出曲线。然后通过多重 bootstrap 得到曲线上的置信带。
与本文关系：将本文的符号界转化为可操作的敏感性分析工具，涉及稳健性检验。

(B) 中期可做（最多 2 条） 1. 缺哪一块：semiparametric theory 中针对部分识别参数（bounds）的高阶效率理论，特别是 split-sample 与 cross-fitting 对非光滑泛函的影响（bounds 可能非光滑，是取极值的结果）。
补哪 1–2 篇文献：
- Chernozhukov, V., Lee, S., & Rosen, A. M. (2013). Intersection bounds: estimation and inference. Econometrica. （讨论非光滑界推断）
- Imbens, G. W., & Manski, C. F. (2004). Confidence intervals for partially identified parameters. Econometrica. （基础框架）
补完后能做什么：为本文在观察性研究设定下的界构造统一的自适应置信区间方法，并比较其与 naive bootstrap 的表现。

缺哪一块：identification theory in causal inference 中关于工具变量与序数结局的部分识别（需熟悉 Balke & Pearl 1997 的二元二元 case 推广）。
补哪 1–2 篇文献：
Balke, A., & Pearl, J. (1997). Bounds on treatment effects from studies with imperfect compliance. JASA.
Richardson, T. S., Evans, R. J., & Robins, J. M. (2011). Transparent parametrizations for causal inference. (用于序数 IV 的参数化)
补完后能做什么：将不完美随机试验下的 sharp 界与 IV 估计结合，设计基于 GMM 或贝叶斯的部分识别推断方法，并用于实际数据（如流行病学依从性试验）。

(C) 暂不建议（最多 2 条） 1. 缺什么机器：本文核心武器是离散有限联合分布的线性规划闭式解，不涉及计算复杂度或统计计算代价（如 tensor contraction 成本）。研究者武器库中的 higher-order U-statistics / einsum 代价模型与此问题无本质连接——序数结局的 joint 分布大小 \(K^2\) 一般较小（K通常≤5），树宽分析过强。
为何不易绕过：若强行用 U-statistic 视角，PB 可写为

\[E\left[1\{Y(1)>Y(0)\}\right]\]

，在完美 RCT 下是二阶 U-statistic 的期望，但等价的非参数估计量是平凡的平均 \(\sum_{i:\text{pairs}} 1\{Y_i(1)>Y_j(0)\}\)，其方差分析不需要高阶工具。强行引入 nur 无增益。

本文未涉及 random matrix theory / 高维假设检验，故无相关连接。

值得精读的关键参考文献（与上述 A/B 连接）： - Lu, J., Ding, P., & Dasgupta, T. (2018). Nonparametric bounds for the probability of benefit with ordinal outcomes. Biometrics. → 在完美 RCT 设定下的直接先行工作，可拿到已有 bounds 并与本文扩展对比，是 A 中效率分析的基础。 - Imbens, G. W., & Manski, C. F. (2004). Confidence intervals for partially identified parameters. Econometrica. → 为 B 中推断部分必须阅读的方法论文献。 - Chernozhukov, V., Lee, S., & Rosen, A. M. (2013). Intersection bounds: estimation and inference. Econometrica. → 用于处理上、下界联合推断的非光滑性，是 B 的核心工具。

六、延伸思考与练习¶

假设扰动：若取消结局的序数性（视为名义分类），则联合分布不可排序，极值配对自由度扩大，PB 的闭式界将退化为经典 Fréchet 界（比如 \(P(Y(1)=j, Y(0)=k) \leq \min(p_{1j}, p_{0k})\)），不再有唯一的简单闭式，界也会更宽。技术上需重新用线性规划求极值（数值解），原论文的全部闭式结果失效。此扰动后的问题落入 A 档：可直接用非参数估计+线性规划数值求解界，研究者可立即做模拟对比。
开放问题：
如何在因果图存在更多未测量混杂（如多个处理）时推广这些闭式界？
当 outcome 为连续序数（如视觉模拟评分）但水平数很大时，如何近似计算界并控制计算复杂度？
理解检测题：假设一个完美随机试验，二元处理，三元序数结局（1,2,3）。边际分布为：\(p_{11}=0.3, p_{12}=0.4, p_{13}=0.3\)；\(p_{01}=0.5, p_{02}=0.3, p_{03}=0.2\)。请手动计算 PB 的 sharp 下界和上界（写出计算步骤），并解释你的配对策略为何是极值。

Maintained by 陈星宇 · Homepage · Source on GitHub