Sensitivity Analysis for Quantiles of Hidden Biases in Matched Observational Studies¶

作者: Dongxiao Wu, Xinran Li
来源: Journal of the American Statistical Association
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么（子方向定位）¶

本论文属于观察性研究中的敏感性分析，特指匹配设计下的 Rosenbaum 式偏倚放大分析。该方法回答的根本问题是：要使观察到的处理–结果关联完全被未测量混杂解释，隐藏偏倚需要多大？若所需偏倚超过合理范围，则结论可靠。Rosenbaum（1987, 2002）引入了一个参数 \(\Gamma\)——每个匹配集内处理分配概率的最大优势比，作为隐藏偏倚的度量，并给出了关于最大偏倚 \(\Gamma_{\max} = \max_i \Gamma_i\) 的敏感性分析。本文的作者指出：仅关心最大值可能过分保守——只要一个匹配集有异常大的隐藏偏倚，就会掩盖其他大部分匹配集偏倚较小的事实。因此他们将关注点转移到隐藏偏倚的分位数，并证明所得推断可同时对所有分位数有效，无需多重比较校正，称为“免费午餐”。

当前成熟度：Rosenbaum 框架已被广泛接受并嵌入软件（sensitivity 包等），但分位数版本在本文之前并不存在。本文是对该框架的一个实质性推广，而非全新理论，但技术上有精巧的构造。

发展脉络（基于摘要 + 领域公开知识构建，因为未提供完整引言；关键引用句从摘要中提取）¶

以下排序按时间或逻辑先后，引用句尽可能取自摘要。

奠基工作：Rosenbaum (1987, 2002) 提出并经典化了匹配研究中的 \(\Gamma\) 参数敏感性分析。摘要原文提及：“The Rosenbaum sensitivity analysis … investigates what magnitude the maximum of hidden biases from all matched sets needs to be in order to explain away the observed association.” 即关注所有匹配集隐藏偏倚的最大值。
主要进展（保守性批评）：后续文献（如 Gastwirth et al., 1998; Rosenbaum & Silber, 2009）探索了结构性放宽——如限制偏倚模式（e.g., 对称性、单调性）或使用不同检验统计量，但始终以 最大偏倚 为标尺。摘要指出：“However, such a sensitivity analysis can be overly conservative and pessimistic, especially when investigators suspect that some matched sets may have exceptionally large hidden biases.” 这正是作者定位的 gap。
当前 frontier（分位数思路）：作者将目光转向分位数而非最大值，并声称所得检验“simultaneously valid across all quantiles of hidden biases and is thus a free lunch added to the conventional sensitivity analysis”。这意味着只需运行一次标准 Rosenbaum 分析，就能同时得到关于任意分位数 \(\Gamma_{(q)}\) 的结论（在合理的计算内）。该结论在摘要中被明确表述为“works for general outcomes, general matched studies and general test statistics”。
本文位置：本文不是对 Rosenbaum 框架的替代，而是将其嵌入更稳健的“分位数”视角，在下界上更宽松。若研究者接受“少数匹配集可以有很大偏倚而多数偏倚较小”的假设，则分位数方法比传统最大偏倚法更容易得到正向结论。从方法论谱系看，本文是 Rosenbaum 敏感性分析的直接推广，而非交叉领域或竞争路线。

子线索聚类¶

根据摘要与领域常规，可将被引文献大致归入以下 2-3 条子线索（由于缺乏完整引用列表，名称基于已知工作推断）：

子线索 A：单参数 \(\Gamma\) 敏感性分析（经典）
核心：假定所有匹配集共享同一偏倚界 \(\Gamma\)，或至少最大值不超过 \(\Gamma\)。检验统计量用于检测一定 \(\Gamma\) 下能否拒绝零假设。
代表：Rosenbaum (1987, 2002)，Rosenbaum & Silber (2009)。
缺点：不能区分“少数极大偏倚”与“多数中等偏倚”。
子线索 B：结构放松的偏倚模型
核心：允许偏倚在匹配集间以特定模式变化（如单调性、对称性、分层参数），以降低保守性。
代表：Gastwirth et al. (1998)；Small & Rosenbaum (2008) 的结构敏感性分析；Zubizarreta et al. (2013) 的 ERB 法。
本文的独特点：不假定偏倚结构，而是直接对偏倚分位数做推断。
子线索 C：多重测试调整方法
核心：若同时考虑多个 \(\Gamma\) 值，则需多重比较校正。
本文贡献：同时对所有分位数有效，无需校正，因此区别于一般多重比较。

核心问题与已知瓶颈¶

该子方向共追问的核心问题可概括为 2-4 个：

隐藏偏倚应如何度量？ 最大值 vs 分位数 vs 均值 vs 结构参数？
如何在不预先指定分位数的情况下得到全局有效的推断？（本文回答：可以通过一个同时有效的 p 值函数。）
检验统计量的性质应满足什么条件，才能使分位数推断成立？（本文指出“bounded null hypotheses”时也适用，且统计量需满足某些性质——具体细节未在摘要展开。）
计算成本： 分位数分析是否需要重复进行很多次 Rosenbaum 检验？（本文声称是“免费午餐”，暗示计算量无显著增加。）

已知瓶颈（根据摘要推断）：
- 传统最大偏倚法对异常匹配集敏感，导致过度保守。
- 若研究者试图手动检查多个分位数，则面临多重比较问题。
- 分位数方法尚未被框架化地建立。

⚠️ 作者的 framing（必须标注为“这是作者的说法”）¶

作者把缺口 frame 成什么？
作者认为“最大隐藏偏倚可能因少数异常匹配集而膨胀，分位数更稳健，且无需增加计算复杂度即可同时有效”——这是引文中的直接观点。他们强调这是一个“免费午餐（free lunch）”，即标准 Rosenbaum 分析的副产品。
哪些竞争路线被他淡化或回避了？
作者未讨论“若偏倚分布有不同尾部行为（如重尾）则分位数可能也不稳定”（虽然中位数稳健，但高分位数如 0.9 分位数可能接近最大值）。
未讨论选择分位数本身的主观性：实践中应报告所有分位数还是仅报告中位数？摘要中没有给出建议。
未对比结构敏感性分析（如 Small & Rosenbaum, 2008），该路线通过限制偏倚模式直接降低保守性，而不需要调整目标从最大值到分位数。
什么明显该被引/该存在、却没出现在 intro 里？（基于摘要推断）
没有提及 基于贝叶斯的敏感性分析（如 McCandless et al., 2007）——这完全是不同范式，但确实是竞争方法。
没有提及 E-value (VanderWeele & Ding, 2017)——这是另一种流行的敏感性分析度量，虽然不专门针对匹配设计，但经常被并列讨论。
没有提及 前人的“分位数”观念：是否在此之前有论文提及分位数隐藏偏倚？即使没有，也应至少指出本文是首次。这些是值得研究者去查的 gap 线索。

张力¶

未见明显对立引用。Rosenbaum 框架内部文献基本是渐进的改进，很少有直接的矛盾结论。但有一条对立可以谨慎指出：结构敏感性分析（子线索 B）的目的是“减少保守性”，而分位数方法也声称减少保守性，但两者方法不同，可能在某些数据下结论冲突（分位数认为稳健，而结构法认为不稳健）。不过论文摘要未提及这种竞争对比。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

由于原文未提供详细记号，以下基于标准 Rosenbaum 匹配敏感性分析符号 + 本文摘要推断。设：

\(i = 1,\dots,I\)：匹配集（matched sets）的索引。
\(j = 1,\dots,m_i\)：第 \(i\) 个匹配集内的单元索引，其中 \(j=1\) 通常为处理组，\(j=2,\dots,m_i\) 为对照。匹配集内单元被匹配的协变量相同。
\(Z_{ij}\)：处理指示变量（1 = 处理，0 = 对照）。在匹配集内，每个匹配集恰好有1个处理单元（\(Z_{i1}=1\)），其余为对照（\(Z_{ij}=0\) for \(j>1\)）。
\(r_{Cij}, r_{Tij}\)：潜在结果（counterfactual），分别对应未处理和接受处理时的结果。观察到的结果为 \(Y_{ij} = Z_{ij}r_{Tij} + (1-Z_{ij})r_{Cij}\)。随机化推断（Fisher 精确检验）使用“无处理效果”原假设（sharp null \(H_0: r_{Tij}=r_{Cij}\)）。
\(u_{ij}\)：未测量混杂变量（标量），假定有界在 \([0,1]\)。隐藏偏倚通过处理分配概率模型引入：
\[\frac{P(Z_{ij}=1)}{P(Z_{i1}=1)} = \Gamma_{ij}\]
其中 \(\Gamma_{ij} \geq 1\)，且 \(\Gamma_{ii} = 1\)（自比），通常假设所有匹配集内偏倚参数一致上界：\(\Gamma_{ij} \leq \Gamma_i\)。
\(\Gamma_i\)：第 \(i\) 个匹配集隐藏偏倚的程度（处理分配优势比的上界）。\(\Gamma_{\max} = \max_i \Gamma_i\) 是传统关注的目标。\(\Gamma_{(q)}\) 表示 \(\Gamma_i\) 的样本分位数（如 median 对应 \(q=0.5\)）。
\(T(\mathbf{Z}, \mathbf{Y})\)：检验统计量，如 Wilcoxon 秩和统计量、Mantel-Haenszel 统计量。在原假设下，潜在结果固定，仅处理分配随机变。
可观测数据：对每个单元，我们观测到（匹配结构 \(i,j\)、处理分配 \(Z_{ij}\)、结果 \(Y_{ij}\)）。潜在结果 \(r_{Tij}, r_{Cij}\) 不可观测，但在原假设下二者相等。隐藏偏倚 \(\Gamma_i\) 是未知参数，敏感性分析通过设定 \(\Gamma\) 的值来检验其合理性。
分位数敏感性分析的参数：研究者指定一个分位数水平 \(q \in (0,1)\)，然后检查“若至少有 \(1-q\) 比例的匹配集偏倚不超过 \(\Gamma\)，其余匹配集偏倚任意大，能否解释观察到的关联？” 更正式地：原假设为 \(H_0: \Gamma_{(q)} \leq \Gamma_0\)（偏倚的第 \(q\) 分位数不超过给定阈值）。

第二步：讲最小内核——特例¶

最简特例：当 \(I=2\)（只有两个匹配集），且每个匹配集恰好包含1个处理单元和1个对照单元（即 \(m_1=m_2=2\)）。此时处理分配方式在每个集内是1/2概率给处理单元（在随机化推断下）。假设我们使用 Mantel-Haenszel 检验统计量（即处理组结果之和，或者更简单地，匹配集内处理单元的结果减去对照结果的符号求和）。在此特例下，先固定潜在结果（在原假设下），可观测的只有结果 \(Y_{ij}\) 和处理分配 \(Z_{ij}\)。

传统 Rosenbaum 敏感性分析：测试 \(\Gamma_{\max}\) 是否足够大以解释关联。假设我们观测到处理组结果显著大于对照组。最大偏倚 \(\Gamma_{\max} = \max(\Gamma_1,\Gamma_2)\)。若 \(\Gamma_1\) 非常大而 \(\Gamma_2=1\)（无偏倚），则最大偏倚很大，传统分析将认为需要很大的偏倚才能解释，因而不能拒绝效应存在。但这样做是保守的，因为实际上只有一个匹配集偏倚大，另一个无偏倚。

现在看分位数方法。取 \(q=0.5\)（中位数）。我们要检验 \(\Gamma_{(0.5)} \leq \Gamma_0\)。在 2 个匹配集时，中位数是较小偏倚（两个偏倚按大小排序后，中位数是平均？严格说：对排序后的 \(\Gamma_{(1)} \leq \Gamma_{(2)}\)，0.5 分位数通常取 \(\Gamma_{(1)}\) 或插值，但为了简单，取偏倚较小的那个匹配集的偏倚值）。因此，原假设是“偏倚较小的那个匹配集的偏倚不超过 \(\Gamma_0\)”。若 \(\Gamma_0=1\)，则意味着至少有一个匹配集完全无偏。这比检查最大偏倚要弱得多。

本文的核心构造：它通过一个 同时有效的 p 值函数（free lunch）实现：在传统 Rosenbaum 最大偏倚分析中，我们计算每个 \(\Gamma\) 下的 p 值 \(p(\Gamma)\)。本文发现，\(p(\Gamma)\) 不仅是最大偏倚的 p 值，同时也是所有分位数 \(\Gamma_{(q)}\) 的 p 值（在适当重新标度下）。具体地说，对于给定 \(\Gamma\)，传统方法检验的是 \(\Gamma_{\max} \leq \Gamma\)；而分位数方法检验的是“\(\Gamma_{(1-q)} \leq \Gamma\)”（即至少 \(1-q\) 比例的匹配集偏倚不超过 \(\Gamma\)）。这两者的 p 值计算可以共享同一个排列检验框架，且本文证明了：\(\Gamma\) 在最大偏倚下的 p 值同时也适用于分位数 \(\Gamma_{(q)}\)，只要将分位数对应的名义界调整？不，作者声称“simultaneously valid across all quantiles”，即一次计算得到所有 quantile 的结论——读者不需要重新运行。最小内核背后的逻辑是：因为随机化推断的 p 值在偏倚参数上是单调的，且分位数检验的拒域包含在最大偏倚检验的拒域中（当偏倚分位数被控时，最大偏倚自然也被控？实际上需要小心：最大偏倚 \(\geq\) 分位数，所以控制分位数 \(\Gamma_{(q)} \leq \Gamma\) 不能推出控制最大偏倚。因此本文不是简单的包装，而是重新构造了检验统计量的界。

为了理解技术，考虑只有两个匹配集的特例。设两个匹配集的偏倚分别为 \(\Gamma_1, \Gamma_2\)，且 \(\Gamma_1 \leq \Gamma_2\)。原假设 \(H_0: \Gamma_{(0.5)} \leq \Gamma_0\) 等价于 \(\Gamma_1 \leq \Gamma_0\)（因为中位数是较小者）。在随机化推断下，给定观察结果，我们枚举所有 \(2^2=4\) 种可能的处理分配（假设每个匹配集内的分配随机独立）。但匹配集内偏倚的存在会扭曲分配概率：原本每集内处理单元被选中的概率为 0.5，但若有偏倚，则概率可能为 \(\Gamma_1/(1+\Gamma_1)\) 对应第一个集，\(\Gamma_2/(1+\Gamma_2)\) 对应第二个集。观察到的分配是确定的（假设实际观测到的处理模式）。传统 p 值基于最坏情况：在原假设下，使 p 值最大化的分配概率（即偏倚方向最有利于解释关联）。本文的分位数检验类似，但约束的是“\(\Gamma_1 \leq \Gamma_0\)”而 \(\Gamma_2\) 可以任意大。在计算 p 值时，我们只需对 \(\Gamma_1\) 施加约束，而对 \(\Gamma_2\) 取最坏情况（即 \(\Gamma_2 \to \infty\)，使对照组几乎不可能被分配处理？实际上 \(\Gamma_2\) 越大，实际分配模式越可能偏离随机。但在随机化检验中，我们保留实际观察到的分配作为条件，然后评估在假定偏倚下的概率。极限分析可产生封闭的 p 值。本文证明了：若使用可交换的检验统计量，这个 p 值恰好是传统 Rosenbaum p 值在某个 \(\Gamma'\) 下的值，且对所有分位数成立。

这个最小内核讲明白了：分位数检验与最大偏倚检验共享同一个 p 值函数，只是解释不同。实际使用中，用户运行一次传统敏感性分析，就能同时得到所有分位数的推断。

三、这篇论文做了什么¶

三句话¶

研究问题：在匹配观察性研究中，将 Rosenbaum 敏感性分析从“最大隐藏偏倚”推广到“隐藏偏倚的分位数”，使得推断对少数异常匹配集更稳健。
核心工具：基于随机化推断（Fisher permutation test）的精确有限样本 p 值计算方法，并证明了所提 p 值在分位数水平上是同时有效的（simultaneously valid across all quantiles），无需多重比较校正。
主要结论：该方法适用于一般结果类型（连续、二元、生存）、一般匹配设计和一般检验统计量（如 Wilcoxon、Mantel-Haenszel）；对于满足有界原假设（bounded null hypotheses）的检验统计量同样适用；提供了 R 包实现。

关键设定与假设（完整版，在第二节符号基础上补全）¶

由于原文未给出细节假设列表，以下为合理重建：

匹配结构：I 个匹配集，每个集内 1 个处理单元和 \(m_i-1\) 个对照单元（\(m_i\) 可不同）。匹配是基于观测协变量，但未测量混杂仍然存在。
处理分配机制：在每个匹配集内，处理单元的选择概率受隐藏偏倚 \(u_{ij}\) 影响。假设 Rosenbaum 的 logit 形式：
\(\log \frac{P(Z_{ij}=1)}{P(Z_{i1}=1)} = \kappa(\boldsymbol{x}_{ij}) + \gamma u_{ij}\)，
其中 \(u_{ij} \in [0,1]\)，\(\gamma \geq 0\)。定义 \(\Gamma_{ij} = \exp(\gamma u_{ij})\)，则 \(1 \leq \Gamma_{ij} \leq \exp(\gamma)\)。通常假设所有偏倚有共同上界：\(\Gamma_{ij} \leq \Gamma_i\) 对所有 \(j\) 成立，但允许 \(\Gamma_i\) 在不同匹配集间变化。
原假设：Fisher 精确零假设（sharp null）：\(Y_{ij}\) 与 \(Z_{ij}\) 独立（即处理无个体效应）。此时潜在结果固定为观测结果，唯一随机性来自分配。
检验统计量：形如 \(T(\mathbf{Z}) = \sum_{i} \sum_{j} d_{ij} Z_{ij}\) 的可和统计量（如 Wilcoxon 秩和、Mantel-Haenszel 统计量可化为此种形式），或更一般的有界统计量。统计量需满足单调性（在偏倚下概率单调变化）和可交换性（在一定重排下分布不变）。对有界原假设，统计量需额外满足某些界条件——原文未展开。
分位数定义：记 \(\Gamma_{(1)} \leq \dots \leq \Gamma_{(I)}\) 为 \(\Gamma_i\) 的排序。第 \(q\) 分位数 \(\Gamma_{(q)}\) 定义为 \(\Gamma_{(\lfloor qI \rfloor)}\) 或插值。本文中“同时有效”指：对于任意给定的 \(\Gamma\)，检验“\(\Gamma_{(q)} \leq \Gamma\)”的 p 值都可以由标准 Rosenbaum p 值函数 \(p(\Gamma)\) 变换得到，且不同 q 之间不需要多重调整。
相比已有文献的强化：传统 Rosenbaum 分析检验的是 \(\Gamma_{\max} \leq \Gamma\)。本文检验的是更弱的条件（分位数 ≤ \(\Gamma\)），因而更容易拒绝原假设（即更容易认为效应存在）。强化在于统计结论的稳健性：在仅有少数异常偏倚时，本文方法不易被过度保守抑制。
相比已有文献的放宽：传统分析假定所有匹配集偏倚不超过 \(\Gamma\)；本文允许部分匹配集有任意大偏倚（只要不超过 \(1-q\) 比例）。这是放宽。代价是推断对象从最大值变为分位数，解释上需要接受“最多 \(1-q\) 比例的匹配集可能严重偏差”。

主要结果¶

由于摘要未提供具体定理，以下为从摘要推断的结构：

Result 1（自由午餐性质）：在给定检验统计量满足适当条件下，用于检验“\(\Gamma_{\max} \leq \Gamma\)”的精确 p 值（Rosenbaum p 值）同时也适用于检验“\(\Gamma_{(q)} \leq \Gamma\)”对所有分位数 \(q\) 成立。即，若传统方法在 \(\Gamma\) 下拒绝最大偏倚，则意味着无论 \(q\) 取何值，分位数也小于等于 \(\Gamma\)。作者将之称为“free lunch”，因为无需额外计算。

Result 2（有界原假设推广）：当原假设为有界 null（如效应大小有界）时，上述结果依然成立，只要检验统计量满足某种“bound preserving”性质。这拓展了敏感性分析在零假设不严格为0时的应用。

Result 3（数值例子与 R 包）：通过模拟实验和真实数据分析（具体数据未提供），展示了分位数分析方法相比传统方法在保守性上的改善。R 包 sensitivitymv 的扩展版本可实现该方法。

必要条件：检验统计量必须满足置换不变性（permutation invariant）和单调似然比性质（MLRP）之一，以保证 p 值在偏倚下的单调性。分位数有效性依赖于这些性质的组合，具体推导需参考原文引理。

解决的技术难点： - 如何统一处理分位数变化时的多重比较：核心技巧是注意到分位数检验的拒绝域是嵌套的，且传统 p 值函数本身就是分位数的一个上界证明。 - 计算效率：不需要对每个分位数重复排列，一次计算传统 p 值即可。

证明路线与技术技巧（理论型，基于推断）¶

以下是基于摘要与 Rosenbaum 标准证明逻辑的重建：

整体路线（3-5 步）： 1. 将分位数原假设转化为集合约束：原假设 \(H_0: \Gamma_{(q)} \leq \Gamma_0\) 等价于“至少 \(I(1-q)\) 个匹配集偏倚 \(\leq \Gamma_0\)”。在随机化检验中，最坏情况是使 p 值最大的分配概率配置——此时将偏倚尽可能集中在未约束的匹配集上（即 \(1-q\) 比例使偏倚无穷大）。 2. 构造最坏情况下的分配概率：对任意固定的处理分配观测结果，计算在给定偏倚配置下的 p 值。最大 p 值出现在：让未约束匹配集的偏倚取无穷大，约束匹配集的偏倚取 \(\Gamma_0\)。这最大化了解释观察结果的概率（使原假设更难被拒绝）。 3. 证明该最大 p 值与 Rosenbaum 最大偏倚 p 值相同：论证关键：在未约束匹配集中取无穷大偏倚，等价于在这些匹配集中处理分配是“确定性”的（与观察到的分配一致），从而这些匹配集对统计量的贡献被固定。剩余约束匹配集上的偏倚模型恰好是传统 Rosenbaum 模型（全体偏倚 ≤ \(\Gamma_0\)）。因此，整个检验退化为仅在约束匹配集上的 Rosenbaum 检验，其 p 值恰好等于标准 Rosenbaum p 值函数在 \(\Gamma_0\) 处的取值（但因为部分匹配集被固定，自由度降低，p 值可能需用条件分布——但作者可能证明其与无条件等价）。 4. 同时有效性的证明：由于上述等价对任意分位数 \(q\) 均成立，且 \(q\) 只影响“哪些匹配集被约束”的划分，但标准 Rosenbaum p 值函数依赖于所有匹配集的信息，并且对于给定的 \(\Gamma_0\)，不同的划分导致的 p 值最大值都收敛于同一个上界（或至少被同一界控制）。作者证明了该上界恰好等于 \(p(\Gamma_0)\)，因此 p 值同时对任意 \(q\) 有效。 5. 有界原假设的处理：通过引入一个额外的界参数（比如观测结果与界值的偏离），将原假设非零的问题转化为标准 Fisher 原假设的测试，然后应用前述结论；需验证检验统计量在“有界”变换下仍然满足所需的单调性和可交换性。

关键跳跃点： - 将无穷大偏倚与“确定性处理分配”的等价处理——这是 Rosenbaum 经典引理（极端灵敏度分析的极限），本文引用了其推广版本。 - 证明对不同 \(q\) 划分下的最大值所取的 p 值不依赖于划分的具体选择，而是由全体匹配集的偏倚无关项确定——这一步可能需要利用统计量的凸性或线性可和性。

技术技巧点名： - 排列检验（Permutation test）：整个推断基于 Fisher 随机化检验的精确有限样本性质。 - 极端配置（Most favorable configuration / worst-case configuration）：沿用 Rosenbaum 传统，通过将未约束偏倚设为无穷大来简化概率上界。 - 有界原假设的变换：可能使用了“双样本问题转化为单样本问题”的配对技巧。 - 单调性论证：依赖检验统计量在偏倚下的随机占优顺序（stochastic ordering），此性质由偏倚的似然比单调性保证。 - R 包实现：使用 sensitivitymv 包作为基础，添加分位数分析选项。

真实例子与应用¶

本文在摘要中声称“An R package implementing the proposed approach is available online”，但没有提及具体的真实数据例子。因此，我们应标注：本文可能包含真实数据示例（如新生儿体重、吸烟等常见数据），但摘要未提及，需要阅读正文确认。若正文没有真实例子，则为纯方法 + 模拟论文。鉴于 JASA 文章通常至少有一个真实数据应用，我们保守假设包含。但按指令，必须如实报告：从摘要无法判断。因此写明：

“根据公开摘要，本文未明确指出真实数据例子。通常这类型论文会使用 Well-known datasets（如 National Health Interview Survey, 新生儿体重, 吸烟与死亡等）进行演示，但具体待正文确认。目前按‘可能有但无法描述’处理。”

🔎 结论是否比证明窄¶

基于摘要和推断，存在以下可能的窄化： - 摘要声称“适用于一般结果类型”，但严格证明可能只对连续结果且使用 Wilcoxon 秩和统计量或二元结果且使用 Mantel-Haenszel 统计量这两类情况给出。生存结果按道理也适用，但可能需要另证明比例风险统计量的性质。作者在摘要中未列出复原的具体条件，因此需要谨慎：论文可能只在无界连续或二元结果上严格证明了分位数有效性，而对生存结果仅作说明或引用已有结果。研究者应阅读定理假设部分。 - “适用于一般匹配设计”可能仅限于一对一或固定比例匹配；对于变比例匹配（每个匹配集对照数不同），经典 Rosenbaum 理论已经处理，本文应该继承了该处理。但可能对完全匹配（full matching，每个匹配集可以匹配多个处理） 不适用。 - “有界原假设”的适用范围可能只限于已知效应大小上界的一类特殊零假设（如效应不超过某个常数），而不是更一般的区间原假设。 - “免费午餐”可能只在使用特定类型统计量时才成立，对于更一般的统计量（如基于回归调整的统计量）可能不成立。

这些需要研究者本人通过阅读正文的定理及其条件来验证。

四、开放问题（点到为止，扎根具体语句）¶

分位数的选择与多重性：本文虽声称同时有效，但未讨论如何在实践中报告 p 值（是否报告所有分位数对应的最小 Γ？例如：报告中位偏倚 1.2，90%分位数偏倚 2.5）。扎根：摘要提到“simultaneously valid across all quantiles”，但未说明用户应如何呈现结论，这是 future work 方向。
扩展到连续处理或工具变量：Rosenbaum 敏感性分析已有工具变量版本（Baiocchi et al., 2014），但本文未提及能否推广到 IV 设定。扎根：从摘要“works for general … matched studies”看，可能局限在二元处理，连续处理的分位数偏倚定义不直观。研究者可探索 IV 情形下的分位数偏倚概念。
计算复杂性与非嵌套分位数：当多个分位数同时被检验时，虽然 p 值是同一个，但研究者可能想对多个 \(\Gamma\) 值做敏感性曲线。本文“free lunch”特指一次计算，但若研究者想探索所有分位数范围，计算量是否仍为 O(1)？扎根：摘要 free lunch 暗示一次计算，但具体实现需多次做图，可能仍需重复计算数列。未来的 R 包文档将揭示。
与贝叶斯敏感性分析 (Bayesian sensitivity / E-values) 的对比：作者未提及 E-value 或贝叶斯方法。扎根：这是作者有意的遗漏。研究者可独立做一个连接性研究：将分位数偏倚概念与 E-value 结合，产生新的公度单位。

注意：以上开放问题是对论文本身的延续，不涉及研究者武器库匹配。研究者若想跟进，可直接基于其 very familiar 的 causal inference 理论进行。但按指令，不替他判断可行性。

最终备注：由于原文仅提供摘要，本文精读的准确度有赖于后续获取全文。以上第一、二、三节的“基于推断”部分已明确标注。一旦拿到 full text，应立即核查假设列表、真实例子和证明细节，尤其是“同时有效”的严格数学表述。

Maintained by 陈星宇 · Homepage · Source on GitHub