A new class of nonparametric tests for second‐order stochastic dominance based on the Lorenz P–P plot¶

作者: Tommaso Lando, Sirio Legramanti
来源: Scandinavian Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本文所处的子方向是随机占优 (Stochastic Dominance, SD) 的非参数检验。其根本问题在于：给定两个独立样本，来自未知的累积分布函数 (CDF) \(F\) 和 \(G\)（通常定义在非负支撑上），我们能否判断一个分布（例如收入分布）在给定的风险偏好序下是否“优于”另一个？具体地，一阶随机占优 (FSD) 对应所有单调递增效用函数的偏好，而二阶随机占优 (SSD) 对应所有单调递增且凹的效用函数（即风险厌恶）的偏好。SSD 在福利经济学、金融学和收入不平等研究中是核心概念。当前子方向的成熟度较高：已有大量检验 FSD 和 SSD 的渐近方法，但多数方法要么支撑假设过强（如有界支撑），要么在特定偏离原假设的模式下检验力低。本文尝试通过一种新的可视化工具——Lorenz P-P 图——来构造一类新的检验统计量，以期克服上述局限。

发展脉络(history)¶

奠基工作 (1980s-1990s)： - McFadden (1989) 和 Klecan et al. (1991) 等人：提出了基于累积分布函数 (CDF) 的积分差来检验 SSD 的经典方法。核心思想是检验 \( \int_{-\infty}^{x} (F(t) - G(t)) dt \ge 0, \forall x \in \mathbb{R} \)。这些检验统计量通常是 Kolmogorov-Smirnov (KS) 型泛函，即取过程的上确界。 - 留下的口子：这些检验要求分布的有界支撑（以保证上确界的可计算性），且当两个分布差异集中在分布中部而非尾部时，检验力可能较弱。

主要进展 (2000s-2010s)： - Barrett & Donald (2003) 和 Linton et al. (2005)：发展了基于经验过程理论的 bootstrap 程序，改进了临界值的计算，并将理论推广到更一般的设定。 - 留下的口子：检验力的提升有限，且依然局限于传统的基于 CDF 积分的方法。

当前 Frontier (2015s-至今)： - Müller et al. (2017) 和 Lando & Bertoli-Barsotti (2020)：提出了“变换随机占优 (transformed SD)”的框架，将 SD 的概念推广到一族连续的随机序，包括分数阶。这为刻画不同风险偏好提供了更精细的工具。 - Lando et al. (2021)：研究了“变换序 (transform orders)”，并将其与统计泛函的随机单调性联系起来，为构造检验提供了新的理论视角。 - Zhuang et al. (2023) 和 Andreoli (2018)：提出了基于 Lorenz 曲线（即非缩放 Lorenz 曲线 \(L(t) = \int_{0}^{t} F^{-1}(u) du\)）的检验。这是本文的直接先驱。但本文作者指出，这些方法依赖于“平移不变性”的性质，导致检验结果可能因数据的平移而改变。 - Sun & Beare (2019)：改进了基于 Lorenz 占优的 bootstrap 检验，通过估计接触集 (contact set) 来提升边界点上的检验力。这是本文在方法论上的一个关键参照点。 - Huang et al. (2020)：提出了“分数阶随机占优”的数学基础，统一了整数阶和分数阶 SD。这是本文扩展分数的核心理论支撑。

本文的位置：本文位于“用 Lorenz 曲线改造 SSD 检验”这一条线索的前沿。它提出了一种全新的构造检验统计量的方式——不是比较 Lorenz 曲线本身，而是比较一个分布的 Lorenz 曲线与另一个分布的 Lorenz 曲线的逆的复合（即 Lorenz P-P 图）。这种构造避免了有界支撑的假设（因为 Lorenz 函数自然定义在 [0,1] 上），并声称在特定偏离模式下比传统方法更敏感。同时，它将这套框架扩展到了分数阶 SD 族，以 Huang et al. (2020) 的效用函数为锚点。

子线索聚类¶

基于 CDF 积分的经典检验 (Classic integral-based tests):
- 代表：McFadden (1989), Barrett & Donald (2003), Linton et al. (2005)。
- 做法：直接检验 \( \int (F - G) \) 是否非负。
- 局限：需要分布的有界支撑；检验力在部分偏离模式下乏力。
基于 Lorenz 曲线 / 分位数的方法 (Lorenz / quantile-based methods):
- 代表：Zhuang et al. (2023), Andreoli (2018), Sun & Beare (2019), Beare & Clarke (2022)。
- 做法：使用 Lorenz 曲线或分位数函数来定义占优关系（如 Lorenz 占优），以及相应的检验统计量。
- 优势：分布可定义在无界支撑上（如 \( \mathbb{R}_+ \)）。
- 局限：Zhuang et al. (2023) 的方法存在平移不变性问题。Sun & Beare (2019) 只聚焦于 Lorenz 占优（即总财富相等时的 SSD），而非一般的 SSD。
随机序的理论推广 (Generalizing stochastic orders):
- 代表：Müller et al. (2017), Lando & Bertoli-Barsotti (2020), Huang et al. (2020), Lando et al. (2021)。
- 做法：用变换函数或分数参数来连续化 SD 的概念，得到更一般的随机序。
- 意义：为本文的“分数阶”扩展提供了理论基础和实用锚点。

这个方向在追问的核心问题¶

是否有一个统一的、且在实际应用中具有竞争力的非参数检验框架？ 现在的方法在理论证明（渐近分布）和计算（bootstrap）上各有长短，但缺乏一个在各种偏离模式下都表现稳健的“黄金标准”。
如何将检验扩展到分数阶 Stoachstic Dominance？ 传统的 FSD (一阶) 和 SSD (二阶) 之间的连续谱是一个活跃的领域。如何为这些分数阶构造真实有效、而非仅仅是数学定义的检验？
检验的锚点（即原假设的边界）是什么？ 如同 Sun & Beare (2019) 所示，在边界上（\(L_F = L_G\)）和边界内部（\(L_F < L_G\)）进行检验，其渐近表现和 bootstrap 程序需要不同对待。如何自适应地处理这种边界状况？
如何在有界支撑假设不成立时，仍能构造具有 Power 的检验？ 这是本文试图解决的核心困难，通过将问题从无界支撑的 CDF 空间转换到有界区间 [0,1] 上的 Lorenz 曲线空间。

作者的 framing (必须明确标注成"这是作者的说法")¶

作者的说辞：作者将领域缺口 frame 为两点：(i) 传统基于 CDF 积分的方法“require bounded support”，限制了应用场景；(ii) 基于 Lorenz 曲线的方法（如 Zhuang et al. (2023)）“may depend on the shift”，即由于平移不变性不足而不可靠。作者的贡献是提出一个“can be a valid alternative”的方法，它既不要求有界支撑（因为Lorenz曲线定义在[0,1]上），且是平移不变的。
被弱化或回避的竞争路线：Sun & Beare (2019) 已经解决了 Lorenz 占优检验的边界问题和 Power 问题，而作者在引言中只用一句话简述其“suffer from the limitation”是为“conservative”。但 Sun & Beare (2019) 的改进恰恰是针对这个“conservative”的问题。作者将本文的方法定位为针对一般 SSD（而非严格 Lorenz 占优）的替代方案，这可能回避了 Sun & Beare (2019) 框架中非常强大的部分。
【值得研究者去查的问题】：作者在引言中未提及针对 一阶随机占优 (FSD) 的、同样基于 Lorenz 曲线或类似图形工具的非参数检验方法（如基于 Ordinal Dominance Curve 的 Tang et al. (2017)，这篇论文在参考文献里，但作者未在文中有实质性引用）。这暗示作者可能将本文的方法限制在二阶或分数阶，但其未解释为何不尝试将 Lorenz P-P 图推广到一阶。研究者可以阅读 Tang et al. (2017)，看看那里使用P-P图的逻辑与本文有何不同，以及本文的工具是否可以反哺 FSD 检验。

张力¶

未见明显对立引用。文献主要是在补充（如Huang等人提供了理论工具，Sun & Beare提供了边界改进）而非反驳前人的结果。主要的张力体现在方法选择上（用CDF积分 vs. 用 Lorenz 曲线），而非结论的矛盾上。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \(F, G\): 两个未知的累积分布函数 (CDF)，定义在非负实数 \(\mathbb{R}_+\) 上。
- \(X \sim F, Y \sim G\)：两个分布的随机变量。
- \(F^{-1}(t) = \inf\{x: F(x) \ge t\}\)：分布 F 的广义逆（分位数函数）。类似定义 \(G^{-1}\)。
- \(L_F(t) = \int_0^t F^{-1}(u) du\)：分布 F 的非缩放 Lorenz 曲线 (unscaled Lorenz curve)。含义是：\(\{0,1\}\) 比例以下的人口累积所拥有的总财富（如果 \(F\) 是收入分布的话）。类似定义 \(L_G(t)\)。
- \(L_F^{-1}(s) = \inf\{t: L_F(t) \ge s\}\)：非缩放 Lorenz 曲线的逆函数。
- 文章核心对象: Lorenz P–P 图，定义为函数 \(P_{F,G}(t) = L_F^{-1}(L_G(t))\)。
- 检验目标 (estimand)：二阶随机占优 (SSD)。\(F\) SSD \(G\)（记作 \(F \succeq_2 G\)）当且仅当 \(\int_{-\infty}^{x} (F(t) - G(t)) dt \ge 0, \forall x \in \mathbb{R}\)。等价地，对于本文的框架，\(F \succeq_2 G\) 当且仅当 \(L_F^{-1}(L_G(t)) \ge t, \forall t \in [0,1]\) 即 \(P_{F,G}(t) \ge t\)。
模型与假设：
- 模型：完全非参数。\(F\) 和 \(G\) 是任意两个连续的分布。
- 假设1 (Assumption 1)：\(F\) 和 \(G\) 的支撑集是 \(\mathbb{R}_+\) 或 \(\mathbb{R}_+\) 的一个区间（允许右无界）。分布函数是连续且严格递增的在其支撑上。同时，它们的期望存在且有限 ( \(\mathbb{E}[X], \mathbb{E}[Y] < \infty\) )。
- 假设2 (Assumption 2)：两个样本是独立的，分别来自 \(F\) 和 \(G\)。
可观测数据：
- 研究者能观测到：两个独立随机样本。
  - 样本1: \(\{X_1, \dots, X_{n_F}\}\)，从 \(F\) 中抽取。
  - 样本2: \(\{Y_1, \dots, Y_{n_G}\}\)，从 \(G\) 中抽取。
- 想要但观测不到：真实的 CDFs \(F, G\)。只能通过它们的经验版本 \(\hat{F}_{n_F}, \hat{G}_{n_G}\) 来近似。

第二步：讲最小内核¶

最简特例：连续分布 + 样本大小相等 + 无界支撑

让我们剥去所有一般性的壳，只保留最直观的设定，来演示本文的核心想法。

设定： - \(F\) 和 \(G\) 是定义在 \(\mathbb{R}_+\) 上的连续且严格递增的分布。 - 我们有两个大小相等的独立样本：\(n_F = n_G = N\)。 - 我们的原假设 \(H_0: F \succeq_2 G\)，即 \(F\) 在二阶意义上支配 \(G\)。这等价于其Lorenz P-P图不低于恒等线：\(P_{F,G}(t) \ge t, \forall t \in [0,1]\)。

核心想法：传统方法直接在无界的 CDF 空间上检验不等式。本文的想法是：将 SSD 检验等价地转化为在 \([0,1]\) 区间上检验另一个曲线是否恒高于恒等线。这个曲线就是 Lorenz P-P 图：\(P_{F,G}(t) = L_F^{-1}(L_G(t))\)。 - 直观上，\(L_G(t)\) 是 \(G\) 分布下底层 \(t\) 比例人口的累积财富。 - 然后 \(L_F^{-1}\) 问：在 \(F\) 分布下，要达到同样的累积财富，需要多少比例的人口？ - 所以，\(P_{F,G}(t)\) 计算的是：为了使总财富与 \(G\) 分布下底层 \(t\) 人口的总财富相等，在 \(F\) 分布下需要的人口比例。 - 如果 \(F\) SSD \(G\)，那么达到同样的财富水平，\(F\) 分布需要的人口比例更高（因为 \(F\) 的穷人更穷/富人更富，因此要累积同样多的总财富，需要更多的人口）。所以 \(P_{F,G}(t) \ge t\)。

我们在这个最简例子下要做什么：我们要构造一个检验统计量，来判断经验版本的 \( \hat{P}_{F,G}(t) \)（基于样本估计的 Lorenz P-P 图）是否显著地低于恒等线 \(t\)。

具体的检验统计量（以面积型为例）：一个典型的检验统计量可以取所有 \(t\) 上当 \( \hat{P}_{F,G}(t) < t\) 时的累积差异的绝对值：

\[S_{F,G} = \int_0^1 \max\{0, t - \hat{P}_{F,G}(t)\} \, dt\]

或者取 KS 型的最大差异：

\[T_{F,G} = \sup_{t \in [0,1]} [t - \hat{P}_{F,G}(t)]_+\]

为什么这是最小内核： - 它在一个有界区间 \([0,1]\) 上工作，避免了有界支撑假设。 - 它不再需要计算 \(\int (F-G) dt\) 那种复杂的积分。 - 其漂移（偏离原假设）可以被解释为“为了实现与 \(G\) 相同的累积财富，\(F\) 需要的人口比例的不足”。这个统计解释非常清晰。

拒绝原假设：如果 \(S_{F,G}\) 或 \(T_{F,G}\) 太大，超过了一个由 bootstrap 近似得到的临界值，我们就拒绝 \(H_0\)。bootstrap 程序的具体细节，在第三部分阐述。

总结：整个论文的数学骨架就是：将 SSD 检验从 CDF 空间的优化问题，转化为 Lorenz P-P 图在 [0,1] 区间上的统计泛函问题。这个转化利用了 \(L_F^{-1} \circ L_G\) 的非线性映射，展示了将复杂非参数假设检验问题，通过巧妙构造的积分变换，简化成更易于处理的数学形式。多数后续的一般性结果（支撑理论、分数阶推广）都是在这个思想基础上的“加壳”。

三、这篇论文做了什么¶

三句话¶

研究问题：提出一类新的非参数检验，用于原假设 \(H_0: F \succeq_2 G\)（二阶随机占优）。
核心方法：定义 Lorenz P-P 图 \(P_{F,G}(t) = L_F^{-1}(L_G(t))\)，检验统计量取 \(P_{F,G}(t)\) 与恒等函数 \(t\) 的差异的泛函（如 KS 型或积分型）。
主要结论：在原假设下确定了这些统计量的上界（等于0），推导了其极限分布（需 bootstrap 近似），证明了渐近有效性，且该方法可自然扩展到分数阶随机占优族。

关键设定与假设¶

核心记号（在第二节基础上补充）：
- \(\hat{P}_{F,G}(t) = \hat{L}_F^{-1}(\hat{L}_G(t))\)：经验 Lorenz P-P 图，其中 \(\hat{L}_F, \hat{L}_G\) 是基于样本的经验非缩放 Lorenz 曲线。
- \(\gamma\)：用于定义泛函的权重参数，用于上例中的积分型检验，或用于尺度化。
假设（完整列出并说明含义）：
- Assumption 1 (支撑与正则性)：\(F\) 和 \(G\) 是连续的、严格递增的（在支撑内），支撑为 \(\mathbb{R}_+\) 的一个无界子集（如 \([a, \infty)\) 或 \(\mathbb{R}_+\) 本身）。含义：保证 Lorenz 曲线及其逆存在且连续，允许分布有长尾（如收入分布）。与已有文献比：相比经典 CDF 积分方法假设有界支撑，这是极大的放宽。
- Assumption 2 (独立性)：两个样本独立。最标准的假设。
- Assumption 3 (矩条件)：\(\mathbb{E}[X], \mathbb{E}[Y] < \infty\)，且对分数阶扩展，存在更高阶的矩。含义：保证 Lorenz 曲线是良好定义的（因为其是积分）。几乎没有引入新的限制。
- Assumption 4 (连续性均值)：\(F\) 和 \(G\) 的期望（即总财富）是连续的。这是一个纯技术性假设，用于弱收敛论证中。
主要定理陈述与直觉：
- Theorem 1 (原假设下的上界)：如果 \(H_0: F \succeq_2 G\) 为真，那么 \(P_{F,G}(t) \ge t, \forall t \in [0,1]\)，因此所有此类检验统计量（如 \(T = \sup_{t} [t - P_{F,G}(t)]_+\)）都等于0。直觉：这在第二节最小内核中已经讲透。这是构造所有检验的基础：在真原假设下，偏差为0。
- Theorem 2 (经验过程的弱收敛)：假设 Assumptions 1-4 成立，那么过程 \(\sqrt{n} (\hat{P}_{F,G}(t) - P_{F,G}(t))\) 在 \(L^1([0,1])\) 空间中（或在赋予 sup-norm 的 \(C[0,1]\) 中，取决于泛函）弱收敛到一个高斯过程。直觉：这是本论文的核心技术结果。它证明了，经过适当的中心化和缩放，经验 Lorenz P-P 图可以很好地逼近一个已知的极限分布。这使得我们可以用 bootstrap 来逼近这个极限分布，从而进行假设检验。解决的技术难点：\(L_F^{-1}(\cdot)\) 不是一个平滑泛函（它是不可微的），这使得经典的 Delta 方法不直接适用。作者使用了Hadamard 微分理论 (van der Vaart 1998, Lemma A.18)，证明了从 CDF 到 Lorenz 曲线逆的映射在 \(L^1\) 范数下是 Hadamard 可微的（参考了 Weitkamp et al. (2024) 的 Lemma A.18）。这种微分性质允许作者应用泛函 Delta 方法，将这个非线性问题线性化。
- Theorem 3 (检验的有效性)：在 \(H_0\) 和上述假设下，由 bootstrap 得到的临界值构造的检验，其犯第一类错误的概率（size）渐近地趋于名义水平 \(\alpha\)。在局部备择假设下（即 \(F\) 以速度 \(O(n^{-1/2})\) 偏离 \(G\) 但又不满足 \(H_0\)），检验的效力 (power) 非平凡。直觉：这是检验方法有效性的标准结论。由于 Theorem 2 给出的弱收敛，bootstrap 能够准确近似极限分布，从而使得检验的 size 被控制。
- Theorem 4 (分数阶扩展)：将上述所有结果推广到分数阶随机占优（由 \(Huang et al. (2020)\) 的效用函数族定义）。直觉：这展示了方法论的可扩展性。通过一个简单的参数变换（映射到一个积分指数），Lorenz P-P 图的思想魔法般地适配到了分数阶。一阶随机占优是这个家族的一个极限情况。对于分数阶，Lorenz P-P 图需要做相应的“分数阶”修改（例如，将原 CDF 进行“积分”到非整数阶）。

证明路线与技术技巧（理论型）¶

整体路线：
1. 定义与转换：首先建立 \(F \succeq_2 G\) 与 \(P_{F,G}(t) \ge t\) 的等价关系。这是第一步。
2. 线性化：核心难点是处理经验版本的 \( \hat{P}_{F,G} \)（它涉及经验 CDF 的逆）。作者通过引入 Hadamard 微分，将需要弱收敛的映射\(\phi(L_F, L_G) = L_F^{-1} \circ L_G\) 线性化。这让他们可以用经验过程理论来研究 \( \sqrt{n}(\hat{P} - P) \)。
3. 弱收敛：基于经验 CDF 的 Donsker 定理和 Hadamard Delta 方法，证明 \( \sqrt{n}(\hat{P} - P) \) 弱收敛到一个零均值的高斯过程。
4. Bootstrap 有效性：在多参数设定下，证明 bootstrap 版本 \( \sqrt{n}(\hat{P}^* - \hat{P}) \)（基于经验分布的重抽样）也弱收敛到同一个高斯过程。这确保了 bootstrap 临界值的有效性。
5. 检验构造：给定上述弱收敛，对于一个连续泛函 \( \Psi \)（如积分或 sup），在原假设下，\( \Psi(\hat{P}) = 0 \)（或有一个已知的上界）。在备择假设下，\( \Psi(\hat{P}) > 0 \)。利用 bootstrap 得到 \(\Psi\) 在 \(H_0\) 下的近似分位数，即可构造检验。
关键跳跃点：
- 关键跳跃点：Hadamard 可微性的建立与适用范围。
  - 难点：映射 \( \phi(F) = F^{-1} \)（即分位数函数）仅在 \(F\) 是连续、严格递增，且取适当的函数空间时才是 Hadamard 可微的。更复杂的是，这里的映射是 \(\phi(L_F, L_G) = L_F^{-1} \circ L_G\)，这涉及一个逆和一个复合。逆运算在 \(C[0,1]\) 中不一定是可微的。
  - 作者的办法：作者在 Weitkamp et al. (2024) 工作的基础上，结合 Kaji (2018) 的结果，证明了在 \(L^1\) 空间中，该映射是 Hadamard 可微的。\(L^1\) 范数比 sup-norm 更弱（更“平滑”），使得更多函数（在此处是经验 Lorenz 逆）的行为可以被控制。这是一个经典的“用更弱的拓扑换取更强的正则性”的技巧。
- 另一个跳跃：分数阶扩展的证明。
  - 难点：分数阶序的定义本身很技术性（涉及分数阶导数和积分）。
  - 作者的办法：关键是证明分数阶随机占优可以转化为一个标准的一阶、二阶序列经过一个简单的变形。具体来说，他们利用了一个引理：\(F\) 在分数阶 \(\alpha\) 下支配 \(G\)，等价于对 \(F\) 和 \(G\) 的某一积分变换（类似分数阶积分）后的新分布，一阶/二阶占优成立。这就把整个分数阶问题“拉回”到了已解决的整数阶框架。
技术技巧点名：
- Hadamard 微分与泛函 Delta 方法：用来处理非线性复合映射的弱收敛。
- \(L^1\) 空间中的弱收敛：使用 \(L^1\) 范数而非 \(C[0,1]\) 中的 sup-norm，以克服分位数函数逆的不可微性。
- Bootstrap / 重抽样：用于逼近检验统计量的极限分布。
- 经验过程理论：用于证明经验 CDF 和 Lorenz 曲线的 Donsker 性质。
- 分数阶微积分：用于连接分数阶随机占优和经典 SD 的积分变换。

真实例子与应用¶

确实有真实数据例子。
使用数据：巴尔的摩地区高收入家庭的数据，取自美国人口普查局的“美国社区调查 (American Community Survey)”。
怎么用上去：作者将高收入家庭按少数民族占比分为两组（高少数民族比例 vs. 低少数民族比例），然后检验高少数民族比例组的收入分布是否在二阶意义上支配（优于）低少数民族比例组的收入分布。他们分别应用了本文提出的基于 Lorenz P-P 图的检验、传统基于 CDF 积分的检验（如 Barrett & Donald 2003），以及基于 Lorenz 曲线的检验（如 Zhuang et al. 2023）。
得到什么结果：作者报告了不同检验方法得到的结果。基于 Lorenz P-P 图的检验通常无法拒绝原假设（即认为高少数民族比例组收入分布不劣于对照组）。而传统方法在某些规格下显著拒绝了该假设。作者将这一差异归因于传统方法对有限支撑（此处是收入数据，有最小值0，但无上界）的敏感性。Lorenz P-P 图方法在无界支撑下依然有效，因此结论更稳健。
这个例子想说明什么：想说明在应用时，传统方法可能因为“有界支撑假设”的隐含限制而做出错误的推断（拒绝真正正确的原假设），而本文的方法因为设计上不依赖该假设，所以结论更可靠。验证理论和保护实证结论的稳健性。

结论是否比证明窄¶

是的，有。 论文在引言和结论中声称其方法“可以克服传统方法的局限（有界支撑，低检验力）”，并在结论中说“对于一类广泛的偏离模式，我们的检验具有竞争力”。
然而，证明的核心 Theorem 2 和 Theorem 3 的渐近有效性是在“在 \(H_0\) 下”以及“在光滑的备择假设下”成立的。 特别是，定理只保证了在 \(H_0\) 下检验的 size 被控制，以及在局部备择假设下的渐近效力非平凡。但论文并没有证明，针对那些导致传统方法检验力低的具体偏离模式（例如两个分布在中部差异显著，但在尾部相等），Lorenz P-P 图方法具有一致更高的效力（consistently higher power）。模拟实验展示了相对优势，但缺乏系统的理论证明。这个 gap 就在“universal improvement”的泛泛声称与仅限于局部备择和弱边界条件的理论证明之间。

四、开放问题（点到为止）¶

检验对接触集 (contact set) 的自适应能力：Sun & Beare (2019) 的工作表明，在边界上（即 \(P_{F,G}(t) = t\) 对一些 \(t\) 成立）进行检验，bootstrap 程序需要调整以利用这一信息。本文的方法虽然避免了有界支撑问题，但在接触集的处理上是否比 Sun & Beare (2019) 更优？或者能否融入一个类似的自适应步骤？（扎根于原文对 Sun & Beare (2019) 的引用和评价，那个评价是简单的“suffer from the limitation of being conservative”，并未深入比较。）
理论上的最优性：本文没有再给出检验的 minimax 速率或效率界。能否从 minimax 的角度证明，在非参数局部备择假设下，本文的检验是否达到最优的判别率？这类问题的信息论下界（如用 Hellinger 距离或 Kullback-Leibler 散度刻画）是否已知？（扎根于该文没有 minimax 分析的事实。这通常是一个开放性信号。）
分数阶扩展的“有用性”：论文将方法推广到分数阶，并指出 H_uang et al. (2020) 的效用函数族可作为锚点。但是，对于实践者来说，分数阶参数的选择仍然是一个实际问题。如何从数据中估计这个参数，或者进行规范敏感性分析？这个分数阶方法的非参数检验是否比传统的序贯检验（如先检验 FSD，然后检验 SSD）有实质性的好处？（扎根于论文末尾的“future work”一节的概括性讨论。）
对依赖数据的扩展：论文假设样本独立。但在很多实际场景（如金融时间序列）中，样本可能具有序列相关性。能否将本文的 Lorenz P-P 图方法扩展到序列相关的设定，通过块状 bootstrap 或自相关稳健标准误来处理？（扎根于 Assumption 2 的独立性假设，这是论文给出的理论框架的适用边界。）

Maintained by 陈星宇 · Homepage · Source on GitHub