跳转至

A new class of nonparametric tests for second‐order stochastic dominance based on the Lorenz P–P plot

作者: Tommaso Lando, Sirio Legramanti
来源: Scandinavian Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么

本文所处的子方向是随机占优 (Stochastic Dominance, SD) 的非参数检验。其根本问题在于:给定两个独立样本,来自未知的累积分布函数 (CDF) \(F\)\(G\)(通常定义在非负支撑上),我们能否判断一个分布(例如收入分布)在给定的风险偏好序下是否“优于”另一个?具体地,一阶随机占优 (FSD) 对应所有单调递增效用函数的偏好,而二阶随机占优 (SSD) 对应所有单调递增且凹的效用函数(即风险厌恶)的偏好。SSD 在福利经济学、金融学和收入不平等研究中是核心概念。当前子方向的成熟度较高:已有大量检验 FSD 和 SSD 的渐近方法,但多数方法要么支撑假设过强(如有界支撑),要么在特定偏离原假设的模式下检验力低。本文尝试通过一种新的可视化工具——Lorenz P-P 图——来构造一类新的检验统计量,以期克服上述局限。

发展脉络(history)

奠基工作 (1980s-1990s): - McFadden (1989)Klecan et al. (1991) 等人:提出了基于累积分布函数 (CDF) 的积分差来检验 SSD 的经典方法。核心思想是检验 \( \int_{-\infty}^{x} (F(t) - G(t)) dt \ge 0, \forall x \in \mathbb{R} \)。这些检验统计量通常是 Kolmogorov-Smirnov (KS) 型泛函,即取过程的上确界。 - 留下的口子:这些检验要求分布的有界支撑(以保证上确界的可计算性),且当两个分布差异集中在分布中部而非尾部时,检验力可能较弱。

主要进展 (2000s-2010s): - Barrett & Donald (2003)Linton et al. (2005):发展了基于经验过程理论的 bootstrap 程序,改进了临界值的计算,并将理论推广到更一般的设定。 - 留下的口子:检验力的提升有限,且依然局限于传统的基于 CDF 积分的方法。

当前 Frontier (2015s-至今): - Müller et al. (2017)Lando & Bertoli-Barsotti (2020):提出了“变换随机占优 (transformed SD)”的框架,将 SD 的概念推广到一族连续的随机序,包括分数阶。这为刻画不同风险偏好提供了更精细的工具。 - Lando et al. (2021):研究了“变换序 (transform orders)”,并将其与统计泛函的随机单调性联系起来,为构造检验提供了新的理论视角。 - Zhuang et al. (2023)Andreoli (2018):提出了基于 Lorenz 曲线(即非缩放 Lorenz 曲线 \(L(t) = \int_{0}^{t} F^{-1}(u) du\))的检验。这是本文的直接先驱。但本文作者指出,这些方法依赖于“平移不变性”的性质,导致检验结果可能因数据的平移而改变。 - Sun & Beare (2019):改进了基于 Lorenz 占优的 bootstrap 检验,通过估计接触集 (contact set) 来提升边界点上的检验力。这是本文在方法论上的一个关键参照点。 - Huang et al. (2020):提出了“分数阶随机占优”的数学基础,统一了整数阶和分数阶 SD。这是本文扩展分数的核心理论支撑。

本文的位置: 本文位于“用 Lorenz 曲线改造 SSD 检验”这一条线索的前沿。它提出了一种全新的构造检验统计量的方式——不是比较 Lorenz 曲线本身,而是比较一个分布的 Lorenz 曲线与另一个分布的 Lorenz 曲线的逆的复合(即 Lorenz P-P 图)。这种构造避免了有界支撑的假设(因为 Lorenz 函数自然定义在 [0,1] 上),并声称在特定偏离模式下比传统方法更敏感。同时,它将这套框架扩展到了分数阶 SD 族,以 Huang et al. (2020) 的效用函数为锚点。

子线索聚类

  1. 基于 CDF 积分的经典检验 (Classic integral-based tests):

    • 代表:McFadden (1989), Barrett & Donald (2003), Linton et al. (2005)
    • 做法:直接检验 \( \int (F - G) \) 是否非负。
    • 局限:需要分布的有界支撑;检验力在部分偏离模式下乏力。
  2. 基于 Lorenz 曲线 / 分位数的方法 (Lorenz / quantile-based methods):

    • 代表:Zhuang et al. (2023), Andreoli (2018), Sun & Beare (2019), Beare & Clarke (2022)
    • 做法:使用 Lorenz 曲线或分位数函数来定义占优关系(如 Lorenz 占优),以及相应的检验统计量。
    • 优势:分布可定义在无界支撑上(如 \( \mathbb{R}_+ \))。
    • 局限:Zhuang et al. (2023) 的方法存在平移不变性问题。Sun & Beare (2019) 只聚焦于 Lorenz 占优(即总财富相等时的 SSD),而非一般的 SSD。
  3. 随机序的理论推广 (Generalizing stochastic orders):

    • 代表:Müller et al. (2017), Lando & Bertoli-Barsotti (2020), Huang et al. (2020), Lando et al. (2021)
    • 做法:用变换函数或分数参数来连续化 SD 的概念,得到更一般的随机序。
    • 意义:为本文的“分数阶”扩展提供了理论基础和实用锚点。

这个方向在追问的核心问题

  1. 是否有一个统一的、且在实际应用中具有竞争力的非参数检验框架? 现在的方法在理论证明(渐近分布)和计算(bootstrap)上各有长短,但缺乏一个在各种偏离模式下都表现稳健的“黄金标准”。
  2. 如何将检验扩展到分数阶 Stoachstic Dominance? 传统的 FSD (一阶) 和 SSD (二阶) 之间的连续谱是一个活跃的领域。如何为这些分数阶构造真实有效、而非仅仅是数学定义的检验?
  3. 检验的锚点(即原假设的边界)是什么? 如同 Sun & Beare (2019) 所示,在边界上(\(L_F = L_G\))和边界内部(\(L_F < L_G\))进行检验,其渐近表现和 bootstrap 程序需要不同对待。如何自适应地处理这种边界状况?
  4. 如何在有界支撑假设不成立时,仍能构造具有 Power 的检验? 这是本文试图解决的核心困难,通过将问题从无界支撑的 CDF 空间转换到有界区间 [0,1] 上的 Lorenz 曲线空间。

作者的 framing (必须明确标注成"这是作者的说法")

  • 作者的说辞:作者将领域缺口 frame 为两点:(i) 传统基于 CDF 积分的方法“require bounded support”,限制了应用场景;(ii) 基于 Lorenz 曲线的方法(如 Zhuang et al. (2023))“may depend on the shift”,即由于平移不变性不足而不可靠。作者的贡献是提出一个“can be a valid alternative”的方法,它既不要求有界支撑(因为Lorenz曲线定义在[0,1]上),且是平移不变的
  • 被弱化或回避的竞争路线Sun & Beare (2019) 已经解决了 Lorenz 占优检验的边界问题和 Power 问题,而作者在引言中只用一句话简述其“suffer from the limitation”是为“conservative”。但 Sun & Beare (2019) 的改进恰恰是针对这个“conservative”的问题。作者将本文的方法定位为针对一般 SSD(而非严格 Lorenz 占优)的替代方案,这可能回避了 Sun & Beare (2019) 框架中非常强大的部分。
  • 【值得研究者去查的问题】:作者在引言中未提及针对 一阶随机占优 (FSD) 的、同样基于 Lorenz 曲线或类似图形工具的非参数检验方法(如基于 Ordinal Dominance Curve 的 Tang et al. (2017),这篇论文在参考文献里,但作者未在文中有实质性引用)。这暗示作者可能将本文的方法限制在二阶或分数阶,但其未解释为何不尝试将 Lorenz P-P 图推广到一阶。研究者可以阅读 Tang et al. (2017),看看那里使用P-P图的逻辑与本文有何不同,以及本文的工具是否可以反哺 FSD 检验。

张力

未见明显对立引用。文献主要是在补充(如Huang等人提供了理论工具,Sun & Beare提供了边界改进)而非反驳前人的结果。主要的张力体现在方法选择上(用CDF积分 vs. 用 Lorenz 曲线),而非结论的矛盾上。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号
    • \(F, G\): 两个未知的累积分布函数 (CDF),定义在非负实数 \(\mathbb{R}_+\) 上。
    • \(X \sim F, Y \sim G\):两个分布的随机变量。
    • \(F^{-1}(t) = \inf\{x: F(x) \ge t\}\):分布 F 的广义逆(分位数函数)。类似定义 \(G^{-1}\)
    • \(L_F(t) = \int_0^t F^{-1}(u) du\):分布 F 的非缩放 Lorenz 曲线 (unscaled Lorenz curve)。含义是:\(\{0,1\}\) 比例以下的人口累积所拥有的总财富(如果 \(F\) 是收入分布的话)。类似定义 \(L_G(t)\)
    • \(L_F^{-1}(s) = \inf\{t: L_F(t) \ge s\}\):非缩放 Lorenz 曲线的逆函数。
    • 文章核心对象: Lorenz P–P 图,定义为函数 \(P_{F,G}(t) = L_F^{-1}(L_G(t))\)
    • 检验目标 (estimand):二阶随机占优 (SSD)。\(F\) SSD \(G\)(记作 \(F \succeq_2 G\))当且仅当 \(\int_{-\infty}^{x} (F(t) - G(t)) dt \ge 0, \forall x \in \mathbb{R}\)。等价地,对于本文的框架,\(F \succeq_2 G\) 当且仅当 \(L_F^{-1}(L_G(t)) \ge t, \forall t \in [0,1]\)\(P_{F,G}(t) \ge t\)
  • 模型与假设
    • 模型:完全非参数。\(F\)\(G\) 是任意两个连续的分布。
    • 假设1 (Assumption 1)\(F\)\(G\) 的支撑集是 \(\mathbb{R}_+\)\(\mathbb{R}_+\) 的一个区间(允许右无界)。分布函数是连续且严格递增的在其支撑上。同时,它们的期望存在且有限 ( \(\mathbb{E}[X], \mathbb{E}[Y] < \infty\) )。
    • 假设2 (Assumption 2):两个样本是独立的,分别来自 \(F\)\(G\)
  • 可观测数据
    • 研究者能观测到:两个独立随机样本。
      • 样本1: \(\{X_1, \dots, X_{n_F}\}\),从 \(F\) 中抽取。
      • 样本2: \(\{Y_1, \dots, Y_{n_G}\}\),从 \(G\) 中抽取。
    • 想要但观测不到:真实的 CDFs \(F, G\)。只能通过它们的经验版本 \(\hat{F}_{n_F}, \hat{G}_{n_G}\) 来近似。

第二步:讲最小内核

最简特例:连续分布 + 样本大小相等 + 无界支撑

让我们剥去所有一般性的壳,只保留最直观的设定,来演示本文的核心想法

设定: - \(F\)\(G\) 是定义在 \(\mathbb{R}_+\) 上的连续且严格递增的分布。 - 我们有两个大小相等的独立样本:\(n_F = n_G = N\)。 - 我们的原假设 \(H_0: F \succeq_2 G\),即 \(F\) 在二阶意义上支配 \(G\)。这等价于其Lorenz P-P图不低于恒等线:\(P_{F,G}(t) \ge t, \forall t \in [0,1]\)

核心想法: 传统方法直接在无界的 CDF 空间上检验不等式。 本文的想法是:将 SSD 检验等价地转化为在 \([0,1]\) 区间上检验另一个曲线是否恒高于恒等线。 这个曲线就是 Lorenz P-P 图:\(P_{F,G}(t) = L_F^{-1}(L_G(t))\)。 - 直观上,\(L_G(t)\)\(G\) 分布下底层 \(t\) 比例人口的累积财富。 - 然后 \(L_F^{-1}\) 问:在 \(F\) 分布下,要达到同样的累积财富,需要多少比例的人口? - 所以,\(P_{F,G}(t)\) 计算的是:为了使总财富与 \(G\) 分布下底层 \(t\) 人口的总财富相等,在 \(F\) 分布下需要的人口比例。 - 如果 \(F\) SSD \(G\),那么达到同样的财富水平,\(F\) 分布需要的人口比例更高(因为 \(F\) 的穷人更穷/富人更富,因此要累积同样多的总财富,需要更多的人口)。所以 \(P_{F,G}(t) \ge t\)

我们在这个最简例子下要做什么: 我们要构造一个检验统计量,来判断经验版本的 \( \hat{P}_{F,G}(t) \)(基于样本估计的 Lorenz P-P 图)是否显著地低于恒等线 \(t\)

具体的检验统计量(以面积型为例): 一个典型的检验统计量可以取所有 \(t\) 上当 \( \hat{P}_{F,G}(t) < t\) 时的累积差异的绝对值:

\[S_{F,G} = \int_0^1 \max\{0, t - \hat{P}_{F,G}(t)\} \, dt\]
或者取 KS 型的最大差异:
\[T_{F,G} = \sup_{t \in [0,1]} [t - \hat{P}_{F,G}(t)]_+\]
为什么这是最小内核: - 它在一个有界区间 \([0,1]\) 上工作,避免了有界支撑假设。 - 它不再需要计算 \(\int (F-G) dt\) 那种复杂的积分。 - 其漂移(偏离原假设)可以被解释为“为了实现与 \(G\) 相同的累积财富,\(F\) 需要的人口比例的不足”。这个统计解释非常清晰。

拒绝原假设: 如果 \(S_{F,G}\)\(T_{F,G}\) 太大,超过了一个由 bootstrap 近似得到的临界值,我们就拒绝 \(H_0\)。bootstrap 程序的具体细节,在第三部分阐述。

总结: 整个论文的数学骨架就是:将 SSD 检验从 CDF 空间的优化问题,转化为 Lorenz P-P 图在 [0,1] 区间上的统计泛函问题。这个转化利用了 \(L_F^{-1} \circ L_G\) 的非线性映射,展示了将复杂非参数假设检验问题,通过巧妙构造的积分变换,简化成更易于处理的数学形式。多数后续的一般性结果(支撑理论、分数阶推广)都是在这个思想基础上的“加壳”。

三、这篇论文做了什么

三句话

  • 研究问题:提出一类新的非参数检验,用于原假设 \(H_0: F \succeq_2 G\)(二阶随机占优)。
  • 核心方法:定义 Lorenz P-P 图 \(P_{F,G}(t) = L_F^{-1}(L_G(t))\),检验统计量取 \(P_{F,G}(t)\) 与恒等函数 \(t\) 的差异的泛函(如 KS 型或积分型)。
  • 主要结论:在原假设下确定了这些统计量的上界(等于0),推导了其极限分布(需 bootstrap 近似),证明了渐近有效性,且该方法可自然扩展到分数阶随机占优族。

关键设定与假设

  • 核心记号(在第二节基础上补充):
    • \(\hat{P}_{F,G}(t) = \hat{L}_F^{-1}(\hat{L}_G(t))\):经验 Lorenz P-P 图,其中 \(\hat{L}_F, \hat{L}_G\) 是基于样本的经验非缩放 Lorenz 曲线。
    • \(\gamma\):用于定义泛函的权重参数,用于上例中的积分型检验,或用于尺度化。
  • 假设(完整列出并说明含义):
    • Assumption 1 (支撑与正则性)\(F\)\(G\) 是连续的、严格递增的(在支撑内),支撑为 \(\mathbb{R}_+\) 的一个无界子集(如 \([a, \infty)\)\(\mathbb{R}_+\) 本身)。含义:保证 Lorenz 曲线及其逆存在且连续,允许分布有长尾(如收入分布)。与已有文献比:相比经典 CDF 积分方法假设有界支撑,这是极大的放宽。
    • Assumption 2 (独立性):两个样本独立。最标准的假设。
    • Assumption 3 (矩条件)\(\mathbb{E}[X], \mathbb{E}[Y] < \infty\),且对分数阶扩展,存在更高阶的矩。含义:保证 Lorenz 曲线是良好定义的(因为其是积分)。几乎没有引入新的限制。
    • Assumption 4 (连续性均值)\(F\)\(G\) 的期望(即总财富)是连续的。这是一个纯技术性假设,用于弱收敛论证中。
  • 主要定理陈述与直觉
    • Theorem 1 (原假设下的上界):如果 \(H_0: F \succeq_2 G\) 为真,那么 \(P_{F,G}(t) \ge t, \forall t \in [0,1]\),因此所有此类检验统计量(如 \(T = \sup_{t} [t - P_{F,G}(t)]_+\)都等于0直觉:这在第二节最小内核中已经讲透。这是构造所有检验的基础:在真原假设下,偏差为0。
    • Theorem 2 (经验过程的弱收敛):假设 Assumptions 1-4 成立,那么过程 \(\sqrt{n} (\hat{P}_{F,G}(t) - P_{F,G}(t))\)\(L^1([0,1])\) 空间中(或在赋予 sup-norm 的 \(C[0,1]\) 中,取决于泛函)弱收敛到一个高斯过程。直觉:这是本论文的核心技术结果。它证明了,经过适当的中心化和缩放,经验 Lorenz P-P 图可以很好地逼近一个已知的极限分布。这使得我们可以用 bootstrap 来逼近这个极限分布,从而进行假设检验。解决的技术难点\(L_F^{-1}(\cdot)\) 不是一个平滑泛函(它是不可微的),这使得经典的 Delta 方法不直接适用。作者使用了Hadamard 微分理论 (van der Vaart 1998, Lemma A.18),证明了从 CDF 到 Lorenz 曲线逆的映射在 \(L^1\) 范数下是 Hadamard 可微的(参考了 Weitkamp et al. (2024) 的 Lemma A.18)。这种微分性质允许作者应用泛函 Delta 方法,将这个非线性问题线性化。
    • Theorem 3 (检验的有效性):在 \(H_0\) 和上述假设下,由 bootstrap 得到的临界值构造的检验,其犯第一类错误的概率(size)渐近地趋于名义水平 \(\alpha\)。在局部备择假设下(即 \(F\) 以速度 \(O(n^{-1/2})\) 偏离 \(G\) 但又不满足 \(H_0\)),检验的效力 (power) 非平凡。直觉:这是检验方法有效性的标准结论。由于 Theorem 2 给出的弱收敛,bootstrap 能够准确近似极限分布,从而使得检验的 size 被控制。
    • Theorem 4 (分数阶扩展):将上述所有结果推广到分数阶随机占优(由 \(Huang et al. (2020)\) 的效用函数族定义)。直觉:这展示了方法论的可扩展性。通过一个简单的参数变换(映射到一个积分指数),Lorenz P-P 图的思想魔法般地适配到了分数阶。一阶随机占优是这个家族的一个极限情况。对于分数阶,Lorenz P-P 图需要做相应的“分数阶”修改(例如,将原 CDF 进行“积分”到非整数阶)。

证明路线与技术技巧(理论型)

  • 整体路线
    1. 定义与转换:首先建立 \(F \succeq_2 G\)\(P_{F,G}(t) \ge t\) 的等价关系。这是第一步。
    2. 线性化:核心难点是处理经验版本的 \( \hat{P}_{F,G} \)(它涉及经验 CDF 的逆)。作者通过引入 Hadamard 微分,将需要弱收敛的映射\(\phi(L_F, L_G) = L_F^{-1} \circ L_G\) 线性化。这让他们可以用经验过程理论来研究 \( \sqrt{n}(\hat{P} - P) \)
    3. 弱收敛:基于经验 CDF 的 Donsker 定理和 Hadamard Delta 方法,证明 \( \sqrt{n}(\hat{P} - P) \) 弱收敛到一个零均值的高斯过程。
    4. Bootstrap 有效性:在多参数设定下,证明 bootstrap 版本 \( \sqrt{n}(\hat{P}^* - \hat{P}) \)(基于经验分布的重抽样)也弱收敛到同一个高斯过程。这确保了 bootstrap 临界值的有效性。
    5. 检验构造:给定上述弱收敛,对于一个连续泛函 \( \Psi \)(如积分或 sup),在原假设下,\( \Psi(\hat{P}) = 0 \)(或有一个已知的上界)。在备择假设下,\( \Psi(\hat{P}) > 0 \)。利用 bootstrap 得到 \(\Psi\)\(H_0\) 下的近似分位数,即可构造检验。
  • 关键跳跃点
    • 关键跳跃点:Hadamard 可微性的建立与适用范围。
      • 难点:映射 \( \phi(F) = F^{-1} \)(即分位数函数)仅在 \(F\) 是连续、严格递增,且取适当的函数空间时才是 Hadamard 可微的。更复杂的是,这里的映射是 \(\phi(L_F, L_G) = L_F^{-1} \circ L_G\),这涉及一个逆和一个复合。逆运算在 \(C[0,1]\) 中不一定是可微的。
      • 作者的办法:作者在 Weitkamp et al. (2024) 工作的基础上,结合 Kaji (2018) 的结果,证明了在 \(L^1\) 空间中,该映射是 Hadamard 可微的。\(L^1\) 范数比 sup-norm 更弱(更“平滑”),使得更多函数(在此处是经验 Lorenz 逆)的行为可以被控制。这是一个经典的“用更弱的拓扑换取更强的正则性”的技巧。
    • 另一个跳跃:分数阶扩展的证明。
      • 难点:分数阶序的定义本身很技术性(涉及分数阶导数和积分)。
      • 作者的办法:关键是证明分数阶随机占优可以转化为一个标准的一阶、二阶序列经过一个简单的变形。具体来说,他们利用了一个引理:\(F\) 在分数阶 \(\alpha\) 下支配 \(G\),等价于对 \(F\)\(G\) 的某一积分变换(类似分数阶积分)后的新分布,一阶/二阶占优成立。这就把整个分数阶问题“拉回”到了已解决的整数阶框架。
  • 技术技巧点名
    • Hadamard 微分与泛函 Delta 方法:用来处理非线性复合映射的弱收敛。
    • \(L^1\) 空间中的弱收敛:使用 \(L^1\) 范数而非 \(C[0,1]\) 中的 sup-norm,以克服分位数函数逆的不可微性。
    • Bootstrap / 重抽样:用于逼近检验统计量的极限分布。
    • 经验过程理论:用于证明经验 CDF 和 Lorenz 曲线的 Donsker 性质。
    • 分数阶微积分:用于连接分数阶随机占优和经典 SD 的积分变换。

真实例子与应用

  • 确实有真实数据例子。
  • 使用数据巴尔的摩地区高收入家庭的数据,取自美国人口普查局的“美国社区调查 (American Community Survey)”。
  • 怎么用上去:作者将高收入家庭按少数民族占比分为两组(高少数民族比例 vs. 低少数民族比例),然后检验高少数民族比例组的收入分布是否在二阶意义上支配(优于)低少数民族比例组的收入分布。他们分别应用了本文提出的基于 Lorenz P-P 图的检验、传统基于 CDF 积分的检验(如 Barrett & Donald 2003),以及基于 Lorenz 曲线的检验(如 Zhuang et al. 2023)。
  • 得到什么结果:作者报告了不同检验方法得到的结果。基于 Lorenz P-P 图的检验通常无法拒绝原假设(即认为高少数民族比例组收入分布不劣于对照组)。而传统方法在某些规格下显著拒绝了该假设。作者将这一差异归因于传统方法对有限支撑(此处是收入数据,有最小值0,但无上界)的敏感性。Lorenz P-P 图方法在无界支撑下依然有效,因此结论更稳健。
  • 这个例子想说明什么:想说明在应用时,传统方法可能因为“有界支撑假设”的隐含限制而做出错误的推断(拒绝真正正确的原假设),而本文的方法因为设计上不依赖该假设,所以结论更可靠。验证理论和保护实证结论的稳健性。

结论是否比证明窄

  • 是的,有。 论文在引言和结论中声称其方法“可以克服传统方法的局限(有界支撑,低检验力)”,并在结论中说“对于一类广泛的偏离模式,我们的检验具有竞争力”。
  • 然而,证明的核心 Theorem 2 和 Theorem 3 的渐近有效性是在“在 \(H_0\) 下”以及“在光滑的备择假设下”成立的。 特别是,定理只保证了在 \(H_0\) 下检验的 size 被控制,以及在局部备择假设下的渐近效力非平凡。但论文并没有证明,针对那些导致传统方法检验力低的具体偏离模式(例如两个分布在中部差异显著,但在尾部相等),Lorenz P-P 图方法具有一致更高的效力(consistently higher power)。模拟实验展示了相对优势,但缺乏系统的理论证明。这个 gap 就在“universal improvement”的泛泛声称与仅限于局部备择和弱边界条件的理论证明之间。

四、开放问题(点到为止)

  1. 检验对接触集 (contact set) 的自适应能力Sun & Beare (2019) 的工作表明,在边界上(即 \(P_{F,G}(t) = t\) 对一些 \(t\) 成立)进行检验,bootstrap 程序需要调整以利用这一信息。本文的方法虽然避免了有界支撑问题,但在接触集的处理上是否比 Sun & Beare (2019) 更优?或者能否融入一个类似的自适应步骤?(扎根于原文对 Sun & Beare (2019) 的引用和评价,那个评价是简单的“suffer from the limitation of being conservative”,并未深入比较。)
  2. 理论上的最优性:本文没有再给出检验的 minimax 速率或效率界。能否从 minimax 的角度证明,在非参数局部备择假设下,本文的检验是否达到最优的判别率?这类问题的信息论下界(如用 Hellinger 距离或 Kullback-Leibler 散度刻画)是否已知?(扎根于该文没有 minimax 分析的事实。这通常是一个开放性信号。)
  3. 分数阶扩展的“有用性”:论文将方法推广到分数阶,并指出 H_uang et al. (2020) 的效用函数族可作为锚点。但是,对于实践者来说,分数阶参数的选择仍然是一个实际问题。如何从数据中估计这个参数,或者进行规范敏感性分析?这个分数阶方法的非参数检验是否比传统的序贯检验(如先检验 FSD,然后检验 SSD)有实质性的好处?(扎根于论文末尾的“future work”一节的概括性讨论。)
  4. 对依赖数据的扩展:论文假设样本独立。但在很多实际场景(如金融时间序列)中,样本可能具有序列相关性。能否将本文的 Lorenz P-P 图方法扩展到序列相关的设定,通过块状 bootstrap 或自相关稳健标准误来处理?(扎根于 Assumption 2 的独立性假设,这是论文给出的理论框架的适用边界。)

Maintained by 陈星宇 · Homepage · Source on GitHub

评论