A new class of tests for convex-ordered families based on expected order statistics¶

作者: Tommaso Lando, Mohammed Es-Salih Benjrada
来源: Electronic Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本方向是非参数假设检验中一个特定的子问题：检验一个未知分布 \(F\) 是否属于一个由凸变换序定义的分布族。具体来说，给定一个已知的参考分布 \(G\)，检验变换函数 \(T = G^{-1} \circ F\) 是否为凸函数（或凹函数），从而判断 \(F\) 是否属于像“递增失效率”（IHR）、“递减失效率”（DHR）、“递增赔率率”（IOR）、“递减赔率率”（DOR）等经典或新兴的、与“老化”或“风险”相关的分布族。这个子问题的核心统计挑战在于：检验必须完全非参数——不假设 \(F\) 属于任何参数族——且检验统计量需要对 \(G\) 的选择和外生支撑不敏感。当前成熟度：已有大量针对特定分布族（尤其是 IHR vs 指数分布）的检验，但直到本文才出现一个统一框架，能同时处理多个、甚至是重尾分布下的凸序族检验。

发展脉络（history）¶

奠基工作（1960s-1970s）：Barlow, Marshall & Proschan (1963) 系统研究了单调失效率分布的性质，将失效率单调性（IHR / DHR）与分布的凸性/凹性联系起来，为后续检验奠定了理论基础。Proschan & Pyke (1967) 和 Bickel & Doksum (1969) 则提出了基于正规化空间（normalized spacings）的 IHR 检验，证明了其在固定备择下的渐近正态性，并推导了 Pitman 效率。这些工作建立了检验 IHR 的基本范式：检验分布是否属于某一特定“老化”族。
主要进展（2000s-2010s）：研究人员开始探索更广泛的非参数检验方法。Hall & Van Keilegom (2005) 提出了不依赖指数分布假设的 IHR 检验，通过经验分布函数局部凸性的评估来校准检验，避免了传统方法的过度保守。Groeneboom & Jongbloed (2012) 则基于等张（isotonic）L2 投影构造检验，比较经验分布与其等张估计的偏离，证明检验统计量在严格递增失效率下渐近正态。同时，Carolan (2002)、Gijbels & Heckman (2004)、Mitra & Anis (2008) 等也贡献了各种检验，但都局限于特定分布族（如 IHR 或 NBUE）。
当前 Frontier（2010s-2020s）：两个平行发展推动了这个子领域。其一，Lando et al. (2021, 2022, 2024) 引入了“递增赔率率”（IOR）分布，并建立了其理论性质、估计方法和检验，证明 IOR 族比 IHR 族更灵活（能容纳重尾和浴缸形分布），但缺乏统一的检验框架。其二，Beare (2021) 和 Lando et al. (2023) 研究了凸性检验的“最不利分布”（least favorable distribution）性质，特别是 Beare 证明了对支撑在 [0,1] 上的分布，均匀分布是所有凹分布中最不利的，其极限分布 stochastically 占优势。Arab et al. (2025) 则为变换序下的次序统计量建立了概率不等式，这是本文的直接理论工具。
本文的位置：本文声称填补了“分散检验方法之间的一个缺口”——它不针对某个特定分布族（如 IHR 或 IOR）设计检验，而是提出了一个统一框架，只要一个分布族可以由 \(G^{-1} \circ F\) 的凸性（或凹性）来刻画，就可以用同一个检验。这个框架将 IHR、DHR、IOR、DOR 等族作为特例包含在内。作者引用了 Arab et al. (2025) 的概率不等式作为构建检验统计量的理论基础，并声称这是第一个能同时处理这些族且适用于重尾分布、支撑无限制的检验。

子线索聚类¶

这些被引文献大致落在 3 条子线索上：

传统失效率检验 (IHR/DHR)：
- 做什么：检验 \(F\) 是否具有递增（或递减）失效率，通常以指数分布作为参考。
- 代表工作：Barlow et al. (1963) [奠基理论]，Proschan & Pyke (1967) [首个检验]，Bickel & Doksum (1969) [渐近正态性与 Pitman 效率]，Hall & Van Keilegom (2005) [非指数假设下的改进]，Groeneboom & Jongbloed (2012) [基于等张 L2 投影的检验]。
- 弱点：仅适用于由指数分布作为参考 \(G\) 的那个特例。
赔率率检验 (IOR/DOR) 与变换序：
- 做什么：检验 \(F\) 是否具有递增（或递减）赔率率，或更一般地，研究由变换序定义的分布族及其推断。
- 代表工作：Lando et al. (2022, 2024) [IOR 理论、估计与检验]，Lando et al. (2021) [变换序的一般理论]，Arab et al. (2025) [变换序下次序统计量的概率不等式]。
- 弱点：针对 IOR 的检验是分散的，缺乏一个能同时处理 IHR 和 IOR 等族的统一检验。
支撑有界分布的凸性检验：
- 做什么：检验支撑在 [0,1] 上的分布函数的凹性（这等价于密度递增等性质）。
- 代表工作：Beare (2021) [证明了均匀分布是“最不利的”]。
- 弱点：检验局限于支撑有界的情况，且与 IHR/IOR 等族的关系不直接。

这个方向在追问的核心问题¶

统一性：能否构造一个单一的检验程序，使其对由不同参考分布 \(G\) 定义的各种凸序族（IHR、IOR、DHR 等）都有效，而无需针对每个族设计不同的统计量？
重尾稳健性：这些分布族（如 IOR、DOR）常包含重尾分布（如 Pareto、Fréchet），其均值可能不存在。检验方法是否依然能保持一致性（consistency）？
功效的有序性：检验的功效是否与该子方向的“序”相一致？即，对于一个给定的凸序（如凸变换序），检验在检测“更凸”的偏离时是否应有更高的功效（单调功效 power）？
无支撑限制：能否设计出不要求分布支撑有限或具有特定区间（如 [0,1]）的检验？

⚠️ 作者的 framing¶

作者把缺口 frame 成“缺乏一个统一、一致且具有单调功效的检验框架，该框架能同时覆盖由不同参考分布 \(G\) 定义的凸序族，且适用于重尾分布和任意支撑。” 这使得本文成为一个“显然的下一步”。

竞争路线被他淡化或回避了： - 作者声称其方法“不依赖 \(G\) 的具体选择”，但从定理和模拟来看，检验由 \(G\) 高度定义——参考 \(G\) 是指数分布时检验 IHR，是 log-logistic 时检验 IOR。这个框架并未减少用户在指定 \(G\) 时的先验知识要求，只是将检验从“针对特定族”转换成了“针对特定 \(G\)”。 - Proschan & Pyke (1967) 和 Bickel & Doksum (1969) 的基于空间的方法被提及，但作者没有深入比较其方法与这些“经典”方法的有限样本功率，只声称其方法“满足相同的理论性质”。 - Hall & Van Keilegom (2005) 的巧妙想法——避免假设指数分布——也被提及，但作者没有讨论其方法是否能被统一框架包含，或与之相比有何具体优势。

什么明显该被引 / 该存在、却没出现在 intro 里？ - 没有引用任何关于“凸性检验”或“形函数检验”的一般非参数文献，例如 Dümbgen (1998) 或 Dümbgen, Spokoiny & Wilke (2009) 等关于“凸性/凹性检验”的理论工作。这些文献通常关注随机误差下的形状约束检验，与本文的框架可能有重叠或对比。 - 没有讨论检验的局部渐近功效 (local asymptotic power, LAP)，或者与渐近相对效率 (ARE) 的比较。这是一个重要的缺口，因为一个“一致”但“弱”的检验可能没有实用价值。被引用最多的“经典”检验（如 Bickel & Doksum, 1969）都讨论了 Pitman 效率。 - 没有引用任何关于非参数似然比检验 (empirical likelihood) 的工作，这可能也是一种构造凸序检验的有效替代方法。

张力¶

未见明显对立引用。被引工作之间是互补而非矛盾的：它们逐步从特定族（IHR）扩展到更一般的族（IOR），再到统一框架（本文）。Beare (2021) 的“最不利性”结果实际上支撑了本文的“一致性”论证。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号与参数/定义域：
- \(X\)：感兴趣的随机变量，具有未知的累积分布函数 \(F\)。
- \(G\)：已知的参考累积分布函数。\(G\) 的选择完全由研究者根据假设的分布族决定（例如 IHR 对应 \(G=\) 指数分布）。
- \(T = G^{-1} \circ F\)：变换函数，是本文的核心量。如果 \(T\) 是凸函数，则称 \(F\) 在“凸变换序”下小于 \(G\)，记作 \(F \preceq_c G\)。
- \(\mathbb{X}_n = (X_1, ..., X_n)\)：来自 \(F\) 的独立同分布样本，\(n\) 为样本量。
- \(X_{(1)} \le ... \le X_{(n)}\)：样本的次序统计量。
- \(\mathbb{E}[X_{(i)}]\)：第 \(i\) 个次序统计量的期望值。
- \(\theta_k = \mathbb{P}(X \le \mathbb{E}[X_{(k)}])\)：本文构造检验统计量所基于的概率，其中 \(k\) 是某个固定的秩（例如 \(k = \lfloor n/2 \rfloor\) 为中位数次序的秩）。
- \(\hat{\theta}_k\)：对 \(\theta_k\) 的估计，基于样本。
模型与假设：
- 数据生成机制：\(X_i \sim F, \ i.i.d.\)，其中 \(F\) 是连续的、累积分布函数。（本文也允许离散和混合情形，但核心理论基于连续假设）。
- 已知量：\(G\) 是完全已知的分布。例如，检验 IHR 时，\(G(x) = 1 - e^{-x}\)。
- 待检验假设：
  - \(H_0: F \preceq_c G\) 或 \(F \preceq_{cv} G\)（即 \(T\) 凸或 \(T\) 凹）。
  - \(H_1:\) 不满足 \(H_0\) 的凸性/凹性条件。
- 核心假设（为识别所需）：\(T\) 的凸性/凹性。这个假设通过定义目标族而直接给出，不是额外的统计识别假设。
可观测数据与不可观测对象：
- 可观测：\(X_1, ..., X_n\)，一个大小为 \(n\) 的样本。
- 可观测（通过估计）：次序统计量 \(X_{(i)}\) 及其排序。可以计算 \(\hat{\theta}_k = \frac{1}{n} \sum_{j=1}^n \mathbf{1}\{X_j \le \hat{\mathbb{E}}[X_{(k)}]\}\)，其中 \(\hat{\mathbb{E}}[X_{(k)}]\) 是 \(\mathbb{E}[X_{(k)}]\) 的估计量。
- 不可观测（是目标）：变换函数 \(T = G^{-1} \circ F\) 的具体形状是未知的，我们要检验的是 \(T\) 的凸性/凹性，而不是它的具体值。\(\mathbb{E}[X_{(k)}]\) 本身也是不可直接观测的，需要从样本中估计，这是检验设计的关键一步。

第二步：讲最小内核¶

最简特例： 取 \(G\) 为标准指数分布 (\(G(x) = 1 - e^{-x}\), \(x \ge 0\))。则检验 \(G^{-1} \circ F\) 的凸性，等价于检验 \(F\) 是否具有递增失效率 (IHR)。这是本文统一框架的特例，也是最经典的设定。

在这个特例下：

要检验的命题：
- \(H_0: F\) 有递增失效率（即 \(T\) 是凸的）。
- \(H_1: F\) 没有递增失效率（\(T\) 不是凸的）。
核心思路：
- 从 Arab et al. (2025) 的一个结果出发：如果 \(F \preceq_c G\) （即 \(T\) 凸），那么对于某个特定秩 \(k\)，有 \(\mathbb{P}(X \le \mathbb{E}[X_{(k)}]) \le \frac{k}{n+1}\)。
- 反过来，如果 \(F\) 在“凸的意义上”偏离 \(G\) 足够远（例如 \(T\) 是凹的），则 \(\mathbb{P}(X \le \mathbb{E}[X_{(k)}]) \ge \frac{k}{n+1}\) 或相反的不等式成立。
- 检验想法：估计 \(\theta_k = \mathbb{P}(X \le \mathbb{E}[X_{(k)}])\)，然后检验这个概率是否显著偏离 \(\frac{k}{n+1}\)。如果估计值远小于临界值，则拒绝 \(H_0\)（支持 \(T\) 凸）；如果远大于，则拒绝 \(H_0\)（支持 \(T\) 凹）。
怎么具体操作：
- 从样本 \(\mathbb{X}_n\) 中，用L-estimators（线性组合的次序统计量）估计 \(\mathbb{E}[X_{(k)}]\)。一个最简单的情况是，用样本分位数（例如样本中位数）来估计 \(\mathbb{E}[X_{(k)}]\)。
- 然后计算 \(\hat{\theta}_k = \frac{1}{n} \sum_{j=1}^n \mathbf{1}\{X_j \le \hat{\mathbb{E}}[X_{(k)}]\}\)。
- 检验统计量就是 \(\hat{\theta}_k - \frac{k}{n+1}\)。通过计算这个差值的分布（在 \(H_0\) 下），可以得到 p 值。
为什么这能工作（直觉）：
- 如果 \(G\)（指数分布）是“老化”的（失效率递增），那么 \(F\)（有递增失效率）通常会“更老”，即它的分布应该更集中在左边。因此，样本点小于某个特定次序统计量期望值的概率应该比随机情形下（均匀分布/指数分布）更小。
- 具体地说，在 \(H_0\)（F 是 IHR）下，这个概率有上界 \(\frac{k}{n+1}\)。
- 如果 \(F\) 是“年轻”（失效率递减），它会更分散，所以 \(X\) 小于该期望值的概率更大，这个上界就不成立，检验就能检测到。

没有这个特例，核心数学困难是什么？ 如果把 \(G\) 换成其他分布（如 Fréchet 或 log-logistic），核心困难不在于检验逻辑的变化，而在于L-estimators 的良好性质。如果分布是重尾的（如 Pareto），\(\mathbb{E}[X]\) 可能不存在，但 \(\mathbb{E}[X_{(k)}]\) 可能存在。作者证明，即使在重尾情况下，L-estimators 满足强相合性（Strong Law of Large Numbers），从而保证了检验的一致性，不受“均值不存在”的影响。

目标读者读完这一节后应该抓住：本文把检验 \(T\) 是否凸这个抽象的、无限维的函数假设问题，转化成检验一个具体的、一维的概率参数 \(\theta_k\) 是否偏离理论基准值的问题。这个转化建立在“期望次序统计量”的不等式之上，而这个不等式本身是凸变换序的一个已知性质。

三、这篇论文做了什么¶

三句话：
1. 研究了什么问题：提出了一类新的非参数检验，判断一个未知分布 \(F\) 是否属于由凸变换序（convex transform order）定义的一个分布族，即检验 \(G^{-1} \circ F\) 的凸性或凹性，其中 \(G\) 是已知参考分布。
2. 核心工具/方法：检验统计量基于对“随机变量 \(X\) 不超过其第 \(k\) 个次序统计量的期望值”这个概率的估计。该概率通过 L-estimation（次序统计量的线性组合）来估计，利用了凸变换序下的概率不等式。
3. 主要结论：该检验是无偏、一致的，并且其检验功效关于“凸变换序”是单调的（分布越“凸”，功效越高）。关键的 L-estimators 满足强相合性，使其适用于重尾（均值可能不存在）分布。该框架覆盖了经典（IHR）和新兴（IOR, DOR）的流行分布族。
关键设定与假设（在第二节基础上补充）：
- 假设 A1（连续性与严格单调性）：\(F\) 和 \(G\) 都是连续且严格递增的累积分布函数。这是为了确保逆函数和次序统计量的标准理论成立。相比已有文献（如 Barlow et al., 1963），这是一个标准假设，但比一些只考虑正值分布（life distributions）的假设更一般。
- 假设 A2（已知性）：\(G\) 是一个完全已知的参考分布。这是定义目标族的核心。比 Hall & Van Keilegom (2005) 的 IHR 检验（不假设指数分布）更严格，因为它要求研究者明确指定 \(G\)。
- 假设 A3（可积性）：对于所考察的 L-estimator，需要适当的矩条件以保证强相合性。对于重尾分布（如 Pareto 指数 \(\alpha > 1\)），该假设仍能成立，即使 \(\mathbb{E}[X]\) 不存在。
- 基本概念（重申）：凸变换序 \(\preceq_c\) 定义为 \(G^{-1} \circ F\) 是凸函数。凹变换序 \(\preceq_{cv}\) 类似。
主要结果：
- 定理 3.5（检验的一致性与无偏性）：对于检验 \(H_0: F \preceq_c G\) vs \(H_1: F \not\preceq_c G\)（或凹情形），基于检验统计量 \(T_n\) 的检验是一致（consistent）且无偏（unbiased）的。一致性意味着随着样本量增加，检验能正确检测任何固定偏离 \(H_0\) 的分布。无偏性意味着在 \(H_0\) 下，犯第一类错误的概率不超过名义水平 \(\alpha\)；在 \(H_1\) 下，功效至少为 \(\alpha\)。
  - 技术难点：检验统计量的分布依赖于未知的 \(F\)，因此很难直接推导其临界值。作者巧妙地利用了Arab et al. (2025) 的概率不等式：在 \(H_0\) 下，\(\theta_k = \mathbb{P}(X \le \mathbb{E}[X_{(k)}]) \le \frac{k}{n+1}\)。因此，可以将检验的临界值设定为与 \(\frac{k}{n+1}\) 相关的某个值，从而避免了估计无假设下的分布。这个“最不利分布”的论证类似于 Beare (2021)，但适用于更一般的框架。
- 定理 3.7（功效的单调性）：如果分布 \(F_1\) 和 \(F_2\) 都偏离 \(H_0\)，且 \(F_1\) 在凸变换序下比 \(F_2\) “更凸”（即 \(G^{-1} \circ F_1\) 比 \(G^{-1} \circ F_2\) “更凸”），那么检验针对 \(F_1\) 的功效不低于针对 \(F_2\) 的功效。这是一个很强且自然的要求，它说明检验与“序”是自洽的。
  - 技术难点：证明这个单调性需要建立检验统计量与凸变换序之间的直接联系。作者利用L-estimators 的单调性性质：如果 \(F \preceq_c G\)，则其对应的 L-estimators 也会以特定的顺序排序。然后通过某种概率不等式桥接，证明检验功效也随此顺序单调。
- 定理 4.1（L-estimator 的强相合性）：对于来自一个可能是重尾分布的样本，如果 \(\mathbb{E}[|X|^\delta] < \infty\) 对某个 \(\delta > 0\) 成立，且 L-estimator 的权重（分数）满足正则条件，那么该 L-estimator 是强相合的。这确保了在重尾（如 Pareto）下，对 \(\mathbb{E}[X_{(k)}]\) 的估计是可靠的。
  - 关键技术难点：经典 L-estimator 的 SLLN 通常需要一阶矩存在 (\(\mathbb{E}[|X|]<\infty\))。为了处理均值未定义的情形（如 Pareto 分布形状参数 < 2），作者使用了truncation和martingale differences或鞅差序列技巧，证明即使在一阶矩无穷时，L-estimators 作为次序统计量的线性组合仍能几乎必然收敛。
证明路线与技术技巧：
- 整体路线：
  1. 构造统计量：给定样本 \(X_1,...,X_n\)，选择一个秩 \(k\)（例如 \(k = \lfloor n/2 \rfloor\)）。用 L-estimator \(\hat{L}_n\) 估计 \(\mathbb{E}[X_{(k)}]\)。
  2. 计算检验统计量：计算 \(T_n = \frac{1}{n} \sum_{j=1}^n \mathbf{1}\{X_j \le \hat{L}_n\}\)，它估计了 \(\theta_k\)。
  3. 确定拒绝域：基于在 \(H_0\) 下 \(\theta_k \le k/(n+1)\) 这一事实（来自 Arab et al., 2025），设定一个拒绝域，例如：当 \(T_n\) 小于某个基于 \(k/(n+1)\) 和 \(\alpha\) 的临界值 \(c_\alpha\) 时拒绝 \(H_0\)（对于检验 \(T\) 凸的情形）。这里的关键是，\(c_\alpha\) 可以选择为不依赖于 \(F\) 的，只依赖于 \(n, k, \alpha, G\)。
  4. 证明一致性（定理 3.5）：需要证明当 \(F\) 不属于 \(H_0\) 时，\(T_n\) 会几乎必然落在拒绝域内。这依赖于两件事：① L-estimator \(\hat{L}_n\) 是强相合的（定理 4.1），所以 \(T_n\) 强收敛于 \(\theta_k\)；② 对于 \(H_0\) 之外的分布，\(\theta_k\) 的一个反向概率不等式成立（例如，如果 \(T\) 严格凹，则 \(\theta_k > k/(n+1)\)）。综合上述，只要偏离足够远，\(T_n\) 会以概率 1 超过临界值。对于一致性，要证明检验能检测任意程度的偏离（大于 0 的检测力），这要求 \(\theta_k\) 是该分布的函数。
  5. 证明功效单调性（定理 3.7）：需要证明 \(T_n\) 是凸变换序的“单调泛函”。这通常依赖于：如果 \(F_1 \preceq_c F_2\)（即 \(F_1\) 比 \(F_2\) 更凸），那么对于任何给定的秩 \(k\)，有 \(\mathbb{E}_{F_1}[X_{(k)}] \le \mathbb{E}_{F_2}[X_{(k)}]\)。然后利用这一事实（及其对应的 L-estimator 性质），证明在 \(F_1\) 下拒绝的概率大于等于在 \(F_2\) 下拒绝的概率。
- 关键跳跃点：
  - 最难的部分是将凸性假设转化为可检验的关于期望次序统计量的概率不等式，这一步由 Arab et al. (2025) 完成，本文直接借用。
  - 第二个跳跃是证明L-estimators 在重尾分布下的强相合性。传统的 SLLN 要求一阶矩存在。对于 Pareto (形状参数 < 2) 这种情况，\(\mathbb{E}[X]\) 无穷，但 \(\mathbb{E}[X_{(k)}]\) 是有限的。作者证明，即使权重不满足经典的一阶矩条件，通过仔细处理 L-estimators 的鞅差表示（例如，利用顺序统计量的马氏链性质），可以证明其强相合性。
- 技术技巧点名：
  - L-estimation：用来估计次序统计量的期望。这是检验统计量的核心成分。
  - Strong Law of Large Numbers for L-estimators (重尾版本)：用鞅差序列或截断法证明。
  - 概率不等式（来自 Arab et al., 2025）：将抽象的凸性假设转化为具体的、关于边缘概率的可检验条件。
  - 凸变换序下的次序统计量单调性：用于证明检验功效的单调性。
真实例子与应用：
- 论文包含模拟研究和实际数据应用。
- 模拟：作者模拟了来自不同分布（如指数、Weibull、Gamma、Pareto、Fréchet）的数据，这些分布的变换函数 \(T\) 分别满足凸、凹或复杂形状。他们比较了本文提出的检验（针对 \(H_0: T\) 凸和 \(H_0: T\) 凹）在不同参考分布（指数、log-logistic）下的尺寸（size）和功效（power），并与经典的 Proschan & Pyke (1967) 检验（针对 IHR）进行对比。
  - 结果：在 IHR 情形下（\(G\)=指数），提出的检验与 Proschan & Pyke 检验在功效上基本持平。在 IOR 情形下（\(G\)=log-logistic），提出的检验能有效检测偏离，而经典 IHR 检验则无法胜任（因为 IOR 和 IHR 不同）。这验证了统一框架的优势。
  - 说明：模拟验证了理论结果：检验的尺寸被控制在名义水平附近；功效随样本量和偏离程度增加而增加；且功效对 \(G\) 的选择是敏感的（选错了 \(G\)，检验会失效）。
- 实际例子：分析了一个火灾损失数据（来自某保险公司），用于检验这些损失是否服从 IOR 分布（即 \(F \preceq_c \text{Log-Logistic}(shape=1)\)）。分析显示，尽管该数据是重尾的，但本文提出的检验未能拒绝 IOR 假设，而传统 IHR 检验则拒绝了。这个例子展示了新检验的实用性：它允许分析师检验一个更灵活、更能容纳重尾的“老化”模型（IOR），而传统方法因模型过于严格而拒绝了。
🔎 结论是否比证明窄：
- 是。论文证明的是一致性和无偏性，但仅在 \(H_0\) 被刻画为“\(\theta_k \le k/(n+1)\)”的情形下严格成立。这个刻画依赖于一个已知的概率不等式，该不等式对于“完全凸”的 \(T\) 成立。然而，对于“几乎凸”（\(T\) 仅在局部非凸）的情形，\(\theta_k\) 可能恰好等于或略大于 \(k/(n+1)\)，此时检验可能失效，但作者没有讨论这种局部偏离情形。论文的主要结论假设了“固定备择假设”，没有讨论局部渐近功效。
- 作者声称检验适用于“任何 \(G\)”，但其可行性完全取决于能否为该 \(G\) 找到类似 \(k/(n+1)\) 的临界值。对于任意 \(G\)，这个临界值是否总是可解析或数值计算？论文没有给出一般条件，只给出了指数和 log-logistic 的显式结果。对于其他 \(G\)，用户可能需要自行推导。
- 论文没有证明检验的渐近正态性，也没有讨论其Pitman 效率（渐近相对效率）。这意味着很难与其他竞争方法（如 Proschan & Pyke 或 Bickel & Doksum 检验）进行定量比较，尽管作者在模拟中进行了经验性比较。

四、开放问题（点到为止，扎根具体语句）¶

局部渐近功效：检验的一致性（定理 3.5）是针对“固定偏离”的。对于以 \(n^{-1/2}\) 速率收敛于零的局部备择假设序列，检验的局部渐近功效（local asymptotic power）是多少？扎根：整个论文末的“补充材料”或“未来工作”部分可能会讨论，但正文中未见。这是经典检验理论（如 Pitman 效率）的一个自然延伸。
最优选择问题：检验统计量依赖于秩 \(k\)（例如 \(k=\lfloor n/2 \rfloor\)）的选择。如何在不同备择假设下最优地选择 \(k\)？例如，对于去检测尾部行为 vs. 中心行为，不同的 \(k\) 可能效果不同。扎根：引言中提到了依赖 \(k\) 的选择，但未给出理论指导。
高维/组合设定下的扩展：该框架是单变量检验。对于高维分布或向量值随机变量的凸序检验，是否存在类似方法？扎根：引言第 3 段提到“适用于多变量情形”是未来目标。
重尾情形下更好的 L-estimator 与检验界值：论文证明了 L-estimator 的强相合性，但对有限样本下的收敛速度和检验界值的精度没有深究。在重尾且样本量有限时，检验的第一类错误能否被精确控制，还是需要bootstrap等校准方法？扎根：模拟部分（Section 5.3）中，对于重尾分布检验，尺寸有时会偏离名义水平，说明理论上的无偏性在有限样本下可能需要更精细的校准。

Maintained by 陈星宇 · Homepage · Source on GitHub