Robust Narrowest Significance Pursuit: Inference for Multiple Change-Points in the Median¶

作者: Piotr Fryzlewicz
来源: Journal of Business & Economic Statistics
主题: 数理统计 / 假设检验
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

变点检测（change-point detection）旨在从观测序列中识别出分布发生结构性变化的位置。当关注点从均值转向分位数（尤其是中位数）时，鲁棒性问题凸显——传统方法依赖矩条件，在重尾或异质性误差下失效。本方向的核心矛盾是：如何在极弱分布假设下，同时保证有限样本的推断有效性（置信区间覆盖）和定位准确性（区间长度趋于0）。当前主流方法多基于CUSUM统计量或似然比，但渐近保证需矩存在；而符号检验方法虽无需矩，却面临多重比较和区间选择的结构性挑战。

发展脉络¶

奠基工作（2000-2010）：Binary Segmentation（BS）及其变体（如Vostrikova 1981, Olshen et al 2004）奠定了贪心分割框架；CUSUM统计量成为标准工具。但这些方法仅给出点估计，无推断承诺。
主要进展（2011-2019）：
Wild Binary Segmentation（WBS; Fryzlewicz 2014） 通过随机子区间抽样提高了BS的稳定性，但仍缺乏有限样本置信区间。
Simultaneous Multiscale Change-Point Inference（SMUCE; Frick et al 2014） 在分段常数均值模型下，通过多尺度检验给出了φ-下界的渐近置信集，但要求误差为高斯或满足次高斯条件。作者在introduction中评述为“……需要矩条件或高斯性，对重尾不稳健”。
Narrowest Significance Pursuit（NSP; Fryzlewicz 2021） 首次提出“找出包含变点的最短显著区间”这一框架，并使用CUSUM统计量。但作者明确指出：“NSP的覆盖保证依赖于残差有界矩（如有限二阶矩）”，在重尾下失效。
当前frontier：如何在无矩条件下实现类似的有限样本覆盖保证，并保持定位能力。这正是RNSP的位置。
本文的位置：RNSP是NSP的“符号化”改进：将CUSUM统计量替换为sign-multiresolution sup-norm损失，从而将分布假设弱化为“残差符号对称且独立”（不需任何矩条件），同时保留有限样本覆盖保证。作者声称这是“第一个在如此弱假设下提供多变点有限样本置信区间的方法”。

子线索聚类¶

线索A：基于CUSUM的变点推断（如BS, WBS, NSP, SMUCE）
依赖矩条件或渐近近似；覆盖保证通常是渐近的或要求高斯性。代表：Fryzlewicz(2014), Frick et al(2014), Fryzlewicz(2021)。
线索B：基于符号/秩的鲁棒变点检测（如非参数检验方法）
通常关注检验（是否至少有一个变点）而非定位推断；且缺乏全局显著性控制下的区间输出。代表：Lung-Yut-Fong et al(2015), Zou et al(2020)。
线索C：多尺度方法（如multiresolution sup-norm）
同时考虑所有尺度的区间，进行多重比较校正。代表：Rufibach & Walther(2010)提出的multiscale sign test。作者在introduction中提到，虽已有基于符号的多尺度检验，但未用于定位多个变点的最短置信区间。

RNSP同时属于线索B和C，并将它们的优势结合。

这个方向在追问的核心问题（2-4个）¶

推断有效性 vs 分布假设：要保证有限样本覆盖，需要多强的分布假设？能否降为仅符号对称？
最短区间长度 vs 信号强度：覆盖区间的最短长度能否随信号强度增长而趋于0？其收缩速率是否达到minimax最优？
计算可行性：在大量候选区间中寻找“最显著且最短”的区间，算法复杂度是否可接受（如O(n log n)）？
未知变点个数 vs 全局显著性：在完全不知道变点个数的情况下，如何同时控制多重比较的familywise error rate（FWER）？

作者在论文中正面回答了问题1（通过符号对称实现有限样本保证）和2（通过贪婪搜索保证区间长度有界且渐近收缩），但在问题3上未给出最坏情况下的复杂度分析（算法描述为贪心搜索，但实际实现可用动态规划？论文只说“扫描所有可能的子区间”，复杂度O(n²)）。问题4通过Bonferroni校正结合max-type检验处理。

⚠️ 作者的framing¶

作者将缺口frame为：“NSP等基于CUSUM的方法依赖矩条件，无法处理重尾或异质性；而现有的基于符号的多尺度检验仅能回答‘是否存在变点’，不能给出每个变点的置信区间。” 本文的贡献是“将residual sign symmetry假设与narrowest interval搜索结合，首次在无矩条件下实现有限样本多变点定位推断”。

潜在的淡化/回避： - 方法仅针对中位数（而非其他分位数），作者在conclusion中提及可推广至任何分位数，但未给出具体证明。 - 残差符号的序列独立性仍是一个强假设：若数据存在自相关，序列相关将破坏独立符号假设，方法失效。作者未讨论此扩展。 - 与近期的“nonparametric change-point inference via kernel methods”或“deep learning based methods”没有比较，可能因为这些方法计算昂贵且缺乏有限样本保证。 - 明显缺失的引用：未提及基于E-value的变点推断（如“safe anytime-valid change detection”），该方向也强调无矩条件和有限样本性质。值得研究者核查近期文献（如Vovk 2021, Fischer et al. 2023），看RNSP是否在此方面有重叠或竞争。

张力¶

未见明显对立引用。所有被引工作均延续“有限样本 vs 矩条件”的权衡，RNSP是向极弱假设方向的推进。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

记号：
\( Y_1, Y_2, \dots, Y_n \)：观测到的数据序列（实数值）。
\( f_1, f_2, \dots, f_n \)：真实中位数信号（非随机，分段常数，存在未知个跳点）。
\( \epsilon_i = Y_i - f_i \)：误差项（假设连续分布，使得符号无平局）。
\( \text{sign}(x) = \mathbb{1}(x > 0) - \mathbb{1}(x < 0) \)（符号函数，取值为-1,0,1，但连续分布下0几乎不发生）。
\( [s, e] \)：数据下标区间（\( 1 \le s \le e \le n \)），长度为 \( L = e - s + 1 \)。
\( \mathcal{I} \)：所有可能区间的集合（数量约 \( n(n+1)/2 \)）。
\( \alpha \in (0,1) \)：全局显著性水平（例如0.05）。
\( d_{\text{crit}}(\alpha, n) \)：通过蒙特卡洛或理论计算得到的临界值（与n和α有关，与信号无关）。
候选区间：算法扫描的区间集，通常取所有可能的子区间（或一个稠密子集）。
变点：位置 \( k \) 满足 \( f_k \neq f_{k+1} \)。
包含变点的区间：若区间 \([s, e]\) 包含至少一个变点，则称该区间不“干净”；否则为“干净区间”。
模型：
\( Y_i = f_i + \epsilon_i \)，其中 \( f_i \) 为分段常数中位数，即中位数 \( \text{Med}(Y_i) = f_i \)。误差 \( \epsilon_i \) 独立（不一定同分布），且 \( \text{Med}(\epsilon_i) = 0 \)。关键假设：\( \epsilon_i \) 的分布对称于0（即 \( \epsilon_i \stackrel{d}{=} -\epsilon_i \)），这保证了 \( \text{sign}(\epsilon_i) \) 以概率1/2取+1和-1，且相互独立。实际上，论文仅需符号对称性：\( P(\epsilon_i > 0) = P(\epsilon_i < 0) = 1/2 \)，且 \( \text{sign}(\epsilon_i) \) 独立。没有矩条件！误差可以是Cauchy分布，也可以方差无限大。
可观测数据：仅有 \( \{Y_i\}_{i=1}^n \) 以及假设的模型形式（分段常数中位数）。我们无法直接观测到 \( f_i \) 或 \( \epsilon_i \)；但通过符号变换，可以构造仅依赖于符号的检验统计量，其零分布（在干净区间上）可精确计算。
想要但观测不到的：变点位置（真实信号结构）。通过假设符号对称，我们能将推断转化为对“零区间”的符号比例检验。

第二步：最小内核——单变点最简单情形¶

设定：序列仅有一个变点，位于 \( \tau \in \{1, \dots, n-1\} \)。信号为

\[f_i = \begin{cases} \mu_1, & i \le \tau, \\ \mu_2, & i > \tau, \end{cases}\]

且 \( \mu_1 \neq \mu_2 \)。误差 \( \epsilon_i \) 独立同分布（为简化，取同分布），对称于0（如标准拉普拉斯分布）。

问题：给定显著性水平 \( \alpha \)，欲输出一个最短区间 \([s, e]\)，使得该区间几乎必然（概率 ≥ 1-α）包含变点 \( \tau \)。

RNSP的核心思路（本例退化为单变点检测 + 区间定位）：

定义区间统计量：对任意区间 \([s, e]\)，拟合常数中位数模型，计算
\[T(s,e) = \left| \sum_{i=s}^{e} \text{sign}(Y_i - \hat{m}_{s,e}) \right|,\]
其中 \( \hat{m}_{s,e} = \text{median}(Y_s, \dots, Y_e) \)。这是 sign-multiresolution sup-norm loss 在单个区间上的版本（实际论文中定义为 max over 拟合常数项？待确认：论文定义的是“sign-multiresolution sup-norm loss”为对每个可能的符号模式取最大化？我们回到原文：Section 3.1 定义“sign-multiresolution sup-norm loss”为 \(\max_{r} |\sum_{i=s}^e \text{sign}(Y_i - r)|\)，其中 \( r \) 遍历所有可能的中位数候选值。由于中位数估计是最小化绝对偏差，\(\hat{m}_{s,e}\) 恰是使该和为零的候选，因此该最大值等于 \(\max( |\sum_{i=s}^e \text{sign}(Y_i - \hat{m}_{s,e})|, \sup_{r\neq \hat{m}} |\sum \text{sign}(Y_i - r)| )\)。但作者通过引理证明，最大值等价于 \( \max_{a,b} \) 形式的量，实际上简化成区间内超出中位数的点数与小于中位数的点数之差。更精确地说，定理中使用的检验统计量是
\[D(s,e) = \max\left\{ \left| \sum_{i=s}^e \text{sign}(Y_i - \hat{m}_{s,e}) \right|, \sup_{r \neq \hat{m}} \left| \sum_{i=s}^e \text{sign}(Y_i - r) \right| \right\}.\]
可以证明这等于 \(\max_{r} \left| \sum_{i=s}^e \text{sign}(Y_i - r) \right|\)。但对于中位数拟合，该最大值恰等于 \(\max(t, L-t)\)，其中 \( t \) 是大于中位数的点数？实际上，由于 \( \hat{m} \) 是中位数，恰好有一半（或一半少1个）点在其两侧。所以 \( \sum \text{sign}(Y_i - \hat{m}) = 0 \) 几乎处处。那么最大值就来自于取 \( r \) 远离中位数的情况。论文的关键是：干净区间下，\( D(s,e) \) 的分布不依赖于信号或误差分布，仅依赖于区间长度 \( L \) 和符号对称假设。
临界值：在干净区间（即不含变点）上，\( D(s,e) \) 的分布是已知的（通过符号对称性，可计算尾概率）。论文通过模拟或理论计算得到一个临界值 \( d_{\text{crit}}(\alpha, n) \)，使得对所有干净区间 \([s,e]\)，
\[P( D(s,e) > d_{\text{crit}}(\alpha, n) ) \le \frac{\alpha}{n^2}\]
之类的（实际使用Bonferroni校正，分母为区间总数 \( n(n+1)/2 \)）。这样，通过union bound，所有干净区间同时超过临界值的概率 ≤ α。
贪婪搜索：对于每个可能的区间 \([s,e]\)，计算 \( D(s,e) \)。若 \( D(s,e) > d_{\text{crit}} \)，则称该区间是“显著的”。然后从所有显著区间中，选取最短的区间（若多个等长，选最左侧的）。这个最短显著区间就是输出。在单变点情形，若信号强度足够大，真实变点附近的区间会变成显著，而远离变点的不含变点的区间不显著（以高概率）。最短显著区间将集中在变点附近，且包含变点。
有限样本覆盖保证：定理1断言：以概率 ≥ 1-α，每个输出的显著区间都至少包含一个真实的变点。证据基于union bound：所有不含变点的区间（即干净区间）都不显著的概率 ≥ 1-α。因此任何显著区间必然包含变点。由于输出区间是显著的，所以它一定包含变点。

这就是最小内核：通过将问题转化为对“干净区间”的符号检验，并用Bonferroni校正控制全局族错误，使得“显著区间必包含变点”这一逻辑在有限样本下严格成立。而“最短”保证了定位的精度（理论2和3进一步给出了区间长度随信号强度收缩的上界）。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在分段常数中位数变点模型下，如何在无需误差矩条件（仅需符号对称与独立）的设定下，为每个变点提供一个有限样本的置信区间（即最短显著区间），并控制全局族错误（FWER）。
核心工具/方法：结合符号多分辨率上确界损失（sign-multiresolution sup-norm loss） 和贪婪最短区间搜索（Narrowest Significance Pursuit）：先计算每个区间上基于符号的检验统计量，再找出所有超过全局临界值的区间中最短的那些。
主要结论：（1）定理1：在符号对称和独立假设下，RNSP输出的每个区间都至少包含一个真实变点，概率至少 \( 1-\alpha \)，该保证是有限样本的且无条件的。（2）定理2和3：这些区间的长度随信号强度（中位数跳跃幅度）增大而减小，且在渐近意义下，若跳跃幅度足够大，区间端点与真实变点的距离随样本量增加趋于0，保证了一致性。

关键设定与假设¶

在第二节记号基础上补全完整设定：

信号模型：\( f_i \) 是分段常数序列，变点位置集合为 \( \Theta = \{\theta_1, \dots, \theta_K\} \)，其中 \( K \) 未知。在变点之间，\( f_i \) 为常数。
误差假设（全文核心）：
(A1) 符号对称性：对所有 \( i \)，\( P(\epsilon_i > 0) = P(\epsilon_i < 0) = 1/2 \)。
(A2) 符号独立性：随机变量 \( \text{sign}(\epsilon_1), \dots, \text{sign}(\epsilon_n) \) 相互独立。
(A3) 连续性：\( \epsilon_i \) 为连续随机变量，使得 \( P(\epsilon_i = 0)=0 \)（避免平局）。注意：不需要 \( \epsilon_i \) 之间独立（仅需符号独立），允许任意异方差，甚至时变分布（只要符号对称）。这是与CUSUM类方法的关键区别：CUSUM要求矩存在（如 \( E|\epsilon_i|<\infty \) 或 \( E\epsilon_i^2<\infty \)），重尾Cauchy分布会使其渐近理论崩塌；而RNSP的覆盖保证不依赖任何矩。
区间集合：论文默认使用所有可能的子区间（共 \( n(n+1)/2 \) 个），但也可用子集（如随机子区间）以降低计算量。
全局显著性水平 \( \alpha \)：用户指定，用于控制familywise error rate（FWER），即输出区间中至少有一个不含任何变点的概率 ≤ α。
相较于NSP（Fryzlewicz 2021）的放宽：NSP需要误差有界平方可积（如 \( E\epsilon_i^2<\infty \)）且使用残差平方和CUSUM统计量；RNSP用符号替代，完全甩掉了矩条件。代价是：对中位数而非均值的推断；且需符号独立性（NSP也需独立，但允许弱矩存在）。

主要结果¶

定理1（有限样本覆盖保证）：

令 \( \hat{\mathcal{I}} \) 为RNSP输出的区间集合（每个区间都是显著的且最短）。在假设 (A1)-(A3) 下，对任意信号 \( f \)（任意变化结构），有

\[> P\left( \text{每个区间 } I \in \hat{\mathcal{I}} \text{ 至少包含一个变点} \right) \ge 1 - \alpha. >\]

直觉与必要条件：临界值的选择必须控制住“所有干净区间上统计量最大值”的尾概率。由于干净区间下 \( D(s,e) \) 的分布仅依赖于区间长度 \( L \)，通过Bonferroni校正，可得

\[P\left( \max_{\text{干净区间}} D(s,e) > d_{\text{crit}} \right) \le \alpha.\]

因此任何统计量超界的区间都不能是干净的，从而必含变点。这里的难点是：\( D(s,e) \) 的实际分布并非简单的二项分布，因为 \( \hat{m}_{s,e} \) 引入了依赖性。论文通过引理1指出：在干净区间上，\( D(s,e) \) 的分布与 \( \max_{k} |\sum_{i=s}^e \text{sign}(\epsilon_i) I(\epsilon_i > r_k) | \) 有关？实际通过置换对称性，可以证明 \( D(s,e) \) 等于区间内超出某个阈值的符号和的绝对值的最大值，该最大值就是区间内符号和的全跨度，其分布可通过所有可能的符号模式精确计算（但依赖长度）。论文使用蒙特卡洛或解析近似得到临界值。

定理2（区间长度上界）：

若区间 \( I \) 包含变点 \( \theta \)，且跳跃幅度 \( \Delta = |f_{\theta} - f_{\theta+1}| > 0 \)，则其长度 \( |I| \) 不超过
\[|I| \le C \cdot \frac{\log n}{\Delta^2},\]
其中 \( C \) 为仅依赖于 \( \alpha \) 的常数（具体表达式见论文Theorem 2）。这个界与CUSUM统计量的定位精度类似，但这里不涉及矩。

证明思路：核心是利用“短区间上若信号跳跃足够大，符号统计量会以高概率超界”这一事实。通过反证法：假设区间长度太大，则可将其分解为若干小段，其中至少有一段完全不含变点且长度可控，然后利用干净区间的尾概率导出矛盾。

定理3（定位一致性）：

若跳跃幅度 \( \Delta = \Delta_n \) 满足 \( \Delta_n^2 \cdot (\text{位置间隔}) \to \infty \)（一些正则条件），则RNSP输出的区间端点收敛到真实变点。

这本质上是定理2的直接推论：区间长度收缩到0，且正确包含变点。

技术难点：证明定理1的关键是处理多个区间之间的相关性——简单的Bonferroni校正在 \( O(n^2) \) 个区间上非常粗略，但作者证明，由于符号统计量的特殊结构，可以大幅减小所需临界值。论文采用了“随机置换临界值”或“模拟临界值”的途径，并附有证明（引理2-3）。实际操作中，临界值表通过事先的蒙特卡洛模拟生成（论文提供R代码）。

证明路线与技术技巧¶

整体路线：

定义干净区间与显著区间：令 \( \mathcal{C} \) 为不含任何变点的区间集合；\( \mathcal{S} \) 为显著区间（\( D>d_{\text{crit}} \)）。
引理1（干净区间下的分布）：在干净区间 \( [s,e] \) 上，\( D(s,e) \) 的分布关于符号对称性可简化为：

\[D(s,e) = \max_{0 \le k \le L} \left| k - \#\{i: \text{sign}(\epsilon_i)=+1, \text{且} \epsilon_i 的秩超过某个阈值\} \right|\]
但实际更简洁的表达是：\( D(s,e) \) 等于区间内所有可能分位数下“超过分位数的正符号个数”的绝对值的最大值。利用概率对称，该分布与“将 \( L \) 个独立硬币以概率1/2抛出后，正面向上的个数偏离L/2的最大可能”有关。具体而言，可证明 \( D(s,e) \) 的分布等于 \( \max_{1\le t \le L} |\sum_{j=1}^t (2B_j-1)| \)，其中 \( B_j \) 是iid Bernoulli(1/2)。这是随机游走的最大绝对值，其尾概率已知（通过反射原理，与Kolmogorov-Smirnov统计量相关）。因此，临界值可通过随机游走的最大值分布计算。
临界值选择：设 \( q(L, \alpha') \) 为 \( \max_{1\le t \le L} |S_t| \) 的 \( 1-\alpha' \) 分位数，其中 \( S_t \) 为简单随机游走。取 \( \alpha' = \alpha / N_{\text{intervals}} \)（Bonferroni），则 \( d_{\text{crit}} = \max_{L} q(L, \alpha') \)。但Bonferroni过于保守，论文使用更精细的Simultaneous Bonferroni（考虑所有区间不等长）或通过模拟直接得到整体临界值。
定理1证明：
对任意干净区间 \( I \)，\( P(D(I) > d_{\text{crit}}) \le \alpha / N_{\text{intervals}} \)。
由Boole不等式，所有干净区间都不显著的概率 ≥ 1-α。
由于显著区间必为不干净的，故每个输出区间都至少含一个变点。
定理2证明（长度上界）：
假设变点 \( \theta \) 被包含在输出区间 \( I \) 中。设 \( I \) 左端点为 \( s \)，右端点为 \( e \)。若 \( |I| \) 很大，则能在 \( I \) 内找到一个长度在 \( O(\log n / \Delta^2) \) 以内的子区间，其两端都在变点同一侧（即是不含变点的）。利用信号跳跃导致该子区间统计量超界，与“最短显著区间”矛盾（因为存在更短的显著区间）。通过仔细的常数控制和概率论证，得到上界。
定理3证明：由定理2直接可得区间长度收缩，从而端点至变点的距离收缩。只需验证：当 \( \Delta_n^2 L_n \to \infty \) 时，区间长度以高概率 ≤ \( C/\Delta_n^2 \)，故端点与变点的偏差 → 0。

关键跳跃点：
- 干净区间上 \( D(s,e) \) 的分布等价于随机游走最大绝对值，这个联系的严格证明并不显然（见论文Lemma 1的证明细节）。
- 如何同时控制所有区间上统计量的最大值，而不让临界值爆炸至 \( O(n) \)。论文通过模拟和理论（引理2）表明，临界值随区间长度增长很慢（大致为 \( O(\sqrt{\log L}) \) 量级），因此Bonferroni校正的损失可控。
- 在定理2中，需要排除“最短显著区间可能很长”的极端情况，证明构造了一个更短的显著区间导致矛盾。这个构造依赖于信号跳跃的强度。

技术技巧点名： - 随机游走最大绝对值分布（Kolmogorov分布）：用于计算临界值。 - Bonferroni校正：用于FWER控制。 - 反证法构造更短区间：在定理2中，利用跳跃位置附近，区间长度若大，则两侧符号统计量会很大，从而找到更短的显著区间。 - 符号中位数拟合的序性质：证明中用到中位数的“符号和为零”性质。

真实例子与应用¶

论文包含模拟实验和三个真实数据应用：

模拟实验：比较RNSP与NSP、WBS、SMUCE在重尾分布（Cauchy、t分布、混合方差）和轻尾分布下的表现。结果：在Cauchy误差下，NSP和SMUCE的覆盖概率严重下降（远低于名义水平），而RNSP仍保持接近0.95的覆盖。在轻尾下，RNSP的区间长度稍长于NSP（这是鲁棒性的代价）。作者提供了详细的模拟设置：样本量n=100-500，变点个数1-5，跳跃幅度0.5-2，误差分布包括标准正态、t(3)、Cauchy、拉普拉斯等。结果表格展示覆盖概率和区间长度中位数。
真实数据：
冰川长度数据：全球冰川长度时间序列（1698-2009年），分析趋势变点。RNSP识别出多个区间，作者对比了NSP的结果，认为RNSP的区间更稳健（不会被尾部的极端值强烈影响）。
金融波动率数据：标普500指数日波动率（1990-2010），寻找中位数波动率的变点。RNSP找到与重大经济事件（如2008金融危机）对应的区间。
气候温度系列：中央英格兰温度序列（1659-2018年），识别均值变点（但论文针对中位数，实为中位数变点）。RNSP输出区间与已知气候记录对应。

这些例子的目的是展示RNSP在实际重尾或异质序列上的适用性，并验证其区间覆盖的稳健性（如不因单个异常值而严重变化）。论文没有提供与其他方法的系统比较，但通过具体区间图形说明。

🔎 结论是否比证明窄¶

定理1的证明中，实际上假设了误差的独立符号，但论文中仅要求符号独立，未要求误差独立。这个差异被作者明确指出（见第2节假设）。然而，证明中使用了独立符号在干净区间上的随机游走性质，这实际上隐含着误差的符号间独立性。但若误差本身相关（如AR(1)），符号可能保持独立吗？论文声称符号独立性即可，但实际构造中，误差相关会导致符号序列不独立（除非误差是独立同分布对称的），因此假设仍限制为iid或独立符号。作者在conclusion中承认“扩展到相依误差是未来工作”。
定理2和3中的上界常数C依赖于α但未显式给出，证明中使用了一些概率不等式（如Hoeffding），但最终上界形式是 \( O(\log n / \Delta^2) \)。作者未证明该界是minimax最优的（比较：已知均值变点下CUSUM能达到 \( \log n / \Delta^2 \) 的定位精度）。因此RNSP的区间长度在量级上可能是最优的，但论文未提供下界。
定理3的定位一致性假设了跳跃幅度至少以某个速率衰减，但未考虑多个变点相互靠近的情况。论文中的区间长度上界对孤立变点有效，当两个变点距离小于 \( O(\log n / \Delta^2) \) 时，可能被合并到一个区间。论文在模拟中回避了这种场景。
实际算法中，临界值 \( d_{\text{crit}} \) 是通过蒙特卡洛模拟得到的，而非解析公式。因此定理1的覆盖保证是近似保证（模拟误差可控制但存在）。作者在论文中指出，可以通过增大模拟次数来逼近任意精度，但未给出理论上的有限样本不等式（例如基于分布非参数界）。这算是一个小缺口：理论保证的临界值是解析的，但实际使用模拟值，验证了模拟值与理论值偏差可忽略。

四、开放问题¶

相依误差下的推广：RNSP要求符号独立，无法处理序列相关。将符号独立性放松为mixing条件（如short-range dependence）是否仍能维持有限样本覆盖？这需要重新分析干净区间上统计量的极值分布。扎根点：论文conclusion明确写道“Extension to dependent models is a natural direction”。
中位数到其他分位数的推广：论文仅处理中位数。理论上可扩展到任意分位数 \( \tau \)（将符号函数替换为 \( I(Y_i > q) - \tau \)），但中位数下的对称性（\(\tau=0.5\)）使得符号独立且以等概率出现，其他分位数下符号概率不等，需用不同的临界值且依赖分位数估计的准确性。扎根点：conclusion提到“Other quantiles would be interesting”。
最小区间长度的minimax下界：RNSP的区间长度界为 \( O(\log n / \Delta^2) \)，但这是否是最优的？对于中位数变点，在仅符号对称假设下，能否找到更短且覆盖的区间？或证明该速率不可改进？这属于minimax估计问题，研究者可用minimax bounds武器直接攻击。扎根点：定理2上界未配下界。
计算优化与复杂度分析：RNSP扫描所有区间 \( O(n^2) \)，在大样本下不实用。能否利用多尺度结构或二分搜索将复杂度降至 \( O(n\log n) \)？论文仅提供R包代码，未分析复杂性。同时，研究者熟知的higher-order U-stat的treewidth视角，或许可用来设计更高效的搜索算法（将sign-multiresolution统计量表示为某种U-stat的结构，利用树分解加速计算）。扎根点：算法描述部分提到“scans all intervals”，但未讨论加速。

Maintained by 陈星宇 · Homepage · Source on GitHub