跳转至

Theoretical properties of angular halfspace depth

作者: Stanislav Nagy, Petra Laketa
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么: 这个子方向是流形/球面上的非参数统计深度与分位数理论。在欧氏空间 \(\mathbb{R}^d\) 中,深度函数(如 Tukey halfspace depth)为多变量数据提供了基于秩与中心性的非参数排序,从而定义中位数与分位数区域。然而,当数据被约束在单位球面 \(\mathbb{S}^{d-1}\)(方向数据/天体观测/地磁数据)上时,欧氏线性结构与仿射变换不再适用,根本的统计问题在于:如何在缺乏自然线性序的流形上,构造满足公理化要求(旋转不变、单调衰减、凸的中心区域)的深度函数,并建立其经验版本到总体版本的严格收敛理论? 当前该方向处于公理体系初步成型、但特定深度函数的严格统计理论基础(连续性、收敛率、大样本保障)存在长期空缺的阶段。

发展脉络(history): - 奠基工作(欧氏深度公理与理论):Tukey (1975) 提出 halfspace depth (hD);Zuo & Serfling (2000) 系统化了统计深度函数的四大公理(仿射不变性、单调性、凸性、消失于无穷);Dyckerhoff (2012) 建立了 hD 收敛性与中心区域收敛性的等价条件,为经验深度的 Glivenko-Cantelli 型理论奠基。 - 主要进展(欧氏 hD 的几何与严格刻画):Laketa & Nagy (2021) 给出了 hD 射线基定理的初等证明与严格单调性条件;Pokorný et al. (2022) 引入 flag halfspaces,统一了连续与离散测度的 hD 理论,解决了样本中位数集维数的遗留问题;Nagy et al. (2019) 揭示了 hD 与凸几何中 floating body 的等价关系,借凸几何工具解决了 hD 的理论难题。 - 当前 frontier(球面深度的多样构造与计算):Liu & Singh (1992) 与 Agostinelli & Romanazzi (2013) 尝试将欧氏深度向球面平移;Ley et al. (2014) 提出角 Mahalanobis 深度,获得了 Bahadur 表示与渐近正态性,但依赖分布假设;Pandolfo et al. (2018) 构造了基于距离的球面深度,降低了计算成本;Hallin et al. (2022) 利用最优传输(Monge-Kantorovich)在球面上定义了分位数与秩,获得了分布自由的 MANOVA 检验与 Glivenko-Cantelli 性质。 - 本文的位置:ahD 由 Liu (1987) 引入,但长期因计算瓶颈与理论空白被边缘化。本文旨在填补 ahD 自 1987 年以来的严格统计理论基础空缺——证明其满足公理、建立中位数与中心区域的均匀连续性与一致性。

子线索聚类: 1. 欧氏 hD 的纯理论深化:Dyckerhoff (2012), Laketa & Nagy (2021), Pokorný et al. (2022), Nagy et al. (2019)。这一簇在修补 hD 的射线基定理、单调性条件与凸几何等价刻画,为深度函数的收敛分析提供最底层的拓扑与测度论工具。 2. 球面深度的参数/半参数构造:Ley et al. (2014), Pandolfo et al. (2018)。这一簇为了获得渐近分布与计算可行性,引入了 Mahalanobis 距离或特定度量,代价是牺牲了部分分布自由性与纯非参数性。 3. 球面深度的最优传输/非参数构造:Hallin et al. (2022), Chernozhukov et al. (2017)。这一簇利用 measure transportation 定义球面分位数与深度,优势是天然具有凸的中心区域与分布自由的秩,但依赖传输映射的计算与理论。

这个方向在追问的核心问题: 1. 公理兼容性:如何保证球面深度函数在旋转群(而非仿射群)下不变,且中心区域在球面拓扑下凸(而非欧氏凸)? 2. 收敛保障:经验深度与经验中心区域是否在球面上均匀收敛到总体版本?收敛条件是什么(总体分布的支撑连续性/绝对连续性)? 3. 计算可行性:如何突破球面深度计算的高维组合复杂度瓶颈?

⚠️ 作者的 framing: - 作者的说法:作者将缺口 frame 为“ahD 自 1987 年引入以来缺乏严格理论分析,随着近期计算算法的突破,理论基础的补全成为显然的下一步”。作者强调 ahD 是“hD 在球面上的自然推广”,暗示其应继承 hD 的所有优良公理性质。 - 淡化/回避的竞争路线:intro 中对 Hallin et al. (2022) 的最优传输深度与 Ley et al. (2014) 的 Mahalanobis 深度仅作列举,未对比 ahD 在理论性质(如中心区域的凸性/嵌套性)或分布自由性上相对于它们的优劣;对 Pandolfo et al. (2018) 提出的“ahD 计算成本高”的批评,作者仅以“近期有进展”一笔带过,未给出具体算法引用。 - 缺失的引用:intro 未引用任何关于球面/流形上深度函数收敛率的文献,也未引用流形上经验过程的极值理论——这暗示“收敛率”可能是一个作者未触及、且文献中亦少有探讨的真空白。

张力: 未见明显对立引用。Pandolfo et al. (2018) 指出 ahD 计算成本高且缺乏算法,本文认为此障碍已部分消除,但未提供直接反驳的算法文献,二者在“计算可行性是否已解决”上存在隐张力。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代

  • \(d\):欧氏空间的维数(\(d \geq 2\))。
  • \(\mathbb{S}^{d-1}\)\(\mathbb{R}^d\) 中的单位球面,即方向数据的支撑集。
  • \(P\)\(\mathbb{S}^{d-1}\) 上的总体概率测度(要推断的对象)。
  • \(X_1, \ldots, X_n\):独立同分布的随机变量(样本),取值于 \(\mathbb{S}^{d-1}\),服从测度 \(P\)
  • \(P_n\):基于样本 \(X_1, \ldots, X_n\) 的经验测度。
  • \(x\)\(\mathbb{S}^{d-1}\) 上的任意一点(查询点,要计算其深度)。
  • \(H\)\(\mathbb{S}^{d-1}\) 上的闭半球,即存在 \(u \in \mathbb{S}^{d-1}\) 使得 \(H = \{ y \in \mathbb{S}^{d-1} : \langle u, y \rangle \geq 0 \}\)
  • \(\mathfrak{H}\)\(\mathbb{S}^{d-1}\) 上所有闭半球的集合。
  • \(\text{ahD}(x; P)\):点 \(x\) 相对于测度 \(P\) 的 angular halfspace depth(总体 estimand),定义为 \(\text{ahD}(x; P) = \inf_{H \in \mathfrak{H}: x \in H} P(H)\)
  • \(\text{ahD}(x; P_n)\):点 \(x\) 相对于经验测度 \(P_n\) 的 angular halfspace depth(经验估计量)。
  • \(\mathcal{M}(P)\):方向中位数集合,即 \(\mathbb{S}^{d-1}\) 上使 \(\text{ahD}(x; P)\) 达到最大的所有 \(x\) 的集合。
  • \(\mathcal{C}_\alpha(P)\):深度为 \(\alpha\) 的中心区域,即 \(\mathcal{C}_\alpha(P) = \{ x \in \mathbb{S}^{d-1} : \text{ahD}(x; P) \geq \alpha \}\)

模型与可观测数据: 数据生成机制为 \(X_i \sim P\)\(P\)\(\mathbb{S}^{d-1}\) 上的未知 Borel 测度。研究者实际能观测到的是 \(\mathbb{S}^{d-1}\) 上的 \(n\) 个点 \(X_1, \ldots, X_n\)不可观测但想要推断的是总体深度函数 \(\text{ahD}(\cdot; P)\) 的全局形态、中位数集合 \(\mathcal{M}(P)\) 的位置与拓扑结构、以及中心区域 \(\mathcal{C}_\alpha(P)\) 的几何形状。识别这些总体对象不需要额外因果假设,完全依赖 \(P\) 的可观测支撑与测度性质(如绝对连续性、支撑连通性)。

第二步:最小内核

整篇论文的证明本质上是欧氏 hD 理论在球面拓扑与旋转群下的“加壳”推广。最简特例取 \(d=2\)(圆周 \(\mathbb{S}^1\) 上的方向数据)

\(\mathbb{S}^1\) 上,闭半球 \(H\) 退化为闭半圆弧(长度为 \(\pi\) 的弧)。对于圆周上的点 \(x\)\(\text{ahD}(x; P)\) 的计算极其直观:找出所有包含 \(x\) 的闭半圆弧,测度 \(P\) 赋予这些弧的最小质量就是 \(x\) 的深度

  • 要证的命题退化成什么:在 \(\mathbb{S}^1\) 上,若 \(P\) 在圆周上绝对连续且支撑连通,则:
  • 单调性:从最大深度点(中位数)出发,沿圆周向两侧移动,深度严格单调递减,直至在圆周对极点处降为 0。
  • 均匀收敛\(\sup_{x \in \mathbb{S}^1} |\text{ahD}(x; P_n) - \text{ahD}(x; P)| \to 0\) 几乎必然成立(Glivenko-Cantelli 型)。
  • 中心区域收敛:经验中心区域 \(\mathcal{C}_\alpha(P_n)\) 在 Hausdorff 距离下一致收敛到 \(\mathcal{C}_\alpha(P)\)

  • 证明怎么走、为什么成立: 在 \(\mathbb{S}^1\) 上,包含 \(x\) 的闭半圆弧只有两个(左半圆与右半圆),\(\text{ahD}(x; P) = \min(P(\text{左半圆}), P(\text{右半圆}))\)。由于 \(P\) 绝对连续,当 \(x\) 沿圆周微小移动 \(\Delta \theta\) 时,左/右半圆弧的边界仅移动 \(\Delta \theta\),质量变化为 \(O(\Delta \theta)\),因此深度函数是连续的;若支撑连通,中位数唯一且深度向两侧严格单调递减。经验版本 \(P_n\) 是阶梯函数,但 \(\mathbb{S}^1\) 上的闭半圆弧类是一个 Vapnik-Chervonenkis (VC) 类(其 VC 维数为 3),由经典经验过程理论,\(\sup_{H \in \mathfrak{H}} |P_n(H) - P(H)| \to 0\) 几乎必然。由于 \(\text{ahD}(x; P_n) = \inf_{H: x \in H} P_n(H)\) 是该 VC 类上的一族下确界,且总体版本连续,通过 Dyckerhoff (2012) 在欧氏空间建立的“深度逐点收敛 \(\Leftrightarrow\) 深度均匀收敛 \(\Leftrightarrow\) 中心区域 Hausdorff 收敛”的等价框架(该框架仅依赖拓扑与测度结构,可平移至球面),均匀收敛与中心区域收敛自然得出。

  • 一般情形的“加壳”:当 \(d \geq 3\) 时,闭半球不再由两个方向决定,而是由法向量 \(u \in \mathbb{S}^{d-1}\) 参数化,\(\mathfrak{H}\) 的 VC 维数随 \(d\) 线性增长。深度的单调性需要将欧氏的“严格单调性条件”(Dyckerhoff 2017, Laketa & Nagy 2021)通过 gnomonic projection(将球面投影到切超平面,把球面半球变为欧氏半空间)平移至球面测度 \(P^\pm\) 上;均匀收敛的证明需将 VC 类的覆盖数估计与球面拓扑下的连续性结合;中心区域收敛需验证球面凸集的 Hausdorff 距离性质。


三、这篇论文做了什么

三句话: ①研究了单位球面 \(\mathbb{S}^{d-1}\) 上方向数据的 angular halfspace depth (ahD) 的严格统计理论性质;②核心工具是 gnomonic projection(将球面半球映射为欧氏半空间)与欧氏 hD 的公理/收敛理论(Dyckerhoff 2012, Laketa & Nagy 2021)的平移,辅以球面经验过程(VC 类)与凸几何;③主要结论是 ahD 满足球面深度函数的全部四条公理(旋转不变性、单调性、球面凸性、消失于对极点),且在总体测度满足绝对连续与支撑连通条件下,经验深度、方向中位数集合与中心区域均具有均匀连续性与几乎必然一致收敛性。

关键设定与假设: 在第二节最小记号基础上补全: - \(\mathcal{G}_d\)\(\mathbb{R}^d\) 上的正交变换群(旋转群),对应球面深度的不变性群(取代欧氏深度的仿射群)。 - \(P^\pm\):测度 \(P\) 在 gnomonic projection 下的投影测度。具体地,取半球 \(H\) 的极点 \(u\),将 \(H\) 内的点 \(x\) 投影到 \(u\) 处的切超平面 \(T_u\) 上,得到 \(\mathbb{R}^{d-1}\) 上的测度 \(P^\pm_u\)。这是本文最关键的技术设定——将球面问题转化为欧氏问题。 - 假设 A1(绝对连续性)\(P\)\(\mathbb{S}^{d-1}\) 上相对于球面 Lebesgue 测度绝对连续。统计含义:保证深度函数连续,无原子质量导致深度跳跃。 - 假设 A2(支撑连通与内点)\(P\) 的支撑是 \(\mathbb{S}^{d-1}\) 的一个连通开子集的闭包,且具有非空内部。统计含义:保证中位数集合的唯一性与深度的严格单调衰减;若无此假设,可能出现中位数集合维数 \(>0\) 或深度平台区。 - 假设 A3(严格单调性条件):对投影测度 \(P^\pm\),要求其满足 Laketa & Nagy (2021) 在欧氏空间中提出的严格单调性条件。统计含义:这是保证中心区域嵌套且边界不发生“坍缩”的最低测度论条件,本文通过 gnomonic projection 将其平移至球面。

相比已有文献:Ley et al. (2014) 的 Mahalanobis 深度依赖旋转对称分布假设以获得渐近正态性;Hallin et al. (2022) 的传输深度依赖参考分布的选取。本文的 A1-A3 是纯非参数的拓扑与测度论条件,不涉及任何参数族或参考分布,条件强度与欧氏 hD 的经典理论(Dyckerhoff 2012)平行。

主要结果: 1. 定理 3(公理满足性):ahD 满足 Zuo & Serfling (2000) 提出的统计深度函数四条公理的球面版本: - (P1) 旋转不变性:对任意 \(U \in \mathcal{G}_d\)\(\text{ahD}(Ux; UP) = \text{ahD}(x; P)\)。 - (P2) 单调性:从最大深度点出发,沿球面大圆向对极点移动,深度单调递减;在 A2 下严格单调。 - (P3) 球面凸性:中心区域 \(\mathcal{C}_\alpha(P)\)\(\mathbb{S}^{d-1}\) 上的球面凸集(即包含任意两点的大圆弧段)。 - (P4) 消失性:\(\text{ahD}(x; P) \to 0\)\(x\) 趋于对极点(在 \(\mathbb{S}^{d-1}\) 拓扑下均匀衰减)。 直觉:ahD 继承了 hD 的全部优良几何性质,且这些性质在球面拓扑下自然成立,无需修改定义内核。

  1. 定理 5-6(均匀连续性与一致性):在 A1-A3 下,
  2. \(\text{ahD}(\cdot; P)\)\(\mathbb{S}^{d-1}\) 上均匀连续。
  3. \(\sup_{x \in \mathbb{S}^{d-1}} |\text{ahD}(x; P_n) - \text{ahD}(x; P)| \to 0\) 几乎必然(Glivenko-Cantelli 型一致收敛)。 直觉与必要条件:必要条件是 \(\mathfrak{H}\)(闭半球类)为 VC 类且总体深度连续。VC 性保证经验测度在半球类上均匀收敛;总体深度连续保证下确界运算不破坏均匀收敛。 解决的技术难点:球面上深度的下确界是在一个无限参数族(所有包含 \(x\) 的半球)上取的,经验版本的下确界可能不连续;本文通过总体深度的均匀连续性 + VC 类的均匀收敛,绕过了“下确界不保持收敛”的经典障碍。

  4. 定理 7-8(中位数与中心区域收敛):在 A1-A3 下,

  5. 方向中位数集合 \(\mathcal{M}(P_n)\) 在 Hausdorff 距离下几乎必然收敛到 \(\mathcal{M}(P)\)
  6. 中心区域 \(\mathcal{C}_\alpha(P_n)\) 在 Hausdorff 距离下几乎必然收敛到 \(\mathcal{C}_\alpha(P)\),对所有 \(\alpha \in (0, \alpha_{\max}]\) 一致成立。 直觉:这是 Dyckerhoff (2012) 欧氏结果的球面版——深度均匀收敛 + 严格单调性 \(\Rightarrow\) 中心区域 Hausdorff 收敛。

证明路线与技术技巧: - 整体路线: 1. 球面到欧氏的投影:通过 gnomonic projection,将球面半球 \(H\) 映射为欧氏半空间 \(\tilde{H}\),将球面测度 \(P\) 映射为欧氏测度 \(P^\pm\),建立 \(\text{ahD}(x; P) = \text{hD}(\tilde{x}; P^\pm)\) 的等价关系(定理 1)。 2. 公理的平移:利用欧氏 hD 已知的公理满足性(Pokorný et al. 2022, Laketa & Nagy 2021),通过投影-逆投影,将欧氏半空间的性质(凸性、单调性)翻译为球面半球的性质(球面凸性、球面单调性)。 3. 经验过程的均匀控制:证明闭半球类 \(\mathfrak{H}\) 是 VC 类(其 VC 维数为 \(d+1\)),由 VC 定理得到 \(\sup_{H \in \mathfrak{H}} |P_n(H) - P(H)| \to 0\) a.s.。 4. 下确界运算的连续性保护:利用总体深度的均匀连续性(来自 A1-A3),证明 \(\text{ahD}(x; P_n) = \inf_{H: x \in H} P_n(H)\) 在逐点收敛时自动升级为均匀收敛。 5. Dyckerhoff 框架的移植:将 Dyckerhoff (2012) 的“深度均匀收敛 \(\Leftrightarrow\) 中心区域 Hausdorff 收敛”等价定理从欧氏空间移植到球面拓扑(需验证球面凸集的 Hausdorff 距离性质与紧致性)。

  • 关键跳跃点
  • 引理 2(Gnomonic 等价性)\(\text{ahD}(x; P) = \text{hD}(\tilde{x}; P^\pm)\) 的严格建立。难点在于 gnomonic projection 不是全局双射(仅在每个半球内双射),且投影测度 \(P^\pm\) 依赖于半球的选取;作者通过 flag halfspace(Pokorný et al. 2022)的概念,巧妙地统一了不同半球投影下的测度定义,绕过了“投影测度不唯一”的障碍。
  • 定理 5 的均匀收敛升级:从 VC 类的均匀收敛 \(\sup_H |P_n(H) - P(H)| \to 0\) 到深度函数的均匀收敛 \(\sup_x |\text{ahD}(x; P_n) - \text{ahD}(x; P)| \to 0\)。难点在于下确界运算 \(\inf_{H: x \in H}\) 一般不保持均匀收敛(经验深度可能有尖峰);作者利用总体深度的均匀连续性 + 球面的紧致性,通过覆盖论证将逐点收敛升级为均匀收敛。

  • 技术技巧点名

  • Gnomonic projection:用在引理 2,将球面深度问题转化为欧氏深度问题,是全文证明的基石。
  • Flag halfspaces (Pokorný et al. 2022):用在定理 1 与引理 2,处理闭半球与开半球的边界问题,统一连续与离散测度的深度定义。
  • VC theory (Vapnik-Chervonenkis classes):用在定理 5,控制闭半球类上的经验过程,保证 \(P_n\)\(\mathfrak{H}\) 上的均匀收敛。
  • Dyckerhoff's convergence equivalence (Dyckerhoff 2012):用在定理 7-8,将深度收敛直接转化为中心区域收敛,避免重新构造 Hausdorff 收敛证明。
  • Covering argument on compact manifolds:用在定理 5 的均匀收敛升级,利用 \(\mathbb{S}^{d-1}\) 的紧致性与深度的均匀连续性,通过有限覆盖将逐点收敛提升为一致收敛。

真实例子与应用: 本文为纯理论论文,无实证例子、无模拟实验、无真实数据分析。所有结果均在抽象测度 \(P\) 与样本 \(X_1, \ldots, X_n\) 上严格证明。

🔎 结论是否比证明窄: - 作者在 abstract 与 intro 中泛泛 claim ahD “allows us to define elements of nonparametric inference, such as the median, the inter-quantile regions, or the rank statistics”,但正文中仅证明了中位数与中心区域的收敛性,未给出 rank statistics 的任何定义或收敛定理。这是一个结论比证明宽的信号——rank statistics 的构造与收敛需额外证明(可能依赖深度诱导的排序在球面上的连续性),目前仅为 conjecture。 - 作者在 intro 中暗示“recent progress on the computational front”使 ahD 具备应用潜力,但正文未提供任何计算算法或复杂度分析,也未引用具体算法论文。这一 claim 缺乏本文内部的支撑。


四、开放问题(点到为止,扎根具体语句)

  1. ahD 的收敛率与 minimax 下界:本文仅证明了几乎必然一致收敛(Glivenko-Cantelli 型),未给出收敛速度。要证/估的是:\(\sup_{x \in \mathbb{S}^{d-1}} |\text{ahD}(x; P_n) - \text{ahD}(x; P)|\) 的收敛率是否为 \(O(n^{-1/2})\)(或受 VC 维数 \(d+1\) 影响),以及该率是否达到 minimax 最优。扎根点:定理 5 仅陈述收敛到 0,无任何 rate;Dyckerhoff (2012) 亦无 rate 结果。
  2. 球面 rank statistics 的构造与渐近理论:作者 claim ahD 可定义 rank statistics,但未给出定义与定理。要证的是:基于 ahD 排序的球面 rank 是否具有分布自由的渐近性质(如渐近均匀性、Bahadur 表示)。扎根点:abstract 中“rank statistics”一词无正文定理对应。
  3. 放宽绝对连续性假设(A1)下的收敛性:本文的均匀收敛依赖 \(P\) 绝对连续(保证深度连续);若 \(P\) 含原子(如方向数据中常出现的重复角度),ahD 是否仍有逐点收敛或部分均匀收敛?扎根点:假设 A1 是定理 5-8 的必要条件,Pokorný et al. (2022) 在欧氏 hD 中已用 flag halfspaces 处理了原子测度,但本文未将此推广至 ahD 的收敛理论。
  4. 计算复杂度的严格分析:作者暗示计算障碍已消除,但未给出 ahD 计算的算法或复杂度界。要算的是:给定 \(n\)\(\mathbb{S}^{d-1}\) 上的点,计算所有点的 ahD 的最坏时间复杂度是否为多项式级,以及是否存在近似算法。扎根点:intro 中“recent progress on the computational front”无正文支撑;Pandolfo et al. (2018) 明确指出 ahD 计算成本高。

提醒:要确认“收敛率”是否为真 gap,建议检索 2020-2024 年球面/流形上深度函数的渐近理论文献约 5 篇——若均停留在一致性而无 rate,则为共识性真空白;若已有 rate 结果,则需对比本文设定与已有 rate 设定的差异。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论