Strong limit theorems for empirical halfspace depth trimmed regions¶

作者: Andrii Ilienko, Ilya Molchanov, Riccardo Turin
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向研究的是深度函数（depth function）及其诱导的修剪区域（trimmed regions）的经验估计的渐近性质。深度函数是多元非参数统计中一个核心概念，它将数据中心化程度量化为一个实值函数，其上层水平集（修剪区域）是数据中心区域的自然估计。本质问题在于：给定一个来自概率测度 \(\mu\) 的 i.i.d. 样本，经验深度和修剪区域是否收敛到其总体版本？收敛的速度和形式（概率收敛、几乎必然收敛、以及重对数律下的精确率）是什么？这是一个典型的非参数集合估计问题，其成熟度较高，已有大量关于弱收敛的工作，但强收敛的精确率结果相对较少。

发展脉络（History）¶

奠基工作与深度概念：Tukey (1975) 提出了半空间（halfspace）深度，这是最早也是最经典的深度概念之一。它的核心思想是：一个点 \(x\) 相对于分布 \(\mu\) 的深度，是所有包含 \(x\) 的半空间的最小概率。由此定义的上层水平集称为深度修剪区域（depth-trimmed regions），并构成了一个由外向内、层层嵌套的中心区域簇。Donoho & Gasko (1992) 等早期工作奠定了其作为稳健多变量位置估计的理论基础。
主要进展：弱收敛与几何联系：
- Dyckerhoff (2012)（被引文献[5]）：系统地研究了深度函数与修剪区域收敛性之间的逻辑关系，为后续分析提供了理论基础。该文给出了在较弱条件下，点态收敛等价于一致收敛，并推导了修剪区域在Hausdorff度量下弱收敛的条件。此方向的核心问题之一是建立经验估计的收敛率。
- Brunel (2016)（被引文献[3]）：取得了关键突破，证明了在半空间深度水平集（即修剪区域）的浓度（concentration）。在温和假设下，他证明了经验水平集与其总体版本之间的Hausdorff距离以参数速率 \(n^{-1/2}\) 概率收敛。这是该领域一个里程碑式的弱收敛结果。
- Nagy, Schuett & Werner (2018)（被引文献[1]）：建立了深度修剪区域与凸几何中凸浮动体（convex floating body） 之间的深刻联系。当 \(\mu\) 是某凸体 \(K\) 上的均匀分布时，深度修剪区域恰好是 \(K\) 的凸浮动体。这一发现将深度估计与古典几何测度论和仿射表面积等概念联系起来，为利用几何工具分析深度提供了新路径。
- Molina-Fructuoso & Murray (2021)（被引文献[2]）：从偏微分方程（Hamilton-Jacobi方程）的视角研究深度，为计算和理解深层性质提供了新理论框架（粘度解）。
当前Frontier与本文的位置：
- 前沿问题：已有弱收敛结果（如Brunel的 \(n^{-1/2}\) 概率收敛）已相当完备，但几乎必然（almost sure）收敛的精确率，特别是重对数律（Law of the Iterated Logarithm, LIL） 形式的率尚待建立。此外，结果多是关于Hausdorff距离收敛，而对集合包含关系（即一个集合几乎必然最终被另一个集合包含）这另一种更强、更适用于拓扑推断的收敛形式，研究较少。
- 本文的作者定位：这是作者的说法：作者将本文定位为“补全”，明确指出已有的弱收敛结果（如Brunel, 2016的 \(n^{-1/2}\) 率）在几乎必然意义下不成立，并需要更强的定理来解释其样本路径行为。作者声称，本文首次证明了经验修剪区域在集合包含意义下的Marcinkiewicz–Zygmund SLLN，以及在Hausdorff距离下的LIL。对于凸浮动体的特例，作者将结果与Fresen (2011) 的结论连接，声称解决了凸浮动体经验估计的强收敛问题，并给出了比其更精确的率。
- 被淡化或回避的竞争路线：这是作者的说法，作者明确指出[3]的结果是关于概率收敛，不适用于几乎必然收敛。作者没有深入讨论[5]中Dyckerhoff关于“点态收敛蕴含Hausdorff收敛”的充分性条件在强收敛下的适用性，而是直接提供了更具有构造性的证明框架。作者也回避了[2]中Hamilton-Jacobi方程方法在构建经验估计强收敛率上的可能应用。
- 什么明显该被引/该存在、却没出现在intro里？：作者提到[4]（Fresen, 2011）的结论是关于凸包与浮动体的Banach-Mazur距离，但本文结论是关于凸浮动体本身。未见到对计算几何/统计学习理论中“经验过程理论”在深度区域集合上的最新应用（如Dutta et al., 2021, 被引文献[7]）的引用，后者可能为本地的集合包含结果提供另一种证明思路。也未见对文献[11]（Laketa & Nagy, 2021）中关于射线基定理及其对最小修剪区域（中位数）表征的深入讨论。

子线索聚类¶

概率收敛与浓度：以Brunel (2016) 为代表，专注于在概率意义上建立经验水平集的收敛率（\(n^{-1/2}\)），是本文直接对比的基线。
几何与仿射联系：以Nagy et al. (2018) 为代表，将深度与凸浮动体、仿射表面积等几何概念联系起来，为深度研究提供了理论深度和新的推导工具。本文的凸浮动体特例正是利用了这条线索。
算法与PDE视角：以Molina-Fructuoso & Murray (2021) 为代表，从优化和偏微分方程角度理解深度，是一个新兴但独立的方向，与本文的强极限定理分属不同技术路线。
集合拓扑的强极限定理：以Ilienko & Molchanov (2017) 为代表，作者及其合作者之前的工作，是关于多维随机游走、更新集等随机集合的强极限定理（SLLN, LIL）。本文可以看作是将这套随机集合强极限理论应用于由深度函数定义的、结构更复杂的随机集合。

方向核心追问与瓶颈¶

几乎必然收敛率是否紧？ 对于给定的分布类，Hausdorff距离下的LIL率 \((n^{-1}\log\log n)^{1/2}\) 是否是最优的？能否建立匹配的minimax下界？
集合包含意义下的收敛刻画了什么？ 这种更精细的收敛形式（一个区域几乎必然最终包含另一个区域）对于构造稳健的置信区域或进行假设检验有何具体优势？它的适用条件（如凸性）是否可以放松？
维度诅咒如何体现？ 半空间深度的收敛率是否会因为维度升高而退化（出现\(n^{-1/d}\)等慢速率）？本文的定理对维度\(d\)的依赖是隐含在约束条件（如对\(R_\varepsilon(\alpha)\)的覆盖数界）中，而非显式给出。这是否意味着在高维下结果可能变得保守或难以应用？
如何推广到其他深度？ 该强极限定理的证明技术是否适用于其他深度量（如simplicial depth, projection depth）及其相应的修剪区域？

张力¶

未在作者引用的文献中见到明显的结论矛盾。主要张力在于从弱收敛向强收敛的跳跃本身，以及从Hausdorff距离收敛到集合包含收敛的增强。作者通过在本文定理中同时提供SLLN（集合包含）和LIL（Hausdorff距离）两个结果，来彰显其理论贡献。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

\(\mu\): 一个定义在 \(\mathbb{R}^d\) 上的概率测度。这是总体的、真实的世界，不可直接观测。例如，可以是某个规律下的分布。
\(\alpha\): 深度水平（depth level），一个介于 \(0\) 和 \(1/2\) 之间的数。它定义了修剪区域的边界，即深度值为 \(\alpha\) 的点构成的区域边界。
半空间深度 \(D(x; \mu)\): 对于任意点 \(x \in \mathbb{R}^d\)，其相对于 \(\mu\) 的深度定义为 \(D(x; \mu) = \inf_{H: x \in H} \mu(H)\)，其中 \(H\) 是闭半空间。深度越大，点 \(x\) 越“中心”。
理论修剪区域 \(G(\alpha)\): 对于水平 \(\alpha \in (0, \sup_x D(x;\mu))\)，理论修剪区域定义为深度超过 \(\alpha\) 的点的集合：\(G(\alpha) = \{ x \in \mathbb{R}^d : D(x;\mu) \ge \alpha \}\)。它是一个凸集。这是我们要估计的目标（estimand）。
\(X_1, \dots, X_n\): 根据 \(\mu\) 的 i.i.d. 样本。这是可观测数据。
经验测度 \(\mu_n\): 由样本定义的离散测度：\(\mu_n(A) = (1/n) \sum_{i=1}^n \mathbb{1}(X_i \in A)\)。
经验半空间深度 \(D(x; \mu_n)\): 用经验测度 \(\mu_n\) 代替理论测度 \(\mu\) 计算出的深度。
经验修剪区域 \(\widehat{G}_n(\alpha)\): 对应于经验深度超过 \(\alpha\) 的点的集合：\(\widehat{G}_n(\alpha) = \{ x \in \mathbb{R}^d : D(x;\mu_n) \ge \alpha \}\)。这是我们从数据中能计算出的估计量。
Hausdorff距离 \(d_H(A, B)\): 度量两个集合 \(A\) 和 \(B\) 之间最大可能距离的度量。\(d_H(A, B) = \max\{\sup_{a \in A} \inf_{b \in B} \|a-b\|, \sup_{b \in B} \inf_{a \in A} \|a-b\|\}\)。如果两个集合非常接近，这个距离很小。
潜在量 / 不可观测的量：\(\mu\) 和由它定义的 \(G(\alpha)\) 是不可直接观测的。所有估计性质都必须基于对 \(\mu_n\) 和 \(\widehat{G}_n(\alpha)\) 的分析。

第二步：讲最小内核¶

特例：考虑一维情况 (\(d=1\))。此时，半空间就是射线 \((-\infty, t)\) 或 \([t, \infty)\)。

模型：设 \(\mu\) 是实数轴 \([-1,1]\) 上的均匀分布。分布函数 \(F(t) = (t+1)/2\)。
可观测数据：来自该均匀分布的 i.i.d. 样本 \(X_1, \dots, X_n\)。样本经验分布函数 \(F_n(t)\)。
理论深度和修剪区域：
- 半空间深度 \(D(x; \mu) = \min(F(x), 1-F(x)) = \min((x+1)/2, (1-x)/2) = (1-|x|)/2\)。这是一个对称的三角形函数，在0处达到最大值1/2，边缘处为0。
- 理论修剪区域 \(G(\alpha) = \{ x: (1-|x|)/2 \ge \alpha \} = \{ x: |x| \le 1-2\alpha \} = [-(1-2\alpha), 1-2\alpha]\)。它就是中心长度为 \(2(1-2\alpha)\) 的对称区间。
这个例子下的核心问题：经验修剪区域 \(\widehat{G}_n(\alpha)\) 是什么？它能以多快的速度几乎必然地收敛到理论区间 \([- (1-2\alpha), 1-2\alpha]\)？
- 经验深度：对于点 \(x\)，经验深度 \(D(x; \mu_n) = \min(F_n(x), 1-F_n(x))\)。
- 经验修剪区域：\(\widehat{G}_n(\alpha) = \{ x: D(x;\mu_n) \ge \alpha \}\)。这等价于样本分位数区间：\(\widehat{G}_n(\alpha) = [X_{(\lceil n\alpha \rceil)}, X_{(\lceil n(1-\alpha) \rceil)}]\)，其中 \(X_{(i)}\) 是第 \(i\) 个顺序统计量。例如，对于\(\alpha=0.1\)，这个区间是第10%和90%百分位数之间的区域。
本文的核心思想（在这个特例下）：
- 集合包含的SLLN：定理的核心结论之一是：对于任何固定的 \(\alpha\)，存在一个序列 \(\varepsilon_n \to 0\)，使得几乎必然地，对足够大的 \(n\)，有 \(\widehat{G}_n(\alpha) \subseteq G(\alpha - \varepsilon_n)\)（或反过来）。在一维情况下，这意味着经验分位数区间几乎必然最终位于理论分位数区间的一个“薄”扩展内。这等价于经典顺序统计量的强大数定律。
- Hausdorff距离的LIL：更精确地，Hausdorff距离 \(d_H(\widehat{G}_n(\alpha), G(\alpha))\) 的收敛率是 \((n^{-1}\log\log n)^{1/2}\)。在一维特例下，这等价于学习样本分位数的重对数律：\(\limsup_{n \to \infty} (n/(\log\log n))^{1/2} |X_{(\lceil n\alpha \rceil)} + (1-2\alpha)| = \) 某个与密度有关的常数。
为什么这个例子是内核：它去除了所有关于高维、半空间组合的复杂几何，将问题简化为“学习一个区间”。核心结论：经验修剪区域（即一个区间）几乎必然以Hausdorff距离 \((n^{-1}\log\log n)^{1/2}\) 的率收敛到真实区域。整篇论文就是想把这个从一维情况已知的结论推广到任意维度的凸集（半空间深度区域）。在一维，Hausdorff距离收敛就是区间端点的收敛；在高维，需要处理更复杂的集合边界和支撑超平面。

三、这篇论文做了什么¶

三句话：① 研究了概率测度 \(\mu\) 的经验加权半空间深度修剪区域 \(\widehat{G}_n(\alpha)\) 的几乎必然收敛性质。② 核心工具是随机集合的强大数定律和重对数律，证明利用了经验过程理论、VC维和覆盖数，并通过引入一个辅助的“A-正则”函数来表征集合的厚度。③ 主要结论是：证明了在集合包含意义下的Marcinkiewicz–Zygmund SLLN，和在Hausdorff距离下的LIL，收敛率为 \((n^{-1}\log\log n)^{1/2}\)；在 \(\mu\) 为凸体上均匀分布的特殊情形下，这给出了凸浮动体经验估计的强收敛结果。
关键设定与假设（在第二节符号基础上的补充）：
- \(A\)-正则性 (Assumption 1.2)：这是本文的核心技术性假设。它要求存在一个定义在方向上的函数 \(z_\mu\) 和一个单调递减函数 \(\psi_\mu\)，使得任意由半空间定义的区域 \(H\) 的“深度”可以线性化。在定理1.5的特例下（凸体均匀分布），\(A\) 被具体化为方向函数的梯度范数。本质上，这个假设是为了保证深度函数的边界具有良好的性质，能够被近似为一系列由特定半空间（“界定”半空间）支撑的集合的并。它避免了深度函数可能出现的复杂、非正则的几何形状。
- 对 \(R_\varepsilon(\alpha)\) 的覆盖数界 (Assumption 4.6)：定理4.7（Hausdorff距离下的LIL）要求对 \(\alpha\) 的一个邻域内的所有值，集合 \(G(\alpha) \setminus G(\alpha+\varepsilon)\)（即不同深度水平之间的“环”状区域）具有一定的复杂度，能用有限个半径为 \(\varepsilon\) 的球覆盖。这是常见的经验过程复杂度控制条件，保证了Glivenko-Cantelli类和Donsker类性质，是处理Hausdorff距离的核心。
- 分布无条件：除了上述正则性条件和紧支撑假设外，模型对 \(\mu\) 没有严格的假设（如严格凸、绝对连续等）。结果适用于任意使得修剪区域非空且满足假设的概率测度。这相比之前需要较强假设的结果（如Fresen (2011) 要求log-concave分布）是一个显著放宽。
主要结果：
1. 定理 2.1 (Marcinkiewicz–Zygmund SLLN for Set Inclusion)：
  - 陈述：设 \(G(\alpha)\) 非空并满足 Assumption 1.2。存在一个常数 \(p \in (0,1)\) 和一个非负序列 \(\varepsilon_n \to 0\)，使得对于任意 \(\delta > 0\)，几乎必然存在一个指数 \(N\)，对所有 \(n \ge N\)，有 \(\widehat{G}_n(\alpha) \subseteq G(\alpha - \varepsilon_n)\) 和 \(G(\alpha + \varepsilon_n) \subseteq \widehat{G}_n(\alpha)\)。
  - 直觉：经验区域和真实区域被一个厚度渐变为0的壳所分离。这个壳的厚度\((\varepsilon_n)\)在SLLN下是确定的（非随机）。它刻画了样本集“最终”会稳定在真实区域附近。
  - 必要条件：\(G(\alpha)\) 非空和 \(A\)-正则性假设。\(\varepsilon_n\) 的具体构造依赖于深度函数的几何。
  - 解决的技术难点：直接处理集合包含关系比Hausdorff距离更难，因为需要精细地控制哪半空间被包含。作者通过引入集合函数 \(\phi(A) = \max\{ \mu(H \setminus G(\alpha)) : H \text{ is a halfspace in } A \}\) 和其经验版本，来量化和界定这种包含关系。
2. 定理 2.2 (Law of the Iterated Logarithm for Hausdorff Distance)：
  - 陈述：在更强的正则性条件下（Assumption 4.6），有
    \[\limsup_{n\to\infty} \frac{\sqrt{n}}{\sqrt{\log\log n}} d_H(\widehat{G}_n(\alpha), G(\alpha)) = C(\mu, \alpha) \ \text{a.s.},\]
    其中 \(C(\mu, \alpha)\) 是一个由分布决定的正则常数。
  - 直觉：这是样本路径最强的收敛结果，给出了“波动”幅度的精确渐近量级。
  - 必要条件：更强的正则性（用来控制边界区域）和对 \(n\) 的Borel-Cantelli引理式的精细论证。
  - 解决的技术难点：将Hausdorff距离的收敛转化为经验过程 \(G_n(t) = \sqrt{n}(F_n(t) - F(t))\) 在某个紧集上（由支持函数定义）的LIL。这需要处理经验过程的连续模。
3. 定理 6.3 (凸体均匀分布的特例)：
  - 陈述：如果 \(\mu\) 是凸体 \(K\) 上的均匀分布，且 \(K\) 的边界是 \(C^2\) 的且具有正高斯曲率，那么对于 \(\alpha \in (0, 1/2)\)，经验凸浮动体的Hausdorff距离收敛满足LIL，率为 \((n^{-1}\log\log n)^{1/2}\)。
  - 贡献：明确地将一般结果应用于几何中经典的凸浮动体上，给出了具体、可验证的条件。
证明路线与技术技巧（理论型）：
- 整体路线：
  1. 第一步：化归为半空间族。 证明修剪区域可以表示为某些半空间族的交集。关键引理（Lemma 2.3）证明：\(\widehat{G}_n(\alpha) = \bigcap \{ H: \mu_n(H) < \alpha \}\)，即经验区域是所有“不包含太多样本点的”半空间的交集。
  2. 第二步：分离集合包含与Hausdorff距离。 对集合包含关系的证明（定理2.1），核心是找到一组“尖端”方向，使得修剪区域的边界点能被这些方向上的极端半空间逼近。作者构造了一个泛函 \(\kappa(A) = \sup \{ t: A \subseteq G(\alpha - t) \}\) 来描述一个集合 \(A\) 被真实区域 \(G\) 所包含的“深度”。这个泛函的收敛等价于集合包含的收敛。
  3. 第三步：对集合包含建立经验过程。 将 \(\mu\) 的经验测度 \(\mu_n\) 看作是 \(\mu\) 的一个扰动。利用 \(A\)-正则性假设，作者证明了 \(\kappa(\widehat{G}_n(\alpha))\) 近似于 \(\mu(\widehat{G}_n(\alpha))\) 的函数，从而将对集合的收敛转化为对经验测度在某个（随机）集合上的积分收敛。这最终可归结为对定义在 \(\hat{G}_n(\alpha)\) 上的经验过程 \(\sqrt{n}(\mu_n - \mu)\) 的LIL分析。令人惊讶的是，作者证明 \(\hat{G}_n(\alpha)\) 几乎必然最终被包含在某个可控的集合中，从而避免了处理随机集带来的不自适应问题。
  4. 第四步：对Hausdorff距离进行更精细的刻画。 Hausdorff距离可以表示为支持函数的L∞范数。而支持函数可以写为 \(\sup_{u\in S^{d-1}} |\mu_n(H_u(c)) - \mu(H_u(c))|\)，其中 \(H_u(c)\) 是法向为 \(u\), 距离原点为 \(c\) 的半空间。因此，问题转化为研究一个有界函数集上经验过程的LIL。为此，作者需要验证Donsker定理的条件，并利用Vapnik-Chervonenkis理论控制熵积分，最终得到\(\sqrt{n}\)率下的对数项。
  5. 第五步：常数识别。 LIL中的常数 \(C(\mu, \alpha)\) 被识别为与某个半空间的边界处深度函数的局部变化有关。在凸体例子中，它可以用高斯曲率表示。
- 关键跳跃点：
  - 从集合包含到经验过程 (定理2.1 的证明)：最吃功夫的地方是证明 \(\widehat{G}_n(\alpha) \subseteq G(\alpha - \varepsilon_n)\) 和其逆。作者构造了一个函数 \(\Phi\)，使得 \(\Phi(\widehat{G}_n(\alpha))\) 的经验过程收敛于 \(\Phi(G(\alpha))\)，从而导出包含关系。这里的技巧在于对“从经验深度到真实深度的距离”进行一个积分刻画。
  - 对Hausdorff距离中 \(\varepsilon\) 的界定 (定理2.2 的证明)：遇到的主要困难是，对\(\alpha\)的一个微小扰动，\(G(\alpha)\) 的Hausdorff距离可能不是平滑的。作者通过引入Minkowski加和（Minkowski sum）\(G(\alpha) \oplus \varepsilon B\)（\(B\)为单位球）和侵蚀（erosion）\(G(\alpha) \ominus \varepsilon B\)来绕过这一点，将Hausdorff距离的LIL转化为对这些膨胀/侵蚀后区域的深度水平变化的LIL。这利用了\(G(\alpha)\)的凸性。
- 技术技巧点名：
  - 经验过程理论：全文贯穿，用于处理\(\mu_n(f) - \mu(f)\)的均匀收敛。
  - VC理论 / 覆盖数：用于控制函数类的复杂度，为Donsker性质和LIL提供条件（Assumption 4.6）。
  - Borel-Cantelli引理：用于从概率收敛升级为几乎必然收敛，是SLLN和LIL证明的标配。
  - Minkowski和/差：用于将Hausdorff距离的收敛转化为深度水平的变化，简化了集合几何的处理。
  - 凸分析/支撑函数：用于将集合间的Hausdorff距离转换为支持函数间的L∞距离。
  - Marcinkiewicz–Zygmund SLLN：用于建立随机集合在弱矩条件下的强收敛性。
  - 对称化/泊松化：文本中提到使用Poissonization将独立但未必同分布的随机变量转化为同分布，便于应用SLLN。
真实例子与应用： 本文为纯理论，无真实数据实证例子。论文所有示例（Section 6）均为理论特例，包括凸体均匀分布（给出积分几何弧长公式）和对称分布（如均匀在圆盘上，修剪区域为圆）。这些例子主要用于展示和验证所提出理论结果的具体形式，并说明常数\(C\)的计算。
🔎 结论是否比证明窄：
- 是，结论的范围比证明所覆盖的假设要宽泛。定理2.2的LIL要求很强的正则性（Assumption 4.6），但作者在定理中将其陈述为“对于满足假设1.2和4.6的测度”，这个假设包含了非常强的集合边界的性质（如光滑性、正曲率）。然而，作者在引言和结论的总结性段落（如Corollary 6.3）中，将其作为一般性结果来陈述。这是一个典型的口径差异：证明在一个强假设下成立，但结论被泛化成看似适用于更广的分布。特别是，要求分布密度在边界处非零且边界光滑，这对很多应用（如稀疏分布、有尖角分布的深度区域）可能不成立。作者在定理假设中明确陈述了这些，但在结论总结时没有反复强调其限制性，这符合学术写作惯例，但研究者需注意。

四、开放问题（点到为止，扎根具体语句）¶

Minimax下界与最优性：定理2.2的LIL率 \((n^{-1}\log\log n)^{1/2}\) 在给定分布类（如所有满足Assumption 4.6的分布）下是否可达到？能构造匹配的minimax下界吗？（扎根于定理2.2中对常数的唯一性陈述和假设4.6的强烈依赖，暗示该率可能依赖于分布函数的局域性质，且未必对所有分布都是最小最大最优率。）
非凸或非规则的修剪区域：本文定理要求修剪区域是凸的（由半空间交集得到），这是半空间深度的固有性质。但许多其他深度（如simplicial depth）的修剪区域可能非凸。本文的证明（特别是使用Minkowski和与Complexity控制的部分）是否适用于非凸区域？（扎根于引言和Section 2.1中对凸性的依赖，如利用支撑函数和Minkowski和的论证。）
高维缓慢率：定理的收敛率没有显式依赖维度\(d\)，但Assumption 4.6中的覆盖数\(N(\varepsilon)\)随\(d\)增长（通常是\(O(\varepsilon^{-d})\)）。这在高维下会导致整个收敛率退化到近似\(n^{-1/d}\)，但本文的LIL率是参数化的\((n^{-1}\log\log n)^{1/2}\)。这暗示了定理结果可能只在中等维度有意义，或者需要更精细的条件（如稀疏结构）来避免维度诅咒。作者在结束语中未讨论这个问题。（扎根于Assumption 4.6的表述，以及对假设1.2（A-正则）的几何解释，这预言了高维下的困难。）
常数\(C\)的显式表达式与可计算性：LIL常数\(C(\mu, \alpha)\)被证明存在，但未给出一般性公式。在凸体、光滑边界等特例下，它由高斯曲率刻画。但对一般分布，这个常数能否用可计算的经验量来近似，从而构造渐近置信区间？（扎根于定理6.1和6.2对常数\({c_{d-1}}\)的计算，以及定理2.2之后对常数\(C\)未显式表达的讨论。）

Maintained by 陈星宇 · Homepage · Source on GitHub