A model-based approach to density estimation in sup-norm¶

作者: Guillaume Maillard
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 9/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么
子方向是 一致范数（sup-norm, \(L^\infty\)）下的非参数密度估计。基本问题是：给定来自未知分布 \(P\) 的 i.i.d. 样本 \(X_1,\dots,X_n\)（密度 \(p\) 相对于某一控制测度 \(\mu\)），如何构造一个估计量 \(\hat p_n\)，使得

\[\|\hat p_n - p\|_\infty = \operatorname{ess\,sup}_{x} |\hat p_n(x)-p(x)|\]

在 Oracle 不等式（备择：minimax 率）意义下可控。与 \(L^1\)、\(L^2\)、Hellinger 损失相比，sup-norm 的控制最难，因为它要求对最差一个点作出准确估计，且均匀性对平滑性假设非常敏感。该方向当前成熟度中等：早期有核估计的逐点渐近正态与一致收敛速度（如 1970s–80s），但缺乏统一的自适应框架。近十至十五年，以 Baraud 等为代表的“模型基估计”将问题重新包装为非参数选择的 Oracle 不等式问题。

发展脉络
从 奠基工作 到 当前 frontier 的线形梳理（用作者自己的引用句来定位）：

\(L^1\) 与 Hellinger 损失下的模型选择（文献[1,2,4]背景）。
Devroye & Lugosi (2001) 首先在 \(L^1\) 损失下解决了密度估计的模型选择问题（如直方图选择），给出了基于 VC 维的 Oracle 不等式。本文引用：“This problem was first solved by Devroye and Lugosi [2001, Chapter 6] in the case of the \(L^1\) loss”。
Baraud et al. (2016) 将方法推广到 Hellinger 距离，取得了更一般的 Oracle 不等式。本文引用：“and by Baraud et al. [2016] in the case of the Hellinger distance”。
Baraud (2014) 提供了对经验过程期望上界的一种精细控制（VC-major class 下，小方差函数类），这一技术被后续模型选择所复用。
\(\ell\)-estimation 统一框架（文献[5]）。
Baraud (2021) 提出了基于任意损失函数 \(d(\cdot,\cdot)\) 的模型基估计方法（称为“\(\ell\)-estimation”）。该方法的核心是：为每个候选模型 \(M\) 定义如下随机量

\[T_n(p) = \text{某种依赖于 } p \text{ 与样本的经验量}\]
使得 \(\mathbb{E}[T_n(p)] \ge d(p,P)\)（或 \(d(p,p^*)\) 的确定下界），然后通过最小化 \(T_n(p)\) 来选择 \(p\) 在模型内的近似。这一框架对 Hellinger、\(L^1\)、Wasserstein 等均奏效。本文的出发点是：“To achieve model-based estimation in the norm \(\|\cdot\|_{\infty,\mu}\), we adapt the general method of \(\ell\)-estimation introduced by Baraud [2021]。”
结构模型（例如单指标、多指标）的适应估计（文献[2,6]）。
Samarov & Tsybakov (2007) 提出了“多指标模型”（multi-index model）作为密度降维的先验：密度 \(p\) 依赖于 \(x\) 在某个低维子空间上的投影。他们主要考虑 MISE 风险下的聚合与适应。
Lepski & Rebelles (2020) 在 \(L^2\) 损失下研究了结构适应：假设在未知旋转下，二维密度的坐标独立且各自落在 Hölder 类中，给出了自适应 minimax 估计。本文引用：“This model was proposed by Samarov and Tsybakov [2004] and studied more recently by Lepski and Rebelles [2020]。”
当前 frontier 与本文位置。
在 Baraud (2021) 框架下，尚无对 sup-norm 损失的显式适配，因为 sup-norm 的自然经验模拟（max over grid）会导致有限的维数复杂度和粗糙的边界。
对单一指标模型这类结构性模型，在 sup-norm 下的最优率是开放的：即使在一维光滑度 \(\beta\) 已知时，也无结果。作者在引言中明确陈述：“Particularly interesting is the case of the single index model with fixed smoothness \(\beta\), where we recover the one-dimensional rate: this was an open problem.”

子线索聚类
从引文与引用句可以提取 2–3 条子线索：

子线索	代表工作	核心方法 / 损失	本文如何定位
(A) 统一模型选择框架	Baraud (2021); Baraud et al. (2016)	\(\ell\)-estimation 用于 Hellinger/\(L^1\)/Wasserstein	将 \(\ell\)-estimation 移植到 sup-norm
(B) 结构性密度降维	Samarov & Tsybakov (2007); Lepski & Rebelles (2020)	MISE（\(L^2\)）下的多/单指标适应	求解 sup-norm 下的等价适应问题
(C) 经验过程的精细控制	Baraud (2014); Baraud (2020)	VC-major class 的期望上界；\(\ell\)-estimation 的变体	体积条件的上界来源于此

核心问题
该方向在追问 2–3 个问题：
1. 统一 Oracle 不等式：对任意模型 \(M\)，能否给出形如

\[\|\hat p_n - p\|_\infty \le C \inf_{q\in M} \|p - q\|_\infty + \text{r}_n(M)\]

的不等式，且右侧第二项 \(\text{r}_n(M)\)（复杂性项）最优？
2. 自适应性与结构性：当真实密度 \(p\) 属于某种结构性类（如单指标、张量积型、各向异性光滑）时，模型选择能否自动匹配其本质维数，从而避免维数诅咒？
3. 体积条件的紧性：sup-norm 的复杂性控制需要关于“差接近最大值的集合体积”的假设——这是否为本质条件？能否被放松？

⚠️ 作者的 framing
作者把缺口 frame 为：“Baraud (2021) 的 \(\ell\)-estimation 方法适用于多种损失，但不直接涵盖 \(\|\cdot\|_\infty\)。本文通过引入一个基于体积的辅助量，使其适配 sup-norm。”这是典型的“把已有框架迁移到新设定”的策略。
作者淡化的竞争路线：
- 直接核密度估计（KDE） + 带宽选择的 bootstrap 方法已有 sup-norm 的一致收敛速率（例如 Gine & Guillou 2002），但其自适应依赖高阶 bias 估计且难以推广到结构性模型。作者未直接比较。
- 基于超平面的经验风险最小化（如导数积分平均）求解 sup-norm 损失: 计算上难以处理，且已有理论多是负面的（NP-hard 等），作者不提这一条。
- 什么明显该有但未出现？在高维下的计算与统计的权衡（如多项式时间可实现性）——本文只关注统计率，不讨论计算复杂性。对于一位计算受限统计研究者来说，这是一个值得查的缺口：单指标密度估计是否能在多项式时间实现 sup-norm 自适应？

张力
参考工作之间未见明显对立引用。Baraud 系列与 Devroye-Lugosi 是以不同损失为目标的互补工作；Lepski & Rebelles 则专注于 \(L^2\) 损失的结构适应。张力主要存在于损失函数选择（不同损失的最优率可能不同），但作者未在引言中提及这种比较。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

控制测度：\(\mu\) 是 \(X\) 上的 \(\sigma\)-有限测度（通常为 Lebesgue 测度或计数测度），\(X\) 是样本空间（本文假设为紧 Polish 空间）。
目标密度：真实分布 \(P\) 对 \(\mu\) 有密度 \(p = dP/d\mu\)，但 \(p\) 未必属于任何预先指定的模型。
模型：\(\mathcal{M}\) 是 \(\mu\)-a.e. 正的密度函数集合（满足 \(\int \tilde p \, d\mu = 1\)，\(\tilde p \ge 0\)）。模型可以是参数族、光滑类（如 Hölder）、单指标族等。
样本：独立同分布样本 \(X_1,\dots,X_n \sim P\)（即从真实 \(p\) 抽取）。
可观测 vs 不可观测：可观测的是样本值 \(X_i\)；不可观测的是 \(p\) 本身以及所有与 \(P\) 有关的积分量。例如 \(\|p - \tilde p\|_\infty\) 不能直接观测；但可以通过经验分布对 \(p\) 做估计。
损失：

\[\delta(p,q) = \|p - q\|_{\infty,\mu} = \operatorname{ess\,sup}_{x\in X} |p(x)-q(x)|.\]
体积条件：定义对于给定 \(\epsilon >0\)，

\[S_\epsilon(p,q) = \{x: |p(x)-q(x)| > \epsilon\},\]
其 \(\mu\)-测度 \( \mathrm{vol}(S_\epsilon) \) 是控制 sup-norm 估计的关键量。
估计量：\(\hat p_n = \hat p_n(X_1,\dots,X_n)\) 是取值为 \(\mathcal{M}\) 中的随机函数（若模型选择，则从一个可数族中选择）。

第二步：最小内核——单指标模型，已知 \(\beta\)，\(d=2\)，真密度属于模型¶

最简设定：
- 样本空间 \(X = [0,1]^2\)（二维）或 \(\mathbb{R}^2\)，\(\mu\) 为 Lebesgue 测度。
- 真密度 \(p^*\) 属于单指标模型：存在单位向量 \(\theta^* \in S^1\) 和一维密度 \(f^*\) 满足 Hölder 光滑度 \(\beta>0\)（如 Hölder(\(\beta,L\))，\(\beta\leq 2\)），使得

\[p^*(x) = f^*(\langle x, \theta^* \rangle), \quad x\in\mathbb{R}^2.\]

- 模型集合为：

\[\mathcal{M} = \big\{ p(x) = f(\langle x,\theta\rangle) : \theta\in\Theta, \, f \in \mathcal{F}(\beta,L) \big\},\]

其中 \(\Theta \subset S^1\) 是单位向量的离散化网格（大小为 \(n^{C}\) 以保证覆盖精度），\(\mathcal{F}(\beta,L)\) 是 \([0,1]\) 上有界 Hölder \(\beta\) 密度集合，且 \(\int f =1,\ f\ge 0\)。
- 假设置信：真 \(p^*\) 属于 \(\mathcal{M}\)（即存在某 \(f^*, \theta^*\) 表示 \(p^*\)）。
- 目标：构造估计量 \(\hat p_n\)，使得

\[\|\hat p_n - p^*\|_\infty = O_p\big(n^{-\beta/(2\beta+1)}\big),\]

即一维非参数最优率——注意此处是 sup-norm 下的一维形式，无维数诅咒。

最小内核的数学本质

去掉多余的一般性假设（真密度在模型内、\(\beta\) 已知、\(d=2\)），核心难处是：
1. 对每个固定的 \(\theta\)，如何经验地估计 \(\|f(\langle \cdot,\theta\rangle) - p^*\|_\infty\)？直接计算超平面上的最大偏差不可行。
2. 如何在不同 \(\theta\) 之间选择，使得最终估计的误差不超过最佳 \(\theta\) 误差的常数倍数？

关键想法（缩减成一张图）：

对每个固定 \(\theta\)，定义切片 \(Z_i = \langle X_i,\theta\rangle \in \mathbb{R}\)。由于 \(p^*(x) = f^*(\langle x,\theta^*\rangle)\)，如果 \(\theta=\theta^*\)，则密度简化为一维，问题退化为在 sup-norm 下一维密度估计（已知光滑度 \(\beta\)）。
但若 \(\theta\neq \theta^*\)，则映射 \(x\mapsto \langle x,\theta\rangle\) 不再是充分的，真实密度 \(p^*\) 在 \(\theta\) 方向的投影不是密度 \(f^*\)，而是某个二维投影（有额外变异性），会导致较大的逼近误差。
方法：对每个 \(\theta\)，构造一个临时密度估计 \(\hat p_{\theta}\)（通过一维核密度类型估计），然后定义一个经验准则 \(\text{crit}_n(\theta)\)，使得

\[\mathbb{E}[\text{crit}_n(\theta)] \approx \|\hat p_{\theta} - p^*\|_\infty (\text{或者被其控制}).\]
该准则来自 Baraud (2021) 的 \(\ell\)-estimation 框架。本文中的具体形式是：

\[\text{crit}_n(\theta) = \sup_{q\in B(\hat p_{\theta}, r_n)} \frac{1}{n}\sum_{i=1}^n 1_{q(X_i) > t} \quad \text{（调整参数 } r_n, t \text{ 适当选择）}.\]
通过将 \(R_n(\theta) = \sup_{q\in B(p^*_0, r_n)} \|q-p^*\|_\infty\)（某种局部 supremum）与体积条件联系起来：若近似误差集中在小的集合上，则经验准则的期望可以同样小。

当所有 \(\theta\) 比较时，模型选择准则保证最终选择的 \(\hat\theta\) 满足

\[\| \hat p_{\hat\theta} - p^* \|_\infty \le C \inf_{\theta} \| \hat p_{\theta} - p^* \|_\infty,\]

利用一维最优率即得结果。

核心数学困难在于证明：对任何 \(p,q\)（属于某模型），若 \(\|p-q\|_\infty = R\) 且在 \(S_{R/2}(p,q)\) 上的 volume 足够小，则可通过经验过程控制判别 \(p\) 与 \(q\) 的能力，从而保证 Oracle 不等式中的复杂性项是 逼近误差的函数，而非最坏情况。本文的体积条件给出了精确的量纲。

三、这篇论文做了什么¶

三句话
1. 研究了问题：在一致范数下，基于独立同分布样本，从任意给定的模型（真密度不必在其中）中找到准最佳逼近，并实现可数族模型的自适应选择。
2. 核心工具：Baraud (2021) 的 \(\ell\)-estimation 框架的 sup-norm 适配，加上一个体积条件（volume condition），用以控制模型内部函数的差集测度。
3. 主要结论：得到通用的 Oracle 不等式，该不等式中的复杂性项由体积条件界定；在分段多项式、各向异性光滑类上得到 minimax 最优率，并在单指标模型中恢复了维数无关的一维非参率，解决了 Lepski & Rebelles (2020) 等人的开放问题。

关键设定与假设（在第二节记号基础上补全）

数据：\(X_1,\dots,X_n\) i.i.d. 来自 \(P\)（目标密度 \(p\)）。控制测度 \(\mu\) 为有限测度，且 \(X\) 为紧 Polish 空间。
模型族：可数集 \(\{\mathcal{M}_m\}_{m\in\mathbb{N}}\)，每个 \(\mathcal{M}_m\) 是一族密度函数（定义在 \(X\) 上，nonnegative, integrate to 1）。
假设 HA（体积条件）：存在常数 \(c_0>0\) 和函数 \(\mathrm{v}(s): \mathbb{R}^+ \to [0,1]\)（非增），使得对于任意 \(p,q\in\mathcal{M}_m\)（或跨模型，见公式 (2.1)），

\[\mu\big( \{x: |p(x)-q(x)| > t\} \big) \le \mathrm{v}\big( \frac{t}{\|p-q\|_\infty} \big) \cdot \|p-q\|_\infty^{-c_0}.\]
实际应用时，作者对分段多项式证明了 \(\mathrm{v}(s) = C s^{-K}\) 形式的条件。
额外技术条件：模型内函数一致有界（存在 \(B\) 使得 \(p(x) \le B\) \(\mu\)-a.e.），且测度 \(\mu\) 为概率测度（不失一般性可标准化）。可测性与空间完备性为常规假设。

与已有文献的对比：相比 Baraud (2021) 对一般损失函数的统一处理，sup-norm 需要更强的体积条件；相比 Devroye-Lugosi 的 L1 结果，复杂性项从 VC-维变成体积条件。

主要结果

定理 1（单一模型 Oracle 不等式）：假设模型 \(\mathcal{M}\) 满足体积条件（和紧致性）。则存在依赖样本的估计量 \(\hat p_n \in \mathcal{M}\)，使得对任意 \(\delta>0\)，以概率 \(1-\delta\)，

\[\|\hat p_n - p\|_\infty \le c_1 \inf_{q\in\mathcal{M}} \|q - p\|_\infty + c_2 \sqrt{\frac{\log(1/\delta)}{n}} + c_3 r_n,\]
其中 \(r_n\) 是模型复杂度项，由体积条件中的函数 \(\mathrm{v}\) 和 \(n\) 决定。在典型设定下 \(r_n = O(\sqrt{\log n / n})\) 量级。
直觉：体积条件保证模型内部“相互接近的函数”其差异不会集中在很小的集合上，从而经验分布可以均匀分辨它们。
定理 2（模型选择 Oracle 不等式）：假设有一族模型 \(\{\mathcal{M}_m\}\) 满足体积条件。则存在选择机制给出 \(\hat m\) 和 \(\hat p_{\hat m}\)，使

\[\|\hat p_{\hat m} - p\|_\infty \le C \inf_{m}\big( \inf_{q\in\mathcal{M}_m} \|q-p\|_\infty + \text{pen}_m \big),\]
其中惩罚项 \(\text{pen}_m\) 依赖于 \(r_n,m\) 和体积函数的形状。
推论（单指标模型）：当 \(\mathcal{M} = \{ x\mapsto f(\langle x,\theta\rangle): \theta\in\Theta_N,\ f\in\mathcal{C}^\beta([0,1]), \|f\|_{\mathcal{C}^\beta} \le L\}\) 时（\(\Theta_N\) 是 \(N=O(n^{d-1})\) 个等距覆盖点），取合适的惩罚与估计构造，得到

\[\|\hat p_n - p^*\|_\infty = O_p\big( n^{-\beta/(2\beta+1)} \big),\]
其中维数 \(d\) 不出现在率中。这是 sup-norm 下的新结果，解决了开放问题。

证明路线与技术技巧

整体路线（3–5 步）

构造替代损失：对任意 \(p\in\mathcal{M}\)，定义经验统计量

\[U_n(p) = \frac{1}{n}\sum_{i=1}^n \phi\big(p(X_i)\big),\]
其中 \(\phi\) 是一个精心选择的非负函数（如截断型指示函数，尺度依赖于 p 和拟估计值），使得

\[\mathbb{E}[U_n(p)] \ge c \|p-p^*\|_\infty - \varepsilon_n,\]
且上偏差以指数衰减概率控制。具体：使用 Baraud (2021) 的一般构造，将损失函数嵌入到以先验半径定义的“球”上。
球上的经验过程控制：考虑模型内一个球

\[B(q, r) = \{ p\in\mathcal{M}: \|p-q\|_\infty \le r \}.\]
需要证明其上的经验过程 \(\sup_{p\in B(q,r)} |U_n(p) - \mathbb{E}[U_n(p)]|\) 的期望阶是 \(r^{\kappa} \sqrt{ \log N / n}\)（\(\kappa\) 由体积条件决定）。证明使用 Baraud (2014) 的 VC-major 类经验界，结合体积条件刻画球的“有效大小”。
定义估计量：

\[\hat p_n = \arg\min_{p\in\mathcal{M}} \big\{ U_n(p) + C \cdot \text{体积惩罚项} \big\}.\]
此处的体积惩罚项利用了定理2中的惩罚函数，确保过拟合（模型内选得太复杂）不会导致 sup-norm 误差增大。
Oracle 不等式的推导：对任意候选 \(q\in\mathcal{M}\)，方程两边做差值，先由第一步得到下界，再用第二步的局部经验界得到上界，从而将

\[\|\hat p - p^*\|_\infty \lesssim \|q - p^*\|_\infty + \text{复杂度项}.\]
模型选择：对可数族，采用切片比较：对每个 \(m\)，在惩罚项中用 \(n^{-1} \times (\text{模型维数}),\) 配上体积条件中的量。最终用 Baraud (2021) 中的标准模型选择论证（类似 Birgé & Massart 的 penalization 方法）。

关键跳跃点

体积条件如何进入复杂性项：通常的 \(\ell\)-estimation 中，复杂性控制用的是覆盖数（covering number）或 VC 维。但 sup-norm 下，函数的偏差在很小集合上可忽略，但经验过程会受极端值干扰。作者发现了：如果对任意小 \(\epsilon>0\)，有 \(\mu\{|p-q|>\epsilon\|p-q\|_\infty\} \le C\cdot\|p-q\|_\infty^\gamma\)，那么经验过程的偏差可以降低到 \(O( \sqrt{\frac{\log N}{n}} \cdot \|p-q\|_\infty^{\gamma/2})\)，从而实现分母的收缩。这一观察源自 Baraud (2014) 中对小方差函数类的上界。
跨模型比较的 penalty：在单指标例子中，模型集合包含不同的索引方向 \(\theta\)。不同 \(\theta\) 对应的模型大小不同且维数（\(d-1\) 维流形），因此 penalty 必须能匹配这种维数变化。本文使用覆盖数 + 体积条件联合界定 penetration bound。

技术技巧点名

Baraud (2014) 的经验界：用于获得局部小方差函数类上的 supremum 期望阶，是全文最核心的统计学工具。
体积条件的函数形式：在分片多项式的例子，作者通过显式计算球内函数差的最大体积导出 \(\mathrm{v}(s) = O(s^{-\kappa})\)。
离散化+覆盖：对单指标模型的索引空间 \(\Theta_{N}\) 做 \(\epsilon\)-net，并用组合求 and 的界联合控制。
Birgé-Massart 型惩罚：模型选择部分的标准工具，但需结合体积来构造可变的复杂性项。

真实例子与应用
本文为纯理论论文，没有真实数据例子或模拟实验。仅在第 4–5 节进行理论例证：
- 分段多项式：令 \(X=[0,1]^d\)，模型 \(\mathcal{M}_m\) 为在某个等矩形剖分上，每个单元内为次数 \(\le r\) 的多项式（且大于零、积分为 1）的密度集。作者证明体积条件成立且

\[r_n \asymp \sqrt{ \frac{m}{n} \log( n/m ) }.\]

从而估计的 sup-norm 误差为 \(O_p\big( (\frac{m}{n}\log n)^{1/2} + m^{-\alpha/d} \big)\)，与 L2 的 minimax 上界相匹配（但这里是 sup-norm）。
- 单指标模型：如上文所述，维数无关的一维率。
- 各向异性光滑类：设定与分段多项式类似，得到与各向异性维数相关的最优率。

🔎 结论是否比证明窄

定理 1 的 Oracle 不等式的系数 \(c_1\) 可能依赖于体积条件的常数（隐含在证明中）。所以虽写成常数阶，但实际应用时若要得到精确 minimax 常数，需进一步工作。论文中未声称常数最优（只提 2c_1 + 小项）。
单指标模型的结论假设 \(\beta\) 已知，并依赖一个有限覆盖网格（大小与维数相关）。若 \(\beta\) 未知，需要额外的适应性步骤，本文未处理（但模型选择框架在原理上允许，未证)。正文中：“the case where the smoothness is unknown… is left for future work”（第 6 节末）。
作者对多项式时间计算性没有任何讨论。虽然单指标模型的估计只涉及在一维核密度估计（计算廉价），但模型选择涉及在所有 \(\theta\) 上的遍历，需要 \(O(n^{d-1})\) 次一维估计，对高维 \(d\) 是不切实际的。这点未被提及，对统计-计算权衡感兴趣的研究者是一个可扩展的观察点。

四、开放问题（扎根具体语句）¶

未知光滑度的适应：
单指标模型的推论假设 Hölder 指数 \(\beta\) 已知。若 \(\beta\) 未知，能否通过本文的模型选择框架（使用不同光滑度 \(\beta\) 的模型族）达到自适应？作者在结论段写道：“The case where the smoothness is unknown… is left for future work.”
扎根句：脚注或第6节末相关语句。
体积条件的必要性与推广：
本文的 Oracle 不等式依赖体积条件。是否存在自然且无此条件的类（例如光滑函数类在 sup-norm 下具有全局紧性）使得性能同样成立？作者在引入体积条件时称：“the volume condition is necessary in a certain sense… but we do not prove necessity.”
扎根句：第2节末尾的 remark。
多项式时间实现的可行性：
对单指标模型，模型选择要求对覆盖网格 \(\Theta_N\) 中每个 \(\theta\) 做一次一维估计，网格大小 \(N = O(n^{d-1})\)，对高维（如 d≥5）不可计算。是否存在计算复杂度在多项式时间内（如随机搜索或逐步投影）且保持统计最优性的方法？本文完全不讨论计算，属于一个被遗漏的界面。
扎根句：第4.4节 “Model selection among single-index models” 中，明确使用了大小为 \(n^{d-1}\) 的离散化。
其他损失（如 \(L^p\)）下的类似结果：
本文针对 sup-norm，Baraud (2021) 针对 Hellinger/\(L^1\)，二者间是否有更统一的体积条件框架？或 \(L^2\) 下是否有更简明的结果？本文未做任何交叉比较。
扎根句：第1节末“It would be interesting to extend the methodology to other norms…”, 但作者未展开。

提醒研究者：若要确认第3条是否为真正 gap，可快速浏览近5年关于“单指标密度估计计算效率”的文献（如 Balabdaoui et al. (2019), Liu et al. (2020)），看它们是否在 sup-norm 下提出多项式时间方法。

Maintained by 陈星宇 · Homepage · Source on GitHub