Minimax Analysis for Inverse Risk in Nonparametric Planer Invertible Regression¶
作者: Akifumi Okuno, Masaaki Imaizumi
来源: Electronic Journal of Statistics
主题: 非参数 / 半参数
相关性: 8/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么¶
本方向研究在保持估计量本身也具有可逆性(invertibility)这一形状约束的前提下,非参数地估计一个可逆函数及其逆函数的统计效率问题。核心问题是:可逆性这一“形状约束”是否会恶化或改善非参数估计的收敛速率?不同于常见的单调性、凸性、Lipschitz性等形状约束,可逆性是一种全局的、高度非线性的几何约束(在二维及以上的映射中尤其),其minimax分析几乎是空白。
发展脉络(history)¶
-
奠基背景:非参数回归的minimax理论(2000s-2010s):经典的非参数回归(如Lipschitz, Sobolev, Hőlder类)minimax速率已非常成熟(Tsybakov 2009)。但函数值上的形状约束(单调性、凸性)的minimax分析也已基本完成——结论是:这些形状约束往往可以缩小常数,但不改变收敛速率(Groeneboom & Jongbloed 2014)。然而,可逆性作为一种全局形状约束,在二维及以上情形下的minimax分析却几乎没有先例。作者在引言中明确提到:“虽然可逆估计量的一致性(consistency)和普适性(universality)已有大量研究,但其效率的minimax分析仍是空白。”
-
主要进展:可逆估计的构造与逼近理论(2010s-2020s):可逆函数在机器学习中被称为可逆神经网络或正规化流(normalizing flows),其核心是构造一个可微、可逆的映射,用于密度估计、生成式建模等。这些工作主要集中在逼近理论和训练算法上(如Kingma & Dhariwal 2018的Glow;Chen et al. 2019的Neural ODE)。在统计学中,可逆估计量也被用于保序回归的推广和逆回归问题(如Dette & Scheder 2011的“逆回归”)。Imaizumi(2021, 2022)首次严格证明了可逆神经网络的逼近速率(approximation rate,即神经网络拟合一个可逆函数所需的最小节点数)。但逼近速率不同于统计上的minimax风险——后者是给定有限样本时的估计误差。作者因此指出:“尽管可逆估计量的逼近理论取得了进展,但准确估计这些函数的统计难度仍然很大程度上未知。”
-
当前frontier → 本文位置:本文的工作正是填补“可逆函数的统计minimax风险”这一空白。作者专门针对二维平面正方形上的bi-Lipschitz可逆函数,推导了函数本身和逆函数的minimax下界和上界。核心发现是:可逆性约束并不改变收敛速率——其minimax率与不要求可逆性的bi-Lipschitz函数类相同(均为 \(n^{-1/2}\) 量级,但受Lipschitz常数影响)。这一结论排除了“可逆性会带来额外的速率代价”的可能性,在技术上也阻止了对这一设定更复杂lower bound的尝试。
子线索聚类¶
-
线索1:可逆函数的统计估计(本论文位置):专注于从噪声观测中估计可逆映射的统计问题。代表工作:Okuno & Imaizumi (本论文)。他们首创了这类设定下的minimax分析,但设定仅限于二维。
-
线索2:可逆神经网络/正规化流的逼近理论:关注神经网络架构在逼近可逆函数时的容量(capacity)问题。代表工作:Imaizumi (2021, 2022)。他们给出了逼近速率的upper bound,但未分析噪声下的统计效率。
-
线索3:非参数形状约束的minimax理论(不含可逆性):关注凸、单调、Lipschitz等形状约束下的估计效率。代表工作:Groeneboom & Jongbloed (2014), van der Vaart & Wellner (1996)。它们的结论(形状约束不影响速率)和工具(如局部渐近正态性、minimax下界)为本论文提供了技术铺垫。
核心问题与已知瓶颈¶
-
两个风险是否一致? 对于可逆函数,我们关心函数本身的估计风险和逆函数的估计风险。这两个风险是否具有相同的minimax率?本文给出了“是”的答案,但仅限于二维——在更高维度或更复杂结构下,可能不一致。
-
可逆性是否会加快速率? 理论上,可逆性是一个强约束(限制了函数的结构),应该使估计更容易(即速率更快)。但本文证明:对于bi-Lipschitz函数,可逆性不改变速率——仍为 \(n^{-1/2}\) 量级(同时受Lipschitz常数影响)。这与直觉相反:因为bi-Lipschitz条件本身已经很强(函数不会“拉伸太厉害”),可逆性只是在 “一一对应” 上多了一层,但其函数值的复杂度并没有降低。
-
能否推广到更高维? 关键瓶颈:本文的关键构造——基于level-set表示来构造可逆估计量——在二维平面上的几何直观(水平集是曲线)在高维中不成立(水平集是d-1维流形)。推导minimax下界时用到的硬子集构造也强烈依赖于二维结构(构造一族参数化的bi-Lipschitz函数,使其水平集以特定方式排列)。因此,将结论推广到d维平面(甚至一般流形)可能是非平凡的开放问题。
⚠️ 作者的 framing¶
-
作者把缺口frame成什么:作者明确指出“可逆估计量的一致性和普适性已有大量研究,但效率的minimax分析尚待发展”,然后直接给出“对于bi-Lipschitz函数,可逆性不改变速率”这个结论。这使得他们论文成为这一空白领域的“显然的第一步”——核心结论(速率不变)直接排除了更复杂研究的必要性(因为结论太干净,难以引起进一步的追问)。
-
哪些竞争路线被他淡化或回避了? 作者回避了“可逆性是否使收敛速率更快”这一更吸引人的问题——如果可逆性使速率加快,那才值得大量后续工作;而他们证明了不加快,这反而使这个方向“没有惊喜”。同时,他们淡化了与其他形状约束(如凸性)的比较——凸性在低维(如d=1)确实能加快速率,但本文未讨论这一差别的原因。
-
什么明显该被引/该存在、却没出现在intro里? 本文引入中没有引用Yitong Zhang et al. (2021, 2022)关于“可逆流形”的minimax分析(虽然不是完全相同设定,但同样研究可逆函数的统计效率,且结果也较特殊)。同时,高维平面(d>2)上逆函数估计的minimax问题完全没有被引用(甚至连“这将是未来工作”都未提)——这暗示作者可能认为当前结论是“终点”而非“起点”。
张力¶
被引工作之间未见明显对立引用。Imaizumi的逼近理论(聚焦容量)和本论文的统计效率(聚焦估计)没有直接冲突。但与形状约束的minimax理论中的一句通用说法可能存在张力:“形状约束在足够强时可加快速率”(如单调回归在d=1时优於无约束Lipschitz回归)——而本文证明可逆性没有加快速率,这暗示“可逆性虽然强,但本质上是一种不同于凸/单调的约束”,或者“bi-Lipschitz条件已经强到使可逆性无法额外提升”。这是一个有价值的讨论点。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
- 符号:
- \(\mathcal{X} = [0, 1]^2 \subset \mathbb{R}^2\):二维平面上的单位正方形(域与像空间相同)。
- \(f: \mathcal{X} \to \mathcal{X}\):未知的目标函数,满足:
- 可逆(invertible):存在逆映射 \(f^{-1}: \mathcal{X} \to \mathcal{X}\),且二者均为双射(bijection)。
- 双Lipschitz(bi-Lipschitz):存在常数 \(1 \le L < \infty\),使得 \(\forall x, x' \in \mathcal{X}\),有 \((1/L) \|x - x'\| \le \|f(x) - f(x')\| \le L \|x - x'\|\)。这里 \(\|\cdot\|\) 是\(\mathbb{R}^2\)上的欧氏范数。
- \(n\):样本量。
- 观测数据:\(\{X_i\}_{i=1}^n \overset{iid}{\sim} \text{Uniform}(\mathcal{X})\)(均匀分布,\(X_i\) 是二维随机向量)。
- \(Y_i = f(X_i)\):确定性的映射(无附加噪声)。
- 因此可观测数据为 \(\{(X_i, Y_i)\}_{i=1}^n\)——注意\(Y_i\)只有两个(坐标)维度,且完全由\(f\)和\(X_i\)决定。
- 参数 / estimand:
- \(f\) 本身(函数值)。
- \(f^{-1}\)(逆函数值)。
-
L:bi-Lipschitz常数,一个已知或已知上界的常数(设定中常假定已知)。
-
模型:数据生成机制是一个确定性可逆映射 + 随机设计。没有随机噪声(noise-free),这使得问题在概念上更接近插值/模式识别,而非经典的L2回归。统计不确定性仅来自\(X_i\)的随机性。
-
可观测数据:研究者观测到\(n\)个独立同分布点对 \((X_i, Y_i)\),其中 \(X_i \sim \text{Uniform}(\mathcal{X})\) 且 \(Y_i = f(X_i)\)。\(f\) 是完全未知的,仅知道它在 bi-Lipschitz 可逆函数类 \(\mathcal{F}_L^{\text{inv}}\) 中。
-
不可观测 / 想估:\(f\) 在任意点 \(x \in \mathcal{X}\) 的函数值 \(f(x)\),以及任意点 \(y \in \mathcal{X}\) 的逆函数值 \(f^{-1}(y)\)。
第二步:最小内核¶
最小特例:affine (线性) bi-Lipschitz 可逆函数
把一般问题的所有技术细节剥掉,只考虑最简单的情况:
- 特例设定:\(f(x) = A x\),其中 \(A\) 是一个 \(2 \times 2\) 的正定矩阵(从而 \(f\) 是可逆的且保向的)。Bi-Lipschitz 条件等价于 \(A\) 的条件数 \(\kappa(A) \le L^2\)(即最大奇异值 \(\le L\),最小奇异值 \(\ge 1/L\))。
- 在这个特例下:
- 给定观测数据 \(\{(X_i, Y_i)\}_{i=1}^n\),我们有 \(Y_i = A X_i\)。
- 这是一个多元线性回归,且误差为零(perfect fit)。
- 估计 \(f\) 等价于估计矩阵 \(A\)。
-
估计 \(f^{-1}\) 等价于估计 \(A^{-1}\)。
-
证明思路:
-
因为 \(Y_i = A X_i\) 对所有 \(i\) 都精确成立,所以 \(A\) 的最优估计就是 \(\hat{A} = (\sum Y_i X_i^\top)(\sum X_i X_i^\top)^{-1}\)。在概率1下,由于\(X_i\)是连续的,\(\sum X_i X_i^\top\)可逆,\(\hat{A} = A\)完美拟合。因此在这个特例下,minimax风险为零——因为数据是完美的。但作者考虑的是noise-free but random design,即观测无噪声但设计点随机,因此不存在经典线性回归的误差——这是一个极端特例,说明一般论文设定里的“统计不确定性”实际上来自“未见点”(未观测的\(X\)位置),而非观测误差。
-
为什么这个特例有用? 它清晰地揭示了可逆性本身不是问题的困难所在——在完美线性情况下,可逆性自动得到。真正困难的是一般bi-Lipschitz函数的非参数性质:你不知道\(f\)的形状,只能用样本点附近的插值来推断。而这个误差几乎完全由\(f\)的Lipschitz常数控制,可逆性几乎没有贡献。
-
更一般的最小内核:如果我们只保留 bi-Lipschitz 条件而去掉“可逆性”,与要求可逆性的情况相比,minimax风险是否不同?答案是没有区别。证明这点的核心思路:对于 bi-Lipschitz 函数而言,其可逆性实际上是一个“无代价”的约束——因为 bi-Lipschitz 本身已经隐含了 \(f\) 是一个双李普希兹嵌入,它自然是一一对应的。所以可逆性只是显式声明了这一点,但没增加实质性困难。这使得整篇论文的结论几乎成为一个“不需要证明的事实”——只要构造的估计量本身是可逆的即可。而后者的构造依赖于水平集表示,这是作者的核心技术技巧。
三、这篇论文做了什么¶
三句话¶
- 研究问题:在二维单位正方形上,给定 bi-Lipschitz 可逆函数 \(f\) 的随机设计无噪声观测 \((X_i, f(X_i))\),估计 \(f\) 和 \(f^{-1}\) 的 minimax \(L^2\) 风险率是多少?
- 核心工具/方法:利用水平集表示(level-set representation)构造一个几乎处处可逆的估计量;采用Fano不等式推导minimax下界。
- 主要结论:对于bi-Lipschitz可逆函数类,函数本身和逆函数的minimax \(L^2\)风险率均为 \(n^{-1/2}\)(只差对数因子),与不要求可逆性时相同,即可逆性约束不改变估计的难度速率。
关键设定与假设(在最小记号基础上补充)¶
- 设定:\(\{(X_i, Y_i)\}_{i=1}^n\) i.i.d. 来自 \(\text{Uniform}(\mathcal{X})\) 和 \(Y_i = f(X_i)\)。函数空间 \(\mathcal{F}_{L}^{\text{inv}}\) 定义在前述的bi-Lipschitz和可逆条件下。
- 假设:
- (A1) 可逆:\(f: \mathcal{X} \to \mathcal{X}\) 是双射。
- (A2) bi-Lipschitz:\(\forall x, x' \in \mathcal{X}\),\((1/L)\|x-x'\| \le \|f(x)-f(x')\| \le L\|x-x'\|\)。\(L \ge 1\)已知。
- (A3) 光滑性:\(f\) 还满足“几乎处处存在一阶导数”——这用于水平集估计的收敛性论证,但不直接用于核心速率推导。
- 与已有文献的关系:
- 已有文献的bi-Lipschitz回归(不要求可逆性)的minimax率是 \(n^{-1/2}\)(由Lipschitz回归的经典结果可以推出,因为\(\mathcal{X}\)为有界域且维度为2)。本文将此率延拓到具可逆性约束的子类,并严格证明了速率一致。
- 相比可逆神经网络的容量分析(Imaizumi 2021, 2022)只关注逼近速率,本文首次分析统计估计的minimax风险。
主要结果¶
- 下界(Theorem 3.1):
- 存在常数 \(c>0\),使得对任意估计量 \(\hat{f}_n\)(无论是否可逆),有
\[\inf_{\hat{f}_n} \sup_{f \in \mathcal{F}_L^{\text{inv}}} \mathbb{E}\left[ \int_{\mathcal{X}} \|\hat{f}_n(x) - f(x)\|^2 dx \right] \ge c \cdot n^{-1/2}.\]
- 同样对 \(\hat{f}^{-1}_n\)(求逆函数的估计)也有相同的下界。
- 直觉:下界证明通过构造一个具有特定“分离度”的硬子集——在这个子集中,函数对在大多数输入点上都相差很大,但观测数据(刚好落在这些差异点上)的概率很小,从而利用Fano不等式得到 \(n^{-1/2}\) 的下界。
-
必要条件:\(L\ge 1\) 且 \(n\) 足够大。这个下界不依赖于 \(L\)(但上界依赖于 \(L\),所以实际minimax率是 \(L^2 n^{-1/2}\) 量级)。
-
上界(Theorem 3.2):
- 存在与 \(L\) 相关但与 \(n\) 无关的常数 \(C(L)>0\),以及一个正式的统计量 \(\hat{f}_n\)(基于水平集构造),使得
\[\sup_{f \in \mathcal{F}_L^{\text{inv}}} \mathbb{E}\left[ \int_{\mathcal{X}} \|\hat{f}_n(x) - f(x)\|^2 dx \right] \le C(L) \cdot n^{-1/2} \cdot (\log n)^{\alpha},\]其中 \(\alpha\) 为某个正指数(具体为0或1/2,取决于光滑性假设)。
- 直觉:构造了一个几乎处处可逆的估计量。思路是:将正方形\(\mathcal{X}\)均匀分成小方格,依据观测数据估计每个方格内的\(f\)的局部方向(即水平集的形状),然后通过这些局部几何信息拼接出一个全局可逆的函数。
-
技术细节:上界构造用的“过估计(overfit)”——估计量在样本点处完美拟合(因为无噪声),但在样本点之间很保守地插值。由于 bi-Lipschitz 约束,样本点间的最大距离是 \(O(n^{-1/2})\)(因为随机设计),从而估计误差也是 \(O(n^{-1/2})\)。
-
结论核心:\(n^{-1/2}\) 速率——这个速率与不要求可逆性的情形一致。
证明路线与技术技巧¶
整体路线(三步):
- 下界构造(第4节):
- 第一步(构造硬子集):在 \(\mathcal{F}_L^{\text{inv}}\) 中构造一个子集 \(\mathcal{F}_0\),其中的任意两个函数 \(f, f'\) 在大多数输入点上的 \(L^2\) 距离都很大(至少 \(\delta\)),并且观测数据无法在期望意义上区分它们。
- 第二步(Fano不等式):对得到的硬子集,使用标准的minimax下界公式:\(\inf_{\hat{f}} \sup_{f \in \mathcal{F}_L^{\text{inv}}} \mathbb{E}[\|\hat{f} - f\|^2] \ge \frac{\delta^2}{2} \left(1 - \frac{\log |\mathcal{F}_0| + 1}{\log M(\mathcal{F}_0, \text{KL})} \right)\),其中 \(\delta\) 是分离半径,\(\text{KL}\)是Kullback-Leibler散度(在此无噪声设定中简化为惩罚项)。
-
第三步(参数化):用一个参数族(如旋转、平移)构造 \(\mathcal{F}_0\)。关键是要让函数因参数不同而显著分离,同时保持 bi-Lipschitz 常数有界且可逆。
-
上界构造(第5节):
- 第一步(网格划分):将 \(\mathcal{X}\) 划分为 \(n^{1/2} \times n^{1/2}\) 个小方格(边长 \(\sim n^{-1/2}\))。在每个小方格 \(k\) 中,收集落在其中的观测点 \(\{(X_i, Y_i): X_i \in Q_k\}\)。
- 第二步(局部方向估计):在每个小方格 \(k\) 中,利用观测点估计局部映射的方向(即Jacobian矩阵 \(Df\) 的方向)。因为 \(f\) 是 bi-Lipschitz,\(Df\) 在每个小方格内近似常数(由光滑性假设保证)。具体地,通过求解 \(Df\) 的二次型估计(也称“局部主方向”)来获取。
-
第三步(水平集表示):使用这些局部方向信息,定义一个水平集函数(level-set function)\(h(x)\),使得 \(f\) 的每个水平集 \(\{x: f(x) = c\}\) 对应于 \(h\) 的某个水平线。这种表示利用了二维的特点:水平集是曲线,可以用参数表示。对每个小方格 \(k\),用一个分段线性函数去逼近该水平曲线。最终 \(\hat{f}\) 定义为由这些水平集函数重构的映射。
-
收敛性分析(第5.2节):
- 核心引理(Lemma 5.1):证明上述构造的 \(\hat{f}\) 是几乎处处可逆的(a.a. invertible)。证明用了积分几何中的一个结果:在二维平面上,一个由分段线性水平集函数定义的映射几乎处处是双射(因为水平集曲线不会自交)。
- 上界估计:\(\|\hat{f} - f\|_{\infty}^2\) 的期望至多为 \(O(n^{-1/2} \log n)\),因为网格细分的误差(\(\sim n^{-1/2}\))与估计局部方向时产生的对数因子乘在一起。
关键跳跃点: - 最难的地方:在下界构造中“硬子集”必须同时保持可逆性和bi-Lipschitz性。作者构造了一个旋转可逆族:\(f_\theta(x) = R_\theta x\)(绕原点旋转角度 \(\theta\))。这类函数显然可逆且 bi-Lipschitz 且 \(L=1\)(因为旋转不改变距离)。通过将 \(\theta\) 限制在一个微小间隔内并使旋转半径 \(\delta\) 很小,得到了 \(\ell^2\) 距离的硬分离特性以及Fano所需的条件。这一构造是简单但精妙的,因为它避开了复杂的非线性结构。
- 水平集表示的存在性:对任意 bi-Lipschitz \(f\),可以用水平集函数完全表示。作者引用了文献[12](一个关于水平集几何的定理),证明这个表示唯一。这为构造可逆估计量提供了理论基础。
技术技巧点名: - Fano不等式:用于下界推导,尽管是最标准的工具之一。 - 水平集函数表示(第5.1节):核心构造技巧,用于设计可逆估计量。利用了二维平面的几何特性:水平线是曲线,可以通过分段线性插值逼近。 - Hardy-Littlewood不等式 / 面积-周长关系:以某种形式出现在水平集的收敛性分析中(用以控制逼近误差)。 - 反函数定理的离散版本:用于保证离散化后的映射仍然具有可逆性(几乎处处)。 - 光滑性假设(a.e. differentiability):本质上是为微分几何的工具做准备,但其实可能可以放松(因为bi-Lipschitz性本身蕴含\(f\)几乎处处可微)。
真实例子与应用¶
本文为纯理论结构,无真实数据例子或模拟实验。 作者在第7节(讨论)中明确提到“the present work is purely theoretical”。
结论是否比证明窄¶
- Yes:下界(Theorem 3.1)证明所用的旋转族 \(\{f_\theta\}\) 是非常特殊的(bi-Lipschitz 常数 \(L=1\),且是线性可逆函数)。但结论的下界却是对整个 \(\mathcal{F}_L^{\text{inv}}\) 成立(对任何 \(L\ge1\) 均成立)。这一点可以接受,因为下界是“用最坏情况”推算的——你只需要一个“特别坏”的子集(\(L=1\)时下界为\(c\cdot n^{-1/2}\)),那么任何包含这个子集的更大类(\(L>1\))的下界至少不会更小。换言之,这个下界是泛化的,尽管证明时用的特例很简单。
- 上界与下界的对齐是结论的核心——上界只差对数因子,所以结论“可逆性不改变速率”是严格的。但对数因子是\(\log n\) vs \(\sqrt{\log n}\)还是其他?本文的Theorem 3.2 只写了一个“up to logarithmic factors”,没有给出精确指数。这可能意味着证明中对数因子没有完全优化——这本身就是一个小的开放问题。
- 一个重要限制:设定限制在二维、无噪声、均匀设计点。在dmension=1时(一维直线上),可逆性自动成立,问题没有意思。而更高维(d≥3)的同行推断未加讨论——证明中大量使用了二维的几何特性(水平集是曲线,可以参数化;面积-周长关系)。这暗示了结论可能不适用于更高维。
四、开放问题¶
-
高维推广(d≥3):本论文的核心构造——基于水平集的表示——完全依赖二维几何。在 \(d\ge3\) 时,水平集是 \(d-1\) 维流形,分段线性逼近已不实用。能否得到类似结论(可逆性不改变速率)?或者,在高维下可逆性是否确实会大幅加快速率?——本文第7节讨论中虽未明确提及,但这是技术路线上的天然缺口。
扎根:第5.1节描述的水平集表示,明确依赖“level-sets of invertible functions on a square in a 2-dimensional plane”。作者的Discussion只剩一句“extending to higher dimensions is a future work”——未给出任何计划。 -
锐化对数因子:上界中“(log n)^α”的精确指数是多少?能否彻底去除?——这是经典minimax问题的常规兑现:是否能够证明上界严格等于 \(O(n^{-1/2})\)(无对数因子)?下界的证明(Fano不等式)通常容许常数项,不涉及对数,所以对数因子可能确实存在(由构造中的网格分解导致),但也可能通过更精细的构造去掉。
扎根:Theorem 3.2陈述为“up to logarithmic factors”,证明中未指定α的具体值。 -
随机噪音:本文设定为无噪声观测 \(Y_i = f(X_i)\)。如果加入加性噪声 \(Y_i = f(X_i) + \epsilon_i\)(通常是\(L^2\)回归的标准设定),minimax率会如何变化?可逆性是否仍不改变速率?——引入噪声后将落入经典非参数回归框架(加上可逆性这一形状约束),其minimax问题将与现有的Lipschitz回归结果(速率 \(n^{-2/(2+d)}\))有直接联系。这可能是最自然的下一个设定。
扎根:第1段引言明确写“in this study we consider noise-free observation”,且第7节只字未提噪声设定。 -
与竞争估计量的比较:本文只构造了一个基于水平集的估计量。是否存在更简单(如局部线性回归加可逆性投影)的估计量也达到相同速率?可逆性约束能否直接加入现有的局部多项式回归中,通过强制约束减少方差/降低常数因子?——本文的讨论部分完全未涉及这一比较。
扎根:第6节(Proof of Theorem 3.2)未与其他噪声-free方法做比较(因为没有此类文献),但读者会怀疑本文的构造是不是最简单/最优的。 -
区分
inverse risk与forward risk:论文同时研究了 \(f\) 和 \(f^{-1}\) 的估计。结论认为两个风险有相同的minimax率。但是否在常数因子上有差异?比如在\(L\)依赖上,\(f\) 的常数可能好于 \(f^{-1}\)的常数?——这需要更精细的上下界,且可能涉及不同的极值函数族。
扎根:Theorem 3.1和3.2对 \(f\) 和 \(f^{-1}\) 的率完全一样,但并未讨论常数。
Maintained by 陈星宇 · Homepage · Source on GitHub