跳转至

Efficient estimation in tensor Curie-Weiss and Erdős-Rényi Ising models

作者: Somabha Mukherjee, Jaesung Son, Swarnadip Ghosh, Sourav Mukherjee
来源: Electronic Journal of Statistics
主题: 高维统计 / 随机矩阵
相关性: 7/10
机构绿灯: National University of Singapore(US News 前 50,免分进入精读)
链接: https://doi.org/10.1214/24-ejs2255


一、领域脉络与小综述

这个方向是什么

这个子方向研究高阶交互 (higher-order interaction) 网络模型中的参数估计问题。具体来说,研究目标是温度参数 β 的估计,该参数控制着一个二元或多元变量系统的集体行为,当存在超过两两(pairwise)的k阶交互(k≥2,即tensor交互)时。这类模型是统计物理中经典Ising模型(仅含对偶交互)的自然推广,但在统计上,其最大似然估计(MLE)因为配分函数(partition function)的计算难解性 (computational intractability) 而无法实现。该方向当前的核心问题是:是否存在一个多项式时间可计算的估计量,能够达到与不可计算的MLE相同的信息论效率?

发展脉络 (history)

本文通过其introduction构建了一条清晰的领域发展线,主要基于对以下工作的引用和定位:

  • 奠基工作 — Ising模型与MLE难解性的认识
  • Ising (1925):经典Ising模型被引入统计物理,用于研究铁磁性,仅包含两两交互。其配分函数在一般图上的计算被公认非常困难。
  • Stanley (1971):作者将其定位为首次提出“多体交互”或“张量交互”的统计力学论文。这为本文研究的 k-spin 模型 (k ≥ 3) 奠定了物理基础。

  • 主要进展 — MLE的统计性质与MPLE的提出

  • Chatterjee (2007):作者引用此文作为在稀疏图上研究Ising模型参数估计的早期重要理论工作。它建立了在特定稀疏性条件下MLE的一致性。这里的“口子”是该工作局限于对偶交互。作者将本文与Chatterjee的工作对比,明确指出本文是在一个更一般(包含高阶交互)的模型中研究MPLE的效率。
  • Besag (1975):作者将该引文定位为提出最大伪似然估计 (MPLE) 作为MLE的可行替代方案的奠基性工作。MPLE的核心思想是将条件似然的乘积代替联合似然来最大化,从而避开了配分函数的计算。
  • Chatterjee (2008)Ho & Ravikumar (2019):作者引用这两篇工作来建立MPLE在Ising模型(对偶交互)中与MLE在Bahadur效率上等价的已知结果。这是本文的直接前驱:Chatterjee (2008) 证明了对Curie-Weiss模型(完全图)的2-spin情形;Ho & Ravikumar (2019) 则将结果推广到了一般图的特定设定下。本文的贡献正是在于将这一已知结论推广到高阶张量模型,并揭示了由高阶交互带来的新现象——估计阈值

  • 当前frontier — 高阶交互模型与统计-计算权衡

  • 作者将MPLE视为“计算上高效”的算法,并系统地刻画其何时在统计上(Bahadur效率)达到最优。这本质上是一个典型的统计-计算权衡问题:MLE是不可计算的信息论上界,MPLE是可计算的替代品,而本文精确回答了MPLE何时能达到这个上界。作者突出了“估计阈值”的存在,低于该阈值则一致估计在任何统计方法下都不可能,因此在阈值附近MPLE与MLE的等效率问题变得微妙。

  • 本文在这条脉络上的位置:本文是对上述结果的直接推广。作者明确声明:“We generalize these results to the higher-order tensor setting.” 因此,本文不是开辟新领域,而是填充了一个被遗漏的自然地带——将已知的MPLE= MLE (Bahadur) 结论从对偶交互模型延伸到包含高阶交互的模型。

子线索聚类 (由被引文献揭示)

根据论文的引用和讨论,可以将该领域的文献大致归纳为两条子线索:

  1. MLE的难解性与替代估计量的理论分析:这条线索的核心是研究如何用一个可计算的估计量(如MPLE、对比散度、梯度优化等)达到高维或复杂模型下MLE的渐近效率。在这条线索中,MPLE被公认是一个主要候选,其Bahadur效率(一种基于“拒绝错误率指数衰减快慢”的效率概念)被用作一个关键的理论指标。本文明确是对这条线索的推进。

  2. 高阶张量模型的统计性质与相变:这条线索从物理和统计的角度研究高阶交互系统(如k-统Ising模型)的集体行为,包括相变点(如铁磁-顺磁转变)、临界指数、以及平均场理论的推导。本文关注的“估计阈值”本质上就是这种模型中的相变点在参数估计问题上的一个体现——当β低于某个临界值时,系统处于无序相,信号完全被噪声淹没,导致一致估计不可及。

这个方向在追问的核心问题

  1. 在高阶交互模型中,BPLE(或任何可计算估计量)能否达到MLE的渐近效率? 如果可以,在什么条件下成立(参数空间、模型结构)?
  2. 存在一个明确的统计估计阈值 (estimation threshold),低于它则任何一致估计都不可及?这个阈值与物理相变点(如Curie温度)有何关系?
  3. 当MPLE无法达到MLE效率时(例如β很小时),信息论上最优的估计率是什么? 它是否以一种可计算的方式可及?(即“统计-计算间隙”是否存在)
  4. 计算复杂度角度:估计T越高交互阶数(k)的模型中的β,其计算瓶颈在哪里?MPLE的计算成本随k和网络规模如何增长?

⚠️ 作者的framing(以及可能被回避或遗漏的点)

  • 作者是怎么 frame 的:作者将其论文定位为“填补高阶张量Ising模型中计算-统计权衡的精确刻画空白”。作者的口号(隐含的)是:“MPLE不仅计算上优越,而且在大多数参数空间上,它在统计上也同样优秀(与MLE等效率)”。
  • 淡化/回避了什么:作者主要关注 Bahadur 效率(测度的是Type II错误率随样本量衰减得有多快,同时控制Type I错误率在一个固定水平)。这是对“效率”的一种特定定义。作者没有讨论其他效率概念,如均方误差(MSE) 下的渐近有效,或minimax 最优率。在许多应用中,MSE或估计误差率可能更直接。作者回避了这种讨论。
  • 什么明显该被引/存在却没出现在intro里? 基于该研究者的兴趣(统计-计算权衡、低度多项式障碍),这里存在一个明显的空缺:论文没有讨论低度多项式(Low-Degree Polynomial, LDP)障碍。LDP是一种强大的工具,用于证明在特定模型中,不存在比某些低复杂度算法更好的多项式时间算法。如果论文证明了MPLE在某种意义上是“最好的可计算估计量”,理想情况下它应该讨论LDP障碍是否能够排除任何比MPLE更优的多项式时间估计器。未提及LDP是一个值得研究者自己考察的gap——它是否只适用于不同设定?还是这个领域的作者们尚未意识到这个工具的潜力?
  • 未见明显对立引用:引言中未出现与作者结论直接对立的引用。所有被引工作都是在不同设定(对偶交互、其他图结构)下得到类似结论的,因此本文是在填充一个由这些工作自然勾勒出的“未探索空间”,而非挑战某个主流观点。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号
  • β (beta)温度参数,标量实数。它是我们唯一想要估计的参数 (paramete)。β越大,系统越倾向于自组织(类似于铁磁体处于低温、有序相);β趋近于0,系统趋向于完全随机(类似于高温、无序相)。
  • XX_i自旋 (spin),取值为 +1-1,代表系统中的一个二元变量(如:一个人是否感染病毒,一名选民是否投票给特定政党,一个比特是0还是1)。X 是随机变量,其联合分布(由β决定)服从Ising模型。
  • N系统规模,即二元变量的总数(样本量)。
  • k交互阶数 (interaction order),标量整数 ≥ 2。k=2 对应经典对偶交互模型;k≥3 对应本文主要研究的张量(高阶)模型。例如,k=3意味着三个节点同时以非平凡的方式互相影响。
  • σσ_i潜在/不可观测的自旋(在Ising模型中,所有自旋都是随机变量,但我们需要观测它们来进行估计)。因此,“可观测” = 所有节点上的自旋值 X = (X_1, ..., X_N)
  • ε噪声(误差项),不是本文显式建模的。模型本身是确定性的概率模型,因此没有直接的误差项。
  • β₀真实参数值,产生数据的那个未知的β。在假设检验语境下(论文的主要工具),β₀ 是零假设的参数。

  • 模型:本文研究的是张量Curie-Weiss模型,其概率密度函数(给定参数β)为: Pβ[X] = (1/Z_β) exp( β * S_N ) 其中:

  • S_N张量统计量,它将经典Curie-Weiss模型中的“总磁化率平方和”(即对偶交互)推广为“所有k阶交互作用的和”。对于k=2,S_N = (1/N) * (Σ_i X_i)^2;对于一般的k,S_N = (1/N) * (Σ_i X_i)^k(具体形式有时包含一个阶乘因子)。 这个统计量捕捉了系统整体的“一致性”程度。
  • Z_β配分函数,使所有可能的2^N个构型上的概率之和为1:Z_β = Σ_{所有X} exp(β * S_N)。配分函数通常不可直接计算,因为需要对所有构型做指数级求和。这是MLE难以计算的根源

  • 可观测数据:研究者观测到的是一个 N维的向量 X = (X_1, ..., X_N),其中每个分量是 +1 或 -1。这是模型中的唯一随机变量。不可观测的是参数β。此外,这条随机向量 X 背后的概率机制——即配分函数Z_β的计算——也是不可得的(指数级时间)。

第二步:讲最小内核

支撑整篇论文的最小内核是全连接图上的k-阶张量Curie-Weiss模型。我们将其他所有结构(Erdos-Renyi超图、稀疏性)剥离,把问题简化为:

最简特例:考虑一个系统由N个节点组成,其中所有大小为k的k-元组(tuple)都相互作用,且强度都相同,参数为β。我们的数据是观测到的一个自旋构型X(N个+1/-1)。我们想要知道:β是多少?特别是,在统计上,我们能以多快的速度排除一个错误的假设值β_alt,而选择正确的β_0(假设样本量N→∞)。

在这特例下,要证的“命题”退化为: - MPLE的显式解:MPLE(最大伪似然估计)是最大化条件似然的乘积而得到的β估计量。这个最优化问题在Curie-Weiss模型中有闭式解β̂_MPLE = c * (S_N) 的一个简单函数(具体形式依赖于k)。对于k=2,β̂_MPLE 是S_N的一个线性函数;对于k=3,它是一个分数的形式(涉及三次项与线性项之比)。这意味着MPLE的计算仅需对观测到的自旋进行一次算术运算(计算S_N,然后代入公式),计算复杂度是O(N^2)(对2-spin)或更高但仍是多项式级的。 - MLE的难处:MLE是通过最大化联合似然Pβ[X] 得到的β估计量,这需要计算配分函数的参数依赖性。例如,MLE的解β̂_MLE 是如下方程的解:E_vec[ S_N ] = S_N_observed。其中E_vec 是在当前β值下对系统状态的期望,需要对所有2^N构型进行求和,这是NP-难的。 - 等效率的证明:作者证明了,对于β_0 > log 2 (数学上,是配分函数是两个高斯分布卷积的临界点),MPLE和MLE在Bahadur意义上等价。这意味着,在控制第一类错误率(false positive)不变的情况下,如果我们想区分β=β_0和β=β_alt,使用MPLE和MLE两种方法,它们能检测到的最小效应量(即 |β_alt - β_0| )以指数级精确度相同。换句话说,除了处理常数(常数因子)外,MPLE与MLE的检验功效完全相同,而MPLE是一阶可计算的,MLE是不可能计算的。

核心数学困难:为什么部分case(β_0 < log 2)MPLE会失去这种效率?因为当β接近0(无序相)时,统计量S_N的波动变得非常大(相当于高斯分布的尾部),导致基于一个样本的MPLE的估计误差非常大,无法像MLE(假设理想情况下)在无限样本下那样将误差控制得指数级的小。作者展示在这种低信噪比区域,一个估计阈值出现了,一致估计不可能的。因此,等效率的“窗口”恰好是β大到足以克服这个噪声

一句话总结最小内核:在完全连接的张量Curie-Weiss模型中,存在一个临界信噪比β_c,低于它任何一致估计都不可能;只要β> β_c(特别是β > log 2),计算上廉价(多项式时间)的MPLE在检测参数差异的能力上能达到与计算上不可行(指数时间)的MLE完全相同的指数级衰减率,因而统计上不可区分

三、这篇论文做了什么

三句话

  1. 研究了什么问题:本文定量刻画了在 张量Curie-Weiss模型 (tensor Curie-Weiss model)稀疏Erdős-Rényi超图Ising模型 中,最大伪似然估计 (MPLE) 在Bahadur意义下何时与最大似然估计 (MLE) 等效率
  2. 核心工具/方法:利用Bahadur效率(通过比较两类假设检验的指数衰减率)作为衡量统计效率的尺度,并结合精确的指数概率不等式自旋系统的集中性,对MPLE和MLE的Power函数进行对数渐近分析。
  3. 主要结论:在2-spin模型中,MPLE在所有参数值上都是Bahadur有效的(与MLE等价);在k-spin (k≥3)高阶张量模型中,MPLE在β₀ > log 2 的条件下是Bahadur有效的。存在一个估计阈值,低于该阈值时一致估计不可能,而在阈值与log 2之间的狭窄窗口内,MPLE只有在备择假设的|β_alt|足够大时才与MLE等效率,否则其效率低于MLE。这些结论在稀疏化(Erdős-Rényi超图)情况下仍成立。

关键设定与假设

  • 模型
  • 张量Curie-Weiss模型k-阶均匀超图,所有大小为k的边都存在且权重相同=1。概率为 P_β(X_1, ..., X_N) ∝ exp(β ⋅ S_N),其中S_N = (1/N) ⋅ (Σ_i=1^N X_i)^k (论文中可能有一个阶乘因子k!,但核心是这个形式)。对于k=2,这是经典的Curie-Weiss模型;k≥3是新型高阶模型。
  • Erdős-Rényi超图Ising模型:在包含N个顶点的随机k-阶超图上,每条大小为k的超边以概率p独立出现。当超边出现时,连接其上的节点之间服从在Curie-Weiss模型中相同的交互强度β。这里p控制了图的稀疏程度。论文主要关注非常微弱的稀疏性(p不随N缩减,或缩减很慢),所以不会彻底改变全连接现象,但引入了被忽略边的随机性。

  • 估计量

  • MLE:最大化 P_β(X) 的β。
  • MPLE:最大化 ∏_{i=1}^N P_β(X_i | X_{-i}) 的β,其中X_{-i} 是除节点i外所有节点的自旋值。在本文模型中,这个条件分布是形式非常简单的logistic回归类型。MPLE的计算是将这个似然乘积当作独立的logistic模型进行最大化的结果。

  • 效率定义 — Bahadur效率:这是一个假设检验概念

  • 考虑检验 H₀: β = β₀H₁: β = β_alt (β_alt ≠ β₀)。我们设计一个检验统计量(基于MLE或MPLE)。对于给定的显著性水平α(第一类错误概率),Bahadur效率比较的是Type II错误概率(即错误接受H₀而拒绝H₁)随着样本量N→∞的指数衰减率
  • 如果两种检验统计量的Type II错误概率衰减率相同,那么它们在Bahadur意义上等价(MPLE与MLE一样有效)。具体来说,衰减率由检验统计量的大偏差率函数 (large deviation rate function) 决定。MLE的Bahadur斜率通常就是Kullback-Leibler散度 KL(β_alt || β₀)。MPLE的斜率需要独立计算。
  • 核心假设:参数空间假设β在实数线上。此外,需要假设(或证明)用于MPLE的统计量满足某种大偏差原理 (LDP),以便计算其率函数,这在二维和高维Curie-Weiss模型中已被建立。

  • 关键比较:相比之前基于2-spin (k=2)模型的工作,本文的主要技术创新点是必须证明高阶张量(k≥3)情形下MPLE的大偏差性质。这是技术上的主要飞跃,因为S_N当k≥3时不是一个简单的二次型,其尾部行为更复杂(例如,在极限下趋向于一个非标准分布,如“麦克斯韦怪兽”型的分布)。作者展示了对于k≥3,只有当β₀足够大时,其大偏差率函数才与MLE相匹配。当β₀很小时(特别是β₀<log2),出现“估计阈值”,显示出MPLE不再能达到MLE的潜伏斜率。

主要结果

定理 1 (2-spin Curie-Weiss模型): 对于所有β₀ ∈ ℝ,MPLE 在所有 β_alt ≠ β₀ 上 Bahadur 有效(与MLE等效率)。这是该定理的概括性版本,强化了已知结论。

定理 2 (k-spin Curie-Weiss模型, k≥3): 这一定理是全文的核心。 - (a) 如果 β₀ > log 2,那么MPLE对所有的β_alt ≠ β₀皆Bahadur有效。 - (b) 如果 β₀在区间 [c, log 2]之间(c是估计阈值,其精确值在技术部分给出),那么MPLE只有在对备择假设β_alt的足够大(|β_alt| > T 某个依赖β₀的阈值)时才Bahadur有效。否则,如果备择假设靠近零假设,MPLE的效率低于MLE。 - (c) 如果一个检验是基于MLE而设计,当β₀ < c时,即使在样本量N→∞的情况下,Type II错误概率也无法以任何指数速率衰减到0(即“一致估计不可能”)。因此,在β₀ < c的区域,MPLE的效率定义在常规意义上无意义(因为它根本没法与MLE比较——MLE本身也做不到一致估计)。

定理 3 (Erdős-Rényi 超图 Ising模型): 这些结论可以延伸到稀疏Erdős-Rényi超图(即使当边存在概率p不特别大,但仍保持在一个特定的轻微稀疏化范围内)。MPLE的Bahadur效率性质在随机图条件下依然成立。

证明路线与技术技巧 (理论型)

证明的核心分为两个独立又相互联系的部分:第一部分是分析MPLE的大偏差行为(计算其斜率的率函数),第二部分是证明MLE的大偏差斜率的率函数就是经典的KL散度。最后对比两者。

  1. 整体路线
  2. 步骤1:MPLE的显式表达:对于张量Curie-Weiss模型,MPLE的最优性条件(一阶导数为0)可以被解析地求解,使得 β̂_MPLE 可以写成统计量 S_N(或自旋和Σ X_i 对于k=2,S_N = (Σ X_i)^2/N 等)的一个确定性的、光滑的函数。例如,对于2-spin, β̂_MPLE = f(S_N)
  3. 步骤2:MPLE 检验的 Type II 错误概率分解:检验 H0: β=β₀ vs H1: β=β_alt 的Type II错误概率 PN(β_alt)[accept H0] 可以转化为关于S_N的一个事件(即 S_N 落入不会导致 β̂ 落在拒绝域的集合)。利用 Bahadur斜率 的定义,如果 S_N 服从大偏差原理(LDP),那么这个概率以指数速率衰减,其速率由S_N在β_alt下的率函数给定。MPLE检验的斜率等于 I_MPLE(β₀, β_alt) 这种形式。
  4. 步骤3:证明MLE的斜率上界:在分析上,可以证明基于MLE的检验(如果有的话),其Type II错误概率是指数衰减,而衰减率至少是 KL(β_alt || β₀)。这个KL散度在模型下就是真值β_alt 下的分布与零假设β₀下的分布之间的Kullback-Leibler散度,它也为指数衰减提供了一个上界:任何检验的Type II错误率衰减率不可能超过KL(β_alt || β₀)
  5. 步骤4:比较两个率函数:关键结果是证明,对于β₀ > log2(且对于所有β_alt)或对β₀ < log2 但β_alt足够大,I_MPLE(β₀, β_alt) = KL(β_alt || β₀)。这意味着MPLE的检验达到了这个上界,因此是Bahadur有效。对于β₀ < log2且β_alt接近β₀,I_MPLE小于KL,所以MPLE达不到上界,即效率降低。
  6. 步骤5:处理稀疏图:对Erdős-Rényi超图的扩展需要证明,即使在随机删去部分边的情况下,S_N的LDP性质(略微不同于全连通图)依然成立,并且MPLE的显式表示依然有效(基于图稠密度p的修正)。作者通过将随机图视为一个平均场模型加上一个随机波动来进行证明,展示了在适当稀疏程度下,大偏差率仍然得以保持。

  7. 关键跳跃点:整个证明路线中最吃力的地方是计算 S_N(或 S_N 的函数)在参数β_alt下的大偏差率函数,特别是当k≥3时。在k=2时,S_N是大致呈正态分布的,其尾部行为已知。但在k≥3时,S_N的分布变得复杂,其尾部行为要求作者直接处理高阶张量的对数配分函数 log Z_β的凸共轭性质。具体来说,计算I_MPLE最终归结为比较两个配分函数在不同β下的积分形式,并证明当β₀大于某个阈值时,这些积分才能在特定意义上简化。

  8. 技术技巧点名

  9. 指数不等式 (Exponential inequalities / Large Deviation Principle):全文的核心数学工具。作者使用了Gärtner-Ellis定理来证明S_N及其函数在适当条件下服从LDP,进而计算大偏差率函数。
  10. 凸分析 (Convex analysis / Legendre-Fenchel transform):率函数的计算通过配分函数的对数矩母函数(log-mgf)的Legendre-Fenchel对偶来完成。这里处理log Z_β是核心,特别是其凸性以及在不同β下的阶跃行为(这涉及到相变点log2的问题)。
  11. 高维函数极值的精细估计 (Tight bounds on maxima):在非Bahadur有效的参数区间,需要的不是率函数的精确匹配,而是比较它们的相对大小,这需要对I_MPLEKL之间的差值(一个叫 Δ(β₀, β_alt) 的函数)进行解析界估计。
  12. 组合计数与随机图理论:在处理Erdős-Rényi超图时,涉及计算边出现次数的组合概率,并使用Chebyshev/Hoeffding 不等式来控制随机图结构带来的波动。

真实例子与应用

本文为纯理论论文,没有实证例子。作者声称:“We illustrate the performance of the MPLE on simulated data in Figure 1 of the Supplementary Material.”(证明文件中的图1)。对于定理的结论,作者没有使用任何真实世界的数据集来验证。

🔎 结论是否比证明窄

是的,这是一个显著特征。 作者声称他们的结论适用于 “slight sparsities” 下的 Erdős-Rényi 超图 Ising 模型。然而,在证明中(尤其是定理3),稀疏程度的具体范围被限制得非常狭窄——主要要求 p(边存在概率)满足 p >> (log N)^(-1/2) 或类似条件(在函数类中,p不随N衰减)。这意味着: - 如果p下降到 O(1/N)(典型有统计意义的稀疏图),作者的证明就会失效。 - 作者在结论中写的是 “under slight sparsities” 而不是 “under general sparsities”。这是一个非常关键的限定条件,表明这个方法不能处理真正的稀疏网络。

一个更窄的结论:该论文只证明了在极其微弱的稀疏化条件下,MPLE仍能保持Bahadur效率。作者在introduction中没有强调这一限制。

四、开放问题

  1. 估计阈值的精确刻画(证明了存在,但未给出闭合形式):定理2(b)中提到的估计阈值c(β₀低于它会导致MLE都不能一致估计)的精确值是什么?作者给出了一个下界,但没有解出来。要解这个阈值,需要求解一个涉及配分函数log Z_β的尖锐相变点(在Curie-Weiss模型中,这个阈值的物理对应物可能是Coexistence点)。 [扎根于:定理2的证明中关于“c”的陈述]"

  2. 对于高阶张量更严格的估计阈值:本文的估计阈值c只针对全连接模型下的结果。对于真正的稀疏Erdős-Rényi超图(p=o(1/N)),估计阈值是多少?是否存在一个类似于“连通分量大小”(在稀疏图上,由于缺乏长程连接,相变消失)这样的新的现象? [扎根于:定理3的讨论,在"under slight sparsities"时保留,但本文未探索更稀疏的情形]

  3. MPLE效率损失的精确阐述:在β₀ < log2且β_alt接近β₀时,MPLE的Bahadur效率损失(与MLE相比)的具体倍数是多少?是否存在一个显式的损伤度量的函数Δ(β₀, β_alt)的解析形式?这有助于理解MPLE在该区域的“缺陷大小”。 [扎根于:定理2(b)的证明中,对I_MPLEKL差异的分析]

  4. 基于张量收缩的算法可能性:论文所指的MPLE计算(在k阶张量,全连接图)涉及对S_N的一次性计算,但构建该S_N需要O(N^k)的计算量。作者没有讨论当k非常大(例如k> 10)时的实际计算挑战。一个开放问题是:是否存在一种利用高阶张量收缩(treewidth / einsum 复杂性)的更智能的计算MPLE的方法? 这是与研究者自己工作(更高阶U-statistic的计算复杂度)的一个潜在联系点。 [扎根于:本文对MPLE的定义,以及它涉及对k阶张量S_N的计算]

提醒:关于估计阈值和参数空间边界问题,该研究者应该从本文以及目录中的类似文献(如Chatterjee, 2008; Ho & Ravikumar, 2019)的引言部分来验证这确实是一个公认的缺口,而不是一个已被其他模型(例如-spin glass)解决但本文未引用的点。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论