Exact minimax optimality of spectral methods in phase synchronization and orthogonal group synchronization¶

作者: Anderson Ye Zhang
来源: Annals of Statistics
主题: 高维统计 / 随机矩阵
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

本子方向研究同步化问题（synchronization problems）的统计估计：给定一组未知群元素 \(z_1^*, \dots, z_n^*\)（取值于某个紧致群，如复单位圆 \(\mathrm{U}(1)\)、正交群 \(\mathrm{O}(d)\)、旋转群 \(\mathrm{SO}(d)\)），观测量是部分或全部成对相对测量 \(Y_{ij} \approx z_i^* (z_j^*)^{-1}\) 加噪声。核心统计问题是：在什么信噪比条件下能够一致估计群元素？各个估计量（谱方法、最大似然、广义幂法、半定规划）之间是否有精度差异？本文聚焦谱方法（取数据矩阵的主特征向量后归一化）是否在 minimax 意义上已经最优。

发展脉络（history）¶

根据论文 introduction 及被引文献，可将发展梳理为以下阶段：

奠基工作（2009–2012）：Singer (2009) [15] 提出角同步化（angular synchronization）问题，建立谱方法（取由测量构造的 Hermitian 矩阵的 top eigenvector）作为简单有效的估计量，并利用随机矩阵理论分析了其在大量异常值下的稳定性。Wang & Singer (2012) [4] 引入 \(\mathrm{SO}(d)\) 同步化的稳健惩罚函数，证明了精确与稳定恢复的相变行为。这些工作确立了谱方法在同步化问题中的基石地位，但当时只给出了粗略的相变阈值，没有精确的 minimax 风险刻画。
主流推断方法及其最优性分析（2014–2020）：
半定规划（SDP）松弛的紧性：Bandeira, Boumal & Singer (2014) [20] 证明角同步化的 MLE 的 SDP 松弛在随机模型下是紧的（即恢复 MLE）。Javanmard, Montanari & Ricci-Tersenghi (2015) [22] 从统计物理角度计算了 SDP 的相变阈值。
广义幂法（GPM）：Boumal (2016) [19] 证明在相似噪声条件下改进的幂法收敛到全局最优。Liu et al. (2016) [25] 给出 GPM 估计误差的有限样本界，证明其与 Cramér-Rao 界同阶。Ling (2020) [12] 用 leave-one-out 技术证明 GPM 线性收敛到全局最优。
信息论极限：Lelarge & Miolane (2016) [17] 计算了低秩对称矩阵估计的互信息极限，定位了可检测阈值。Perry et al. (2016) [7] 证明 PCA（谱方法）在多种先验下达到最优检测阈值，但精度刻画还不够精细。
精确 minimax 风险的首次匹配：Gao & Zhang (2020) [3] 针对相位同步（\(\mathrm{U}(1)\)）证明：MLE 与 GPM 的风险与 minimax 下界精确匹配（首项常数 \(\sigma^2/(2p)\)）。Gao & Zhang (2021) [2] 进一步将这一结果推广到正交群与旋转群同步，分析了迭代极分解算法（GPM 的一种变种）的精确最优性。这些工作把最优性从“同阶”推进到了首项常数匹配。
当前 frontier 与本文位置：上述工作已经证明 MLE 和 GPM 达到精确 minimax 风险，但谱方法——最简单的估计量——是否也能达到同样精度？此前文献仅知其“次优”或“渐近等价”但缺乏常数级精确比较。本文在这一缺口上证明谱方法同样达到精确 minimax 最优，从而统一了不同方法的最优性。

子线索聚类¶

被引工作可大致落在以下子线索：

谱方法理论（Singer 2009, Singer & Shkolnisky 2011, Chen et al. 2020, Perry et al. 2016, Romanov & Gavish 2018）：侧重谱方法本身的相变、精度、算法分析，但未给出精确 minimax 常数匹配。
MLE / SDP / GPM 的最优性（Gao & Zhang 2020, Gao & Zhang 2021, Boumal 2016, Bandeira et al. 2014, Liu et al. 2016, Ling 2020）：这些工作证明 MLE、GPM、SDP 等更复杂方法达到精确 minimax 风险，其中 Gao & Zhang (2020, 2021) 直接给出了匹配常数。
特征向量扰动分析（Fan, Wang & Zhong 2018, Abbe et al. 2017, Cai & Zhang 2016, Cape et al. 2017, Agterberg et al. 2021）：开发了 \(\ell_\infty\)、\(\ell_{2,\infty}\)、逐元素的特征向量/子空间扰动界。本文受到 Abbe et al. (2017) [16] 中首阶近似思想的启发，但需要将其从 \(\ell_\infty\) 界适配到 \(\ell_2\) 界并达到紧致常数。
信息论极限与计算-统计权衡（Perry et al. 2016, Lelarge & Miolane 2016, Javanmard et al. 2015）：从互信息、相变、低度多项式等角度刻画问题的基本极限。本文与这条线索的关联是：证实谱方法（一种简单多项式算法）在一致估计可行区域内没有额外统计代价。

这个方向在追问的核心问题与已知瓶颈¶

核心问题 1：同步化问题的 minimax 估计风险（在平方 \(\ell_2\) 损失下）的首项常数是多少？
核心问题 2：不同估计算法（谱方法、MLE、GPM、SDP）是否都能达到这个首项常数？若能，在多宽的信噪比范围内？
核心问题 3：谱方法是否能代替更复杂的 MLE/GPM/SDP 而仍不损失统计效率？此前已知谱方法可以做到同阶最优（Perry et al. 2016），但常数是否匹配未知。
已知瓶颈：谱方法的本质是进行主特征向量分解，其精度受限于扰动分析的精确性。传统 Davis-Kahan \(\sin\Theta\) 定理只能给出谱距离上界，不足以得到 \(\ell_2\) 误差的首项常数匹配。要获得常数精确匹配，需要一个更紧的一阶近似（first-order approximation）工具，同时要恰当定义总体特征向量以消除无噪声时的误差。

⚠️ 作者的 framing¶

这是作者的说法：作者把缺口 frame 为“谱方法虽然简单、被广泛使用，但其估计性能是否与更复杂方法一样好（尤其在首项常数上）一直没有答案”。本文通过发展新的总体特征向量选择与新的扰动分析，证明谱方法也达到精确 minimax 最优，从而说明“在一致估计可行区域内，谱方法与 MLE、GPM、SDP 等价”。

竞争路线被淡化或回避的方面：作者强调谱方法的“简单性”，但在比较中只说“numerically the performance of the spectral method is already very good and the improvement from GPM is often marginal”（引用 [19]）。对于稳健性（outliers）的场景，谱方法可能不如迭代方法（如 message passing），但这不属于本文模型（假设噪声为同方差高斯且无异常值）。

什么明显该被引/该存在、却没出现在 intro 里？：作者引用了大量关于 GPM、SDP 的最优性结果，但未引用关于扰动分析的直接常数匹配工作（如 Gao & Zhang 2020/2021 已经为 MLE/GPM 给出了精确常数，但没有用谱方法）。这是一个自然缺口。另外，关于随机矩阵谱的精确渐近（如 Baik-Ben Arous-Péché 相变）虽然有引用（[7, 14]），但本文并不依赖于相变理论，而是直接在全信噪比区域（只要一致估计可行）让常数匹配。值得研究者去查的问题：是否有其他紧致群（如 \(\mathrm{SO}(3)\)）的结果？本文推广到正交群但未覆盖旋转群（即行列式为 +1 的约束）。Gao & Zhang (2021) 处理了旋转群，但本文结果限于正交群（引理 6 等提到 \(\mathrm{O}(d)\) 而非 \(\mathrm{SO}(d)\)）。

张力¶

被引工作之间未见明显对立结论。关于谱方法是否最优，先前结论停留在“同阶”或“渐近等价”，而本文将其提升为“精确首项常数匹配”。这是正向推进，不是矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

设定：设有 \(n\) 个未知群元素 \(z_1^*, \dots, z_n^*\)。相位同步：\(z_i^* \in \mathbb{C}\)，\(|z_i^*| = 1\)，即复单位模向量。正交群同步：\(z_i^* \in \mathbb{R}^{d\times d}\) 且为正交矩阵（\(Z_i^* \in \mathrm{O}(d)\)）。为简化，先只讲相位同步（\(d=1\) 的特例），正交群同步类似。
可观测数据：对每对 \((i,j)\)，以概率 \(p\) 独立观测

\[Y_{ij} = z_i^* \overline{z_j^*} + \sigma W_{ij},\]
其中 \(W_{ij}\) 是复高斯分布 \(\mathcal{CN}(0,1)\)（独立对称，\(W_{ij} = \overline{W_{ji}}\)）。当 \(i=j\) 时无测量。未观测的条目视为缺失（观测模式由对称 Bernoulli 变量 \(A_{ij} \sim \mathrm{Ber}(p)\) 控制，独立于 \(z^*\) 和 \(W\)）。数据矩阵 \(X \in \mathbb{C}^{n\times n}\) 定义为：

\[X_{ij} = A_{ij} Y_{ij},\quad i\neq j,\quad X_{ii}=0.\]
潜在量：真正的群元素 \(z^* = (z_1^*, \dots, z_n^*)^\top \in \mathbb{C}^n\) 是要估计的参数，但只能通过噪声观测 \(X\) 获得信息。不可直接观测 \(z^*\) 本身。
估计目标：估计 \(z^*\) 模一个整体旋转（全局相位模糊，因为 \(z^*\) 和 \(z^* e^{i\theta}\) 产生相同的相对测量）。通常通过损失函数 \(\ell^2\) 距离度量：

\[\mathrm{Loss}(\hat{z}, z^*) = \min_{\theta \in [0,2\pi)} \| \hat{z} - e^{i\theta} z^* \|^2,\]
等价于 \(\| \hat{z}\hat{z}^H - z^* z^{*H} \|_F^2/2\)（详见本文命题 1）。
符号：
\(n\)：群元素个数；\(p\)：观测概率；\(\sigma\)：噪声标准差。
\(X\)：数据矩阵（对称，对角元为0）。
\(z^*\)：真实参数向量（\(\mathbb{C}^n\)）。
\(\tilde{u}\)：\(X\) 的 leading eigenvector（模长归一化后得到谱估计 \(\hat{z}\)）。
\(u^*\)：新定义的总体特征向量——详见下文。
\(\lambda_1(X)\)：\(X\) 的最大特征值。
\(W\)：高斯噪声矩阵（对称，对角元为0，非对角元独立 \(\mathcal{CN}(0,1)\)）。
\(A\)：邻接矩阵（对称，\(A_{ij}=1\) 表示被观测）。

第二步：最小内核——相位同步、完全观测 (\(p=1\))、小噪声 \(\sigma \to 0\) 的特例¶

为了看清本文的核心数学思想，考虑最简单特例：相位同步，且观测概率 \(p=1\)（所有 \(\{Y_{ij}\}_{i<j}\) 都观测到），噪声方差 \(\sigma^2\) 很小（但有限）。数据矩阵为

\[X = z^* z^{*H} + \sigma W,\]

其中 \(W\) 是复 Wigner 矩阵（对称，对角元0，非对角元独立 \(\mathcal{CN}(0,1)\)）。

传统谱方法：取 \(X\) 的 leading eigenvector \(u_1\)（满足 \(\|u_1\|=1\)），然后通过去掉全局相位（将每个分量化为单位模）得到估计 \(\hat{z}_i = u_{1,i}/|u_{1,i}|\)。

问题：当 \(\sigma=0\) 时，\(X = z^* z^{*H}\)，其最大特征值的特征空间是 \(\mathbb{C} z^*\)。但 \(z^*\) 本身不是单位向量（因为 \(\|z^*\|^2 = n\)），所以 \(u_1 = z^*/\|z^*\|\)，即归一化版本。因此谱方法在无噪声时精确恢复 \(z^*\)（模全局相位）。当 \(\sigma>0\) 时，由 Davis-Kahan 定理只能给出 \(u_1\) 与 \(z^*/\|z^*\|\) 的 \(\sin\Theta\) 距离的阶，其 \(\ell_2\) 误差约为 \(O(\sigma)\)。

本文核心想法：为了得到常数精确匹配的 minimax 最优性，需要更精细的刻画。关键思路：

重新定义总体特征向量：不是直接取 \(z^*/\|z^*\|\)，而是取
\[u^* := \frac{1}{\sqrt{n}} z^*.\]
这样 \(\|u^*\|=1\)，且无噪声时 \(X = n u^* u^{*H}\)，其最大特征值为 \(n\)，对应特征向量正好是 \(u^*\)。所以谱方法在无噪声时精确恢复 \(u^*\)（也就恢复了 \(z^*\)）。这个选择非常自然，但之前文献中常用 \(z^*/\sqrt{n}\) 吗？本文强调这是它的贡献之一。
一阶近似：当有噪声时，扰动分析要证明
\[\tilde{u} = u^* + \frac{1}{n} X u^* - u^* + \text{高阶项},\]
其中 \(\frac{1}{n} X u^*\) 是第一阶项。事实上，因为 \(X\) 的谱分解可写为 \((\lambda_1 - n)\) 等，但本文的新工具（引理4）直接证明：在 \(\sigma\) 小到使一致估计可行的条件下，
\[\|\tilde{u} - u^* - (I - u^*u^{*H})\frac{X u^*}{n} \|_2 \leq \text{（高阶小量）}.\]
右侧的高阶项比主项低一个量级（在 \(\ell_2\) 范数下）。这个一阶近似是紧致的——即主项已经刻画了误差的精确首项。
误差平方的期望计算：利用一阶近似，可以计算 \(\mathbb{E}\|\hat{z} - z^*\|^2\) 的渐近首项。具体地，\(\hat{z}_j = \tilde{u}_j / |\tilde{u}_j|\)，而 \(\tilde{u}_j \approx z_j^*/\sqrt{n} + \frac{1}{n} \sum_k X_{jk} u_k^*\)，经过代数运算（引理7、引理8），平方损失之和的期望收敛到 \(\sigma^2/(2p)\)（当 \(p=1\) 时即为 \(\sigma^2/2\)）。这一常数与 Gao & Zhang (2020) 中 MLE 的 minimax 下界完全一致。

这个最小内核揭示的核心数学事实：在一致估计可行的信噪比区域内，谱方法一阶等价于 MLE/GPM，因此达到相同的精确 minimax 风险。证明的关键不在谱分解本身，而在于一阶近似的紧致性——这依赖于本文新发展的扰动分析工具。

三、这篇论文做了什么¶

三句话¶

研究了相位同步（\(\mathrm{U}(1)\)）与正交群同步（\(\mathrm{O}(d)\)）模型中，谱方法（取数据矩阵主特征向量后归一化）在平方 \(\ell_2\) 损失下的估计精度。
核心工具是：①新定义的总体特征向量 \(u^* = z^*/\sqrt{n}\)（或正交群情形中 \(U^* = Z^*/\sqrt{n}\)），确保无噪声时谱方法精确恢复；②新的主特征向量扰动分析，证明 \(\tilde{u}\) 可以被其一阶近似以 \(\ell_2\) 误差紧致逼近。
主要结论：谱方法在一致估计可行的信噪比条件下（\(\sigma^2/(2np) = o(1)\)）达到 minimax 下界 \(\frac{\sigma^2}{2np} + o(\frac{\sigma^2}{np})\)，从而证明其与 MLE、GPM、SDP 等更复杂方法在首项常数上等价。

关键设定与假设¶

数据生成：\(Y_{ij} = z_i^* \overline{z_j^*} + \sigma W_{ij}\)（复高斯），或 \(Y_{ij} = Z_i^* Z_j^{*\top} + \sigma W_{ij}\)（矩阵高斯）。观测模式：独立同分布 Bernoulli(p)，对称地缺失。
假设：本文没有额外约束（如稀疏性、连接条件等），唯一要求是一致估计可行：minimax 风险 \(\frac{\sigma^2}{2np} \to 0\)，这意味着 \(np/\sigma^2 \to \infty\)（即信噪比足够大，使得任意两个群元素间的平均观测次数趋于无穷）。在相位同步中，这个条件正是 Gao & Zhang (2020) 中定义的可行区域。
相比已有文献：本文的假设比以往许多谱方法分析更弱或至少相同——它允许不完全数据，且不要求 \(p\) 以特定速度衰减（只要 \(np \to \infty\)）。对于正交群同步，假设 \(d\) 固定（与 \(n\) 无关），这匹配 Gao & Zhang (2021) 的设定。
估计量：谱估计：\(\hat{z} = \mathcal{P}(\tilde{u})\)，其中 \(\tilde{u}\) 是 \(X\) 的 leading eigenvector，\(\mathcal{P}\) 将每个分量投影到单位圆上（即 \(\hat{z}_i = \tilde{u}_i / |\tilde{u}_i|\)）。对于正交群同步，类似地对每一行/列进行正交化（具体为：令 \(\tilde{U} \in \mathbb{R}^{nd\times d}\) 为 \(X\) 的 top-d 特征向量构成的矩阵，然后对每个 \(n\) 个 \(d\times d\) 块做极分解投影到正交群）。
损失：\(\ell^2\) 损失最小化全局旋转：\(\ell(\hat{z}, z^*) = \min_{\theta}\sum_{i=1}^n |\hat{z}_i - e^{i\theta} z_i^*|^2\)。在正交群情况下类似，但为 \(\ell_2\) 距离（矩阵 Frobenius 范数模群作用）。

主要结果¶

定理 1（相位同步，不完全数据）：假设 \(\sigma^2/(2np) \to 0\)（即一致估计可行），则谱方法估计 \(\hat{z}\) 满足

\[\ell(\hat{z}, z^*) = (1 + o_{\mathbb{P}}(1)) \frac{\sigma^2}{2np},\]

且进一步地，在温和矩条件下，

\[\mathbb{E}[\ell(\hat{z}, z^*)] = (1 + o(1)) \frac{\sigma^2}{2np},\]

其中下界 \(\frac{\sigma^2}{2np}\) 是之前文献已建立的 minimax 下界（Gao & Zhang 2020）。因此谱方法达到了精确 minimax 最优（首项常数匹配）。

定理 2（正交群同步）：类似地，在 \(\sigma^2 d(d-1)/(4np) \to 0\) 条件下，谱方法的 \(\ell_2\) 损失满足

\[\ell(\hat{Z}, Z^*) = (1 + o_{\mathbb{P}}(1)) \frac{\sigma^2 d(d-1)}{4np},\]

与 Gao & Zhang (2021) 中 MLE 的最优风险一致。

技术难点： - 需要处理不完全观测带来的方差变异：\(A_{ij}\) 的 Bernoulli 性使得噪声方差不同，且数据矩阵的期望不是低秩的（因为对角元缺失）。通过巧妙的总体特征向量选择，将期望矩阵的“秩一”性恢复。 - 一阶近似需要紧致的界：传统的一阶近似引理（如 Abbe et al. 2017）是在 \(\ell_\infty\) 范数下成立，且需要要求 \(n\) 与秩的关系。本文改为 \(\ell_2\) 范数并证明在主项误差之上高阶项可忽略，这需要新的扰动分析（引理 4）。

证明路线与技术技巧¶

整体路线（以相位同步为例，完整观测 \(p=1\) 的简化版本以说明主干，不完全观测类似但需要处理 \(A_{ij}\)）：

总领引理（Lemma 4）：对于 \(X = n u^* u^{*H} + \sigma W\)（对角元修正后），在 \(\sigma \ll \sqrt{n}\) 条件下，
\[\|\tilde{u} - u^* - (I - u^*u^{*H})\frac{X u^*}{n} \|_2 = O_{\mathbb{P}}\Big( \frac{\sigma^2}{n^{3/2}} \Big),\]
其中 \((I - u^*u^{*H})\frac{X u^*}{n}\) 一阶近似了误差。这通过建立 \(\tilde{u}\) 的迭代形式并控制高阶项得到，用到 Davis-Kahan 定理的精细版本与 Chebyshev 不等式。
一阶误差项的显式公式（Lemma 5）：计算
\[(I - u^*u^{*H})\frac{X u^*}{n} = \frac{1}{n} \sum_{k\neq j} W_{jk} u_k^* + \text{（对角元修正的项）} .\]
该量是一个复高斯随机向量，其每个坐标的方差约为 \(\sigma^2/(2n^2)\)，因此总平方和的期望等于 \(\sigma^2/(2n)\)（对应 \(\sigma^2/(2np)\) 在 \(p=1\) 时）。
从特征向量误差到估计误差（Lemma 7–8）：谱方法估计 \(\hat{z} = \mathcal{P}(\tilde{u})\) 的损失可以由 \(\|\tilde{u} - u^*\|_2^2\) 加上边界项表示，证明的关键是 \(\tilde{u}_i\) 与 \(u_i^*\) 的相位差可以近似为 \((\tilde{u}_i - u_i^*)/u_i^*\) 的虚部等。
合并得到主项：结合以上，得到损失的主项期望为 \(\sigma^2/(2np)\)。

关键技术技巧：

总体特征向量 \(u^* = z^*/\sqrt{n}\)：这一选择使得 \(X\) 的期望矩阵 \(E[X] = n u^* u^{*H} - \text{diag}(u^* u^{*H}?\)，对角元修正后恰好 rank-1 且特征值与 n 相关。这避免了传统定义中特征向量范数与分量比例导致的问题。
新的一阶近似引理（Lemma 4）：这是全文技术核心。它不同于 Abbe et al. (2017) 的 \(\ell_\infty\) 界，而是直接在 \(\ell_2\) 中给出紧致逼近。证明思路：利用特征值扰动 \(|\lambda_1 - n|\) 的控制，以及 \(\tilde{u}\) 作为 \(\lambda_1\) 与 \(X\) 的瑞利商关系，得到 \(\tilde{u} = \frac{X\tilde{u}}{\lambda_1}\)，然后代入展开。具体推导需要用到 \(\|X u^*\|_2\) 的集中不等式和 \(\lambda_1\) 在 \(n\pm O(\sigma\sqrt{n})\) 范围内的性质。
Leave-one-out 思想：尽管没有显式叫 leave-one-out，但在估计每一步概率界时，使用了 \(\tilde{u}_{(-i)}\) 的构造（在引理 A.2 等细节中），独立出单个坐标的噪声，这是经典 leave-one-out 技巧。
处理不完全数据时的二项方差：通过将邻接矩阵 \(A_{ij}\) 视为独立 Bernoulli，用 Bernstein 不等式控制 \(A_{ij}\) 与噪声乘积的和，得到与完全观测情形相同的主项形式，只是 \(\sigma^2\) 替换为 \(\sigma^2/p\)（因为有效样本量减少）。

真实例子与应用¶

本文为纯理论论文，无实证例子。模拟或真实数据应用均未出现。所有结果都是渐近理论陈述与证明。

🔎 结论是否比证明窄¶

定理 1 的结论是“谱方法达到 minimax 下界且首项常数匹配”。证明是在一致估计可行（\(\sigma^2/(2np) \to 0\)）的设定下完成的。如果 \(\sigma^2/(2np)\) 仅是有界常数而非趋于0，则一阶近似的高阶项可能不消失，此时常数匹配可能不成立。本文明确写了“as long as consistent parameter estimation is possible”，但未覆盖相变边界处的精确刻画。这是窄的地方。
对于正交群，论文的第二部分假设 \(d\) 固定。当 \(d\) 随 \(n\) 增长时（如高维正交群），结果可能不成立，且未讨论。Gao & Zhang (2021) 的类似结果也限于固定 \(d\)。因此结论的适用范围在 \(d=O(1)\)。
关于旋转群 \(\mathrm{SO}(d)\)（行列式>0），本文只处理了正交群 \(\mathrm{O}(d)\)。实际上，极分解投影到正交群可能得到行列式为 -1 的矩阵，而旋转群需要额外约束（符号调整）。Gao & Zhang (2021) 通过“sign trick”处理了旋转群，本文未特别处理，因此它的正交群结果并不自动涵盖旋转群（虽然可以通过对每个块取其行列式符号修正来扩展，但论文并未给出严格证明）。这算一个窄点。

四、开放问题¶

旋转群（\(\mathrm{SO}(d)\)）的情形：本文只覆盖了正交群 \(\mathrm{O}(d)\)。对于旋转群，需要一个额外的符号调整步骤。Gao & Zhang (2021) 已处理了旋转群，但使用的是更复杂的极分解算法。谱方法是否也能达到相同的精确 minimax 常数？这可以作为一个具体的延伸问题。（扎根：论文第二节末尾说“We further extend our analysis to establish the exact minimax optimality of the spectral method for the orthogonal group synchronization”，明确范围限于正交群。）
高维群（\(d\) 随 \(n\) 增长）：本文假设 \(d\) 固定。当 \(d = d_n \to \infty\) 时，谱方法的表现如何？此时极大似然估计的 minimax 风险是什么？是否存在更优的谱方法？（扎根：定理 2 的假设“\(d\) 固定”未在正文中明确陈述，但证明中使用了维度可分离的定常常数，如果 \(d\) 增长则 ruby 中的 \(\ell_2\) 误差可能不再是渐近正态高斯。）
更一般的噪声协方差：假设噪声不是独立同方差高斯，而是有异方差性或相关性（如每个 \(Y_{ij}\) 的方差不同）。谱方法是否仍然能达到最优？本文的一阶近似工具能否推广？（扎根：论文引言结尾提到“a new perturbation analysis toolkit”，其证明依赖于高斯独立同方差性质。异方差情形需要新的集中不等式。）
非线性变换的扩展：本文处理的是加性高斯噪声。如果噪声模型是对数正态、泊松、或者相对测量是由非线性链接函数生成的（如广义线性模型中的同步化），谱方法是否还能达到 minimax 最优？这可能涉及到指数族分布下的矩阵估计问题，与 Gao & Zhang (2020) 中 MLE 的扩展方向一致，但谱方法更依赖矩信息。（扎根：论文模型（2）是加性高斯异方差，但作者提及了更一般的噪声模型在 [7] 中讨论，但本文未涉足。）

提醒：想确认问题 1 是真 gap 还是 trivial extension，可以去读 Gao & Zhang (2021) 的引理细节，看他们处理旋转群时是否用了本质不同的技术；另外，检查本文附录中关于正交群同步的证明是否包含了符号自由度处理。

Maintained by 陈星宇 · Homepage · Source on GitHub