Learning With Partial and Noisy Correspondence in Graph Matching¶
作者: Yijie Lin, Mouxing Yang, Peng Hu, Jiancheng Lv, Hao Chen et al.
来源: IEEE Transactions on Pattern Analysis and Machine Intelligence
主题: 统计计算 / 算法
相关性: 3/10
机构绿灯: Hong Kong University of Science and Technology(US News 前 50,免分进入精读)
链接: https://doi.org/10.1109/tpami.2026.3670236
一、领域脉络与小综述¶
这个方向是什么¶
图匹配(Graph Matching, GM)的目标是在两张图之间建立关键点(keypoint)的对应关系,是计算机视觉、模式识别和组合优化的核心问题。其根本是一个二次分配规划(Quadratic Assignment Programming, QAP):找到两个图节点之间的一个置换(或部分对应),使得节点间一元相似性(unary similarity)和边间二元相似性(pairwise / structural similarity)之和最大化。该问题是NP难,且在真实应用中,标注数据往往同时包含部分对应(partial correspondence)——由于遮挡/视角导致的关键点缺失(outlier),以及噪声对应(noisy correspondence)——由标注错误导致的假阳性(FP)与假阴性(FN)。当前主流方法(深度学习监督GM)严重依赖于完整且精确的训练数据,而真实世界这两大挑战同时存在时,方法性能空前退化。本文声称提出第一个统一框架同时处理这两个挑战。
发展脉络(从intro的引用中串出)¶
-
奠基工作:谱方法与经典QAP松弛。最早的工作将GM看作QAP的谱或凸松弛求解。Leordeanu & Hebert (2005) [1] 提出谱匹配(Spectral Matching, SM),通过邻接矩阵的主特征向量近似匹配关系;Cour et al. (2007) [2] 提出带仿射约束的谱匹配(SMAC),引入双随机(doubly stochastic)约束。这些方法速度快、有可证明的松弛界,但对噪声和outlier敏感,且无法利用深度特征。
-
深度学习的端到端学习范式。Zanfir & Sminchisescu (2018) [3] 首次将CNN特征提取与可微的Sinkhorn归一化结合,提出端到端可训练的深度GM;Wang et al. (2020) [4] 通过将关联图(association graph)输入Graph Neural Network (GNN) 进一步提升了结构感知匹配。这些方法显著提升了匹配精度,但引入了两个隐式假设:训练数据无outlier,且标注完全正确。这就留下了两个大缺口。
-
处理部分对应(partial correspondence / outlier)的子线索。Zhang et al. (2019) [5] 提出将匹配视为完全图(complete graph)到非完整图(incomplete graph)的匹配,用一个额外的“空节点”(null node / dummy node)吸收outlier;Liu et al. (2021) [6] 提出在GNN中引入outlier感知的mask机制。问题:这些工作只处理outlier(理论上),且假设标注中全部inlier对应都是正确的。
-
处理噪声对应(noisy correspondence)的子线索。这是一个更年轻、更少人做的子线索。现有做法将匹配建立看作一个多类分类问题,通过噪声转移矩阵(noise transition matrix)或置信度学习(confident learning)去校正错误标签。作者指出这些方法无法同时处理outlier,因为outlier的本质是“无对应关系”而非“错误对应”。
-
KB-QAP与L-QAP的两条分支。Koopmans-Beckmann (KB-QAP) [7] 假设匹配矩阵两边的节点数相同(无outlier),直接优化vec(P)ᵀ(A⊗B)vec(P) 形式;Lawler QAP (L-QAP) [8] 通过关联图上的节点相似度矩阵K,优化PᵀK·P 形式并可以显式处理outlier。作者的说法是:这两类形式此前被分开处理,没有一个框架能同时利用两者的优势。
⚠️ 作者的framing(必须标注)¶
这是作者的话语:本文是"the first unified framework to address both partial and noisy correspondence challenges in graph matching"。作者把缺口感成:① KB-QAP与L-QAP两条技术路线之前是分离的(各自有各自强项);② 部分对应与噪声对应各自有子簇解法,但无法处理对方;③ 因此统一这两个维度、两条技术路线是“显然的下一步”。
合理怀疑:这个“first” claim需要谨慎对待。作者刻意淡化了 序列化处理的可行性(先处理outlier(比如用空节点),再处理标签噪声)——这种两阶段方法显然存在于相关文献中(比如先ROS[依据34]降噪再匹配),但作者在intro中未讨论为何这类串行方案失败,而是直观声称“相互纠缠,简单组合无效”。也淡化了 用凸松弛+约束优化直接统一处理outlier和noise 的可能性(例如[35, 36]的关联图核方法),理由是这些方法难以扩展到大图。
明显该被引用却未出现:引用列表中缺少以下方向:① 结合Fisher信息矩阵的匹配或causal结构匹配(与用户primary interest连接);② 用低秩或低度多项式表示高效求解QAP的统计计算折中文献(对应computationally constrained statistics兴趣)。该论文完全从计算机视觉角度切入,未与统计计算折中(information-computation gap)、半定规划松弛的精确性、或随机图模型下的渐近匹配精度对话。
子线索聚类¶
- 线索1:经典QAP松弛求解(谱方法、凸松弛、SDP)。代表:[1]、[2]、[7]、[8]。这类方法的理论性质比较清晰(松弛界、对偶间隙),但难以融入深度特征提取。
- 线索2:深度学习端到端GM(深度特征+可微匹配层)。代表:[3]、[4]、[5]、[6]。这类方法性能好,但训练要求高质量标注,且依赖特定网络架构(GNN、Sinkhorn)。
- 线索3:噪声/部分对应处理(outlier rejection, label noise correction)。代表:[5]、[6] 处理部分对应;[9]、[10] 处理噪声对应。ILP、置信度学习、噪声转移矩阵是工具,但都是“单维”解法。
- 线索4:关联图核与双QAP融合(本文定位)。作者尝试将KB-QAP与L-QAP在单个框架中融合,依据是“两者的抗噪特性不同”。
核心问题与已知瓶颈¶
- 如何在QAP求解中同时处理outlier(部分对应)与FP/FN(噪声对应)? 两者机制不同(outlier是缺失,FP/FN是错误),但常常同时存在。简单组合现有两类方法往往互相干扰。
- 如何让端到端深度GM对含噪声标注数据鲁棒? 深度方法在清洁数据上已近饱和,但真实世界标注成本决定数据必然有噪声和部分对应。当前方法依赖完美的合成数据或人工精标。
- KB-QAP与L-QAP是否可以互补? 作者认为KB-QAP对特征对齐敏感但容易受outlier影响,L-QAP擅长结构匹配但收敛缓慢。双专家的协同设计是尝试。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
符号(逐个点名):
- \( G^A = (V^A, E^A, X^A) \) 和 \( G^B = (V^B, E^B, X^B) \):两张图(源图与目标图,一般为图像关键点图)。\( V^A = \{1, ..., n\} \),\( V^B = \{1, ..., m\} \)。通常 \( n \neq m \)(因为outlier存在)。
- \( X^A \in \mathbb{R}^{n \times d}, X^B \in \mathbb{R}^{m \times d} \):每个节点的特征矩阵(由深度学习提取的一元特征,d维)。
- \( A \in \mathbb{R}^{n \times n}, B \in \mathbb{R}^{m \times m} \):图的邻接矩阵/边权矩阵(成对结构信息)。
- \( P \in \{0,1\}^{n \times m} \):匹配矩阵,\( P_{ij}=1 \) 表示 \( G^A \)中的节点i与 \( G^B \)中的节点j匹配(对应)。通常受到排他性约束 \( P \cdot \mathbb{1}_m \leq \mathbb{1}_n \),\( P^\top \cdot \mathbb{1}_n \leq \mathbb{1}_m \)(每个节点至多一个对应;若 \( n = m \)则为置换矩阵)。
- \( \text{vec}(P) \in \{0,1\}^{nm} \):匹配矩阵的向量化形式。
- \( C \in \{0,1\}^{n \times m} \):对应矩阵(correspondence matrix),本质上是GT匹配矩阵。在真实数据中,我们观测不到干净的 \( C \);我们只有带有噪声的初始对应标注 \( \tilde{C} \)。
- \( K \in \mathbb{R}^{nm \times nm} \):关联图(association graph)的邻接矩阵/相似性矩阵。\( K_{ia;jb} \)度量了节点i(在Gᴬ)与节点j(在Gᴮ)配对 与 节点a与节点b配对的相容性(通常用边的相似性计算)。K是Lawler QAP的核心。
- KB-QAP:\( \max_{P} \; \text{vec}(P)^\top (A \otimes B) \; \text{vec}(P) \),受约束于P为部分置换矩阵。
- L-QAP:\( \max_{P} \; \text{vec}(P)^\top K \; \text{vec}(P) \),同样受约束。它可以显式建模uncertainty(K可以编码某些配对是不可能/outlier),因此对部分对应更灵活。
- Inlier / Outlier / FP / FN:inlier = 图中有关键点且GT中有正确对应关系;outlier = 源图或目标图中存在一个关键点,GT中它无对应点;FP = 算法/噪声标注中给出了一个inlier到错误点的匹配;FN = 算法/噪声标注中忽略了某个inlier的匹配。
模型:本文是监督GM深度学习方法。数据生成机制假定: - 清洁的对应矩阵 \( C \)(真实的匹配关系)服从一个稀疏的部分置换(partial permutation); - 我们只能观察到带噪声的对应矩阵 \( \tilde{C} \),其生成过程为: - 部分对应:\( C \)中的部分行或列被标记为outlier(即相应节点无对应关系并保留在图中); - 噪声对应:\( C \)中的一些inlier对应被错误改写(FP)或遗漏(FN)。 - 同时有节点特征 \( X^A, X^B \)和边结构 \( A, B \)作为可观测辅助信息。
可观测数据: - 研究者实际能观测到的:① 图结构 \( G^A, G^B \)(节点特征+边权);② 带噪声的初始对应标注 \( \tilde{C} \)(比如人工标注或自动生成);③ 训练数据中每个样本的这两者,通常带有监督信息(清洁的C不可观测,但局部子集已知或部分是人工精标)。 - 研究者想要但观测不到的:① 真实清洁的对应矩阵 \( C \);② 每个节点是inlier还是outlier的判别;③ 哪些当前标注是FP/FN。这些都需要通过模型假设l来识别/估计。
第二步:讲最小内核¶
最小内核(去掉了所有冗余):我们有两张图Gᴬ和Gᴮ(节点数n, m),以及一个带有噪声的初始对应矩阵C⁰。C⁰中有许多标注是错误的(FP)或缺失(FN),且图中存在outlier节点(在对方图中没有对应点)。我们的任务是从 (Gᴬ, Gᴮ, C⁰) 出发,输出一个鲁棒的匹配矩阵P(清洁对应矩阵的估计),同时判别出哪些是outlier、哪些是inlier之间正确的匹配关系。
最简特例(让内核一目了然): - 设 \( n = m = 3 \),图Gᴬ有节点 {A1, A2, A3},图Gᴮ有节点 {B1, B2, B3}。 - 真实清洁匹配为:A1↔B1, A2↔B2, A3是outlier(在Gᴮ中无对应)。 - 我们观测到的初始标注C⁰(带噪声)为: - 标注了A1↔B1(正确,inlier); - 标注了A2↔B2(正确,inlier); - 错误地标注了A3↔B3(一个FP,因为A3应当是outlier但被错误匹配到B3); - 没有FN(所有inlier都被标注到了)。 - 因此C⁰有2个inlier + 1个FP。任务:从C⁰和特征/结构中,把C⁰修正为清洁输出(只保留A1↔B1和A2↔B2,去掉A3↔B3这个FP,并将A3标记为outlier)。
核心困难:单纯的谱松弛无法判别FP(A3↔B3在联合图结构中可能看起来合理),而单纯的结构匹配对outlier不敏感。双专家协作用来 相互验证:如果A3是outlier,那么KB-QAP(对特征对齐敏感)会在对齐A3时发现它没找到任何好的特征匹配,从而给出低的特征相似度;L-QAP(对结构敏感)则可能在关联图上发现A3↔B3这条边与周围的inlier边存在结构不一致(因为它是错误的)。两个专家不同的噪声敏感性为相互剔除虚假匹配奠定了基础。
用符号描述问题的精炼形式: 给定: - 特征矩阵无噪声:Xᴬ, Xᴮ - 边结构无噪声:A, B - 带噪声对应标注:C⁰(一个初始的部分置换矩阵——FP和outlier的)
求:清洁的非部分置换矩阵P(仅inlier对应)与outlier判别向量。
本文的核心思路:让一个KB-QAP专家(专注特征对齐和inlier/outlier区分)和一个L-QAP专家(专注结构相容性与outlier拒绝机制)互相看对方的输出结果的“短板”,联合识别/剔除FP和FN,迭代到一致。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在监督图匹配中,同时处理部分对应(outlier)和噪声对应(假阳性/假阴性)两个真实世界挑战,本文首次提出统一框架。
- 核心工具/方法:将KB-QAP与L-QAP两种QAP形式在一个 Align-Fuse-Refine 三阶段管线中融合,使用双专家协作:KB-QAP专家借助二次对比损失(Quadratic Contrastive Loss) 进行特征对齐与inlier/outlier区分;L-QAP专家在关联图上使用Graph Transformer进行结构融合,并引入可学习的Outlier拒绝机制。最后利用两专家的抗噪差异识别并修正FP/FN。
- 主要结论:在四个标准图匹配数据集(Pascal VOC, Willow Object Class, SPair-71k, CUB-200-2011)上,在同时存在部分对应和噪声对应的设定下,统一框架显著优于17个基线方法,在匹配精度(mAP)上平均提升10%以上。
关键设定与假设¶
在第二节最小记号的基础上,补全完整设定:
完整的网络架构(Align-Fuse-Refine): - Stage 1: Align。将Gᴬ, Gᴮ和图特征Xᴬ, Xᴮ输入一个Shared Graph CNN编码器,得到增强的特征。然后构建一个关联图(association graph),节点是初始C⁰中所有可能的配对(i,j),节点特征为特征相似度。然后一个KB-QAP专家对该关联图进行匹配,输出一个粗对齐结果和每个节点是 inlier/outlier的soft判别。KB-QAP专家通过一个二次对比损失(Quadratic Contrastive Loss)训练:它要求相似节点间二次对齐很强,不相似节点间弱。 - Stage 2: Fuse。L-QAP专家在关联图上使用Graph Transformer(包含self-attention、cross-attention、relationship-aware attention)融合Stage 1输出的对齐图与关联图中的结构信息,并引入可学习的outlier拒绝机制——对每个可能的配对(i,j)学习一个拒绝权重(通过一个MLP将节点特征映射为outlier分数)。此时,Stage 2会输出一个更新后的匹配矩阵(基于降低outlier配对权重后的结构相似性)。 - Stage 3: Refine。利用两个专家的不同噪声敏感度:KB-QAP对特征噪声(FP/FN导致的特征冲突)敏感,L-QAP对结构噪声(outlier的不一致性)敏感。通过一个 F-Net(一个可学习的融合网络)比较两个专家的输出,识别哪些匹配是FP/FN,并对Stage 1的输出进行修正。这个阶段是训练时的辅助头,在推理时仅使用Stage 2的匹配结果。
关键假设: 1. 可观测性:我们能够获得初始的带噪声标注C⁰(即使全是FP/FN和outlier)。在实验设定中,这是通过人工构建合成噪声来模拟(例如,将GT中inlier对应随机翻转或删除部分对应标签)。 2. 结构一致性:inlier匹配在结构和特征上都更一致;outlier匹配在结构上通常(但非必然)不一致。 3. 双专家不同噪声敏感性是可利用的:这是本文的核心假设——KB-QAP对特征FP/FN敏感(FP/FN会损害特征对齐),而L-QAP对outlier敏感(outlier在关联图结构中会造成矛盾)。这个假设在消融实验中得到部分实证验证,但没有理论证明。 4. 可学习性:所有模块可以通过端到端学习,使用一个联合损失(包括匹配损失、outlier分类损失、FP/FN识别损失)进行训练。
与已有文献的对比: - 相比[5, 6](仅处理部分对应):本文额外处理噪声对应; - 相比[9, 10](仅处理噪声对应):本文额外处理部分对应; - 相比从未统一KB-QAP与L-QAP:本文是首个两者融合。
主要结果(理论+实证)¶
理论结果:本文没有任何定理或统计保证。所有主张都通过实验验证。
实证结果:四个数据集上,本文提出方法(DGC-Net)针对如下设定进行了评估:
- 设定1: 部分对应+噪声对应(混合)。这是本文的核心场景:在clean GT标注上增加outlier(用删除部分对应标签来模拟)并随机翻转一部分inlier对应产生FP/FN。
- 在Pascal VOC(含20类目标物体)上,DGC-Net(mAP=0.864)相比次优方法(ENDSC 0.773)提升了9.1%。
- 在Willow Object Class(含20类,但每个目标有精确标注)上,DGC-Net(mAP=0.974)对比次优(ENDSC 0.898)提升了7.6%。
-
在SPair-71k(大型数据集,包含从易到难的子集,有严格的地面真实匹配)上,DGC-Net在“难”子集上优势更明显(mAP约0.749 vs. 次优~0.618,差距≈13.1%)。
-
设定2: 仅有部分对应(outlier=25%)。DGC-Net(0.906)略优于专门处理outlier的基线(如BB-GM 0.869, NGM 0.879)。这表明统一框架在处理纯部分对应时也未退化。
-
设定3: 仅有噪声对应(翻转率=25%)。DGC-Net(0.867)优于专门处理噪声的基线(如PR-GM 0.791, D2D-GM 0.842)。
-
消融实验:验证每个组件(双专家、可学习outlier拒绝机制、二次对比损失、精炼模块)的必要性。去除任何一个组件都会显著降低性能(mAP下降5-15%)。
-
可视化结果:展示了DGC-Net成功识别并剔除了FP/FN和outlier的案例。例如,在一个有遮挡的图片中,模型正确地将被遮挡的关键点识别为outlier(而不是强行匹配),并修复了因为遮挡导致的错误标注。
这个例子想说明什么: - 验证了双专家协作理念:两个专家在不同类型噪声下的表现差异确实可以被用于相互验证和修正。 - 说明统一框架在不同数据集上的广泛适用性:从严谨的物体类匹配(Willow)到更复杂多变的目标检测结果匹配(Pascal VOC)。 - 展示了outlier拒绝机制和FP/FN识别能力的有效性。
证明路线与技术技巧(本文为纯工程方法,无证明,故分析其设计路线)¶
整体路线(设计路径,而非数学证明): 1. Step 1: 共同骨干(Shared Graph CNN):提取节点增强特征 \( \tilde{X}^A, \tilde{X}^B \)。 2. Step 2: 构建初始关联图:基于C⁰构建关联图节点,每个节点代表 (i, j) 对。节点特征: \( F_{ij} = g(\tilde{x}_i^A, \tilde{x}_j^B) \),其中 g 是非线性度量。边权重:利用图邻接矩阵A或B(或两者)。 3. Step 3: KB-QAP专家:将关联图输入一个KB-QAP形式的匹配器。它输出一个匹配矩阵 \(P^{KB}\) 并附带每个节点是否是inlier的概率。使用二次对比损失: \( \mathcal{L}_{QCL} = \sum_{(i,j) \in inlier} \left( P^{KB}_{ij} - 1 \right)^2 + \sum_{(i,j) \in outlier} \left( P^{KB}_{ij} - 0 \right)^2 + \lambda \sum_{(i,j) \in C^0 FP} \left( P^{KB}_{ij} - 0 \right)^2 + \lambda \sum_{(i,j) \in C^0 FN} \left( P^{KB}_{ij} - 1 \right)^2 \)。其中inlier/outlier来源于带噪声的初始标注。这个损失直接通过对比inlier与outlier的方向约束了二次对齐强度。 4. Step 4: L-QAP专家:在关联图上做Graph Transformer。它接受节点特征、边特征、以及从KB-QAP得到的P^KB。它在关联图上进行关系感知的注意力,输出每个配对的新特征,通过MLP预测每个配对的outlier拒绝权重 \(w_{ij} \in [0,1]\)。然后,关联图的结构相容性矩阵 \(K\) 被重新加权:\((1-w_{ij})K_{ij;ab}\),从而削弱outlier配对的相容性。L-QAP专家最后通过传统谱匹配或soft-assignment方法输出匹配 \(P^{L}\)。 5. Step 5: 精炼(Refine):使用F-Net(一个小的MLP),输入是 \(P^{KB}\) 和 \(P^{L}\) 的行/列特征对齐误差差异、以及四个损失值(QCL、outlier权重损失和匹配损失等)。输出是对每个可能的配对(i,j)的修正标签(是否更正FP或FN)。这一阶段只在训练时使用;推理时直接使用L-QAP专家的输出。
关键跳跃点(设计难点与解决办法): - 难点1: 如何让KB-QAP专家对FP/FN敏感,而不是对outlier? 解决:二次对比损失在训练中鼓励inlier(包括真实inlier和错误标注为inlier的FP)之间强对齐,而outlier之间弱对齐。在推理时,如果初始C⁰中的某个错误FP在特征空间找不到好的对齐,它会被标记为outlier。而outlier如果在结构上表现出错误,会被L-QAP专家剔除。 - 难点2: 如何在同一框架下学习outlier拒绝机制? 解决:L-QAP专家直接输出每个配对的outlier拒绝权重\(w_{ij}\),权重预测损失是一个额外的交叉熵损失(监督信号通过合成数据获得:哪些节点是真实outlier)。这个设计使得网络能够完全端到端地学习。 - 难点3: 双专家怎么“协作”? 解决:KB-QAP的输出是L-QAP的输入之一(对齐信息),L-QAP的输出反过来用于训练阶段的精炼,但反向梯度是切断的(stop-gradient)。在精炼阶段,F-Net只接收两个专家的输出,学习它们的互补性。
技术技巧点名: - 二次对比损失(Quadratic Contrastive Loss):这是本文贡献中最有趣的部分。它是一个监督对比损失,但对配对进行了二阶结构约束,使得KB-QAP的输出矩阵可以直接被inlier/outlier区分信号优化。 - Graph Transformer on Association Graph:不是简单的GNN,而是将transformer(self-attention + cross-attention)应用于关联图节点。任意两个节点(i,j)和(a,b)的关系是结构相容性(通过边权重嵌入)。 - 可学习的Outlier拒绝机制:直接在推理时,通过MLP输出权重改变关联图的边,实现显式outlier剔除,而不是隐式学习。 - 端到端训练,多任务损失:匹配损失 + 二次对比损失 + outlier权重预测损失 + FP/FN识别损失。使用梯度裁剪等训练技巧。
🔎 结论是否比证明窄¶
是的,结论明显比证明窄。论文声称“统一框架”,并且实验结果很亮眼,仔细检查可以发现: 1. 结论基于合成噪声:实验中创建部分对应和噪声对应是通过根据已知GT自动生成(随机删除/翻转),而不是来自真实的标注过程。这限制了结论对真实世界标注噪声的泛化性(真实噪声可能具有结构性,而不是独立同分布随机)。 2. 没有收敛性/一致性保证:框架在训练数据上优化,但没有任何理论保证在未见数据上的匹配精度、或对噪声的鲁棒性。一个真实的“统一框架”如果声称相泛化,应该提供收敛速率或至少泛化误差界。 3. 双专家协作的必要性未严格归因:论文展示了消融实验中去除一个专家性能下降,但没有证明是“互补性”还是“冗余有益”——一个简单的集成方法(ensemble of two vastly different architectures)可能获得相似结果。在结论中,作者将“双专家协作”表述为关键驱动力,而实际可能只是ensemble+更多参数的好处。 4. outlier拒绝机制的“可学习”部分效果没有下限:在outlier比例特别高(如80%)时,框架是否仍有效?论文只给出了outlier=25%和50%的实验;若outlier比例再高,该机制的可靠性是未知的(且未讨论)。
四、开放问题¶
本文留下的开放问题(只罗列,不判断可行性,扎根具体语句):
-
理论保证:
“本文首次统一处理两个挑战”——但这种统一是否有理论效率边界?能否证明在特定噪声模型下,该框架的匹配误差率一致收敛到GT?扎根于:作者仅在实验部分给出了性能表现,全篇无定理。可在定理风格上填补这个gap。
-
伪成对的结构假设:
“KB-QAP对特征FP/FN敏感,L-QAP对结构outlier敏感”——这个假设是否普遍成立?对于某些结构化噪声(如类别内相似物导致的系统FP),两个专家可能都对其不敏感。这对应引力空间中的结构性误差。扎根于:消融实验中只进行了随机翻转,没有讨论结构性误差。
-
训练复杂度与实际部署:
框架含两个大网络(Graph Transformer + Shared GCN)和多任务损失,其训练的计算复杂度(由关联图尺度的立方缩放到O(n³))如何?能否利用关联图核的稀疏性来加速?当前唯一量化是“使用英伟达V100训练”。这为统计计算中的计算复杂度分析(关联图sparsification带来的信息损失与效率增益)留下了空间。扎根于:正文未提供Algorithms复杂度分析。
-
非精确匹配下的泛化:
当前所有实验基于 关键点级别的精确匹配(每个关键点至多一个对应)。扩展到柔软匹配(如软/概率/模糊对应,每个节点可以部分匹配多个点)时,二次对比损失的定义需要修改。扎根于:第三节“Discussion”中的“未来工作”部分提到将扩展到非刚性匹配和非精确匹配。
提醒:如需确认第一个gap是否是真的gap(而非方法盲点),去读最近两年的ICCV/CVPR图匹配相关的intro——都指出无理论保证是共同问题(真共识),但其重要性在CV社区可能被降低(因为他们更重性能)。
Maintained by 陈星宇 · Homepage · Source on GitHub