图形对比性聚类

对比学习 04/07/2022

三个要点
✔️ 开发了一个新颖的图对照框架，通过学习来确保同一聚类和增量结果中的样本具有相似的表示数量。
✔️ 将上述框架应用于聚类，并引入了一个学习具有高判别性能的特征的模块和一个更紧凑的集群分配模块。
✔️ 图像聚类实验。在各种数据集上。并记录了明显高于现有模型的准确性。

Graph Contrastive Clustering
written by Huasong Zhong, Jianlong Wu, Chong Chen, Jianqiang Huang, Minghua Deng, Liqiang Nie, Zhouchen Lin, Xian-Sheng Hua
(Submitted on 3 Apr 2021)
Comments: Published on arxiv.
Subjects: Computer Vision and Pattern Recognition (cs.CV)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

介绍

最近，有人提出了对比性学习，它同时进行表示和聚类分配。然而，聚类可能受到传统方法不考虑分类信息的限制。因此，本文开发了一个新的图对比框架，并提出了应用于聚类的图对比聚类（GCC）。

技术

$N$未标记的$N$图像，属于$K$类型的类别给定一组图像${\bf I}=\{I_1,I_2,\cdots,I_N\}$，聚类的目的是将它们分为$K$类型的聚类。为了获得特征，一个CNN模型$\Phi(\theta)$被训练，$(z_i,p_i)$通过将$I_i$映射到$d$维特征表示($||z_i|||_2=1$)和$K$维聚类分配概率分布($\sum_{j=1}^Kp_{ij}=1$).第$i$个样本的预测标签按以下方式获得。

$$l_i = {rm arg max}_j(p_{ij}), 1\le j\le K$$

图形对比法（GC）

让$G=(V,E)$是一个无向图，顶点$V={v_1,cdots,v_N}$和边$E$。设$G=(V,E)$是一个无向图，顶点$V={v_1,cdots,v_N}$，边$E$，定义邻接矩阵$A$为

$$A_{ij}=\begin{cases}1, & {\rm if}(v_i, v_j)\in E \\0, & {\rm otherwise} \end{cases}$$

让$D_i$为$V_i$和矩阵$D$的顺序。

$$d_{ij}=\begin{cases}d_i, & (i=j) \\0, & (i\neq j) \end{cases}$$

是一个有$ij$成分的矩阵，归一化的对称图拉普拉斯定义为

$$L=I-D^{-\frac{1}{2}}AD^{-\frac{1}{2}},\ L_{ij}=-\frac{A_{ij}}{\sqrt{d_id_j}}(i\neq j)$$

给出$N$归一化的$N$特征表示${\bf x}=\{x_1,\cdots, x_N\}$，如果$A_{ij}>0$，GC确保$x_i$和$x_j$接近，如果$A_{ij}=0$，$x_i$和$x_j$远离。如果图被划分为几个社区，同一社区的特征表示的相似性将大于不同社区的特征表示。将内部和外部社区的相似性$S_{intra}$和相似性$S_{inter}$分别定义如下。

$$S_{intra}=\sum_{L_{ij}<0}-L_{ij}S(x_i,x_j)$$

$$S_{inter}=\sum_{L_{ij}=0}S(x_i,x_j)$$

然而，$S(x_i,x_j)$是相似度，本文使用的是高斯核。

$$S(x_i,x_j)=e^{-||x_i-x_j||_2^2/\tau}\sim e^{x_i\cdot x_j/\tau}$$

因此，GC的损失是

$${\cal L}_{GC}=-\frac{1}{N}\sum_{i=1}^N\log(\frac{S_{intra}}{S_{inter}})$$

这将是一种情况。

GCC

GCC框架如下图所示。

它由两个共享CNN的头组成，包括一个用于学习特征的Representation Graph Contrastive（RGC）模块和一个用于学习集群分配的Assignment Graph Contrastive（AGC）模块。

RGC

如果${\bf I}'=\{I_1',\cdots,I_N'\}$是原始图像的随机变换，$z'=(z_1',\cdots,z_N')$是它们的特征，根据以上讨论，RGC损失可以写成如下。

$$L_{RGC}^{(t)}=-\frac{1}{N}\sum_{i=1}^N\log\left(\frac{\sum_{L_{ij}^{(t)}<0}-L_{ij}^{(t)}e^{z_i'\cdot z_j'/\tau}}{\sum_{L_{ij}=0}e^{z_i'\cdot z_j'/\tau}}\right)$$