Skip to content

Latest commit

 

History

History
27 lines (16 loc) · 1.48 KB

barlowtwins.md

File metadata and controls

27 lines (16 loc) · 1.48 KB

论文名称:Barlow Twins: Self-Supervised Learning via Redundancy Reduction

论文地址:https://arxiv.org/abs/2103.03230

论文简介:冗余减少原则的自监督学习方法

Abstract

学习表征对于增强的不变性-》容易陷入常数解-》设计方法来避免模型坍塌

image-20230329013043450

使用一种新的视角去学习表示,从embeddig本身出发,而不是从样本出发。优化目标是为两个增强之后的图像输入encoder后得到的嵌入生成互相关矩阵**,使其尽可能地接近单位矩阵,**让不同的维度的特征尽量表示不同的信息,降低特征之间的冗余度。

$$ \mathcal{L}{\mathcal{B} \mathcal{T}} \triangleq \underbrace{\sum_i\left(1-\mathcal{C}{i i}\right)^2}{\text {invariance term }}+\lambda \underbrace{\sum_i \sum{j \neq i} \mathcal{C}{i j}{ }^2}{\text {redundancy reduction term }} $$ 其中:

$$ \mathcal{C}{i j} \triangleq \frac{\sum_b z{b, i}^A z_{b, j}^B}{\sqrt{\sum_b\left(z_{b, i}^A\right)^2} \sqrt{\sum_b\left(z_{b, j}^B\right)^2}} $$

使用这种思路优化得到的编码器也能得到良好的特征。

直观上的解释,这种优化思路相当于将InfoNCE所优化的样本相关阵接近恒等矩阵:$Z_a * Z_b{ }^T \rightarrow \mathcal{I}_N$ 转换为了特征相关阵接近恒等矩阵:$Z_a^T * Z_b \rightarrow \mathcal{I}_D$,在特征维度隐式地提供了负样本,从而无需实例级别的负样本。