前言

返回上层目录
YOLO
图像标注工具

===

本质上resnet、densenet、inception这些网络并没有明显区别，都是反复利用feature maps，例如resnet的跳跃连接，densenet的密集连接，inception的多分支。甚至包括那种即插即用的模块，例如注意力机制，本质上也是对feature maps的反复利用，然后就是不同的融合方式。

如果你认真看一下所有的注意力模块，就会发现形式反正就那个形式，卷积、全连接、池化这几种随便叠加，哪种有效就行。

同样，如果你认真去看一些特征金字塔的改进，同样如此，特征金字塔的形式是现成的，关键就在于怎么做融合，有的就是从上往下，有的从下往上，有的上下其手。感兴趣的可以看看公众号CV技术指南的各种大总结《计算机视觉中的特征金字塔技术总结》

再同样，数据增强的方法也有十几篇论文，能怎么创新？反正就那个形式，然后就搞出了cutmix，mixup这十几种。感兴趣的可以看看公众号CV技术指南的各种大总结《计算机视觉中的数据增强总结》

因此，如果给你一个最基本的CNN网络，让你在那上面创新，其实思路是很明确的。一个固定的单路径前向传播，可以改成有捷径的(resnet的跳跃连接），多岔路的(inception的多分支)，通往多个地点的捷径的(densenet的密集连接)，另一个分支上做一些特殊的操作再重新相乘的(注意力模块)。

如果还不明白，再举个例子，如果给你一个基本的CNN网络，应该怎么设计轻量化网络？反正就是卷积通道上的连接减少，激活函数在底层简化、替换耗时的操作如单元素的操作等。

搞到后面就会发现，已经没得搞了。因为它的组成就这么一些，每个地方都有人去做优化。

同样后面的CNN已经没得多大可以创新的了，因为对feature maps的应用的设计就那么一些，只能从别的领域上弄过来了，例如把transformer里的注意力模块弄过来做一些操作。本质上与现有的那些网络创新的思路没什么区别。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

computer-vision.md

computer-vision.md

前言

Files

computer-vision.md

Latest commit

History

computer-vision.md

File metadata and controls

前言