https://arxiv.org/abs/2105.05633
Segmenter: Transformer for Semantic Segmentation (Robin Strudel, Ricardo Garcia, Ivan Laptev, Cordelia Schmid)
vit로 semantic segmentation. vit의 이미지 크기 증가에 따른 효율성은 중요한 이슈이지만...그냥 되는 만큼 크게 키워서 쓰는 케이스가 꽤 나올 것 같기도 하네요.
[[210324 Vision Transformers for Dense Prediction]]
#semantic_segmentation