Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 512 Bytes

211018 HRFormer.md

File metadata and controls

7 lines (4 loc) · 512 Bytes

https://arxiv.org/abs/2110.09408

HRFormer: High-Resolution Transformer for Dense Prediction (Yuhui Yuan, Rao Fu, Lang Huang, Weihong Lin, Chao Zhang, Xilin Chen, Jingdong Wang)

hrnet의 transformer 버전이네요. 이 영역에서는 vit의 최고의 성과 swin transformer를 상대하는 게 문제인데 swin transformer가 워낙 무지막지한 모델이라 어떨지 모르겠네요. object detection에서의 성능도 궁금한데...레이턴시는 한 번 찍어볼만 하겠네요.

#vit #backbone