https://arxiv.org/abs/2104.04191
SI-Score: An image dataset for fine-grained analysis of robustness to object location, rotation and size (Jessica Yung, Rob Romijnders, Alexander Kolesnikov, Lucas Beyer, Josip Djolonga, Neil Houlsby, Sylvain Gelly, Mario Lucic, Xiaohua Zhai)
bit/vit/clip와 bn/gn에 대한 객체의 위치, 크기, 회전에 대한 robustness 평가. vit와 clip의 특성이 상당히 좋군요. conv padding 문제일까 싶기도 하고...bn과 gn도 location에 대한 robustness 패턴 차이가 크네요.
#robustness #vision_transformer #backbone