https://arxiv.org/abs/2109.04988
Panoptic Narrative Grounding (C. González, N. Ayobi, I. Hernández, J. Hernández, J. Pont-Tuset, P. Arbeláez)
오...visual grounding에서 한 발짝 더 나아갔군요. 이미지 캡션에 대해서 상응하는 panoptic segmentation map을 생성하는 과제, 데이터셋, 베이스라인 모델을 만들어 공개했습니다.
#visual_grounding #panoptic_segmentation