Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 866 Bytes

230502 Pick-a-Pic.md

File metadata and controls

9 lines (5 loc) · 866 Bytes

https://arxiv.org/abs/2305.01569

Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation (Yuval Kirstain, Adam Polyak, Uriel Singer, Shahbuland Matiana, Joe Penna, Omer Levy)

text2img 모델의 텍스트 프롬프트와, 생성된 두 이미지, 그리고 그 중 어느 쪽을 유저들이 선호했는가에 대한 데이터셋. 크라우드워커가 아니라 유저들의 피드백 결과로 레이블링 되었다는 것을 강조하고 있군요. midjourney도 super resolution 과정에서 유저가 특정 이미지를 선택하게 하는 것으로 선호 레이블을 모으고 있다고 하던데 Stability AI 쪽에서도 비슷한 작업을 한 것을 보면 같은 쪽으로 생각이 모인 것 같네요.

그래서 이 선호도 데이터셋으로 무엇을 할 수 있는가...하면 무궁무진할 것 같군요.

#text2img