Skip to content

sangheonEN/Vision_Transformer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Vision_Transformer

ViT(Vision_Transformer)

자연어 처리에서 많이 사용되었던 RNN 순환구조를 이제 Vision 영상 이미지 데이터에 적용한 내용과 이론을 공부하고 실제 구현도 해보는 것에 목적을 둔다.

따라서, Vision Transformer와 ConvLSTM을 구현하는 목표로 해당 GitHub Repo가 생성되었다.

관련 문헌은 아래와 같다. 해당 논문을 리뷰하는 건 나의 개인 기술 블로그를 참고하면 된다. [기술블로그: https://soonhandsomeguy.tistory.com/]


관련 문헌

  1. [RNN, https://arxiv.org/pdf/1409.2329.pdf]

  2. [LSTM, https://static.googleusercontent.com/media/research.google.com/ko//pubs/archive/43905.pdf]

  3. [FC LSTM, https://arxiv.org/pdf/1308.0850.pdf]

  4. [ConvLSTM, https://arxiv.org/pdf/1506.04214.pdf]

  5. [Semantic Segmentation using ConvLSTM, https://arxiv.org/pdf/1807.07946.pdf]

  6. [Vision Transformer, https://arxiv.org/pdf/2010.11929.pdf]

About

ViT(Vision_Transformer)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages