Skip to content

Latest commit

 

History

History
5 lines (3 loc) · 265 Bytes

200129 Empirical Attention.md

File metadata and controls

5 lines (3 loc) · 265 Bytes

https://arxiv.org/abs/1904.05873

machine translation에서도 attention term 중 여럿을 제거할 수 있다는 것이 흥미롭지만 저자에 따르면 제거하더라도 computation cost 차원에서 큰 차이가 없다고. (1d sequence라서.)

#attention