WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing (Sanyuan Chen, Chengyi Wang, Zhengyang Chen, Yu Wu, Shujie Liu, Zhuo Chen, Jinyu Li, Naoyuki Kanda, Takuya Yoshioka, Xiong Xiao, Jian Wu, Long Zhou, Shuo Ren, Yanmin Qian, Yao Qian, Jian Wu, Micheal Zeng, Furu Wei)

speech pretraining. 더 많은 더 다양한 데이터 + mixing augmentation + 모델 보강. 성능이 막 펑펑 뛰어오르네요.

#speech #pretraining

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

211026 WavLM.md

211026 WavLM.md

Files

211026 WavLM.md

Latest commit

History

211026 WavLM.md

File metadata and controls