From d4ddf8741082c28c14727191b49834a432e4397e Mon Sep 17 00:00:00 2001 From: Gabriel Yang Date: Sun, 3 Sep 2023 17:16:59 +0900 Subject: [PATCH] vocoder update --- glossary/dictionary/terms/vocoder.qmd | 5 ++++- 1 file changed, 4 insertions(+), 1 deletion(-) diff --git a/glossary/dictionary/terms/vocoder.qmd b/glossary/dictionary/terms/vocoder.qmd index 5079860..e87dbff 100644 --- a/glossary/dictionary/terms/vocoder.qmd +++ b/glossary/dictionary/terms/vocoder.qmd @@ -6,4 +6,7 @@ author: sungmo.yang --- src: HuggingFace audio --- -설명을 추가해주세요. \ No newline at end of file +오디오를 생성하는 모델은 로그 멜 스펙트로그램을 출력으로 생성하는 것이 일반적입니다. 사람이 인지할 수 있는 파형으로 변경하는 신경망인 보코더를 사용합니다. `Bark`와 같은 오디오 딥러닝 모델은 `원시 음성 파형`을 직접 생성합니다. 이와 같은 모델들은 별도의 보코더가 필요하지 않습니다. + +## 참조 +1. https://huggingface.co/learn/audio-course/en/chapter6/pre-trained_models \ No newline at end of file