반응형
비교적 낮은 사양과 CPU에서도 구동 가능한 TTS툴. 깃헙은 여기. 자신의 목소리를 트레이닝시킬 수 있습니다. 윈도에서도 잘 돌아가고요. 하나의 언어에서 한국어, 영어, 일본어, 중국어, 광동어 등의 음성을 생성할 수 있다고 하네요. 억양이나 감정을 좀 더 조절할 수 있는 음성 합성이라고 하면 Style-Bert-VIST2도 괜찮은 선택이라고 하니(단, 일본어만 가능) 참조하세요.
.....해보니까 윈도에서의 완성이 올바르지 않은 것 같습니다. 우분투에서 하는게 맞지 않나...싶네요. 일본어 목소리 샘플은 여러곳이 있는데 무료로 사용할 수 있는게 꽤 되는 것 같습니다.
우분투를 사용한다면 도커로도 사용할 수 있다고 합니다. PC.WATCH에 사용법이 상세하게 나와 있네요. 목소리 데이터 세트는 여러가지...있겠지만 일본어는 무료로 배포되는 츠쿠요미짱의 데이터를 학습에 사용해봐도 괜찮지 않나 싶습니다.
반응형
'Web.World > Ai.ML.SD' 카테고리의 다른 글
Perplexity, Deep Research 공개 (0) | 2025.02.17 |
---|---|
Zonos - 고품질 음성 합성 모델 (0) | 2025.02.14 |
포니 디퓨전(Pony Diffusion), ILXL (0) | 2025.02.02 |