GPT-SoVITS, 목소리 훈련 가능한 TTS 툴
·
Web.World/Ai.ML.SD
비교적 낮은 사양과 CPU에서도 구동 가능한 TTS툴. 깃헙은 여기. 자신의 목소리를 트레이닝시킬 수 있습니다. 윈도에서도 잘 돌아가고요. 하나의 언어에서 한국어, 영어, 일본어, 중국어, 광동어 등의 음성을 생성할 수 있다고 하네요. 억양이나 감정을 좀 더 조절할 수 있는 음성 합성이라고 하면 Style-Bert-VIST2도 괜찮은 선택이라고 하니(단, 일본어만 가능) 참조하세요. .....해보니까 윈도에서의 완성이 올바르지 않은 것 같습니다. 우분투에서 하는게 맞지 않나...싶네요. 일본어 목소리 샘플은 여러곳이 있는데 무료로 사용할 수 있는게 꽤 되는 것 같습니다. 우분투를 사용한다면 도커로도 사용할 수 있다고 합니다. PC.WATCH에 사용법이 상세하게 나와 있네요. 목소리 데이터 세트는 여러가지..
AI 보이스(국내) 업체 이용하기
·
Web.World/Ai.ML.SD
생각보다 가격이 되게 비싸거나 하진 않는데, 이걸 전문적으로 사용한다면 미묘하지 않나 싶음. 마이크로소프트 애저, 네이버 클로바 더빙, KT AI 보이스 등이 있는 듯하다. 각종 클라우드 기반 서비스를 제공하는 업체나 전문 업체들도 관련 서비스를 제공하고 있다. 예를 들면 프로소디, 타입캐스트, 구글, 아마존, 카카오, IBM 등에서도 TTS 서비스는 제공하는데 무료 제공하는 업체는 차이는 좀 있는 편. 개인적으론 MS 애져가 되게 만족도가 높았음. 반응 속도도 빠른 편이고. 약관 잘 읽어보고, 필요에 따라 이리저리 사용하면 되지 않나 싶다. 개인적으로 기본 발음에서 가장 어색함이 적었던 건 클로바고, 설정을 해도 비교적 위화감이 적게 우리말로 만들어지는 건 MS 애져였다. 앞으로도 국내 AI 보이스 업..
마이크로소프트 애저 음성 서비스 사용하기
·
PC.Div.Soft/Tip
MS 애저 계정으로 무료 요금제를 사용하면 제한적이지만 음성 파일 합성이나 음성 > 텍스트 변환 등을 해볼 수 있다. 텍스트로의 변환은 Whisper쓰는게 더 편하긴 하지만. TTS의 경우 국내라면 KT나 클로바의 음성 합성 서비스가 굉장히 만족도가 높다. MS의 TTS서비스 역시 좋지만, 개인적으론 클로바가 좀 더 매력적이지 않나 싶음. 가격도 크게 부담되는 수준은 아니고. 다만 이정도 퀄리티의 서비스를 무료로 사용할 수 있는 건 MS 애저가 유일하지않나 싶다. 어느 정도의 작업을 어떻게 하느냐....에 따라 달린 거겠지만 생각보다 저렴한 가격에 이런 저런 서비스들 사용할 수 있는 건 좋지 않나 싶다. 사용법은 간단하다. 애저 계정 만들고 > 지역은 Korea Central, 이름은 적당히 긴 이름으로..