TTS
1.6B 파라미터로 감정 담은 말하기가 가능한 Nari DIA
1.6B 파라미터로 감정 담은 말하기가 가능한 Nari DIA
2025.04.27얼마전 한국 Nari Labs에서 만든 Dia TTS엔진이 공개되었습니다. 허깅페이스 등에서 데모 페이지도 제공하고 있네요. 영문만 지원하며, 웃음이나 화자 설정 등이 가능합니다.
Elevenlabs.io - 자연스러운 TTS 서비스
Elevenlabs.io - 자연스러운 TTS 서비스
2025.04.18월 10,000크레딧 제공, 요즘엔 MS Azure보다 좀 더 자연스러운 서비스들을 제공하는 곳들이 있는 듯. 피노키오에서 제공되는 것들 구글링해보다가 발견. 영어로 뭔가를 만들어주는 건 되게 자연스럽더라. 다만 한국어나 영어는 조금 아쉬운 편. 역시 본좌 타입캐스트...다만 텍스트로 효과(파도 소리, 사자 소리 같은거)를 만들 수 있.....(동물 울음소리는 좀 어색하더라)고, 목소리 변환 같은 것도 가능해서 이것저것 찍먹해보기 괜찮아서 포스팅. 특히 프롬프트로 효과음 만들 수 있다는 게 좋은 점이라고 생각함.
GPT-SoVITS, 목소리 훈련 가능한 TTS 툴
GPT-SoVITS, 목소리 훈련 가능한 TTS 툴
2025.02.16비교적 낮은 사양과 CPU에서도 구동 가능한 TTS툴. 깃헙은 여기. 자신의 목소리를 트레이닝시킬 수 있습니다. 윈도에서도 잘 돌아가고요. 하나의 언어에서 한국어, 영어, 일본어, 중국어, 광동어 등의 음성을 생성할 수 있다고 하네요. 억양이나 감정을 좀 더 조절할 수 있는 음성 합성이라고 하면 Style-Bert-VIST2도 괜찮은 선택이라고 하니(단, 일본어만 가능) 참조하세요. .....해보니까 윈도에서의 완성이 올바르지 않은 것 같습니다. 우분투에서 하는게 맞지 않나...싶네요. 일본어 목소리 샘플은 여러곳이 있는데 무료로 사용할 수 있는게 꽤 되는 것 같습니다. 우분투를 사용한다면 도커로도 사용할 수 있다고 합니다. PC.WATCH에 사용법이 상세하게 나와 있네요. 목소리 데이터 세트는 여러가지..
AI 보이스(국내) 업체 이용하기
AI 보이스(국내) 업체 이용하기
2023.09.14생각보다 가격이 되게 비싸거나 하진 않는데, 이걸 전문적으로 사용한다면 미묘하지 않나 싶음. 마이크로소프트 애저, 네이버 클로바 더빙, KT AI 보이스 등이 있는 듯하다. 각종 클라우드 기반 서비스를 제공하는 업체나 전문 업체들도 관련 서비스를 제공하고 있다. 예를 들면 프로소디, 타입캐스트, 구글, 아마존, 카카오, IBM 등에서도 TTS 서비스는 제공하는데 무료 제공하는 업체는 차이는 좀 있는 편. 개인적으론 MS 애져가 되게 만족도가 높았음. 반응 속도도 빠른 편이고. 약관 잘 읽어보고, 필요에 따라 이리저리 사용하면 되지 않나 싶다. 개인적으로 기본 발음에서 가장 어색함이 적었던 건 클로바고, 설정을 해도 비교적 위화감이 적게 우리말로 만들어지는 건 MS 애져였다. 앞으로도 국내 AI 보이스 업..
마이크로소프트 애저 음성 서비스 사용하기
마이크로소프트 애저 음성 서비스 사용하기
2023.06.13MS 애저 계정으로 무료 요금제를 사용하면 제한적이지만 음성 파일 합성이나 음성 > 텍스트 변환 등을 해볼 수 있다. 텍스트로의 변환은 Whisper쓰는게 더 편하긴 하지만. TTS의 경우 국내라면 KT나 클로바의 음성 합성 서비스가 굉장히 만족도가 높다. MS의 TTS서비스 역시 좋지만, 개인적으론 클로바가 좀 더 매력적이지 않나 싶음. 가격도 크게 부담되는 수준은 아니고. 다만 이정도 퀄리티의 서비스를 무료로 사용할 수 있는 건 MS 애저가 유일하지않나 싶다. 어느 정도의 작업을 어떻게 하느냐....에 따라 달린 거겠지만 생각보다 저렴한 가격에 이런 저런 서비스들 사용할 수 있는 건 좋지 않나 싶다. 사용법은 간단하다. 애저 계정 만들고 > 지역은 Korea Central, 이름은 적당히 긴 이름으로..