Zonos - 고품질 음성 합성 모델
·
Web.World/Ai.ML.SD
오픈웨이 텍스트 음성 변환 모델이라고 합니다. 음정 변화와 말하기 속도, 기분 등의 반영을 쉽게 할 수 있고 44kHz를 지원한다고 합니다. 3000시리즈 이상의 NVIDIA GPU가 탑재된 우분투 시스템에서 사용할 수 있다고 하니 참조하세요.
일본어 무료 AI 음성 합성 소프트웨어(TTS) - VOICEVOX
·
PC.Div.Soft/Free Software
미세 설정(말하기 속도, 피치, 억양, 단어 분리 등)을 가능하게 한다고. 음성 합성 소프트웨어 엔진은 CPU/GPU 모두 동작하는데 GPU의 경우 3GB정도의 VRAM이 있는 NVIDIA GPU만 지원함. 합성된 언어는 WAV형식으로 저장할 수 있고, 사용된 라이브러리와 VOICEVOX를 사용했다는 문구 넣어서 사용 가능하다고. 간단한 설명은 유튭에 영상으로 등록되어 있음. 무엇보다 무료라는 게 크다. 프리셋이라고 해야 하나, 목소리를 가진 캐릭터를 미리 선택해서 고르는 방법인데 캐릭터에 따라 사용 가능한 범위가 다르니(어떤 건 크레딧 표시만 하면 되지만 어떤 건 일부 오디오 작품(오디오 북?) 같은 거는 사용할 수 없다고 되어 있음. 앱 자체가 일본어라 일본어 모르면 좀 사용하기 힘들지 않나 싶다. ..