Hume에서 TTS용 2세대 음성 AI 모델 Octave 2를 출시한다고 합니다. 플랫폼, API를 통해 사용해볼 수 있다고 하네요. 말의 감정적 어조를 좀 더 깊게 이해하고, 숫자, 반복 단어 등의 발음이 좋아졌다고 합니다. 15초 분량의 오디오로 목소리를 복제하여 음성을 다른 언어로 생성할 수 있다고 하네요.
확실히 제공되는 예제에서는 조금 어색하긴 해도 감정이 담겨서 무뚝뚝하게 들리지는 않네요. 가격도 저렴한 편이구요. MS 애저보다도 괜찮은 것 같습니다. 무료로 이것저것 사용하면 좋겠네요.