반응형
OpenAI의 TTS 모델의 데모를 들어볼 수 있는 웹페이지입니다. 현재 영어에 최적화되어 있다고 하네요. 여럿 써봤지만 국내 제공 업체의 모델이 가장 무난하고 쇼츠 등에서 자주 들을 수 있는 목소리고. MS의 TTS도 훌륭하다 생각함.
아무튼, OpenAI API의 신규 TTS 모델을 조정할 수 있는데, 음성 효과, 톤, 속도, 감정 등을 조절해 볼 수 있고, 목소리 종류도 다양한 편이라 영어 듣기로도 훌륭하게 사용할 수 있지 않나 싶고, 한국어, 일본어, 중국어도 잘 읽어주더라.
반응형
'Web.World > Ai.ML.SD' 카테고리의 다른 글
Memo AI - 로컬 Whisper 모델 사용해 전사/번역 가능한 툴 (0) | 2025.03.22 |
---|---|
구글 AI 스튜디오, Imagen 기반의 이미지 생성 기능 (0) | 2025.03.21 |
Metademolab - meta의 움직이는 캐릭터 생성 (0) | 2025.03.20 |