반응형
Audio to TXT 가능. Whisper CPP를 사용해 전사해준다. FFMPEG는 받아서 덮어씌워줍시다. CUDA 버전도 있던데 경로가 잘못되었는지 pepe 어쩌구 에러를 내뿜더라. CPU버전은 잘 됨. AVX2를 지원하는 CPU를 필요로 한다고 하니 참조합시다.
CPU 사용하는 만큼 GPU를 활용하는 것보다는 좀 오래 걸리지만 충분히 편하게 쓸 수 있다. 고마워요. 개발자님. CUDA 버전 버그도 잡아주세요....
반응형
'Web.World > Ai.ML.SD' 카테고리의 다른 글
무료 비디오 업스케일러 웹 (0) | 2025.03.23 |
---|---|
Memo AI - 로컬 Whisper 모델 사용해 전사/번역 가능한 툴 (0) | 2025.03.22 |
OpenAI.fm - OpenAI TTS 데모 사이트 (0) | 2025.03.21 |