반응형
Whisper UI를 사용하기에 어려운 환경(AMD 글카라던가 AMD 글카라던가...)이지만 텍스트 인식은 충분히 써먹을 수 있다. 메모리도 적게 먹음.
여기서 최신 버전 받고, 여기서 언어 학습파일(cpp-안보이면 검색에서 whisper cpp라고 검색해봅시다)받아주자. 어지간히 사양 낮은 글카가 아니라면 ggml-large.bin 받으면 됨. 그리고 받은 파일은 대충 프로그램 폴더 내에 같이 넣어두도록 하자. 이후 프로그램 실행하고, Model Path에 더보기(...)버튼 눌러서 아까 받은 bbml-large.bin파일 선택한 뒤, OK 눌러서 다음으로 넘어갑시다.
그럼 잠깐 파일 읽는 진행바 올라가고, VRAM 점유율이 늘어난다.
이후 Transcrive File 부분에서, 위에는 글자 캡쳐를 할 파일, 아래 Output File에는 저장할 파일 종류와 위치를 선택해두고 Transcribe 버튼을 누르면 진행바 올라가면서 작업이 완료된다. 오디오 캡쳐는 마이크 등으로 녹음한 거 옮겨주는 기능인데 그냥 녹음 한 뒤 파일만들어서 바꾸는 게 좀 더 좋지 않나 싶다.
회의한거 옮기느라 사무실에서 사용할 방법알려주면서 포스팅. 개발자님들 고마워요!
반응형
'PC.Div.Soft > Free Software' 카테고리의 다른 글
대화상자 등에서 텍스트 복사 - Textify (0) | 2023.06.25 |
---|---|
숏컷(Shortcut) 23.05.14 업데이트 (0) | 2023.05.21 |
Kdenlive 23.04.1 출시 (0) | 2023.05.21 |