https://github.com/Const-me/Whisper/releases
위 링크에서 whisperdesktop.zip 다운받고
https://huggingface.co/ggerganov/whisper.cpp/tree/main
여기서 모델 받으면 되는데 ggml-large.bin를 받는 게 좋아요 (언어 모델이 커야 인식률이 괜찮음)
암튼 whisperdesktop.zip, ggml-large.bin (알고리즘 모델) 받았으면
압축풀고 대충 한 폴더에 때려박고
아래 스샷처럼 whisperdesktop.exe 실행 후 ... 눌러서 다운받은 모델 경로 지정해주고 OK
다음 화면으로 넘어가서
language : korean으로 설정 후 대상 파일, output format, 저장할 경로 지정해주고 Transcribe 누르면 됨
Output format은 srt, txt 등으로 지정할 수 있는데
어도비 프리미어 프로에서 srt파일을 불러온 후
아래 영상처럼 캡션을 그래픽으로 업그레이드 기능으로 일반 자막으로 바꾼 후 효과를 넣을 수 있음.
stable-ts라고 좀 더 영상자막 생성에 특화된 whisperAI 프로젝트?가 있는데
이건 파이썬 깔고 뭐하고 해야되서 좀 더 복잡하지만 아래 링크로 남겨봅니다.