19P by xguru 2023-02-26 | favorite | 댓글과 토론
  • 음성인식 모델인 Whisper를 이용해서 로컬에 있는 다양한 파일의 음성을 인식해 자막(srt,vtt,txt) 파일로 만들어주는 오픈소스
  • GPU/CUDA 가속 버전 지원
  • Ubuntu/MacOS/Win32(in git-bash)
  • yt-dlp + static-ffmpeg 이용