11P by xguru 2023-02-15 | favorite | 댓글 1개
  • OpenAI Whisper(음성인식모델)를 위한 로컬에서 쉽게 활용하기 위한 GUI 및 API 오픈소스
  • transcribe/detect/download 등의 기능을 REST API로 제공
  • 웹페이지에서 오디오/비디오 파일을 업로드 해서 작업 시작 가능
  • docker-compose로 실행해서 이용(redis/api/worker 등 3개의 도커 컨테이너 실행)
  • 최소모델인 tiny 가 약 1GB의 VRAM을 필요로 함(최대인 large는 10GB)