WaaS - Whisper as a Service
(github.com/schibsted)- OpenAI Whisper(음성인식모델)를 위한 로컬에서 쉽게 활용하기 위한 GUI 및 API 오픈소스
- transcribe/detect/download 등의 기능을 REST API로 제공
- 웹페이지에서 오디오/비디오 파일을 업로드 해서 작업 시작 가능
- docker-compose로 실행해서 이용(redis/api/worker 등 3개의 도커 컨테이너 실행)
- 최소모델인 tiny 가 약 1GB의 VRAM을 필요로 함(최대인 large는 10GB)