WaaS - Whisper as a Service

xguru · 2023-02-15T10:47:02+09:00

OpenAI Whisper(음성인식모델)를 위한 로컬에서 쉽게 활용하기 위한 GUI 및 API 오픈소스 transcribe/detect/download 등의 기능을 REST API로 제공 웹페이지에서 오디오/비디오 파일을 업로드 해서 작업 시작 가능 docker-compose로 실행해서 이용(redis/api/worker 등 3개의 도커 컨테이너 실행) 최소모델인 tiny 가 약 1GB의 VRAM을 필요로 함(최대인 large는 10GB)

(github.com/schibsted)

11P by xguru 2023-02-15 | ★ favorite | 댓글 1개

OpenAI Whisper(음성인식모델)를 위한 로컬에서 쉽게 활용하기 위한 GUI 및 API 오픈소스
transcribe/detect/download 등의 기능을 REST API로 제공
웹페이지에서 오디오/비디오 파일을 업로드 해서 작업 시작 가능
docker-compose로 실행해서 이용(redis/api/worker 등 3개의 도커 컨테이너 실행)
최소모델인 tiny 가 약 1GB의 VRAM을 필요로 함(최대인 large는 10GB)

xguru 2023-02-15 [-]

Whisper - OpenAI가 오픈소스로 공개한 다국어 음성 인식 시스템(ASR)
OpenAI, Whisper v2 모델 공개

답변달기

WaaS - Whisper as a Service

함께 보면 좋은 글 β

댓글과 토론