이번에 나온 ElevenLabs Realtime Speech to Text를 빠르게 사용하는 방법
최대한 간단하게 음성 전사 기능만 구현했습니다 🙏
- git clone https://github.com/lee-lou2/ai-note.git
- https://elevenlabs.io/app/developers/api-keys 에서 'Speech to Text'를 Access하여 api 키 발급
- clone한 프로젝트 페이지에서 .env.sample 을 복제하여 .env 파일 생성
- ELEVENLABS_API_KEY 에 생성한 ElevenLabs API Key 등록, BASIC_AUTH_USERNAME, BASIC_AUTH_PASSWORD 에는 페이지 접근 시 사용할 계정 정보 등록
- 패키지 설치: pip install -r requirements.txt
- 실행: uvicorn main:app --reload --port 8000
그리고 http://localhost:8000 접근 시 바로 사용 가능
확실히 ElevenLabs Realtime Speech to Text v2가 빠르고 정확함
현재 무료 사용자도 사용할 수 있습니다(추후 ElevenLabs의 가격 정책 변경이 발생될 수 있음)
해당 github 레포는 계속 업데이트할 예정입니다
- (예정) 여러 사용자가 함께 접속해서 하나의 문서를 업데이트 하는 기능
- (예정) 전사된 내용을 요약하는 기능
- (예정) 타이핑한 문서와 함께 요약하는 기능