Show GN: 클로바노트, daglo를 대체할 수 있는 ElevenLabs Realtime Speech to Text를 바로 사용해보기!

(url.lou2.kr)

7P by leelou2 8달전 | ★ favorite | 댓글과 토론

이번에 나온 ElevenLabs Realtime Speech to Text를 빠르게 사용하는 방법

최대한 간단하게 음성 전사 기능만 구현했습니다 🙏

git clone https://github.com/lee-lou2/ai-note.git
https://elevenlabs.io/app/developers/api-keys 에서 'Speech to Text'를 Access하여 api 키 발급
clone한 프로젝트 페이지에서 .env.sample 을 복제하여 .env 파일 생성
ELEVENLABS_API_KEY 에 생성한 ElevenLabs API Key 등록, BASIC_AUTH_USERNAME, BASIC_AUTH_PASSWORD 에는 페이지 접근 시 사용할 계정 정보 등록
패키지 설치: pip install -r requirements.txt
실행: uvicorn main:app --reload --port 8000

그리고 http://localhost:8000 접근 시 바로 사용 가능

확실히 ElevenLabs Realtime Speech to Text v2가 빠르고 정확함
현재 무료 사용자도 사용할 수 있습니다(추후 ElevenLabs의 가격 정책 변경이 발생될 수 있음)

해당 github 레포는 계속 업데이트할 예정입니다

(예정) 여러 사용자가 함께 접속해서 하나의 문서를 업데이트 하는 기능
(예정) 전사된 내용을 요약하는 기능
(예정) 타이핑한 문서와 함께 요약하는 기능