22P by xguru 20일전 | favorite | 댓글 6개
  • 영화, 팟캐스트, 인터뷰 등에서 배경 소음을 제거하고 음성만 깨끗하게 추출해줌
  • 최대 크기는 500MB & 1시간 분량의 오디오 까지 지원
  • 음악 보컬용으로 설계되거나 최적화되지는 않음(콘텐츠에 따라 성공은 가능)
  • 아직 실시간 스트리밍용 API는 공개하지 않았지만, 곧 공개할 예정
  • 이용 요금은 오디오 1분당 1000자

How much does Voice Isolator cost?
Voice Isolator costs 1000 characters for every minute of audio.

이게 무슨 뜻일까요? 왜 글자수가 나오는지 모르겠네요

token 같은 개념아닌가요?

GPT에서 이미지도 text token 처럼 계산 되듯이요

회사가 제공하는 다른 서비스를 보니 이해가 됩니다. Speech to text to Speech 방식인 것 같네요 그래서 중간 텍스트에 대한 과금을 하는거구요

한편 여러가지 오픈 모델을 통한 보컬 분리를 유무료로 제공하는 MVSep에서도 수 종류의 음성/소음 분리 모델을 제공하고 있습니다.
https://mvsep.com

Adobe Podcast AI 도 비슷한 기능을 제공합니다. 무료 버전도 있긴 하네요 https://podcast.adobe.com/enhance

무료버전 기준 한국어는 최적화되지 않은 느낌이더군요..