8P by xguru 10일전 | ★ favorite | 댓글 2개

Audiblez란?

  • .epub 전자책을 .m4b 오디오북으로 변환하는 도구
  • Kokoro-82M 기반의 고품질 음성 합성 사용
  • Apache 라이선스로 제공되며, 100시간 이하의 오디오 데이터로 훈련됨
  • Google Colab의 T4 GPU에서 "초당 600자 변환 속도"로 "Animal Farm"을 약 5분 내 변환 가능
  • M2 MacBook Pro(CPU 모드)에서는 "초당 60자 속도로 약 1시간 소요"
    • Apple Silicon(M1, M2)에서는 현재 CUDA 지원 없음 (MLX 지원 대기 중)

Audiblez 4.2 주요 업데이트

  • wxWidgets 기반의 멀티 플랫폼 GUI 지원 (Mac, Windows, Linux)
  • 다양한 언어 지원 (영어, 스페인어, 프랑스어, 힌디어, 이탈리아어, 일본어, 포르투갈어, 중국어)
  • ONNX에서 kokoro 패키지를 사용한 Torch 기반으로 변경
  • CUDA 가속 지원 (단, Apple Silicon에서는 CPU 모드로 실행)
  • 오디오북에 표지 이미지 및 챕터 타임스탬프 포함
  • Windows 지원 향상

Kokoro-82M 모델로 전자책을 오디오북으로 변환하기
이거 기반인데 여기에 포함된 한국어가 Audiblez에는 없네요 ( 댓글에 Kokoro의 한국어 품질은 별로라는 얘기가 있긴 합니다)

kokoro 프로젝트 과거 기록을 보면 분명 한국어 보이스가 있었는데 discord 쪽 논의를 보면 한국 aihub 의 해외 데이터 반출금지 조항때문에 배포에는 어려움을 겪고 있는 상황인 것 같습니다…