16P by xguru 1달전 | favorite | 댓글과 토론
  • 리눅스, 윈도우, 안드로이드 및 기타 OS
  • "Formant Synthesis(포먼트 합성)" 방식을 사용하는 eSpeak 엔진 기반
    • 작은 크기로 많은 언어를 지원해서 윈도우 및 구글 번역 엔진 등에서 사용했었음(지금은 많이 자체엔진으로 대체됨)
    • 음성은 선명하고 빠른 속도로 사용할 수 있지만 사람의 음성 녹음을 기반으로 하는 대형 합성기만큼 자연스럽거나 부드럽지는 않음
    • 또한 Klatt 포먼트 합성을 지원하며, 백엔드 음성 합성기로 MBROLA를 사용가능
  • 지원 형태
    • 커맨드 라인 프로그램 : 리눅스 & 윈도우. 파일 및 Stdin 으로 받은 문자열 읽기
    • Shared 라이브러리(윈도우에서는 DLL)
    • 윈도우용 SAPI5 버전. 스크린 리더 및 다른 프로그램에서 SAPI5 인터페이스로 이용 가능
    • Solaris, MacOS 를 포함한 다양한 플랫폼으로 이식
  • 기능
    • 특성을 변경할 수 있는 다양한 음성을 포함
    • 음성 출력을 WAV 파일로 생성할 수 있음
    • SSML(음성 합성 마크업 언어)이 지원되며(완전하지 않음) HTML도 지원
    • 컴팩트한 크기. 여러 언어를 포함한 프로그램과 데이터의 총 용량은 몇 MB 정도
    • MBROLA diphone Voices의 프런트엔드로 사용할 수 있음. eSpeak NG는 텍스트를 음높이와 길이 정보가 있는 음소로 변환
      • MBROLA는 음성 합성을 위한 음절 모음으로 구성된 오픈 소스 음성 엔진
      • 음성은 상업적 목적이 아닌 경우 무료로 제공되지만 오픈 소스는 아님
    • 텍스트를 음소 코드로 번역할 수 있으므로 다른 음성 합성 엔진의 프런트 엔드로 적용 가능
    • 다른 언어에 대한 지원 추가 가능. 여러 언어가 다양한 단계로 포함되어 있음
    • C로 작성됨