# WhisperX - 타임스탬프 정확도를 개선한 Whisper 기반의 ASR

> Clean Markdown view of GeekNews topic #8149. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=8149](https://news.hada.io/topic?id=8149)
- GeekNews Markdown: [https://news.hada.io/topic/8149.md](https://news.hada.io/topic/8149.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2022-12-31T10:49:01+09:00
- Updated: 2022-12-31T10:49:01+09:00
- Original source: [github.com/m-bain](https://github.com/m-bain/whisperX)
- Points: 5
- Comments: 0

## Topic Body

- OpenAI Whisper는 매우 정확한 트랜스크립션을 생성하지만, 타임스탬프가 단어 단위가 아닌 발화수준(Utterance) 단위여서 몇초 정도 부정확함   
- Wav2vec2.0 같은 음소기반 ASR(Phoneme-based)과 강제 정렬(Forced Alignment)을 이용하여 Whisper 모델의 타임스탬프를 개선   
- 기본 언어는 {en, fr, de, es, it, ja, zh, nl} 제공. 추가 언어는 Huggingface Model Hub에서 찾아서 테스트 필요

## Comments



_No public comments on this page._
