# Omni SenseVoice - 단어별 타임스탬프 가능한 고속 음성 인식

> Clean Markdown view of GeekNews topic #17671. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=17671](https://news.hada.io/topic?id=17671)
- GeekNews Markdown: [https://news.hada.io/topic/17671.md](https://news.hada.io/topic/17671.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2024-11-10T09:31:01+09:00
- Updated: 2024-11-10T09:31:01+09:00
- Original source: [github.com/lifeiteng](https://github.com/lifeiteng/OmniSenseVoice)
- Points: 13
- Comments: 1

## Summary

Omni SenseVoice는 다국어 음성 이해 모델로, 자동 음성 인식, 음성 언어 식별, 음성 감정 인식, 오디오 이벤트 감지 등의 기능을 제공합니다. 이 모델은 초고속 추론과 정확한 타임스탬프에 최적화되어 있어 오디오 트랜스크립션을 더 스마트하고 빠르게 처리할 수 있습니다. 주요 옵션으로는 언어 자동 감지 및 지정, 역 텍스트 정규화 적용 여부 선택, 특정 GPU에서 실행, 양자화된 모델 사용 등이 있습니다.

## Topic Body

- 자동 음성 인식(ASR), 음성 언어 식별(LID), 음성 감정 인식(SER), 오디오 이벤트 감지(AED) 등의 기능을 갖춘 다국어 음성 이해 모델 SenseVoice 기반  
- 초고속 추론과 정확한 타임스탬프에 최적화되어 있어 더 스마트하고 빠르게 오디오 트랜스크립션을 처리할 수 있음   
- 주요 옵션   
  - `--language`: 언어를 자동으로 감지/지정(auto, zh, en, yue, ja, ko)  
  - `--textnorm`: 역 텍스트 정규화 적용 여부 선택(역 정규화된 경우 withitn, 원시 텍스트의 경우 woitn)   
  - `--device-id`: 특정 GPU에서 실행(기본값: CPU의 경우 -1)  
  - `--quantize`: 빠른 처리를 위해 양자화된 모델을 사용

## Comments


### Comment 31186

- Author: yangeok
- Created: 2024-11-12T18:43:14+09:00
- Points: 1

한국어가 옵션에 있으니 테스트 해보고싶네요 ㅎ