1P by spilist2 3달전 | favorite | 댓글 1개

저는 미디어 번역 회사에 재직중이고, 자막 편집기를 제공합니다.

편집기에서 스펠체크 기능이 있고, 전체 자막을 텍스트로 변환하여 (잘라서) API를 호출합니다.

지금은 bing API를 쓰고 있는데 무척 성능이 안 좋습니다. 잡아야 할 걸 못 잡고, 안 잡아야 할 걸 잡네요.

시도해본 대안들은 다음과 같습니다.

  • AWS 스펠체크는 한 번 호출에 20글자 제한이 있어서 쓰기가 너무 어렵고
  • 그래머리는 작년에 API 지원이 종료됐고
  • https://sapling.ai/ 를 테스트해봤는데 오히려 bing의 품질이 더 낫고
  • https://rapidapi.com/collection/grammar-spellcheck-api 여기에 있는 것들도 다 테스트해봤는데 bing보다 딱히 낫다고 하기 어려웠습니다.

꼭 '다국어'가 아니더라도 영어만이라도 잘 잡히면 좋겠는데 좋은 대안책이 별로 없네요. 꼭 제품 추천이 아니더라도, 스펠체크를 해보신 경험을 나눠주시면 감사하겠습니다.

https://huggingface.co/mzbac/mistral-grammar/tree/main
다국어라는 말에 꽂혀서 Mistral 계열을 찾다보니 이런 게 있었는데, 제품 레벨까지 충족시키는 정도인지는 잘 모르겠습니다...
영어에 맞추어 파인튜닝된 모양인데, 이 모델 한번 시도해보시는 건 어떨지요