# Show GN: 미연시하려고 만든 화면/음성 번역 앱

> Clean Markdown view of GeekNews topic #30684. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=30684](https://news.hada.io/topic?id=30684)
- GeekNews Markdown: [https://news.hada.io/topic/30684.md](https://news.hada.io/topic/30684.md)
- Type: show
- Author: [jufufu](https://news.hada.io/@jufufu)
- Published: 2026-06-21T15:43:12+09:00
- Updated: 2026-06-21T15:43:12+09:00
- Original source: [github.com/tchinso](https://github.com/tchinso/MekiCopy/)
- Points: 5
- Comments: 0

## Topic Body

미연시를 좋아하는 평범한 오타쿠에요.  
예전에는 이지트랜스나 아랄트랜스를 사용해서 번역하던 시절이 있었다고 들었어요.  
요즘은 MORT를 이용해서 OCR번역기를 돌릴 수 있다는데  
직접 써보니 설정도 기능도 너무 많고 복잡하고,   
무엇보다 화면인식률이 너무 나쁘더라구요.  
번역도 DeepL 번역은 API키 안 넣으면 자꾸 에러뜨고  
요즘은 로컬 AI도 좋아졌는데 로컬 OCR AI모델이랑   
로컬 AI 번역 모델 넣으면 좋지 않을까? 해서  
만들었어요.  
만들다보니 음성 인식해서 번역하는 기능도 넣으면 좋지 않을까?   
해서 점점 스케일이 커지다보니  
하나의 앱으로 화면/음성을 인식해서 번역하는 앱을 만들었어요.  
언어는 일본어만 돼요(원래 목적 자체가 미연시 목적이니...)  
화면 인식 번역은  
임시 영역을 확정 영역으로 등록 한 후에, 번역 버튼만 딸깍 딸깍 누르면 번역되어서 오버레이로 표시되는 형식이고  
음성 인식은 음성파일을 통째로 받아오면 대본을 작성해서 오버레이에 띄우는 형식이에요.  
  
만드는 과정이 쉽진 않았어요.  
원래 프로그래밍과 전혀 상관없는 학과에 전혀 상관없는 직장을 다니고 있고,  
프로그램이라고는 고등학교 정보 시간 때 DevC++ 잠깐 만져서 if/while까지 진행해봤던 기억이 다에요.  
GPT-5.5 로 이 정도까지 만들 수 있다는 걸 여러분들에게 보여드리고 싶었어요.  
사용한 토큰 수는 7.2억 토큰 정도 되어요.  
부디 GN 분들의 많은 피드백 부탁드려요!

## Comments


_No public comments on this page._