Show GN: AI 한영/영한 번역기 도다리

더 이상의 설명이 必要韓紙?

tominam2 2024-04-15 [-]

NHNDQ의 부모 모델이 facebook-nllb라는 200개 국어 다번역 모델이에요.
그러다보니 그런 외계어를 가끔합니다.

아직 한국어 번역 품질이 조금 떨어지는 부분을 가지고 프리게이트 사건의 주인공 도더리의 닉네임을 따서 제품 이름을 지은 것 같았으므로, 그 사건에서 나온 희대의 번역기 사용 실수 “必要韓紙”를 언급하지 않을 수 없었습니다.

tominam2 2024-04-15 [-]

뭔가 복잡한 사건이 있었나보네요. 읽어도 잘 이해를 못하겠습니다ㅠ

도다리라는 이름은 mixtral-7bx8 모델과의 대화로 만들었습니다.
처음에 ai는 '언어다리'라는 이름을 추천해줬는데 저는 뭔가 그리기 쉬운 확실한 이미지가 필요해서 '도다리'는 어떠냐고 재미삼아 물었습니다. 스스로도 뚱딴지 같다고 생각했으니까요.

근데 ai는 도다리가 '도움을 주는 다리'라는 뜻으로 아주 좋다는 답변을 주었습니다. 생각지도 못했던 해석이라 참신하다고 생각했습니다. 그렇게 나온 이름이 도다리입니다

꽤나 오래된 사건인데, 당시 한국 인터넷 커뮤니티에서는 나름 유명한 사건이었습니다.
대충 정리하면 다음과 같습니다.

어떤 네이버 카페의 운영자 도더리가 한정판 일본 음악 CD를 7만원에 공동구매한다는 공지를 올림
이후 1차 공동구매 참여자 명단이 올라왔는데, 이름이나 주소가 뭔가 이상하여 사람들이 의심하게 됨
어느 카페 가입자가 해당 CD는 한정판도 아니고 가격도 3만원대에 불과하다는 걸 밝혀내어 따지자 도더리가 그를 카페에서 추방하면서 일이 커짐
도더리가 일본 회사와 주고받은 메일이라며 공개한 메일 내용에서 “必要韓紙”와 같은 어이없는 번역기 사용 오류가 드러나면서 외부인에게도 유명세를 타게 됨
이후 드러난 바에 따르면 도더리는 소위 허언증이 심한 사람으로, 그가 인터넷에 올린 대다수의 자기 행적은 말도 안 되는 허세와 거짓말로 점철되어 있었음

그나저나 거대언어모델이 가끔 생각지도 못한 해석을 내놓는데 그게 그럴싸한 경우는 저도 가끔 겪어봤습니다.
사람들과의 대화 속에서 자기 혼자서는 미처 생각하지 못한 부분을 짚게 되는 현상을 이제는 기계와의 대화에서도 경험하는 것 같습니다.

tominam2 2024-04-15 [-]

세상에나. 근데 잡혀가진 않았나보네요.
개인적으로 chatGPT는 샌님같아서 재미가 없는데 Mixtral은 검열이 없어서 그런지 대화가 아주 흥미롭습니다

위키 내용에 따르면 고소까지 당했다가 싹싹 빌었는지 선처받아 그냥 넘어갔다네요. 고소당할 당시 그의 신분은 공익근무요원이었다고.

저는 개인 PC 성능상 아직 로컬 LLM을 직접 써본 적은 없네요. GPT-4 정도만 사용하고 있는데, Claude-3는 추가 구독해볼까 싶습니다.