Show GN: AI한테 메일 맡기지 마라 — 인박스엔 비서가 아니라 '방화벽'이 필요하다 (오픈소스)

(github.com/k08200)

요즘 "AI 이메일" 도구는 전부 같은 방향입니다. 메일마다 초안 깔고, "AI가 답장하래요" 배지 붙이고, 자동 전송 버튼 답니다. 결과는? 인박스가 조용해지는 게 아니라 더 시끄러워집니다. 화면 위에 화면을 또 얹는 거예요.

저는 정반대로 만들었습니다. AI한테 인박스를 맡기는 게 아니라, AI를 막는 방화벽. Klorn은 들어오는 메일마다 분류 딱 하나만 내보내고 나머지는 안 보여줍니다.

4단계 — SILENT(기록만, 안 보임) / QUEUE(큐에 보임, 알림 없음) / PUSH(진짜 깨움) / AUTO(지금은 분류만, 실행은 의도적으로 미연결).

핵심 — LLM은 결정을 안 합니다. 메일마다 4개 숫자(확신도·발신자 신뢰·되돌릴 수 있음·긴급도)만 점수 매기고, 사람이 읽을 수 있는 결정론적 규칙이 그걸 단계로 매핑합니다. 그래서 모델 없이도 정책을 감사·테스트할 수 있고, LLM이 죽어도 키워드 fallback이 같은 숫자를 만들어 긴급 메일은 통과시킵니다.

그리고 되돌릴 수 없는 건 AI한테 절대 안 맡깁니다. 전송·영구삭제·외부전달 3개는 deterministic floor 뒤에 — 승인 시점에 보낼 바이트를 receipt로 고정하고, 실행 때 한 바이트라도 다르면 throw. 자율 경로는 fail-closed. AI가 "보냈어요"라고 우겨도 바이트가 안 맞으면 안 나갑니다.

"AI는 마법" 부분도 직접 측정했습니다. 분류 작업에선 GPT-4o보다 훨씬 싼 모델이 더 정확했어요. 이런 일엔 천재 모델이 아니라 4개 신호를 매번 똑같이 읽는 일관성이 필요합니다 (수치·근거는 아래 글).

AGPLv3 오픈소스, OpenAI 호환 엔드포인트면 다 붙습니다(Ollama로 메일이 내 머신 밖으로 안 나감). 솔직히 초기 PoC — 제 실제 메일 50개에 약 80% 일치(1회, 제가 건 기준선), 실유저는 아직 저 하나, AUTO 실행은 일부러 꺼둠. 과장하면 첫 댓글이 물어뜯으니까요.

설계 글 (엔지니어들 아키텍처 토론 붙은 시리즈):

싼 모델이 GPT-4o 이긴 이유: https://dev.to/k08200/…
LLM이 점수만 매기고 결정은 안 하는 이유: https://dev.to/k08200/…
되돌릴 수 없는 액션의 deterministic floor: https://dev.to/k08200/…
레포: https://github.com/k08200/klorn (docker-compose + 로컬 LLM 셋업). 데모는 OAuth 테스팅 모드(100명)라 self-host가 가장 빠름.

Show GN: AI한테 메일 맡기지 마라 — 인박스엔 비서가 아니라 '방화벽'이 필요하다 (오픈소스)

함께 보면 좋은 글 β

댓글과 토론