5P by wellsa | ★ favorite | 댓글과 토론

법령 검색하다 보면 "성폭력처벌법 제14조"를 알아야 찾아지는 게 답답해서, 시민이 일상어 그대로 물어보면 관련 조문을 돌려주는 RAG 데모를 만들어봤어요.

데이터는 법제처 공공 OpenAPI 에서 받아 Markdown 으로 정렬, 매일 cron 으로 갱신하고 있습니다.

• 법령 (law-kr): 5,589
• 행정규칙 (regulate-kr): 10,765
• 판례 (precedent-kr): 171,014
• 법령해석례 (interpretation-kr): 8,728
• 헌재결정례 (constitution-kr): 38,092
• 자치법규 (localrule-kr): 159,910
• 조약 (treaty-kr): 6,907

총 397K+ Markdown 문서.
운영 DB 에 1.36M+ 조문 인덱싱.

• 데모: https://minilex.wellsa.ai
• 데이터/코드 (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai

시민 시나리오 5건(딥페이크 / 임금체불 / 부당해고 / 개인정보 유출 / 스토킹) 정도는 출처 조문 같이 돌려주는 거 확인했고, 일반화는 아직 멀었습니다.
키워드 + 동의어 확장에 의존도가 높아서 랭킹 일반화가 다음 숙제예요.

스택은 평범하게 Next.js + FastAPI + Celery + PostgreSQL + pgvector, 임베딩은 nomic-embed-text-v2-moe(768d) 쓰고 있습니다.
자체 안전샘플 벤치는 R@5 0.86 / MRR 0.753 정도 나왔어요.

법률상담 대체 도구는 아니고 출처 조문 탐색 보조용입니다.
실제 결정은 자격있는 전문가와 상의해주세요.

피드백 / PR 환영합니다.

댓글과 토론