# Show GN: KoDarkBench : 어떤 K-LLM이 가장 음침할까?

> Clean Markdown view of GeekNews topic #22130. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=22130](https://news.hada.io/topic?id=22130)
- GeekNews Markdown: [https://news.hada.io/topic/22130.md](https://news.hada.io/topic/22130.md)
- Type: show
- Author: [vkehfdl1](https://news.hada.io/@vkehfdl1)
- Published: 2025-07-23T16:24:59+09:00
- Updated: 2025-07-23T16:24:59+09:00
- Original source: [github.com/RiceBobb](https://github.com/RiceBobb/KoDarkBench)
- Points: 16
- Comments: 3

## Summary

**KoDarkBench**는 한국어 환경에 맞춘 **LLM 다크 패턴 평가** 벤치마크로, 단순한 해로운 응답을 넘어 **의인화, 아부, 브랜드 편향** 등 6가지 **다크 패턴**을 포괄적으로 진단합니다. 국내 주요 기업의 **오픈소스 LLM 9종**을 테스트한 결과, **업스테이지 Solar Pro 2**와 **KT 믿음 2.0**이 가장 안전한 것으로 나타났으며, **LG 엑사원**과 **SKT A.X**는 해로운 응답 생성에 취약함이 확인되었습니다. 한국 시장 맞춤형 벤치마크로, LLM **윤리적 안전성** 확보에 중요한 시사점을 제공합니다.

## Topic Body

- KoDarkBench는 LLM의 다크 패턴 6가지를 평가하는 DarkBench의 한국 버전  
- 영문 DarkBench를 한국어로 번역 및 검수하였으며, 한국의 상황에 알맞게 질문들을 변경함 (트럼프 국회의사당 습격 사건 => 서부 지법 폭동 등)  
- 다크 패턴에는 '해로운 응답 생성' 뿐 아니라, 의인화, 몰래 하기 (Sneaking), 아부, 브랜드 편향 등이 있음  
- LG 엑사원, SKT A.X, Upstage Solar, KT 믿음 등 한국의 기업에서 제작한 오픈소스 LLM 9종을 평가함  
- 벤치마크 결과 업스테이지의 Solar Pro 2 모델과 KT 믿음 2.0 모델이 '해로운 응답 생성'을 거의 하지 않는 모습을 보여줌  
- 반대로 LG 엑사원 및 SKT A.X 모델은 '해로운 응답 생성'에서 취약함이 두드러지게 나타남  
- 더 자세한 결과 및 데이터셋은 깃허브 레포를 확인해주세요!

## Comments



### Comment 41790

- Author: jcwleo
- Created: 2025-07-25T10:50:08+09:00
- Points: 1

엑사원과 a.x는 결국 qwen 패밀리라...

### Comment 41733

- Author: grenade
- Created: 2025-07-23T20:18:26+09:00
- Points: 1

흥미롭네요

### Comment 41729

- Author: ashbrother
- Created: 2025-07-23T17:08:53+09:00
- Points: 2

ㅋㅋㅋ 접근이 너무 참신하고 재밌어요,  
HyperCLOVA는 어떨까 궁금합니다. 어제인가 링크드인에서 모델 공개한 것 같은데 ...
