# Show GN: Nemotron-Personas-Korea 기반 한국인 페르소나 탐색기

> Clean Markdown view of GeekNews topic #28976. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=28976](https://news.hada.io/topic?id=28976)
- GeekNews Markdown: [https://news.hada.io/topic/28976.md](https://news.hada.io/topic/28976.md)
- Type: show
- Author: [tantara](https://news.hada.io/@tantara)
- Published: 2026-04-28T18:03:52+09:00
- Updated: 2026-04-28T18:03:52+09:00
- Original source: [microworld.dev](https://www.microworld.dev/)
- Points: 1
- Comments: 0

## Topic Body

엔비디아에서 공개한 [Nemotron-Personas-Korea 데이터셋](https://huggingface.co/datasets/nvidia/Nemotron-Personas-Korea)을 활용한 한국인 페르소나 탐색기입니다.  
  
이 데이터셋은 한국인 100만 명 규모의 합성 데이터셋으로, 나이, 직업, 지역, 가족 관계 등이 포함되어 있습니다. 데이터셋 제작 방식이나 통계 정보는 https://news.hada.io/topic?id=28919에 자세히 설명되어 있습니다.  
  
페르소나 탐색기의 주요 기능은 다음과 같습니다.  
  
1. 페르소나를 검색하거나 비슷한 페르소나를 찾을 수 있습니다. Qwen s임베딩 모델을 사용하여 유사도를 비교합니다.  
  
2. 지도에서 페르소나의 인구 분포를 확인할 수 있습니다. 데이터셋에 있는 위치 정보를 사용합니다.  
  
3. 페르소나와 대화할 수 있습니다. 아주 간단한 질문 정도에 답할 수 있습니다.  
  
Qwen 0.6 임베딩 모델로 데이터셋 전체에 대해 1024차원의 임베딩을 추출하여 허깅페이스 데이터셋으로 만들었습니다. *_persona 칼럼에 이름이 반복적으로 들어가는 특징이 있어, 이름에 편향된 임베딩 값을 가질 수 있습니다.  
  
* 허깅페이스 [Nemotron-Personas-Korea-Qwen3-0.6B-embeddings](https://huggingface.co/datasets/tantara/Nemotron-Personas-Korea-Qwen3-0.6B-embeddings)

## Comments



_No public comments on this page._
