# 자연어 인공지능 모델 해킹하기

> Clean Markdown view of GeekNews topic #3886. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=3886](https://news.hada.io/topic?id=3886)
- GeekNews Markdown: [https://news.hada.io/topic/3886.md](https://news.hada.io/topic/3886.md)
- Type: news
- Author: [budlebee](https://news.hada.io/@budlebee)
- Published: 2021-03-14T11:00:03+09:00
- Updated: 2021-03-14T11:00:03+09:00
- Original source: [arxiv.org](https://arxiv.org/abs/2012.07805)
- Points: 12
- Comments: 0

## Topic Body

- 구글, 하버드, 스탠포드, OpenAI, 애플이 공동 발표한 논문에 따르면, 큰 언어 모델에 질문하는 것만으로 학습에 사용되었던 구체적인 데이터를 추출해 낼 수 있었다.

- GPT-2를 대상으로 한 공격은 뉴스 헤드라인, 집주소와 같은 개인정보를 아주 높은 정확도로 추출해 냈다.

- 비단 GPT-2 뿐만 아니라 다른 언어 모델도 이런 공격에 취약할 수 있으니 학습 데이터를 전처리하는데 더욱 신경써야 한다

## Comments


_No public comments on this page._