OpenAI, DeepSeek의 데이터 도용 의혹에 분노

(404media.co)

OpenAI와 DeepSeek의 논란
- OpenAI와 Microsoft는 DeepSeek이 OpenAI의 데이터를 부당하게 사용했는지 조사 중임.
- DeepSeek이 OpenAI의 모델을 기반으로 R1 모델을 개발했으며, 이는 AI 업계에서 큰 주목을 받고 있음.
- DeepSeek이 OpenAI의 데이터를 무단으로 사용했다는 의혹이 제기되고 있음.
DeepSeek의 모델 학습 방법
- DeepSeek은 OpenAI의 모델로부터 지식을 추출하는 '증류'라는 기술을 사용했음.
- 증류는 하나의 모델이 다른 모델로부터 학습하는 방식으로, 학생 모델이 부모 모델에게 많은 질문을 하여 지식을 습득하는 과정임.
- 이러한 방식으로 DeepSeek이 OpenAI의 모델로부터 지식을 얻었다는 증거가 있다고 주장됨.
OpenAI의 아이러니
- OpenAI는 대량의 데이터를 무단으로 수집하여 비즈니스를 구축해왔다는 비판을 받고 있음.
- OpenAI가 다른 회사의 데이터 수집 방식에 대해 불만을 제기하는 것은 아이러니하다는 의견이 있음.
회원 전용 콘텐츠
- 이 게시물은 유료 회원 전용이며, 무제한 광고 없는 기사와 추가 팟캐스트 콘텐츠를 제공함.
- 무료 회원은 주간 이야기 요약 이메일과 같은 게시물에 접근 가능함.

Hacker News에서는 원본 기사를 제출해야 한다고 강조함
- 다른 사이트에서 발견된 내용을 보고하는 게시물의 경우, 해당 사이트를 제출해야 함
- 링크베이트와 분노를 유발하는 기사를 제출하지 말 것을 권장함
Bloomberg와 Financial Times는 Microsoft와 OpenAI가 DeepSeek이 R1 모델을 부적절하게 훈련했는지 조사하고 있다고 보도함
- OpenAI는 화가 나거나 격분한 상태가 아님
- DeepSeek이 사용 계약을 위반했는지 확인하려고 할 뿐임
기사에는 OpenAI가 "격분"하거나 화가 났다는 증거가 전혀 없음
- 이는 완전한 클릭베이트임
많은 Hacker News 댓글 작성자들이 증거 부족에도 불구하고 이 이야기를 믿고 싶어하는 것은 부끄러운 일임