▲GN⁺ 2024-05-10 | parent | ★ favorite | on: Stack Overflow 사용자들, OpenAI 제휴 후 답변 삭제 잇따라(build5nines.com)Hacker News 의견 StackOverflow의 사용자 컨텐츠 라이선스 변경 문제: 약 5년 전, StackOverflow는 사용자가 제출한 모든 컨텐츠를 CC-BY-SA 4.0으로 제공한다고 잘못 선언함. 원래 사용자 계약은 CC-BY-SA 3.0이었음. 2018년 중반부터 2019년 초까지 코드와 비코드에 적용되는 라이선스에 혼란이 있었음. 2019년 초에 사용자들에게 다시 로그인하고 새로운 라이선스 계약을 수락하도록 요청함. 현재는 2018년 5월 5일 이전 컨텐츠는 CC-BY-SA 3.0, 이후는 CC-BY-SA 4.0이 적용됨. StackOverflow의 AI 스크래퍼 및 OpenAI 제공 문제에 대한 사용자 의견: 자신의 답변이 AI 학습에 사용되는 것을 괜찮게 생각하는 사용자도 있음. ChatGPT 같은 도구에 큰 가치를 제공한다고 봄. OpenAI 제휴가 사용자의 컨텐츠 삭제 문제의 핵심은 아님. 라이선스상 컨텐츠 삭제는 환영받지 못했고 대개 번복됨. CC-BY-SA 라이선스로 인해 StackOverflow가 허용하지 않더라도 다른 사람이 복제할 수 있어 컨텐츠 삭제가 어려움. 사용자는 이름을 삭제하거나 개인정보를 편집할 순 있지만, 양질의 컨텐츠 자체를 나중에 제거할 순 없음. 영리 기업이 "무료" 제품을 관리하는 문제: 수익을 내야 하므로 오픈소스 윤리에 구애받지 않음. 사용자는 오픈소스에 기여한다고 생각하지만 실상은 아님. StackExchange의 행위는 아마 합법적이겠지만, 기여자는 이해관계자가 아니며 상업적으로 지속가능한 수준의 기여자만 유지하면 됨. 무료로 제공되는 제품의 경우 사용자가 곧 제품이 되며, 어떻게 수익화되는지 모른다면 언젠가 실망하게 될 것임. AI 학습에 특화된 새로운 컨텐츠 라이선스 필요성: 상용 AI 학습에 사용된 컨텐츠의 경우 AI 가중치를 공개하도록 하는 등 GPL 정신의 라이선스 등장 가능성. StackOverflow의 데이터셋 판매 모델: 애초에 StackOverflow는 사용자 중심이 아닌 SEO용 데이터셋 구축에 주력해 왔음. OpenAI 딜로 인해 크게 달라진 건 없음. LLM의 등장으로 StackOverflow의 위기는 불가피하므로, 붕괴 전에 OpenAI에 팔아 얻을 걸 얻는 게 나음. CC BY-SA 라이선스의 ShareAlike 조항의 중요성: 파생물을 만들 경우 동일한 라이선스로 배포해야 한다는 조항이 매우 광범위하고 모호함. "build upon"의 정의가 많은 사용자에게 매력적이지 않을 수 있음. LLM과 StackOverflow의 장단점 비교: LLM 덕분에 StackOverflow를 가급적 피할 수 있게 됨. StackOverflow는 엘리트주의와 실질적 도움보다는 절차를 중시하는 독성으로 가득 차 있음. LLM이 가끔 틀린 답변을 하는 것에 대한 불만이 있지만, StackOverflow의 답변 중에도 완전히 틀리거나 질문과 무관한 것들이 많음. 오래된 답변도 많음. LLM의 작문 능력과 StackOverflow 사용자의 검증이 결합된다면 가장 이상적일 것임. 단순히 인터넷 포인트 획득이 목적인 사람에겐 좋지 않겠지만 사용자에겐 최고일 것임. 컨텐츠 대량 삭제에 대한 StackOverflow의 자동 경고 메시지: 최소한 2017년부터 있었던 것으로 보이며, 대량 삭제 감지 시 자동으로 표시되는 듯함. StackOverflow가 포럼보다는 위키에 가까운 면이 있어 이러한 정책의 이유는 이해할 만함. OpenAI 반대 시위를 잠재우기 위해 도입된 것 같지는 않음. 개인적으로는 지난 2년간 StackOverflow를 거의 사용하지 않았다는 의견도 있음.
Hacker News 의견