10P by neo 27일전 | favorite | 댓글 2개
  • 페이스북의 최고경영자 마크 저커버그는 메타의 대형 언어 모델 Llama 3이 오픈소스라고 주장하지만 실제로는 오픈소스가 아님
  • 오픈소스 이니셔티브(OSI)의 오픈소스 정의에 따르면 Llama 3의 라이선스는 여러 가지 점에서 오픈소스 조건을 충족하지 못함
  • 메타는 이러한 속임수를 쓰는 유일한 기업이 아님. 이를 "오픈워싱"이라고 부름
    • 오픈워싱은 실제로는 오픈하지 않은 제품이나 서비스를 "오픈"한 것처럼 포장하는 기만적 관행
    • 2009년 인터넷 정책 연구자 Michelle Thorne이 "그린워싱"에서 영감을 얻어 이 용어를 만듦
  • AI 분야에서 오픈워싱이 만연한 상황. Radboud University 연구진이 조사한 45개 모델 중 Google, Meta, Microsoft 등 대기업 모델은 실제로 오픈소스가 아님

기업들이 오픈워싱을 하는 이유

  • 과거에는 오픈소스를 꺼렸으나 지금은 오픈소스에 대한 인식이 긍정적으로 바뀜
    • 2001년 Steve Ballmer는 "Linux는 암"이라고 선언하며, 오픈소스 소프트웨어를 사용하면 나머지 소프트웨어도 모두 오픈소스로 만들어야 한다고 주장
  • 기업들은 오픈소스의 긍정적 이미지를 이용하면서도 실제로는 오픈소스에 전념하지 않음
    • 이는 대중 이미지를 개선하고 투명성과 개방성을 중시하는 소비자들에게 어필하는 데 도움이 됨
    • 일부 기업은 오픈워싱을 통해 모델과 관행을 과학적, 규제적 감시로부터 보호하면서 "오픈"이라는 꼬리표의 혜택을 누림
    • EU AI법이 "오픈소스" 모델에 특별 면제를 제공하므로 오픈워싱에 강력한 동기 부여가 됨

오픈소스 AI에 대한 명확한 정의 부재

  • EU는 아직 오픈소스 AI에 대한 명확한 정의를 내리지 못하고 있으며, 사실 그 누구도 아직 그렇지 못함
    • OSI는 향후 며칠 내에 오픈소스 AI 정의를 발표할 예정
    • 현재의 오픈워싱 라이선스들은 제작자들을 제외하고는 모두의 정의에 어긋남
  • 하지만 모든 대형 AI 기업들이 오픈소스에 대해 거짓말하는 것은 아님
    • 예를 들어 IBM의 Granite 3.0 LLM은 실제로 Apache 2 라이선스 하에 오픈소스로 제공됨
  • OSI가 정부나 규제 기관이 아님에도 불구하고, 오픈소스 용어를 올바르게 사용해야 하는 이유는 무엇일까?
    • OSI는 단지 유용한 지침을 만든 비영리 단체일 뿐
  • Chainguard의 CEO인 Dan Lorenc은 최근 애틀랜타에서 열린 SOSS 컨퍼런스 기조연설에서 다음과 같이 말함
    • 누구도 OSI의 정의를 사용하도록 강요할 수는 없지만, 많은 사람들, 특히 변호사들은 이 정의를 신뢰함
    • 그들은 OSI의 활동을 신뢰하며, 기업들이 오픈소스 기준을 충족하는 라이선스를 사용할 때 받게 되는 보호를 이해함
    • 그렇기 때문에 전 세계 대기업의 조달 계약에서 이 정의가 등장하는 것

오픈소스는 단순히 법적, 사업적 문제가 아님

  • 오픈소스는 개발자들에게 자유로운 활동 방식을 제공함
    • 오픈소스 없이는 라이선스의 다양한 조건을 알거나 신경 쓰지 않고도 코드를 자유롭게 사용할 수 있는 혜택을 잃게 될 것
    • 모든 코드의 라이선스를 일일이 확인해야 한다면, 개발자들은 새로운 라이브러리를 사용할 때마다 법률 검토를 받아야 함
    • 기업들은 소스 코드가 공개될 때 직면하게 될 책임이 불분명하다면 인터넷에 무언가를 게시하는 것을 두려워하게 될 것
  • Lorenc은 이것이 대기업만의 문제가 아니라 공유된 문제라고 강조함
    • 오픈소스를 사용하는 모든 사람이 영향을 받게 될 것
    • 전체 프로젝트가 작동을 멈출 수 있고, 보안 버그는 수정되지 않을 것이며, 유지보수는 훨씬 더 어려워질 것
    • 오픈소스의 정의를 보존하고 지키기 위해 함께 행동해야 함. 그렇지 않으면 변호사들이 다시 개입하게 될 것
  • 많은 지적재산권 변호사들은 이런 골치 아픈 일을 원하지 않음
    • 진정한 오픈소스 라이선스는 기업, 프로그래머, 변호사 모두의 삶을 더 쉽게 만듦
    • "우리와 경쟁할 수 있는 사람을 제외한 오픈" 또는 "클라우드에 코드를 배포할 수 있는 사람을 제외한 오픈"과 같은 조항을 도입하는 것은 문제를 자초하는 것

오픈워싱은 모두에게 피해를 줌

  • 결국 오픈워싱은 모두의 법률, 비즈니스, 개발 작업을 더럽힐 것
  • 아이러니하게도, 현재 이런 접근법을 지지하는 근시안적인 기업들도 피해를 볼 것
  • 결국 그들의 거의 모든 작업, 특히 AI 분야에서의 작업은 오픈소스에 기반하고 있기 때문

GN⁺의 의견

  • 오픈소스의 정의를 훼손하는 오픈워싱 관행은 AI 분야뿐 아니라 전반적인 소프트웨어 산업에 부정적 영향을 끼칠 수 있음. 개발자들의 활동을 제약하고 기업들의 법적 위험을 높임
  • 기업들이 오픈소스의 긍정적 이미지만 이용하려 하는 것은 근시안적인 태도. 장기적으로는 오히려 기업 자신에게도 해가 될 수 있음
  • AI 기술 발전을 위해서는 오픈소스 정신에 입각한 협력과 공유가 필수적임. 기업들은 진정한 오픈소스 문화 조성에 앞장서야 함
  • 오픈소스 AI에 대한 명확한 정의와 기준 마련이 시급함. OSI의 오픈소스 AI 정의가 조만간 발표될 예정인데, 이를 토대로 기업과 정부, 개발자 커뮤니티가 협력해 나가야 할 것
  • 오픈워싱을 예방하기 위한 소비자와 개발자 대상 인식 제고 활동도 필요함. 기업의 "오픈" 주장을 그대로 받아들이지 않고 실제 라이선스와 관행을 꼼꼼히 살펴보는 습관이 중요

오픈 소스로 프로젝트를 공개해서 초기 버그 수정과 기능 개선을 커뮤니티에 맡긴 다음, 안정화되고 나면 다시 독점 라이센스로 쏙 빼버리는 현상이 자주 보이네요.

포크하면 되는 것 아니냐 하는 주장도 있지만 이미 자리잡힌 이미지와 네임 밸류를 기업이 그냥 집어먹는거죠.

Hacker News 의견
  • 두 프로그램 또는 AI 모델 중 하나를 선택할 때, 오픈 소스를 선호하는 사람과 그렇지 않은 사람 간의 논쟁이 발생함. 오픈 소스가 아닌 프로그램도 오픈 소스처럼 보이도록 하는 것이 목표임.

  • 오픈 소스는 기업 친화적인 타협이었지만, 일부 참여자들은 높은 도덕성을 가지고 있었음. 이러한 도덕성을 가진 사람들이 오픈 소스의 남용을 막아야 함.

  • 상표, 인증, 라이선스 등을 통해 해결할 수 없다면, 주류 언론을 통해 메시지를 전달해야 함. <i>The Register</i>는 내부 지식이 있지만, 대중에게 널리 알려져야 함.

  • 여러 회사에서 오픈 소스를 비난하면서도 Linux, Java, Debian 등 오픈 소스 소프트웨어에 의존하여 사업을 운영함. 대부분의 기업은 기여나 지원에 대한 의무를 느끼지 않음.

  • OSI가 논란의 여지가 있는 오픈 소스 AI 정의를 준비 중임.

  • thirdweb는 기술적으로 오픈 소스이지만, API 키 없이는 작동하지 않으며, SAAS에 API 호출 한도를 확인함. 이는 진정한 오픈 소스 대안을 만들려는 팀을 낙담시킴.

  • 공정 소스와 같은 개념을 대중화하지 못한 결과로, 작은 비SAAS 회사는 오픈 소스로 생존할 수 없음.

  • 오픈 소스는 자유 소프트웨어가 가진 윤리나 철학을 가지고 있지 않음. 자유 소프트웨어가 오픈 소스보다 우월함.

  • 대형 모델의 경우, 훈련 비용이 높고 이진 아티팩트가 귀중하며 변형 가능함. OSI가 정의를 확립하면 Meta가 이를 따를지 여부와 관계없이 그들의 노력을 칭찬할 가치가 있음.

  • OSI는 대형 클라우드 제공자 시대에 시장 참여자로부터의 보호가 필요하다는 점을 인식해야 함. Mongo, Elastic, Redis와 같은 드라마를 피할 수 있는 명확한 라이선스 옵션이 필요함.

  • "Open <something>"이라는 용어는 대중을 오도하지 않도록 보호되어야 함. "OpenAI"와 같은 혼란을 방지해야 함.

  • "Open Source"라는 용어를 잘못 사용하는 것보다 커뮤니티의 기여를 받아들인 후 라이선스를 철회하는 것이 더 나쁜 경우임. 이는 사기로 간주되어 민사 책임을 져야 함.

  • AI 모델에 대해 재현 가능한 훈련 스크립트와 데이터를 공유하지 않는 경우 "Open Weights"라는 이름이 더 적합함.