10P by GN⁺ 7달전 | ★ favorite | 댓글 2개
  • 페이스북의 최고경영자 마크 저커버그는 메타의 대형 언어 모델 Llama 3이 오픈소스라고 주장하지만 실제로는 오픈소스가 아님
  • 오픈소스 이니셔티브(OSI)의 오픈소스 정의에 따르면 Llama 3의 라이선스는 여러 가지 점에서 오픈소스 조건을 충족하지 못함
  • 메타는 이러한 속임수를 쓰는 유일한 기업이 아님. 이를 "오픈워싱"이라고 부름
    • 오픈워싱은 실제로는 오픈하지 않은 제품이나 서비스를 "오픈"한 것처럼 포장하는 기만적 관행
    • 2009년 인터넷 정책 연구자 Michelle Thorne이 "그린워싱"에서 영감을 얻어 이 용어를 만듦
  • AI 분야에서 오픈워싱이 만연한 상황. Radboud University 연구진이 조사한 45개 모델 중 Google, Meta, Microsoft 등 대기업 모델은 실제로 오픈소스가 아님

기업들이 오픈워싱을 하는 이유

  • 과거에는 오픈소스를 꺼렸으나 지금은 오픈소스에 대한 인식이 긍정적으로 바뀜
    • 2001년 Steve Ballmer는 "Linux는 암"이라고 선언하며, 오픈소스 소프트웨어를 사용하면 나머지 소프트웨어도 모두 오픈소스로 만들어야 한다고 주장
  • 기업들은 오픈소스의 긍정적 이미지를 이용하면서도 실제로는 오픈소스에 전념하지 않음
    • 이는 대중 이미지를 개선하고 투명성과 개방성을 중시하는 소비자들에게 어필하는 데 도움이 됨
    • 일부 기업은 오픈워싱을 통해 모델과 관행을 과학적, 규제적 감시로부터 보호하면서 "오픈"이라는 꼬리표의 혜택을 누림
    • EU AI법이 "오픈소스" 모델에 특별 면제를 제공하므로 오픈워싱에 강력한 동기 부여가 됨

오픈소스 AI에 대한 명확한 정의 부재

  • EU는 아직 오픈소스 AI에 대한 명확한 정의를 내리지 못하고 있으며, 사실 그 누구도 아직 그렇지 못함
    • OSI는 향후 며칠 내에 오픈소스 AI 정의를 발표할 예정
    • 현재의 오픈워싱 라이선스들은 제작자들을 제외하고는 모두의 정의에 어긋남
  • 하지만 모든 대형 AI 기업들이 오픈소스에 대해 거짓말하는 것은 아님
    • 예를 들어 IBM의 Granite 3.0 LLM은 실제로 Apache 2 라이선스 하에 오픈소스로 제공됨
  • OSI가 정부나 규제 기관이 아님에도 불구하고, 오픈소스 용어를 올바르게 사용해야 하는 이유는 무엇일까?
    • OSI는 단지 유용한 지침을 만든 비영리 단체일 뿐
  • Chainguard의 CEO인 Dan Lorenc은 최근 애틀랜타에서 열린 SOSS 컨퍼런스 기조연설에서 다음과 같이 말함
    • 누구도 OSI의 정의를 사용하도록 강요할 수는 없지만, 많은 사람들, 특히 변호사들은 이 정의를 신뢰함
    • 그들은 OSI의 활동을 신뢰하며, 기업들이 오픈소스 기준을 충족하는 라이선스를 사용할 때 받게 되는 보호를 이해함
    • 그렇기 때문에 전 세계 대기업의 조달 계약에서 이 정의가 등장하는 것

오픈소스는 단순히 법적, 사업적 문제가 아님

  • 오픈소스는 개발자들에게 자유로운 활동 방식을 제공함
    • 오픈소스 없이는 라이선스의 다양한 조건을 알거나 신경 쓰지 않고도 코드를 자유롭게 사용할 수 있는 혜택을 잃게 될 것
    • 모든 코드의 라이선스를 일일이 확인해야 한다면, 개발자들은 새로운 라이브러리를 사용할 때마다 법률 검토를 받아야 함
    • 기업들은 소스 코드가 공개될 때 직면하게 될 책임이 불분명하다면 인터넷에 무언가를 게시하는 것을 두려워하게 될 것
  • Lorenc은 이것이 대기업만의 문제가 아니라 공유된 문제라고 강조함
    • 오픈소스를 사용하는 모든 사람이 영향을 받게 될 것
    • 전체 프로젝트가 작동을 멈출 수 있고, 보안 버그는 수정되지 않을 것이며, 유지보수는 훨씬 더 어려워질 것
    • 오픈소스의 정의를 보존하고 지키기 위해 함께 행동해야 함. 그렇지 않으면 변호사들이 다시 개입하게 될 것
  • 많은 지적재산권 변호사들은 이런 골치 아픈 일을 원하지 않음
    • 진정한 오픈소스 라이선스는 기업, 프로그래머, 변호사 모두의 삶을 더 쉽게 만듦
    • "우리와 경쟁할 수 있는 사람을 제외한 오픈" 또는 "클라우드에 코드를 배포할 수 있는 사람을 제외한 오픈"과 같은 조항을 도입하는 것은 문제를 자초하는 것

오픈워싱은 모두에게 피해를 줌

  • 결국 오픈워싱은 모두의 법률, 비즈니스, 개발 작업을 더럽힐 것
  • 아이러니하게도, 현재 이런 접근법을 지지하는 근시안적인 기업들도 피해를 볼 것
  • 결국 그들의 거의 모든 작업, 특히 AI 분야에서의 작업은 오픈소스에 기반하고 있기 때문

GN⁺의 의견

  • 오픈소스의 정의를 훼손하는 오픈워싱 관행은 AI 분야뿐 아니라 전반적인 소프트웨어 산업에 부정적 영향을 끼칠 수 있음. 개발자들의 활동을 제약하고 기업들의 법적 위험을 높임
  • 기업들이 오픈소스의 긍정적 이미지만 이용하려 하는 것은 근시안적인 태도. 장기적으로는 오히려 기업 자신에게도 해가 될 수 있음
  • AI 기술 발전을 위해서는 오픈소스 정신에 입각한 협력과 공유가 필수적임. 기업들은 진정한 오픈소스 문화 조성에 앞장서야 함
  • 오픈소스 AI에 대한 명확한 정의와 기준 마련이 시급함. OSI의 오픈소스 AI 정의가 조만간 발표될 예정인데, 이를 토대로 기업과 정부, 개발자 커뮤니티가 협력해 나가야 할 것
  • 오픈워싱을 예방하기 위한 소비자와 개발자 대상 인식 제고 활동도 필요함. 기업의 "오픈" 주장을 그대로 받아들이지 않고 실제 라이선스와 관행을 꼼꼼히 살펴보는 습관이 중요
Hacker News 의견
  • 두 프로그램 또는 AI 모델 중 하나를 선택할 때, 오픈 소스를 선호하는 사람과 그렇지 않은 사람 간의 논쟁이 발생함. 오픈 소스가 아닌 프로그램도 오픈 소스처럼 보이도록 하는 것이 목표임.

  • 오픈 소스는 기업 친화적인 타협이었지만, 일부 참여자들은 높은 도덕성을 가지고 있었음. 이러한 도덕성을 가진 사람들이 오픈 소스의 남용을 막아야 함.

  • 상표, 인증, 라이선스 등을 통해 해결할 수 없다면, 주류 언론을 통해 메시지를 전달해야 함. <i>The Register</i>는 내부 지식이 있지만, 대중에게 널리 알려져야 함.

  • 여러 회사에서 오픈 소스를 비난하면서도 Linux, Java, Debian 등 오픈 소스 소프트웨어에 의존하여 사업을 운영함. 대부분의 기업은 기여나 지원에 대한 의무를 느끼지 않음.

  • OSI가 논란의 여지가 있는 오픈 소스 AI 정의를 준비 중임.

  • thirdweb는 기술적으로 오픈 소스이지만, API 키 없이는 작동하지 않으며, SAAS에 API 호출 한도를 확인함. 이는 진정한 오픈 소스 대안을 만들려는 팀을 낙담시킴.

  • 공정 소스와 같은 개념을 대중화하지 못한 결과로, 작은 비SAAS 회사는 오픈 소스로 생존할 수 없음.

  • 오픈 소스는 자유 소프트웨어가 가진 윤리나 철학을 가지고 있지 않음. 자유 소프트웨어가 오픈 소스보다 우월함.

  • 대형 모델의 경우, 훈련 비용이 높고 이진 아티팩트가 귀중하며 변형 가능함. OSI가 정의를 확립하면 Meta가 이를 따를지 여부와 관계없이 그들의 노력을 칭찬할 가치가 있음.

  • OSI는 대형 클라우드 제공자 시대에 시장 참여자로부터의 보호가 필요하다는 점을 인식해야 함. Mongo, Elastic, Redis와 같은 드라마를 피할 수 있는 명확한 라이선스 옵션이 필요함.

  • "Open <something>"이라는 용어는 대중을 오도하지 않도록 보호되어야 함. "OpenAI"와 같은 혼란을 방지해야 함.

  • "Open Source"라는 용어를 잘못 사용하는 것보다 커뮤니티의 기여를 받아들인 후 라이선스를 철회하는 것이 더 나쁜 경우임. 이는 사기로 간주되어 민사 책임을 져야 함.

  • AI 모델에 대해 재현 가능한 훈련 스크립트와 데이터를 공유하지 않는 경우 "Open Weights"라는 이름이 더 적합함.

오픈 소스로 프로젝트를 공개해서 초기 버그 수정과 기능 개선을 커뮤니티에 맡긴 다음, 안정화되고 나면 다시 독점 라이센스로 쏙 빼버리는 현상이 자주 보이네요.

포크하면 되는 것 아니냐 하는 주장도 있지만 이미 자리잡힌 이미지와 네임 밸류를 기업이 그냥 집어먹는거죠.