Nico의 데이터룸, Papermark 코드 도용 의혹 제기
(twitter.com/mfts0)- Nico의 데이터룸 제품이 직접 만든 결과물이 아니라 Papermark의 오픈소스 및 엔터프라이즈 라이선스 코드에서 가져온 것 같다는 의혹이 공개됨
- 핵심 쟁점은 저작권과 라이선스 침해 여부이며, 문제 제기자는 제품을 즉시 내려야 한다고 요구함
- 이 사안은 “빠르게 움직이며 깨뜨리는 것”이 아니라 사기에 가깝다는 강한 비판으로 이어짐
- 해당 제품 논란으로 Nico의 나머지 사업에도 의심이 번질 수 있다는 지적이 포함됨
- Garry Tan, Jared Friedman, Y Combinator가 함께 태그되며 YC 커뮤니티 평판 문제로도 확산됨
Papermark 코드 도용 의혹
- Nico의 데이터룸 제품이 자체 개발된 것이 아니라 Papermark의 오픈소스 및 엔터프라이즈 라이선스 코드에서 가져온 것처럼 보인다는 공개 의혹이 제기됨
- 문제 제기자는 이를 단순한 빠른 제품 개발이나 “vibe coding”으로 보기 어렵고, 저작권과 라이선스 침해 가능성이 있다고 봄
- 요구 사항은 명확함
- 해당 제품을 즉시 내려야 한다는 입장임
- 침해가 사실이라면 단순한 실수보다 심각한 행위로 받아들여질 수 있음
비판의 확산
- 비판은 Nico의 데이터룸 제품 하나에 그치지 않고, 나머지 사업 전반의 신뢰성에도 의문을 던짐
- Garry Tan, Jared Friedman, Y Combinator가 태그되면서 개인 간 분쟁을 넘어 YC 커뮤니티의 평판과도 연결됨
- 현재 공개된 내용만으로는 의혹 제기와 요구 사항이 중심이며, 추가 검증이나 반박 내용은 제공되지 않음
댓글과 토론
Hacker News 의견들
-
웹페이지 스크린샷을 Figma Make 같은 도구에 넣으면 꽤 비슷한 복제본을 만들 수 있음
스크린샷에서 딱 그런 느낌이 나고, 아주 비슷하지만 완전히 같지는 않음. 문구가 많이 같은 것도 아마 그 때문일 듯함. 문구 재작성조차 생성형 텍스트 도구에 맡기지 않은 건 그냥 허술함 -
다른 Twitter 댓글을 보면 아마 AI에게 Papermark를 베끼라고 시킨 듯함
AI 댓글에 페이지가 “reference”에 맞춰 정렬됐다는 식의 흔적이 있음
https://xcancel.com/ffumarola/status/2070479755892371713#m -
그들의 답변은 이랬음:
The team that made dataroom has stated that they did not use any of papermark’s code and that dataroom was made from scratch with inspiration from existing document sharing softwares, and that this post’s allegations of us stealing code are false. [...]
스크린샷을 보면 디자인과 문구 모두 페이지 전체를 거의 그대로 복사한 게 분명함. 창업자 Nico Laqua가 사실상 “우리는 코드를 베낀 게 아니다”라고만 답하고 아무 책임도 지지 않는 태도는 그와 회사의 도덕 기준을 잘 보여줌. 소송감으로 충분하지 않을 수는 있어도, 그렇다고 옳은 일은 아님
https://x.com/nico_laqua/status/2070158170937581951- 몇 년 전 Corgi가 처음 엔지니어를 뽑을 때 인터뷰를 봤는데, Nico와는 정말 잘 맞지 않았고 단순 전화 스크리닝이었는데도 내가 겪은 인터뷰 중 가장 매끄럽지 않았음
Nico가 진심으로 “코드를 베끼지 않았다”를 합리적인 방어라고 생각해도 별로 놀랍지 않음. 명확한 규칙처럼 보이기 때문이고, 극단적인 “shape rotator” 유형은 법 같은 영역의 애매함을 어려워하는 경우가 많음. 실제로 저작권 침해는 포르노 판별 기준처럼, 보면 아는 경우가 많음 - 예전에 주말 근무를 자랑하고 자기의 별 볼 일 없는 보험 회사를 맨해튼 프로젝트에 비유하던 사람임
어딘가에서는 이 회사/산업이 세계에서 AI의 가장 중요한 적용처라고 주장하기도 했음. 이들이 베꼈다는 데 의심이 없고, 최소한 믿을 만한 사람은 아님
https://x.com/nico_laqua/status/2061130574358773852?s=20 - “소송당하기엔 충분하지 않을 수 있다”는 건 주로 오픈소스 프로젝트가 좀처럼 소송하지 않기 때문임
더 소송을 잘 거는 회사에 이런 일을 했다면 소송당할 가능성이 꽤 있고, 승소 가능성도 50 대 50 정도는 된다고 봄. 이게 창의적·예술적 요소를 복사한 것으로 판단될지, 단순한 동작 방식 복제로 볼지는 말하기 어렵지만, 기능 복제는 괜찮아도 사용자 경험을 통째로 베끼면 금방 저작권 침해가 됨 - 거짓말을 더 밀어붙이는 것만 봐도 Nico가 어떤 사람인지 충분히 알 수 있음
- 디자인은 shadcn이고 MIT 라이선스인 매우 인기 있는 디자인 시스템임
문구도 실사 자료실 솔루션이라면 충분히 예상 가능한 표준적인 내용에 가깝다고 봄
- 몇 년 전 Corgi가 처음 엔지니어를 뽑을 때 인터뷰를 봤는데, Nico와는 정말 잘 맞지 않았고 단순 전화 스크리닝이었는데도 내가 겪은 인터뷰 중 가장 매끄럽지 않았음
-
이 스레드에 대한 배경을 조금 더 설명해줄 수 있나? Nico가 누구인지, Papermark가 무엇이고 뭘 하는지 전혀 모르겠음
별개로, 사람들이 기존 솔루션이나 프로젝트를 바이브 코딩으로 따라 만드는 데 그치지 않고, 오픈소스 코드를 “훔쳐서” 오픈소스의 도덕적·윤리적·법적 전제를 지키지 않은 채 마음대로 쓰는 데 더 익숙해지고 있는 것처럼 보임. 예전보다 오픈소스 위반이 곳곳에서 늘어나는데 큰 법적 결과는 없는 느낌임- 맞음. 이제 훨씬 쉬워졌음
게다가 AI만으로 들어온 새 개발자 중 상당수는 FOSS가 맥주처럼 공짜라는 뜻이 아니라 자유에 관한 것이라는 점을 이해하지 못하거나 신경 쓰지 않음.
나는 하드웨어 오디오 샘플러의 바이너리 데이터 파일을 파싱하는 GPL3 라이브러리를 작업함. 누군가 내 라이브러리 위에서 여러 작업을 할 수 있는 앱을 만들었고, GPL3 라이선스를 따랐음.
그런데 최근 누군가 그 앱을 완전히 바이브 코딩으로 복제해서, 웹사이트와 60달러쯤 되는 구매 링크까지 올렸음. 색상만 다르고 UI가 정확히 같은 너무 노골적인 복제였고, GPL3 조건은 전혀 지키지 않았음. 운영진이 글을 목록에서 내리고 복제 앱 개발자를 차단했으며, 포럼 커뮤니티는 원래 앱 개발자를 지지했음. DMCA 삭제 요청도 보냈고, 며칠 뒤 복제 사이트가 내려갔음.
원래 앱 개발자는 그 제조사 관련 글이 올라오는 주요 포럼이 사실상 하나뿐이고, 운영진도 AI 관련 물건을 싫어해서 운이 좋았음. 아이러니하게도 원래 앱 개발자도 자기 작업을 다 바이브 코딩함. 그 포럼과 운영진이 없었다면 원래 앱 개발자도, GPL3 라이브러리 관리자인 나도 솔직히 망했을 것임.
중앙화에는 장점이 있음. 그게 없다면 모두가 비공개 소스로 돌아가 타인의 작업을 존중하자는 논의를 강제로 만들 대중적 움직임 말고는 대안이 잘 안 보임. 지금까지는 명예와 커뮤니티 반발 시스템에 기대고 있었음 - 판사와 정부는 기업 친화적이고 소비자·시민에게는 적대적임
기업들은 무엇이든 해도 빠져나가는 데 익숙해지고 있음. “빠르게 움직이고 부숴라”는 원래 기술에 관한 말이었지만 이제는 법에 관한 태도가 됐음. Uber가 이 흐름을 대중화했고, 이제 모두가 똑같이 함. AI가 저작권법을 깨는 것도 그 흐름의 일부임.
새로운 법은 패자를 위한 것이라는 사고방식 때문에 앞으로 힘든 시기를 겪게 될 듯함 - 가장 큰 도둑들이 조 단위 기업가치로 향하고 있다면 뭘 기대하겠나
이제 인터넷의 모든 것은 사실상 모두가 마음대로 가져가는 것이 됐다고 봐야 함 - 이것이 범용 초지능으로 가는 승자독식 경쟁이고, 범용 초지능이 절대적 세계 지배로 이어진다고 확신한다면, 당연히 현재 법, 특히 단순한 지식재산권 규칙에 얽매일 생각을 하지 않게 됨
확실하게 지는 유일한 방법은 게임에 참여하지 않는 것이기 때문임 - 외부 고객이나 파트너의 문서를 다루는 기업이라면 DocSend by Dropbox 같은 데이터룸을 써서 접근 관리, 분석, 감사 기능과 함께 문서를 공유하고 받음
Papermark는 DocSend의 오픈소스 대안임. 자체 호스팅이나 호스팅형으로 쓸 수 있어 DocSend보다 훨씬 비용 효율적이라 인기가 많음.
Corgi는 YC가 투자한 보험 스타트업으로, 다른 YC 스타트업에 보험을 판매함. Nico는 창업자임. 최근 약 30억 달러 가치로 1억 달러를 조달했고, 현재 YC가 특히 밀어주는 회사 중 하나임.
보험 인수 심사에는 많은 문서가 필요하기 때문에 Corgi는 DocSend에 매달 수천 달러를 내고 있었음. 어떤 이유에서인지 Corgi는 12명 규모 팀을 꾸려 자체 DocSend 대안인 Dataroom을 만든 것으로 보임. 그리고 Corgi는 이를 월 10달러부터 시작하는 더 저렴한 DocSend로 포지셔닝해, 이미 붐비는 시장에서 SaaS 제품으로 만들기로 했음.
Papermark는 Corgi의 Dataroom이 자기 오픈소스 제품과 동일한 문구와 구조를 많이 쓴다는 걸 즉시 알아챘음. 그래서 Corgi가 출처 표시 없이 Papermark의 작업물을 가져갔다고 판단했음. Corgi는 제품 간에 단어 단위로 일치하는 부분이 있는 건 단순한 우연이라며 부인함.
또 다른 YC 스타트업 Delve는 Corgi가 의심받는 일과 훨씬 더 많은 일을 실제로 했다가 적발되어 YC에서 제외됐음
- 맞음. 이제 훨씬 쉬워졌음
-
내가 보기엔 그의 논리는 대략 두 가지임
- 개발자가 수동으로 코드를 복사하지 않았다
- 같은 영역의 모든 소프트웨어는 서로 베낀다
하지만 여기서 가장 큰 단서는 두 제품의 동일한 레이아웃과 문구임. LLM에 “이 제품을 작성하고 1:1 복제본을 만들어라”라고 지시하는 것도 상식적인 정의로는 여전히 복사임. 아무것도 복사하지 않았다고 주장하는 건 말이 안 됨
- 둘 다 겉보기엔 ShadCN 보일러플레이트 같음: https://ui.shadcn.com/blocks
ShadCN은 AI가 90% 이상 자동으로 선택하는 가장 인기 있는 디자인 시스템이고, lovable 같은 플랫폼에서도 기본값에 가까움 - 그게 Google 대 Oracle의 핵심이었던 것 같음
Google은 API를 복사하되 구현은 클린룸으로 유지했고, 이것은 결국 공정 이용이라고 명확히 판결됐음. API 재구현처럼 엄격한 대상에도 공정 이용이 적용된다면, UI나 레이아웃 복제처럼 훨씬 더 모호한 대상에도 적용된다고 볼 수 있음 - 그는 코드가 복사되지 않았다고 주장하는 것임
-
왜 아직도 예전 Twitter였던 것을 진지하게 쓰는지 모르겠음
-
그들이 말한 대로 코드를 복사해서 붙여넣지는 않았다고 해도, 사실상 LLM이 저장소를 크롤링한 결과를 바탕으로 같은 코드를 재현했고 라이선스를 존중하지 않은 셈일 수 있음
법원이 판단하기에 좋은 민사 사건이 될 만함. 그들의 방어는 “우리는 LLM에게 당신의 작업을 재현하라고 시켰을 뿐이니 ‘우리’가 코드를 복사한 건 아니다”처럼 보임. 좋지 않은 냄새가 남 -
문제의 라이선스: https://github.com/papermark/papermark?tab=License-1-ov-file
AGPL이고, 기본적으로 사용자가 네트워크를 통해 소프트웨어와 상호작용하더라도 소스 코드를 공개해야 한다는 뜻임. 그 코드를 사용하는 프로젝트도 AGPL이어야 함.
분리해서 우회하는 방법은 있음. 예를 들어 AGPL 인증 서버를 쓴다고 해서 비즈니스 로직이 들어간 코드까지 영향을 받아야 하는 것은 아님.
특히 과거 논란을 봤다면, 제품을 라이선스에 맞게 설계할 방법을 찾을 수 있었을 것임.
다만 실제로 코드가 복사됐다는 전제에서 하는 말이고, 우리는 그걸 확실히 알지는 못함. 매우 비슷해 보이지만 어떻게 집행될지는 잘 모르겠음- 집행하려면 아마 소송해야 할 텐데, 이건 Corgi만의 문제보다 더 커질 것 같음
이런 모델들과 관련한 저작권 문제는 정말 엉망임
- 집행하려면 아마 소송해야 할 텐데, 이건 Corgi만의 문제보다 더 커질 것 같음
-
기술 업계는 도둑질을 정상화하고 그걸 혁신이라고 부르기 위해 뭐든 할 것임
-
전형적인 YC 스타트업식 행보임