Hacker News 의견
  • 나는 저자임을 밝히며, 내 책 3권이 50만권 데이터셋에 포함된 것을 직접 확인했음
    따라서 이번 합의로 약 9,000달러를 받게 될 예정임
    두 권은 2만 달러 이하의 선인세만 받았고 수익도 나지 않아, 이 정도면 공정하다고 생각함
    Anthropic이 이 데이터로 모델 훈련에 도움을 받았겠지만, 이 모델들이 영구적인 자산이라 단정하긴 어려움
    • 이것이 공정하다고는 할 수 없음
      만약 내가 저작권을 위반해서 적발되면 단순히 벌금만이 아니라 실제 감옥에 갈 수도 있음
    • 어떻게 내 작품이 해당 데이터셋에 포함된 걸 확인했는지 궁금함
    • 실제로 이 돈을 내가 받게 되는 것인지, 아니면 내 출판사가 선인세를 청산하는 데 사용할지 궁금함
    • 두 책은 선인세도 못 건질 만큼 판매가 저조했다고 했지만, 그게 본인에게는 공정하게 느껴져도 다른 작가들에게는 불공정할 수 있음
    • 내가 이해하기로는 이번 소송의 쟁점이 모델 훈련 자체가 아니라 불법적으로 도서를 확보한 점임
      각 책을 3000달러에 판매하는 게 아니라면 이 결과가 납득 가능하지 않음
  • 지금까지 댓글들은 거절 결정 자체에만 집중해, 실제로 판사가 제시한 거절 사유에는 주목하지 않고 있음
    내가 아는 한, Alsup 판사는 절차상의 문제(배분 방법, Anthropic의 소송 반복 방지 효과 등)에 초점을 맞췄지, 합의금 자체는 거부하지 않았음
    법 전문가는 아니지만, 교섭 당사자들이 금액을 조정하지 않고도 판사의 거절 이유를 해결할 수 있다고 생각함
    • 맞음
      기사는 명확하게 “무효화 없이 거절”됐으며, 몇 가지 사항만 조정되면 예비 승인이 날 것이라고 밝힘
      많은 사람들이 원 기사를 제대로 읽지 않은 듯함
      단, 모든 문제가 이렇게 원만히 해결될지는 모르겠음
      목록을 새로 작성하는 데 시간이 빠듯해서, 실제로 최종 거절이나 훨씬 지연된 절차가 될 수도 있다고 봄
  • Judge Alsup의 판결문 바로가기: https://www.bloomberglaw.com/public/desktop/document/BartzetalvAnthropicPBCDocketNo324cv05417NDCalAug192024CourtDocket/38?doc_id=X541S23JROF9BCQSF8959K1SF12
    이 이름은 tech law를 팔로우한 사람에게 익숙할 수 있음
    그는 Oracle v Google 재판과 Uber를 위해 Waymo 기술을 훔친 Anthony Levandowski의 형사 사건을 맡았던 판사임
    • 나는 이런 재판에 가벼운 관심만 있었지만 Alsup 판사에 긍정적인 인상을 받았음
      그의 기술적 이해도에 감명받았음
      그의 판결문과 의견은 미국 사법제도의 성공 사례라고 생각함
      그의 결정에 동의하지 않더라도 마찬가지로 높이 평가함
  • 이 합의가 승인됐다면 앞으로 우려되는 선례가 될 수 있었음
    내 정보 자유 및 저작권에 대한 입장은 Aaron Swartz의 사망 이후 변하지 않았음
    지적재산권 및 특허, 저작권 등은 주로 기존 기득권만을 보호하는 오래된 제도라고 생각함
    해적판이 만연해 대부분 미디어가 바로 풀려도, 창작자/미디어 기업은 계속 성장하고 충분히 수익을 내고 있음
    왜 출판사들이 수십년 된 법률에만 매달려 접근을 제한해야 하나는 의문임
    • 늘 창작물과 지식이 자유롭게 풀려야 한다는 주장은 소프트웨어와 개발자를 편의상 빼고 이야기하는 경우가 많음
      지식재산권이 반드시 대형 기득권만을 보호하는 건 아님
      여러분이 모를 뿐, 보호 덕에 지키는 사람이 분명히 있음
    • 실제로 그게 법적 선례를 남길까, 아니면 일종의 문화적 기준 같은 게 생기는 수준일까 궁금함
      Anthropic이 잘못을 인정하지 않는 이상, 선례로 기능하지는 않을 수 있음
      하지만 이 합의는 어떤 입장이든 수많은 모순적 해석을 요구하고 있다는 점에서 혼란스러움
  • 내가 기억하기로, 판사는 저작권 있는 자료로 모델을 훈련하는 것은 공정 사용이라고 본 듯함
    나는 이에 동의하지 않음
    앞으로 텍스트를 기반으로 생계를 유지하는 사람들에게 실질적 문제가 될 것임
    결국 대형 언어 모델이 웹, 뉴스, 책 출판 시장의 가치를 뺏어가고 정당한 보상이 이루어지지 않을 수 있음
    판사가 지적한 유일한 문제는 불법 복제된 책을 훈련에 사용한 점임
  • 기사 제목이 이상함
    "Anthropic judge"가 무슨 의미인지 모르겠음
    • Anthropic 소송을 맡은 판사라는 의미임
    • 마치 해당 판사가 Anthropic 소속처럼 들림
    • 나도 처음엔 진짜 Anthropic에서 새롭게 내놓은 'AI Judge'가 그런 판결을 내렸다는 줄 알았음
    • 인간 판사임
      이런 시대, 인간 판사의 역할을 만끽해야 할 것임
  • 이런 AI 회사들이 어떻게 사용자가 전체 PDF나 텍스트 파일을 업로드하는 걸 방지하고 있는지 의문임
    사용자 입력을 기반으로 모델을 훈련해도, 여전히 저작권 침해 위험이 있는 것 아님?
    • 결국 뭐든 흡입해간다면, 흡입한 결과에 대해 책임을 져야 함
    • 만약 그 결과가 저작권 위반으로 판명되면, 그 자체가 소송 대상이 될 수 있음
      모델 출력에서 위반이 드러난다면 입력 방식과 상관없이 문제가 됨
    • 훈련 여부와 무관하게, LLM이 PDF 내용을 읽는다면 Dropbox에 파일을 저장하는 것과 유사함
  • 기사 전체를 접근할 수 없는 사람들을 위해, 판사가 왜 거절했는지 요약해 줌
    기사에서 핵심적으로 두 문단이 이유를 잘 설명한다고 생각함
    판사가 본 합의안을 "무효화 없이 거절"한 것은 더 명확한 정보가 제출될 때까지 승인 결정을 미루겠다는 것임
    합의금이 정해진 뒤 집단 소송 당사자들이 제대로 보상을 받지 못하는 사례가 빈번하다고 언급함
    그래서 집단 소송 구성원들에게 실제로 '매우 충분한 공지'가 이뤄져, 참여 및 이탈 기회를 보장하고 추후 예기치 못한 소송을 막아야 한다고 강조함
    걱정하는 부분은 두 가지임
    1. 집단 구성원 공지, 청구 및 지급 방식, 포함 작품 명확화, 변호사 비용 과다 수령 방지
    2. Anthropic이 후속 소송에 노출되지 않도록 하는 합의의 법적 장치
  • Anthropic은 지금이라도 이 합의를 접고 본격적으로 소송전을 가져가면 거의 이길 가능성이 높음
    • 실제로 Anthropic이 그 경로를 택했고, 판사가 저자 측에 더 강한 대표성을 요구함
      하지만 만약 Anthropid이 지면 보상금이 5배 이상으로 뛸 수 있기 때문에 회사 존립이 위험해질 수 있음
    • 7백만 권의 책을 불법적으로 다운받았다는 사실은 부정할 수 없음
    • 합의를 시도하는 건 패소 시 회사 전체가 위험해질 정도로 부담이 크기 때문임
      Anthropic 측도 재판으로 가면 패배할 것을 확신하고 있음
  • 거대 기업에 공감은 없지만, 지식재산권·저작권은 인류에 아무 긍정적 효과를 주지 않는다고 생각함
    • 아이디어가 가치가 되는 경제에서 실물재산처럼 아이디어도 보호받는 것이 논리적임
      20년, 1억 달러를 들여 개발한 아이디어가 아무 보호도 안 된다면, 아무도 그런 투자를 하지 않음
      오늘날의 기술(의약품, 전자제품, 콘텐츠 등)이 가능한 건 결국 이런 보호장치 덕분임
      물론, 현재 제도가 경쟁을 막거나 혁신을 훼손한다는 지적도 일부 타당함
      다만, 제도가 없다면 애초에 원천기술이 개발되지 않아 자유롭게 쓸 아이디어 자체도 없었을 것임
    • 저작권은 실제로 아무 제한 없이 복제 가능한 것을 마치 상품처럼 팔게 해주는 허구임
      그래도 AI 기업 덕분에 저작권권력자들도 이제는 같은 크기의 상대와 싸우게 됐음
      이전엔 힘없는 개인 저자/개발자를 자살로 내몰기 일쑤였으나, 이제는 아니다는 점이 AI 기업의 유일한 장점임
    • 창작을 경험해 본 사람이 아니면 저작권 무용론을 쉽게 말할 수 있음
      내가 아는 작가·음악가는 모두 자신의 작업물 유통과 판매 권리에 어느 정도는 보호받아야 한다고 함
      베스트셀러 작가가 왜 생계가 위태로워져야 하는지 이해할 수 없음
    • 본인이 어떤 일을 하며 일한 결과를 무료로 풀어야 한다고 생각하는지 궁금함
      아니면 남의 일에만 그런 생각을 하는 건 아닌지 묻고 싶음