1P by GN⁺ | ★ favorite | 댓글 1개
  • GLM-5.2는 실제 사용 가능한 1M 컨텍스트와 장기 과제 독립 수행을 지원하는 오픈소스 모델로, 복잡한 에이전트 애플리케이션 구축 기반을 제공함
  • 프런티어 모델 접근이 비기술적 이유로 갑자기 차단되는 상황에서 과학은 세계적이어야 하며 AGI로 가는 길은 높은 장벽에 갇히면 안 됨
  • AGI는 소수 규칙이 독점하고 언제든 회수할 수 있는 특권이 아니라, 인류가 지능의 경계를 함께 탐구하고 복잡한 과제를 푸는 공동 기반이어야 함
  • GLM-5.2는 Zhipu의 현재까지 가장 강력한 오픈소스 모델이며, 자국 최강 코딩 모델을 만들기 위한 주 엔진 역할을 계속함
  • GLM Coding Plan의 Lite / Pro / Max 사용자에게 먼저 제공되고, API는 다음 주 공개될 예정이어서 프런티어 지능에 대한 접근성이 한 단계 가까워짐

핵심 메시지

  • 특정 프런티어 모델의 갑작스러운 제한은 깊이 유감스러운 일로 제시되며, 비기술적 이유로 접근이 끊기는 시점일수록 과학은 세계적이어야 한다는 입장이 강화됨
  • AGI로 가는 길은 높은 장벽에 둘러싸이면 안 되며, AGI는 인류가 지능의 경계를 함께 탐구하고 복잡한 도전을 해결하는 초석이어야 함
  • AGI는 소수 규칙이 독점하고 언제든 회수할 수 있는 특권이 아니어야 하며, 외부 봉쇄와 제한 앞에서 급진적 개방이 필요함
  • 프런티어 지능은 오픈소스, 접근 가능성, 구축 가능성을 유지해야 하며, 모든 헌신적인 개발자에게 제공되어야 함

GLM-5.2 공개 및 이용 일정

  • GLM-5.2는 Zhipu가 현재까지 공개한 가장 강력한 오픈소스 모델임
  • 이 모델은 실제 사용 가능한 1M 컨텍스트 윈도우를 지원하며, 장기 과제의 독립 완료에서 지속적인 우위를 유지함
  • 복잡한 에이전트 애플리케이션을 만들기 위한 견고한 기반을 제공하며, 자국 최강 코딩 모델을 만들기 위한 주 엔진 역할을 계속함
  • GLM-5.2는 5:21에 GLM Coding Plan 사용자에게 공식 제공되며, 대상은 Lite / Pro / Max 사용자를 모두 포함함
  • API는 다음 주에 공개될 예정이며, ModelKey는 GLM-5.2

댓글과 토론

Hacker News 의견들
  • Z.ai 창업자 발표에 따르면 GLM-5.2는 “완전 공개” 모델이며, 일부 최전선 모델 접근이 비기술적 이유로 갑자기 제한되는 상황에서 최전선 지능은 모두에게 열려 있어야 한다고 함
    GLM-5.2는 Zhipu의 현재까지 가장 강한 오픈소스 모델이고, 실제 사용 가능한 1M 컨텍스트 창과 장기 과제 독립 수행 능력을 내세움
    GLM Coding Plan의 Lite / Pro / Max 사용자에게 먼저 제공되고, API는 다음 주 공개 예정이라고 밝힘
    https://x.com/jietang/status/2065784751345287314

    • GLM이 좋은 점은 OpenRouter에서 사용할 때 미국 기반 제공자데이터 보존 없음 조건으로 필터링할 수 있게 해준다는 것임
      Qwen 같은 다른 중국 오픈 가중치 모델과 다르게 보임
    • “GLM-5.2 is Fully Open”이 오픈 가중치만 뜻하는지, 아니면 소스와 데이터까지 공개한다는 뜻인지 궁금함
  • 아직 벤치마크 결과가 담긴 공식 블로그 글은 없어 보이지만, 중국 AI 연구소들이 이렇게 작업물을 공개하고 허용적인 라이선스로 세계에 기여하는 점은 다시 고맙게 느껴짐
    Fable 5 사태는 이런 공개 모델이 얼마나 가치 있는지 다시 보여줌

    • 첫인상으로는 최전선 연구소들보다 약 6개월 뒤처진 정도로 보이고, 1월의 Opus와 비슷한 느낌임
      그래도 상당히 인상적이고 충분히 쓸 만함
      아키텍처나 복잡한 문제에서는 눈에 띄게 약하지만, 그 외를 기대한 사람은 많지 않았을 것 같음
      특히 디자인과 사용자 인터페이스 쪽은 체급 이상으로 잘하는 듯한데, 개인 취향일 수도 있음
    • 벤치마크 없이 모델을 내놓는 건 모델이 아마 별로라는 신호처럼 보임
  • 최근 며칠 동안 중국 연구소들은 MiniMaxM3, KimiK2.7, GLM5.2를 내놓았는데, 그 사이 미국은 모델을 검열하고 있음
    거의 소설처럼 읽힘

    • kimi2.7이 GLM5.2와 비교해서 어떤지 궁금함
    • 중국 모델들도 검열되어 있음
      현재 Anthropic 사안에서 미국이 모델을 검열한다고 표현할 수도 있겠지만, 트럼프 행정부의 일반적인 부패, 보복, 갈취, 무능 쪽이 더 잘 맞아 보임
  • 기대했던 C++ 라이브러리 OpenGL Mathematics는 아닌 듯함

  • 미국 정부가 Fable에서 벌인 최신 행동을 보면, 이런 흐름이 점점 미래처럼 보임
    변덕스러운 행위자가 문을 걸어 잠그는 전략 제품에는 의존할 수 없음
    오픈 가중치 모델은 기본적으로 그런 상황에 면역에 가까움

    • 어느 정도만 맞음
      미국 정부는 외국 오픈 가중치 모델과 거래하거나, 다운로드하거나, 사용하는 일을 불법으로 만들 수 있음
      개인에게 집행하기는 어렵겠지만 기업은 기본적으로 따를 것이고, 제재 방식으로 가면 GitHub 같은 미국 기반 호스팅에서도 내려갈 가능성이 큼
      게다가 우리는 이미 무서운 수준의 대규모 감시로 빠르게 가고 있어서 집행을 도울 수도 있음
      Fable 상황은 매우 위험한 선례를 만들고 있고, 정보와 컴퓨팅 자유를 위한 싸움에서 지고 있는 것 같아 미래가 걱정됨
    • 중국도 동등하거나 앞서게 되는 순간 비공개로 전환할 가능성이 매우 큼
    • 정부를 비판하는 건 아마 정당하지만 Anthropic은 그냥 넘어가면 안 됨
      이 헛소리를 부추기는 쪽이 Anthropic임
      말도 없이 결과 품질을 낮추고, “안전”이라는 명목으로 요청을 거부함
      정부가 외국인에게 모델을 내리라고 하지 않았더라도, Anthropic 자체가 형편없어서 여전히 아주 나쁜 상황이었을 것임
  • Anthropic이 정부로부터 Fable 금지 서한을 받은 중국 시간 오후 5시 21분과 정확히 같은 시각에 공개됐고, 다른 모델들이 사용할 수 없게 되는 상황을 명시적으로 언급함

    • 정말 그런가? 시간대가 확실한지 모르겠음
      꽤 이상해 보임
      나중에 게시물을 수정했을 가능성도 있지 않을까 싶음
  • 이번 공개는 Mythos 드라마에 편승하려고 급하게 당겨진 것 같음
    “Fable을 못 쓰게 돼서 아쉽겠지만, 주말 동안 우리 걸 써보라”는 식이고, 원래는 다음 주 공개 예정이었을 가능성이 있어 벤치마크가 아직 다 준비되지 않은 듯함

  • 5.2 flash 공개를 기대하고 있음
    시간이 좀 지났지만 4.7 flash는 여전히 가장 강한 로컬 코딩 모델 중 하나라고 느낌

    • flash는 없다는 언급을 본 것 같음
    • 정말? 4.7-flash는 나에게 꽤 끔찍했음
      로컬 모델로는 아직 Qwen-3.5가 최고임
      3.6은 VRAM 사용량이 24GB를 살짝 넘어가서, 그때부터는 소비자용 GPU를 쓰는 게 아니게 됨
  • 새 모델의 능력, 기대할 수 있는 점, 더 저렴한지, 더 빠른지, 출력 품질이 더 좋은지 등을 다룬 블로그 글을 써줬으면 함
    그래도 공개해준 건 고마움

    • 월요일까지는 기다려보는 게 좋을 듯함
  • 실제로 어느 정도 컴퓨팅 자원이 필요한지, 여러 형태별 요구사항이 궁금함
    TurboQuant, MTP 같은 Google의 최적화나 자체 혁신을 포함해서 최전선 품질을 로컬 사용자에게 현실적으로 제공할 수 있게 했는지도 알고 싶음

    • GLM-5 시리즈는 744B-A40B
      합리적인 의미의 로컬 모델은 아니지만, 오픈 모델이므로 가중치가 일주일쯤 뒤 올라오면 토큰당 가격으로 경쟁하는 서드파티 추론 제공자가 여럿 생길 것임
    • 하드웨어에 8만 달러를 쓰면 돌릴 수 있음
      소비자용 하드웨어에서 효과적으로 돌아가는 로컬 모델 같은 건 없고, 그렇다고 말하는 사람은 거짓말을 하거나 망상하는 것임