GLM 5.2 출시

(twitter.com/jietang)

2P by GN⁺ 1달전 | ★ favorite | 댓글 1개

GLM-5.2는 실제 사용 가능한 1M 컨텍스트와 장기 과제 독립 수행을 지원하는 오픈소스 모델로, 복잡한 에이전트 애플리케이션 구축 기반을 제공함
프런티어 모델 접근이 비기술적 이유로 갑자기 차단되는 상황에서 과학은 세계적이어야 하며 AGI로 가는 길은 높은 장벽에 갇히면 안 됨
AGI는 소수 규칙이 독점하고 언제든 회수할 수 있는 특권이 아니라, 인류가 지능의 경계를 함께 탐구하고 복잡한 과제를 푸는 공동 기반이어야 함
GLM-5.2는 Zhipu의 현재까지 가장 강력한 오픈소스 모델이며, 자국 최강 코딩 모델을 만들기 위한 주 엔진 역할을 계속함
GLM Coding Plan의 Lite / Pro / Max 사용자에게 먼저 제공되고, API는 다음 주 공개될 예정이어서 프런티어 지능에 대한 접근성이 한 단계 가까워짐

핵심 메시지

특정 프런티어 모델의 갑작스러운 제한은 깊이 유감스러운 일로 제시되며, 비기술적 이유로 접근이 끊기는 시점일수록 과학은 세계적이어야 한다는 입장이 강화됨
AGI로 가는 길은 높은 장벽에 둘러싸이면 안 되며, AGI는 인류가 지능의 경계를 함께 탐구하고 복잡한 도전을 해결하는 초석이어야 함
AGI는 소수 규칙이 독점하고 언제든 회수할 수 있는 특권이 아니어야 하며, 외부 봉쇄와 제한 앞에서 급진적 개방이 필요함
프런티어 지능은 오픈소스, 접근 가능성, 구축 가능성을 유지해야 하며, 모든 헌신적인 개발자에게 제공되어야 함

GLM-5.2 공개 및 이용 일정

GLM-5.2는 Zhipu가 현재까지 공개한 가장 강력한 오픈소스 모델임
이 모델은 실제 사용 가능한 1M 컨텍스트 윈도우를 지원하며, 장기 과제의 독립 완료에서 지속적인 우위를 유지함
복잡한 에이전트 애플리케이션을 만들기 위한 견고한 기반을 제공하며, 자국 최강 코딩 모델을 만들기 위한 주 엔진 역할을 계속함
GLM-5.2는 5:21에 GLM Coding Plan 사용자에게 공식 제공되며, 대상은 Lite / Pro / Max 사용자를 모두 포함함
API는 다음 주에 공개될 예정이며, ModelKey는 GLM-5.2임

GN⁺ 1달전 [-]

Hacker News 의견들

Z.ai 창업자 발표에 따르면 GLM-5.2는 “완전 공개” 모델이며, 일부 최전선 모델 접근이 비기술적 이유로 갑자기 제한되는 상황에서 최전선 지능은 모두에게 열려 있어야 한다고 함
GLM-5.2는 Zhipu의 현재까지 가장 강한 오픈소스 모델이고, 실제 사용 가능한 1M 컨텍스트 창과 장기 과제 독립 수행 능력을 내세움
GLM Coding Plan의 Lite / Pro / Max 사용자에게 먼저 제공되고, API는 다음 주 공개 예정이라고 밝힘
https://x.com/jietang/status/2065784751345287314
- GLM이 좋은 점은 OpenRouter에서 사용할 때 미국 기반 제공자와 데이터 보존 없음 조건으로 필터링할 수 있게 해준다는 것임
  Qwen 같은 다른 중국 오픈 가중치 모델과 다르게 보임
- “GLM-5.2 is Fully Open”이 오픈 가중치만 뜻하는지, 아니면 소스와 데이터까지 공개한다는 뜻인지 궁금함
아직 벤치마크 결과가 담긴 공식 블로그 글은 없어 보이지만, 중국 AI 연구소들이 이렇게 작업물을 공개하고 허용적인 라이선스로 세계에 기여하는 점은 다시 고맙게 느껴짐
Fable 5 사태는 이런 공개 모델이 얼마나 가치 있는지 다시 보여줌
- 첫인상으로는 최전선 연구소들보다 약 6개월 뒤처진 정도로 보이고, 1월의 Opus와 비슷한 느낌임
  그래도 상당히 인상적이고 충분히 쓸 만함
  아키텍처나 복잡한 문제에서는 눈에 띄게 약하지만, 그 외를 기대한 사람은 많지 않았을 것 같음
  특히 디자인과 사용자 인터페이스 쪽은 체급 이상으로 잘하는 듯한데, 개인 취향일 수도 있음
- 벤치마크 없이 모델을 내놓는 건 모델이 아마 별로라는 신호처럼 보임
최근 며칠 동안 중국 연구소들은 MiniMaxM3, KimiK2.7, GLM5.2를 내놓았는데, 그 사이 미국은 모델을 검열하고 있음
거의 소설처럼 읽힘
- kimi2.7이 GLM5.2와 비교해서 어떤지 궁금함
- 중국 모델들도 검열되어 있음
  현재 Anthropic 사안에서 미국이 모델을 검열한다고 표현할 수도 있겠지만, 트럼프 행정부의 일반적인 부패, 보복, 갈취, 무능 쪽이 더 잘 맞아 보임
기대했던 C++ 라이브러리 OpenGL Mathematics는 아닌 듯함
미국 정부가 Fable에서 벌인 최신 행동을 보면, 이런 흐름이 점점 미래처럼 보임
변덕스러운 행위자가 문을 걸어 잠그는 전략 제품에는 의존할 수 없음
오픈 가중치 모델은 기본적으로 그런 상황에 면역에 가까움
- 어느 정도만 맞음
  미국 정부는 외국 오픈 가중치 모델과 거래하거나, 다운로드하거나, 사용하는 일을 불법으로 만들 수 있음
  개인에게 집행하기는 어렵겠지만 기업은 기본적으로 따를 것이고, 제재 방식으로 가면 GitHub 같은 미국 기반 호스팅에서도 내려갈 가능성이 큼
  게다가 우리는 이미 무서운 수준의 대규모 감시로 빠르게 가고 있어서 집행을 도울 수도 있음
  Fable 상황은 매우 위험한 선례를 만들고 있고, 정보와 컴퓨팅 자유를 위한 싸움에서 지고 있는 것 같아 미래가 걱정됨
- 중국도 동등하거나 앞서게 되는 순간 비공개로 전환할 가능성이 매우 큼
- 정부를 비판하는 건 아마 정당하지만 Anthropic은 그냥 넘어가면 안 됨
  이 헛소리를 부추기는 쪽이 Anthropic임
  말도 없이 결과 품질을 낮추고, “안전”이라는 명목으로 요청을 거부함
  정부가 외국인에게 모델을 내리라고 하지 않았더라도, Anthropic 자체가 형편없어서 여전히 아주 나쁜 상황이었을 것임
Anthropic이 정부로부터 Fable 금지 서한을 받은 중국 시간 오후 5시 21분과 정확히 같은 시각에 공개됐고, 다른 모델들이 사용할 수 없게 되는 상황을 명시적으로 언급함
- 정말 그런가? 시간대가 확실한지 모르겠음
  꽤 이상해 보임
  나중에 게시물을 수정했을 가능성도 있지 않을까 싶음
이번 공개는 Mythos 드라마에 편승하려고 급하게 당겨진 것 같음
“Fable을 못 쓰게 돼서 아쉽겠지만, 주말 동안 우리 걸 써보라”는 식이고, 원래는 다음 주 공개 예정이었을 가능성이 있어 벤치마크가 아직 다 준비되지 않은 듯함
5.2 flash 공개를 기대하고 있음
시간이 좀 지났지만 4.7 flash는 여전히 가장 강한 로컬 코딩 모델 중 하나라고 느낌
- flash는 없다는 언급을 본 것 같음
- 정말? 4.7-flash는 나에게 꽤 끔찍했음
  로컬 모델로는 아직 Qwen-3.5가 최고임
  3.6은 VRAM 사용량이 24GB를 살짝 넘어가서, 그때부터는 소비자용 GPU를 쓰는 게 아니게 됨
새 모델의 능력, 기대할 수 있는 점, 더 저렴한지, 더 빠른지, 출력 품질이 더 좋은지 등을 다룬 블로그 글을 써줬으면 함
그래도 공개해준 건 고마움
- 월요일까지는 기다려보는 게 좋을 듯함
실제로 어느 정도 컴퓨팅 자원이 필요한지, 여러 형태별 요구사항이 궁금함
TurboQuant, MTP 같은 Google의 최적화나 자체 혁신을 포함해서 최전선 품질을 로컬 사용자에게 현실적으로 제공할 수 있게 했는지도 알고 싶음
- GLM-5 시리즈는 744B-A40B임
  합리적인 의미의 로컬 모델은 아니지만, 오픈 모델이므로 가중치가 일주일쯤 뒤 올라오면 토큰당 가격으로 경쟁하는 서드파티 추론 제공자가 여럿 생길 것임
- 하드웨어에 8만 달러를 쓰면 돌릴 수 있음
  소비자용 하드웨어에서 효과적으로 돌아가는 로컬 모델 같은 건 없고, 그렇다고 말하는 사람은 거짓말을 하거나 망상하는 것임

답변달기

GLM 5.2 출시

핵심 메시지

GLM-5.2 공개 및 이용 일정

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들