3P by GN⁺ 4시간전 | ★ favorite | 댓글 2개
  • Alibaba의 Qwen 팀 핵심 연구진이 대거 사임하면서, 최근 공개된 Qwen 3.5 모델 시리즈의 향후가 불투명해짐
  • 팀 리더 Lin Junyang이 사임을 발표했고, 이어 여러 핵심 인력들이 동반 퇴사
  • 최근 출시된 Qwen 3.5 모델 패밀리가 소형 모델에서도 뛰어난 성능을 보여주고 있어서 더욱 주목받는 중
  • Qwen 팀의 해체 가능성은 중국발 오픈소스 AI 연구 생태계에 중요한 변곡점이 될 수 있음

Qwen 팀의 인사 변동

  • Alibaba의 Qwen 3.5 모델 시리즈가 공개된 직후, 팀 리더 Lin Junyang이 X(구 트위터)를 통해 “me stepping down. bye my beloved qwen.”이라는 메시지로 사임을 발표
    • Lin은 2024년 이후 Qwen의 오픈 가중치 모델 공개를 주도한 핵심 연구자로, Alibaba 내 최연소 P10 등급 인력 중 한 명이었음
  • 중국 매체 36Kr 보도에 따르면, 3월 4일 오후 1시경 Alibaba의 Tongyi Lab이 긴급 전사 회의를 열고 CEO Wu Yongming이 직접 Qwen 팀에 상황을 설명
    • Lin의 사임은 12시간 전인 새벽 0시 11분에 발표되었으며, 팀 내부에서도 충격이 컸다고 전함
    • Lin은 오후 2시경 WeChat에 “Qwen의 형제들, 원래 계획대로 계속하라. 문제없다”는 메시지를 남겼으나 복귀 여부는 명확히 밝히지 않음
    • Qwen 팀원들은 36Kr에 "경쟁사보다 훨씬 적은 리소스 속에서 Junyang의 리더십이 현재 성과를 달성한 핵심 요인"이라고 이야기 함
  • 사임의 계기로 Alibaba 내부 조직 개편에서 Google Gemini 팀 출신 새 연구자가 Qwen 책임자로 배치된 점이 거론되나, 확인되지 않은 정보임

핵심 인력들의 연쇄 퇴사

  • Lin의 사임 이후 여러 핵심 멤버들이 동반 퇴사한 것으로 확인됨
    • Binyuan Hui: Qwen 코드 개발 리드, Qwen-Coder 시리즈 총괄, 에이전트 학습 전 과정 담당, 최근 로보틱스 연구 참여
    • Bowen Yu: Qwen 후학습(post-training) 리드, Qwen-Instruct 시리즈 개발 주도
    • Kaixin Li: Qwen 3.5/VL/Coder 핵심 기여자, 싱가포르국립대 박사
    • 이외에도 다수의 젊은 연구자들이 같은 날 사임한 것으로 보도됨
  • Alibaba CEO가 직접 회의에 참석한 점은 회사 측이 사태의 심각성을 인식하고 있음을 보여줌

Qwen 3.5 모델의 특징

  • Qwen 3.5는 Alibaba Qwen 팀이 최근 몇 주간 공개한 오픈 가중치 모델 패밀리로, 성능이 매우 뛰어남
    • 2월 17일 공개된 Qwen3.5-397B-A17B는 807GB 규모의 대형 모델
    • 이후 122B, 35B, 27B, 9B, 4B, 2B, 0.8B 등 다양한 크기의 모델이 연속 공개됨
  • 27B와 35B 모델은 코딩에서 좋은 평가, 9B·4B·2B 모델은 크기에 비해 매우 효율적임
    • 27B와 35B 모델은 32GB/64GB Mac에서 구동 가능한 수준이면서 코딩 태스크를 훌륭하게 처리
    • 특히 2B 모델은 4.57GB(양자화 시 1.27GB)에 불과하지만 추론 및 멀티모달(비전) 기능을 모두 지원

향후 전망

  • Qwen 팀이 해체된다면, 소형 모델에서 고품질 성능을 구현해온 연구 성과가 중단될 가능성이 있음
  • 팀 구성원들이 새로운 연구소를 설립하거나 다른 기관에 합류할 경우, 후속 연구에 대한 기대감은 존재
  • 현재 상황은 “아직 불확실한 상태”로, Alibaba가 일부 인력을 유지할 가능성도 남아 있음

참고된 외부 출처

Lin Junyang 사임은 충격이네요. Qwen 3.5 35B-A3B 잘 쓰고 있어서 Qwen 4 기대했는데 ㅠㅠ

Hacker News 의견들
  • 개발이 너무 방해받지 않기를 바람. Simon이 말했듯 Qwen3.5는 정말 인상적임
    지난 며칠 동안 Qwen3.5-35B-A3B를 테스트했는데, 지금까지 써본 모델 중 가장 에이전트형 코딩 능력이 뛰어남
    Rust와 Elixir 코드를 Pi harness로 작성하게 했는데, 테스트를 스스로 만들고 통과 여부를 검증함. 테스트나 컴파일 오류 루프를 잘 처리하면서 목표를 향해 나아감
    • GH200에서 3.5:122b를 돌려봤는데, Rust/React/TS 작업에서 Sonnet보다는 약간 부족하지만, 작은 범위의 작업은 충분히 잘 처리함
      다만 중간에 “이게 더 간단하겠다”며 지시사항을 무시하고 지원 코드를 통째로 삭제하는 경향이 있음
    • 나도 Rust로 테스트했는데, 가끔 무한 루프에 빠졌다가 스스로 풀림
      deadpool과 deadpool-r2d2를 계획 단계에서 선택해 스스로 혼란스러워함. 그래도 전반적으로 코드는 괜찮고, 데이터베이스 계층만 조금 손봐야 할 듯함
      지금까지 셀프호스팅 가능한 모델 중 가장 안정적
    • 밀집형 27B 모델을 써보니 루프와 불필요한 반복이 훨씬 적었음
    • 혹시 llama.cpp로 로컬 실행 중인지 궁금함. 기본 chat template으로는 도구 호출이 실패했는데, 이 템플릿을 쓰면 훨씬 잘 작동함
    • 어떤 하드웨어에서 돌리고 있는지 궁금함. 일상적인 코딩에서 frontier 모델을 대체할 수 있다고 느끼는지 묻고 싶음
  • Qwen 연구팀과 Alibaba 제품팀 간에 긴장이 있었다고 함. Alibaba가 최근 DAU를 KPI로 강제하려 했다고 들음
    기업 입장에서는 전략 변경이 이해되지만, 왜 핵심 연구진을 내보냈는지는 의문임. 지금은 모델 연구자가 부족한 시기 아닌가 싶음
    • 아마도 향후 Qwen 모델을 폐쇄형 상용 모델로 전환하려 했고, 연구진이 그걸 받아들이지 못했을 가능성이 있음
  • 미국 연구소들이 왜 이런 인재들에게 막대한 자금을 투자하지 않는지 궁금함
    • 내 지역(오하이오)에서는 ICE가 중국인들을 단속하고 있음. 합법적 체류자도 추방 위험을 느끼고 있음
      이런 분위기에서는 미국 연구소가 아무리 돈을 써도 인재 유치가 어려움
    • 미국은 합법 이민자조차 억류 위험에 노출되도록 만들었음
    • 유럽이 미국의 정치적 혼란에 대비해 경쟁 모델을 키워야 함
    • 이미 미국 자본에 끌린 사람들은 떠났고, 중국도 충분히 자금을 투자 중임
      게다가 중국 기업에서는 의사결정 영향력을 더 크게 가질 수 있음
    • 문제는 단순히 NSF 예산 삭감이 아님. 보건 문제, 전쟁 리스크, 외국인 연구자에 대한 불확실성 등으로 미국의 매력이 줄었음
      트럼프 행정부 시절부터 이미 외국인 유학생 유입이 줄었고, 지금은 미국에서 박사 과정을 밟는 게 오히려 평판 리스크로 여겨질 정도임
  • 로컬 모델을 사용할 때 사람들은 시행착오를 더 관대하게 받아들이는 경향이 있음
    클라우드 모델이 토큰을 낭비하면 비용이 아깝지만, 로컬 모델이 루프를 돌면 “생각 중이구나”라고 느껴짐
    Qwen 같은 모델이 로컬 코딩에 충분히 쓸만해지면, 변화는 기술적이라기보다 경제적일 가능성이 큼
    • 로컬 모델의 토큰 낭비는 오히려 환영임. 내 방의 GPU 메인프레임이 난방기 역할을 하니까 (스위스의 불안정한 난방 사정 덕분임)
  • 32B 모델을 로컬에서 며칠 돌려봤는데, 에이전트형 코딩을 꽤 잘 처리함
    크기에 비해 성능이 뛰어나지만, 긴 지시문에서는 절반쯤 무시하는 경향이 있음. 이 정도 크기에서는 감수할 만한 트레이드오프임
  • 수학자로서 Qwen을 이용해 논문 간의 관계나 요약을 자동화해봤음
    심지어 오인용 검증까지 수행해 arXiv 논문에 활용됨
    결과물은 이 페이지에 정리해둠
  • 연구진이 다른 곳에서 다시 오픈웨이트 모델 경쟁을 이어가길 바람
    사실 이런 연구를 정부가 지원해야 한다고 생각했지만, 지금은 중국 기업이 그 역할을 대신하고 있음
  • Qwen3.5는 정말 뛰어남. 35B 버전을 Ada NextGen 24GB에서 easy-llm-cli로 돌려봤는데, Gemini 3 Pro와 거의 비슷한 수준이었음
    속도도 꽤 빠름
    • q4 quant 설정으로 175 tg와 7K pp를 얻을 수 있었고, 대부분의 클라우드 제공자보다 효율적이었음
  • 요즘은 “AI가 사람을 대체한다”에서 “AI는 특정 인물 없이는 죽는다”로 분위기가 바뀐 듯함. 정말 극적인 전환
    • Anthropic의 가동률이 99.9999999% 가 아니라 단 90% 수준임. 상태 페이지를 보면 알 수 있음
      AI가 사람을 완전히 대체할 수 있다면, CEO들이 이렇게 설득에 애쓸 필요가 없을 것임
    • “AI는 특정 인물 없이는 죽는다”는 말은 과장임. 사람들은 단지 Qwen 모델군의 향방을 궁금해하는 것뿐임
    • AGI 목표에서 광고 중심의 단기 전략으로 전환된 게 지금 상황을 잘 보여줌
    • Claude는 스스로 네이티브 앱을 만들지 못함, 웹 앱조차 불안정해서 Anthropic이 Bun을 인수한 이유가 됨
  • 그냥 잊자, 여긴 차이나타운