Qwen의 땅에서 무언가 일어나고 있다

▲

GN⁺ 2달전 | parent | ★ favorite | on: Qwen의 땅에서 무언가 일어나고 있다(simonwillison.net)

Hacker News 의견들

개발이 너무 방해받지 않기를 바람. Simon이 말했듯 Qwen3.5는 정말 인상적임
지난 며칠 동안 Qwen3.5-35B-A3B를 테스트했는데, 지금까지 써본 모델 중 가장 에이전트형 코딩 능력이 뛰어남
Rust와 Elixir 코드를 Pi harness로 작성하게 했는데, 테스트를 스스로 만들고 통과 여부를 검증함. 테스트나 컴파일 오류 루프를 잘 처리하면서 목표를 향해 나아감
- GH200에서 3.5:122b를 돌려봤는데, Rust/React/TS 작업에서 Sonnet보다는 약간 부족하지만, 작은 범위의 작업은 충분히 잘 처리함
  다만 중간에 “이게 더 간단하겠다”며 지시사항을 무시하고 지원 코드를 통째로 삭제하는 경향이 있음
- 나도 Rust로 테스트했는데, 가끔 무한 루프에 빠졌다가 스스로 풀림
  deadpool과 deadpool-r2d2를 계획 단계에서 선택해 스스로 혼란스러워함. 그래도 전반적으로 코드는 괜찮고, 데이터베이스 계층만 조금 손봐야 할 듯함
  지금까지 셀프호스팅 가능한 모델 중 가장 안정적임
- 밀집형 27B 모델을 써보니 루프와 불필요한 반복이 훨씬 적었음
- 혹시 llama.cpp로 로컬 실행 중인지 궁금함. 기본 chat template으로는 도구 호출이 실패했는데, 이 템플릿을 쓰면 훨씬 잘 작동함
- 어떤 하드웨어에서 돌리고 있는지 궁금함. 일상적인 코딩에서 frontier 모델을 대체할 수 있다고 느끼는지 묻고 싶음
Qwen 연구팀과 Alibaba 제품팀 간에 긴장이 있었다고 함. Alibaba가 최근 DAU를 KPI로 강제하려 했다고 들음
기업 입장에서는 전략 변경이 이해되지만, 왜 핵심 연구진을 내보냈는지는 의문임. 지금은 모델 연구자가 부족한 시기 아닌가 싶음
- 아마도 향후 Qwen 모델을 폐쇄형 상용 모델로 전환하려 했고, 연구진이 그걸 받아들이지 못했을 가능성이 있음
미국 연구소들이 왜 이런 인재들에게 막대한 자금을 투자하지 않는지 궁금함
- 내 지역(오하이오)에서는 ICE가 중국인들을 단속하고 있음. 합법적 체류자도 추방 위험을 느끼고 있음
  이런 분위기에서는 미국 연구소가 아무리 돈을 써도 인재 유치가 어려움
- 미국은 합법 이민자조차 억류 위험에 노출되도록 만들었음
- 유럽이 미국의 정치적 혼란에 대비해 경쟁 모델을 키워야 함
- 이미 미국 자본에 끌린 사람들은 떠났고, 중국도 충분히 자금을 투자 중임
  게다가 중국 기업에서는 의사결정 영향력을 더 크게 가질 수 있음
- 문제는 단순히 NSF 예산 삭감이 아님. 보건 문제, 전쟁 리스크, 외국인 연구자에 대한 불확실성 등으로 미국의 매력이 줄었음
  트럼프 행정부 시절부터 이미 외국인 유학생 유입이 줄었고, 지금은 미국에서 박사 과정을 밟는 게 오히려 평판 리스크로 여겨질 정도임
로컬 모델을 사용할 때 사람들은 시행착오를 더 관대하게 받아들이는 경향이 있음
클라우드 모델이 토큰을 낭비하면 비용이 아깝지만, 로컬 모델이 루프를 돌면 “생각 중이구나”라고 느껴짐
Qwen 같은 모델이 로컬 코딩에 충분히 쓸만해지면, 변화는 기술적이라기보다 경제적일 가능성이 큼
- 로컬 모델의 토큰 낭비는 오히려 환영임. 내 방의 GPU 메인프레임이 난방기 역할을 하니까 (스위스의 불안정한 난방 사정 덕분임)
32B 모델을 로컬에서 며칠 돌려봤는데, 에이전트형 코딩을 꽤 잘 처리함
크기에 비해 성능이 뛰어나지만, 긴 지시문에서는 절반쯤 무시하는 경향이 있음. 이 정도 크기에서는 감수할 만한 트레이드오프임
수학자로서 Qwen을 이용해 논문 간의 관계나 요약을 자동화해봤음
심지어 오인용 검증까지 수행해 arXiv 논문에 활용됨
결과물은 이 페이지에 정리해둠
연구진이 다른 곳에서 다시 오픈웨이트 모델 경쟁을 이어가길 바람
사실 이런 연구를 정부가 지원해야 한다고 생각했지만, 지금은 중국 기업이 그 역할을 대신하고 있음
Qwen3.5는 정말 뛰어남. 35B 버전을 Ada NextGen 24GB에서 easy-llm-cli로 돌려봤는데, Gemini 3 Pro와 거의 비슷한 수준이었음
속도도 꽤 빠름
- q4 quant 설정으로 175 tg와 7K pp를 얻을 수 있었고, 대부분의 클라우드 제공자보다 효율적이었음
요즘은 “AI가 사람을 대체한다”에서 “AI는 특정 인물 없이는 죽는다”로 분위기가 바뀐 듯함. 정말 극적인 전환임
- Anthropic의 가동률이 99.9999999% 가 아니라 단 90% 수준임. 상태 페이지를 보면 알 수 있음
  AI가 사람을 완전히 대체할 수 있다면, CEO들이 이렇게 설득에 애쓸 필요가 없을 것임
- “AI는 특정 인물 없이는 죽는다”는 말은 과장임. 사람들은 단지 Qwen 모델군의 향방을 궁금해하는 것뿐임
- AGI 목표에서 광고 중심의 단기 전략으로 전환된 게 지금 상황을 잘 보여줌
- Claude는 스스로 네이티브 앱을 만들지 못함, 웹 앱조차 불안정해서 Anthropic이 Bun을 인수한 이유가 됨
그냥 잊자, 여긴 차이나타운임