9P by GN⁺ 3시간전 | ★ favorite | 댓글과 토론
  • 중국 주요 AI 연구소들을 직접 방문하고 연구자들과 대화한 경험을 바탕으로, 중미 AI 생태계의 문화적 차이와 그것이 모델 개발에 미치는 영향을 분석한 현장 보고
  • 중국 연구자들은 개인의 명성보다 최종 모델의 품질 최적화에 집중하는 문화적 성향을 보이며, 핵심 기여자 중 상당수가 현역 학생
  • 중국 AI 기업들은 외부 서비스를 구매하기보다 자체 기술 스택을 통제하려는 강한 소유 의식을 갖고 있으며, 오픈소스 공개도 실용적 판단에 기반
  • 대부분의 중국 AI 개발자들이 Claude를 사용하고 있으며, 엔터프라이즈 AI 수요가 SaaS가 아닌 클라우드 시장 궤적을 따를 가능성
  • 미국과 중국의 AI 생태계는 구조적으로 다른 방식으로 작동하며, 서구 프레임워크로 중국 AI 산업을 단순 매핑하면 범주 오류가 발생할 수 있음

중국 연구자들의 사고방식

  • 중국의 LLM 개발 기업들은 교육과 업무에서의 오랜 문화적 전통과 기술 기업 운영의 미묘한 차이를 결합하여 빠른 추격자(fast-follower) 로서 최적의 구조를 갖춤
  • 최신 LLM 구축은 데이터, 아키텍처 세부사항, RL 알고리듬 구현 등 전체 스택에 걸친 세밀한 작업이 핵심이며, 개별 기여자의 성과가 전체 모델의 다목적 최적화를 위해 양보되어야 하는 복잡한 과정
  • 미국 연구자들은 자신의 작업을 적극적으로 홍보하는 문화가 강하고, "선도적 AI 과학자"로서의 명성 추구가 조직 내 갈등을 유발
    • Llama 조직이 이런 정치적 이해관계의 무게로 붕괴되었다는 소문이 널리 퍼져 있음
    • 일부 연구소에서는 최종 모델에 자신의 아이디어가 반영되지 않은 것에 대해 불만을 제기하는 최고 연구자에게 보상을 지급해야 했다는 이야기도 존재
  • 중국 연구소들의 핵심 기여자 중 상당수가 현역 학생이며, 연구소 자체가 매우 젊은 조직
    • 이는 Ai2의 구조와 유사하게 학생들이 동료로 대우받고 LLM 팀에 직접 통합되는 방식
    • 반면 미국의 OpenAI, Anthropic, Cursor 등은 인턴십을 제공하지 않으며, Google의 Gemini 관련 인턴십도 실질적 작업과 분리될 우려 존재
  • 이러한 문화적 차이가 모델 구축 능력을 향상시키는 구체적 요인:
    • 최종 모델 향상을 위해 비주목 작업에 대한 높은 수용성
    • AI 신규 인력이 이전 하이프 사이클에 얽매이지 않아 현대 기술에 더 빠르게 적응
    • 에고가 적어 조직 구조가 약간 더 확장 가능하고, 시스템 게임화가 적음
    • 다른 곳에서 개념 증명된 문제를 해결하는 데 적합한 풍부한 인재 풀
  • 이러한 장점은 중국 연구자들이 창의적이고 분야를 개척하는 0-to-1 스타일의 학술 연구를 덜 생산한다는 알려진 고정관념과 대비
    • 학술적 연구소의 리더들은 더 야심적인 연구 문화를 배양하려 노력 중
    • 일부 기술 리더들은 교육 및 인센티브 시스템의 재설계가 현재 경제적 균형 내에서 이루어지기엔 너무 큰 과제라며 회의적

학생 연구자들의 특성

  • 중국에서도 미국과 유사한 두뇌 유출 현상이 발생하고 있으며, 이전에 학계를 고려하던 많은 이들이 산업계에 남으려는 추세
    • 한 연구자는 교수직에 관심이 있었지만 "교육은 LLM으로 해결됨 — 학생이 왜 나한테 질문하겠냐"라고 언급
  • 학생들은 LLM에 선입견 없이 접근하는 이점을 보유
    • 최근 몇 년간 LLM의 핵심 패러다임이 MoE 스케일링 → RL 스케일링 → 에이전트 활용으로 전환
    • 이 모든 것을 잘 수행하려면 광범위한 문헌과 기술 스택의 맥락을 빠르게 흡수해야 하며, 학생들은 이 작업에 익숙하고 열정적
  • 중국 학생 연구자들은 철학적 담론에 덜 관여하며 매우 직접적
    • 모델의 경제학이나 장기적 사회적 위험에 대한 정교한 의견을 가진 중국 연구자는 미국 대비 훨씬 적음
    • 한 연구자는 Dan Wang의 유명한 전제인 "중국은 엔지니어가 운영하고, 미국은 변호사가 운영한다"를 인용
    • 중국에는 Dwarkesh나 Lex 같은 메가 주류 팟캐스트를 통해 과학자의 스타 파워를 체계적으로 키우는 트랙이 존재하지 않음
  • AI가 초래할 경제적 불확실성, AGI 이상의 질문, 모델 행동에 대한 도덕적 토론 등에 대한 질문에서 중국 과학자들은 토론과 사회 구조에 대한 의견이 장려되지 않는 시스템에서 성장한 특성을 반영

베이징과 중국 AI 생태계의 현장 분위기

  • 베이징은 Bay Area와 매우 유사하게 느껴지며, 경쟁 연구소가 도보나 짧은 이동 거리 내에 위치
    • 36시간 동안 Z.ai, Moonshot AI, 칭화대학교, Meituan, Xiaomi, 01.ai를 방문
    • Didi로 이동이 편리하며, 중국의 XL 차량에는 마사지 의자가 있는 전기 미니밴이 배정되는 경우가 많음
  • 연구자들의 인재 쟁탈전은 미국과 매우 유사하며, 연구자들이 이직하는 것이 일반적이고 선택 기준은 현재 분위기가 가장 좋은 곳
  • 중국의 LLM 커뮤니티는 경쟁하는 부족이 아닌 생태계에 가까운 느낌
    • 모든 중국 연구소가 인기 있는 Doubao 모델을 보유한 ByteDance를 경계
    • ByteDance는 중국 유일의 프론티어 비공개 연구소
    • 모든 연구소가 DeepSeek을 실행에서 최고의 연구 감각을 가진 기술 리더로 존중
    • 미국에서 비공식적으로 연구소 멤버들을 만나면 금방 불꽃이 튀는 것과 대조적
  • 중국 연구자들의 겸손함 중 가장 인상적인 점은 비즈니스 측면에 대해 "자신의 문제가 아니다"라며 무관심한 태도
    • 미국에서는 데이터 판매자, 컴퓨트, 자금 조달 등 생태계 수준의 산업 트렌드에 모두가 집착

중국 AI 산업의 차이점과 유사점

  • 오늘날 AI 모델 구축은 뛰어난 연구자들의 엔지니어링 결과물에 그치지 않고, 구축, 배포, 자금 조달, 채택이 결합된 복합적 활동으로 변화
  • 서구 생태계와의 주요 차이점 6가지:
  • 1. 국내 AI 수요의 초기 징후

    • 중국 기업들이 소프트웨어에 비용을 지불하지 않아 거대한 추론 시장이 형성되지 않을 것이라는 가설이 존재
    • 이는 역사적으로 중국에서 매우 작은 SaaS 생태계에만 해당하는 사실이며, 중국에는 여전히 대규모 클라우드 시장이 존재
    • 핵심 미해결 질문: 엔터프라이즈 AI 지출이 SaaS 시장(작음)을 따를지 클라우드 시장(근본적)을 따를지
    • 전반적으로 AI는 클라우드에 더 가까운 궤적을 보이며, 새로운 도구 주변에 시장이 성장하는 것에 대해 적극적으로 우려하는 사람은 없었음
  • 2. 대부분의 개발자가 Claude를 사용

    • 중국의 AI 개발자 대부분이 Claude에 열광하고 있으며, Claude가 소프트웨어 구축 방식을 어떻게 변화시켰는지에 집중
    • Claude가 명목상 중국에서 금지되어 있음에도 불구하고 사용 중
    • 일부 연구자는 Kimi나 GLM CLI 같은 자체 도구 사용을 언급하지만, 모두가 Claude 사용을 언급
    • Bay Area에서 인기가 급상승 중인 Codex에 대한 언급은 놀라울 정도로 적었음
    • 중국이 역사적으로 소프트웨어 구매에 소극적이었다 해도, 추론 수요의 대규모 급증이 없을 것이라는 인상은 주지 않음
  • 3. 기술 소유 의식

    • 중국 문화가 활발한 경제 엔진과 결합하여 예측 불가능한 결과를 생산
    • 수많은 AI 모델은 마스터 플랜이 아닌 많은 기술 기업들의 실용적이고 현재적인 균형을 반영
    • 산업은 ByteDance와 Alibaba가 상당한 자원으로 대부분의 시장에서 승리할 것으로 예상되는 인컴번트로서 존중받는 구도
    • DeepSeek은 존경받는 기술 리더이지만 시장 리더와는 거리가 있으며, 방향을 설정하지만 경제적으로 승리할 구조는 아님
    • Meituan(배달 서비스)이나 Ant Group 같은 회사가 모델을 구축하는 것이 서양에서는 놀라울 수 있지만, LLM이 미래 기술 제품의 핵심이므로 강력한 기반이 필요하다는 판단
    • 범용 모델을 파인튜닝하면 오픈 커뮤니티의 피드백으로 스택을 강화하고, 자사 제품용 내부 파인튜닝 버전 유지 가능
    • "오픈 우선" 사고방식은 실용성에 기반: 모델에 대한 강력한 피드백 확보, 오픈소스 커뮤니티에 기여, 미션 강화
  • 4. 정부 지원은 실재하지만 규모는 불명확

    • 중국 정부가 오픈 LLM 경쟁을 적극 지원한다는 주장이 자주 제기됨
    • 여러 수준으로 분권화된 정부이며 각 수준에서 정확히 무엇을 하는지에 대한 명확한 플레이북이 없음
    • 베이징의 지역구(neighborhood)들이 기술 기업의 사무실 유치를 위해 경쟁
    • 제공되는 "도움"은 거의 확실히 허가 같은 관료적 절차 간소화를 포함하지만, 인재 유치나 칩 밀수까지 가능한지는 불명확
    • 방문 중 정부 관심이나 도움에 대한 언급이 여러 차례 있었지만, 세부 사항을 단정적으로 보고하기엔 너무 부족
    • 중국 정부 최상위 수준이 모델의 기술적 결정에 영향을 미친다는 힌트는 전혀 없었음
  • 5. 데이터 산업이 훨씬 덜 발달

    • Anthropic이나 OpenAI가 단일 환경에 1,000만 달러 이상, 연간 수억 달러 규모를 RL 프론티어 확장에 지출한다는 정보를 들어왔기에, 중국 연구소도 미국 회사에서 같은 환경을 구매하거나 국내 생태계의 지원을 받는지 확인하려 함
    • 데이터 산업이 완전히 없다기보다는 상대적으로 품질이 낮아 환경이나 데이터를 자체 구축하는 것이 더 나은 경우가 많음
    • 연구자들이 직접 RL 훈련 환경 구축에 상당한 시간을 투자
    • ByteDance와 Alibaba 같은 대기업은 이를 지원하기 위한 사내 데이터 라벨링 팀 보유
    • 이 모든 것이 이전 항목의 구매보다 구축 사고방식을 반영
  • 6. Nvidia 칩에 대한 절실한 수요

    • Nvidia 컴퓨트가 훈련의 골드 스탠다드이며 모든 연구소가 이의 부족으로 발전이 제한됨
    • 공급이 있다면 구매할 것이 분명
    • Huawei를 포함한 다른 가속기는 추론용으로 긍정적 평가를 받으며, 수많은 연구소가 Huawei 칩에 접근 가능
  • 이 포인트들은 서구 연구소의 운영 방식을 중국에 빠르게 매핑하면 범주 오류가 발생하는, 매우 다른 AI 생태계의 그림을 보여줌
  • 핵심 질문은 이러한 서로 다른 생태계가 의미 있게 다른 유형의 모델을 생산할지, 아니면 중국 모델이 항상 미국 프론티어 모델의 3~9개월 전 버전으로 설명될지 여부

글로벌 균형

  • 중국은 규칙이나 레시피로 표현될 수 있는 곳이 아니며, 매우 다른 역학과 화학을 가진 곳
    • 문화가 매우 오래되고 깊으며, 국내 기술 구축 방식과 완전히 얽혀 있음
  • 미국의 현재 권력 구조는 중국에 대한 세계관을 의사결정의 핵심 장치로 사용하지만, 중국에는 서구 의사결정으로 모델링하기 매우 어려운 자질과 본능이 존재
  • 왜 이 연구소들이 최고 모델을 오픈으로 공개하는지 직접 물어봐도, 소유 의식과 진정한 생태계 지원의 교차점은 연결하기 어려움
  • 거의 모든 주요 중국 기술 회사가 자체 범용 LLM을 구축 중
    • Meituan(배달 서비스), Xiaomi(광범위 소비자 기술 회사) 등이 오픈 웨이트 모델 공개
    • 미국의 동등한 회사들은 그냥 서비스를 구매할 것
    • 이 회사들이 LLM을 구축하는 이유는 핫한 트렌드를 따르기 위해서가 아니라, 자체 스택을 통제하고 시대의 가장 중요한 기술을 개발하려는 깊은 근본적 열망
  • 중국 연구자들의 인간미, 매력, 진정한 따뜻함은 매우 인간적인 경험
    • 미국에서 익숙한 냉혹한 지정학적 대화가 그들에게는 전혀 스며들지 않았음
  • 오픈 생태계가 전 세계적으로 번영하면 더 안전하고 접근 가능하며 유용한 AI를 만들 수 있으며, 현재 질문은 미국 연구소가 그 리더십 포지션을 차지하기 위한 조치를 취할지 여부
  • 오픈 모델에 영향을 미치는 행정명령에 대한 소문이 더 돌고 있으며, 이는 미국의 리더십과 글로벌 생태계 간의 시너지를 더 복잡하게 만들 수 있음