3P by GN⁺ 6시간전 | ★ favorite | 댓글 1개
  • Nvidia CEO 젠슨 황이 All-In 팟캐스트에 출연해 Groq 인수, 추론 폭발, 물리적 AI, 에이전트 컴퓨팅, AI 산업의 PR 위기 등 광범위한 주제를 다룬 인터뷰
  • Nvidia는 GPU 회사에서 AI 팩토리 회사로 진화했으며, 에이전트 처리를 위한 이기종 컴퓨팅 아키텍처에 Groq LPU, BlueField, CPU, 네트워킹 프로세서를 추가
  • Open Claw를 현대 AI 컴퓨팅의 운영체제 청사진으로 평가하며, 메모리 시스템·스킬·스케줄링·IO 서브시스템을 갖춘 최초의 개인용 AI 컴퓨터로 정의
  • 물리적 AI는 50조 달러 규모의 시장을 기술 산업이 처음으로 다루는 영역이며, 현재 연간 약 100억 달러에 근접한 사업으로 기하급수적 성장 중
  • AI 산업의 PR 위기에 대해 기술 리더들의 극단적·종말론적 발언이 정책 입안자와 대중에게 미치는 부정적 영향을 경고하며, 보다 절제되고 균형 잡힌 소통 필요

Groq 인수와 추론 폭발

  • 2년 반 전 소개한 AI 팩토리 운영체제 Dynamo의 핵심 기술은 비분리 추론(disaggregated inference) 으로, 추론 처리 파이프라인을 분할하여 서로 다른 GPU에서 실행하는 방식
  • 이 비분리 컴퓨팅 개념이 Mellanox 인수로 이어졌고, 현재 Nvidia 컴퓨팅은 GPU, CPU, 스위치, 스케일업/스케일아웃 스위치, 네트워킹 프로세서 전반에 분산
    • 여기에 Groq를 추가하여 적합한 워크로드를 적합한 칩에 배치하는 구조
  • 에이전트 처리 시대로 전환하면서 작업 메모리, 장기 메모리, 도구 사용, 스토리지 요구가 급증
    • 대형 모델, 소형 모델, 디퓨전 모델, 자기회귀 모델 등 데이터센터 내 다양한 모델 유형 공존
  • Vera Rubin은 이 극도로 다양한 워크로드를 실행할 수 있도록 설계된 시스템
    • 기존 1랙 구성에서 4개 랙 추가, Nvidia의 TAM이 약 33~50% 증가
    • 추가분은 스토리지 프로세서(BlueField), Groq 프로세서, CPU, 네트워킹 프로세서로 구성
  • 데이터센터 가격과 토큰 비용을 동일시하면 안 됨
    • 500억 달러 팩토리가 최저 비용 토큰을 생산할 수 있으며, 이유는 10배의 처리량 효율
    • 200억 달러는 토지·전력·셸 비용이고, 스토리지·네트워킹·CPU·서버·쿨링은 어차피 필요
    • GPU 가격이 1x냐 0.5x냐의 차이는 500억 대 400억 정도이며, 10배 처리량 대비 큰 비율이 아님
  • 작년에 추론이 1,000배 증가할 것이라 했는데, 이제 100만 배, 10억 배 수준으로 갈 것
    • 당시 세계는 사전 스케일링·훈련에 집중하고 있었으나, 현재 추론이 폭발적으로 증가하여 추론 제약(inference constrained) 상태

세계 최고 가치 기업의 의사결정

  • CEO의 역할은 비전과 전략을 정의하는 것이며, 뛰어난 컴퓨터 과학자와 기술자들의 정보를 기반으로 미래를 형성
  • 핵심 기준: 미친 듯이 어려운 일인가, 이전에 한 번도 된 적 없는 일인가, Nvidia의 특별한 슈퍼파워에 부합하는가
    • 쉬운 일이면 경쟁자가 많으므로 피해야 함
    • 극도로 어려운 일에는 고통이 수반되므로 그 과정을 즐길 수 있어야

물리적 AI의 50조 달러 시장과 Open Claw

  • 물리적 AI는 기술 산업이 처음으로 50조 달러 규모 산업을 다루는 기회
    • 10년 전 시작, 현재 연간 약 100억 달러에 근접한 기하급수적 성장 사업
  • 3가지 컴퓨팅 시스템 구분
    • 첫 번째: AI 모델 훈련·개발용 컴퓨터
    • 두 번째: 평가용 컴퓨터 — 물리 법칙을 따르는 가상 환경에서 로봇·자동차 평가 (Omniverse)
    • 세 번째: 엣지 로보틱스 컴퓨터 — 자율주행차, 로봇, 테디베어 등
  • 통신 기지국을 AI 인프라의 일부로 전환하는 작업 진행 중
    • 2조 달러 규모의 통신 산업이 AI 인프라의 확장이 될 것
  • 디지털 생물학은 ChatGPT 모멘트에 근접
    • 유전자, 단백질, 세포의 표현과 동역학 이해가 2~5년 내 가능
    • 5년 내 디지털 생물학이 헬스케어 산업에서 변곡점에 도달할 것
  • Open Claw는 지난 2년간의 3가지 변곡점 중 세 번째
    • 첫 번째: ChatGPT — 생성형 AI를 대중 인식으로 끌어올림
    • 두 번째: o1/o3 — 추론(reasoning), 근거 기반 정보로 경제 모델 변곡
    • 세 번째: Claude Code — 최초의 유용한 에이전트 시스템이지만 기업용에 한정, Open Claw가 대중 의식에 AI 에이전트 개념을 각인
  • Open Claw의 컴퓨팅 모델 구조
    • 메모리 시스템: 스크래치패드(단기 메모리), 파일 시스템
    • 스킬: API를 통해 여러 유형의 애플리케이션 실행
    • 리소스 관리·스케줄링: 크론잡, 에이전트 스폰, 태스크 분해
    • IO 서브시스템: 입출력, WhatsApp 연결 등
    • 이 4가지 요소가 근본적으로 컴퓨터를 정의 → 최초의 오픈소스 개인용 AI 컴퓨터
  • 에이전트 소프트웨어의 거버넌스·보안 기여
    • 민감한 정보 접근, 코드 실행, 외부 통신 중 동시에 세 가지를 모두 허용하지 않는 정책
    • Peter Steinberger와 Nvidia 엔지니어들이 보안 강화에 기여

AI의 PR 위기와 Anthropic 커뮤니케이션 문제

  • AI는 생물학적 존재도, 외계인도, 의식이 있는 것도 아닌 컴퓨터 소프트웨어
  • "우리가 전혀 이해하지 못한다"는 말은 사실이 아니며, 이 기술에 대해 많은 것을 이해하고 있음
  • 정책 입안자들에게 지속적으로 정보를 제공하고, 종말론과 극단주의가 정책 결정에 영향을 미치지 않도록 해야 함
    • 동시에 기술이 매우 빠르게 움직이므로 정책이 기술보다 너무 앞서가면 안 됨
  • 미국의 최대 국가안보 우려: 다른 국가들이 AI를 채택하는 동안 미국이 AI에 분노하거나 두려워하거나 편집증적이 되어 채택하지 못하는 것
  • Anthropic에 대해: 기술이 훌륭하고, 보안·안전에 대한 집중을 존경
    • 그러나 기술의 위험을 경고하는 것은 좋지만, 겁을 주는 것은 덜 좋음
    • 증거 없이 극단적이고 재앙적인 발언을 하면 사람들이 생각하는 것 이상으로 해로울 수 있음
    • 기술 리더로서 말의 무게를 인식하고 더 절제되고, 온건하고, 균형 잡히고, 사려 깊어야
  • 미국 내 AI 인기도가 17% 이며, 핵 산업처럼 셧다운되는 전철을 밟을 위험
    • 중국에 100개의 핵분열 원자로가 건설 중인 반면 미국은 0개
    • 데이터센터 모라토리엄 이야기도 나오는 상황

매출 역량, 직원 토큰 배분, 에이전트의 미래

  • AI 모델 사용 순위: 1위 OpenAI, 2위 오픈소스(매우 큰 격차), 3위 Anthropic
  • 컴퓨팅 수요 증가
    • 생성형 → 추론: 약 100배
    • 추론 → 에이전트: 약 100배
    • 2년 만에 컴퓨팅이 10,000배 증가
  • 사람들은 정보에 돈을 지불하지만 일(work)에 더 많은 돈을 지불
    • 에이전트 시스템은 일을 처리해줌 → 소비가 현재 약 100배 증가, 아직 스케일링도 시작하지 않은 상태
  • Nvidia의 43,000명 직원 중 약 38,000명이 엔지니어
    • 50만 달러 연봉 엔지니어가 연간 5,000달러만 토큰에 쓰면 큰 문제
    • 최소 25만 달러 이상 토큰에 소비해야 한다는 기대
    • 칩 설계자가 "종이와 연필만 쓰겠다, CAD 도구 필요 없다"고 하는 것과 같은 상황
  • Auto Research 사례
    • 데스크톱에서 30분 만에 수행한 연구가 일반적으로 7년 걸리는 PhD 논문 수준
    • GitHub에서 다운로드하여 로컬에서 실행, 과학 저널 수준의 결과
    • 600줄의 코드로 주말에 공개된 도구
  • 미래의 업무 방식: 코드를 직접 작성하는 대신 아이디어, 아키텍처, 사양을 작성하고 팀을 조직하며 평가 기준을 정의
    • 모든 엔지니어가 100개의 에이전트를 보유할 것

엔터프라이즈 소프트웨어의 미래

  • 엔터프라이즈 IT 소프트웨어 산업이 파괴될 것이라는 시각에 대한 반론
    • 엔터프라이즈 소프트웨어는 인원과 좌석(butts and seats) 에 의해 제한되어 왔음
    • 100배 더 많은 에이전트가 SQL, 벡터 데이터베이스, Blender, Photoshop 등 기존 도구를 사용하게 됨
    • 기존 도구들은 작업을 잘 수행하고, 최종 작업 결과를 사용자가 제어 가능한 형태로 표현하는 통로 역할

오픈소스, 글로벌 확산, 이란/대만 공급망

  • 모델은 기술이지 제품이 아니며, 기술이지 서비스가 아님
    • 독점 모델과 오픈소스 모델 둘 다 근본적으로 필요 (A or B가 아닌 A and B)
    • 일반 소비자는 ChatGPT, Claude, Gemini 등 수평 레이어의 범용 지능을 선호
    • 산업별 도메인 전문성·특화는 오픈 모델에서만 가능
  • 오픈소스 모델은 프론티어에 근접해 있으며, 프론티어에 도달하더라도 서비스형 모델은 계속 번성할 것
  • 글로벌 확산 현황
    • 바이든 시대의 확산 규칙은 반미국적 AI 확산 정책이었음
    • Trump 대통령은 미국 기술 산업의 세계 선도와 기술 확산을 원함
    • Nvidia는 세계 2위 시장(중국)에서 95% 시장 점유율을 포기하고 현재 0%
    • Secretary Lutnik으로부터 승인된 라이선스를 확보, 중국 기업들로부터 구매 주문을 받고 공급망 가동 재개 중
  • 국가안보 관점
    • 소형 모터, 희토류 광물, 통신 네트워크, 지속 가능 에너지를 통제하지 못하면 국가안보 약화
    • AI 산업이 태양광, 희토류, 자석, 모터, 통신처럼 되면 안 됨
    • 미국 기술 스택(칩~컴퓨팅 시스템~플랫폼)이 세계의 90% 를 차지하는 것이 바람직
  • 대만: 미국 재산업화를 최대한 빠르게 추진해야 하며, 대만 공급망의 전략적 파트너십과 우정을 확보하여 Arizona, Texas, California에서 빠른 속도로 제조
    • 한국, 일본, 유럽으로 공급망 다변화 필요
    • 다변화·회복력 확보 중에는 인내와 자제 필요
  • 헬륨: 문제가 될 수 있으나 공급망에 충분한 버퍼가 있을 가능성

자율주행 플랫폼과 경쟁

  • "움직이는 모든 것이 언젠가 완전히 또는 부분적으로 자율화될 것"
  • Nvidia는 자율주행차를 직접 만들지 않고 모든 자동차 회사가 만들 수 있도록 지원
    • 훈련 컴퓨터, 시뮬레이션/평가 컴퓨터, 차량 컴퓨터 3가지를 모두 구축
    • 세계 최초의 추론 기반 자율주행차 — 복잡한 시나리오를 단순한 시나리오로 분해하여 탐색하는 Alpommyo 시스템
  • Tesla는 훈련 컴퓨터만 구매, 다른 회사들은 전체 스택 사용 등 유연한 협력 모델
  • Google TPU, Amazon Inferentia/Tranium 등 고객이 경쟁자가 되는 상황
    • Nvidia의 자신감: 최고의 기술로 경쟁하며 빠르게 달리는 한, Nvidia에서 구매하는 것이 가장 경제적
    • 모든 클라우드에 존재하는 유일한 아키텍처 — 클라우드에서 온프레미스, 차량, 어느 지역, 우주까지
    • 사업의 약 40% 는 전체 AI 팩토리를 구축할 수 있는 풀스택이 없으면 고객이 활용 불가
  • 시장 점유율 확대 이유
    • Anthropic이 Nvidia로 이동, Meta도 Nvidia로 이동, 오픈 모델 성장 — 모두 Nvidia 기반
    • 클라우드 외부의 기업·산업·엣지 성장
    • AWS가 향후 몇 년간 100만 개 칩 구매 발표
  • 애널리스트들의 성장 둔화 예측(내년 30%, 그 다음 20%, 2029년 7%)에 대해
    • AI의 규모와 범위를 이해하지 못하는 것
    • 대부분 AI가 상위 5개 하이퍼스케일러에만 있다고 생각하지만 실제로는 훨씬 광범위

우주 데이터센터, AI 헬스케어, 로보틱스

  • 우주 데이터센터
    • 이미 우주에 진출 — 방사선 경화 처리된 CUDA가 전 세계 위성에서 이미징·AI 이미지 처리 수행
    • 우주에서 모든 데이터를 지구로 보내는 대신 우주에서 직접 이미징 처리가 합리적
    • 우주에는 에너지가 풍부하나, 전도·대류를 이용한 냉각 불가 → 복사만 가능, 매우 큰 표면적 필요
    • 우주 데이터센터 아키텍처 탐구에 수년 소요 예상
  • AI 헬스케어 3가지 영역
    • AI 생물학: AI로 생물학적 행동을 표현·예측 → 신약 발견
    • AI 에이전트: 진단 보조 등 — Open Evidence, Hypocratic 등의 사례
    • 물리적 AI: 물리 법칙을 이해하는 AI → 로봇 수술 등
    • 미래에는 초음파, CT 등 병원의 모든 장비가 에이전트화 — 안전한 버전의 Open Claw가 모든 장비에 내장
  • 로보틱스
    • 미국이 이 산업을 대부분 발명했으나 핵심 기술(뇌=AI)이 등장하기 약 5년 전에 지쳐버림
    • 고기능 존재 증명(existence proof)에서 합리적인 제품까지 기술은 2~3사이클(3~5년) 이상 걸리지 않음
    • 중국은 마이크로 전자, 모터, 희토류, 자석 분야에서 세계 최고 → 세계 로보틱스 산업이 중국 생태계·공급망에 크게 의존
    • 로봇은 개인이 독립적으로 할 수 없는 일을 가능하게 하여 경제적 이동성과 번영의 최대 해제(unlock) 가 될 것
    • 현재 미국은 수백만 명의 노동력 부족 상태로 로보틱스가 절실히 필요
    • 로봇을 통한 가상 현존(virtual presence), 빛의 속도로 이동, 달·화성 식민지화의 핵심 수단

OpenAI/Anthropic 매출 잠재력과 AI 모트

  • Dario Amodei는 2027~28년까지 수천억 달러, 2030년까지 1조 달러의 비인프라 AI 매출 예측
    • Jensen은 이것이 매우 보수적이라고 평가, Anthropic이 그보다 훨씬 나은 성과를 낼 것으로 기대
    • 아직 고려되지 않은 부분: 모든 엔터프라이즈 소프트웨어 회사가 Anthropic·OpenAI 토큰의 부가가치 리셀러가 될 것
    • Go-to-market이 로그적으로 확장될 전망
  • AI 시대의 모트(해자)깊은 전문화(deep specialization)
    • 범용 모델이 에이전트 시스템에 연결되고, 많은 모델은 기업이 자체 훈련한 특화 서브 에이전트
    • 기업가를 위한 메시지: 자신의 버티컬을 누구보다 깊이 알고, 도구가 발전하면 자신의 지식을 주입
    • 에이전트를 고객과 빨리 연결할수록 플라이휠이 작동하여 에이전트가 더 나아짐
    • 현재의 수평 플랫폼 → 커스터마이징 모델과 반대로, 플랫폼 기업이 전문가·버티컬 도메인 전문가가 되는 기회

AI 시대 젊은이들을 위한 조언

  • 심층 과학, 심층 수학, 언어 능력을 추천
    • 언어가 AI의 프로그래밍 언어이므로 영문학 전공자가 가장 성공할 수도 있음
  • 어떤 교육을 받든 AI 사용에 깊이 전문가가 되어야 함
    • 과하게 지시하지 않고(overprescribe), AI가 혁신하고 창조할 여지를 남기면서 원하는 결과로 이끄는 것은 예술(artistry)
  • 방사선과 전문의 사례
    • 10년 전 컴퓨터 비전이 방사선과를 완전히 대체할 것이라는 예측 → 컴퓨터 비전은 100% 통합됨
    • 그러나 방사선과 전문의 수는 오히려 증가, 수요 급증
    • 스캔이 빨라져 더 많은 스캔 → 더 많은 환자 처리 → 병원 수익 증가
    • 직업의 작업(task) 은 변하지만 목적(purpose) 은 유지
  • 생산성이 증가하면 더 부유한 국가가 되어 교실에 더 많은 교사를 배치할 수 있으며, 모든 학생에게 개인화된 커리큘럼 제공 가능
  • 일자리 전환은 불가피하나, 자율주행으로 1,000~1,500만 운전 일자리가 변화할 것
    • 쇼퍼는 이동성 어시스턴트로 진화할 가능성 — 차가 스스로 운전하는 동안 승객을 위한 다양한 업무 수행
    • 항공기 오토파일럿이 더 많은 조종사를 만들어냈듯이 유사한 패턴

24:28 부터가 인상적이네요

한번 이런 사고실험을 해보죠.

연봉 50만 달러를 받는 소프트웨어 엔지니어나 AI 연구원이 있다고 가정해 봅시다. 이런 경우는 저희에게 흔합니다.

그 연봉 50만 달러짜리 엔지니어에게 연말에 제가 물어볼 겁니다.
“올해 토큰에 얼마를 썼나요?”
그런데 그 사람이 “5천 달러 썼습니다”라고 답한다면, 저는 정말 기가 막힐 겁니다.

그 연봉 50만 달러짜리 엔지니어가 최소 25만 달러어치 토큰도 쓰지 않았다면, 저는 굉장히 심각하게 받아들일 겁니다.

이건 우리 칩 디자이너 중 한 명이
“전 그냥 종이와 연필만 쓸게요. CAD 툴은 필요 없을 것 같습니다”
라고 말하는 것과 다를 바 없습니다.

이제는 최고의 인재를 바라보는 관점 자체가 완전히 바뀌고 있다는 뜻입니다.

이건 NBA에서 르브론 제임스가 자기 몸을 관리하고 컨디션을 유지하는 데
매년 100만 달러를 쓰기 시작했을 때 우리가 배운 것과도 비슷합니다.

이렇게 뛰어난 지식 노동자들에게 왜 초인적인 능력을 쥐여주지 않겠습니까?

그렇다면 2~3년 뒤를 내다봤을 때,
엔비디아의 최고 인재 한 명은 얼마나 효율적으로 일하게 될까요?
그리고 대체 어디까지 해낼 수 있게 될까요?

우선, “와, 이건 너무 어렵다”라는 생각은 사라질 겁니다.
“이건 시간이 너무 오래 걸린다”라는 생각도 사라질 겁니다.
“사람이 많이 필요하다”라는 생각도 사라질 겁니다.

너무 크다, 너무 무겁다, 너무 오래 걸린다.
이런 생각들은 전부 사라집니다.
결국 남는 건 창의성입니다.
당신이 무엇을 생각해낼 수 있느냐만 남는 거죠.

그러면 이제 질문은 이것입니다.
이 에이전트들과 어떻게 함께 일할 것인가?

그건 결국 컴퓨터 프로그래밍을 하는 새로운 방식입니다.
과거에는 우리가 직접 코드를 썼습니다.
앞으로는 아이디어를 쓰고, 아키텍처를 쓰고, 명세를 쓰게 될 겁니다.

우리는 팀을 조직하고,
좋은 결과와 나쁜 결과를 어떻게 평가할지 정의하고,
무엇이 훌륭한 결과인지 정하고,
어떻게 함께 반복 개선할지,
어떻게 브레인스토밍할지를 정하게 될 겁니다.

정말로 중요한 건 바로 그런 일입니다.

그리고 제 생각에는,
앞으로 모든 엔지니어는 에이전트 백 명을 거느리게 될 겁니다.