젠슨 황: Nvidia의 미래와 물리적 AI, 에이전트의 부상 [유튜브]

(youtube.com)

6P by GN⁺ 3달전 | ★ favorite | 댓글 5개

Nvidia CEO 젠슨 황이 All-In 팟캐스트에 출연해 Groq 인수, 추론 폭발, 물리적 AI, 에이전트 컴퓨팅, AI 산업의 PR 위기 등 광범위한 주제를 다룬 인터뷰
Nvidia는 GPU 회사에서 AI 팩토리 회사로 진화했으며, 에이전트 처리를 위한 이기종 컴퓨팅 아키텍처에 Groq LPU, BlueField, CPU, 네트워킹 프로세서를 추가
Open Claw를 현대 AI 컴퓨팅의 운영체제 청사진으로 평가하며, 메모리 시스템·스킬·스케줄링·IO 서브시스템을 갖춘 최초의 개인용 AI 컴퓨터로 정의
물리적 AI는 50조 달러 규모의 시장을 기술 산업이 처음으로 다루는 영역이며, 현재 연간 약 100억 달러에 근접한 사업으로 기하급수적 성장 중
AI 산업의 PR 위기에 대해 기술 리더들의 극단적·종말론적 발언이 정책 입안자와 대중에게 미치는 부정적 영향을 경고하며, 보다 절제되고 균형 잡힌 소통 필요

Groq 인수와 추론 폭발

2년 반 전 소개한 AI 팩토리 운영체제 Dynamo의 핵심 기술은 비분리 추론(disaggregated inference) 으로, 추론 처리 파이프라인을 분할하여 서로 다른 GPU에서 실행하는 방식
이 비분리 컴퓨팅 개념이 Mellanox 인수로 이어졌고, 현재 Nvidia 컴퓨팅은 GPU, CPU, 스위치, 스케일업/스케일아웃 스위치, 네트워킹 프로세서 전반에 분산
- 여기에 Groq를 추가하여 적합한 워크로드를 적합한 칩에 배치하는 구조
에이전트 처리 시대로 전환하면서 작업 메모리, 장기 메모리, 도구 사용, 스토리지 요구가 급증
- 대형 모델, 소형 모델, 디퓨전 모델, 자기회귀 모델 등 데이터센터 내 다양한 모델 유형 공존
Vera Rubin은 이 극도로 다양한 워크로드를 실행할 수 있도록 설계된 시스템
- 기존 1랙 구성에서 4개 랙 추가, Nvidia의 TAM이 약 33~50% 증가
- 추가분은 스토리지 프로세서(BlueField), Groq 프로세서, CPU, 네트워킹 프로세서로 구성
데이터센터 가격과 토큰 비용을 동일시하면 안 됨
- 500억 달러 팩토리가 최저 비용 토큰을 생산할 수 있으며, 이유는 10배의 처리량 효율
- 200억 달러는 토지·전력·셸 비용이고, 스토리지·네트워킹·CPU·서버·쿨링은 어차피 필요
- GPU 가격이 1x냐 0.5x냐의 차이는 500억 대 400억 정도이며, 10배 처리량 대비 큰 비율이 아님
작년에 추론이 1,000배 증가할 것이라 했는데, 이제 100만 배, 10억 배 수준으로 갈 것
- 당시 세계는 사전 스케일링·훈련에 집중하고 있었으나, 현재 추론이 폭발적으로 증가하여 추론 제약(inference constrained) 상태

세계 최고 가치 기업의 의사결정

CEO의 역할은 비전과 전략을 정의하는 것이며, 뛰어난 컴퓨터 과학자와 기술자들의 정보를 기반으로 미래를 형성
핵심 기준: 미친 듯이 어려운 일인가, 이전에 한 번도 된 적 없는 일인가, Nvidia의 특별한 슈퍼파워에 부합하는가
- 쉬운 일이면 경쟁자가 많으므로 피해야 함
- 극도로 어려운 일에는 고통이 수반되므로 그 과정을 즐길 수 있어야 함

물리적 AI의 50조 달러 시장과 Open Claw

물리적 AI는 기술 산업이 처음으로 50조 달러 규모 산업을 다루는 기회
- 10년 전 시작, 현재 연간 약 100억 달러에 근접한 기하급수적 성장 사업
3가지 컴퓨팅 시스템 구분
- 첫 번째: AI 모델 훈련·개발용 컴퓨터
- 두 번째: 평가용 컴퓨터 — 물리 법칙을 따르는 가상 환경에서 로봇·자동차 평가 (Omniverse)
- 세 번째: 엣지 로보틱스 컴퓨터 — 자율주행차, 로봇, 테디베어 등
통신 기지국을 AI 인프라의 일부로 전환하는 작업 진행 중
- 2조 달러 규모의 통신 산업이 AI 인프라의 확장이 될 것
디지털 생물학은 ChatGPT 모멘트에 근접
- 유전자, 단백질, 세포의 표현과 동역학 이해가 2~5년 내 가능
- 5년 내 디지털 생물학이 헬스케어 산업에서 변곡점에 도달할 것
Open Claw는 지난 2년간의 3가지 변곡점 중 세 번째
- 첫 번째: ChatGPT — 생성형 AI를 대중 인식으로 끌어올림
- 두 번째: o1/o3 — 추론(reasoning), 근거 기반 정보로 경제 모델 변곡
- 세 번째: Claude Code — 최초의 유용한 에이전트 시스템이지만 기업용에 한정, Open Claw가 대중 의식에 AI 에이전트 개념을 각인
Open Claw의 컴퓨팅 모델 구조
- 메모리 시스템: 스크래치패드(단기 메모리), 파일 시스템
- 스킬: API를 통해 여러 유형의 애플리케이션 실행
- 리소스 관리·스케줄링: 크론잡, 에이전트 스폰, 태스크 분해
- IO 서브시스템: 입출력, WhatsApp 연결 등
- 이 4가지 요소가 근본적으로 컴퓨터를 정의 → 최초의 오픈소스 개인용 AI 컴퓨터
에이전트 소프트웨어의 거버넌스·보안 기여
- 민감한 정보 접근, 코드 실행, 외부 통신 중 동시에 세 가지를 모두 허용하지 않는 정책
- Peter Steinberger와 Nvidia 엔지니어들이 보안 강화에 기여

AI의 PR 위기와 Anthropic 커뮤니케이션 문제

AI는 생물학적 존재도, 외계인도, 의식이 있는 것도 아닌 컴퓨터 소프트웨어
"우리가 전혀 이해하지 못한다"는 말은 사실이 아니며, 이 기술에 대해 많은 것을 이해하고 있음
정책 입안자들에게 지속적으로 정보를 제공하고, 종말론과 극단주의가 정책 결정에 영향을 미치지 않도록 해야 함
- 동시에 기술이 매우 빠르게 움직이므로 정책이 기술보다 너무 앞서가면 안 됨
미국의 최대 국가안보 우려: 다른 국가들이 AI를 채택하는 동안 미국이 AI에 분노하거나 두려워하거나 편집증적이 되어 채택하지 못하는 것
Anthropic에 대해: 기술이 훌륭하고, 보안·안전에 대한 집중을 존경
- 그러나 기술의 위험을 경고하는 것은 좋지만, 겁을 주는 것은 덜 좋음
- 증거 없이 극단적이고 재앙적인 발언을 하면 사람들이 생각하는 것 이상으로 해로울 수 있음
- 기술 리더로서 말의 무게를 인식하고 더 절제되고, 온건하고, 균형 잡히고, 사려 깊어야 함
미국 내 AI 인기도가 17% 이며, 핵 산업처럼 셧다운되는 전철을 밟을 위험
- 중국에 100개의 핵분열 원자로가 건설 중인 반면 미국은 0개
- 데이터센터 모라토리엄 이야기도 나오는 상황

매출 역량, 직원 토큰 배분, 에이전트의 미래

AI 모델 사용 순위: 1위 OpenAI, 2위 오픈소스(매우 큰 격차), 3위 Anthropic
컴퓨팅 수요 증가
- 생성형 → 추론: 약 100배
- 추론 → 에이전트: 약 100배
- 2년 만에 컴퓨팅이 10,000배 증가
사람들은 정보에 돈을 지불하지만 일(work)에 더 많은 돈을 지불
- 에이전트 시스템은 일을 처리해줌 → 소비가 현재 약 100배 증가, 아직 스케일링도 시작하지 않은 상태
Nvidia의 43,000명 직원 중 약 38,000명이 엔지니어
- 50만 달러 연봉 엔지니어가 연간 5,000달러만 토큰에 쓰면 큰 문제
- 최소 25만 달러 이상 토큰에 소비해야 한다는 기대
- 칩 설계자가 "종이와 연필만 쓰겠다, CAD 도구 필요 없다"고 하는 것과 같은 상황
Auto Research 사례
- 데스크톱에서 30분 만에 수행한 연구가 일반적으로 7년 걸리는 PhD 논문 수준
- GitHub에서 다운로드하여 로컬에서 실행, 과학 저널 수준의 결과
- 600줄의 코드로 주말에 공개된 도구
미래의 업무 방식: 코드를 직접 작성하는 대신 아이디어, 아키텍처, 사양을 작성하고 팀을 조직하며 평가 기준을 정의
- 모든 엔지니어가 100개의 에이전트를 보유할 것

엔터프라이즈 소프트웨어의 미래

엔터프라이즈 IT 소프트웨어 산업이 파괴될 것이라는 시각에 대한 반론
- 엔터프라이즈 소프트웨어는 인원과 좌석(butts and seats) 에 의해 제한되어 왔음
- 곧 100배 더 많은 에이전트가 SQL, 벡터 데이터베이스, Blender, Photoshop 등 기존 도구를 사용하게 됨
- 기존 도구들은 작업을 잘 수행하고, 최종 작업 결과를 사용자가 제어 가능한 형태로 표현하는 통로 역할

오픈소스, 글로벌 확산, 이란/대만 공급망

모델은 기술이지 제품이 아니며, 기술이지 서비스가 아님
- 독점 모델과 오픈소스 모델 둘 다 근본적으로 필요 (A or B가 아닌 A and B)
- 일반 소비자는 ChatGPT, Claude, Gemini 등 수평 레이어의 범용 지능을 선호
- 산업별 도메인 전문성·특화는 오픈 모델에서만 가능
오픈소스 모델은 프론티어에 근접해 있으며, 프론티어에 도달하더라도 서비스형 모델은 계속 번성할 것
글로벌 확산 현황
- 바이든 시대의 확산 규칙은 반미국적 AI 확산 정책이었음
- Trump 대통령은 미국 기술 산업의 세계 선도와 기술 확산을 원함
- Nvidia는 세계 2위 시장(중국)에서 95% 시장 점유율을 포기하고 현재 0%
- Secretary Lutnik으로부터 승인된 라이선스를 확보, 중국 기업들로부터 구매 주문을 받고 공급망 가동 재개 중
국가안보 관점
- 소형 모터, 희토류 광물, 통신 네트워크, 지속 가능 에너지를 통제하지 못하면 국가안보 약화
- AI 산업이 태양광, 희토류, 자석, 모터, 통신처럼 되면 안 됨
- 미국 기술 스택(칩~컴퓨팅 시스템~플랫폼)이 세계의 90% 를 차지하는 것이 바람직
대만: 미국 재산업화를 최대한 빠르게 추진해야 하며, 대만 공급망의 전략적 파트너십과 우정을 확보하여 Arizona, Texas, California에서 빠른 속도로 제조
- 한국, 일본, 유럽으로 공급망 다변화 필요
- 다변화·회복력 확보 중에는 인내와 자제 필요
헬륨: 문제가 될 수 있으나 공급망에 충분한 버퍼가 있을 가능성

자율주행 플랫폼과 경쟁

"움직이는 모든 것이 언젠가 완전히 또는 부분적으로 자율화될 것"
Nvidia는 자율주행차를 직접 만들지 않고 모든 자동차 회사가 만들 수 있도록 지원
- 훈련 컴퓨터, 시뮬레이션/평가 컴퓨터, 차량 컴퓨터 3가지를 모두 구축
- 세계 최초의 추론 기반 자율주행차 — 복잡한 시나리오를 단순한 시나리오로 분해하여 탐색하는 Alpommyo 시스템
Tesla는 훈련 컴퓨터만 구매, 다른 회사들은 전체 스택 사용 등 유연한 협력 모델
Google TPU, Amazon Inferentia/Tranium 등 고객이 경쟁자가 되는 상황
- Nvidia의 자신감: 최고의 기술로 경쟁하며 빠르게 달리는 한, Nvidia에서 구매하는 것이 가장 경제적
- 모든 클라우드에 존재하는 유일한 아키텍처 — 클라우드에서 온프레미스, 차량, 어느 지역, 우주까지
- 사업의 약 40% 는 전체 AI 팩토리를 구축할 수 있는 풀스택이 없으면 고객이 활용 불가
시장 점유율 확대 이유
- Anthropic이 Nvidia로 이동, Meta도 Nvidia로 이동, 오픈 모델 성장 — 모두 Nvidia 기반
- 클라우드 외부의 기업·산업·엣지 성장
- AWS가 향후 몇 년간 100만 개 칩 구매 발표
애널리스트들의 성장 둔화 예측(내년 30%, 그 다음 20%, 2029년 7%)에 대해
- AI의 규모와 범위를 이해하지 못하는 것
- 대부분 AI가 상위 5개 하이퍼스케일러에만 있다고 생각하지만 실제로는 훨씬 광범위

우주 데이터센터, AI 헬스케어, 로보틱스

우주 데이터센터
- 이미 우주에 진출 — 방사선 경화 처리된 CUDA가 전 세계 위성에서 이미징·AI 이미지 처리 수행
- 우주에서 모든 데이터를 지구로 보내는 대신 우주에서 직접 이미징 처리가 합리적
- 우주에는 에너지가 풍부하나, 전도·대류를 이용한 냉각 불가 → 복사만 가능, 매우 큰 표면적 필요
- 우주 데이터센터 아키텍처 탐구에 수년 소요 예상
AI 헬스케어 3가지 영역
- AI 생물학: AI로 생물학적 행동을 표현·예측 → 신약 발견
- AI 에이전트: 진단 보조 등 — Open Evidence, Hypocratic 등의 사례
- 물리적 AI: 물리 법칙을 이해하는 AI → 로봇 수술 등
- 미래에는 초음파, CT 등 병원의 모든 장비가 에이전트화 — 안전한 버전의 Open Claw가 모든 장비에 내장
로보틱스
- 미국이 이 산업을 대부분 발명했으나 핵심 기술(뇌=AI)이 등장하기 약 5년 전에 지쳐버림
- 고기능 존재 증명(existence proof)에서 합리적인 제품까지 기술은 2~3사이클(3~5년) 이상 걸리지 않음
- 중국은 마이크로 전자, 모터, 희토류, 자석 분야에서 세계 최고 → 세계 로보틱스 산업이 중국 생태계·공급망에 크게 의존
- 로봇은 개인이 독립적으로 할 수 없는 일을 가능하게 하여 경제적 이동성과 번영의 최대 해제(unlock) 가 될 것
- 현재 미국은 수백만 명의 노동력 부족 상태로 로보틱스가 절실히 필요
- 로봇을 통한 가상 현존(virtual presence), 빛의 속도로 이동, 달·화성 식민지화의 핵심 수단

OpenAI/Anthropic 매출 잠재력과 AI 모트

Dario Amodei는 2027~28년까지 수천억 달러, 2030년까지 1조 달러의 비인프라 AI 매출 예측
- Jensen은 이것이 매우 보수적이라고 평가, Anthropic이 그보다 훨씬 나은 성과를 낼 것으로 기대
- 아직 고려되지 않은 부분: 모든 엔터프라이즈 소프트웨어 회사가 Anthropic·OpenAI 토큰의 부가가치 리셀러가 될 것
- Go-to-market이 로그적으로 확장될 전망
AI 시대의 모트(해자) 는 깊은 전문화(deep specialization)
- 범용 모델이 에이전트 시스템에 연결되고, 많은 모델은 기업이 자체 훈련한 특화 서브 에이전트
- 기업가를 위한 메시지: 자신의 버티컬을 누구보다 깊이 알고, 도구가 발전하면 자신의 지식을 주입
- 에이전트를 고객과 빨리 연결할수록 플라이휠이 작동하여 에이전트가 더 나아짐
- 현재의 수평 플랫폼 → 커스터마이징 모델과 반대로, 플랫폼 기업이 전문가·버티컬 도메인 전문가가 되는 기회

AI 시대 젊은이들을 위한 조언

심층 과학, 심층 수학, 언어 능력을 추천
- 언어가 AI의 프로그래밍 언어이므로 영문학 전공자가 가장 성공할 수도 있음
어떤 교육을 받든 AI 사용에 깊이 전문가가 되어야 함
- 과하게 지시하지 않고(overprescribe), AI가 혁신하고 창조할 여지를 남기면서 원하는 결과로 이끄는 것은 예술(artistry)
방사선과 전문의 사례
- 10년 전 컴퓨터 비전이 방사선과를 완전히 대체할 것이라는 예측 → 컴퓨터 비전은 100% 통합됨
- 그러나 방사선과 전문의 수는 오히려 증가, 수요 급증
- 스캔이 빨라져 더 많은 스캔 → 더 많은 환자 처리 → 병원 수익 증가
- 직업의 작업(task) 은 변하지만 목적(purpose) 은 유지
생산성이 증가하면 더 부유한 국가가 되어 교실에 더 많은 교사를 배치할 수 있으며, 모든 학생에게 개인화된 커리큘럼 제공 가능
일자리 전환은 불가피하나, 자율주행으로 1,000~1,500만 운전 일자리가 변화할 것
- 쇼퍼는 이동성 어시스턴트로 진화할 가능성 — 차가 스스로 운전하는 동안 승객을 위한 다양한 업무 수행
- 항공기 오토파일럿이 더 많은 조종사를 만들어냈듯이 유사한 패턴

xguru 3달전 [-]

24:28 부터가 인상적이네요

한번 이런 사고실험을 해보죠.

연봉 50만 달러를 받는 소프트웨어 엔지니어나 AI 연구원이 있다고 가정해 봅시다. 이런 경우는 저희에게 흔합니다.

그 연봉 50만 달러짜리 엔지니어에게 연말에 제가 물어볼 겁니다.
“올해 토큰에 얼마를 썼나요?”
그런데 그 사람이 “5천 달러 썼습니다”라고 답한다면, 저는 정말 기가 막힐 겁니다.

그 연봉 50만 달러짜리 엔지니어가 최소 25만 달러어치 토큰도 쓰지 않았다면, 저는 굉장히 심각하게 받아들일 겁니다.

이건 우리 칩 디자이너 중 한 명이
“전 그냥 종이와 연필만 쓸게요. CAD 툴은 필요 없을 것 같습니다”
라고 말하는 것과 다를 바 없습니다.

이제는 최고의 인재를 바라보는 관점 자체가 완전히 바뀌고 있다는 뜻입니다.

이건 NBA에서 르브론 제임스가 자기 몸을 관리하고 컨디션을 유지하는 데
매년 100만 달러를 쓰기 시작했을 때 우리가 배운 것과도 비슷합니다.

이렇게 뛰어난 지식 노동자들에게 왜 초인적인 능력을 쥐여주지 않겠습니까?

그렇다면 2~3년 뒤를 내다봤을 때,
엔비디아의 최고 인재 한 명은 얼마나 효율적으로 일하게 될까요?
그리고 대체 어디까지 해낼 수 있게 될까요?

우선, “와, 이건 너무 어렵다”라는 생각은 사라질 겁니다.
“이건 시간이 너무 오래 걸린다”라는 생각도 사라질 겁니다.
“사람이 많이 필요하다”라는 생각도 사라질 겁니다.

너무 크다, 너무 무겁다, 너무 오래 걸린다.
이런 생각들은 전부 사라집니다.
결국 남는 건 창의성입니다.
당신이 무엇을 생각해낼 수 있느냐만 남는 거죠.

그러면 이제 질문은 이것입니다.
이 에이전트들과 어떻게 함께 일할 것인가?

그건 결국 컴퓨터 프로그래밍을 하는 새로운 방식입니다.
과거에는 우리가 직접 코드를 썼습니다.
앞으로는 아이디어를 쓰고, 아키텍처를 쓰고, 명세를 쓰게 될 겁니다.

우리는 팀을 조직하고,
좋은 결과와 나쁜 결과를 어떻게 평가할지 정의하고,
무엇이 훌륭한 결과인지 정하고,
어떻게 함께 반복 개선할지,
어떻게 브레인스토밍할지를 정하게 될 겁니다.

정말로 중요한 건 바로 그런 일입니다.

그리고 제 생각에는,
앞으로 모든 엔지니어는 에이전트 백 명을 거느리게 될 겁니다.

답변달기

aliveornot 3달전 [-]

무슨 의미인지는 알겠으나, 코드 라인 수로 엔지니어를 평가하는 건 바보짓이긴 했죠. 좋은 지표라는건 참 어려운 일 같습니다

답변달기

aer0700 3달전 [-]

연봉 50만 달러짜리 엔지니어에게 "토큰을 얼마 썼나요?"를 물어보는 게 아니라,
"올해 무엇을 개발했고, 그것은 회사의 영업이익에 어떻게 기여했나요?"를 물어봐야 하는 것 아닐까요?

답변달기

kirkyoon 2달전 [-]

토큰을 얼마 썼나요? 라고 물어보는게 아니라 잘 활용하고 있는가를 물어보는거죠
5000달러만 썼다는건 너무 적게 쓴것에 대한 기준으로 생각하면 될 것같네요
“전 그냥 종이와 연필만 쓸게요. CAD 툴은 필요 없을 것 같습니다”
라고 말하는 것과 다를 바 없습니다.

답변달기

kirkyoon 2달전 [-]

다른 예시를 들면 "직원중에 엑셀을 합계 수식만 쓰고 있는 직원이 있어?"로 생각하면 될 것 같네요.

답변달기

젠슨 황: Nvidia의 미래와 물리적 AI, 에이전트의 부상 [유튜브]

Groq 인수와 추론 폭발

세계 최고 가치 기업의 의사결정

물리적 AI의 50조 달러 시장과 Open Claw

AI의 PR 위기와 Anthropic 커뮤니케이션 문제

매출 역량, 직원 토큰 배분, 에이전트의 미래

엔터프라이즈 소프트웨어의 미래

오픈소스, 글로벌 확산, 이란/대만 공급망

자율주행 플랫폼과 경쟁

우주 데이터센터, AI 헬스케어, 로보틱스

OpenAI/Anthropic 매출 잠재력과 AI 모트

AI 시대 젊은이들을 위한 조언

함께 보면 좋은 글 β

댓글과 토론

24:28 부터가 인상적이네요