5P by neo 12시간전 | ★ favorite | 댓글과 토론
  • 로보틱스 분야는 2025년 407억 달러라는 역대 최고 투자를 유치했으며, 전년 대비 74% 증가해 전체 벤처 자금의 9%를 차지하며 AI 소프트웨어와 함께 투자 선도 분야로 부상
  • 피지컬/물리적 AI는 로봇이 사전 프로그래밍된 규칙이 아닌 데이터로부터 학습하여 물리적 세계에서 작동할 수 있게 하는 핵심 기술
  • 언어 모델과 달리 피지컬 AI 모델은 실제 로봇 데이터가 필요하며, 이로 인해 시장 통제를 위한 초기 선점 기회가 형성
  • 10개 피지컬 AI 모델 카테고리에 걸쳐 70개 이상의 기업이 데이터·시뮬레이션, 모델 접근법, 파운데이션 모델, 관측성 영역에서 경쟁 중
  • 다중 로봇 협업이 피지컬 AI의 핵심 미해결 과제로, 이를 먼저 해결하는 기업이 자율 로봇 플릿의 산업 확장을 주도할 전망

핵심 시사점

  • 독점적 학습 데이터가 피지컬 AI의 핵심 경쟁 우위로, 대형 기술 기업들이 인수를 통해 데이터 접근권 확보에 나서는 중
    • Nvidia는 2025년 3월 합성 데이터 제공업체 Gretel을 3억 2천만 달러 이상에 인수
    • Meta는 데이터 인프라 및 모델 개발 업체 Scale에 148억 달러 지분 투자
    • OpenAI는 학습 데이터 확보를 위해 Medal 인수를 시도했으나, Medal은 해당 데이터로 모델을 구축하는 General Intuition을 출범
    • 독점적 학습 데이터를 확보한 기업은 더 뛰어난 모델 개발이 가능하며, 경쟁사는 라이선스 접근에 의존해야 함
    • 다양하고 고품질의 학습 데이터를 조기에 확보하는 것이 상업적 규모 달성의 핵심
  • 월드 모델은 로봇이 자율적으로 예측하고 계획할 수 있게 하며, 이는 대규모 언어 모델(LLM)이 달성하지 못하는 역량
    • 월드 모델 투자가 2024년 14억 달러에서 2025년 69억 달러로 급증
    • 해당 분야 기업들의 평균 Mosaic 점수 722(전체 시장의 상위 3%)
    • 성공을 위해서는 통제된 환경의 고품질 학습 데이터와 하드웨어 제조사와의 긴밀한 파트너십 필요
  • 다중 로봇 협업이 피지컬 AI의 핵심 미해결 과제로 남아있음
    • 미국 기업들은 17건의 딜에서 170억 달러 이상 투자 유치
    • 중국 기업들은 15건의 딜에서 4억 1,600만 달러 투자 유치
    • 두 지역 모두 단일 로봇 역량에 거의 전적으로 집중하며, 다양한 로봇 유형이 함께 작동하는 데 필요한 오케스트레이션 레이어를 구축하는 기업은 소수
    • 협업 문제를 먼저 해결하는 기업이 자율 로봇 플릿의 산업 확장을 통제할 수 있음

카테고리 개요

  • 데이터 & 시뮬레이션

    • 로봇 학습의 기반을 제공하며, 로봇은 대량의 학습 데이터가 필요하지만 실제 데이터 수집은 느리고 비용이 많이 소요
    • 세 가지 하위 시장 구성:
      • 합성 학습 데이터 — 로보틱스: 값비싼 실제 수집 없이 이미지, 센서 데이터, 3D 장면 등 합성 데이터셋을 생성하는 도구
      • 로봇 시연 데이터 제공업체: 모방 학습을 위한 원격 조작 데이터, 모션 궤적, 비디오 등 실제 데이터를 캡처하는 기업
      • 로보틱스 시뮬레이션 플랫폼: 물리적 배포 전 로봇을 학습, 테스트, 검증하는 가상 환경
    • 데이터 희소성이 피지컬 AI의 주요 병목 현상으로, 비용과 가용성 문제로 실제 학습 데이터 접근이 어려움
      • 이 시장들의 평균 Mosaic 점수 약 600(시장 모멘텀 상위 절반)
      • 기업의 50%가 배포 단계에 진입하여 피지컬 AI용 데이터 인프라가 연구를 넘어 상업적 실행 가능성으로 성숙 중
    • 많은 기업이 합성 데이터와 시뮬레이션에 의존하며 Nvidia가 시장을 선도
      • 그러나 합성 데이터만으로는 불충분하며, 신뢰할 수 있는 모델 학습에 실제 로봇 데이터가 여전히 중요
      • Scale은 164억 달러를 투자받아 Mosaic 점수 상위 1%에 랭크
      • Scale은 합성 데이터 생성과 실제 데이터 수집(로봇의 인간 원격 조작, 물리적 환경의 센서 데이터 포함)을 결합하여 데이터 라벨링 사업을 모델 개발로 확장
    • 신흥 기업들이 기존 데이터 부족을 극복하기 위해 새로운 데이터 소스 추구
      • General Intuition은 로봇 시스템에 적용 가능한 게임플레이 비디오로 모델을 학습시키기 위해 1억 3,400만 달러 투자 유치
      • micro1은 5억 달러 가치평가로 3,500만 달러를 투자받아 인간 상호작용 비디오로 세계 최대 규모의 로보틱스 학습 데이터셋 구축 중
    • 독점적 데이터셋이나 시뮬레이션 플랫폼 없이는 로봇 기업들이 선도 기업에게 라이선스를 받거나 터치, 압력, 물리적 움직임 같은 핵심 데이터 유형에서 뒤처질 위험
  • 모델에 대한 접근

    • 로봇에게 시각, 추론, 행동 능력을 부여하며 각 모델이 다른 모델 위에 구축됨
    • 경직된 프로그래밍 대신 새로운 작업에 적응할 수 있게 함
    • 세 가지 하위 시장 구성:
      • 비전-언어 모델(VLM) 개발사: 시각적 이해와 자연어를 결합한 멀티모달 모델로, 로봇의 인식 레이어 역할
      • 비전-언어-행동(VLA) 모델 개발사: VLM을 기반으로 시각 인식, 언어 이해, 모터 제어를 결합하여 명령을 물리적 행동으로 직접 변환하는 AI 시스템
      • 월드 모델 AI 개발사: 공간 관계, 물리 법칙, 인과관계를 예측하기 위해 환경 변화를 시뮬레이션하는 모델
    • 피지컬 AI가 로보틱스를 하드코딩된 프로그래밍에서 유연하고 작업 적응형 시스템으로 전환시키며, VLA 모델이 선도적 아키텍처로 부상
      • Figure, 1X, Galbot 같은 선도적 휴머노이드 로봇 기업들이 독점적 VLA 모델 구축 중
      • Nvidia, Meta 같은 빅테크 기업들은 로봇 제조사에 상업적 라이선스를 위한 모델 개발 중
    • 월드 모델이 예측적 추론을 추가하여 진정한 혁신이 될 가능성
      • World LabsRunway 같은 기업들이 월드 모델 구축 중
      • VLA가 즉각적 입력에 반응하는 것과 달리, 월드 모델은 시간에 따른 환경 변화를 시뮬레이션
      • 로봇이 결과를 예측하고, 다단계 행동을 계획하며, 오류에서 복구할 수 있게 함
  • 파운데이션 모델

    • 데이터와 아키텍처를 결합하여 인식, 추론, 행동이 가능한 사전 학습된 로봇 지능
    • 일부는 조작용 범용 모델이고 일부는 특화된 모델
    • 개발자들이 처음부터 구축하지 않고 이 지능을 라이선스하여 적용 가능
    • 세 가지 하위 시장 구성:
      • 로봇 파운데이션 모델 개발사: 다양한 하드웨어에서 로봇이 보고, 생각하고, 움직이도록 돕는 범용 모델
      • 자율주행 파운데이션 모델 개발사: 대규모 주행 데이터셋으로 학습되어 인식, 예측, 계획, 제어를 통합하고, 로보택시, 트럭 운송, 배달용 기존 자율 시스템을 대체
      • 다중 로봇 협업 모델 개발사: 작업 분배, 충돌 회피, 분산 의사결정을 처리하여 로봇 군집이 협력할 수 있게 하는 다중 에이전트 알고리듬
    • 파운데이션 모델 시장은 매우 역동적
      • 미국 기술 대기업(Microsoft, Google, Amazon)과 중국 선도 기업(Huawei, Baidu)이 DeepSeek, Physical Intelligence 같은 주목받는 스타트업과 경쟁
    • 많은 기업이 여러 유형의 파운데이션 모델에 걸쳐 작업
      • 한 도메인의 학습 데이터가 다른 도메인의 모델 성능 향상에 기여 가능
      • Nvidia가 세 가지 파운데이션 모델 카테고리 모두에서 활동하는 유일한 기업으로, 전체 피지컬 AI 스택의 인프라로 자리매김
    • 다중 로봇 협업이 다음 프론티어
      • 창고에서 휴머노이드, 자율 이동 로봇, 자율 지게차가 함께 작동하는 것과 같은 시나리오
      • 다양한 로봇 유형 협업에는 중앙 제어 없이 작업, 자원, 충돌 회피를 관리하는 오케스트레이션 레이어 필요
      • 소수의 스타트업(Field AI, Intrinsic)과 빅테크 기업만이 이를 추구
      • 대부분의 작업이 상업적 배포보다는 연구 단계에 머무름
    • 독점적 모델을 보유한 기업은 차별화와 수직 통합을 통해 더 높은 마진 확보 가능
    • 서드파티 AI를 라이선스하는 기업은 모델 상품화에 따른 낮은 비용 혜택을 받을 수 있지만, 핵심 기술보다는 배포 속도와 통합 품질로 경쟁
  • 관측성(Observability)

    • 로봇이 프로덕션에서 작동할 때 발생하는 상황을 포착하여 연구실 개발과 실제 배포 간의 격차를 해소
    • 로보틱스 관측성 플랫폼: 개발 및 프로덕션에서 로봇을 모니터링, 디버깅, 최적화하는 플랫폼
    • 로봇이 실패하거나 예기치 않게 동작할 때 엔지니어들이 인시던트를 재생하고 원인을 파악하여 수정 사항을 푸시
    • 실제 엣지 케이스가 시뮬레이션과 학습에 반영되어 모델을 개선하고 성능 향상
    • FoxgloveFormant이 대표적 예시로, 성능을 추적하고 실패를 분석하며 배포 인사이트를 학습 데이터셋, 시뮬레이션, 모델에 다시 피드백
    • 강력한 관측성을 갖춘 기업은 실패로부터 학습하여 모델을 신속하게 개선 가능
    • 예상치 못한 상황이 학습 이점으로 전환되어 프로덕션 준비 시스템과 연구실 프로토타입을 구분하는 핵심 요소