3P by neo 24일전 | ★ favorite | 댓글 1개
  • 필자는 10년 동안 다양한 헤지펀드에서 투자 분석가로 일했으며, AI 기술 발전과 주식 시장의 주가 평가에 대한 독특한 관점을 가지고 있음
  • 최근 몇 년 동안 개발자로 일하며 AI 모델 및 서비스와 관련된 여러 오픈 소스 프로젝트를 진행 중임.

# Nvidia : The Bull Case

Nvidia의 주가 상승 배경

  • AI와 딥러닝 기술의 성장: 딥러닝과 AI는 인터넷 이후 가장 혁신적인 기술로 평가받으며, Nvidia는 GPU 분야에서 독점적 지위를 확보해 주요 기업들의 대규모 투자와 인프라 지출을 이끌어냄
  • 높은 마진: 데이터센터용 고급 제품에서 90% 이상의 높은 이익률을 기록
  • 확장 가능한 시장: AI 기술의 성장과 함께 데이터센터, 로봇, 인간 작업 대체 등의 다양한 응용 분야에서 새로운 수요가 창출되고 있음
  • "스케일링 법칙": 모델 성능이 데이터와 컴퓨팅 자원의 확대로 꾸준히 개선되며, Nvidia는 이를 최대한 활용 중

Nvidia의 현재 지위와 경쟁 우위

  • CUDA 플랫폼: GPU 프로그래밍의 사실상 표준이 된 Nvidia의 소프트웨어 생태계
  • Mellanox 인수: 고성능 GPU 간 연결 기술로 데이터센터에서 경쟁사 대비 우위를 제공
  • 독점적 소프트웨어와 드라이버 품질: AMD에 비해 우수한 드라이버와 소프트웨어 안정성
  • 리더십 유지 전략: 높은 이익을 연구개발(R&D)에 재투자하여 기술적 우위를 지속적으로 유지

# Nvidia에 대한 주요 위협

하드웨어 경쟁

  • Cerebras: 웨이퍼 크기의 AI 칩으로 Nvidia의 GPU 병렬 처리 및 연결 문제를 우회하는 새로운 접근법 제시
  • Groq: "결정적 연산" 기반 기술로 AI 추론 성능을 극대화
  • 주요 고객의 자체 칩 개발:
    • Amazon: Trainium2와 Inferentia2 같은 자체 칩 도입
    • Google: TPU 6세대 칩을 자체 개발
    • Microsoft와 OpenAI: 자체 AI 칩 개발 계획 발표
    • Apple: 소비자 중심 칩에서 축적된 기술을 AI 칩에 응용 가능성

소프트웨어 경쟁

  • 높은 수준의 추상화 프레임워크:
    • MLX, Triton, JAX와 같은 플랫폼이 CUDA의 중요성을 낮추고 대체 가능성을 확대
  • 코드 변환 기술: LLM을 사용해 CUDA 코드를 다른 하드웨어에 맞게 변환하는 기술이 개발 중
  • AMD 드라이버 개선: 오픈 소스 개발자들이 AMD GPU의 성능을 최적화하기 위한 새로운 드라이버 작업 진행 중

AI 모델의 효율성 혁신

  • DeepSeek의 등장:
    • DeepSeek는 FP8 혼합 정밀도 학습과 고효율 추론 기술로 Nvidia 대비 1/45 비용으로 경쟁 모델 성능 달성
    • Mixture-of-Experts(MOE) 아키텍처를 활용해 대규모 모델을 메모리 효율적으로 구현
    • "Multi-head Latent Attention" 같은 기술로 VRAM 사용량 대폭 절감
    • API 호출 비용은 OpenAI와 Anthropic 대비 95% 저렴

산업 구조의 변화

  • TSMC의 역할: Nvidia가 자체 칩을 생산하지 않는 구조로 인해 TSMC는 다른 경쟁사의 칩도 동일한 공정으로 제작 가능
  • 모든 고객의 자체화 노력: Nvidia의 고마진 제품에 대한 의존도를 낮추기 위해 주요 고객들이 자체 칩 설계에 투자

시장 전망과 Nvidia의 도전 과제

  • Nvidia의 현재 주가는 2025년 매출 20배, 75% 이상의 이익률을 가정한 매우 낙관적인 성장 시나리오에 의존
  • 효율성 혁신과 하드웨어 및 소프트웨어 경쟁 심화로 인해 성장률 둔화와 마진 하락 가능성 존재
  • Nvidia가 AI 기술 분야에서 계속 우위를 유지하더라도, 경쟁자들의 지속적인 도전은 시장 점유율과 장기 성장성에 영향을 미칠 가능성이 큼

# 결론

  • Nvidia는 AI 혁신의 선두주자로서 현재는 독보적인 위치에 있지만, 다각적인 경쟁 위협산업의 빠른 변화로 인해 현재의 높은 밸류에이션을 유지하기는 어려울 수 있음
  • 투자자들은 Nvidia의 기술적 우위와 AI 시장의 성장 가능성을 긍정적으로 평가하면서도, 경쟁사의 기술 혁신과 시장 구조 변화로 인한 리스크를 주의 깊게 관찰해야 함
Hacker News 의견
  • DeepSeek의 설명은 80-90년대 네트워킹 경험을 떠올리게 함. 당시 비디오 온디맨드가 큰 시장이었고, 고급 비디오 코딩 알고리즘의 잠재력을 무시했음. 인터넷 비디오 가능성은 더 빠른 인터넷이 아닌 더 똑똑한 알고리즘 덕분이었음.

    • AI의 경우, GPU는 계속 빨라지지만 실리콘 성능의 10배 향상은 오랜 시간이 걸릴 것임. DeepSeek은 새로운 알고리즘 발견 가능성을 시사함.
  • DeepSeek가 더 적은 자원으로 더 많은 일을 할 수 있다면, Jevons Paradox가 작용할 것임. 작은 회사들도 경쟁할 수 있다는 생각으로 GPU 판매가 증가할 것임. DeepSeek는 약 200명의 직원으로 대기업보다 20배 적은 비용으로 경쟁 모델을 훈련할 수 있다고 주장함.

  • AI 모델 개발에서 첫 번째 움직임의 불리함을 강조함. 모델을 5%의 비용으로 복제할 수 있다면 두 가지 합리적인 결정이 있음:

    • 비용 효율성에 집중하여 두 번째 움직임의 이점을 줄임
    • 규모의 경제, 네트워크 효과, 규제 포획을 통해 경쟁적 방어벽 구축
  • OpenAI 같은 회사는 직접적인 네트워크 효과를 누리는 플랫폼으로 전환해야 함.

  • AI 컴퓨팅의 대부분이 추론에 집중되고 있음. R1(680B)을 3대의 소비자 컴퓨터에서 분산 실행할 수 있음. NVIDIA의 장점은 수천 개의 GPU를 효율적으로 연결하는 것인데, 이는 AI 컴퓨팅의 작은 부분에만 중요할 것임.

  • NVIDIA의 여러 장점이 공격받고 있음. 그러나 경쟁자들이 각각의 장점만 공격하고 있어 NVIDIA는 여전히 모든 장점을 가진 유일한 회사로 남을 것임.

  • 휴머노이드 로봇 AI의 진정한 시험은 세탁물 접기임. 현재 기술로는 여전히 어려운 문제임. 최근 로봇 AI의 발전이 있는지 궁금함.

  • 687B MoE 모델을 일반 하드웨어에서 배포하는 효율성을 과대평가함. Apple 하드웨어에서는 불가능하고, 데스크탑 컴퓨터에서도 간신히 가능함. PCIe 대역폭 문제로 프로그래밍 작업에 12분이 걸림.

  • 불법적인 전략이 있을 수 있음: NVDA 가격 반등을 기다리고, OpenAI 경쟁자를 만들어 이익을 얻는 것.

  • DeepSeek의 효과를 올바르게 보는 사람이 적음. 10배 더 효율적이라면 자원을 1/10만큼 사용하는 것이 아니라 10배 더 사용하게 됨. 기술 제품은 항상 이러한 방향으로 움직여 왔음.

  • 주식 시장 공매도 전략에 관심이 없어도 DeepSeek v3와 R1 논문에서 흥미로운 아이디어를 명확하게 요약한 훌륭한 기술적 내용이 많음.