GN⁺ 2025-01-28 | parent | ★ favorite | on: 경쟁과 DeepSeek이 Nvidia에 미치는 영향(youtubetranscriptoptimizer.com)
Hacker News 의견
  • DeepSeek의 설명은 80-90년대 네트워킹 경험을 떠올리게 함. 당시 비디오 온디맨드가 큰 시장이었고, 고급 비디오 코딩 알고리즘의 잠재력을 무시했음. 인터넷 비디오 가능성은 더 빠른 인터넷이 아닌 더 똑똑한 알고리즘 덕분이었음.

    • AI의 경우, GPU는 계속 빨라지지만 실리콘 성능의 10배 향상은 오랜 시간이 걸릴 것임. DeepSeek은 새로운 알고리즘 발견 가능성을 시사함.
  • DeepSeek가 더 적은 자원으로 더 많은 일을 할 수 있다면, Jevons Paradox가 작용할 것임. 작은 회사들도 경쟁할 수 있다는 생각으로 GPU 판매가 증가할 것임. DeepSeek는 약 200명의 직원으로 대기업보다 20배 적은 비용으로 경쟁 모델을 훈련할 수 있다고 주장함.

  • AI 모델 개발에서 첫 번째 움직임의 불리함을 강조함. 모델을 5%의 비용으로 복제할 수 있다면 두 가지 합리적인 결정이 있음:

    • 비용 효율성에 집중하여 두 번째 움직임의 이점을 줄임
    • 규모의 경제, 네트워크 효과, 규제 포획을 통해 경쟁적 방어벽 구축
  • OpenAI 같은 회사는 직접적인 네트워크 효과를 누리는 플랫폼으로 전환해야 함.

  • AI 컴퓨팅의 대부분이 추론에 집중되고 있음. R1(680B)을 3대의 소비자 컴퓨터에서 분산 실행할 수 있음. NVIDIA의 장점은 수천 개의 GPU를 효율적으로 연결하는 것인데, 이는 AI 컴퓨팅의 작은 부분에만 중요할 것임.

  • NVIDIA의 여러 장점이 공격받고 있음. 그러나 경쟁자들이 각각의 장점만 공격하고 있어 NVIDIA는 여전히 모든 장점을 가진 유일한 회사로 남을 것임.

  • 휴머노이드 로봇 AI의 진정한 시험은 세탁물 접기임. 현재 기술로는 여전히 어려운 문제임. 최근 로봇 AI의 발전이 있는지 궁금함.

  • 687B MoE 모델을 일반 하드웨어에서 배포하는 효율성을 과대평가함. Apple 하드웨어에서는 불가능하고, 데스크탑 컴퓨터에서도 간신히 가능함. PCIe 대역폭 문제로 프로그래밍 작업에 12분이 걸림.

  • 불법적인 전략이 있을 수 있음: NVDA 가격 반등을 기다리고, OpenAI 경쟁자를 만들어 이익을 얻는 것.

  • DeepSeek의 효과를 올바르게 보는 사람이 적음. 10배 더 효율적이라면 자원을 1/10만큼 사용하는 것이 아니라 10배 더 사용하게 됨. 기술 제품은 항상 이러한 방향으로 움직여 왔음.

  • 주식 시장 공매도 전략에 관심이 없어도 DeepSeek v3와 R1 논문에서 흥미로운 아이디어를 명확하게 요약한 훌륭한 기술적 내용이 많음.