DeepSeek의 설명은 80-90년대 네트워킹 경험을 떠올리게 함. 당시 비디오 온디맨드가 큰 시장이었고, 고급 비디오 코딩 알고리즘의 잠재력을 무시했음. 인터넷 비디오 가능성은 더 빠른 인터넷이 아닌 더 똑똑한 알고리즘 덕분이었음.
AI의 경우, GPU는 계속 빨라지지만 실리콘 성능의 10배 향상은 오랜 시간이 걸릴 것임. DeepSeek은 새로운 알고리즘 발견 가능성을 시사함.
DeepSeek가 더 적은 자원으로 더 많은 일을 할 수 있다면, Jevons Paradox가 작용할 것임. 작은 회사들도 경쟁할 수 있다는 생각으로 GPU 판매가 증가할 것임. DeepSeek는 약 200명의 직원으로 대기업보다 20배 적은 비용으로 경쟁 모델을 훈련할 수 있다고 주장함.
AI 모델 개발에서 첫 번째 움직임의 불리함을 강조함. 모델을 5%의 비용으로 복제할 수 있다면 두 가지 합리적인 결정이 있음:
비용 효율성에 집중하여 두 번째 움직임의 이점을 줄임
규모의 경제, 네트워크 효과, 규제 포획을 통해 경쟁적 방어벽 구축
OpenAI 같은 회사는 직접적인 네트워크 효과를 누리는 플랫폼으로 전환해야 함.
AI 컴퓨팅의 대부분이 추론에 집중되고 있음. R1(680B)을 3대의 소비자 컴퓨터에서 분산 실행할 수 있음. NVIDIA의 장점은 수천 개의 GPU를 효율적으로 연결하는 것인데, 이는 AI 컴퓨팅의 작은 부분에만 중요할 것임.
NVIDIA의 여러 장점이 공격받고 있음. 그러나 경쟁자들이 각각의 장점만 공격하고 있어 NVIDIA는 여전히 모든 장점을 가진 유일한 회사로 남을 것임.
휴머노이드 로봇 AI의 진정한 시험은 세탁물 접기임. 현재 기술로는 여전히 어려운 문제임. 최근 로봇 AI의 발전이 있는지 궁금함.
687B MoE 모델을 일반 하드웨어에서 배포하는 효율성을 과대평가함. Apple 하드웨어에서는 불가능하고, 데스크탑 컴퓨터에서도 간신히 가능함. PCIe 대역폭 문제로 프로그래밍 작업에 12분이 걸림.
불법적인 전략이 있을 수 있음: NVDA 가격 반등을 기다리고, OpenAI 경쟁자를 만들어 이익을 얻는 것.
DeepSeek의 효과를 올바르게 보는 사람이 적음. 10배 더 효율적이라면 자원을 1/10만큼 사용하는 것이 아니라 10배 더 사용하게 됨. 기술 제품은 항상 이러한 방향으로 움직여 왔음.
주식 시장 공매도 전략에 관심이 없어도 DeepSeek v3와 R1 논문에서 흥미로운 아이디어를 명확하게 요약한 훌륭한 기술적 내용이 많음.
Hacker News 의견
DeepSeek의 설명은 80-90년대 네트워킹 경험을 떠올리게 함. 당시 비디오 온디맨드가 큰 시장이었고, 고급 비디오 코딩 알고리즘의 잠재력을 무시했음. 인터넷 비디오 가능성은 더 빠른 인터넷이 아닌 더 똑똑한 알고리즘 덕분이었음.
DeepSeek가 더 적은 자원으로 더 많은 일을 할 수 있다면, Jevons Paradox가 작용할 것임. 작은 회사들도 경쟁할 수 있다는 생각으로 GPU 판매가 증가할 것임. DeepSeek는 약 200명의 직원으로 대기업보다 20배 적은 비용으로 경쟁 모델을 훈련할 수 있다고 주장함.
AI 모델 개발에서 첫 번째 움직임의 불리함을 강조함. 모델을 5%의 비용으로 복제할 수 있다면 두 가지 합리적인 결정이 있음:
OpenAI 같은 회사는 직접적인 네트워크 효과를 누리는 플랫폼으로 전환해야 함.
AI 컴퓨팅의 대부분이 추론에 집중되고 있음. R1(680B)을 3대의 소비자 컴퓨터에서 분산 실행할 수 있음. NVIDIA의 장점은 수천 개의 GPU를 효율적으로 연결하는 것인데, 이는 AI 컴퓨팅의 작은 부분에만 중요할 것임.
NVIDIA의 여러 장점이 공격받고 있음. 그러나 경쟁자들이 각각의 장점만 공격하고 있어 NVIDIA는 여전히 모든 장점을 가진 유일한 회사로 남을 것임.
휴머노이드 로봇 AI의 진정한 시험은 세탁물 접기임. 현재 기술로는 여전히 어려운 문제임. 최근 로봇 AI의 발전이 있는지 궁금함.
687B MoE 모델을 일반 하드웨어에서 배포하는 효율성을 과대평가함. Apple 하드웨어에서는 불가능하고, 데스크탑 컴퓨터에서도 간신히 가능함. PCIe 대역폭 문제로 프로그래밍 작업에 12분이 걸림.
불법적인 전략이 있을 수 있음: NVDA 가격 반등을 기다리고, OpenAI 경쟁자를 만들어 이익을 얻는 것.
DeepSeek의 효과를 올바르게 보는 사람이 적음. 10배 더 효율적이라면 자원을 1/10만큼 사용하는 것이 아니라 10배 더 사용하게 됨. 기술 제품은 항상 이러한 방향으로 움직여 왔음.
주식 시장 공매도 전략에 관심이 없어도 DeepSeek v3와 R1 논문에서 흥미로운 아이디어를 명확하게 요약한 훌륭한 기술적 내용이 많음.