Hacker News 의견
  • GPU 제한이 중국 개발자들에게 더 혁신적이고 적은 자원으로 더 많은 것을 하도록 만든 환경을 조성함

    • Deepseek 팀에 찬사를 보냄
  • Deepseek에 대한 찬사가 흥미로움

    • Deepseek가 다른 모델을 크게 능가할 수 없는 구조적이고 근본적인 이유가 있음
      • 미국과 중국의 무역 전쟁이 Deepseek의 컴퓨팅 가용성을 불리하게 만들 가능성이 있음
      • 중국의 검열이 Deepseek의 데이터 수집과 출력에 어느 정도 제한을 가함
      • Deepseek가 오픈 소스이기 때문에 다른 모델들이 쉽게 복제할 수 있음
    • Gemini, ChatGPT, Deepseek, Claudie를 정기적으로 사용 중이며, Deepseek는 다른 모델보다 특별히 뛰어나거나 열등하지 않음
    • Deepseek가 LLM 분야를 완전히 장악한다고 생각하는 이유를 알고 싶음
  • 중국이 경제 발전과 함께 기여자가 되어야 한다고 믿음

    • 과거 30년 동안 IT 혁신에 실질적으로 참여하지 않았음
    • 무어의 법칙에 의존하여 더 나은 하드웨어와 소프트웨어를 기다리는 방식으로 확장 법칙을 대함
  • Deepseek는 작년부터 오픈 소스 LLM 커뮤니티에서 두드러진 이름이었음

    • 다른 중국 LLM 플레이어에 비해 마케팅 비용이 적음
  • 구식 상징적 AI와 현대 ML 버전을 결합하는 것에 대한 언급이 없는 것이 놀라움

  • 중국은 GPU 의존성을 깨기 위한 순수 연구를 할 강력한 인센티브가 있음

    • 과학을 위해 서로의 수학자를 공격하는 일이 없기를 바람
  • API가 저렴한 이유 중 하나는 API 데이터를 학습에 사용한다고 명시했기 때문임

    • OpenAI와 Claude는 API를 사용할 경우 데이터를 학습에 사용하지 않겠다고 함
  • AI 회사 간의 경쟁이 건강하게 지속되기를 바람

    • 기술과 논문을 계속 공유하여 전체적으로 더 나아지기를 희망함
  • DeepSeek가 10배 적은 자원으로 o1과 Claude와 동등한 성과를 이룬 것이 인상적임

    • 더 나은 알고리즘과 접근 방식이 ML의 다음 단계에 필요함
  • "catfish"라는 단어의 흥미로운 (오용) 사용

    • 일반적으로 이해하는 방식과 다름