GN⁺ 2023-11-13 | parent | ★ favorite | on: AI 시대를 위한 GPU 생존 툴킷(journal.hexmos.com)
Hacker News 의견
  • 코드 오류 지적

    • 기사에 나온 코드에 오류가 있음. CUDA 커널이 호출되지 않음.
    • JIT 컴파일된 코드로 만델브로트 집합을 "계산"하는 데 걸리는 시간의 90%가 실제 계산이 아닌 함수 컴파일에 사용됨.
    • CUDA에 대해 배우고 싶다면 행렬 곱셈 구현이 좋은 연습이 될 것임. 두 가지 튜토리얼 링크 제공.
  • 개발자 필독 기사에 대한 비판

    • 기사는 모든 개발자가 알아야 할 내용이라 주장하지만, 실제로는 AI에서 GPU 사용에 대한 논의임.
    • 대부분의 개발자는 AI 개발자가 아니며 AI나 GPU를 직접 사용하지 않음.
    • 또한 기사는 GPU가 존재하는 이유인 3D 그래픽에 대해 거의 언급하지 않음.
  • CPU와 GPU의 작업 처리 방식에 대한 설명

    • CPU가 여러 작업을 차례로 처리한다는 설명은 성능 측면에서 볼 때 기본적으로 틀림.
    • 파이프라인이 병렬로 명령어를 실행하고, SIMD가 있으며, 여러 코어가 동일한 문제를 처리할 수 있음.
  • CPU와 GPU의 성능 비교

    • CPU는 직렬 코드에, GPU는 병렬 코드에 각각 잘 맞음이 대략적으로 맞음.
    • CPU는 약 100개의 "코어"가 각각 독립적인 작업을 수행하고, 분기 예측과 파이프라인으로 메모리 지연을 숨김.
    • GPU는 약 100개의 "컴퓨트 유닛"이 각각 80개의 독립적인 작업을 번갈아 가며 수행하고, 다른 80개 중 하나에서 다음 명령어를 실행하여 메모리 지연을 숨김.
  • 파이썬과 AI의 관계

    • 파이썬이 AI에서 지배적인 이유는 파이썬과 C의 관계가 CPU와 GPU의 관계를 반영하기 때문임.
    • GPU는 성능이 뛰어나지만 코딩하기 어려워서 사람들은 PyTorch와 같은 고수준 API 호출을 사용함.
    • C도 성능이 뛰어나지만 코딩하기 어려워서 파이썬을 추상화 계층으로 사용함.
    • GPU에 대한 이해가 필요한지 확실하지 않으며, 무어의 법칙이 끝나고 멀티스레딩이 속도 증가의 주요 모드가 되면서 병렬 프로그래밍을 위한 새로운 언어가 등장할 것임. Mojo가 그 시작임.
  • Erlang/Elixir와 Nx/Axon

    • 대부분의 프로그래밍 언어가 CPU처럼 순차 처리를 위해 설계되었지만, Erlang/Elixir는 GPU처럼 병렬 처리를 위해 설계됨.
    • Nx/Axon(Elixir)이 성공할지 궁금함.
  • GPU 구매 가이드 필요성

    • 최소 지출 금액과 예산별 최고의 선택에 대한 구매 가이드가 필요함.
    • 그러나 해당 정보는 가끔 변경되므로 최신 상태를 유지하는 자원이 있는지 확실하지 않음.
  • "모든 개발자가 알아야 한다"는 클릭베이트 기사에 대한 비판

    • 다시 클릭베이트 기사가 등장함.
  • AWS 인스턴스 유형에 대한 설명

    • AWS P5 인스턴스(그리고 P4d 및 P4de)는 주로 훈련을 위한 것임.
    • 추론에 가장 친화적인 인스턴스 유형은 T4와 A10G GPU를 갖춘 G4dn 및 G5임.
  • GPU 프로그래밍에 대한 초보자의 흥미

    • GPU 프로그래밍에 매우 새로운 사람으로서, 기사가 재미있게 읽힘.
    • 간단한 "개 또는 고양이" 신경망을 쉽게 훈련할 수 있는 현재의 발전이 놀랍음.