▲GN⁺ 2023-11-13 | parent | ★ favorite | on: AI 시대를 위한 GPU 생존 툴킷(journal.hexmos.com)Hacker News 의견 코드 오류 지적 기사에 나온 코드에 오류가 있음. CUDA 커널이 호출되지 않음. JIT 컴파일된 코드로 만델브로트 집합을 "계산"하는 데 걸리는 시간의 90%가 실제 계산이 아닌 함수 컴파일에 사용됨. CUDA에 대해 배우고 싶다면 행렬 곱셈 구현이 좋은 연습이 될 것임. 두 가지 튜토리얼 링크 제공. 개발자 필독 기사에 대한 비판 기사는 모든 개발자가 알아야 할 내용이라 주장하지만, 실제로는 AI에서 GPU 사용에 대한 논의임. 대부분의 개발자는 AI 개발자가 아니며 AI나 GPU를 직접 사용하지 않음. 또한 기사는 GPU가 존재하는 이유인 3D 그래픽에 대해 거의 언급하지 않음. CPU와 GPU의 작업 처리 방식에 대한 설명 CPU가 여러 작업을 차례로 처리한다는 설명은 성능 측면에서 볼 때 기본적으로 틀림. 파이프라인이 병렬로 명령어를 실행하고, SIMD가 있으며, 여러 코어가 동일한 문제를 처리할 수 있음. CPU와 GPU의 성능 비교 CPU는 직렬 코드에, GPU는 병렬 코드에 각각 잘 맞음이 대략적으로 맞음. CPU는 약 100개의 "코어"가 각각 독립적인 작업을 수행하고, 분기 예측과 파이프라인으로 메모리 지연을 숨김. GPU는 약 100개의 "컴퓨트 유닛"이 각각 80개의 독립적인 작업을 번갈아 가며 수행하고, 다른 80개 중 하나에서 다음 명령어를 실행하여 메모리 지연을 숨김. 파이썬과 AI의 관계 파이썬이 AI에서 지배적인 이유는 파이썬과 C의 관계가 CPU와 GPU의 관계를 반영하기 때문임. GPU는 성능이 뛰어나지만 코딩하기 어려워서 사람들은 PyTorch와 같은 고수준 API 호출을 사용함. C도 성능이 뛰어나지만 코딩하기 어려워서 파이썬을 추상화 계층으로 사용함. GPU에 대한 이해가 필요한지 확실하지 않으며, 무어의 법칙이 끝나고 멀티스레딩이 속도 증가의 주요 모드가 되면서 병렬 프로그래밍을 위한 새로운 언어가 등장할 것임. Mojo가 그 시작임. Erlang/Elixir와 Nx/Axon 대부분의 프로그래밍 언어가 CPU처럼 순차 처리를 위해 설계되었지만, Erlang/Elixir는 GPU처럼 병렬 처리를 위해 설계됨. Nx/Axon(Elixir)이 성공할지 궁금함. GPU 구매 가이드 필요성 최소 지출 금액과 예산별 최고의 선택에 대한 구매 가이드가 필요함. 그러나 해당 정보는 가끔 변경되므로 최신 상태를 유지하는 자원이 있는지 확실하지 않음. "모든 개발자가 알아야 한다"는 클릭베이트 기사에 대한 비판 다시 클릭베이트 기사가 등장함. AWS 인스턴스 유형에 대한 설명 AWS P5 인스턴스(그리고 P4d 및 P4de)는 주로 훈련을 위한 것임. 추론에 가장 친화적인 인스턴스 유형은 T4와 A10G GPU를 갖춘 G4dn 및 G5임. GPU 프로그래밍에 대한 초보자의 흥미 GPU 프로그래밍에 매우 새로운 사람으로서, 기사가 재미있게 읽힘. 간단한 "개 또는 고양이" 신경망을 쉽게 훈련할 수 있는 현재의 발전이 놀랍음.
Hacker News 의견
코드 오류 지적
개발자 필독 기사에 대한 비판
CPU와 GPU의 작업 처리 방식에 대한 설명
CPU와 GPU의 성능 비교
파이썬과 AI의 관계
Erlang/Elixir와 Nx/Axon
GPU 구매 가이드 필요성
"모든 개발자가 알아야 한다"는 클릭베이트 기사에 대한 비판
AWS 인스턴스 유형에 대한 설명
GPU 프로그래밍에 대한 초보자의 흥미