▲GN⁺ 2025-02-07 | parent | ★ favorite | on: 당신의 모델을 스케일 하는 법: TPU에서의 LLM에 대한 시스템적 관점(jax-ml.github.io)Hacker News 의견 JAX가 앞으로 몇 년 동안 pytorch/cuda를 대체할 것이라는 기대가 있음. Deepseek 팀과의 PTX 문제는 하드웨어 성능을 최대한 활용하기 위해 더 낮은 수준의 접근 방식에 투자하는 것의 가치를 보여줌 Google 내부에서 성능 작업의 지침서로 사용되었음. 공개된 것이 놀랍지만, Gemini 관련 세부 사항은 제거된 것으로 보임 이 가이드는 JAX/XLA 덕분에 GPU로 직접 전환할 수 있는 점이 좋음 JAX가 왜 AST 대신 트레이싱을 사용하는지 궁금해하는 의견이 있음 작성자의 트윗 스레드 링크가 공유됨 Jekyll 사이트를 PDF로 변환할 방법을 찾고 있는 사람 있음 훌륭한 글이라는 칭찬과 감사의 표현이 있음 멋진 애니메이션을 어떻게 만드는지 궁금해하는 의견이 있음
Hacker News 의견