7P by xguru 2021-07-29 | favorite | 댓글 1개

- 파이썬과 비슷한 프로그래밍 언어 & 컴파일러
- CUDA 경험이 없는 연구자들도 쉽게 고효율의 딥러닝을 위한 GPU코드 작성가능
ㅤ→ 이미 Torch 구현 보다 2배정도 효율이 좋은 커널 구현
- Linux, NVIDIA GPU 지원 (AMD GPU 와 다른 CPU들은 개발중)
- 기본 코드는 Numba와 비슷 하지만, SIMT를 사용하지 않고 블록단위에 대한 연산으로 인스턴스 내에서 병렬 실행
- 파이썬 코드를 Triton-IR로 바꾸고 Triton Compiler 를 통해서 LLVM-IR로 변환하는 아키텍처

원 작성자의 논문 : http://eecs.harvard.edu/~htk/publication/…
(Philippe Tillet을 OpenAI가 채용해서 계속 개발을 지원해 주고 있다고)