7P by xguru 2022-12-23 | favorite | 댓글과 토론
  • 쉽고, 비용 효율적으로 ML Workload를 실행
    • 스팟 VM을 사용해서 3x 비용 절감. Preemption 에서 자동 리커버리 기능 포함
    • Idle 클러스터 자동 스탑
    • 벤치마크를 통해서 해당 Job에 맞는 최적 VM을 찾음
    • 존/리전/클라우드를 넘어서 최저 가격을 찾아서 자동 선택하도록 최적화
  • AWS, Azure, GCP 어디서든 잡 & 클러스터를 실행
  • 코드 변경없이 GPU, TPU, CPU 워크로드 지원