SkyPilot - 아무 클라우드에서나 머신러닝 작업을 실행하는 프레임워크
(github.com/skypilot-org)- 쉽고, 비용 효율적으로 ML Workload를 실행
- 스팟 VM을 사용해서 3x 비용 절감. Preemption 에서 자동 리커버리 기능 포함
- Idle 클러스터 자동 스탑
- 벤치마크를 통해서 해당 Job에 맞는 최적 VM을 찾음
- 존/리전/클라우드를 넘어서 최저 가격을 찾아서 자동 선택하도록 최적화
- AWS, Azure, GCP 어디서든 잡 & 클러스터를 실행
- 코드 변경없이 GPU, TPU, CPU 워크로드 지원