Show GN: NVBeacon - macOS 메뉴바에서 원격 NVIDIA GPU 상태를 보는 앱
(github.com/jaein4722)AI 연구 일을 하다 보니 공용 GPU 서버에서 학습을 자주 돌립니다. 그때마다 빈 GPU가 있는지, 학습 프로세스가 살아있는지, util과 memory를 제대로 쓰고 있는지 확인하려고 매번 터미널을 열어 nvidia-smi를 확인하는 흐름이 꽤 번거로웠습니다.
그래서 macOS 메뉴바에서 원격 NVIDIA GPU 서버 상태를 바로 볼 수 있는 앱을 만들어봤습니다. SSH로 서버에 연결해 정보를 가져오고, 서버 쪽에 별도 에이전트나 추가 프로그램 설치 없이 동작하도록 했습니다.
메뉴바에서 연결된 서버의 GPU 상태를 바로 볼 수 있고, 프로세스별 정보도 함께 확인할 수 있습니다. 기본 nvidia-smi만으로는 바로 보기 어려운 프로세스 UID도 가져와서 어떤 사용자가 어떤 작업을 돌리고 있는지 조금 더 직관적으로 파악할 수 있게 했습니다. 기존 SSH 설정을 최대한 활용하고, 내가 돌리는 프로세스를 빠르게 찾는 쪽도 신경 썼습니다.
개인적으로 쓰려고 만든 도구인데, 주변 사람들에게도 간단히 테스트해보니 생각보다 반응이 괜찮아서 공개해봤습니다. 현재는 macOS 전용입니다.
비슷한 환경에서 GPU 서버를 자주 쓰는 분들이 있으면 한 번 써보시고, 불편한 점이나 필요한 기능 있으면 피드백 주시면 감사하겠습니다!