nvtop이나 nvidia-smi는 GPU 사용 상황에 대한 좋은 개요를 제공하지만, 실제 작업 속도를 반영하는 데는 적합하지 않음을 발견함. AI 성능에 관심이 있다면, 개별 커널을 프로파일링하기 위해 Nsight Compute CLI를, 매크로 뷰를 위해서는 Nsight Systems를 추천함. PyTorch를 사용하는 경우 PyTorch 프로파일러 사용을 권장함.
apt install이 작동하지 않는 문제에 대해 불만을 표함. NVIDIA와 관련된 설치 문제가 자주 발생하며, 이로 인해 리눅스 재설치 시 많은 시간을 소비해야 함을 지적함. 드라이버, CUDA, CUDA 툴킷, cuDNN 등 여러 계층과 버전 충돌이 혼란을 야기한다고 비판함.
Nvitop이라는, 사용자가 선호하는 또 다른 유틸리티를 소개함.
nvtop과 bottom을 리눅스에서 선호하는 자원 모니터로 언급하며, nvtop이 NVIDIA 장치뿐만 아니라 비NVIDIA 장치에서도 작동한다는 사실을 배웠음을 공유함.
btop을 선호하는데, 이는 최신 버전에서 일반 프로세스 모니터링뿐만 아니라 GPU 모니터링도 수행함을 언급함.
리눅스 그래픽 카드 유틸리티가 다중 플랫폼을 지원하게 되어 기쁘다고 말하며, 이전의 드라이버별 방식에서 벗어난 것을 긍정적으로 평가함.
gpustat이라는 선호하는 유틸리티를 소개하며, 훈련에 문제가 있는지 잘 진행되고 있는지 알 수 있는 최소한의 정보를 제공한다고 설명함.
Zenith라는 자신의 프로젝트를 소개하며, 이는 NVIDIA GPU 모니터링뿐만 아니라 디스크, CPU, Top과 같은 기능을 결합한 것임을 설명함.
Home Assistant를 사용하게 되면서 모든 데이터 소스를 통합하고 싶어짐을 표현함. 데이터를 원하는 대로 렌더링할 수 있으며, sensors2mqtt라는 프로젝트를 찾아내어 이를 사용하고 싶다는 의견을 나타냄.