전반적으로 맞는 말이지만 MLX로 로컬모델들을 Apple Silicon 기기에서 잠시 실행해본 입장에서 100% 동의하기는 어렵네요.

참고로 모델 개발할때 mlx로 포팅해야한단 부담도 있고, mps를 활성화시켜도 체감상 cpu보다 약간 연산이 빠른 정도라 아직 불편쓰입니다.