16P by xguru 2022-10-03 | favorite | 댓글과 토론
  • "Data Version Control" : Git for Data & Models, Makefiles for ML
  • 큰 파일, 데이터셋, 머신러닝 모델, 메트릭들 및 코드를 트래킹 하여 처리할 수 있도록 설계됨
  • AWS S3, Google Drive/GCS, Azure Blob Storage, SSH/SFTP, HDFS 등에 데이터와 모델을 저장하고, 버전 정보는 Git으로 관리
  • 실험은 로컬 Git 레포에서 트래킹
  • CLI 및 VSCode 확장 제공
  • 윈도우/맥/리눅스