38P by xguru 2달전 | favorite | 댓글 2개
  • 데이터 집약적 어플리케이션을 10년 넘게 구축해본 소프트웨어 엔지니어임. 주로 백엔드(레거시, 클라우드)
  • (1) 피봇하는게 좋을까요? (2) 해보신 분? (3) 내 업무에 ML이 없는데 어떻게 할 수 있을까요?
  • 모델 구축에 중점을 두지 않고, 모델 관리/배포/스케일링에 더 중점을 두는 ML 엔지니어링 실무가 있나요?
    • 즉, 그 기반에 있는 모든 수학을 배우지 않아도 될까요?

arnabgho

  • Snap에서 MLE 테크 리드로 일하며 스냅의 제너레이티브 AI 인프라의 기초를 닦았음
    • 매우 보람 있는 커리어 경로로 MLE 경로를 적극 추천하고 싶음
  • "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" 책은 프로덕션용 머신러닝 시스템 설계에 대한 매우 좋은 입문서
  • 해당 저자(Chip Huyen)가 작성한 이 블로그는 프로덕션급 AI 및 ML 시스템 구축에 대한 입문서로 적극 추천
    프로덕션용 LLM 어플리케이션 구축하기 (요약본 및 번역글 링크 포함)
  • 질문에 대한 답
    • (1) 예, 특히 지금과 같은 시대정신의 변곡점에서 이러한 전환을 하는 것이 현명함
    • (2) 예
    • (3) ML 엔지니어링 기술을 시작하고 숙달하는 방법에 대한 리소스는 위를 참조

breckenedge

  • 약 7개월 전에 ML을 사용하여 콘텐츠 추천을 만드는 3개월짜리 프로젝트에 발을 들여놓았음
  • 기성 협업 필터링 라이브러리로 시작해서 PyTorch로 끝냈고, ChatGPT가 큰 도움이 되었음
  • 계속 그 길을 가도 괜찮았지만 경영진은 더 빠르고 더 나은 결과를 원했고, 경험이 없는 상태에서 시작할 때 3개월은 흐름을 잡기에 충분한 시간이었음
  • 많은 ML은 데이터 세트를 정리하고 준비하는 것이었는데, 그다지 재미있지 않았음
  • 한 임원이 Amazon Personalize를 사용해보라고 권유했고, 좋은 시도는 해봤지만 결국에는 성공하지 못했음. 데이터 문제였는지 기본 모델 문제였는지
  • 블랙박스 ML 서비스를 사용할 때 발생하는 문제의 핵심은 무슨 일이 일어나고 있는지 분석할 수 없다는 점
  • Amazon Personalize는 데이터 레이어를 변경하는 것을 어렵게 만들기 때문에 더 나은 솔루션에 가까워지고 있는지 알 수 없음
  • 숙련된 ML 전문가가 개인화를 사용하면 더 나은 솔루션에 가까워질 수 있음
  • 따라서 ML을 다룰 수 있다면 경력으로 삼기 전에 ML 평가판 프로젝트를 수행하여 마음에 드는지 확인해 보는 것이 좋음

nsyptras

  • 모델 구축에 중점을 두지 않고 모델 관리/배포/확장에 더 중점을 두는 ML 엔지니어링이 있을까?

  • 내가 2018년에 이쪽으로 전환함. MLOps라고 불림. 그 전에는 모바일 개발자였음
  • 그 당시에는 전환이 꽤 쉬웠음(지금은 경쟁이 더 치열할 수도 있겠지만)
  • 내가 한 일:
    • 혼자서 집중적인 ML 프로젝트를 진행하면서 ML 스택 전반에서 일하는 것이 즐겁다는 것을 깨달음
    • 이 프로젝트에 대한 [블로그 포스팅]((https://www.nicksypteras.com/blog/aisu.html)도 작성
    • 그런 다음 MLOps 팀에 지원하여 이 프로젝트를 활용하여 기술/경험을 입증
    • 수학을 피할 수도 있겠지만 기본을 배우면 모든 것이 훨씬 쉬워질 것
    • 기본적인 ML 수학이 없었다면 매우 맹목적으로 비행했을 것이라고 생각함

ilaksh

  • "MLOps"를 생각하고 있는 듯. MLOps도 중요함
  • HuggingFace와 RunPod으로 Python으로 모델을 배포하는 연습을 해볼 것
  • 또한 LLM 사전 학습, 미세 조정 및 평가에 대한 튜토리얼도 찾아보고, Predibase도 확인할 것
  • 현재 가장 중요한 것은 확산 트랜스포머라고 생각
    • 이를 위한 트레이닝 작업을 실행하는 방법을 설명하는 문서를 찾을 수 있다면 사람들에게 도움이 될 수 있을 것
  • "치트"를 원한다면 replicate.com을 확인. cog는 replicate.com 외부에서 ML 모델을 자체 호스팅하는 데도 유용할 수 있음

nottorp

  • 나는 "ML 엔지니어로 전환"하지는 않았지만 지난 2.5개월 동안 공개 모델을 사용하고, 도구와 API를 사용하여 훈련하고 실행하는 방법을 어느 정도 배웠음
  • 코드 작성은 거의 하지 않고 많은 책을 읽었음
  • 소규모 조직(역할에 갇히지 않고 할 일만 주는)과 함께 일하면 도움이 됨

trybackprop

  • 실제로 ML로 전환을 고려하고 있는 숙련된 소프트웨어 엔지니어를 위해 이에 대한 블로그 게시물을 작성해서 공유함
  • 답변
      1. 개인 시간에 해킹을 즐기고 있다면 '현명하다'고 할 수 있음. 나는 전환하기 전 1년간 밤과 주말에 자료를 공부하면서 이 일을 풀타임으로 하고 싶다는 생각을 처음으로 하게 되었음
      1. 네, 그리고 전환 후 7년째 ML 엔지니어로 일하고 있음. 현재 FAANG의 ML 기술 책임자임. 그 전에는 인프라와 제품 분야에서 일했음
      1. 몇 년 전에 내가 받은 조언 중 하나는 ML 업무와 인접한 팀에 합류하여 프로덕션 ML이 어떻게 생겼는지 익숙해질 수 있도록 하라는 것. Kaggle.com에서 ML 씽킹 연습을 시작할 수도 있움
  • 제 블로그의 다른 게시물에서 AI/ML과 이 직업에 필요한 수학을 배울 수 있는 리소스를 확인 가능
  • Linear Algebra 101 for AI/ML – Part 1
  • (대화형 퀴즈, 벡터/행렬의 기초, 업계에서 널리 사용되는 오픈 소스 ML 프레임워크인 PyTorch에 대한 간단한 소개 포함).

deepGem

  • fast.ai 의 "Practical Deep Learning for Coders 를 살펴 볼 것
  • 2022년에 나온 자료지만 여기서 배우는 원리는 오늘날에도 매우 유효하며 매우 유용
  • 특히 Self Attention, 트랜스포머 및 이러한 개념에 기반한 최신 아키텍처가 특히 그러함
  • fast.ai 과정을 수료한 많은 사람들이 ML 엔지니어뿐만 아니라 연구 과학자로 커리어를 전환했음
  • 말하자면 쉬운 과정이 아니기 때문에 여가 시간에 시간을 내서 수강해야 함
  • 배포/확장에 관심이 있으시다면 파트 1의 2강으로 바로 넘어가도 좋음. 제레미는 훌륭한 선생님임
    • 나는 학계 출신이 아니기 때문에 그의 강의 스타일이 매우 건강하다고 생각

한국에서는 그냥 api호출하는거 그정도 수준만 알면됩니다, 기업에서는 큰돈들여 투자는 하기싫고 ,그렇지만 뭔가 핫하게 유행은 따라가고싶고 ...그런 애매한 분위기.

잘읽었습니다. 감사합니다.