State of Data Science 2021 보고서 [46p PDF]
(anaconda.com)- 데이터 사이언스 분야가 어떻게 성장하고 있는지를 조사한 보고서
ㅤ→ 회사 및 교육기관 들이 채택하는 트렌드를 통해서 학생들이 미래에 뭘 준비해야 할까?
- Anaconda.org 가 140개국, 4299명 대상 온라인 조사
- 남 72%, 여 23%
- 25~40세 50%, 18~24세 24%, 41~56세 18%
- 학사 34%, 석사 24%, 박사 10%, 고교수준 13%
- 학생 27%, 비즈니스 분석가 11%, 데이터 사이언티스트 11%, 교수/연구자 9%, 데이터 엔지니어 7%, 개발자 6%
- 관리자 레벨 26%, 시니어 25%, 엔트리 15%, 이사급 10%, 수석급 8%, 오너/경영진/C레벨 8%, VP 5%
- COVID-19가 데이터 사이언스 투자에 끼친 영향 : 감소 37%, 증가 26%, 유지 24%
- 팀 사이즈
ㅤ→ 솔로 19%
ㅤ→ 6~10명 44%
ㅤ→ 1~5명 29%
ㅤ→ 11-20명 17%
ㅤ→ 20명 이상 10%
- 조직내에서 자신의 팀 : IT 23%, 연구개발 16%, 선행 데이터 사이언스 8%, 운영 8%, 재무 6%
- 데이터 사이언티스트의 시간 사용 : 데이터 준비 22%, 데이터 클렌징 17%, 보고 & 프리젠테이션 17%, 데이터 시각화 15%, 모델 선정 12%, 모델 훈련 12%, 모델 배포 11%
- 데이터 모델이 프로덕션에 도입 못되게 막는 것들
ㅤ→ 27% : IT 보안 표준 준수
ㅤ→ 24% : Python/R로된 모델을 다른 언어로 재코딩
ㅤ→ 23% : 디펜던시와 환경 관리
ㅤ→ 24% : 다른 언어로된 모델을 Python/R로 재코딩
- 데이터 사이언스용 시스템 구입시 주 고려 사항
ㅤ→ CPU/GPU 성능 60%
ㅤ→ 메모리 46%
ㅤ→ IT 부서의 승인 45%
ㅤ→ OS 42%
ㅤ→ 제조사의 고객 지원 평판 40%
ㅤ→ 브랜드 32%
- 조직에서의 오픈소스 사용 : 허용 87%, 불가 7%
- 오픈소스 사용 권장 : Yes 65%, No 21%
- 팀이 오픈소스 사용에 기여하게 어떻게 지원하는 가
ㅤ→ 오픈소스 프로젝트 기여하는데 시간을 별도로 부여 46%
ㅤ→ 오픈소스 프로젝트 개발에 별도로 펀딩 54%
ㅤ→ 오픈소스 프로젝트에만 참여하는 팀 멤버가 있음 41%
언어 사용 여부 (Always, Frequently, Somtimes, Rarely, Never)
ㅤ→ Python : 항상 34%, 종종 29%, 때때로 22%, 가끔 11%, 전혀 4%
ㅤ→ SQL : 항상 15%, 종종 20%, 때때로 27%, 가끔 16%, 전혀 22%
ㅤ→ R : 항상 10%, 종종 17%, 때때로 25%, 가끔 18%, 전혀 30%
- 32%의 응답자가 6-12개월 안에 새로운 Job을 찾을 예정