최신 데이터 인프라 이해하기 #1 - 기본 개념과 단어 설명
2020-11-05
"최신 데이터 인프라"를 조금 쉽게 이해할 수 있도록 설명하는 시리즈 동영상
a16z 가 정리한 최신 인프라 아키텍쳐 다이어그램을 기반으로, 1화에서는 기본 개념과 단어들을 설명합니다.
1편이 10분단위라 꽤 긴 시리즈가 될거 같은데, 한번 쭉 들으시면 요즘엔 어떤 데이터 인프라 도구들이 쓰이는지 이해하시기 좋을겁니다
1편 : 데이터 인프라 관련 기본 개념과 단어 설명
- 0:48 A Unified Data Infrastructure Architecture
- 1:19 데이터 인프라의 목적
- 1:50 데이터 인프라 기초 : 프로덕션 vs 데이터 웨어하우스
- 2:43 데이터의 차이 : 정규화된 스키마 vs 디멘져널 스키마(스타 스키마)
- 3:50 ETL(Extract, Transform, Load : 추출, 변환, 적재 )
- 4:30 ETL 에서 ELT 로
- 4:58 Data Analyst vs Data Engineer vs Data Scientist
- 7:40 Sources, Ingestion and Transformation, Storage, Query Processing, Output