9P by xguru 2020-10-07 | favorite | 댓글과 토론

FirstMark의 VC인 Matt Turck가 이미지 한장으로 정리한 2020년 데이터 & 인공지능 업계 지도와 설명

- Data Infra 주요 트렌드
ㅤ→ 최신 데이터스택이 주류로 : Snowflake,BigQuery,RedShift,DBT,Fivetran,Stitch,Looker..
ㅤ→ ETL vs ELT
ㅤ→ 데이터 엔지니어링의 자동화
ㅤ→ 데이터 분석가의 부상
ㅤ→ 데이터 레이크와 데이터 웨어하우스의 통합? = Data Lakehouse 또는 Unified Analytics Warehouse
ㅤ→ 복잡도는 여전 :
ㅤㅤ⇨ 실시간 스트리밍 기술에 대한 요구 증가
ㅤㅤ⇨ 오케스트레이션 엔진 : Airflow 와 Luigi 에서 시작해서, 차세대 엔진들인 Prefect, Dagster, Kedro, Metaflow 등
ㅤㅤ⇨ Data Lineage & DataOps : LinkedIn (Datahub), WeWork (Marquez), Lyft (Admunsen), Uber (Databook)

- Analytics & Enterprise AI 주요 트렌드
ㅤ→ 데이터 과학 및 머신러닝 플랫폼(DSML)의 호황기
ㅤ→ ML이 실제로 배포 및 임베드 됨
ㅤㅤ⇨ MLOps
ㅤㅤ⇨ AI Governance, AI fairness
ㅤㅤ⇨ Decision Science (optimization, simulation)
ㅤ→ NLP의 해 : GPT-3, BERT, ELECTRA

- 주요 투자, 엑싯, IPO
ㅤ→ IPO : Snowflake, Palantir, Datadog, Sumo Logic, Dynatrace, Cloudflare
ㅤ→ M&A : ARM(NVIDIA), SignalFX(Splunk), Habana Labs(Intel), Fitbit(Google), Moovit(Intel)
ㅤ→ 작지만 흥미로운 인수들 : MapR(HPE), HortonWorks(Cloudera), Arcadia Data(Cloudera), Redash(Databricks)..