데이터 분석을 위한 실용적인 SQL
(hakibenita.com)Pandas 대신 SQL 로 데이터 분석을 하는 예제들
- SQL vs Pandas 성능/메모리 비교
- 기본
ㅤ→ Common Table Expressions
ㅤ→ 데이터 생성
ㅤ→ 랜덤 생성
ㅤ→ 랜덤 선택하기
ㅤ→ 샘플링
- 기술(Descriptive) 통계
- 소계(Subtotal) 작성 : Rollup, Cube, 그룹화
- 누적 집계 : Window 함수, Sliding Window
- 선형 회귀
- 보간(Interpolation)
- 비닝(Binning)
데이터 분석 전체를 대체한다기 보다는, SQL로 전처리 해서 데이터를 줄여 메모리 많이 먹는 Pandas를 가볍게 만드는 용도로 보면 될 듯 하네요.