19P by xguru 2021-08-26 | favorite | 댓글 2개

- CSV, TSV, Tabular JSON 등 named-index 데이터 처리
ㅤ→ 키밸류 데이터에 대해 awk, sed, cut, join, sort 의 기능을 제공
- 데이터 정제 및 축소, 통계 작성, DevOps, 시스템 관리, 로그 파일 처리, 파일 포맷 변환, DB 쿼리 후처리 등에 유용
ㅤ→ R, Pandas, SQL Output 등을 처리하는 도우미
- 스트리밍 지원 및 Unix Pipe에도 잘 연동
- 내부에서 Insertion-Ordered Hash Map 으로 데이터 처리
- 오픈소스 : 처음에는 C로 작성되었다가 6.0부터는 Go로 변경

자주 쓸 일은 없는데, 설명서 옆에 띄워놓고 띄엄띄엄 써봐도 지금까지 써 봤던 어떤 도구보다도 좋네요!

좋네요. 대용량 csv를 ad hoc으로 처리할 경우 마땅한 툴이 잘 없었는데 쓰기에도 편해보입니다.