# Sail - AI시대를 위한 빅데이터 처리 프레임워크

> Clean Markdown view of GeekNews topic #18036. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=18036](https://news.hada.io/topic?id=18036)
- GeekNews Markdown: [https://news.hada.io/topic/18036.md](https://news.hada.io/topic/18036.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2024-12-01T09:31:02+09:00
- Updated: 2024-12-01T09:31:02+09:00
- Original source: [github.com/lakehq](https://github.com/lakehq/sail)
- Points: 11
- Comments: 0

## Summary

Sail은 스트림 프로세싱, 배치 프로세싱, 고성능 연산 워크로드를 통합 처리하는 프레임워크로, Spark SQL과 Spark DataFrame API에 대한 호환 솔루션을 제공합니다. TPC-H 벤치마크 기준으로 Spark보다 4배 빠르고 94%의 하드웨어 비용을 절감할 수 있으며, 코드 변경 없이 사용할 수 있습니다. Rust 기반 엔진으로 Apache Arrow와 Apache DataFusion 위에 구축되었으며, Spark Connect 프로토콜을 사용해 Spark 세션과 Sail 서버 간 통신이 가능합니다.

## Topic Body

- 스트림 프로세싱 / 배치 프로세싱 / 고성능-연산(AI) 워크로드를 통합 처리하는 프레임워크를 목표   
- 현재 Spark SQL과 Spark DataFrame API에 대한 Drop-in 대체 솔루션을 제공(호환)  
- 단일 머신 또는 분산 설정에서 동작 가능  
- TPC-H 벤치마크 기준 Spark 대비 4배 빠르고, 94%의 하드웨어 비용을 절감하며, 코드 변경이 필요없음   
- 파이썬 패키지로 이용 가능 `pip install "pysail==0.2.0.dev0"`  
- 기술 스택   
  - Rust 기반 엔진으로 Apache Arrow와 Apache DataFusion 위에 구축  
  - Spark Connect 프로토콜을 사용해 Spark 세션이 Sail 서버와 통신

## Comments



_No public comments on this page._
