# YTsaurus - Exabyte-Scale 스토리지 & 처리 시스템 오픈소스

> Clean Markdown view of GeekNews topic #8796. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=8796](https://news.hada.io/topic?id=8796)
- GeekNews Markdown: [https://news.hada.io/topic/8796.md](https://news.hada.io/topic/8796.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2023-03-25T10:19:01+09:00
- Updated: 2023-03-25T10:19:01+09:00
- Original source: [ytsaurus.tech](https://ytsaurus.tech/)
- Points: 9
- Comments: 1

## Topic Body

- Yandex가 공개한 분산 스토리지 & 프로세싱 빅데이터 플랫폼 오픈소스   
  - 유스케이스 : 배치 처리, 애드혹 분석, OLTP, 머신러닝, 메타데이터 스토리지, ETL 파이프라인   
- 멀티테넌트 에코시스템  
- 신뢰성 및 안전성 : SPOF 없음. 서버간 복제 자동화. 진행상황 손실없이 업데이트   
- 확장성   
  - 1백만개까지의 CPU 코어 및 수천개 GPU까지 확장 가능   
  - 1만개 이상의 노드 지원. 자동 서버 스케일 업 & 다운   
  - Exabyte 데이터 까지 다양한 저장매체 지원  
- 풍부한 기능   
  - 광범위한 MapReduce 모델   
  - 분산 ACID 트랜잭션   
  - 다양한 SDK(C++, Python, Java, Go) 와 API 제공   
  - 컴퓨팅 리소스 및 스토리지에 대한 안전한 격리   
  - 사용자 친화적 UI   
- CHYT powered by ClickHouse  
  - 친숙한 SQL Dialect 및 비슷한 기능   
  - 빠른 분석 쿼리   
  - 인기 BI 솔루션들과 연동(JDBC/ODBC)  
- SPYT powered by Apache Spark  
  - ETL 프로세스를 만들기 위한 도구   
  - 다양한 크기의 여러 독립 클러스터 지원   
  - 기존 솔루션들의 쉬운 이관

## Comments



### Comment 15389

- Author: xguru
- Created: 2023-03-25T10:20:02+09:00
- Points: 2

오픈소스 자체의 역사 및 내부 사용 기술에 대한 소개글 : [YTsaurus: Exabyte-Scale Storage and Processing System Is Now Open Source](https://medium.com/yandex/ytsaurus-exabyte-scale-storage-and-processing-system-is-now-open-source-42e7f5fa5fc6)  
- 거의 10년 넘게 개발을 진행했다고 합니다.   
- 2006년 부터 MapReduce를 사용하다가 2009년에 한계에 부딛혀 2010년부터 YT 프로젝트를 시작   
- Cypress (Storage) + MapReduce + 동적 K-V 테이블 + YQL + CHYT + SPYT   
- 주요 서버 코드는 C++
