# 2025년 데이터베이스 결산

> Clean Markdown view of GeekNews topic #25592. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=25592](https://news.hada.io/topic?id=25592)
- GeekNews Markdown: [https://news.hada.io/topic/25592.md](https://news.hada.io/topic/25592.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2026-01-06T09:47:11+09:00
- Updated: 2026-01-06T09:47:11+09:00
- Original source: [cs.cmu.edu](https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html)
- Points: 29
- Comments: 1

## Summary

**PostgreSQL의 확장과 MCP 표준의 확산이 2025년 데이터베이스 산업을 이끌었습니다.** 주요 클라우드 기업이 PostgreSQL 기반 서비스를 강화하며, Supabased와 PlanetScale 등은 분산형 프로젝트로 확장성을 실험했습니다. 동시에 모든 주요 DBMS가 **Anthropic의 Model Context Protocol(MCP)** 을 채택하면서 LLM과 데이터베이스의 직접 통합이 현실화되었고, 이는 데이터 접근 방식의 새로운 표준으로 자리 잡았습니다. 업계 전반의 인수합병과 폐업이 이어지며, 데이터베이스 생태계는 집중화와 재편의 국면에 들어섰습니다.

## Topic Body

- 2025년은 **PostgreSQL의 지배력 강화**, **MCP 표준 확산**, **대형 인수합병**, **파일 포맷 경쟁 재점화**, **Larry Ellison의 부상** 등으로 요약되는 해였음  
- PostgreSQL은 주요 클라우드 기업의 핵심 DBaaS로 자리 잡았고, **분산형 프로젝트(Multigres, Neki, PgDog)** 가 새롭게 등장  
- 모든 주요 DBMS가 **Anthropic의 Model Context Protocol(MCP)** 을 도입하며 LLM과 데이터베이스의 통합이 본격화  
- MongoDB가 FerretDB를 상대로 **API 복제 관련 소송**을 제기했고, 파일 포맷 분야에서는 **Parquet 대체 경쟁**이 격화  
- 업계 전반의 인수·폐업·자금 조달이 활발히 이어지며, **데이터베이스 산업의 재편과 집중화**가 가속화된 한 해로 평가됨  

---

### PostgreSQL의 지속적 확장
- PostgreSQL 18 버전이 2025년 11월 공개되어 **비동기 I/O 스토리지 서브시스템**과 **skip scan** 기능을 도입  
  - OS 페이지 캐시 의존도를 줄이고, 다중 키 인덱스 활용을 개선  
- Databricks가 **Neon**을 10억 달러에, Snowflake가 **CrunchyData**를 2억5천만 달러에 인수  
  - Microsoft는 **HorizonDB**를 출시하며 주요 클라우드 기업 모두 PostgreSQL 기반 서비스를 보유하게 됨  
- Supabase의 **Multigres**, PlanetScale의 **Neki**, PgDog 등 **분산형 PostgreSQL 프로젝트**가 새로 등장  
  - Supabase는 Vitess 공동창업자 Sugu를 영입해 샤딩 미들웨어 개발 주도  
- 독립 PostgreSQL 서비스로는 Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge, Nile 등이 활동  
  - Hydra, PostgresML 등 일부 스타트업은 2025년에 폐업  
- PostgreSQL 중심의 **M&A 경쟁과 기술 진화**가 업계의 핵심 동력으로 작용  

### MCP(Model Context Protocol)의 전면 확산
- 2025년에는 모든 주요 DBMS가 **Anthropic의 MCP 표준**을 지원  
  - MCP는 LLM이 데이터베이스와 상호작용할 수 있도록 하는 **JSON-RPC 기반 인터페이스**  
- OpenAI가 2025년 3월 MCP 지원을 발표한 이후, ClickHouse, Snowflake, Oracle, MongoDB 등 주요 시스템이 MCP 서버를 출시  
  - PostgreSQL 기반 서비스들도 각각 독자 MCP 서버를 제공 (Supabase, Timescale, Xata 등)  
- MCP 서버는 단일 요청 단위로 데이터베이스에 접근하며, **이기종 DB 간 조인 기능은 미지원**  
- Neon은 데이터 브랜칭 기능을 통해 **AI 에이전트가 생성하는 DB의 80%** 를 담당  
- 보안 측면에서 **권한 최소화와 자동 보호 메커니즘**의 필요성이 강조됨  
  - 일부 시스템은 읽기 전용 제한, 쿼리 타임아웃, 결과 제한 등 기본 보호 기능 제공  

### MongoDB와 FerretDB의 법적 분쟁
- MongoDB가 2025년 FerretDB를 상대로 **특허·저작권·상표권 침해 소송** 제기  
  - FerretDB는 MongoDB 쿼리를 PostgreSQL로 변환하는 **미들웨어 프록시**로, “drop-in replacement” 문구 사용이 문제로 지적됨  
- Microsoft는 MongoDB 호환 오픈소스 **DocumentDB**를 Linux Foundation에 기부  
  - Amazon, Yugabyte 등도 프로젝트에 참여  
- MongoDB의 “비관계형 DB를 개척했다”는 주장에 대해, 1960년대 **IDS, IMS** 등 선행 시스템이 존재했음을 지적  
- FerretDB의 초기 이름이 “MangoDB”였던 점이 **상표 혼동 논란**으로 언급됨  

### 파일 포맷 경쟁의 재점화
- 2025년에는 Parquet의 아성에 도전하는 **5개의 신규 오픈소스 파일 포맷** 등장  
  - FastLanes(CWI), F3(CMU+칭화대), Vortex(SpiralDB), AnyBlox(독일 연구진), Amudai(Microsoft)  
- SpiralDB의 **Vortex**는 Linux Foundation에 기부되어 주목받았고, AnyBlox는 **VLDB 최우수 논문상** 수상  
- Parquet 개발진은 이에 대응해 **사양 현대화 작업**을 추진  
- Pavlo가 참여한 **F3 포맷**은 **WASM 기반 디코더 내장**으로 상호운용성 문제 해결을 목표로 함  
- 차세대 경쟁은 **GPU 지원 여부**로 이어질 가능성이 높음  

### 인수합병·투자·폐업 동향
- 2025년 주요 인수 사례  
  - IBM이 **DataStax**와 **Confluent** 인수, Databricks가 **Neon·Tecton·Mooncake** 인수  
  - Snowflake가 **CrunchyData·Datometry**, Salesforce가 **Informatica**, Nvidia가 **HeavyDB** 인수  
  - Fivetran과 dbt Labs가 **전격 합병**, ETL 통합 플랫폼으로 재편  
- 주요 투자 라운드  
  - Databricks(40억·10억 달러), ClickHouse(3.5억 달러), Supabase(2억·1억 달러), Timescale(1.1억 달러) 등  
- 폐업 사례  
  - **Fauna**, **PostgresML**, **Hydra**, **MyScaleDB**, **Voltron Data**, **Apache Derby** 등  
  - IBM Research Almaden 연구소 폐쇄로 **DB 연구의 상징적 종착점** 언급  
- Pavlo는 GPU 기반 DB의 상업적 한계를 지적하며, **CPU 기반 OLAP 엔진의 성숙과 사용자 경험 중심 경쟁**을 강조  

### Larry Ellison의 ‘최고의 해’
- 2025년 Oracle 창업자 **Larry Ellison**이 **세계 최고 부자(3930억 달러)** 로 등극  
  - Oracle 주가 급등과 AI 데이터센터 투자로 자산 급증  
- Oracle은 **TikTok 미국 법인 인수**, **Paramount의 Warner Bros 인수 시도** 등 대형 거래에 관여  
- Pavlo는 Ellison의 행보를 “데이터베이스로 세상을 정복한 인물의 상징”으로 묘사  
  - 비판에도 불구하고 **Oracle의 영향력과 Ellison의 존재감**이 여전히 막강함  

### 결론
- 2025년 데이터베이스 산업은 **PostgreSQL 중심의 재편**, **AI·LLM 통합 가속화**, **대형 M&A와 폐업의 양극화**로 요약  
- Pavlo는 연구자와 업계 모두가 **보안·표준화·운영 자동화**에 집중해야 함을 강조  
- 마지막으로 CMU 연구진의 신규 스타트업 **Sydht.ai** 출범을 예고하며 글을 마무리

## Comments



### Comment 48728

- Author: neo
- Created: 2026-01-06T09:47:11+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=46496103) 
- CMU DB Group의 독특한 **강의 스타일**을 꼭 봐야 함  
  [YouTube 검색 결과](https://youtube.com/results?search_query=cmu+database)에서 확인할 수 있음.  
  특히 [gangsta 인트로](https://youtu.be/dSxV5Sob5V8)와 [DJ 세트](https://youtu.be/7NPIENPr-zk?t=85)가 정말 인상적이었음.  
  예전에 강의 중 누군가 바닥에서 자고 있던 영상도 기억남. Andy의 **이력과 맥락**이 더 궁금해짐  
  - Wu-Tang과 힙합 팬이라면 공감할 듯함. 그 인트로는 정말 멋졌음  
  - CMU의 “Intro to Database Systems”가 학부 수준인지, 내부 구조를 다루는 고급 과정인지 헷갈림. 데이터베이스 초보로서 적절한 입문 강좌를 찾고 싶음  
  - 링크에 “https://”를 붙여 클릭 가능하게 수정했음  

- 최근 몇 년간 리뷰에서 **immutable** 혹은 **bi-temporal 데이터베이스**가 언급되지 않은 점이 아쉬움  
  이런 DB는 특히 **핀테크 산업**에서 매우 유용함.  
  대표적으로 [XTDB v2 (2025)](https://xtdb.com/blog/launching-xtdb-v2)와 [Datomic Free (2023)](https://blog.datomic.com/2023/04/datomic-is-free.html)이 있음  
  - CMU에서 5주 전 XTDB 관련 [기술 세미나](https://db.cs.cmu.edu/events/futuredata-reconstructing-history-with-xtdb/)를 진행했음.  
    “그냥 존재한다”는 언급만으로 충분한지 궁금함  
  - PostgreSQL의 **tstzrange** 타입과 [pg_bitemporal 확장](https://github.com/hettie-d/pg_bitemporal)을 활용하면 꽤 멀리 갈 수 있음.  
    우리는 row trigger 기반 **감사 로그 시스템**으로 변경 이력과 undo 기능을 구현했음.  
    또한 로그를 별도 저장소로 옮겨 **오프라인 백업**도 유지함  
  - Immutable DB의 장점이 점점 인식되고 있음. 단순 감사 기능뿐 아니라 **동시 읽기**, 빠른 복제, 트랜잭션 undo 등 다양한 이점이 있음.  
    나는 현재 **immutable SQLite**를 개발 중임 — [xitdb-java](https://github.com/radarroark/xitdb-java)  
  - 일부는 triple store에 시간성과 불변성을 덧붙이고 있음. xtdb나 datomic이 SPARQL 그래프 탐색에서 느리기 때문임.  
    **시간 여행 지원 triple store**를 기대함  
  - 나도 비슷한 의견을 [다른 댓글](https://news.ycombinator.com/item?id=46503181)에 남겼음  

- 2025년 데이터베이스 트렌드는 두 가지로 요약됨  
  1️⃣ 모든 것을 **SQLite**로 이전  
  2️⃣ **JSON 필드** 중심 사용  
  SQLite는 단일 파일 구조와 데몬 없는 설계 덕분에 다루기 쉬움. JSON 함수 덕분에 유연한 데이터 처리도 즐거움  
  - 내 관점에서는 요즘은 전부 **DuckDB**임. 단일 파일, 다양한 포맷 지원, S3·Parquet·컬럼 저장소·WASM 등 완벽함  
  - 사실 “DB가 꼭 필요한가?” 싶음. SQLite는 완전한 DB와 직접 만든 객체 스토리지의 중간 지점임.  
    일종의 **정규화된 객체 접근 API**를 제공함  
  - SQLite가 다중 사용자 환경이 아닐 때, 동시에 여러 웹 연결이 쓰기를 수행하면 어느 정도까지 감당 가능한지 궁금함  
  - 예전엔 SQLite를 프로덕션에 쓰지 말라는 인식이 있었는데, 요즘은 바뀐 듯함  
  - 내 기준에서는 “가능하면 SQLite, 필요하면 PostgreSQL, 분석엔 DuckDB, 대규모 BI엔 BigQuery” 조합이 이상적임  

- Pavlo가 MCP 보안에 대해 회의적인 이유를 이해함. MCP는 **최소 권한 원칙**과 반대되는, 맥락 노출 중심의 철학을 가짐  
  DB를 이런 프로토콜로 노출하면 단순 데이터뿐 아니라 **스키마 복잡성**까지 모델에 드러남.  
  결국 **SQL 인젝션의 재현**처럼 느껴짐 — 이번엔 악의적 사용자가 아니라 모델의 환각이 원인임  
  - LLM이 **stateless**하다는 점을 이용해, 입력 맥락의 출처를 추적하고 위험한 상태 변경을 차단하는 **MCP 게이트웨이**를 만들었음.  
    Simon Willison의 lethal trifecta 프레임워크 기반이며, [open-edison](https://github.com/Edison-Watch/open-edison)에서 확인 가능함  
  - 프로덕션 환경에서 **쓰기 권한이 있는 DB MCP**를 쓰는 사람은 없을 것임. 그걸 프로토콜 탓으로 돌리는 건 부당함  
  - 우리가 원칙을 버릴 만큼의 가치가 있었는지 의문임. 아마도 “move fast, break things” 정신의 연장선일 뿐임  

- Immutable DB로의 전환이 필요하다고 느낌.  
  Datomic은 강력하지만 **복잡하고 학습 곡선이 가파름**, immudb는 아직 **프로덕션 준비 미흡**임.  
  수십만 레코드만 넘어도 문제가 생김  

- **Supabase**가 엄청난 성장세를 보임. YC 스타트업의 약 70%가 사용 중이라는 이야기도 들음.  
  이들이 나중에 **self-hosted**로 옮길지 궁금함  

- EdgeDB가 **Gel**로 이름을 바꾼 이유가 언급되었지만, 인수 섹션에도 추가됐어야 함.  
  Gel이 [Vercel에 합류](https://www.geldata.com/blog/gel-joins-vercel)했음  
  - 고마움. 블로그에 [정정 링크](https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html#erratum-gel)를 추가했음.  
    이런 변경을 자동으로 추적할 방법을 찾아야 함  
  - 솔직히 실망스러움. Vercel의 [공식 글](https://vercel.com/blog/investing-in-the-python-ecosystem)을 봐도 Gel의 미래가 불투명해 보임.  
    GitHub 마지막 커밋도 2주 전임  

- CMU의 Andy와 DB Group 덕분에 데이터베이스가 훨씬 **대중적**이 되었음. 정말 세계적 수준의 팀임  
  - 구체적으로 어떤 일을 했는지 궁금함  

- **PostgreSQL 18** 릴리스가 정말 훌륭함.  
  대부분은 async IO worker만 이야기하지만, **Unicode locale**, **unvalidated 제약조건 추가**, **가상 컬럼**, **btree skip scan**, **UUIDv7** 등도 큰 개선임  

- 최근 몇 년간의 **멀티이어 트렌드**가 인상적임.  
  Databricks와 Snowflake는 클라우드 경쟁 속에서도 **민첩성과 생존력**을 입증했음.  
  반면 Cloudera와 Hortonworks는 실패했음.  
  또한 **ClickHouse**는 조용히 자신만의 틈새를 완벽히 채워가고 있음
