2025년 데이터베이스 결산
(cs.cmu.edu)- 2025년은 PostgreSQL의 지배력 강화, MCP 표준 확산, 대형 인수합병, 파일 포맷 경쟁 재점화, Larry Ellison의 부상 등으로 요약되는 해였음
- PostgreSQL은 주요 클라우드 기업의 핵심 DBaaS로 자리 잡았고, 분산형 프로젝트(Multigres, Neki, PgDog) 가 새롭게 등장
- 모든 주요 DBMS가 Anthropic의 Model Context Protocol(MCP) 을 도입하며 LLM과 데이터베이스의 통합이 본격화
- MongoDB가 FerretDB를 상대로 API 복제 관련 소송을 제기했고, 파일 포맷 분야에서는 Parquet 대체 경쟁이 격화
- 업계 전반의 인수·폐업·자금 조달이 활발히 이어지며, 데이터베이스 산업의 재편과 집중화가 가속화된 한 해로 평가됨
PostgreSQL의 지속적 확장
- PostgreSQL 18 버전이 2025년 11월 공개되어 비동기 I/O 스토리지 서브시스템과 skip scan 기능을 도입
- OS 페이지 캐시 의존도를 줄이고, 다중 키 인덱스 활용을 개선
- Databricks가 Neon을 10억 달러에, Snowflake가 CrunchyData를 2억5천만 달러에 인수
- Microsoft는 HorizonDB를 출시하며 주요 클라우드 기업 모두 PostgreSQL 기반 서비스를 보유하게 됨
- Supabase의 Multigres, PlanetScale의 Neki, PgDog 등 분산형 PostgreSQL 프로젝트가 새로 등장
- Supabase는 Vitess 공동창업자 Sugu를 영입해 샤딩 미들웨어 개발 주도
- 독립 PostgreSQL 서비스로는 Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge, Nile 등이 활동
- Hydra, PostgresML 등 일부 스타트업은 2025년에 폐업
- PostgreSQL 중심의 M&A 경쟁과 기술 진화가 업계의 핵심 동력으로 작용
MCP(Model Context Protocol)의 전면 확산
- 2025년에는 모든 주요 DBMS가 Anthropic의 MCP 표준을 지원
- MCP는 LLM이 데이터베이스와 상호작용할 수 있도록 하는 JSON-RPC 기반 인터페이스
- OpenAI가 2025년 3월 MCP 지원을 발표한 이후, ClickHouse, Snowflake, Oracle, MongoDB 등 주요 시스템이 MCP 서버를 출시
- PostgreSQL 기반 서비스들도 각각 독자 MCP 서버를 제공 (Supabase, Timescale, Xata 등)
- MCP 서버는 단일 요청 단위로 데이터베이스에 접근하며, 이기종 DB 간 조인 기능은 미지원
- Neon은 데이터 브랜칭 기능을 통해 AI 에이전트가 생성하는 DB의 80% 를 담당
- 보안 측면에서 권한 최소화와 자동 보호 메커니즘의 필요성이 강조됨
- 일부 시스템은 읽기 전용 제한, 쿼리 타임아웃, 결과 제한 등 기본 보호 기능 제공
MongoDB와 FerretDB의 법적 분쟁
- MongoDB가 2025년 FerretDB를 상대로 특허·저작권·상표권 침해 소송 제기
- FerretDB는 MongoDB 쿼리를 PostgreSQL로 변환하는 미들웨어 프록시로, “drop-in replacement” 문구 사용이 문제로 지적됨
- Microsoft는 MongoDB 호환 오픈소스 DocumentDB를 Linux Foundation에 기부
- Amazon, Yugabyte 등도 프로젝트에 참여
- MongoDB의 “비관계형 DB를 개척했다”는 주장에 대해, 1960년대 IDS, IMS 등 선행 시스템이 존재했음을 지적
- FerretDB의 초기 이름이 “MangoDB”였던 점이 상표 혼동 논란으로 언급됨
파일 포맷 경쟁의 재점화
- 2025년에는 Parquet의 아성에 도전하는 5개의 신규 오픈소스 파일 포맷 등장
- FastLanes(CWI), F3(CMU+칭화대), Vortex(SpiralDB), AnyBlox(독일 연구진), Amudai(Microsoft)
- SpiralDB의 Vortex는 Linux Foundation에 기부되어 주목받았고, AnyBlox는 VLDB 최우수 논문상 수상
- Parquet 개발진은 이에 대응해 사양 현대화 작업을 추진
- Pavlo가 참여한 F3 포맷은 WASM 기반 디코더 내장으로 상호운용성 문제 해결을 목표로 함
- 차세대 경쟁은 GPU 지원 여부로 이어질 가능성이 높음
인수합병·투자·폐업 동향
- 2025년 주요 인수 사례
- IBM이 DataStax와 Confluent 인수, Databricks가 Neon·Tecton·Mooncake 인수
- Snowflake가 CrunchyData·Datometry, Salesforce가 Informatica, Nvidia가 HeavyDB 인수
- Fivetran과 dbt Labs가 전격 합병, ETL 통합 플랫폼으로 재편
- 주요 투자 라운드
- Databricks(40억·10억 달러), ClickHouse(3.5억 달러), Supabase(2억·1억 달러), Timescale(1.1억 달러) 등
- 폐업 사례
- Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby 등
- IBM Research Almaden 연구소 폐쇄로 DB 연구의 상징적 종착점 언급
- Pavlo는 GPU 기반 DB의 상업적 한계를 지적하며, CPU 기반 OLAP 엔진의 성숙과 사용자 경험 중심 경쟁을 강조
Larry Ellison의 ‘최고의 해’
- 2025년 Oracle 창업자 Larry Ellison이 세계 최고 부자(3930억 달러) 로 등극
- Oracle 주가 급등과 AI 데이터센터 투자로 자산 급증
- Oracle은 TikTok 미국 법인 인수, Paramount의 Warner Bros 인수 시도 등 대형 거래에 관여
- Pavlo는 Ellison의 행보를 “데이터베이스로 세상을 정복한 인물의 상징”으로 묘사
- 비판에도 불구하고 Oracle의 영향력과 Ellison의 존재감이 여전히 막강함
결론
- 2025년 데이터베이스 산업은 PostgreSQL 중심의 재편, AI·LLM 통합 가속화, 대형 M&A와 폐업의 양극화로 요약
- Pavlo는 연구자와 업계 모두가 보안·표준화·운영 자동화에 집중해야 함을 강조
- 마지막으로 CMU 연구진의 신규 스타트업 Sydht.ai 출범을 예고하며 글을 마무리
Hacker News 의견들
-
CMU DB Group의 독특한 강의 스타일을 꼭 봐야 함
YouTube 검색 결과에서 확인할 수 있음.
특히 gangsta 인트로와 DJ 세트가 정말 인상적이었음.
예전에 강의 중 누군가 바닥에서 자고 있던 영상도 기억남. Andy의 이력과 맥락이 더 궁금해짐- Wu-Tang과 힙합 팬이라면 공감할 듯함. 그 인트로는 정말 멋졌음
- CMU의 “Intro to Database Systems”가 학부 수준인지, 내부 구조를 다루는 고급 과정인지 헷갈림. 데이터베이스 초보로서 적절한 입문 강좌를 찾고 싶음
- 링크에 “https://”를 붙여 클릭 가능하게 수정했음
-
최근 몇 년간 리뷰에서 immutable 혹은 bi-temporal 데이터베이스가 언급되지 않은 점이 아쉬움
이런 DB는 특히 핀테크 산업에서 매우 유용함.
대표적으로 XTDB v2 (2025)와 Datomic Free (2023)이 있음- CMU에서 5주 전 XTDB 관련 기술 세미나를 진행했음.
“그냥 존재한다”는 언급만으로 충분한지 궁금함 - PostgreSQL의 tstzrange 타입과 pg_bitemporal 확장을 활용하면 꽤 멀리 갈 수 있음.
우리는 row trigger 기반 감사 로그 시스템으로 변경 이력과 undo 기능을 구현했음.
또한 로그를 별도 저장소로 옮겨 오프라인 백업도 유지함 - Immutable DB의 장점이 점점 인식되고 있음. 단순 감사 기능뿐 아니라 동시 읽기, 빠른 복제, 트랜잭션 undo 등 다양한 이점이 있음.
나는 현재 immutable SQLite를 개발 중임 — xitdb-java - 일부는 triple store에 시간성과 불변성을 덧붙이고 있음. xtdb나 datomic이 SPARQL 그래프 탐색에서 느리기 때문임.
시간 여행 지원 triple store를 기대함 - 나도 비슷한 의견을 다른 댓글에 남겼음
- CMU에서 5주 전 XTDB 관련 기술 세미나를 진행했음.
-
2025년 데이터베이스 트렌드는 두 가지로 요약됨
1️⃣ 모든 것을 SQLite로 이전
2️⃣ JSON 필드 중심 사용
SQLite는 단일 파일 구조와 데몬 없는 설계 덕분에 다루기 쉬움. JSON 함수 덕분에 유연한 데이터 처리도 즐거움- 내 관점에서는 요즘은 전부 DuckDB임. 단일 파일, 다양한 포맷 지원, S3·Parquet·컬럼 저장소·WASM 등 완벽함
- 사실 “DB가 꼭 필요한가?” 싶음. SQLite는 완전한 DB와 직접 만든 객체 스토리지의 중간 지점임.
일종의 정규화된 객체 접근 API를 제공함 - SQLite가 다중 사용자 환경이 아닐 때, 동시에 여러 웹 연결이 쓰기를 수행하면 어느 정도까지 감당 가능한지 궁금함
- 예전엔 SQLite를 프로덕션에 쓰지 말라는 인식이 있었는데, 요즘은 바뀐 듯함
- 내 기준에서는 “가능하면 SQLite, 필요하면 PostgreSQL, 분석엔 DuckDB, 대규모 BI엔 BigQuery” 조합이 이상적임
-
Pavlo가 MCP 보안에 대해 회의적인 이유를 이해함. MCP는 최소 권한 원칙과 반대되는, 맥락 노출 중심의 철학을 가짐
DB를 이런 프로토콜로 노출하면 단순 데이터뿐 아니라 스키마 복잡성까지 모델에 드러남.
결국 SQL 인젝션의 재현처럼 느껴짐 — 이번엔 악의적 사용자가 아니라 모델의 환각이 원인임- LLM이 stateless하다는 점을 이용해, 입력 맥락의 출처를 추적하고 위험한 상태 변경을 차단하는 MCP 게이트웨이를 만들었음.
Simon Willison의 lethal trifecta 프레임워크 기반이며, open-edison에서 확인 가능함 - 프로덕션 환경에서 쓰기 권한이 있는 DB MCP를 쓰는 사람은 없을 것임. 그걸 프로토콜 탓으로 돌리는 건 부당함
- 우리가 원칙을 버릴 만큼의 가치가 있었는지 의문임. 아마도 “move fast, break things” 정신의 연장선일 뿐임
- LLM이 stateless하다는 점을 이용해, 입력 맥락의 출처를 추적하고 위험한 상태 변경을 차단하는 MCP 게이트웨이를 만들었음.
-
Immutable DB로의 전환이 필요하다고 느낌.
Datomic은 강력하지만 복잡하고 학습 곡선이 가파름, immudb는 아직 프로덕션 준비 미흡임.
수십만 레코드만 넘어도 문제가 생김 -
Supabase가 엄청난 성장세를 보임. YC 스타트업의 약 70%가 사용 중이라는 이야기도 들음.
이들이 나중에 self-hosted로 옮길지 궁금함 -
EdgeDB가 Gel로 이름을 바꾼 이유가 언급되었지만, 인수 섹션에도 추가됐어야 함.
Gel이 Vercel에 합류했음 -
CMU의 Andy와 DB Group 덕분에 데이터베이스가 훨씬 대중적이 되었음. 정말 세계적 수준의 팀임
- 구체적으로 어떤 일을 했는지 궁금함
-
PostgreSQL 18 릴리스가 정말 훌륭함.
대부분은 async IO worker만 이야기하지만, Unicode locale, unvalidated 제약조건 추가, 가상 컬럼, btree skip scan, UUIDv7 등도 큰 개선임 -
최근 몇 년간의 멀티이어 트렌드가 인상적임.
Databricks와 Snowflake는 클라우드 경쟁 속에서도 민첩성과 생존력을 입증했음.
반면 Cloudera와 Hortonworks는 실패했음.
또한 ClickHouse는 조용히 자신만의 틈새를 완벽히 채워가고 있음