나는 내 인생 전체를 하나의 데이터베이스에 담았다
(howisfelix.today)- 2019년부터 개인 생활의 모든 데이터를 수집·시각화해온 프로젝트로, 운동·수면·기분·위치·날씨 등 100여 가지 항목을 매일 기록
- 약 38만 개의 데이터 포인트를 축적했으며, RescueTime·Foursquare Swarm·Apple Health 등 다양한 소스와 수작업 입력을 결합
- 모든 데이터는 Postgres 기반 단일 데이터베이스에 저장되고, Ruby·JavaScript·Plotly로 시각화되어 공개
- 프로젝트는 MIT 오픈소스로 공개되어 있으며, 개인 서버에서 완전 자가 호스팅 형태로 운영
- 3년간의 실험 끝에 자체 구축의 효용은 제한적이라 결론 내렸지만, 자기 인식과 데이터 주권의 중요성을 체감한 사례로 남음
프로젝트 개요
- 2019년부터 3년간 자신의 삶 전반의 지표를 정량화해온 개인 데이터 프로젝트
- 하루 100개 이상의 항목을 기록하며, 피트니스·영양·사회생활·컴퓨터 사용·날씨 등을 포함
- 총 38만 개의 데이터 포인트를 수집
- 주요 데이터 소스
- RescueTime: 웹사이트·앱 사용 기록 149,466건
- Foursquare Swarm: 위치·방문 장소 126,285건
- 수작업 입력: 기분·수면·건강·식습관 등 67,031건
- Weather API: 날씨 데이터 15,442건
- Apple Health: 걸음 수 3,048건
데이터베이스 구조와 기술 구성
- 모든 데이터는 Postgres 기반 타임스탬프형 키-값 구조로 저장
- 각 행은
timestamp,key,value로 구성 - 시간대 차이를 고려해 날짜별로 자동 태깅하는 스크립트 작성
- 각 행은
-
데이터 입력
- Telegram 봇을 통해 하루 여러 차례 질문에 응답
- 락다운 기간, 운동 시즌 등은 기간 단위로 입력
-
시각화 도구
- Ruby·JavaScript·Plotly를 이용해 자체 분석 계층 구축
- 48개의 그래프를 공개용으로 선택, 스냅샷 형태로 표시
주요 데이터 인사이트
-
기분과 행동의 상관관계
- 행복·흥분 상태일 때 명상 확률 44%↑, 독서·오디오북 28%↑, 음주 31%↑
-
수면과 컨디션
- 8.5시간 이상 수면 시 두통·감기 증상 확률 증가, 에너지 24%↓
-
운동·체중 변화
- 2020년 8월부터 ‘린 벌크’ 시작, 체중 +8.5kg, 안정시 심박수 +9bpm
- 2014년 69kg → 2021년 89.8kg으로 증가
-
위치·이동 패턴
- 2016–17 샌프란시스코, 2018–19 뉴욕, 2020–21 빈 거주
- 코로나19 이후 비행 횟수 급감, 락다운 영향 뚜렷
-
기후와 생활 습관
- 여름에는 걸음 수 33%↑, 음주 23%↑, 질병 40%↓
- 겨울에는 온라인 쇼핑 100%↑, 감기 증상 45%↑
개인화된 데이터 활용 예시
- Air Quality: 빈 자택의 방별 CO₂ 농도 측정, 침실 환기 문제 확인
- Spotify 기록: 2013년 이후 48만 분(334일) 음악 청취, 20만 곡 중 49% 완청
- Instagram Stories: 3년간 1,906개 게시, 팬데믹 기간 감소
- GitHub 활동: fastlane(2014–2018) 이후 FxLifeSheet 등 개인 프로젝트 지속
- 투자 관리: 2주마다 자산 분포 추적 및 시뮬레이션 수행
프라이버시와 오픈소스 철학
- 모든 데이터는 본인 소유 서버에 저장, 외부 서비스와 연결되지 않음
- 공개된 그래프는 개인 정보 노출이 없는 형태로 제한
- “대기업이 이미 보유한 데이터를 개인도 직접 소유해야 한다”는 관점 강조
- FxLifeSheet는 MIT 라이선스로 공개되어 누구나 수정·활용 가능
결론 및 2025년 업데이트
- 3년간의 실험 결과, 직접 구축한 시스템은 시간 대비 효용이 낮음
- 기대했던 만큼 놀라운 인사이트는 적었음
- 그러나 자기 인식과 데이터 주권의 가치를 체험
- 향후에는 기분 등 핵심 지표만 최소한으로 추적 예정
- 2025년 현재 데이터 수집은 중단했으나, 웹사이트는 계속 유지 예정
Hacker News 의견들
-
페이지 하단의 요약이 인상적이었음
프로젝트를 수년간 구축하고 확장하며 데이터를 분석한 결과, 직접 솔루션을 만드는 건 시간 대비 가치가 낮았음
처음엔 놀라운 통찰을 기대했지만, 실제로는 몇 가지 흥미로운 그래프 외엔 수백 시간을 투자할 만큼의 보상이 없었음
‘Quantified Self’ 운동은 어쩌면 강박적 완벽주의에 더 가까운 것 같음- 나는 10년 가까이 Apple Watch를 착용해왔음
평소엔 별 의미 없어 보이던 데이터가, 어느 날 심장 질환 오진을 막는 핵심 정보가 되었음
오랜 기간의 안정된 기록이 있었기에 의사가 잘못된 판단을 바로잡을 수 있었음
데이터의 가치는 오랜 시간 후 갑자기 드러나는 순간적 효용에 있음 - 나도 예전에 수면 트래커를 써봤는데, 몇 달 지나니 이미 내 몸이 알고 있는 사실만 확인하는 수준이었음
“좋은 수면”이라 알려줘도 이미 기분으로 느끼고 있었고, 데이터가 내 행동을 바꾸진 않았음
결국 데이터 시각화의 재미 외엔 실질적 변화가 없었음 - 나도 여러 생활 지표 추적 실험을 해봤음
칼로리, 영양소, 수면, 운동, 공기질, 기분 등 다양하게 기록했지만, 몇 주 지나면 수익 대비 노력의 한계가 명확해졌음
다만 실험을 일정 기간으로 제한하면 유용한 통찰을 얻을 수 있었음
매일 데이터를 쌓는 건 강박적일 수 있지만, 시간 제한 실험으로 접근하면 충분히 의미 있음 - 나도 비슷한 시도를 했음
Reddit, HN, Slashdot 댓글 18년치와 LLM 대화 3년치를 모아 RAG 실험을 했는데, 오히려 창의성이 감소했음
모델이 내 과거 생각에 갇혀버려 새로움이 사라졌음
결국 데이터는 과거를 향하지만, 나는 미래로 향하는 모델을 원했음 - 나는 일기, 스케치, 사진, 위치 데이터를 결합한 개인 기록 시스템을 만들었음
특히 감정 기록이 가장 도움이 되었음 — 감정을 적는 행위가 곧 인식과 반성의 과정이 되었음
과거의 감정과 사건을 읽는 건 단순히 유용함을 넘어 자기 서사의 섬세한 결을 만들어줌
- 나는 10년 가까이 Apple Watch를 착용해왔음
-
단순 계산만으로도 Felix의 항공 여행 CO₂ 배출량이 연간 70~110톤에 달함
파리협정 기준(1인당 1.5톤)을 감안하면, 유럽 평균의 10~15배, 1.5°C 목표 대비 50배 이상임- 환경 보호를 위해 비행을 줄이고 싶다면 세금 인상이 현실적임
개인을 비난하는 건 비생산적이며, 행동 변화를 이끄는 건 결국 비용 구조의 변화임
설령 비용이 10배가 되어도, 경제적 이유로 계속 비행할 사람은 존재함 - 나는 항공기 조종사로, 지난 10년간 약 65,658톤의 CO₂를 배출했음을 계산했음
좌석 거리당으로 보면 덜 심각하지만, 그래도 충격적인 수치임
통계 페이지 - 나도 같은 생각임
이 정도 배출량을 부끄러움 없이 받아들이기 어렵다는 점이 핵심임
한 개인이 작은 국가 수준의 CO₂를 내뿜는 건 충격적임 - 미국 평균과 비교해도, 교통이 차지하는 비중은 30% 정도이고 비행은 그중 일부에 불과함
따라서 그의 총 배출량은 훨씬 더 높을 가능성이 큼
- 환경 보호를 위해 비행을 줄이고 싶다면 세금 인상이 현실적임
-
내 경험상 객관적 지표(영양, 수면) 는 유용하지만, 주관적 지표(기분, 스트레스) 는 변동이 커서 의미가 적었음
핵심은 데이터 입력의 마찰을 줄이고 시각화를 쉽게 하는 것임
나는 iPhone Action + Obsidian + QuickAdd 스크립트로 자동화했고, Dataview와 Chart.js로 시각화함
이 조합에 매우 만족 중임- 네 설명이 흥미로움
나는 Reflect라는 셀프 트래킹 앱을 만들고 있는데, 네 의견을 듣고 싶음
Reflect 앱 링크 - 나는 기분 추적도 가치 있다고 생각함
꾸준히 기록하다 보면 자신의 감정 패턴을 인식하게 되고, 스스로의 핑계를 덜 하게 됨
- 네 설명이 흥미로움
-
많은 사람들이 냉소적으로 보지만, 이 프로젝트의 시각화와 데이터 규모는 정말 인상적임
특히 ‘My Life in Weeks’ 표현 방식은 멋져서 나도 써보고 싶음 -
“Palantir DB에 내 인간 ID로 쿼리하면 내 인생 데이터가 다 나올 것”이라는 농담이 있었음
- 웃기지만 씁쓸한 현실 풍자로 느껴졌음
- “구독료가 너무 비싸서 못 씀”이라며 농담으로 응수함
-
이 프로젝트는 내 꿈이자 악몽임
예전엔 Quantified Self 운동에 빠져 Fitbit, Withings API를 다뤘지만, 기록의 피로감이 결국 흥미를 갉아먹었음
이제는 LLM이 이 비용을 줄여줄 수 있을 거라 기대함
최근엔 MacroFactor로 영양소를 추적 중인데, 처음으로 데이터가 행동으로 이어지는 경험을 하고 있음
금융 데이터도 자동화해 Plaid API로 세금 정리를 완성했음
결론적으로, 모든 걸 직접 구축하는 건 과하지만, 일부 데이터만 잘 활용해도 충분히 가치 있음- 나도 여러 활동을 추적해봤는데, 감시받는다는 인식만으로도 습관이 바뀜을 느꼈음
예를 들어 GCM을 착용했을 때, 무의식적으로 더 건강하게 행동하려 했음
데이터 분석보다 관찰 자체가 행동 변화를 유도함
- 나도 여러 활동을 추적해봤는데, 감시받는다는 인식만으로도 습관이 바뀜을 느꼈음
-
“겨울엔 태양 에너지 노출이 적다”는 표현이 재밌었음
어쩌면 이 문장이 프로젝트 전체의 시각적 사고방식을 설명하는지도 모르겠음 -
나도 비슷한 시스템을 만들었지만 훨씬 단순함
Apple Health, 은행 CSV, Git 커밋 데이터를 SQLite로 통합했음
실제 유용했던 건 단순한 쿼리였음 — 수면 시간과 커밋 빈도 상관관계, 프로젝트 시작 시 소비 급증 등
핵심은 데이터를 한곳에 모으는 것, 그 이상은 수익 대비 노력의 한계가 큼- 은행 CSV 자동화는 얼마나 어려웠는지 궁금함
-
나는 타사 서비스에 내 데이터가 저장되는 게 불편함
하지만 여러 소스를 결합해 하나의 그림을 만드는 건 흥미로움
다만 건강 데이터와 위치, 날씨를 연관짓는 건 의미가 불분명하다고 느낌
이런 프로젝트는 자체 호스팅일 때 훨씬 안심됨 -
개인 데이터의 단일 쿼리 가능한 DB 개념은 매력적임
하지만 진짜 어려운 건 저장이 아니라 데이터 수집과 정규화임
기업에서도 비슷한 문제를 겪음 — 여러 출처의 정보를 하나의 Company Intelligence DB로 통합할 때
스키마를 초기에 통제하는 접근이 옳음, 스키마 드리프트가 장기 프로젝트의 최대 리스크임
어떤 스토리지 엔진을 쓰는지, 그리고 시간 데이터 스냅샷을 어떻게 관리하는지도 궁금함