1P by GN⁺ 1일전 | ★ favorite | 댓글 1개
  • 2019년부터 개인 생활의 모든 데이터를 수집·시각화해온 프로젝트로, 운동·수면·기분·위치·날씨 등 100여 가지 항목을 매일 기록
  • 38만 개의 데이터 포인트를 축적했으며, RescueTime·Foursquare Swarm·Apple Health 등 다양한 소스와 수작업 입력을 결합
  • 모든 데이터는 Postgres 기반 단일 데이터베이스에 저장되고, Ruby·JavaScript·Plotly로 시각화되어 공개
  • 프로젝트는 MIT 오픈소스로 공개되어 있으며, 개인 서버에서 완전 자가 호스팅 형태로 운영
  • 3년간의 실험 끝에 자체 구축의 효용은 제한적이라 결론 내렸지만, 자기 인식과 데이터 주권의 중요성을 체감한 사례로 남음

프로젝트 개요

  • 2019년부터 3년간 자신의 삶 전반의 지표를 정량화해온 개인 데이터 프로젝트
    • 하루 100개 이상의 항목을 기록하며, 피트니스·영양·사회생활·컴퓨터 사용·날씨 등을 포함
    • 총 38만 개의 데이터 포인트를 수집
  • 주요 데이터 소스
    • RescueTime: 웹사이트·앱 사용 기록 149,466건
    • Foursquare Swarm: 위치·방문 장소 126,285건
    • 수작업 입력: 기분·수면·건강·식습관 등 67,031건
    • Weather API: 날씨 데이터 15,442건
    • Apple Health: 걸음 수 3,048건

데이터베이스 구조와 기술 구성

  • 모든 데이터는 Postgres 기반 타임스탬프형 키-값 구조로 저장
    • 각 행은 timestamp, key, value로 구성
    • 시간대 차이를 고려해 날짜별로 자동 태깅하는 스크립트 작성
  • 데이터 입력
    • Telegram 봇을 통해 하루 여러 차례 질문에 응답
    • 락다운 기간, 운동 시즌 등은 기간 단위로 입력
  • 시각화 도구
    • Ruby·JavaScript·Plotly를 이용해 자체 분석 계층 구축
    • 48개의 그래프를 공개용으로 선택, 스냅샷 형태로 표시

주요 데이터 인사이트

  • 기분과 행동의 상관관계
    • 행복·흥분 상태일 때 명상 확률 44%↑, 독서·오디오북 28%↑, 음주 31%↑
  • 수면과 컨디션
    • 8.5시간 이상 수면 시 두통·감기 증상 확률 증가, 에너지 24%↓
  • 운동·체중 변화
    • 2020년 8월부터 ‘린 벌크’ 시작, 체중 +8.5kg, 안정시 심박수 +9bpm
    • 2014년 69kg → 2021년 89.8kg으로 증가
  • 위치·이동 패턴
    • 2016–17 샌프란시스코, 2018–19 뉴욕, 2020–21 빈 거주
    • 코로나19 이후 비행 횟수 급감, 락다운 영향 뚜렷
  • 기후와 생활 습관
    • 여름에는 걸음 수 33%↑, 음주 23%↑, 질병 40%↓
    • 겨울에는 온라인 쇼핑 100%↑, 감기 증상 45%↑

개인화된 데이터 활용 예시

  • Air Quality: 빈 자택의 방별 CO₂ 농도 측정, 침실 환기 문제 확인
  • Spotify 기록: 2013년 이후 48만 분(334일) 음악 청취, 20만 곡 중 49% 완청
  • Instagram Stories: 3년간 1,906개 게시, 팬데믹 기간 감소
  • GitHub 활동: fastlane(2014–2018) 이후 FxLifeSheet 등 개인 프로젝트 지속
  • 투자 관리: 2주마다 자산 분포 추적 및 시뮬레이션 수행

프라이버시와 오픈소스 철학

  • 모든 데이터는 본인 소유 서버에 저장, 외부 서비스와 연결되지 않음
  • 공개된 그래프는 개인 정보 노출이 없는 형태로 제한
  • “대기업이 이미 보유한 데이터를 개인도 직접 소유해야 한다”는 관점 강조
  • FxLifeSheet는 MIT 라이선스로 공개되어 누구나 수정·활용 가능

결론 및 2025년 업데이트

  • 3년간의 실험 결과, 직접 구축한 시스템은 시간 대비 효용이 낮음
    • 기대했던 만큼 놀라운 인사이트는 적었음
    • 그러나 자기 인식과 데이터 주권의 가치를 체험
  • 향후에는 기분 등 핵심 지표만 최소한으로 추적 예정
  • 2025년 현재 데이터 수집은 중단했으나, 웹사이트는 계속 유지 예정
Hacker News 의견들
  • 페이지 하단의 요약이 인상적이었음
    프로젝트를 수년간 구축하고 확장하며 데이터를 분석한 결과, 직접 솔루션을 만드는 건 시간 대비 가치가 낮았음
    처음엔 놀라운 통찰을 기대했지만, 실제로는 몇 가지 흥미로운 그래프 외엔 수백 시간을 투자할 만큼의 보상이 없었음
    Quantified Self’ 운동은 어쩌면 강박적 완벽주의에 더 가까운 것 같음

    • 나는 10년 가까이 Apple Watch를 착용해왔음
      평소엔 별 의미 없어 보이던 데이터가, 어느 날 심장 질환 오진을 막는 핵심 정보가 되었음
      오랜 기간의 안정된 기록이 있었기에 의사가 잘못된 판단을 바로잡을 수 있었음
      데이터의 가치는 오랜 시간 후 갑자기 드러나는 순간적 효용에 있음
    • 나도 예전에 수면 트래커를 써봤는데, 몇 달 지나니 이미 내 몸이 알고 있는 사실만 확인하는 수준이었음
      “좋은 수면”이라 알려줘도 이미 기분으로 느끼고 있었고, 데이터가 내 행동을 바꾸진 않았음
      결국 데이터 시각화의 재미 외엔 실질적 변화가 없었음
    • 나도 여러 생활 지표 추적 실험을 해봤음
      칼로리, 영양소, 수면, 운동, 공기질, 기분 등 다양하게 기록했지만, 몇 주 지나면 수익 대비 노력의 한계가 명확해졌음
      다만 실험을 일정 기간으로 제한하면 유용한 통찰을 얻을 수 있었음
      매일 데이터를 쌓는 건 강박적일 수 있지만, 시간 제한 실험으로 접근하면 충분히 의미 있음
    • 나도 비슷한 시도를 했음
      Reddit, HN, Slashdot 댓글 18년치와 LLM 대화 3년치를 모아 RAG 실험을 했는데, 오히려 창의성이 감소했음
      모델이 내 과거 생각에 갇혀버려 새로움이 사라졌음
      결국 데이터는 과거를 향하지만, 나는 미래로 향하는 모델을 원했음
    • 나는 일기, 스케치, 사진, 위치 데이터를 결합한 개인 기록 시스템을 만들었음
      특히 감정 기록이 가장 도움이 되었음 — 감정을 적는 행위가 곧 인식과 반성의 과정이 되었음
      과거의 감정과 사건을 읽는 건 단순히 유용함을 넘어 자기 서사의 섬세한 결을 만들어줌
  • 단순 계산만으로도 Felix의 항공 여행 CO₂ 배출량이 연간 70~110톤에 달함
    파리협정 기준(1인당 1.5톤)을 감안하면, 유럽 평균의 10~15배, 1.5°C 목표 대비 50배 이상임

    • 환경 보호를 위해 비행을 줄이고 싶다면 세금 인상이 현실적임
      개인을 비난하는 건 비생산적이며, 행동 변화를 이끄는 건 결국 비용 구조의 변화
      설령 비용이 10배가 되어도, 경제적 이유로 계속 비행할 사람은 존재함
    • 나는 항공기 조종사로, 지난 10년간 약 65,658톤의 CO₂를 배출했음을 계산했음
      좌석 거리당으로 보면 덜 심각하지만, 그래도 충격적인 수치
      통계 페이지
    • 나도 같은 생각임
      이 정도 배출량을 부끄러움 없이 받아들이기 어렵다는 점이 핵심임
      한 개인이 작은 국가 수준의 CO₂를 내뿜는 건 충격적임
    • 미국 평균과 비교해도, 교통이 차지하는 비중은 30% 정도이고 비행은 그중 일부에 불과함
      따라서 그의 총 배출량은 훨씬 더 높을 가능성이 큼
  • 내 경험상 객관적 지표(영양, 수면) 는 유용하지만, 주관적 지표(기분, 스트레스) 는 변동이 커서 의미가 적었음
    핵심은 데이터 입력의 마찰을 줄이고 시각화를 쉽게 하는 것
    나는 iPhone Action + Obsidian + QuickAdd 스크립트로 자동화했고, Dataview와 Chart.js로 시각화함
    이 조합에 매우 만족 중임

    • 네 설명이 흥미로움
      나는 Reflect라는 셀프 트래킹 앱을 만들고 있는데, 네 의견을 듣고 싶음
      Reflect 앱 링크
    • 나는 기분 추적도 가치 있다고 생각함
      꾸준히 기록하다 보면 자신의 감정 패턴을 인식하게 되고, 스스로의 핑계를 덜 하게 됨
  • 많은 사람들이 냉소적으로 보지만, 이 프로젝트의 시각화와 데이터 규모는 정말 인상적임
    특히 ‘My Life in Weeks’ 표현 방식은 멋져서 나도 써보고 싶음

  • “Palantir DB에 내 인간 ID로 쿼리하면 내 인생 데이터가 다 나올 것”이라는 농담이 있었음

    • 웃기지만 씁쓸한 현실 풍자로 느껴졌음
    • “구독료가 너무 비싸서 못 씀”이라며 농담으로 응수함
  • 이 프로젝트는 내 꿈이자 악몽
    예전엔 Quantified Self 운동에 빠져 Fitbit, Withings API를 다뤘지만, 기록의 피로감이 결국 흥미를 갉아먹었음
    이제는 LLM이 이 비용을 줄여줄 수 있을 거라 기대함
    최근엔 MacroFactor로 영양소를 추적 중인데, 처음으로 데이터가 행동으로 이어지는 경험을 하고 있음
    금융 데이터도 자동화해 Plaid API로 세금 정리를 완성했음
    결론적으로, 모든 걸 직접 구축하는 건 과하지만, 일부 데이터만 잘 활용해도 충분히 가치 있음

    • 나도 여러 활동을 추적해봤는데, 감시받는다는 인식만으로도 습관이 바뀜을 느꼈음
      예를 들어 GCM을 착용했을 때, 무의식적으로 더 건강하게 행동하려 했음
      데이터 분석보다 관찰 자체가 행동 변화를 유도
  • “겨울엔 태양 에너지 노출이 적다”는 표현이 재밌었음
    어쩌면 이 문장이 프로젝트 전체의 시각적 사고방식을 설명하는지도 모르겠음

  • 나도 비슷한 시스템을 만들었지만 훨씬 단순함
    Apple Health, 은행 CSV, Git 커밋 데이터를 SQLite로 통합했음
    실제 유용했던 건 단순한 쿼리였음 — 수면 시간과 커밋 빈도 상관관계, 프로젝트 시작 시 소비 급증 등
    핵심은 데이터를 한곳에 모으는 것, 그 이상은 수익 대비 노력의 한계가 큼

    • 은행 CSV 자동화는 얼마나 어려웠는지 궁금함
  • 나는 타사 서비스에 내 데이터가 저장되는 게 불편
    하지만 여러 소스를 결합해 하나의 그림을 만드는 건 흥미로움
    다만 건강 데이터와 위치, 날씨를 연관짓는 건 의미가 불분명하다고 느낌
    이런 프로젝트는 자체 호스팅일 때 훨씬 안심됨

  • 개인 데이터의 단일 쿼리 가능한 DB 개념은 매력적임
    하지만 진짜 어려운 건 저장이 아니라 데이터 수집과 정규화
    기업에서도 비슷한 문제를 겪음 — 여러 출처의 정보를 하나의 Company Intelligence DB로 통합할 때
    스키마를 초기에 통제하는 접근이 옳음, 스키마 드리프트가 장기 프로젝트의 최대 리스크임
    어떤 스토리지 엔진을 쓰는지, 그리고 시간 데이터 스냅샷을 어떻게 관리하는지도 궁금함