개인 백과사전

(whoami.wiki)

18P by GN⁺ 3달전 | ★ favorite | 댓글 1개

할머니집에서 발견한 1,351장의 가족 사진을 정리하며 기억을 구조화하기 위해 MediaWiki 기반 개인 위키를 구축
위키 형식으로 사진, 인물, 사건을 연결하면서 가족사와 개인사를 기사 형태로 재구성
이후 Google Photos, 위치 기록, 금융 거래, 음악 인식 데이터 등 다양한 디지털 흔적을 통합해 Claude Code와 언어 모델로 자동 페이지 생성을 실험
이 과정에서 모델이 기억의 공백을 복원하고, 대화·여행·우정의 흐름을 데이터 기반 서사로 재편함
결과적으로 whoami.wiki 오픈소스 프로젝트로 발전해, 개인이 자신의 데이터를 백과사전처럼 탐색하고 소유할 수 있는 체계를 제시함

개인 백과사전 프로젝트의 시작

팬데믹 이후 처음으로 할머니 집을 방문해 1,351장의 오래된 사진을 발견하고 정리 작업을 시작함
- 사진에는 조부모의 젊은 시절부터 본인의 중학교 시절까지가 포함됨
- 초기 분류는 필름 종류나 사진 비율 등 물리적 속성을 기준으로 진행
사진을 정리하며 기억의 단편적인 이야기들이 떠올랐으나, 순서나 맥락이 불분명했음
- EXIF 메타데이터가 없던 시기의 사진이라 시간 순서 파악이 어려움
할머니와 함께 사진을 재배열하며 결혼식 당시의 기억을 구술로 기록
- 인물 이름과 사건을 메모하고, 일부는 젊은 시절의 친척으로 확인
기록을 정리해 MediaWiki를 로컬에서 실행, 실제 위키백과 형식으로 편집
- 인포박스, 본문, 사진 캡션, 인물 링크 등을 포함한 구조적 페이지 작성
- 관련된 법률 개정, 의식, 장소 등은 실제 위키백과 페이지에 연결

위키 소프트웨어를 통한 기억의 재구성

이틀 만에 사진의 역사적 배경을 완성된 기사 형태로 정리
- 위키 소프트웨어가 지식과 미디어를 보존하는 강력한 도구임을 체감
이후 수개월간 가족 사진 전체를 위키 페이지로 확장
- r/genealogy 커뮤니티의 조언을 받아 구술사 기록 방식을 개선
- 음성 전사와 언어 모델을 활용해 편집 효율을 높임
위키 형식 덕분에 사건과 인물 간의 연결 관계를 쉽게 파악
- 예를 들어, 조부모 결혼식의 가수가 본인을 출산한 간호사였음을 발견

디지털 데이터와 언어 모델의 결합

이후 Google Photos의 디지털 사진으로 확장
- EXIF 메타데이터를 통해 날짜, 시간, 위치 정보를 활용 가능
2012년 가족 여행 사진 625장을 대상으로 Claude Code에 위키 페이지 생성을 요청
- ImageMagick으로 만든 콘택트 시트를 참고해 이미지 탐색
- 모델은 시각 정보와 타임스탬프만으로 장소와 활동을 재구성
- 교통수단, 방문지, 인물 식별 등 세부 묘사 포함
작성된 초안에 본인의 일화 목록을 추가해 서사 완성

복합 데이터 통합 실험

2022년 멕시코시티 여행 데이터를 대상으로 확장
- 291장의 사진, 343개의 동영상, Google Maps 위치 기록, Uber 이동, 은행 거래, Shazam 기록을 통합
Claude Code가 수행한 주요 작업
1. 은행 거래와 위치 데이터를 교차 분석해 방문한 식당 확인
2. 티켓 결제 내역으로 축구 경기의 팀과 대회명 식별
3. Uber 이동 기록으로 이동 시간과 위치 파악
4. Shazam 기록으로 장소별 음악 장르 기술
5. 저녁 식사 중 기타 연주 장면을 영상 프레임에서 찾아 페이지에 삽입
MediaWiki의 토론 페이지, 카테고리, 수정 이력 기능을 그대로 활용
- 새로운 데이터가 추가될 때마다 실제 위키 편집자처럼 수정 내역이 누적

개인 데이터의 백과사전화

시간이 지나며 모델이 기억의 공백을 채우는 역할로 전환
- 모델이 여러 데이터 소스를 교차 분석해 잊고 있던 사실을 복원
Facebook, Instagram, WhatsApp 아카이브 약 10만 개 메시지와 음성 노트를 분석
- 친구들과의 대화에서 우정의 흐름과 인생 사건을 추출해 페이지로 구성
- 친구들이 해당 페이지를 읽고 모든 내용을 탐독할 정도로 몰입
이 과정을 통해 단순한 가족사 프로젝트가 아닌 개인 백과사전(personal encyclopedia) 구축으로 발전
- 데이터 기반의 구조적·상호연결된 자기 기록 체계 완성

whoami.wiki 프로젝트 공개

이러한 경험을 바탕으로 whoami.wiki 를 오픈소스로 공개
- MediaWiki 기반, 개인 데이터로 위키 페이지를 자동 생성
- 사용자는 자신의 데이터 내보내기를 제공하고, 언어 모델이 초안을 작성
- 로컬 실행, 데이터 소유권 유지, 모델 독립성 보장
개인의 결혼식, 친구, 여행 등 모든 주제가 공공 위키와 동일한 형식으로 기록 가능
완성된 페이지를 탐색하는 경험이 초기 Facebook 타임라인을 연상시키는 즐거움 제공
기술보다 중요한 것은 사람과 기억에 대한 재발견
- 할머니의 삶을 기록하며 강인함과 회복력을 새롭게 인식
- 친구들과의 관계를 되돌아보며 감사와 연결감을 회복
프로젝트는 아직 초기 단계이며, 누구나 설치 문서를 통해 직접 시작 가능
- 데이터는 사용자 소유로 남고, 어떤 모델이든 읽을 수 있는 구조
- 협력자들의 피드백을 받아 지속적으로 개선 중

GN⁺ 3달전 [-]

Hacker News 의견들

이 프로젝트는 정말 멋지고 가족의 역사를 보존하는 흥미로운 방식이라 생각함
하지만 AI가 개입된 부분에선 감정적으로 복잡한 느낌을 받았음
장인의 손작업이 공장에 밀려나는 듯한 씁쓸함이 있었고, 동시에 AI가 은행 내역, 티켓, 음악 기록까지 교차 분석하는 모습은 약간 디스토피아적이었음
그래도 전체적으로는 대단히 인상적인 시도였음
- 고마움 :)
  나도 처음엔 모든 편집을 직접 하며 역사가처럼 자료를 엮었음
  이후 에이전트 실험을 시작하면서 작업 속도가 훨씬 빨라졌지만, 여전히 어떤 내용을 남기고 지울지 고민하는 ‘위키 기여자’ 같은 시간을 보냈음
  동시에 이런 경험이 개인 데이터 보호의 중요성을 절실히 깨닫게 했음. 우리는 디지털 흔적을 너무 많이 남기고 있음
- 평소엔 인간 흉내 내는 AI가 불쾌하지만, 이번엔 달랐음
  Steve Jobs가 말한 ‘마음의 자전거’처럼, 기술이 인간의 일을 돕는 도구로 작동했음
  오랜만에 기술이 인간적인 창작을 돕는 모습을 보고 예전의 설렘을 다시 느꼈음
- 나도 비슷한 생각임. 가족사를 다루는 프레임 장치로는 훌륭하지만, AI가 서술자가 되는 건 본능적으로 거부감이 듦
  LLM이 정보를 정리하는 건 도덕적으로 문제없지만, 거대 기업의 모델이 개인의 서사를 대신 말하는 건 불편함
- 여기선 AI가 단순한 협업자로 보였음
  작성자는 재미있는 부분을, AI는 지루한 데이터 연결을 맡았고, 이런 역할 분담이 이상적이라 생각함
- 나도 같은 반응이었음. 가족 구성원과 사건을 직접 기록하는 건 너무 좋지만, AI가 전부 대신하는 건 매력이 사라짐
  1. 큐레이션의 손맛이 사라짐
  2. 기억의 주관성이 중요한데, AI는 그걸 교정하려 함
  3. 결국 영혼 없는 결과물이 됨
나와 아내는 매년 새해에 50장 정도의 종이를 묶어 작은 노트를 만듦
해진 옷감으로 제본하고, 여행지의 성냥갑 같은 추억의 물건으로 장식함
1년 동안 배운 것, 다툼과 화해, 요리 레시피, 생각 등을 적으며 그 해의 기록물로 남김
AI 도구 대신 손으로 쓰는 이유는 그 과정이 의미 있고 즐거운 의식이기 때문임
아이들이 나중에 읽을 걸 생각하면 더 아름답게 느껴짐
- 나도 비슷하게 Instax 프린터로 사진을 인화해 일기에 붙임
  예전의 손때 묻은 레시피북처럼, 물감이 튄 흔적이 있는 책이 더 매력적임
- 이런 걸 commonplace book이라 부름. Jillian Hess가 관련 연구를 많이 했음
- 정말 멋진 아이디어라 아내와 아이들과 함께 해보려 함
- 감동적이지만, 솔직히 그만한 에너지가 없을 것 같음
나도 실제 인쇄된 책으로 이런 작업을 시작했음
수천 장의 사진을 Scribus로 편집해 연도별로 책을 만들고 있음
죽은 뒤에도 내 흔적이 물리적으로 남는다는 게 좋음
앞장에 SD카드를 붙여 영상도 함께 남길 예정임
또, 중고 Canon Selphy 프린터를 구해 집에서 사진을 인쇄함. 색감은 완벽하진 않지만 벽에 걸어두니 뿌듯함
- 나는 Zine 제작을 좋아함. 레이저 프린트는 햇빛에도 오래가고, 연필이 가장 오래 남더라
  360도 스테이플러는 빠른 제본에 최고임
- 나는 이메일로 비슷한 걸 함. 아들이 태어났을 때 이메일 주소를 만들어 가족들이 그에게 메시지와 사진을 보내게 함
  18살이 되면 그가 읽을 수 있도록 하는 디지털 유산 프로젝트임
  관련 글은 여기
- 책 제작 비용이 궁금함. 직접 만들면 싸지만 요즘 시간이 부족함
- 나도 해보고 싶음. 템플릿이나 팁을 공유해줄 수 있을까?
- SD카드는 오래 못 간다고 들었음. 일부 영상을 플립북으로 남기는 건 어떨까?
나는 가계도 연구를 좋아함. 10세대(약 250년) 전까지 아르헨티나로 온 조상을 추적했음
유럽 쪽은 전쟁과 문서 유실로 어려움이 많음
최근엔 가족 어르신들에게 음성 메시지로 옛이야기를 받아 정리 중임
아버지가 만든 가계도와 함께 위키 형식으로 정리하면 좋을 듯함
- 10세대면 대단함. 조상은 어느 나라 출신인가 궁금함
매년 아내가 우리 공유 계정의 사진을 선별해 50페이지짜리 책으로 엮음
지금까지 12년치의 연간 기록이 생겼고, 손으로 넘길 수 있는 추억이 됨
그녀는 이 작업을 다른 사람을 위해서도 해주는데, 개인적인 터치 덕분에 큰 호응을 얻음
프로젝트 자체는 멋지지만, LLM API를 사용할 때는 프라이버시가 중요함
나는 미국 기업의 모델에 내 사진을 맡기고 싶지 않음
- confer.to 같은 대안이 있음
- 사진보다 은행 내역이 더 걱정됨
- 작성자는 이미 블로그에 사진을 공개했으니 비밀로 여기지 않는 듯함
- PPQ.AI, OpenRouter.AI, 혹은 Apple on-device AI 같은 대안이 있을지도 모름
- 그렇다면 중국, 러시아, 유럽 기업의 LLM에는 맡길 수 있겠는가?
가족 인터뷰와 LLM 워크플로우의 조합은 정말 좋은 활용 예임
하지만 Google Maps 위치 기록, Uber, 은행 거래, Shazam까지 내보내는 건 선 넘은 느낌임
요즘 “데이터는 내 기기 안에 있다”는 AI 프로젝트가 많지만, 실제로는 데이터 이동 경로가 불분명함
사용자들이 그 트레이드오프를 충분히 이해하지 못하는 것 같음
“기본적으로 비공개”라 해도, 실제로는 AI 회사 서버로 데이터가 업로드됨
로컬 LLM이 지원되지 않는다면, 프라이버시 문구는 더 명확해야 함
Google Maps, Uber, 은행, Shazam 데이터를 AI에 넘겼다는 부분에서 불편함을 느낌
프로젝트 자체는 훌륭하지만, 가장 민감한 데이터를 서비스에 맡기는 건 위험함
언젠가 유출될 가능성은 항상 존재함
- 난 불편하지 않음. 단지 이런 자기 데이터 집착(quantified self) 에는 흥미가 없음
  가족 이야기 보존엔 관심 있지만, 자기 분석엔 관심 없음
아이디어는 좋지만, 어디까지 공유할지가 문제임
혼자 볼 땐 모든 걸 기록할 수 있지만, 가족이 함께 보면 민감한 이야기가 생김
- 동의함. 게다가 그 모든 게 Anthropic 서버에 올라감
  가족의 어두운 과거나 갈등까지 기록하는 건 사생활 침해일 수 있음
  전쟁, 감옥, 상속 문제 등은 각자 다른 기억과 감정을 갖고 있음
  이런 걸 AI가 엮으면 객관성의 환상만 남고, 가족 간의 상처를 다시 열 수도 있음
  결국 기억은 자연스럽게 잊혀지는 생명 주기를 가지는 게 맞다고 생각함
  기술에 몰입한 사람들은 이런 인간적인 복잡성을 종종 간과함
- 결국 내 위키이니, 내가 원하는 대로 하면 됨

답변달기

개인 백과사전

개인 백과사전 프로젝트의 시작

위키 소프트웨어를 통한 기억의 재구성

디지털 데이터와 언어 모델의 결합

복합 데이터 통합 실험

개인 데이터의 백과사전화

whoami.wiki 프로젝트 공개

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들