당신의 하루를 위한 git log – Dayflow
(github.com/JerryZLiu)- Dayflow는 Mac에서 하루의 활동 기록과 요약 타임라인을 자동으로 생성해주는 오픈소스 앱임
- 1초에 1프레임씩 스크린을 녹화하고, 15분마다 AI로 분석하여 요약 카드와 집중 방해 요소를 시각화함
- 사용자는 Gemini(클라우드) 또는 Ollama/LM Studio(로컬) 모델을 선택할 수 있고, 개인정보 보호와 데이터 소유권을 직접 관리하는 것이 강점임
- 타임라인 생성을 위한 AI 프로세스가 클라우드와 로컬 모드에서 처리 구조가 다르고, 각각 장단점이 존재함
- MIT 라이선스의 완전한 오픈소스로, 투명성과 신뢰성, 확장 가능성을 확보함
Dayflow 개요 및 의의
Dayflow는 macOS 환경에서 사용자의 스크린 활동을 분 단위로 자동 요약하여, 마치 git log처럼 명확한 활동 이력 타임라인을 생성함
직관적 사용성과 고도화된 개인정보 보호 설정이 가능한 것이 주요 차별점임
- 앱 용량 25MB, 메모리 사용량 100MB 미만, CPU 점유율 1% 미만으로 매우 가벼운 동작을 구현함
- 모든 데이터와 분석 과정의 소유권과 관리 권한을 사용자에게 위임함
- Gemini API(클라우드) 또는 Ollama/LM Studio(로컬) 중에서 AI 프로바이더를 직접 선택할 수 있음
주요 기능
- 자동 활동 타임라인: 하루 동안의 화면 활동을 요약 카드로 자동 기록
- 1 FPS 녹화: 초당 1 프레임 녹화로 자원 소모 최소화
- 15분 간격 분석: 15분마다 최신 녹화본을 AI로 분석하고 결과를 즉시 반영
- 집중 방해 요소 하이라이트: 집중을 방해한 시점 및 상황을 추적 가능
- 타임랩스 및 자동 정리: 타임랩스 시청, 3일 이후 녹화본 자동 삭제
- SwiftUI 기반 네이티브 UX: 맥OS 생태계에 최적화된 UI/UX 제공
- Sparkle 기반 자동 업데이트
- (예정) 대시보드 커스터마이즈, 일일 저널 등 추가 기능 예고
동작 원리
- 캡처: 1FPS로 15초 단위 비디오 청크 기록, 3일 간 저장
- 분석: 15분마다, 최근 녹화분을 AI에 입력
- 생성: AI가 활동 요약 및 카드 생성
- 디스플레이: 시각적 타임라인 형태로 출력
- 정리: 3일 이상 경과 데이터 자동 삭제
AI 처리 파이프라인
-
Gemini(클라우드) : 동영상 → 업로드·트랜스크립션(1회 LLM 호출) → 카드 생성(1회 LLM 호출) → 완료
- 장점: 복잡한 순차 처리가 필요 없는 간결한 파이프라인
- 효율성 높음, 네이티브 비디오 인식 활용
-
Local 모델(Ollama/LM Studio) : 동영상 → 프레임 30장 추출 → 설명 생성(30회 LLM 호출) → 병합 및 카드 생성(여러 차례 LLM 호출)
- 장점: 개인정보 완전 로컬 유지
- 처리 복잡성 높고, 분석 속도 더딤
설치 및 사용 조건
요구사항
- macOS 13.0 이상
- Xcode 15+ (개발 및 소스 빌드 시)
- Gemini API 키(필요 시, 클라우드 분석용)
- 화면 및 시스템 오디오 녹음 권한 필요
실행 방법
- GitHub Release에서 Dayflow.dmg 다운로드 후, 응용 프로그램 폴더에 설치 및 권한 부여
- 소스 빌드: 저장소 클론 후 Xcode에서 실행, Gemini 사용 시 환경 변수 Key 입력 필요
데이터 & 개인정보 보호
-
녹화 데이터:
- 저장 경로:
~/Library/Application Support/Dayflow/recordings/
- SQLite DB:
~/Library/Application Support/Dayflow/chunks.sqlite
- 1FPS 캡처, 15분당 분석, 3일간 보관
- 저장 경로:
- 전체 초기화: Dayflow 종료 후 위 폴더 전체 삭제, 재실행 시 초기화 가능
처리 방식 & 프로바이더별 차이
-
Gemini (클라우드)
- Google에 배치 전송, 분석 진행
- Cloud Billing 활성화 시 데이터가 모델 학습에 사용되지 않음
- 유럽/영국/스위스는 기본적으로 Paid-Style 데이터 처리 적용
- 여전히 남아있는 정책 준수 모니터링 및 로그 보관 존재
-
로컬(Ollama / LM Studio)
- 모든 프로세스가 사용자 로컬 머신에서만 이뤄짐, 완전 오프라인 가능
- 요약 품질, 처리 지연 요소 존재
- GPU 분석 시 배터리 소모 높을 수 있음(긴 기록 시 전원 연결 권장)
- 향후 로컬 모델 미세조정 및 최적화 로드맵
macOS 권한 및 관리
- 화면/시스템 오디오 녹음: 필수 권한, 시스템 설정 > 개인정보 보호에서 관리
- 설정 변경: 앱 내에서 캡처 시작/정지, 디버그 모드에서 배치 내용 확인 가능
자동 업데이트
- Sparkle(오픈소스 Updater) 내장: 매일 자동 체크 및 백그라운드 다운로드 지원
- 앱 메뉴에서 직접 버전 확인 및 업데이트 체크 가능
프로젝트 구조
-
Dayflow/
– SwiftUI 소스, UI 및 분석 파이프라인 -
docs/
– 앱캐스트/문서/스크린샷/영상 등 자료 -
scripts/
– DMG 패키징, 코드사인, 자동화 스크립트 등 릴리스 관리
문제 해결 & 지원
- 화면 캡처 오류: 개인정보 설정 내 권한 재확인
- API 에러: Gemini API 키 및 네트워크 점검
개발 및 커뮤니티
- Pull Request, 이슈 환영 / 커뮤니티 기반 확장 가능
- MIT 라이선스 – 투명성 및 신뢰, 리스크 최소화
주요 참고자료
- Ollama GPU 가속: Metal 지원 관련 문서
- LM Studio 오프라인문서
- Gemini API 약관 등 공식 문서 링크
핵심 가치
- 활동 데이터에 대한 완전한 소유권 및 투명한 개인정보 보호
- 노이즈 없이 신뢰할 수 있는 업무/활동 이력을 제공하는 조용한 비서 역할
- 대시보드 커스터마이즈, 일일 요약 등 확장성 확보
- GitHub 1.4k star 달성 등 커뮤니티의 높은 관심
라이선스
- MIT 라이선스 기반, 무보증 제공, 누구나 검증·참여 가능
Hacker News 의견
-
이 제품을 변호사나 시간 단위로 비용을 청구하는 전문직에게 판매하면 좋은 반응을 얻을 것 같음, 하루 동안 놓친 업무를 복원해 빌링 누수를 막을 수 있기 때문에 높은 가격을 지불할 가능성 있음
- 한편으론, 이걸 사용하면 변호사들이 실제로 시간 대비 얼마나 적게 일하는지도 드러날 수 있겠다는 생각이 듦
- 나도 소프트웨어 계약자로서 이 기능을 항상 원했음, 지금 리눅스에서 간단히 프로토타입 만들고 있음
- 영국에선 시간 단위도 아니고, 6분 단위로 청구함, 직업 문화를 알 수 있는 대목임
-
좋은 제품임! 나는 현재 PC에서 작업 추적용으로 ActivityWatch를 사용 중임
내가 이런 소프트웨어에 바라는 점은 다음과 같음- 산만함의 시작점을 찾아내는 기능: 예를 들어, 특정 이메일 확인하려고 이메일 창을 열면 관련 없는 이메일들까지 보게 되면서 5~15분 정도 딴짓에 빠지게 되는 일이 있음, 이 정보가 있으면 산만함을 줄이기 위한 실행으로 이어짐, 예시로 유튜브 추천영상 숨김 플러그인 설치 후 실제로 산만함이 줄었음, 안 쓰는 창을 다 닫아서 다른 일에 눈길이 안 가도록 함
- 반복되는 업무와 그 주기 파악: 예를 들어, 특정 예외 케이스에 대해 매주 한 번씩 거의 똑같은 방식으로 인보이스를 수작업 작성한다면, 이걸 자동화할 수 있을지 고민할 수 있음
- 작업 전, 중, 후 기분 상태를 기록: 이게 가장 넓고 정의하기 힘든 질문이지만, 미루는 습관 개선과 업무 시작을 용이하게 하는 데 큰 가능성이 있다고 생각함
- 사람마다 산만해지는 패턴을 이해하는 데 도움되는 기능이 있으면 정말 좋겠음, 나도 똑같이 유튜브 확장 프로그램을 쓰고 있음
-
이런 제품이 ADHD를 가진 사람들에게도 큰 도움이 될 것 같다는 생각이 바로 들었음
무엇이 산만함을 유발하는지, 어떤 반복되는 패턴이 존재하는지 파악 가능함 (예: git commit마다 Hacker News 들어가 15분 허비)
자동으로 캡처해 준 기록을 복기할 수 있는 점이 정말 큼, 예전에 TimeRescue로 고객 시간을 정확하게 측정하는 데 큰 성공을 경험함
그런데 매뉴얼 입력이 필요한 도구는 항상 집중을 방해하거나 깜빡 사용을 잊어서 오래 못 씀
한 단계 더 나아가면, 실시간(처리 지연을 감안해)으로 내가 딴짓을 하고 있음을 알려주는 기능이 있으면 좋겠음, 사용자가 딴짓 여부를 직접 정의하거나, 피드백으로 점점 더 똑똑해지는 방식도 구상해 볼 만함
제품이 매우 매력적이라고 생각하며, Windows Recall 같은 아이디어를 좋아했는데 프라이버시 중심인 이 제품을 보니 좋음 -
제품 컨셉이 매우 마음에 들지만, 개발자의 GitHub가 거의 비어있던 상태에서 갑자기 쉽게 스파이웨어로도 변할 수 있는 앱을 출시한 점은 걱정됨, 특히 비밀번호 등 보안에 대한 우려가 큼
- 이미 GitHub에 소스가 있다면, 프로필 신경쓰기보단 직접 코드 확인으로 우려를 쉽게 해소할 수 있음
-
나는 은행 정보, 비밀번호 등 민감한 데이터를 Gemini에 보내는 게 불편함
로컬 모델 사용할 때 퍼포먼스가 얼마나 다를지 궁금함- 내 경험과 평가를 바탕으로 등급을 매기면, Gemini 2.5 pro는 A-, qwen2.5vl은 B-/C+ 정도임, 결과가 항상 확정적이지 않아서 품질을 보장하기 힘듦
최신 논문을 보면 distillation 기법으로 로컬 모델도 SOTA 퍼포먼스가 가능하다길래, 그 쪽으로 직접 실험할 예정임 - 엔터프라이즈 버전이 아닌 일반 Gemini를 쓰면, 프롬프트와 답변에 담긴 모든 민감 정보가 100% 구글에 노출됨
- 구글이 내 이메일, 브라우저, 스마트폰 OS, 일부 비밀번호까지 이미 가지고 있으니, 사실상 내 기밀 데이터는 모두 탈취당했다는 가정임
- 원래 비밀번호는 화면에 노출이 안 되고, 패스워드 매니저에서 바로 검열된 입력창으로 가기 때문에 스크린에 드러나지 않아야 함
- 내 경험과 평가를 바탕으로 등급을 매기면, Gemini 2.5 pro는 A-, qwen2.5vl은 B-/C+ 정도임, 결과가 항상 확정적이지 않아서 품질을 보장하기 힘듦
-
screenpipe와 유사한 컨셉임, screenpipe는 더 많은 커스터마이징을 제공함
github.com/mediar-ai/screenpipe- screenpipe 창업자임, 이런 제품이 더 많아지면 반가움, OSS, 로컬, 벤더 락인 없이, API/MCP 친화적이면 이상적임
아쉬운 점은 현재 macos만 지원하고 있음, 나는 요즘 대부분 windows를 씀
- screenpipe 창업자임, 이런 제품이 더 많아지면 반가움, OSS, 로컬, 벤더 락인 없이, API/MCP 친화적이면 이상적임
-
멋진 프로젝트임! Rewind와 비슷한 경험을 했고, 프라이버시 관련된 걱정이 있었음
참고로 Rewind는 OCR을 로컬에서 처리해서 텍스트 데이터만 전송함
macOS에 집중한다면, VNRecognizeTextRequest를 활용해서 복잡한 OCR 과정을 건너뛸 수 있음
특히 클라우드 기반 AI를 쓴다면, BERT 같은 가벼운 모델로 민감 정보를 탐지 및 마스킹할 수 있음- VNRecognizeTextRequest를 몰랐는데, 정말 신기함, 소개해줘서 고마움
-
Zoom이나 화상회의 중에 녹화 아닌 캡처를 할 경우, 법적으로 "녹화" 임을 밝혀야 하는지 궁금함
라이브 자막이나 전사 기능이 있어도 법적 요건이 달라지는지 알고 싶음- 내 주(州)에선 본인이 녹화 중임을 알리지 않고 Zoom 화면을 캡처하는 것이 대체로 불법임, 정확하지는 않지만 핵심은 1fps 동영상 저장 여부이지 AI 요약 여부가 아님
-
이 제품 정말 좋음, 기존의 타임트래커를 직접 쓰는 것보다 훨씬 머리 부담이 적음
로컬 옵션과 BYO key(키 직접 제공) 옵션으로 프라이버시 선택지도 있어 맘에 듦
이런 형태의 제품이 일찍 나왔어야 할 것 같은데, 이번에 정말 잘 만든 느낌임 -
나 역시 로컬 모델로만 쓸 의향이 있음, 정말 멋진 제품임
- 내 친구들과 나는 로컬/클라우드 선호가 반반임, 각자 프라이버시 취향에 따라 품질 혹은 프라이버시 어느 쪽을 선택할 수 있다는 게 좋음