14P by xguru 2일전 | ★ favorite | 댓글 1개
  • SwiftUI로 구현된 네이티브 macOS 앱으로 화면을 1 FPS로 기록하고 15분마다 AI 분석을 수행해 자동으로 타임라인과 요약을 생성
    • 타임랩스를 재생하여 하루 흐름을 시각적으로 재검토 가능
  • 25MB 앱 크기, ~100MB RAM, <1% CPU 사용을 목표로 경량·저부하를 지향하며, 분산요소 없이 로컬 중심 UX를 제공
  • AI는 Gemini(자신의 키 입력)로컬 모델(Ollama·LM Studio) 을 선택하여 처리가능
  • 녹화된 데이터는 보관 3일 후 자동 정리하여 자원 관리 최적화 및 개인 정보 보호
  • Coming Soon
    • 무한히 커스터마이즈 가능한 대시보드 : 임의의 질문을 던지면, 결과를 타일로 만들어서 계속 추적 가능
    • 데일리 저널 : 하이라이트 회고, 가이드 프롬프트의 반영, 스크린샷과 노트를 타임라인과 함께 기록
  • 동작 방식
    • Capture: 화면을 1 FPS15초 조각 단위 녹화 수행
    • Analyze: 15분마다 최근 조각을 선택한 AI 제공자로 전달해 분석 수행
    • Generate: 활동 요약 카드를 생성해 시간순 타임라인을 구성
    • Display: 시각 타임라인 UI로 하루의 흐름을 보여줌
    • Cleanup: 3일 경과 녹화본 자동 삭제로 저장 공간 관리 수행
Hacker News 의견
  • 이 제품을 변호사나 시간 단위로 비용을 청구하는 전문직에게 판매하면 좋은 반응을 얻을 것 같음, 하루 동안 놓친 업무를 복원해 빌링 누수를 막을 수 있기 때문에 높은 가격을 지불할 가능성 있음

    • 한편으론, 이걸 사용하면 변호사들이 실제로 시간 대비 얼마나 적게 일하는지도 드러날 수 있겠다는 생각이 듦
    • 나도 소프트웨어 계약자로서 이 기능을 항상 원했음, 지금 리눅스에서 간단히 프로토타입 만들고 있음
    • 영국에선 시간 단위도 아니고, 6분 단위로 청구함, 직업 문화를 알 수 있는 대목임
  • 좋은 제품임! 나는 현재 PC에서 작업 추적용으로 ActivityWatch를 사용 중임
    내가 이런 소프트웨어에 바라는 점은 다음과 같음

    • 산만함의 시작점을 찾아내는 기능: 예를 들어, 특정 이메일 확인하려고 이메일 창을 열면 관련 없는 이메일들까지 보게 되면서 5~15분 정도 딴짓에 빠지게 되는 일이 있음, 이 정보가 있으면 산만함을 줄이기 위한 실행으로 이어짐, 예시로 유튜브 추천영상 숨김 플러그인 설치 후 실제로 산만함이 줄었음, 안 쓰는 창을 다 닫아서 다른 일에 눈길이 안 가도록 함
    • 반복되는 업무와 그 주기 파악: 예를 들어, 특정 예외 케이스에 대해 매주 한 번씩 거의 똑같은 방식으로 인보이스를 수작업 작성한다면, 이걸 자동화할 수 있을지 고민할 수 있음
    • 작업 전, 중, 후 기분 상태를 기록: 이게 가장 넓고 정의하기 힘든 질문이지만, 미루는 습관 개선과 업무 시작을 용이하게 하는 데 큰 가능성이 있다고 생각함
    • 사람마다 산만해지는 패턴을 이해하는 데 도움되는 기능이 있으면 정말 좋겠음, 나도 똑같이 유튜브 확장 프로그램을 쓰고 있음
  • 이런 제품이 ADHD를 가진 사람들에게도 큰 도움이 될 것 같다는 생각이 바로 들었음
    무엇이 산만함을 유발하는지, 어떤 반복되는 패턴이 존재하는지 파악 가능함 (예: git commit마다 Hacker News 들어가 15분 허비)
    자동으로 캡처해 준 기록을 복기할 수 있는 점이 정말 큼, 예전에 TimeRescue로 고객 시간을 정확하게 측정하는 데 큰 성공을 경험함
    그런데 매뉴얼 입력이 필요한 도구는 항상 집중을 방해하거나 깜빡 사용을 잊어서 오래 못 씀
    한 단계 더 나아가면, 실시간(처리 지연을 감안해)으로 내가 딴짓을 하고 있음을 알려주는 기능이 있으면 좋겠음, 사용자가 딴짓 여부를 직접 정의하거나, 피드백으로 점점 더 똑똑해지는 방식도 구상해 볼 만함
    제품이 매우 매력적이라고 생각하며, Windows Recall 같은 아이디어를 좋아했는데 프라이버시 중심인 이 제품을 보니 좋음

  • 제품 컨셉이 매우 마음에 들지만, 개발자의 GitHub가 거의 비어있던 상태에서 갑자기 쉽게 스파이웨어로도 변할 수 있는 앱을 출시한 점은 걱정됨, 특히 비밀번호 등 보안에 대한 우려가 큼

    • 이미 GitHub에 소스가 있다면, 프로필 신경쓰기보단 직접 코드 확인으로 우려를 쉽게 해소할 수 있음
  • 나는 은행 정보, 비밀번호 등 민감한 데이터를 Gemini에 보내는 게 불편함
    로컬 모델 사용할 때 퍼포먼스가 얼마나 다를지 궁금함

    • 내 경험과 평가를 바탕으로 등급을 매기면, Gemini 2.5 pro는 A-, qwen2.5vl은 B-/C+ 정도임, 결과가 항상 확정적이지 않아서 품질을 보장하기 힘듦
      최신 논문을 보면 distillation 기법으로 로컬 모델도 SOTA 퍼포먼스가 가능하다길래, 그 쪽으로 직접 실험할 예정임
    • 엔터프라이즈 버전이 아닌 일반 Gemini를 쓰면, 프롬프트와 답변에 담긴 모든 민감 정보가 100% 구글에 노출됨
    • 구글이 내 이메일, 브라우저, 스마트폰 OS, 일부 비밀번호까지 이미 가지고 있으니, 사실상 내 기밀 데이터는 모두 탈취당했다는 가정임
    • 원래 비밀번호는 화면에 노출이 안 되고, 패스워드 매니저에서 바로 검열된 입력창으로 가기 때문에 스크린에 드러나지 않아야 함
  • screenpipe와 유사한 컨셉임, screenpipe는 더 많은 커스터마이징을 제공함
    github.com/mediar-ai/screenpipe

    • screenpipe 창업자임, 이런 제품이 더 많아지면 반가움, OSS, 로컬, 벤더 락인 없이, API/MCP 친화적이면 이상적임
      아쉬운 점은 현재 macos만 지원하고 있음, 나는 요즘 대부분 windows를 씀
  • 멋진 프로젝트임! Rewind와 비슷한 경험을 했고, 프라이버시 관련된 걱정이 있었음
    참고로 Rewind는 OCR을 로컬에서 처리해서 텍스트 데이터만 전송함
    macOS에 집중한다면, VNRecognizeTextRequest를 활용해서 복잡한 OCR 과정을 건너뛸 수 있음
    특히 클라우드 기반 AI를 쓴다면, BERT 같은 가벼운 모델로 민감 정보를 탐지 및 마스킹할 수 있음

    • VNRecognizeTextRequest를 몰랐는데, 정말 신기함, 소개해줘서 고마움
  • Zoom이나 화상회의 중에 녹화 아닌 캡처를 할 경우, 법적으로 "녹화" 임을 밝혀야 하는지 궁금함
    라이브 자막이나 전사 기능이 있어도 법적 요건이 달라지는지 알고 싶음

    • 내 주(州)에선 본인이 녹화 중임을 알리지 않고 Zoom 화면을 캡처하는 것이 대체로 불법임, 정확하지는 않지만 핵심은 1fps 동영상 저장 여부이지 AI 요약 여부가 아님
  • 이 제품 정말 좋음, 기존의 타임트래커를 직접 쓰는 것보다 훨씬 머리 부담이 적음
    로컬 옵션과 BYO key(키 직접 제공) 옵션으로 프라이버시 선택지도 있어 맘에 듦
    이런 형태의 제품이 일찍 나왔어야 할 것 같은데, 이번에 정말 잘 만든 느낌임

  • 나 역시 로컬 모델로만 쓸 의향이 있음, 정말 멋진 제품임

    • 내 친구들과 나는 로컬/클라우드 선호가 반반임, 각자 프라이버시 취향에 따라 품질 혹은 프라이버시 어느 쪽을 선택할 수 있다는 게 좋음