- 12개의 서로 다른 이메일에 흩어져 있는 숫자 값을 합산할 일이 생김
- 복사가 귀찮아서 Gmail 계정을 둘러보는 동안 화면 캡처를 녹화한 다음 Google Gemini를 사용하여 해당 동영상에서 숫자를 추출해봤는데 너무 잘 동작함
AI Studio와 QuickTime을 활용한 비용 효율적인 비디오 스크래핑
- 먼저 QuickTime Player로 관련 이메일을 탐색하며 화면 녹화 진행
- 녹화된 35초 분량의 비디오를 Google의 AI Studio에 업로드하고 Gemini 모델에 JSON 배열 형식으로 추출 요청함
- 날짜와 달러 금액이 포함된 JSON 배열 결과를 성공적으로 반환받음
- 결과를 Numbers에 붙여넣기 위해 CSV 형식으로 변환 요청하여 받아냄
- 비용은 약 0.1센트 이하로 매우 저렴함. 현재 AI Studio는 무료로 제공 중
대안들의 한계
- 수작업으로 데이터 복사는 오류 발생 가능성이 높고 지루한 작업
- Gmail API 사용은 복잡하고 많은 노력 필요
- 브라우저 자동화는 별도의 이메일 파싱 단계 필요
- 이메일 계정 접근 권한을 가진 정교한 AI 도구 활용은 프롬프트 인젝션 등의 위험 존재
비디오 스크래핑의 장점
- 화면에 보이는 모든 것을 추출 가능
- 사용자가 AI 모델에 노출할 내용을 완벽하게 통제 가능
- 웹사이트 인증이나 스크래핑 방지 기술의 영향을 받지 않음
- 설정 비용이 전혀 들지 않음
- 매우 저렴한 비용으로 활용 가능
- 데이터 저널리즘 분야에서도 유용하게 활용될 수 있음
보너스: LLM 가격 계산기
- 작성자는 토큰 가격 계산을 위한 도구를 별도로 만듦
- ChatGPT Code Interpreter를 사용했으나 계산 오류 발생
- Claude 3.5를 활용하여 가격 계산기 제작
- 입력/출력 토큰 가격을 수동으로 설정하거나 프리셋 버튼으로 모델별 가격 설정 가능
- 전체 제작 과정은 Claude와의 대화를 통해 19분 만에 10개 버전으로 반복 개선됨
- 가격 정보는 스크린샷을 대화에 직접 삽입하여 Claude가 추출하도록 함