• OpenAI API 키를 이용해 컴퓨터를 제어할 수 있음.
    • 원한다면 다른 LLM 사용 가능. LiteLLM의 도움을 받을 수도 있음.
  • LLM과 통신하고 그 지시 내용(마우스/키보드 입력)을 흉내 낼 수 있음.
  • 예시:
    • "오늘의 낱말 퍼즐 풀어줘."
    • "Google Docs 열어서 점심 식단 짜줘."
    • "웹 어플리케이션 코딩해줘."
  • 오작동을 일으킬 수 있는 지시:
    • 공간 추론
      • 스프레드 시트 조작
    • 마우스 커서가 필수적인 복잡한 GUI 어플리케이션
  • 예정:
    • "Garage Band로 베이스 기타 샘플 좀 만들어 줘."
    • "Sportify로 내 친구들의 음악 취향을 알아내서 오늘 밤 파티에 쓰일 재생 목록 만들어 줘."
  • LLM에 따라 약 $0.0005 - $0.002 정도 소요될 것으로 예상.
  • 'Stop' 버튼을 누르거나 커서를 화면 모서리로 옮겨서 중단시킬 수 있음.
  • 만약 다중 모니터라면 주요 화면 안에서만 활동할 수 있음.