Comet - Perplexity의 Web Agent이자 브라우저
(perplexity.ai)Comet: Perplexity가 만든 새로운 브라우저
출시한 지 조금 지났지만 대기 명단 통과 후 사용해 보고 작성해 봅니다
핵심 개요
Comet은 Perplexity에서 개발한 AI 브라우저로, 사용자의 집중력과 워크플로우를 극대화하고 호기심을 실행력으로 바꿔줍니다.
주요 기능 및 특징
-
AI 통합 검색, 즉각적 컨텍스트, 사이트 자동화
- 브라우저에서 바로 요약, 쇼핑, 일정, 리서치 가능
-
Comet Assistant
- 클릭, 입력, 제출, 자동완성 등 반복 작업 자동 처리
-
복잡한 업무도 자동화
- 제품 비교부터 결제까지 쇼핑 전 과정 지원
-
통합 관리
- 이메일과 캘린더(Gmail, Google Calendar) 연동
- 일정 브리핑, 메일/일정 예약까지 브라우저 내에서 해결
-
개인 맞춤형 경험
- 사용 패턴을 학습해 탭 및 인사이트 자동 정리
-
내 활동에서 바로 답변 찾기
- 히스토리, 동영상, 문서 등 개인 데이터 검색 지원
-
스마트 액션 및 탭별 초점 기능
- @tab 기능으로 열린 탭에 맞는 실시간 답변 제공
사용 사례
Perplexity Linkedin에서 사용 사례를 추가로 포스팅 해 주었습니다
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
서비스 사용 후 개인 의견
기술
- 크로미움 브라우저 + Perplexity + Web Agent 형태
- 자연어 쿼리 -> Intent/slot 추출 -> Symantic DOM 매핑 -> 액션 변환 -> 이벤트 실행(web Tool) -> 결과 파싱 후 전처리 -> ReAct 형태의 구조 추정
- Comet이 스크린샷을 찍어주어 현재 작업 현황을 파악이 가능하지만, 비전모델을 이용해 분석을 하는지는 추가 확인 필요
테스트 사례
(1) 메일 작성
- 적절히 구글 이메일 웹사이트를 활용해 메일을 작성
- Agent가 실제 발송은 하지 않고 임시 저장하는 선택
(2) 네이버 지도 경로 찾기 + 주변 음식점 추천
- 네이버 지도 웹페이지를 방문한 후 서울역에서 잠실까지 경로를 찾아달라고 질의하였고 네이버 지도 서비스를 적절히(사람처럼) 사용해 경로를 찾음
- 주변 음식점 찾기는 네이버 지도를 활용하지 않고 기존 Perplexity의 Search Tool을 사용
(3) Open AI Platform Pricing 크롤링
- Open AI Platform은 Remix를 사용하는 것으로 알고 있으며 일부 API 가격이 토글 형식으로 가려져 있는 상태
- Comet에게 명시적으로 토글을 열고 모든 API의 가격을 확인해서 Markdown으로 결과를 달라고 하였고 적절히 제공함
- 다만, 정확히 정보를 추출하도록 하는 프롬프트 엔지니어링 필요
- Anthropic의 API 페이지도 확인하도록 하였지만, 웹페이지의 레이아웃(디바이더)가 모호해 복잡한 API 정책을 정확히 파싱하지 못함. 기본적인 API 가격은 정확히 추출.
개인 의견
- 브라우징 에이전트를 개발하며 컨텍스트, 렌더링, 등등 고려할 점이 많았을 것 같은데 어떻게 해결했을지 궁금합니다.
- 기술적으론 wow가 보이는데, 프로덕트의 관점에선 아직 모호한 것 같습니다.
- 사람마다 다르겠지만, 전 왜 이 프로덕트를 써야하는지, Comet을 이용하기 위해 돈을 지불할 이유가 있는지, 나(고객)의 어떤 문제를 해결해 줄 수 있는지. 즉, 가치 제안이 저에게는 명확하지 않습니다. 현재는 '오! 신기하다 이게 되네, 생각날 때 몇번 더 사용해 봐야지' 입니다.
- 물론 Perplexity가 사용 사례를 제시해 주고 있지만, '굳이 Agent로 해결해야 할 문제인가?(내가 하면 더 빠른데)'와 '진짜 문제를 모두 해결한게 맞나?'라는 생각이 듭니다.
- 아무래도 브라우저가 인프라에 가까워 이렇게 느껴지는 것이 아닐까 조심스럽게 추측 해 봅니다
- AI Agent기반 브라우저가 어떻게 보면 새로운 포멧이기에 고객들에게 '당신은 어떤 문제가 있는데 Comet이 진짜 그 문제를 완벽히 해결해줄 수 있어'를 잘 보여주면 될 것 같다고 생각합니다.
- 눈여겨 보며 좀 더 사용해 봐야 할 것 같습니다. 프로덕트적인 문제를 어떻게 해결할 수 있을지 고민이 되네요.
UI
개인적으로 분석해 본 내용입니다. (역기획으로 만들어 보고자 작업중 입니다...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
궁금한게 경험하실때 해당 comet 에이전트 쿼리 사용 제한이 있었나요? 아니면 다른 툴들처럼 테스트 기간이라 쿼리가 상관없는 상태인지 궁금하네요. pro-max 이렇게 있었던걸로 기억이 나서 궁금해 여쭤봅니다.
전 현재 pro 구독 상태입니다. 제가 좀 적게 사용한 것 일수도 있지만 Comet 포함 Perplexity에서 아직까진 Limit에 걸린 적은 없습니다. 생각보다 널널한 것 같기도 해요.
구독 플랜에 ratelimit이 제공되지 않아 확실히는 잘 모르겠어요.
일단 beta release를 pro-max와 다르게 준 것 같습니다.
https://perplexity.ai/help-center/en/…
개인적인 느낌이지만 말씀하신대로 테스트 기간이라 그런지 쿼리가 상관 없어 보입니다. 한번에 가상 브라우저 12개 병렬로 띄워서 작업이 되는 것 까지 확인했습니다. 이건 놀랍네요.
기술적으론 wow가 보이는데, 프로덕트의 관점에선 아직 모호한 것 같습니다.
에 공감합니다.
- 에이전트의 작업속도가 너무 느리고, 그렇다고 믿고 맡겨두고 잊어도 될만큼 성능이 나오냐 하면, 그것도 아닙니다.
- 모델선택이 불가능한것으로 보이고 그래서 아마 퍼플렉시티의 자체모델로 대부분의 작업이 이루어지는 것 같은데, 환각이 너무 심합니다.
예:) 네이버 뉴스페이지를 읽고, 관세협상에 대한 신문별 논조를 정리해달라고 했을 때, 읽지 않은 신문의 내용을 '각 신문사에 성향에 대한 사전 학습된 편견'을 바탕으로, 안 읽은 신문사의 논조를 지어내서 답변합니다. - 이러한 작업을 제대로 수행하게 만들기 위해서는 프롬포트 엔지니어링과 반복적인 검토/교정이 필요한데, 거기에 신경쓰는 비용이 코멧을 통한 자동화를 통해 얻을 수 있는 이익보다 커보입니다.
- 만드는 과정에서 맞닥뜨렸을 기술적인 난제들이 눈에 보여서, 그런 부분에서 '개발자'입장에서 흥미를 가지고 볼 부분은 존재합니다만, 상품으로써는...