Comet - Perplexity의 Web Agent이자 브라우저

(perplexity.ai)

7P by sungmin330 5달전 | ★ favorite | 댓글 4개

Comet: Perplexity가 만든 새로운 브라우저

출시한 지 조금 지났지만 대기 명단 통과 후 사용해 보고 작성해 봅니다

핵심 개요

Comet은 Perplexity에서 개발한 AI 브라우저로, 사용자의 집중력과 워크플로우를 극대화하고 호기심을 실행력으로 바꿔줍니다.

주요 기능 및 특징

AI 통합 검색, 즉각적 컨텍스트, 사이트 자동화
- 브라우저에서 바로 요약, 쇼핑, 일정, 리서치 가능
Comet Assistant
- 클릭, 입력, 제출, 자동완성 등 반복 작업 자동 처리
복잡한 업무도 자동화
- 제품 비교부터 결제까지 쇼핑 전 과정 지원
통합 관리
- 이메일과 캘린더(Gmail, Google Calendar) 연동
- 일정 브리핑, 메일/일정 예약까지 브라우저 내에서 해결
개인 맞춤형 경험
- 사용 패턴을 학습해 탭 및 인사이트 자동 정리
내 활동에서 바로 답변 찾기
- 히스토리, 동영상, 문서 등 개인 데이터 검색 지원
스마트 액션 및 탭별 초점 기능
- @tab 기능으로 열린 탭에 맞는 실시간 답변 제공

사용 사례

Perplexity Linkedin에서 사용 사례를 추가로 포스팅 해 주었습니다
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all

서비스 사용 후 개인 의견

기술

크로미움 브라우저 + Perplexity + Web Agent 형태
자연어 쿼리 -> Intent/slot 추출 -> Symantic DOM 매핑 -> 액션 변환 -> 이벤트 실행(web Tool) -> 결과 파싱 후 전처리 -> ReAct 형태의 구조 추정
Comet이 스크린샷을 찍어주어 현재 작업 현황을 파악이 가능하지만, 비전모델을 이용해 분석을 하는지는 추가 확인 필요

테스트 사례

(1) 메일 작성

적절히 구글 이메일 웹사이트를 활용해 메일을 작성
Agent가 실제 발송은 하지 않고 임시 저장하는 선택

(2) 네이버 지도 경로 찾기 + 주변 음식점 추천

네이버 지도 웹페이지를 방문한 후 서울역에서 잠실까지 경로를 찾아달라고 질의하였고 네이버 지도 서비스를 적절히(사람처럼) 사용해 경로를 찾음
주변 음식점 찾기는 네이버 지도를 활용하지 않고 기존 Perplexity의 Search Tool을 사용

(3) Open AI Platform Pricing 크롤링

Open AI Platform은 Remix를 사용하는 것으로 알고 있으며 일부 API 가격이 토글 형식으로 가려져 있는 상태
Comet에게 명시적으로 토글을 열고 모든 API의 가격을 확인해서 Markdown으로 결과를 달라고 하였고 적절히 제공함
다만, 정확히 정보를 추출하도록 하는 프롬프트 엔지니어링 필요
Anthropic의 API 페이지도 확인하도록 하였지만, 웹페이지의 레이아웃(디바이더)가 모호해 복잡한 API 정책을 정확히 파싱하지 못함. 기본적인 API 가격은 정확히 추출.

개인 의견

브라우징 에이전트를 개발하며 컨텍스트, 렌더링, 등등 고려할 점이 많았을 것 같은데 어떻게 해결했을지 궁금합니다.
기술적으론 wow가 보이는데, 프로덕트의 관점에선 아직 모호한 것 같습니다.
사람마다 다르겠지만, 전 왜 이 프로덕트를 써야하는지, Comet을 이용하기 위해 돈을 지불할 이유가 있는지, 나(고객)의 어떤 문제를 해결해 줄 수 있는지. 즉, 가치 제안이 저에게는 명확하지 않습니다. 현재는 '오! 신기하다 이게 되네, 생각날 때 몇번 더 사용해 봐야지' 입니다.
물론 Perplexity가 사용 사례를 제시해 주고 있지만, '굳이 Agent로 해결해야 할 문제인가?(내가 하면 더 빠른데)'와 '진짜 문제를 모두 해결한게 맞나?'라는 생각이 듭니다.
아무래도 브라우저가 인프라에 가까워 이렇게 느껴지는 것이 아닐까 조심스럽게 추측 해 봅니다
AI Agent기반 브라우저가 어떻게 보면 새로운 포멧이기에 고객들에게 '당신은 어떤 문제가 있는데 Comet이 진짜 그 문제를 완벽히 해결해줄 수 있어'를 잘 보여주면 될 것 같다고 생각합니다.
눈여겨 보며 좀 더 사용해 봐야 할 것 같습니다. 프로덕트적인 문제를 어떻게 해결할 수 있을지 고민이 되네요.

UI

개인적으로 분석해 본 내용입니다. (역기획으로 만들어 보고자 작업중 입니다...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf

▲

cshj55 5달전 [-]

궁금한게 경험하실때 해당 comet 에이전트 쿼리 사용 제한이 있었나요? 아니면 다른 툴들처럼 테스트 기간이라 쿼리가 상관없는 상태인지 궁금하네요. pro-max 이렇게 있었던걸로 기억이 나서 궁금해 여쭤봅니다.

답변달기

▲

sungmin330 5달전 [-]

전 현재 pro 구독 상태입니다. 제가 좀 적게 사용한 것 일수도 있지만 Comet 포함 Perplexity에서 아직까진 Limit에 걸린 적은 없습니다. 생각보다 널널한 것 같기도 해요.
구독 플랜에 ratelimit이 제공되지 않아 확실히는 잘 모르겠어요.
일단 beta release를 pro-max와 다르게 준 것 같습니다.

https://perplexity.ai/help-center/en/…

개인적인 느낌이지만 말씀하신대로 테스트 기간이라 그런지 쿼리가 상관 없어 보입니다. 한번에 가상 브라우저 12개 병렬로 띄워서 작업이 되는 것 까지 확인했습니다. 이건 놀랍네요.

답변달기

▲

nottiger 5달전 [-]

잘 읽고 갑니다.
예상대로 인것 같아서 조금 아쉽네요..

답변달기

▲

cenoch 5달전 [-]

기술적으론 wow가 보이는데, 프로덕트의 관점에선 아직 모호한 것 같습니다.

에 공감합니다.

에이전트의 작업속도가 너무 느리고, 그렇다고 믿고 맡겨두고 잊어도 될만큼 성능이 나오냐 하면, 그것도 아닙니다.
모델선택이 불가능한것으로 보이고 그래서 아마 퍼플렉시티의 자체모델로 대부분의 작업이 이루어지는 것 같은데, 환각이 너무 심합니다.
예:) 네이버 뉴스페이지를 읽고, 관세협상에 대한 신문별 논조를 정리해달라고 했을 때, 읽지 않은 신문의 내용을 '각 신문사에 성향에 대한 사전 학습된 편견'을 바탕으로, 안 읽은 신문사의 논조를 지어내서 답변합니다.
이러한 작업을 제대로 수행하게 만들기 위해서는 프롬포트 엔지니어링과 반복적인 검토/교정이 필요한데, 거기에 신경쓰는 비용이 코멧을 통한 자동화를 통해 얻을 수 있는 이익보다 커보입니다.
만드는 과정에서 맞닥뜨렸을 기술적인 난제들이 눈에 보여서, 그런 부분에서 '개발자'입장에서 흥미를 가지고 볼 부분은 존재합니다만, 상품으로써는...

답변달기