Perplexity Deep Research 공개

(perplexity.ai)

5P by GN⁺ 5달전 | ★ favorite | 댓글 1개

Perplexity가 시간을 절약하면서 심층적인 연구와 분석을 수행하는 Deep Research 기능을 출시
사용자의 질문에 대해 수십 개의 검색을 실행하고, 수백 개의 자료를 읽고, 이를 논리적으로 분석하여 종합적인 보고서를 제공
금융, 마케팅, 기술 연구 등 전문가 수준의 다양한 작업을 수행할 수 있으며, Humanity’s Last Exam에서 높은 성과를 기록
Deep Research는 모든 사용자에게 무료로 제공되며, Pro 구독자는 무제한으로 사용할 수 있음
비구독자는 하루에 제한된 수의 답변만 이용 가능. 현재 웹 버전에서 사용 가능하며, 곧 iOS, Android, Mac에서도 제공될 예정
Deep Research를 사용하려면 perplexity.ai에서 검색창의 모드 선택기에서 "Deep Research"를 선택 후 질문을 입력하면 됨

작동 방식

Perplexity의 Deep Research는 기존 답변 기능을 한층 발전시켜, 사람이 수 시간 동안 수행해야 할 연구를 2~4분 내에 완료함.
논리적 연구 수행
- 검색 및 코딩 기능을 갖춘 Perplexity는 여러 차례 검색을 실행하며 문서를 읽고 분석함.
- 연구 주제에 대해 점진적으로 학습하면서 연구 계획을 수정하는 방식으로 진행됨.
보고서 작성
- 평가한 자료를 기반으로 명확하고 종합적인 보고서를 작성함.
내보내기 및 공유
- 최종 보고서는 PDF 또는 문서로 저장 가능하며, Perplexity Page로 변환하여 공유할 수도 있음.

Deep Research 활용 사례

Deep Research는 다양한 복잡한 주제를 전문적으로 분석하는 데 적합하며, 다음과 같은 분야에서 유용하게 활용 가능함.
금융
마케팅
기술
시사 문제
건강
인물 연구
여행 계획

Humanity’s Last Exam 성과

Deep Research는 Humanity’s Last Exam에서 21.1% 정확도를 기록하며, Gemini Thinking, o3-mini, o1, DeepSeek-R1 등 여러 AI 모델을 능가함
이 시험은 100개 이상의 분야에서 3,000개 이상의 질문으로 구성된 AI 성능 평가 기준

SimpleQA 성과

Deep Research는 SimpleQA 벤치마크에서 93.9% 정확도를 기록하여 다양한 사실 기반 질문에 대해 업계 최고 수준의 성능을 보임.

실행 속도

Deep Research는 높은 정확도를 유지하면서도 대부분의 연구 작업을 3분 이내에 완료함
향후 성능 최적화를 통해 속도를 더욱 개선할 계획

▲

GN⁺ 5달전 [-]

Hacker News 의견

매주 새로운 AI가 AI-우수성-벤치마크에 따르면 이전 AI보다 20% 더 나아졌다고 하지만, 최신 SOTA 모델의 유용성은 몇 년 전 공개된 첫 번째 ChatGPT 버전보다 약간 높음
- 이러한 AI는 유아의 추론 능력을 가지고 있지만, 점점 더 권위 있는 글쓰기 스타일로 미세 조정되고 있음
- 연구 논문처럼 포맷된 출력물에서 글꼴과 색상만 빠져 있는 상태임
이러한 심층 연구 응용 프로그램이 출시되어 기쁨
- LLMs에 대한 명백한 사용 사례처럼 보임
- Perplexity를 테스트 쿼리에 실행해 봄
- "Fortune 100 CEO들의 전공 목록"이라는 쿼리에서 어려움을 겪음
- OpenAI와 Gemini는 어느 정도 우아하게 결과 테이블을 생성하지만, Perplexity는 주제에 대해 일반적으로 이야기함
- 유사한 실패 사례가 더 있음
- 단일 질문 요약에는 좋지만, 두 번째 데이터 목록을 찾아 결과를 결합할 때는 잘 작동하지 않음
OpenAI가 $200/월 버전의 Deep Research를 출시한 지 약 2주 만에, 24시간 내에 오픈 소스화되고 Perplexity에서 무료로 제공됨
- 변화의 속도가 놀랍고 OpenAI가 여전히 경쟁 우위를 가지고 있는지 의문임
"Deep Research"라는 이름을 사용하는 세 번째 제품임
- 첫 번째는 Gemini Deep Research, 두 번째는 ChatGPT Deep Research, 세 번째는 Perplexity Deep Research임
이러한 도구들에 대한 질문은 동일함: Perplexity, OAI 등이 실제로 자사 비즈니스에서 이러한 도구를 사용하는 증거가 어디에 있는지
- 제공된 예시들에 감명받지 않음
- "상위 20개 바이오텍 스타트업" 같은 쿼리는 다양한 무료 소스에서 답변 가능함
- 특히 금융/투자 정보에서는 신호와 잡음을 구분하기 위해 더 깊이 들어가야 함
OpenAI가 새로운 제품과 상호작용 메커니즘/UX를 도입할 때마다 다른 사람들이 이를 모방함
- ChatGPT, 코드 인터프리터, 대화 모델, 심층 연구 등에서 발생함
- OpenAI가 새로운 UX 패러다임을 도입하는 것이 좋지만, 다른 모든 사람들이 이를 따라가는 것 같음
- Operator/MCP/브라우저 사용은 제외함
Perplexity를 사용하여 50개 주의 지역 법률, 정책, 세율, 법적 장애물에 대한 테이블을 생성해 봄
- OpenAI DR과 동일한 프롬프트를 제공했으며, Perplexity는 OpenAI와 달리 CSV 다운로드를 잘 처리함
- 추천함
OpenAI나 Google의 Deep Research를 사용해보지 않았지만, Amiga 500 사운드 칩의 특별함에 대한 쿼리에서 훌륭하고 상세한 기사를 작성함
- 개인적으로 매우 유익했고 새로운 것을 배움
대안보다 더 심층적인 답변을 제공하지만, 결과의 정확성은 대안보다 떨어짐
Gergely (The Pragmatic Engineer)의 트윗에 대한 사람들의 의견이 궁금함
- 웹 게시자가 유료화로 전환할지 궁금함
- 심층 연구나 AI 검색의 경제성이 맞지 않음
- 웹 게시자와 사이트 소유자가 트래픽과 방문자를 잃고 있음

답변달기