5P by neo 8일전 | ★ favorite | 댓글 1개
  • Perplexity가 시간을 절약하면서 심층적인 연구와 분석을 수행하는 Deep Research 기능을 출시
  • 사용자의 질문에 대해 수십 개의 검색을 실행하고, 수백 개의 자료를 읽고, 이를 논리적으로 분석하여 종합적인 보고서를 제공
  • 금융, 마케팅, 기술 연구 등 전문가 수준의 다양한 작업을 수행할 수 있으며, Humanity’s Last Exam에서 높은 성과를 기록
  • Deep Research는 모든 사용자에게 무료로 제공되며, Pro 구독자는 무제한으로 사용할 수 있음
  • 비구독자는 하루에 제한된 수의 답변만 이용 가능. 현재 웹 버전에서 사용 가능하며, 곧 iOS, Android, Mac에서도 제공될 예정
  • Deep Research를 사용하려면 perplexity.ai에서 검색창의 모드 선택기에서 "Deep Research"를 선택 후 질문을 입력하면 됨

작동 방식

  • Perplexity의 Deep Research는 기존 답변 기능을 한층 발전시켜, 사람이 수 시간 동안 수행해야 할 연구를 2~4분 내에 완료함.
  • 논리적 연구 수행
    • 검색 및 코딩 기능을 갖춘 Perplexity는 여러 차례 검색을 실행하며 문서를 읽고 분석함.
    • 연구 주제에 대해 점진적으로 학습하면서 연구 계획을 수정하는 방식으로 진행됨.
  • 보고서 작성
    • 평가한 자료를 기반으로 명확하고 종합적인 보고서를 작성함.
  • 내보내기 및 공유
    • 최종 보고서는 PDF 또는 문서로 저장 가능하며, Perplexity Page로 변환하여 공유할 수도 있음.

Deep Research 활용 사례

  • Deep Research는 다양한 복잡한 주제를 전문적으로 분석하는 데 적합하며, 다음과 같은 분야에서 유용하게 활용 가능함.
  • 금융
  • 마케팅
  • 기술
  • 시사 문제
  • 건강
  • 인물 연구
  • 여행 계획

Humanity’s Last Exam 성과

  • Deep Research는 Humanity’s Last Exam에서 21.1% 정확도를 기록하며, Gemini Thinking, o3-mini, o1, DeepSeek-R1 등 여러 AI 모델을 능가함
  • 이 시험은 100개 이상의 분야에서 3,000개 이상의 질문으로 구성된 AI 성능 평가 기준

SimpleQA 성과

  • Deep Research는 SimpleQA 벤치마크에서 93.9% 정확도를 기록하여 다양한 사실 기반 질문에 대해 업계 최고 수준의 성능을 보임.

실행 속도

  • Deep Research는 높은 정확도를 유지하면서도 대부분의 연구 작업을 3분 이내에 완료함
  • 향후 성능 최적화를 통해 속도를 더욱 개선할 계획
Hacker News 의견
  • 매주 새로운 AI가 AI-우수성-벤치마크에 따르면 이전 AI보다 20% 더 나아졌다고 하지만, 최신 SOTA 모델의 유용성은 몇 년 전 공개된 첫 번째 ChatGPT 버전보다 약간 높음

    • 이러한 AI는 유아의 추론 능력을 가지고 있지만, 점점 더 권위 있는 글쓰기 스타일로 미세 조정되고 있음
    • 연구 논문처럼 포맷된 출력물에서 글꼴과 색상만 빠져 있는 상태임
  • 이러한 심층 연구 응용 프로그램이 출시되어 기쁨

    • LLMs에 대한 명백한 사용 사례처럼 보임
    • Perplexity를 테스트 쿼리에 실행해 봄
    • "Fortune 100 CEO들의 전공 목록"이라는 쿼리에서 어려움을 겪음
    • OpenAI와 Gemini는 어느 정도 우아하게 결과 테이블을 생성하지만, Perplexity는 주제에 대해 일반적으로 이야기함
    • 유사한 실패 사례가 더 있음
    • 단일 질문 요약에는 좋지만, 두 번째 데이터 목록을 찾아 결과를 결합할 때는 잘 작동하지 않음
  • OpenAI가 $200/월 버전의 Deep Research를 출시한 지 약 2주 만에, 24시간 내에 오픈 소스화되고 Perplexity에서 무료로 제공됨

    • 변화의 속도가 놀랍고 OpenAI가 여전히 경쟁 우위를 가지고 있는지 의문임
  • "Deep Research"라는 이름을 사용하는 세 번째 제품임

    • 첫 번째는 Gemini Deep Research, 두 번째는 ChatGPT Deep Research, 세 번째는 Perplexity Deep Research임
  • 이러한 도구들에 대한 질문은 동일함: Perplexity, OAI 등이 실제로 자사 비즈니스에서 이러한 도구를 사용하는 증거가 어디에 있는지

    • 제공된 예시들에 감명받지 않음
    • "상위 20개 바이오텍 스타트업" 같은 쿼리는 다양한 무료 소스에서 답변 가능함
    • 특히 금융/투자 정보에서는 신호와 잡음을 구분하기 위해 더 깊이 들어가야 함
  • OpenAI가 새로운 제품과 상호작용 메커니즘/UX를 도입할 때마다 다른 사람들이 이를 모방함

    • ChatGPT, 코드 인터프리터, 대화 모델, 심층 연구 등에서 발생함
    • OpenAI가 새로운 UX 패러다임을 도입하는 것이 좋지만, 다른 모든 사람들이 이를 따라가는 것 같음
    • Operator/MCP/브라우저 사용은 제외함
  • Perplexity를 사용하여 50개 주의 지역 법률, 정책, 세율, 법적 장애물에 대한 테이블을 생성해 봄

    • OpenAI DR과 동일한 프롬프트를 제공했으며, Perplexity는 OpenAI와 달리 CSV 다운로드를 잘 처리함
    • 추천함
  • OpenAI나 Google의 Deep Research를 사용해보지 않았지만, Amiga 500 사운드 칩의 특별함에 대한 쿼리에서 훌륭하고 상세한 기사를 작성함

    • 개인적으로 매우 유익했고 새로운 것을 배움
  • 대안보다 더 심층적인 답변을 제공하지만, 결과의 정확성은 대안보다 떨어짐

  • Gergely (The Pragmatic Engineer)의 트윗에 대한 사람들의 의견이 궁금함

    • 웹 게시자가 유료화로 전환할지 궁금함
    • 심층 연구나 AI 검색의 경제성이 맞지 않음
    • 웹 게시자와 사이트 소유자가 트래픽과 방문자를 잃고 있음