14P by neo 17일전 | favorite | 댓글 1개
  • Audio Overview는 Google의 NotebookLM의 새로운 기능으로, 제공된 콘텐츠를 바탕으로 두 AI 호스트가 심층 토론을 진행하는 맞춤형 팟캐스트를 생성함
  • 이 팟캐스트는 약 10분 정도로 만들어지고, 매우 설득력 있는 오디오 대화를 제공함
  • NotebookLM은 사용자가 여러 소스(문서, 텍스트, 웹 페이지 링크, YouTube 비디오)를 하나의 인터페이스에 모아 질문을 할 수 있게 해주는 사용자 맞춤형 RAG 제품임
    • 이 시스템은 Gemini 1.5 Pro LLM을 기반으로 작동함
    • 몇개의 소스를 로드한 후, Notebook Guide 메뉴에서 Audio Overview를 생성할 수 있는 옵션을 제공함
  • Thomas Wolf는 자신의 웹사이트나 LinkedIn 프로필 URL을 NotebookLM에 붙여넣어 8분짜리 팟캐스트를 생성해보라고 제안함
    • 그래서 내 블로그와 소개 페이지 URL을 사용해 10분 45초짜리 에피소드를 생성했으며, 매우 칭찬이 가득한 내용이었음
  • Audio Overview의 높은 품질은 Google Research의 SoundStorm 프로젝트 덕분임
    • SoundStorm은 스크립트와 짧은 오디오 예제를 사용해 30초의 오디오를 0.5초 만에 생성할 수 있음
    • 이 시스템은 대화의 흐름을 자연스럽게 유지하며, 고품질의 대화형 오디오를 생성함
  • Kevin Roose와 Casey Newton이 Google의 Steven Johnson과 인터뷰를 진행함
    • 시스템은 주제를 개요로 작성하고, 세부 스크립트를 생성한 후, 비평 단계를 거쳐 수정함
    • 마지막 단계에서는 "disfluencies"를 추가해 대화를 자연스럽게 만듦
  • Lawncareguy85는 AI 호스트가 자신들이 AI임을 인식하게 만드는 팟캐스트를 생성함
    • AI 호스트는 자신들이 AI임을 알게 된 후, 실존적 위기를 겪음
  • 이 기사를 퍼블리시한후, 이 글을 바탕으로 NotebookLM에 팟캐스트를 생성하도록 요청함
    • AI 호스트는 실존적 위기를 겪으며, 자신들이 AI임을 인식함

GN⁺의 정리

  • 이 기사는 Google의 NotebookLM이 어떻게 사용자 맞춤형 팟캐스트를 생성하는지 설명함
  • AI 호스트가 매우 자연스럽고 설득력 있는 대화를 생성하는 과정을 다룸
  • SoundStorm 프로젝트와 같은 기술이 이러한 고품질 오디오를 가능하게 함
  • AI가 생성한 콘텐츠와 실제 사람의 콘텐츠를 구별하는 능력이 중요해짐
Hacker News 의견
  • ChatGPT를 장거리 운전 중 기술 주제에 대한 가상 팟캐스트로 사용함이 매우 유용함

    • 호스트의 "능력 수준"을 조절할 수 있기를 희망함
    • Signals and Threads 팟캐스트만이 흥미로운 깊이를 제공함
  • Scholander 압력 챔버 설명서를 업로드하여 팟캐스트를 생성함

    • 정보가 정확하고 가벼운 농담과 중요한 주제를 포함함
    • 인간의 개입 없이 몇 분 만에 생성되는 것이 놀라움
  • NotebookLM이 고품질 팟캐스트의 구조와 감정을 잘 생성함

    • 현재 AI가 예술, 음악, 비디오를 모방하는 것과 유사함
    • 많은 사람들이 품질에 신경 쓰지 않음
    • 오늘날 출판되는 많은 책들이 아이디어 전달보다는 다른 목적을 가짐
    • 글쓰기, 팟캐스트, 음악의 품질이 이미 2차적이어서 AI의 방해를 받기 쉬움
  • 철학 수업의 읽기 자료를 팟캐스트로 변환하여 주제를 소개하고 요약함

    • 30페이지 PDF를 읽는 것이 부담스러울 때 도움이 됨
    • 운동이나 통근 중에 더 쉽게 접근할 수 있는 오디오 형식으로 제공함
    • Spotify에 업로드하여 동급생과 공유함
  • 게임 디자인 문서를 업로드하여 팟캐스트를 생성함

    • 호스트들이 아이디어를 매우 통찰력 있는 정보로 취급함
    • 여러 문서를 업로드하면 과도하게 놀라는 톤을 인식하게 됨
  • 텍스트를 다양한 미디어 형식으로 쉽게 변환할 수 있는 점이 인상적임

    • Apple의 텍스트 음성 변환 도구를 사용하여 Wikipedia 기사를 들었으나 흥미롭지 않았음
    • 실제 팟캐스트는 호스트와 게스트의 개성 때문에 성공함
    • 다음 버전의 Notebook이 스피커의 목소리, 톤, 교육 수준 등을 더 커스터마이즈할 수 있기를 희망함
  • 기술 논문과 표준을 업로드했으나 잘못된 정보를 생성함

    • 내부 검토나 수동 주석으로 수정 가능함
    • 연구자들이 새로운 표현 방법을 찾는 데 도움이 될 수 있음
    • 10년 이상 연구한 주제에 대해 새로운 대화 포인트를 제공함
  • 기술적으로 인상적이지만 비효율적이고 느린 방법임

    • 흥미롭거나 반박할 수 있는 의견이 없음
    • 배울 수 있는 전문 지식이 없음
    • 가치가 없음
  • 생성된 팟캐스트가 얕고 깊이가 없음

    • 중간 정도의 팟캐스트를 생성하지만 진정한 깊이는 없음
  • Deep Dive Podcast 생성기가 놀라움

    • 38페이지 PDF로 40분짜리 팟캐스트를 생성했으나 중간에 반복되는 내용이 많음
    • 문서에 "목차"가 있어서 두 번 본 것일 수 있음