▲GN⁺ 2024-10-28 | parent | ★ favorite | on: NotebookLlama - 구글 NotebookLM의 오픈 소스 버전(github.com/meta-llama)Hacker News 의견 NotebookLM의 "에피소드"를 들을수록, Google이 기존의 멀티모달 백본을 기반으로 두 명의 화자가 참여하는 "팟캐스트 토론" 모델을 훈련시켰다는 확신이 듦 두 화자가 인간처럼 서로 말을 끊고 대화하는 방식이 매우 자연스러움 실제 팟캐스트와 그 전사본을 기반으로 모델을 미세 조정했을 가능성이 있음 "The Daily" 에피소드를 예로 들어, 언어 모델이 팟캐스트 내용을 요약하는 가상의 기사를 작성하고, 이를 두 화자 모델에 입력하여 출력된 전사본이 입력 기사와 얼마나 일치하는지 확인하는 방식일 것이라 추측함 NotebookLM은 기술에 익숙하지 않은 사람들에게도 매우 인상적임 70대 부모님과 8살 아이도 이 기술에 놀라움을 금치 못하고 계속 사용 중임 TTS 엔진 선택이 이상하다고 생각함 최신 오픈 TTS 시스템과 비교했을 때, XTTSv2나 새로운 F5-TTS가 더 나은 선택이었을 것이라고 주장함 샘플 출력이 매우 부족하다고 평가함 NotebookLM 팀이 기존의 기초 모델을 사용하여 히트 상품을 만들어낸 점을 강조함 다른 언어와 다양한 억양, 특히 동남아시아 억양으로 출시되기를 기대함 NotebookLM이 오픈 소스가 아니라 iPython 노트북에서의 몇 가지 실험일 가능성이 있다고 생각함 LLM 수준에서의 기능은 특별히 새롭지 않지만, 제품으로서의 포장 방식이 흥미로움 "팟캐스트" 부분은 대규모 코퍼스의 소개/개요일 뿐이며, 봇과의 대화를 통해 인용된 참고 자료를 얻는 것이 더 유용하다고 봄 LLM을 사용한 프로토타이핑이 매우 빠르다는 점을 보여줌 API를 사용해보지 않은 사람들에게 시도해볼 것을 권장함 NotebookLM이 팟캐스트만 생성하는지에 대한 의문을 가짐 팟캐스트는 재미있지만 다소 장난스러운 기능이라고 생각함 모바일 폰에서 로컬로 실행할 수 있다면 좋겠다고 생각함 예를 들어, 작업 문서를 팟캐스트로 변환하여 운전 중에 들을 수 있다면 생산성이 크게 향상될 것이라고 주장함 샘플이 다소 거칠다고 평가함 NotebookLM을 사용해본 사람의 출력을 듣고 싶다고 언급함
Hacker News 의견
NotebookLM의 "에피소드"를 들을수록, Google이 기존의 멀티모달 백본을 기반으로 두 명의 화자가 참여하는 "팟캐스트 토론" 모델을 훈련시켰다는 확신이 듦
NotebookLM은 기술에 익숙하지 않은 사람들에게도 매우 인상적임
TTS 엔진 선택이 이상하다고 생각함
샘플 출력이 매우 부족하다고 평가함
다른 언어와 다양한 억양, 특히 동남아시아 억양으로 출시되기를 기대함
NotebookLM이 오픈 소스가 아니라 iPython 노트북에서의 몇 가지 실험일 가능성이 있다고 생각함
LLM을 사용한 프로토타이핑이 매우 빠르다는 점을 보여줌
NotebookLM이 팟캐스트만 생성하는지에 대한 의문을 가짐
모바일 폰에서 로컬로 실행할 수 있다면 좋겠다고 생각함
샘플이 다소 거칠다고 평가함
NotebookLM을 사용해본 사람의 출력을 듣고 싶다고 언급함