오디오 파일만 분할로 받아서 스크립트로 추출하고 있습니다.

유튜브 UI상에는 자막(스크립트)를 시간별로 볼 수 있는 화면이 있는데, 이것만 파싱하면 크롤링하는 시간을 훨씬 단축할 수 있을 것 같습니다. 여러 크롬 플러그인도 그거 보고 요약해주는 것으로 알고 있어요.

네 맞습니다. 원래 YouTube Data API로 스크립트를 받아서 사용하는게 좋은데 테스트해보면 거의 다 스크립트가 없다고 리턴하더라구요ㅠㅜ 업로더가 설정을 해야 한다는데

ytdlp에 자막 다운로드 받는 기능이 있습니다. 그 자동생성된 자막으로 다운로드 되어 오타가 있긴 하지만 저는 그걸로 AI에 던져서 요약본을 생성해서 사용하고 있습니다.

오 몰랐던 정보군요. AI가 제시해준대로 하다보니 이런문제가 있네요. 오디오 추출보다 빨라질거 같네요 테스트해보겠습니다!

https://github.com/ysm-dev/cpdown

이것도 비슷한방식으로 만들었어요.
코드 뜯어보세요 :)

여기도 참고하겠습니다 :)

아하. 쉽지 않군요..