GN⁺ 8달전 | parent | ★ favorite | on: LLM 시각화(bbycroft.net)
Hacker News 의견
  • 정말 복잡하면서도 감탄스러움, 과정을 시각화하는 방식이 정말 멋짐
  • 관련된 자료가 있음, 혹시 다른 것도 궁금하다면 참고 가능함
    LLM Visualization - 2023년 12월, 댓글 131개
  • 조지아텍 연구자들이 만든 또 다른 transformer 시각화 자료가 있음
    https://poloclub.github.io/transformer-explainer/
    그리고 'The Illustrated Transformer'라는 유명한 시각화 자료도 추천함
    https://jalammar.github.io/illustrated-transformer/
    Sebastian Raschka, PhD가 아키텍처에 대해 쓴 게시글도 있음
    https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the
    해커뉴스의 이 댓글에서는 다양한 리소스를 한 번에 볼 수 있음
    https://news.ycombinator.com/item?id=35712334
  • 시각화가 정말 흥미로움, 전체 과정을 시각적으로 볼 수 있지만 모델의 내부 의사결정 기준을 완전히 이해하지 못한다는 점이 아이러니함, 1년쯤 전에 찾아봤을 땐 아직 이 부분에서 진전이 없었음
  • 이 시각화 콘텐츠가 정말 훌륭해서 5살 아들이 다니는 컴퓨터 동아리에서 아이들에게 보여주려고 계획 중임
    • 그 방식이면 아이들 낮잠 자게 하는 데 최고일 듯함
  • 정말 대단하고 감탄스러운 예술 작품 같음, 작업해줘서 고마움
  • 예전부터 이 시각화 자료를 정말 좋아했음
    https://alphacode.deepmind.com/
    (모바일이면 플레이를 누르고 끝까지 줌 아웃한 뒤 아래로 스크롤하면 됨)
  • LLM 시각화가 이런 식으로 교육 도구가 되면 정말 멋질 것 같음, 예를 들어 생성 과정에서 attention이 어떻게 움직이는지나 프롬프트가 출력에 어떻게 영향을 주는지 보여줄 수 있을 듯함, 이런 인터랙티브한 시각화가 뒷단에서 실제로 무슨 일이 일어나는지 이해하는 데 정말 도움이 될 것 같음
  • 정말 훌륭하다고 생각함, 시간이 되면 깊이 있게 탐구해보고 싶음, 관측 도구와 결합하면 이 자료가 과학자들에게 "블랙박스"라고 알려진 모델 내부를 파헤칠 수 있게 해준다고 생각함
  • 이제야 이해가 됨, 이 자료는 정말 대단한 리소스임, 시간과 노력에 감사함