GeekNews 최신글 예전글 쓰레드 댓글 Ask Show GN⁺ Weekly | 글등록 | @doolayer
로그인

doolayer

5 karma 가입일 2024-10-14

최근 활동

최근 작성한 글

전체 보기
Show GN: jsonquotefixer: 잘못된 LLM JSON 구조 출력을 깔끔하게 정리해주는 파이썬 패키지 2025-08-20 · 1점 · 댓글 2개

최근 작성한 댓글

전체 보기
requirements 만 있고, pyproject.toml 없는 레포보면 이제 구식으로 보이죠 ㅎㅎ;
그냥 joblib 쓸게요
PagedAttention의 메모리 관리 한계를 보완하기 위해 vAttention이 제안되었습니다. 관련 논문은 여기에서 확인할 수 있습니다: https://arxiv.org/pdf/2405.04437
시간오더는 n (시퀀스 길이) 입니다!
인터넷처럼 양 자체는 무제한이지만(종량제가 걸리는 경우도 있긴 하지만) 속도에 제한을 거는 방식으로 가면 좋을 것 같습니다. 구현이야 뭐 지금도 배치처리 방식이 있는 것처럼 연산자원과 사용자에게 도달하는 자원은 분리가 가능하죠. 결국 공급자 입장에서도 예측가능성을 확보하고, 사용자도 합리적인 금액과 속도를 보장받을 수 있다면 윈윈 아니겠습니까? 일부 과다 사용자의 경우, 별도 계약을 통해 전

전체 배지

댓글 작성
댓글 작성 브론즈
스페셜
First Comment

더 많은 GeekBadge가 있습니다. 활동을 통해 모으거나, GeekGold로 구매해 보세요.

긱뉴스에 GeekBadge 기능이 추가되었습니다. 긱배지로 자신을 표현해 보세요.
처음 오셨나요 사이트 이용법 FAQ About 긱배지 이용약관 개인정보 처리방침   | Blog Lists RSS   | Bookmarklet
X (Twitter) Facebook   |   긱뉴스봇 : Slack 잔디 Discord Teams Dooray! Google Chat Swit
시작하기 이용법 FAQ About 긱배지 약관 개인정보
Lists Blog RSS X 긱뉴스봇