10P by xguru 2023-03-17 | favorite | 댓글 1개
  • llama.cpp 를 Rust로 포팅한 프로젝트
  • f16 또는 4-bit quntized 버전 모델 지원
  • 원본과 같이 ggml 텐서 라이브러리를 그대로 이용해서 오리지널과 같은 퍼포먼스