▲xguru 2025-02-24 | parent | ★ favorite | on: DeepSeek, FlashMLA 오픈소스 공개 (1 of 5)(github.com/deepseek-ai)FlashAttention-2: 더 나은 병렬처리와 작업 분할로 더 빨라진 Attention FlashAttention-3: 비동기 및 저정밀도로 빠르고 정확한 Attention
FlashAttention-2: 더 나은 병렬처리와 작업 분할로 더 빨라진 Attention
FlashAttention-3: 비동기 및 저정밀도로 빠르고 정확한 Attention