▲GN⁺ 2025-04-15 | parent | ★ favorite | on: DeepSeek 추론 엔진 오픈소스를 향한 여정(github.com/deepseek-ai)Hacker News 의견 3월에 vLLM이 DeepSeek 논문의 개선점을 적용하여 vLLM v0.7.3의 DeepSeek 성능이 약 3배 이상 향상됨 여전히 개선의 여지가 많음 vLLM을 사용하여 sharegpt 데이터셋으로 5K 토큰/초, 랜덤 2000/100으로 12K 토큰/초를 벤치마크함 DeepSeek-V3/R1 추론 시스템 개요에 따르면, 각 H800 노드는 프리필링 시 평균 73.7k 토큰/초 입력(캐시 히트 포함) 또는 디코딩 시 14.8k 토큰/초 출력을 제공함 DeepSeek는 다른 추론 아키텍처를 배포하지만, 이는 개선의 여지가 많음을 보여줌 더 많은 오픈 소스를 기대함 코드베이스 분기점에 공감함 vLLM의 초기 포크를 기반으로 DeepSeek 모델에 맞게 커스터마이즈하여 확장하기 어려움 유지 가능한 서브 라이브러리를 분리하고 정보를 직접 공유하는 접근 방식이 커뮤니티와 협력하는 좋은 방법임 장애물이 있지만, 기여하지 않는 쉬운 길을 택하지 않음 기술에 대한 정보만 공유하는 것이 더 나을 수 있지만, 여전히 지식 공유임 그들이 하지 않는 것이 더 쉬울 것 같음 그들에게 찬사를 보냄 상업적 AI 회사들이 연구 결과와 노하우를 공유하는 동기 Google이 Transformer 아키텍처를 공개한 이유 인류를 위한 좋은 일을 하고 싶고, 진보를 촉진하고 싶어할 수 있음 상업적 이익에 반하는 행동을 회사 경영진이 어떻게 취할 수 있는지 의문 정보와 지적 재산 공유를 촉진하는 상업적 논리가 있는지 궁금함 "오픈 소스 커뮤니티에 흥미로운 것이 있지만, 회사 외부에서 실행하려면 많은 정리가 필요하고, 출시 후 적절히 유지할 인력이 없음" 많은 회사들이 이 위치에 있음 "우리는 이것을 유지하지 않을 것이지만, 포크는 자유롭게 하세요"라는 메모와 함께 오픈 소스화하기를 바람 DeepSeek의 좋은 엔지니어링 작업을 보았음 계속 이어지기를 바람 중국이 미국의 지배에 대응하기 위해 오픈 소스 AI 도구, 모델 등을 대량으로 출시하는 전략인지 궁금함 시장에 좋은 일이라고 생각함 tl;dr "vLLM 포크가 유지 불가능해졌고, 이제 공개적으로 다시 구축할 예정임" 검열을 구현하는 한 가지 방법이라고 느낌
Hacker News 의견
3월에 vLLM이 DeepSeek 논문의 개선점을 적용하여 vLLM v0.7.3의 DeepSeek 성능이 약 3배 이상 향상됨
코드베이스 분기점에 공감함
상업적 AI 회사들이 연구 결과와 노하우를 공유하는 동기
"오픈 소스 커뮤니티에 흥미로운 것이 있지만, 회사 외부에서 실행하려면 많은 정리가 필요하고, 출시 후 적절히 유지할 인력이 없음"
DeepSeek의 좋은 엔지니어링 작업을 보았음
중국이 미국의 지배에 대응하기 위해 오픈 소스 AI 도구, 모델 등을 대량으로 출시하는 전략인지 궁금함
tl;dr "vLLM 포크가 유지 불가능해졌고, 이제 공개적으로 다시 구축할 예정임"
검열을 구현하는 한 가지 방법이라고 느낌