▲GN⁺ 2025-02-15 | parent | ★ favorite | on: GPU에 대한 오해(fly.io)Hacker News 의견 개발자들은 GPU나 AI/ML 모델보다 LLMs를 원함. 시스템 엔지니어들은 CUDA와 GPU에 대해 신경 쓰지만, 소프트웨어 개발자들은 그렇지 않음 소프트웨어 개발자들 사이에 큰 분열이 있음. 일부는 코드의 실행 위치와 작동 방식을 이해하고 싶어함 다른 그룹은 git push만으로 끝내고 싶어하며, DNS나 리눅스 같은 것을 이해하고 싶어하지 않음 fly.io 같은 회사는 후자에게 매력적임. GPU 인스턴스는 전자에게 매력적임 두 시장을 다르게 접근해야 함. 후자에게는 추상화와 자동화를 많이 판매할 수 있음 2012년부터 무어의 법칙이 사실상 끝남. 단일 스레드 실행은 2GHz에서 멈춤 2012-2022년 동안 클라우드로 이동하면서 단일 스레드의 정체를 눈치채지 못함 2022년 데이터 센터는 더 많은 코어를 가진 차세대 칩을 구매할 필요가 없음을 깨달음 LLMs는 100% 병렬 처리 가능하므로 다시 자본을 투자할 수 있음 2024년 웨이퍼 스케일 실리콘이 등장할 것임. Llama 모델을 A100보다 10배 빠르게 실행할 수 있음 소프트웨어는 이 성능을 활용할 방법을 찾아야 함 fly GPU 머신은 매우 빠르고 신뢰할 수 있으며, 대안에 비해 가격이 비싸지 않음 DX가 훌륭함. 새로운 명령어를 배울 필요가 없음 가격이 더 저렴하고 더 많은 지역에서 사용할 수 있기를 바람 4090을 구매했지만, 24GB VRAM으로는 충분하지 않음 2개 이상의 3090과 맞춤형 전원 공급 장치가 더 나았을 것임 성능과 품질이 아직 부족함 Fly를 선택하는 고객은 전용 GPU 서버를 장기간 사용하는 마지막 사람일 것임 서버리스 솔루션을 사용할 가능성이 높음 GPU 슬라이스가 없는 것이 아쉬움. 월 $1,000의 비용은 정당화하기 어려움 AMD 소비자 GPU를 Raspberry Pi에 연결하는 것이 경제적일 수 있음 "우리가 틀렸다"는 말은 영어에서 가장 고귀하고 아름다운 말 중 하나임 Fly.io는 Cloudflare의 Workers 플랫폼과 유사한 개발자를 끌어들임 PaaS 환경의 개발 속도를 원함 Cloudflare는 GPU와 함께 PaaS 접근 방식을 유지하며 Workers AI를 구축함 Runpod에서 서버리스 엔드포인트를 설정하는 데 한 달이 걸렸고, 비싸고 신뢰할 수 없었음 Google Cloud 크레딧을 사용하여 제품을 고객에게 제공할 수 있었음 GPU 제공자에 대한 수요가 있음. Fly가 이 시장에 진입할 수 있을지는 확실하지 않음
Hacker News 의견
개발자들은 GPU나 AI/ML 모델보다 LLMs를 원함. 시스템 엔지니어들은 CUDA와 GPU에 대해 신경 쓰지만, 소프트웨어 개발자들은 그렇지 않음
git push만으로 끝내고 싶어하며, DNS나 리눅스 같은 것을 이해하고 싶어하지 않음2012년부터 무어의 법칙이 사실상 끝남. 단일 스레드 실행은 2GHz에서 멈춤
fly GPU 머신은 매우 빠르고 신뢰할 수 있으며, 대안에 비해 가격이 비싸지 않음
4090을 구매했지만, 24GB VRAM으로는 충분하지 않음
Fly를 선택하는 고객은 전용 GPU 서버를 장기간 사용하는 마지막 사람일 것임
GPU 슬라이스가 없는 것이 아쉬움. 월 $1,000의 비용은 정당화하기 어려움
"우리가 틀렸다"는 말은 영어에서 가장 고귀하고 아름다운 말 중 하나임
Fly.io는 Cloudflare의 Workers 플랫폼과 유사한 개발자를 끌어들임
Runpod에서 서버리스 엔드포인트를 설정하는 데 한 달이 걸렸고, 비싸고 신뢰할 수 없었음