5P by GN⁺ 4시간전 | ★ favorite | 댓글 1개
  • Valve의 Steam Deck를 위해 설계된 SCX-LAVD 리눅스 스케줄러가 Meta의 대규모 서버 환경에서도 효과적으로 작동한다는게 공개됨
  • 이 스케줄러는 게임 콘솔 수준의 효율적 자원 관리를 목표로 설계된 것인데, Meta는 이를 통해 서버 워크로드의 성능 향상지연 시간 최소화를 추구
  • 휴대용 게임 기기를 위한 지연 민감도 인지 가상 데드라인 스케줄링(Latency-criticality Aware Virtual Deadline) 구조가 하이퍼스케일 서버에서도 성능과 안정성을 보임
  • 기존 EEVDF 스케줄러와 비교해 유사하거나 더 나은 성능을 보이며 다양한 하드웨어 구성에 적응 가능함
  • Meta는 SCX-LAVD를 특수 목적이 아닌 기본 서버 스케줄러 후보로 검토하고 있음
  • 게임 하드웨어용 기술이 대형 데이터센터로 확장된 드문 사례

Linux Plumbers Conference 2025 발표 배경

  • Tokyo에서 열린 Linux Plumbers Conference 2025에서 Meta 엔지니어들이 관련 내용을 발표함
  • 발표 제목은 “How do we make a Steam Deck scheduler work on large servers”로, 휴대용 기기용 스케줄러의 서버 확장 과정 설명
  • Steam Deck를 위해 설계된 스케줄러를 서버 환경에 맞게 검증하고 조정한 경험 공유

SCX-LAVD 스케줄러 개요

  • SCX-LAVD는 Latency-criticality Aware Virtual Deadline 스케줄러로 설계됨
  • Valve의 Steam Deck 환경에서 낮은 지연안정적인 성능을 목표로 개발됨
  • Linux sched_ext 프레임워크 위에서 동작하는 확장형 스케줄러 구조 사용
  • Meta는 이를 통해 지연 시간 감소, 성능 일관성 향상, 서버 효율성 개선을 기대
  • Valve의 설계가 게임용 실시간 처리 요구에 맞춰진 만큼, 서버에서도 지속적 부하 관리에 유리한 구조

Meta 서버 환경에서의 적용 결과

  • Meta 서버의 다양한 CPU 및 메모리 구성에서도 안정적인 동작 확인
  • CCX 및 LLC 경계 간 로드 밸런싱 성능이 우수하게 나타남
  • 특정 워크로드에 최적화된 스케줄러가 필요하지 않은 환경에서 기본 선택지로 적합함

기존 스케줄러 및 다른 활용 사례

  • SCX-LAVD는 EEVDF 스케줄러와 비교해 유사하거나 더 나은 성능을 보임
  • CachyOS Handheld Edition, Bazzite 등 Linux 게임 환경에서도 이미 활용 중
  • Igalia가 Valve와의 계약을 통해 개발을 주도한 스케줄러임

Meta의 향후 활용 방향

  • Meta는 SCX-LAVD를 “Meta’s New Default Scheduler”로 지칭함
  • 대규모 서버 플릿 전반에서 범용적으로 적용 가능한 스케줄러로 평가 중
  • 추가 연구 내용과 성능 분석은 LPC 발표 영상슬라이드 자료로 공개됨
Hacker News 의견들
  • Valve가 사실상 리눅스 생태계 발전을 혼자 이끌고 있음
    Windows 게임을 리눅스에서 돌리기 위해 Proton/Wine이 크게 발전했고, Steam Deck 덕분에 Wayland의 HDR·VRR 지원도 생겼음
    프레임 페이싱 개선을 위해 만든 스케줄러가 지금은 Meta 데이터센터에서도 쓰이고 있음
    결국 Meta 서버 효율이 Valve가 Elden Ring의 프레임 끊김을 줄이려 Igalia에 돈을 준 덕분에 좋아진 셈임. 이런 게 진짜 오픈소스의 선순환임
    • 게임의 프레임 끊김을 줄이려다 오픈소스 그래픽 스택용 셰이더 컴파일러가 최적화된 결과를 얻었음
      관련 공지: Steam Community Announcement
    • 게임 개발은 여전히 저평가된 분야
      수많은 소프트웨어·하드웨어 최적화가 게임 개발에서 비롯되었음
      최근 RAM 가격이 오르는 만큼, 다시 최적화 중심으로 돌아가 업계 전반의 불필요한 부하를 줄이길 바람
    • 여러 데스크톱 중심 리눅스 배포판이 있었지만, 대부분 “기술적으로는 되지만 불편함을 감수해야 하는” 상태였음
      Valve가 직접 나서기 전까지는 이런 문제를 해결할 주체가 없었음
    • 시간이 지나면 Valve가 Microsoft가 수년간 미뤄온 일들까지 손댈 것 같음
      기다리기보다는 직접 바꾸는 게 훨씬 낫다고 생각함
    • 게임 덕분에 GPU 산업이 AI 붐을 맞을 준비가 되어 있었음
      과거 게임 개발은 항상 소프트웨어 최적화의 최전선이었음
  • Valve가 Igalia 같은 컨트랙터 중심 구조로 리눅스 관련 개발을 진행한다는 점이 흥미로움
    Proton도 비슷한 방식으로 만들어졌다고 들음. Valve는 내부 인력보다 외부 계약을 많이 활용하는 듯함
    • Igalia는 여러 기업의 오픈소스 개발 스폰서십을 조직적으로 관리하는 독특한 회사임
      Google 등 다양한 기업과 협업하며, 복잡한 결제·복리후생 문제를 효율적으로 처리함
    • Valve는 내부적으로 게임·하드웨어·배포에만 집중하고, 그 외 영역은 전문 계약자에게 위임
      이런 구조가 비용 효율적이고, 고품질 결과를 내는 이유라고 생각함
      물론 Valve의 논란도 있지만, 좋은 점과 나쁜 점을 함께 인정해야 함
    • Valve는 약 350~400명 규모의 작은 평면 조직
      그래서 정규직보다 계약자 확장이 훨씬 쉬움
    • Proton은 Valve 내부 개발자, CodeWeavers, 커뮤니티가 함께 만든 프로젝트임
      DirectX→Vulkan, OpenGL→Vulkan 변환 같은 특수 기술 영역은 Igalia 같은 조직에 위탁함
    • Valve는 가능한 한 인력을 최소화하려는 경향이 있음
      이런 고정형·고난도 프로젝트는 어떤 회사라도 외주를 주는 게 합리적임
  • sched_ext는 Meta에서 개발된 스케줄러임
    여러 회사가 협업하며 공동 GitHub 저장소에서 함께 개발 중임
  • Linux에서 게임 스트리밍이 얼마나 잘 되는지 궁금함
    Windows 10 지원이 끝나서 이제 Linux로 완전히 옮기려 함
  • 4개월째 Bazzite Desktop을 메인으로 쓰고 있는데, 이제 Windows는 사실상 버려진 소프트웨어 같음
    업데이트를 해도 여전히 무겁고 관리가 어려움
    • Bazzite가 게임 중심 배포판 아닌가?
      모든 작업을 그 위에서 하는 건 좀 이상해 보임. Steam Deck에서 엑셀을 쓰는 느낌임
  • 오픈소스의 마법은 Valve가 엔터프라이즈 라이선스 같은 걸 요구하지 않는다는 점임
    • 맞지만, Red Hat은 RHEL 바이너리를 배포하지 않으면 소스코드를 공개할 의무가 없음
      Meta도 내부 서버에서만 쓰는 한, 자체 패치된 리눅스를 비공개로 유지할 수 있음
    • 휴대용 콘솔용 스케줄러가 Facebook 서버에서도 잘 작동한다는 게 놀라움
    • 반대로 SteamOS나 여러 리눅스 배포판이 Meta의 Kyber IO 스케줄러를 도입해 마이크로스터터를 해결하기도 함
      서로 영향을 주고받는 구조임
    • 생각해보면, Steam에서 게임을 살 때 내는 30% 수수료가 일종의 라이선스 비용일지도 모름
  • Meta가 Valve의 스케줄러를 서버에 적용했다는 게 흥미로움
    이런 시도가 어떻게 시작됐는지 궁금함
    • 아마도 어떤 엔지니어가 테스트해보고 성능 향상을 발견해, 아래에서 위로 퍼진 결과일 것임
      대기업에서도 이런 식으로 혁신이 일어남
  • Phoronix 기사 대신 원본 영상을 보는 게 낫다고 생각함
    YouTube 링크
    • YouTube 영상을 1차 자료로 신뢰하지 않는 순간, 삶이 훨씬 편해짐
    • Phoronix를 블로그 스팸이라 부르다니 의외임
  • Meta가 어떤 초저지연 워크로드를 돌리길래 이런 스케줄러가 필요한지 궁금함
    • 영상에 따르면 WhatsApp의 Erlang 워커가 서브밀리초 지연을 요구함
    • 아마 광고 경매 시스템 때문일 것임
    • Meta처럼 거대한 기업은 지연이 곧 비즈니스 손실로 이어짐
    • Meta는 항상 “가능한 한 빠르게”를 목표로 함, 필요 이상일 때도 있음
    • 서버 5만 대 중 1%만 줄여도 50대 절감, 대당 8천 달러라면 연간 40만 달러 절약임
      Meta 규모에서는 훨씬 큰 절감 효과임
  • 서버 워크로드가 다른 영역의 아이디어를 받아들이는 게 흥미로움
    최근 Kubernetes 전용 OS들이 Android처럼 업데이트를 적용하는 걸 봤음
    • 그게 immutable 시스템을 말하는 거냐고 되묻고 싶음