1P by GN⁺ 1일전 | ★ favorite | 댓글 1개
  • Arm이 Neoverse 플랫폼 기반의 AGI CPU를 공개하며, 자율적 AI 인프라를 위한 생산 준비형 실리콘을 직접 제공
  • 이 CPU는 고밀도 랙 환경에서의 병렬 AI 워크로드를 위해 최적화되어, 지속 부하에서도 높은 단일 스레드 성능과 메모리 대역폭을 유지
  • Meta, OpenAI, SK Telecom 등 주요 파트너들이 이미 상용 배포를 시작했으며, 가속기 관리와 에이전트 오케스트레이션 등 다양한 AI 인프라에 적용 중
  • Arm은 1OU Dual Node Reference Server를 공개하고, OCP 표준 폼팩터 및 오픈소스 도구로 생태계 확장을 추진
  • 이번 출시는 Arm이 데이터센터 실리콘 시장에 본격 진입했음을 의미하며, AI 네이티브 데이터센터 아키텍처의 핵심 기반으로 자리함

Arm AGI CPU 발표: 에이전틱 AI 클라우드 시대를 위한 실리콘 기반

  • Arm AGI CPU는 Arm Neoverse 플랫폼을 기반으로 한 새로운 실리콘 제품으로, 차세대 AI 인프라 구동을 목표로 설계된 생산 준비형 CPU임
  • Arm이 35년 역사상 처음으로 직접 실리콘 제품을 제공하며, IP 및 Compute Subsystem(CSS)을 넘어 플랫폼 수준 솔루션과 Arm 설계 프로세서를 고객에게 선택적으로 제공함
  • AI 인프라의 급속한 진화와 대규모 배포 가능한 Arm 플랫폼에 대한 수요 증가에 대응하기 위한 조치임

에이전틱 AI 인프라의 부상

  • AI 시스템이 전 세계적으로 지속적이고 자율적으로 운영되는 시대에 진입함
    • 과거에는 인간의 상호작용 속도가 시스템 처리 속도를 제한했으나, 에이전틱 AI에서는 소프트웨어 에이전트가 실시간으로 다중 모델과 상호작용하며 의사결정을 수행함
  • 이러한 변화로 CPU가 현대 인프라의 핵심 조율 요소로 부상함
    • CPU는 가속기, 메모리, 스토리지, 워크로드 스케줄링, 데이터 이동 등을 관리하며, 다수의 에이전트를 동시에 조정함
  • Arm Neoverse는 이미 AWS Graviton, Google Axion, Microsoft Azure Cobalt, NVIDIA Vera 등 주요 하이퍼스케일 및 AI 플랫폼의 기반으로 사용되고 있음
  • Arm AGI CPU는 이러한 글로벌 AI 인프라 확장 요구에 대응하기 위해 개발됨

Arm AGI CPU: 랙 단위 에이전틱 효율성 설계

  • Arm AGI CPU는 대규모 병렬 환경에서 지속 부하 중에도 높은 단일 태스크 성능을 유지하도록 설계됨
    • 작동 주파수, 메모리, I/O 아키텍처 등 모든 요소가 고밀도 랙 배치에서의 병렬 AI 워크로드를 지원하도록 최적화됨
  • Arm의 기준 서버 구성은 1OU, 2노드 설계로, 각 블레이드에 272코어(2칩, 전용 메모리 및 I/O 포함)를 탑재함
    • 공랭식 36kW 랙에는 30개의 블레이드(총 8160코어)가 장착 가능
    • Supermicro와 협력한 수랭식 200kW 설계는 336개의 Arm AGI CPU(총 45,000코어 이상)를 수용 가능
  • 이 구성은 최신 x86 시스템 대비 랙당 2배 이상의 성능을 제공함*
    • 메모리 대역폭이 높아 지속 부하에서도 스레드 효율 유지
    • Neoverse V3 코어 기반의 단일 스레드 성능이 향상되어 스레드당 처리량 증가

AI 생태계에서의 초기 확산

  • Arm AGI CPU는 주요 파트너들과 함께 상용 배포 단계에 진입함
    • 적용 분야는 가속기 관리, 에이전트 오케스트레이션, 서비스 및 애플리케이션 밀집화, 네트워킹 및 데이터 플레인 컴퓨트 확장 등
  • Meta가 선도 파트너로 참여하여, Meta 앱군의 기가와트급 인프라 최적화 및 MTIA 가속기와의 통합을 추진 중임
  • 초기 파트너에는 Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP, SK Telecom 등이 포함됨
    • ASRockRack, Lenovo, Supermicro를 통해 상용 시스템 주문 가능
  • Arm은 Arm AGI CPU 1OU Dual Node Reference Server를 공개하여 Open Compute Project(OCP) DC-MHS 표준 폼팩터로 제공함
    • 해당 서버 설계, 펌웨어, 시스템 아키텍처 명세, 디버그 프레임워크, 진단 및 검증 도구를 오픈소스로 기여할 예정
    • 세부 내용은 OCP EMEA Summit에서 공개 예정

Arm 인프라의 새로운 장

  • Arm AGI CPU 출시는 Arm 데이터센터 전략의 새로운 단계를 의미함
    • 하이퍼스케일 클라우드부터 AI 스타트업까지 다양한 고객층을 지원
  • Arm AGI CPU는 Arm의 데이터센터 실리콘 제품군의 첫 모델로, 현재 주문 가능
    • 후속 제품들은 최고 수준의 성능, 확장성, 효율성을 목표로 개발 중
  • Arm Neoverse CSS 로드맵과 병행하여, 모든 Arm 데이터센터 고객이 공통 플랫폼 아키텍처와 소프트웨어 호환성을 유지하도록 지원함
  • 50개 이상의 주요 기업이 Arm 실리콘 확장을 지지하며, AI 네이티브 데이터센터 아키텍처를 정의하고 직접 구축하는 단계로 진입함

파트너 발언 요약

  • Cerebras

    • 초대규모 추론 중심 AI 인프라 구축에서 Arm AGI CPU의 확장성과 효율성이 핵심 역할 수행
  • Cloudflare

    • 전 세계 네트워크 전반에서 효율적 확장을 위해 고성능·저전력 컴퓨트 인프라로 Arm AGI CPU 채택
  • Meta

    • 데이터센터 성능 밀도 향상과 다세대 AI 시스템 로드맵 지원을 위해 Arm과 공동 개발 진행
  • OpenAI

    • 대규모 AI 워크로드 조율 계층 강화 및 시스템 효율·대역폭 향상에 Arm AGI CPU가 기여 예정
  • Positron

    • 추론 가속 기술과 Arm AGI CPU의 에너지 효율성 결합으로 데이터센터의 성능·비용 효율 개선 기대
  • Rebellions

    • Arm AGI CPU와 NPU 결합형 고밀도 서버 구성으로 대규모 추론 워크로드에 최적화된 플랫폼 제공
  • SAP

    • Arm 기반 엔터프라이즈 워크로드의 성숙도를 강조하며, 차세대 AI 비즈니스 솔루션 지원 기반으로 Arm AGI CPU 확장
  • SK Telecom

    • Rebellions AI 가속기와 Arm AGI CPU를 통합한 대규모 AI 추론 데이터센터 인프라를 구축 중이며, AIDC 경쟁력 강화 목표

주의 및 면책 고지

  • 본 문서에는 Arm의 제품 로드맵, 성능, 파트너 배포 계획 등에 대한 미래 예측 진술이 포함되어 있음
    • 실제 결과는 시스템 구성, 워크로드 등 요인에 따라 달라질 수 있음
  • 성능 수치는 Arm 내부 추정치로, Arm AGI CPU 기반 서버와 동급 x86 서버의 랙 단위 비교를 기준으로 함*
  • 모든 제품명과 회사명은 해당 소유자의 상표 또는 등록상표임
Hacker News 의견들
  • 이 CPU 이름은 거의 증권 사기 수준임
    요즘 "AGI"라 하면 대부분 Artificial General Intelligence를 떠올리는데, Arm은 "Agentic AI Infrastructure"라고 부르고 있음
    일반 투자자들은 그 차이를 모르고 ARM 주식을 사게 될 것이고, Arm은 그걸 알고 있음. 업계에서는 이런 걸 ‘거짓말’이라 부름

    • 요즘 AGI는 그냥 마케팅용 단어로 전락했음. 이제 AGI 향이 나는 데오드란트도 나올 것 같음
    • 예전에 5G 마케팅도 이랬음. 실제 5G가 배포되기 전인데도 5G라 부르며 소비자 혼동을 유도했음
      PBS 기사에서도 다뤘듯, 마케팅은 늘 이런 식으로 용어를 섞어 씀
    • 부자들이 이렇게 멍청하다면 돈을 잃어도 할 말이 없음
      아무 확인도 안 하고 투자하는 사람은 어떤 법으로도 보호할 수 없음
    • 오히려 이런 과장된 네이밍이 좋다고 생각함
      이런 허황된 마케팅이 오히려 업계가 ‘AGI’라는 단어를 버리고 현실로 돌아오게 만들 수도 있음
    • 이런 식의 마케팅이 정말 짜증남
      기존 용어를 가져다 새 의미로 포장하는 건 오래된 수법임
      IBM의 “Personal Computer”, Microsoft의 “Windows”, Intel의 “Core”도 다 그랬음
      (참고로 나는 ARM의 소액 투자자임)
  • 이건 단순히 Arm이 Neoverse CPU를 직접 제조해 판매하는 것임
    AI CPU가 아님. Graviton, Epyc, Xeon과 다를 게 없음
    이미 몇 년 전 Qualcomm vs Arm 소송에서 드러났던 내용임
    Arm이 라이선스만 주는 게 아니라 직접 CPU를 팔 계획이었고, 당시 CEO는 부인했지만 결국 사실로 드러남
    관련해서 내가 쓴 게시글도 있음

    • 예전에 Intel이 Pentium으로 웹 브라우징이 빨라진다고 홍보하던 게 떠오름
    • 나도 처음엔 같은 생각이었음. 블로그 내용을 보니 ARM이 고객과 직접 경쟁하려는 게 명확함
      그래서 AI 유행에 편승해 이름을 붙인 듯함
      하지만 하드웨어 업체들은 이런 허세를 간파할 것임. 결국 가격 경쟁력이 없으면 안 팔림
    • 더 나쁜 건, 진짜 AI 가속기(NPU) 가 들어간 SoC도 있는데 이건 그런 것도 아님
  • 흥미로운 건 Arm이 35년 역사상 처음으로 자체 실리콘 제품을 낸다는 점임

    • 수십 년간 다른 회사들이 ARM 코어를 이상하게 써온 걸 보며 답답했던 엔지니어들이, 드디어 자기 실력을 보여줄 기회를 얻은 듯함
    • ARM이 직접 칩을 만든다는 건, 마치 TSMC가 자체 CPU를 판매하는 것과 같음
      이제 ARM이 고객사와 직접 경쟁하게 됨
    • 결국 AI 실리콘 경쟁의 유혹이 너무 커진 것 같음
      라이선스 수익보다 직접 칩을 파는 게 더 이익이 된 시점임
    • 하지만 ARM1을 만든 VLSI도 결국 ARM의 실리콘이었음. 완전히 새로운 일은 아님
    • 이걸 하려면 Design Verification 엔지니어를 새로 고용해야 할 텐데, 그건 큰 비용임
  • AGI는 Agentic AI Infrastructure의 약자임
    혹시 다른 걸 떠올렸다면 참고하길

    • 지금 AI 업계의 현실을 시적으로 요약한 표현 같음. 아름답지만 씁쓸한 풍경
    • 차라리 이름을 AAII로 해서 “AI보다 두 배 강력하다”고 홍보했으면 더 재밌었을 듯함
    • AGI의 각 글자가 어디에 강조되는지도 헷갈림
      ARM이 A, R, M 프로필을 깔끔히 구분했던 걸 생각하면 실망스러움
    • 이건 그냥... 뭔가 있음. 좋은 의미의 ‘뭔가’는 아님
    • 마치 점프하다가 상어를 뛰어넘으며 바지를 잃은 느낌임. 의도했든 아니든 인상적임
  • AGI(Agentic AI Infrastructure)는 CSS(Compute Subsystems)와 함께 라인업에 추가된다고 함
    누가 이런 이름을 짓는지 궁금함

    • “Generative AI”를 “General AI”처럼 들리게 만든 사람들과 같은 부류일 듯함
      마케터의 기본 생활 방식은 사기인 듯함
    • 그럼 Artificial General Intelligence와 Cascading Style Sheets가 손잡는 건 아님?
  • 이건 마치 자기 아이 이름을 World President Smith라고 짓는 것 같음

    • 근데 의외로 통할 수도 있음
      APA 논문에 따르면 이름이 행동에 영향을 준다고 함
      내 부동산 중개인 성도 ‘House’임
  • 오늘날 모든 게 AGI임
    어제는 Agentic이었고, 그저께는 AI였음
    이제 곧 AGI Agentic AI Crypto 화장지가 슈퍼마켓에 깔릴 것 같음. 그 옆에는 UML Rational Rose 참치캔이 있을 듯함

  • Arm이 이제 자체 CPU를 직접 판매한다고 함

  • “Built for rack-scale agentic efficiency”가 무슨 뜻인지 모르겠음

    • 마케팅 문구를 넘겨보면, 136코어에 300W 전력으로 효율을 높인 대규모 멀티코어 시스템임
      Arm의 설명에 따르면 미래의 Agentic 워크로드는 CPU와 GPU 모두에 부하가 걸리므로 CPU 효율이 중요하다고 함
    • 요즘은 그냥 그럴듯하게 들리는 단어만 나열하는 시대임
    • 결국 “토큰 소비량 × 에이전트 수 × 랙 공간”이라는 Agentic 연산 밀도 개념임
    • “mongodb is web scale” 밈이 떠오름
    • “바늘 끝 위에서 몇 명의 천사가 춤출 수 있을까?” 같은 질문 같음
      위키백과 링크 참고