8P by neo 8일전 | favorite | 댓글 1개
  • 2020년에 칩 레이아웃을 설계하기 위한 새로운 강화 학습 방법을 소개하는 preprint를 발표함
  • 이 방법은 나중에 Nature에 게재되었고 오픈 소스로 제공됨
  • 오늘 우리는 이 방법과 칩 설계 분야에 미친 영향에 대해 자세히 설명하는 Nature addendum을 발표함
  • 또한 사전 훈련된 체크포인트를 공개하고 모델 가중치를 공유하며 AlphaChip이라는 이름을 발표함
  • 컴퓨터 칩은 인공지능(AI)의 놀라운 발전을 이끌었고, AlphaChip은 AI를 활용하여 칩 설계를 가속화하고 최적화함
  • 이 방법은 Google의 맞춤형 AI 가속기인 Tensor Processing Unit(TPU)의 최근 3세대에서 초인적인 칩 레이아웃을 설계하는 데 사용됨
  • AlphaChip은 실제 엔지니어링 문제를 해결하는 데 사용된 최초의 강화 학습 접근 방식 중 하나임
  • 수주 또는 수개월의 인력 투입 대신 몇 시간 만에 초인적이거나 비슷한 수준의 칩 레이아웃을 생성하며, 이러한 레이아웃은 전 세계의 데이터 센터부터 모바일 폰까지 다양한 칩에 사용됨

AlphaChip의 작동 방식

  • 칩 레이아웃을 설계하는 것은 간단한 작업이 아님
  • 컴퓨터 칩은 많은 상호 연결된 블록으로 구성되어 있으며, 회로 구성 요소의 계층과 매우 얇은 와이어로 모두 연결되어 있음
  • 또한 동시에 충족해야 하는 복잡하고 얽혀있는 많은 설계 제약 조건이 있음
  • 그 복잡성 때문에 칩 설계자들은 60년 넘게 칩 플로어플래닝 프로세스를 자동화하는 데 어려움을 겪어 왔음
  • AlphaGo와 AlphaZero와 유사하게, 우리는 AlphaChip이 칩 플로어플래닝을 일종의 게임으로 접근하도록 구축함
  • 빈 그리드에서 시작하여 AlphaChip은 한 번에 하나의 회로 구성 요소를 배치하고, 모든 구성 요소 배치를 완료할 때까지 이를 반복함
  • 그런 다음 최종 레이아웃의 품질에 따라 보상을 받음
  • 새로운 "에지 기반" 그래프 신경망을 통해 AlphaChip은 상호 연결된 칩 구성 요소 간의 관계를 학습하고 칩 전반에 걸쳐 일반화할 수 있어, 설계하는 각 레이아웃마다 향상될 수 있음

AI를 사용하여 Google의 AI 가속기 칩 설계하기

  • AlphaChip은 2020년 발표 이후 Google의 TPU 모든 세대에 사용되는 초인적인 칩 레이아웃을 생성해 왔음
  • 이러한 칩은 Google의 Transformer 아키텍처를 기반으로 대규모 AI 모델을 가능하게 함
  • TPU는 Gemini와 같은 대규모 언어 모델부터 Imagen 및 Veo와 같은 이미지 및 비디오 생성기에 이르는 강력한 생성 AI 시스템의 핵심에 있음
  • 이러한 AI 가속기는 Google의 AI 서비스의 핵심이기도 하며 Google Cloud를 통해 외부 사용자에게 제공됨
  • TPU 레이아웃을 설계하기 위해 AlphaChip은 먼저 온칩 및 칩 간 네트워크 블록, 메모리 컨트롤러 및 데이터 전송 버퍼와 같은 이전 세대의 다양한 칩 블록에서 연습함 (이를 사전 훈련이라고 함)
  • 그런 다음 현재 TPU 블록에서 AlphaChip을 실행하여 고품질 레이아웃을 생성함
  • 이전 접근 방식과 달리 AlphaChip은 인간 전문가와 유사하게 더 많은 칩 배치 작업 인스턴스를 해결할수록 더 나아지고 빨라짐
  • AlphaChip은 최신 Trillium(6세대)를 포함한 각 새로운 TPU 세대마다 더 나은 칩 레이아웃을 설계하고 전체 플로어플랜의 더 많은 부분을 제공하여 설계 주기를 가속화하고 더 높은 성능의 칩을 생산해 왔음

AlphaChip의 광범위한 영향

  • Alphabet, 연구 커뮤니티 및 칩 설계 업계 전반에 걸친 애플리케이션을 통해 AlphaChip의 영향을 볼 수 있음
  • TPU와 같은 특수 AI 가속기 설계를 넘어 AlphaChip은 Google의 첫 번째 Arm 기반 범용 데이터 센터 CPU인 Axion 프로세서와 같은 Alphabet 전반의 다른 칩에 대한 레이아웃을 생성해 왔음
  • 외부 조직에서도 AlphaChip을 채택하고 이를 기반으로 구축하고 있음 (예: 세계 최고의 칩 설계 회사 중 하나인 MediaTek은 삼성 휴대폰에 사용되는 Dimensity Flagship 5G와 같은 가장 진보된 칩의 개발을 가속화하면서 전력, 성능 및 칩 면적을 개선하기 위해 AlphaChip을 확장함)
  • AlphaChip은 칩 설계를 위한 AI 작업의 폭발을 촉발했으며, 논리 합성 및 매크로 선택과 같은 칩 설계의 다른 중요한 단계로 확장되었음

미래의 칩 만들기

  • 우리는 AlphaChip이 컴퓨터 아키텍처에서 제조에 이르기까지 칩 설계 주기의 모든 단계를 최적화할 잠재력이 있다고 믿음
  • 스마트폰, 의료 장비, 농업 센서 등 일상 기기에서 발견되는 맞춤형 하드웨어의 칩 설계를 혁신할 수 있음
  • AlphaChip의 향후 버전은 현재 개발 중이며, 우리는 이 분야를 계속 혁신하고 칩이 더 빠르고 저렴하며 전력 효율적인 미래를 만들기 위해 커뮤니티와 협력하기를 기대함

GN⁺의 의견

  • AlphaChip의 AI 기반 접근 방식은 칩 설계 분야에 혁명을 일으키고 있음. 특히 칩 레이아웃 설계 프로세스를 자동화하는 데 큰 진전을 이루었음
  • AlphaChip은 실제 엔지니어링 문제에 강화 학습을 적용한 초기 사례 중 하나이며, 이는 AI가 실제 세계에서 어떻게 활용될 수 있는지 보여주는 좋은 예임
  • AlphaChip이 TPU 설계에 미친 영향은 AI 가속기 하드웨어 발전에 있어 중요한 이정표가 될 것임. 더 나은 AI 가속기는 더 강력한 AI 모델을 가능하게 할 것이고, 이는 다시 AI 발전을 더욱 가속화할 것임
  • 그러나 AI 설계 도구에 대한 과도한 의존은 인간 설계자의 전문 지식 상실로 이어질 수 있음. 장기적으로는 AI와 인간 전문가의 협업이 가장 바람직할 것임
  • 유사한 AI 기반 설계 도구로는 Cadence의 Cerebus, Synopsys의 DSO.ai 등이 있음. 앞으로 AI 기반 설계 자동화 도구 간 경쟁이 치열해질 것으로 보임
Hacker News 의견
  • Google의 Nature 논문은 EDA CAD 분야 연구자들로부터 비판을 받음
    • Google 내부 연구자의 반박 논문: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • UCSD 연구팀의 2023 ISPD 논문: "Assessment of Reinforcement Learning for Macro Placement"
    • Igor Markov의 비판 논문: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • Google의 RL 매크로 배치 알고리즘은 다른 최신 알고리즘과 공정하게 비교되지 않았음
    • 인간보다 매크로 배치에서 더 나은 성능을 주장하지만, 이는 현재 혼합 배치 알고리즘의 성능에 미치지 못함
    • RL 기술은 다른 알고리즘보다 더 많은 컴퓨팅 자원을 필요로 하며, 배치 문제 자체의 새로운 표현을 학습하는 것이 아니라 대체 함수를 학습함
  • Google의 작업에 대해 회의적이며, 개인 웹사이트에 자세한 게시물을 작성함
  • Google의 연구자들이 괴롭힘을 당해 Anthropic으로 이직한 사례가 있음
    • 관련 기사: "Google Brain AI Researcher Fired Tension"
  • TSMC는 최신 칩 설계 자동화 소프트웨어가 TDP를 위한 논리 설계를 선택할 수 있는 기능을 강조함
    • 이는 Dennard scaling을 유지하는 방법일 수 있음
    • 빛의 속도와 물리적 근접성은 여전히 중요하지만, 열 스로틀링을 피하는 것이 얼마나 많은 이점을 가져올지 궁금함
  • 칩 설계 품질 측정 방법에 대한 질문
    • Google이 보고하는 메트릭이 타당한지, 아니면 단순히 자신들을 좋게 보이게 하려는 것인지 궁금함
    • 칩 설계의 "품질"은 다면적이며 사용 사례에 크게 의존함
    • 데이터 센터용 칩과 모바일 폰 카메라 또는 자동차용 칩은 매우 다르게 보일 것임
    • 이 특정 문제/작업에서 "더 나은" 것이 무엇을 의미하는지 궁금함
  • Eurisco는 한때 배치 및 라우팅 작업을 수행하는 데 사용되었으며, 매우 잘 수행했음
    • Eurisco는 Traveler TCS 게임의 전투 우주선 함대를 설계하는 데 사용됨
    • Eurisco는 VLSI 설계에서 학습한 대칭 기반 배치를 사용함
    • AlphaChip의 휴리스틱이 다른 곳에서도 사용될 수 있는지 궁금함
  • Google의 칩 설계 작업은 "논란의 여지가 있음"
    • 새로운 것을 하지 않고 PR만 하는 이유가 궁금함
  • 많은 DeepX 논문이 적절한 CS 포럼 대신 Nature에 제출되는 문제
    • 칩 설계에서 더 나은 작업을 하고 있다면 IPSD나 ISCA 등에 제출해야 함
    • Nature가 이러한 논문을 어떻게 처리하는지 알 수 없음
  • "초인적"이라는 표현을 계속 사용하는 이유가 궁금함
    • 알고리즘이 이러한 작업에 사용되며, 인간이 수조 개의 트랜지스터를 손으로 배치하지 않음
  • PCB 설계/레이아웃을 위한 도구가 있었으면 좋겠음
  • 메모리 기반 컴퓨팅이 연구에서 경쟁력 있는 제품으로 전환되는 시점에 얼마나 가까운지 궁금함
    • 메모리스터와 같은 실험을 대규모로 확장하기 위해 매우 적극적으로 투자할 시점에 도달했다고 생각함
    • AI 데이터 센터를 위해 몇 개의 새로운 원자로가 필요할지 논의하고 있음