AlphaChip이 컴퓨터 칩 설계를 혁신한 방법

(deepmind.google)

7P by GN⁺ 9달전 | ★ favorite | 댓글 1개

2020년에 칩 레이아웃을 설계하기 위한 새로운 강화 학습 방법을 소개하는 preprint를 발표함
이 방법은 나중에 Nature에 게재되었고 오픈 소스로 제공됨
오늘 우리는 이 방법과 칩 설계 분야에 미친 영향에 대해 자세히 설명하는 Nature addendum을 발표함
또한 사전 훈련된 체크포인트를 공개하고 모델 가중치를 공유하며 AlphaChip이라는 이름을 발표함
컴퓨터 칩은 인공지능(AI)의 놀라운 발전을 이끌었고, AlphaChip은 AI를 활용하여 칩 설계를 가속화하고 최적화함
이 방법은 Google의 맞춤형 AI 가속기인 Tensor Processing Unit(TPU)의 최근 3세대에서 초인적인 칩 레이아웃을 설계하는 데 사용됨
AlphaChip은 실제 엔지니어링 문제를 해결하는 데 사용된 최초의 강화 학습 접근 방식 중 하나임
수주 또는 수개월의 인력 투입 대신 몇 시간 만에 초인적이거나 비슷한 수준의 칩 레이아웃을 생성하며, 이러한 레이아웃은 전 세계의 데이터 센터부터 모바일 폰까지 다양한 칩에 사용됨

AlphaChip의 작동 방식

칩 레이아웃을 설계하는 것은 간단한 작업이 아님
컴퓨터 칩은 많은 상호 연결된 블록으로 구성되어 있으며, 회로 구성 요소의 계층과 매우 얇은 와이어로 모두 연결되어 있음
또한 동시에 충족해야 하는 복잡하고 얽혀있는 많은 설계 제약 조건이 있음
그 복잡성 때문에 칩 설계자들은 60년 넘게 칩 플로어플래닝 프로세스를 자동화하는 데 어려움을 겪어 왔음
AlphaGo와 AlphaZero와 유사하게, 우리는 AlphaChip이 칩 플로어플래닝을 일종의 게임으로 접근하도록 구축함
빈 그리드에서 시작하여 AlphaChip은 한 번에 하나의 회로 구성 요소를 배치하고, 모든 구성 요소 배치를 완료할 때까지 이를 반복함
그런 다음 최종 레이아웃의 품질에 따라 보상을 받음
새로운 "에지 기반" 그래프 신경망을 통해 AlphaChip은 상호 연결된 칩 구성 요소 간의 관계를 학습하고 칩 전반에 걸쳐 일반화할 수 있어, 설계하는 각 레이아웃마다 향상될 수 있음

AI를 사용하여 Google의 AI 가속기 칩 설계하기

AlphaChip은 2020년 발표 이후 Google의 TPU 모든 세대에 사용되는 초인적인 칩 레이아웃을 생성해 왔음
이러한 칩은 Google의 Transformer 아키텍처를 기반으로 대규모 AI 모델을 가능하게 함
TPU는 Gemini와 같은 대규모 언어 모델부터 Imagen 및 Veo와 같은 이미지 및 비디오 생성기에 이르는 강력한 생성 AI 시스템의 핵심에 있음
이러한 AI 가속기는 Google의 AI 서비스의 핵심이기도 하며 Google Cloud를 통해 외부 사용자에게 제공됨
TPU 레이아웃을 설계하기 위해 AlphaChip은 먼저 온칩 및 칩 간 네트워크 블록, 메모리 컨트롤러 및 데이터 전송 버퍼와 같은 이전 세대의 다양한 칩 블록에서 연습함 (이를 사전 훈련이라고 함)
그런 다음 현재 TPU 블록에서 AlphaChip을 실행하여 고품질 레이아웃을 생성함
이전 접근 방식과 달리 AlphaChip은 인간 전문가와 유사하게 더 많은 칩 배치 작업 인스턴스를 해결할수록 더 나아지고 빨라짐
AlphaChip은 최신 Trillium(6세대)를 포함한 각 새로운 TPU 세대마다 더 나은 칩 레이아웃을 설계하고 전체 플로어플랜의 더 많은 부분을 제공하여 설계 주기를 가속화하고 더 높은 성능의 칩을 생산해 왔음

AlphaChip의 광범위한 영향

Alphabet, 연구 커뮤니티 및 칩 설계 업계 전반에 걸친 애플리케이션을 통해 AlphaChip의 영향을 볼 수 있음
TPU와 같은 특수 AI 가속기 설계를 넘어 AlphaChip은 Google의 첫 번째 Arm 기반 범용 데이터 센터 CPU인 Axion 프로세서와 같은 Alphabet 전반의 다른 칩에 대한 레이아웃을 생성해 왔음
외부 조직에서도 AlphaChip을 채택하고 이를 기반으로 구축하고 있음 (예: 세계 최고의 칩 설계 회사 중 하나인 MediaTek은 삼성 휴대폰에 사용되는 Dimensity Flagship 5G와 같은 가장 진보된 칩의 개발을 가속화하면서 전력, 성능 및 칩 면적을 개선하기 위해 AlphaChip을 확장함)
AlphaChip은 칩 설계를 위한 AI 작업의 폭발을 촉발했으며, 논리 합성 및 매크로 선택과 같은 칩 설계의 다른 중요한 단계로 확장되었음

미래의 칩 만들기

우리는 AlphaChip이 컴퓨터 아키텍처에서 제조에 이르기까지 칩 설계 주기의 모든 단계를 최적화할 잠재력이 있다고 믿음
스마트폰, 의료 장비, 농업 센서 등 일상 기기에서 발견되는 맞춤형 하드웨어의 칩 설계를 혁신할 수 있음
AlphaChip의 향후 버전은 현재 개발 중이며, 우리는 이 분야를 계속 혁신하고 칩이 더 빠르고 저렴하며 전력 효율적인 미래를 만들기 위해 커뮤니티와 협력하기를 기대함

GN⁺의 의견

AlphaChip의 AI 기반 접근 방식은 칩 설계 분야에 혁명을 일으키고 있음. 특히 칩 레이아웃 설계 프로세스를 자동화하는 데 큰 진전을 이루었음
AlphaChip은 실제 엔지니어링 문제에 강화 학습을 적용한 초기 사례 중 하나이며, 이는 AI가 실제 세계에서 어떻게 활용될 수 있는지 보여주는 좋은 예임
AlphaChip이 TPU 설계에 미친 영향은 AI 가속기 하드웨어 발전에 있어 중요한 이정표가 될 것임. 더 나은 AI 가속기는 더 강력한 AI 모델을 가능하게 할 것이고, 이는 다시 AI 발전을 더욱 가속화할 것임
그러나 AI 설계 도구에 대한 과도한 의존은 인간 설계자의 전문 지식 상실로 이어질 수 있음. 장기적으로는 AI와 인간 전문가의 협업이 가장 바람직할 것임
유사한 AI 기반 설계 도구로는 Cadence의 Cerebus, Synopsys의 DSO.ai 등이 있음. 앞으로 AI 기반 설계 자동화 도구 간 경쟁이 치열해질 것으로 보임

▲

GN⁺ 9달전 [-]

Hacker News 의견

Google의 Nature 논문은 EDA CAD 분야 연구자들로부터 비판을 받음
- Google 내부 연구자의 반박 논문: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
- UCSD 연구팀의 2023 ISPD 논문: "Assessment of Reinforcement Learning for Macro Placement"
- Igor Markov의 비판 논문: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
Google의 RL 매크로 배치 알고리즘은 다른 최신 알고리즘과 공정하게 비교되지 않았음
- 인간보다 매크로 배치에서 더 나은 성능을 주장하지만, 이는 현재 혼합 배치 알고리즘의 성능에 미치지 못함
- RL 기술은 다른 알고리즘보다 더 많은 컴퓨팅 자원을 필요로 하며, 배치 문제 자체의 새로운 표현을 학습하는 것이 아니라 대체 함수를 학습함
Google의 작업에 대해 회의적이며, 개인 웹사이트에 자세한 게시물을 작성함
Google의 연구자들이 괴롭힘을 당해 Anthropic으로 이직한 사례가 있음
- 관련 기사: "Google Brain AI Researcher Fired Tension"
TSMC는 최신 칩 설계 자동화 소프트웨어가 TDP를 위한 논리 설계를 선택할 수 있는 기능을 강조함
- 이는 Dennard scaling을 유지하는 방법일 수 있음
- 빛의 속도와 물리적 근접성은 여전히 중요하지만, 열 스로틀링을 피하는 것이 얼마나 많은 이점을 가져올지 궁금함
칩 설계 품질 측정 방법에 대한 질문
- Google이 보고하는 메트릭이 타당한지, 아니면 단순히 자신들을 좋게 보이게 하려는 것인지 궁금함
- 칩 설계의 "품질"은 다면적이며 사용 사례에 크게 의존함
- 데이터 센터용 칩과 모바일 폰 카메라 또는 자동차용 칩은 매우 다르게 보일 것임
- 이 특정 문제/작업에서 "더 나은" 것이 무엇을 의미하는지 궁금함
Eurisco는 한때 배치 및 라우팅 작업을 수행하는 데 사용되었으며, 매우 잘 수행했음
- Eurisco는 Traveler TCS 게임의 전투 우주선 함대를 설계하는 데 사용됨
- Eurisco는 VLSI 설계에서 학습한 대칭 기반 배치를 사용함
- AlphaChip의 휴리스틱이 다른 곳에서도 사용될 수 있는지 궁금함
Google의 칩 설계 작업은 "논란의 여지가 있음"
- 새로운 것을 하지 않고 PR만 하는 이유가 궁금함
많은 DeepX 논문이 적절한 CS 포럼 대신 Nature에 제출되는 문제
- 칩 설계에서 더 나은 작업을 하고 있다면 IPSD나 ISCA 등에 제출해야 함
- Nature가 이러한 논문을 어떻게 처리하는지 알 수 없음
"초인적"이라는 표현을 계속 사용하는 이유가 궁금함
- 알고리즘이 이러한 작업에 사용되며, 인간이 수조 개의 트랜지스터를 손으로 배치하지 않음
PCB 설계/레이아웃을 위한 도구가 있었으면 좋겠음
메모리 기반 컴퓨팅이 연구에서 경쟁력 있는 제품으로 전환되는 시점에 얼마나 가까운지 궁금함
- 메모리스터와 같은 실험을 대규모로 확장하기 위해 매우 적극적으로 투자할 시점에 도달했다고 생각함
- AI 데이터 센터를 위해 몇 개의 새로운 원자로가 필요할지 논의하고 있음

답변달기