GN⁺ 2025-03-24 | parent | ★ favorite | on: 나는 좋은 병렬 컴퓨터를 원해요(raphlinus.github.io)
Hacker News 의견
  • "두 가지 주요 요인이 이를 방해한다고 믿음"

    • 의견을 과학적으로 포장하는 것에 지침
    • Cell 프로세서 작업 경험에서 많은 미세 관리가 필요했음
    • 현대 시스템은 메모리 보호, 격리, 안정성을 고려하여 설계됨
    • Amiga에서 코드를 작성하게 하면 새로운 감사가 생길 것임
  • 프로그래밍 모델이 2025년에는 비효율적임

    • 런타임에 셰이더 소스/바이트코드를 컴파일해야 함
    • NUMA/디스크리트에서 CPU와 GPU 간의 데이터 구조 조작이 어려움
    • CPU-GPU 및 GPU 작업 간의 데이터 접근 동기화 필요
    • 표준화되지 않은 하드웨어로 인해 혼란스러운 API 처리 필요
    • 다양한 구성의 조합 처리 필요
  • "수백 개의 작은 CPU를 단일 칩에 넣은" 회사에서 일한 경험

    • 프로그래밍 모델이 너무 이상해서 실패할 것임
    • 차세대는 새로운 아키텍처가 아닌 추가 기능이 있는 GPU일 것임
  • GPU가 CPU보다 10~100배 더 강력함

    • 많은 작업이 더 많은 성능을 필요로 하지 않음
    • GUI는 20년 이상 사용자 입력에 반응적이었음
    • GPU 프로그래밍을 단순화해야 함
  • M4 Mac mini 슈퍼컴퓨터 구축에 대한 의견

    • Apple M3 Ultra GPU 및 Neural Engine 명령어 집합 역공학
    • 50조 이상의 연산을 초당 수행할 수 있음
  • 병렬 컴퓨터의 문제점

    • 많은 사람들이 개발 목적으로 장치를 채택해야 함
    • CPU에서 GPU로 코드를 포팅하는 것은 큰 작업임
    • AMD와 다른 회사들이 GPU를 CPU에 더 가깝게 이동시키는 아이디어 탐구
  • 2D 렌더러에 GPU가 필요한 이유가 명확하지 않음

    • 3D 렌더러는 도움이 필요함
    • Vulkan은 렌더러 아래의 레벨임
    • Rust 3D에서 렌더러 설계의 마찰점 존재
  • Larabee에 대한 언급이 많지만 Xeon Phis에 대한 언급이 없음

    • CPU 설계가 단일 코어 성능과 전력 효율성을 최적화하는 방향으로 나뉘고 있음
    • E 코어가 더 많아지면 병렬성을 활용하는 알고리즘이 승리할 수 있음
  • GPU의 높은 처리량을 가능하게 하는 희생

    • Apple Silicon의 통합 메모리 시스템이 있음
    • GPU 프로그래밍 API가 메모리가 통합되지 않은 것처럼 다루게 함