2P by GN⁺ 6시간전 | ★ favorite | 댓글 1개
  • AI Index 2026은 벤치마크 성능, 투자, 대중 인식, 컴퓨트, 탄소 배출 같은 지표로 AI 전반의 흐름을 집계한 보고서
  • 주목할 만한 AI 모델 출시는 미국과 산업계 중심으로 이어졌고, 중국은 산업용 로봇 설치에서 뚜렷한 우위 기록
  • 전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가했고, Nvidia GPU가 현재 총 용량의 60퍼센트 이상 차지
  • 멀티모달 LLM과 agentic AI의 벤치마크 성능은 빠르게 상승했지만, 아날로그 시계 읽기 같은 일반 과제에서는 낮은 정확도 지속
  • 2025년 AI 투자는 5,810억 달러를 넘겨 최고치를 기록했고, 고용 영향과 규제 신뢰, 대중 수용도는 국가와 지표에 따라 큰 차이 드러남

2026 AI Index 보고서의 핵심 지표

  • Stanford의 400페이지 이상 분량 AI Index 2026 보고서가 벤치마크 점수, 투자, 대중 인식 등 여러 각도에서 AI 현황을 집계
  • 선도 AI 모델 성능은 계속 가속 중이며, OpenAI와 Anthropic 같은 대형 AI 기업들은 올해 후반 IPO를 향해 나아가는 중
  • AI에 대한 반감도 이어지며, 특히 미국에서는 지방정부가 신규 데이터센터 개발에 대한 제한 또는 전면 금지를 받아들이기 시작함
  • 2021년부터 2025년까지의 이전 연도 보도에 이어, 2026년 AI 현황을 압축하는 추세 선별

미국의 AI 모델 우위

  • 미국은 지난 10년 동안 주목할 만한 AI 모델 출시를 주도했고, 2025년에도 그 흐름 유지
    • Epoch AI 기준으로 미국 기반 조직이 2025년에 출시한 주목할 만한 모델 수는 50개
    • 중국의 산출량은 격차를 좁히기 시작
  • 주목할 만한 모델의 거의 전부는 산업계에서 등장
    • 2025년 산업계의 주목할 만한 모델 출시는 87건
    • 학계와 정부 기관을 모두 합친 다른 출처의 출시는 7건
  • 산업계 비중은 장기적으로 크게 확대
    • 산업계가 출시한 모델은 현재 주목할 만한 모델의 90퍼센트 이상
    • 2015년에는 50퍼센트 미만, 2003년에는 0

중국의 로보틱스 배치 우위

  • 미국 기업이 주목할 만한 AI 모델 수에서는 앞서지만, 로보틱스 배치에서는 중국이 뚜렷한 우위
    • International Federation of Robotics 데이터 기준, 중국의 2024년 산업용 로봇 설치 수는 295,000대
    • 일본은 약 44,500대, 미국은 34,200대 설치

전 세계 AI 컴퓨트 급증

  • Epoch AI의 총 AI 컴퓨트 용량 지표가 AI 인프라 확장의 대표 수치로 제시됨
  • Nvidia의 H100e 성능을 기준척도로 삼은 그래프에서, 전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가
    • 2021년을 첫 추적 연도로 둘 때 총 AI 컴퓨트는 30배 증가
  • 이 확장에서 Nvidia가 가장 큰 수혜 기록
    • Nvidia GPU가 현재 전 세계 총 AI 컴퓨트 용량의 60퍼센트 이상 차지
    • 자체 AI 하드웨어를 설계하는 Amazon과 Google이 그 뒤를 이음

AI 학습과 추론의 탄소 배출

  • AI 학습 과정의 탄소 배출량은 이전 해에도 지적된 항목이었고, 2026년에도 우려가 이어짐
  • 최신 프런티어 대규모 언어 모델 학습은 매우 큰 배출량으로 추정됨
    • xAI의 Grok 4 학습 배출량 추정치는 탄소환산 기준 72,000톤 초과
    • OpenAI GPT-45,184톤, Meta Llama 3.1 405B8,930톤 추정
  • Ray Perrault는 이 수치들이 추정치임을 밝히며 해석에 주의 요청
    • “These estimates should be interpreted with caution”
    • Grok의 경우 Forbes 기사, xAI 발언, 기타 검증 불가 출처에서 추론한 입력값에 크게 의존해 불확실성 존재
    • Epoch AI는 Grok 4의 배출량을 독립적으로 약 140,000톤 CO₂로 더 높게 추정
  • AI 추론 배출량도 증가 중이며, 모델 간 차이도 큼
    • 가장 비효율적인 추론 모델의 배출량은 가장 효율적인 모델보다 10배 이상
    • DeepSeek V3는 중간 길이 프롬프트 응답 시 약 23와트 소비 추정
    • Claude 4 Opus는 약 5와트 소비 추정

LLM 벤치마크 성능 가속

  • 지난 10년 동안 AI 모델 성능은 매우 빠르게 향상됐고, 그래프상으로 그 진전 속도는 더 빨라지는 모습
  • 특히 멀티모달 LLM은 새로 만들어지는 벤치마크를 거의 즉시 정복하는 수준으로 진전
  • Agentic AI 영역의 상승폭이 가장 가파름
    • 차트 오른쪽의 두 급경사 선은 자율 컴퓨터 사용을 평가하는 OSWorld benchmark
    • 자율 코딩을 평가하는 SWE-Bench Verified 소프트웨어 엔지니어링 벤치마크
  • Humanity’s Last Exam에서도 성능이 빠르게 향상
    • 2025년 Stanford AI Index에서 1위 모델인 OpenAI o1의 정답률은 8.8퍼센트
    • 이후 정확도는 38.3퍼센트까지 상승
    • 2026년 4월 기준 최고 점수 모델인 Anthropic Claude Opus 4.6과 Google Gemini 3.1 Pro 등은 50퍼센트 초과
  • Ray Perrault는 벤치마크와 현실 성능의 대응 관계에 주의 제기
    • “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
    • 법률 추론 벤치마크 정확도 75퍼센트만으로 실제 로펌 업무 적합성을 알기 어렵다는 언급

의료 분야 AI 연구 확대

  • 의료 연구에서 AI 채택이 빠르게 증가
  • AI 기반 신약 개발 관련 논문 수는 지난 2년 동안 2배 이상 증가
  • 의료 이미지와 텍스트를 함께 다루는 멀티모달 바이오메디컬 AI 논문 수는 2년 전 대비 2.7배

아날로그 시계 읽기 한계

  • 일부 영역의 급속한 향상과 달리, 아날로그 시계 읽기와 달력 이해 같은 일반 과제에서는 약점 지속
  • 멀티모달 LLM의 아날로그 시계 판독 능력을 측정하는 ClockBench에서 최고 성능 모델도 성공 확률이 절반 수준
    • OpenAI GPT-5.4의 정답 확률은 50 대 50
  • 대부분 모델은 이보다 훨씬 낮은 성적 기록
    • Anthropic Claude Opus 4.6의 정확도는 8.9퍼센트
    • 같은 모델이 Humanity’s Last Exam에서는 최고 수준 점수를 기록했다는 점도 함께 언급
  • Ray Perrault는 이를 보다 일반적인 문제와 연결
    • 언어와 이미지, 음성 톤 같은 다른 모달리티의 조합을 묻는 경우에도 언어 성분이 예상보다 큰 비중 차지
    • 비언어 정보를 완전히 무시하는 수준까지 이어질 수 있다는 연구 흐름 언급

2025년 AI 투자 최고치

  • AI 모델 성능 향상과 함께 AI 투자도 동반 상승
  • AI 분석 기업 Quid 데이터 기준, 2025년 AI 투자는 5,810억 달러 초과로 신기록
    • 2024년 2,530억 달러의 두 배 이상
    • 이전 최고치였던 2021년 3,600억 달러도 크게 상회
  • 2021년과 달리 2025년의 기록은 인수합병이 아니라 AI 기업에 대한 민간 투자가 주도
  • 투자금의 대부분은 미국으로 유입
    • 지난해 미국 내 AI 투자액은 3,440억 달러 초과

소프트웨어 엔지니어의 AI 집중

  • GitHub에서 AI 관련 프로젝트 수가 2025년까지 558만 개로 급증
    • 2020년 대비 약 5배
    • 2024년 대비 23.7퍼센트 증가
  • 이 증가는 단순한 AI 생성 프로젝트 범람만으로 보이지 않음
    • 별 10개 이상 프로젝트 수도 비슷한 속도로 증가
    • AI 프로젝트 전체가 받은 스타 수도 비슷한 속도로 증가
    • 사람의 참여가 존재함을 시사
  • 대표 인기 사례로 오픈소스 agentic AI 소프트웨어 OpenClaw 제시
    • GitHub에서 352,000 stars 획득
  • Ray Perrault는 AI 봇이나 에이전트 프로젝트가 열기에 일부 영향을 줄 수 있다는 점은 인정
    • “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
    • Stanford 보고서에는 언급되지 않은 활동 추적 웹사이트 Agents in the Wild 기준으로, GitHub 활동의 다수는 여전히 인간이 수행하는 것으로 보인다는 언급
  • 컴퓨터과학 논문에서도 AI 열기 강세
    • AI 관련 컴퓨터과학 논문 수는 지난 10년간 102,000건에서 258,000건으로 2배 이상 증가
    • 2024년 기준 이 가운데 68퍼센트 이상은 학계 출처
    • 정부와 산업계 비중은 각각 약 11.5퍼센트, 12.5퍼센트
    • 성장은 machine learning, computer vision, generative AI 분야가 주도

고용에 대한 AI 영향 불확실성

  • 생성형 AI 확산과 함께 고용 불안이 커졌지만, 현재 데이터는 혼재된 결과 제시
  • AI 대체 위험이 높은 직군으로 여겨지는 software developerscustomer support agents의 연령대별 정규화 인원 수 그래프 제시
    • 초급 일자리는 감소
    • 중견 및 시니어 직무는 유지되거나 증가
  • 이런 변화는 더 넓은 경제 흐름과 분리해 해석하기 어려움
    • 보고서는 많은 직종 전반에서 실업률 상승 언급
    • 예상과 달리 AI 노출이 가장 낮은 노동자의 실업률 상승폭이, AI 노출이 가장 높은 노동자보다 더 큼

AI에 대한 대중 인식 변화

  • Ipsos 설문에서 AI에 대한 낙관론이 최근 몇 년간 소폭이지만 눈에 띄게 증가
    • “benefits outweigh the drawbacks” 응답은 2024년 55퍼센트에서 59퍼센트로 상승
    • AI를 “good understanding” 한다는 응답은 67퍼센트에서 68퍼센트로 소폭 상승
  • 유사 질문들에서도 전체 수용도는 부정보다 긍정 쪽이 우세하지만, 일부 부정 감정도 증가
    • 응답자의 52퍼센트가 AI를 사용하는 제품과 서비스가 자신을 “nervous”하게 만든다고 응답
  • 국가별 편차가 큼
    • 중국, Malaysia, Thailand, Indonesia, Singapore를 포함한 동남아시아 국가들은 더 긍정적인 방향
    • 연간 기준 가장 큰 긍정 전환은 Germany 12퍼센트, France 10퍼센트, the Netherlands 10퍼센트
    • Colombia-6퍼센트로 가장 큰 부정 전환 기록

AI 규제 신뢰의 국가별 차이

  • AI가 긍정적 영향을 줄 것이라는 인식 증가와 함께, 정부 규제 신뢰에 대한 깊은 불신도 일부 국가에서 동반
  • 특히 미국은 AI 투자 선도국임에도 규제 신뢰도는 최하위권
    • Ipsos 설문에서 정부의 AI 규제를 신뢰한다는 미국 응답자는 31퍼센트
  • 많은 유럽 국가와 일본도 낮은 신뢰 수준
  • 아시아와 남아메리카 국가들은 정부의 AI 규제 능력에 대한 신뢰가 가장 큼
  • 미국과 Colombia의 대비가 두드러짐
    • 미국은 AI 규제에 대한 깊은 불신이 있지만, 다수 응답자가 AI 편익이 단점보다 클 것으로 봄
    • Colombia는 AI 규제에 대한 신뢰는 높지만, AI 전반에 대한 감정은 악화
  • 2025년 AI 서사의 축소판처럼, 모델 성능의 질사회적 영향에 대한 인식은 과제와 질문에 따라 큰 폭으로 달라짐
Hacker News 의견들
  • 젊은 층의 AI 인식이 생각보다 밝지만은 않다는 점을 짚고 싶음. Gallup 조사를 보면 회의감이 꽤 분명해 보임

    • 나는 이걸 AI의 본질적 한계를 천천히 알아가는 과정으로 봄
    • 나는 이 분위기가 일시적이라고 봄. 역사상 새로운 기술 전환마다 그랬듯, 결국 다들 적응하면서 활용 방식을 찾아낼 거라고 봄
  • 최신 프런티어 LLM 하나를 학습시키는 데 7만 2천 톤이 넘는 탄소 배출이 나온다 해도, 전 세계 연간 380억 톤 규모와 비교하면 상대적으로 작음이라는 생각임

    • 나는 LLM 하나의 학습 배출량이 사람 1만 7천 명의 연간 배출량에 해당한다는 점이 전혀 사소하지 않다고 봄. 기사 기준으로는 작년보다 8배 증가했고 2배가량 과소추정됐을 가능성도 있음. 게다가 하드웨어, 학습 데이터 수집 봇, 프롬프트 처리 같은 사용 전반은 빠져 있고, 이런 대형 모델은 여러 개이며 소형 모델은 수천 수만 개임. 올해 AI 전체 배출량이 8천만 톤 CO2e를 넘는다는 추정은 Austria나 Israel 같은 국가 전체보다 크니, 결코 가볍지 않음
    • 나는 이렇게도 볼 수 있다고 생각함. 모델 하나 학습에 7만 2천 톤이 들고 그 모델을 1억 명이 쓴다면 1인당 0.00072톤 수준임. 기사 기준 평균 인간의 연간 배출량은 5톤 이상이고 미국인은 18톤쯤이니, 여기에 0.00072를 더해도 체감은 거의 없다고 봄. 물론 추론 비용은 별도임
    • 나는 xAI가 굳이 탄소 집약도를 높인 것처럼 보인다는 점을 감안해도 이 수치는 사실상 미미하다고 봄. 게다가 2025년 주요 모델 둘을 골라 놓고 둘 다 Grok인 건, 그 해 기준 가장 덜 유용하고 덜 쓰이며 덜 흥미로운 축에 속하는 모델을 집어 든 셈이라 좀 우습게 느껴짐
  • 나는 결국 누구도 해자 moat를 가지지 못할 거라고 봐서, 오히려 투자자들의 착각만 더 커지는 그래프로 읽힘

    • 나는 해자가 분명 생긴다고 봄. 토큰 품질에 예산을 집중할 수도 있고, 적더라도 더 좋은 토큰을 쓸 수도 있음. 여기에 사용자 기반과 참여도가 붙으면 신규 진입자가 따라오기 어려운 플라이휠이 만들어짐. 시장은 복잡해서 단순화하면 놓치는 게 많음
    • 나는 자본과 모멘텀 자체도 해자라고 봄. 중국 모델들이 증류를 활용하는 건 맞지만, 아직은 처음부터 대규모 모델을 학습시키는 모습은 많이 못 봤음. 다만 칩이 더 싸지고 중국산 칩이 본격화되면 상황이 달라질 수도 있음
  • China의 로보틱스 선두도 눈에 띄지만, 내게 가장 먼저 튀어나온 건 Grok 배출량 차트였음

    • 나는 기사 속 "이 추정치는 주의해서 해석해야 하며 Grok의 경우 공개 보도를 바탕으로 추론한 입력값에 크게 의존한다"는 문구를 보면, 그 차트는 신뢰성 면에서 좀 미심쩍어 보임
  • GitHub 프로젝트 생성 수가 늘었다고 해서 "소프트웨어 엔지니어들이 AI에 올인했다"고 말하는 건 꽤 웃기게 느껴짐. 저장소 하나 만든다고 다 소프트웨어 엔지니어가 되는 건 아닌데, 그랬다면 다른 공부는 안 했어도 됐겠다는 생각마저 듦

    • 나는 그 지표가 좋지 않다는 데 동의하고, 대신 Claude Code GitHub Commits Over Time 같은 지표로 바꾸는 편이 낫다고 봄. 물론 이것도 완벽하진 않지만, 최소한 조금 덜 불완전한 지표이고 뭔가 의미 있는 흐름은 더 잘 보여준다고 느낌
  • "China가 로보틱스에서 앞선다"는 부분은 AI와 별 상관없어 보임. China 그래프는 2012년부터 거의 같은 궤적이라서, 그 차트는 기사 맥락에 잘 안 맞는다고 느낌

    • 나는 ChatGPT는 그때 없었더라도, 로보틱스를 움직이던 ML 기술 자체는 이미 그 시기에도 충분히 작동하고 있었다고 봄
  • "AI 모델 학습은 막대한 탄소를 배출할 수 있음"이라는 말은 맞지만, 내가 정말 보고 싶은 건 전 세계적으로 이 모델들을 서비스 운영하면서 얼마나 탄소가 나오는지에 대한 그래프임

  • "지난 10년간 AI 모델 성능이 놀라운 속도로 개선됐고, 그 진보가 가속 중"이라는 문장에는 동의하기 어려움. 내가 보기엔 거의 모든 분야가 이미 정체 구간 plateau에 들어가는 중임. 경쟁 수학처럼 최근에 시작한 분야는 아직 덜해 보여도, 과거 그래프 패턴상 결국 비슷하게 정체될 가능성이 커 보임

  • 나는 아직도 State of AI in 2026라는 표현이 잘 이해되지 않음

  • 이 글은 중복 게시물로 보임. 원문은 이 스레드, 출처는 Stanford HAI의 2026 AI Index Report