# 2025 AI Index Report

> Clean Markdown view of GeekNews topic #20376. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=20376](https://news.hada.io/topic?id=20376)
- GeekNews Markdown: [https://news.hada.io/topic/20376.md](https://news.hada.io/topic/20376.md)
- Type: GN+
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2025-04-17T10:09:08+09:00
- Updated: 2025-04-17T10:09:08+09:00
- Original source: [hai.stanford.edu](https://hai.stanford.edu/ai-index/2025-ai-index-report)
- Points: 6
- Comments: 1

## Summary

**AI의 사회적 영향력**은 역사적으로 가장 뚜렷하며, **21세기 최고의 변혁 기술**로 평가받고 있습니다. AI의 발전은 고난도 벤치마크에서의 성능 향상과 일상 생활로의 빠른 확산을 통해 가속화되고 있습니다. **미국과 중국은 AI 모델 개발에서 선도적인 역할**을 하고 있으며, AI의 **책임 있는 사용과 규제**에 대한 논의도 활발히 진행 중입니다. 그러나 **복잡한 추론**은 여전히 AI의 큰 도전 과제로 남아 있습니다.

## Topic Body

- **AI의 사회적 영향력**은 지금이 가장 뚜렷하며, 그 파급력은 가히 역사적임  
- Stanford HAI는 AI가 **21세기 최고의 변혁 기술**이 될 것으로 보고 있음  
- 그러나 **AI 발전의 혜택이 모두에게 골고루 돌아가려면**, 방향성 있는 개발이 필요하다고 강조함  
- AI Index는 AI의 기술적 진보, 경제적 영향, 사회적 영향을 객관적으로 분석하여 정책 입안자와 기업 리더에게 중요한 통찰을 제공함  
  
### 1. 고난도 벤치마크에서의 AI 성능이 지속적으로 향상됨  
  
- 2023년, 연구자들은 **최신 AI 시스템의 한계를 시험하기 위해** 새로운 벤치마크 도입:  
  - **MMMU**, **GPQA**, **SWE-bench**  
- 불과 1년 만에 **성능이 대폭 향상**됨:  
  - MMMU: **+18.8%p**  
  - GPQA: **+48.9%p**  
  - SWE-bench: **+67.3%p**  
- 벤치마크 외에도, **AI는 고품질 비디오 생성 기술에서 눈에 띄는 진전**을 보임  
- 일부 환경에서는 **언어 모델 기반 에이전트가 제한된 시간 내 인간보다 뛰어난 프로그래밍 성과**를 내기도 함  
  
### 2. AI는 일상 생활 속으로 빠르게 확산 중  
  
- **의료부터 교통까지**, AI는 실험실을 넘어 **일상 생활에 본격적으로 통합**되고 있음  
- 2023년, **미 FDA는 AI 기반 의료기기 223개를 승인** (2015년에는 단 6개에 불과)  
- **자율주행차는 더 이상 실험이 아닌 상용화 단계**에 돌입  
  - **Waymo**: 매주 **15만 건 이상의 자율주행 이동 서비스** 제공  
  - **Baidu**: **Apollo Go 로보택시**를 통해 중국 여러 도시에서 상용 서비스 운영  
  
### 3. 기업은 AI 도입에 전폭적인 투자와 활용을 진행 중  
  
- 2024년, **미국의 민간 AI 투자액은 1,091억 달러**로 전 세계 최고 수준  
  - **중국(93억 달러)의 약 12배**, **영국(45억 달러)의 약 24배**  
- 특히 **생성형 AI 분야에만 339억 달러**가 투자됨 → **2023년 대비 18.7% 증가**  
- **AI 사용 기업 비율도 빠르게 증가**:  
  - 2023년 55% → 2024년에는 **78%가 AI를 도입했다고 보고**  
- **연구 결과에 따르면**, AI는 전반적으로 **생산성 향상**과 함께  
  - **직무 간 숙련도 격차 해소에도 긍정적 기여**  
  
### 4. 미국은 여전히 주요 AI 모델 생산 선도국이나, 중국이 빠르게 성능 격차를 좁히고 있음  
  
- 2024년 기준, 미국은 **40개의 주요 AI 모델**을 발표하여 **중국(15개), 유럽(3개)**을 크게 앞섬  
- 수량에서는 미국이 앞서지만, **중국 모델의 품질 격차는 빠르게 축소**  
  - 대표 벤치마크(MMLU, HumanEval)에서 **2023년 두 자릿수 차이 → 2024년 거의 동등 수준**으로 변화  
- 중국은 여전히 **AI 논문 및 특허 수에서 세계 1위**  
- AI 모델 개발은 점점 **중동, 라틴 아메리카, 동남아 등으로 다변화**되고 있음  
  
### 5. 책임 있는 AI(RAI) 생태계는 진화 중이나 불균형함  
  
- **AI 관련 사고와 문제는 급증**하고 있으나, **대형 산업 모델 개발자들은 여전히 RAI 표준 평가 도입이 드묾**  
- 새로운 안전성 평가 벤치마크 등장:  
  - **HELM Safety**, **AIR-Bench**, **FACTS** → **정확성과 안전성 평가에 유망한 도구**  
- 기업들은 **RAI 리스크 인식은 높지만, 실질적 조치에는 미흡**  
- 반면, **정부는 AI 거버넌스에 대한 대응 속도 가속화**  
  - OECD, EU, UN, 아프리카 연합 등에서 **투명성과 신뢰성을 중시하는 정책 프레임워크 발표**  
  
### 6. 글로벌 AI에 대한 낙관론은 상승세지만 지역 간 격차는 큼  
  
- AI가 유익하다고 보는 비율:  
  - **중국(83%)**, **인도네시아(80%)**, **태국(77%)** 등에서는 긍정 평가 다수  
  - **캐나다(40%)**, **미국(39%)**, **네덜란드(36%)** 등은 낮은 수치 기록  
- 그러나 낙관론은 증가세:  
  - **2022년 대비 낙관적 인식 상승**: 독일(+10%), 프랑스(+10%), 캐나다(+8%), 영국(+8%), 미국(+4%)  
  
### 7. AI는 더 효율적이고 저렴하며 접근 가능한 방향으로 발전 중  
  
- **소형 모델의 성능 향상**에 힘입어, **GPT-3.5 수준 모델의 추론 비용이 2022년 11월 → 2024년 10월 사이에 280배 감소**  
- 하드웨어 측면에서:  
  - **연간 비용 30% 감소**  
  - **에너지 효율 40% 향상**  
- **오픈 웨이트 모델**도 급격히 성능 향상 중  
  - 일부 벤치마크에서 폐쇄형 모델과의 성능 차이를 **8% → 1.7%로 축소**  
- 이 모든 요소가 **고급 AI 기술의 진입 장벽을 빠르게 낮추고 있음**  
  
### 8. 각국 정부는 AI 규제와 투자에 본격적으로 나서고 있음  
  
- 2024년 **미국 연방 기관은 AI 관련 규제를 59건 발표**  
  - 2023년보다 2배 이상 증가, 관련 기관 수도 2배로 확대  
- **75개국에서 AI 관련 입법 언급이 21.3% 증가**  
  - 2016년 대비 9배 증가  
- 주요 정부 투자 사례:  
  - **캐나다: $24억**, **중국: $475억 반도체 펀드**  
  - **프랑스: €1,090억**, **인도: $12.5억**  
  - **사우디아라비아: Project Transcendence로 $1,000억 투자**  
  
### 9. AI 및 컴퓨터 과학 교육 확산 중, 그러나 접근성과 준비 부족 문제 존재  
  
- **세계 국가의 2/3가 K–12 컴퓨터 과학 교육을 시행 또는 계획 중**  
  - 2019년보다 2배 증가  
  - **아프리카와 라틴 아메리카에서 가장 빠른 진전**  
- 미국 내 컴퓨터 관련 학사 학위 취득자 수는 **10년간 22% 증가**  
- 하지만 **기초 인프라 부족(전기 등)**으로 인해 아프리카 일부 지역은 여전히 접근이 어려움  
- 미국의 K–12 컴퓨터 과학 교사 중 **81%는 AI가 필수 교육 요소라고 생각**하지만,  
  - **절반 이하만이 실제로 AI를 가르칠 준비가 되어 있다고 응답**  
  
### 10. 산업계는 AI 개발을 선도 중이지만 경쟁은 치열해지고 있음  
  
- 2024년 **주요 AI 모델의 약 90%가 산업계에서 개발**됨 (2023년에는 60%)  
- 반면, **가장 많이 인용된 AI 연구는 여전히 학계에서 나옴**  
- 모델 규모는 계속 확장 중:  
  - **학습 연산량은 5개월마다 2배**  
  - **데이터셋은 8개월마다 2배**  
  - **전력 사용량은 매년 2배 증가**  
- 하지만 **성능 격차는 줄어드는 추세**:  
  - 상위 1위와 10위 모델 간 점수 차이: **11.9% → 5.4%**  
  - 1위와 2위 모델 간 차이: **단 0.7%**  
- 이는 **경쟁이 치열하고 복잡성이 증가한 AI 개발 환경**을 의미함  
  
### 11. AI는 과학 분야에서 최고 권위를 인정받고 있음  
  
- AI는 최근 **노벨상 수상 연구의 핵심 기술로 인정**받음  
  - **딥러닝 기술(물리학 부문)**, **단백질 구조 예측 응용(화학 부문)**으로 각각 수상  
- 또한, **강화학습 분야의 획기적인 공로로 튜링상**도 수여됨  
- 이는 **AI의 과학적 영향력이 주요 학문 분야에서 정식으로 인정받기 시작했음을 시사**  
  
### 12. 복잡한 추론은 여전히 AI의 큰 도전 과제로 남아 있음  
  
- AI는 **국제 수학 올림피아드 수준 문제 해결에는 뛰어난 성과**를 보임  
- 그러나 **PlanBench와 같은 복잡한 추론 벤치마크**에서는 여전히 어려움을 겪음  
- **명확한 정답이 존재함에도 불구하고**, 일관되게 논리 문제를 해결하지 못하는 경우가 많음  
- 이로 인해, **정확성이 중요한 고위험 분야에서 AI의 실효성에는 한계가 있음**

## Comments



### Comment 37264

- Author: neo
- Created: 2025-04-17T10:09:09+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=43644662) 
* 이 보고서의 데이터를 Google Drive의 CSV 파일로 제공하여, 이를 SQLite 데이터베이스로 변환해 Datasette Lite로 탐색할 수 있게 했음
  - 가장 흥미로운 테이블은 다양한 모델에서의 편향 예시를 보여줌
* 11번 항목(AlphaFold3 vs Vina, Gnina 등)에 대한 반박을 Substack에 게시했음
  - Gnina는 Vina의 결과를 신경망으로 재평가한 것이라 동일한 우려가 적용됨
  - AI에 대해 낙관적이지만, 이번 비교는 잘못되었음
  - 새로운 약물 후보에 일반화할 수 있는 방법이 필요하지만, 반복적인 데이터셋으로 평가되었음
* AI가 인간보다 뛰어나다는 보고서를 자주 보지만, 일상적인 문제 해결에 도움을 받지 못했음
  - Claude에게 수백 줄의 코드와 문제 위치를 제공했지만, 문제를 해결하지 못했음
  - LLM이 특정 출력에 집착하는 경향이 있음
  - Google 검색과 비슷하게, 구체적인 검색을 시도해도 같은 결과를 반환함
* 환경 영향에 대한 장이 없다는 점이 놀라움
  - 유럽, 특히 프랑스에서는 AI 사용을 비판하는 주요 논점임
  - 예술 도용, 일자리 파괴, 허위 정보 생성 용이성, 저소득 국가 AI 트레이너의 근무 조건 등이 포함됨
  - 개인적으로 AI에 반대하지 않으며, 피드에서 자주 보는 논점을 나열한 것임
* 각 장이 개별 PDF로 제공되며, 전체 보고서는 456페이지임
* "AI의 까다로운 벤치마크 성능이 계속 개선되고 있음"
  - 더 많은 AI 모델이 이러한 권위 있는 벤치마크에 맞춰 조정되고 있다고 느낌
* 웹사이트가 이미지를 새 탭에서 열기 어렵게 만드는 이유에 대한 질문이 있음
  - URL을 복사하면 노이즈 이미지로 연결되지만, AWS S3에서 원본 이미지를 다운로드할 수 있음
  - 비기술적 사용자를 겁주기 위한 것인지 의문임
* Stanford의 과거 AI 보고서는 상당하고 비판적이었음
  - 현재 보고서는 여러 작은 보도 자료를 하나로 묶은 것처럼 보임
  - AI가 대학에서 기업으로, 연구 논문에서 보도 자료로 이동했음
  - OpenAI의 GPT 관련 보도 자료는 유용한 정보 없이 통계만 나열했음
* 생활 수준이 향상될 것이라고 확신함
  - 동일한 시간에 더 효과적인 작업을 수행할 수 있어 생산성이 증가하고 비용이 저렴해질 것임
  - 주식 시장에서 이 효과가 어떻게 나타날지는 확신하지 못함
* 미국이 여전히 최고 AI 모델을 생산하지만, 중국이 성능 격차를 좁히고 있음
  - 대부분의 연구자는 국가가 아닌 똑똑한 사람들과 멋진 것을 만드는 데 집중함
  - 세계 유일의 제조 강국과의 전쟁을 원하지 않음
  - 중국과의 AI 경쟁에서 미국이 R&D에 진지하게 임한다면 좋겠지만, 원하지 않음
