WeatherNext 2: Google DeepMind의 가장 발전된 기상 예측 모델

(blog.google)

5P by GN⁺ 2달전 | ★ favorite | 댓글 1개

WeatherNext 2는 AI 기반으로 글로벌 기상 예측의 정확도와 효율성을 크게 향상한 모델
단일 TPU에서 1분 이내에 수백 가지 기상 시나리오를 생성하며, 기존 모델보다 8배 빠른 예측 속도 제공
새로운 Functional Generative Network(FGN) 구조를 통해 물리적으로 일관된 예측을 유지하고, 시간당 해상도까지 지원
예측 데이터는 Earth Engine과 BigQuery에서 이용 가능하며, Vertex AI의 조기 접근 프로그램을 통해 맞춤형 추론 기능 제공
이 기술은 Search, Gemini, Pixel Weather, Google Maps Platform 등 구글 서비스 전반의 기상 기능을 업그레이드함

WeatherNext 2 개요

Google DeepMind와 Google Research가 공동 개발한 WeatherNext 2는 AI 기반 기상 예측 모델로, 기존 대비 8배 빠른 속도와 1시간 단위 해상도를 제공
- 단일 입력에서 수백 개의 가능한 기상 시나리오를 생성
- 예측은 단일 TPU에서 1분 미만에 완료되며, 기존 물리 기반 슈퍼컴퓨터 모델은 수시간 소요
이 모델은 온도, 풍속, 습도 등 99.9%의 변수와 예측 리드타임(0~15일) 에서 이전 모델보다 우수한 성능을 보임
WeatherNext 2는 지구 전역의 고해상도 예측을 가능하게 하며, 기상 기관의 의사결정 지원에도 활용됨

새로운 AI 모델링 접근법

WeatherNext 2는 Functional Generative Network(FGN) 라는 새로운 AI 모델링 방식을 채택
- 모델 구조에 직접 ‘노이즈’를 주입하여 예측 결과가 물리적으로 현실적이고 상호 연결된 상태를 유지
이 접근법은 ‘마지널(marginal)’과 ‘조인트(joint)’ 예측 모두에 유용
- 마지널은 개별 요소(예: 특정 위치의 온도, 고도별 풍속, 습도)
- 조인트는 여러 요소가 결합된 대규모 기상 시스템으로, 폭염 지역이나 풍력 발전량 예측 등 복합적 현상 분석에 필수
모델은 마지널 데이터만으로 학습하지만, 조인트 패턴을 스스로 학습해 복합 예측을 수행

데이터 접근 및 활용

WeatherNext 2의 예측 데이터는 Google Earth Engine과 BigQuery에서 공개
- Earth Engine 데이터 카탈로그와 BigQuery Analytics Hub를 통해 조회 가능
Google Cloud Vertex AI에서는 조기 접근 프로그램을 통해 맞춤형 모델 추론(inference) 기능을 제공
이 기술은 Search, Gemini, Pixel Weather, Google Maps Platform의 Weather API 등에 통합되어, 향후 Google Maps의 날씨 정보 기능에도 적용 예정

연구에서 실제로

WeatherNext 2는 연구 성과를 실제 응용으로 확장한 사례
- Google은 이 기술을 통해 전 세계 연구자, 개발자, 기업이 복잡한 문제 해결에 활용할 수 있도록 도구와 데이터를 개방
향후에는 새로운 데이터 소스 통합과 접근성 확대를 통해 모델 성능을 지속적으로 개선할 계획
Google은 지리공간 AI 연구 생태계 강화를 위해 Earth Engine, AlphaEarth Foundations, Earth AI 등과 연계

추가 자료

WeatherNext 2 관련 논문(arXiv: 2506.10772) 공개
개발자 문서, Earth Engine 데이터 카탈로그, BigQuery 쿼리 예시, Vertex AI 조기 접근 등록 페이지 제공
관련 모델로는 GenCast(극한 기상 예측)와 GraphCast(전 지구적 빠른 예보)가 함께 소개됨

▲

GN⁺ 2달전 [-]

Hacker News 의견

나는 이 주제에 꽤 깊이 들어가 있는데, 외부인이 흥미로워할 만한 점은 neuralgcm이나 WeatherNext 1 같은 최신 모델들이 모두 CRPS 라는 목적함수로 학습된다는 점임
이 방식은 일반적인 ML 분야에서는 거의 안 쓰이고, 날씨 예측에서만 보았음
요약하자면 입력에 무작위 노이즈를 추가하고, 일반적인 손실(L1 등)을 최소화하면서 동시에 서로 다른 노이즈 초기값으로 생성된 두 결과 간의 차이를 최대화하도록 학습함
이런 접근이 언젠가 전통적인 GenAI에도 적용될지 궁금함
- 노이즈는 입력이 아니라 모델 파라미터에 추가되는 것 아닌가 궁금함
  이건 Variational Noise 논문을 떠올리게 함
  만약 입력에 노이즈를 더하는 거라면, DINO 같은 SSL 기법과 비슷할 것 같음
- 최근 최적화 작업에서 서로 다른 두 출력을 의도적으로 만들고 싶었는데 좋은 휴리스틱을 찾지 못했음
  GenAI와는 무관한 작업이었지만, 이 CRPS 방식이 있었다면 도움이 되었을 것 같음
- 이 접근은 Variational Autoencoder를 떠올리게 함
- 왜 L2 손실 대신 이런 방식을 쓰는지 목적이 궁금함
- 모델이 과거 데이터를 학습하긴 하지만, 실제 예측 시에는 새로운 관측값으로 여러 번 앙상블 실행을 한다는 점을 명확히 해야 함
최근 Google 검색의 지역 날씨 예보가 눈에 띄게 부정확해졌음을 느꼈음
몇 주 전부터 밤 기온이 영하로 떨어질 거라고 계속 예보했지만 실제로는 그렇지 않았음
내 지역은 예측이 어려운 곳이긴 하지만, 다른 비Google 소스들이 훨씬 정확했음
혹시 새 모델의 롤아웃이 이미 이루어져서 더 나빠졌거나, 반대로 곧 개선될 예정인지 궁금함
지역 단위로 모델별 예측 성능을 비교할 수 있는 사이트가 있는지도 알고 싶음
- Open-Meteo의 무료 API가 유용함
  모델별 예보 데이터를 그래프로 시각화할 수 있고, 여러 주요 모델을 포함함
  다만 WeatherNext는 아직 없음
- 지역별 모델 성능 비교가 너무 당연한 기능처럼 보이는데, 실제로는 거의 존재하지 않음. 이유가 궁금함
발표에서 속도와 시나리오 수의 향상은 강조했지만, 정확도 개선에 대한 설명이 부족하다고 느꼈음
“WeatherNext 2는 8배 빠르고 1시간 단위 해상도를 제공한다”는 문구는 멋지지만, 결국 사용자인 나는 정확한 예보 하나만 원함
- 중요한 점은, 이 제품의 최종 사용자는 일반인이 아니라는 것임
  CRPS 점수 같은 지표는 전문가용이며, 이는 전통적인 앙상블 모델의 under-dispersion 문제를 해결하기 위한 것임
  이런 개선이 결국 일반 사용자가 보는 결정론적 예보의 정확도를 높이는 기반이 됨
  관련 기술은 WeatherBench에서 확인 가능함
- 일반 사용자 입장에서는 설명이 부족했음
  날씨 예보의 핵심은 수십 년 전부터 앙상블 시나리오 개념이었고, “비 올 확률 70%”는 100개 시나리오 중 70개에서 비가 온다는 뜻임
  즉, 단 하나의 ‘정확한 예보’는 존재하지 않음
- 사용자로서 나는 불확실성의 분산도 보고 싶음
  많은 날씨 앱들이 이를 시각적으로 잘 보여줌
- 가장 중요한 벤치마크는 정확도이며, 기존의 물리 기반 모델(GFS, ECMWF 등)과 비교해야 함
  이런 모델들은 거대한 HPC 클러스터에서 돌아가지만, 중앙에서 계산 후 결과만 배포하면 되므로 효율적임
- 과거 데이터로 학습된 모델이지만, 물리 기반 요소가 부족해 보임
  고성능을 위해 필요한 물리적 근거가 어디에 있는지 궁금함
Google의 날씨 예측 엔진은 이미 매우 뛰어나며, 이번 시즌의 허리케인 경로 예측은 놀라울 정도로 정확했음
반면 미국 정부의 Global Forecasting System(GFS) 은 점점 나빠지고 있음
관련 기사: Ars Technica 링크
- “GFS가 나빠지고 있다”는 게 구체적으로 어떤 의미인지 궁금함
논문을 읽어보니 모델을 얼마나 자주 재학습해야 하는지 명시되어 있지 않음
지역별 분포를 학습하는 구조라면, 시간이 지나면 패턴이 변하므로 주기적인 재학습이 필요할 것 같음
만약 매주 3일씩 학습해야 한다면, 그건 현실적으로 비용 문제가 될 수 있음
제2차 세계대전 시절의 일화가 떠오름
Kenneth Arrow가 장기 예보가 무작위 추측과 다를 바 없다는 걸 발견했지만, 상관은 “쓸모없다는 걸 알아도 계획에는 필요하다”고 답했다고 함
- 통계 수업에서 들었는데, 실제로 좋은 날씨가 나쁜 날씨보다 훨씬 많음
  그래서 “비 안 온다”고만 말해도 90%는 맞음
  그런데 과거 기상예보는 그보다 정확도가 낮았다는 게 아이러니함
  요즘 모델은 정말 놀라울 정도로 정확해서 10일 예보도 거의 맞음
- 고대의 점술도 단순한 미신이 아니라, 결정을 내리지 못할 때 무작위 선택을 통해 행동하게 만드는 의사결정 도구였다는 해석이 있음
- Eisenhower의 말처럼 “계획은 쓸모없지만, 계획하는 과정은 필수적임”이라는 교훈이 떠오름
최근 Google 기본 날씨 앱의 정확도가 떨어졌음
2~5도 정도 차이가 나는 경우가 많았음
HN에서 추천받은 Weawow 앱을 써봤는데, 이름은 별로지만 정확도는 훌륭함
지금까지 써본 중 가장 만족스러움
여전히 AI 기반 날씨 예보가 실생활에서는 멀게 느껴짐
부모님 세대가 TV 일기예보를 보던 시절과 비교해도 체감 정확도는 크게 다르지 않음
예보된 맑은 날에 폭우가 오거나, 비 예보가 있었는데 하루 종일 맑은 경우가 여전함
소비자 입장에서는 기술 발전이 실제 체감 신뢰도로 이어지지 않는 것 같음
- 데이터는 존재함: Our World in Data에 따르면 예보 정확도는 꾸준히 향상 중임
- 문제는 데이터의 표현 방식임
  예를 들어 Apple Weather에서 “비 오는 날”은 하루 중 한 시점이라도 비 확률이 높으면 그렇게 표시됨
  실제로는 오전 5시에만 비가 오고 나머지는 맑을 수도 있음
  사용자가 데이터를 해석할 수 있어야 하고, AI가 개인의 관심사에 맞게 예보를 맥락화해주면 좋겠음
- 예보는 꾸준히 개선 중이지만, 단계적 진화이지 갑작스러운 혁신은 아님
  예를 들어 Weathergraph에 rainbow.ai의 단기 강수 예측을 추가했는데, 지금까지 써본 중 가장 정확했음
  레이더 데이터 자체도 노이즈가 많고, 이를 정제하는 과정이 이미 ML 모델임
- 실제로는 정확도가 크게 향상됨
  30년 전의 1일 예보 수준이 지금의 4일 예보 정확도와 같음
  다만 우리가 날씨를 더 잘 이해하게 된 건 아니고, 계산 능력이 비약적으로 늘어난 결과임
- 일반적인 날씨 예보도 여전히 완벽하진 않음
이 모델을 어디서 쓸 수 있는지 궁금했음
예전 Dark Sky처럼 초지역 단위 예보를 찾고 있음
- 이제 연구 결과가 실제 서비스에 통합되었음
  WeatherNext 2의 예보 데이터는 Earth Engine과 BigQuery에서 사용 가능하며, Vertex AI에서 커스텀 추론용으로 조기 접근 프로그램도 운영 중임
  또한 Search, Gemini, Pixel Weather, Google Maps Platform Weather API에도 적용되어 있음
- 개인적으로는 Windy 앱을 가장 좋아함
  모델 간 예보 차이를 비교할 수 있고, 바람 벡터 애니메이션이 시각적으로 매우 흥미로움
- HRRR 모델도 매우 훌륭함
  1시간마다 갱신되고, 15분 단위 해상도로 18시간, 1시간 단위로 48시간 예보를 제공함
  HRRR 사이트
- 예전 Weather Underground는 개인 기상 관측소 데이터를 통합했었음
  IBM이 인수한 이후 많이 바뀌었지만, 그 프로젝트가 아직 살아 있을지도 모름
- Google의 공식 Weather API 링크도 참고할 만함
이번 시즌 가장 정확한 허리케인 예측을 제공한 모델이 이번에 발표된 것과 같은 모델인지 궁금함
관련 기사: Ars Technica 링크

답변달기