1P by neo 24일전 | favorite | 댓글 1개
  • 우리는 Jayesh, Cris, Nikhil이며, Silurian 팀의 일원임. Silurian은 지구를 시뮬레이션하는 기초 모델을 구축하며, 날씨 예측을 시작으로 하고 있음. 최근 허리케인 예측 결과는 여기에서 시각화할 수 있음

  • 날씨 예측을 하루 더 일찍 알 수 있다면 그 가치는 얼마나 될까? 전통적인 예측 시스템은 10년마다 하루씩 예측 정확도가 향상되고 있음. 하지만 최근 몇 년간 GPU와 현대 딥러닝 기술 덕분에 이 속도가 빨라지고 있음

  • 2022년 이후 NVIDIA, Google DeepMind, Huawei, Microsoft 등에서 날씨 딥러닝 시스템 연구가 활발히 진행되고 있음. 이 모델들은 물리학을 거의 내장하지 않고 데이터만으로 예측을 학습함. 놀랍게도, 이 접근 방식이 전통적인 대기 물리학 시뮬레이션보다 더 나은 예측을 제공함

  • Jayesh와 Cris는 각각 Microsoft의 ClimaX와 Aurora 프로젝트를 이끌면서 이 기술의 잠재력을 직접 경험함. 그들이 구축한 기초 모델은 날씨 예측의 금표준으로 여겨지는 ECMWF의 예측을 개선했으며, 사용된 훈련 데이터는 극히 일부였음. Silurian의 목표는 이 모델들을 최대한 확장하고 물리적 예측의 한계까지 밀어붙이는 것임. 궁극적으로는 에너지 그리드, 농업, 물류, 국방 등 날씨에 영향을 받는 모든 인프라를 모델링하는 것임. 즉, 지구를 시뮬레이션하는 것임

  • 이번 여름, 우리는 GFT (Generative Forecasting Transformer)라는 1.5B 파라미터 프론티어 모델을 구축했음. 이 모델은 약 11km 해상도로 최대 14일간의 글로벌 날씨를 시뮬레이션함. 역사적 기록에 극단적인 날씨 데이터가 부족함에도 불구하고, GFT는 2024년 허리케인 경로 예측에서 매우 뛰어난 성과를 보이고 있음. 여기에서 우리의 허리케인 예측을 확인할 수 있음. 우리는 cambecc/earth라는 오픈 소스 날씨 시각화 도구를 사용하여 이를 시각화함

  • HN에서의 출시에 매우 흥분되며, 여러분의 의견을 듣고 싶음

GN⁺의 정리

  • Silurian은 날씨 예측을 시작으로 지구를 시뮬레이션하는 기초 모델을 구축하는 회사임
  • 최근 몇 년간 딥러닝 기술의 발전으로 날씨 예측의 정확도가 크게 향상되고 있음
  • Silurian의 GFT 모델은 극단적인 날씨 데이터가 부족함에도 불구하고 뛰어난 예측 성과를 보이고 있음
  • 이 기술은 에너지, 농업, 물류 등 다양한 인프라에 적용될 수 있는 잠재력을 가짐
  • 유사한 기능을 가진 프로젝트로는 NVIDIA와 Google DeepMind의 날씨 딥러닝 시스템이 있음
Hacker News 의견
  • 열대성 저기압의 앙상블 예측을 할 수 있게 되어 기쁨

    • ML 모델과 ECMWF의 HRES 모델을 비교하는 것에 실망
    • HRES는 평균 날씨의 최적 추정이 아닌 가능한 날씨의 단일 실현임
    • NeuralGCM이 WeatherBench 리더보드에서 상위에 있음
    • 모델의 성능을 WeatherBench에서 비교하고 싶음
  • 물리학을 내장하지 않은 모델이 데이터만으로 더 나은 예측을 함

    • "언어학자를 해고할 때마다 성능이 올라간다"는 NLP 격언이 물리학자에게도 적용됨
  • Silurian이 지구를 시뮬레이션하는 기초 모델을 구축함

    • 성공하면 무엇을 더 시뮬레이션하고 싶은지 궁금함
  • ClimaX의 상업적 잠재력에 대해 흥분함

    • 특정 산업이 상업적 잠재력에 대해 연락했는지 궁금함 (예: 천연 자원 탐사)
  • 비영리 단체로서 토지에 대한 유사 모델을 구축함

    • 토지 마스크를 토지 임베딩으로 대체하는 데 도움을 주고 싶음
    • 이는 지역 효과를 다운스케일링하는 데 크게 도움이 될 것임
  • Google이 작년에 출시한 GraphCast와 비교해 어떻게 다른지 궁금함

  • 날씨 모델이 혼란스러움

    • ML 방법이 물리 기반 시뮬레이션보다 수치적으로 안정적인지 궁금함
    • 계산 요구 사항 측면에서 어떻게 비교되는지 궁금함
    • 과거에 FORTRAN에서 Verilog로 모델을 변환한 경험이 있음
  • 예측 불가능한 지진에 이 접근법을 적용해본 적이 있는지 궁금함

  • 이 접근법이 "The Bitter Lesson"의 또 다른 사례인 것 같음

  • 미래에 무엇을 더 시뮬레이션할지 궁금함

    • 샌프란시스코에서 자연어로 객체를 검색할 수 있는 데모를 구축함
    • Clay 임베딩을 사용해봤지만 CLIP으로 미세 조정된 OSM 캡션 임베딩보다 성능이 떨어짐