AI 기반 기상 및 기후 모델은 예측의 미래를 변화시킨다.
최근 네이처(Nature)에 발표된 논문에서 Google, MIT, 하버드 및 유럽 중거리 기상예보 센터의 연구팀은 다음과 같이 말한다. 그들의 모델은 엄청난 "계산 비용 절감"을 제공하며 "지구 시스템을 이해하고 예측하는 데 필수적인 대규모 물리적 시뮬레이션을 향상"할 수 있다.
NeuralGCM 모델은 머신러닝의 발전을 사용하여 날씨 및 기후 예측을 더 빠르고 저렴하게 만드는 꾸준한 연구 모델 중 최신 모델이다.
NeuralGCM이란 무엇일까?
NeuralGCM 모델은 기존 모델의 최고의 기능과 머신러닝 접근 방식을 결합하는 것을 목표로 한다.
NeuralGCM의 핵심은 "일반 순환 모델"이다. 여기에는 지구 대기의 물리적 상태에 대한 수학적 설명이 포함되어 있으며, 복잡한 방정식을 풀어 미래에 무슨 일이 일어날지 예측한다.
그러나 NeuralGCM은 또한 구름 형성과 같이 잘 이해되지 않은 물리적 프로세스에 대해 방대한 데이터에서 패턴과 규칙성을 검색하는 프로세스인 머신러닝을 사용한다. 하이브리드 접근 방식은 머신러닝 모듈의 출력이 물리 법칙과 일치하도록 보장한다.
결과 모델은 날씨를 며칠 및 몇 주 전에 미리 예측하고 기후 예측을 위해 몇 달 및 몇 년을 예측하는 데 사용할 수 있다.
연구원들은 WeatherBench 2라는 표준화된 예측 테스트 세트를 사용하여 NeuralGCM을 다른 모델과 비교했다. 3일 및 5일 예측의 경우 NeuralGCM은 Pangu 및 GraphCast와 같은 다른 머신러닝 날씨 모델과 비슷한 성능을 보였다. 10일과 15일에 걸친 장기 예측의 경우 NeuralGCM은 기존 최고의 기존 모델만큼 정확했다.
NeuralGCM은 또한 열대 저기압 및 대기 하천과 같이 흔하지 않은 기상 현상을 예측하는 데에도 꽤 성공적이었다.
왜 머신러닝인가?
머신러닝 모델은 제공된 데이터의 패턴을 학습한 다음 이 학습을 사용하여 예측하는 알고리즘을 기반으로 한다. 기후 및 기상 시스템은 매우 복잡하기 때문에 머신러닝 모델에는 훈련을 위해 방대한 양의 과거 관측치와 위성 데이터가 필요하다.
훈련 과정은 매우 비용이 많이 들고 많은 컴퓨터 성능이 필요하다. 그러나 모델을 훈련한 후에는 이를 사용하여 예측하는 것이 빠르고 저렴하다. 이것이 일기예보에 대한 매력의 큰 부분이다.
훈련 비용이 높고 사용 비용이 낮다는 점은 다른 종류의 머신러닝 모델과 유사하다. 예를 들어 GPT-4는 훈련하는 데 몇 달이 걸렸으며 미화 1억 달러가 넘는 비용이 들었지만 쿼리에 즉시 응답할 수 있다고 한다.
1980년에서 2020년 사이의 기후 변화를 포착할 때 NeuralGCM이 주요 모델(AMIP) 및 실제 데이터(ERA5)와 어떻게 비교되는지 비교한다. Google Research
머신러닝 모델의 약점은 익숙하지 않은 상황(이 경우 극단적이거나 전례 없는 기상 조건)에서 어려움을 겪는 경우가 많다는 것이다. 이를 위해서는 모델이 훈련된 데이터 이상으로 일반화하거나 추정할 수 있어야 한다.
NeuralGCM은 물리학 기반 코어가 실제로 어느 정도 기반을 제공하기 때문에 다른 머신러닝 모델보다 이 분야에서 더 나은 것으로 보인다. 지구의 기후가 변화함에 따라 전례 없는 기상 조건이 더욱 흔해질 것이며, 머신러닝 모델이 얼마나 잘 따라갈 수 있을지 알 수 없다.
실제로 아직까지 일상적인 예측을 위해 기계 학습 기반 날씨 모델을 사용하는 사람은 없다. 그러나 이는 매우 활발한 연구 분야이며 어떤 식으로든 미래 예측에는 머신러닝이 포함될 것이라고 확신할 수 있다.