대학소식

구글의 AI 일기예보, 얼마나 정확할까?

자연대 홍보기자단 자:몽 6기 | 김세직



뉴스의 마지막을 장식하거나, 스마트폰 앱으로 외출 전 간단하게 확인할 수 있는 일기예보. '일기예보'라는 네 글자를 들으면 사람들은 무슨 생각을 할까? 일부는 오늘 날씨가 맑아서 산책을 나가고자 할 것이고, 또 몇몇은 며칠 뒤 여행에서의 날씨가 안 좋을까 걱정을 할 것이다. 그러나 상당수의 사람이 '오늘 또 일기예보가 틀리네'라며 한탄을 하는 것을 주변에서 심심찮게 찾을 수 있다. 그만큼 일기예보의 정확성은 우리의 산업 전반과, 일상생활에까지 큰 영향을 미치기 때문에 중요하다고 할 수 있다. 그러므로 대기과학 분야에서는 이러한 예보의 정확성을 높이기 위하여 수많은 노력과 돈을 들이고 있다. 그런데 기존의 예보 방식에서 탈피해, 가파른 성장세로 기존 방식보다 더 높은 정확성을 가진 방법이 탄생하였다면, 당신은 믿을 수 있을 것인가?


구글 딥마인드의 AI 기반 기상 예보 모델, 'GraphCast'

  세계 과학 저널의 양대산맥 중 한 축을 이루는 'Science'에 2023년 11월 14일, 한 논문이 게재되었다. 해당 글을 투고한 주체는 세계 인터넷 시장을 책임지는 대형 다국적 기업인 'Google'. 한 때 기계학습을 통해 인간과는 차원이 다른 속도로 실력을 길러 이세돌 9단을 상대로 받구 경기에서 승리한 인공지능 'AlphaGo'를 개발한 'Google Deepmind'사가 그 주인공이다. 구글 딥마인드가 투고한 글의 핵심은 다음과 같다: AI의 기계학습을 기반으로 한 GraphCast는 지구의 위도와 경도를 0.25˚ 간격으로 세분화하여 기상 예측을 진행한다. GraphCast는 기존의 방식에 비해 10일 예측에 있어서 뛰어난 정확도를 보인다. 기존의 방식을 사용하던 대기과학 집단들은 GraphCast를 참고하여 더 향상된 수준의 기상 예측을 이룩하기 위해 노력하고 있다. 구글 딥마인드는 위와 같은 글을 투고하며 프로그래밍 플랫폼인 'GitHub'에 GraphCast를 활용할 수 있는 소스 코드까지 업로드하며 자신감을 내비쳤다. 그러면 기상 예보 모델이란 무엇이며, GraphCast는 과연 기존 기상 예보 모델에 비해서 신뢰할 만하다고 할 수 있을까?


기상 예보 모델

  
짧은 시간에 일어나는 대기 중에서의 현상을 흔히 날씨라고 부르는데, '기상'이라는 동의어가 존재한다. 그리고 사회와 산업 전반은 날씨의 영향을 많이 받으므로 예측이 중요한데 이를 기상 예보를 통해 실현할 수 있다. 그러면 기상 예보는 구체적으로 어떻게 이루어지는 것일까?
  대기과학에서는 '모델링(modeling)'이라는 방법을 활용하여 기상 예보를 진행한다. 모델링이란, 지구를 작은 크기의 위도와 경도로 세분화하고 격자화하여, 특정 격자의 현재 기상 상태와 대기의 운동을 설명할 수 있는 역학 방정식을 이용하여 미래의 기상 현상을 예측하는 것이다. 즉, 우리가 기상 현상을 예측하기 위하여 사용하는 컴퓨터를 활용한 방법이 '기상 예보 모델링' 또는 '기상 예보 모델'인 것이다.
  이러한 기상 예보 모델은 20세기 중반부터 컴퓨터의 발명에 따라 급속도로 발전했다. 현재 가장 많이 이용되고 높은 정확도를 보이는 모델로 '수치 예보 모델(Numerical Weather Prediction, NWP)'이 있고, 그에 대항하여 등장한 구글 딥마인드의 GraphCast는 '기계학습 예보 모델(Machine-Learning Weather Prediction, MLWP)'에 속한다. 이 두 모델의 핵심적인 차이는 무엇이며, MLWP는 기존의 NWP에 비해 무엇이 낫다고 할 수 있을까?

구글 딥마인드의 GraphCast가 그린 기상 예보. 사진 = Google Deepmind


GraphCast의 일기예보를 신뢰할 수 있을까?

  
앞에서 설명하였듯, NWP는 전통적인 방식을 따라 과거의 기상 상태를 대기의 지배 역학 방정식에 대입하여 미래의 기상 상태를 예측한다. 더 자세히 기술하자면, 매우 짧은 시간 단계마다 방정식을 계산하는 것을 반복하여 1일, 3일, 그리고 7일 이상까지의 예측을 하는 것이다. 그러나 이러한 방법은 몇 가지 치명적인 문제점을 지니고 있다. 첫째로, 수초 단위의 계산을 무수히 많이 반복하여 수일 단위의 예측을 진행해야 하기 때문에 계산에 들어가는 시간과 비용이 천문학적이다. 둘째로, 격자의 크기를 특정 범위 이하로 줄임으로써 정확도를 높인다고 하면, 계산을 해야 하는 시간 간격이 더 작아지기 때문에 필요한 시간과 비용이 기하급수적으로 증가하게 된다. 셋째로, 대기의 지배 역학 방정식을 따르지 않는 미세물리적인 방식으로 인한 기상이 발생할 가능성이 존재해 해당 기상 현상들은 NWP 방식 하에서는 예측이 어렵다. 이러한 문제점들로 인해 많은 대수의 슈퍼컴퓨터를 동원하고 많은 비용을 들여 기상 예보를 진행해도 특정 동네에서의 강수와 같은 미세한 기상 현상을 놓칠 수밖에 없는 것이다.
  GraphCast와 같은 MLWP는 앞선 NWP의 단점들을 혁파하는 성능을 가진다. MLWP는 지배 방정식을 이용하여 순차적으로 다음 시점의 기상을 계산하는 것이 아니라, 과거의 수십년 간의 데이터를 이용하여 기계학습을 한 후 다음 시간의 기상이 어떻게 전개될 것인지 예측한다. GraphCast가 학습을 하는 데 사용한 자료는 유럽중기예보센터(ECMWF)의 재분석 자료인 ECMWF Reanalysis v5(ERA5) 자료이며, 40년 간의 ERA5  자료를 이용하였고 위성이나 지상 관측 자료 또한 사용하였다. GraphCast는 전지구를 0.25˚ 간격으로 나누어 100만 개 이상의 격자를 만들고, 연직으로는 고도 80km까지 37개의 층으로 나누어 세밀한 예측을 진행했다.
  언뜻 보면 단순한 것 같고 의심이 들 만한 방식이지만, 실제로는 높은 정확도를 나타냈다. 구글 딥마인드측은 "ECMWF에서 사용하는 NWP 모델인 HRES에 대비하여, 구글의 GraphCast는 1,380개의 테스트 항목 중 약 90% 이상에서 더 높은 정확도를 보였다"고 전했다. 또한 "GraphCast는 1분 이내로 앞으로의 10일 예측을 생성하는 데 성공했다"고도 덧붙였다. 더욱 놀라운 점은, 논문이 발표되기 전인 2023년 9월 이미 GraphCast는 허리케인 리의 이동 경로를 추적하여 캐나다 노바스코샤에 상륙할 것을 기존 모델에 비해 약 3일 먼저 정확하게 예측했다는 것이다.
  4차 산업혁명 시대에 접어들며 AI 기술이 빠르게 발전하면서, GraphCast를 비롯한 MLWP의 성장 속도가 매우 가팔라지며 대기과학에 혁신을 이끌어내고 있다. MLWP가 과거 데이터를 활용하여 미래에 대한 예측, 더 나아가 극한 기상 또는 미세물리적인 현상 예측을 해냄에 따라 기상 학계의 MLWP에 대한 관심이 집중되고 있다. 현재 GraphCast는 앞에서 언급한 것과 같이 GitHub에 공개된 오픈 소스를 다운로드하여 쉽게 이용할 수 있다. 인류의 삶에 밀접하게 연결된 기상 예보를 더 완벽하게 해낼 수 있게 도와줄 기술의 등장에 많은 이들의 귀추가 주목되고 있다.


참고 자료

[1] 이주영. '구글 딥마인드 "기상 이변 예측도 더 우수... 일기예보 전환점 될 것"'. 매일경제. 2023. 11. 15.
[2] 김달훈. '구글 딥마인드, 사이언스지에 날씨 예보 AI 모델 '그래프캐스트' 발표'. CIO. 2023. 11. 16.
[3] Martin Bayer. '구글, AI 기반 기상 예보 모델 '그래프캐스트' 공개'. IT WORLD. 2023. 11. 20.
[4] Remi Lam et al. 'Learning skillful medium-range global weather forecasting'. Science. 2023. 11. 14.


자연과학대학 홍보기자단 자:몽 김세직 기자 tooboon@snu.ac.kr
카드뉴스는 자:몽 인스타그램 @grapefruit_snucns에서 확인할 수 있습니다.

관련 기사