Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 정회원 · 경기대학교 토목공학과 석사과정 (Kyonggi University · duswl001130@kyonggi.ac.kr)
  2. 경기대학교 토목공학과 학부과정 (Kyonggi University · khj80518@kyonggi.ac.kr)
  3. 종신회원 · 교신저자 · 경기대학교 사회에너지시스템공학과 교수 (Corresponding Author · Kyonggi University · mum@kgu.ac.kr)



강수량 예측, 통계적 모형, 딥러닝 모형, 적합 모형
Precipitation forecasting, Statistical model, Deep learning model, Optimal model

1. 서 론

최근 IPCC(Intergovernmental Panel on Climate Change)의 6차「지구온난화 1.5℃」특별보고서(IPCC, 2021)에 따르면 극한 고온, 호우 등 자연재해의 발생이 증가하며 이러한 변화로 인해 온난화 속도와 규모에 따라 더욱 심화될 것으로 전망하고 있다. 전 세계적으로 기후변화에 대한 관심이 증가하고 있으며, 기상 시뮬레이션의 결과로 극한 수문 사상의 규모와 빈도가 변화하고 있음을 확인할 수 있다. 또한, 수문학 분야에서는 기후 변화에 대해 과거부터 지속적인 관심을 보였고, 많은 연구에서 지구온난화에 의한 극한 강수의 규모 및 발생빈도가 증가할 것으로 전망하였다. 기후 변화로 인해 수문순환 과정이 기존과 다르게 변화해 과거 관측과는 다른 극한 강우나 가뭄의 결과를 야기할 수 있다. 이러한 변화에 따라, 전 세계적으로 극한 홍수나 가뭄에 대한 대응책을 제시하기 위하여 강수량 예측이 진행되고 있다(Kite, 1993; Boorman et al., 1997; Panagoulia et al., 1997; Gellens et al., 1998; Saelthun et al., 1998; Mirza et al., 1998; Prudhomme et al., 2003; Meehl et al., 2004; Kim et al., 2008). 선행 연구를 살펴보면 북반구에서 고위도 지역으로 갈수록 강우량이 증가하는 경향성을 보인다는 것이다. 해당 내용을 대한민국에 적용하면 향후 강우량의 증가뿐 아니라 극한 강우 일수의 증가가 예상되는 지역이라고 볼 수 있다(Park et al., 2013).

도시화와 산업화에 따라 수문 유출이 변화했을 뿐 아니라 지구온난화로 인해 극한 강수 또한 증가하고 있으며, 훙수 피해가 발생하게 되어 국민들의 생활과 사회 기반 시설에 지장을 줄 수 있다. 따라서, 강수를 예측하는 것이 과거보다 중요시 되고 있으며 최근에는 관측 자료를 이용해 강수의 경향성을 찾아내기 위해 기계학습의 방법이 사용되고 있다. 기계학습 방법 중 많이 활용되는 것이 인공신경망을 이용한 강수 예측 연구이며 과거 통계적 모형에서 벗어나 강수확률과 강수량에 대한 예측도를 높이고자 다양한 인공신경망 모델을 제시하였다(Kuligowski et al., 1998; Luk et al., 2001).

최근에는 물리적 접근법보다 데이터 기반 접근법이 더 많은 인기를 얻고 있다. 지난 몇 년 동안 다양한 데이터 기반 모델의 성공적인 적용은 수문학 분야에서 시계열 분석을 위한 심층 신경망의 적용 가능성을 새롭게 열었다. 경험적 접근법 중에서도 Box-Jenkins 방법(Box et al., 2015), 인공신경망(Artifical Neural Network, ANN) 또는 다층 퍼셉트론(Multi Layer Perceptron, MLP), 서포트 벡터 회귀(Support Vector Regression, SVR) (Cortes and Vapnik, 1995) 및 유전자 표현 프로그래밍(Gene Expression Programming, GEP)이 반복적으로 사용되고 있다. 위 방법들이 사용된 유사한 연구들(Moustris et al., 2011; Kashid and Maity, 2012; Mekanik et al., 2013; Venkata Ramana et al., 2013; Abbot and Marohasy, 2014)에서 기계학습 알고리즘을 활용한 강수량 예측의 가능성을 살펴볼 수 있었다. 최근에는 ANN, SVR, GP(Genetic Programming)와 함께 웨이블릿과 군집 최적화를 결합한 월별 강수량 추정 개발에 더 많은 관심이 집중되고 있다 (Shenify et al., 2016). 호주의 특정 지역에 대해서 강수량 예측을 진행한 사례를 살펴볼 수 있었지만(Abbot and Marohasy, 2014), 국내에서는 레이더의 이미지를 활용해 강수량 예측을 진행하는 등 ASOS(Automated Synoptic Observing System) 관측 정보를 활용한 예측사례를 살펴보기 어려웠다.

본 연구에서는 통계적 모형인 ARIMA(Auto-Regressive Integrated Moving Average)와 SARIMA(Seasonal Auto- Regressive Integrated Moving Average)를 활용하고 인공신경망 모형으로는 LSTM(Long Short-Term Memory)과 GBM(Gradient Boosting Machine)을 활용해 강수 예측을 진행하였다. 8개의 지점에서 관측된 ASOS 관측 정보를 이용하여 강수량을 예측하였다. ARIMA, SARIMA, LSTM, GBM 모형을 통해 강수량 예측을 위해 모형별 적합 후 지점별 적합한 예측 모형을 분석하였다.

2. 연구방법

2.1 통계적 모형

2.1.1 ARIMA 모형

ARIMA(Auto-Regressive Integrated Moving Average) 모형은 현재 시계열 값을 예측하기 위해 과거의 관측값, 오차 그리고 차분 절차를 활용한다. 이 모형은 자기회귀(AR) 모델과 이동평균(MA) 모델의 특성들을 결합하여 구성되어 있다. 시계열 $Z_{t}$가 자기회귀 모형의 차수 p, 이동평균 모형의 차수 q, 그리고 차분 차수 d를 갖는 $ARIMA(p,\: d,\: q)$ 과정을 따르며 평균 $\mu$를 가진다면, 해당 시계열은 Eq. (1)의 형태로 표현된다(Box et al., 1970).

(1)

$\phi(B)W_{t}=\theta(B)_{\epsilon_{t}}$

where, $W_{t}=(1-B)^{d}(Z_{t}-\mu)$,

$\phi(B)=1-\phi_{1}(B)-\cdots -\phi_{p}(B^{p})$,

$\theta(B)=1-\theta_{1}(B)-\cdots -\theta_{q}(B^{q})$,

$\epsilon_{t}\sim iid N(0,\: \sigma^{2})$

여기서, p는 자기회귀 모형의 차수로, t 시점의 값이 (t - 1), …, (t - p) 시점의 값에 영향을 주는 것을 의미한다. d는 차분을 뜻하고, t 시점의 값에 (t - d) 시점의 값을 빼서 정상 시계열 형태로 만들어준다. q는 이동평균 모형의 차수로, t 시점의 값에 연속적인 (t - 1), …, (t - p) 시점의 오차들이 영향을 주는 것을 의미한다. 그리고, $\phi(B),\: \theta(B)$는 각각 자기회귀, 이동평균 모형에 대한 다항식을 나타낸다. B는 후진연산자를 의미하며, d는 시계열 $Z_{t}$의 차분 차수를 나타낸다. ARIMA 모형은 비정상적(Nonstationary) 시계열 자료를 분석하는 데 사용되는 방법이다.

실제 ARIMA 시계열 분석은 적용공분산 정상성(Covariance Stationary) 적합 과정을 거친 후 예측을 진행하게 된다. 단변량 ARIMA 분석기법은 두 가지의 특징을 가진다. 첫째, 하나의 시계열 자료만으로 변동상태를 확인할 수 있다. 둘째, 시계열 자료 중 시간별 자료의 변동이 클 때 변동을 반영하여 예측을 진행할 수 있다는 장점을 가지고 있다.

ARIMA 모델을 시계열 자료에 적합하는 과정은 시계열 자료의 정상성(Stationarity) 여부를 검정한다. 정상성은 시계열 데이터에서 평균, 표준편차와 같은 확률적 특성들이 시간 경과에 따라 변하지 않는 상태를 의미한다. 비정상적일 때는 차분을 이용해 정상 시계열 자료로 만들어주는 과정이 선행되어야 한다. 이 과정에서 자기상관함수(Autocorrelation Function)와 부분자기상관함수(Partial Autocorrelation Function) 등의 그림을 활용할 수 있다. 위 과정 이후 잠정 모델의 AIC(Corrected Akaike’s information criterion)값을 산출하여 AIC가 최소가 되는 모형의 하이퍼 파라미터 p, d, q를 결정한다. 모델의 적합성을 평가하기 위한 통계적 진단 방법으로는 잔차의 자기상관함수(ACF)와 부분자기상관함수(PACF)를 계산하여 잔차가 독립적인지를 확인하는 잔차 분석 방법을 주로 사용한다. 최종적으로, 적합한 ARIMA 모델을 활용하여 미래의 시계열 데이터 값을 예측한다(Bari et al., 2015).

2.1.2 SARIMA 모형

계절 ARIMA 모형은 순수 계절적 특성을 가진 계절시계열이나 계절적 특성 없이 비정상성만을 지닌 시계열과는 다른 특성을 가진 시계열 자료이다. 그러므로, 계절성과 비정상성을 함께 고려하는 것이 필수적이다. 계절적 영향을 제거한 후, 분산을 안정화하기 위해 데이터 변환과 추세를 제거하기 위한 차분을 적용함으로써, 정상 시계열 데이터를 확보할 수 있다. 해당 모형을 예측 적합의 과정을 통하여 예측 결과를 도출할 수 있다. SARIMA(Seasonal ARIMA) 모형은 ARIMA 모형에 계절적 특성과 주기성을 추가한 모형이며, 시계열 자료의 구성성분들이 확률성을 가지거나 다른 구성요소에 종속적인 경우에 사용할 수 있다. 시계열 $Z_{t}$가 계절적인 주기 S를 가진다면 Eq. (2)으로 표현할 수 있다(Balibey et al., 2015; Bari et al., 2015; Naz, 2015; YoosefDoost et al., 2017).

(2)

$\phi_{p}(B)\Phi_{P}(B^{S})(1-B)^{d}(1-B^{S})^{D}(Z_{t}-\mu)=\theta_{q}(B)\Theta_{Q}(B^{S})\epsilon_{t}$

where, $\phi_{p}(B)=1-\phi_{1}(B)-\cdots -\phi_{p}(B^{p})$,

$\theta(B)=1-\theta_{1}(B)-\cdots -\theta_{q}(B^{q})$,

$\Phi_{P}(B^{S})=1-\Phi_{1}(B)-\cdots -\Phi_{P}(B^{P})$,

$\Theta_{Q}(B^{S})=1-\Theta_{1}(B)-\cdots -\Theta_{Q}(B^{Q})$,

$\epsilon_{t}\sim iid N(0,\: \sigma^{2})$

여기서, B는 후진연산자이고, $\phi_{p}(B)$와 $\theta_{q}(B)$는 p, q 차수의 비 계절적 자기회귀, 이동평균 모형에 대한 다항식이며, $\Phi_{P}(B^{S})$와 $\Theta_{Q}(B^{S})$는 각각 P, Q 차수를 갖는 계절적 자기회귀, 이동평균 연산자, d는 비 계절적 차분 차수를 D는 계절적 차분 차수를 의미한다.

비정상적 시계열 자료에 계절효과가 추가되면 계절적 특성이 존재하는 비정상적 시계열이기 때문에 Eq. (3)과 같은 계절 ARIMA 모형을 이용한다. 계절 ARIMA 모형은 비 계절적 요소인 p, d, q와 계절적 요소인 P, D, Q로 구성되어 있다. 여기서 p는 시계열의 현재 값이 이전의 ‘p’개의 값의 어떻게 의존하는지를 의미한다. d는 비정상적인 시계열을 정상적인 시계열로 변환하기 필요한 차분의 횟수이다. q는 시계열의 현재 오차가 이전의 ‘q’개의 오차에 어떻게 의존하는지를 나타낸다. 계절적 요소인 P는 계절적 주기 내에서 시계열의 현재 값이 이전의 ‘P’개의 계절적 값에 어떻게 의존하는지를 나타낸다. D는 계절적 비정상성을 제거하기 위해 필요한 차분의 횟수이다. Q는 계절적 주기 내에서 시계열의 현재 오차가 이전의 ‘Q’개의 계절적 오차에 어떻게 의존하는지를 나타낸다.

(3)
ARIMA$(p,\: d,\: q)$$(P,\: D,\: Q)$

계절 ARIMA 모형은 순수 계절적 특성을 가진 계절시계열이나 계절적 특성 없이 비정상성만을 지닌 시계열과는 다른 특성을 가진 시계열 자료이다. 그러므로, 계절성과 비정상성을 함께 고려하는 것이 필수적이다. 계절적 영향을 제거한 후, 분산을 안정화하기 위해 데이터 변환과 추세를 제거하기 위한 차분을 적용함으로써, 정상 시계열 데이터를 확보할 수 있다. 해당 모형을 예측 적합의 과정을 통하여 예측 결과를 도출할 수 있다.

SARIMA 모형 적합 과정은 정상성검정, 추정, 적합모형 선정으로 이루어진다. 첫째, 정상성 검정에서는 시계열 데이터의 평균, 분산, 자기상관함수가 시간에 따라 일정한지를 확인한다. 이 과정에서 시계열이 비정상적으로 나타날 경우, 변수 변환(Variable Transformation)과 차분(Difference)을 이용해 시계열 패턴을 정상적으로 만든다. 정상성 검정을 위해서는 그래프 분석 방법이 사용된다. 이러한 분석을 통해 차분의 차수인 ‘d’와 계절적 차분의 차수 ‘D’가 결정된다. 다음 단계에서는 ACF와 PACF 그래프, AIC 통계량 등을 활용하여 비계절적 차수 p, q와 계절적 차수 P, Q를 선택하여 초기 모델을 설정한다. 최종적으로 적합 모형 선정 과정에서는 통계적 검증을 통해 만들어진 모형이 적합한지를 판단하는 것으로 잔차 분석과 과대 적합 진단을 이용한다. 만약 모델이 통계적으로 유의미하지 않은 경우, 다시 이전 단계를 수행하며 다른 모델을 선택한다. 이후, 선택된 모델에 대한 계수 추정과 적합성 검정을 반복적으로 수행한다. 위 과정을 거쳐 최종적으로 확정된 모델을 사용하여 시계열 데이터의 예측값을 도출한다. 위 과정은 모델이 데이터에 적합하고 통계적으로 유의미한 결과를 제공할 때까지 반복 진행한다.

2.2 딥러닝 모형

2.2.1 LSTM(Long Short-Term Memory)

일반적인 RNN(Recurrent Neuron Network) 구조는 Fig. 1과 같으며, 좌측의 RNN 구조를 시간 순서대로 나열하면 과거의 정보가 임의 시점인 t에 영향을 주는 루프형태를 띄고 있으며, 데이터의 가변길이인 시퀀스(Sequence)를 시간의 흐름과 연결 지을 수 있기에 시계열 데이터의 예측에 유용하다. 다만 긴 시퀀스의 자료를 사용한 경우 깊게 쌓여진 심층 RNN이 만들어지고, 심층 RNN의 경우 학습이 진행되다가 오차 경사의 기울기가 사라지고 입력층과 인접한 층에서 데이터의 정보를 기억하지 못해 예측에 이용할 수 없다.

Fig. 1. Concept of Recurrent Neural Network Structure(Lukic, 2020)
../../Resources/KSCE/Ksce.2024.44.4.0443/fig1.png
Fig. 2. Structure of LSTM(Yang et al., 2020)
../../Resources/KSCE/Ksce.2024.44.4.0443/fig2.png

RNN의 한 종류인 LSTM(Long Short-Term Memory)은 기존의 장기 의존성 문제(Long-Term Depedencies)를 해결하기 위해서 나온 모형이다. 따라서 임의 시점의 데이터뿐만 아니라, 과거 데이터와 임의 시점간의 유사성을 고려하여 미래 데이터를 예측하기 위한 모형이다. LSTM은 RNN의 문제점인 오차 경사의 기울기 소실(Gradient Vanishing) 및 최적화 오류(Optimization Hurdle)를 해결할 뿐 아니라 시퀀스를 늘린 장기적인 시간의 종속성을 감지 하는데도 효과적이다.

LSTM 구조는 Fig. 2와 같으며, 핵심요소로는 시간에 따라 상태(State)를 유지할 수 있는 메모리이동 셀(Cell)과 셀 안팎으로 데이터의 흐름을 조절하는 세 개의 비선형 게이트 구조이다. 즉, LSTM은 특정 시점의 상태($h_{t}$)를 업데이트하기 위해 셀(Cell, $C_{t}$)이라는 개념을 도입하여 입력과 현재까지의 상태를 이용하여 내부에 가지고 있는 정보를 업데이트할 것인지 아닌지를 판단한다(Olah, 2015). 셀의 들어가는 자료를 조절하기 위한 게이트의 종류로는 입력 게이트(Input Gate, $i_{t}$), 망각 게이트(Forget Gate, $f_{t}$) 그리고 출력 게이트(Output Gate, $o_{t}$) 크게 3가지로 이루어져 있다.

망각게이트는 Eq. (4)로 나타낼 수 있으며 이전 셀의 출력인 $h_{t-1}$과 현재의 입력인 $x_{t}$를 시그모이드(Sigmoid Function) 활성레이어에 적용해 0과 1사이의 값을 얻어 이 값을 현재 상태와 요소끼리 곱하게 되며, 그 과정에서 이 정보를 유지할지 제거할지를 선택하게 된다(Jung et al., 2018).

(4)
$f_{t}=\sigma(W_{f}\bullet[h_{t-1},\: x_{t}]+b_{f})$

위 식에서 $\sigma$는 활성화 함수를 의미하며 $W_{f}$는 망각게이트의 가중치를 $b_{f}$는 망각게이트의 편향을 의미한다. 입력게이트 $i_{t}$에서는 Eq. (5)와 같이 셀에 어떤 정보를 선택해 저장할지를 정하게 되며 해당 과정은 크게 두 단계로 나누어진다. 첫째, 활성화 함수를 이용해 업데이트 여부를 결정하고, 둘째, 하이퍼볼릭 탄젠트(Hyperbolic Tangent, tanh) 함수를 통해 새로운 셀 상태로 업데이트하는데 사용 될 후보 셀($\widetilde{C}_{t}$)을 Eq. (6)을 통해 생성하게 된다.

(5)
$i_{t}=\sigma(W_{i}\bullet[h_{t-1},\: x_{t}]+b_{i})$
(6)
$\widetilde{C}_{t}=\tan h(W_{c}\bullet[h_{t-1},\: x_{t}]+b_{c})$

여기서, $W_{i}$는 입력게이트의 가중치를 $W_{c}$는 후보 셀의 가중치를 의미한다. $b_{i}$는 입력게이트의 편향을 $b_{c}$는 후보 셀의 편향을 의미한다. 임의시점 이전의 셀 상태($C_{t-1}$)와 임의시점의 생성된 후보 셀($\widetilde{C}_{t}$)을 Eq. (7)과 같이 조합하여 임의시점의 셀 상태($C_{t}$)를 업데이트하게 된다.

(7)
$C_{t}=f_{t}\bullet C_{t-1}+i_{t}\bullet\widetilde{C}_{t}$

마지막으로 출력게이트 $o_{t}$는 Eq. (8)은 활성화 함수인 시그모이드 함수를 이용해서 셀 상태 중 중요도에 따라 출력 여부를 결정한다. 마지막으로 Eq. (9)와 같이 하이퍼볼릭 탄젠트 함수를 사용하여 활성화된 임의 시점의 셀 상태($C_{t}$)와의 곱을 통해 특정 시점의 상태($h_{t}$)를 업데이트하게 된다.

(8)
$o_{t}=\sigma(W_{o}\bullet[h_{t-1},\: x_{t}]+b_{o})$
(9)
$h_{t}=o_{t}\bullet\tan h(C_{t})$

여기서, $W_{o}$는 출력게이트의 가중치, $b_{o}$는 편향을 나타낸다.

2.3 GBM(Gradient Boosting Machine)

Gradient Boosting Machine(GBM) 알고리즘은 여러 개의 약한 학습자(Weak Learners), 혹은 결정 트리(Decision Trees)를 결합해서 강한 학습자(Strong Learner)로 구성된 머신러닝 알고리즘이다. 약한 학습자는 편향적이고, 분산이 낮고, 가중치규제(Regularization)를 낮게 적용한다는 특징을 가지므로, 강한 학습자에 비해서 오차율이 크고 정확하지 않은 결과를 불러올 수 있다. 반면, 강한 학습자는 이러한 약한 학습자들을 결합시켜서 오차율을 낮추는 데에 도움을 줄 수 있다. Gradient Boosting 기법은 손실함수(Loss Function), 약한 학습자(Weak Learner), 가법모형(Additive Model), 이렇게 3가지의 구성요소를 지닌다. 손실함수는 최적화 혹은 최소화되어야 하는 대상이고, 약한 학습자는 예측 및 강한 학습자를 결성하기 위해 이용되며, 가법모형은 손실함수의 가중치를 규제(Regularize)하는 데에 사용된다. 따라서 GBM 알고리즘은 약한 학습자 혹은 결정 트리를 추가적으로 적용시키는 반복(Iteration)에 따라, 기존 약한 학습자의 오차율을 개선하고 정확도를 높인다. 그중에서 LightGBM 모형(Ke et al., 2017)Fig. 3과 같으며 앙상블 학습 모형 중, Boosting 계열에 속하는 모형으로 다른 GBM 알고리즘과 달리 리프 중심(Leaf-Wise) 분할을 사용하여 깊이 중심(Level-Wise) 분할 방법보다 모형 학습 시 손실을 더 많이 줄이는 방향으로 학습을 수행하고 학습시간이 적게 소요된다는 장점이 있다(Zhang et al., 2020).

Fig. 3. Process of the LightGBM Model(Choi et al., 2023)
../../Resources/KSCE/Ksce.2024.44.4.0443/fig3.png

2.4 평가지표

본 연구에서는 모델의 예측 성능을 평가하기 위한 지표로 평균 제곱근 오차(Root Mean Sequared Error, RMSE), 평균 절대 오차(Mean Absolute Error, MAE)를 사용하였다. 여기서, N은 데이터 수, $y_{i}$는 i번째 실제값, $\hat{y_{i}}$는 i번째 예측값을 나타낸다.

(10)
RMSE(Root Mean Squared Error) = $\sqrt{\dfrac{1}{N}\sum_{i=1}^{N}(y_{i}-\hat{y})^{2}}$
(11)
MAE(Mean Absolute Error) = $\dfrac{1}{N}\sum_{i=1}^{N}|y_{i}-\hat{y_{i}}|$

3. 연구방법

3.1 기상자료 수집

본 연구에서는 기상청에서 제공하는 강릉, 광주, 대구, 대전, 부산, 서울, 제주, 춘천의 기상관측(ASOS) 데이터 중 검증 기간 시점의 30년 이전 월 강수량 데이터를 훈련용 데이터로 사용했으며 검증과 시험 구간을 2013년 1월부터 2022년 12월까지를 모델 검증용 데이터로 해당 기간의 월 강수량 데이터를 사용했다. 적합 모형 선정에는 훈련용 데이터를 검증과 시험 구간 이전 30년 월 강수량 데이터를 1년 단위로 이동하여 2013년부터 2022년까지 예측 모형별로 연 단위로 10개의 최적 적합 모형을 선정하는 검증 단계 이후에, 적합 모형을 이용해 시험 기간 해당년의 월 강수량을 예측하였다. 예를 들어 2016년의 월 강수량을 예측할 때는 1986~2015년의 자료를 활용하여 2016년에 적합한 하이퍼 파라미터를 선정하는 검증단계 이후, 시험 단계에서는 적합 모형을 가지고 2016년 월 강수량을 예측하였다.

Fig. 4는 본 연구 대상 지역의 관측소를 나타낸 그림이며, Fig. 5에는 각 관측소에서 관측된 강수량 데이터를 1983년 1월부터 2022년 12월까지의 월 강수량을 도시하였다.

Fig. 4. Weather Stations in This Study
../../Resources/KSCE/Ksce.2024.44.4.0443/fig4.png
Fig. 5. Observed Monthly Precipitation(1983~2022). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig5.png

3.2 모형별 예측 결과

3.2.1 ARIMA 모형 월 강수량 예측

모형의 적합성을 높이기 위해 최소의 AIC 값을 얻을 수 있는 p, d, q를 0~2의 범위에서 시행 오차법을 통해 선정 후 예측을 진행하였다(Hyndman et al., 2008). 월 강수량이 음수로 예측되면, 강수량의 특성을 고려하여 0으로 변환하였고 시행 오차법으로 선정된 ARIMA 모형의 파라미터인 p, d, q를 Fig. 6에 박스플롯과 커널 밀도 추정의 특성을 합한 바이올린 플롯을 이용하여 도시하였으며, 바이올린 플롯을 사용하여 지역별 적합한 모형의 매개변수의 빈도를 확인하였다. Fig. 7에서는 ARIMA 모형을 활용하여 2013년부터 2022년까지 예측을 진행하였다.

평가지표인 RMSE와 MAE가 가장 작게 나온 대구의 RMSE는 64.39 mm, MAE는 47.81 mm이고, 가장 크게 나온 서울의 경우 RMSE는 106.97 mm, MAE는 72.01 mm이다. Fig. 7에서는 특정 기간을 제외하고 주기함수의 형태로 예측이 진행되었음을 알 수 있다.

Fig. 6. ARIMA Model Hyperparameter(p, d, q). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig6.png
Fig. 7. Predicted Monthly Precipitation Using ARIMA(2013~2022). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig7.png

3.2.2 SARIMA 모형 월 강수량 예측

SARIMA 모형의 하이퍼 파라미터의 경우 유사 연구(Dimri et al., 2020)에서 월별 시계열 자료를 예측할 때 주기성(S)를 12로 설정하였고 ARIMA 모형의 p, d, q와 계절적 특성을 고려한 P, D, Q가 합쳐진 SARIMA 모형을 활용해 월 강수량 예측을 진행한 선행 연구들을 참고하여 월별 강수량 예측 모형에 적합한 값으로 선정되는 0~2를 대입하여 시행 오차법을 통해 최소의 AIC값을 가지는 하이퍼 파라미터를 산정하였다(Aliyu et al., 2021; Dabral et al., 2017). 매개변수 산정 결과는 Fig. 8에 박스플롯과 커널 밀도 추정의 특성을 합한 바이올린 플롯을 이용하여 도시하였다. Fig. 9에서는 SARIMA 모형을 활용해 2013년부터 2022년까지 월 강수량 예측 결과를 도시하였다.

ARIMA(Fig. 7) 서울과 SARIMA(Fig. 9) 서울을 비교해보면 주기함수의 형태가 보이는 것은 유사하나 강수 최대값을 예측하는 것이 ARIMA(Fig. 7) 서울에서는 약 250 mm 정도이지만, SARIMA (Fig. 9) 서울은 약 700 mm로 ARIMA 모형에 비해 강수 최대값을 예측하기에 적합한 모형임을 알 수 있다.

Fig. 8. SARIMA Model Hyperparameter(p, d, q, P, D, Q). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig8.png
Fig. 9. Predicted Monthly Precipitation Using SARIMA(2013~2022). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig9.png

3.2.3 LSTM 모형 월 강수량 예측

LSTM 모형은 Table 1과 같이 구성하였다. Learning rate는 0.001과 0.01를 Batch size는 32, 64, 128을 Epoch는 50, 100, 200으로 모형을 구성하였을 때, 시행오착법을 통해 RMSE를 최소로 하는 하이퍼 파라미터를 선정하였다. 연도별로 선정한 하이퍼 파라미터를 Learning rate, Batch size와 Epoch 순으로 Fig. 10에 도시하였으며 모형 구성 이후 MSE(Mean Squared Error)를 손실함수로 사용해 월 강수량 예측을 진행하였다. Fig. 10은 적합한 하이퍼 파라미터를 색상으로 구분하여 해당연도별 및 지역별로 적합 모형의 하이퍼 파라미터를 직관적으로 도시하였다. LSTM 모형을 활용해 2013년부터 2022년까지 월 강수량을 예측한 결과를 Fig. 11에 도시하였다.

통계적 모형(ARIMA, SARIMA)의 예측 결과와 LSTM 모형의 예측 결과를 비교해보면 통계적 모형의 경우 예측에서 주기함수의 형태를 보였으나 LSTM 모형의 예측 결과 중 광주, 서울, 춘천을 보면 단순 주기함수에서 벗어나 강수 최대값이 발생하는 월을 예측하여 강수 최대값에 대한 예측뿐 아니라 건기 구간에서도 적절한 예측이 이루어짐을 살펴볼 수 있다.

Fig. 10. Optimal Learning Rate, Batch Sizes, and Epochs for LSTM Models by Stations and Year
../../Resources/KSCE/Ksce.2024.44.4.0443/fig10.png
Fig. 11. Predicted Monthly Precipitation Using LSTM(2013~2022). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig11.png
Table 1. LSTM Hyper Parameter

Hyper parameter

Value

Learning rate

0.001, 0.01

Batch size

32, 64, 128

Epoch

50, 100, 200

Hidden activation function

Relu

Output activation function

Linear

3.2.4 GBM 모형 월 강수량 예측

GBM 모형의 경우 하이퍼 파라미터를 Table 2와 같이 Learning rate는 0.001, 0.01, 0.05을 Number of estimators 50, 100, 200을 넣어 가장 작은 RMSE를 갖는 하이퍼 파라미터를 시행오차법을 이용해 모형을 적합 후 예측을 진행하였다. Fig. 12에 연도별로 적합한 모형의 하이퍼 파라미터는 색상별로 구분하여 사용되는 하이퍼 파라미터를 직관적으로 지역 및 연도별로 구분하였다.

Table 2. GBM Hyper Parameter

Hyper parameter

Value

Learning algorithm

LightGBM

Learning rate

0.001, 0.01, 0.05

Number of estimators

50, 100, 200

Metric

MSE(Mean Squard Error)

GBM 모형을 이용한 월 강수량 예측 결과는 Fig. 13에 도시하였다. 산정 결과를 분석해보니, GBM 모형은 최대값을 예측하는 데 어려움이 있었고, 매월 최소 80 mm 이상의 강수가 내릴 것으로 예측되는 특성을 파악할 수 있다.

Fig. 12. Optimal Learning Rate and n_estimators for GBM Models by Stations and Year
../../Resources/KSCE/Ksce.2024.44.4.0443/fig12.png
Fig. 13. Predicted Monthly Precipitation Using GBM(2013~2022). (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig13.png

3.3 모형별 평가

월 강수량 자료를 이용하여 ARIMA 모형, SARIMA 모형, LSTM 모형과 GBM 모형을 이용해 2013년부터 2022년까지 10년 동안의 월 강수를 예측하였다. 예측된 강수의 월 강수량을 최근 10년(2013~2022년)간의 관측된 강수량과 비교한 결과를 Fig. 14에 나타내었다. 예측된 강수량이 관측된 강수량보다 과소 예측이 되었음을 추세선의 기울기가 1보다 작다는 사실을 통해 도출할 수 있다.

예측값을 계절별로 분류된 예측값의 정확도를 검증하여 Table 4에 도시하였고, 각 지역에서 예측 정확도가 높은 모형과 계절을 굵게 표시하였다. 여기서, MAM은 3~5월, JJA는 6~8월, SON은 9~11월, DJF는 12~2월을 의미한다. 강릉, 광주, 대구, 대전, 서울 그리고 춘천은 SARIMA 모형을 활용해 12~2월을 예측하였을 때, RMSE가 각각 41.23 mm, 22.19 mm, 18.96 mm, 25.92 mm, 21.93 mm, 26.26 mm으로 적합한 모형인 선정됨을 알 수 있다. 부산의 경우 LSTM모형을 활용해 3~5월을 예측할 때 RMSE가 40.24 mm로 적합하였으며, 제주는 LSTM 모형을 이용해 12~2월을 예측할 때, RMSE가 29.76 mm로 적합한 모형을 선정했다. 또한, 서울의 6~8월 예측하는 부분에서 RMSE가 219.87 mm에서 96.83 mm로 최대 55.96 % 작게 나오는 등 위 결과를 활용해 지역별로 적합한 모형을 선정하였다.

Fig. 14. Comparison between Predicted Precipitation and Observed Precipitation with Each Method. (a) Gangneung, (b) Gwangju, (c) Daegu, (d) Daejeon, (e) Busan, (f) Seoul, (g) Jeju, (h) Chuncheon
../../Resources/KSCE/Ksce.2024.44.4.0443/fig14.png
Table 3. Accuracy Evaluation for each 8 Observed Location Model

Station / Model

ARIMA

SARIMA

LSTM

GBM

Gangneung

RMSE(mm)

103.03

107.06

82.82

119.44

MAE(mm)

73.77

71.53

52.88

90.51

Gwangju

RMSE(mm)

94.09

87.83

33.25

107.23

MAE(mm)

65.06

53.78

23.22

73.80

Daegu

RMSE(mm)

64.39

58.58

42.78

76.34

MAE(mm)

47.81

43.25

26.50

53.51

Daejeon

RMSE(mm)

82.47

89.32

64.84

93.77

MAE(mm)

58.43

58.21

41.00

68.23

Busan

RMSE(mm)

101.95

113.15

68.79

112.31

MAE(mm)

66.25

71.74

39.19

80.26

Seoul

RMSE(mm)

106.97

106.92

60.64

127.78

MAE(mm)

72.01

64.72

37.40

79.61

Jeju

RMSE(mm)

100.38

98.02

55.35

105.67

MAE(mm)

69.03

68.63

38.81

74.18

Chuncheon

RMSE(mm)

120.45

115.88

76.98

145.84

MAE(mm)

75.59

72.04

45.91

88.10

Table 4. Seasonal Accuracy Evaluation for each 8 Observed Location Model

Station/Season/Model

ARIMA

SARIMA

LSTM

GBM

Gangneung

MAM

RMSE(mm)

65.96

51.13

53.91

75.90

MAE(mm)

49.94

39.41

40.90

59.31

JJA

RMSE(mm)

129.50

127.89

99.28

160.12

MAE(mm)

109.02

105.51

71.06

132.85

SON

RMSE(mm)

138.66

158.68

113.00

141.64

MAE(mm)

101.49

112.34

67.48

105.00

DJF

RMSE(mm)

45.97

41.23

43.64

74.86

MAE(mm)

34.66

28.86

32.10

64.88

Gwangju

MAM

RMSE(mm)

64.32

45.34

35.97

61.06

MAE(mm)

54.07

39.94

27.87

52.14

JJA

RMSE(mm)

151.96

158.26

43.35

165.45

MAE(mm)

105.36

112.04

30.81

119.75

SON

RMSE(mm)

78.63

57.10

25.90

112.50

MAE(mm)

61.97

46.03

16.66

83.97

DJF

RMSE(mm)

44.78

22.19

24.06

47.27

MAE(mm)

38.85

17.12

17.55

39.35

Daegu

MAM

RMSE(mm)

52.29

41.40

31.48

54.74

MAE(mm)

44.40

35.57

23.89

37.54

JJA

RMSE(mm)

89.89

92.24

72.58

97.55

MAE(mm)

67.65

79.15

46.34

75.54

SON

RMSE(mm)

69.92

56.06

25.08

98.88

MAE(mm)

55.20

43.34

19.66

73.29

DJF

RMSE(mm)

29.77

18.96

20.87

31.93

MAE(mm)

24.00

14.94

16.12

27.66

Daejeon

MAM

RMSE(mm)

65.72

42.40

36.20

51.02

MAE(mm)

51.61

33.04

27.60

41.20

JJA

RMSE(mm)

133.53

161.62

111.26

136.20

MAE(mm)

108.37

136.38

74.15

99.04

SON

RMSE(mm)

65.64

57.62

37.87

98.77

MAE(mm)

51.63

44.26

30.16

85.65

DJF

RMSE(mm)

27.35

25.92

41.16

65.26

MAE(mm)

22.12

19.14

32.12

47.03

Busan

MAM

RMSE(mm)

65.50

58.62

40.24

72.16

MAE(mm)

48.15

45.04

29.95

53.73

JJA

RMSE(mm)

170.16

196.47

99.93

166.20

MAE(mm)

128.21

150.21

48.09

125.20

SON

RMSE(mm)

83.79

87.86

68.15

119.77

MAE(mm)

62.25

62.81

45.71

96.33

DJF

RMSE(mm)

36.27

38.22

51.80

57.32

MAE(mm)

26.42

28.91

33.01

45.77

Seoul

MAM

RMSE(mm)

74.73

57.58

45.97

57.59

MAE(mm)

56.51

46.07

30.78

45.34

JJA

RMSE(mm)

176.73

193.84

96.63

219.87

MAE(mm)

138.74

145.95

68.99

153.93

SON

RMSE(mm)

90.34

66.02

51.65

98.34

MAE(mm)

71.90

51.76

32.95

73.45

DJF

RMSE(mm)

28.13

21.93

24.38

63.08

MAE(mm)

20.90

15.10

16.90

45.71

Jeju

MAM

RMSE(mm)

48.39

37.91

39.23

43.69

MAE(mm)

38.41

32.32

28.24

34.39

JJA

RMSE(mm)

124.92

130.43

71.81

131.45

MAE(mm)

92.00

104.60

55.32

99.04

SON

RMSE(mm)

141.54

134.80

68.37

143.66

MAE(mm)

108.66

99.79

48.52

107.44

DJF

RMSE(mm)

48.22

42.58

29.76

69.57

MAE(mm)

37.08

37.81

23.18

55.85

Chuncheon

MAM

RMSE(mm)

71.62

52.47

55.27

73.03

MAE(mm)

54.65

42.39

38.64

56.63

JJA

RMSE(mm)

213.29

214.70

134.01

240.38

MAE(mm)

161.43

176.31

92.02

164.41

SON

RMSE(mm)

80.62

64.59

42.51

141.62

MAE(mm)

63.86

51.03

33.10

94.41

DJF

RMSE(mm)

30.18

26.26

29.76

43.64

MAE(mm)

22.44

18.44

19.89

36.95

4. 결 론

본 연구에서는 통계적 모형과 딥러닝 모형을 이용하여 국내 8개 ASOS 지점(강릉, 광주, 대구, 대전, 부산, 서울, 제주, 춘천)의 월 강수량 예측 시점의 과거 30년의 월 강수량 자료를 활용하여 2013년부터 2022년까지 10년간 월 강수량을 예측하였다. 단변량 강수량 예측의 불확실성을 줄이고자 2013년 1월부터 2022년 12월까지의 월 강수량 예측을 지점별, 계절별로 진행한 후 비교하였다.

다양한 예측 모형을 비교 분석한 결과, 대부분의 예측 모형이 강수량의 추세를 정확하게 예측했음에도 불구하고, 실제 강수량을 과소평가하는 경향이 있었다. 이러한 강수량 예측의 불확실성을 감소시키기 위해 지역별 및 월별 강수 패턴의 적합한 모형을 선정하였다. 첫째, 모든 대상지점에서 LSTM 모형은 다른 모형에 비해 높은 예측력을 보였다. RMSE가 두 번째로 작은 모형과 비교하여 서울은 RMSE가 60.64 mm로 약 43.28 % 차이를 보였으며, 제주에서는 RMSE는 55.35 mm로 43.53 % 작게 나와 예측력의 향상을 보였다. 둘째, 지점별로 적합한 예측 모형과 계절을 선정하였다. 계절별 평균 강수량이 낮은 12월부터 2월 DJF 기간에는 SARIMA 모형이, 강수량이 많은 6월부터 8월인 JJA 기간에는 LSTM 모형이 더 높은 예측 정확도를 보였다. 이러한 결과는 강수량 예측에서 계절적 변동성을 모델 선택에 반영하는 것의 중요성을 강조한다. 강릉, 광주, 대구, 대전, 서울 그리고 춘천은 SARIMA 모형을 활용해 12~2월을 예측하였을 때, RMSE가 각각 41.23 mm, 22.19 mm, 18.96 mm, 25.92 mm, 21.93 mm, 26.26 mm으로 적합한 모형을 선정한다. 부산의 경우 LSTM 모형을 이용해 3~5월을 예측할 때, RMSE가 40.24 mm로 적합한 모형을 선정하였고 제주의 경우 LSTM 모형을 활용해 12~2월을 예측할 때, RMSE가 29.76 mm으로 모형 적합을 하였다. 또한, 서울의 6~8월인 JJA기간을 예측하는 부분에서 RMSE가 219.87 mm에서 96.63 mm로 최대 56.05 % 작게 나와 여름철인 JJA 기간에 예측 성능이 크게 개선되었다는 점에서 주목할 만하다.

이러한 분석 결과는 강수량 예측에 있어 지역별, 계절별 강수 패턴을 면밀하게 고려하고 이를 예측 모델 선택 반영하는 것이 중요하다는 것을 시사한다. 따라서, 12~2월을 제외한 기간에서 LSTM모형을 활용해 예측을 진행하는 것이 적합함을 살펴볼 수 있었다. 12~2월의 기간에서 월 강수가 무강수의 형태를 보이다 강수가 발생하는 등의 변동성이 있는 지역과 기간에서는 SARIMA모형이 LSTM 모형 보다 우수함을 살펴 볼 수 있었다. 따라서, 이러한 계절적 요소와 변동성을 고려하여 모형 선택시 예측 정확도를 높이는데 기여할 수 있다.

추후 본 연구에서 선정된 적합 모형을 강수량 예측에 강수량뿐만 아니라 습도나 온도와 같은 요인을 추가하여 다변량 예측모형을 통해 일부 기간에 대해서 강수량이 과소추정되는 문제점을 해결하고자 한다.

Acknowledgements

This work was supported by Kyonggi University‘s Graduate Research Assistantship 2024 and this work was also supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT) (No. NRF-2022R1A2C2004034).

References

1 
"YoosefDoost, A., Sadeghian, M. S., NodeFarahani, M. and Rasekhi, A. (2017). “Comparison between performance of statistical and low cost ARIMA model with GFDL, CM2. 1 and CGM 3 atmosphere-ocean general circulation models in assessment of the effects of climate change on temperature and precipitation in Taleghan Basin.” American Journal of Water Resources, Vol. 5, No. 4, pp. 92-99, https://doi.org/10.12691/ajwr-5-4-1."DOI
2 
"Choi, I. H., Cha, K. H., Kim, K. M. and Ahn, J.-H. (2023). “Development of forecasting model for machine learning- based landfill leachate generation using linear interpolation.” Journal of Korean Society of Environmental Engineers, Vol. 45, No. 1, pp. 11-20, https://doi.org/10.4491/KSEE.2023.45.1.11."DOI
3 
"Shenify, M., Danesh, A. S., Gocić, M., Taher, R. S., Abdul Wahab, A. W., Gani, A., Shamshirband, S. and Petković, D. (2016). “Precipitation estimation using support vector machine with discrete wavelet transform.” Water Resources Management, Vol. 30, pp. 641-652, https://doi.org/10.1007/s11269-015-1182-9."DOI
4 
"Yang, C., Zhai, J. and Tao, G. (2020). “Deep learning for price movement prediction using convolutional neural network and long short-term memory.” Mathematical Problems in Engineering, Vol. 2020, 2746845, https://doi.org/10.1155/2020/2746845."DOI
5 
"Mekanik, F., Imteaz, M. A., Gato-Trinidad, S. and Elmahdi, A. (2013). “Multiple regression and Artificial Neural Network for long-term rainfall forecasting using large scale climate modes.” Journal of Hydrology, Vol. 503, pp. 11-21, https://doi.org/10.1016/j.jhydrol.2013.08.035."DOI
6 
"Kuligowski, R. J. and Barros, A. P. (1998). “Localized precipitation forecasts from a numerical weather prediction model using artificial neural networks.” Weather and Forecasting, Vol. 13, No. 4, pp. 1194-1204, https://doi.org/10.1175/1520-0434(1998)013<1194:LPFFAN>2.0.CO;2."DOI
7 
"Kashid, S. S. and Maity, R. (2012). “Prediction of monthly rainfall on homogeneous monsoon regions of India based on large scale circulation patterns using Genetic Programming.” Journal of Hydrology, Vol. 454-455, pp. 26-41, https://doi.org/10.1016/j.jhydrol. 2012.05.033."DOI
8 
"Mirza, M. Q., Warrick, R. A., Ericksen, N. J. and Kenny, G. J. (1998). “Trends and persistence in precipitation in the Ganges, Brahmaputra and Meghna river basins.” Hydrological Sciences Journal, Vol. 43, No. 6, pp. 845-858, https://doi.org/10.1080/02626669809492182."DOI
9 
"Moustris, K. P., Larissi, I. K., Nastos, P. T. and Paliatsos, A. G. (2011). “Precipitation forecast using artificial neural networks in specific regions of Greece.” Water Resources Management, Vol. 25, pp. 1979-1993, https://doi.org/10.1007/s11269-011-9790-5."DOI
10 
"Jung, S., Cho, H., Kim, J. and Lee, G. (2018). “Prediction of water level in a tidal river using a deep-learning based LSTM model.” Journal of Korea Water Resources Association, Vol. 51, No. 12, pp. 1207-1216, https://doi.org/10.3741/JKWRA.2018.51.12.1207."DOI
11 
"Abbot, J. and Marohasy, J. (2014). “Input selection and optimisation for monthly rainfall forecasting in Queensland, Australia, using artificial neural networks.” Atmospheric Research, Vol. 138, pp. 166-178, https://doi.org/10.1016/j.atmosres.2013.11.002."DOI
12 
"Box, G. E. and Pierce, D. A. (1970). “Distribution of residual autocorrelations in autoregressive-integrated moving average time series models.” Journal of the American Statistical Association, Vol. 65, No. 332, pp. 1509-1526, https://doi.org/10.1080/01621459.1970.10481180."DOI
13 
"Kim, B. S., Kim, B. K., Kyung, M. S. and Kim, H. S. (2008). “Impact assessment of climate change on extreme rainfall and IDF analysis.” Journal of Korea Water Resources Association, Vol. 41, No. 4, pp. 379-394, https://doi.org/10.3741/JKWRA. 2008.41.4.379."DOI
14 
"Boorman, D. B. and Sefton, C. E. M. (1997). “Recognising the uncertainty in the quantification of the effects of climate change on hydrological response.” Climatic Change, Vol. 35, No. 4, pp. 415-434, https://doi.org/10.1023/A:1005372407881."DOI
15 
"Venkata Ramana, R., Krishna, B., Kumar, S. R. and Pandey, N. G. (2013). “Monthly rainfall prediction using wavelet neural network analysis.” Water Resources Management, Vol. 27, pp. 3697-3711, https://doi.org/10.1007/s11269-013-0374-4."DOI
16 
"Park, M., Park, M., Kim, S. and Joo, J. (2013). “Extreme storm estimation by climate change using precipitable water.” Journal of the Korean Society of Hazard Mitigation, Vol. 13, No. 1, pp. 121-127, https://doi.org/10.9798/KOSHAM.2013.13.1.121."DOI
17 
"Luk, K. C., Ball, J. E. and Sharma, A. (2001). “An application of artificial neural networks for rainfall forecasting.” Mathematical and Computer Modelling, Vol. 33, No. 6-7, pp. 683-693, https://doi.org/10.1016/S0895-7177(00)00272-7."DOI
18 
"Prudhomme, C., Jakob, D. and Svensson, C. (2003). “Uncertainty and climate change impact on the flood regime of small UK catchments.” Journal of Hydrology, Vol. 277, No. 1-2, pp. 1-23, https://doi.org/10.1016/S0022-1694(03)00065-9."DOI
19 
"Dimri, T., Ahmad, S. and Sharif, M. (2020). “Time series analysis of climate variables using seasonal ARIMA approach.” Journal of Earth System Science, Vol. 129, pp. 1-16, https://doi.org/10.1007/s12040-020-01408-x."DOI
20 
"Aliyu, A. S., Auwal, A. M. and Adenomon, M. O. (2021). “Application of Sarima Models in Modelling and Forecasting Monthly Rainfall in Nigeria.” Asian Journal of Probability and Statistics, Vol. 13, No. 3, pp. 30-43. "DOI
21 
"Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q. and Liu, T. Y. (2017). “Lightgbm: A highly efficient gradient boosting decision tree.” Advances in Neural Information Processing Systems, 30."URL
22 
"Gellens, D. and Roulin, E. (1998). “Streamflow response of Belgian catchments to IPCC climate change scenarios.” Journal of Hydrology, Vol. 210, No. 1-4, pp. 242-258, https://doi.org/10.1016/S0022-1694(98)00192-9."DOI
23 
"Zhang, Y., Zhu, C. and Wang, Q. (2020). “LightGBM‐based model for metro passenger volume forecasting.” IET Intelligent Transport Systems, Vol. 14, No. 13, pp. 1815-1823, https://doi.org/10.1049/iet-its.2020.0396."DOI
24 
"Sælthun, N. R. (1998). “Climate Change Impacts on Runoff and Hydropower in the Nordic Countries: Final Report from the Project “Climate Change and Energy Production”.” Nordic Council of Ministers."URL
25 
"Dabral, P. P. and Murry, M. Z. (2017). “Modelling and forecasting of rainfall time series using SARIMA.” Environmental Processes, Vol. 4, No. 2, pp. 399-419, https://doi.org/10.1007/s40710-017-0226-y."DOI
26 
"Bari, S. H., Rahman, M. T., Hussain, M. M. and Ray, S. (2015). “Forecasting monthly precipitation in Sylhet city using ARIMA model.” Civil and Environmental Research, Vol. 7, No. 1, pp. 69-77."URL
27 
"Panagoulia, D. and Dimou, G. (1997). “Sensitivity of flood events to global climate change.” Journal of Hydrology, Vol. 191, No. 1-4, pp. 208-222, https://doi.org/10.1016/S0022-1694(96)03056-9."DOI
28 
"Hyndman, R. J. and Khandakar, Y. (2008). “Automatic time series forecasting: the forecast package for R.” Journal of statistical software, Vol. 27, pp. 1-22, https://doi.org/10.18637/jss.v027.i03."DOI
29 
"Kite, G. W. (1993). “Application of a land class hydrological model to climatic change.” Water Resources Research, Vol. 29, No. 7, pp. 2377-2384, https://doi.org/10.1029/93WR00582."DOI
30 
"Lukic, B. (2020). Applied Machine Learning Methods with Long-Short Term Memory Based Recurrent Neural Networks for Multivariate Temperature Prediction."URL
31 
"Naz, S. (2015). “Forecasting daily maximum temperature of Umeå.” Department of Mathematics and Mathematical Statistics, Umea University Master Thesis."URL
32 
"Meehl, G. A. and Tebaldi, C. (2004). “More intense, more frequent, and longer lasting heat waves in the 21st century.” Science, Vol. 305, No. 5686, pp. 994-997."DOI
33 
"Balibey, M. and Türkyilmaz, S. (2015). “A time series approach for precipitation in Turkey.” Gazi University Journal of Science, Vol. 28, No. 4, pp. 549-559."URL
34 
"Box, G. E., Jenkins, G. M., Reinsel, G. C. and Ljung, G. M. (2015). Time series analysis: forecasting and control, John Wiley & Sons."URL
35 
"Cortes, C. and Vapnik, V. (1995). “Support-vector networks.” Machine Learning, Vol. 20, pp. 273-297, https://doi.org/10.1007/BF00994018."DOI
36 
"Olah, C. (2015). Understanding LSTM networks. https://research. google/pubs/understanding-lstm-networks/"URL
37 
"IPCC. (2021). Climate Change 2021: Global Warming of 1.5. IPCC. "URL