Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 정회원 · 교신저자 · 한국건설기술연구원 수석연구원 공학박사 (Corresponding Author ․ Korea Institute of Civil Engineering and Building Technology ․ ssyoon@kict.re.kr)
  2. 한국건설기술연구원 UST학생연구원 박사과정 (Korea Institute of Civil Engineering and Building Technology ․ gianchoi@kict.re.kr)



딥러닝, 실시간, 최적화, 하천, 학습데이터, 홍수예측
Deep learning, Flood prediction, Optimizing, Real-time, River, Training data

1. 서 론

하천 홍수의 정확하고 신속한 예측은 효율적인 홍수 위험 관리와 재해 경감 전략에 있어 매우 중요하다. 홍수 발생을 높은 정확도로 예측할 수 있는 능력은 심각한 사회경제적 피해를 줄이기 위한 필수 요소이다. 특히, 기후변화로 인해 극한 기상 현상의 빈도와 강도가 증가함에 따라 홍수 발생 여부를 정확하게 예측할 수 있는 홍수 예측 시스템에 대한 필요성이 증가하고 있다. 이러한 상황에서 환경부에서는 2024년 홍수기부터 인공지능(AI) 홍수예보 기술을 적용하여 223개소 홍수특보 지점의 홍수예보를 수행하고 있다(Ministry of Environment, 2024).

최근에는 딥러닝 알고리즘과 기존 수문학적 접근법의 융합으로 홍수 예측 시스템의 효율성이 크게 향상되고 있다. 홍수 예측에 일반적으로 사용되는 수문학적 기법은 종종 기상 및 수문학적 현상의 복잡성과 변동성으로 인해 물리적 모델에 의존하면서 복잡한 매개변수 설정으로 인한 신뢰성 저해, 비선형성 및 복잡한 홍수 유발 상호작용 반영의 한계, 입력자료의 불확실성으로 정확도 저하 문제가 발생될 수 있다(Amarilla et al., 2023). 수문수리 모델의 매개변수 검보정을 위해서 관측 유량 자료가 필수적이나, 모니터링 시스템이 미비한 지역에서는 자료 수집이 제한적일 수 있다. 이로 인해 예측 정밀도가 떨어질 수 있으며, 수문 환경이 변화할 경우 부정적인 영향을 미쳐 최적의 홍수 위험 관리 전략을 수립하는 데 어려움을 초래할 수 있다(Zhao et al., 2023). 또한, 빠르게 변화하는 수문학적 환경에서는 기존 모델이 즉각적으로 적응하지 못할 수 있다. 유량 변화 및 토지 이용 패턴의 급격한 변화는 현재 모델의 효율성을 저하시킬 수 있으며, 이로 인해 홍수 예측이 지연되거나 부정확해질 수 있다(Trošelj et al., 2023). 최근 국내외에서는 수문 빅데이터와 머신러닝 기법을 적용하여 기존 수문 모델 기반 방법을 보완하는 연구가 진행되고 있다. 특히, 딥러닝 기술을 통한 하천 수위 예측은 눈에 띄는 발전을 이루었으며, 다양한 연구를 통해 홍수 관리의 효율성을 개선하고 있다(Hu et al., 2018; Kratzert et al., 2019; Bowes et al., 2019; Ahmed et al., 2023). 국내의 경우, 안성천의 시단위 수위 예측을 위해 ANN(Artificial Neural Network)을 이용하여 1~2시간 이내에 좋은 예측 성능을 보인 연구가 있으며(Sung et al., 2017) 금강 유역 대청댐 상류 수위 예측 연구에서는 구글의 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하여 다중선형회귀모델과 LSTM(Long Short-Term Memory) 인공신경망 모델을 구축하고, 2002년부터 2016년까지의 15년간 시계열 수위 자료를 사용하여 옥천 수위관측소의 수위를 예측한 바 있다(Jung et al., 2021a). 또한, 섬진강 수계에서는 LSTM 기반 딥러닝 기법을 적용하여 구례 지점의 하천 수위를 1시간, 3시간, 6시간 선행 예측하는 연구가 수행되었으며, LSTM 기법에 고해상도 강우 자료를 활용하여 섬진강 수계의 하천 수위를 선행 시간별로 예측한 연구도 있다(Jung et al., 2021b; Han et al., 2024). 기존 대부분의 연구사례에서는 선행 시간별로 딥러닝 기반 시계열 예측 모델을 구축하고, 전체 평가 기간에 대해 선행 시간별로 관측수위와 비교 평가를 수행하여, 수위 예측 측면에서 LSTM 모델의 안정성과 우수성을 제시한 바 있다. 다만 이러한 선행 시간별 학습, 모델 최적화, 평가 방식으로는 실제 홍수예보에서 중요한 실시간 하천 수위 예측 성능을 충분히 평가하기에는 한계가 존재한다. 특히, 전체 평가 기간을 사용하는 경우 저수위 구간의 데이터가 첨두 수위 구간보다 많이 포함되어 있기 때문에 모델이 빈도가 높은 수위에 더 잘 맞춰지려는 경향(central tendency bias)이 생기므로 첨두 수위가 과소평가 된다. 따라서 홍수예보 관점에서는 핵심요인인 첨두수위 위주의 데이터 학습 분석과 시퀀스-투-시퀀스(sequence-to-sequence) 기반의 매 생산시점별 10~360분 예측 시계열 자료에 대한 정확도 성능 확보가 필요하다.

이에 본 연구에서는 딥러닝을 이용하여 하천 홍수 예측 모델을 구축할 때 사용되는 학습데이터를 실시간 홍수 예경보 발령 관점에 따라 최적 구성하고 이를 통해 모델의 정확도 개선 가능성을 평가하고자 한다.

2. 연구방법

2.1 AutoKeras

본 연구에서는 학습 자료 구성 외에 딥러닝 모형에 영향을 주는 인위적인 요인을 최대한 배제하고자 AutoKeras를 활용하여 최적의 딥러닝 신경망 구조를 결정하고, 각 데이터별 학습을 통해 최적화하고자 하였다. AutoKeras는 딥러닝 모델의 자동 설계 및 최적화를 지원하는 오픈소스 라이브러리로, 모델 구조 구성 및 하이퍼파라미터 최적화에 있어 시행착오나 인간 경험의 영향을 최소화하기 위해 이 접근법을 선택하였다.

AutoKeras는 텍사스 A&M 대학교의 DATA Lab에서 개발된 도구로 Keras 라이브러리를 기반으로 구축되었다(Jin et al., 2019). 이 도구는 하이퍼파라미터 튜닝과 모델 최적화 작업을 자동화하여 다양한 과제에 신속하게 머신러닝 모델을 적용할 수 있도록 한다. AutoKeras의 모델 아키텍처 탐색 과정은 Neural Architecture Search(NAS)와 베이지안 최적화 기법(Bayesian Optimization) 기법이 결합되어 작동된다.

NAS는 인간이 직접 설계하지 않고도 모델 아키텍처를 탐색하는 알고리즘 기반으로 성능 기준을 최대로 충족할 수 있도록 신경망 구조를 자동으로 설계한다. 초기에는 간단하게 신경망 구조로 시작하여, 레이어의 수, 커널 크기, 필터 수를 다양하게 조정하여 성능이 점차 향상될 수 있도록 구조를 진화시킨다. 여기에 결합된 베이지안 최적화 기법이 모델 구조나 하이퍼파라미터 탐색 시 무작위나 단순 반복이 아닌, Gaussian Process와 같이 확률적 모델을 통해 현재까지의 평가 결과를 바탕으로 다음 탐색 후보를 선택함으로써, 탐색 효율성을 높여 제한된 자원과 시간 내에서도 전역 최적(global optimum)에 가까운 결과를 도출할 수 있게 한다.

AutoKeras의 강점은 NAS와 베이지안 최적화를 결합한 아키텍처 탐색을 통해 최소한의 사용자 개입으로 고성능 딥러닝 네트워크를 구축할 수 있다는 점에 있다. 이 도구는 데이터 특징 분석(특징 발굴, 선택, 구성 포함)과 네트워크 구성(하이퍼파라미터 선택 및 미세 조정 포함)과 같은 중요한 프로세스를 자동화하여, 최적의 딥러닝 모델을 개발하는 데 소요되는 복잡하고 시간이 많이 드는 과정을 간소화한다(Ahmed et al., 2023; Perez, 2019). 특히, 딥러닝 네트워크 모델 구축 및 최적화 과정에서 인위적인 영향이 최소화되므로, 본 연구에서 규명하고자 하는 학습데이터 최적 구성에 따른 실시간 하천 홍수 예측 정확도 개선 정도 평가에 객관성을 담보할 수 있다.

2.2 딥러닝 모델 학습

본 연구에서는 하천 수위 예측을 위해 AutoKeras를 활용하여 딥러닝 모델을 최적화하였다. 전 처리된 데이터셋은 모델 평가의 대표성을 보장하기 위해 훈련 세트와 검증 세트를 80:20 비율로 전략적으로 분할하였다. 모델의 학습을 목적함수로 Eq. (1)과 같이 평균절대오차(Mean Absolute Error, MAE)를 사용하였고, 수문학적 모델링의 특정 요구 사항을 충족하기 위해서 Nash-Sutcliffe Efficiency(NSE)라는 사용자 정의지표(Custom Metric)를 추가 사용하였다. NSE는 수문학 모델 성능 평가에 중요한 지표로 정의되며, 식은 다음과 같다.

(1)
$MAE=\dfrac{\sum_{i=1}^{n}\left | y_{true,\: i}-y_{pred,\: i}\right |}{n}$
(2)
$NSE=1-\dfrac{\sum_{i=1}^{n}(y_{true,\: i}-y_{pred,\: i})^{2}}{\sum_{i=1}^{n}(y_{true,\: i}-\overline{y_{true}})^{2}}$

여기서 $y_{true}$는 관측값 $y_{pred}$는 모델예측값 𝑖는 데이터 세트 i에서의 값을 나타낸다.

AutoKeras의 설정에서 모델 기본 구조를 회귀 모델로 설정하고, 단일 입력 노드와 회귀 헤드로 구성되도록 하였다. 모델 아키텍처 탐색은 MAE를 손실 함수로 사용하고, 성능 평가를 위해 NSE 지표를 포함하였다. 모델 아키텍처를 폭넓게 탐색하면서도 계산 효율성을 유지하기 위해 탐색 공간은 최대 50회의 실험으로 제한하였다.

3. 적용 결과

3.1 연구대상 지역

본 연구에서는 한반도 중부에 위치한 강원도 내 상류 한탄강 유역을 연구 대상 지역으로 선정하였다. 해당 유역은 Fig. 1에 제시된 바와 같이 한탄대교를 기준으로 상류에 위치하고 있으며, 임진강의 주요 지류인 한탄강이 이 지역의 주요 수로를 형성하고 있다. 한탄강의 본류 길이는 175.81 km에 이르며, 전체 유역 면적은 1,063.96 km2이다. 이 유역 내 수위 관측을 위해 3개의 수위 관측소가 설치되어 있으며, 이들은 각각 삼합교(관측소 1), 장수대교(관측소 2), 한탄대교(관측소 3)이다. 또한, 해당 유역의 강우량 정보는 청양리, 오덕초교, 서면초교, 다목초교, 용담교, 명월리 등 6개의 인근 강우 관측소로부터 수집된다.

Fig. 1. Study Area and Location of Waterlevel and Rain Stations

../../Resources/KSCE/Ksce.2025.45.3.0347/fig1.png

3.2 학습자료 전처리

본 연구에서는 2019년 7월 1일부터 2021년 10월 31일까지 삼합교, 장수대교, 한탄대교에서 수집된 연속적인 수위 데이터를 이용하였다. 수위 데이터는 10분 간격으로 측정되었으며, 이는 Fig. 2Fig. 3의 (b)-(d)에 해당한다. 또한, 인근 6개의 강우 관측소에서 수집된 강우 데이터를 이용하여 Thiessen 가중 평균법을 통해 평균 면적 강우를 산출하였다. 이는 Fig. 2Fig. 3의 (a)에 해당한다.

본 연구에서는 실시간 홍수예보 활용을 목표로 딥러닝 기반의 하천 수위 예측 모델을 설계하였다. 일반적으로 연속적인 데이터에 대한 딥러닝 예측 모델은 크게 3가지 방법으로 구성될 수 있다(Han et al., 2023). 첫 번째는 단일타겟(single target) 모델로 기존 하천 수위 예측 시 일반적으로 사용되던 방식으로, 예측 시간별로 각 모델을 구축하여 개별적으로 예측을 수행하므로, 예측시간이 m개인 경우, 모델 개수도 m개로 동일하며, 각 모델의 출력갯수는 1개가 된다. 두 번째는 재귀적(recursive) 모델로, 단일 모델이 예측한 결과를 다음 단계의 입력자료로 다시 정의해서 사용하는 모델이다. 따라서 예측 시간과 무관하게 모델 개수는 1개이나, 예측 시간이 증가하면서 모델 오차가 누적되어 예측 정확도가 저하된다는 단점이 있다. 세 번째 방식인 다중타겟(multi target) 모델은 시계열 예측과 유사하게 예측 시간 m까지 예측을 수행하므로, 모델 1개로 인한 출력 개수는 m개가 된다. 일반적으로 많이 사용되는 단일타겟 모델은 예측 시간별로 개별 모델 구축이 필요하고, 예측 시간이 늘어날수록 모델의 수가 증가되어 구축 복잡성이 높아지고, 유지 관리에 소요되는 전산 자원이 과다하게 소모된다는 단점이 있다. 특히, 각 모델이 독립적으로 예측을 수행하므로, 예측에 필요한 데이터의 상관관계를 효과적으로 반영하지 못하고, 시간 간의 일관성 있는 패턴을 유지하기 어려우므로, 시간에 따른 연속성을 고려할 때 한계가 있을 수 있다. 반면 다중타겟 모델은 전체 손실을 최소화하여 다양한 선행시간에 대해 학습되므로 특정 리드 타임에 대한 성능이 저하될 수 있지만, 일관성 있는 시계열 패턴 유지 및 예측 효율성을 높일 수 있다는 장점이 있다. 본 연구에서는 실시간 관점에서 수위 자료의 시계열 일관성을 고려하고, 연산 및 모델 유지관리의 효율성을 고려하여 다중타겟 모델 개념으로 학습을 수행하고자 하였다.

이에 따라 학습 및 검증 데이터셋은 실시간 입력 데이터 형식을 모방하여 구성되었다. 기본적으로 모델은 과거 720분 동안의 72개의 시점에서 수집된 관측 데이터를 이용하여, 향후 360분까지의 36개의 시점을 예측하는 것을 목표로 한다.

데이터의 처리 절차는 다음과 같다. 먼저 데이터 정제 및 정규화 작업을 수행하였다. 결측값 처리를 위해 중위값 대체(median imputation) 데이터 보간 기법을 적용하였다. 이 보간 방법은 각 열의 중위값으로 결측값을 대체하여 데이터 연속성을 유지하면서 잠재적인 이상치의 영향을 최소화한다. 또한, 데이터의 표준화를 위해 파이썬 머신러닝 라이브러리인 scikit-learn의 StandardScaler를 사용하였으며, 이는 각 데이터($x_{i}$)에 대하여 Eq. (3)과 같이 평균을 0, 분산을 1로 맞추는 방식으로 수행된다.

(3)
$x_{i,\: scaled}=\dfrac{x_{i}-\mu}{\sigma}$

또한, 시계열 데이터를 시퀀스-투-시퀀스(sequence-to-sequence) 예측을 위해 준비하는 과정에서는 슬라이딩 윈도우(sliding window) 방식을 사용하였다. 이 방법을 통해 입력-출력 쌍을 생성하였으며, 각 입력 시퀀스는 72개의 시간 단계(input_steps)로 구성되었고, 여기에는 강우 및 3개 관측소의 수위 데이터가 모두 포함된다. 이에 대응하는 출력 시퀀스는 36개의 시간 단계(output_steps)로 구성되며, 목표 변수는 관측소 3의 수위이다. 슬라이딩 윈도우 기법은 창을 점진적으로 이동시키면서 시퀀스 데이터를 생성하게 된다.

본 연구에서는 홍수 예경보 발령 예측 정확도를 높이기 위해서 중요 기준이 되는 고수위 및 수위 상승 시퀀스들을 별도로 분리하여 학습데이터 세트를 구분하고 이로 인한 예측 성능의 차이를 확인하고자 하였다. 이를 위해 데이터 세트 구성 과정에서 두 가지 필터링 기준을 적용하였다. 첫 번째는 입력데이터 시간 범위에서 강우량이 0.1 mm 이상인 데이터가 있는 경우만을 필터링하여 총 30,067개 학습 데이터세트(Dataset type 1)를 구성하였다. 다만, 이렇게 구성된 데이터 세트에서는 강우와 그에 따른 수위 변화가 없는 기간이 강우로 인한 수위 상승이 있는 기간보다 더 빈번하게 나타났다. 이러한 데이터를 학습에 사용하면 모델이 낮은 수위 상승을 예측하는 데 최적화될 수 있으며, 이는 홍수와 같은 중요한 사건에서의 예측 성능을 저하시킬 수 있다.

이에 모델의 성능, 특히 첨두유량 및 수위 상승 예측 성능을 향상시키기 위해 두 번째 필터링 기준을 적용하였다. 적용 기준은 입력 데이터 시간 범위에서 강우량이 0.1 mm 이상이고, 예측 데이터 시간 범위에서 예측하고자 하는 한탄대교(관측소 3)의 최대 수위가 EL.2m 이상인 데이터를 필터링하였다. 그 결과 13,801개 학습 데이터세트(Dataset type 2)를 구성하였고, 이 필터링 기준에 따라 구분된 학습 데이터 세트의 일부를 Fig. 4에 표시하였다. 파란색 선은 입력자료이며 주황색 선은 예측 목표값이다.

최종적으로 구성된 학습데이터 세트를 정리하면 다음 Table 1과 같다.

Fig. 2. Observed Rain and Waterlevel Data for Training. (a) Rain Data, (b) Waterlevel Data(Station 1), (c) Waterlevel Data(Station 2), (d) Waterlevel Data(Station 3)

../../Resources/KSCE/Ksce.2025.45.3.0347/fig2.png

Fig. 3. Observed Rain and Waterlevel Data for Test. (a) Rain Data, (b) Waterlevel Data(Station 1), (c) Waterlevel Data(Station 2), (d) Waterlevel Data(Station 3)

../../Resources/KSCE/Ksce.2025.45.3.0347/fig3.png

Fig. 4. Pre-processed Dataset with Filtering for Training and Validation

../../Resources/KSCE/Ksce.2025.45.3.0347/fig4.png

Table 1. Summarizes the Dataset

Category

Dataset type 1

Dataset type 2

Filtering Criteria

Rainfall ≧ 0.1mm

Rainfall ≧ 0.1mm

Maximum water level of target station ≧ EL.2m

Number of dataset

30,067

13,801

3.3 하천홍수예측을 위한 딥러닝 신경망 최적화

Dataset type 1과 Dataset type 2를 각각 이용하여 AutoKeras가 최적화한 딥러닝 모델은 다음 Table 2와 같은 하이퍼파라미터를 갖는다. AutoKeras를 통해 최적모델을 선정할 때 100번까지 모델 구조 탐색을 시도하도록 조건을 설정하여, 오차가 적고 정확도가 높은 모델이 선정되도록 하였다.

30,067개의 데이터세트(Dataset type 1)를 모두 이용하였을 때, 16번째 모델 구성에서 최적화된 것으로 나타났다. 옵티마이저로 확률적 경사 하강법(SGD), 학습률 0.01일 때 학습 손실(loss)는 0.0817, NSE는 0.9111이었고, 검증 손실은 0.0907, NSE는 0.9763로 나타나 과적합 되지 않고 안정적으로 딥러닝 신경망을 최적화하였다.

Fig. 5는 Dataset type 1 활용한 모델의 학습 및 검정 과정의 epoch 별 오차와 NSE의 변화를 보여준다. 결정된 딥러닝 모델(Model 1)은 Fig. 6과 같이 크기(None, 72, 4)를 갖는 입력 레이어로 시작한다. 여기서 72는 시간 단계(time steps)를, 4는 입력변수(features)의 수를 나타낸다. 이어서 데이터 타입 변환 레이어(cast_to_float32), 다차원 입력 데이터를 일차원 벡터로 변환하는 평탄화 레이어(flatten), 평탄화된 데이터를 입력으로 받아 36개의 출력을 생성하는 회귀 출력 레이어(regression_head_1)와 완전 연결층(Dense)으로 이어지는 구조이며, 총 10,404개의 학습 가능한 파라미터를 갖는다.

최적 결정된 두 모델 모두 시계열 수위 예측에 좋은 성능을 보인 LSTM 구조를 갖지 않지만, 인위적인 조정없이 100번의 모델 탐색 과정에서 최적 선정된 모델로써 각 데이터 특성을 반영하여 가장 높은 정확도와 낮은 오차로 학습된 것이다.

13,801개의 데이터세트(Dataset type 2)를 이용하였을 때는 3번째 시도한 모델 구성에서 최적화되었다(Fig. 7). 이때 회귀 헤드의 dropout 비율 0.5, 확률적 경사 하강법(SGD) 옵티마이저, 학습률 0.01이 사용되었다. 검증 손실은 0.1773으로 학습 손실 0.2300보다 낮았으며, 검증 NSE는 0.964이다.

최적화된 모델(Model 2)의 구조는 Fig. 8에 나타난 바와 같이 여러 핵심 요소로 구성된다. 모델은 입력층에서 (None, 72, 4) 형태의 3D 입력을 받는다. 데이터 전처리 단계에서는 CastToFloat32 레이어를 사용하여 네트워크 전체에서 일관된 데이터 타입을 유지함으로써 계산 효율성과 수치적 안정성을 향상시킬 수 있다. 과적합을 방지하기 위해 드롭아웃(dropout) 레이어가 적용되었는데, 이 드롭아웃은 학습 중 일부 뉴런을 무작위로 제거하여 모델 복잡도를 조절하고 일반화 성능을 향상시키는 모델 정규화이다.

특징 추출 단계에서는 평탄화(flatten) 레이어가 3D 입력을 1D 벡터로 변환하며, 72 * 4개의 피처로 구성된 288개의 요소를 생성한다. 출력층은 36개의 유닛을 가진 단일 Dense 레이어로 구성되며, 이 레이어는 평탄화된 피처를 36개의 시간 단계로 직접 매핑하여 수위 예측을 수행한다.

Fig. 5. Model Training Result of Each Epoch Using Dataset Type 1. (a) Regression Loss (MAE), (b) Nash-Sutcliffe Efficiency (NSE)

../../Resources/KSCE/Ksce.2025.45.3.0347/fig5.png

Fig. 6. Structure of the Optimized Deep Learning Model Using Dataset Type 1

../../Resources/KSCE/Ksce.2025.45.3.0347/fig6.png

Fig. 7. Model Training Result of Each Epoch Using Dataset Type 2. (a) Regression Loss (MAE), (b) Nash-Sutcliffe Efficiency (NSE)

../../Resources/KSCE/Ksce.2025.45.3.0347/fig7.png

Fig. 8. Structure of the Optimized Deep Learning Model Using Dataset Type 2

../../Resources/KSCE/Ksce.2025.45.3.0347/fig8.png

Table 2. Summarizes the Hyperparameters and Metric Results for Deep Learning Model Training and Validation

Category

Parameter / Metric

Dataset type 1

Dataset type 2

Hyperparameters

regression_head_1 / dropout

0.0

0.5

optimizer

SGD

SGD

learning rate

0.01

0.01

Training Metrics

loss

0.0817

0.2300

NSE

0.9111

0.7315

Validation Metrics

val_loss

0.0907

0.1773

val_NSE

0.9763

0.9646

Trial Info

Trial ID

16

3

Best epoch

99

98

4. 실시간 홍수예측 및 정확도 평가

4.1 사전학습된 딥러닝 모델을 이용한 실시간 홍수예측

본 연구에서는 사전 학습된 수위 변화 여부와 관계없이 강우가 발생한 모든 학습데이터 셋(Dataset type 1)을 사용하여 구축한 딥러닝 모델(Model 1)과 일정 수준 이상의 수위 상승 변화가 있는 학습데이터 셋(Dataset type 2)을 사용하여 구축한 딥러닝 모델(Model 2)로 Fig. 3의 테스트 데이터를 대상으로 수위 시계열 및 홍수 위험 예측의 정확성을 평가하였다. 예측 결과를 실제 관측된 수위와 비교하여 모델의 성능을 평가하였다. 이 평가를 수행하기 위해, 세 개의 관측소에서 수집한 72개의 시간 단계에 걸친 강우량 및 수위 데이터를 활용하여 현재 시점으로부터 720분 이전까지의 데이터를 입력으로 사용하고, 목표 수위 관측소인 한탄대교에서 10분부터 360분 후의 수위 및 홍수 위험 수준을 예측하였다.

본 연구에서는 Table 3Fig. 9~Fig. 11과 같이 테스트 기간 내 발생한 세 강우 사례에 대해 시계열 수위 예측 및 홍수 발생 예측 여부를 분석하였다. 한탄대교의 홍수위기 대응(관심·주의·경계·심각) 기준은 관심 5.0 m, 주의 7.9 m 경계 10.1 m, 심각 12.2 m로, 각 홍수 위기 대응 단계(real flood level)를 그래프상에서 1, 2, 3, 4로 표기하고, 관심 단계 수위 이하일 경우는 0으로 표기하였다.

Fig. 9는 2022년 6월 30일 22시 50분에 Model 1과 Model 2로 수행한 시계열 수위 예측과 홍수 위험 수준 결과이다. 두 모델 모두 홍수 위험 수준을 직접 예측하지 않으므로, 수위 예측을 바탕으로 홍수 위험 수준을 추론하였다. 해당 예측 시점에서는 실제 2022년 7월 1일 02시 30분에 한탄대교에서 5 m 이상의 관심 단계 이상의 수위 상승이 관측되었다. 홍수 예측 시점(6월 30일 22시 50분)을 기준으로 Model 2를 이용한 경우, 예측 시간(6시간) 범위 내에서 관심 단계 이상의 수위 상승을 실제 발생 시간보다 3시간 40분 빠르게 예상하였으며, Table 3에서 보듯이, Model 1은 6월 30일 23시 50분에 Model 2보다 1시간 느리게 예상하였다. 예측된 수위 시계열(파란색 네모)을 살펴보면, Model 1은 Model 2보다 관측된 수위(검은 점)와 상당한 차이를 보였다. Fig. 10은 2022년 8월 8일 11시 10분에 예측한 수위 및 홍수 위험 수준이다. 실제 2022년 8월 8일 14시 30분에는 강우로 인해 홍수 위험 수준이 관심 단계를 초과하였다. Model 2와 Model 1 모두 11:20에 앞으로 6시간 이내에 관심 단계를 초과해서 수위가 상승할 것으로 예측하였다. 이 사례에서는 Model 2의 시계열 결과가 상대적으로 관측 수위 유사한 경향을 보였다. Fig. 11은 2022년 9월 5일 23시 50분 시점에서의 시계열 수위 예측과 홍수 위험 수준을 보여준다. 실제로는 2022년 9월 6일 04시 10분에 강우로 인해 홍수 위험이 관심 단계를 초과하였다. Model 2는 23:50에 관심 단계 이상의 수위 상승을 예측하였지만, Table 3에서 보듯이 Model 1은 30분 후인 00:20에 관심 단계 이상의 수위 상승을 예측하였다. 다만, 예측된 수위시계열은 전반적으로 과소 추정 경향을 여전히 보이므로 홍수예측 실무적 활용에는 다소 주의가 필요하며, 향후 연구를 통해 정확도 확보를 위한 데이터 셋 구성 기준 및 학습 모델 보완이 필요하다.

Table 3은 특정 호우 사례 대상으로 실시간 시계열 하천홍수예측 성능을 상관계수(Correlation Coefficient), 평균 제곱근 오차(Root Mean Square Error, RMSE), NSE 및 홍수 여부(Flooding)로 분석한 결과이다. 상관계수를 보면 Model 1은 대부분의 시간에서 높은 상관계수를 나타내 수위 변동 패턴을 잘 모의하는 것으로 나타났다. Model 2도 전반적으로 높은 상관계수를 기록했으나, 일부 시점에서는 Model 1보다 약간 낮은 값을 보였다. 평균 제곱근 오차에서는 Model 1이 전반적으로 낮은 값을 나타냈으며, Model 2는 상대적으로 큰 값을 보였다. NSE는 Model 1은 시점에 따라 값이 크게 변동하며, 일부 시점에서는 음수 값을 나타냈다. 반면 Model 2는 대부분의 시점에서 양의 값을 유지하면서 전반적으로 안정적인 예측 성능을 나타냈다. 홍수 예측 성공 여부에 대한 결과를 보면 Model 2가 Model 1보다 여러 시점에서 홍수를 성공적으로 예측했다. 결론적으로 시계열 수위 예측의 성능을 보여주는 지표인 상관계수, 평균 제곱근 오차는 학습데이터를 많이 사용하여 학습된 Model 1이 우수하였고, 홍수 예측은 수위상승 경향이 큰 데이터 위주로 학습된 Model 2가 더 우수하였다.

Fig. 9. Predicted Water Levels Using a Deep Learning Model on June 30, 2022, at 22:50. (a) Model 1, (b) Model 2

../../Resources/KSCE/Ksce.2025.45.3.0347/fig9.png

Fig. 10. Predicted Water Levels Using a Deep Learning Model on August 8, 2022, at 11:10. (a) Model 1, (b) Model 2

../../Resources/KSCE/Ksce.2025.45.3.0347/fig10.png

Fig. 11. Predicted Water Levels Using a Deep Learning Model on September 5, 2022, at 23:50. (a) Model 1, (b) Model 2

../../Resources/KSCE/Ksce.2025.45.3.0347/fig11.png

Table 3. Evaluation Results for Predicted Water Level of Models

Prediction Time

Model 1

Model 2

Correlation

Coefficient

RMSE

NSE

Flooding

Correlation

Coefficient

RMSE

NSE

Flooding

June 30, 2022

22:40

0.546

0.468

-1.651

X

0.762

0.404

0.289

X

22:50

0.732

0.392

-0.936

X

0.831

0.394

0.317

23:00

0.741

0.358

-0.701

X

0.771

0.414

0.229

23:10

0.817

0.250

0.131

X

0.830

0.395

0.287

23:20

0.855

0.150

0.658

X

0.848

0.382

0.309

23:30

0.871

0.136

0.701

X

0.883

0.348

0.402

23:40

0.874

0.131

0.699

X

0.829

0.351

0.360

23:50

0.882

0.126

0.683

0.850

0.313

0.466

August 8, 2022

11:00

0.972

0.413

-0.803

X

0.961

0.363

0.362

X

11:10

0.967

0.293

-0.060

0.977

0.272

0.590

11:20

0.952

0.163

0.622

0.965

0.265

0.571

11:30

0.951

0.106

0.823

0.964

0.215

0.689

11:40

0.960

0.078

0.895

0.948

0.246

0.554

September 5-6, 2022

23:40

0.960

0.129

0.398

X

0.767

0.178

0.474

X

23:50

0.959

0.121

0.383

X

0.797

0.159

0.533

00:00

0.959

0.102

0.510

X

0.722

0.154

0.455

00:10

0.963

0.114

0.241

X

0.660

0.145

0.395

00:20

0.953

0.102

0.229

0.780

0.119

0.529

4.2 실시간 하천 홍수 예측 정확도 결과

본 연구에서는 학습데이터 구성별 차이를 반영하여 구축된 Model 1과 Model 2의 홍수 예측 성능을 미래 6시간 이내에서 홍수의 발생 유무 예측을 기준으로 평가하고자 하였다. Table 4는 테스트 기간인 2022년 4월 1일부터 10월 31일 기간 내 4,428건에 대해 홍수 발생 여부를 예측하는 데 있어 Model 1과 Model 2의 성능을 비교한 일치 표(contingency table)이다.

Model 1은 모델은 실제 홍수가 발생한 경우를 180건 정확하게 예측하였으며(Hits), 홍수가 발생하지 않았음에도 홍수로 잘못 예측한 경우가 88건(False Alarms), 홍수를 예측하지 못한 경우가 65건(Misses), 홍수가 발생하지 않았음을 정확히 예측한 경우는 4,095건(Correct Negatives)이었다. 반면, Model 2는 홍수 예측에서 더 나은 성능을 보였으며, 192건의 홍수(Hits)를 정확히 예측하였다. False Alarms은 90건으로 다소 증가했으나, Misses는 49건으로 감소하였다. 또한, 홍수가 발생하지 않은 경우를 정확히 예측한 횟수(Correct Negatives)도 4,097건으로 약간 향상되었다. 이 결과는 홍수 예측을 목적으로 수위 상승 위주의 데이터 구성이 홍수 발생 여부 예측의 향상에 기여함을 보여주었다.

또한 구축된 Model 1과 Model 2의 홍수 예측 성공 여부에 대해서 아래 Eq. (4)~Eq. (7)과 같이 이진 분류 모델의 성능을 측정하는 대표적인 지표인 정밀도(Precision), 재현율(Recall), F1-score, 임계성공지수(Critical Success Index, CSI)를 이용하여 Table 5와 같이 평가하였다.

(4)
$Precision=\dfrac{Hits}{Hits+False Ala{s}}$
(5)
${Recall}=\dfrac{Hits}{Hits+Misses}$
(6)
${F}1=2\times\dfrac{{Precision}\times{Recall}}{{Precision}+{Recall}}$
(7)

${CSI}=\dfrac{Hits}{{False}{Ala s}+Hits+Misses}$

$=\dfrac{정확히 예측한 경우}{홍수 발생과 관련된 전체 경우}$

Table 4. Contingency Table for Test Data Set

Observed

Yes (Flood)

No (No Flood)

Model 1

Yes (Flood)

180 (Hits)

88 (False alarms)

No (No Flood)

65 (Misses)

4095 (Correct negatives)

Model 2

Yes (Flood)

192 (Hits)

90 (False alarms)

No (No Flood)

49 (Misses)

4097 (Correct negatives)

Table 5. Performance Metrics Comparison for Test Data Set

Model

Items

Model 1

Model 2

Precision

0.672

0.681

Recall

0.735

0.797

F1-Score

0.702

0.734

CSI

0.541

0.580

5. 결론 및 향후 연구

본 연구에서는 딥러닝 기반의 하천 수위 예측 모델의 홍수 예경보 활용 가능성을 높이기 위해 딥러닝 기반의 하천 수위 예측 모델을 위한 학습데이터를 최적 구성하였고, 학습데이터 최적 구성에 의한 딥러닝 모델의 정확도 개선만을 확인할 수 있도록 딥러닝 네트워크 구성 및 학습 과정에서 인위적인 요인을 배제하고자 AutoKeras를 활용하였다. 이를 통해 수위 변화 여부와 관계없이 강우가 발생한 모든 학습데이터 셋을 사용한 딥러닝 모델(Model 1)과 일정 수준 이상의 수위 상승 변화가 있는 학습데이터 셋을 사용한 딥러닝 모델(Model 2)을 구축하고, 한탄강 상류의 한탄대교의 수위를 예측하여 하천 홍수 예측 성능을 평가하였다. 두 모델을 비교한 결과, 수위 시계열 예측 성능은 학습데이터가 더 많은 Model 1이 우수한 상관계수와 낮은 평균 제곱근 오차를 기록했으나, 홍수 예측 성능은 Model 2가 더 뛰어났다. 특히, Model 2는 홍수 발생 여부를 더 효과적으로 예측하여 재현율, F1-score, 임계성공지수 등의 지표에서 Model 1을 상회하는 성능을 보였다. 이는 수위 상승 위주의 데이터 구성이 홍수 예측 성능 향상에 기여했음을 보여주었다. 이러한 결과는 학습데이터의 특성과 구성 방식이 모델의 예측 능력에 큰 영향을 미친다는 것을 보여주며, 홍수와 같은 특정 사건을 예측하려면 관련된 핵심 요소(수위 상승)를 더 집중적으로 학습시킬 필요가 있음을 시사한다. 다만 Model1이 더 많은 데이터를 사용해 안정적인 수위 예측 성능을 보여주었으므로, 두 모델을 조합하거나 수위 상승 위주의 데이터 학습시 자료의 부족 및 불균형을 해소하기 위한 방안으로 활용하고, 일정 수준의 홍수 예측 정확도 확보를 위한 학습방법과 데이터 활용 기준 선정에 대한 추가 연구를 수행하고자 한다. 또한 현재 AutoKeras로 결정된 모델보다 복잡하고, 홍수예측에 좋은 성능을 보이는 LSTM 구조를 활용하여 홍수예측 정확도 개선에 관한 연구로 확장하고자 한다.

Acknowledgements

The research for this paper was carried out under the KICT Research Program (Project no. 20250284-001, Development of Digital Urban Flood Control Technology for the Realization of Flood Safety City) funded by the Ministry of Science and ICT.

References

1 
"Ahmed, A., Al Maliki, A., Hashim, B., Alshamsi, D., Arman, H. and Gad, A. (2023). “Flood susceptibility mapping utilizing the integration of geospatial and multivariate statistical analysis, Erbil area in Northern Iraq as a case study.” Scientific Reports, Vol. 13, No. 1, 11919, https://doi.org/10.1038/s41598-023-39290-4."DOI
2 
"Amarilla, G. A., Stalder, D. H., Pasten, M. and Pinto-Roa, D. P. (2023). “Comparative analysis of statistical and recurrent neural network models for short-term river level forecasting in the Paraguay River.” 2023 IEEE Latin American Conference on Computational Intelligence (LA-CCI), pp. 1-6, https://doi.org/10.1109/LA-CCI58595.2023.10409420."DOI
3 
"Bowes, B. D., Sadler, J. M., Morsy, M. M., Behl, M. and Goodall, J. L. (2019). “Forecasting groundwater table in a flood prone coastal city with long short-term memory and recurrent neural networks.” Water, Vol. 11, No. 5, 1098, https://doi.org/10.3390/w11051098."DOI
4 
"Han, H., Kang, N., Yoon, J. and Hwang, S. (2024). “Utilizing deep learning algorithm and high-resolution precipitation product to predict water level variability.” Journal of Korea Water Resources Association, Vol. 57, No. 7, pp. 471-479, https://doi.org/10.3741/JKWRA.2024.57.7.471 (in Korean)."DOI
5 
"Hu, C., Wu, Q., Li, H., Jian, S., Li, N. and Lou, Z. (2018). “Deep learning with a long short-term memory networks approach for rainfall-runoff simulation.” Water, Vol. 10, No. 11, 1543, https://doi.org/10.3390/w10111543."DOI
6 
"Jin, H., Song, Q. and Hu, X. (2019). “Auto-Keras: An efficient neural architecture search system.” In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, Anchorage, AK, USA, 4-8 August 2019, pp. 1946- 1956, https://doi.org/10.1145/3292500.3330648."DOI
7 
"Jung, J., Mo, H., Lee, J., Yoo, Y. and Kim, H. S. (2021a). “Flood stage forecasting at the gurye-gyo station in sumjin river using LSTM-based deep learning models.” Journal of the Korean Society of Hazard Mitigation, Vol. 21, No. 3, pp. 193-201, https://doi.org/10.9798/KOSHAM.2021.21.3.193 (in Korean)."DOI
8 
"Jung, S., Lee, D. and Lee, K. (2021b). “Prediction of river water level using deep-learning open library.” Journal of the Korean Society of Hazard Mitigation, Vol. 18, No. 1, pp. 1-11, https://doi.org/ 10.9798/KOSHAM.2018.18.1.1 (in Korean)."DOI
9 
"Kratzert, F., Klotz, D., Herrnegger, M., Sampson, A. K., Hochreiter, S. and Nearing, G. S. (2019). “Toward improved predictions in ungauged basins: Exploiting the power of machine learning.” Water Resources Research, Vol. 55, pp. 11344-11354, https://doi.org/10.1029/2019WR026065."DOI
10 
"Ministry of Environment (2024). “Ministry of Environment and Local Governments Discuss Strengthened Flood Measures, Including AI-Based Flood Forecasting” [Press Release]"URL
11 
"Perez, J. G. M. (2019). Autotext: AutoML for Text Classification, Master’s Thesis, National Institute of Astrophysics, Optics and Electronics, Puebla, Mexico."URL
12 
"Sung, J. Y., Lee, J., Chung, I. M. and Heo, J. H. (2017). “Hourly water level forecasting at tributary affected by main river condition.” Water, Vol. 9, No. 9, 644, https://doi.org/10.3390/w9090644."DOI
13 
"Trošelj, J., Nayak, S., Hobohm, L. and Takemi, T. (2023). “Real-time flash flood forecasting approach for development of early warning systems: integrated hydrological and meteorological application.” Geomatics, Natural Hazards and Risk, Vol. 14, No. 1, pp. 1-10, https://doi.org/10.1080/19475705.2023.2269295."DOI
14 
"Zhao, Y., Chen, Y., Zhu, Y. and Xu, S. (2023). “Evaluating the feasibility of the Liuxihe model for forecasting inflow flood to the Fengshuba reservoir.” Water, Vol. 15, No. 6, 1048, https://doi.org/10.3390/w15061048."DOI