Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 경북대학교 건설환경에너지공학부 박사과정 (Kyungpook National University)
  2. 경북대학교 토목공학과 교수 (Kyungpook National University)
  3. 한국건설기술연구원 박사후연구원 (Korea Institute of Civil Engineering and Builidng Technology)


도시 홍수 분석, 침수 예측, LSTM 모형, 로지스틱 회귀
Flood prediction, Urban runoff analysis, LSTM model, Logistic regression

  • 1. 서 론

  • 2. 연구 방법

  •   2.1 실제 호우 자료의 수집

  •   2.2 1-2차원 홍수분석

  •   2.3 RNN과 LSTM

  •   2.4 로지스틱 회귀

  • 3. 연구 대상 지역과 모형의 검증

  • 4. LSTM 기반 총 월류량 예측

  •   4.1 입력 자료 및 매개변수 검토

  •   4.2 모형의 구축 및 예측결과

  • 5. 침수 범위 예측

  •   5.1 로지스틱 회귀의 학습

  •   5.2 예측결과 및 비교

  • 6. 결 론

1. 서 론

최근 기후 변화의 영향과 함께 도시 지역에 대한 불규칙적인 집중호우가 발생하고 있다. 이는 도시화가 진행되고 복잡한 배수 체계를 가진 도시유역에 대해 침수를 일으킬 수 있는 원인이 된다. 도시 홍수는 재산 및 인명피해로 이어질 수 있기 때문에 침수의 양상을 사전에 파악하고, 예측할 수 있는 시스템을 구축하는 것은 매우 중요하다 할 수 있다. 도시 홍수해석을 위해 수치해석 기반 모형이 사용되었으며, 이는 정교한 모의 결과를 제공하였다. 다만 수치해석 기반 모형의 경우, 매개변수의 조정, 자료의 수집, 입출력 자료에 대한 전·후처리에 시간이 다소 소요될 수 있는 단점이 있다. 근래에는 기계학습을 이용한 자료기반 홍수 해석 모형에 대하여 연구되어 왔으며, 홍수 해석에 대한 결과를 보다 빨리 제공할 수 있는 장점이 있다(Mosavi et al., 2018).

기계학습의 범주에 포함되는 딥 러닝은 일반적인 신경망 보다 깊은 학습이 가능하며, 비선형을 가진 자료에 대해서도 적절한 분석결과를 제시할 수 있다. Shen(2018)에 따르면, 수자원 및 수문분야에 대한 딥 러닝 기법의 적용은 점차증가하고 있으며 대부분 과학 분야에서와 마찬가지로 수자원 분야에서도 우수한 예측 및 분석결과를 도출해낼 것으로 보인다. Hu et al.(2018)은 강우-유출 시뮬레이션을 위해 LSTM (Long Short-Term Memory) 신경망을 사용하였으며, 86개의 강우-유출 패턴 자료를 이용하였다. 이에 대한 결과를 일반적은 ANN (Artificial Neural Network)모델과 비교하여 LSTM 신경망의 우수성을 검증하였다.

다양한 기계학습이 수문자료 예측에 이용되고 있으나, 딥 러닝을 이용한 도시 배수분구 단위 홍수 사상을 예측한 연구는 부족한 것으로 보인다. 도시 유역의 홍수는 하천과 같이 연속적인 유량 및 홍수량 분석이 어려우며, 단일 도시 유역에 대한 실제 월류량 자료와 이를 유발한 관측 강우자료도 부족한 실정이다. 아직까지 침수 이력이 있는 도시 지역에 대한 지표 침수심을 측정할 수 있는 기기가 부족하며, 배수관망 내에 흐름을 통해 월류되는 홍수량을 기록할 수 있는 시스템이 구축되어 있지 않아 도시유역에 대한 강우-유출 양상 파악에 더욱 어려움을 주고 있다.

이에 본 연구에서는 도시 침수를 야기한 다양한 관측강우 사상을 조사하였으며, 관측 강우 자료 기반 1차원 도시유출해석과 2차원 침수해석을 실시하여 홍수 데이터베이스를 구축하였다. 이는 단일 도시 유역에서 침수를 일으키는 실제 강우자료에 대한 부족함을 보완해주고, 다양한 자료 패턴을 필요로 하는 딥 러닝 기법의 적용가능성을 확보 할 수 있을 것으로 보인다. 다양한 관측 강우사상은 LSTM 모형의 입력 자료로서 사용하고 1차원 도시유출해석 결과는 목표값으로 사용되었다. 2차원 침수 해석 결과는 로지스틱 회귀 모형의 종속 변수로서 적용되어 LSTM으로부터 예측 된 총 월류량이 입력 될 시에 침수 범위를 예측할 수 있도록 하였다. 제시된 방법론을 통해 LSTM 모형 기반 총 월류량 곡선을 도시유역에서 적용할 수 있음을 나타내고, 예측 되는 침수 범위를 통해 도시 홍수 대응체계의 기초자료를 제공할 수 있을 것으로 보인다. 본 연구에 대한 흐름도는 Fig. 1과 같다.

Figure_KSCE_40_03_02_F1.jpg
Fig. 1.

Flowchart for Study

2. 연구 방법

2.1 실제 호우 자료의 수집

서울시를 포함한 전국단위(인천, 천안, 충주, 부산, 울산, 창원) 도시에 대하여 침수피해를 야기한 지속시간 6시간 강우를 ASOS (Automated Synoptic Observing System)와 AWS (Automatic Weather System)의 관측 자료를 기상청(Korea Meteorological Administration, KMA, 2020) 웹사이트를 통하여 조사하였다. 2009~2017년도에 걸친 실제 호우를 조사하였으며, 총 70여개의 강우 자료를 수집하였다. 총 강우량(mm)은 최소 7.5 mm에서 최대 284.4 mm까지 나타났으며, 다양한 강수 패턴을 LSTM 모형에 학습하고자 하였다. 침수를 유발한 과거 관측 강우를 다수 수집함으로써 연구 대상 지역 내에 부족한 침수 사상을 보완하였다. Table 1에 본 연구에서 적용한 강우 관측소의 이름, 관측소코드, 관측날짜, 강우량을 제시하였으며, LSTM 모형에 적용하기 위한 학습, 검증, 테스트 자료에 따라 구분하였다. LSTM 모형의 훈련 자료는 총 40개의 강우 사상으로 구성되어 있으며, 검증 자료는 20개의 강우 사상으로 구성되어 있다. 테스트 자료의 경우 총 10개의 강우 사상이 사용되었다. 각 강우사상은 10분 단위 자료이며, 지속시간 6시간 이므로 360개의 자료를 가지고 있다. 훈련을 위한 자료는 20개 관측강우 사상이므로 총 14,400개의 자료를 포함하고 있다. 본 연구에서는 제시된 예측 모형의 검증을 위해 테스트 자료 중 2011년 7월 27일에 강남(400) AWS에서 관측된 강우 사상에 대한 총 월류량과 침수 범위를 예측하고 이를 수치해석 기반 홍수 모의 결과와 비교하였다.

Table 1. Observed Rainfall Data

Rainfall Stations Observed Date Total Rainfall ( m m )
Training Data (40 Events) Seoul (108) ASOS 2010/09/21, 2011/07/27 267.5, 116.5
Gangnam (400) AWS 2010/09/21 253.5
Gwanak Mountain (116) Weatehr Radar 2010/09/21, 2011/07/27 110.0, 184.5
Seocho (401) AWS 2010/09/21 258.0
Gangdong (402) AWS 2010/09/21 275.5
Songpa (403) AWS 2010/09/21, 2011/07/27 252.0, 194.5
Gangseo (404) AWS 2010/09/21, 2011/07/27 70.0, 178.5
Yangcheon (405) AWS 2010/09/21, 2011/07/27 52.0, 180.5
Dobong (406) AWS 2010/09/21 166.5
Nowon (407) AWS 2010/09/21, 2011/07/27 57.5, 88.5
Dongdaemun (408) AWS 2010/09/21, 2011/07/27 232.5, 127.5
Jungrang (409) AWS 2010/09/21, 2011/07/27 267.5, 112.0
KMA (410) AWS 2010/09/21 251.5
Mapo (411) AWS 2010/09/21, 2011/07/27 241.5, 177.5
Seodaemun (412) AWS 2010/09/21, 2011/07/27 154.5, 121.5
Gwangjin (413) AWS 2010/09/21, 2011/07/27 249.0, 117.0
Seongbuk (414) AWS 2010/09/21, 2011/07/27 160.0, 106.5
Yongsan (415) AWS 2010/09/21, 2011/07/27 180.0, 136.5
Eunpyeong (416) AWS 2010/09/21, 2011/07/27 238.5, 25.5
Geumcheon (417) AWS 2010/09/21 160.0
Hangang (418) AWS 2010/09/21 240.5
Seongdong (421) AWS 2010/09/21 216.5
Gwanak (509) AWS 2010/09/21 91.0
Yeongdeungpo (510) AWS 2010/09/21 260.0
Gwacheon (590) AWS 2010/09/21 63.5
Validation Data (20 Events) Geumcheon (417) AWS 2011/07/27 47.0
Bukak Mountain (422) AWS 2011/07/27 125.0
Gangbuk (424) AWS 2010/09/21, 2011/07/27 119.5, 81.0
Namhyeon (425) AWS 2011/07/27 248.0
Gwanak (509) AWS 2011/07/27 245.0
Yeongdeungpo (510) AWS 2011/07/27 181.0
Gwacheon (590) AWS 2011/07/27 140.0
Incheon (112) ASOS 2017/07/23 69.3
Cheonan (232) ASOS 2017/07/16 223.6
Chungju (127) ASOS 2017/07/16 284.4
Busan (159) ASOS 2009/07/16, 2011/07/27, 2012/07/15, 2014/08/25, 2017/09/11 243.0, 229.5, 114.0, 91.0, 254.1,
Ulsan (152) ASOS 2016/10/05, 2017/09/11 91.2
Changwon (155) ASOS 2014/08/25, 2016/10/05 209.5, 116.7
Test Data (10 Events) Gangnam (400) AWS 2011/07/27, 2012/08/15, 2013/07/22 184.5,131.5, 140.5
Seocho (401) AWS 2011/07/27, 2012/08/15, 2013/07/22 201.0,129.5, 128.0
Gangdong (402) AWS 2011/07/27 111.5
KMA (410) AWS 2011/07/27 164.5
Hangang (418) AWS 2011/07/27 150.0
Seongdong (421) AWS 2011/07/27 118.0

2.2 1-2차원 홍수분석

1차원 도시유출 데이터베이스를 만들기 위하여 사용한 SWMM 모형은 도시 및 비도시지역에 대하여 널리 사용되는 1차원 유출해석 모형이다(Rai et al., 2017). 앞서 조사한 관측 강우에 따른 유출량을 EPA-SWMM (EPA’s Storm Water Management Model, 5.1 version)을 통하여 산출하였으며, 외수의 영향은 서울특별시 풍수해저감종합계획(Seoul Metropolitan City, 2015)을 참조하여 적용하였다. SWMM 모형의 실행블록 중 Runoff와 Extran을 활용하였으며, Runoff 블록은 강우사상 기반의 초기연산이 수행되는 블록으로써 배수유역 내의 유출현상, 맨홀에 대한 유입수문곡선을 계산한다. Extran블록의 경우 Runoff 블록의 출력자료를 활용하여 배수관망 시스템의 유량과 수심을 구하기 위해 사용되며, 계산 시간별 배수관망 내의 유량 및 수위를 통해 관내의 역류현상, 월류량 해석이 가능하다(Park et al., 2019). 연구 대상지역에서 다양한 강우 사상에 따른 월류량 해석을 위하여 Eqs. (1) and (2)에 나타난 Saint-Venant의 연속방적식과 운동량 방정식을 활용하였다. Q는 유출량( m 3 ), W 는 소유역의 폭( m ), n 은 Manning의 조도계수, d 는 수심( m ), d p 는 지면저류 손실수심( m ), S 는 소유역 경사를 의미하며, A 는 소유역의 지표흐름 단면적( m 2 ), V 는 지표흐름 속도( m / s e c )를 나타낸다.

$$Q=W\times\frac1n(d-d_p)^\frac53S^\frac12$$ (1)
$$\frac{\partial Q}{\partial t}+gAS_f-2V\frac{\partial A}{\partial t}-V^2\frac{\partial A}{\partial x}+gA\frac{\partial H}{\partial x}=0$$ (2)

침수 범위에 대한 분석을 위한 2차원 홍수 해석은 유한차분기법을 기반으로 하는 수리해석 프로그램을 이용하였다. 적용한 FLO-2D 모형은 FEMA (Federal Emergency Management Agency, 미국 연방재난관리청)가 승인한 하천흐름과 홍수해석을 위한 수리모형으로 유한차분법을 이용한다(Risi et al., 2015). 2차원 수리학적 침수해석의 결과를 이용하여 각 강우조건에 따른 최대 침수 지도를 생성하였으며, 결과는 로지스틱 회귀의 종속 변수로서 사용된다. 홍수파 해석을 위한 2차원 격자의 크기는 5 m 정방형으로 하였으며, Eqs. (3) and (4)를 이용하여 합성 조도계수를 0.025로 산정 및 적용하였다. n 은 합성조도계수, n 0 는 저면조도계수, θ 은 건폐율(%), n 1 은 0.06(농지), n 2 는 0.047(도로), n 3 는 0.05(기타), A 1 은 농지면적, A 2 는 도로면적, A 3 는 기타토지 이용면적, h 는 수심이다(Moore, 2011; Son et al., 2015). 본 연구에서는 전국단위로 조사된 70개의 강우 사상에 대하여 SWMM 모의와 2차원 홍수해석을 실시하였다. 1-2차원 해석 결과는 RNN과 로지스틱회귀의 입력 자료로서 사용되었다.

$$n^2=n_o^2+0.02\times\frac\theta{100-\theta}\times h^{4/3}$$ (3)
$$n_0^2=\frac{n_1^2A_1+n_2^2A_2+n_3^2A_3}{A_1+A_2+A_3}$$ (4)

2.3 RNN과 LSTM

RNN은 과거에 입력된 데이터와 나중에 입력된 데이터 사이의 관계를 고려할 수 있는 신경망이며, 연속적인 배열을 가진 자료에 대한 분석에 탁월한 능력을 발휘한다. RNN은 일반적인 신경망과 같이 back propagation 알고리즘을 사용하여 훈련되며, 신경망에 대한 학습을 시작한 뒤에 경사 하강법을 적용한다. 그러나 일반적인 신경망과 달리 순환형 학습 구조를 가지고 있으며, 입력되는 데이터를 계층에 따라 순환시킬 수 있는 장점이 있다. 이를 통해 과거의 정보를 기억하는 동시에 최신 데이터로 갱신 할 수 있다. RNN의 순환구조는 Fig. 2와 같이 표현될 수 있다. x 0 , x 1 , ..., x t - 1 , x t 은 RNN에 입력되는 데이터를 나타내며, 출력값은 h 0 , h 1 , ..., h t - 1 , h t 으로 표현된다. 여기서 t 는 각 벡터에 대한 시간 또는 순서를 나타낸다. Fig. 2에서 R N N 은 신경망의 각 독립적인 RNN 층을 나타낸다.

Figure_KSCE_40_03_02_F2.jpg
Fig. 2.

Structure of RNN

Fig. 2와 같이 각 RNN 층은 그 층으로의 입력과 1개의 전 RNN 층으로부터의 출력을 받는다. 이 두 데이터를 이용하여 현 시간 또는 순서의 출력을 계산하는데, 이때에 이용되는 수식은 Eq. (5)와 같다.

$$h_t=tanh(h_{t-1}W_h+x_tW_x+b)$$ (5)

Eq. (5)에서 볼 수 있듯이, RNN의 가중치는 2개가 있다. 하나는 입력 x t 를 출력 h t 로 변환하기 위한 가중치 W x 가 있으며, 다른 하나는 1개의 RNN 출력을 다음 순서의 출력으로 변환하기 위한 W h 가중치가 있다. 활성화 함수에 대한 b 는 편향을 나타낸다.

LSTM은 시계열 데이터에서 직접 학습하는 Fig. 2와 같은 RNN 신경망의 일종이다(Le et al., 2019). LSTM은 입력 자료에 대한 정보 상태를 보존 여부에 따라 학습이 가능한 기법이다. 일반적인 RNN은 전 시간에 대한 은닉층의 학습결과에 대해서만 업데이트하는 단점이 있다. Fig. 2와 같은 RNN의 일종이지만 입력 자료에 대한 정보를 더욱 장기적으로 기억하기 위해 Fig. 3(b)와 같이 은닉층에 셀 상태(cell state)구조를 추가한 것이 LSTM 모델이다. Fig. 3(b)에서 어떤 정보를 버릴 것인가에 대한 계산은 ‘forget gate’( f t )을 통해 수행되며, 이전 단계의 h t - 1 과 현재 단계의 x t 를 sigmoid 함수에 적용하여 0과 1사이의 값을 산정한다. 이를 현재 상태와 곱해지게 되며, 이 과정에서 정보를 유지할지 제거할지 결정한다.

$$f_t=\sigma(W_f\times\;\left[h_{t-1},x_t\right]\;+b_f)$$ (6)
Figure_KSCE_40_03_02_F3.jpg
Fig. 3.

Structure of RNN and LSTM

다음으로 앞으로 새롭게 들어오는 데이터 중 어떤 것을 셀 상태에 저장할 것인지를 정한다. ‘input gate’( i t )라고 불리는 시그모이드 함수가 어떤 데이터를 업데이트할지 정하게 된다. hyperbolic tangent 함수를 통해 새로운 후보 값들인 C ~ t 벡터를 만들게 되고, i t 값과 조합하여 Cell State에 더한다.

$$i_t=\sigma(W_i\times\;\left[h_{t-1},\;x_t\right]\;+b_i)$$ (7)
$${\widetilde C}_t=tanh(W_C\times\;\left[h_{t-1},\;x_t\right]\;+b_C)$$ (8)

과거 상태인 C t - 1 을 업데이트해서 새로운 상태 C t 를 만들기 위하여, Eqs. (6)~(8) 결과들을 이용한다. Eq. (9)을 통하여 현재 단계에 대한 정보 상태를 업데이트 할 수 있다. 최종적인 결과는 ‘output gate’( o t )를 통해 수행될 수 있으며, 셀 상태의 어느 부분을 도출할지 결정하는 단계로 볼 수 있다. 이를 위해 Eq. (10)을 이용하며, 여기서 b o o t 의 편향을 나타낸다. 마지막으로 Eq. (11)를 통하여 현재 셀 상태에 대한 업데이트를 수행한다.

$$C_t=f_t\times C_{t-1}+i_t\times\widetilde{C_t}$$ (9)
$$o_t=\sigma(W_o\times\;\left[h_{t-1},\;x_t\right]\;+b_o)$$ (10)
$$h_t=o_t\times tanh(C_t)$$ (11)

2.4 로지스틱 회귀

로지스틱 회귀는 비율, 비례적 또는 범주형 자료에 대한 회귀 추정을 실시하는 간단한 기계학습의 일종이다. 더욱 발전된 분류와 회귀 기법에 비하면 매우 간단한 이론에 바탕을 두고 있지만, 범주형 자료에 대하여 확률적인 분석이 가능하다. 즉, 종속변수에 직접적인 영향을 가진 독립변수를 이용하여 어떤 특정 사건의 발생 여부를 예측할 수 있다.

로지스틱 회귀 분석은 수자원 및 홍수위험 분석에 적용된 사례가 있다. Pradhan(2009)은 과거 몬순 강우에 의한 홍수피해를 입은 연구대상 지역에 대한 정량적인 홍수 위험등급의 추정치를 제시하기 위하여 로지스틱 회귀를 사용하였다. 이를 위한 독립변수로서 경사도, 곡률, 강우, 배수 및 고도인자를 모두 고려하여 회귀분석을 실시하였다. Ozdemir(2011)은 다양한 GIS 기반 자료를 이용하여 지하수 존재에 대한 가능성을 나타내는 지도를 생성하였다. 이를 통해 4단계의 지하수 존재의 가능성 등급을 분류 할 수 있었으며, 지하수 원천에 대한 예측 정확도 90 %이상을 달성할 수 있었다. Nandi et al.(2016)은 주성분 분석과 로지스틱 회귀를 이용하여 홍수 위험 맵핑을 시도하였다. 흐름누적 값을 포함한 다양한 인자에 대한 다기준 분석을 실시하였으며, 홍수 사상에 대한 분류에 대한 검증을 수행하여 적합한 결과를 산정하였다.

본 연구에서 로지스틱 회귀는 독립변수인 1차원 도시유출해석 결과에 따른 종속변수인 침수 유무를 예측하기 위하여 사용되었다. 1차원 도시유출해석 결과는 70개의 관측 강우사상에 대한 SWMM 모의를 통하여 수집하였으며, 종속변수인 대상지역에 대한 침수 유무에 대한 자료는 1-2차원 연계해석 결과, 침수흔적도, 풍수해저감종합계획 보고서를 통해 수집을 하였다. p 는 침수가 발생할 확률을 나타내며, 예측된 p 값은 0부터 1사이의 값을 나타내게 된다. 강우조건 별 침수발생 확률 p 에 대한 오즈비(odds ratio)는 Eq. (12)과 같다.

$$odds\;ratio=\left(\frac p{1-p}\right)$$ (12)

로지스틱 회귀는 오즈비 또는 각 분류항목에 대한 확률의 자연로그 값은 입력되는 독립변수에 선형적 관계를 가지고 있음을 가정한다. 회귀의 매개변수는 최우도법 등을 통해 산정이 되며, 오즈비의 로그 값인 로짓(logit)함수는 0과 1사이에 구속 된 변수를 연속 된 무한의 변수로 변환시켜 준다. 로짓함수는 독립변수들의 선형 함수를 통해 정의 되며 Eq. (13)와 같다. 본 연구에서 제시되는 강우 조건에 따라 침수 발생 확률은 Eq. (14)를 통하여 산정할 수 있다(Gardner and Vogel, 2005). x 의 값으로서 강우 사상에 따른 총 월류량이 입력되게 된다.

$$logit(p)=log\left(\frac p{1-p}\right)=b_0+bx+\epsilon_i$$ (13)
$$p=\;\frac{e^{(b_0+bx)}}{1+e^{(b_0+bx)}}$$ (14)

여기서, p 는 로짓함수와 함께 산정되는 침수의 발생확률을 나타낸다. b 0 는 상수항을 나타내며, b x 는 기울기 벡터값과 독립변수를 나타낸다.

3. 연구 대상 지역과 모형의 검증

연구 대상지역으로서 삼성1, 삼성2 배수분구를 포함하는 서울시 삼성동 일대로 선정하였으며, Fig. 4에 배수분구 경계와 배수 관망과 맨홀이 나타나 있다. 나타난 배수관망과 맨홀 정보는 SWMM의 배수 관망 입력 자료로 사용되었다. 도시 지표에 내린 우수는 관망을 통해 최종적으로 탄천으로 우수가 배수되는 연결 구조로 구성되어있다. 연구 대상지역은 2001년, 2010년 9월 21일 그리고 2011년 7월 27일에 집중호우에 따른 극심한 침수피해가 발생한 사례가 있다. 상대적으로 저지대 이며, 복잡한 배수체계 그리고 관내 흐름 한도를 초과하는 우수유입을 통하여 내수침수가 발생된 것으로 보인다(Seoul Metropolitan City, 2015). 하수관거의 설계빈도를 초과하는 집중호우가 발생한다면, 두 구간에 대해서 내수침수가 발생될 것으로 보이며, 실제로 Fig. 4(a)와 같이 2010년 침수흔적도에 따르면 삼성역에서 선릉역 구간의 도로에 따라 내수침수가 발생한 것으로 나타난다.

Figure_KSCE_40_03_02_F4.jpg
Fig. 4.

Comparison of Floodmark and Simulation Result (Samseong Area)

SWMM 기반 1차원 도시유출해석 결과의 적절성을 판단하기 위하여, 맨홀 지점 별 월류량을 이용한 2차원 침수해석을 실시하고 이를 내수침수위험지구, 침수흔적도와 비교하고자 하였다. SWMM모형 결과의 적절성 검증을 위한 2차원 모형은 FLO-2D를 이용하였다. Fig. 4와 같이 2010년 침수흔적도와 2010년 9월 21일의 관측 강우 기반 2차원 홍수해석 결과를 비교하였을 때에, 선릉역 및 테헤란로 일대의 침수양상이 대부분 유사하게 나타났다. 침수흔적도 내에 발생한 격자 중, 침수가 발생한 격자의 비율은 75.82 %로 나타났다. 또한 삼성역에서 선릉역 까지의 전체 침수심에서 침수흔적도 내에 발생한 침수격자 개수의 비율은 67 %으로 나타났다. 침수흔적도가 0.3 m이상일 경우 작성하는 것과, Fig. 4(b)는 건물과 도로를 반영하여 지표흐름 해석 결과를 통한 침수심을 나타내는 것임을 고려하면 2차원 홍수해석 과정은 타당한 것으로 판단된다. ‘선릉과 정릉’의 일부 저지대 부분에 침수가 발생하는 것으로 모의가 되었는데, 해당 관리소(문화재청 궁능유적본부, Cultural Heritage Administration, 2020)에 문의 결과 2010, 2011년도에 실제로 침수가 발생한 지역임을 확인하였다.

4. LSTM 기반 총 월류량 예측

4.1 입력 자료 및 매개변수 검토

LSTM 모형을 구축할 때에 전국 주요 관측 강우 사상은 입력 자료, SWMM의 총 월류량 결과를 목표값 자료로서 사용하였다. 총 월류량 결과는 조사 된 전국단위 강우자료를 이용하여, 삼성 배수분구에 대한 1차원 도시유출 해석을 실시하여 수집하였다. 총 70개의 강우-총 월류량 세트 중 40개 사상은 훈련, 20개 사상은 검증, 10개 사상은 테스트 자료로서 사용되었다. 관측 강우 사상들과 SWMM의 총 월류량 모의 결과들은 Figs. 5 and 6과 같이 하나의 일련(Sequence) 자료 형태로 합성 되었다. LSTM의 과적합을 피하기 위하여 드롭아웃(Dropout)기능을 사용하였으며, 드롭아웃은 딥 러닝의 학습 시에 과적합 문제를 해결하기 위해 노드 중 일부를 제거하는 학습기법이다. 드롭아웃의 비율, 노드의 수, LSTM 층의 개수에 따라 예측 결과를 비교하고자 하였다. Table 2와 같이 매개변수에 따라 4개의 LSTM 모형을 구축하였다.

Figure_KSCE_40_03_02_F5.jpg
Fig. 5.

Sequence of Rainfall Data (Input for LSTM)

Figure_KSCE_40_03_02_F6.jpg
Fig. 6.

Sequence of Total Overflow Data (Target for LSTM)

Table 2. LSTM Model and Parameter

Parameter LSTM 1 LSTM 2 LSTM 3 LSTM 4
Loss Function Mean Squared Error
Optimizer Adam
Dropout 0.3 0.5 0.3 0.3
Number of Nodes 32 32 32 64
Number of LSTM Layers 3 3 5 3

4.2 모형의 구축 및 예측결과

Table 3에는 LSTM 모형의 훈련, 검증, 테스트 결과를 나타내었으며, 2011년 7월 27일 강우 사상에 대한 총 월류량 예측 결과를 SWMM 모의 결과와 비교하였다. 예측 대상의 강우 사상에 대한 총 월류량 모의결과와 예측결과는 Fig. 7에 나타내었다. 비교를 위한 오차 분석법은 평균제곱근편차(Root Mean Sqaure Error, RMSE)와 Nash-Sutcliffe 효율계수(Nash-Sutcliffe Efficiency Coefficient, NSEC)를 사용하였다. 전반적으로 LSTM2 모형의 학습, 검증, 테스트 결과의 평균제곱근편차가 낮고 높은 효율계수를 나타내고 있다. 그러나, 본 연구의 예측 대상인 2011년 7월 27일 사상에 대해서는 LSTM1 모형에서 가장 SWMM 모의 결과와 근접한 예측결과를 나타내었다. 반면 LSTM3 모형에서 SWMM 모의 결과와 가장 큰 차이를 나타내었으며, 학습 결과 또한 다른 모형보다 좋지않은 결과를 산출하였다.

Table 3. Result of LSTM Prediction

Results for LSTM 1 LSTM 2 LSTM 3 LSTM 4
Training RMSE 0.8982 0.8225 1.2018 0.8043
NSEC 0.9842 0.9867 0.9716 0.9873
Validation RMSE 1.4756 1.1656 1.6997 1.3709
NSEC 0.9744 0.9840 0.9659 0.9778
Testing RMSE 0.9285 0.8797 1.2996 0.9240
NSEC 0.9719 0.9748 0.9450 0.9722
Total Accumulated Overflow (2011/07/27 Rainfall Event) 144.7 ( m 3 / s , SWMM) 147.26 147.92 159.17 137.43

Figure_KSCE_40_03_02_F7.jpg
Fig. 7.

Comparison of LSTM Results

5. 침수 범위 예측

5.1 로지스틱 회귀의 학습

본 연구에서는 2011년 7월 27일에 대한 총 월류량에 대한 예측뿐만 아니라, 침수심 0, 0.2, 0.5 m 이상에 대한 침수범위를 각각 예측하였다. 예측을 위한 침수심 기준은 서울안전누리(Seoul Metropolitan Government, 2020)에서 제공되는 침수예상도의 범례를 참조하였다. 침수 범위 예측을 위하여 로지스틱회귀를 이용하였으며, 독립변수는 총 월류량, 종속변수는 격자 별 침수의 발생 유무로 선정하였다. 침수의 발생 유무 자료는 삼성 배수분구에 대한 2차원 홍수해석 모의 결과를 통하여 수집하였다. 이에 대한 정보는 예측 검증의 대상이 되는 2011년 7월 27일 강남 AWS 관측 강우사상을 제외한 69개의 실측 강우 사상의 2차원 모의 결과를 이용하였다. 총 월류량은 SWMM 모의를 통해 산정된 값을 사용하였다. 주어진 총 월류량에 대하여 특정 격자에 침수가 발생하면 1, 발생하지 않는다면 0으로 지정하였다. 침수가 발생하는 주요 침수 격자에 대해서 로지스틱회귀를 적용하였으며, MATLAB 기반 행렬연산을 통해 빠르게 침수범위를 산정할 수 있도록 하였다. 본 연구에서는 총 236651개의 격자에 대해 분석을 실시하였는데, 69개의 강우 사상에 대하여 30번의 침수가 발생한 66708번째 격자에 대한 회귀 결과는 Fig. 8과 같다. 대상지역에 대한 침수 범위를 예측하기 위해 모든 격자에 대해 동일한 방법으로 로지스틱회귀 곡선을 작성하였으며, 총 월류량이 각각 곡선에 입력되고 그 확률이 50 % (0.5)을 넘었을 때에 침수가 발생하는 것으로 판단하였다.

Figure_KSCE_40_03_02_F8.jpg
Fig. 8.

Application of Logistic Regression for Total Overflow-Inundation Data

5.2 예측결과 및 비교

2011년 7월 27일 강우에 대한 총 월류량 SWMM 모의 결과와 가장 근접하게 예측한 LSTM1의 결과를 로지스틱회귀에 입력하여 침수범위를 예측하고자 하였다. 침수심 0.0, 0.2, 0.5 m 이상에 대한 침수범위를 SWMM 결과를 이용한 2차원 해석결과의 침수범위와 비교하였다. 1-2차원 모의와 LSTM 모형과 로지스틱회귀의 연계를 통한 예측결과는 Fig. 9와 같다. 침수 범위 예측결과의 검증을 위해 모의 결과에 대한 침수면적적합도를 산정하였는데, 이를 위하여 Eq. (15)를 사용하였다. 여기서 G r i d S i m u l a t e d 는 홍수 해석모의를 통해 침수가 발생한 격자를 나타내며, G r i d P r e d i c t e d 는 예측된 침수 격자를 나타낸다. 모의 및 예측된 총 침수 격자의 수에서 공통적으로 침수가 발생되는 격자의 수 비율을 산정함으로써 침수면적적합도를 산정하였다. 침수심 0.0~0.2 m, 0.2~0.5 m, 0.5 m 이상에 대한 침수면적적합도는 각각 91.06 %, 82.39 %, 97.33 %으로 나타났다.

$$Area\;Fitness=\frac{(Grid_{Simulated}\cap{\mathrm{Grid}}_{Predicted})}{(Grid_{Simulated}\cup{\mathrm{Grid}}_{Predicted})}\times100(\%)$$ (15)
Figure_KSCE_40_03_02_F9.jpg
Fig. 9.

Comparison of Inundation Extent

6. 결 론

본 연구에서는 복잡한 배수체계를 가진 도시유역에 대하여, 총 월류량을 나타내는 유출 곡선과 침수 범위를 예측할 수 있는 기법을 제시하고자 하였다. 이를 위하여 LSTM 모형과 로지스틱회귀 모형을 이용하였으며, 강우 사상은 서울시를 포함한 전국단위의 강우사상을 적용하였다. 주어진 70개의 관측 강우 사상만으로도 LSTM은 충분한 학습을 수행하였으며, LSTM 매개변수에 따른 예측 결과를 비교할 수 있었다. 홍수 예측은 강남 AWS에서 2011년 7월 27일에 관측된 강우 사상에 대하여 실시되었으며, 1-2차원 홍수해석 결과와 비교하였다. 1차원, 2차원 결과에 대하여 모두 적합한 예측 결과를 나타냈다. 주요 연구 결과를 정리하면 다음과 같다.

(1)서울시를 포함한 전국 단위의 관측 강우를 사용함으로써, 단일 도시 배수분구에서 부족한 홍수 양상을 적용할 수 있었다. 비록 인접 지구 또는 다른 지역의 관측 강우를 차용하여 사용하는 것이지만, 기계학습 기반 홍수예측 모형을 위한 충분한 입력 자료를 구축하는데 유용한 것으로 판단된다. 학습 단계에 대해서는 주로 서울시 관측 강우를 사용하고, 검증 단계에서는 서울시 외 타지역에 대한 강우를 포함하였다. 적용된 LSTM 모형은 서울시 관측 강우에 대하여 학습하였기에 Table 3에서 상대적으로 검증 단계의 오차가 크게 나타나는 것으로 보인다.

(2)LSTM을 이용한 총 월류량 예측 결과는 SWMM을 통한 1차원 모의결과와 비교하였다. LSTM의 주요 매개변수에 따라 예측 결과를 비교하였는데, 드랍아웃 비율을 0.3, 노드의 수를 32개, LSTM 층의 수는 3개를 사용했을 때에 SWMM의 2011년 7월 27일(강남 AWS) 강우 사상에 대한 모의 결과와 근접하게 나타났다. 이를 통해 매개변수 변화에 따른 LSTM의 예측력을 파악할 수 있었으며, 도시 유역에 대한 유출 예측뿐만 아니라 추후 수문분야에 대한 LSTM의 적용 시 참고자료가 될 수 있을 것으로 보인다.

(3)대상 지역에 대한 2차원 격자의 총 월류량에 따른 침수 발생 양상을 파악한 후, 이를 격자 별로 로지스틱회귀에 학습하였다. LSTM에 의해 예측된 총 월류량을 기반으로 침수심 0.0~0.2 m, 0.2~0.5 m, 0.5 m 이상의 침수심에 대한 범람 범위를 예측하였다. 예측의 검증을 위해 침수면적적합도를 산정하였는데, 0.5 m이상의 침수 범위에 대해서 97.33 %의 침수면적적합도가 산정되었다. 수치해석 기반 홍수 모형의 경우 1차원 해석 시 14분, 2차원 침수해석 시 50분이 소요되었다. 제시된 방법론은 2차원 침수 범위 예측까지 3초 이내로 산정되어, 실시간으로 수재해 대응을 위한 유용한 방법론으로 판단된다. 본 연구는 침수심에 대한 범람 범위에 대한 제시뿐만 아니라 홍수위험도에 대한 실시간 산정을 위해 적용될 수 있을 것으로 보인다.

Acknowledgements

본 결과물은 환경부의 재원으로 한국환경산업기술원의 물관리연구사업의 지원을 받아 연구되었습니다(79609).

References

1 
Cultural Heritage Administration (2020). Flood history, Available at: http://royaltombs.cha.go.kr (Accessed: January 2, 2020).
2 
Gardner, K. K. and Vogel, R. M. (2005). "Predicting ground water nitrate concentration from land use." Ground Water, Vol. 43, No. 3, pp. 343-352.DOI
3 
Hu, C., Wu, Q., Li, H., Jian, S., Li, N. and Lou, Z. (2018). "Deep learning with a long short-term memory networks approach for rainfall-runoff simulation." Water, Vol. 10, No. 11, 1543.DOI
4 
Korea Meteorological Administration (KMA) (2020). Meteorological database, Observation Data, Available at: https://data. kma.go.kr (Accessed: December 1, 2019).
5 
Le, X. H., Ho, H. V., Lee, G. H. and Jung, S. H. (2019). "Application of long short-term memory (LSTM) neural network for flood forecasting." Water, Vol. 11, No. 7, 1387, DOI: 10.3390/w11071387.DOI
6 
Moore, M. R. (2011). Development of a high-resolution 1D/2D coupled flood simulation of Charles City, Iowa, Master's Thesis, University of Iowa, United States of America (USA).
7 
Mosavi, A., Ozturk, P. and Chaw K. K. (2018). "Flood prediction using machine learning models: Literature review." Water, Vol. 10, No. 11, 1536, DOI: 10.3390/w10111536.DOI
8 
Nandi, A., Mandal, A., Wilson, M. and Smith, D. (2016). "Flood hazard mapping in Jamaica using principal component analysis and logistic regression." Environment Earth Science, Vol. 75, No. 465, DOI: 10.1007/s12665-016-5323-0.DOI
9 
Ozdemir, A. (2011). "Using a binary logistic regression method and GIS for evaluating and mapping the groundwater spring potential in the Sultan Mountains (Aksehir, Turkey)." Journal of Hydrology, Vol. 405, No. 1-2, pp. 123-136.DOI
10 
Park, J. H., Kim, S. H. and Bae, D. H. (2019). "Evaluating appropriateness of the design methodology for urban sewer system." Journal of Korea Water Resource Association, KWRA, Vol. 52, No. 6, pp. 411-420.
11 
Pradhan, B. (2009). "Flood susceptible mapping and risk area delineation using logistic regression, GIS and remote sensing." Journal of Spatial Hydrology, Vol. 9, No. 2, pp. 1-18.
12 
Rai, P. K., Chahar, B. R. and Dhanya, C. T. (2017). "GIS-based SWMM model for simulating the catchment response to flood evetns." Hydrology Research, Vol. 48, No. 2, pp. 384-394.DOI
13 
Risi, R. D., Jalayer, F. and Paola, F. D. (2015). "Meso-scale hazard zoning of potentially flood prone areas." Journal of Hydrology, Vol. 527, pp. 316-325.DOI
14 
Seoul Metropolitan City (2015). Comprehensive plan for storm and flood damage reduction, Korea, Vol. 1, Chapter 3, pp. 374-375.
15 
Seoul Metropolitan Government (2020). Flood criterion data, Available at: http://safecity.seoul.go.kr (Accessed: January 5, 2020)
16 
Shen, C. (2018). "A transdisciplinary review of deep learning research and its relevance for water resources scientists." Water Resources Research, Vol. 54, No. 11, pp. 8558-8593, DOI: 10.1029/2018WR022643.DOI
17 
Son, A. L., Kim, B. H. and Han, K. Y. (2015). "A study on prediction of inundation area considering road network in urban area." Journal of the Korean Society of Civil Engineers, KSCE, Vol. 35, No. 2, pp. 307-318.DOI