최정현
(Jeonghyeon Choi)
1iD
장수형
(Suhyung Jang)
2iD
김상단
(Sangdan Kim)
33,†iD
-
부경대학교 지구환경시스템과학부 (환경공학전공)
(Division of Earth Environmental System Science (Major of Environmental Engineering),
Pukyong National University)
-
K-water 연구원 통합물관리연구소
(Integrated Water Resources Management Center, K-water Research Institute)
-
부경대학교 환경공학과
(Department of Environmental Engineering, Pukyong National University)
© Korean Society on Water Environment. All rights reserved.
Key words
Semi-distributed hydrological model, Markov-Chain Monte Carlo technique, Metropolis-Hastings algorithm, Parameter calibration, Parameter uncertainty
1. Introduction
이수, 치수, 환경, 생태 등 다양한 측면에서의 유역관리를 위해 수문모형들이 적용되고 있다. 지난 수십 년간 컴퓨터 성능의 발달과 함께 자연현상을
모의하기 위한 모델링 기술은 괄목할만한 성장을 이루어 왔다. 자연현상의 프로세스에 대한 통찰력이 깊어짐에 따라 개발되는 모형들도 점점 복잡한 구조를
가지게 되었다. 즉, 더 다양한 수문 프로세스들을 표현하기 위하여 소요되는 매개변수들의 수가 증가하게 되었으며, 선형적으로 표현되던 상태변수들 사이의
관계가 복잡한 비선형적인 관계로 대체되었다(Jia et al., 2018). 모형이 정교해지고 복잡해질수록 더 많은 양의 관측정보와 사용자의 전문적인 지식, 숙련도가 요구되며, 그 결과 모형의 불확실성은 증가하게 되었다(Hensen and Lamberts, 2012).
복잡한 모형의 경우, 매개변수 값을 관측된 물리적인 정보로부터 직접적으로 추정하는 것은 현실적으로 불가능하며, 주어진 정보를 이용하여 매개변수 값들을
보정하는 것이 필수적이다(Kim et al., 2008). 모형 보정방법은 크게 시행착오법(trial and error), 결정론적 접근법(deterministic approach), 확률론적 접근법(stochastic
approach)으로 구분될 수 있다. 시행착오법은 보정과정에서 별도의 전문적인 지식이 상대적으로 덜 요구되는 반면, 사용자의 주관적인 판단에 매우
의존적이며 객관적인 설명이나 논리가 부족하게 되어 보정결과에 대한 신뢰성을 감소시키는 원인이 된다. 이러한 단점으로 인해 최적화 도구와 같은 수학적인
기법을 이용하여 목적함수를 기반으로 모형의 예측 값과 관측 값 사이의 차이를 최소화하는 매개변수를 추정하는 방법(즉, 결정론적 접근법)이 사용되어
왔다. 이 접근법은 목적함수를 최소화하는 하나의 매개변수 조합을 추정한다. 그러나 매개변수의 수가 증가함에 따라 equi-finality 문제(유사한
적합도를 산출하는 복수의 최적 매개변수 조합)를 발생시킬 가능성이 있다(Jia et al., 2018; Liang et al., 2016). 즉, 매개변수 보정을 수행할 경우, 동일한 유역을 대상으로 구성된 모형에서 보정기간이 다를 경우 서로 다른 최적 매개변수 조합이 나타날 가능성이
있으며, 동일한 기간에서도 복수의 최적 매개변수 조합이 유사한 모형결과를 나타낼 수 있다(Jia et al., 2018). 모형은 유역의 수문특성을 설명하는 매개변수들의 경험적인 조합으로 볼 수 있기에, 특정 매개변수 값이 절대적일 수 없다(Kuczera and Parent, 1998). 즉, 매개변수를 확률변수로 간주하여 수문모형이 가지는 불확실성을 살펴볼 필요가 있게 된다.
확률론적 접근법은 매개변수의 확률적 특성(불확실성)을 설명할 수 있는 방법이다. 일반적으로 모형이 나타내는 불확실성의 원인은 (1) 입력 기상자료
또는 보정에 사용되는 유량관측자료가 가지는 오차, (2) 모형구조의 비합리성에 기인된 오차, (3) 모형 매개변수의 오차로 구분될 수 있다(Refsgaard and Storm, 1996). 입력 및 관측자료가 가지는 오차는 매개변수 보정 및 모의결과에 영향을 미치며, 모형 구조의 비합리성 또한 모의결과에 절대적인 영향을 미치는 것으로
알려져 있다(Carpenter and Georgakakos, 2004; Chowdhury and Sharma, 2007; Engeland et al., 2005; Georgakakos et al., 2004; Kavetski et al., 2006a, 2006b; Marshall et al., 2007). 그러나 모형 매개변수 보정을 통해 매개변수 이 외의 요소로부터 발생하는 불확실성을 감소시킬 수 있는 점을 감안한다면, 실제로 모형의 복합적인
불확실성이 모형의 매개변수에 집중될 수 있다고 가정할 수 있다. 이러한 가정 하에 모형 매개변수에 집약된 불확실성은 매개변수의 확률분포를 통해 설명될
수 있으며, 또한 모의결과에 명시적으로 반영시킬 수 있다(Camacho et al., 2015; Schoups and Vrugt, 2010; Todini, 2007).
확률론적 접근법의 대표적인 방법은 베이즈 정리(Bayes’ theorem; Bayes, 1763)를 기반으로 한 베이지안 접근법으로, 컴퓨터 성능의 향상과 함께 20세기 후반 MCMC(Markov-Chain Monte Carlo) 기법 등 다양한
알고리즘이 개발됨에 따라 인문, 과학, 공학 등 폭넓은 분야에서 실용적 사용이 가능하게 되었다(Bishop, 2006). 베이지안 접근법은 모형 매개변수 보정과 불확실성 분석을 수행하기 위한 일반적인 프레임워크를 제공한다(Camacho et al., 2015). 최근 모형의 불확실성 분석에 대한 관심이 증가하면서 다양한 수문모형에 베이지안 접근법을 적용하여 모형의 불확실성을 분석하는 연구가 활발히 이루어지고
있다.
국외에서는 수문모형에서 모의되는 유량과 같은 모의 결과의 적합도 뿐만 아니라 불확실성을 조사하고 모형의 신뢰도를 평가하는 많은 연구가 활발히 수행되어
왔다. Sun et al. (2012)에서는 Storm Water Management Model (SWMM)에 베이지안 접근법 중 하나인 Generalized Likelihood Uncertainty
Estimation (GLUE) 방법론을 사용하여 모의유역의 규모에 따른 모델의 수문 매개변수 및 모형 결과의 불확실성을 비교 평가하였다. 또한,
Zhang et al. (2015)은 SWMM에 GLUE를 이용하여 소규모 도시유역에 대해 다양한 오염물질에 대한 수질 모의 시 발생하는 불확실성을 분석하여 모형의 신뢰도를 평가한바
있다. Li et al. (2010)과 Joseph and Guillaume (2013)에서는 Soil and Water Assessment Tool (SWAT)에 MCMC 기법을 적용하여 매개변수의 불확실성을 조사하였으며 모형의 신뢰도를
평가하는 방안을 제시하였다. Knighton et al. (2016) 또한 SWMM에 대해 베이지안 접근법을 적용하여 모형의 불확실성을 조사하였으며 모의결과의 적합도와 불확실성 분석의 중요성을 언급하였다. 이 밖에도
베이지안 접근법을 기반으로 Environmental Fluid Dynamics Code (EFDC), Root Zone Water Quality Model
(RZWQM2) 등 다양한 수문, 수리 및 수질모형에 대해 매개변수 및 모형의 불확실성을 조사하고 모형의 신뢰도를 분석한 연구가 수행된 바 있다(Abdi et al., 2020; Ahmadisharaf et al., 2019; Han and Zheng, 2016; Liu et al., 2017; Sun et al., 2015; Zhang and Li, 2015).
국내에서는 수위-유량 관계곡선(Lim et al., 2019), NWS-PC 강우-유출 모형(Kwon et al., 2012; Kwon et al., 2008), HEC-1 단일강우사상 모형(Kwon et al., 2013), 장기간 연속유출모의 Tank 모형(Kim et al., 2020)과 같이 비교적 단순한 모형에 대해 매개변수를 추정하고 불확실성을 정량화하기 위해 베이지안 접근법이 적용된바 있다. 또한 SWAT의 매개변수를 보정하고
모형의 불확실성을 정량화된 수치(-factor 및 -factor)로 제공하는 SWAT-Calibration and Uncertainty Program(SWAT-CUP)이 개발됨에 따라, 이를 국내외
유역에 적용하여 SWAT 모형으로부터 모의 된 유량 결과에 대한 적합도와 불확실성을 살펴본 연구가 수행되었다(Choi, 2013; Joh et al., 2012; Kim et al., 2013; Kim, 2017; Lee and Seo, 2011). 정리하자면, 국내 연구들은 기 개발된 상대적으로 간단한 모형에 대해 불확실성 분석을 수행하거나, SWAT-CUP를 국내에 소개하고 이를 국내
유역에 적용하여 유량 모의결과의 불확실성 수치를 분석하는 것에 중점을 두고 있다.
Choi et al. (2020)은 토양수분을 중심으로 유역 수문성분의 변화를 모의하는 격자기반의 준 분포형 수문모형(Semi- distributed Soil moisture-Based
Hydrological Model, S-SBHM)을 개발하였으며, 결정론적 접근법 중 하나인 pattern search 기법을 이용하여 모형 매개변수의
추정이 수행되었다. 그러나 앞서 언급한 바와 같이, 모형의 신뢰성을 판단하기 위해서는 매개변수와 모형의 불확실성을 살펴보는 것이 필요하다. 따라서
본 연구는 Choi et al. (2020)의 후속연구로서, MCMC 기법을 S-SBHM과 결합하여 합천댐 유역에 적용함으로써 유량 모의결과의 적합도 및 불확실성과 함께 모형 매개변수의 불확실성을
살펴보고, 이를 통해 준 분포형 모형을 적용하는 타당성을 확인하는 것이 주요 목적이다. 또한 S-SBHM과 유사한 수문 프로세스 및 매개변수로 이루어진
집체형 모형을 구성하여 성능 및 불확실성을 비교분석함으로써 준 분포형 모형의 적용성을 상대적으로 평가하고자 하였다.
2. Materials and Methods
2.1 준 분포형 수문모형
Choi et al. (2020)에서 제안된 S-SBHM은 수문 모델링에 널리 사용되는 미환경보존청(United States Environmental Protection Agency,
USEPA)의 SWMM과 미농무부(United States Department of Agriculture, USDS) 농업연구국(Agricultural
Research Service, ARS)의 SWAT을 참고하여 개발되었으며, 각 격자는 수조모형(Tank model) 개념으로 표면층, 토양층, 대수층으로
구성된다(Fig. 1 참조). 모형 구성을 위한 입력자료는 수치표고자료(Digital Elevation Model, DEM), 토양도 및 토지피복도로부터 산출된 유역의
GIS 자료로부터 추출된 격자별 유출곡선지수(Curve Number, CN), 불투수면적율, 포화투수계수 등이며, 일-단위 유역평균 강우 및 잠재증발산량
자료를 이용하여 일-단위의 유량, 증발산량, 토양수분 등 다양한 수문요소를 모의할 수 있다. 해당 모형의 자세한 구성 및 추가적인 정보는 Choi et al. (2020)을 참고할 수 있다.
Fig. 1. Schematic diagram of semi-distributed hydrological model (S-SBHM) (Choi et al., 2020).
S-SBHM은 총 7개의 매개변수를 가진다(Table 1 참조). Choi et al. (2020)에서는 수문모형의 실무적인 적용성 확대에 초점을 맞추어 사용자가 직접 값을 입력해야하는 매개변수를 줄이고 입력자료를 최대한 이용하여 유역의 특성이
반영되도록 하였기에, 7개의 매개변수 중 4개의 매개변수(, , , )는 문헌을 참고하여 상수로 입력하거나, 입력된 격자자료를 보정 없이 그대로 적용하였다. 따라서 해당 연구에서 보정대상으로 선택된 매개변수는 토양층에서의
증발산과 관련된 토양수분의 최적점(Optimum point, ), 토양수분의 침루량을 계산하기 위한 침루형상계수(), 지하수위에 따른 지하수 유출과 관련된 감쇠상수()이다. 그러나 본 연구에서는 모든 가용한 매개변수가 가지는 확률적 특성(불확실성)을 확인하고자, Table 1에 제시된 7개의 매개변수를 모두 보정대상 매개변수로 설정하여 보정을 수행하였다. 단, 격자별 및 는 입력된 값을 기반으로 아래 식들과 같이 조정계수(, )를 적용하여 유역 전체에 대해 동일한 비율로 보정되도록 적용하였다.
Table 1. Parameters of hydrological model(Choi et al., 2020)
Layers
|
Choi et al.(2020) |
in this study
|
description
|
Parameters
|
Classify
|
Parameters
|
Classify
|
Surface layer
|
|
input
|
|
calibration
|
Depth of depression storage on pervious area (mm)
|
|
input
|
|
calibration
|
Depth of depression storage on impervious area (mm)
|
Soil layer
|
|
input
|
|
calibration
|
Curve Number
|
|
calibration
|
|
calibration
|
Optimum point of soil moisture
|
|
calibration
|
|
calibration
|
Shape exponent of percolate
|
|
input
|
|
calibration
|
Saturation permeability coefficient (mm/day)
|
Aquifer layer
|
|
calibration
|
|
calibration
|
Baseflow recession constant (day)
|
2.2 집체형 수문모형
본 연구에서 사용된 S-SBHM을 상대적으로 비교하기 위해 S-SBHM 모형과 동일한 수문거동을 모의하는 집체형 모형(lumped Soil moisture-Based
Hydrological Model, L-SBHM)을 별도로 구성하였다(Fig. 2 참고). 즉, 표면층, 토양층, 대수층으로 동일하게 구분하여 모형 내부의 수문기작은 동일하나, 유역 전체를 하나의 격자로 취급하여 수문거동을 모의하도록
모형을 구성하였다. 따라서 단일 격자는 합천댐 유역의 평균적인 특성을 가지며, GIS 기반의 입력되는 격자자료를 대신하여 유역 평균값들이 입력되었다.
이외에 강우 및 잠재증발산량 등의 입력자료는 동일하게 적용되며, 보정대상 매개변수 또한 S-SBHM과 마찬가지로 총 7개로 구성된다(Table 1 참고).
Fig. 2. Schematic diagram of lumped hydrological model (L-SBHM).
2.3 Markov-Chain Monte Carlo 기법
베이지안 접근법을 이용한 보정방법은 미래에 어떤 사건이 발생할 확률은 과거 같은 사건이 발생한 확률에 기초하여 산출할 수 있다는 것을 이론화한 베이즈
정리를 기반으로 한다. 이러한 가정을 활용하면, 관측자료()로부터 매개변수()의 사후분포(posterior distribution, )를 추정할 수 있으며(Bayes, 1763), 이를 수식으로 표현하면 아래와 같다.
여기서, 는 매개변수의 사전분포(prior distribution)이며, 는 우도함수(likelihood function), 는 정규화상수(normalization constant)이다.
사전분포를 결합 확률분포의 형태로 표현한 후, 관측자료가 주어지면 베이즈 정리를 이용하여 매개변수의 사후분포를 구할 수 있다. 우도는 특정 매개변수
값이 주어졌을 때, 관측자료가 나타날 확률로, 이 값은 모형으로부터 생산된 결과와 관측자료 사이의 오차 확률분포를 통해 결정된다. 베이지안 접근법은
매개변수의 사전 정보를 확률분포로 표현하고, 관측자료를 이용하여 사전 정보를 역으로 추정(inverse estimation)하는 확률론적 보정기법으로,
베이지안 접근법을 활용한 보정의 장점은 모형의 불확실한 입력변수의 사후분포를 예측하기 위해 관측자료와 사전 지식을 통합하는 능력에 있다(Swiler, 2006).
베이지안 접근법 중 하나인 Markov-Chain Monte Carlo (MCMC) 기법은 매개변수의 사후분포에서 매개변수 표본을 추출하는 방법이다.
여기서 Markov-Chain은 연속으로 이어지는 일련의 값이 주어질 때, 현재의 값은 바로 직전의 값으로부터만 영향을 받는 것을 의미하며, Monte
Carlo는 무작위 표본추출을 통해 표본을 얻는 방법을 의미한다(Makowski et al., 2002). 따라서 이를 결합한 MCMC 기법은 현재의 표본을 참고하여 다음 표본을 추출하는 방법을 말한다. 추출된 표본은 정해진 규칙에 따라 채택 또는
거절되며, 채택된 표본은 다음 단계의 표본을 추출하는데 사용된다. 이러한 과정의 반복을 통해 수렴된 매개변수의 사후분포를 획득할 수 있다.
MCMC 기법의 대표적인 표본추출 방법으로 Metropolis- Hastings (MH) 알고리즘(Hasting, 1970)이 있다. Markov-Chain을 , , …, 이라고 할 때, 이전의 상태 에 대한 다음의 상태 는 제안분포 로부터 추출한 변수 로 정의한다면, 여기서 확률 은 아래와 같은 조건을 통해 진화과정을 결정하게 된다.
여기서, 와 은 각각의 매개변수 와 에서의 우도이며, 아래와 같이 정의된다.
여기서 는 관측유량, 는 매개변수 조합 을 이용하여 모의된 유량, 은 관측유량 자료의 수, 은 관측유량 자료의 분산이다. 는 관측 또는 모의 유량자료에 대해 Box-Cox 변환을 하였음을 의미한다(Box and Cox, 1964; Kuczera, 1983). 표본 추출 시 매개변수의 사후분포가 고 유량에 적합하도록 편향되는 것을 방지하기 위해 유량자료에 Box-Cox 변환을 취하였다. 참고로 본 연구에서는
Box-Cox의 변환계수 는 0.5가 적용되었다.
MH 알고리즘을 적용하여 매개변수 조합의 개 시퀀스 , 을 생성한 절차를 간략하게 나타내면 다음과 같다.
(1)초기 을 설정한다. 본 연구에서는 매개변수의 하한과 상한의 중간 값으로 설정하였다.
(2)제안분포 로부터 후보 매개변수 을 추출한다. 제안분포의 경우 본 연구에서는 평균 , 분산 을 가지는 끝이 매개변수의 상한과 하한에 의해 잘려진
정규분포가 적용되었다.
(3)균등분포로부터 0에서 1 사이의 균등 난수 을 추출하고 을 만족하면, 가 되며, 그렇지 못할 경우 로 유지한다.
초기 회 반복을 통해 구성된 Markov-Chain은 매개변수의 사후분포에서 무작위로 추출된 매개변수를 갖는 체인으로 수렴된다. 따라서 위의 과정을 충분히( 회) 반복 후 초기 회의 반복을 통해 추출된 매개변수는 제거해야 한다.
MH 알고리즘을 적용하기 위해서는 초기 매개변수 , 제안분포 , 초기 반복 추출 횟수 , 총 반복 추출 횟수 을 결정해야한다. 초기 매개변수의 선택은 일반적으로 결과에 민감하지 않은 반면, 제안분포의 선택은 중요한 사안이다. 제안분포는 일반적으로 평균 과 일정한 공분산 행렬 인 정규분포가 사용된다(즉, ~ ). Campbell et al. (1999)와 Harmon and Challenor (1997)에 따르면, 앞서 언급한 절차 중 (3)단계에서 수행되는 을 만족하는 비율(즉, 채택률)이 20 ~ 70 %가 되도록 을 선택하는 것을 추천하고 있으며, 본 연구에서도 이를 적용하였다. 또한 버려질 반복 횟수 은 의 20 % 이상을 적용하면 충분한 것으로 알려져 있으며(Raftery and Lewis, 1995), 체인이 진행되는 경과를 추적하여 매개변수 사후분포의 평균값들이 수렴되기에 충분할 만큼 반복 횟수 을 확보하여야 한다(Kim et al., 2020).
본 연구에서 수문모형 매개변수의 사전분포는 균등분포로 가정하였다. 균등분포의 하한과 상한은 각 매개변수가 취할 수 있는 물리적인 범위를 고려하여 설정하였다.
즉, 표면층의 불투수면적 및 투수면적에 대한 지면저류고(각각 , )는 0 ~ 20 ㎜, 는 0.1 ~ 0.9, 는 1 ~ 10, 는 0 ~ 1, 은 -1 ~ 1, 는 0.7 ~ 1.3으로 각각 설정하였다. 합천댐 유역을 대상으로 반복적인 수치실험을 통해 MH 알고리즘의 초기 반복횟수 은 2,500회로 설정하였으며, 이후 체인의 반복횟수 는 10,500회로 고정하였다.
최종적으로 획득된 매개변수 사후분포의 평균 또는 중앙값을 보정된 매개변수 추정치로 사용할 수 있다(Camacho et al., 2015). 생성된 표본으로부터 매개변수의 분산을 계산하는 것도 가능하며, 모형으로부터 예측된 값의 확률분포를 계산하는 것에도 사용될 수 있다.
2.4 수문모형 구축 및 적용
합천댐 유역의 유역면적은 925.0 ㎢, 연 평균 강수량은 1,244.8 ㎜, 연 평균 유입량은 615.7 ㎜이다. 합천댐 유역의 모형 구축을 위해
GIS 자료를 입력자료로 변환하는 사전 처리과정이 수행되었다. 참고로, DEM은 국토지리정보원의 국토정보플랫폼(NGII, 2014), 토양도는 농촌진흥청의 흙토람(KRDA, 2010)에서 제공되는 자료가 사용되었으며, 토지피복도는 환경부의 환경공간정보시스템(ME, 2007)에서 제공되는 자료로 2007년 중분류 토지피복도가 사용되었다. ArcGIS 프로그램을 이용하여 토지피복도와 토양도의 결합을 통해 90 m 간격의
격자별 평균 값을 추출하였다. 토지피복도로부터 격자별 평균 불투수율을 추출하였으며, 토양도로부터 NRCS 수문학적 토양그룹에 따른 격자별 평균 포화투수계수 또한
추출하였다.
집체형의 경우 GIS 자료로부터 유역평균 값을 산정하였으며, 따라서 입력된 값은 59.45, 는 191.81 ㎜/h, 불투수면적율은 6.29 %가 적용되었다. 두 모형에 입력되는 일-단위 유역 평균 강우 및 잠재증발산량은 합천댐 유역에 근접한
기상관측소에서 관측된 기상정보로부터 획득되었으며, 일-단위 유량자료는 합천댐 유역 말단에 위치한 댐에서 관측된 댐 유입량 자료를 사용하였다. Fig.
3에 합천댐 유역 및 기상관측소, 댐의 위치와 함께 GIS로부터 생성된 격자자료를 제시하였다.
Fig. 3. Location information and gridded input data based on GIS data at Hapcheon watershed.
3. Results and Discussion
3.1 매개변수 추정 및 수문모형 결과 분석
합천댐 유역을 대상으로 2010년부터 2019년까지 일-단위 유역 공간평균 강우자료와 잠재증발산량 자료를 입력하여 MH 알고리즘을 이용한 수문모형의
매개변수 추정결과는 Table 2와 같다. 추정된 매개변수별 사전분포 및 사후분포는 Fig. 4에 나타내었으며, 최적 매개변수로 모의된 일-단위 및 월-단위 유량을 Fig. 5에 도시하였다. Table 2에서 각 매개변수별 Mean은 최종 추정된 매개변수 값을 의미한다. S-SBHM에서 모의된 일-단위 유량에 대한 결정계수(R2) 0.77, 모형효율계수(NSE; Nash and Sutcliffe, 1970) 0.77, KGE (Gupta et al., 2009) 0.82를 나타내었다. 월-단위 유량에 대해서는 각각의 지수가 0.96, 0.94, 0.88로 매우 높은 정확도를 나타내는 것으로 확인되었다.
일반적으로 R2가 0.5, NSE가 0.4, KGE가 0.6 이상이면 모델의 결과가 관측자료를 우수하게 재현하고 있는 것으로 판단한다(Chung et al., 1999; Green et al., 2006; Patil and Stieglitz, 2015).
Table 2. Mean and standard deviation (std) of parameter posterior distribution obtained by Metropolis-Hastings algorithm
Parameter ID
|
Parameter
|
S-SBHM
|
L-SBHM
|
mean
|
std
|
mean
|
std
|
1
|
|
1.9673
|
2.4267
|
0.0881
|
0.2040
|
2
|
|
0.6802
|
0.9524
|
0.0378
|
0.1005
|
3
|
|
0.0226
|
0.0321
|
0.0309
|
0.0201
|
4
|
|
0.4225
|
0.1003
|
0.4635
|
0.0535
|
5
|
|
3.5184
|
0.2647
|
3.9395
|
0.2813
|
6
|
|
1.2200
|
0.0970
|
1.0678
|
0.0419
|
7
|
|
0.9781
|
0.0181
|
0.9785
|
0.0148
|
day
|
R2 |
0.7703
|
0.7759
|
NSE
|
0.7698
|
0.7695
|
KGE
|
0.8171
|
0.8410
|
month
|
R2 |
0.9551
|
0.9535
|
NSE
|
0.9389
|
0.9142
|
KGE
|
0.8822
|
0.8116
|
p-factor (%)
|
19.1436
|
15.3348
|
r-factor
|
0.0769
|
0.0697
|
Fig. 4. Prior and posterior distribution of each parameter in S-SBHM and L-SBHM.
Fig. 5. Calibration of S-SBHM and L-SBHM.
집체형 모형인 L-SBHM의 정확도와 비교하였을 때, 일-단위 유량의 경우 NSE는 S-SBHM이, 그 외 지표는 L-SBHM이 더 높았다. 그러나
두 모형 사이의 정확도에 대한 차이는 크지 않았으며, 두 모형 모두 유역의 유량을 모의하는데 유사한 정확도를 보인다고 말하는 것이 더 타당할 것이다.
월-단위의 유량은 두 모형 모두 매우 높은 정확도를 나타내지만, L-SBHM의 R2, NSE, KGE가 각각 0.95, 0.91, 0.81로 모든 지표에서 S-SBHM이 L-SBHM보다 높은 정확도를 나타내고 있음을 발견할 수 있다(Table
2 참고).
3.2 불확실성 분석 및 비교
서론에 언급된 바와 같이 모형 매개변수의 불확실성은 관측치의 오류와 모형 구조에 내포된 오차가 반영되어 나타나기에, 각각의 매개변수가 가지는 불확실성을
살펴볼 필요가 있다(Teweldebrhan et al., 2018). Table 2의 매개변수별 평균(mean)과 표준편차(std)를 통해 매개변수에 내포된 불확실성을 살펴볼 수 있다. S-SBHM의 매개변수들 중에서는 , , , 순으로 변동계수가 큰 것을 알 수 있으며, 이는 토양수분의 증발산과 지표면유출 계산에 대한 불확실성이 상대적으로 크다는 것을 의미한다. 이러한 결과는
입력자료와 모형구조의 불확실성으로부터 기인되었을 가능성이 있다. 특히, 강우와 잠재증발산 자료를 유역평균자료로 입력하였기에 이에 따른 공간적인 오차로부터
발생되는 불확실성이 매개변수의 불확실성에 함께 포함되어 나타난 것으로 판단된다. 산악지형으로 이루어진 합천댐 유역에서 증발산은 고도와 사면, 식생의
분포 등 다양한 조건에 따라 매우 큰 공간적인 변동성을 나타내지만 입력자료와 모형구조에서 이를 반영하지 못하기에, 유역의 증발산에 가장 큰 비중을
가지는 토양수분의 증발산과 관련된 매개변수가 큰 불확실성을 가지는 것으로 추측할 수 있다. 또한, 지표면유출은 강우에 즉각적으로 반응하여 발생됨으로
강우자료가 가지는 불확실성이 이와 관련된 매개변수들에 대한 불확실성에 반영되어 나타난 것으로 판단된다. 반면 보정자료로 사용되는 유역의 유량자료의
경우 유역출구에서 관측되는 것으로 공간적인 변동성을 나타내지 않기에 상대적으로 지하수유출 계산과 관련된 매개변수의 불확실성은 상대적으로 작게 나타난
것으로 판단된다.
L-SBHM과 비교할 경우, 을 제외하고 S-SBHM의 모든 매개변수의 표준편차가 상대적으로 크게 나타났다. 이는 입력된 유역특성자료의 공간적인 변동성으로부터 기인되는 것으로
설명할 수 있다. 격자로 구성된 다양한 지형 정보가 입력되는 S-SBHM의 경우에는 격자들 사이의 공간적인 변동성이 매개변수의 불확실성에 포함되어
나타나기 때문이다. 또한 모형구조상 입력자료의 및 와 같은 격자 정보는 또는 을 통해 보정된다 하더라도 유역 전체에 대해 일정 비율로 조정되기에 격자별로 발생되는 입력자료의 오차를 보정하는 것에는 한계가 있게 된다. 반대로
집체형 모형의 경우 단일한 격자로 평균값이 적용되어 공간적인 변동성이 배제되기 때문에 매개변수의 불확실성이 상대적으로 낮게 나타나게 된다.
Fig. 6은 S-SBHM과 L-SBHM으로부터 추정된 2010년에 대한 유량 모의결과의 95 % 신뢰구간을 보여주고 있다. Fig. 6에서 음영으로 표시된
95 PPU는 MH 알고리즘으로부터 모의 발생된 매개변수를 이용하여 계산된 유량의 95 %가 속하는 구간을 의미한다. 모의된 유량의 신뢰도, 즉 결과의
불확실성을 정량적으로 살펴보기 위해 S-SBHM의 p-factor와 r-factor를 산정하였다(Table 2 참조). p-factor가 100 %에 가까울수록, r-factor는 0에 가까울수록 모형 결과의 신뢰도가 높다(Joh et al., 2012; Ryu et al., 2012). 두 모형의 p-factor를 비교하였을 때, S-SBHM이 19.14 %, L-SBHM이 15.33 %로 S-SBHM의 매개변수 추정치가 높은
신뢰도를 나타내는 것으로 나타났다. 즉, 분포형 모형으로 모의된 95 PPU안에 관측유량이 상대적으로 많이 포함되는 것으로 확인되었다. 그러나 관측유량이
표준편차에 대한 95 PPU의 평균적인 폭을 의미하는 r-factor의 관점에서 보면 다른 결과를 나타낸다(Table 2 참고). S-SBHM의 r-factor는 0.0769이며 L-SBHM은 0.0697로 나타났다. 낮은 값일수록 높은 신뢰도를 나타내는 r-factor는
S-SBHM으로부터 모의된 유량이 상대적으로 낮은 신뢰도를 나타내는 것으로 나타났다. 다만 두 모형간의 f-factor와 r-factor는 각각 3.81
%, 0.0072의 차이만을 나타내기에 두 모형이 가지는 결과의 신뢰성에 유의한 차이를 나타낸다하기엔 무리가 있다.
Fig. 6. Uncertainty of simulated daily inflow (2010.01 – 2010.12).
3.3 모형결과의 안정성
Table 3은 모의된 일-단위 유량에 대해 월별로 구분하여 재현성을 확인한 것이다. 두 모형 사이에 차이는 크게 나타나지는 않지만, S-SBHM이 8월을 제외한
대부분 월에 대해 상대적으로 더 좋은 성능을 나타내고 있다. 일-단위 유량에 대해 산출한 월별 R2, NSE, KGE의 평균(mean), 최솟값(min) 및 표준편차(std)는 S-SBHM이 상대적으로 더 큰 평균값과 최솟값을 가지며 더 작은 표준편차를
나타내는 것을 확인 할 수 있다. 이는 준 분포형 모형이 집체형 모형보다 안정적인 유량모의 성능을 나타내는 것으로 해석할 수 있다.
Table 3. R2, NSE and KGE derived from simulated daily inflow data for month of S-SBHM and L-SBHM
results
|
R2 |
NSE
|
KGE
|
model
|
S-SBHM
|
L-SBHM
|
S-SBHM
|
L-SBHM
|
S-SBHM
|
L-SBHM
|
values for month
|
1
|
0.4582
|
0.4558
|
0.2231
|
0.1963
|
0.5750
|
0.5987
|
2
|
0.3787
|
0.3734
|
-0.0689
|
-0.1392
|
0.4648
|
0.4428
|
3
|
0.3691
|
0.3527
|
0.0368
|
0.0003
|
0.5165
|
0.5090
|
4
|
0.4355
|
0.4361
|
0.2443
|
0.2635
|
0.5331
|
0.5178
|
5
|
0.5888
|
0.5802
|
0.5756
|
0.5680
|
0.6731
|
0.6418
|
6
|
0.8444
|
0.8550
|
0.8436
|
0.8539
|
0.9029
|
0.8415
|
7
|
0.8151
|
0.8270
|
0.8079
|
0.7982
|
0.8235
|
0.7725
|
8
|
0.7718
|
0.7739
|
0.7593
|
0.7695
|
0.7322
|
0.7698
|
9
|
0.7999
|
0.8051
|
0.7908
|
0.7906
|
0.7235
|
0.7171
|
10
|
0.5800
|
0.5722
|
0.5707
|
0.5627
|
0.5505
|
0.5727
|
11
|
0.4030
|
0.3816
|
-0.3588
|
-0.5515
|
0.3693
|
0.2998
|
12
|
0.5373
|
0.5291
|
0.3473
|
0.1736
|
0.6840
|
0.5771
|
mean
|
0.5818
|
0.5785
|
0.3976
|
0.3571
|
0.6290
|
0.6050
|
min
|
0.3691
|
0.3527
|
-0.3588
|
-0.5515
|
0.3693
|
0.2998
|
max
|
0.8444
|
0.8550
|
0.8436
|
0.8539
|
0.9029
|
0.8415
|
std
|
0.1820
|
0.1901
|
0.3920
|
0.4425
|
0.1545
|
0.1547
|
우리나라는 건기와 우기 뚜렷하게 구분되어 유량의 계절적인 변동성이 매우 큰 지역이다. 유역의 물순환 건강성을 파악하고 유역의 건기와 우기에 대한 물순환
요소의 정보를 획득할 필요가 있는 경우에는 이러한 계절성을 보다 잘 반영할 수 있는 수문 모형이 필요할 것이다. 반면, 홍수예측 및 관리를 위한 용도로
수문모형을 사용하는 경우에는 우기의 유량 예측 성능이 상대적으로 중요한 사항일 것이다. 모든 월에 대해 상대적으로 우수한 모의성능을 나타낸 S-SBHM의
결과로부터, 유역의 물순환 건강성을 평가하는 등 전체기간에 대한 수문특성을 파악하기 위한 물순환 관리 측면에서 준 분포형 모형의 적용이 타당할 것임을
알 수 있다. 강우량이 집중되는 우기(8월)에 대한 성능이 상대적으로 높게 나타나는 L-SBHM의 결과는 집체형 모형이 유역의 홍수예측 및 관리를
위한 용도로 수문모형을 활용하고자 할 경우에 더욱 효과적임을 의미한다. 따라서 각 모형의 특성을 이해하고 수문모형의 사용 목적과 결과물에 대한 기대치,
소요비용 등을 고려한 모형의 선택이 필요할 것으로 판단된다.
앞서 분석된 S-SBHM과 L-SBHM에 대한 결과를 종합적으로 살펴본다면, S-SBHM이 격자기반의 입력자료로 인해 매개변수가 상대적으로 큰 불확실성을
가짐에도 불구하고 일-단위 유량의 모의에 있어서 우수한 성능과 신뢰도를 유사하게 나타내었으며, 월-단위 유량의 모의 성능과 월별 모의성능은 높은 성능을
나타내었다. 따라서 S-SBHM에 입력되는 자료의 불확실성을 감소시킬 수 있다면, 모형이 크게 개선될 가능성이 있을 것으로 판단된다. 이러한 측면에서
시공간적인 관측정보를 제공할 수 있는 위성 관측자료는 모형 매개변수의 불확실성을 감소시킬 수 있는 유용한 자료가 될 수 있을 것이다. 이미 인공위성
원격탐사자료를 수문분석에 사용하기 위한 연구들이 시범적인 단계에서 다수 수행되고 있다(Long et al., 2014; Swann and Koven, 2017; Zhang et al., 2018). Silvestro et al. (2015)은 위성자료가 분포형 수문모형의 매개변수 불확실성을 줄이는데 유용함을 확인한바 있다. 또한, 이러한 매개변수 불확실성의 감소는 많은 매개변수 조합에
따른 equi-finality 문제 또한 개선할 수 있을 것이다. 따라서 본 연구에서 사용된 분포형 모형의 불확실성을 감소시키기 위한 방안으로써 인공위성
원격탐사자료의 활용은 추후 연구를 통해 다뤄질 필요가 있을 것이다.
4. Conclusions
본 연구에서는 그동안 국내에서 수행되어온 외국에서 개발된 수문모형 및 그 모형에 부가적인 기능으로 개발된 불확실성 분석 도구의 적용에 관한 연구들을
기반으로 독자적인 준 분포형 수문모형을 개발하고 개발된 모형의 불확실성을 분석할 수 있는 도구를 개발하였다는 점에서 학문적인 가치가 있을 것이다.
기 개발된 모형을 적용하는 것에 비하여 수문모형과 불확실성 분석 도구를 모두 직접 개발(코딩)함으로써 이후 다양한 분석을 수행할 수 있는 기반을 구축하였다는데
의미가 있다고 할 수 있다.
본 연구에서는 제안된 격자기반의 준 분포형 수문모형 S-SBHM에 대하여 MCMC 기법의 MH 알고리즘을 이용하여 매개변수를 보정함으로써, 해당 모형이
가지는 매개변수의 불확실성과 모형 자체의 성능을 정량적으로 검증하고자 하였다. R2, NSE, KGE를 산정하여 S-SBHM의 일-단위 유량모의 성능을 살펴본 결과 세 지표 모두 약 0.8에 가까운 값을 나타내어 우수한 성능을 나타내는
것으로 확인되었다. 반면, 추출된 매개변수 표본의 사후분포로부터 매개변수의 불확실성을 확인하였을 때, 입력자료가 가지는 공간적인 변동성이 매개변수의
불확실성에 반영되어 분포형 모형 매개변수의 불확실성을 증폭시키는 것을 확인할 수 있었다.
동일한 수문 프로세스 및 매개변수로 이루어진 집체형 모형(L-SBHM)을 구성하고 상대적인 비교를 수행하였다. 일-단위 유량모의 성능은 S-SBHM과
L-SBHM에 큰 차이를 나타내지 않았으며, 월-단위 유량모의 성능은 S-SBHM이 상대적으로 우수한 성능을 나타내었다. 또한, S-SBHM의 매개변수의
큰 불확실성에도 불구하고 모의결과의 불확실성에는 두 모형이 큰 차이를 나타내지 않다. 월별 일-단위 유량모의 성능을 추가적으로 분석한 결과, S-SBHM은
대부분의 월에 대해 상대적으로 높은 성능을 나타내었으며, L-SBHM는 높은 유량이 발생한 8월에 대해 높은 성능을 나타내었다. 따라서 각 모형의
적용 목적에 맞게 모형을 선택하여 사용하는 것이 필요할 것이다.
반면, 인공위성 원격탐사자료, 레이더 강우자료 등의 활용을 통해 준 분포형 모형의 입력자료의 변동성이 매개변수 불확실성에 미치는 영향을 감소시킬 수
있다면 모형 결과가 더욱 개선될 가능성이 있음을 살펴볼 수 있었다. 따라서 제안된 S-SBHM의 개선을 위해서는 공간적으로 분포된 모형 입력자료에
대한 추가적인 연구가 필요할 것이다.
본 연구에서는 단일한 유역을 대상으로 연구를 수행하였기에, 보다 다양한 유역에 대해 확장하여 연구를 수행할 필요가 있다. 특히, 공간적 이질성이 다른
유역에 대한 동일한 연구의 수행을 통해 입력자료의 공간적인 변동성이 분포형 모형의 불확실성에 미치는 영향 또한 정량적으로 확인해 볼 필요가 있다.
또한, 유역을 격자가 아닌 SWAT과 같이 수문학적 반응단위(Hydrologic Response Unit, HRU)로 구분한 모형을 구축하여 본 연구의
결과와 비교해 보는 것도 모형의 구성이 불확실성에 미치는 영향을 살펴보기 위한 좋은 추가연구가 될 것이다. 본 연구에 사용된 모형들보다 복잡하고 매개변수가
많은 분포형 모형과의 비교를 통해 모형의 성능과 불확실성을 비교하는 연구도 필요할 것이다.
Acknowledgement
본 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행되었음 (NRF-2019R1A2C1003114).