Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 서울대학교 건설환경공학부 박사과정 (Seoul National University·hyoddubi1@snu.ac.kr)
  2. 한국수자원조사기술원 첨단인프라실 전임연구원 (Korea Institute of Hydrological Survey·geunsoo87@kihs.re.kr)
  3. 정회원·단국대학교 토목환경공학과 교수 (Dankook University·dongsu-kim@dankook.ac.kr)
  4. 종신회원·교신저자·서울대학교 건설환경공학부·건설환경종합연구소 교수 (Corresponding Author․Seoul National University·dryspark@snu.ac.kr)



H-ADCP, 부유사 농도 모니터링, 총유사량 산정, 수정 아인슈타인 방법, 서포트 벡터 회귀(SVR)
H-ADCP, Suspended sediment load monitoring, Total load estimation, Modified Einstein procedure, Support vector regression (SVR)

1. 서 론

자연하천에서의 유사량은 하천에서는 교량이나 보와 같은 구조물의 안정성 및 하천 수질의 주요 인자로서, 해안 지역에서는 해안 유사 공급원으로서 중요한 역할을 한다. 이에 자연하천의 유사량 관리를 위해 국내에서는 한국수자원조사기술원에서 부유사량을 실측해 매년 수문조사보고서를 발간하고 있으며 2019년 한국수문조사보고서(MoE, 2019)에 보고된 바를 기준으로 44개의 유사량 관측소를 운영하고 있다. 매년 유사량 관측소 개소 수를 증설하고 있으나 유사량 시료 채집부터 분석에 이르는 과정에 소요되는 비용이 커 부유사 관측소 증설이 어렵고 이마저도 주기적인 실측에 어려워 강우가 발생하는 경우에 집중적으로 수행되고 있다. 마찬가지로 유사량 관측 비용 문제로 인해 소류사량 및 총유사량은 실측이 이루어지지 않는 실정이며 그 대신 수정 아인슈타인 방법(modified Einstein method; Colby and Hembree, 1954)으로 산정한 총유사량을 제공한다. 아울러, 실무적인 유사량 산정 목적으로 실측 부유사량과 추정된 총유사량을 유량의 관계를 이용해 부유사량-유량 및 총유사량-유량 관계곡선을 유도해 적용하고 있다(MoE, 2019).

수위-유량 곡선은 상승기에 하강기보다 낮은 수위가 나타나 시계반대방향 이력현상 고리(hysteresis loop)를 형성하며 발달하는 것으로 알려져 있다(Chaudhry, 2008). 비슷하게, 유사량(혹은 부유사 농도)과 유량의 관계에서도 이력현상이 발생하지만 유사량과 유량의 관계는 비교적 복잡해 시계반대방향 뿐 아니라 시계방향으로도 혹은 8자 모양으로 시계방향과 반시계방향 고리가 혼합된 양상으로 발달한다(Williams, 1989). 최근에는 Gellis(2013)가 유사량-유량 이력현상의 원인이 유역의 도시화 정도나 선행홍수의 규모 등과 같은 다양한 요인과의 상관성을 가짐을 보였다. 한편, 유사량을 유량의 지수함수 관계로 추정하는 유사량-유량 관계곡선을 이용한 유사량 산정법이 널리 이용되고 있지만 이 방법은 유사량의 이력현상을 예측할 수 없어 오차가 수반된다(Rajaee et al., 2011). 유사량-유량 관계곡선 방법의 단점을 극복하기 위해 최근에는 인공신경망 등의 기계학습 기법들을 활용해 유사량의 시계열 분석을 수행하는 연구들이 이루어지고 있다(Rajaee et al., 2011; Zounemat-Kermani et al., 2020). 이러한 시계열 예측 기계학습 모형은 부유사 농도 예보 측면에서는 활용성이 좋으나 물리적인 기반이 없어 부유사 농도 이외에 소류사량 혹은 총유사량 추정에는 비교적 정확도가 떨어진다(Zounemat-Kermani et al., 2020).

초음파 도플러 유속계(ADCP, acoustic Doppler current profiler)로부터 취득한 후방산란값과 부유사 농도의 관계를 이용하면 부유사농도를 산정할 수 있는데(Urick, 1948), 이러한 특성을 활용해 횡방향으로 설치된 초음파 도플러 유속계(H-ADCP, horizontal-ADCP)를 시계열 부유사 모니터링에 적용하고자 하는 연구가 지속되고 있다(Haught et al., 2017; Landers, 2012; Son, 2021; Topping et al., 2006; 2007; Venditti et al., 2016). 특히, Venditti et al.(2016)Son(2021)은 H-ADCP를 이용해 시계열 부유사 모니터링을 수행할 시 유사량과 유량이 가지는 이력현상을 관측할 수 있음을 보고했다. 2019년 기준으로 국내에서는 62개소의 자동 유량 관측소에 H-ADCP가 설치되어 있는데, 이를 활용하면 보다 적은 비용으로 부유사를 모니터링해 기존 부유사 모니터링 자료의 시공간적 제약을 대폭 줄일 수 있을 것으로 판단된다.

본 연구에서는 H-ADCP로부터 수집된 자료를 이용하는 서포트 벡터 회귀(SVR, support vector regression) 기반으로 하여 실시간으로 부유사 농도로부터 총유사량을 추정하는 방법을 제안한다. 세부적으로는 시스템에 탑재될 부유사 농도를 Urick (1948)의 소나방정식을 바탕으로 산정하는 SVR 모형과 직접 산정된 부유사 농도와 유량을 이용해 수정 아인슈타인 추정값을 산정하는 SVR 모형을 유도한다. 한편, H-ADCP를 이용해 수정 아인슈타인 방법을 직접 적용하기 위해서는 에너지 경사나 단면정보 등의 수리량이 필요하지만 자연하천에서 수리량은 시공간적으로 변화하기 때문에 수리량을 가정해야 한다. 그러나, 본 연구에서는 H-ADCP로부터 직접 취득할 수 있는 변수들만을 이용하기 때문에, 수리량을 가정함으로써 생기는 불확도를 최소화하고 정확도와 편의성이 향상된 모형을 제안하는 것을 세부 목표로 한다.

2. 배경이론

2.1 ADCP 초음파산란도를 이용한 부유사 농도 모니터링

ADCP를 이용한 부유사 농도 모니터링은 자연하천의 부유사와 같이 수중에 분포한 입자에 부딪친 후 산란되는 음파를 분석한 결과를 바탕으로 수행된다. ADCP의 변환기(transducer)에서 발사된 신호 강도(SL, source level)와 수신기에서 측정된 후방산란 음향 강도(MB, measured backscatter)의 관계는 Urick(1975)의 단순화된 소나방정식을 통해 다음과 같이 표현될 수 있다.

(1)
$MB + 2TL = SL + TS$

여기서, $TL$은 전송 손실(transmission loss)의 약자로, 음파가 진행하는 동안 겪는 음파 확산, 점성, 산란감쇠 등의 각 감쇠 요인으로 인한 음파 손실을 의미한다. $TL$은 음파가 발신되고 반사되어 돌아올 때 모두 발생하므로 위 식의 $2TL$과 같이 편도 손실 값을 두 번 곱한 왕복 전송 손실(2-way transmission loss)로 표현되기도 한다. 소나방정식의 마지막 항인 $TS$는 표적 강도(target strength)의 약자로 매질 내에서 초음파가 진행하는 경로에 존재하는 입자에 충돌하고 반향되는 정도로 본 연구에서는 ADCP에서 발사된 음파가 수체 내 부유사에서 반사되는 정도에 해당된다. $2TL$은 크게 다음 세 가지 감쇠 원인을 고려해 산정된다: (1) 변환기에서 발사되는 음파의 확산 양상에 의한 감쇠, (2) 유체의 점성, 이온의 완화효과(ionic relaxation) 등으로 인한 감쇠, (3) 부유사 입자 경계면의 점성과 형태로 인한 산란으로 발생하는 감쇠.

음파의 확산이 기하학적으로 구형(shperical)으로 이루어짐을 모형화 했을 때 음파의 왕복 손실 정도는 음파의 이동 거리 $r$에 따라 $20\log_{10}(r)$로 표현할 수 있다. 그러나 변환기와 인접한 발사 초기 영역에서는 초음파가 불규칙하게 확산되는 특성이 있어 Downing et al.(1995)는 음파의 파장 $\lambda$와 초음파 센서의 반지름$a_{t}$를 이용한 무차원 수 $z=r\lambda /(\pi a_{t}^{2})$를 도입하여 확산 손실을 $20\log_{10}(\psi r)$과 같이 보정계수를 도입하는 방법을 제안했으며, 여기서 $\psi$는 아래 식으로 계산된다.

(2)
$\psi =\dfrac{1 + 1.35 z +(2.5z)^{3.2}}{1.35z +(2.5z)^{3.2}}$, where $z =\dfrac{r\lambda}{\pi a_{t}^{2}}$

여기서 $\lambda$는 음파의 주파수 $f$와 수체 내 음파의 파속 $c$의 관계 $c=\lambda f$로부터 계산될 수 있으며, 이 때 파속 $c$는 섭씨 수온 $T$를 이용해 이용해 계산된다.

(3)
$c=1.402385\times 10^{3}+5.038813T \\ -5.799136\times 10^{-2}T^{2}+3.287156\times 10^{-4}T^{3} \\ -1.398845\times 10^{-6}T^{4}+2.787860\times 10^{-9}T^{5}$

유체와 부유사로 인한 감쇠는 각각 물로 인한 보정계수 $\alpha_{w}$와 유사로 인한 보정계수 $\alpha_{s}$에 음파 진행거리 $2r$을 곱해 $2r\alpha_{w}+ 2r\alpha_{s}$의 꼴로 계산할 수 있다. 이 때 Eq. (1)의 좌항과 물 보정 후방산란(WCB, water corrected backscatter), 유사를 추가로 보정한 유사 보정 후방산란(SCB, sediment corrected backscatter)이 가지는 관계는 다음과 같이 정리된다.

(4)
$ MB+2TL=MB+20\log_{10}(\psi r)+2r\alpha_{w}+2r\alpha_{s}\\ =WCB+2r\alpha_{s}=SCB $

결과적으로 부유사의 부피농도($SSC_{V}$)는 SCB와 $SSC_{V}$의 관계식을 실측부유사 농도 자료를 통해 유도함으로써 얻을 수 있다. 대표적인 SCB-$SSC_{V}$ 관계식은 대수스케일의 선형 회귀식으로 $C_{1}$와 $C_{2}$를 식의 회귀계수라고 할 때 $\log_{10}SSC_{V}=C_{1}\times SCB$$+C_{2}$의 꼴을 가진다. SCB는 부유사 입도분포, 수온 등의 물리 조건에 영향을 받는데, 이러한 물리 조건이 관측 지점마다 상이함에 따라 보정된 관계식의 회귀계수 $C_{1}$와 $C_{2}$가 음의 상관관계를 가지면서 관측소마다 다르게 나타나는 것으로 보고되었다(Noh et al., 2021). 여기에 식의 정확도를 높이기 위해 회귀식의 입력 변수로서 $\alpha_{s}$ (Landers et al., 2016) 또는 관측소에서 모니터링된 수위(Son, 2021)를 도입하기도 한다.

2.1.1 물 보정 후방산란 계수와 유사 보정 후방산란 계수의 산정법

실무적으로 WCB를 계산할 때에는 유체로 인한 음파 에너지의 감쇠는 유체 내 황산마그네슘(MgSO4) 이온의 결합 및 분해 효과로 인한 이온의 완화효과와 매질의 점성에 따른 감쇠를 각각 염도와 온도의 함수로 감쇠 계수를 계산하여 후방산란값을 보정한다. 하천수와 같이 이온 및 염도의 영향을 무시할 수 있는 조건에서 물의 점성으로 인한 감쇠만 고려하는 경우 Schulkin and Marsh(1962)의 아래 관계식을 통해 $\alpha_{w}$를 산정할 수 있다.

(5)
$\alpha_{w}= 8.69\dfrac{3.38\times 10^{-6}\times f^{2}}{21.9\times 10^{6-1520/(T+273)}}$

한편, 부유사로 인한 감쇠 효과는 작은 크기의 입자 간에 작용하는 점성 효과와 음파가 입자에 충돌한 이후 발생하는 산란으로 인한 효과가 복합적으로 작용한다. 두 기작 중 점성 효과는 부유 입자의 표면적, 음파의 진동수, 유체의 점성, 입자의 비중에 지배되는데, 부유사의 부피 농도가 주어졌을 때 입자의 직경이 작을수록 단위 부피당 표면적이 커지므로 감쇠가 증가하고 반대로 입경이 커지면 전단력과 점성으로 인한 감쇠가 감소한다(Landers et al., 2016). 산란 감쇠 효과는 표면적보다는 입자의 원주($=\pi d_{s}$)과 더욱 연관성이 크다고 알려져 있으며, 파장이 원주보다 매우 큰 경우 산란 감쇠가 급격히 증가하지만 유사의 원주와 파장이 비슷한 경우에는 복잡하게 변화하는 것으로 알려져 있다(Urick, 1948; Flammer, 1962). Urick(1948)은 앞서 언급한 두 가지의 부유사로 인한 감쇠 기작을 반영해 부유사의 부피농도에 따른 감쇠 계수 관계식을 개발 및 검증하였다. 이후 Sheng and Hay(1988)은 부유사 입자의 산란감쇠에 대해 보다 심도 있게 연구한 Flammer(1962)의 연구 결과를 바탕으로 Urick(1948)에 반영되지 않은 부유사 감쇠 계수의 최댓값을 찾아 산란감쇠 경험식을 새로이 제시했다. 앞의 두 유사 감쇠 모형들을 상호 보완하기 위해 Landers(2012)Urick(1948)의 식에서 산란 감쇠 항을 Sheng and Hay(1988)의 관계식으로 대체한 hybrid Urick-Sheng-Hay 식(Eq. (6))을 제안했다.

(6)
$\alpha_{s}=SSC_{V}[k(\gamma -1)^{2}(\dfrac{s}{s^{2}+(\gamma +\tau)^{2}}) \\ +\dfrac{k^{4}d_{s}^{3}}{5(1+1.3k^{2}d_{s}^{2}+0.24k^{4}d_{s}^{2})}]4.34$

여기서, $SSC_{V}$는 부유사의 부피 농도; $k$는 음파의 cm 단위 파장 $\lambda$에 대한 음파의 파수(=$2\pi /\lambda$); $\gamma$는 유사의 비중; $d_{s}$는 유사의 입경(cm); $s\equiv \dfrac{9}{4\beta d_{s}}(1+\dfrac{1}{\beta d_{s}})$; $\tau\equiv 0.5 +\dfrac{9}{4\beta d_{s}}$; $\beta\equiv \sqrt{f\pi /\nu}$

이다. 음파의 주파수 $f$를 3 MHz, 부유사 부피 농도 $SSC_{V}$를 1,000 ppm으로 고정했을 때 부유사의 입경에 따른 $\alpha_{s}$의 변화를 상술한 모형을 통해 Fig. 1에 도시하였다.

Eq. (6)Fig. 1에 의하면 $\alpha_{s}$는 부유사의 농도와 부유사의 입경에 따라 비선형적으로 변하고, 설명변수 또한 불확도를 포함하

고 있어 실무적으로 적용 시에는 많은 가정을 필요로 한다. 한편, Topping et al.(2007)은 다중 셀(multi-cell) ADCP를 이용했을 때 농도와 부유사 입도 분포가 모든 셀에서 동일하다고 가정하면 WCB로부터 SCB를 산정할 수 있음을 보여 유사 보정 과정에서의 불확도를 줄였다는 평가를 받는다(5Landers et al., 2016). ADCP의 관측 셀 간에 부유사 농도, 부유사 입도 분포가 동일하다고 가정하면 WCB와 SCB의 관계를 나타내는 Eq. (4)의 마지막 두 항을 음파 진행거리 $r$로 미분한 값이 0이 된다.

(7)
$\dfrac{d}{dr}(SCB)=\dfrac{d}{dr}(WCB + 2r\alpha_{s})=0$

위 식의 해를 구하면 $\alpha_{s}= -0.5\dfrac{d}{dr}(WCB)$로 이 관계를 이용해 $\alpha_{s}$ 및 SCB를 얻을 수 있다(Landers, 2012).

Fig. 1. Coefficients Varying Particle Size of the $\alpha_{s}$ Estimation Models (Reproduced fromLanders et al. (2016))
../../Resources/KSCE/Ksce.2023.43.3.0321/fig1.png

2.2 서포트 벡터 회귀

서포트벡터머신(SVM, support vector machine)은 분류문제를 풀기 위해 개발된 지도학습 기법으로, Boser et al.(1992)가 커널을 이용한 비선형 분류기를 제안한 뒤 Cortes and Vapnik (1995)에 의해 확장되었다. SVM의 목적함수와 용도에 따라 분류기로 이용되는 경우 SVC (support vector classification), 회귀분석에 이용되는 경우 서포트벡터회귀(SVR, support vector regression)로 각각 구분할 수 있다. Drucker et al.(1997)는 초평면과 자료의 마진을 최대화하도록 학습하는 SVM의 목적함수를 수정해 SVM을 회귀분석에 적용하는 SVR을 개발하였다.

SVC가 초평면과 자료의 마진을 최대화하도록 학습하는 것과 다르게 SVR은 마진의 너비 $2\epsilon$ 내에 모든 학습 자료 벡터를 반드시 포함하도록 최적화를 수행한다. 이 때 SVR은 동시에 초평면 $y = w^{T}x$의 회귀계수 $w$를 최소화 하여 회귀식이 과도하게 복잡해지는 효과를 방지한다. 자료의 불확도가 큰 경우 자료가 허용 마진을 벗어나서 해를 구할 수 없게 되거나 이상치로 인해 과적합이 되는 문제가 발생한다. 이런 경우 정규화계수 $C$와 마진을 벗어나는 정도 $\xi$와 $\xi^{*}$를 도입함으로써 문제를 해결할 수 있다. SVR은 2차 계획법 최적화 문제를 풀어 학습되며, 이 때 실제로 풀게 되는 라그랑주 쌍대함수는 다음과 같다.

(8)
$\begin{matrix}\max imize&-\dfrac{1}{2}\sum_{i,\: j=1}^{N}(\lambda_{i}-\lambda_{i}^{*})(\lambda_{j}-\lambda_{j}^{*})K(x_{i},\: x_{j})+\sum_{i=1}^{N}(\lambda_{i}-\lambda_{i}^{*})y_{i}\\&-\sum_{i=1}^{N}(\lambda_{i}\epsilon -\lambda_{i}^{*}\epsilon^{*})\\subject\: to&\sum_{i=1}^{N}(\lambda_{i}-\lambda_{i}^{*})\\&0\le\alpha_{i},\: \alpha_{i}^{*}\le C\\&{for}{i},\:{j}=1,\: ...,\:{N}\end{matrix}$

여기서, $N$은 자료의 개수; $\lambda_{i}$와 $\lambda_{i}^{*}$는 $i$번째 자료에 해당되는 라그랑주 승수; $K(· ,\:·)$는 임의의 커널 함수이다.

가장 널리 이용되는 기계학습 방법중 하나인 인공신경망은 모형의 구성을 사전에 결정해야 하고 지역해에 빠지기 쉬워 모형의 성능 향상을 위해 많은 노력이 필요하다. 반면 SVR은 2차 계획법 볼록최적화 문제를 풀기 때문에 주어진 자료와 매개변수 조합에 대해 유일한 최적해를 생산해내고 사전에 학습되는 모형의 구조를 구체화할 필요가 없다(Smola, 1996). 또한 SVR은 커널함수와 정규화를 통해 잡음이 큰 비선형 자료를 대상으로 적용 가능하다. 상기 측면들과 본 연구의 대상 자료가 현장에서 취득된 계측 자료임을 고려했을 때, SVR이 전통적 회귀 방법이나 인공신경망에 비해 적합하다고 판단하였다.

2.2.1 서포트 벡터 머신의 재귀적 특징 제거법

Guyon et al.(2002)은 수천개에 달하는 DNA 배열에서 SVC를 이용해 유의한 특징을 추출하는 방법으로서 SVM의 재귀적 특징 제거법(RFE-SVM, recursive feature elimination for SVM)을 제안했다. RFE-SVM은 $p$번째 특징을 제거한 특징 벡터 $x^{(-p)}$에 대한 SVR의 목적함수의 변화를 계산함으로써 변수들의 중요도를 평가한다. SVR의 경우 중요도 점수 $c_{p}$는 다음과 같이 계산된다.

(9)
$c_{p}=\dfrac{1}{2}|\sum_{i,\: j=1}^{N}(\lambda_{i}-\lambda_{i}^{*})(\lambda_{j}-\lambda_{j}^{*})K(x_{i},\: x_{j}) \\ -\sum_{i,\: j=1}^{N}(\lambda_{i}-\lambda_{i}^{*})(\lambda_{j}-\lambda_{j}^{*})K(x_{i}^{(-p)},\: x_{j}^{(-p)})|$

여기서, $x_{i}^{(-p)}$는 $p$번째 변수를 제외한 $i$번째 입력변수 벡터이다. 한번 학습한 뒤 각 변수에 대한 $c_{p}$가 평가되면, $c_{p}$가 가장 낮게 평가된 변수를 소거하고 나머지 변수들을 이용해 SVM 학습을 학습시키고 중요도 점수를 다시 평가하는 과정을 반복한다. Fig. 2는 RFE-SVM의 순서도를 나타낸다.

입력변수의 조합에 따른 모형 최적화를 수행하는 방법으로서 가능한 변수 조합에 대해 매번 모형을 학습해 예측 정확도가 우수한 결과를 채택하는 방식을 적용할 수 있으나 모든 경우의 수에 대해 시도하는 것은 자원이 매우 크게 소요된다. 예를 들어, $Np$개의 입력변수를 후보로 할 때 $2^{Np}-1$회 반복 학습을 수행해야 한다. 그러나 RFE-SVM은 SVM의 변수 결정에 요구되는 학습 횟수를 $2^{Np}-1$회에서 $Np$회로 대폭 감소시킨다는 데에 이점이 있다.

Fig. 2. Flowchart of the RFE-SVM Procedure
../../Resources/KSCE/Ksce.2023.43.3.0321/fig2.png

2.2.2 격자검색과 겹 교차검증을 통한 초매개변수 결정

SVR의 학습 원리에 따라 학습 시 SVR 목적함수 매개변수($C$와 $\epsilon$) 그리고 커널함수를 각각 보정해야 한다. 커널함수 보정은 커널함수의 종류 자체와 커널함수의 자체 매개변수를 보정해야 하는데, $K(x_{i,\: }x_{j})=\exp(-\gamma(x_{i}- x_{j})^{2})$로 정의되는 방사기저함수(RBF, radial basis function)의 $\gamma$와 같은 매개변수를 예로 들 수 있다. 매개변수 결정에는 격자검색(grid search) 방법과 $K$겹 교차 검증($K$-fold cross-validation)을 함께 적용하는 것이 일반적이다(Raghavendra and Deka, 2014).

격자 검색은 모형의 매개변수 후보를 모든 매개변수 조합에 대해 반복적으로 학습을 진행하는 방법이다. 각 매개변수 조합에 대해 모형의 적합도를 평가해 가장 우수한 결과를 나타내는 매개변수 조합을 찾아내는 방법이다.

$K$겹 교차검증은 전체 학습 데이터셋을 $K$개의 하위 분류로 나눈 뒤 각 분할에 따라 검증 데이터셋을 할당한 뒤 $K$개의 적합도 점수를 평균해 모형의 적합도를 판단한다. 실무 적용 시에는 모든 데이터를 이용해 학습된 모형을 이용하게 되는데 이 때 적합도는 전체 자료에 대한 점수가 아닌 교차검증 점수(CV-score)를 정확도 지표로서 참조하는 것이 합당하다. CV-score를 도입함으로써 모형의 일반화 성능을 판단할 수 있고 가능한 많은 자료를 이용한 모형 유도를 가능케 해 실용적인 모형을 유도할 수 있다.

Fig. 3은 5-겹 교차검증을 예시로 격자 검색 시 최종 적합도를 계산하는 방법을 그림으로 나타낸 것이다. 본 연구에서는 격자검색 시 CV-score를 바탕으로 매개변수를 결정하는 방법을 이용하였다. 여기에 더 나아가 재귀적특징제거법을 통해 입력변수를 결정하고 격자검색을 통해 각 변수 조합에 따른 초매개변수를 보정하였다(이하 Grid-CV-RFE).

Fig. 3. Example of the Grid Search with $K$-Fold Cross-Validation’s Score Evaluation Rule
../../Resources/KSCE/Ksce.2023.43.3.0321/fig3.png

3. H-ADCP연계 부유사 농도 및 총유사량 산정 모형 개요

3.1 대상 지점

본 연구에는 전라남도 나주시에 위치한 남평교 관측소를 대상지역으로 선정하였다. 남평교는 영산강의 제 1지류인 지석천에 위치하였으며, 유역면적은 585.05 km2, 영산강 합류점으로부터 7.95 km에 위치한다. 남평교 관측소는 H-ADCP를 이용한 자동 유량 측정과 더불어 D-74 수심적분 부유사 채집기를 이용한 유사량 관측이 매년 수행되고 있다. 관측소 주변의 하상재료는 자갈과 모래가 혼재되어 있으며 $d_{50}$은 2019년 기준 홍수 전후 평균 4.1 mm로 알려져 있다(MoE, 2019).

남평교 유량관측소에는 RDI사의 CM600 H-ADCP가 설치되어 있고, 이 H-ADCP로부터 10분 간격으로 H-ADCP의 원시 자료가 수집된다. 부유사 농도 및 총유사량 산정 모형 개발에는 H-ADCP의 유사보정산란도($SCB$), 수온($T$), 수심($h$), 유량($Q$)을 이용했다. SCB는 H-ADCP의 원시 초음파 산란도를 2.1절에 서술한 절차에 따라 산정하고, 부유사량은 부유사 농도를 산정한 뒤 유량을 곱해($Q_{SL}=SSC\times Q$) 계산했다. SVR 모형의 개발 및 검증에는 참값으로서 환경부에서 발간된 2019년 한국수문조사보고서(MoE, 2019)의 유사량편에 수록된 2019년 7월에서 10월 동안 총 20회 실측된 부유사 농도($SSC$), 부유사량($Q_{SL}$), 그리고 총유사량($Q_{TL}$)이 이용되었다. 여기서, 한국수문조사 보고서에 수록된 총유사량 자료는 실측 부유사 농도를 이용해 수정 아인슈타인 방법으로 산정된 값으로 본 연구에서 개발된 모형의 최종 산출물인 총유사량 또한 수정 아인슈타인 방법을 모사한 값임을 분명히 하는 바이다.

3.2 SVR 모형 결정

재귀적 특징 제거법과 격자검색을 이용해 커널함수와 매개변수를 변경해가며 학습을 수행했다. 검증 자료로 과도하게 적은 자료가 포함되는 것을 방지하기 위해 모형의 적합도 지표를 결정계수 $R^{2}$(Eq. (10))로 한 3-겹 교차검증을 수행하였다.

(10)
$R^{2}=1-\dfrac{\sum_{i=1}^{N}(y_{i}^{obs}-y_{i}^{pred})}{\sum_{i=1}^{N}(y_{i}^{obs}-\overline{y^{obs}})}$

여기서, $y_{i}^{obs}$와 $y_{i}^{pred}$는 각각 $i$번째 자료의 관측값과 추정값; $\overline{y^{obs}}$는 관측값의 평균이다. 최적 커널함수는 방사기저함수(RBF, radial basis function) 커널로 나타났으며, RBF 커널은 다음과 같이 정의된다.

(11)
$K(x_{i},\: x_{j})\equiv \exp[-\gamma ||x_{i}-x_{j}||^{2}]$

본 연구에서는 부유사 농도를 산정하는 SVR 모형(이하 SVR-SSC)과 총유사량($Q_{TL}$)을 산정하는 SVR을 각각 개발하는 것을 목표로 한다. 모형 간 연계성을 도모하기 위해 총유사량 모형(이하 SVR-$Q_{TL}$)은 부유사 농도 모형으로부터 산정된 부유사농도($SSC_{SVR}$)를 입력받도록 구성했다.

Fig. 4는 살아남은 변수 개수에 따른 SVR-SSC와 SVR-$Q_{TL}$의 Grid-CV-RFE 결과를 각각 그래프로 도시한 것이다. 파란 선은 평균 점수를 의미하고, 빨간 선은 가장 적합도가 높은 변수 및 매개변수 조합에 대한 결정계수를 나타낸다. 그리고 최적의 결과에서 초매개변수 조합과 재귀적 특징 제거 과정에서 드러난 입력 변수의 중요성 순위를 Table 1에 정리했다.

SVR-SSC의 초매개변수는 $C$=2048, $\epsilon$=0.4, $\gamma$=1이 가장 높은 정확도를 나타냈고, 이 때 입력변수는 $SCB$ 하나의 입력변수를 제외하고 나머지 입력 변수는 제거되었다. 총유사량의 경우에는 $\gamma$는 1로 SVR-SSC와 동일하고, $C$과 $\epsilon$은 각각 128과 0.01일 때 최적의 결과가 나타났다. 총유사량 산정에 필요한 최적의 변수 조합은 $SSC_{SVR}$과 $Q$로 나타났다. 두 모형 모두에서 $h$와 $T$는 각각 3위와 4위의 중요도로 나타나 모형 입력변수에서 제외되었다.

Fig. 4. Grid-RFE-CV Scores with Respect to the Number of Features: (a) Parameter Grid Averaged Scores-SSCSVR, (b) Parameter Grid Averaged Scores-log10QTL
../../Resources/KSCE/Ksce.2023.43.3.0321/fig4.png
Table 1. Optimal Hyperparameters and Feature Importance Ranking from Grid-CV-RFE: The $(·)*$ Signs Denote the Survived Features Corresponding to RFE

Target

Hyperparameters

Feature importance ranking

$C$ $\epsilon$ $\gamma$

1

2

3

4

$SSC_{SVR}$

2048

0.4

1

$SCB$*

$Q$ $h$ $T$
$Q_{TL}$

128

0.01

1

$SSC_{SVR}$*

$Qp$*

$h$ $T$

3.3 실시간 총유사량 SVR 모형 개요

본 연구에서 제안하는 실시간 총유사량 관측 시스템은 3.2절의 분석 결과를 바탕으로 $SCB$를 입력변수로 하는 SVR-SSC와 $SSC_{SVR}$과 $Q$를 입력변수로 하는 SVR-$Q_{TL}$을 순차적으로 연결한 형태를 가지고 있다. 두 모형을 연계함으로써 SVR 모형들에서 요구하는 입력변수들은 모두 자동 유량 관측소에 설치된 H-ADCP에서 취득 가능한 변수들인 $SCB$와 $Q$로 정리된다. 개발되는 시스템으로부터 총 세 개의 유사량 관련 인자($SSC_{SVR}$, $Q_{SL}$, 그리고 $Q_{TL}$)를 출력변수로 얻을 수 있다. 본 시스템의 이해를 돕기 위해 실시간 총유사량 관측 시스템의 순서를 다이어그램으로 Fig. 5에 도시했다. 그림에서 H-ADCP로부터 얻을 수 있는 입력변수들은 파란색으로, 두 SVR 모형들의 출력변수들은 빨간색으로 표시했다.

두 SVR 모형들은 Python 환경에서 Scikit-learn(Pedregosa et al., 2011) 라이브러리를 활용해 개발되었다. SVR-SSC와 SVR-$Q_{TL}$ 모두 내부적으로 표준편차 기반 정규화를 위해 Standard Scaler 함수에 의한 전처리 및 후처리 과정을 거친다. 앞에서 서술된 바와 같이 SVR-SSC 모형은 $SCB$를 입력값으로 받고, $SSC_{SVR}$을 반환하며, 이를 통해 부유사량 $Q_{SL}$을 산출할 수 있다. SVR-$Q_{TL}$은 $SSC_{SVR}$과 H-ADCP로부터 계측된 유량($Q$)을 입력변수로 해 $Q_{TL}$를 산정하도록 설계되었다. 여기서, $Q_{TL}$의 실측값 분포를 고려해 $y=\log_{10}Q_{TL}$을 학습하였다. 이에 따라 총유사량 산정 시 SVR-$Q_{TL}$모형이 $y=\log_{10}Q_{TL}$를 반환하기 때문에 총유사량을 $Q_{TL}$$=10^{y}$의 관계식으로 역산하는 후처리 단계를 추가로 포함한다.

한 편, SVR-$Q_{TL}$ 모형은 회귀모형이기 때문에 최종 출력되는 총유사량이 부유사량보다 낮게 추정되는 물리적으로 불가능한 경우가 발생한다. 이러한 문제를 방지하기 위해 본 시스템의 마지막 단계에서 $Q_{TL}=\max(Q_{TL,\: }Q_{SL})$ 연산을 거쳐 $Q_{TL}$을 항상 $Q_{SL}$보다 같거나 크게 보정하였다.

Fig. 5. Pipeline of the Developed SVR Models Estimating SSC and $Q_{TL}$
../../Resources/KSCE/Ksce.2023.43.3.0321/fig5.png

4. 적용 결과 및 고찰

4.1 모형 성능 평가

SVR-SSC와 SVR-$Q_{TL}$의 유사량 예측 성능을 선행 연구에서 개발된 모형들과 비교해 평가했다. 부유사량을 비교하기 위해 Noh et al.(2021)에서 $SCB$에 대한 대수식 모형(Eq. (12))과 한국수문조사보고서(MoE, 2019)에서 개발된 유량-부유사량 곡선(Eq. (13))을 통해 $Q_{SL}$을 계산했다.

(12)
$\log_{10}SSC = 0.0405\times SCB -2.5729$
(13)
$Q_{SL}= 0.1203Q^{1.6942}$

더불어, 한국수문조사보고서(MoE, 2019)에서 수록된 총유사량-유량 관계곡선을 이용해 총유사량 모형의 성능을 비교했으며 사용된 식은 아래와 같다.

(14)
$Q_{TL}= 0.0997Q^{1.7579}$

Fig. 6(a)와 (b)는 각각 부유사량과 총유사량 추정 결과를 산점도로 나타낸 것이다. 파란 직선은 1:1 대응 선으로, 이를 기준으로 추정값이 위에 있으면 과대평가, 아래에 있으면 과소평가함을 의미한다. 총유사량과 부유사량 모두에서 검은색 동그라미로 표시된 SVR 모형들이 1:1 선에 가까워 예측 성능이 우수함을 볼 수 있다. 초록색 사각형으로 표현된 부유사량-유량 관계곡선과 총유사량-유량 곡선의 예측 결과는 중간 유사량이 $10^{2}$ 이상 $10^{3}$ 이하일 때에는 과대평가하고 이보다 유사량이 많거나 적게 발생하는 경우에는 과소평가하는 모습이 나타났다. 이 현상에 대해서는 후술하는 장에서 보다 자세히 토의한다. Eq. (12)는 SVR과 부유사량-유량 곡선의 중간정도 정확도가 나타났으나 부유사량이 낮을수록 정확도가 낮게 나타났다.

각 모형들의 정량적인 비교를 위해 결정계수($R^{2}$)와 MSE (mean squared error), 그리고 PBIAS(percent bias)를 계산해 Table 2에 정리했다. 여기서, MSE와 PBIAS는 다음과 같이 계산된다.

(15)
$MSE=\sum_{i=1}^{N}\dfrac{(y_{i}^{obs}-y_{i}^{pred})^{2}}{n}$
(16)
$PBIAS=100\times\dfrac{\sum_{i=1}^{N}(y_{i}^{pred}-y_{i}^{obs})}{\sum_{i=1}^{N}(y_{i}^{obs})}$

MSE는 평균적인 오차의 크기를 알기에 유용하고 $R^{2}$는 이를 정규화한 값으로 볼 수 있다. 또한 PBIAS를 이용하면 모형의 편향을 판단할 수 있고, PBIAS가 0보다 큰 경우 실제 관측 값보다 추정값이 크게 나타난 것으로, 모형이 과대평가하는 경향을 보인다고 판단할 수 있다. 마찬가지로, 음수의 PBIAS는 과소평가를 의미한다.

본 연구에서 새로 제시되는 SVR 모형들의 경우에는 교차검증 이후 전체 자료를 바탕으로 다시 유도된 바 전체 자료를 대상으로 한 평가 지표 외에 CV-score를 괄호 안에 추가로 제시했다. 특히, SVR-SSC의 경우에는 산출 값이 부유사 농도이기 때문에 실측 부유사 농도 대비 정확도와 부유사량으로 다시 계산한 정확도를 각각 3CV-SSC와 3CV-$Q_{SL}$로 구분해 표기하였다.

부유사량 예측 모형의 경우에는 예측 산점도에서도 나타난바와 같이 제시된 세 지표 모두 SVR이 가장 우수한 것으로 드러났다. Noh et al.(2021)에서 제시된 대수식은 SVR 다음으로 정확했으며 PBIAS의 경우에는 SVR과 거의 비슷하게 나타났다. 부유사량-유량 관계곡선은 MSE와 PBIAS 모두 SVR에 비해 1.5배가량 크게 나타났다. 이 결과는 가능하다면 부유사량 산정 시 부유사량과 유량의 1:1 대응 관계를 이용하기보다 실제 수체의 산란강도로 부유사량을 추정하는 것이 실시간 관측보다 낮은 오차로 관측할 수 있음을 시사한다.

$R^{2}$ 또한 SVR-SSC가 0.783으로 나머지 두 모형에 비해 우수하게 나타났다. 교차검증 값은 이보다 다소 높았으며 이 때 3CV-$Q_{SL}$은 0.885로 세 모형 가운데 가장 높은 정확도를 보였다. 한 편 SVR-SSC가 $SCB$만을 입력변수로 하는 부유사 농도를 산정하는 모형임에도 불구하고 3CV-SSC는 비교적 낮은 0.812로 계산됐다. 부유사량-유량 관계곡선의 교차검증 값은 0.786으로 전체 자료를 대상으로 할 때($R^{2}$=0.687)보다 높았다. $SCB$ 대수식은 SSC와 $Q_{SL}$모두 교차검증 점수가 0.765로 나와 교차검증 성능으로는 가장 낮았다.

총유사량-유량 관계곡선 대비 SVR 모형의 예측 성능은 $Q_{TL}$에서 더욱 분명하게 나타났다. SVR-$Q_{TL}$의 MSE는 유량 관계곡선의 MSE보다 약 400배 작게 계산되었다. PBIAS를 보았을 때 총유사량-유량 관계곡선이 약 29% 과소평가하나 SVR-$Q_{TL}$은 총유사량을 평균적으로 0.14% 가량 크게 추정해 상대적으로 SVR-$Q_{TL}$의 성능이 우수했다. $R^{2}$는 전체자료를 이용했을 때와 교차검증했을 때 모두 SVR-$Q_{TL}$이 상대적으로 높게 나타났다. 특히, 전체 자료를 대상으로 다시 유도한 SVR 모형의 $R^{2}$가 1에 가깝게 나왔는데 이는 남평교 관측소에서 SVR-$Q_{TL}$이 수정 아인슈타인 방법을 매우 비슷하게 모사했음을 의미한다.

Fig. 6. Prediction Results of the Sediment Load Estimation Models: (a) $Q_{SL}$, (b) $Q_{TL}$
../../Resources/KSCE/Ksce.2023.43.3.0321/fig6.png
Table 2. Performance Measures of the Models Estimating SSC and $Q_{TL}$ (3CV-SSC, 3CV-$Q_{SL}$, and 3CV-$Q_{TL}$ Indicates $R^{2}$ from the Three-Fold Cross-Validation for SSC, $Q_{SL}$, and $Q_{TL}$, Respectively)

Target value

Model

MSE

PBIAS (%)

$R^{2}$
$Q_{SL}$

SVR-SSC (This study)

6.090$\times 10^{6}$

-19.239

0.783

(3CV-SSC: 0.812)

(3CV-$Q_{SL}$: 0.885)

$\log_{10}SCB$ eq. (Eq. (12))

(Noh et al., 2021)

7.213$\times 10^{6}$

-19.896

0.743

(3CV-SSC: 0.765)

(3CV-$Q_{SL}$: 0.765)

$Q-Q_{SL}$ rating curve

(MoE, 2019)

9.373$\times 10^{6}$

-30.625

0.687

(3CV-$Q_{SL}$: 0.786)

$Q_{TL}$

SVR-$Q_{TL}$-

(This study)

2.814$\times 10^{4}$

0.143

0.999

(3CV-$Q_{TL}$: 0.860)

$Q-Q_{TL}$ rating curve

(MoE, 2019)

1.121$\times 10^{7}$

-29.170

0.715

(3CV-$Q_{TL}$: 0.816)

4.2 남평교 관측소 홍수사상 관측 결과

Fig. 7(a)는 관측기간 동안의 유량 및 부유사량 실측값을 빨간 화살표로, 유사량 추정 모형들의 시계열 추정 값을 모형에 따라 다른 색의 화살표로 나타낸 그림이다. Fig. 7(b)에는 수문조사보고서에 수록된 총유사량 추정 값을 빨간 화살표로 나타내고 SVR와 총유사량-유량 관계곡선에 의한 시계열 추정 값은 각각 검은색, 초록색 화살표로 구분했다. 각 화살표는 관측 횟수를 의미한다.

제시된 그림에서 부유사량과 총유사량에서 고리모양의 이력곡선이 나타나는 것을 확인할 수 있다. 수체의 후방산란 값을 바탕으로 유사량을 추정하는 세 모형(SVR-SSC, SVR-$Q_{TL}$, 그리고 Eq. (12))의 경우에는 이력현상의 존재를 재현해낼 수 있었다. 그러나 초록색으로 그려진 부유사량과 총유사량 관계곡선들은 유량과 유사량이 1대1 대응으로 나타나기 때문에 하천에서 발생하는 이력현상을 재현할 수 없었다. 이러한 유사량-유량 관계곡선의 이력현상 재현 여부 문제로 인해 특히 홍수사상의 첨두에서 오차가 두드러졌다.

유사량 실측값에서는 크게 두 개의 이력곡선이 구분되어 나타났다. 두 이력곡선 모두 시계방향으로 발달했으며 상대적으로 작은 이력곡선이 차지하는 범위가 큰 이력곡선 안에 포함되었다. Fig. 7-(a)와 (b)에서 유량이 400 m3 이하인 경우에는 하나의 유량 값에 4개의 유사량이 대응되는 것을 볼 수 있고 600 m3 이상에서는 2개의 유사량이 대응되었다. 또한 상승기보다 하강기에 더 많은 관측값이 분포한 것을 관찰할 수 있다. 이를 통해 유사량-유량 관계곡선은 작은 유량에서의 하강기를 더욱 잘 예측하도록 유도되어 고유량이 나타나는 홍수 사상의 상승기에 대한 예측력이 비교적 낮게 됨을 유추할 수 있다.

Fig. 7(a)를 보면 후방산란 기반 모형들은 유사량-유량 관계곡선에 비해 상대적으로 부유사량 곡선의 시간적 변동을 잘 모사하지만 유사량-유량 관계곡선들과 마찬가지로 상승기보다 하강기의 부유사량에서 정확도가 높았다. 고유량에서의 부유사량 예측 오차에도 불구하고 SVR-SSC 산출값을 이용하는 SVR-$Q_{TL}$은 상승기의 총유사량을 실측치에 가깝게 산정해낼 수 있었다.

여기서 추가로 관측된 이력곡선의 개수와 형태에 주목할 필요가 있다. 실측값에서는 시계방향으로 발달하는 두 이력곡선이 관측되었다. 시계방향으로 발달하는 이력곡선은 첨두유사량이 첨두유량보다 관측소에 먼저 도달하는 경우에 발생한다(Williams, 1989).

보다 높은 시간 해상도를 갖는 SVR 모형의 추정값을 보면 해당 홍수 사상에서 여러개의 곡선이 발생되었음을 관찰할 수 있다. 추가적으로 관측된 이력곡선들은 시계방향 단일폐곡선이 아니라 꼬인 형태로 국부적으로 반시계방향으로 발달한다. 이는 단일 홍수 사상의 유사량 계측 시기 사이사이에 추가적인 유사량의 지역 최댓값들이 존재했음을 암시한다.

또, 유량이 700 m3 이상일 때 유량이 증가함에도 유사량이 낮아지는 현상이 관찰되었다. 이러한 국부 최솟값을 SVR-SSC 모형이 5,000 t/d보다 낮게 추정했고, $\log_{10}SCB$에 대한 대수식(Eq. (12))은 보다 큰 값으로 추정했다.

이러한 해석을 뒷받침하기 위해 시계열 수문곡선을 Figs. 8 and 9에 도시하였다. 그림에서 정확도가 가장 높게 나타난 SVR 모형들을 대표로 해 갈색 파선으로, 유사량-유량 관계곡선식은 초록색 파선, 실측 부유사량 및 총유사량은 빨간 가위표, 그리고 유량을 파란 실선으로 표시했다. 그리고 유사량 계측이 실제로 이루어졌던 세 개의 홍수 사상을 대표로 확대해 제시했다.

Event 1의 그림을 보면 파선으로 그려진 두 예측 모형의 예측 결과 모두 유량이 서서히 상승하는 2019년 7월 19일 실측값과 유량이 급격하게 증가하는 20일에 부유사량을 저평가했다. Event 3의 두 번째 첨두유량 직전에 발생한 부유사량도 실측값이 두 예측값보다 높음을 확인할 수 있다. 하강기에서는 부유사량-유량 관계곡선이 부유사량을 과대평가했다. 반면 하강기에 발생한 유사량들은 SVR을 통해 산정한 값과 유사하다. 이는 위에서 논의된 상승기 부유사량에 대한 낮은 정확도에 상응하는 내용이다.

부유사량 수문곡선의 Event 1과 Event 2는 Event 3에 비해 단순한 유량 및 부유사량 곡선이 나타난다. 특히 하나의 유량과 부유사량에서 하나의 첨두가 관찰되고 부유사량의 첨두값이 유량의 첨두값보다 먼저 관측되었다. Event 3에서는 국부적으로 세 개의 첨두값이 관측되었다. 현장에서 실측이 이루어진 Event 3의 두 번째 첨두 홍수량에서도 부유사량 첨두가 선행하는 것을 볼 수 있다. 부유사량 첨두의 선행 현상은 실측 부유사량 이력곡선이 시계방향으로 발달한 것과 일치한다. 유사량-유량 관계곡선은 하나의 유량 값이 하나의 부유사량 값과 대응되기 때문에 첨두 부유사량이 발생하는 시간이 첨두 유량이 발생하는 시간과 일치한다는 차이점이 있다. 따라서 Fig. 7에서 나타난 바와 같이 지수함수 형태의 단순한 이력곡선 이외에는 예측이 불가능하다.

Event 3에서 부유사량의 실측은 두 번째 첨두의 상승부와 하강부, 그리고 세 번째 첨두의 하강부에서만 수행되었다. 실측 부유사량을 이으면 하나의 첨두값을 가지는 단순 부유사량 곡선이 형성된다. 이는 Event 3과 같이 유량의 첨두가 두 개 이상 나타나는 홍수 사상의 경우에도 이력곡선이 단순한 하나의 고리만을 형성하는 결과를 낳는다. SVR 모형은 실측값보다 높은 시간 해상도를 가지고 있기 때문에 Event 3의 의 첫 번째와 세 번째 첨두 유량이 발생함에 따른 부유사량의 기복을 관측하는 데에 성공했다. 세부적으로, 두 번째와 세 번째 첨두 유량이 발생할 때에 각 첨두 유량을 전후로 해 총 세 개의 첨두 부유사량이 발생했다. 이러한 복잡한 부유사량 거동은 유사량-유량 이력곡선에서 나타난 복잡한 고리들을 의미한다. 초록색 파선으로 표시된 부유사량-유량 이력곡선에서는 부유사량 실측 시 관찰할 수 없었던 두 개의 첨두값이 재현되었다. 그러나 이는 위에 언급한 바와 같이 유량의 기복을 그대로 따라간 것이기 때문에 첨두유량 앞뒤로 추가로 나타난 첨두값은 재현되지 못했다. Event 3에서 추가로 관측된 첨두 부유사량은 실측값만을 이용했을 때에는 규명이 불가능하다는 점에서 SVR 모형의 예측 결과가 실측값만 이용하거나 유사량-유량 이력곡선을 이용한 결과보다 더 많은 정보를 가지고 있다는 점을 알 수 있다.

총유사량 수문곡선의 형태는 유량이 많을 때에는 부유사량 수문곡선과 비슷한 형태를 가진다. 그러나 Event 2에서 7월 18일에서 7월 20일과 같이 상대적으로 유량이 작을 때에 나타나는 유사량의 변동이 더욱 크게 나타났다. SVR-SSC와 달리 SVR-$Q_{TL}$은 총유사량의 큰 변동에도 불구하고 Event 2의 유량 상승기에도 정확한 결과를 보였다. 낮은 유량일 때 뿐 아니라 유량이 컸던 Event 3의 두 번째 상승기에도 실측 참조값에 가까운 총유사량을 추정했다.

Fig. 8(b) and (c)에서 하강기 대부분의 기간에서 유사량-유량 관계곡선이 SVR-SSC보다 부유사량을 같거나 높게 평가한 것과 달리 Fig. 9(b) and (c)에서는 총유사량 유사량의 꼬리 부분이 역전되는 순간이 나타났다. 또 총유사량 수문곡선에서는 유량 상승기에 추가적인 지역 최댓값들이 나타났는데, 이는 부유사량 수문곡선에서는 돋보이지 않았던 것이다.

Fig. 8(a)Fig. 9-(a)를 보면 유사량이 약 $10^{2}$ t/d보다 작은 경우 SVR 모형을 이용한 추정값들에서 시간적으로 섭동이 크게 나타나는 것을 볼 수 있다. 이 섭동이 SVR 모형에 내재된 불확도에서 기인한 것인지 확인할 필요가 있는데 작은 변동 값이 SVR-$Q_{TL}$의 추정값에서 더욱 도드라졌기 때문에 총유사량과 유량이 낮은 때를 바탕으로 섭동 원인을 검토하였다.

Fig. 10는 Event 1과 상대적으로 유량이 낮았던 8월 5일에서 8월 18일 까지 나타난 총유사량의 섭동을 각각 확대한 그림이다. 여기서, 초록색 파선은 유사량-유량 관계곡선이 아닌 H-ADCP로부터 취득된 $SCB$값에서 최솟값을 뺀 것이다. 주의 깊게 살펴보아야 할 점은 갈색으로 표시된 총유사량 추정값의 변동이 초록색으로 그려진 후방산란 값의 변동을 따라간다는 점이다. 이를 바탕으로 미루어 보면 관측된 총유사량의 변동 값은 $SCB$값의 변동에 기인한 것으로 판단된다. 다만, ADCP음파의 후방산란강도는 부유사 이외에도 유기물(Hoitink and Hoekstra, 2005)이나 기포(Guerrero et al., 2012)가 존재하는 경우에도 증가하는 것으로 알려져 있다. 따라서 추후 연구를 통해 H-ADCP를 이용한 부유사 농도 모니터링의 불확도를 개선하기 위해 저유량에서 발생하는 후방산란 값 증가의 원인을 검토할 필요가 있다. 추가적으로, 빨간 상자에서의 유량 상승기나, 노란 상자에서는 유량 변동 시에 $SCB$가 다소 감소함을 볼 수 했다. 또한 이런 $SCB$의 변화가 주기성을 가지는 것을 보면 보 개방 등의 하천 수리 구조물 조정으로 인한 영향이 있을 것으로 판단된다.

Fig. 7. Estimated Discharge-Sediment Load Curves during Measurement Period: (a) $Q_{SL}$, (b) $Q_{TL}$
../../Resources/KSCE/Ksce.2023.43.3.0321/fig7.png
Fig. 8. Hydrographs for Suspended Loads ($Q_{SL}$) during the Measurement Period: (a) Whole Data, (b) Event 1, (c) Event 2, (d) Event 3
../../Resources/KSCE/Ksce.2023.43.3.0321/fig8.png
Fig. 9. Hydrographs for Total Loads ($Q_{TL}$) during the Measurement Period: (a) Whole Data, (b) Event 1, (c) Event 2, (d) Event 3
../../Resources/KSCE/Ksce.2023.43.3.0321/fig9.png
Fig. 10. Zoomed Up Sediment Fluctuations due to Raw Signal Fluctuations
../../Resources/KSCE/Ksce.2023.43.3.0321/fig10.png

5. 결 론

국내에서는 매년 홍수 시 현장에서 채취한 시료를 이용해 부유사 농도를 실측한 뒤 이를 바탕으로 수정 아인슈타인 방법을 적용하여 총유사량을 산정한다. 그러나 전통적 부유사 계측 방법의 비용적인 한계로 인해 부유사 농도 실측 횟수를 늘릴 수 없는 실정이다. 본 연구는 자동 유량 관측소에 설치된 H-ADCP로부터 취득된 원시자료로부터 자연하천의 총유사량을 산정하는 실시간 총유사량 관측 시스템을 제시하였으며, 제시한 유사량 모니터링 모형이 기존 유량-유사량 관계곡선보다 정확도, 이력현상 재현도 측면에서 정확함을 보였다.

본 연구에서 제시하는 실시간 총유사량 관측 시스템은 두 개의 SVR 모형으로 구성되어 있다. 첫 번째 SVR 모형은 수체의 후방산란값 $SCB$로부터 부유사 농도 $SSC_{SVR}$을 추정한다. 두 번째 모형은 부유사 농도와 유량을 입력으로 받아 수정 아인슈타인 방법을 이용한 총유사량 산정량에 근접한 결과를 생산하는 SVR 기반의 의사 수정 아인슈타인 방법 모형(pseudo modified Einstein method)이다.

개발된 유사량 모니터링 시스템의 유도에는 수문조사보고서에 수록된 남평교 관측소의 실측 부유사농도(부유사량) 그리고 총유사량 산정값이 이용되었다. SVR의 매개변수와 입력변수는 각각 격자검색기반 $K$겹 교차검증과 재귀적특징제거법을 이용해 결정되었다. 그 결과 SVR-SSC 모형의 입력변수는 유사보정후방산란($SCB$)가 최적의 입력변수로 결정되었으며 총유사량($Q_{TL}$) 산정에는 부유사농도와 유량이 중요한 것으로 나타났다. 유도된 모형들의 교차검증 정확도는 모두 $R^{2}$가 0.8 이상으로 나타났다.

4개월 동안의 모니터링기간에 발생한 홍수사상을 바탕으로 개발된 모형들의 현장 적용성을 평가했다. 개발된 총유사량 모니터링 시스템은 자연하천에서 발생하는 고리 형태의 유사량-유량 이력현상을 관측할 수 있었다. 부유사 실측에 의해서도 이력현상이 나타났으나 부유사 실측의 시간적 제약으로 인해 단순한 유사량-유사량 이력곡선을 형성했다. 반면 본 연구에서 제안하는 실시간 모니터링 시스템은 보다 높은 시간 해상도로(10분 간격) 유사량을 모니터링할 수 있어 실측에서 드러나지 않았던 이력곡선 등의 추가적인 유사이송 거동을 관측할 수 있음을 보였다.

본 연구에서 제안하는 총유사량 모니터링 시스템의 장점은 다음과 같다. 첫째, 기 모니터링된 자료가 있다면 추가적인 정보 없이 실시간으로 부유사농도와 총유사량을 정확하게 모니터링할 수 있다는 장점이 있다. 둘째, 본 모니터링 시스템은 자동 유량 관측소에 설치된 H-ADCP로부터 취득되는 원시자료만을 필요로 한다. 따라서 한 번 SVR 모형이 학습되면 총유사량 모니터링을 위해 추가적인 비용이 요구되지 않는다. 셋째, 수체의 후방산란을 통해 직접적으로 부유사량을 모니터링 후 유사량을 산정하기 때문에 기존 유사량-유량 관계곡선보다 물리적인 가정 아래 유도되었으며 유사량-유량 관계곡선으로 관측 불가능한 유사량-유량 이력현상 등을 관측할 수 있다. 더불어, 총유사량 모니터링 결과로부터 유사량의 유출 용적을 추정할 수 있기 때문에 추후 하천 및 해안 지역의 유사량 수지 분석 등의 연구 분야에서도 본 총유사량 모니터링 시스템이 활용될 수 있을 것으로 기대된다.

본 모니터링 시스템은 기존에 계측된 부유사 농도와 총유사량을 데이터모델로 유도한다는 특징이 있다. 때문에 다음과 같은 후속연구가 수행된다면 보다 양질의 총유사량 모니터링이 가능할 것으로 기대된다. 보다 신뢰도 있는 모형의 구축을 위해 더 많은 관측 자료를 확보하고 그에 따른 모형의 업데이트를 지속적으로 수행할 필요가 있다. 다음으로, 부유사 입자 이외에 기포 혹은 유기물 등 음파의 후방산란에 기여하는 다양한 요인들에 대해 분석하고 보정함으로써 H-ADCP 기반 부유사 농도 산정 기법의 신뢰도를 개선하는 연구가 필요하다. 또한, 현재 H-ADCP가 설치된 자동 유량 관측소 중에 유사량이 실측되지 않은 관측소가 혼재하는데 모형이 유도된 특정 지역에서만 유효하기 때문에 유사량 미계측 지역에 직접적으로 적용하는 데에 문제가 있다. 따라서 본 실시간 총유사량 모니터링 시스템과 Noh et al.(2021)이 제안한 방법과 같은 유사량 미계측 지역에서의 적용 방법이 함께 고려된다면 양질의 유사량 자료를 확보할 수 있을 것으로 기대된다.

감사의 글

본 연구는 환경부의 재원으로 한국환경산업기술원의 수요대응형 물공급서비스 연구사업의 지원을 받아 수행되었으며 이에 감사드립니다(2020002650001). 또한, 서울대학교 공학연구원의 지원에도 감사드립니다.

References

1 
Al-Mejibli, I. S., Alwan, J. K. and Abd, D. H. (2020). “The effect of gamma value on support vector machine performance with different kernels.” International Journal of Electrical and Computer Engineering, Vol. 10, No. 5, 5497.DOI
2 
Boser, B. E., Guyon, I. M. and Vapnik, V. N. (1992). “A training algorithm for optimal margin classifiers.” Proceedings of the Fifth Annual Workshop on Computational Learning Theory, pp. 144-152.DOI
3 
Chaudhry, M. H. (2008). Open-channel flow, Springer, NY, U.S., pp. 481.URL
4 
Colby, B. R. and Hembree, C. H. (1954). “Computations of total sediment discharge, Niobrara River near Cody, Nebraska.” Science, Vol. 119, No. 3097, pp. 657-658.DOI
5 
Cortes, C. and Vapnik, V. (1995). “Support-vector networks.” Machine Learning, Vol. 20, No. 3, pp. 273-297.DOI
6 
Downing, A., Thorne, P. D. and Vincent, C. E. (1995). “Backscattering from a suspension in the near field of a piston transducer.” The Journal of the Acoustical Society of America, Vol. 97, No. 3, pp. 1614-1620, doi: 10.1121/1.412100.DOI
7 
Drucker, H., Burges, C. J. C., Kaufman, L., Smola, A. and Vapnik, V. (1997). “Support vector regression machines.” Advances in Neural In-Formation Processing System, Vol. 9, pp. 155-161.URL
8 
Flammer, G. H. (1962). Ultrasonic measurement of suspended sediment, US Government Printing Office, Vol. 1141.URL
9 
Gellis, A. C. (2013). “Factors influencing storm-generated suspended-sediment concentrations and loads in four basins of contrasting land use, humid-tropical Puerto Rico.” Catena, Vol. 104, pp. 39-57.DOI
10 
Guerrero, M., Rüther, N. and Szupiany, R. N. (2012). “Laboratory validation of acoustic Doppler current profiler (ADCP) tech- niques for suspended sediment investigations.” Flow Measurement and Instrumentation, Vol. 23, No. 1, pp. 40-48.DOI
11 
Guyon, I., Weston, J., Barnhill, S. and Vapnik, V. (2002). “Gene selection for cancer classification using support vector machines.” Machine Learning, Vol. 46, No. 1-3, pp. 389-422.DOI
12 
Haught, D., Venditti, J. G. and Wright, S. A. (2017). “Calculation of in situ acoustic sediment attenuation using off‐the‐shelf horizontal ADCPs in low concentration settings.” Water Resources Research, Vol. 53, No. 6, pp. 5017-5037.DOI
13 
Hoitink, A. J. F. and Hoekstra, P. (2005). “Observations of suspended sediment from ADCP and OBS measurements in a mud-dominated environment.” Coastal Engineering, Vol. 52, No. 2, pp. 103-118.DOI
14 
Landers, M. N. (2012). Fluvial suspended sediment characteristics by high-resolution, surrogate metrics of turbidity, laser- diffraction, acoustic backscatter, and acoustic attenuation, Ph. D. Thesis, Dept. of Civil and Environ. Eng., Georgia Inst. of Technol., Atlanta, Ga.URL
15 
Landers, M. N., Straub, T. D., Wood, M. S. and Domanski, M. M. (2016). Sediment acoustic index method for computing continuous suspended-sediment concentrations, No. 3-C5. US Geological Survey.DOI
16 
Ministry of Environment (MoE) (2019). Hydrological annual report in Korea (in Korean).URL
17 
Noh, H., Son, G., Kim, D. and Park, Y. S. (2021). “Clustering of sediment characteristics in South Korean Rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique.” Journal of Korea Water Resources Association, Vol. 55, No. 1, pp. 43-57 (in Korean).DOI
18 
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M. and Duchesnay, E. (2011). “Scikit-learn: Machine learning in python.” Journal of Machine Learning Research, Vol. 12, pp. 2825-2830.URL
19 
Raghavendra, N. S. and Deka, P. C. (2014). “Support vector machine applications in the field of hydrology: A review.” Applied Soft Computing, Vol. 19, pp. 372-386.DOI
20 
Rajaee, T., Nourani, V., Zounemat-Kermani, M. and Kisi, O. (2011). “River suspended sediment load prediction: application of ANN and wavelet conjunction model.” Journal of Hydrologic Engineering, Vol. 16, No. 8, pp. 613-627.DOI
21 
Schulkin, M. and Marsh, H. W. (1962). “Sound absorption in sea water.” The Journal of the Acoustical Society of America, Vol. 34, No. 6, pp. 864-865.DOI
22 
Sheng, J. and Hay, A. E. (1988). “An examination of the spherical scatterer approximation in aqueous suspensions of sand.” The Journal of the Acoustical Society of America, Vol. 83, No. 2, pp. 598-610.DOI
23 
Smola, A. (1996). Regression estimation with support vector learning machines, MSc Thesis, The Technical University, München, Germany.URL
24 
Son, G. (2021). Riverine sediment load measurement technique using acoustic doppler current profilers considering hysteresis. Ph. D. Thesis, Dankook University (in Korean).URL
25 
Topping, D. J., Wright, S. A., Melis, T. S. and Rubin, D. M. (2006). “High-resolution monitoring of suspended-sediment concentration and grain size in the Colorado River using laser-diffraction instruments and a three-frequency acoustic system.” Proceedings of the 8th Federal Interagency Sedimentation Conference, Reno, Nev., U.S. Geological Survey, pp. 539-546.URL
26 
Topping, D. J., Wright, S. A., Melis, T. S. and Rubin, D. M. (2007). “High-resolution measurements of suspended-sediment concen- tration and grain size in the Colorado River in Grand Canyon using a multi-frequency acoustic system.” Proceedings, 10th International Symposium on River Sedimentation, August 1-4, 2007: Moscow, Russia, Vol. 3, pp. 330-339.URL
27 
Urick, R. J. (1948). “The absorption of sound in suspensions of irregular particles.” The Journal of the Acoustical Society of America, Vol. 20, No. 3, pp. 283-289.DOI
28 
Urick, R. J. (1975). Principles of underwater sound for engineers, McGraw Hill, NY, U.S., p. 384.URL
29 
Venditti, J. G., Church, M., Attard, M. E. and Haught, D. (2016). “Use of ADCPs for suspended sediment transport monitoring: An empirical approach.” Water Resources Research, Vol. 52, No. 4, pp. 2715-2736.DOI
30 
Williams, G. P. (1989). “Sediment concentration versus water discharge during single hydrologic events in rivers.” Journal of Hydrology, Vol. 111, pp. 89-106.DOI
31 
Zounemat-Kermani, M., Mahdavi-Meymand, A., Alizamir, M., Adarsh, S. and Yaseen, Z. M. (2020). “On the complexities of sediment load modeling using integrative machine learning: Application of the great river of Loíza in Puerto Rico.” Journal of Hydrology, Vol. 585, 124759.DOI