The Journal of
the Korean Society on Water Environment

The Journal of
the Korean Society on Water Environment

Bimonthly
  • ISSN : 2289-0971 (Print)
  • ISSN : 2289-098X (Online)
  • KCI Accredited Journal

Editorial Office


  1. 경북대학교 에너지환경연구소 (Energy and Environment Institute, Kyungpook National University)
  2. 경북대학교 미래과학기술융합학과 (Department of Advanced Science and Technology Convergence, Kyungpook National University)



Bayesian calibration, Biophysicochemical process, Kinetics, Mathematical model, Parameter estimation

1. Introduction

물환경 및 수처리공정에서 발생하는 다양한 현상들을 이해하고 제어하기 위해서, 과학자 및 공학자들은 생물-물리-화학 공정(반응)들의 동역학을 규명하고 다양한 예측 모델을 수립하는 노력을 기울여왔다. 예를 들어, 하폐수처리 활성슬러지 공정에서 일어나는 생화학적 반응들을 이해하고 예측하기 위하여, 미국-유럽지역 연구자들을 중심으로 1980년대부터 활성슬러지모델(Activated Sludge Model, ASM)이란 연립미분방정식 기반 수학적 모델을 개발하여 왔다. 현재 ASM 모델은 하수처리장 공정 예측을 위한 대부분의 상용(Commercial) 소프트웨어의 기초 모델로 활용되고 있다(Duarte et al., 2024; Jeppsson, 1996; Van Loosdrecht et al., 2015). 다른 예로써, 물환경 및 수처리공정에서 발생하는 입자 응집 현상에 대하여, 입자 개체군수지식(Population Balance Equation, PBE)을 활용하여 물환경 부유입자 응집 반응을 연립미분방정식 형태의 수학적 모델로 구현하여 예측하고 있다(Kim and Lee, 2020; Lee et al., 2011). 이와 같이, 물환경 및 수처리공정 예측을 위한 다양한 노력이 이뤄져 왔으며, 그 결과 다양한 수학적 예측 모델이 개발, 활용되고 있다.

최근 동역학 기반 수학적 예측 모델과 함께, 물환경 및 수처리공정 예측을 위하여 머신러닝을 비롯한 데이터 기반 인공지능 기법이 활용되고 있다(Duarte et al., 2024). 인공지능 기법은 일종의 블랙박스 모델로써 생물-물리-화학적 공정(반응) 동역학에 기반하지 않고, 다양한 경로로 획득된 데이터를 기반으로 미래를 예측하는 모델이다. 즉, 시스템 내부에서 일어나는 매커니즘을 이해하지 않고서도, 충분한 데이터만 확보된다면 시스템 예측 결과를 도출할 수 있다. 하지만, 역설적으로, 데이터 기반 인공지능 기법은 데이터의 질적, 양적 기준을 확보하지 못하면 양질의 예측 결과를 도출할 수 없다. 예를 들어, 하수처리장 수질인자의 안정적인 관측 기술이 존재하지 않는다면, 하수처리장 공정 예측을 위한 데이터 기반 인공지능 기법의 활용에 제한이 있을 수 있다. 하지만, 생물-물리-화학 공정(반응) 동역학에 기반한 수학적 예측 모델은, 모델 검보정 외 관측 데이터 의존성이 크지 않으며, 가상현실(디지털 트윈)로써 데이터와 무관하게 독립적으로 구동될 수 있다.

동역학 기반 수학적 모델은 다수의 데이터-모델 접합(Fitting) 매개변수(상수)를 가지며 이들 매개변수가 모델 예측 결과를 제어하므로, 사용자는 매개변수를 합리적으로, 엄격하게 산정하여 모델에 반영하여야 한다. 하지만, 다수 매개변수를 다루기는 쉽지 않은 작업이며, 대부분 사용자는 경험을 바탕으로 임의적으로 모델 매개변수를 선택한다. 하수처리장 활성슬러지공정 시뮬레이션을 위한 ASM 모델은 30~40여개의 매개변수를 가지며, 사용자가 다수 매개변수를 합리적으로 선택하기가 쉽지 않다(Gujer et al., 1999; Jeppsson, 1996). 최근 다양한 매개변수 평가 기법들이 개발되었으나, 본 연구에서는 최적 접합 매개변수 평가뿐만 아니라, 매개변수 간 상관관계 및 매개변수 변화에 따른 모델 민감도(Sensitivity)까지 평가 가능한 베이지안 보정(Bayesian Calibration) 기법을 선택하였다(Vrugt, 2016; van Turnhout et al., 2016).

베이지안 보정 기법은 Bayes 정리를 기반한 매개변수 추정의 통계적 접근법으로써, 실험 데이터와 모델 예측치 간 최적 접합 매개변수를 산출한다. 베이지안 보정은 실험 데이터와 함께 매개변수의 사전 분포(Prior Distribution)를 기반으로 우도함수(Likelihood Function)을 계산함으로써 매개변수의 불확실성을 고려한 매개변수의 사후분포(Posterior Distribution)를 계산한다(Vrugt, 2016). 따라서, 베이지안 보정 기법은 실험-예측치 간 최적 접합 기준을 만족하는 다수의 매개변수 추정치들을 산출하며, 일반적으로 매개변수의 사후분포는 최빈값과 불확실성을 내포한 정규분포 형태가 된다. 베이지안 보정 기법은 매개변수의 불확실성이 큰 수문 모델(Hydrological Model)에 주로 활용되어 왔으며(Vrugt, 2016), 또한 생물/생태 동역학 모델에 적용된 바 있다(van Mourik et al., 2014; van Turnhout, 2016). 수문 및 생물/생태 동역학 모델은 복잡다단한 지구환경과 생체 현상을 다루므로, 모델 매개변수의 불확실성은 필연적으로 나타난다. 물환경 및 수처리 공정 또한 불확실성을 크게 내포하며, 베이지안 보정 기법을 활용한 매개변수 추정이 필요한 분야로 판단된다. 특히, 베이지안 보정 기법을 국내외 구축된 하천⋅호수 수질 모델(QUAL, WASP 등), 유역 환경 모델(HSPF, SWAT 등), 수처리 공정 모델(GPS-X, BIOWIN 등)과 연계 활용한다면, 불확실성을 내포한 모델 매개변수를 체계적, 과학적으로 평가할 수 있다.

본 연구는 베이지안 보정 기법을 물환경 및 수처리공정에서 일어나는 생물-물리-화학 공정(반응)의 대표 사례에 적용함으로써, 베이지안 보정 기법의 물환경 분야에서의 적용성을 평가, 소개하고자 한다. 하폐수처리장 활성슬러지공정의 종속영양미생물 성장-사멸 동역학과 물환경 부유입자 응집 동역학 배치 실험 데이터와 연립미분방정식 기반 수학적 모델을 활용하여, 최적 접합 매개변수 산정 방법으로써 베이지안 보정 기법의 물환경 분야 적용 가능성을 평가하였다. 물환경 분야의 연구자/공학자가 본 연구에 적용, 평가된 베이지안 보정 기법을 활용하게 되면, 기존 경험적, 임의적 매개변수 선택의 한계를 벗어나 이론적, 합리적인 매개변수 선택과 모델 운용을 할 수 있으리라 기대한다.

2. Materials and Methods

2.1 활성슬러지 종속영양미생물 성장-사멸 동역학 배치 실험

하수에 포함된 Readily Biodegradable COD (RBCOD)와 하수처리 시스템 활성슬러지의 호기성 미생물 분율을 정량 분석을 위하여 미생물 성장-사멸 동역학 실험(Microbial Growth Kinetic Test)을 수행하였다(Choi et al., 2017; Lee et al., 2006; Wentzel et al., 1995). Modified Ludzack-Ettinger (MLE) 타입 하수처리 시스템에서 추출한 활성슬러지와 하수를 혼합하여 3 L 회분식(Batch) 반응기에 투여 후 실험을 진행하였다(Fig. 1a). 반응기 용존산소 측정을 위한 용존산소 프로브(YSI Inc., 미국)와 산소 공급을 제어할 수 있는 PLC 시스템을 활용하여, 회분식 실험이 진행되는 동안 산소호흡율(Oxygen Uptake Rate, OUR)를 지속적으로 측정하였다. 용존산소 농도가 2 mgO/L 이하로 하락하면 산소공급이 자동으로 시작되며, 4 mgO/L 이상에 도달하면 산소공급이 차단되고, 산소공급이 중단된 기간 동안 측정된 용존산소 농도 저감율을 바탕으로 산소호흡율을 산정하였다. 또한, 회분식 실험이 진행되는 동안, 일정 시간 간격으로 여과 샘플을 확보하여 질산염 및 아질산염 분석을 수행하였고 질산화에 따른 산소호흡율을 산정하였다. 본 연구는 유기물 분해 종속영양미생물(Ordinary Heterotrophic Organisms)에 한정하여 미생물 성장-사멸 동역학 모델을 수립하였으므로, 질산화에 따른 산소호흡율(OURN)을 총 산소호흡율(OURT)에서 감하여 계산한 종속영양미생물에 의한 산소호흡율(OURH)을 모델 매개변수 보정 작업의 실험데이터로 활용하였다(Fig. 1). 회분식 실험 시작과 종료 시 샘플에 대한 COD 농도를 측정하여 COD 물질수지 수립에 활용하였다. 미생물 성장 동역학 실험의 산소호흡율 자료에 대하여 해석적 계산법(Analytical Solution)을 적용하면, 하수의 RBCOD 분율과 활성슬러지에 포함된 호기성 미생물 분율을 산출할 수 있다(Lee et al., 2014; Wentzel et al., 1995). 하지만, 본 연구는 해석적 계산법을 적용하지 않고 연립 미분방정식 형태의 수학적 모델을 베이지안 보정 기법과 연계하여 하수 RBCOD 분율과 활성슬러지 호기성 미생물 분율을 산정하였다.

Fig. 1. (a) Schematic diagram of a batch test for microbial growth kinetics, and (b) Experimental results obtained from the batch test (i.e., changes of nitrate and nitrite concentration and oxygen uptake rate). OURTindicates total oxygen uptake rate. OURNand OURHindicate oxygen uptake rates by nitrification and heterotrophic microorganisms, respectively.
../../Resources/kswe/KSWE.2024.40.4.179/PICAC3.png

2.2 응집 동역학 실험

응집 동역학의 최적 모델 계수 산정 도구로써 베이지안 보정 기법의 활용성을 평가하기 위하여 응집 동역학 테스트를 수행하였다. 생체고분자물질(Extracellular Polymeric Substances)의 일종인 Xanthan Gum (Sigma-Aldrich, USA)과 점토질 입자를 포함한 현탁액을 사용하여 2 L 표준 쟈테스터(Phipps and Bird, USA)에서 응집 동역학 테스트를 수행하였다(Kim and Lee, 2020). Xanthan Gum은 다당류 중합체로써 입자 응집을 증진시키는 것으로 알려져있다(Villacorte et al., 2015). 또한, 0.1~4.0 μm 크기 분포의 Kaolinite (Sigma-Aldrich, USA)를 점토질 입자로써 실험에 사용하였다. 응집 동역학 실험 시작 후 2분 동안, 반응조 현탁액을 200 rpm으로 급속 혼합하였으며, 이후 응집 동역학이 평형 상태에 도달할 때까지 현탁액의 난류 강도를 제어하기 위해 혼합속도를 100 rpm으로 고정하여 교반하였다. 응집 동역학 실험을 진행하는 동안, 반응조와 광산란식 입도분석기(LISTT-200X, Sequoia Inc., USA)를 6mm 튜브와 정량펌프로 연결하여 현탁액의 입도 분포를 실시간 관측하였다(Fig. 2a). LISST-200X 입도 분석기는 Mie 산란 이론에 기반하며 레이저가 수중 입자에 부딪힐 때 산란되는 빛을 분석하여 입도분포를 실시간 분석하는 장비로써, 본 연구의 연속류 흐름(Flow-through) 장치와 연계하여 매 30초 간격으로 반응조 내 입도분포를 관측하였다. 현탁액의 입자 농도가 높을 경우, 광산란식 입도분석기는 레이저 경로상 중첩에 의한 오류가 발생하므로, 본 연구의 점토질 현탁액의 농도는 0.12 g/L으로 제한하였다. 관측된 입도 분포는 응집 동역학 모델의 주요 종속변수인 응집체 평균 직경(DF)과 부피 분율(VF)을 환산되어, 응집 동역학 모델과 베이지안 보정 기법 적용성 평가에 활용되었다(Fig. 2b).

Fig. 2. (a) Schematic diagram of the batch test for flocculation kinetics and real-time measurement of floc size distribution, (b) Experimental results obtained from the batch test (i.e., mean diameter and volumetric fraction of flocs).
../../Resources/kswe/KSWE.2024.40.4.179/PICAE3.png

2.3 활성슬러지 종속영양미생물 성장-사멸 동역학 모델

본 연구의 생물학적 공정(반응) 동역학에 대한 베이지안 보정 기법 적용성 평가를 위하여, ASM1 (Activated Sludge Model No.1) 모델에 기반한 호기성 종속영양미생물 성장 동역학 모델을 활용하였다(Henze et al., 1987; Jeppsson, 1996). ASM1 호기성 미생물 성장 동역학 모델은 Monod 타입 모델을 기초로 최대 성장속도 상수와 반포화 상수를 포함한 성장 동역학과 1차 반응식 형태의 미생물 사멸(자가분해) 동역학으로 구성되며(Equation 1), 미생물 기질(먹이)은 빠르게 분해되는 Readily Biodegradable COD (RBCOD)와 느리게 분해되는 Slowly Biodegradable COD (SBCOD)로 구성된다(Equation 2~3). 특히, SBCOD는 미생물 가수분해(Hydrolysis) 작용에 의해 일정 분량은 RBCOD로 변환되며 나머지는 난분해성물질로 변환되는 것으로 가정된다. 미생물 성장 동역학 모델은 각 호기성 미생물, RBCOD, SBCOD에 대한 연립 미분방정식 형태로 구성되며, 산소소모율(Oxygen Uptake Rate; OUR)은 시스템의 상태 변수로써 산출될 수 있다(Equation 4). 호기성 미생물 성장 동역학의 연립미분방정식은 Matlab (The MathWorks Inc., USA) 내장함수를 활용하여 적분되었으며, 베이지안 보정 기법과 연계하여 다수 모델 매개변수 조합에 대하여 연립미분방정식을 반복적으로 연산하였다. 호기성 미생물 성장 동역학의 연립미분방정식 계산을 위한 Matlab 코드는 Appendix 1~3에 수록하였다.

(1)
d X H d t = μ H S S K S + S S X H - b H X H
(2)
d S S d t = - 1 Y H μ H S S K S + S S X H + k H X S   /   X H K X + X S   /   X H X H
(3)
d X S d t = 1 - f p b H X H - k H X S   /   X H K X + X S   /   X H X H
(4)
d O d t = O U R = - 1 - Y H Y H μ H S S K S + S S X H

여기서, XH = 호기성 미생물 농도 (mgCOD/L), SS = Readily Biodegradable COD (RBCOD) 농도 (mgCOD/L), XS = Slowly Biodegradable COD (SBCOD) 농도, YH = 기질의 생체 전환율 (-), μH = 최대 성장속도 상수 (/d), KS = RBCOD 분해 반포화 상수 (mgCOD/L), kH = 가수분해 속도 상수 (/d), KX = SBCOD 분해 반포화 상수 (mgCOD/L), fp = SBCOD 가수분해에 따른 난분해성물질 전환율 (-), bH = 호기성 미생물 자가분해 상수 (/d), O = 용존산소 농도 (mgO/L), 그리고 OUR = 산소소모율 (mgO/L/d). 본 연구의 베이지안 보정 기법 적용 시, 배치 실험에서 획득된 종속영양미생물의 산소호흡율(OURH) 데이터를 실험-모델 접합을 위한 상태 변수로 활용하였으며, 미생물 성장 동역학 모델 매개변수 4개(μH, KS, kH, KX) 그리고 각 종속변수 초기값 3개(XH,0, SS,0, XS,0)를 데이터-모델 접합(Fitting) 계수로 활용하였다. 미생물 사멸 동역학 계수 bH 및 화학양론 계수 YH, fp는 불확실성이 크지 않으므로 ASM1 모델에서 제시된 대푯값(0.62, 0.67, 0.08)을 사용하였다(Henze et al., 1987; Lee et al., 2014) (Table 1; Appendix 2).

Table 1. Variables and parameters of ordinary heterotrophic microbial growth-decay kinetic model categorized for purposes in numerical simulation and fitting analysis (Lee et al., 2014)
Category Symbol Definition Text in the code* Remarks
Dependent variables XH Microorganism concentration [mgCOD/L] y(1)
SS Readily biodegradable COD [mgCOD/L] y(2)
XS Slowly biodegradable COD [mgCOD/L] y(3)
State variables OUR Oxygen Uptake Rate [mgO/L/d] OURate Data for fitting analysis
Initial conditions XH,0 XH at t=0 [mgCOD/L] y0(1) Fitting parameters
SS,0 SS at t=0 [mgCOD/L] y0(2)
XS,0 XS at t=0 [mgCOD/L] y0(3)
Kinetic parameters μH Max. specific growth rate [/d] mu_h Fitting parameters
KS Half saturation coeff. for growth [mgCOD/L] k_s
kh Max. specific hydrolysis rate [/d] k_h
KX Half saturation coeff. for hydrolysis [-] k_x
bH Heterotrophic decay rate [/d] b_h Fixed parameters
Stiochiometric constants YH Heterotrophic yield coefficient [-] y_h Fixed parameters
fp Biomass fraction yielding fragments [-] f_p
* See the numerical code in Appendices 1~3

2.4 응집 동역학 모델

본 연구의 응집 공정(반응) 동역학에 대한 베이지안 보정 기법 적용성 평가를 위하여, 이군집(Two-Class) 응집 동역학 모델을 적용하였다(Lee et al., 2011). 물환경에서 생체고분자물질(EPS) 매개되는 응집은 응집핵(Flocculi)과 응집체(Floc) 이군집 입도분포를 형성하는 것으로 알려져 있다(Kim and Lee, 2020; Lee et al., 2012). 따라서, 본 연구는 입경이 고정된(~5 μm)을 가진 응집핵(Flocculi)과 변화(성장)하는 입경을 가진(10~500 μm) 응집체(Floc)로 구성된 이군집입자개체군수지식(Two Class Population Balance Equation; TCPBE)을 적용하였다. TCPBE는 응집핵 농도(dNP/dt), 응집체 농도(dNF/dt) 및 플록에 결합된 응집핵의 총 농도(dNT/dt)의 시간 변화율을 예측하는 연립 미분방정식 형태로 구성된다(Equation 5~7). TCPBE는 응집체에 결합된 응집핵의 수(NC)를 응집체 크기 지표로 사용하였으며, 충돌 빈도 인자(β)와 응집체 파괴 동역학 상수(aF)에 대한 커널은 수체 전단력(G) 및 응집체 크기와 상관한 공식을 사용하였다(Equation 8~9)(Burd and Jackson, 2002; Lee et al., 2011). TCPBE 연립미분방정식은 Matlab (The MathWorks Inc., USA) 내장함수를 활용하여 적분되었으며, 베이지안 보정 기법과 연계하여 다수 모델 매개변수 조합에 대하여 연립미분방정식을 반복적으로 연산하였다. TCPBE 연립미분방정식 계산을 위한 Matlab 코드는 Appendix 4~6에 수록하였다.

(5)
d N P d t = - 1 2 α P P   β P P   N P   N P   N C N C - 1 - α P F   β P F   N P   N F + f N C     a F   N F
(6)
d N F d t = 1 2 α P P   β P P   N P   N P   1 N C - 1 - 1 2 α F F   β F F   N F   N F +     a F   N F
(7)
d N P d t = 1 2 α P P   β P P   N P   N P   N C N C - 1 + α P F   β P F   N P   N F - f N C     a F   N F
(8)
β i j = 1 6 D i + D j 3   G
(9)
a F = E b G D F - D P D P p μ G F y   /   D F       2 q    

여기서, DPDF는 각각 응집핵, 응집체의 평균 직경을 나타낸다. f는 응집체 파괴에 의해 생성된 응집핵의 분율이다. αPP, αPF, αFF는 각각 응집핵-응집핵, 응집핵-응집체, 응집체-응집체 충돌 시 최종 부착되는 충돌 효율을 나타내며, 일반적으로 모델 보정 매개변수로 사용된다. 충돌 빈도 인자(β)는 수체 난류에 따른 입자 충돌의 확률을 나타내며, 아래첨자 ij는 응집체(P) 또는 응집체(F)를 나타낸다. Eb는 응집체 파괴 동역학의 효율, μ는 유체의 절대 점도, G는 전단 속도, Fy는 응집체 전단 강도, pq는 실험적으로 결정된 경험적 매개변수이다. 본 연구의 베이지안 보정 기법 적용 시, 응집 동역학 실험에서 획득된 응집체 평균입경(DF) 및 부피분율(VF)을 실험-모델 접합을 위한 상태 변수로 활용하였으며, 충돌 효율 인자(αPP, αPF, αFF), 응집체 프랙탈 상수 (nf), 응집체 파괴 동역학의 경험적 매개변수(Eb, p, q), 응집체 파괴에 의해 생성된 응집핵 분율(f)을 데이터-모델 접합 매개변수로 활용하였다. 이와 더불어, 응집핵의 초기 부피분율(VP,0)을 실험-모델 접합 매개변수로 활용하여 TCPBE 연립미분방정식의 초기조건(NP,0,, NF,0,, NT,0)을 산출하였다(Table 2; Appendix 5). 불확실성이 비교적 작은 응집 동역학 매개변수(Fy)는 기존 문헌의 대푯값(1.0×10-10)을 적용하였으며(Winterwerp and van Kesteren, 2004; Lee et al., 2011), 반응조 유체 흐름 및 입자 특성 매개변수들은 표준 및 실측값(μ= 1.0×10-6, G = 95, DP = 5.0×10-6, ρP = 2500, DF,0 = 15.0×10-6, Cmass = 0.12)을 활용하였다(Table 2).

Table 2. Variables and parameters of the two-class flocculation kinetic model categorized for purposes in numerical simulation and fitting analysis (Lee et al., 2011)
Category Symbol Definition Text in the code* Remarks
Dependent variables NP Number concentration of flocculi [/m3] y(1)
NF Number concentration of flocs [/m3] y(2)
NT Number conc. of flocculi bound in flocs [/m3] y(3)
State variables DF Mean diameter of flocs [m] fdia Data for fitting analysis
VF Volume fraction of flocs [-] ffrac
Initial conditions NP,0 NP at t=0 y0(1) Dependent on VP,0
NF,0 NF at t=0 y0(2)
NT,0 NT at t=0 y0(3)
VP,0 Volume fraction of primary particles at t=0 [-] pfrac_ini Fitting parameters
Kinetic parameters αPP collision efficiency factor of flocculi [-] alpha1 Fitting parameters
αPF collision efficiency factor b/t flocculi & flocs [-] alpha2
αFF collision efficiency factor of flocs [-] alpha3
nf Fractal dimension of floc [-] nfrac
Eb Breakage coefficient [s0.5/m] brk_eb
p Empirical parameter of breakage kinetics [-] brk_p
q Empirical parameter of breakage kinetics [-] brk_q
f Fraction of flocculi by breakage [-] brk_f
Fy Yield strength of flocs [10-10Pa] brk_fy Fixed parameters
Flow conditions μ Absolute viscosity of the fluid [N s/m2] mu Fixed parameters
G Fluid turbulent shear rate [/s] shear
Particle properties DP Mean diameter of primary particles [m] dp Fixed parameters
ρP Density of primary particles [g/L] pdens
DF,0 Mean diameter of flocs at t=0 [m] df_ini
Cmass Mass concentration of particles [g/L] pconc
* See the numerical code in Appendices 4~6

2.5 베이지안 보정 기법

베이지안 보정 기법은 베이지안 추론(Bayesian Inference)을 기반하는 확률론적 데이터-모델 보정 방법으로써, 관측 데이터-모델 결과 간 최적 보정(Fitting) 매개변수를 확률론적으로 추론하는 방법이다. 베이지안 보정 기법은 알려진 데이터를 기반으로 미지의 사후 분포를 추론하는 방법론이다(Equation 10). 베이지안 보정 기법은 비선형 또는 선형 관계를 설명할 수 있으며, 모델의 불확실성 정량 평가할 수 있는 장점을 가진다(Beckers et al. 2020).

(10)
P   X       y ~   = P   X     L X       y ~    

본 연구에서는 베이지안 추론을 기반으로 하는 DREAM (Differential Evolution Adaptive Metropolis) 소프트웨어 패키지(https://faculty.sites.uci.edu/jasper/software/)를 사용하여 미생물 성장-사멸 동역학 및 응집 동역학 모델 매개변수를 추정하였다. 베이지안 보정의 결과는 실험 및 관측 데이터에 대하여 모델 접합(Fitting) 매개변수의 불확실성을 반영하여 매개변수의 사후 확률 분포를 나타낼 수 있다. 매개변수의 사후 분포는 사전 분포와 실험/관측 데이터(e.g., 미생물 성장-사멸 동역학 실험의 산소호흡률, 응집 동역학 실험의 응집체 크기 및 분율)를 고려한 매개변수의 확률(빈도) 함수로부터 계산된다. 본 연구는 베이지안 보정 기법의 적용에 초점을 두었으며, 자세한 수학적 알고리즘은 DREAM 개발자가 출간한 연구논문에 수록되어 있다(Vrugt, 2016).

3. Results and Discussion

3.1 최적 접합 매개변수 추적 알고리즘

본 연구의 베이지안 보정 기법은 DREAM 소프트웨어(Vrugt, 2016)를 사용하였으며, 특별히 DREAM(ZS) 알고리즘을 사용하여 최적 접합 매개변수 추적하였다. Fig. 3(a)와 같이, DREAM(ZS) 알고리즘은 병렬연산(Parallel Computation)을 활용하여 1회 계산 배치에 독립적인 3개 매개변수 조합에 대하여 시뮬레이션을 동시에 수행하여 연산 시간을 단축하였다. 각 회차 계산 배치의 연산 결과를 바탕으로 최적 접합에 더 근접한 매개변수를 도출하여 후속 연산에 활용하므로, 시뮬레이션 결과가 점진적으로 최적 접합에 도달하게 된다. 본 연구의 미생물 성장-사멸 동역학 XH,0 매개변수 경우, 대략 1,000회 계산 배치 수행 후 최적값인 49.2 mg/L에 도달하는 것으로 나타났다(Fig. 3a). 또한, 계산 배치가 진행되면서 더 이상 발산하지 않고 안정화되는 여부(Convergence)를 판단하기 위하여 R-diaganostic 인자를 바탕으로 결정된다(Gelman and Rubin, 1992). 본 연구 미생물 성장-사멸 동역학 테스트의 경우, 12,000회 계산 배치 후 안정화에 도달하는 것으로 나타났다(Fig. 3b).

Fig. 3. (a) Trace plot of sampled values of a fitting parameter (XH,0of the microbial growth-decay kinetics), and (b) Evolution of theRconvergence diagnostic ofGelman and Rubin (1992).
../../Resources/kswe/KSWE.2024.40.4.179/PICB13.png

3.2 미생물 성장-사멸 동역학

미생물 성장-사멸 동역학 배치 실험을 수행하여 획득한 산소호흡율(OUR) 곡선은 Fig. 4 같이 나타나며, 실험초기 호기성 미생물의 RBCOD 분해에 의해 OUR의 급격한 증가가 나타나며 RBCOD 분해가 종료되는 시점에 OUR이 급격히 하락하며, 이후 SBCOD 및 미생물 자가분해(사멸)에 따라 OUR이 일정하게 유지되는 경향을 가진다. 미생물 성장-사멸 동역학 실험의 이와 같은 OUR 변화 경향을 활용하여 하수에 포함된 RBCOD 농도(SS,0)를 계산할 수 있으며, 또한 활성슬러지의 호기성 미생물 농도(XH,0) 계산에 활용할 수 있다(Lee et al., 2014; Wentzel et al., 1995).

Fig. 4. Time series of oxygen uptake rate measured (dotted), best-fit simulation (red line), and 95% simulation uncertainty intervals due to total uncertainty (gray band).
../../Resources/kswe/KSWE.2024.40.4.179/PICB33.png

기존의 RBCOD 및 호기성 미생물 농도 계산은 연립미분방정식을 간략화, 실험 데이터에 선형화된 모델을 최적 접합(Fitting)하는 해석적 계산법(Analytical Methods)을 활용하였으나, 본 연구는 베이지안 보정 기법을 활용하여, 비선형 연립미분방정식 변경 없이, 사용자가 정의한 모델 매개변수의 사전 분포(Prior Distribution)에 대한 결과, 즉 사후 분포(Posterior Distribution)를 확률론적인 기법으로 산출하게 된다. Table 3과 같이, 사용자가 정의한 일정 범위를 가진 모델 매개변수의 사전 분포(Prior Distribution) 값(수천~수만 개)들에 대하여 연립미분방정식을 연산하고 데이터-모델 접합도를 평가함으로써 사후 분포(Prior Distribution) 값들을 얻게 된다. 본 연구에서는 번거로운 모델의 선형화, 단순화 과정 없이, 호기성 미생물 성장 동역학 모델의 주요 매개변수인 하수 RBCOD 농도(SS,0), 활성슬러지 미생물 농도(XH,0)를 평가할 수 있었다. 다만 베이지안 보정 기법은 수천~수만 개 연립미분방정식 풀이 연산을 해야 하지만, 현재의 가정용 PC 수준으로도 10분 내로 결과를 도출할 수 있다.

Table 3. Prior distribution and posterior mean of model-data fitting parameters of microbial growth-decay kinetics used in Bayesian calibration
Parameter Definition Prior distribution Posterior mean
μH Heterotrophic max. specific growth rate [/d] [0.1~10.0] 4.98
KS Half saturation coeff. for heterotrophs [mgCOD/L] [0.001~0.10] 0.047
kh Max. specific hydrolysis rate [/d] [0.1~10.0] 5.61
KX Half saturation coeff. for hydrolysis [-] [0.05~5.0] 3.09
XH,0 Concentration of heterotrophs [mgCOD/L] [1~100] 49.2
SS,0 Readily biodegradable COD [mgCOD/L] [10~100] 70.6
XS,0 Slowly biodegradable COD [mgCOD/L] [50~500] 322.8

모델 매개변수의 사후 분포는 Fig. 5와 같이 일반적으로 정규분포의 형태를 가지지만, 일부 민감도가 낮은 매개변수는 명확한 정규분포를 띄지 않고 평탄한 형태를 가진다. 이와 같이 비교적 평탄한 사후 분포를 가지는 매개변수들은 모델 연산 결과에 큰 영향을 미치지 아니하므로 데이터-모델 접합 작업에서 제외할 수 있다. 또한, 모델 매개변수들 중 상관성이 매우 높은 경우가 발생하며, 예를 들어, μH~XH,0 또는 kh~SS,0의 경우, 사용자의 판단에 따라 상응하는 두 개 매개변수 중 하나를 취사선택하여 데이터-모델 보정 작업의 복잡성을 줄일 수 있다. 이와 같이 베이지안 보정 기법은 최적 매개변수의 도출 기능뿐만 아니라, 모델 예측 결과에 대한 매개변수의 영향과 매개변수들 간 상관성에 대한 정보를 추가 제공할 수 있다. 최근 대세인 머신러닝, 인공지능 기법들과 비교하여서도, 베이지안 보정 기법은 매개변수 특성 평가에 관한 특별한 장점을 가지고 있다.

Fig. 5. Histogram of posterior distribution of microbial growth-decay kinetic parameters used in Bayesian calibration and correlation plots between different parameters
../../Resources/kswe/KSWE.2024.40.4.179/PICDB4.png

3.3 응집 동역학

본 연구에서는 응집핵-응집체 이군집 응집 동역학 모델(TCPBE)을 적용하였으므로, 응집체 크기(DF)와 전체 응집핵-응집체 농도 대비 응집체 분율(VF)을 실험 데이터-모델 보정 작업에 활용하였다. 응집 동역학 실험 동안, 응집을 통하여 응집핵의 상대적 분율을 감소되고, 응집체의 크기와 분율은 지속하여 커지며 더 이상의 변화가 없는 평형 상태에 도달한다(Fig. 6). TCPBE는 이와 같은 응집핵-응집체의 변화 경향을 모사할 수 있으며, 베이지안 보정 기법을 적용하여 실험 데이터-모델 예측치 간 최적 접합의 결과를 도출할 수 있었다(Table 4).

Table 4. Prior distribution and posterior mean of model-data fitting parameters of two-class flocculation kinetics used in Bayesian calibration
Parameter Definition Prior distribution Posterior mean
αpp Collision efficiency factor of flocculi [-] [0.0~0.25] 0.008
αPF αFF Collision efficiency factor of floc [-] [0.0~1.00] 0.997
nf Fractal dimension of floc [-] [2.0~2.6] 2.37
Eb Breakage coefficient [s0.5/m] [1.0×10-5~7.5×10-4] 4.0×10-5
p Empirical parameter of breakage kinetics [-] [0.1~2.5] 0.828
q Empirical parameter of breakage kinetics [-] [0.15~1.5] 0.265
f Fraction of flocculi by breakage [-] [0.0~1.0] 0.009
Vp,0 Initial volumetric fraction of primary particle [-] [0.5~1.0] 0.920
Fig. 6. Time series of (a) floc diameter and (b) volumetric fraction measured (dotted), best-fit simulation (red line), and 95% simulation uncertainty intervals due to total uncertainty (gray band).
../../Resources/kswe/KSWE.2024.40.4.179/PICDF3.png

앞서 소개한 미생물 성장-사멸 동역학의 경우와 유사하게, 사용자가 정의한 응집 동역학 모델 매개변수의 사전 분포(Prior Distribution)에 대한 결과(Posterior Distribution)를 확률론적인 기법으로 산출하게 된다. 데이터-모델 접합을 위한 다수 매개변수들에 대한 일괄적인 평가는 어려운 작업이며, 인위적인 시행착오(Trials and Erros)로 산출하기는 거의 불가능하다. 베이지안 보정 기법은 수천, 수만회의 반복 작업을 컴퓨터를 활용하여 수행하며, 그 결과를 통계적으로 해석함으로써 비교적 손쉽게 데이터-모델 보정 작업을 수행하게 된다.

응집 동역학 모델 매개변수의 사후 분포(Posterior Distribution)는 대체로 정규분포를 따르며, 특별히 응집체 충돌 효율 계수(αFF)는 사용자가 정의한 사전 분포의 상단 경계에 최빈값이 형성되는 것으로 나타났다(Fig. 7). αFF는 물리적으로 1을 넘을 수 없으므로, 매개변수의 사전분포 범위 설정에서 현실의 물리적인 범위 내로 한정하였기 때문에, 사후분포는 상단 경계 1을 넘지 않고 그 주변으로 집중되어 있었다. αFF와 응집체 프랙탈 차원(형상) 계수(nf)는 강한 상관성을 나타내며, 이들 매개변수가 공통으로 응집 동역학을 증대시키는 것으로 파악할 수 있었다. 또한, 응집체 파괴와 관련된 세 개의 매개변수들(Eb, p, q) 간 뚜렷한 음 또는 양의 상관성을 나타내고 있다. 이와 같이, 모델 매개변수들의 상관성을 파악함으로써, 모델의 구조적 특성 이해를 도모하고 사용자의 모델 적용의 방향에 따라 매개변수를 취사 선택할 여지를 제공할 수 있다.

Fig. 7. Histogram of posterior distribution of flocculation kinetic parameters used in Bayesian calibration and correlation plots between different parameters.
../../Resources/kswe/KSWE.2024.40.4.179/PICE42.png

4. Conclusion

최근 각광을 받고 있는 인공지능 기반 블랙박스 모델들에 비하여, 연립미분방정식 기반 수학적 예측 모델은 생물-물리-화학적 공정(반응) 동역학을 반영하며 사전 데이터가 존재하지 않더라도 모델을 구동할 수 있는 장점을 가지고 있다. 하지만, 다양한 생물-물리-화학적 공정(반응) 동역학이 얽혀있으며 수많은 매개변수를 포함하는 연립미분방정식을 풀어내기는 쉽지 않다. 때로는 체계적인 매개변수 평가 없이, 인위적인 시행착오를 통하여 얻어진 모델 매개변수 변수들을 활용하기도 한다.

본 연구에서는 베이지안 보정 기법을 미생물 성장-사멸 동역학과 응집 동역학 실험 및 모델에 대하여 적용하였으며, 베이지안 보정 기법과 연계한 수학적 예측 모델의 새로운 가능성을 제시하였다. 본 연구논문에 제시된 베이지안 보정 기법을 활용하여, 연구자가 수립한 다양한 생물-물리-화학적 공정(반응) 동역학 모델의 매개변수 보정 작업을 수월하게 진행할 수 있으리라 판단된다.

현재의 컴퓨팅 기술의 발전을 고려하면, 베이지안 보정 기법은 복잡한 생물-물리-화학적 공정(반응) 동역학 모델에 대한 적용뿐만 아니라, 향후 반응-이동 현상을 고려한 3차원 시공간 예측모델에도 적용가능하리라 판단된다. 베이지안 보정 기법은, 컴퓨팅 기술의 발전과 함께, 물환경 수질예측에 주로 활용되는 대규모, 다차원 수리-수질 예측 모델(EFDC, Delft3D, MIKE 등)에도 적용할 수 있으리라 기대된다. 또한, 최근 4차 산업혁명의 기조에 따라 국내외 상하수처리 플랜트의 디지털 트윈 구현이 활발히 진행되고 있다. 본 연구에서 제시한 베이지안 보정 기법과 상하수처리 물리-생물-화학적 공정 동역학 모델을 연계한다면, 인공지능-머신러닝 등 데이터 집약형 예측 모델에 대비하여, 저비용 디지털 트윈 구현이 가능할 것으로 기대된다.

Acknowledgement

이 논문은 2021년도 한국연구재단 이공분야 기초연구사업(NRF-2020R1I1A3A04036895)의 지원을 받아 수행됨.

Appendices

Appendix 1. Script for connecting the microbial growth-decay kinetic model and DREAM software
../../Resources/kswe/KSWE.2024.40.4.179/PICE91.png
Appendix 2. Function for integrating the microbial growth-decay kinetics
../../Resources/kswe/KSWE.2024.40.4.179/PICEF0.png
Appendix 3. Function of the ordinary differential equations of the microbial growth-decay kinetics
../../Resources/kswe/KSWE.2024.40.4.179/PICF2F.png
Appendix 4. Script for connecting the two-class flocculation kinetic model and DREAM software
../../Resources/kswe/KSWE.2024.40.4.179/PICF5F.png
Appendix 5. Function for integrating the flocculation kinetics
../../Resources/kswe/KSWE.2024.40.4.179/PICFAE.png
Appendix 6. Function of the ordinary differential equations of the flocculation kinetics
../../Resources/kswe/KSWE.2024.40.4.179/PICFED.png

References

1 
Beckers F., Heredia A., Noack M., Nowak W., Wieprecht S., Oladyshkin S., 2020, Bayesian calibration and validation of a large‐scale and time‐demanding sediment transport model, e2019WR026966, Water Resources Research, Vol. 56, No. 7DOI
2 
Burd A. B., Jackson G. A., 2002, Modeling steady-state particle size spectra, Environmental Science and Technology, Vol. 36, No. 3, pp. 323-327DOI
3 
Choi Y., Baek S., Kim J., Choi J., Hur J., Lee T., Park C., Lee B. J., 2017, Characteristics and biodegradability of wastewater organic matter in municipal wastewater treatment plants collecting domestic wastewater and industrial discharge, Water, Vol. 9, No. 6, pp. 409DOI
4 
Duarte M. S., Martins G., Oliveira P., Fernandes B., Ferreira E. C., Alves M., Lopes F., Pereira M. A., Novais P., 2024, A review of computational modeling in wastewater treatment processes, ACS ES&T Water, Vol. 4, No. 3, pp. 784-804DOI
5 
Gelman A. G., Rubin D. B., 1992, Inference from iterative simulation using multiple sequences, Statistical Science, Vol. 7, No. 4, pp. 457-472DOI
6 
Gujer W., Henze M., Mino T., van Loosdrecht M., 1999, Activated sludge model No. 3, Water Science and Technology, Vol. 39, No. 1, pp. 183-193DOI
7 
Henze M., Grady C. P. L., Gujer W., Marais G. v. R., Matsuo T., 1987, Activated sludge model No. 1
8 
Jeppsson U., 1996, Modelling aspects of wastewater treatment processes, PhD Dissertation, Lund Institute of TechnologyGoogle Search
9 
Kim J. I., Lee B. J., 2020, Investigation on flocculi-floc interaction and flocculation in extracellular polymeric substances, ionic species and clay-containing suspension, Journal of Korean Society on Water Environment, Vol. 36, No. 3, pp. 185-193DOI
10 
Lee B. J., Fettweis M., Toorman E., Molz F. J., 2012, Multimodality of a particle size distribution of cohesive suspended particulate matters in a coastal zone, Journal of Geophysical Research: Oceans, Vol. 117, pp. C03014DOI
11 
Lee B. J., Toorman E., Molz F. J., Wang J., 2011, A two-class population balance equation yielding bimodal flocculation of marine or estuarine sediments, Water Research, Vol. 45, No. 5, pp. 2131-2145DOI
12 
Lee B. J., Wentzel M. C., Ekama G. A., 2006, Measurement and modelling of ordinary heterotrophic organism active biomass concentrations in anoxic/aerobic activated sludge mixed liquor, Water Science and Technology, Vol. 54, No. 1, pp. 1-10DOI
13 
Lee B. J., Wentzel M., Ekama G. A., Choi Y., Choi J., 2014, Measurement of ordinary heterotrophic organism active biomass in activated sludge mixed liquor: Evaluation and comparison of the quantifying techniques, Environmental Engineering Research, Vol. 19, No. 1, pp. 91-99DOI
14 
Van Loosdrecht M. C. M., Lopez-Vazquez C. M., Meijer S. C. F., Hooijmans C. M., Brdjanovic D., 2015, Twenty-five years of ASM1: Past, present and future of wastewater treatment modelling, Journal of Hydroinformatics, Vol. 17, No. 5, pp. 697-718DOI
15 
van Mourik S., ter Braak G., Stigter H., Molenaar J., 2014, Prediction uncertainty assessment of a systems biology model requires a sample of the full probability distribution of its parameters, PeerJ, Vol. 2, pp. e433DOI
16 
van Turnhout A. G., Kleerebezem R., Heimovaara T. J., 2016, A toolbox to find the best mechanistic model to predict the behavior of environmental systems, Environmental Modelling & Software, Vol. 83, pp. 344-355DOI
17 
Villacorte L. O., Ekowati Y., Neu T. R., Kleijn J. M., Winters H., Amy G., Schippers J. C., Kennedy M. D., 2015, Characterisation of algal organic matter produced by bloom-forming marine and freshwater algae, Water Research, Vol. 73, pp. 216-230DOI
18 
Vrugt J. A., 2016, Markov chain Monte Carlo simulation using the DREAM software package: Theory, concepts, and MATLAB implementation, Environmental Modelling & Software, Vol. 75, pp. 273-316DOI
19 
Wentzel M., Mbewe A., Ekama G., 1995, Batch test for measurement of readily biodegradable COD and active organism concentrations in municipal waste waters, Water SA, Vol. 21, No. 2, pp. 117-124Google Search
20 
Winterwerp J. C., van Kesteren W. G. M., 2004, Introduction to the physics of cohesive sediment in the marine environment