2.2. Sampling and analysis
๋ถ์์ ์ฌ์ฉ๋ ์๋ฃ๋ 2017๋
5์ 16์ผ๋ถํฐ 2018๋
11 ์ 23์ผ๊น์ง ์ฐ๊ตฌ๋์ ๋ณด์ ์๋ฅ 500 m ์ง์ ์ค์์ ์์ธตยท ์ค์ธตยทํ์ธต์์ ์ฑ์ทจํ์๋ค.
๋ฐฑ์ ๋ณด๋ ์ด 35ํ(105๊ฐ ์๋ฃ), ์ฃฝ์ฐ๋ณด๋ ์ด 37ํ(111๊ฐ ์๋ฃ)์ ์คํ์ด ์ด๋ฃจ์ด์ก๋ค. ์๋ฃ ๋ Van Dorn ์ฑ์ทจ๊ธฐ๋ฅผ ์ฌ์ฉํ์ฌ, ํ์ฒ ์ค์์
์์ธต, ์ค์ธต, ํ์ธต์์ ๊ฐ๊ฐ ์ฑ์ทจํ์๋ค. ์์จ(Temp, ยฐC), pH, ์ฉ์กด์ฐ์ (DO, mg/L), ์ ๊ธฐ์ ๋๋(EC, ฮผS/cm)๋ ์๋ฃ ์ฑ์ทจ
์ ํ์ฅ์ ์ ๋คํญ๋ชฉ ์์ง์ธก์ ๊ธฐ(YSI-EXO, YSI-6600, YSI Pro plus) ๋ฅผ ์ฌ์ฉํ์ฌ ์์ฌ๋ณ๋ก ์ธก์ ํ์์ผ๋ฉฐ, ์ผ์๋ค์ ๋ํ ๋ณด์ ์
์ฃผ๊ฐ ๋จ์๋ก ์ค์ํ์๋ค. ์ฑ์ทจ๋ ์๋ฃ๋ 4 ยฐC ์ดํ๋ก ๋ณด๊ด ํ์ฌ ์คํ์ค๋ก ์ด๋ฐํ ํ, ์์ง์ค์ผ๊ณต์ ์ํ๊ธฐ์ค(ME, 2017) ์ ๋ฐ๋ผ ๋ถ์ํ์๋ค.
์กฐ๋ฅ ์ข
๋ณ ์ธํฌ์ ๋ถ์์ ์ํ ์๋ฃ๋ Lugol ์ฉ์ก์ผ๋ก ํ ์ฅ์์ ์กฐ๋ฅ๋ฅผ ๊ณ ์ ํ ํ ์๋ฃ๋ฅผ ์คํ์ค๋ก ์ด๋ฐํ์ฌ, ์์ง ์ค์ผ๊ณต์ ์ํ๊ธฐ์ค(ME, 2017)์ โ์๋ฌผ์ฑํ๋ํฌํค-ํ๋ฏธ๊ฒฝ๊ณ ์๋ฒ(ES 04705.1b)โ์ ์คํ์ฌ ๋ถ์ํ์๋ค. ๋ค๋ง Microcystis ์ ๊ฒฝ์ฐ colony๋ฅผ ํ์ฑํ์ฌ ๋ถ๊ท ์ผํ๊ฒ ๋ถํฌํจ์ผ๋ก์จ ๊ณ์ ๊ฒฐ๊ณผ์ ์ค์ฐจ๋ฅผ ์ ๋ฐํ๊ธฐ ๋๋ฌธ์ ์ผ์ ๋์ ์ฉ์ก์ผ๋ก๋ถํฐ Microcystis colony๋ฅผ ๋ถ๋ฆฌํ์ฌ ๋ณ๋๋ก ๊ณ์ํ์๋ค.
๊ธฐ์์๋ฃ๋ ๊ธฐ์์ฒญ์ ๊ธฐ์์๋ฃ๊ฐ๋ฐฉํฌํธ์์ ๊ณผ์
๊ตฌ๊ฐ ๋ด์ ์์นํ ์ข
ํฉ๊ธฐ์๊ด์ธก์, ๋ฐฉ์ฌ๊ธฐ์๊ด์ธก์๋ฅผ ๋์์ผ๋ก ์์งํ์์ผ๋ฉฐ, ๋์ ์ง์ ์ ๊ธ๊ฐ 1๊ฐ์, ์์ฐ๊ฐ
2๊ฐ์์ด๋ฉฐ, ๊ฐ์๋(mm) ์๋ฃ๋ฅผ ์์งํ์๋ค. ์ ๋์๋ฃ๋ K-water ๋ฌผ์ ๋ณดํฌํธ์์ ์ ๊ณตํ๋ ๋ณด๋ณ ์๋ฌธ์๋ฃ๋ฅผ ์์งํ์๋ค.
2.3. Statistical analyses
๋ณธ ์ฐ๊ตฌ์ ์ฐ๊ตฌ์ ์ฐจ๋ Fig. 2์ ๊ฐ์ด ๋จ๊ณ๋ณ๋ก ์ํ๋์ ์ผ๋ฉฐ ์ต์ข
์ ์ผ๋ก ๊ฐ ๋ณด๋ณ ๋จ์กฐ๋ฅ ์ฐ์ ํ๊ฒฝ์ ์ข
ํฉ์ ์ผ๋ก ํ๊ฐํ์๋ค. ๋จ์กฐ๋ฅ(Cyano), ๋
น์กฐ๋ฅ(Green), ๊ท์กฐ๋ฅ(Diatom)
์ธํฌ์ ๋ฐ๋ ๋ฐ Chl-a ๋๋๋ ํ๊ฒฝ์์ธ๊ณผ์ ๊ต์ฐจ ์๊ด์ฑ ๋ถ์์ ์ค์ํ์๋ค. ๋ถ์์ ์ฌ์ฉํ ํ์ฅ ์ธก์ ํญ๋ชฉ์ ์์จ, DO, EC์ด๋ฉฐ, ๋ฌผ๋ฆฌ์ ์ธ์๋
7์ผ ํ๊ท ์ ๋(Q7day), 7์ผ ๋์ ๊ฐ์ฐ๋(APRCP7), ฮT(์ยทํ์ธต ์์จ์ฐจ)์ด๋ค. ์์์ผ๋ฅ ๋ TP (Total Phosphorus), TN
(Total Nitrogen), NH3-N, NO3-N, ์ ๊ธฐ๋ฌผ ๋ฐ ๋ฏธ๋ ๋ฌผ์ง์ BOD (Biochemical Oxygen Demand), COD (Chemical Oxygen Demand), TOC
(Total Organic Carbon), Fe, SiO2๋ฅผ ํฌํจํ์๋ค. ์๊ฐ ์ ๋์ ์ฌ์ฉ ํ์ง ์๊ณ Q7day๋ฅผ ์ฌ์ฉํ ๊ฒ์ ํธ์ฃผ์ ๋จ๋์ชฝ์ ์์นํ ํ ์ฒ์์ ์ํํ ์ ํ์ฐ๊ตฌ(Mitrovic et al,. 2003; Sherman et al., 1998) ๊ฒฐ๊ณผ์์, ๋ณด ๊ตฌ๊ฐ์ ๋จ์กฐ๋ฅ ์ฐ์ ์ด ์ง์์ ์ธ ์ ๋์ ๊ฐ์์ ์์จ์ฑ์ธต ํ์ฑ์ด ์์ธ์ด๋ผ๋ ๊ฒ์ ์ฐธ๊ณ ํ์๋ค.
Fig. 2. The overall processes of this study.
๋จ์กฐ๋ฅ๊ฐ ์ฐ์ ํ๋ ํ๊ฒฝ์ ์ค์๋ณ์๋ฅผ ํ๊ฐํ๊ธฐ ์ํด SMLR ๋ชจ๋ธ๊ณผ ์์๋ธ(Ensemble) ํ์ต๊ธฐ๋ฒ ์ค RF๊ธฐ๋ฒ์ ์ฌ์ฉํ์๋ค. ๋ถ์์ ์ฌ์ฉ๋ ์ข
์๋ณ์๋
๋จ์กฐ๋ฅ ์ฐ์ ๋(C. dominance)์ด๋ฉฐ ๋
๋ฆฝ๋ณ์๋ Temp, DO, EC, Q7day, APRCP7, ฮT, pH, NO3-N, NH3-N, TN, PO4-P, Fe์ด๋ค. C.dominance๋ ์ ์ฒด ์กฐ๋ฅ ์ธํฌ์ ๋ฐ๋์ ๋ํ ๋จ์กฐ๋ฅ ์ธํฌ ์ ๋ฐ๋์ ๋น๋ก์จ ๋จ์กฐ๋ฅ ์ฐ์ ์ ์ํ ๋
น์กฐ๋ฐ์์ ์ํ๋ ๋ฅผ ๊ฐ์ ์ ์ผ๋ก
๋ํ๋ธ๋ค.
SMLR์ ๋จ๊ณ์ ์ ์ง ๋ฐฉ๋ฒ์ ์ ์ฉํ์์ผ๋ฉฐ, ๋ชจ๋ธ์ ์ฌ์ฉ ํ๋ ์ฒซ ๋ฒ์งธ ๋ณ์๋ ์ข
์๋ณ์์ ์๊ด์ฑ์ด ๊ฐ์ฅ ํฐ ๋
๋ฆฝ๋ณ ์๋ฅผ ์ ํํ๋ค. ๋ค์ ๋ณ์๋ ์๊ด์ฑ์ด
ํฐ ๋
๋ฆฝ๋ณ์๊ฐ ์์ฐจ ์ ์ผ๋ก ์ ์ฉ๋๋ฉฐ, ์ง์
๊ธฐ์ค์ ๋ง์กฑํ๋ ๋ณ์๊ฐ ์์ผ๋ฉด ํ ๋ก์์ ๋ ์ค๋จ๋๋ค(Chung et al., 2014). ๋ถ์๊ฒฐ๊ณผ๋ ๊ฒฐ์ ๊ณ ์(R2), RMSE (Root Mean Square Error), Mallows์ CP ํต ๊ณ๋, AIC (Akaike Information Criterion)์
์ฌ์ฉํ์ฌ ํ๊ฐ ํ์๋ค. SMLR ๊ฒฐ๊ณผ๋ RF ๋ชจ๋ธ ๊ฒฐ๊ณผ์ ๋น๊ต๋ฅผ ํตํด ๋จ์กฐ๋ฅ ์ฐ์ ๊ณผ ๊ด๊ณ๊ฐ ๋์ ์ค์ ๋ณ์๋ฅผ ์ ์ ํ๋๋ฐ ํ์ฉ๋์๋ค.
RF ๋ชจ๋ธ์ ์ฌ๋ฌ ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจ๋ธ์ ์์ธก ๊ฒฐ๊ณผ๋ค์ ์ข
ํฉํ์ฌ ์ ํ๋๋ฅผ ๋์ด๋ ์์๋ธ ํ์ต ๊ธฐ๋ฒ์ผ๋ก, ๋ถ๋ฅ๋ ํฌ ํ(voting), ํ๊ท๋ ํ๊ท (averaging)์ผ๋ก
๊ฒฐ๊ณผ๋ฅผ ์ฐ์ถํ๋ค (Breiman, 2001). RF ๋ชจ๋ธ์ ์ ์ฉ ์ ์ฐจ๋ ํ์์ ๋ฐ์ดํฐ ๋ถ์(Exploratory Data Analysis, EDA), ์ฆ ๋ฐ์ดํฐ ์์ง, ์ ๋ ฌ ๋ฐ ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ
๋ฑ๊ณผ ๊ฐ์ ์ ์ฒ๋ฆฌ ์์
์ํ ํ์ ๊ฒฐ๊ณผ ๋ฅผ ์ถ์ ํ์๋ค. ๋ํ RF ๋ชจ๋ธ ๊ฐ๋ฐ๊ณผ์ ์ค ๊ณผ์ ํฉ์ ๋ฐฉ์ง ํ๊ณ ์์ธก์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด k-fold ๊ต์ฐจ
๊ฒ์ (Cross validation)์ 10-fold, 3ํ ๋ฐ๋ณต์ผ๋ก ์ค์ํ์๋ค. RF ๋ชจ๋ธ์ ๋ชฉํ๋ณ์์ ๊ฐ์ ์์ธกํ๊ธฐ ์ํด ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจํ์ ์ต๋
๋ช ๊ฐ ์ฌ์ฉํ ๊ฒ์ธ์ง(ntree), ์์ฌ๊ฒฐ์ ๋๋ฌด์ ๊ฐ ๋ง๋์์ ์ค ๋ช
๋ณ์๋ฅผ ๋ช ๊ฐ ๋ก ํ ๊ฒ์ธ์ง(mtry) ๋ฑ์ ์ฐ๊ตฌ์๊ฐ ์ง์ ์ ํํ์ฌ์ผ ํ๋ค.
RF ๋ชจ๋ธ์ ntree ๊ฐ์ Breiman and Cutler (2015)์ ๋ฐ๋ผ ์ด๊ธฐ๊ฐ์ธ 500์ผ๋ก ์ค์ ํ์์ผ๋ฉฐ, mtry๋ Liaw and Wiener (2002)์ ์ํ ๋ฐฉ๋ฒ์ ์ํด ๊ฒฐ์ ํ์๋ค. mtry ์ ๊ฐ์๋ ๋ฐฑ์ ๋ณด๋ 2 ~ 4๊ฐ, ์ฃฝ์ฐ๋ณด๋ 2 ~ 5๊ฐ๊น์ง ์ค์ ํ ์ฌ RF ๋ชจ๋ธ์ ์ ์ฉํ์๋ค. ๋ชจ์๊ฒฐ๊ณผ
์์ธก ์ค์ฐจ๋ mtry๊ฐ ์ฆ๊ฐํ ์๋ก ๊ฐ์ํ์์ผ๋ฉฐ, ๋ฐฑ์ ๋ณด๋ mtry๊ฐ 4๊ฐ์ธ ๋ชจ๋ธ์ ์ RMSE ๊ฐ์ด 0.077 %, ์ฃฝ์ฐ๋ณด๋ mtry๊ฐ 5๊ฐ์ธ ๋ชจ๋ธ์์
RMSE ๊ฐ์ด 0.066 %๋ก ๊ฐ์ฅ ๋ฎ์ ํธ์ฐจ๋ฅผ ๋ณด์ฌ, ์ต์ข
๋งค๊ฐ ๋ณ์๋ก ์ ์ ํ์๋ค.
์ต์์ ๋ณ์๋ก ์์ธก ์ฑ๋ฅ์ด ๊ฐ์ฅ ์ข์ RF ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด RFE ๊ธฐ๋ฒ์ ์ฌ์ฉํ์์ผ๋ฉฐ, C.dominance ์์ธก์ ์ฌ์ฉ ํ ๋
๋ฆฝ๋ณ์๋ ฮT,
Temp, EC, Q7day, APRCP7, TOC, TP, PO4-P, TN, Fe์ด๋ค. RFE๋ Backward ๋ฐฉ์ ์ค ํ๋๋ก, ๋ณ์ ์ค ์ค์๋๊ฐ ๋ฎ์ ๋ณ์๋ฅผ ํ๋์ฉ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ด๋ค.
RF ๋ชจ๋ธ์ ์ด์ฉํ ๋จ์กฐ๋ฅ ์ฐ์ ๊ณผ ๊ด๋ จ๋ ์ค์ ๋ณ์ ์ถ์ถ ๊ณผ ํจ๊ป, ๋จ์กฐ๋ฅ ์ฐ์ ๋๊ฐ ๋์ ํ๊ฒฝ์กฐ๊ฑด์ ํ์ธํ๊ธฐ ์ํด ์์ฌ๊ฒฐ์ ๋๋ฌด(Decision Tree,
์ดํ DT) ๋ถ์์ ์ค์ํ์๋ค. ๋ถ์์ ์ฌ์ฉ๋ ์ข
์๋ณ์๋ C.dominance์ด๋ฉฐ ์ค๋ช
๋ณ์๋ RF ๋ชจ๋ธ ์ค์๋ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ์ ์ ๋ ๋ณ์๋ค์
์ ์ฉ ํ์๋ค. DT ๋ชจ๋ธ์ ๊ฐ ๋ณ์๋ฅผ ์ด๋ถํ ํ๋ ๊ณผ์ ์ ๋ฐ๋ณตํ ์ฌ ๋๋ฌด๋ชจํ์ ํ์ฑํ๋ฉฐ, ์ข
์๋ณ์๊ฐ ๋ฒ์ฃผํ์ธ ๊ฒฝ์ฐ ๋ถ๋ฅ, ์ฐ์ํ์ธ ๊ฒฝ์ฐ ํ๊ท๋ถ์์
์ํํ๋ค. ๋
๋ฆฝ๋ณ์๋ค์ ๋ฒ์ฃผํ ๋๋ ์ฐ์ํ ๋ชจ๋์ ์ ์ฉ๋ ์ ์์ผ๋ฉฐ ์ด ๊ณผ์ ์ ๋ฐ๋ณตํ ํ ์ ์ ํ ๋๋ฌด๋ชจํ์ ์ฐพ๊ธฐ ์ํ ๊ฐ์ง์น๊ธฐ(Pruning)๋ฅผ ํตํด
์ต์ข
๋ชจํ์ ์ ํํ๋ค. ๋ณธ ์ฐ๊ตฌ์์ DT ๋ชจ๋ธ์ Rํ๋ก๊ทธ๋จ ์ rpart package (Breiman et al., 1984)๋ฅผ ์ฌ์ฉํ์๊ณ , RF ๋ชจ๋ธ์ randomForest package(Breiman and Cutler, 2015)๋ฅผ ์ฌ์ฉํ์๋ค.
๋
น์กฐ ๋ฐ์์ ์ํฅ์ ๋ฏธ์น๋ ํ๊ฒฝ์์ธ์ ๊ตฐ์ง๋ถ์์ ์ํด ์ฃผ์ฑ๋ถ๋ถ์(Principal component analysis, PCA)์ ์ฌ์ฉํ์ ๋ค. ๋ถ์์
์ฌ์ฉํ ์๋ฃ๋ C.dominance, Temp, DO, EC, Q7day, APRCP7, ฮT, pH, NO3-N, NH3-N, TN, TP, PO4-P, Chl-a, Fe, BOD, COD, TOC, SiO2๋ฅผ ํฌํจํ์๋ค. ์ฃผ์ฑ๋ถ ์์ ๊ฒฐ์ ์ ์ฃผ์ฑ๋ถ ์ถ์ ์ ์ฌ๋ ์๋ฃ์ ๋ถ์ฐ ํฌ๊ธฐ๋ฅผ ๋ํ ๋ด๋ ๊ณ ์ ์น(eigenvalue)๊ฐ 1.0 ์ด์์ธ ๊ฐ์ ๊ฐ๋ ์ฃผ์ฑ๋ถ
์ถ ๋ง์ ๊ณ ๋ คํ์์ผ๋ฉฐ(Box and Cox, 1964; Jung et al., 2012; Soltani et al., 2012), ์ถ์ ํ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ณ์์ ์์ธ๊ฐ ์ ๊ด๊ณ๋ฅผ ๊ฐ์ฅ ๋ช
ํํ ์ค๋ช
ํ๋ ๊ฒ์ผ๋ก ์๋ ค์ง Varimax ํ์ ๋ฐฉ๋ฒ์ ์ ์ฉํ์๋ค(Husson, 2010). ๋ํ, ์์๋ฃ๊ฐ ์ฃผ ์ฑ๋ถ ๋ถ์์ ํ๋นํ ๋ฐฉ๋ฒ๋ก ์ธ์ง ํ๋จํ๊ธฐ ์ํด Bartlett ๊ตฌ ํ๋ ๊ฒ์ ๋ฐ KMO (Kaiser-Meyer-Olkin)
test (KMO)๋ฅผ ์ฌ ์ฉํ์๋ค. KMO test ๊ฒฐ๊ณผ๋ ๋ถ์์ ์ฌ์ฉ๋ ๋ณ์์ ์๋ฃ์ ๋ด์ฌ๋ ์์ธ๋ค ๊ฐ์ ๊ณต๋ถ์ฐ ์ ๋๋ฅผ ๋ํ๋ธ ์ฒ๋๋ก์จ 1์ ๊ฐ๊น์ธ์๋ก
๋ถ์์ ํ๋น์ฑ์ด ๋๊ณ ์ต์ 0.5 ์ด์ ๋์ด์ผ ๋ถ ์์ด ๊ฐ๋ฅํ๋ค(Jung and Kim, 2017). KMO ๊ฒ์ ๊ฒฐ๊ณผ, ๋ฐฑ์ ๋ณด ๋ ์ด 1๊ฐ(COD), ์ฃฝ์ฐ๋ณด๋ ์ด 4๊ฐ(pH, PO4-P, TN, NO3-N) ์ ๋ณ์๊ฐ KMO ๊ธฐ์ค ๊ฐ(0.5 ๋ฏธ๋ง)์ ๋ง์กฑํ์ง ๋ชปํ์ฌ ์ด ๋ค ๋ณ์๋ฅผ ๋ฐฐ์ ํ๊ณ ๋ถ์ํ์๋ค. ์ต์ข
์ ์ผ๋ก ์ ์ ๋ ๋ณ์๋ก ๋ถ์ํ ๊ฒฐ๊ณผ, ๋ฐฑ์ ๋ณด์
KMO ๊ฐ์ 0.74 (p โช 0.05), ์ฃฝ์ฐ๋ณด ๋ KMO ๊ฐ์ 0.68 (p โช 0.05)๋ก ๋ชจ๋ ๋ณด์์ ๊ธฐ์ค ๊ฐ์ ๋ง์กฑํ์๋ค.