2.1 ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ
๋๋คํฌ๋ ์คํธ๋ Breiman(2001)์ด ์ ์ํ ์์๋ธ ํ์ต ๊ธฐ๋ฒ์ผ๋ก, ์ฌ๋ฌ ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ(Decision Tree)๋ฅผ ๊ฒฐํฉํ์ฌ ๋์ ์ผ๋ฐํ ์ฑ๋ฅ์
์ ๊ณตํ๋ ๋ชจ๋ธ์ด๋ค. ๊ฐ ํธ๋ฆฌ๋ ๊ฐ๋ณ์ ์ผ๋ก ํ์ต๋๋ฉฐ, ์์ธก ๊ฒฐ๊ณผ๋ ๋ค์๊ฒฐ ์์น ๋๋ ํ๊ท ์ ํตํด ๊ฒฐํฉ๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ ๋ฐ์ดํฐ์ ๊ณผ์ ํฉ(Overfitting)์
๋ฐฉ์งํ๊ณ , ๋ถ๋ฅ(Classification) ๋ฌธ์ ์ ํ๊ท(Regression) ๋ฌธ์ ๋ชจ๋์์ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค[3].
๋๋คํฌ๋ ์คํธ๋ ๋ฐฐ๊น
(Bootstrap Aggregating)๊ณผ ๋๋ค ๋ณ์ ์ ํ(Random Feature Selection)์ ๋ ๊ฐ์ง ์ฃผ์ ๊ฐ๋
์
๊ธฐ๋ฐํ๋ค. ๋ฐฐ๊น
์ ํ์ต ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ณต์ ์ถ์ถ(Bootstrap sampling)์ ํตํด ์ฌ๋ฌ ์ํ์ ์์ฑํ๊ณ , ๊ฐ ์ํ์ ์ฌ์ฉํ์ฌ ๋
๋ฆฝ์ ์ธ ํธ๋ฆฌ๋ฅผ
ํ์ตํ๋ ๊ธฐ๋ฒ์ด๋ค[3].
๋๋ค ๋ณ์ ์ ํ์ ๊ฐ ๋
ธ๋์์ ์ ์ฒด ๋ณ์ ์งํฉ ์ค ์ผ๋ถ๋ฅผ ๋ฌด์์๋ก ์ ํํ์ฌ ์ต์ ์ ๋ถํ (Split)์ ์ํํ๋ ๋ฐฉ๋ฒ์ผ๋ก, ํธ๋ฆฌ ๊ฐ ์๊ด์ฑ์ ์ค์ด๊ณ
๋ชจ๋ธ์ ๋ค์์ฑ์ ์ฆ๊ฐ์ํจ๋ค[4, 5].
๋ถ๋ฅ ๋ฌธ์ ์์ ๋๋คํฌ๋ ์คํธ ์ต์ข
์์ธก๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค[5]:
์ฌ๊ธฐ์ $H(x)$๋ ๋๋คํฌ๋ ์คํธ์ ์ต์ข
์์ธก๊ฐ, $h_{k}(x)$๋ ๋ฒ์งธ ํธ๋ฆฌ์ ์์ธก๊ฐ, ๋ $I(x)$์ง์ํจ์์ด๋ค. ์ด ์์์ ๊ฐ๋ณ ํธ๋ฆฌ์ ๊ฒฐ๊ณผ๋ฅผ
ํฌํ ๋ฐฉ์์ผ๋ก ๊ฒฐํฉํ์ฌ ์ต๋น๊ฐ์ ์์ธกํ๋ ๊ณผ์ ์ ๋ํ๋ธ๋ค[5].
์ด ๋ ๊ฐ ํธ๋ฆฌ๋ ๋ณต์ ์ถ์ถ๋ก ์์ฑ๋ ํ์ต ๋ฐ์ดํฐ์ ๋ฌด์์๋ก ์ ํ๋ ๋ณ์๋ค๋ก ํ์ต๋๋ฏ๋ก, ๋ฐ์ดํฐ์ ์ผ๋ถ ์ด์์น๋ ๋
ธ์ด์ฆ์ ๋ฏผ๊ฐํ์ง ์์ผ๋ฉฐ ์์ ์ ์ธ
์ฑ๋ฅ์ ๋ณด์ฅํ๋ค.
๋๋คํฌ๋ ์คํธ์ ์ฑ๋ฅ์ ํธ๋ฆฌ ๊ฐ์ $K$, ๋ถํ ์ ๊ณ ๋ คํ ๋ณ์ ๊ฐ์, ๋
ธ๋ ํฌ๊ธฐ ๋ฑ ๋ค์ํ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ์ํฅ์ ๋ฐ๋๋ค. ํธ๋ฆฌ ๊ฐ์ $K$๋ ์ถฉ๋ถํ
ํฐ ๊ฐ์ ์ค์ ํ๋ฉด ์ผ๋ฐํ ์ค๋ฅ๊ฐ ์๋ ดํ์ฌ ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง, ๋ถํ์ํ๊ฒ ๋ง์ ํธ๋ฆฌ๋ ๊ณ์ฐ ๋น์ฉ์ ์ฆ๊ฐ์ํฌ ๋ฟ ์ฑ๋ฅ ํฅ์์๋ ๊ธฐ์ฌํ์ง ์๋ ๊ฒ์ผ๋ก
์๋ ค์ ธ ์๋ค[1, 6]. ๋๋คํฌ๋ ์คํธ๋ ์ฌ๋ฌ ์ฅ์ ์ ๊ฐ์ง๋ค. ๋
ธ์ด์ฆ์ ์ด์์น์ ๋ณ๋์ด ์ ๊ณ ๊ณผ์ ํฉ์ ์ํ์ด ๋ฎ๋ค. ๋ณ์ ์ค์๋(Variable Importance)๋ฅผ ํ๊ฐํ
์ ์์ด, ๋ณ์์ ์ ํ ๋ฐ ๋ชจ๋ธ์ ํด์์๋ ํ์ฉ์ด ๊ฐ๋ฅํ๋ค. ๋ค์์ ๋ณ์์ ๋ณต์กํ ๊ด๊ณ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋น์ ํ ๋ชจ๋ธ๋ก, ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ํจ๊ณผ์ ์ด๋ค[7].
kNN์ ๋ฐ์ดํฐ์ ๋น์ ํ ๋ถํฌ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋น๋ชจ์์ (Non-Parametric) ํ์ต ๊ธฐ๋ฒ์ผ๋ก, ์๋ก์ด ๋ฐ์ดํฐ์ ํ์ต ๋ฐ์ดํฐ ๊ฐ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ
๊ฐ์ฅ ๊ฐ๊น์ด ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์์ธก์ ์ํํ๋ค. ์ด ๋ชจ๋ธ์ ๋ถ๋ฅ์ ํ๊ท ๋ฌธ์ ์ ์ฃผ๋ก ์ฌ์ฉ๋๋ฉฐ, ๊ฐ๋จํ๋ฉด์๋ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ด ํน์ง์ด๋ค[8, 9].
kNN์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๊ฑฐ๋ฆฌ ๊ณ์ฐ ๋ฐฉ์์ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ(Euclidean Distance)์ด๋ฉฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ผ ์ ์๋ค[10]:
์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ ์์์ ํ์ฉํ kNN ๋ชจ๋ธ์ ์
๋ ฅ ๋ฐ์ดํฐ์ ํ์ต ๋ฐ์ดํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ ๊ฐ์ฅ ๊ฐ๊น์ด $k$๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ ํํ๋ ๋ฐฉ์์ผ๋ก ์๋ํ๋ค[11]. ์ด ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ ํํ์ ๋ํ ์ฌ์ ๊ฐ์ ์์ด ๋์ํ๋ฏ๋ก, ๋น๋ชจ์์ ํ์ต ๊ธฐ๋ฒ์ผ๋ก ๋ถ๋ฅ๋๋ค[12]. ์๋ก์ด ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ ์ฃผ์ด์ง๋ฉด, ๋ชจ๋ธ์ ์ ํ๋ ์ด์๋ค์ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ ํด๋น ๋ฐ์ดํฐ์ ๋ถ๋ฅ ๋๋ ํ๊ท ๊ฐ์ ์์ธกํ๋ค[9]. ๋ถ๋ฅ ๋ฌธ์ ์์ kNN์ ๋ค์๊ฒฐ ์์น์ ์ ์ฉํ์ฌ ๊ฐ์ฅ ๋ง์ด ๋ฑ์ฅํ๋ ์ด์ ๋ฐ์ดํฐ์ ํด๋์ค๋ฅผ ์๋ก์ด ๋ฐ์ดํฐ์ ํ ๋นํ๋ค. ์ด๋ฌํ ์ ๊ทผ๋ฒ์ ๋ฐ์ดํฐ๊ฐ ๊ท ์ผํ๊ฒ
๋ถํฌํ๊ณ ๋
ธ์ด์ฆ๊ฐ ์ ์ ๋ ๋์ ์ ํ๋๋ฅผ ๋ณด์ธ๋ค. ํ๊ท ๋ฌธ์ ์์๋ ์ด์ ๋ฐ์ดํฐ์ ๊ฐ์ ํ๊ท ์ ์ฌ์ฉํ์ฌ ์์ธก๊ฐ์ ์ฐ์ถํ๋ฉฐ, ์ด๋ ๋ฐ์ดํฐ ๊ฐ ๊ฐ์ ์ฐ์์ ์ธ
๊ด๊ณ๋ฅผ ๋ฐ์ํ๋๋ฐ ์ ๋ฆฌํ๋ค[11].
kNN ๋ชจ๋ธ์ ์ฑ๋ฅ์ $k$๊ฐ์ ํฌ๊ฒ ์์กดํ๋ฉฐ, $k$๊ฐ์ด ์์ ๊ฒฝ์ฐ ๋ชจ๋ธ์ด ๋
ธ์ด์ฆ์ ๋ฏผ๊ฐํด์ง ์ ์๋ ๋ฐ๋ฉด, $k$๊ฐ์ด ํฌ๋ฉด ๊ณผ์์ ํฉ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ
์ ์๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๊ต์ฐจ๊ฒ์ฆ ๋ฐฉ๋ฒ์ด ์์ฃผ ์ฌ์ฉ๋๋ฉฐ, ์ด๋ฅผ ํตํด ๋ฐ์ดํฐ์ ๊ฐ์ฅ ์ ํฉํ $k$๊ฐ์ ์ฐพ๋๋ค[11, 12]. ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, ์ฐจ์์ ์ ์ฃผ(The Curse of Dimensionality)๊ฐ ๋ฐ์ํ ์ ์๋ค. ์ด๋ ๊ณ ์ฐจ์ ๊ณต๊ฐ์์ ๋ชจ๋ ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ
๊ฑฐ์ ๋์ผํ ๊ฑฐ๋ฆฌ์ ์์นํ๊ฒ ๋๋ ๋ฌธ์ ๋ก, kNN์ ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ ๊ณ์ฐ ๋ฐฉ์์ ์ ํจ์ฑ์ ์ ํ์ํจ๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฃผ์ฑ๋ถ ๋ถ์(Principal
Components Analysis, PCA)๊ณผ ๊ฐ์ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ด ์ ์ฉ๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ๊ฐ ์ฌ์ฉ๋๋ค[9]. kNN์ ๋จ์์ฑ๊ณผ ์ ์ฐ์ฑ์ผ๋ก ์ธํด ๋ค์ํ ์์ฉ ๋ถ์ผ์์ ํ์ฉ๋๊ณ ์๋ค. ์ด์ํ์ง, ๊ฒฐ์ธก๊ฐ ๋์ฒด, ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฑ์์ ์ฑ๊ณต์ ์ผ๋ก ์ ์ฉ๋ ๋ฐ ์๋ค[11]. ์ด๋ฌํ ํน์ฑ์ kNN์ด ๋น์ ํ์ ๋ฐ์ดํฐ ๋ถํฌ์์๋ ์ผ๊ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ ๋ฐ์ดํฐ์ ํน์ฑ๊ณผ ๋ฌธ์ ์ ํ์ ๋ง๋ ๋ค์ํ ๋ณํ ๋ชจ๋ธ์ผ๋ก ํ์ฅ๋ ์ ์์์
๋ณด์ฌ์ค๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ชจ๋ธ์ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ํ๋ฅ ์ ๋ถ๋ฅ ๋ชจ๋ธ๋ก, ๋ฐ์ดํฐ์ ๊ฐ Feature๊ฐ ์ฃผ์ด์ง Class์ ๋ํด ์กฐ๊ฑด๋ถ๋ก ๋
๋ฆฝ์ ์ด๋ผ๋ ๊ฐ์ ์
์ ์ ๋ก ์๋ํ๋ค[13]. ์ด ๊ฐ์ ์ ํ์ค์ ์ผ๋ก ์ถฉ์กฑ๋์ง ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ง๋ง, ๋์ด๋ธ ๋ฒ ์ด์ฆ๋ ์ฌ์ ํ ๋ค์ํ ์ค์ ์์ฉ ๋ถ์ผ์์ ํจ๊ณผ์ ์ธ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ๊ณ์ฐ ํจ์จ์ฑ๊ณผ ๊ตฌํ์
๋จ์์ฑ์ผ๋ก ์ธํด ๋๋ฆฌ ์ฌ์ฉ๋๊ณ ์๋ค[13, 14]. ๋์ด๋ธ ๋ฒ ์ด์ฆ๋ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฅ $P(C \vert X)$๋ฅผ ๊ณ์ฐํ์ฌ, ์ฃผ์ด์ง ์
๋ ฅ ๋ฐ์ดํฐ $X$๊ฐ ์ํ ๊ฐ๋ฅ์ฑ์ด ๊ฐ์ฅ ๋์ Class
$C$๋ฅผ ์์ธกํ๋ค. ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ผ ์ ์๋ค[13]:
$P(C)$๋ ํด๋์ค์ ์ฌ์ ํ๋ฅ , $P(X \vert C)$๋ ํด๋์ค $C$์์ ๋ฐ์ดํฐ $X$๊ฐ ๋ฐ์ํ ์กฐ๊ฑด๋ถ ํ๋ฅ , $P(X)$๋ ๋ฐ์ดํฐ $X$์
์ด ํ๋ฅ ์ด๋ค[13].
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ชจ๋ธ์ ํต์ฌ ๊ฐ์ ์ Feature๋ค์ด ํด๋์ค์ ๋ํด ์กฐ๊ฑด๋ถ๋ก ๋
๋ฆฝ์ ์ด๋ผ๋ ๊ฒ์ด๋ค. ์ด๋ก ์ธํด $P(X \vert C)$๋ ๋ค์๊ณผ ๊ฐ์ด
๊ณ์ฐ๋๋ค[13]:
$X_{i}$๋ ์
๋ ฅ ๋ฐ์ดํฐ $X$์ ๊ตฌ์ฑ ์์๋ฅผ ๋ํ๋ธ๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ๋ ๊ฐ๋ ฅํ ๋ถ๋ฅ๊ธฐ์ด์ง๋ง, ๋
๋ฆฝ์ฑ ๊ฐ์ ์ด ์๋ฐ๋๋ ๊ฒฝ์ฐ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์๋ค. ๊ทธ๋ฌ๋ ๋
๋ฆฝ์ฑ ๊ฐ์ ์ด ์๋ฐ๋๋๋ผ๋ ๋ฎ์ ์ํธ๋กํผ(Entropy)
๋ถํฌ๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ์ ์งํ ์ ์๋ค[15].
์ด๋ ๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ํด๋์ค ์์ธก์ ํ์ํ ์ ๋ณด๋ฅผ ์ถฉ๋ถํ ์ ๊ณตํ๋ ๊ฒฝ์ฐ, ๋
๋ฆฝ์ฑ ๊ฐ์ ์ ์ฌ๋ถ์ ๊ด๊ณ์์ด ๋ชจ๋ธ์ด ์๋ํ ์ ์์์ ๋ํ๋ธ๋ค[15].
2.2 ์ฑ๋ฅ ํ๊ฐ ์งํ
ํผ๋ ํ๋ ฌ(Confusion Matrix)๊ณผ ๊ทธ์ ๊ธฐ๋ฐํ ์ฑ๋ฅ ์งํ์ธ ์ ํ๋(Accuracy), ์ ๋ฐ๋(Precision), ์ฌํ๋(Recall),
F1 ์ค์ฝ์ด(F1 Score) ๋ฑ์ ํตํ์ฌ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ๋์ ์ผ๋ก ์ธก์ ํ ์ ์๋ค[15, 20].
ํผ๋ ํ๋ ฌ์ ํ๋จ ๊ฒฐ๊ณผ์ ์ค์ ๊ฒฐ๊ณผ ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ Fig. 2์ ๊ฐ์ด ์๊ฐ์ ์ผ๋ก ๋ํ๋ด๋ฉฐ, ๋ชจ๋ธ์ ๋ถ๋ฅ ์ ํ๋ ๋ฐ ์ค๋ฅ ํจํด์ ๋ช
ํํ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋ค.
Fig. 2. Confusion matrix[20]
ํผ๋ ํ๋ ฌ์ ์ฃผ์ ๊ตฌ์ฑ ์์๋ ๋ค์๊ณผ ๊ฐ๋ค.
TP(True Positive)๋ ์ค์ ๋ก ์์ฑ์ธ ์ฌ๋ก๋ฅผ ๋ชจ๋ธ์ด ๋ฐ๋ฅด๊ฒ ํ๋จํ ๊ฒฝ์ฐ, TN(Trun Negative)์ ์ค์ ๋ก ์์ฑ์ธ ์ฌ๋ก๋ฅผ ๋ชจ๋ธ์ด
๋ฐ๋ฅด๊ฒ ํ๋จํ ๊ฒฝ์ฐ, FP(False Positive)๋ ์ค์ ๋ก ์์ฑ์ธ ์ฌ๋ก๋ฅผ ๋ชจ๋ธ์ด ์์ฑ์ผ๋ก ์๋ชป ํ๋จํ ๊ฒฝ์ฐ, FN(False Negative)์
์ค์ ๋ก ์์ฑ์ธ ์ฌ๋ก๋ฅผ ๋ชจ๋ธ์ด ์์ฑ์ผ๋ก ์๋ชป ํ๋จํ ๊ฒฝ์ฐ๋ฅผ ๋ปํ๋ค[20].
์ ํ๋๋ ์ ์ฒด ๋ฐ์ดํฐ(TP, TN, FP, FN) ์ค ๋ชจ๋ธ์ด ์ค์ ์ฌ๋ก์ ๋์ผํ๊ฒ ํ๋จํ ๋ฐ์ดํฐ(TP, TN)์ ๋น์จ๋ก ์ ์ํ ์ ์๋ค[15, 16]:
์ ๋ฐ๋๋ ๋ชจ๋ธ์ด ์์ฑ์ผ๋ก ํ๋จํ ๋ฐ์ดํฐ(TP, FP) ์ค ์ค์ ์ฌ๋ก์ ๋์ผํ๊ฒ ํ๋จํ ๋ฐ์ดํฐ(TP)์ ๋น์จ์ ์๋ฏธํ๋ค[15, 17, 18]:
์ฌํ๋๋ ์ค์ ์ฌ๋ก์์ ์์ฑ์ธ ๋ฐ์ดํฐ(TP, FN) ์ค ๋ชจ๋ธ์ด ์ฌ๋ฐ๋ฅด๊ฒ ์์ฑ์ผ๋ก ํ๋จํ ๋ฐ์ดํฐ(TP)์ ๋น์จ์ ์๋ฏธํ๋ค[15, 19]:
F1 ์ค์ฝ์ด๋ ์ ๋ฐ๋์ ์ฌํ๋์ ๊ท ํ์ ์ด์ฉํ์ฌ ๋ํ๋ธ ์งํ๋ก์, ์ ๋ฐ๋์ ์ฌํ๋์ ์กฐํ ํ๊ท ์ผ๋ก ๊ณ์ฐ๋๋ฉฐ ํด๋์ค ๋ถ๊ท ํ์ด ์กด์ฌํ ๋ ์ ์ฉํ๋ค. F1
์ค์ฝ์ด๋ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์๋ค[20]:
๋ค์ค ํด๋์ค ํผ๋ ํ๋ ฌ์ ์ฌ์ฉํ ์ ์๋ค. ๋ค์ค ํด๋์ค ํผ๋ ํ๋ ฌ์ ๋ค์ค ํด๋์ค์ ํ๋จ ๋ถํฌ๋ฅผ ์๊ฐ์ ์ผ๋ก ์ ๊ณตํ๋ฉฐ, ๋ถ๊ท ํ ๋ฐ์ดํฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ
์ํด ์ฌ์ฉ๋๋ค. ๋ค์ค ํด๋์ค ํผ๋ ํ๋ ฌ์ ํตํ์ฌ ๊ฐ ํด๋์ค์ ์ฐธ/๊ฑฐ์ง ํ๋จ ์ ๋ณด๋ฟ๋ง ์๋๋ผ, ํด๋์ค ๊ฐ ์ํธ์์ฉ์ ์์ธํ ๋ถ์ํ ์ ์๋ค. ๋ํ,
๋ง์ดํฌ๋ก(Micro), ๋งคํฌ๋ก(Macro), ๊ฐ์ค ํ๊ท (Weighted Average) ๋ฐฉ์์ผ๋ก ์ ๋ฐ๋, ์ฌํ๋, F1 ์ค์ฝ์ด๋ฅผ ๊ณ์ฐํ์ฌ ๋ชจ๋ธ์ ์ ๋ฐ์ ์ธ
์ฑ๋ฅ์ ์ธก์ ํ ์ ์๋ค. ์ด๋ฌํ ์ฑ๋ฅ ํ๊ฐ ์งํ์ ๋ค์ค ํด๋์ค ํผ๋ ํ๋ ฌ์ ๋ชจ๋ธ์ ๊ฐ์ ๊ณผ ์ฝ์ ์ ๋ถ์ํ๊ณ , ๊ฐ์ ๋ฐฉํฅ์ ๋์ถํ๋ ๋ฐ ์ ์ฉํ ๋๊ตฌ๋ก
์ฌ์ฉํ ์ ์๋ค[21].