๋
ธ์์
(Soo-Young Noh)
*iD
๊น์ฐฝํ
(Chang-Hyun Kim)
โ iD
-
(Dept. of Electronic Engineering, Kangnam University, Republic of Korea.)
Copyright ยฉ The Korean Institute of Electrical Engineers
Key Words
Brushless DC motors, deep reinforcement learning, online parameter tuning, state-space control
1. ์ ๋ก
BLDC(brushless DC) ๋ชจํฐ๋ ๋์ ํจ์จยท์๋ต์ฑยท๋ด๊ตฌ์ฑ์ด ์๊ตฌ๋๋ ๋ก๋ด, ๋๋ก , ์ฐจ๋ ๊ตฌ๋ ๋ถ์ผ์์ ํ์ค ๊ตฌ๋์์ผ๋ก ๋๋ฆฌ ์ฑํ๋๊ณ ์๋ค.
๊ทธ๋ฌ๋ ๊ถ์ ์จ๋ ์์น, ์์ ์ฝํ, ์คํ ์ํ ๋ณํ, ๊ฐ๋ณ ํ์ค ๋ฑ์ผ๋ก ์ ๊ธฐยท๊ธฐ๊ณ ํ๋ผ๋ฏธํฐ๊ฐ ์๊ฐ์ ๋ฐ๋ผ ์ดํํ๋ฉฐ, ์ด๋ ์๋ยทํ ํฌ ์ฑ๋ฅ ์ ํ๋ก
์ด์ด์ง๋ค๋ ์ฌ์ค์ด ๋ค์์ ์ฐ๊ตฌ์์ ๋ณด๊ณ ๋์๋ค [1-
2]. ๋๋ถ์ด ํ์ฅ ์ ํธ ํ๊ฒฝ์๋ ์ผ์ยท์ ์์ ๊ณ ์ฃผํ ์ก์์ด ๊ณต์กดํ๋ค. ํนํ ์ ๊ฐยท์ํ ์์คํ
์์ ๋ณดํธ์ ์ผ๋ก ์ฌ์ฉํ๋ Hall ์์น ์ผ์๋ ์งํฐ ๋ฐ ์ง์ฐ
ํน์ฑ์ผ๋ก ์ธํด ์์น ์ถ์ ์ ์๊ฐ์ ๋ถํ์ค์ฑ์ ์ ๋ฐํ๋ค [3]. ์ด๋ฌํ ์์ธ๋ค์ ์ ์ด๊ธฐ ์ค๊ณ ์ฌ์ ๋ฅผ ์ถ์์ํค๊ณ , ์ด๊ธฐ ์กฐ์ ์ฑ๋ฅ์ ์ฅ๊ธฐ ์ ์ง์ ์ด๋ ค์์ ์ด๋ํ๋ค [4].
์ด ๋ฌธ์ ์ ๋์ํ๊ธฐ ์ํด ๊ฐ์ธ ๋น์ ํ ์ ์ด์ ์์ธกยท์ต์ ์ ์ด๊ฐ ํ๋ฐํ ์ฐ๊ตฌ๋๊ณ ์๋ค. SMC(sliding mode control)๋ ๋ชจ๋ธ ๋ถํ์ค์ฑ๊ณผ
์ธ๋์ ๊ฐ์ธํ๋ฉฐ, ๊ณผ๋ ์ค๋ฒ์ํธ๋ฅผ ์ต์ ํ๊ณ ๋ถํ ๋ณ๋ ๋ณต์ ์๊ฐ์ ๋จ์ถํ ์ ์์์ด ๋ณด๊ณ ๋์๋ค [5]. ๋ฐ๋ฉด, ๊ตฌํ์ ๋ฐ๋ผ ์ค๋ฒ์ํธ ๋ฐ ์๋ต ์ง์ฐ์ด ๋ฐ์ํ ์ ์์ด ์ฒด๊ณ์ ์ธ ์ค๊ณยท์กฐ์ ์ ์ฐจ๊ฐ ์๊ตฌ๋๋ค.
์์ธกยท์ต์ ์ ์ด ์ธก๋ฉด์์๋ ์ ๋ ฅ๋ณํ๊ธฐ ์ค์์นญ ์ ์ฝ๊ณผ ๊ตฌ๋๊ณ ๋น์ ํ์ ๋ช
์์ ์ผ๋ก ๋ค๋ฃจ๋ MPC(model predictive control) ๊ณ์ด์ด
BLDC์ ์ ์ฉ๋์ด ์ ํ ๊ตฌ๊ฐ ๋งค๋๋ฌ์๊ณผ ์๋ ํ์ง์ ๊ฐ์ ํ์๊ณ , NMPC(nonlinear model predictive control)๋ ์ ์ฝ
ํ์ ์๋ต์ ์ฒด๊ณ์ ์ผ๋ก ๋ค๋ฃจ๋ ์ฅ์ ์ ๋ณด์๋ค [6]. ๋ค๋ง ์ฐ์
์ ๋ฐ์์ ๋ฒ์ฉ ์ ์ด๊ธฐ์ ์ค์ฌ์ฉ ๋น์ค์ ์ฌ์ ํ PID ๊ณ์ด์ด ์๋์ ์ด๋ค. ๊ตฌ์กฐ ๋จ์์ฑ, ํด์ ์ฉ์ด์ฑ, ์ ์ง๋ณด์ ํธ์์ฑ์๋ ๋ถ๊ตฌํ๊ณ , PID๋
์ฐธ์กฐ ์ถ์ข
๊ณผ ์ธ๋ ์ต์ ๋ฅผ ๋์ผ ์ด๋์ผ๋ก ์ ์ถฉํด์ผ ํ๋ฉฐ, ๋ฏธ๋ถํญ์ ๊ณ ์ฃผํ ์ฆํญ ํน์ฑ์ผ๋ก ์ธํด Hall ์ ํธ์ ์ก์์ ๋ฏผ๊ฐํ๋ค๋ ํ๊ณ๊ฐ ์๋ค. ๋ํ ํ๋ผ๋ฏธํฐ
๋ณํ์ ์ ์ํ์ง ๋ชปํด ์ฅ๊ธฐ๊ฐ ์ด์ฉ ์ ์ฑ๋ฅ์ด ์ ํ๋๋ค.
์ด๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๋ณธ ์ฐ๊ตฌ๋ ๊ธฐ์กด์ PID์ ๋ค๋ฅด๊ฒ ์ถ๋ ฅ ๋ฏธ๋ถ์ ์ง์ ์ฐ์ง ์๊ณ ๊ด์ธก๊ธฐ ๊ธฐ๋ฐ ์ถ์ ๊ณผ ๋ด๋ถ ์ํ ํผ๋๋ฐฑ์ ํ์ฉํ๋ SS-PID(State-Space
PID)๋ฅผ ๋์
ํด ์ก์ ๋ฏผ๊ฐ์ฑ์ ์ํํ๊ณ ์ค์ธก ์ ํธ์ ๊ฑฐ์น ๊ธฐ์๋ ์์ ์ ์ธ ์ถ์ข
์ ์ป๋ ๊ฒ์ ์ถ๋ฐ์ ์ผ๋ก ํ๋ค [7]. ๋ค๋ง SS-PID๋ ์ด๋์ด ๊ณ ์ ๋๋ฉด ๋ชจํฐ ์ดํ์ ๋ฐ๋ฅธ ํ๋ผ๋ฏธํฐ ๋ณํ์ ์ทจ์ฝํ๊ณ , ๊ด์ธก๊ธฐ ์ด๋ ๋ฑ ์กฐ์ ํด์ผ ํ ๋ณ์๊ฐ PID ๋๋น ์ฆ๊ฐํ๋ฏ๋ก ํ๋ผ๋ฏธํฐ๊ฐ
์๊ฐ์ ๋ฐ๋ผ ๋ณํ๋ ํ๋ํธ์์๋ ์๋ ์ฌ์กฐ์ ์ ๋ถ๋ด์ด ํฌ๋ค. ๊ณ ์ ์ PID ์ ์ด๊ธฐ์ ๋ํ์ฌ ํผ์ง, ์งํ์๊ณ ๋ฆฌ์ฆ, ์
์ ๊ตฐ์ง ์ต์ ํ, ์ ๊ฒฝ๋ง ๋ฑ ๋ค์ํ
๊ธฐ๋ฒ์ผ๋ก ์ฐ๊ตฌ๋์์ผ๋ ์ฃผ๋ก ๊ณ ์ ์ ์ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง ์ ์ด๊ธฐ๋ฅผ ๋์์ผ๋ก ํ๊ฑฐ๋ ์คํ๋ผ์ธ ์ต์ ํ๋ฅผ ๋์์ผ๋ก ํ์ฌ ์ค์๊ฐ ์ฐ์ ์กฐ์ ์ ํ๊ณ๋ฅผ ๋ณด์๋ค.
๋ฐ๋ผ์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด SS-PID์ ์ ์ด๋ณ์๋ฅผ ์จ๋ผ์ธ์ผ๋ก ์ฌ์กฐ์ ํ๋ ๊ฐํํ์ต ๊ธฐ๋ฐ DDPG(Deep deterministic policy
gradient) ์์ด์ ํธ๋ฅผ ์ ์ํ๋ค [8-
12]. ์ด๋ฌํ ์กฐ์ ๊ธฐ๋ SS-PID ์ ์ด๊ธฐ์ ํ์ต ๊ธฐ๋ฐ ์จ๋ผ์ธ ์ฌ์กฐ์ ๊ธฐ๋ฒ์ ํตํฉํ๋ ๊ฒ์ผ๋ก ์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ๊ณผ ๋์ ์ ์ด ์ฑ๋ฅ์ ๋์์ ํ๋ณดํ๋ค. ํต์ฌ
์ค๊ณ๋ ์์ ๊ณผ ์ฌํ์ฑ์ด๋ค. ์ฒซ์งธ, ์์ด์ ํธ์ ์ก์
์ ํตํ ์กฐ์ ๋ ํ๋ผ๋ฏธํฐ๋ ์ด๊ธฐ ์ธ์ฆ๋ SS-PID์ ํ๋ผ๋ฏธํฐ ์ฃผ๋ณ์ ์ค์ผ์ผ๋ก ์ ํ๋์ด ๋ถ์์ ํ ํ์์
์์ฒ ์ฐจ๋จํ๋ค. ๋ํ ์ ์ด ๋ณ์๋ฅผ ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์ฐ์ ์ก์
์ ์ฐ์ถํ์ฌ ๋ถ๋๋ฝ๊ฒ ์กฐ์ ํ๋ค. ๋์งธ, ๊ด์ธก์ ์ค์ฐจ, ์ค์ฐจ ๋ณํ์จ, ๋์ ์ค์ฐจ๋ก ๊ตฌ์ฑํด
์ค์ฐจ๋ฅผ ์ต์ํํ๊ธฐ ์ํด ํ์ํ ์ ๋ณด๋ง ์์ถํ๋ค. ์
์งธ, ๋ณด์์ ์์ ์ค์ฐจ๋ฅผ ์ ๋ถํ์ฌ ์ค์ฉ์ ์ ์ด๋ฅผ ์ ๋ํ๋ค. ๋ท์งธ, Simulink ํ๊ฒฝ์์ ์ํผ์๋๋ง๋ค
๋ฆฌ์
ํจ์๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฌผ๋ฆฌ์ ์ยทํํ ์ฌ์ด์์ ๋ฌด์์ ์ด๊ธฐํํ์ฌ ํ๋ผ๋ฏธํฐ ๋ณํ์ ๋ฐ๋ผ ์์ด์ ํธ๊ฐ ์ต์ ์ ์ ์ด ๋ณ์๋ฅผ ์ ํํ๋๋ก ํ๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก
๋ณธ ์ฐ๊ตฌ๋ ๊ตฌํ๊ณผ ์ค๊ณ๊ฐ ๋จ์ํ๋ฉฐ ๊ธฐ์กด์ PID ๊ณ์ด์ ์ ์ด๊ธฐ๋ฅผ ์ฌ์ฉํ๋ฉฐ ๊ณ ์ ์ PID์ ๋น๊ตํ์ฌ ๊ณ ์ฃผํ ์ก์์ ์ํฅ์ ์กฐ์ ๊ฐ๋ฅํ SS-PID๋ก Hall
์ผ์ ์ก์ ๋ฏผ๊ฐ๋๋ฅผ ๋ฎ์ถ๋ฉด์, ํ๋ผ๋ฏธํฐ ๋ณํ๋ก ์ธํ ์ฅ๊ธฐ ์ฑ๋ฅ ์ ํ๋ฅผ ๋ฅ์ ๊ฒฝ๋ง ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ ๊ฒ์ผ๋ก ๋น์ ํ์ ํน์ฑ์ ํ์ต๊ฐ๋ฅํ DDPG ๊ฐํํ์ต ๊ธฐ๋ฐ์
์จ๋ผ์ธ ์ฌ์กฐ์ ์ผ๋ก ๋ณด์ํ๋ ์ค๋ฌด ์งํฅ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
2. ์ด๋ก ์ ๋ฐฐ๊ฒฝ
2.1 BLDC ๋ชจํฐ ๋ชจ๋ธ ์ค๊ณ
๋ณธ ์ฐ๊ตฌ๋ ํ๊ท ํ๋ ๋จ์ผ์ถ(์ ๊ธฐโ๊ธฐ๊ณ ๊ฒฐํฉ) BLDC ๋์ญํ์ ์ฌ์ฉํ๋ค. ์ด๋ ์ ๊ธฐ์์ ์ (1) ๊ธฐ๊ณ์์ ์ (2)์ ๊ฐ์ด ์ ์๋๋ค [13-
14].
์ฌ๊ธฐ์ $i(t)$๋ ์ ๋ฅ, $u(t)$๋ ์ ์, $\omega(t)$๋ ๊ฐ์๋, $\tau_{L}(t)$์ ๋ถํํ ํฌ,$L$์ ๊ถ์ ์ธ๋ํด์ค, $R$์
์ ํญ, $K_{e}$๋ ์ญ๊ธฐ์ ๋ ฅ ์์, $J$๋ ์ง๋๊ด์ฑ, $B$๋ ์ ์ฑ ๋ง์ฐฐ, $K_{t}$๋ ํ ํฌ์์์ด๋ค.
ํ์ง๋ง ๋ณธ ์ฐ๊ตฌ๋ ๋ถํํ ํฌ๋ฅผ ๊ณ ๋ คํ์ง ์์ผ๋ฉฐ ์ด๋ ๋ถํํ ํฌ๊ฐ ์๋ค๋ฉด ๊ธฐ๊ณ์ ์์ ์ $\tau_{m}$๊ฐ ๋งค์ฐ ์์์ ธ ์๋ฎฌ๋ ์ด์
์ค ์ํ๋งํ์์ด ์์ ์์
๊ฐ๊น์์ง์ง ์๋๋ก ์ํ๋ง ํ์์ ํฌ๊ฒ ์ค์ฌ์ผ ํ๋ฉฐ ๋ํ ๊ณ ์ด๋, ๊ณผ๋ฏผ์ ์ด๊ฐ ์ค๊ณ๋๊ธฐ ๋๋ฌธ์ ์์ ์ ์ธ ํ์ต์ด ์ด๋ ค์์ง๋ค. ๋ฐ๋ผ์ ํ์ค์ ์ธ ๋ชจํฐ์ ๊ตฌ๋ํ๊ฒฝ์
๊ณ ๋ คํ์ฌ ๋ชจํฐ์ ๊ท ์ผ ์ํ ๊ด์ฑ์ฒด ๋ถ์ฐฉ์ ๊ฐ์ ํ์์ผ๋ฉฐ ์ด๋ ์ (3)์ ์ง๋ ๊ด์ฑ $J$์๊ฐ์ด ํํ๋๋ค.
์ฌ๊ธฐ์ $J_{motor}$์ ๋ชจํฐ์ ์ง๋๊ด์ฑ์ ์๋ฏธํ๊ณ $m$์ ๊ด์ฑ์ฒด์ ์ง๋, $r$์ ๊ด์ฑ์ฒด์ ๋ฐ์ง๋ฆ์ ์๋ฏธํ๋ค.
๋ง์ง๋ง์ผ๋ก ์ (1)๊ณผ ์ (2)์ ์ํด BLDC๋ชจํฐ์ ์ ์์๋ ์ ๋ฌํจ์๋ ์ (4)๊ณผ ๊ฐ์ด ํํ๋ ์ ์๋ค.
์ฌ๊ธฐ์ $s$๋ ๋ผํ๋ผ์ค ๋ณํ์ ๋ณต์ ์ฃผํ์ ๋ณ์์ด๋ค.
2.2 SS-PID
SS-PID๋ ์ ๋ฌํจ์ ํํ์ ๊ณ ์ ์ ์ธ ๊ตฌ์กฐ์ PID๋ฅผ ์ํ ๊ณต๊ฐ ๋ฐฉ์ ์์ ํํ๋ก ํํํ์ฌ ์ํ๊ณต๊ฐ์์ ๋ถ์๊ธฐ๋ฒ์ PID์ ์ด๊ธฐ์์๋ ์ ์ฉํ ์ ์๋๋ก
ํ์๋ค [7]. ์ด๋ SS-PID๋ ๊ด์ธก๊ธฐ๋ฅผ ์ถ๊ฐํ์ฌ PID์ ๋ด๋ถ ์ํ๋ฅผ ์ถ์ ํ๋ ๊ฒ์ผ๋ก PID๋ฅผ ์ํ ๊ณต๊ฐ ๋ฐฉ์ ์์ผ๋ก ํํํ์๋ค. SS-PID๋ $\overline{x}(t)$์
$\overline{r}(t)$๋ฅผ ์
๋ ฅ๋ฐ์ ์ ์ด์
๋ ฅ $u(t)$์ ์ถ๋ ฅํ๋ค. ์ฌ๊ธฐ์ $\overline{x}(t):=\begin{pmatrix}\dot{y}(t)\\y(t)\\\int
y(t)dt\end{pmatrix}$, $\overline{r}(t):=\begin{pmatrix}\dot{r}(t)\\r(t)\\\int r(t)dt\end{pmatrix}$์ด๋ค.
SS-PID์ ์ํ๋ฐฉ์ ์์ ์ (5)์ ๊ฐ๋ค.
์ฌ๊ธฐ์ $K_{d}, K_{p}, K_{i}$๋ ๊ฐ๊ฐ ๋ฏธ๋ถ, ๋น๋ก, ์ ๋ถ์ ๋ํ ์ด๋์ ์๋ฏธํ๋ฉฐ ์ ์ด์
๋ ฅ์ ๋ํน์ฑ์ ๊ฒฐ์ ํ๋ค. ๋ํ $\overline{L}_{o}$๋
๊ด์ธก๊ธฐ์ ์ด๋์ ์๋ฏธํ๋ฉฐ ๊ทธ ์ด๋์ ๋น์จ์ ๋ฐ๋ผ ๊ด์ธก๊ธฐ์ ๋ํน์ฑ์ ๊ฒฐ์ ํ ์ ์๋ค. ์ด๋ ๊ฒ ์ค๊ณ๋ SS-PID๋ ๊ด์ธก๊ธฐ ์ด๋ $\overline{L}_{o}$๋ฅผ
์กฐ์ ํ๋ ๊ฒ์ผ๋ก ๊ทธ ์ฃผํ์ ์๋ต์ ๋ฐ๊พธ์ด ๊ณ ์ฃผํ ๋
ธ์ด์ฆ์ ์ํฅ์ ์ค์ผ ์ ์๋ค [11-
12]. ๊ทธ๋ฆผ 1์ ์ ์๋ BLDC๋ชจํฐ์ ๋ง๊ฒ ์ค๊ณ๋ PID์ SS-PID์ ๋ณด๋ ํฌ๊ธฐ์ ๋์ด๋ค. PID์ ๋น๊ตํ์ฌ SS-PID๋ ๊ณ ์ฃผํ์์ ๊ทธ ํฌ๊ธฐ๊ฐ ๊ฐ์ ๋๋ ๊ฒ์
๋ณผ ์ ์๋ค. ๊ทธ๋ฆผ 2๋ ์ ์ด๊ธฐ์ BLDC๋ชจํฐ์ ๊ฐ๋ฃจํ ๋ณด๋ ํฌ๊ธฐ์ ๋์ด๋ฉฐ ์ด ๋ํ ๊ณ ์ฃผํ์์ ๊ทธ ํฌ๊ธฐ๊ฐ ์์์ง๋ ๊ฒ์ ๋ณผ ์ ์๋ค. ์ด๋ฌํ ๊ณ ์ฃผํ์์์ ํฌ๊ธฐ์ ๊ฐ์ ๋ ์ผ์์์
์
๋ ฅ๋๋ ๊ณ ์ฃผํ ํน์ฑ์ด ๊ฐํ ์ก์์ ๊ฐ์๋๋ฉฐ ๋ฐ๋๋ก ๋น๊ต์ ์ ์ฃผํ์์ญ์ ์๋ ๋ ํผ๋ฐ์ค ์
๋ ฅ์ ์ถ์ข
ํ ์ ์๋๋ก ํ๋ค [15].
๊ทธ๋ฆผ 1. PID ์ ์ด๊ธฐ์ SS-PID์ ๋ณด๋ ํฌ๊ธฐ์ ๋
Fig. 1. Bode magnitude plots of PID and SS-PID controllers
๊ทธ๋ฆผ 2. ์ ์ด๊ธฐโํ๋ํธ ๊ฐ๋ฃจํ ๋ณด๋ ํฌ๊ธฐ์ ๋
Fig. 2. Open-loop Bode magnitude of controllerโplant
3. ๊ฐํํ์ต ์ค๊ณ
BLDC ๊ตฌ๋์์๋ ์จ๋ ์์นยท๋
ธํยท์คํยท๋ถํ ๋ณ๋ ๋ฑ์ผ๋ก ์ ๊ธฐยท๊ธฐ๊ณ ํ๋ผ๋ฏธํฐ๊ฐ ์๊ฐ์ ๋ฐ๋ผ ๋ณ๋ํ๋ค. ์ด๋ ์ ์ด๊ธฐ์ ์ฑ๋ฅ๊ณผ ์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ $\theta$์ฌ์ด์
์ฌ์์ ๋น์ ์, ๋น์ ํ์ด๋ฉฐ, ์ ๋ ๋ชจ๋ธ๋ง์ผ๋ก ์ต์ ์ ์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ฅผ ์์ ์ ์ผ๋ก ๊ณ์ฐํ๊ธฐ ์ด๋ ต๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์ด๋ฅผ ๋ชจ๋ธ์ ๋ ์์กดํ๋ฉด์๋ ์ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ
๋ค๋ฃฐ ์ ์๋ ๊ฒฐ์ ๋ก ์ ์ฑ
๊ฒฝ์ฌ(Deterministic Policy Gradient) ๊ธฐ๋ฐ์ ๊ฐํํ์ต ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ํด์ํ๋ค [8].
๊ฐํํ์ต์์ ์๊ฐ $t$์์์ ๊ด์ธก $o_{t}$, ์ก์
$a_{t}$, ๋ณด์ $r_{t}$์ด๋ผ๊ณ ํ๋ค. ์ ์ฑ
$\pi(a | o ;\theta)$์
๊ด์ธก $o_{t}$๊ฐ ์ฃผ์ด์ก์ ๋ ์ก์
$a_{t}$๋ฅผ ์ ํํ๋ ํ๋ฅ ๋ถํฌ์ด๋ค. DDPG๋ ์กํฐ-ํฌ๋ฆฌํฑ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ ๊ฐํํ์ต ์๊ณ ๋ฆฌ์ฆ ์ค ํ๋์ด๋ค.
DDPG์ ์กํฐ์ ํฌ๋ฆฌํฑ์ ๋ฅ์ ๊ฒฝ๋ง์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ผ๋ฉฐ ์ด๋ฌํ ์ ๊ฒฝ๋ง์ ์ฑ๋ฅ๊ณผ ํ๋ผ๋ฏธํฐ๊ฐ์ ๋น์ ์, ๋น์ ํ์ ํ์ตํ ์ ์๋ค [16]. ์ฌ๊ธฐ์ ์กํฐ๋ ๊ด์ธก์ ๋ฐ์ ๊ด์ธก๊ฐ์ ๋ฐ๋ฅธ ์ต์ ์ ์ก์
์ ์ถ๋ ฅํ๊ณ ํฌ๋ฆฌํฑ์ ๊ด์ธก๊ณผ ์ก์
์กฐํฉ์ ๋ฐ๋ฅธ ๊ฐ์น(Q-value)๋ฅผ ํ๊ฐํ์ฌ ์ ์ฑ
์ ๊ฐ์ ํ๋๋ก
ํ๋ค. ์ด๋ฌํ ๋ฅ์ ๊ฒฝ๋ง์ ๊ตฌ์กฐ๋ก ํ๋ ๊ฐํํ์ต์ ๋ฅ์ ๊ฒฝ๋ง์ ๋ธ๋๋ฐ์ค ๋ฌธ์ ๋ฅผ ๋์ผํ๊ฒ ๊ฐ์ง๊ณ ์๋ค๋ ๋จ์ ์ด ์๋ค. ๊ฒฝ์ฐ์ ๋ฐ๋ผ ์ฒ์ ๋ณด๋ ์ํฉ์์ ์์ด์ ํธ๋
ํ๋ฆฐ ์ก์
์ ํ ์ ์์ผ๋ฉฐ ๊ทธ๋ก ์ธํด ์๋ชป๋ ํ๋ผ๋ฏธํฐ๋ก ์กฐ์ ๋์ด ์ฑ๋ฅ์ด ๋จ์ด์ง๊ฑฐ๋ ์ถ๋ ฅ์ด ๋ฐ์ฐํ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์๋ค.
๊ทธ๋ฆผ 3. ๊ฐํํ์ต ๊ธฐ๋ฐ SS-PID ์จ๋ผ์ธ ์กฐ์ ํ๋ ์์ํฌ
Fig. 3. RL-based online tuning framework for the SS-PID controller
๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ์์๋ ๊ทธ๋ฆผ 3์ ๊ฐํํ์ต ๊ธฐ๋ฐ ํ๋ผ๋ฏธํฐ ์กฐ์ ๊ตฌ์กฐ๋ฅผ ์ ์ํ๋ค. ์ ๊ตฌ์กฐ์์๋ ์์ด์ ํธ๊ฐ ์ง์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ด ์๋ ์ก์
ํจ์์ ์ํด ์กฐ์ ๋๋ฉฐ ์ด๋ ์กฐ์ ๋
์ ์๋ ๊ฐ ํ๋ผ๋ฏธํฐ์ ์ต๋์ต์ ๊ฐ์ ๊ณ ์ ํ์ฌ ์์ ์ฑ์ ๋์ด๋ฉฐ ์ก์
์ ์ ๋ถ์ ํตํ์ฌ ๊ธ๊ฒฉํ ํ๋ผ๋ฏธํฐ์ ๋ณํ๋ฅผ ์ ํํ์๋ค.
3.1 ๊ด์ธก๊ณผ ์ก์
์ ์ ์
๊ด์ธก $o_{t}$์ ๊ฐํํ์ต์ ์์ด์ ํธ๊ฐ ํ๊ฒฝ์ผ๋ก๋ถํฐ ๋ฐ์ ์ ์๋ ์ ๋ณด์ด๋ค. ์์ด์ ํธ๋ ๊ด์ธก์ ๋ฐ๋ผ ์ต์ ์ ์ก์
์ ํ๋๋ก ํ์ตํ๋ฉฐ ๋ณธ ์ฐ๊ตฌ์์๋
๋ชจํฐ์ ๋ ํผ๋ฐ์ค ์๋๋ฅผ ๋น ๋ฅด๊ณ ์์ ์ ์ผ๋ก ์ถ์ข
ํ๊ฒ ํ๊ธฐ ์ํด์ ๋ ํผ๋ฐ์ค ์๋์ ๋ชจํฐ ์๋๋ฅผ ๋บ ์๋ฌ๋ฅผ $e(t)= r(t)-v(t)$ ๋ฏธ๋ถ, ์ ๋ถํ์ฌ
์ฃผ์๋ค.
์ก์
์ ๊ฐ์ ์ ์ผ๋ก ์ ์ด๊ธฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ฉฐ ์ต์ ํ๋ ์ ์ด๊ธฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์จ๋ผ์ธ์ผ๋ก ์ฐพ์๋ธ๋ค. ์ ์ด๊ธฐ์ ํ๋ผ๋ฏธํฐ์ ์ก์
์ ๊ฐ๊ฐ ์ (7)๊ณผ ์ (8)์ ์ ์ํ์๋ค.
์ก์
๋ฒกํฐ $a_{t}$๋ ๊ฐํํ์ต ์์ด์ ํธ๊ฐ ์ ์ด๊ธฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๊ธฐ ์ํด ์ถ๋ ฅํ๋ 5์ฐจ์ ์ฐ์ ์ก์
๊ณต๊ฐ์ ์๋ฏธํ๋ค. ์ฌ๊ธฐ์ ๊ฐ ์ฑ๋ถ์ ์์๋๋ก
$K_{p}, K_{i}, K_{d}, \beta_{1}, \beta_{2}$ ์ ์๋์ ์กฐ์ ๊ฐ์ ๋ํ๋ด๋ฉฐ, ๋ชจ๋ ์ก์
์ $[-1, 1]$ ๋ฒ์๋ก
์ ๊ทํ ๋์ด ์๋ค. ์ฌ๊ธฐ์ ๊ฐํํ์ต์ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ๋งค์ฐ ๋ฏผ๊ฐํ๊ฒ ๋ฐ์ํ๋ฉฐ ํ์ต์ค์ ์๋ชป๋ ์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ํํ๋ ๊ฒ์ผ๋ก ์์คํ
์ด ๊ธ๊ฒฉํ๊ฒ
๋ถ์์ ํด์ง๋ ๊ฒ์ ๋ฐฉ์งํ๊ธฐ ์ํด ์๋ํ๊ณ $\lambda$๋ฅผ ์ (9)์ ๊ฐ์ด ์ ์ํ๋ค.
์ด๋ ๊ฒ ์ (10)์๋ ์ ํด์ง ์๋ํ๊ณ์ ๋ฐ๋ผ ๊ฐ ํ๋ผ๋ฏธํฐ์ ์ต๋ ์ต์๊ฐ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
์ฌ๊ธฐ์ $\theta_{0}$๋ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ ๊ฐ์ด๋ค.
์ด๋ ์๋ํ๊ณ๋ ๊ณผ๋ํ๊ฒ ํฌ๊ฑฐ๋ ์์ ์ด๋์ ์ค์ ํ์ง ๋ชปํ๊ฒ ํ๋ ๊ฒ์ผ๋ก ์์คํ
์ด ๋ฐ์ฐํ์ง ์๋๋ก ํ์ง๋ง ๋๋ฌด ๊ฐํ๊ฒ ์ ์ฝํ๋ค๋ฉด ํ์๋ฒ์๊ฐ ์ข์์ง๊ณ
๋๋ฌด ์ฝํ๊ฒ ์ ์ฝํ๋ค๋ฉด ์์คํ
์ด ํ์ต๊ณผ์ ์์ ์์คํ
์ด ๊ณ์ํด์ ๋ฐ์ฐํ ๊ฐ๋ฅ์ฑ์ด ์๋ค. ์ต์ข
์ ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ ์๋ ํ๊ณ์ ์ํด ์ ํด์ง ์ต๋์ต์๊ฐ ์ฌ์ด์์
ํ๋ง๋ฆฌํฐ ์ด๊ธฐ๊ฐ์ ๊ฐ ํ๋ผ๋ฏธํฐ์ ๋ง์ถฐ ์ค์ผ์ผ๋ง๋ ์ก์
์ ์ ๋ถ์ ๋ ํ๋ ๊ฒ์ผ๋ก ํํ์ด ์ (11)๊ณผ ๊ฐ์ด ํํ์ด ๊ฐ๋ฅํ๋ค. ์ฌ๊ธฐ์ ์ (12)์ ์ก์
์ ์ค์ผ์ผ ํ๋ผ๋ฏธํฐ $\alpha$๋ฅผ ์ ์ํ๋ค.
์ด๋ ๊ฒ ์ค๊ณ๋ ํ๋ผ๋ฏธํฐ๋ ์์ ํ ๋ฒ์๋ด์์ ๋ถ๋๋ฝ๊ฒ ์์ง์ด๋ฉฐ ํ๋ผ๋ฏธํฐ๋ฅผ ์ต์ ํํด ๋๊ฐ๋ค.
3.2 ๋ณด์ํจ์ ์ ์
๊ฐํํ์ต์์ ๋ณด์ํจ์์ ์ ์๋ ํ์ต ์ฑ๋ฅ์ ์ข์ฐํ๋ค. ์์ด์ ํธ๋ ๋์ ๋ณด์์ ์ต๋ํํ๋๋ก ์ ์ฑ
์ ๊ฐฑ์ ํ๋ฏ๋ก, ๋ณด์ ์ค๊ณ๋ ์๋ ด ์๋, ํ์ต ์์ ์ฑ,
ํ์โํ์ฉ ๊ท ํ, ์ ์ฑ
์ ์์ ์ฑ/์ผ๋ฐํ ์ฑํฅ์ ์ง์ ์ ์ธ ์ํฅ์ ๋ฏธ์น๋ค. ๋ถ์ ์ ํ ๋ณด์์ ์ด๋ฅธ ์์ ์์์ ๊ณผ๋ํ ํ์, ๋ณด์ ํดํน, ๋น์๋์ ํธํฅ,
์์น์ ๋ถ์์ ๋ฑ์ ์ผ๊ธฐํ ์ ์๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์๋ ์ถ์ข
๋งฅ๋ฝ์์ ์ค์ฐจ ์ค์ฌ์ ์ฐ์ํ ๋ณด์์ ์ฌ์ฉํ๋ฉฐ, ํฌ์๋ณด์์ ํํผํ๊ณ ์ ๊ทํ์ ํ๊ท ํ๋ฅผ ํตํด
์กฐ์ ๋ฏผ๊ฐ๋๋ฅผ ๋ฎ์ถ ์ ์๋๋ก ์ํผ์๋ ๊ธธ์ด ๋ถ๋ณ์ฑ์ ๊ณ ๋ คํ์ฌ ์ค๊ณ๋์๋ค.
์ฌ๊ธฐ์ ์๋ ์ถ์ข
์ค์ฐจ $e(t)$๋ฅผ ์ด์ฐ์๊ฐ $t = k\Delta t$์์์ ์ค์ฐจ ๋ณํ์จ $\dot{e}(t)$๋ก ์ ์ํ๋ค. ์ฌ๊ธฐ์ ๊ฐ๊ฐ์ ์ค์ฐจ
๋ฌด์ฐจ์ ์ ๊ทํ๋ฅผ ์ ์ฉํ๋ฉด ์ (13)๊ฐ ๋์จ๋ค.
์ฌ๊ธฐ์ $E$๋ ์ค์ฐจ ์ค์ผ์ผ, $\kappa$๋ ํฌํ์๋๋ฅผ ์กฐ์ ํ๋ ์์์ด๋ค. $\tanh(\bullet)$๋ฅผ ์ ์ฉํ๋ ๊ฒ์ผ๋ก ๋ณด์ํญ์ ์ ๊ณ๋ฅผ ๊ฐ์ง๋๋ก
ํ์๋ค [17]. ์ด๋ ํฐ ์ค์ฐจ์์์ ํฌํ๋ก ์ด์์น์ ๋ํ ๊ฐ๊ฑด์ฑ์ ์ ๊ณตํ๊ณ , ์์ ์ค์ฐจ ์์ญ์์๋ ๊ฑฐ์ ์ ํ ๊ฐ๋๋ฅผ ์ ์งํ์ฌ ํ์ต ์์ ์ฑ์ ํฅ์์ํจ๋ค.
๊ฐ ์คํญ์ ๋ฐ๋ฅธ ์์๋ณด์์ ์ (14)์ ์ ์๋๋ค.
$r_{core}$๋ ์ค์ฐจ๋ฅผ ํจ๋ํฐ๋ก ์ ๊ณตํ๋ฉฐ ๊ฐ ์ธ ๊ฐ์ ํญ์ ์ ๊ณฑ์ค์ฐจ, ์ ๋ ์ค์ฐจ, ๊ธฐ์ธ๊ธฐ ์ถ์ข
์ต์ ๋ฅผ ํ๋ํฐ๋ก ์ค๋ค. ์ ๊ณฑ ์ค์ฐจํญ์ ๋์ค์ฐจ ๊ตฌ๊ฐ์์
๋น ๋ฅธ ์๋ ด์ ์ ๋ํ๋ฉฐ ์ ๋ ์ค์ฐจ๋ ์ ์ฒด๊ตฌ๊ฐ์์ ํ๊ท ์ ์ธ ์๋ ด์ ์ ๋ํ์ฌ ์์ ์ค์ฐจ์ ๋ํด์๋ ์ผ์ ํ ๊ฐ๋๋ฅผ ์ ์ง์ํค๋ฉฐ ๊ธฐ์ธ๊ธฐ ์ถ์ข
์ต์ ํญ์ ์ค์ฐจ์
๋ณํ์จ์ ๋ํ ํ๋ํฐ๋ก ๋๋ฌด ๋น ๋ฅธ ์ด๋ ๋ณ๋์ด๋ ๊ณ ์ฃผํ ์ง๋์ ์ต์ ํ๋ค. $r_{prog}$๋ ์งํํญ์ผ๋ก $e^{2}$์ ์๊ฐ ๋ฏธ๋ถ์ ๋น๋กํ๋ ๊ฐ์
๊ฒฝํฅ์ด ๊ด์ฐฐ๋ ๋๋ง ์์ ์ ๋ณด์์ ๋ถ์ฌํ๋ค. ์ด๋ ๋ ํฐ ๋ณด์์ ๋ฐ๊ธฐ์ํด ์์ด์ ํธ๊ฐ ์์คํ
์ ๋ฐ๋ก ๋ฐ์ฐ์์ผ ์๋ฎฌ๋ ์ด์
์ ์กฐ๊ธฐ ์ข
๋ฃ์ํค๋ ๊ฒ์ผ๋ก ์์
๋ณด์์ ์ค์ด๋ ๋์์ ๋ฐฉ์งํ ์ ์๋ค. ๊ฐ์ค์น $w_{1}, w_{2}, w_{\dot{e}}, w_{prog}> 0$๋ ์ํธ ๊ท ํ์ ์กฐ์ ํ๋ฉฐ ๋
์ค์ํ๊ฒ ๊ณ ๋ คํ ์ค์ฐจ์ ๋ํ์ฌ ๊ฐํ ํ๋ํฐ๋ฅผ ์ ๊ณตํ ์ ์๋ค.
์ต์ข
์ ์ผ๋ก ๋ณด์๊ฐ์ ์ํผ์๋๊ธธ์ด $H$์ ๋ํ ํ๊ท ํ ์ ๊ทํ๋ก ๊ธธ์ด ์์กด์ฑ์ ์ค์ด๊ฒ ๋๋ค. ์ (15)์ ๋ณด์๊ฐ์ด๋ค.
๊ทธ๋ฆผ 4๋ ์ด๋ ๊ฒ ์ค๊ณ๋ ์์๋ณด์ $r_{step}$์ 3์ฐจ์ ํ๋ฉด๋ ์์๋ฅผ ๊ทธ๋ฆผ 5๋ ๊ทธ ํํธ๋งต์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๊ทธ๋ฆผ 4. ์์ ๋ณด์ํจ์์ 3์ฐจ์ ํ๋ฉด๋
Fig. 4. 3D surface of the raw reward function
๊ทธ๋ฆผ 5. ์์ ๋ณด์ํจ์์ ํํธ๋งต
Fig. 5. Heatmap of the raw reward function
์์ด์ ํธ๋ ๋ณด์์ ๋์ ํฉ ์ (16) $J$๋ฅผ ์ต์ํํ๋ ์ ์ฑ
์ ํ์ตํ๊ฒ ๋๋ค.
์ฌ๊ธฐ์ $\gamma\in(0, 1)$์ ํ ์ธ์จ์ด๋ค, ๋ํ ๋ง์ง๋ง์ผ๋ก ์ ๋ขฐ๊ตฌ๊ฐ ๋ฐ์ ํฐ ์ค์ฐจ๋ ์กฐ๊ธฐ์ข
๋ฃ์ ํจ๊ป ๊ฐํ ํ๋ํฐ๋ฅผ ๋ถ์ฌํ๋ ๊ฒ์ผ๋ก ๋ฌด์๋ฏธํ
ํ์ต์ ์ค์ด๊ณ ๋น ๋ฅธ ํ์ต์ ํ ์ ์๋๋ก ํ๋ค.
์ฌ๊ธฐ์ $e_{te}> 0$์ ์ํผ์๋ ์กฐ๊ธฐ ์ข
๋ฃ ์๋ฌ์ด๊ณ $\rho > 0$์ ์กฐ๊ธฐ ์ข
๋ฃ์ ์ถ๊ฐ๋ ํ๋ํฐ์ด๋ค. ์ด๋ ๋ช
๋ฐฑํ ๋ฐ์ฐ ๊ถค์ ์ ๋น ๋ฅด๊ฒ ์ ์ธํ๊ณ
ํ๋ณธ์ ํจ์จ๊ณผ ์์ ์ฑ์ ๋์ธ๋ค.
4. ์๋ฎฌ๋ ์ด์
์ ์๋ SS-PID ์จ๋ผ์ธ ํ๋ผ๋ฏธํฐ ์กฐ์ ๊ธฐ๋ฒ์ ํ๊ฐํ๊ธฐ ์ํด MATLAB/Simulink์์ ํ์ต ๋ฐ ์๋ฎฌ๋ ์ด์
์ ์งํํ์๋ค.
์๋ฎฌ๋ ์ด์
์ ์ฌ์ฉ๋ ๋ชจํฐ์ ํ๋ผ๋ฏธํฐ๋ Maxon์ฌ์ BLDC ๋ชจํฐ EC45 24 V 150 W๋ฅผ ๊ธฐ์ค์ผ๋ก 0.236 $kg$์ ์ง๋๊ณผ 0.1$m$
์ ๋ฐ์ง๋ฆ์ ๊ฐ์ง๋ ๊ท ์ง์ํ์ ์ถ๊ฐํ์์ผ๋ฉฐ ๋ชจํฐ์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ ํ 1๊ณผ ๊ฐ๋ค.
๊ฐํํ์ต ํ์ต์ค์๋ ๋ชจํฐ์ ์ดํ๋ก ์ธํ ํ๋ผ๋ฏธํฐ์ ๋ณํ๊ฐ ์์ ๋์ ์ค์ฐจ ์ต์ํ๋ฅผ ํ์ตํ๊ธฐ ์ํด ์ํผ์๋๋ง๋ค ํ๋ผ๋ฏธํฐ๋ฅผ $R\in[R_{0}, 1.5R_{0}]$,
$L\in[L_{0}, 1.2L_{0}]$, $K_{t}\in[K_{t0}, 1.1K_{t0}]$, $K_{e}\in[K_{e0}, 1.1K_{e0}]$,
$J\in[J_{0}, 1.1J_{0}]$, $B\in[B_{0}, 1.6B_{0}]$ ๋ฒ์์ ๋ง๊ฒ ๊ท ๋ฑ๋ถํฌ๋ก ์ด๊ธฐํํ์ฌ ํ์ตํ์๋ค.
SS-PID์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ ํ 2์ ์ ์๋์ด ์์ผ๋ฉฐ PID ๊ณ์๋ MATLAB PID Tuner๋ฅผ ์ด์ฉํ์ฌ ๊ตฌํ์์ผ๋ฉฐ ๊ด์ธก๊ธฐ ์ด๋์ PID์ ๋์ผํ ๊ทน์ ์ ๊ฐ์ง๋๋ก ์ค๊ณํ์๋ค [7].
ํ 1. BLDC ๋ชจํฐ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ
Table 1. BLDC motor initial parameters
|
ํญ๋ชฉ
|
๊ธฐํธ
|
๊ฐ
|
๋จ์
|
|
์์ ํญ
|
$R_{0}$
|
0.468
|
ohm
|
|
์์ธ๋ํด์ค
|
$L_{0}$
|
$137.5\times 10^{-6}$
|
H
|
|
ํ ํฌ์์
|
$K_{t0}$
|
$37.1\times 10^{-3}$
|
$N\bullet m/A$
|
|
์ญ๊ธฐ์ ๋ ฅ ์์
|
$K_{e0}$
|
$37.1\times 10^{-3}$
|
$V\bullet s/rad$
|
|
์ง๋๊ด์ฑ
|
$J_{0}$
|
$1.19\times 10^{-3}$
|
$kg\bullet m^{2}$
|
|
์ ์ฑ ๋ง์ฐฐ
|
$B_{0}$
|
$2.25\times 10^{-6}$
|
$N\bullet m\bullet s/rad$
|
ํ 2. SS-PID ์ด๊ธฐ ํ๋ผ๋ฏธํฐ
Table 2. SS-PID initial parameters
|
ํญ๋ชฉ
|
๊ธฐํธ
|
๊ฐ
|
|
๋น๋ก
|
$K_{p0}$
|
$6.50\times 10^{-2}$
|
|
์ ๋ถ
|
$K_{i0}$
|
$2.0\times 10^{-1}$
|
|
๋ฏธ๋ถ
|
$K_{d0}$
|
$1.69\times 10^{-3}$
|
|
๋ฏธ๋ถํํฐ
|
$N_{0}$
|
7.84
|
|
$T_{d}= K_{d0}/K_{p0}$
|
$T_{d}$
|
0.026
|
|
$W_{o}= 2N_{0}/T_{d}$
|
$W_{o}$
|
603.63
|
|
๊ด์ธก๊ธฐ ์ด๋1
|
$\beta_{1, 0}$
|
$3.64\times 10^{5}$
|
|
๊ด์ธก๊ธฐ ์ด๋2
|
$\beta_{2, 0}$
|
$1.20\times 10^{3}$
|
๋ํ ์ก์
ํจ์, ๋ณด์ํจ์, ๊ฐํํ์ต์ ํ๋ผ๋ฏธํฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ ๊ฐ๊ฐ ํ 3, ํ 4, ํ 5์ ์ ์๋์ด ์์ผ๋ฉฐ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๋ ๊ฒฝํ์ ๋ฐฉ๋ฒ์ผ๋ก ์ค์ ๋์๋ค.
ํ 3. ์ก์
ํจ์ ํ๋ผ๋ฏธํฐ
Table 3. Action function parameters
|
ํญ๋ชฉ
|
๊ธฐํธ
|
๊ฐ
|
|
์ค์ผ์ผ ์ด๋
|
$\alpha$
|
0.1
|
|
์ด๋ ์ํ ํฌํ
|
$\lambda_{p}, \lambda_{i}, \lambda_{d}$
|
2.0
|
|
๊ด์ธก๊ธฐ ์ํ ํฌํ
|
$\lambda_{\beta 1}, \lambda_{\beta 2}$
|
0.1
|
ํ 4. ๋ณด์ํจ์ ํ๋ผ๋ฏธํฐ
Table 4. Reward function parameters
|
ํญ๋ชฉ
|
๊ธฐํธ
|
๊ฐ
|
|
์ค์ฐจ ์ค์ผ์ผ
|
$E$
|
100
|
|
์ํ๋ง ํ์
|
$\Delta t$
|
$1\times 10^{-3}$
|
|
ํฌํ ๊ธฐ์ธ๊ธฐ
|
$\kappa$
|
3.0
|
|
์ค์ฐจ ์ ๊ณฑ ๊ฐ์ค์น
|
$w_{2}$
|
1.0
|
|
์ ๋์ค์ฐจ ๊ฐ์ค์น
|
$w_{1}$
|
0.2
|
|
๊ธฐ์ธ๊ธฐ ๊ฐ์ค์น
|
$w_{\dot{e}}$
|
0.1
|
|
์งํ ๋ณด๋์ค
|
$k_{prog}$
|
0.05
|
|
์กฐ๊ธฐ์ข
๋ฃ ์๊ณ ์ค์ฐจ
|
$e_{te}$
|
3.0
|
|
์ข
๋ฃ ํ๋ํฐ
|
$\rho$
|
1.0
|
|
ํ ์ธ์จ
|
$\gamma$
|
0.99
|
์ก์
ํจ์์ ์ค์ผ์ผ ์ด๋์ ์ ์ด๊ธฐ์ ํ๋ผ๋ฏธํฐ์ ๋ณํ์๋๋ฅผ ์ ํํ๋ฉฐ ๊ธ๊ฒฉํ๊ฒ ๋ณํ์ง ์๋๋ก ์ค์ ํ์์ผ๋ฉฐ ์ด๋ ์ํ ํฌํ์ ๊ฒฝ์ฐ ํฐ ๋ฒ์์ ๋ณํ์๋ ๋ฐ์ฐํ์ง
์์ง๋ง ๊ด์ธก๊ธฐ ์ํ ํฌํ์ ๊ฒฝ์ฐ ๊ฐ์ด ๋๋ฌด ์ปค์ง๋ฉด ๊ณ ์ฃผํ ์๋ต์ ๊ณ ๋ คํ๊ธฐ ์ํด ์๋ฎฌ๋ ์ด์
๋๋ ์ ์ด๊ธฐ์ ์ํ๋งํ์์ ์ค์ฌ์ผ ํ๋ฉฐ ๊ทธ๋ก ์ธํด ์ ์ด๊ธฐ์
์ค์๊ฐ์ฑ ๋๋ ์๋ฎฌ๋ ์ด์
ํ์์ด ๋์ด๋๋ฉฐ ๋๋ฌด ์์์ง ๊ฒฝ์ฐ ๊ธฐ์กด์ PID์ ์ด๊ธฐ์ ์๋ต์ ๋ฐ๋ผ๊ฐ์ง ๋ชปํ์ฌ ๋ฐ์ฐํ ์ ์์ด ์ ์ ํ ๊ฐ์ผ๋ก ์ ํ์ ํ์๋ค.
์ด๋ฌํ ํ๋ผ๋ฏธํฐ์ ์ ์ ์ ๋ฐ๋ผ ์์ด์ ํธ์ ์ ์ฑ
ํ์ต๊ณผ์ ์์ ํ์ต ์๋์ ์์ ์ฑ์ ์ํฅ์ด ์์ง๋ง ํ์ต์ด ์์ ์ ์ผ๋ก ์๋ฃ๊ฐ ๋ ๊ฒฝ์ฐ ์์ ์ ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ
์กฐ์ ํ ์ ์๋ค.
ํ 5. ๊ฐํํ์ต ํ์ดํผํ๋ผ๋ฏธํฐ
Table 5. Reinforcement Learning Hyperparameters
|
ํญ๋ชฉ
|
๊ฐ
|
๋จ์
|
|
์๋ฎฌ๋ ์ด์
์๊ฐ
|
50
|
s
|
|
์ํ๋ง ํ์
|
$1\times 10^{-3}$
|
s
|
|
ํ๊น ํํ ๊ณ์
|
$1\times 10^{-3}$
|
-
|
|
๊ฒฝํ ๋ฒํผ
|
$1\times 10^{6}$
|
-
|
|
๋ฏธ๋๋ฐฐ์น ํฌ๊ธฐ
|
64
|
-
|
๊ทธ๋ฆผ 6์ ์ค๊ณ๋ ๊ฐํํ์ต์์ ํ์ต๊ณผ์ ์์ ๊ณ ๋ ค๋ 50์ด ์ดํ์์์ ๋์์ ๋ณผ ์ ์๋๋ก 100์ด๊ฐ์ ๊ธฐ์กด ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๋ BLDC๋ชจํฐ์์์ ์๋ต
๋น๊ต๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์ดํ๊ฐ ์งํ๋์ง ์์ ๊ธฐ์กด์ ํ๋์ด ๋์ง ์์ SS-PID๋ก ์ ์ด๋๋ BLDC๋ชจํฐ์ ์ ์ด ์๋ต๋ ์์ ์ ์ด๋ฉฐ ์ฐ๊ตฌ์์ ์ ์ํ๋
๊ฐํํ์ต ์กฐ์ SS-PID๋ ์ฒ์์๋ ๋์ผํ ์๋ตํน์ฑ์ ๋ณด์ด์ง๋ง ์๊ฐ์ ๋ฐ๋ผ ์จ๋ผ์ธ์ผ๋ก ์กฐ์ ์ด ์งํ๋์ด ๊ทธ ์๋ต์ด ๊ธฐ์กด์ SS-PID์๋ ๋ค๋ฅด๊ฒ ์ต์ ํ
๋๋ ๊ฒ์ ๋ณผ ์ ์๋ค. ์ด๋ ์ค์ฐจ๋ฅผ ์ต์ํํ๊ธฐ ์ํด ๊ธฐ์กด์ ํ๋ผ๋ฏธํฐ๋ณด๋ค ๋ ๊ณต๊ฒฉ์ ์ผ๋ก ์ ์ด๋๊ณ ์์์ ๋ณด์ด๊ณ ๊ทธ๋ก ์ธํด ์ค๋ฒ์ํธ๋ ๋ ์ปค์ง์ง๋ง,
์ ์ฐฉ์๊ฐ์ ์งง์์ง๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ธ๋ค.
๊ทธ๋ฆผ 6. ์ ์ ํ๋ํธ์์์ ์๋ ์ถ์ข
์๋ต ๋น๊ต (๊ธฐ์กด SS-PID vs ๊ฐํํ์ต ๊ธฐ๋ฐ ์กฐ์ SS-PID)
Fig. 6. Speed tracking responses under nominal plant (Conventional SS-PID vs RL-tuned
SS-PID)
๊ทธ๋ฆผ 7. ์ ์ ํ๋ํธ์์์ ์ ์ด ์ฑ๋ฅ ๋น๊ต: ISE ์ง์
Fig. 7. Control performance comparison in nominal plant: ISE index
๊ทธ๋ฆผ 7์ ์ ์ด๊ธฐ์ ์ฑ๋ฅ์ ๋น๊ตํ๊ธฐ ์ํด ๊ฐ๊ฐ ์ ์ด๊ฒฐ๊ณผ์ ISE(Integral of Squared Error)๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ๊ฐํํ์ต ์กฐ์ SS-PID๋
์๊ฐ์ ๋ฐ๋ผ ์ค์ฐจ๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ์กฐ์ ํด ๊ธฐ์กด์ ํ๋ผ๋ฏธํฐ์ ๋น๊ตํ์ฌ 100์ด๊ฐ $105\times 10^{3}[rad]$๋งํผ์ ISE ์ฐจ์ด๋ฅผ
๋ณด์ด๋ฉฐ, ํ๋ฒ์ ์คํญ์ $6.48\times 10^{3}[rad]$์ ์ค์ฐจ๊ฐ ์ฆ๊ฐํ๋ ๊ธฐ์กด์ ์ ์ด๊ธฐ์ ๋นํ์ฌ $3.29\times 10^{3}[rad]$์
ISE๋ก ์ฐ์ํ ์ถ์ข
์ฑ๋ฅ์ ๋ณด์ธ๋ค.
์ด๋ฐ ์จ๋ผ์ธ์ผ๋ก ์ ์ด๊ธฐ๋ฅผ ์ต์ ํํ๋ ๊ธฐ๋ฒ์ ํนํ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๊ฐ ์ดํ๋ก ์ธํด ๋ณํด ๊ทธ ์ฑ๋ฅ์ด ๋จ์ด์ก์ ๋ ํ์ฉํ ์ ์๋ค.
๊ทธ๋ฆผ 8. ์ดํ ํ๋ํธ์์์ ์๋ ์ถ์ข
์๋ต ๋น๊ต (๊ธฐ์กด SS-PID vs ๊ฐํํ์ต ๊ธฐ๋ฐ ์กฐ์ SS-PID)
Fig. 8. Speed tracking responses under degraded plant parameters (Conventional SS-PID
vs RL-tuned SS-PID)
๊ทธ๋ฆผ 9. ์ดํ ํ๋ํธ์์์ ์ ์ด ์ฑ๋ฅ ๋น๊ต: ISE ์ง์
Fig. 9. Control performance comparison in degraded plant: ISE index
๊ทธ๋ฆผ 8์ ์ดํ๋์ด ํ๋ผ๋ฏธํฐ๊ฐ ๋ณํ์์ ๋ ๊ธฐ์กด SS-PID์ ์๋ต๊ณผ ๊ฐํํ์ต ์กฐ์ SS-PID์ ์๋ต์ ๋น๊ตํ ๊ฒ์ด๋ค. SS-PID์ ์ ์ด ํ๋ผ๋ฏธํฐ๋ ์ดํ
์ด์ ์ ์์คํ
์ ๋ง์ถฐ ์กฐ์ ์ด ๋์๊ธฐ ๋๋ฌธ์ ํ๋ผ๋ฏธํฐ์ ๋ณํ๋ก ์ธํด ๋ ๋์ ์ค๋ฒ์ํธ์ ์ ์ฐฉ์๊ฐ์ ๋ณด์ธ๋ค. ๊ฐํํ์ต ์กฐ์ SS-PID์ ๊ฒฝ์ฐ ๋์ผํ๊ฒ
์ด๊ธฐ์๋ ๋์ ์ค๋ฒ์ํธ์ ์ ์ฐฉ์๊ฐ์ ๋ณด์ฌ์ฃผ๊ณ ์์ง๋ง ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ต์ ํ๋๋ฉฐ ๊ธฐ์กด SS-PID์ ๋น๊ตํ์ฌ ๋ ๋ฎ์ ์ค๋ฒ์ํธ์ ์ ์ฐฉ์๊ฐ์ ๋ณด์ฌ์ฃผ๋ฉฐ
์์ ์ ์ผ๋ก ๊ธฐ์ค์ ํธ๋ฅผ ์ถ์ข
ํ๊ณ ์๋ค.
๋์ผํ๊ฒ ๊ทธ๋ฆผ 9๋ ์ ์ด๊ธฐ์ ์ฑ๋ฅ์ ๋น๊ตํ๊ธฐ ์ํด ๊ฐ๊ฐ ์ ์ด ๊ฒฐ๊ณผ์ ISE๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์ต์ข
์ ์ผ๋ก 100์ด๊ฐ ๊ธฐ์กด์ ์ ์ด๊ธฐ๋ $247\times 10^{3}[rad]$๋งํผ์
ISE๋ฅผ ๋ณด์ด๋ ๊ฒ์ ๋นํ์ฌ ์ ์๋ ์ ์ด๊ธฐ๋ $116\times 10^{3}[rad]$์ ISE๋ฅผ ๋ณด์ด๋ฉฐ ๊ทธ ์ฐจ์ด๋ $131\times 10^{3}[rad]$์ด๋ค.
๋ํ ์ต์ข
์ ์ผ๋ก ํ๋์ ์คํญ๋น ISE๋ $7.49\times 10^{3}[rad]$์ธ ๊ธฐ์กด์ ์ ์ด๊ธฐ์ ๋นํ์ฌ ์ ์๋ ์ ์ด๊ธฐ๋ $3.26\times
10^{3}[rad]$์ผ๋ก ๋๋ฐฐ ์์ค์ ์ ์ด์ถ์ข
์ฑ๋ฅ์ ๋ณด์ธ๋ค. ์ด๋ ์ฒซ ๋ฒ์งธ ์คํญ์์ ๊ฐ๊ฐ ์คํญ๋น ISE๊ฐ $7.41\times 10^{3}[rad]$,
$6.71\times 10^{3}[rad]$์ธ๊ฒ์ ๋นํ์ฌ ๊ฐํํ์ต ๊ธฐ๋ฐ ์กฐ์ ๋ SS-PID๋ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์์ ์ ์ผ๋ก ์กฐ์ ๋์ด ์ค์ฐจ๋ฅผ ์ค์ด๊ณ
์๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
5. ์ค ํ
์ ์๋ ๊ฐํํ์ต ๊ธฐ๋ฐ SS-PID ์ ์ด๊ธฐ์ ์ค์๊ฐ ์ฑ๋ฅ์ ๊ฒ์ฆํ๊ธฐ ์ํด Speedgoat Performance ์ฅ๋น๋ฅผ ์ด์ฉํ HILS(Hardware-In-the-Loop
Simulation) ํ๊ฒฝ์ ๊ตฌ์ถํ์๋ค. ๋ณธ ์คํ์ MATLAB/Simulink Real-Time ํ๊ฒฝ์์ ์ํ๋์์ผ๋ฉฐ, Simulink Coder๋ฅผ
์ด์ฉํ์ฌ ์ค๊ณ๋ ์ ์ด๊ธฐ๋ฅผ ์ค์๊ฐ ์คํ ์ฝ๋๋ก ๋ณํํ์ฌ ๋์ผํ Speedgoat ํ๋์จ์ด์์ ๋์์์ผฐ๋ค. ์ ์ด๊ธฐ ๋ฐ ํ๋ํธ ๋ชจ๋ธ์ ๋ชจ๋ ์ค์๊ฐ ์กฐ๊ฑด์์
์ฐ๋๋๋๋ก ๊ตฌ์ฑํ์๋ค.
์คํ์ ์ฌ์ฉ๋ Speedgoat Performance ์ฅ๋น์ ๊ธฐ๋ณธ ์ฌ์์ CPU๋ Intel Core 3.1 GHz(4-core)์ด๋ฉฐ, ๋ฉ๋ชจ๋ฆฌ๋ 8
GB์ด๋ค. ์ด์์ฒด์ ๋ Simulink Real-Time์ด๋ค. ์ฌ์ฉ๋ ํต์ ๋ชจ๋์ IO133 I/O ๋ชจ๋์ผ๋ก 16์ฑ๋ A/D ์
๋ ฅ(16-bit, ยฑ10
V, 200 kSPS), 8์ฑ๋ D/A ์ถ๋ ฅ(16-bit, ยฑ10 V, ์ ์ฐฉ์๊ฐ 10 ยตs)์ ์ ๊ณตํ๋ค.
๊ทธ๋ฆผ 10. Speedgoat Performance ๋ฐ IO133 ๋ชจ๋์ ์ด์ฉํ HILS ์คํ ๊ตฌ์ฑ
Fig. 10. HILS experimental setup using Speedgoat Performance and IO133 module.
์๋ฎฌ๋ ์ด์
์์ ํ์ต๋ ๊ฐํํ์ต ๊ธฐ๋ฐ SS-PID ์ ์ด๊ธฐ ํ๋ผ๋ฏธํฐ๋ฅผ ๋์ผํ๊ฒ ์ ์ฉํ๊ณ , IO133 ๋ชจ๋์ ํตํด ์ ์ด ์
๋ ฅ ์ ํธ๋ฅผ ์ค์๊ฐ ์
์ถ๋ ฅํ์๋ค.
์ํ๋ง ์ฃผ๊ธฐ๋ 1 ms๋ก ์ค์ ํ์์ผ๋ฉฐ, DDPG ์ ์ฑ
์ ๋ฐ๋ผ ์ ์ด๊ธฐ์ ์ด๋์ ์จ๋ผ์ธ์ผ๋ก ์กฐ์ ํ์๋ค.
๊ทธ๋ฆผ 11. HILS ์ดํ ํ๋ํธ์์์ ์๋ ์ถ์ข
์๋ต
Fig. 11. Speed tracking response in HILS deterioration plants
์ดํ๋ ํ๋ผ๋ฏธํฐ ์กฐ๊ฑด์์์ HILS ์๋ต ๊ฒฐ๊ณผ๋ ๊ทธ๋ฆผ 11๊ณผ ๊ฐ์ผ๋ฉฐ ์๋ฎฌ๋ ์ด์
๊ฒฐ๊ณผ์ ์ ์ฌํ ์ถ์ข
ํน์ฑ์ ๋ณด์๋ค. ๋ํ ISE ์ฑ๋ฅ์ ๊ทธ๋ฆผ 12์ ๋ํ๋ ์์ผ๋ฉฐ 100์ด ๊ตฌ๊ฐ์์ ์ธก์ ๋ ISE ๊ฐ์ $117\times 10^{3}[rad]$๋ก, ์๋ฎฌ๋ ์ด์
๋๋น ์ฝ $1\times 10^{3}[rad]$
์์ค์ ์ฐจ์ด๋ง ์กด์ฌํ์๋ค. ์ด๋ ์ ์ฒด ๋น์จ๋ก ๋ณผ ๋ ๋ฏธ๋ฏธํ ์ฐจ์ด์ ํด๋นํ๋ฉฐ, ์ ์๋ ์ ์ด๊ธฐ๊ฐ ์ค์ ํ๋์จ์ด ํ๊ฒฝ์์๋ ์ ์ฌํ ์๋ ์ถ์ข
์ฑ๋ฅ์ ์ ์งํจ์
๋ณด์ฌ์ค๋ค. ๋ํ HILS ํ๊ฒฝ์์๋ ์ ์ฑ
๊ฐฑ์ ๋ฐ ํ๋ผ๋ฏธํฐ ์กฐ์ ์ด ์ค์๊ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ, ์ ์๋ ํ๋ ์์ํฌ๊ฐ ์ค์๊ฐ ํ์ต ๋ฐ ์จ๋ผ์ธ ํ๋์ด ์ถฉ๋ถํ ๊ฐ๋ฅํจ์
์คํ์ ์ผ๋ก ๊ฒ์ฆํ์๋ค.
๊ทธ๋ฆผ 12. HILS ์ดํ ํ๋ํธ์์์ ์ ์ด ์ฑ๋ฅ : ISE ์ง์
Fig. 12. Control Performance in Degraded Plant under HILS: ISE Index
6. ๊ฒฐ ๋ก
๋ณธ ์ฐ๊ตฌ๋ BLDC ๋ชจํฐ ์ ์ด์์ ๋ชจํฐ์ ์ผ์ ์ก์๊ณผ ์ดํ๋ก ์ธํ ํ๋ผ๋ฏธํฐ ๋ณํ์ ๊ธฐ์ธํ ์ฅ๊ธฐ ์ฑ๋ฅ ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, SS-PID ์ ์ด๊ธฐ์
์ฅ์ ๊ณผ ๊ฐํํ์ต ๊ธฐ๋ฐ ์จ๋ผ์ธ ์กฐ์ ์ ๊ฒฐํฉํ ์๋ก์ด ์ ์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์๋ค. ์ ์๋ ๋ฐฉ๋ฒ์ Simulink ํ๊ฒฝ์์ DDPG ์์ด์ ํธ๋ฅผ ์ด์ฉํ์ฌ
SS-PID์ PID ์ด๋ ๋ฐ ๊ด์ธก๊ธฐ ์ด๋์ ์ฐ์์ ์ผ๋ก ์กฐ์ ํจ์ผ๋ก์จ, ์ด๊ธฐ ํ๋ผ๋ฏธํฐ์ ๊ณ ์ ๋ ์ ํต์ SS-PID์ ๋ฌ๋ฆฌ ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์์คํ
ํ๋ผ๋ฏธํฐ์ ์ ์ํ ์ ์์์ ๋ณด์๋ค. ์๋ฎฌ๋ ์ด์
๊ฒฐ๊ณผ, ์ ์๋ ๊ฐํํ์ต ๊ธฐ๋ฐ SS-PID๋ ์ ์ ์กฐ๊ฑด๋ฟ ์๋๋ผ ์ดํ๋ ํ๋ผ๋ฏธํฐ ์กฐ๊ฑด์์๋ ๊ธฐ์กด SS-PID๋ณด๋ค
์ฐ์ํ ์ถ์ข
์ฑ๋ฅ๊ณผ ๋ฎ์ ISE๋ฅผ ๋ฌ์ฑํ์๋ค. ์ด๋ ์ ์๋ ๊ธฐ๋ฒ์ด ์ฅ๊ธฐ๊ฐ ์ด์ฉ ํ๊ฒฝ์์์ BLDC ๋ชจํฐ ์ ์ด ์ ๋ขฐ์ฑ์ ํฅ์ํ ์ ์์์ ๋ณด์ฌ์ค๋ค.
๊ทธ๋ฌ๋ ์ฌ์ ํ ๊ฐํํ์ต ์์ด์ ํธ๊ฐ ํ์ต ๊ณผ์ ์์ ์ฐ์ถํ๋ ํ๋ผ๋ฏธํฐ๊ฐ ์ ์ญ์ ์ต์ ๊ฐ ๋๋ ์์ ์ฑ์ ๋ณด์ฅํ์ง๋ ๋ชปํ๋ฉฐ, ์ด๋ ์ด๋ก ์ ์ธก๋ฉด์์ ์ ์ฝ์ผ๋ก
์์ฉํ๋ค. ๋์งธ, ์์ด์ ํธ ํ์ต์๋ ์๋นํ ์๋ฎฌ๋ ์ด์
์๊ฐ๊ณผ ์ฐ์ฐ ์์์ด ์๊ตฌ๋๋ฉฐ, ์ด๋ ์ค์ ์ฐ์
์ ์ฉ ์ ๋น์ฉ์์น์ ์์ธ์ผ๋ก ์ด์ด์ง ์ ์๋ค.
๊ทธ๋ผ์๋ ์ ์๋ ๊ฐํํ์ต ๊ธฐ๋ฐ SS-PID๋ ๊ธฐ์กด ์ ์ด๊ธฐ์ ๋จ์ ์ ๋ณด์ํ๊ณ ์ฅ๊ธฐ๊ฐ ์ด์ฉ์์์ ํ๋ผ๋ฏธํฐ ์ดํ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ํํ ์ ์๋ ๊ฐ๋ฅ์ฑ์
๋ณด์ฌ์ฃผ์๋ค. ํนํ ์ ๊ธฐ์๋์ฐจ์ ๊ฐ์ด ๊ณ ์ ๋ขฐ์ฑ์ด ์๊ตฌ๋๋ ์ฅ๊ธฐ ์ด์ฉ ๋ชจํฐ ๊ตฌ๋ ์์คํ
์์, ์ ์ ๊ธฐ๋ฒ์ ์จ๋ผ์ธ์ผ๋ก ์ ์ด๊ธฐ๋ฅผ ์ ์์ ์ผ๋ก ๋ณด์ ํ์ฌ ์ฑ๋ฅ
์ ํ๋ฅผ ๋ฐฉ์งํ๋ ํต์ฌ ๊ธฐ์ ๋ก ํ์ฉ๋ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค. ํฅํ ์ฐ๊ตฌ์์๋ ๊ณ์ฐ ๋น์ฉ์ ์ ๊ฐํ ์ ์๋ ๊ฒฝ๋ํ ํ์ต ๊ตฌ์กฐ ๊ฐ๋ฐ์ด ํ์ํ๋ค.
Acknowledgements
This research was supported by Basic Science Research Program through the National
Research Foundation of Korea(NRF) funded by Ministry of Education (No. 2021R1F1A1061732).
References
J. Xuan, X. Wang, D. Lu, L. Wang, 2017, Research on the safety assessment of the brushless
DC motor based on the gray model, Advances in Mechanical Engineering, Vol. 9, No.
3

M. Weigert, 2023, Analysis of Diagnostic Capabilities for Degradation of Brushless
Direct Current Motors Depending on Varying Simulation Data, Vol. 4, No. 1

J. S. Park, J.-H. Choi, J. Lee, 2016, Compensation Method of Position Signal Error
with Misaligned Hall-Effect Sensors of BLDC Motor, Journal of Electrical Engineering
and Technology, Vol. 11, No. 4, pp. 889-897

M. Deepak, 2022, A Review of BLDC Motor: State of Art, Advanced Control Techniques,
and Applications, IEEE Access, Vol. 10, pp. 1-1

K.-H. Chao, C.-T. Hsieh, X.-J. Chen, 2024, A Robust Controller Based on Extension
Sliding Mode Theory for Brushless DC Motor Drives, Electronics, Vol. 13, No. 20

P. Ubare, D. Ingole, D. N. Sonawane, 2021, Nonlinear Model Predictive Control of BLDC
Motor with State Estimation, IFAC-PapersOnLine, Vol. 54, No. 6, pp. 107-112

W. Tan, W. Han, J. Xu, 2022, State-Space PID: A Missing Link Between Classical and
Modern Control, IEEE Access, Vol. 10, pp. 116540-116553

T. P. Lillicrap, 2016, Continuous control with deep reinforcement learning

X. Hao, 2025, Deep reinforcement learning enhanced PID control for hydraulic servo
systems in injection molding machines, Sci Rep, Vol. 15, No. 1

J. A. van Niekerk, J. D. le Roux, I. K. Craig, 2025, Reinforcement learning based
automatic tuning of PID controllers in multivariable grinding mill circuits, Control
Engineering Practice, Vol. 165

S.-Y. Noh, C.-H. Kim, 2024, SS-PID Controller Design for Maglev Conveyor Systems Based
on Loop Shaping Method, pp. 23-25

S.-Y. Noh, C.-H. Kim, 2025, Design of Deep RL SS-PID Controller for Constrained BLDC
Motor Drive, pp. 2652-2654

A. R. A. Majid, 2024, Enhancing BLDC Motor Speed Control by Mitigating Bias with a
Variation Model Filter, International Journal of Advanced Computer Science and Applications
(IJACSA), Vol. 15, No. 9

Y. S. Park, 2016, Motor control DC, AC, BLDC motors

K. Ogata, 2010, Modern Control Engineering

Y. Ma, W. Zhu, M. G. Benton, J. Romagnoli, 2019, Continuous control of a polymerization
system with deep reinforcement learning, Journal of Process Control, Vol. 75, pp.
40-47

S. J. D. Prince, 2024, Understanding Deep Learning

์ ์์๊ฐ
He received his B.S. degree in Electronic Engineering from Kangnam University, Korea,
in 2024. He is currently pursuing an M.S. degree in Control Engineering at the same
university, where he began his graduate studies in 2024. His research interests include
optimal control, intelligent control, robust control, and control of time-delay systems,
with applications to magnetic levitation and motor drive systems. E-mail : nsy@kangnam.ac.kr
๊น์ฐฝํ(Chang-Hyun Kim)
He received the M.S. and Ph.D. degrees in Electrical Engineering from Hanyang University,
Korea, in 2006 and 2015, respectively. From 2016 to 2021, he was an Assistant Professor
at VISION College of Jeonju, Korea. Since 2021, he has been with Kangnam University,
Korea, where he is currently an Associate Professor in the Department of Electronic
Engineering. His research interests include robust control, model predictive control
(MPC), machine learning, and their applications to magnetic levitation systems, autonomous
mobile robots, and network congestion control. E-mail : chkim@kangnam.ac.kr