• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical and Computer Engineering, Ajou University, Korea.)



Manipulator dynamics, Robust tracking control, Artificial neural network, Six degree-of-freedom manipulator, Integral sliding mode control

1. 서 론

최근 4차 산업혁명 시대에 접어들면서 인간의 노동력을 대체할 수 있는 로봇이 다양하게 연구되고 있다. 특히 매니퓰레이터는 작업자들의 반복적이고 위험성이 높은 작업을 대신하므로 원천 기술 개발이 필수적이다(1). 또한, 정밀제어가 요구되는 비구조화된 목표물의 작업을 수행할 수 있으므로 다양한 분야의 연구가 진행되고 있다. 예를 들어, 로봇의 움직임을 정교하게 제어하는 ‘모션 제어 기술’, 장애물을 회피하거나 최적의 경로로 이동하는 ‘경로 생성 기술’, 다양한 로봇들이 협력하여 임무를 수행하는 ‘협업 기술’ 등이 있다(2)-(3). 특히, 산업 현장에서는 작업의 완성도와 생산 속도를 높이고자 신속하고 정교한 매니퓰레이터의 ‘모션제어’ 분야 연구가 활발히 진행되고 있다. 하지만 구동기의 마찰, 엔코더의 불확실성, 외부 외란 등의 비선형성은 시간지연, 모델 불확실성 등의 문제를 발생시킨다. 이를 해결하기 위해 PID제어, 슬라이딩 모드 제어, 강인제어, 외란 관측 등의 많은 분야의 연구가 진행되어 왔다(4). 또한, 불확실성 문제를 해결하고 로봇의 정밀 제어를 위해서는 로봇의 기구학과 동역학 모델을 필수적으로 알아야 한다. 하지만, 로봇의 동역학 모델을 구하여도 여전히 모델의 불확실성과 알 수 없는 외란으로 인해 궤적추종 시 성능 저하가 발생한다(5)-(6). 그리고 동역학 시스템은 환경에 따라 파라미터가 계속적으로 변하기 때문에 이를 적응적으로 제어하는 인공신경망(Artificial neural network)과 유전 알고리즘(Genetic algorithm) 같은 연구가 진행되고 있고, 이는 동적 로봇 시스템에도 다양하게 활용되고 있다(7). 특히, 인공신경망은 파라미터의 오차에 따라 알맞은 계수를 도출하여 원하는 성능으로 향상할 수 있다는 장점이 있다.

본 논문에서는 매니퓰레이터 시스템의 동역학 기반 적분 슬라이딩 모드 제어기를 설계하여 안정성 및 강인성을 만족시켰다. 일반적으로 적분 슬라이딩 모드 제어기의 계수는 상수로 정의된다. 하지만, 매니퓰레이터 시스템은 시간이 지날수록 시스템 특성이 달라지고, 이는 시스템 성능을 감소시킬 수 있다. 즉, 시스템 제어기의 계수가 시간이 지남에 따라 달라질 수 있다. 따라서 본 논문에서는 이런 문제를 해결하기 위해 인공신경망 기반의 적분 슬라이딩 모드 제어기를 설계하였다. 본 논문의 인공신경망 입력은 각도 오차, 각속도 오차, 각도 오차와 각속도 오차의 합의 적분으로 구성했고, 이는 가중치와 곱하여 적분 슬라이딩 평면을 구성하고 이를 0에 가깝게 수렴하도록 계속해서 가중치가 갱신된다. 이처럼 인공신경망을 기반으로 파라미터를 최적화하고 시간이 지남에 따라 발생할 수 있는 시스템 불확실성 문제에 대해 적응성을 높혔다. 또한, 로봇 동역학을 바탕으로 제어기를 설계할 때는 구동기 동역학을 포함하게 되는데(8), 구동기 동역학에 불확실성이 존재할 경우 모의실험과 실험에서 모델 불확실성이 커지게 된다. 따라서, 본 논문에서는 데이터 시트에 주어진 구동기의 계수를 이용하는 것이 아니라 실제 전압-각속도 데이터를 바탕으로 구동기 동역학의 계수를 식별하였다. 이는 모의실험과 실험에서 발생할 수 있는 오차를 감소시켰다. 끝으로, 모의실험에서는 매니퓰레이터의 관절각이 궤적에 도달하는 시간으로 성능을 검증하였고, 실험에서는 궤적과 매니퓰레이터의 관절각 오차를 비교하여 본 논문의 제어기에 대한 타당성을 확인하였다.

2. 매니퓰레이터의 동역학 및 기구학 모델

이 장에서는 구동기 동역학을 포함한 매니퓰레이터의 동역학 모델 및 기구학 모델을 유도한다. 매니퓰레이터의 각 관절의 전압은 실제 하드웨어의 물성치를 반영한 매니퓰레이터 동역학 식으로 계산된다. 이를 위해 실제 링크의 무게, 길이, 관성 모멘트를 측정하였고, 각 링크의 관성 모멘트는 Solidworks를 이용하여 로봇 동역학을 바탕으로 제어기를 설계할 때는 구동기 동역학을 포함하게 된다

2.1 구동기 동역학을 고려한 매니퓰레이터의 동역학 모델

실험 시 구동기를 사용하므로 본 논문에서는 먼저 구동기 동역학 식의 계수를 식별하였다. 구동기 동역학은 다음과 같다.

(1)
$J\dot w_{m}+(B_{a}+\dfrac{k_{T}k_{e}}{R_{a}})w_{m}+\dfrac{\tau_{L}}{N}=\dfrac{k_{T}}{R_{a}}E$

여기서 $J$ 는 부하 관성 모멘트, $\dot\omega_{m}\in ℜ^{3\times 1}$은 구동기의 회전 각가속도, $B_{a}$는 마찰계수, $K_{T}$는 구동기의 상수, $K_{e}$는 역기전력 상수, $R_{a}$는 구동기의 전기자 저항, $\omega_{m}\in ℜ^{3\times 1}$는 구동기의 회전 각속도, $\tau_{L}\in ℜ^{3\times 1}$는 부하토크, $N$은 구동기의 기어비, $E$는 구동기의 전압이다. 식(1)에서 $B_{a}+\dfrac{k_{T}k_{e}}{R_{a}}$부분을 $a$로 보고, $\dfrac{k_{T}}{R_{a}}$를 $b$로 표현하면

(2)
$J\dot w_{m}+ aw_{m}+\tau_{L}=b E$

와 같다. 식(2)의 $J$, $a$, $b$를 식별할 때에는 Simulink design optimization toolbox를 이용했다. 식별 결과 $J$=0.0154, $a$=0.4093, $b$=0.2559로 계산되었다. 식(2)의 구동기 동역학은 매니퓰레이터 동역학 식과 $\tau_{L}$에 관해 결합되고, 매니퓰레이터 동역학 식은 다음과 같다(9)-(11).

(3)
$M(\theta)\ddot\theta +V(\theta ,\:\dot\theta)\dot\theta +f(\theta)=\tau_{L}$

여기서 $\ddot\theta\in ℜ^{3\times 1}$는 매니퓰레이터의 관절각 가속도, $\dot\theta\in ℜ^{3\times 1}$는 관절각 속도, $\theta$는 관절각이다. $M\in ℜ^{3\times 3}$은 매니퓰레이터의 각 링크의 무게와 관성 모멘트에 관련된 행렬, $V\in ℜ^{3\times 3}$은 링크의 속도 및 기구학에 관련된 행렬, $f\in ℜ^{3\times 1}$는 링크의 중력에 대한 영향을 나타내는 행렬이다. 본 논문은 1~3번째 관절에 매니퓰레이터 링크의 동역학적 특성을 고려하였고, 4~6번째 관절은 각도제어로 시스템을 구성했다. 왜냐하면 본 논문의 매니퓰레이터는 무거운 물체를 파지하는 용도가 아니므로 길이가 짧고 무게가 적은 4~6번째 관절(손목계)의 동역학 특성을 고려할 경우 성능이 저하되었기 때문이다. 또한, 추가적으로 무게가 적을 때 중력의 영향을 고려할 경우 관절각 오차가 커져 $f$ 역시 동역학에서 제외하였다.

다음으로 구동기를 포함한 매니퓰레이터 동역학을 유도하기 위해 식(2)식(3)을 $\tau_{L}$에 관해 정리하여 구동기 동역학을 포함한 매니퓰레이터 동역학을 다음과 같이 표현한다.

(4)
$[M(\theta)+J I]\ddot\theta +[V(\theta ,\:\dot\theta)+a I]\dot\theta =b\bar{E}$

이때, 식별한 식(2)에서 $J$는 상수이므로 식(4)의 $M$과 행렬을 맞추기 위해 단위행렬인 $I\in ℜ^{3\times 3}$와 곱해 행렬을 일치시켰다. 식(4)의 $a$ 역시 같은 방식으로 정의했다. $b$ 또한 상수이므로 $\bar{E}\in ℜ^{3\times 1}$의 각 행렬에 곱해주었다. 따라서 편의상 구동기 동역학을 포함한 매니퓰레이터 동역학 식(4)를 간략히 표현하면 식(5)와 같다.

(5)
$\bar{M}(\theta)\ddot\theta +\bar{V}(\theta ,\:\dot\theta)\dot\theta =b\bar{E}$

2.2 매니퓰레이터 기구학 및 데나비트-하텐버그 (Denavit-Hartenberg) 표시법

본 절에서는 6 자유도 매니퓰레이터의 기구학에 대해 서술한다. 매니퓰레이터의 각 링크는 Solidworks를 이용하여 도면을 설계한 후 알루미늄 소재로 가공하여 그림. 1과 같이 제작하였다.

그림. 1 실험에 사용된 매니퓰레이터

Fig. 1 Manipulator used in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig1.png

매니퓰레이터의 기구학적 정보는 베이스 좌표계에서 말단 좌표계까지의 관계를 나타내고 이를 표준 데나비트-하텐버그 표시법으로 표현하면 표 1과 같다.

표 1. 매니퓰레이터의 D-H 파라미터

Table 1. D-H Parameter of Manipulator

Joint $$ \theta_{\text {initial }}[\mathrm{rad}] $$ $$d_{i}[\mathrm{~cm}]$$ $$a_{i}[\mathrm{~cm}]$$ $$a_{i}[\mathrm{~cm}]$$
1 $$ \theta_{1}+\frac{\pi}{2} $$ 16 3 $$ \frac{\pi}{2} $$
2 $$ \theta_{2}+\frac{\pi}{2} $$ 0 14.7 0
3 $$ \theta_{3} $$ 0 7.5 $$\frac{\pi}{2}$$
4 $$ \theta_{4} $$ 15 0 $$-\frac{\pi}{2}$$
5 $$ \theta_{5} $$ 0 0 $$\frac{\pi}{2}$$
6 $$ \theta_{6} $$ 10.6 0 0

3. 적분 슬라이딩 모드 제어기 설계

본 장에서는 구동기 동역학을 포함한 매니퓰레이터 동역학 (5)에 대해 적분 슬라이딩 모드 제어기를 설계하고 그 안정성을 증명한다. 먼저, 식(6)과 같이 매니퓰레이터의 1~3번째 관절의 적분 슬라이딩 평면을 $S_{t}\in ℜ^{3\times 1}$로 정의한다. 1~3번째의 관절각 오차를 $e\in ℜ^{3\times 1}$, 1~3번째의 관절각 속도 오차를 $\dot e\in ℜ^{3\times 1}$이다. 대해 식(6)과 같다.

(6)
$S_{t}=k_{1}e+\dot e -k_{1}e(0)-\dot e(0)+\bar{k}\int_{0}^{t}(e+\dot e)d\tau$

이때, $t=0$일 때 적분 슬라이딩 평면 $S$는 0을 만족함을 확인할 수 있다. 여기서 $k_{1}\in ℜ^{3\times 1}$, $\bar{k}\in ℜ^{3\times 1}$은 적분 슬라이딩 평면에서의 계수이다. 또한, 이후 리아푸노프 미분 함수에 적분 슬라이딩 모드의 미분 식을 대입해야 하므로 식(6)식(7)과 같이 미분한다.

(7)
$\dot S_{t}=k_{1}\dot e +\ddot e +\bar{k}e+\bar{k}\dot e $

다음으로 제어 입력을

(8)
$\bar{E}=\dfrac{\bar{M}}{b}(-k_{1}\dot e -e+\bar{M}^{-1}\bar{V}\dot\theta +\ddot\theta_{d}-k_{3}S_{t}-k_{4}sgn(S_{t}))$

와 같이 설계한 후 리아푸노프 안정성을 증명할 수 있다.

먼저 리아푸노프 함수를 식(9)과 같이 선정한다.

(9)

$V_{t}=\dfrac{1}{2}S_{t}^{T}S_{t}$ 리아푸노프 안정성은 리아푸노프 함수 $V$를 미분한 $\dot V$이 0보다 작거나 같음을 보이면 된다. 이를 식으로 표현하면 식(10)과 같다.

(10)

\begin{align*} \dot V_{t}& =S_{t}^{T}\dot S_{t} \end{align*} 식(10)의 $\dot S$에 식(7)을 대입하기 위해 다음과 같이 표현한다.

(11)
\begin{align*} \dot S_{t}=k_{1}\dot e +\ddot e +\bar{k}e+\bar{k}\dot e \\ =k_{1}\dot e +\ddot\theta -\ddot\theta_{d}+\bar{k}e+\bar{k}\dot e \end{align*}

식(11)에서 $\ddot e$은 각가속도 오차이므로 $\ddot\theta -\ddot\theta_{d}$으로 바꾸어 표현할 수 있다. 그 다음 식(11)의 각가속도 항 $\ddot\theta$에 매니퓰레이터 동역학 식(5)를 각가속도 항으로 정리하여 대입하기 위해 식(12)와 같이 정리한다.

(12)
$\ddot\theta =\bar{M}^{-1}(b\bar{E}-\bar{V}\dot\theta)$

그리고 식(12)식(11)의 각가속도 항에 대입하면

(13)
$\dot S_{t}=k_{1}\dot e +\bar{M}^{-1}(b\bar{E}-\bar{V}\dot\theta)-\ddot\theta_{d}+\bar{k}e+\bar{k}\dot e$

와 같다. 이제 식(13)를 다시 리아푸노프 함수(10)에 대입하면 다음과 같다.

(14)
$\begin{aligned} \dot{V}_{t} &=S_{t}^{T} \dot{S}_{t} \\ & =S_{t}^{T}\left(k_{1} e+\bar{M}^{-1}(b \bar{E}-\bar{V} \dot{\theta})-\ddot{\theta}_{d}+\bar{k}_{e}+\bar{k}_{e}\right) \end{aligned}$

이때, 식(14)가 음의 한정(즉, $\dot V_{t}\le 0$)이 되도록 설계한 제어입력 식(8)식(14)에 대입하면 식(15)와 같이 음의 한정이 됨을 확인할 수 있다.

(15)
$\begin{aligned} \dot{V}_{t} &=S_{t}^{T} S_{t} \\ &=S_{t}^{T}\left(-k_{3} S_{t}^{2}-k_{4}\left|S_{t}\right| \leq 0\right) \end{aligned}$

따라서 리아푸노프 안정성 정리에 의해 제어오차가 적분 슬라이딩 평면 $S_{t}$에 유한시간내에 도달하면서 이 평면상에서 계속 유지되므로 점근적으로 0에 수렴하게 된다(12).

4. 인공신경망 기반 적분 슬라이딩 모드 제어

본 논문의 인공신경망 기반 적분 슬라이딩 모드 제어에 사용되는 인공신경망 동역학 모델은 다음과 같은 순서로 학습된다.

1. 비용함수 $J$를 식(6)의 적분 슬라이딩 평면을 바탕으로 식(16)와 같이 구성한다.

(16)
$J=\dfrac{1}{2}(\hat(S_{t1}^{T}\hat S_{t1})^{2}+\hat(S_{t2}^{T}\hat S_{t2})^{2})+\hat(S_{t3}^{T}\hat S_{t3})^{2})$

여기서 $\hat S_{t1}$, $\hat S_{t2}$, $\hat S_{t3}$은 관절 1~3번째의 적분 슬라이딩 평면의 추정치이다.

2. 입력 값에는 적분 슬라이딩 평면을 구성하기 위해 관절각 오차, 관절각 속도 오차와 관절각 오차를 합한 적분 값, 관절각 속도 오차가 입력된다.

3. 비용함수를 최소화하기 위해 $k_{1}$, $\bar{k}$의 가중치가 갱신되며 학습된다.

구체적으로 인공신경망에서 가중치를 갱신할 때 델타 규칙에 의한 학습을 통해 오차를 반복적으로 줄여나간다. 델타규칙은 LMS(Least Mean Square) 알고리즘을 이용하여 ADALINE (Adaptive Linear Element)구조에서 가중치를 계산하는 방법이다(13). 본 논문에서는 그림. 2와 같이 단층 퍼셉트론 구조를 이용했다. 또한, 인공신경망 기반 적분 슬라이딩 모드 제어기의 안정성은 3장에서 서술한바와 동일하다. 왜냐하면 인공신경망으로 적분 슬라이딩 모드 제어기의 계수를 학습함에 있어서 양수인 조건만 만족하면 4장에서 전체 시스템의 안정성은 리아푸노프 안정성 해석에 의해 증명된다.

그림. 2 적분 슬라이딩 평면을 구성하는 인공신경망의 단층 퍼셉트론

Fig. 2 Single-layer perceptron of artificial neural network for constructing integral sliding plane

../../Resources/kiee/KIEE.2022.71.1.148/fig2.png

그림. 2에서 $e_{1}$, $e_{2}$, $e_{3}$는 매니퓰레이터의 1~3번째 관절각 오차, $\int(e_{1}+\dot e_{1})$, $\int(e_{2}+\dot e_{2})$, $\int(e_{3}+\dot e_{3})$은 1~3번째 관절각 속도 오차와 관절각 오차를 합한 적분 값, $\dot e_{1}$, $\dot e_{2}$, $\dot e_{3}$은 관절각 속도 오차이다. 이때, 입력 값이 가중치 $k_{1}$, $\bar{k}$와 곱해져 출력 값인 $\hat S_{t}$가 된다. 여기서 $\hat S_{t1}$, $\hat S_{t2}$, $\hat S_{t3}$은 1~3번째의 적분 슬라이딩 평면의 추정치이다. 따라서 비용함수는 식(17)과 같이 정의되고 인공신경망은 $k_{1}$, $\bar{k}$를 갱신하여 비용함수를 최소화한다. 다시말해 $k_{1}$, $\bar{k}$를 갱신하여 비용함수를 최소화한다는 의미는 적분 슬라이딩 모드 평면이 0에 빠르게 수렴하게 하는 것이다. 또한, 인공신경망의 학습은 연속적으로 데이터를 받아서 시스템 특성에 맞게 학습한 온라인 방식을 적용했다. 학습 시간은 매니퓰레이터의 궤적 생성시간과 동일한 시간동안 학습했다.

(17)
$J=\dfrac{1}{2}(\hat(S_{t1}^{T}\hat S_{t1})^{2}+\hat(S_{t2}^{T}\hat S_{t2})^{2})+\hat(S_{t3}^{T}\hat S_{t3})^{2})$

식(17)에서 비용함수 $J$는 스칼라 값이므로 $\hat S_{t}^{T}$$\in ℜ^{1\times 3}$와 전치행렬인 $\hat S_{t}\in ℜ^{3\times 1}$을 곱하여 스칼라로 표현한다.

다음으로 비용함수를 최소화하는 $k_{1}$, $\bar{k}$ 가중치 갱신 업데이트 식은 다음과 같다.

(18)
$$\hat{k_{1}}=k_{1}(0)+\Delta k_{1}$$ $$\hat{k}=\bar{k}(0)+\Delta \bar{k}$$

여기서 $k_{1}(0)$, $\bar{k}(0)$는 $k_{1}$, $\bar{k}$의 초기값이다. 또한, $\triangle k_{1}$, $\triangle\bar{k}$는 $k_{1}$, $\bar{k}$의 변화량이다. 구체적으로 $\triangle k_{1}$을 연쇄법칙(chain rule)을 적용하여 다시 정의하면

(19)
\begin{align*} \left .\begin{aligned}\triangle k_{1}=-\eta\dfrac{\partial E}{\partial S_{t}}\dfrac{\partial S_{t}}{\partial k_{1}}=-\eta\left[\dfrac{\partial E}{\partial S_{t1}}\dfrac{\partial E}{\partial S_{t2}}\dfrac{\partial E}{\partial S_{t3}}\right]\begin{bmatrix}&\dfrac{\partial S_{t1}}{\partial k_{1}}&\\&\dfrac{\partial S_{t2}}{\partial k_{1}}&\\&\dfrac{\partial S_{t3}}{\partial k_{1}}&\end{bmatrix}\\ =-\eta(S_{t1}e_{1}+S_{t2}e_{2}+S_{t3}e_{3})\end{aligned}\right . \end{align*}

와 같다. $k_{1}$과 같은 방법으로 $\triangle\bar{k}$을 정의한다.

(20)
\begin{align*} \left .\begin{aligned}\triangle\bar{k}=-\eta\dfrac{\partial E}{\partial S_{t}}\dfrac{\partial S_{t}}{\partial\bar{k}}=-\eta\left[\dfrac{\partial E}{\partial S_{t1}}\dfrac{\partial E}{\partial S_{t2}}\dfrac{\partial E}{\partial S_{t3}}\right]\begin{bmatrix}&\dfrac{\partial S_{t1}}{\partial\bar{k}}&\\&\dfrac{\partial S_{t2}}{\partial\bar{k}}&\\&\dfrac{\partial S_{t3}}{\partial\bar{k}}&\end{bmatrix}\\ =-\eta(S_{t1}e_{1}+S_{t2}e_{2}+S_{t3}e_{3})\end{aligned}\right . \end{align*}

식(19)식(20)의 가중치와 초기치의 합을 통해 인공신경망 시스템에 적용하였고, 학습율을 의미하는 $\eta$는 모의실험과 실험에서 초기값을 10으로 설정했다. 결과적으로 $k$, $\bar{k}$가 갱신되며 적분 슬라이딩 모드 평면 $S$는 0에 가깝게 수렴하였고, $k$, $\bar{k}$의 값의 변화는 이후 6장의 모의실험과 실험 에서 구체적으로 서술하였다.

3장에서 설계한 적분 슬라이딩 모드 제어기와 인공신경망 동역학 모델을 결합한 인공신경망 기반 적분 슬라이딩 모드 제어기의 전체 매니퓰레이터 시스템 블록도는 그림. 3과 같다.

그림. 3 인공신경망 기반 적분 슬라이딩 모드 제어기의 매니퓰레이터 시스템 블록도

Fig. 3 Block diagram of the manipulator system using the artificial neural network based integral sliding mode control

../../Resources/kiee/KIEE.2022.71.1.148/fig3.png

5. 관절 공간법을 이용한 매니퓰레이터의 궤적생성

일반적으로 매니퓰레이터는 관절 공간법을 이용해 궤적을 생성하여 그 궤적을 추종하는 방법으로 성능을 검증한다. 관절 공간법은 경로의 모양이 관절각에 대한 시간의 함수로 표시되는 경로 생성 방법이다(14). 이를 위해서는 시간 $t$에 관한 각 관절의 함수를 구해야 한다. 먼저 출발시간의 처음 각도와 도착시간의 목표 각도를 조건으로 표현하면

(21)
$\theta(t_{0})=\theta_{0},\:\theta(t_{f})=\theta_{f}$

와 같다. $\theta_{0}$는 초기 관절각, $t_{0}$는 출발시간, $\theta_{f}$는 목표 관절각, $t_{f}$는 종료시간이다. 하지만 식(21)의 조건만으로는 이동하는 경로가 다양하게 표현될 수 있으므로 궤적추종 시 급격하지 않은 경로를 생성하기 위해 라그랑지 보간법을 이용하여 식(22)처럼 시간에 대한 3차 다항식 형태의 관절각 함수로 표현한다.

(22)
$\theta(t)=a_{0}+a_{1}t+a_{2}t^{2}+a_{3}t^{3}$

식(22)에서 4개의 변수 $a_{0}$, $a_{1}$, $a_{2}$, $a_{3}$가 존재하고, 이 변수들은 식(21)식(23)의 4가지 조건으로 결정된다. 또한, 궤적생성 시 각 관절각의 처음 속도와 마지막 속도는 0이므로 식(22)를 미분하여 초기시간과 도착시간을 대입하면 다음과 같다.

(23)
$\dot\theta(0)=0,\:\dot\theta(t_{f})=0$

위 조건을 대입하기 위해 시간에 대한 관절각 함수(22)를 미분한다.

(24)
$\dot\theta(t)=a_{1}+2a_{2}t+3a_{3}t^{2}$

식(24)식(23)의 두 조건을 대입하면 다음과 같이 표현된다.

(25)
$a_{1}=0,\: 2a_{2}t_{f}+3a_{3}t_{f}^{2}=0$

결과적으로 식(21)의 두 조건과 식 (25)두 조건을 다시 표현하면

(26)
\begin{align*} \theta_{0}=a_{0}\\ \theta_{f}=a_{0}+a_{1}t_{f}+a_{2}t_{f}^{2}+a_{3}t_{f}^{3}\\ 0=a_{1}\\ 0=a_{1}+2a_{2}t_{f}+3a_{3}t_{f}^{2} \end{align*}

와 같다. 식(26)을 $a_{i}$에 대해 정리하면

(27)
$a_{0}=\theta_{0},\: a_{1}=0,\: a_{2}=\dfrac{3}{t_{f}^{2}}(\theta_{f}-\theta_{0}),\: a_{3}=-\dfrac{2}{t_{f}^{3}}(\theta_{f}-\theta_{0})$

와 같이 표현할 수 있다. 식(27)식(22)에 대입하여 최종적으로 시간에 대한 각 관절각 함수를 다음과 같이 구할 수 있다.

(28)
$\theta(t_{f})=\theta_{0}+\dfrac{3}{t_{f}^{2}}(\theta_{f}-\theta_{0})t_{f}^{2}-\dfrac{2}{t_{f}^{3}}(\theta_{f}-\theta_{0})t_{f}^{3}$

6장에서는 식(28)을 이용해 모의실험과 실험시 궤적을 생성했다.

6. 모의실험 및 실험

6.1 매니퓰레이터의 궤적추종 모의실험

본 장에서는 매니퓰레이터의 궤적추종으로 제어기의 타당성을 검증한다(15). 5장의 관절 공간법을 이용한 매니퓰레이터의 궤적생성 방법으로 그림. 3과 같이 궤적을 생성했다. 이때, 매니퓰레이터의 초기자세의 모든 관절각은 0[rad] 이지만 그림. 3의 궤적의 처음 각도는 0.18[rad]이다. 그 이유는 모의실험의 특성상 궤적에 도달하는 시간을 확인하기 위해서이다.

모의실험에서는 적분 슬라이딩 평면 식(6)에서 $k_{1}$, $\bar{k}$를 상수로 두고 모의실험을 진행한다. 그 다음 인공신경망으로 $k_{1}$, $\bar{k}$를 학습한 적분 슬라이딩 모드 제어기의 궤적 도달 속도의 비교로 성능을 검증한다. 먼저 모의실험 시 적분 슬라이딩 모드 제어기의 초기치는 표 2와 같다.

표 2. 적분 슬라이딩 모드 제어기의 초기값

Table 2. Initial value of the integrated sliding mode controller

$k_{1}=10$, $\bar{k}=10$

그림. 4는 1~3번째 관절의 궤적추종 모의실험 결과이다. 그래프에서 확인할 수 있듯이 2초 정도에 궤적에 도달한 것을 확인할 수 있었다. 또한 그래프의 1~3번째의 관절각은 차이가 미세해 동일한 선처럼 보였다.

그림. 4 모의실험 궤적 경로

Fig. 4 Trajectory used in the simulation

../../Resources/kiee/KIEE.2022.71.1.148/fig4.png

그림. 5는 인공신경망 기반의 적분 슬라이딩 모드 제어기를 이용한 궤적추종 모의실험 결과이다. 궤적 도달 속도를 비교해야 하므로 궤적은 그림. 4와 동일한 궤적을 사용했다. 앞서 서술한 것처럼 식(6)의 적분 슬라이딩 평면에서 $k_{1}$, $\bar{k}$를 인공신경망을 이용해 학습하였다. 인공신경망에서 가중치의 초기값은 식(18)에서 $k_{1}(0)$, $\bar{k}(0)$이고, 식 (19)의 학습율 $\eta$의 초기값 역시 표 3과 같이 설정하였다.

그림. 5 1~3번째 관절각의 적분 슬라이딩 모드 제어기의 궤적추종 모의실험

Fig. 5 Trajectory tracking performance of 1st to 3rd joint angles using the integrated sliding mode control in the simulations

../../Resources/kiee/KIEE.2022.71.1.148/fig5.png

표 3. 인공신경망 학습시 설정한 초기값

Table 3. Initial values set in learning the artificial neural networks

$k_{1}=10$, $\bar{k}=10$, $\eta =10$

그림. 4에서 계수를 상수로 가정하고 모의실험한 적분 슬라이딩 모드 제어기는 2초정도에 궤적에 도달한 반면, 그림. 5의 인공신경망 기반의 적분 슬라이딩 모드 제어기는 0.6초정도에 궤적으로 도달한 것으로 보아 시간이 단축되었다. 따라서, 궤적에 도달한 시간이 감소하였으므로 인공신경망을 이용한 적분 슬라이딩 모드 제어기의 계수 식별로 성능이 향상됨을 확인하였다. 마찬가지로 그림. 5의 1~3번째의 관절각은 차이가 미세해 동일한 선처럼 보였다.

그림. 6은 인공신경망 기반의 적분 슬라이딩 모드 제어기의 모의실험에서의 궤적추종 시 $k_{1}$, $\bar{k}$의 변화이다. 표 3에서 $k_{1}$, $\bar{k}$의 초기값을 10으로 설정했으므로 다음과 같이 변화한 것을 확인할 수 있다. 또한, 초기 값에 따라 $k_{1}$, $\bar{k}$의 계수가 다르게 학습되었지만 20이하의 양수 범위에서는 고정된 상수 값의 적분 슬라이딩 모드 제어기보다 인공신경망 기반의 적분 슬라이딩 모드 제어기의 궤적 추종 오차가 적은 것을 확인할 수 있었다. 본 논문에서는 초기 값을 10으로 설정한 경우를 서술하였다.

그림. 6 1~3번째 관절각의 인공신경망 기반의 적분 슬라이딩 모드 제어기의 궤적추종 모의실험

Fig. 6 Trajectory tracking performance of 1st to 3rd joint angles using the integrated sliding mode control based artificial neural network in the simulations

../../Resources/kiee/KIEE.2022.71.1.148/fig6.png

6.2 매니퓰레이터의 궤적추종 실험

마찬가지로 5장의 관절 공간법을 이용하여 궤적을 생성하였다. 그림. 7는 실험에서의 매니퓰레이터 궤적이다. 3초 동안은 매니퓰레이터의 초기 자세를 유지하는 구간으로 모든 관절각에 0이 입력되고, 3초부터 10초까지를 실험 구간으로 설정했다. 본 논문의 실험은 매니퓰레이터의 관절에서 특이점이 발생하지 않는 범위 내에서 진행하였고, 반복적인 실험을 진행하여도 적분 슬라이딩 모드 제어기보다 인공신경망 기반의 적분 슬라이딩 모드 제어기의 관절각 오차가 적은 것을 확인할 수 있었다.

그림. 7 인공신경망 기반의 적분 슬라이딩 모드 제어기에서 $k_{1}$, $\bar{k}$ 의 변화

Fig. 7 The change of $k_{1}$, $\bar{k}$ in the artificial neural network based integral sliding mode controller

../../Resources/kiee/KIEE.2022.71.1.148/fig7.png

실험에서는 인공신경망 결합 전후의 각도 오차 결과를 비교하여 성능을 확인하였다. 그림. 8은 인공신경망 결합 전후의 적분 슬라이딩 모드 제어기의 첫 번째 관절각 오차이다. 그림. 9, 그림. 10역시 인공신경망 결합 전후의 적분 슬라이딩 모드 제어기의 두 번째, 세 번째 관절각 오차이다.

그림. 8 실험 궤적 경로

Fig. 8 Trajectory used in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig8.png

그림. 9 적분 슬라이딩 모드 제어기와 인공신경망 기반의 적분 슬라이딩 모드 제어기의 첫 번째 관절각 오차 비교

Fig. 9 The first joint angle errors using the integral sliding mode control without and with the artificial neural network in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig9.png

그림. 10 적분 슬라이딩 모드 제어기와 인공신경망 기반의 적분 슬라이딩 모드 제어기의 두 번째 관절각 오차 비교

Fig. 10 The second joint angle errors using the integral sliding mode control without and with the artificial neural network in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig10.png

그림. 11은 인공신경망 기반의 적분 슬라이딩 모드제어기 실험에서 $k_{1}$, $\bar{k}$의 변화이다. 궤적이 변화하는 시간이 3초에서 10초까지이므로 인공신경망의 학습시간 역시 3초에서 10초까지의 계수 변화를 서술하였다. 궤적 생성시 10초 이후에는 궤적이 변화하지 않고 특정 관절각으로 수렴한다. 따라서, 인공신경망 역시 10초 이후에는 $k_{1}$, $\bar{k}$ 모두 변함이 없고, 10초에서의 학습된 상수 값으로 수렴하는 경향성을 보였다.

그림. 11 적분 슬라이딩 모드 제어기와 인공신경망 기반의 적분 슬라이딩 모드 제어기의 세 번째 관절각 오차 비교

Fig. 11 The third joint angle errors using the integral sliding mode control without and with the artificial neural network in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig11.png

그림. 12는 P제어기를 이용한 4~6번째의 관절각 오차 실험 결과이다. 앞서 서술한 것처럼 P제어기는 동역학을 고려하지 않은 각도제어이므로 인공신경망의 유무에 영향이 거의 없었다. 따라서, 인공신경망 결합 전후를 구분하지 않고 그림. 12으로 성능을 확인했다.

그림. 12 인공신경망 기반의 적분 슬라이딩 모드 제어기 실험의 , 변화

Fig. 12 The change in , in the artificial neural network based integral sliding mode controller in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig12.png

그림. 13 P제어기를 이용한 4~6번째 관절각 실험결과

Fig. 13 Results of the 4th to 6th joint angle using a P controller in the experiments

../../Resources/kiee/KIEE.2022.71.1.148/fig13.png

7. 결 론

본 논문에서는 인공신경망 기반의 적분 슬라이딩 모드 제어기를 이용하여 매니퓰레이터의 궤적추종 방법을 제안하였다. 매니퓰레이터의 정밀 제어를 위해서는 실제 물성치를 반영한 동역학을 고려해야 하며 구동기 동역학을 포함하게 된다. 이때 구동기 동역학에 불확실성이 존재할 경우 성능에 저하가 생겨 오차가 커진다. 따라서, 본 논문에서는 전압−각속도의 실제 데이터로 구동기 동역학 식의 계수를 식별하여 구동기에서 발생하는 불확실성을 줄였다. 그 다음에 구동기 동역학과 매니퓰레이터 동역학 식을 결합하여 구동기 동역학을 포함한 매니퓰레이터 동역학을 구했다. 그리고 리아푸노프 안정성 및 강인성을 만족하는 적분 슬라이딩 모드 제어기를 설계하였다. 적분 슬라이딩 모드 제어기에서의 계수는 시간이 지남에 따라 매니퓰레이터 모델이 변하여 성능이 저하로 이어질 수 있다. 따라서, 본 논문에서는 인공신경망을 이용에 적분 슬라이딩 모드 제어기의 계수를 환경에 맞게 최적화하는 기법에 주목하였다. 모의실험에서는 적분 슬라이딩 모드 제어기에서 인공신경망 결합 전후의 궤적 도달 시간으로 성능을 확인하였고, 실험에서는 매니퓰레이터의 관절각 오차를 통해 본 논문의 제어기에 대한 타당성을 확인하였다.

Acknowledgements

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT) (2020- R1A2C101226111).

References

1 
Jaemin Baek, Sep 2021, Time-delayed Control Schemes and Its Application to Robot Manipulators, The Korean Institute of Electrical Engineers, Vol. 70, No. 9, pp. 19-24Google Search
2 
F. Durini, 2021, Soft large area FBG tactile sensors for exteroception and proprioception in a collaborative robotic manipulator, 2021 Smart Systems Integration (SSI), Grenoble, France, pp. 1-4DOI
3 
Shahzeb Ali, Jun 2020, Inverse kinematic solution of ABB IRB 120, Technical ReportGoogle Search
4 
W. Cheng, Z. Zhang, Y. Wu, 2020, Disturbance observer based Tracking Control for A Flexible Joint Robotic Mani- pulator with External Disturbance, 2020 Chinese Control And Decision Conference (CCDC), Hefei, Cjina, pp. 3406-3409DOI
5 
Calogero Maria Oddo, 2021, Soft large area FBG tactile sensors for exteroception and proprioception in a collaborative robotic manipulator, Smart Systems Integration (SSI), Grenoble, France, pp. 1-4Google Search
6 
Y. Yang, T. Jie, 2017, One-DOF link manipulator control through active disturbance rejection approach, 2017 36th Chinese Control Conference (CCC), Dalian, China, pp. 1028-1032DOI
7 
K. Kim, J. Cho, J. Pyo, S. Kang, J. Kim, 2017, Dynamic Object Recognition Using Precise Location Detection and ANN for Robot Manipulator, 2017 International Conference on Control, Artificial Intelligence, Robotics \&Optimization (ICCAIRO), ETRI, Korea, pp. 237-241DOI
8 
Jin Ho Shin, Woon Bo Baek, Mar 2004, Robust Adaptive Fault- Tolerant Control for Robot Manipulators with Performance Degradation Due to Actuator Failures and Uncertainties, The Korean Institute of Electrical Engineers, Vol. 3, No. 53, pp. 173-181Google Search
9 
Sheng Dong, Zhaohui Yuan, Fuli Zhang, Nov 2019, A Simplified Method for Dynamic Equation of Robot in Generalized Coordinate System, Journal of Physics: Conference Series, Shebel, China, Vol. 1345, No. 4Google Search
10 
Yu Xiang Wu, Ying Feng, Yueming Hu, Sep 2005, Dynamical adap- tive sliding mode output tracking control of mobile mani- pulators, Machine Learning and Cybernetics, Shebel, China, Vol. 2, No. 736, pp. no. 736DOI
11 
Pyung-Hua Chang, Ki Cheol Park, Sukhan Lee, Oct 2000, An extension to operational space for kinematically redundant manipulators: kinematics and dynamics, in IEEE Transactions on Robotics and Automation, Vol. 16, No. 5, pp. 592-596DOI
12 
Wu, Y. X., Feng, Y., Hu, Y. M., 2005, Dynamical adaptive sliding mode output tracking control of mobile manipula- tors, In Proceedings of the 4th IEEE international conference on machine learning and cyberneticspp, Guangzhou, China, pp. 731-736DOI
13 
Jeong seul, 2004, Structure and usage of neural networks, chungnam National University Press, pp. 76-97Google Search
14 
John J. Craig, 2005, Introduction to robotics, Pearson, pp. 258-291Google Search
15 
L. Shaoming, L. Ruipeng, 2017, Research on trajectory trac- king control of multiple degree of freedom manipulator, 2017 32nd Youth Academic Annual Conference of Chinese Association of Automation (YAC), pp. 218-222DOI

저자소개

황준하(Junha Hwang)
../../Resources/kiee/KIEE.2022.71.1.148/au1.png

Junha Hwang received the B.S. degree in the department electrical and computer engineering from Ajou University, Suwon, Korea, in 2020 respectively, where she is currently working toward the M.S. degree.

Tel:031-219-2489

Fax:031-212-9531

E-mail : hjhi1234@ajou.ac.kr

좌동경(Dongkyoung Chwa)
../../Resources/kiee/KIEE.2022.71.1.148/au2.png

Dongkyoung Chwa received the B.S. and M.S. degrees in control and instrumentation engi- neering and the Ph.D. degree in electrical and computer engineering from Seoul National University, Seoul, Korea, in 1995, 1997, and 2001, respectively.

Since 2005, he has been with the Department of Electrical and Computer Engineering, Ajou University, Suwon, Korea, where he is currently a Professor.

Tel:031-219-1815

Fax:031-212-9531

E-mail : dkchwa@ajou.ac.kr