• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Robotis Company, South Korea.)
  2. (Dept. of Robotics, Kwangwoon University, Korea.)



Disturbance Observer, Model Predictive Control, Hybrid Position-Force Control

1. 서 론

로봇 시스템은 산업 분야와 서비스 분야 등 다양한 분야에서 작업 수행을 위해 사용되고 있다. 주어진 작업을 수행함에 있어 환경과의 접촉은 필연적으로 발생하게 된다. 접촉 상황에서 제어 문제의 핵심은 접촉을 잘 유지하면서, 원하는 동작을 수행하는 것이다. 협동 로봇은 사람과의 접촉을 통해 작업을 지시 받고, 조립과 같이 접촉이 필요한 작업을 주로 수행한다. 이러한 로봇들에서 제어기는 작업 수행에 대한 제어뿐만 아니라 접촉을 유지하고, 접촉힘을 제어해야 한다. 최근 이러한 접촉이 있는 로봇 시스템에 모델 예측 제어(Model pre- dictive control, MPC)를 적용하려는 연구가 진행되어 왔다(1-4). 모델 예측 제어는 대표적인 최적 제어 기법 중 하나이다(5). 시스템 모델을 사용하여 미래의 시스템의 상태를 예측하고, 미래까지의 비용(Cost)을 최소화하는 현재의 제어 입력을 계산하는 방법이다. 모델 예측 제어의 장점은 미래의 상태를 고려하고 시스템의 제약을 반영한 최적의 제어 입력을 얻을 수 있다는 점이다. 이러한 특징으로 모델 예측 제어기는 출력과 작업 공간의 제약을 가지는 로봇 시스템을 제어함에 적합하다고 볼 수 있다. 하지만, 실제 로봇에 존재하는 모델과의 불확실성과 외란 때문에 공칭 시스템 모델을 기반으로 미래를 예측하는 모델 예측 제어기의 성능 저하를 유발한다. 따라서 이러한 외란을 보상하기 위해서는 강인제어가 동반되어야 한다.

강체와 접촉이 있는 로봇의 경우, 시스템이 접촉 방향으로 강인성을 가지지 않도록 해야 한다. 이는 강체와의 접촉에도 불구하고 지령 궤적을 추종하기 위해 제어입력이 과도하게 커지는 것을 방지하기 위함이며 이러한 시스템에 외란관측기(Disturbance observer, DOB)[6-8,10]를 사용한 강인제어 연구가 진행되었다(9,11,12). (11)에서는 외란관측기와 로드셀을, (12)은 운동량 기반 외란관측기와 힘/토크 센서를 사용하여 접촉이 있는 로봇 시스템에 대한 강인제어기를 설계하였다. 이 두 연구에서 제안한 강인 제어기는 구조가 간단하지만 접촉힘 제어가 어렵고, 로봇 자세에 따른 제어 성능 변화가 존재한다.

이 논문에서는 환경과의 접촉이 있는 로봇 시스템에서의 최적 제어와 강인 제어 문제를 다룬다. 특히, 모델 예측 제어와 운동량 기반 외란관측기(Momentum-based DOB)를 함께 사용하여 접촉 방향과 작업 방향을 나누어 각 방향에 대한 별도의 강인 제어기를 설계하였다. 제안하는 제어기는 접촉 유지 및 접촉힘 제어와 작업 제어에 대해 강인하며 이를 수치실험을 통해 검증하였다.

논문의 구성은 다음과 같다. 2장에서 배경 지식에 대해 소개한다. 3장에서는 제안하는 운동량 외란관측기 기반 하이브리드 위치-힘 강인제어기에 대해 설명한다. 4장에서는 외란 보상을 고려하는 외란 관측 모델 예측 제어를 제안하였다. 5장에서는 제안하는 제어기를 시뮬레이션을 통해 그 성능을 검증하였다. 마지막으로 6장에서 본 연구의 결론을 제시한다.

2. 배경 이론

본 장에서는 제안하는 외란 관측기와 모델 예측 제어를 이용한 하이브리드 위치-힘 제어의 배경 이론을 설명한다.

2.1 접촉제약을 반영한 동역학

로봇이 작업을 수행할 때, 벽과 같이 말단장치가 어느 방향에 대해서 더 이상 움직이지 못하게 하는 접촉이 발생한 경우를 생각해보자. 매니퓰레이터의 말단장치와 환경이 접촉하는 경우, 로봇은 접촉으로 인한 동작의 제약이 발생하게 되며 이는 작업을 수행함에 있어 반드시 고려되어야 한다. 먼저, 다음과 같은 환경과의 접촉이 있는 상황에서 n개의 자유도를 갖는 매니퓰레이터의 동역학을 생각하자.

(1)
$A\ddot q + B\dot q +g + J_{c}^{T}f_{c}=\Gamma$

여기에서 $q$$\in$$\mathbb{R}$$^{n\times 1}$, $A := A(q)$$\in$$\mathbb{R}$$^{n\times n}$, $B := B(q,\:\dot q)$$\in$ $\mathbb{R}$$^{n\times n}$, $g := g(q)$$\in$$\mathbb{R}$$^{n\times 1}$ 는 각각 관절각, 관절 공간 관성 행렬, 코리올리-원심력 행렬(Coriolis and centrifugal matrix), 그리고 중력 보상 벡터이다. $\Gamma$$\in$$\mathbb{R}$$^{n\times 1}$, $J_{c}:=J_{c}(q)$$\in$$\mathbb{R}$$^{m\times n}$, $f_{c}$$\in$$\mathbb{R}$$^{m\times 1}$은 각각 토크 벡터, 접촉 자코비안(Contact jacobian), 그리고 접촉힘을 나타낸다. 접촉에 대한 기하학적 정보를 모두 알고 있다면 접촉에 대한 자코비안을 얻을 수 있다. 접촉에 대한 자코비안은 매니퓰레이터 말단의 접촉 방향에 대한 속도와 관절 각속도의 관계이다.

식 (1)의 양변에 $J_{c}A^{-1}$을 곱하고 말단 장치에 대한 정기구학 식 $\dot x_{c}= J_{c}\dot q$을 사용하면 매니퓰레이터 말단의 접촉 공간에 대한 동역학은 아래와 같다.

(2)
$\ddot x_{c}-\dot J_{c}\dot q +J_{c}A^{-1}B\dot q +J_{c}A^{-1}g +J_{c}A^{-1}J_{c}^{T}f_{c}= J_{c}A^{-1}\Gamma$

식 (2)는 직교 좌표계에서의 접촉 방향 가속도, 힘, 그리고 관절 토크 간의 관계를 나타낸다. 식 (2)의 양변에 $(J_{c}A^{-1}J_{c}^{T})^{-1}$을 곱하면 아래와 같이 나타낼 수 있다.

(3)
$\Lambda_{c}\ddot x_{c}+\mu_{c}\dot q +p_{c}+ f_{c}=\bar{J}_{c}^{T}\Gamma$

여기서 $\Lambda_{c}$, $\mu_{c}$, $p_{c}$, $\bar{J}_{c}$는 다음과 같다.

(4)
\begin{align*} &\Lambda_{c}=(J_{c}A^{-1}J_{c}^{T})^{-1},\: &\mu_{c}=\Lambda_{c}J_{c}A^{-1}B -\Lambda_{c}\dot J_{c}\\ &p_{c}=\Lambda_{c}J_{c}A^{-1}g,\: &\bar{J}_{c}^{T}=\Lambda_{c}J_{c}A^{-1} \end{align*}

식 (3)에서 로봇의 말단 장치가 강체와의 접촉을 하는 상황을 고려해보자. 이때, $\dot x_{c,\:}\ddot x_{c}= 0$을 만족하며 접촉힘 $f_{c}$에 대하여 다음과 같이 정리할 수 있다.

(5)
$f_{c}=\bar{J}_{c}^{T}\Gamma -\mu_{c}\dot q -p_{c}$

식 (5)식 (1)의 $f_{c}$에 대입하면 다음과 같이 접촉 제약 동역학을 얻을 수 있다.

(6)
$A\ddot q + B\dot q +g -h_{c}=(I -P_{c})\Gamma$

여기서 $h_{c},\:P_{c}$는 각각 $J_{c}^{T}(\mu_{c}\dot q +p_{c}),\: J_{c}^{T}\bar{J}_{c}^{T}$로 계산되며 환경과의 접촉에 의해 생기는 토크이다.

로봇의 말단 장치가 강체와 접촉하는 상황은 접촉에 의해 자유도가 줄어들 수 있는 상황이다. 강체와의 접촉에 의해 자유도가 줄어들었을 때, 로봇 말단장치의 정기구학 식은 다음과 같이 정의할 수 있다.

(7)
$\dot x_{o}= J_{o}\dot q$

여기서 $x_{o}$$\in$$\mathbb{R}$$^{z\times 1}$, $J_{o}:= J_{o}(q)$$\in$$\mathbb{R}$$^{z\times n}$ 는 각각 작업 공간에서의 매니퓰레이터 말단 장치의 위치와 작업 자코비안이며, $z$는 접촉에 의해 줄어든 말단 장치의 자유도를 의미한다.

이제, 식 (7)의 작업 자코비안을 사용하여 식 (6)을 작업 공간으로 투영하면 아래와 같은 식을 유도할 수 있다.

(8)
$\Lambda_{o}\ddot x_{o}+\mu_{o}\dot q +p_{o}=\bar{J}_{o}^{T}\Gamma$

여기에서 $\Lambda_{o}$, $\mu_{o}$, $p_{o}$, $\bar{J}_{o}$는 다음과 같다.

(9)
\begin{align*} & N_{c}^{T}=I-P_{c},\: &\Lambda_{o}=(J_{o}A^{-1}N_{c}^{T}J_{o}^{T})^{-1}\\ & p_{o}=\Lambda_{o}J_{o}A^{-1}N_{c}^{T}g,\: &\bar{J_{o}}^{T}=\Lambda_{o}J_{o}A^{-1}N_{c}^{T}\\ &\mu_{o}=\Lambda_{o}J_{o}A^{-1}N_{c}^{T}B- &\Lambda_{o}\dot J_{o}+\Lambda_{o}J_{o}A^{-1}J_{c}^{T}\Lambda_{c}\dot J_{c} \end{align*}

시스템 모델을 알고 있다고 가정하면 식 (8)을 사용하여 강체와의 접촉에 의해 제약받고 있는 상황에서의 토크 입력을 구할 수 있다.

그림. 1. 운동량 기반 외란관측기 블록도

Fig. 1. Block diagram of momentum-based disturbance observer

../../Resources/kiee/KIEE.2022.71.1.164/fig1.png

2.2 운동량 기반 외란관측기

외란관측기를 사용하면 시스템에 가해지는 덩어리 외란을 추정하여 보상할 수 있다. 특히, 운동량 기반 외란관측기는 운동량을 이용하여 덩어리 외란을 추정하고 이를 보상한다(14). 이 절에서는 운동량 기반 외란관측기를 사용한 강인제어기를 소개한다. 외란을 반영한 매니퓰레이터 동역학은 다음과 같다.

(10)
$A\ddot q + B\dot q +g =\Gamma +\Gamma_{d}$

여기에서 $\Gamma_{d}$$\in$$\mathbb{R}$$^{n\times 1}$는 각 관절에 가해지는 외란 토크 벡터이다. 시스템에 실제로 인가되는 토크는 각 관절의 액추에이터의 출력 토크에서 외란 토크를 제외한 나머지가 가해지게 된다. 제어 알고리즘에서 제어 입력은 매니퓰레이터의 공칭 모델을 사용하여 계산한다. 매니퓰레이터의 공칭 모델은 다음과 같이 정의한다.

(11)
$\bar{A}\ddot q +\bar{B}\dot q +\bar{g}=\Gamma_{r}$

여기에서 $\bar{A,\:}\bar{B,\:}\bar{g}$는 각각 $A,\: B,\: g$에 대한 공칭 모델이며 $\Gamma_{r}$은 공칭 모델을 사용하여 계산한 시스템 제어 입력, 즉 입력 토크이다. 이 시스템 입력 토크를 실제 시스템 식 (10)에 가하는 경우, 실제 모델과 공칭모델간의 차이인 모델 불확실성에 의한 토크가 발생한다.

이 모델 불확실성에 의한 토크와 외란을 아래와 같은 하나의 덩어리 외란 $d$로 생각하자.

(12)
\begin{align*} d= &\Gamma_{d}-(A -\bar{A})\ddot q -(B -\bar{B})\dot q -(g -\bar{g}) \\:=&\Gamma_{d}-\widetilde A\ddot q -\widetilde B\dot q -\widetilde g \end{align*}

시스템의 불확실성과 외란에 의해 생긴 덩어리 외란을 보상하기 위해 그림 1과 같이 외란관측기 모델을 사용하였다. 그리고 Q필터를 사용하여 운동량과 토크 출력을 추정하였다(15).

(13)
\begin{align*} &\dot\zeta = -\dfrac{\alpha}{\mu}(\zeta - A\dot q),\: &\zeta(0)= A\dot q(0)\\ &\dot\chi = -\dfrac{\alpha}{\mu}(\chi -\Gamma),\: &\chi(0)=\Gamma(0) \end{align*}

여기서 $\zeta ,\:\chi$는 각각 운동량 $A\dot q$과 제어 입력 토크 $\Gamma$의 추정 값이며, $\alpha$와 $\mu$는 1차 저역 통과 필터의 설계인자이다. 이 값은 시스템에 가해지는 외란의 범위에 따라 결정하였다.

로봇 시스템 동역학에서 코리올리-원심력 행렬은 유일하지 않다. 알려진 코리올리-원심력 행렬을 계산하는 방법 중 한 가지는 관성 행렬을 사용하는 것이다(16). 이러한 경우 관성 행렬의 미분과 코리올리-원심력 행렬은 반대칭 행렬의 특성($\dot A = B+B^{T}$)을 가지게 되며 운동량의 미분에 대하여 다음과 같이 구할 수 있다.

(14)
$\dfrac{d(A\dot q)}{dt}= A\ddot q +\dot A dotq = B^{T}A^{-1}A\dot q - g+\Gamma +\Gamma_{d}$

이를 덩어리 외란에 대해 정리하고, 식 (13)에 대입하면 외란 추정 값은 다음과 같다.

(15)
\begin{align*} \Gamma_{d} &= A\ddot q +\dot A\dot q - B^{T}A^{-1}A\dot q +\bar{g}-\Gamma \\ \hat d &=\dot \zeta -\bar{B}^{T}\bar{A}^{-1}A\dot q +\bar{g}-\chi \end{align*}

따라서 시스템에 인가되는 제어입력을 덩어리 외란을 보상하여 아래와 같이 설계할 수 있다.

(16)
\begin{align*} \Gamma &=\Gamma_{r}-\hat d \\ &=\Gamma_{r}-\dot\zeta +\bar{B}^{T}\bar{A}^{-1}A\dot q +\bar{g}+\chi \end{align*}

3. 운동량 외란관측기 기반 하이브리드 위치-힘 제어

환경과 접촉이 있는 경우 대부분 로봇 동작에 제약이 발생하고, 특정 경우 작업을 수행함에 있어 방해가 되어 작업 수행 능력 하락으로 이어질 수 있다. 접촉이 없는 보통의 경우, 강인 제어기를 사용하여 이 문제를 해결 할 수 있다. 하지만, 접촉이 있다면 일반적인 강인 제어 기법으로는 접촉 대상과의 안전성을 보장하기 어려워진다. 예를 들어, 강체와의 접촉이 있는 상황에서 강인제어기가 목표 위치로 수렴시키도록 설계되었다면, 목표 위치로 수렴하기 위해 큰 제어 입력을 인가하게 되고, 로봇은 매우 강한 힘을 접촉면에 가하게되는 결과를 초래한다. 이 연구에서는 매니퓰레이터 말단의 자유도를 그림 2와 같이 접촉 방향과 작업 방향으로 나누었다. 그리고 각 방향에 대해 접촉 제약 동역학을 사용하여 강인 제어 문제에 접근하였다. 그 후 각 방향에 대한 강인 제어기를 설계하였다. 제안하는 제어기는 다른 방향에 대해 강인성을 가지지 않는 특징을 가지며, 이는 앞에서 언급한 접촉 상황에서 강인 제어 시에 발생할 문제를 발생시키지 않는다.

그림. 2. 강체와의 접촉이 있는 매니퓰레이터

Fig. 2. Manipulator with rigid body contact

../../Resources/kiee/KIEE.2022.71.1.164/fig2.png

3.1 접촉 방향의 힘 강인 제어

먼저, 그림 2에서 접촉방향에 대해 시스템 외란이 가해지는 상황을 고려해보자.

(17)
$\Lambda_{c}\ddot x_{c}+\mu_{c}\dot q +p_{c}+ f_{c}=\bar{J}_{c}^{T}(\Gamma +\Gamma_{d})$

환경과의 접촉을 강체 접촉이라고 가정하는 경우 $\dot x_{c,\:}\ddot x_{c}= 0$ 이므로 접촉 방향에 대한 일반화된 운동량과 그 미분은 항상 0이 된다. 이러한 이유로, 운동량의 변화량을 추정하여 사용하는 운동량 외란관측기를 접촉 방향에 대해 부적합하다. 따라서 접촉 방향에 대한 강인 제어는 매니퓰레이터의 말단장치에 부착된 힘/토크 센서를 사용하여 접촉힘을 측정하고 측정된 값과 목표 값의 차이를 외란으로 보고 보상하는 방법을 사용한다.

힘/토크 센서의 값에는 큰 잡음이 존재하며 이는 접촉힘 제어의 성능을 감소시키거나 제어기의 발산을 유발할 수 있다. 접촉힘 제어의 성능 저하 및 진동 발생을 억제하기 위해 접촉힘과 제어 입력 각각에 대해 Q필터를 아래와 같이 설계한다.

(18)
$\begin{array}{ll}\dot{\zeta}_{c}=-\alpha_{c} M_{c}^{1}\left(\zeta_{c}-\Gamma_{c}\right), & \zeta_{c}(0)=\Gamma_{c}(0) \\ \dot{\chi}_{c}=-\alpha_{c} M_{c}^{1}\left(\chi_{c}-\Gamma_{c, r}\right), & \chi_{c}(0)=\Gamma_{c, r}(0)\end{array}$

여기서 $\zeta_{c}$, $\chi_{c}$는 각각 접촉 토크 $\Gamma_{c}$와 상위 제어기 토크 $\Gamma_{c,\:r}$를 추정하는 값이다. 접촉에 사용된 자유도를 $m$이라 할 때 $\alpha_{c}$와 $M_{c}$$\in$$\mathbb{R}$$^{m\times m}$는 Q필터 설계인자이며 $M_{c}$의 경우 각 관절에 대한 지연시간 설계인자 $\mu_{c,\:1,\:}\mu_{c,\:2,\:}\cdots ,\:\mu_{c,\:m}$를 대각으로 나열한 행렬이다.

(19)
$M_{c}=\begin{bmatrix}\mu_{c,\:1}&&\\&\ddot s &\\&&\mu_{c,\:m}\end{bmatrix}$

식 (18)의 $\zeta_{c}$, $\chi_{c}$를 사용하여 접촉 방향에 대한 외란 추정 값을 다음과 같이 정의한다.

(20)
$\hat d_{c}=\zeta_{c}-\chi_{c}$

이제 상위 제어기 출력 토크 $\Gamma_{c,\:r}$에 추정한 외란 $\hat d_{c}$을 보상하는 제어 입력을 계산하고 이를 시스템에 인가하도록 한다.

(21)
$\Gamma_{c}=\Gamma_{c,\:r}-\hat d_{c}$

3.2 작업 방향의 위치 강인 제어

접촉을 유지하면서 움직이려면 작업 공간에서의 동작이 접촉공간에 영향을 주지 않으면서 수행되어야 한다. 작업 공간이 접촉 공간의 영공간에 존재한다면, 즉 접촉을 유지하면서 주어진 작업을 수행하기 위한 조인트 공간의 해가 존재한다면 다음과 같이 접촉 제약 동역학 식 (6)을 사용하여 접촉을 유지하는 작업 방향 동역학을 유도할 수 있다. 먼저, 외란을 반영한 접촉 제약 동역학을 고려해보자. 식 (17)에서 $\dot x_{c,\:}\ddot x_{c}= 0$이므로 이를 사용해 외란을 포함하는 접촉 제약 동역학으로 정리할 수 있다.

(22)
$A\ddot q + B\dot q +g -h_{c}=(I -P_{c})(\Gamma_{o,\:r}+\Gamma_{d})$

여기서 $h_{c},\:P_{c}$는 각각 $J_{c}^{T}(\mu_{c}\dot q +p_{c}),\: J_{c}^{T}\bar{J}_{c}^{T}$로 계산되며 환경과의 접촉에 의해 생기는 토크이고 $\Gamma_{o,\:r}$는 작업 방향에 대한 상위제어기의 출력 토크를 의미한다.

그림. 3. 제안하는 하이브리드 위치-힘 강인 제어 블록도

Fig. 3. Block diagram of proposed Hybrid Position-Force Robust Control

../../Resources/kiee/KIEE.2022.71.1.164/fig3.png

식 (7)의 작업 자코비안을 사용하여 식 (22)을 작업 공간으로 투영하여 접촉 제약 작업 방향 동역학을 아래와 같이 얻을 수 있다.

(23)
$\Lambda_{o}\ddot x_{o}+\mu_{o}\dot q +p_{o}=\bar{J}_{o}^{T}(\Gamma_{o,\:r}+\Gamma_{d})$

여기서 $x_{o}$$\in$$\mathbb{R}$$^{z\times 1}$는 작업 공간에서의 매니퓰레이터 말단 장치의 위치를 의미하며 $\Lambda_{o}$, $\mu_{o}$, $p_{o}$, $\bar{J}_{o}$는 식 (9)와 같이 얻을 수 있다.

이제 시스템에 가해지는 외란을 추정하기 위해 시스템의 현재운동량과 상위 제어기 출력을 추정하고 이 차이를 계산해야 된다. 작업 방향에 대한 운동량과 상위 제어기 출력 힘을 Q필터를 사용하여 추정하였다.

(24)
\begin{align*} &\dot\zeta_{o}= -\alpha_{o}M_{o}^{-1}(\zeta_{o}-\Lambda_{o}\dot x_{o}),\: &\zeta_{o}(0)=\Lambda_{o}\dot x_{o}(0)\\ &\dot\chi_{o}= -\alpha_{o}M_{o}^{-1}(\chi_{o}-\bar{J}_{o}^{T}\Gamma_{o,\:r}),\: &\chi_{o}(0)=\bar{J}_{o}^{T}\Gamma_{o,\:r}(0) \end{align*}

여기서 $\zeta_{o}$, $\chi_{o}$는 각각 $\Lambda_{o}\dot x_{o}$와 $\bar{J}_{o}^{T}\Gamma_{o,\:r}$를 추정하는 값이며, $\alpha_{o}$와 $M_{o}$$\in$$\mathbb{R}$$^{z\times z}$는 Q필터 설계인자이며 $M_{o}$의 경우 각 관절에 대한 지연시간 설계인자 $\mu_{o,\:1,\:}\mu_{o,\:2,\:}\cdots ,\:\mu_{o,\:z}$를 대각으로 나열한 행렬이다.

(25)
$M_{o}=\begin{bmatrix}\mu_{o,\:1}&&\\&\ddot s &\\&&\mu_{o,\:z}\end{bmatrix}$

만약 $\zeta_{o}$, $\chi_{o}$가 각각 $\Lambda_{o}\dot x_{o}$와 $\bar{J}_{o}^{T}\Gamma_{o,\:r}$를 충분히 추종하였다고 할 때 작업 방향에 대한 외란 추정 값은 아래와 같이 구할 수 있다.

(26)
$\begin{aligned} \bar{J}_{0}^{T} \Gamma_{d} &=\Lambda_{0} \ddot{x}_{0}+\dot{\Lambda}_{0} \dot{x}_{0}-\dot{\Lambda}_{0} \Lambda_{0}^{-1} \Lambda_{0} \dot{x}_{0}+\mu_{0} \dot{q}+p_{o}-\bar{J}_{0}^{T} \Gamma_{o, r} \\ \hat{d}_{o} &=\dot{\zeta}_{0}-\bar{\Lambda}_{o} \bar{\Lambda}_{0}^{-1} \Lambda_{0} \dot{x}_{0}+\mu_{0} \dot{q}+p_{0}-\chi_{0} \end{aligned}$

(27)
$\Gamma_{o}=\Gamma_{o,\:r}-\hat d_{o}$

외란 추정 값을 사용하여 상위 제어기 출력에서 외란을 보상한 제어 입력 식 (27)을 계산하고 이를 작업 공간, 즉 접촉 공간의 영공간에 투영하여 시스템에 인가한다. 그림 3은 본 논문에서 제안하는 하이브리드 위치-힘 강인 제어 블록도이다.

4. 외란 관측 모델 예측 제어

모델 예측 제어는 최적 제어 기법 중 하나로 미래의 시스템의 거동을 고려하여 비용함수를 최소화하는 제어 입력을 출력한다. 이를 위해 시스템 모델을 사용해 미래의 상태를 예측하게 되며 이는 시스템 모델에 의존적이며 외란에 취약할 수 있다. 모델 불확실성과 외란이 존재하면 제어기가 예측하는 시스템의 미래 거동이 실제 시스템의 상태와 다르게 되어 제어기의 성능이 하락할 수 있다. 외란관측기와 같은 강인 제어기를 함께 사용한다면 이러한 문제를 해결할 수 있지만, 외란까지 보상한 제어 입력이 최적 제어 입력이 아니게 되며 제약 조건을 만족하지 않는 제어 입력이 될 수 있다. 이 장에서는 이러한 문제점을 해결할 수 있는 작업 공간에 대해 외란 보상을 고려한 최적 제어기를 제안한다.

먼저, 매니퓰레이터 말단 장치의 위치, 속도를 상태(State)로, 각속도를 제어 입력으로 하는 상태 공간 모델을 생각해보자.

(28)
\begin{align*} \begin{bmatrix}\dot x \\\ddot x\end{bmatrix}=&\begin{bmatrix}0 &I_{z}\\ 0 & 0\end{bmatrix}\begin{bmatrix}x \\\dot x\end{bmatrix}+\begin{bmatrix}0 \\ I_{z}\end{bmatrix}u \\ :=& A X + B u \end{align*}

여기에서 $x,\:\dot x,\: u$$\in$$\mathbb{R}$$^{z\times 1}$, $I_{z}$$\in$$\mathbb{R}$$^{z\times z}$는 매니퓰레이터 말단 장치의 직교좌표계에서의 위치, 속도, 가속도, 그리고 차원이 $z$인 단위행렬이다.

식 (28)에 대한 이산화 모델은 아래와 같다.

(29)
$\begin{aligned}\left[\begin{array}{l}x_{k+1} \\ \dot{x}_{k+1}\end{array}\right] &=\left[\begin{array}{ll}I_{z} & T_{s} \\ 0 & I_{z}\end{array}\right]\left[\begin{array}{l}x_{k} \\ \dot{x_{k}}\end{array}\right]+\left[\begin{array}{c}T_{s}^{2} / 2 \\ T_{s}\end{array}\right] u_{k} \\:= & A_{d} X_{k}+B_{d} u_{k} \end{aligned}$

여기서 $x_{k}$는 $k$번째 시간에서의 말단장치의 직교좌표계에서의 위치를 나타내며 $T_{s}$$\in$$\mathbb{R}$$^{z\times z}$는 제어 주기를 대각으로 나열한 행렬이다.

식 (29)에서 외란이 있는 경우를 고려해보면 입력에 외란에 의한 가속도 성분 추가하여 외란을 반영한다.

(30)
$X_{k+1}= A_{d}X_{k}+ B_{d}(u_{k}+d_{k})$

여기서 $d_{k}$$\in$$\mathbb{R}$$^{n\times 1}$는 외란 가속도이다.

정상상태에서 상태 지령치 $X_{s}$와 입력 지령치 $u_{s}$가 주어졌을 때 상태 오차 $\widetilde X$의 동역학 식은 다음과 같이 계산된다.

(31)
\begin{align*} \widetilde X_{k+1} &= X_{k+1}- X_{s}\\ &= AX_{k}+Bu_{k}+ Bd_{k}- AX_{s}-B u_{s}\\ &= A(X_{k}- X_{s})+ B(u_{k}- u_{s})+ Bd_{k}\\ &=A\widetilde X_{k}+ B(\widetilde u_{k}+ d_{k})\\ &=A\widetilde X_{k}+ B\bar{u}_{k} \end{align*}

여기서 $X_{s,\:}u_{s}$는 정상상태에서의 상태와 제어입력을 나타낸다. $\bar{u}_{k}$는 $\widetilde u -(-d_{k})$이며 $\widetilde u$가 $-d_{k}$로 수렴하면 외란이 보상된 경우이다. 외란을 보상하며 상태의 오차와 입력의 오차가 0이 되도록 아래와 같이 목적함수를 잡도록 하자.

(32)
$\sum_{k=1}^{N-1}(\widetilde X_{k}^{T}Q\widetilde X_{k}+\bar{u}_{k}^{T}R\bar{u}_{k})+\widetilde X_{N}^{T}S\widetilde X_{N}$

여기서 $Q,\: R$$\in$$\mathbb{R}$$^{2z\times 2z}$, $S$$\in$$\mathbb{R}$$^{z\times z}$는 각각 상태, 입력, 최종 상태에 대한 가중치 행렬로 양의 정부호 행렬이다. 식 (32)에서 비용함수를 최소화하는 최적 제어 입력은 주어진 정상상태의 지령과의 오차를 최소화하며 미래의 시스템 거동에 외란을 반영한 제어 입력이다.

매니퓰레이터가 낼 수 있는 관절의 토크의 범위가 제한되어있고 이것을 직교좌표계에서의 가속도 범위에 대한 제약조건으로 아래와 같이 둘 수 있다.

(33)
$u_{\min}\le u_{k}\le u_{\max}$

식 (33)을 입력의 오차에 대한 제약조건으로 다음과 같이 놓을 수 있다.

(34)
$u_{\min}-u_{s}+\hat d_{k}\le\bar{u}_{k}\le u_{\max}-u_{s}+\hat d_{k}$

따라서 외란 보상을 고려한 외란 관측 모델 예측 제어 문제는 식 (35)와 같으며 그림 4는 제안하는 외란 관측 모델 예측 제어기의 블록도를 나타낸다.

(35)

$\tilde{\min }_{\tilde{X}_{1} \ldots, \tilde{X}_{N}, \bar{u}_{1} \ldots, \bar{u}_{N-1}} \sum_{k=1}^{N-1}\left(\widetilde{X}_{k}^{T} Q \widetilde{X}_{k}+\bar{u}_{k}^{T} R \bar{u}_{k}\right)+\widetilde{X}_{N}^{T} S \widetilde{X}_{N}$

s.t. $\quad \widetilde{X}_{k+1}=A_{d} \widetilde{X}_{k}+B_{d} \bar{u}_{k}$

$u_{\min }-u_{s}+\hat{d}_{k} \leq \bar{u}_{k} \leq u_{\max }-u_{s}+\hat{d}_{k}$

제안하는 외란 관측 모델 예측 제어는 외란을 보상하였을 때에도 로봇의 제어입력에 대한 제약조건을 만족한다. 또한, 최적 제어기에서 예측하는 시스템의 거동과 달라지는 것을 방지하게 된다.

5. 수치실험

5.1 매니퓰레이터 모델

그림 5는 수치실험에 사용된 관절 토크 제어가 가능한 7 자유도 매니퓰레이터 Franka Emika Panda를 보여준다. 매니퓰레이터의 말단장치에 사각의 판이 부착하였으며 사각판과 말단장치 사이에 힘/토크 센서를 부착하였다. 본 논문은 수치실험을 위한 프로그램으로 V-REP을 사용하였다(17). 또한, 물리 엔진으로는 Bullet 2.78 엔진이 사용되었다(18).

그림. 4. 제안하는 외란 관측 모델 예측 제어기 블록도

Fig. 4. Block diagram of proposed Disturbance Observation Model Predictive Control

../../Resources/kiee/KIEE.2022.71.1.164/fig4.png

그림. 5. V-REP에서의 Franka Emika Panda모델

Fig. 5. Franka Emika Panda model in V-REP

../../Resources/kiee/KIEE.2022.71.1.164/fig5.png

그림. 6. 하이브리드 위치-힘 강인 제어 수치실험 블록도

Fig. 6. Simulation Block Diagram of Hybrid Position-Force Robust Control

../../Resources/kiee/KIEE.2022.71.1.164/fig6.png

표 1. 작업 방향에 대한 로봇팔 말단 위치 오차 노름

Table 1. Error Norm of Robot End-Effector Position in Operational Space

PD 제어

PD제어+강인제어

X error [m]

1.4692

0.3930

Y error [m]

0.7175

0.3337

표 2. 작업 방향에 대한 모델 예측 제어의 위치 오차

Table 2. Position error of Model Predictive Control in Operational Space

MPC

MPC + 강인제어

X error [m]

0.0369

0.0125

Y error [m]

0.0844

0.0206

5.2 하이브리드 위치-힘 강인 제어기를 사용한 수치 실험 결과

이 절에서는 3장에서 제안한 하이브리드 위치-힘 강인 제어에 대한 수치실험 결과에 대해 설명한다. 그림 6은 하이브리드 위치-힘 제어 수치실험 블록도이다. 여기에서, 빨간색 점선은 강인 제어가 적용된 경우에 활성화되는 블록을 의미한다. PD 제어기를 사용하여 말단의 목표 가속도를 계산하고 이를 식 (8)을 사용해 작업 방향의 제어 입력을 얻는다. 수치실험에 사용한 설계인자는 $K_{p}$, $K_{d}: =diag(250,\:250,\:1100)$ $M_{c}:=10^{-1}I^{3\times 3}$, $M_{o}: = 10^{-2}diag(1,\:1,\:0.5)$, $\alpha_{c}$, $\alpha_{o}:=1$으로 설정하였으며 제어기의 최소, 최대 출력 가속도는 -20 [$m/s^{2}$]과 20 [$m/s^{2}$]으로 설정하였다. 그림 7은 작업 방향에 대한 로봇팔 말단장치의 위치 제어 수치실험 결과를 보여준다. 그리고 표 1은 PD제어만 사용하였을 때와 PD제어기와 강인제어를 같이 사용하였을 때의 말단 장치의 위치 오차 노름 값을 보여준다. 작업 방향, 즉 X, Y 방향에 대해서 제안한 강인 제어기를 사용하는 경우 오차가 줄어드는 것을 확인할 수 있다. 따라서 제안하는 제어기가 작업 방향에 대한 외란을 잘 보상하고 있음을 알 수 있다.

그림. 7. 작업 방향에 대한 로봇팔 말단 위치 제어 결과

Fig. 7. Result of Position Control in Operational Space

../../Resources/kiee/KIEE.2022.71.1.164/fig7.png

그림. 8. 외란 관측 모델 예측 제어 수치실험 블록도

Fig. 8. Simulation Block Diagram of Disturbance Observer Model Predictive Control

../../Resources/kiee/KIEE.2022.71.1.164/fig8.png

5.3 외란 관측 모델 예측 제어기를 사용한 수치 실험 결과

이 절에서는 4장에서 제안한 외란 관측 모델 예측 제어에 대한 수치실험을 진행하고 5.2절의 시뮬레이션 결과와 비교한다. 그림 8은 외란 관측 모델 예측 제어 시뮬레이션 블록도이다. 여기에서, 빨간색 점선은 강인 제어가 적용된 경우에 활성화되는 블록을 의미한다. QP 계산기로 qpOASES를 사용하였다(19).

모델 예측 제어기 출력을 식 (8)을 사용해 작업 방향 제어 입력을 얻는다. 사용한 제어 설계인자는 $Q$, $S := diag(2000I_{z},\: 10^{-4}I_{z})$, $R:=10^{-3}I_{z}$이며 다른 설계인자는 5.2절과 동일하다. 그림 9표 2는 작업 방향에 대한 로봇팔 말단의 외란 관측 모델 예측 제어의 결과이다. 표 1표 2를 통해 PD 제어, PD 강인 제어, 모델 예측 제어, 외란 관측 모델 예측 제어 순으로 추적 목표와 가까운 것을 확인 할 수 있다. 따라서 시뮬레이션을 통하여 PD제어 기반의 하이브리드 위치-힘 제어기만 사용하는 경우 보다 제안하는 외란관측기를 사용하는 경우가 지령 궤적과의 오차가 작으며, 제안하는 하이브리드 위치-힘 제어를 위한 외란 관측 모델 예측 제어기를 사용하는 경우에 가장 오차가 적은 결과를 얻었다.

그림. 9. 작업 방향 PD제어와 모델 예측 제어 결과

Fig. 9. Result of PD and MPC Control in Operational Space

../../Resources/kiee/KIEE.2022.71.1.164/fig9.png

6. 결 론

이 논문에서는 로봇팔의 하이브리드 위치-힘 제어를 위한 외란 관측 모델 예측 제어를 제안하였다. 강체와 접촉이 있는 상황에서 접촉 공간과 작업 공간을 분리하였고, 각 공간에 대한 강인제어기 적용하여 접촉힘에 대한 강인성과 말단 위치 제어에 대한 강인성을 동시에 부여하였다. 특히, 접촉 방향과 작업 방향의 동적 특성이 다름을 보이고 다른 접근으로 강인제어기를 유도하였다. 또한, 외란이 모델 예측 제어기의 성능을 떨어트릴 수 있기 때문에 모델 예측 제어기 설계 시 외란 보상을 고려해야함을 보였다. 외란을 반영한 외란 관측 모델 예측 제어기를 제안하였으며 수치실험을 통하여 제안한 제어기가 접촉힘과 위치 제어에 대한 강인성을 가지는 것을 보였다. 이는 본 논문에서 제안하는 외란 관측 모델 예측 제어기가 협동 로봇과 같이 환경과의 접촉 외란을 보상하는데 중요한 상황에서 모델 불확실성과 외란을 보상하여 로봇의 제어 성능을 향상 시킬 수 있다.

Acknowledgements

This work was supported by the Korea Institute of Energy Technology Evaluation and Planning (KETEP) grant funded by the Korea government (MOTIE) (20204030200010, Graduate Track for Core Technologies of Wind Power System Engineering) and Basic Science Research Program through the National Research Foundation of Korea (NRF) funded by the Ministry of Education (No. NRF-2018R1D1A1B07042833).

References

1 
G.-P. Incremona, A. Ferrara, L. Magni, 2017, MPC for Robot Manipulators With Integral Sliding Modes Generation, IEEE/ASME Trans. Mechatron., Vol. 22, No. 3, pp. 1299-1307DOI
2 
A. Wahrburg, K. Listmann, 2016, MPC-based admittance control for robotic manipulators, Proc. IEEE Conf. Decis. Control. Las Vegas-USA, pp. 7548-7554DOI
3 
P.-B. Wieber, 2006, Trajectory Free Linear Model Predictive Control for Stable Walking in the Presence of Strong Perturbations, IEEE-RAS Int. Conf. on Humanoid Robots. Genova-Itary, pp. 137-142DOI
4 
Y. Ding, A. Pandala, H.-W. Park, 2019, Real-time Model Predictive Control for Versatile Dynamic Motions in Qua- drupedal Robots, IEEE Int. Conf. on Robotics and Auto- mation Montreal-Canada, pp. 8484-8490DOI
5 
J. B. Rawlings, D. Q. Mayne, 2009, Model Predictive Control: Theory and Design, Nob Hill Pub. LlcGoogle Search
6 
J. Back, H. Shim, 2009, An Inner-loop Controller Guaranteeing Robust Transient Performance for Uncertain MIMO Non- linear Systems, IEEE Transactions on Automatic Control, Vol. 54, No. 7, pp. 1601-1607DOI
7 
W. B. Chen, J. Yang, L Guo, S Li, 2016, Disturbance- observer-based control and related methods — An overview, IEEE Trans. Ind. Electron., Vol. 63, No. 2, pp. 1083-1095DOI
8 
J. Back, H. Shim, 2008, Adding Robustness to Nominal Output-feedback Controllers for Uncertain Nonlinear Systems: A Nonlinear Version of Disturbance Observer, Automatica, Vol. 44, No. 10, pp. 2528-2537DOI
9 
W. Ha, J. Back, 2018, A Disturbance Observer-based Robust Tracking Controller for Uncertain Robot Manipulators, International Journal of Control Automation and Systems, Vol. 16, No. 2, pp. 417-425DOI
10 
H. Shim, G. Park, Y. Joo, J. Back, N. H. Jo, 2016, Yet another tutorial of disturbance observer: Robust stabili- zation and recovery of nominal performance, Control Theory and Technology Special Issue on Disturbance Rejection: A Snapshot A Necessity and A Beginning, Vol. 14, No. 3, pp. 237-249DOI
11 
T. Kim, S. Yoo, H. S. Kim, J. Kim, 2018, Design and Force-Tracking Impedance Control of a 2-DOF Wall- Cleaning Manipulator Using Disturbance Observer and Sliding Mode Control, IEEE Int. Conf. on Robotics and Automation(ICRA) Brisbane-Australia, pp. 4079-4084DOI
12 
H. Lee, Y. Lee, J. Park, 2018, Contact-Consistent Distur- bance Observer for Floating-base Robots, in Int. Sympo- sium on Experimental Robotics(ISER), Vol. 11, pp. 475-484DOI
13 
J. Park, O. Khatib, 2006, Contact consistent control frame- work for humanoid robots, IEEE Int. Conf. on Robotics and Automation(ICRA) Orlando-USA, pp. 1963-1969DOI
14 
J. Back, W. Ha, 2019, Robust Tracking of Robot Mani- pulators via Momentum-based Disturbance Observer and Passivity-based Controller, Int. Journal of Control Auto- mation and System(IJCAS), pp. 976-985DOI
15 
A. Tesfaye, H. S. Lee, M. Tomizuka, 2000, Sensitivity opti- mization approach to design of a disturbance observer in digital motion control systems, IEEE/ASME Trans. Mec- hatron., Vol. 5, pp. 32-38DOI
16 
B. Siciliano, L. Sciavicco, L. Villani, G. Oriolo, 2009, Robo- tics: Modelling, Planning and Control, SpringerGoogle Search
17 
V-REP, [online], Avaliable: https://www.coppeliarobotics.com/Google Search
18 
Bullet Physics [online], Avaliable: https://pybullet.org/wordpress/Google Search
19 
qpOASES [online], Avaliable: https://github.com/coin-or/qpOASESGoogle Search

저자소개

이승민 (Seungmin Lee)
../../Resources/kiee/KIEE.2022.71.1.164/au1.png

2021년 광운대학교 로봇학부 대학원(석사),

2021년~현재 로보티즈(주) 근무,

관심분야는 강인제어 및 최적제어 등

유제휘 (Jehwi Yoo)
../../Resources/kiee/KIEE.2022.71.1.164/au2.png

2018년 광운대학교 로봇학부(학사),

2018년~현재 광운대학교 로봇학부 대학원 박사과정,

관심분야는 휴머노이드 제어 및 우선순위 기반 최적화 등

백주훈 (Juhoon Back)
../../Resources/kiee/KIEE.2022.71.1.164/au3.png

1997년, 1999년 서울대학교 기계 설계 및 생산 공학(학사, 석사),

2004년 서울대학교 전기 공학 및 컴퓨터 과학(박사),

2005년~2006년 Imperial College London, UK에서 연구원으로 근무,

2008년~현재 광운대학교 로봇학부 교수, 관심분야는 제어시스템 이론 및 설계, 재생 에너지 시스템 및 멀티 에이전트 시스템 등