Mobile QR Code QR CODE : Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

ISO Journal TitleJ Korean Inst. IIIum. Electr. Install. Eng.

Online Submission

Main Menu

Journal Search

[

Research article

]

Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

KIIEE Vol. 40, No. 2, p.119-125

ISSN (print) :

1229-4691

ISSN (online) :

2287-5034

Received : 2 February 2026Revised : 5 February 2026Accepted : 6 February 2026

DOI :

http://doi.org/10.5207/JIEIE.2026.40.2.119

박테리아 채집 최적화 알고리즘 기반으로 한 이륜 로봇의 균형 및 주행 제어

Balancing and Driving Control of a Two-Wheeled Robot Based on Bacterial Foraging Optimization Algorithm

유동상 (Dong Sang Yoo) ^†iD

^†Corresponding Author : Professor, School of Electronic & Electrical Engineering, Hankyong National University, Korea E-mail：dsyoo@hknu.ac.kr

License :

This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/)which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

This paper proposes an optimal controller design to enhance the upright balancing and driving performance of a two-wheeled robot. The control system for the two-wheeled robot is based on the Linear Quadratic Regulator (LQR) technique. To determine the optimal control gain by tuning the weighting matrices, the Bacterial Foraging Optimization Algorithm (BFOA) and the hybrid BFOA-PSO (Particle Swarm Optimization) algorithm were implemented. Control performance was quantitatively evaluated using a fitness function that integrates the Integral of Time-weighted Absolute Error (ITAE) index with control input weighting. To verify the practical effectiveness of the proposed controller, a 3D model was established by interfacing SolidWorks CAD data with the Simscape Multibody environment. The results demonstrate that the BFOA-based optimization technique is effective in deriving robust control parameters for the robot. While the hybrid algorithm exhibited slightly superior performance under specific operating conditions, it was observed that the relative superiority among the algorithms varies depending on the initial parameter configurations and environmental factors.

Key Words

3D Model, Bacterial foraging optimization algorithm (BFOA), Linear quadratic regulator (LQR), Particle swarm optimization (PSO), Two-wheeled robot

1. 서 론

이륜 로봇은 부족 구동(underactuated) 시스템 동역학을 바탕으로 자동 제어, 배터리 기술, 전력 전자, 소프트웨어 프로그래밍 및 네트워킹 등 다양한 공학 분야의 융합이 필요한 복잡한 기계 시스템이다. 이 시스템은 구조적 단순함과 높은 에너지 효율, 우수한 기동성 및 환경 적응력을 바탕으로 군사와 민간 분야 모두에서 폭넓게 활용되고 있다. 그러나 시스템 특유의 비선형성과 다변수 간의 강한 결합, 그리고 본질적인 불안정성으로 인해 정밀한 제어에 어려움이 따른다. 따라서 이러한 부족구동 시스템의 안정적인 균형 유지와 제어 알고리즘 개발은 로봇 공학자들이 주목하는 핵심 연구 과제이다^[1, ^2].

이륜 로봇의 균형 유지를 위해 Lyapunov 안정성 정리에 기반한 다양한 제어기가 사용되고 있으나, 이러한 시스템의 성능은 설계자가 임의로 선택한 제어기 계수에 따라 크게 달라진다. 따라서 최적의 성능을 확보하기 위해서는 최적화 알고리즘이 필요하다. 기존의 많은 제어기는 최적화 기법을 거치지 않고 시행착오를 통해 제어 이득을 결정해 왔다는 한계가 있다.

Linear Quadratic Regulator (LQR) 기법은 산업 현장에서 널리 사용되는 선형 상태 되먹임 제어기로, 상태 공간 모델을 기반으로 최적의 제어 입력을 결정한다. LQR 기법의 핵심은 상태 오차(성능)와 제어 입력(에너지 소모) 사이의 최적 균형점을 찾는 것이다. LQR은 이 두 요소에 각각 가중치 행렬 $Q$와 $R$을 부여하여, 비용 함수를 최소화하면서 시스템을 가장 빠르게 안정시키는 수학적 해답을 제공한다. 설계자는 복잡한 제어 로직을 직접 설계하는 대신, 무엇에 비중을 둘 것인지만 결정하면 된다. 즉, $Q$의 가중치를 높이면 에너지를 많이 쓰더라도 목표에 더 정확하고 빠르게 도달하며, $R$의 가중치를 높이면 움직임이 다소 느려지더라도 에너지를 아끼며 부드럽게 움직인다. 결과적으로 LQR은 가중치에 따라 최소 에너지를 사용하면서 목표를 달성하는 최적 제어량을 찾아내지만, 가중치 행렬 $Q$와 $R$을 결정하는 과정에서 여전히 설계자의 경험과 시행착오에 의존해야 한다는 문제가 남는다^[3]. 이에 제어 공학자들은 전역 최적해를 얻기 위해 자연 현상에서 영감을 얻은 확률적 기법 기반의 다양한 지능형 최적화 접근 방식이 채택되고 있다. 대표적으로 자연 선택 이론에 기반한 유전 알고리즘(Genetic Algorithm, GA), 조류나 어류의 군집 행동을 모방한 입자 군집 최적화(Particle Swarm Optimization, PSO) 등이 있다. 이러한 알고리즘은 LQR 제어 시스템을 더욱 견고하게 만들며, 잡음이나 데이터 누락에 대한 민감도를 낮춘다^[4].

박테리아 채집 최적화 알고리즘(BFOA)은 대장균(E. coli)이 영양분을 찾아 이동하는 방식을 모방한 군집 지능 알고리즘의 일종으로, 다양한 분야의 비용 함수 최적화에 적용 가능한 튜닝 기법이다^[5]. 본 논문에서는 LQR 제어기의 성능을 개선하기 위해 BFOA와 다른 자연 영감 기법을 결합한 알고리즘을 활용하여 가중치 행렬 $Q$와 $R$을 튜닝한다. 이를 통해 대수 리카티(Riccati) 방정식을 거쳐 최종적인 최적 제어 이득 $K$를 설계한다.

본 논문의 구성은 다음과 같다. 2절에서는 제안된 이륜 로봇의 동역학을 제시하고, 수직 균형점에 대해 선형화된 상태 방정식을 기술한다. 3절에서는 LQR 제어기의 최적화 방법으로서 BFOA 및 PSO가 융합된 BFOA를 통한 가중치 행렬 결정과 최적 상태 되먹임 제어기 설계 과정을 다룬다. 4절에서는 Simscape와 Simulink를 이용하여 구축한 3D 모델에 적용한 시뮬레이션 결과를 소개한다.

2. 이륜 로봇의 모델

일반적으로 기계 시스템의 동역학 모델은 라그랑주(Lagrange) 방정식, 뉴턴-오일러(Newton-Euler) 방정식, 또는 케인(Kane) 방법 등을 이용하여 수학적 미분방정식을 도출하고, 이를 상태 방정식으로 변환하여 수치 해석적으로 해를 구하는 방식을 취한다.

Fig. 1. Coordinates of two-wheeled robot

본 논문은 Fig. 1과 같이 구성된 이륜 로봇의 일반화된 속도를 직진 운동 속도 $\dot{x}$, 피치(pitch) 운동 각속도 $\dot{\phi}$로 정의하고, 참고문헌^[6]의 유도 과정을 따라 $n_x$축 방향에 대한 직선 주행 동역학 방정식을 다음과 같이 도출한다.

(1)

$(m_p + 2m_w + 2I_w/r^2)\ddot{x} + (m_p l \cos\phi)\ddot{\phi} $

$- m_p l \dot{\phi}^2 \sin\phi = (\tau_L + \tau_R)/r = 2\tau/r$

$(I_p + m_p l^2)\ddot{\phi} + (m_p l \cos\phi)\ddot{x} - m_p g l \sin\phi = -2\tau$

여기서 $\tau_L$과 $\tau_R$은 각각 좌·우측 바퀴에 인가되는 토크로 직진 운동의 경우에는 $\tau_L = \tau_R = \tau$이다.

Fig. 1과 식 (1)에서 사용되는 각 파라미터의 정의와 시뮬레이션을 위해 적용되는 수치는 Table 1에서 보여준다.

Table 1. Mechanical parameters and values

Paramter	Description	Value
$l$	distance from B to P point	0.22 [$m$]
$d$	distance between wheels	0.28 [$m$]
$r$	radius of wheel	0.10 [$m$]
$m_p$	mass of platform & pendulum	16.08 [$kg$]
$m_w$	mass of wheel	1.81 [$kg$]
$I_p$	inertia of platform & pendulum	8.7×10^-2 [$kg\cdot m^2$]
$I_w$	inertia of wheel	7.6×10^-3 [$kg\cdot m^2$]

이륜 로봇의 비선형 동역학식을 제어기에 적용하기 위해서는 평형점($\phi = 0$) 부근에서의 선형화 과정이 필수적이다. 이륜 로봇이 수직으로 서 있는 상태($\phi \approx 0$)를 가정하면, 삼각함수와 미분항에 대해 $\sin\phi \approx \phi$, $\cos\phi \approx 1$ 및 $\dot{\phi}^2 \approx 0$으로 근사화할 수 있으므로 이 근사식을 식 (1)에 대입하면 다음과 같은 선형화된 운동방정식을 얻을 수 있다.

(2)

$E\ddot{\phi} + F\ddot{x} = 2\frac{\tau}{r} \\ \\ G\ddot{x} + F\ddot{\phi} - H\phi = -2\tau$

여기서 각 계수는 다음과 같다.

$E = m_p + 2m_w + 2I_w/r^2$, $F = m_p l$

$G = I_p + m_p l^2$, $H = m_p g l$

상태벡터를 $x = [x, \dot{x}, \phi, \dot{\phi}]^T$로 정의하면 선형화된 시스템은

(3)

$\dot{x}(t) = Ax(t) + Bu(t)$

$A = \begin{bmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & \frac{-FH}{\Delta} & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & \frac{EH}{\Delta} & 0 \end{bmatrix}, B = \begin{bmatrix} 0 \\ \frac{G(2/r) + 2F}{\Delta} \\ 0 \\ \frac{-F(2/r) - 2E}{\Delta} \end{bmatrix}$

로 표현되며, $\Delta = EG - F^2$이며, $u(t) = \tau$이다.

3. BFOA 활용 LQR 제어 시스템 설계

LQR 기법은 현대 제어 이론에서 가장 널리 활용되는 최적 제어 기법의 하나로, 로봇공학, 자율주행, 항공우주 분야 등에서 복잡한 시스템의 안정화를 위해 필수적이다. LQR 기법의 주요 장점은 제어 성능(오차 최소화)과 제어 에너지(입력 사용량 최소화) 사이의 최적 타협점을 수학적으로 도출한다는 점이다. 사용자는 가중치 행렬 $Q$와 $R$을 조정함으로써 시스템의 동적 응답 속도와 에너지 효율성을 직관적으로 결정할 수 있다. 특히 이륜 로봇과 같이 각도, 위치, 속도 등 여러 상태 변수가 상호 결합된 다변수 시스템을 제어할 때, PID와 같은 고전 제어 기법에 비해 설계 과정이 훨씬 체계적이고 간편하다. 또한, 시스템이 가제어성을 만족하고 가중치 행렬이 적절히 설정되면, LQR 기법은 이론적으로 항상 안정성을 보장하는 최적 제어 이득 $K$를 산출한다. LQR은 우수한 위상 여유와 이득 여유를 제공하여, 모델 불확실성이 존재하는 환경에서도 강인한 안정성을 유지하는 특성을 지닌다^[3].

모든 상태변수가 측정 가능하다고 가정할 때, 식 (3)과 같이 선형화된 이륜 로봇의 행렬쌍 $(A, B)$가 제어 가능하므로 다음과 같은 전체 상태 되먹임 제어기를 설계할 수 있다.

(4)

$u(t) = -Kx(t)$

LQR 제어기는 다음의 비용 함수를 최소화하는 최적 제어 입력을 찾는다.

(5)

$J = \int_{0}^{\infty} x(t)^T Q x(t) + u(t)^T R u(t) dt$

여기서 $Q$는 상태 오차에 대한 가중치 행렬이고, $R$은 제어 입력(에너지 소모)에 대한 가중치 행렬이다. 최적 제어 이득 $K$는 다음의 대수 리카티 방정식을 만족하는 양의 정의 행렬 $P$로부터 결정된다.

(6)

$A^T P + P A - P B R^{-1} B^T P + Q = 0$

따라서 설계되는 최적 제어 이득 $K$는 다음과 같다.

(7)

$K = R^{-1} B^T P$

일반적으로 LQR 제어기 설계 시 가중치 행렬 $Q$와 $R$이 결정되면 최적 제어 이득 $K$는 해석적으로 산출되나, $Q$와 $R$의 선정은 설계자의 경험적 시행착오에 의존한다는 한계가 있다. 본 논문에서는 이륜 로봇의 복잡한 동적 특성에 부합하는 최적의 제어 성능을 도출하기 위해, 자연 영감 알고리즘인 BFOA와 하이브리드 BFOA-PSO를 도입하여 가중치 행렬을 정량적이고 자동적으로 최적화하는 기법을 사용한다.

BFOA는 대장균의 먹이 탐색 및 채집 전략을 모방한 자연 영감 전역 최적화 알고리즘이다. 자연계에서 박테리아가 영양분은 풍부하고 독소는 적은 곳으로 이동하는 군집 지능(Swarm Intelligence) 원리를 수학적으로 모델링하여, 복잡한 비선형 문제의 전역 최적해를 탐색하는 데 사용된다^[5].

BFOA는 크게 다음과 같은 4가지 핵심 과정을 통해 최적해를 도출한다.

① 화학주성(Chemotaxis): 편모의 회전 운동을 통해 박테리아가 이동(Tumbling 및 Swimming)하는 과정이다. 목적 함수의 기울기를 따라 더 나은 해의 방향으로 이동하는 국부 탐색을 수행한다.

② 군집(Swarming): 박테리아 간의 상호작용을 통해 밀집도가 높은 지점으로 모이도록 유도하여 탐색의 효율성을 높인다.

③ 복제(Reproduction): 적자생존의 원리에 따라 채집 효율이 우수한 개체는 분열하여 개체 수를 유지함으로써 수렴 속도를 가속화하고, 효율이 낮은 개체는 소멸한다.

④ 제거 및 확산(Elimination and Dispersal): 특정 확률로 개체를 무작위 재배치함으로써 알고리즘이 지역 최적해에 함몰되는 것을 방지하고 전역 탐색 능력을 강화한다.

이 알고리즘의 특징 및 장점은 제거 및 확산 단계를 통해 탐색 범위를 넓힘으로써 기존의 경사 하강법 기반 최적화보다 전역 최적해를 찾을 확률이 높고, 다차원적이고 불연속적인 목적 함수에 대해서도 비교적 안정적인 수렴 성능을 보여준다.

본 논문에서는 이륜 로봇의 최적 제어를 위한 LQR 기법의 비용 함수를 결정하는 가중치 행렬 $Q$와 $R$ 선정을 위해 다음과 같은 단계별 알고리즘을 적용하였다.

Step 1. 초기화 : 박테리아의 수, 최적화 파라미터 차원, 화학주성 단계 횟수, 복제 단계 횟수, 도태-분산 단계 횟수를 설정하고, 각 박테리아의 초기 위치를 탐색 공간 내에서 무작위로 생성한다.

Step 2. 적합도 평가 : 후보 $Q$와 $R$ 값을 기반으로 LQR 최적 제어 이득 $K$를 계산한다. 이륜 로봇 시뮬레이션을 수행하여 상태 변수 $(x, \phi)$의 응답을 확인하고, 정의된 목적 함수를 통해 적합도를 산출한다.

Step 3. 화학주성 단계 : 무작위 방향 전환(Tumble) 및 적합도 개선 방향으로의 지속 이동(Swim)을 통해 국부 최적해를 탐색한다. 즉, 박테리아 $i$가 화학주성 $j$, 복제 $k$, 제거 및 확산 $l$ 단계에 있을 때의 위치를 $\theta^i(j, k, l)$라고 하면, 다음 단계의 위치는 아래 수식에 의해 결정됩니다.

(8)

$\theta^i(j+1, k, l) = \theta^i(j, k, l) + C(i)\frac{\Delta(i)}{\sqrt{\Delta^T(i)\Delta(i)}}$

Step 4. 복제 : 적합도 하위 50%의 개체는 제거하고 상위 50%의 개체를 복제하여 우수한 제어 파라미터를 다음 세대에 계승한다.

Step 5. 도태 및 분산: 설정된 확률에 따라 일부 세균을 재배치하여 전역 최적해(Global Optimum) 탐색 능력을 보장한다.

Step 6. 종료 및 최적 가중치 도출 : 모든 루프가 종료되면 가장 낮은 비용 함수를 가진 개체의 위치를 최적의 $Q$와 $R$로 확정하고, 최종 LQR 제어 이득 $K$를 산출한다.

BFOA는 제거 및 확산 메커니즘을 통해 전역 탐색 능력이 우수하다는 장점이 있으나, 박테리아의 무작위적인 방향 전환 특성으로 인해 수렴 속도가 상대적으로 느리다는 단점이 존재한다. 이러한 한계를 극복하기 위해 PSO의 정보 공유 및 속도 업데이트 개념을 결합한 하이브리드 BFOA-PSO 기법이 제안되었다^[7, ^8].

하이브리드 방식은 화학주성 단계 이후 PSO의 속도 갱신 방법을 도입하여 군집 전체의 최적 정보를 공유한다. 박테리아 $i$의 속도 $v^i$ 갱신은 단순히 무작위 방향 벡터에 의존하지 않고 현재 속도(관성), 개별 최적 위치($pbest$)와 군집 전체의 최적 위치($gbest$)를 향한 가중치를 반영하며, 다음 위치 $\theta^i$는 현재 위치에 갱신된 속도를 더하여 결정된다.

(9)

$v^i(j+1, k, l) = w v^i(j, k, l) + c_1 r_1 (pbest^i - \theta^i(j, k, l)) + c_2 r_2 (gbest - \theta^i(j, k, l))$

$\theta^i(j+1, k, l) = \theta^i(j, k, l) + v^i(j+1, k, l)$

여기서 $r_1$과 $r_2$는 난수에 의해 발생되는 수치이며, $w$는 관성 가중치, $c_1$와 $c_2$는 가속계수를 나타낸다.

4. 3D 모델 구성 및 시뮬레이션

본 논문에서는 제어기의 성능을 검증하고 실시간 애니메이션을 통해 거동을 확인하기 위해 참고문헌^[9]에서 제시한 정밀한 3D 모델을 개발하였다. 첫째, 3D CAD 패키지 SolidWorks를 활용하여 이륜 로봇을 구성하는 주요 강체들을 Fig. 2와 같이 개별 설계하였다.

Fig. 2. Part model of Two-Wheeled Robot

각 부품은 실제 물리적 형상을 기반으로 모델링 되었으며, 데이터 호환 인터페이스(Simscape Multibody Link)를 통해 Simulink/Simscape 환경으로 통합되었다.

모든 강체는 직교좌표계의 $z$축을 기준으로 병진 또는 회전 운동이 가능하도록 설정되었으며, 각 부품의 기준 좌표계와 운동 축의 정렬 상태를 고려하여 정밀한 조립을 진행하였다. 둘째, 3D 모델링 기반의 물리 파라미터 추출을 통해 모델의 신뢰성을 확보하였다. 이러한 설계 방식은 SolidWorks 내에서 정의된 재질과 형상 정보를 바탕으로 각 강체의 무게 중심과 관성 모멘트를 자동 산출할 수 있다는 이점이 있다. 이는 이륜 로봇의 복잡한 비선형 운동방정식을 수립하거나 시스템 파라미터를 동정할 때 오차를 최소화할 수 있는 핵심적인 요소로 작용한다. Fig. 3은 이러한 과정을 걸쳐 구성된 이륜 로봇의 전체 3D 모델을 보여준다.

Fig. 3. 3D model of two-wheeled robot

Table 1에서 제시한 물리 파라미터의 수치는 이러한 과정을 거쳐 산출된 결과이며, 이를 바탕으로 식 (3)의 상태 공간 행렬을 계산하면 다음과 같다.

(10)

$A = \begin{bmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & -21.04 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 126.19 & 0 \end{bmatrix}, B = \begin{bmatrix} 0 \\ 4.18 \\ 0 \\ -19.40 \end{bmatrix}$

식 (10)의 선형화된 이륜 로봇에 대하여 최적의 LQR 제어 성능을 확보하고자, 성능 지수 결정의 핵심인 가중치 행렬 $Q$와 $R$을 최적화하였다. 본 논문에서는 전역 최적해 탐색을 위해 BFOA와 하이브리드 BFOA-PSO을 적용하고 이를 통해 가중치 행렬값을 산출하였다.

두 알고리즘은 초기화 단계에서 박테리아의 위치 $\theta^i$가 탐색 공간 내 난수에 의해 무작위로 결정될 뿐만 아니라, 화학주성 단계의 전환(Tumble) 과정에서 이동 방향을 결정하는 방향 벡터 역시 확률적으로 생성되므로 매 실행 시 서로 다른 탐색 궤적을 그리게 되며, 이처럼 시작점과 탐색 경로가 가변적이기 때문에 결과적으로 동일한 반복 횟수를 설정하더라도 도달하는 최종 해의 품질과 수렴 값에 미세한 차이가 발생하게 된다. 따라서 본 논문에서는 알고리즘의 확률적 변동성을 제어하고 시뮬레이션 결과의 재현성을 보장하기 위해, 난수 발생의 시드(Seed) 값을 고정하여 최적화 과정을 수행하였다. 한편, 적합도 함수로는 이륜 로봇의 정상상태 안정성과 제어 입력의 최소화를 동시에 달성하기 위해, 10초 동안의 위치 오차 및 각도 오차의 ITAE (Integral of Time-weighted Absolute Error) 지수에 제어 입력 가중치를 합산한 형태의 적합도 함수를 사용하였다.

(11)

$J = 5\int_{0}^{10} t|e_\phi|dt + \frac{1}{2}\int_{0}^{10} t|e_x|dt + \frac{5}{2}\int_{0}^{10} |u|dt$

이륜 로봇의 빠른 직립 균형 제어를 위해 각도 오차 최소화에 비중을 크게 두었으나, 제어 입력의 급격한 변화로 기동이 불안정해지는 문제를 해결하기 위해 제어 입력 가중치를 상향하고 구동기 토크 제한 페널티를 강화함으로써, 응답 성능과 제어 안정성 사이의 균형을 최적화하였다.

Table 2. Algorithm parameter values

Parameter	BFOA	BFOA-PSO
Bacteria #	20	20
Chemotaxis steps	50	30
Swim steps	4	4
Reproduction steps	4	2
Elimination-dispersal steps	2	2
Elimination-dispersal prob.	0.25	-
Inertia Weight	-	0.7
Accel. Coeff. $c_1$	-	1.4
Accel. Coeff. $c_2$	-	1.4

알고리즘 수행을 위한 실험적 변수 및 환경 설정은 Table 2와 같으며, 관련 선행 연구의 권장 수치를 바탕으로 이륜 로봇의 제어 입력인 토크를 최소화하기 위해 가중치 행렬 $R$에 민감하게 반응할 수 있는 수치적 환경을 설정하였다. 알고리즘 수행 결과, BFOA의 경우에는 $Q = diag[73.87, 56.16, 29.46, 95.74]$, $R = 17.98$, $K = [-2.03, -3.46, -19.88, -3.48]$로 산출되었으며, 하이브리드 BFOA-PSO의 경우에는 $Q = diag[69.21, 77.79, 61.89, 36.24]$, $R = 49.49$, $K = [-1.18, -2.31, -16.34, -2.07]$로 산출되었다.

먼저 이륜 로봇의 핵심 요구 성능인 직립 균형 제어 능력을 검증하기 위해, 두 알고리즘으로부터 산출된 최적 제어 이득을 적용하여 식 (4)의 상태 되먹임 제어기를 구성하였다. 이후 Fig. 3에 제시된 3D 모델을 대상으로 초기 피치각이 $\phi_0 = 15^\circ$로 부여되었을 때의 균형 제어 시뮬레이션을 수행하여 제어 성능을 분석하였다. 구성된 이륜 로봇 제어시스템의 블록선도는 Fig. 4와 같다.

Fig. 4. Overall control system

Fig. 5. Simulation results for upright balancing

Fig. 5는 시간 경과에 따른 이륜 로봇의 위치 $x$ 및 피치 각도 $\phi$의 응답을 보여준다. 두 알고리즘 모두 초기 피치각 $\phi_d = 15^\circ$를 성공적으로 제어하여 약 2초 정도에 목푯값인 $0^\circ$로 수렴시켰다. 이는 제안된 제어기가 시스템의 직립 안정성을 효과적으로 확보함을 의미한다. 위치 이동 특성을 살펴보면 직립 균형을 위해 이륜 로봇은 전방으로 최대 약 0.2m까지 기동하였으며, 피치각 수렴 후에는 초기 위치로 서서히 복귀하며 평형 상태를 유지하였다. 두 알고리즘의 성능을 비교했을 때, 하이브리드 BFOA-PSO 알고리즘이 BFOA 단독 알고리즘 대비 오버슈트가 적고 위치 복귀 과정이 더 매끄럽게 이루어지는 경향을 보였다. 특히 이륜 로봇의 구동에 요구되는 제어 입력 토크 측면에서, 상대적으로 큰 가중치 행렬 $R$값을 도출한 하이브리드 알고리즘이 초기 기동 토크 및 전체 토크 소모량에서 우위를 점하였다. 다만 이러한 성능 차이는 특정 파라미터 구성에 따른 결과일 수 있으며, 알고리즘 수행 시 다양한 파라미터 조합에 따라 성능 변화가 존재하므로 본 시뮬레이션 결과만으로 두 알고리즘 간의 절대적인 우열을 논하기에는 한계가 있다.

Fig. 6. Simulation results for driving

다음으로 이륜 로봇이 일정한 거리를 직선 주행하는 동안에도 균형을 안정적으로 유지하는지 검증하기 위해 시뮬레이션을 수행하였다. 초기 직립 균형 상태에서 목표 주행 거리는 10m로 설정하였다.

주행 시뮬레이션 결과인 Fig. 6에서 볼 수 있듯이, 두 알고리즘을 활용해 설계된 상태 되먹임 제어기가 직립 균형과 주행 제어를 동시에 효과적으로 수행할 수 있음을 확인하였다.

특히, Fig. 6의 위치 응답 그래프 및 피치 각도 그래프를 통해 다음과 같은 구체적인 결과를 도출하였다. 직립 상태에서 즉시 전진 주행을 시작하게 되면 펜덜럼이 부착된 플랫폼이 뒤로 넘어질 위험이 있으므로, 제어기는 먼저 살짝 후진하며 양의 피치 각도를 형성한 후 주행을 시작하는 전략을 수행하였다. 두 알고리즘 모두 약 6초~7초 시점에 목표 거리인 10m 지점 부근에 안정적으로 도달하였다. 주행 가속 중 피치각은 최대 약 35°~45°까지 기울어졌으나, 제어기를 통해 빠르게 균형을 회복하며 최종적으로 0°에 수렴하였다. 이는 주행 중에도 로봇의 안정적인 자세 제어가 이루어졌음을 입증한다. Fig. 7은 주행 실험의 애니메이션 시각화 결과를 보여준다^[10].

Fig. 7. 3D animation for driving simulation

5. 결 론

본 논문에서는 강한 비선형성과 고유한 불안정성을 가진 이륜 로봇의 최적 제어를 위해 박테리아 채집 최적화 알고리즘(BFOA) 기반의 LQR 제어기 설계 기법을 제안하였다. 먼저, 라그랑주 역학을 기반으로 로봇의 부족구동 동역학 방정식을 도출하고, 수직 평형점 부근에서의 선형화를 통해 제어기 설계에 적합한 상태 공간 모델을 구축하였다. 기존 BFOA가 가진 느린 수렴 속도와 지역 최적해 함몰 문제를 해결하기 위해, PSO의 정보 공유 메커니즘을 결합한 하이브리드 최적화 기법을 적용하였다. 이를 통해 LQR의 가중치 행렬 $Q$와 $R$에 대한 전역 최적해를 효율적으로 도출하였으며, 해당 가중치 행렬을 적용한 대수 리카티 방정식을 풀어 최적의 상태 되먹임 제어 이득 $K$를 설계하였다.

제어 성능의 실효성을 검증하기 위해, SolidWorks에서 설계된 이륜 로봇의 CAD 데이터를 Simscape Multibody 환경으로 연동하여 3D 시뮬레이션 환경을 구축하였다. 이를 통해 수식 모델링에서 간과될 수 있는 각 강체의 정확한 질량 중심, 관성 모멘트, 관절 간의 물리적 구속 조건을 시뮬레이션에 반영하였으며, 애니메이션을 통해 자율 균형 및 주행 제어 과정을 시각적으로 확인하였다. 검증 결과에 따르면 제안된 기법은 시행착오법으로는 도출하기 어려운 최적의 제어 이득을 찾아내어 상태 오차(성능)와 제어 입력(에너지 소모) 사이의 최적 균형점에서 제어 성능을 개선할 수 있음을 확인하였다.

Acknowledgements

본 연구는 한경국립대학교 2024년도 학술연구조성비의 지원에 의한 것임.

References

F. Grasser, A. D’Arrigo, S. Colombi, A. C. Rufer, "JOE: A mobile, inverted pendulum", IEEE Trans. Ind. Electron., vol. 49, no. 1, pp. 107-114, 2002.

A. Castro, "Modeling and dynamic analysis of a two-wheeled inverted-pendulum", M.Sc. Thesis, School of Mech. Eng., Georgia Inst. Technol., 2012.

S. T. Branch, "Optimal design of LQR weighting matrices based on intelligent optimization methods", Int. J. Intell. Inf. Process., vol. 2, no. 1, pp. 63-74, 2011.

P. K. Mandal, "A review of classical methods and nature-inspired algorithms (NIAs) for optimization problems", Res. Control Optim., vol. 13, pp. 100315, 2023.

K. M. Passino, "Biomimicry of bacterial foraging for distributed optimization and control", IEEE Control Syst. Mag., vol. 22, no. 3, pp. 52-67, 2002.

S. Kim, S. Kwon, "Dynamic modeling of a two-wheeled inverted pendulum balancing mobile robot", Int. J. Control Autom. Syst., vol. 13, no. 4, pp. 926-933, 2015.

I. K. Mohammed, A. I. Abdulla, "Balancing a segway robot using LQR controller based on genetic and bacteria foraging optimization algorithms", TELKOMNIKA (Telecommun. Comput. Electron. Control), vol. 18, no. 5, pp. 2642-2653, 2020.

W. M. Korani, "Bacterial foraging oriented by particle swarm optimization strategy for PID tuning", Proc. 10th Annu. Conf. Companion Genet. Evol. Comput., pp. 1823-1826, 2008.

D. S. Yoo, "3D modeling and control for two-wheeled self-balancing robots using Matlab/ Simulink", J. Korean Inst. Illum. Electr. Install. Eng., vol. 37, no. 2, pp. 83-89, 2023.

YouTube, "Balance & drive for two-wheeled robot", 2026, [online]. Available:https://www.youtube.com/@TWR-s6v (Accessed 6 Feb. 2026).

Biography

Dong Sang Yoo

He received the B.S. degree in electrical engineering from Seoul National University, Seoul, Korea in 1985, and the M.S. and Ph.D. degrees in electrical and electronic engineering from KAIST, Taejon, Korea in 1987, and 1992, respectively. From 1992 to 2000, he was a senior research engineer with LG Electronics Company, where he was engaged in research & development of semiconductor equipment and factory automation. Since September 2000, he has been with Hankyong National University, where he is currently a Professor. His current research interests are in the areas of robust control, automation, robotics, and underactuated mechanical systems.

JIEIEJournal of the Korean Institute of Illuminating
and Electrical Installation Engineers

Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

ISO Journal TitleJ Korean Inst. IIIum. Electr. Install. Eng.

Journal Search

Journal XML

Journal Information

Balancing and Driving Control of a Two-Wheeled Robot Based on Bacterial Foraging Optimization Algorithm

Abstract

Key Words

1. 서 론

2. 이륜 로봇의 모델

Fig. 1. Coordinates of two-wheeled robot

(1)

(2)

(3)

3. BFOA 활용 LQR 제어 시스템 설계

(4)

(5)

(6)

(7)

(8)

(9)

4. 3D 모델 구성 및 시뮬레이션

Fig. 2. Part model of Two-Wheeled Robot

Fig. 3. 3D model of two-wheeled robot

(10)

(11)

Fig. 4. Overall control system

Fig. 5. Simulation results for upright balancing

Fig. 6. Simulation results for driving

Fig. 7. 3D animation for driving simulation

5. 결 론

Acknowledgements

References

Biography

Dong Sang Yoo

Article Information (continued)

Key Words

JIEIEJournal of the Korean Institute of Illuminatingand Electrical Installation Engineers

Journal of the Korean Institute of Illuminating and Electrical Installation Engineers

ISO Journal TitleJ Korean Inst. IIIum. Electr. Install. Eng.

Journal Search

Journal XML

Journal Information

Balancing and Driving Control of a Two-Wheeled Robot Based on Bacterial Foraging Optimization Algorithm

Abstract

Key Words

1. 서 론

2. 이륜 로봇의 모델

Fig. 1. Coordinates of two-wheeled robot

(1)

(2)

(3)

3. BFOA 활용 LQR 제어 시스템 설계

(4)

(5)

(6)

(7)

(8)

(9)

4. 3D 모델 구성 및 시뮬레이션

Fig. 2. Part model of Two-Wheeled Robot

Fig. 3. 3D model of two-wheeled robot

(10)

(11)

Fig. 4. Overall control system

Fig. 5. Simulation results for upright balancing

Fig. 6. Simulation results for driving

Fig. 7. 3D animation for driving simulation

5. 결 론

Acknowledgements

References

Biography

Dong Sang Yoo

Article Information (continued)

Key Words

JIEIEJournal of the Korean Institute of Illuminating
and Electrical Installation Engineers