• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. ( Electronics and Telecommunications Research Institute (ETRI), Daejeon, Republic of Korea)



Factory Energy Management System, Load Forecasting, Long Short-term Memory, Manufacturing Execution System, Quality Control Charts

1. 서 론

산업 부분의 전력 사용량을 절감하기 위하여 공장 에너지 관리 시스템(FEMS: Factory Energy Management System)의 개발이 요구되어 지고 있다. 대대한민국의 전력 사용량을 분석한 주요 통계 자료에 따르면, 전력 소비는 여러 부문에서 발생하지만 그 중에서도 산업용 전력 소비가 가장 높은 비중을 차지하고 있다. 그림 1은 산업용 전력 소비의 비중을 다른 부문과 비교한 그래프이다. 그림 1에서는 산업 부문이 대한민국 전체 전력 소비에서 절반을 차지한다는 점을 나타내고 있다. 이는 공장 및 제조업체가 공정에서 사용되는 에너지 효율성을 개선하고 전력 사용량을 줄이기 위한 체계적인 접근과 시스템 개발이 필요하다는 것을 시사한다. FEMS는 실시간으로 에너지 및 공정 데이터를 수집, 분석하여 에너지 소비 패턴을 파악할 수 있습니다. 이를 통해 에너지 사용의 비효율적인 부분을 식별하고 개선할 수 있다.

그림 1. 대한민국 용도별 전력사용량 통계

Fig. 1. Electricity Consumption Statistics by Usage Type in South Korea

../../Resources/kiee/KIEE.2025.74.9.1440/fig1.png

구체적으로 FEMS는 공장에서 소모되는 에너지의 상태를 판단하고 비효율적 운전 및 공정 단계를 제어함으로써 공장 내 사용되는 열, 전기 등의 에너지를 효율적으로 사용 및 절감하기 위한 시스템이다. 한국전자통신연구원(ETRI: Electronics and Telecommunications Research Institute)에서는 2025년부터 10만 TOE 이상의 산업단지에서 의무화되는 FEMS 사용과 보급을 위하여 공장에너지관리시스템(FEMS) 보급형 표준 플랫폼 개발 및 실증 과제를 추진 중이며, 그림 2와 같은 모듈형 구조로 에너지 사용 레벨 및 업종 등 다양한 조건을 고려하여 맞춤형 FEMS 보급을 계획중에 있다. 모델은 기능과 관측 가능 개수에 따라 배포형, 기본형, 고급형, 전문형, 연계형 등으로 나뉘어진다. 해당 모델들에서 공통적으로 요구되고 활용되는 기능은 에너지 모니터링 기능으로 FEMS의 주목적인 에너지 효율화 및 절감량을 위해 필수적인 기능이다. 산업에서 에너지 사용량을 절감하기 위해서는 공장에서 소모될 미래의 전력 소비를 예측하는 것이 중요하다. 특히, 에너지에 대한 정확한 수요를 예측하는 것이 FEMS의 에너지 관리 성능을 좌우한다. 에너지 관리 시스템(EMS: Energy Management System)은 공장보다 일반 가정에 적용된 HEMS(Home Energy Management System)와 상업용 건물에 적용된 BEMS (Building Energy Management System) 등이 있지만, HEMS와 BEMS에서 관리하는 부하들과 FEMS의 부하의 차이가 존재하고, 수집되는 데이터의 종류와 유형이 다르므로 별도의 에너지 및 전력 소비 예측 모델이 필요하다. FEMS는 기능적으로 EIS(EIS: Energy Information System)와 EOS(Energy Optimization System)으로 나뉘고, EIS는 에너지 모니터링을 통해 공장의 운영과 관련된 정보를 제공하고, 이를 바탕으로 공정의 개선사항을 도출할 수 있도록 하고, EOS는 공장의 설비 등을 제어하여 에너지 절감을 유도한다. 에너지 현황을 보다 효과적으로 분석하기 위해서는 다각적 분석과 데이터를 기반으로 부하를 예측하는 알고리즘 개발이 필요하다. 본 논문에서는 EIS 기능에서 전력 소비 수요를 예측을 지원 하기 위하여 인공지능을 활용하여 전력 소비 예측 모델을 제시한다[1-3].

그림 2. ETRI 보급형 표준 FEMS 플랫폼 개발

Fig. 2. Development of ETRI’s Standardized FEMS

../../Resources/kiee/KIEE.2025.74.9.1440/fig2.png

본 연구는 다양한 업종에서 수집된 공정 데이터를 기반으로 이상치 제거, 주기성 분석, 외기온도 보정 등을 적용한 AI 기반 수요 예측 모델을 설계하였으며, 이는 FEMS의 실효성을 제고하는 데 핵심적인 기여를 한다. 업종별 에너지 부하의 특성이 매우 다양하기 때문에, 본 연구에서는 부하 예측의 주기성이 높고 주요 유틸리티 소비량이 큰 바이오 및 제지 업종을 중심으로 실증 실험을 수행하였다. 이들 업종은 MES 정보와 공정 제어가 부하 변화에 명확히 반영되므로, 예측 모델의 타당성을 검증하는 데 효과적이다.

2. 본 론

2.1 공장 에너지 관리 시스템 (FEMS)에서의 에너지 수요 관리

공장은 업종과 생산 제품에 따라 에너지 소모량과 패턴이 다양하기 때문에 단계적으로 에너지의 사용량을 분석하는 과정이 필요하다. 그림 3과 같이 1단계로는 공장의 에너지 사용 현황을 실시간으로 인지하기 위한 에너지 모니터링 단계가 필요하다. 이 단계에서는 각 종 계측기 및 센서에서 수집되는 데이터를 생산 정보 및 작업자 등과 같은 비정형 데이터를 참고해야한다. 2단계에서는 다각적인 분석을 통해서 에너지의 낭비 요소를 파악해야한다. 공장에서는 열 혹은 스팀, 전기, 압축공기 등의 다양한 유형의 에너지원이 사용되기 때문에 각 공정 프로세스와 유틸리티 및 공장 기기에 대한 이해를 바탕으로 에너지 현황을 분석해야 한다. 다음으로 3단계에서는 과거 데이터인 운전 패턴과 생산 제품 및 외부 조건 등을 고려하여 미래의 에너지 수요를 예측해야 한다. 마지막으로 에너지의 낭비 요소를 제거하고, 최적 설비 운영을 통해서 에너지 공급을 최적화해야 한다. 이를 바탕으로 4단계에서는 에너지 수요 공급을 최적화할 수 있고 공장 운영자는 계획된 공정에 맞춰 에너지 절감을 유도할 수 있다[3].

그림 3. 공장 에너지 관리 시스템 (FEMS) 내 에너지 절약 4단계

Fig. 3. Four-Stage Energy Saving Process in Factory Energy Management Systems (FEMS)

../../Resources/kiee/KIEE.2025.74.9.1440/fig3.png

2.2 생산관리시스템을 고려한 모델 설계

공장은 업종마다 에너지의 사용패턴이 상이한데, 특히, 에너지 다소비 공정이 포함된 제지, 바이오, 용해, 식품 업종에서도 공정의 프로세스 및 제조품의 종류에 따라 크게 달라진다. 이러한 정보는 공장 내에서 계획적으로 입력되어 관리되기도 하지만, 대부분 공장에서의 공정 계획은 제조 물품 주문 상황을 고려하여 작업자가 판단하여 생산 순서를 조정한다. 또한, 공정 운영 중에 발생할 수 있는 공정의 이상, 에너지 공급의 변화 등의 이벤트로 공정이 변동되거나 작동이 중지되기도 하기 때문에 단순하게 과거의 공정 데이터를 시계열적으로 분석해서는 정확한 수요 및 부하를 예측하기 어렵다. 따라서 공장들에는 이러한 공정의 정보 및 이벤트를 참고하기 위해서는 MES(MES: Manufacturing Execution System) 데이터 활용이 필요하다. MES는 공장 내에서 제조 작업을 계획하고 모니터링하는 시스템이다. MES는 공장의 생산 계획, 작업 지시, 작업 진행, 진행 상황, 품질 관리, 작업자 관리 등 공정과 생산의 진행에 대한 여러 정보를 포함하고 있어서 FEMS에서 예측 시스템을 구성하기 위해서는 이를 고려한 예측 모델 설계가 필요하다. 특히, 전력 소비에 영향을 미치는 생산 계획 및 스케줄이 작업자에 의해 입력 및 관리 되기 때문에 MES의 생산 계획과 조정된 스케줄을 고려한 수요 예측 모델이 필요하다. 그림 4와 같이 공장의 공정이 시작되기 전에 MES 데이터를 사전에 수집하고, 공정이 시작된 뒤 FEMS의 데이터를 수집하여 전처리 전 학습데이터를 구성한다. 수집된 데이터는 이상치를 제거하고, 전력소비의 패턴과 주기성을 고려한 인공지능 학습 모델을 활용하여 정확한 전력 소비 예측 모델을 설계한다[4].

그림 4. FEMS에서 인공지능 기반 부하 예측 방법

Fig. 4. AI-Based Load Forecasting Method in FEMS

../../Resources/kiee/KIEE.2025.74.9.1440/fig4.png

그림 5. 생산 제품 종류별 공정 부하 특성 비교

Fig. 5. Comparison of Process Load Characteristics by Product Type

../../Resources/kiee/KIEE.2025.74.9.1440/fig5.png

2.3 공장의 부하 데이터 특징

공장에서 수집되는 공정 데이터에는 제품의 생산 중에 작업자의 인위적 제어, 고장 및 불량에 의한 이상 데이터가 포함되기 때문에 이상 데이터를 포함하여 부하 예측 모델을 구성하는 경우 성능이 저하의 주요 원인이 될 수 있다. 특히, 공장에서는 제품의 생산 시작 시각과 종료 시각에 작업자의 제어로 인하여 인위적인 이탈 데이터가 발생하기 때문에 이를 이상 데이터로 간주하고, 모델을 학습시켜야 정확한 수요 예측 모델 설계가 가능하다. 또한, 공장에서는 공정 내에서 제품의 생산 종류가 빈번하게 바뀌기 때문에 제품마다의 운전 조건과 범위를 고려해서 데이터를 해석해야 한다. 그림 5에는 공정에서 측정 중인 계측 정보의 예시이다. 예시에서는 같은 공정 단위에서 계측되고 있는 3종류의 부하 데이터(빨간 실선, 파란 실선, 초록 실선)를 나타내고 있으며, 가로 x축은 공정 시간, 세로 y축은 각 태그의 계측 단위이고, 제품의 생산 종류(16종류)마다 다른 패턴을 보이는 것을 알 수 있다. 생산되는 제품의 종류에 따라 가동/비가동 되는 경우가 존재하며, 데이터가 결측되어 오염되는 패턴도 상이하다. 또한, 일부 공정이 외부에 노출되어 있어 외기온도의 특성에 따라 공정 제어 조건이 달라지는 바이오 업종의 경우에는 기상 데이터를 참고하여 학습 모델을 구성해아한다. 기상청의 외기온도 예측값은 공장의 정확한 위치와는 다소 차이가 있으나, 실제 냉동기 및 냉각탑 등의 운전은 예측된 외기 조건에 따라 사전 제어가 이루어지므로, 부하 예측의 간접 입력 변수로 유의미하게 활용될 수 있다. 특히 MES 기반의 생산 스케줄과 연계 시 외기 조건 변화에 따른 냉방 수요 반영이 가능하다. 따라서 인공지능 모델을 활용하여 부하를 예측하기 위해서는 결측치 데이터를 처리하고, 시각 동기화를 진행해야하며, 외기온도 및 MES 데이터를 고려하여 학습 군집을 구성하여 모델을 구성해야 한다.

동일 공정 단위에서 측정된 3종의 센서 데이터(온도, 압력, 부하 등)의 시간 흐름에 따른 변화를 나타낸다. 제품 종류(총 16종)에 따라 센서값의 분포, 작동 구간, 결측 패턴이 서로 다르게 나타남을 확인할 수 있으며, 이는 예측 모델 구성 시 제품별 학습 군집 설정 및 이상치 처리의 중요성을 시사한다.

2.4 인공지능 기반 시계열 예측 모델

인공지능 기반 시계열 데이터 예측 알고리즘에서는 순환 신경망 모델을 통한 예측 연구가 가장 활발하게 소개되고 있다. 순환 신경망 (Recurrent Neural Network; RNN)은 인공 신경망의 한 종류로서 내부의 은닉 상태 (Hidden State)가 매 순간의 출력 데이터를 만들어내는 과정에 참여한다. 기존 인공 신경망은 훈련 완료된 가중치만으로 이루어져, 입력 데이터와의 연산을 통해 출력 데이터를 형성한다. 하지만, 순환 신경망은 신경망 내부의 은닉 상태 벡터가 과거로부터의 정보를 전달하는 역할을 담당한다. 은닉 상태 벡터가 신경망 내부에 남아 정보를 전달하는 순환 신경망의 구조는 데이터의 추세를 반영하여 출력을 결정해야하는 문제에서 매우 좋은 성능을 나타낸다. 하지만 순환 신경망의 경우 신경망 내부에 잔존하는 은닉 상태 벡터가 지금까지 입력된 데이터의 추세를 기억하고 있으므로, 서로 다른 출력을 나타낼 수 있다. 이와 같이, 순환 신경망은 같은 입력 데이터임에도 데이터가 입력된 순서 또는 추세에 따라 다른 출력을 만들고자 할 때 사용하기에 적합하다. 하지만, 순환 신경망은 입력 데이터의 길이가 길어질수록 초기에 입력된 데이터의 정보를 충분히 미래로 전달하지 못하는 현상이 발생할 수 있으며, 이러한 문제를 기울기 소실 문제 (Vanishing Gradient Problem)라 한다. 기울기 소실 문제를 해결하기 위해 개발된 새로운 종류의 순환 신경망이 바로 장단기 기억 신경망 (Long Short-Term Memory; LSTM)이다. 장단기 기억 신경망은 내부에 존재하는 메모리 셀을 통해 망각 수준을 제어하는 방식으로 동작한다. 셀 내부의 망각 게이트는 셀에서 제거할 정보를 결정하기 위해 사용되며, 입력 게이트는 새롭게 입력되는 정보 중 저장하고자 하는 정보를 결정하기 위해 사용된다. 장단기 기억 신경망은 대부분의 시계열 데이터 처리에서 매우 높은 성능을 나타내어 다양한 연구 분야에서 활발하게 사용되고 있다[5-7].

3. 데이터 특징 추출

3.1 공정 데이터의 결측 관리

공정 데이터를 활용하여 수요 및 부하 예측 알고리즘 개발에 앞서 가장 먼저 수행해야 하는 과정은 데이터 간 취득 시간을 동기화하고, 결측치를 보간하는 데이터 정제 과정이다. 데이터 정제는 데이터 분석 또는 머신러닝 모델을 만들기 전에 데이터를 깨끗하게 만드는 과정이다. 이 중에서도 결측치 처리는 특히 중요한 단계에 해당한다. 결측치는 데이터의 일부가 누락된 상태를 나타내며, 이를 처리하지 않으면 예측 모델의 정확도가 저하될 수 있다. 결측치 처리 과정을 다음의 단계에 따라 진행할 수 있다[8-10].

3.2 데이터 동기화

FEMS를 통해 수집된 데이터 간 취득 시간을 동기화해야 한다. 이는 서로 다른 시간 간격으로 수집된 데이터를 동일한 시간 축으로 맞추는 작업을 의미한다. 동기화된 데이터를 통해 보다 정확한 분석이 가능하다.

• 시간 축 정렬

- 모든 데이터 소스의 시간 스탬프를 동일한 형식으로 변환해야 한다.

- 공통의 시간 간격(예 : 분, 시간, 일 등)을 설정하여 데이터를 정렬해야 한다.

• 동기화 작업

- 각 데이터 포인트가 동일한 시간 간격을 가지도록 데이터 샘플링 또는 인터폴레이션을 수행해야 한다.

- 누락된 시간 구간에 대해 데이터 보간(interpolation)을 통해 값을 채워 넣어야 한다.

3.3 결측치 식별

데이터 동기화 이후에는 데이터 세트에서 결측치를 식별이 필요하다. 이는 데이터의 완전성을 확인하고, 결측치가 발생한 위치와 범위를 파악하는 과정이다.

• 결측치 확인

- 각 변수별로 결측치가 존재하는지 여부를 확인해야 한다.

- 결측치의 비율을 계산하여 전체 데이터 세트에서 결측치가 차지하는 비중을 파악해야 한다.

• 결측치 패턴 분석

- 결측치가 임의로 발생했는지, 아니면 특정 패턴을 따르는지 분석해야 한다.

- 패턴에 따라 결측치 처리 방법을 결정해야 한다.

3.4 결측치 처리 방법

결측치를 처리하는 방법에는 여러 가지가 있으며, 각 방법은 데이터의 특성과 분석 목적에 따라 선택된다.

• 제거(Drop)

- 완전 삭제법 : 결측치가 있는 행이나 열을 모두 삭제하는 방법이다.

장점 : 단순하고 직관적이다.

단점 : 데이터 손실이 크고, 데이터의 대표성이 떨어질 수 있다.

- 부분 삭제법 : 결측치가 적은 부분만 선택적으로 삭제하는 방법이다.

장점 : 데이터 손실을 최소화할 수 있다.

단점 : 모든 결측치를 처리할 수는 없다.

• 대체(Impute)

- 평균/중앙값 대체법 : 결측치가 있는 데이터를 해당 변수의 평균값이나 중앙값으로 대체하는 방법이다.

장점 : 쉽게 구현 가능하며, 데이터 손실이 없다.

단점 : 데이터의 변동성을 감소시킬 수 있다.

- 최빈값 대체법 : 결측치를 해당 변수의 최빈값으로 대체하는 방법이다.

장점 : 범주형 데이터에 적합하다.

단점 : 데이터의 다양성을 감소시킬 수 있다.

• 예측 모델 기반 대체법 (Prediction Model)

- 회귀 대체법 : 회귀 분석을 통해 결측치를 예측하여 대체하는 방법이다.

장점 : 예측 정확도가 높다.

단점 : 복잡한 계산이 필요하다.

- K-최근접 이웃(KNN) 대체법 : 결측치가 있는 데이터를 K-최근접 이웃의 값으로 대체하는 방법이다.

장점 : 데이터의 유사성을 유지할 수 있다.

단점 : 계산 비용이 크다.

• 고급 기법

- 다중 대체법 : 결측치를 여러 번 대체하여 다양한 시나리오를 생성하고, 이를 결합하여 최종 값을 결정하는 방법이다.

장점 : 보다 신뢰성 높은 결과를 제공한다.

단점 : 복잡도가 높다.

- 기계 학습 기법 : 랜덤 포레스트, 딥러닝 등 기계 학습 알고리즘을 사용하여 결측치를 예측하는 방법이다.

장점 : 높은 정확도를 제공한다.

단점 : 계산 비용이 매우 높다.

3.5 검증 및 평가

결측치 처리가 완료되면, 데이터의 일관성과 정확성을 검증해야 한다.

결측치 처리는 데이터 정제 과정에서 중요한 단계로, 에너지 수요예측의 정확성을 높이는 데 필수적이다. 적절한 결측치 처리를 통해 데이터의 완전성을 확보하고, 예측 모델의 성능을 극대화할 수 있다. 이 과정에서 데이터 동기화와 다양한 결측치 처리 기법을 활용하여 신뢰성 높은 데이터를 구축하는 것이 중요하다.

빅데이터를 분석하는 과정에서 데이터 정제는 매우 중요한 단계이며, 필수적으로 수행되어야 한다. 불량 데이터에는 앞서 언급한 결측치, 통신 시간 지연에 따른 지연값, 오측정값, 통신 및 측정 노이즈, 심지어 조작된 데이터가 있을 수 있다. 아래 그림은 시간에 따른 취득 특징들의 결측치 발생 양상을 나타낸다. 시간축과 특징축에서 모두 무작위적으로 발생할 수도 있으나, 공간-시간적으로 집중되어 결측치가 발생하는 경우도 존재한다. 최근에는 모델 기반 대체 기술들이 활발하게 연구되고 있으며, 생성적 적대 신경망 (Generative Adversarial Networks) 역시 이러한 연구의 일환이다. 본 연구에서 취득된 데이터는 결측치가 다수 분포되어 있지는 않으며, 특정 모델을 이용하여 결측치를 대체할 수 없는 환경이다. 따라서 보간법을 이용하여 취득 시간을 동기화하고 결측치를 정제하는 과정을 수행하였다.

4. 공정 데이터 품질 관리 기법

4.1 바이오 업종 학습 데이터 전처리 방법

바이오 업종 FEMS에서 수집되는 데이터들에서는 측정 오류로 인한 데이터 오염 및 결측이 주로 발생하였다. 바이오 공장 내에서 취득 데이터는 총 44종으로 유량 3종, 누적 유량3종, 온도 16종, 압력 2종, 부하량 10종, 누적부하량 10종 등이다. 취득 기간은 2023년 1월1일부터 2023년 6월 19일까지로 측정 간격은 15분 단위로 취득되었다. 정상적으로 모든 데이터가 취득되었다면 16320 × 1 의 데이터 길이를 가져야 한다. 하지만, 계측기의 오류 및 통신 문제 등으로 데이터는 손실 및 오염될 수 있으므로, 데이터 기반 인공지능 모델을 구성하기 위해서는 데이터 전처리 단계에서 오염된 데이터를 정제하는 과정이 필요하다.

표 1 바이오 업종 취득 데이터 길이 분석

Table 1 Analysis of Data Length Acquired from the Biomanufacturing

데이터 TAG

데이터 길이

데이터 TAG

데이터 길이

유량1

16165×1

부하량1

16103×1

누적유량3

16335×1

누적부하량1

16273×1

유량3

16165×1

부하량2

16103×1

누적유량3

16308×1

누적부하량2

16103×1

유량2

16165×1

부하량3

16103×1

누적유량2

16335×1

누적부하량3

16177×1

압력1

16103×1

부하량4

16103×1

압력2

16103×1

누적부하량4

16273×1

온도1

16103×1

부하량5

16103×1

온도2

16103×1

누적부하량5

16273×1

온도3

16103×1

부하량6

16103×1

온도4

16103×1

누적부하량6

16273×1

온도5

16103×1

부하량7

16103×1

온도6

16103×1

누적부하량7

16273×1

온도7

16103×1

부하량8

16103×1

온도8

16103×1

누적부하량8

16273×1

온도9

16103×1

부하량9

16103×1

온도10

16103×1

누적부하량9

16273×1

온도11

16103×1

부하량10

16103×1

온도12

16103×1

누적부하량10

16273×1

온도13

16103×1

온도14

16103×1

온도15

16103×1

온도16

16103×1

데이터 간 시간 간격이 모두 다른 데이터를 동기화하기 위해 큐빅-스플라인 보간을 실시한다. 큐빅-스플라인 보간은 연속 함수를 효과적으로 근사하는 보간 방법의 하나다. 이 기법은 데이터가 주어진 구간에서 3차 다항식을 따르도록 한다. 그림 6은 T1 데이터의 983번 샘플(2023년 1월 11일 08시 15분 ~ 2023년 1월 11일 10시 30분)과 9731번 샘플(2023년 4월 14일 01시 15분 ~ 2023년 4월 14일 03시 00분)에서 데이터 보간된 결과를 관찰한다. 두 예시에서 모두 결측치를 보간하여 연속적인 데이터의 형태를 나타낸다. 향후 딥러닝 네트워크의 입력으로 사용되어야 할 데이터이므로, 제거나 대체에 비해 효과적인 형태의 데이터 보간법으로 판단된다.

그림 6. 큐빅-스플라인을 통한 데이터 보간

Fig. 6. Data Interpolation Using Cubic Spline

../../Resources/kiee/KIEE.2025.74.9.1440/fig6.png

4.2 제지 업종 학습 데이터 전처리 방법

제지 업종에서 수집되는 데이터들은 공정의 변동과 작업자의 예기치 못한 조작으로 인한 데이터들이 주로 발생하였다. 따라서 변동폭이 큰 데이터들을 관리하기 위해서는 전처리 방법을 적용하고 학습 데이터를 구성해야 한다. 제지업종은 바이오 업종과는 다른 데이터 구조와 이상 데이터가 발생한다. 그림 7에서 볼 수 있듯이 제지 업종에서는 2000개 이상의 데이터 관제점이 존재하고, 에너지 태그는 10개 이상, 공정 태그는 2000개 이상, 진단 태그 7개가 존재한다. 또한 취득된 데이터가 1분 간격으로 측정되고 있기 때문에 바이오 업종에 비하여 데이터 샘플링이 높다. 따라서 제지 업종은 결측된 데이터보다 이상 데이터를 제거하여 학습데이터를 구성해야 한다.

그림 7. 제지 업종 데이터 태그 분류

Fig. 7. Data Tag Classification in the Paper Manufacturing Industry

../../Resources/kiee/KIEE.2025.74.9.1440/fig7.png

그림 8. Shewhart 관리도를 통한 공정 이상 데이터 제거

Fig. 8. Removal of Anomalous Process Data Using Shewhart Control Charts

../../Resources/kiee/KIEE.2025.74.9.1440/fig8.png

FEMS에 수집된 데이터를 바탕으로 인공지능 기반 전력 수요 예측 모델을 학습시키게 되는데, 공정에서 제어로 인하여 간헐적으로 발생하는 이상 데이터들을 제거하기 위하여 그림 8와 같이 슈하트 품질관리기법(Shewhart individuals control chart)을 활용하여 학습 성능을 저해하는 데이터들을 제거한다. 공정은 통계적 관리 상태로 공통 원인인 변동이 존재하고, 이를 파악하고 통제하고 유지해야만 정상적인 제품이 생산되고, 생산량 예측이 가능하다. 제품을 생산하는 공정에서 데이터들은 변동성을 나타내게 되지만, 일부 공정에서는 인과 관계가 없는 통제되지 않는 변동성 요인이 포함된다. 슈하트 품질관리기법에서 이상치를 판별하는 상한선과 하한선은 이동평균과 6 시그마 이론에 따라 결정된다. 서로 다른 데이터 $x_{i}$ 와 그 전 상태 값 $x_{i-1}$에 대하여 아래의 수(1)-(2)와 같이 정의된다.

(1)
$MR_{i}=\left | x_{i}- x_{i-1}\right |$
(2)
$MR_{i}=\dfrac{\sum_{i=2}^{m}MR_{i}}{m-1}$

총 m개의 데이터값에 대하여 m-1 동안 이동평균으로 정의되고, 이때 상한선(UCL: Upper Control Limit)과 하한선(LCL: Lower Control Limit)은 수(3)-(4)와 같이 정의된다. (상수 2.66은 슈하트 계수표에 따라 정의된다.)

(3)
$UCL =\overline{x}+ 2.66\overline{MR}$
(4)
$LCL =\overline{x}- 2.66\overline{MR}$

슈하트 관리 기법을 적용하였을 때, 데이터의 이상치 분포는 정상 88.32%, 이상치 11.68%의 결과를 보였고, 이상치를 제거하여 학습데이터를 경량화시키고, 모델의 과적합을 방지하여 성능을 향상을 기대할 수 있다.

5. 인공지능 기반 부하 예측 모델

본 연구에서는 바이오와 제지 업종의 에너지, 공정 및 부하 데이터 분석에 기반하여 부하 예측 알고리즘 및 분석 결과를 제시한다. 본 논문에서는 인공지능 기반 부하 예측 모델을 개발하기에 앞서 훈련 및 테스트 데이터를 분리하는 것이 가장 먼저 수행되어야 한다. 그림 9와 같이 본 논문의 모든 머신러닝 알고리즘 모델은 전체 데이터 중 70%의 데이터를 훈련 데이터로 설정하여 훈련한다. 30\%의 데이터를 테스트 데이터로 설정하여 모델의 성능을 평가하기 위해 사용한다. 전체 데이터에서 훈련 및 테스트 데이터의 설정 현황 및 시간대는 아래 그림을 통해 확인할 수 있다.

그림 9. 훈련 및 테스트 데이터 설정

Fig. 9. Configuration of Training and Test Datasets

../../Resources/kiee/KIEE.2025.74.9.1440/fig9.png

사용하고자 하는 과거 데이터의 길이를 Lag로 명시하고, 추정하고자 하는 미래 데이터의 길이를 Lead로 명시한다. 다양한 Lag와 Lead의 조합이 설정 가능하다. 설정된 주기성에 따라 훈련 Epoch의 수, 초기 학습률 등은 차이가 있을 수 있으나, 모델의 구조는 동일하게 고정된다.

5.1 학습 성능 향상 방법

드랍아웃은 신경망에서 사용되는 정규화(regularization) 기법 중 하나로, 과적합(overfitting)을 줄이고 모델의 일반화 성능을 향상시키는 데 도움을 준다. 드랍아웃은 훈련 과정에서 신경망의 일부 노드를 랜덤하게 선택하여 제외한다. 이를 통해 모델이 특정 노드에 지나치게 의존하지 않도록 한다. 이로써 각 노드는 독립적으로 학습되어 더 강력하게 특징을 학습할 수 있고, 또한 다양한 조합으로 특징을 학습하게 된다. 드랍아웃은 주로 완전연결계층이나 은닉층에서 적용되며, 일반적으로 훈련 중에만 적용되고 테스트나 예측 시에는 모든 노드를 사용하여 모델의 출력을 계산한다.

5.2 바이오 업종 부하 예측 결과

5.2.1 바이오 업종 공정 프로세스 및 데이터 분석

바이오 업종에서는 제품을 생산하기 위해서는 냉각용 수조를 적정 온도로 유지하여 발효관에 공급하는 것이 중요하다. 그림 10에서 볼 수 있듯이 발효관에 적정 온도의 물을 공급하기 위하여 냉각탑과 냉동기를 활용하여 관리하고 있다. 냉각탑과 냉각용 수조는 외부에 노출되어 있고, 냉동기와 냉각탑에서 각각 공급된 물은 냉각용 수조에서 모여서 내부 공정으로 공급된다. 따라서 적정 온도 범위 안에서 공정이 수행되어야 하는 발효관에서는 외기온도를 고려한 공정 온도 관리가 필수적이다. 따라서 해당 공장의 작업자는 MES와 외기온도를 고려하여 적정 온도와 적정 유량을 공급하기 위하여 냉각탑과 냉동기를 제어한다. 해당 바이오 공정에서는 주요 에너지를 가장 많이 소모하는 유틸리티가 냉동기이다. 따라서 에너지를 절감하기 위해서는 공정에 따른 발효관과 공정의 현재 상태를 고려하여 적합한 온도와 유량을 파악하고, 과거의 패턴을 기반으로 부하를 예측하여 공정 설비를 최적 제어하는 것이 필요하다.

그림 10. 바이오 공장에서의 온도, 유량, 압력 계측 포인트

Fig. 10. Measurement Points of Temperature, Flow Rate, and Pressure in a Biomanufacturing Plant

../../Resources/kiee/KIEE.2025.74.9.1440/fig10.png

바이오 업종의 부하 데이터는 냉동기 가동 여부에 따라 데이터의 변화가 급격하게 발생하므로 통계적 특성상 비정상성을 나타낸다. 모델의 표현력을 강화시키기 위해 두 층의 완전연결계층을 사용한다. 첫 번째 완전연결계층의 경우 시그모이드 함수를 활성화 함수로 사용한다. 두 완전연결계층 사이에 드랍아웃층을 위치시켜 네트워크의 과적합을 억제하는 방법을 사용한다.

부하 추정 알고리즘의 입력 데이터를 선정하기 위해서는 공장 내 전체 부하량과 가장 상관성이 높은 데이터를 선별해야 한다. 전체 부하량은 모든 냉동기가 소모하고 있는 전력값을 합산하여 계산된다. 앞선 온도 추정 알고리즘과 유사하게 공장 내 전체 부하량과 타 데이터들 간 상관계수 절댓값을 분석한다. 바이오 업종에서 분석된 전체 부하량 및 타 변수 간 상관계수의 절댓값은 그림 11과 같다. 상관계수의 값이 1을 나타내는 43번째 변수가 추정 목표에 해당하는 전체 부하량이다.

그림 11. 전체 부하량 및 타 변수 간 상관계수의 절댓값

Fig. 11. Absolute Values of Correlation Coefficients Between Total Load and Other Variables

../../Resources/kiee/KIEE.2025.74.9.1440/fig11.png

5.2.2 출력 부하 추정 모델 구조 및 예측 결과

바이오 업종의 부하 예측 모델에서 LSTM 층의 경우 앞선 온도 추정과 동일하게 각각 100개씩의 노드를 사용한다. 첫 완전연결계층에서는 100개의 노드를 사용한다. 드랍아웃층의 확률값은 0.3으로 지정하여 30\% 확률로 훈련과정에서 노드가 비활성화되도록 설정한다.

그림 12. (Lag, Lead)=(8, 8) 복수 출력 부하 추정 모델 구조

Fig. 12. Multi-Output Load Estimation Model Architecture with (Lag, Lead) = (8, 8)

../../Resources/kiee/KIEE.2025.74.9.1440/fig12.png

(Lag, Lead)=(8, 8) 복수 출력 부하 추정 모델은 각 시간대에서 현재 부하량이 입력되어 향후 2시간 동안의 부하량을 벡터 형태로 추정하여 출력하는 형태의 모델이다. 2시간의 과거 데이터가 순차적으로 모델에 입력된다. 훈련 데이터 RMSE는 16.0685이고, 테스트 데이터 RMSE는 28.9874의 오차를 나타낸다.

그림 13. (Lag, Lead)=(8, 8) 복수 출력 부하 추정 모델 결과

Fig. 13. Results of Multi-Output Load Estimation Model with (Lag, Lead) = (8, 8)

../../Resources/kiee/KIEE.2025.74.9.1440/fig13.png

5.3 제지 업종 부하 예측 결과

5.3.1 제지 업종 공정 프로세스 및 데이터 분석

본 연구에서 분석하고 있는 제지 업종은 아래 그림 14과 같이 4단계의 공정을 통하여 제품을 생산하고 있다. 제지 업종에는 4가지 종류의 에너지가 공급되어 제품을 생산하게 되는데 전력, 스팀, 압축 공기 그리고 가스가 공정의 각 단계에 요구량에 맞춰 공급된다. 제지와 펄프를 생산하기 위하여 조성 공정, 초지 공정, 코팅 공정, 완정 공정 단계를 거치게 된다. 조성 공정은 초지기에 재료를 보내기 직전의 공정이다. 종이의 주 원료가 되는 펄프는 혜리 및 고해과정과 충전재를 비롯한 각종 약품을 배합하는 과정을 거친 다음 클리너와 스크린 등에서 정선, 제진 과정을 거쳐 초지기의 헤드박스로 보내지는데, 이 단계에서 종이의 품질이 결정된다. 다음으로 초지 공정에서는 지료를 탈수 및 건조하여 종이를 초조하는 공정이다. 헤드박스에서 분출된 원료들은 와이어 파트를 거쳐 지필로 형성 된 후에 프레스 파트에서 압착 탈수 과정을 거치며, 드라이어 파트에서 수분량을 날리고, 캘린더 공정에서 종이의 두께를 조정하여 제품으로 완성시킨다. 해당 단계에서는 수분량을 건조하기 위하여 많은 열에너지가 소모된다. 초지 공정을 거친 종이는 코팅 공정을 통해 인쇄적성 및 화상 재현성을 향상시키기 위해 종이 표면에 도료를 도피한다. 이 단계에서도 도피면을 고르게 균일하게 하는 과정과 함께 드라이어 과정을 거쳐 건조시킨다. 완정 공정에서는 제품 생산의 목표와 요구사항에 맞추어 롤과 시트 단위로 제단하여 포장하여 수요자가 원하는 공급 제품을 생산하게 된다. 제지 업종에서는 원료를 자르고, 배합하고 특히 열에너지를 활용하여 건조하는 과정을 거치면서 많은 양의 에너지를 소모하게 된다.

그림 14. 제지 업종의 공정 프로세스

Fig. 14. Process Flow of the Paper Manufacturing Industry

../../Resources/kiee/KIEE.2025.74.9.1440/fig14.png

데이터 전처리 단계에서 이상치 제거 이후에 공정 데이터의 주기성을 파악하기 위하여 그림 15와 같이 시계열 데이터의 추세(Trend), 계절성(Seasonal), 잔차(Residual)로 분류하고, 각각의 학습데이터 및 모델을 구성하여 예측의 정확도를 높인다. 추세(Trend)로 분류된 전력 소비 패턴에서는 월간 전력 소비량 증가와 감소의 패턴이 반영되고, 계절성(Seasonal)으로 분류된 전력 소비 패턴에서는 주기적 패턴이 보인다. 제지 업종의 경우에는 스펙트럼 분석 결과 약 2~4주 단위로 패턴의 유사성이 높게 나타났다. 잔여(Residual)로 분류된 데이터 군집은 주기성이 낮아서 전력 소비 패턴을 예측하는 모델에서 낮은 가중치를 설정하여 학습한다.

그림 15. 시계열 분석을 통한 공정 주기 파악

Fig. 15. Identification of Process Cycles Through Time Series Analysis

../../Resources/kiee/KIEE.2025.74.9.1440/fig15.png

제지 업종의 경우에도 전 처리된 데이터를 바탕으로 인공지능 학습 모델을 사용하여 전력 소비를 예측한 결과는 그림 16와 같다. 제지업종은 공정의 특성 상 주기성이 강하게 나타나는 패턴이 상이하여 LSTM 기반으로 시계열 데이터의 주기성과 패턴의 특징을 학습하였다. 실제 데이터에는 이상치가 존재하여 예측의 정확도를 판별하기 어려워 이동평균을 기준으로 전력 소비 예측의 정확도를 비교하였다. MR(2)는 2주간 이동평균, MR(4)는 4주간 이동평균을 나타낸다. 전력 소비 예측 결과 MR(2)와 비교 시 93.02%의 정확도를 나타내었고, MR(4)와 비교 시 96.11%의 정확도를 나타냈다.

그림 16. 부하 예측 모델 정확도 비교

Fig. 16. Comparison of Load Forecasting Model Accuracies

../../Resources/kiee/KIEE.2025.74.9.1440/fig16.png

6. 결 론

본 논문에서 제안한 전력 소비 예측 기술은 제조 공정의 특성과 주기성 분석을 통해 예측 모델의 정확도를 높이는 방법을 제시하였다. 이를 위해 공정 데이터의 이상치를 제거하고, 시계열 분석을 통한 주기적 특성을 바탕으로 LSTM 기반의 인공지능 모델을 활용하여 에너지 소비 예측의 성능을 개선하였다. 이러한 접근법은 FEMS의 에너지 관리 및 모니터링 기능의 향상을 기대할 수 있다.

FEMS의 에너지 관리 성능을 향상시키기 위해서는 공장에서 소모될 미래의 전력 소비를 정확하게 예측하는 것이 중요하다. 또한, 공장의 에너지 소비는 업종별 특성과 공정 프로세스에 따라 상이하며, 계측 데이터의 유형과 수집 주기도 서로 다르다. 이러한 차이로 인해 단일한 부하 예측 알고리즘으로 모든 공정의 에너지 소비를 정확히 추정하는 데에는 한계가 있다. 따라서 에너지 관리를 효과적으로 수행하기 위해서는 에너지 절감 가능성이 높은 공정과 에너지 소비가 집중되는 핵심 공정을 대상으로 한 모니터링 시스템을 구축하는 것이 보다 효율적이다. 이를 위해 생산 정보 시스템(MES) 데이터를 활용하여 주요 공정에서 공장의 생산 계획과 조정된 스케줄을 고려한 수요 예측 모델을 설계할 필요가 있다. MES 데이터는 공장의 생산 계획, 작업 지시, 진행 상황 등을 포함하고 있어, 이를 바탕으로 에너지 수요를 보다 정확하게 예측할 수 있다.

공장에서 수집되는 데이터는 작업자의 인위적 제어, 고장 및 불량에 의한 이상 데이터가 포함될 수 있으므로, 이러한 데이터를 제거하고 분석하는 과정이 필요하다. 또한, 업종마다 다양한 에너지원이 사용되므로 각 공정 프로세스와 유틸리티 및 공장 기기에 대한 이해를 바탕으로 에너지 현황을 분석해야 한다. 이상 데이터를 제거하기 위해 슈하트 품질관리기법(Shewhart individuals control chart)을 활용할 수 있으며, 이를 통해 학습 데이터의 성능을 향상시킬 수 있다. 본 논문에서 비교된 바이오 업종과 제지 업종에서도 데이터의 관리를 위한 전처리 방법이 공정과 데이터의 특성을 고려하여 달리 적용되었다. 데이터 전처리 과정이 인공지능 부하 예측 모델 성능에 큰 영향을 미치므로 적합한 데이터 전처리 방법이 적용되어야 한다.

결론적으로, FEMS의 성공적인 도입과 운영을 위해서는 데이터 동기화, 결측치 처리, 주기성 분석 등의 데이터 정제 과정이 중요하다. 또한, 인공지능 기반의 부하 예측 모델을 통해 보다 정확한 에너지 수요 예측이 가능하며, 이를 통해 공장 운영자는 최적의 에너지 절감 방안을 도출할 수 있다. 본 논문은 단일 모델 기반의 예측 방식에서 벗어나, 실제 공정에서 사용되는 MES 데이터를 연계한 수요 예측 프레임워크를 제안함으로써 다음과 같은 공헌을 제공한다.

(1) 업종별 공정 특성을 반영한 전처리 및 이상치 제거 전략,

(2) 시계열 주기성을 고려한 LSTM 예측 모델의 실증 적용,

(3) 공장 유형별(바이오, 제지) 적용 사례를 통해 일반화 가능성과 실무 적용성을 검증한 점에서 FEMS 분야에 실질적 기여를 하였다.

본 논문은 바이오 및 제지 업종을 중심으로 예측 모델을 검증하였으나, 향후 업종별 부하 패턴 군집화를 통해 예측 범위를 확장하거나, 예측 난이도가 높은 업종에 대한 개별 모델 학습 전략을 병행할 수 있다.

감사의 글

본 연구는 산업통상자원부(MOTIE) 및 한국에너지기술평가원(KETEP)의 에너지기술개발사업(No. 20202020900290)의 지원과, 한국산업기술진흥원(KIAT)의 사업지원(No. RS-2025-04752996), 그리고 국립공주대학교 학술연구지원사업의 의하여 연구되었음.

This research was supported by the Energy Technology Development Program of the Ministry of Trade, Industry and Energy (MOTIE) and the Korea Institute of Energy Technology Evaluation and Planning (KETEP) under Grant No. 20202020900290. It was also supported by the Korea Institute for Advancement of Technology (KIAT) under Project No. RS-2025-04752996, and by the Research Grant of Kongju National University.

References

1 
M. Choobineh and S. Mohagheghi, “Optimal energy management in an industrial plant using on-site generation and demand scheduling,” IEEE Trans. Ind. Appl., vol. 52, no. 3, pp. 1945-1952, 2016.DOI
2 
Y.-M. Shin, Y.-M. Do, T.-W. Heo and I.-W. Lee, “Common framework for factory energy management systems (FEMS),” Proc. Korean Institute of Communications and Information Sciences (KICS) Conf., pp. 453-454, 2022.URL
3 
S.-H. Kim, T.-W. Heo and I.-W. Lee, “Electricity consumption analysis and prediction using quality control charts in factory energy management systems,” Proc. Korean Institute of Electrical Engineers (KIEE) Summer Conf., pp. 2412-2413, 2023.URL
4 
S.-H. Kim, Y.-M. Shin, Y.-M. Do, T.-W. Heo and I.-W. Lee, “Data preprocessing method for lightweight anomaly diagnosis algorithms in factory energy management systems (FEMS),” Proc. Korean Institute of Electrical Engineers (KIEE) Summer Conf., pp. 1744-1745, 2022.URL
5 
W. Kong, Z. Y. Dong, Y. Jia, D. J. Hill, Y. Xu and Y. Zhang, “Short-term residential load forecasting based on LSTM recurrent neural network,” IEEE Trans. Smart Grid, vol. 10, no. 1, pp. 841-851, 2019.DOI
6 
K. Chen, K. Chen, Q. Wang, Z. He, J. Hu and J. He, “Short-term load forecasting with deep residual networks,” IEEE Trans. Smart Grid, vol. 10, no. 4, pp. 3943-3952, 2019.DOI
7 
J. Bedi and D. Toshniwal, “Empirical mode decomposition based deep learning for electricity demand forecasting,” IEEE Access, vol. 6, pp. 49144-49156, 2018.DOI
8 
F. L. Quilumba, W.-J. Lee, H. Huang, D. Y. Wang and R. Szabados, “An overview of AMI data preprocessing to enhance the performance of load forecasting,” in Proc. IEEE Ind. Appl. Soc. Annu. Meeting, pp. 1-8, 2014.DOI
9 
A. F. Atiya, S. M. El-Shoura, S. I. Shaheen and M. S. El-Sherif, “A comparison between neural-network forecasting techniques-case study: river flow forecasting,” IEEE Trans. Neural Netw., vol. 10, no. 2, pp. 402-409, 1999.DOI
10 
A. Garulli, S. Paoletti and A. Vicino, “Models and techniques for electric load forecasting in the presence of demand response,” IEEE Trans. Control Syst. Technol., vol. 23, no. 3, pp. 1087-1097, 2015.DOI

저자소개

김선혁(Seon Hyeog Kim)
../../Resources/kiee/KIEE.2025.74.9.1440/au1.png

Seon Hyeog Kim received the B.S. degree and the integrated M.S. and Ph.D. degrees in Electrical and Electronic Engineering from Yonsei University, Seoul, South Korea, in 2014 and 2022, respectively. From 2022 to 2023, he was with the Electronics and Telecommunications Research Institute (ETRI), Daejeon, South Korea, as a Senior Researcher. In 2024, he joined the Division of Electrical, Electronic and Control Engineering at Kongju National University, Cheonan, South Korea, where he is currently an Assistant Professor. His research interests include battery diagnostics and life cycle management leveraging artificial intelligence and signal processing techniques, as well as intelligent manufacturing system optimization using ICT technologies such as digital twins.

이일우
../../Resources/kiee/KIEE.2025.74.9.1440/au2.png

IL-WOO LEE received the B.S. and M.S. degrees in computer science from Kyung Hee University, Seoul, South Korea, in 1992 and 1994, respectively, and the Ph.D. degree in computer science from Chungnam National University, Daejeon, South Korea, in 2007. He joined the Electronics and Telecommunications Research Institute(ETRI), in 1994, and has been engaged in the research and development of CDMA, TDX-10 ISDN, AIN, and home network systems. He is currently the Assistant Vice President of the division, who has been leading industrial and energy convergence research, since 2023. His research interests include energy efficiency, carbon neutrality, AIoT, autonomous manufacturing, and ICT convergence in agriculture, animal, and aquaculture.

허태욱
../../Resources/kiee/KIEE.2025.74.9.1440/au3.png

Taewook Heo received the Ph.D. degree in computer engineering from Chungnam National University, South Korea, in 2015. He is currently the Director of the Environment ICT Research Section, Electronics and Telecommunications Research Institute, South Korea. His research interests include environmental data analysis, the Internet of Things, energy data analysis, carbon neutrality and sensor networks.