• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept of Electrical Engineering, Soongsil University, Korea)



Electric Power Sales, Power Consumption, Forecasting, LSTM, XGBoost, Ensemble Model

1. 서 론

우리나라는 전력수급기본계획[1]에서 장기 전력소비량과 최대전력수요 예측을 수행하고 있으며, 전력소비량은 한전의 전력판매량을 의미한다. 다양한 관점에서 중장기 전력소비량 예측은 중요하다. 국가적 관점에서 정확한 전력소비량 예측을 하면 전력수급을 효율적이고 안정적으로 유지할 수 있으며, 발전사업 계획과 에너지 정책 수립을 위한 정보로 활용할 수 있다. 또한, 생산량 및 에너지 저장 시스템의 이용을 최적화하고 태양광, 풍력 등 재생에너지의 효율적 통합과 전체 전력공급의 안정화에 활용 가능하다. 발전사업자 관점에서는 발전시설의 가동 계획을 최적화하고 에너지 생산의 효율화가 가능하며, 연료수급 계획수립 등 발전소 운영계획과 중장기적으로 발전시설 확장 및 투자 결정에 활용할 수 있다. 판매사업자 관점에서는 전력 판매 및 구매 계획에 이용하여 월별 에너지 밸런스를 평가하고 손실률 등 지표분석을 통해 전력판매회사의 운영 효율성을 개선할 수 있다. 또한, 재무분석을 통해 수입전망, 투자계획, 계약물량 산정 등에 활용 가능하다.

해외에서는 중장기 전력소비량 예측을 위해 다양한 통계적 기법, 기계 학습, 딥러닝 모델 등을 이용하고 있다[2-12]. 대부분의 연구에서는 전력소비량 예측의 정확성을 높이기 위해 하이브리드 모델을 이용하고 있다. 최적화 알고리즘을 이용하여 입력 매개변수를 결정하는 방법을 개선하고 구간 최적화 기술을 이용하여 예측 정확도를 향상시키는 방법을 적용하거나, 일부 연구에서는 시퀀스 복잡성을 줄이기 위해 데이터를 분해하거나 차원을 축소하는 기법도 이용하였다. 국내에서는 단기 전력수요예측에 대한 연구는 다양하게 진행 중이나 국가 단위 중장기 전력소비량 예측에 관한 연구는 적은 편이다[13-16].

본 논문에서는 중장기 전력판매량 예측을 위해 전력판매량에 영향을 미치는 요소를 분석하고, 이를 바탕으로 월별 전력판매량과 높은 상관관계를 갖는 입력변수를 선정한다. 그리고 선별된 데이터를 LSTM 기반의 심층신경망 모델과 XGBoost 모델을 학습하고 각 모델의 월별 예측값을 보팅 방식으로 결합하여 앙상블 모델을 구성하여 향후 24개월 전력판매량을 예측하는 알고리즘을 제시한다.

2. 전력판매량의 변동 특성 분석

월별 전력판매량 예측을 위해서는 전력판매량에 영향을 미치는 요소 분석이 필요하며, 전력판매량에 영향을 미치는 요소로는 경제적 요인, 계절적 요인, 기상적 요인 등 다양한 외부요인이 있다. 선행연구[2-12]에서는 전력소비량 예측을 위해 다양한 외부요인을 고려하고 있다. 평균기온, 제3산업비율, GDP, 총인구, 서비스 가격 지수, 소비자 물가 지수, 소매 물가 지수, 강수량, 온도, 상대 습도 등 각 국가별로 전력소비량 특성에 적합한 외부요인을 입력변수로 이용하고 있다. 선행연구[2-12], 정부 정책[1] 등을 고려하여 전력판매량에 영향을 미치는 요소를 표 2에 제시한다.

전력판매량에 영향을 주는 요소로는 GDP와 같이 매년 증가하는 형태의 데이터와 기온과 같이 일정한 범위에서 주기적으로 반복되는 형태의 데이터가 있다. 각 요소별 속성에 적합하게 전력판매량과의 상관관계를 분석한다. 전력판매량은 국가 경제성장에 따라 증가하며 GDP는 전력판매량에 영향을 미치는 대표적인 경제적 요소이다. 통계청의 자료를 이용하여 2003년부터 2019년까지 기온과 전력판매량의 상관관계는 -0.5033 수준으로 나타난다. 냉방도일(Cooling Degree Days, CDD)과 난방도일(Heating Degree Days, HDD)은 기온에 따른 냉난방기의 사용 수준을 확인할 수 있는 지표이다. 월별 CDD(Monthly CDD, MCDD)는 한 달간 일평균기온과 기준 기온($T_{CDD}^{ref}$)의 차를 누적 합산한 값이며, 월별 HDD(Monthly HDD, MHDD)는 한 달간 기준 기온($T_{HDD}^{ref}$)과 일평균기온의 차를 누적 합산한 값이다. 여기에서, $T_{CDD}^{ref}$는 24℃, $T_{HDD}^{ref}$는 18℃로 기상청의 기상용어사전에서 정의하고 있는 값이다. MCDD, MHDD는 월별 냉난방기의 누적 사용 수준을 반영하여 여름, 겨울의 전력판매량에 미치는 영향을 확인할 수 있으며, 월별로 CDD, HDD를 합산한 값이므로 월별 날짜 개수의 영향도 일부 포함하고 있다. 예를 들어, 윤달이 존재하는 연도의 2월은 대체적으로 MHDD가 높게 나타난다.

(1)
$CDD_{y,\: m,\: d}=\max(T_{y,\: m,\: d}-T_{CDD}^{ref},\: 0)$
(2)
$MCDD_{y,\: m}=\sum_{d=1}^{m월의 날짜개수}CDD_{y,\: m,\: d}$
(3)
$HDD_{y,\: m,\: d}=\max(T_{HDD}^{ref}-T_{y,\: m,\: d},\: 0)$
(4)
$MHDD_{y,\: m}=\sum_{d=1}^{m월의 날짜개수}HDD_{y,\: m,\: d}$,

MCDD는 여름철인 7~9월, MHDD는 겨울철인 12~2월에 주로 높게 나타난다. 연도별로 기온의 영향을 적게 받는 10월의 전력판매량을 기준으로 정규화한 전력판매량과 MCDD, MHDD 간의 상관관계를 분석하였다. 각각 2003년부터 2019년까지의 여름철과 겨울철을 대상으로 한 상관관계 분석결과는 각각 0.6819, 0.6216 수준으로 높게 나타났다.

월별로 특수일의 개수는 전력판매량에 영향을 미친다. 음력 공휴일, 임시 공휴일 등 공휴일의 개수가 많은 달은 전력판매량이 낮으며 평상일에 공휴일이 위치하고 연휴가 길어지는 경우 전력판매량이 더욱 낮아진다. 특히, 설날, 추석 등 음력 공휴일은 매년 날짜가 변경되기 때문에 전력판매량에 영향을 크게 미친다. 그림 1은 설연휴에 의한 전력판매량 패턴 변화이며 2012년 설연휴는 1월, 2013년 설연휴는 2월에 존재하여 전력판매량 패턴이 크게 차이 나는 것을 확인할 수 있다.

그림 1. 설연휴에 의한 전력판매량 패턴 변화

Fig. 1. Changes in electric power sales patterns due to the Lunar New Year holiday

../../Resources/kiee/KIEE.2024.73.5.766/fig1.png

표 1 해외 월별 전력소비량 예측 연구 동향

Table 1 Overseas monthly power consumption forecast research trends

논문 번호

사용된 기법

입력 데이터

특징

[2]

LSTM, GRU, TCN,

Ensemble Deep Learning

2000명의 고객의 월간 전기 사용량

다양한 딥러닝 모델을 결합한 앙상블 모형으로 예측성능을 개선

[3]

회귀 기반 모델, 시계열 분석 기반 모델, 계산 지능 기반 모델, 하이브리드 모델

중국 남부 도시의 월간 전력 사용량

Grey System 이론을 기반으로 전력소비량의 추세와 계절성을 고려

[4]

GRU, K-Shape 및 K- Means, Robust Exponential and Holt-Winters Smoothing, Bayesian Optimizer

알제리의 경제 부문에서 2000명의

전기 고객의 전력 소비량

이상치 처리, 클러스터링 후 딥러닝 모델을 이용하여 정확한 예측 수행

[5]

ARIMA, Random Walk, 랜덤 포레스트, 라쏘 라스

전력 수요, 달력 변수, 기상 변수,

전기 에너지 가격 변수, 경제 변수 등

다양한 변수를 이용하고 고차원 데이터를 다루기 위해 정규화된 모델 이용

[6]

패턴 유사성 기반 머신러닝 모델

유럽 35개 국가의 월간 전력 수요

시계열 데이터

입·출력 데이터의 패턴을 정의하고

데이터 관계 단순화를 위해 가중치 적용

[7]

Holt-Winters, SARIMA, 동적 선형 모델, TBATS, NNAR, MLP

월간 산업용 전력 소비 데이터

다양한 모델을 비교하여 브라질 산업부문 전력소비에 적합한 모델 분석

[8]

IVMD, IELM, Adaboost

지역 GDP, 산업 구조, 인구, 강철 생산량, 월평균 온도, 평균 강수량, 일조 시간 등

포인트 예측과 간격 예측을 고려하여 전력소비의 불확실성을 분석 및 예측

[9]

Greedy Clustering Algorithm, ARIMA

전력 소비 데이터

최적 군집 수를 선택하여 예측성능 개선

[10]

벡터 오차 수정 모델,

자기 적응 스크리닝 방법

산업 데이터, 상품 거래 데이터, 가격 지수 등

자동으로 입력변수를 선택하고 계절성을 조정하여 예측성능 개선

[11]

반모수 가법 모델, 요인 분석,

이중 블록 부트스트랩 방법, EMD

서비스 가격 지수, 소비자 물가 지수,

소매 물가 지수, 강수량, 온도, 상대 습도 등

고차원 및 주기적 특성을 처리하고

데이터 분포의 불확실성을 고려

[12]

STL 기반 계절-추세 분해 절차, VMD, GWO-SVR

평균 온도, 제3산업비율, GDP, 총인구 등

다양한 모델을 결합하고 구간 최적화를 통해 예측 정확성을 향상

표 2 전력판매량에 영향을 미치는 요소

Table 2 Factors affecting electric power sales

분류

데이터 종류

기상 정보

- 기온

- 운량

- 일사량

- 일조시간

- 습도

- 강수량

- 풍속

냉난방도일

- CDD

- HDD

경제 정보

- GDP

- 인구

- 산업구조(1차, 2차, 3차 산업 비중)

- 지수(서비스지수, 소비자물가지수)

가격 정보

- 가정용 판매단가(소매단가)

- 산업용 판매단가(소매단가)

- 일반용 판매단가(소매단가)

- SMP(도매단가)

- 천연가스 단가

날짜 정보

- 월요일 개수

- 평일(화∼금) 개수

- 토요일 개수

- 일요일 개수

- 특수일 개수

재생에너지

정보

- 자가용 태양광 설비용량, 발전량

- 자가용 풍력 설비용량, 발전량

효율 향상 및 전기화

- 에너지집약도(Energy Intensity)

- 전기차 보급량

- 데이터센터 보급량

- 상용자가발전기 발전량

정책 및 사회적 이슈

- 누진제 개편

- 코로나19

3. LSTM-XGBoost 앙상블 모형을 이용한 월별 전력판매량 예측 알고리즘

본 논문에서는 정확한 월별 전력판매량 예측을 위하여 LSTM 기반의 심층신경망 모형과 XGBoost 모형을 결합한 앙상블 모형을 이용하여 월별 전력판매량을 예측한다. 그림 2는 LSTM-XGBoost 앙상블 모형을 이용한 전력판매량 예측 과정을 나타낸다. 전력판매량 예측 모형의 입력데이터를 선정하기 위하여 표 2의 전력판매량에 영향을 미치는 요소 데이터를 순차적으로 입력한다. 전력판매량에 영향을 미치는 요소 중 데이터 형태가 연간 데이터로만 존재하는 경우 월별 데이터로 보정하거나 연도별로 동일한 값을 이용하는 방법을 이용한다. 피어슨 상관계수의 절댓값이 0.4부터 0.6 사이에 있으면 상관관계가 있음을 의미하므로 전력판매량과 입력데이터의 상관관계가 0.5 이상인 경우 심층신경망 예측 모형이나 XGBoost 예측 모형에 입력데이터로 활용하여 각 모델의 성능이 개선되면 해당 데이터를 채택하는 절차를 반복하여 입력데이터를 선정한다. 선정된 입력데이터를 이용하여 심층신경망 예측 모형과 XGBoost 예측 모형을 학습한다. 각 모델의 월별 예측성능을 비교하여 모델별로 월별 가중치를 계산하여 앙상블 모형을 구성하고 최종 전력판매량 예측을 수행한다. 본 논문에서 입력데이터의 선정 프로세스를 통해 선정된 입력데이터는 월별 GDP, 월별 평균기온, MCDD, MHDD, 월별 특수일의 개수이다.

그림 2. 앙상블 모형을 이용한 전력판매량 예측 과정

Fig. 2. Process of predicting electric power sales using ensemble model

../../Resources/kiee/KIEE.2024.73.5.766/fig2.png

3.1 심층신경망 기반 모델의 전력판매량 예측 모형

LSTM층과 FC층이 병렬로 연결된 심층신경망 기반의 전력판매량 예측 모델은 과거 데이터의 시계열 특성과 전력판매량에 영향을 미치는 요인과의 상관관계를 반영할 수 있다[17]. 그림 3은 심층신경망 기반의 전력판매량 예측 모형을 나타낸다.

그림 3. 심층신경망 기반 전력판매량 예측 모형 구조

Fig. 3. The Structure of DNNs based power electric sales forecasting model

../../Resources/kiee/KIEE.2024.73.5.766/fig3.png

LSTM층은 과거 데이터의 시계열 특징을 반영하기 위해 활용되며, FC층은 예측하려는 월의 정보 등을 예측 모델에 입력하는 역할을 한다. LSTM층에는 월별 전력판매량, 월 변수, 월별 GDP, 월 평균기온, MCDD, MHDD, 월별 특수일의 개수 등이 입력되며, FC층에는 월 변수, 월 평균기온, MCDD, MHDD, 월별 특수일의 개수 등이 입력된다. 출력층에서는 월별 전력판매량이 출력된다. 입력데이터의 정규화방법으로는 최대-최소 정규화 방법을 이용한다. 예측 대상을 $m$월로 설정하면, 심층신경망 기반 예측 모델은 $m$월의 전력판매량을 출력한다. FC층은 월별 데이터를 벡터 형태로 입력받는다. 각 LSTM층은 $m$월의 1년 전, 2년 전, 3년 전 데이터를 입력받는다. 여기에서, 입력되는 과거 데이터의 범위는 LSTM층의 시퀀스 길이에 따라 결정된다. 시퀀스 길이를 $l$이라 할 때, 각 LSTM층은 $m-(l-1)$월부터 $m$월까지의 데이터를 벡터 형태로 입력받는다. 표 3은 LSTM-FC 모형의 입력데이터 구성을 나타낸다.

예측 모델의 파라미터는 예측 대상 월 이전의 실적 데이터를 활용하여 추정되며, 식 (5)와 같은 목적함수인 평균 제곱 오차(Mean Squared Error, MSE)를 최소화하는 방식으로 추정한다.

(5)
$MSE=\dfrac{1}{N}\sum_{i=1}^{N}(Y_{i}-\hat{Y_{i}})^{2}$

여기서, $N$은 예측 모형의 파라미터 추정을 위해 사용되는 데이터 세트 개수, $Y_{i}$는 $i$월의 전력판매량 실적값, $\hat{Y_{i}}$는 예측 모형을 통해 계산된 $i$월의 전력판매량을 의미한다. 한편, 학습률, 배치 사이즈, 에폭 수 등 하이퍼 파라미터는 LSTM 모델 성능에 큰 영향을 미치므로 효과적으로 선택이 필요하다. 이를 위해 격자 탐색(Grid Search) 방법을 이용하여 체계적으로 탐색하여 최적의 하이퍼 파라미터 조합을 선정한다.

표 3 LSTM-FC 모형의 입력데이터 구성

Table 3 Input data composition of LSTM-FC model

LSTM-FC 모형

층 종류

입력데이터 세트

LSTM Layer 1

$y-3$년 $m-(l-1)$월, …, $y-3$년 $m$월

LSTM Layer 2

$y-2$년 $m-(l-1)$월, …, $y-2$년 $m$월

LSTM Layer 3

$y-1$년 $m-(l-1)$월, …, $y-1$년 $m$월

FC Layer

$y$년 $m$월

3.2 XGBoost 기반의 전력판매량 예측 모형

XGBoost는 부스팅(Booting) 기법이 적용된 의사결정나무 기반의 기계학습 방법[18]으로 병렬 연산이 가능한 특성을 가지고 있어 모형의 학습 속도가 빠르며 다양한 데이터에 대한 유연한 학습이 가능하다. XGBoost 기반의 전력판매량 예측 모형은 입력 데이터 선정, 데이터 분할, 그리고 예측 모형 추정을 통해 향후 24개월 전력판매량을 예측한다. 전력판매량과 복잡하게 연관된 외부 요인들을 반영하기 위해 XGBoost 기반의 예측 모형은 다양한 데이터를 독립변수로, 전력판매량을 종속변수로 설정한다. 이렇게 선정된 입력데이터는 최대-최소 정규화 방법을 통해 처리된다. 예측 모형의 입력 데이터는 학습을 위한 데이터와 학습된 모형을 통해 전력판매량을 예측하는 데 사용되는 데이터로 나뉘어진다. XGBoost 모형의 입력 데이터는 월 변수, 월별 GDP, 월 평균기온, MCDD, MHDD 그리고 월별 특수일의 개수이며, 출력 데이터는 월별 전력판매량이다. XGBoost 기반의 예측 모형을 통해 계산된 출력값과 실제 목표값을 비교하여 예측 모형의 파라미터를 추정한다. 이 과정에서는 경사하강법(Gradient Descent)을 사용하여 예측 모형의 파라미터를 업데이트하고, 목표함수인 평균 제곱 오차(MSE)를 최소화하는 파라미터 값을 추정한다. 전력판매량은 최근 데이터에 크게 영향을 받는 특성이 있으므로, 이를 반영하기 위해 모형 학습 시에는 12개월 단위로 최근 데이터에 더 큰 가중치를 부여하여 최근 트렌드를 반영하도록 한다. 한편, XGBoost 모델 구축 과정에서 하이퍼 파라미터 선택은 모델 성능에 결정적 역할을 하므로 격자탐색 방법을 이용하여 max_depth, min_child_weight, subsample, n_estimators 등 주요 하이퍼 파라미터의 조합을 체계적으로 탐색하여 선정한다.

LSTM-FC 모형과 XGBoost 모형의 학습 데이터와 예측 데이터의 비교를 표 4에 제시한다. 각 모형은 예측 시작 연도로부터 6년 전까지의 데이터를 이용하여 학습하여 2년을 예측한다.

표 4 LSTM-FC 모형과 XGBoost 모형의 학습 데이터와 예측 데이터의 비교

Table 4 Comparison of training data and prediction data of LSTM-FC model and XGBoost model

../../Resources/kiee/KIEE.2024.73.5.766/tb4.png

3.3 앙상블 예측 모형

앙상블 예측 모형은 다수의 예측 모델을 결합하여 보다 정확한 예측을 수행하는 방법이다. 본 논문에서는 LSTM 모델과 XGBoost 모델을 생성하고 각 모델의 예측 결과를 투표로 결정하여, 가장 많은 표를 얻은 결과를 최종 예측값으로 선택하는 하드 보팅(Voting) 기반의 앙상블 방법을 적용한다.

(6)
$y_{ensemb\le}=w_{lstm}\times y_{lstm}+ w_{xgboost}\times y_{xgboost}$

여기서, $y_{ensemb\le}$는 앙상블 모형을 이용해 예측한 월별 전력판매량, $y_{lstm}$는 LSTM 모형을 이용해 예측한 월별 전력판매량, $y_{xgboost}$는 XGBoost 모형을 이용해 예측한 월별 전력판매량, $w_{lstm}$, $w_{xgboost}$는 각각 $\bmod el_{lstm}$, $\bmod el_{xgboost}$의 가중치를 의미한다. $w_{lstm}$, $w_{xgboost}$는 월별로 예측 정확도가 높은 모델에 가중치를 부여하며, 각 모델의 예측시점 이전 5년 동안의 월별 예측결과를 비교하여 동일 월에 3회 이상 높게 예측한 모델에 가중치 1을 부여하는 방식이다.

4. 사례연구

정확한 월별 전력판매량 예측을 위해 제안된 LSTM-XGBoost 앙상블 모형을 이용하여 2015년부터 2019년을 사례기간으로 24개월 전력판매량을 예측한다. 제안한 모형을 학습하고 예측하기 위해 입력데이터로는 월별 GDP, 월별 평균기온, MCDD, MHDD 실적값과 월 변수, 월별 특수일의 개수을 이용하였다. 전력판매량 예측 오차 계산을 위해서 식 (7)의 절대평균 백분율 오차율(MAPE, Mean Absolute Percentage Error)을 이용한다.

(7)
$MAPE(\%)=\left |\dfrac{Y^{forecast}-Y^{Actual}}{Y^{Actual}}\right |\times 100$

여기서, $Y^{Actual}$는 월별 전력판매량의 실적값, $Y^{forecast}$는 월별 전력판매량의 예측값을 의미한다.

심층신경망 모델과 XGBoost 모형의 성능 최적화를 위해 격자탐색 방법을 이용하여 하이퍼 파라미터를 선정한다. 표 5에서 제시한 하이퍼 파라미터의 범위 내에서 실험을 수행하여 최적의 값을 결정하였으며, 각 예측 모형의 주요 하이퍼 파라미터의 값은 동일한 표에서 제시한다.

표 5 각 예측 모형의 주요 하이퍼 파라미터

Table 5 Main hyper parameters of each prediction model

모형

하이퍼 파라미터

범위

최적값

LSTM

-FC

Sequence length

{3, 4, 5, 6}

5

Batch size

{26, 28, 30, 32, 34}

32

Learning rate

{0.001, 0.01 0.1}

0.01

Epoch

{1000, 2000, 3000}

1000

XGBoost

Colsample_bytree

{0.5, 0.7, 0.9, 1}

1

Max_depth

{1, 3, 5, 7}

1

min_child_weight

{1, 3, 5, 7}

1

n_estimators

{100, 200, 300, 400}

200

subsample

{0.15, 0.2 0.25, 0.3}

0.25

전력판매량 예측 모형의 성능을 비교하기 위하여 다중회귀모형(Multiple Linear Regression, MLR)을 이용한다. 종속변수는 전력판매량이며, 독립변수는 월별 GDP, 월별 평균기온, 월 변수를 기본으로 하고 MCDD, MHDD를 추가로 이용한 모델인 식 (8)과 참고문헌 [14]에서 제시한 환산평일수를 추가 변수로 이용한 모델인 식 (9)를 비교한다. 환산평일수는 특수일에 평균적으로 발생한 전력량을 평일에 평균적으로 발생한 전력량의 비율로 산정한 값이다.

(8)
$MLR 1 : \begin{align*} y_{m}=\beta_{0}+\beta_{1}x_{GDP,\: m}+\beta_{2}x_{temp,\: m}+\beta_{3}x_{month,\: m}\\ +\beta_{4}x_{MCDD,\: m}+\beta_{5}x_{MHDD,\: m}+\epsilon_{m} \end{align*}$
(9)
$MLR 2 : \begin{align*} y_{m}=\beta_{0}+\beta_{1}x_{GDP,\: m}+\beta_{2}x_{temp,\: m}+\beta_{3}x_{month,\: m}\\ +\beta_{4}x_{day,\: m}+\epsilon_{m} \end{align*}$

여기서, $y_{m}$는 월간 전력판매량, $x_{GDP,\: m}$는 월간 GDP, $x_{temp,\: m}$는 월 평균기온, $x_{month,\: m}$는 월 변수, $x_{MCDD,\: m}$는 월별 CDD, $x_{HDD,\: m}$는 월별 HDD, $x_{day,\: m}$는 월별 환산평일수, $\epsilon_{m}$는 오차항, $\beta_{0}$은 상수항, $\beta_{1}$, $\beta_{2}$, $\beta_{3}$, $\beta_{4}$, $\beta_{5}$는 회귀계수이다. 전력판매량 예측 모형의 성능 비교를 표 6에 제시한다.

표 6 전력판매량 예측 모형의 성능 비교

Table 6 Performance comparison of electric power sales forecasting methods

예측대상

MLR 1

MLR 2

LSTM-FC

XGBoost

Ensemble

2015년∼

2016년

3.19%

3.87%

1.24%

2.59%

1.44%

2016년∼

2017년

2.43%

5.43%

2.17%

2.59%

1.99%

2017년∼

2018년

1.90%

2.50%

2.34%

2.94%

2.34%

2018년∼

2019년

2.29%

2.35%

2.01%

1.71%

1.72%

평균오차

2.45%

3.54%

1.94%

2.45%

1.87%

표준편차

0.47%

1.24%

0.42%

0.45%

0.33%

2015년부터 2019년까지를 예측대상 기간으로 각 예측 모형의 절대 평균 백분율 오차를 비교하였다. 단일 기법을 이용한 모형 중에서는 LSTM 모델이 평균오차가 1.94%이며 표준편차가 0.42%로 가장 뛰어난 성능을 보였으며, XGBoost 모델은 평균오차가 2.45%이며 표준편차가 0.45%로 MLR 1, MLR 2보다 좋은 예측성능을 보였다. LSTM 모델과 XGBoost 모델을 결합한 앙상블 모델은 각 모델의 장점을 활용하고 약점을 보완하여 평균오차가 1.87%로 가장 정확한 예측력을 보여주었며, 평균오차의 표준편차도 0.33%로 단일 기법을 이용한 모형보다 안정적으로 예측하는 것을 확인하였다.

5. 결 론

본 논문에서는 LSTM-XGBoost 앙상블 모델을 이용한 중장기 전력판매량 예측 알고리즘을 제안하였다. 전력판매량에 영향을 미치는 요소를 분석하여 전력판매량과 상관관계가 높은 데이터인 월별 GDP, 월 평균기온, MCDD, MHDD, 특수일의 개수를 모델 학습에 활용하였으며, LSTM 기반 모형과 XGBoost 기반 모형을 구성하고 보팅을 이용하여 구성한 앙상블 모델로 24개월 전력판매량 예측을 수행하였다. 사례연구에서는 다중회귀모형, LSTM 모델, XGBoost 모델, 제안된 LSTM-XGBoost 앙상블 모형을 이용해 2015년부터 2019년의 월별 전력판매량을 예측하였다. 예측결과, 제안된 LSTM-XGBoost 앙상블 모델은 LSTM 모델, XGBoost 모델, 다중회귀모형보다 정확한 예측력을 보였다. LSTM 모델이 단일 모델 중에서는 가장 뛰어난 성능을 보였으나 앙상블 모형을 구성하였을 때 모델 간 상호보완을 통해 예측 정확도가 더욱 개선되는 것을 확인하였다. 본 논문에서 제안된 전력판매량 예측 알고리즘은 국가, 발전사업자, 판매사업자 등 다양한 관점에서 활용될 수 있을 것으로 기대된다. 향후 에너지산업 구조 변화, 요금체계 변화, 사회적 이슈 등의 영향을 전력판매량 예측 알고리즘에 반영한다면 예측 정확도를 더욱 개선시킬 수 있을 것으로 예상한다.

References

1 
D. Hadjout, J.F. Torres, A. Troncoso, A. Sebaa, F. Martínez- Álvarez, “Electricity consumption forecasting based on ensemble deep learning with application to the Algerian market,” Energy, vol. 243, Dec. 2021.DOI
2 
T. Tang, W. Jiang, H. Zhang, J. Nie, Z. Xiong, X. Wu and W. Feng, “GM(1,1) based improved seasonal index model for monthly electricity consumption forecasting,” Energy, vol. 252, Apr. 2022.DOI
3 
D. Hadjout, A. Sebaa, J.F. Torres and F. Martínez-Álvarez, “Electricity consumption forecasting with outliers handling based on clustering and deep learning with application to the Algerian market,” Expert Systems With Applications, vol. 227, Apr. 2023.DOI
4 
P. C. Albuquerque, D. O. Cajueiro and Marina D.C. Rossi, “Machine learning models for forecasting power electricity consumption using a high dimensional dataset,” Expert Systems With Applications, vol. 187, Sep. 2021.DOI
5 
G. Dudek and P. Pełka, “Pattern similarity-based machine learning methods for mid-term load forecasting: A comparative study,” Applied Soft Computing, vol. 104, Feb. 2021.DOI
6 
F. Silva, K. Costa, P. Rodrigues, R. Salas and J. López- Gonzales, “Statistical and Artificial Neural Networks Models for Electricity Consumption Forecasting in the Brazilian Industrial Sector,” Energies, vol. 15, no. 2, Jan. 2022.DOI
7 
T. Gao, D. Niu, Z. Ji and L. Sun, “Mid-term electricity demand forecasting using improved variational mode decomposition and extreme learning machine optimized by sparrow search algorithm,” Energy, vol. 261, Aug. 2022.DOI
8 
Y. Wang, Z. Fu, F. Wang, K. Li , Z. Li, Z. Zhen, P. Dehghanian and M. Fotuhi-Firuzabad, “Adaptive Optimal Greedy Clustering Based Monthly Electricity Consumption Forecasting Method,” IEEE Transaction on Industry Applications, vol. 58, no. 6, pp. 7881-7891, Nov. 2022.DOI
9 
H. Guo, Q. Chen, Q. Xia, C. Kang and X. Zhang, “A monthly electricity consumption forecasting method based on vector error correction model and self-adaptive screening method,” Electrical Power and Energy Systems, vol. 95, pp.427-438, Sep. 2017.DOI
10 
Z. Shao, S. Yang and F. Gao, “Density prediction and dimensionality reduction of mid-term electricity demand in China: A new semiparametric-based additive model,” Energy Conversion and Management, vol. 87, pp. 439-454, Jun. 2014.DOI
11 
D. Niu, Z. Ji, W. Li, X. Xu and D. Liu, “Research and application of a hybrid model for mid-term power demand forecasting based on secondary decomposition and interval optimization,” Energy, vol. 234, Jun. 2021.DOI
12 
Ministry of Trade, Industry and Energy, “The 10th basic plan for long-term electricity supply and demand,” Jan. 2023.URL
13 
Y. Son, “Prediction of electricity sales by time series modelling,” The Korean Journal of Applied Statistics, vol. 27, no. 3, pp. 419-430, May. 2014.DOI
14 
K. Song, R. Park, K. Kim, J. Won, “Electrical Energy Consumption Forecasting Algorithm Using Multiple Regression Method,” Journal of KIIEE, vol. 31, no. 11, pp. 69-74, Sep. 2017.URL
15 
Y. Choi, “Forecasting long-term power sales in Jeju using functional coefficient model,” Korean Energy Economic Review, vol. 18, no. 2, pp. 1-27, Sep. 2019.URL
16 
S. Woo, “Short and midterm forecasting method using LSTM model for power sales in Korea power system,” Master’s Thesis, Soongsil University, 2021.URL
17 
B. Kwon and K. Song, “An ensemble forecasting method of winter and summer peak load using deep neural networks,” The Trans. of KIEE, vol. 69, no. 6, pp. 765-771, May. 2020.URL
18 
B. Kwon, “Short-term load forecasting algorithm blending of statistical method and machine learning,” Doctoral dissertation, Soongsil University, 2022.URL

저자소개

김경환(Kyeong-Hwan Kim)
../../Resources/kiee/KIEE.2024.73.5.766/au1.png

He received his B.S. and M.S. degree in Electrical Engineering from Soongsil University, Seoul, Korea, in 2016 and 2018. Currently, he is pursuing Ph.D. degree in Electrical Engineering at Soongsil University, Seoul, Korea. His research interests include load forecasting, power system operation and power system economics.

조승민(Seung-Min Cho)
../../Resources/kiee/KIEE.2024.73.5.766/au2.png

She received her B.S. degree in Electrical Engineering from Soongsil University, Seoul, Korea, in 2024. Currently, she is pursuing M.S. degree in Electrical Engineering at Soongsil University, Seoul, Korea.

송경빈(Kyung-Bin Song)
../../Resources/kiee/KIEE.2024.73.5.766/au3.png

He received his B.S. and M.S. degrees in Electrical Engineering from Yonsei University, Seoul, Korea, in 1986 and 1988, respectively. He received his Ph.D. degree in Electrical Engineering from Texas A&M University, College Station, Texas in 1995. He is currently a full Professor in Electrical Engineering at Soongsil University, Seoul, Korea. His research interests include load forecasting, load modeling, power system operation and power system economics.