오병찬
(Byeong-Chan Oh)
1iD
김성열
(Sung-Yul Kim)
†iD
-
(
Dept. of Electronic and Electrical Engineering, Keimyung University, Korea.
)
Copyright © The Korean Institute of Electrical Engineers(KIEE)
Key words
Load forecasting, Machine Learning, Support Vector Regression
1. 서론
계통한계가격 결정 및 발전계획 수립을 통한 전력계통의 안정적인 운영을 위해서는 정확한 전력수요 예측이 필요하며 이에 단기 전력수요 예측 중요성이 대두되고
있다. 또한 최근 폭염과 같은 이상기후에 따른 냉·난방 부하 증가로 전력수요 예측 오차가 증가하고 있다. 예측 오차는 전력 추가 구매 비용 증가 혹은
에너지 낭비에 따른 경제적 손실을 발생시킬 수 있으며 계통 안정도 저하 등에 의한 전력 수급 신뢰성에 악영향을 끼친다(1). 또한 기상 환경에 영향을 많이 받는 신재생 에너지 보급 증가로 인해 전력수요 예측 오차가 증가하고 있으며 이에 정확한 수요예측을 위한 연구가 활발히
진행되고 있다(2).
전력수요 예측 기법은 시계열 데이터를 기반으로 하는 자기회귀 이동평균(ARMA)모형, 지수평활화, LR(Linear Regression), 퍼지 회귀(Fuzzy
Regression) 등이 있으며 최근에는 머신러닝, 인공신경망 등 인공지능 기반으로 전력수요예측 분야에서 활발히 연구되고 있으며 많은 논문에서 좋은
예측 성능을 보여주고 있다(3). 이에 본 논문에서는 기상요소에 대한 전력수요 변동성을 고려하여 예측 성능을 높이기 위해 온도, 습도, 풍속, 불쾌지수, 체감온도 등, 기상청 공공
데이터를 활용하여 서포트 벡터 회귀(Support Vector Regression, SVR) 기반의 전력수요 예측기법을 제안한다. MAPE 오차 함수와
MAE 오차함수를 통해 제안한 알고리즘과 지수평활 기법을 비교하며 예측에 필요한 변수들은 피어슨 상관분석을 통해 설정하고자 한다.
본 논문은 다음과 같이 구성된다. 2장에서는 서포트 벡터회귀의 이론과 비선형 예측을 위한 커널함수를 설명하며 3장에서는 데이터 예측을 위한 전처리
과정과 제안하는 알고리즘의 성능을 평가한다. 4장에서는 알고리즘 결과와 함께 향후 연구 방향을 통해 결론을 맺는다.
2. Support Vector Regression(SVR)
기계학습 기법인 SVR은 분류 알고리즘의 하나인 SVM (Support Vector Machine)을 일반화한 기법으로, 서포트 벡터간의 거리 내에
최대한 많은 데이터를 포함하게 하는 최적의 초평면을 찾아 데이터를 예측하는 기법이며 수요예측 뿐만 아니라 기상, 금융 등 다양한 예측분야에서 활용되고
있다(4). SVR 모델을 학습시키기 위한 기본 모델은 식(2)와 같다.
식(1)은 SVR 학습을 위한 데이터 셋을 의미하며 주어진 모든 입력 $x_{i}\in R^{m}$에 대해 실제 목표 변수인 $y_{i}\in R$ 가장
잘 예측하는 함수 $f(x)$를 추정하는 것을 목적으로 한다. 또한 외란 및 과적합 방지를 위한 소프트마진(Soft Margin) 형식의 SVR을
구현하기 위해 오류를 허용하는 여유변수인 $\xi$, $\xi^{*}$를 추가하여 학습시키며, 실측 데이터와 예측데이터 편차가 $\varepsilon$
이내에 들어오면서 w의 노름 함수가 최소가 되게끔 식(3)과 같은 목적함수를 최적화한다. 이때 SVR학습에 있어 상수 $C$가 클 경우 학습데이터의 오차를 가능한 작게 학습하며 반대로 $C
$가 작을 경우 w의 노름 함수를 작게끔 학습한다.
위 목적함수를 최적화 하는 식은 라그랑주 승수법(Lagrange multiplier)을 통해 쌍대(dual)문제로 간단히 문제를 해결할 수 있으며
라그랑주 승수를 이용하여 함수를 식(4)와 같이 나타낼 수 있다.
여기서 $L$은 라그랑주 함수를 의미하며 $(\alpha_{i},\:\alpha^{*}_{i},\:\eta_{i},\:\eta_{i}^{*})$은
라그랑주 승수를 의미한다. 이때 $L$에 대하여 각 변수의 미분 값은 다음과 같이 나타낼 수 있다.
식(5) ~ (8)에서 라그랑주 함수 $L$을 변수 $(b,\: w,\:\xi_{i},\:\xi^{*}_{i})$에 대한 미분을 통해 얻은 값을 토대로 SVR의 목적함수는
식(9)와 같다.
따라서 라그랑주 함수 $L$은 $\alpha_{i}$, $\alpha^{*}_{i}$의 식으로 나타낼 수 있으며 식(5)를 통해 구해진 w값을 활용하여 최종 예측 모델을 구할 수 있다.
SVR은 기본적으로 선형예측 기법이며 그림 1과 같이 비선형적인 데이터를 예측하기 위해 주어진 데이터를 고차원 특징 공간으로 사상시키는 작업이 필요하다.
Fig. 1. Implementation model of ε-SVR andkernal function
본 연구에서는 식(11)과 같은 RBF(Raidal Basis Function)커널을 사용하여 비선형 회귀분석을 진행하였다.
이때, $k(x_{1},\:x_{2})$은 RBF 커널함수, $x_{i}$,$x_{j}$ 는 전력수요 예측변수, $\gamma$는 RBF 커널 폭을
조절하는 변수이며 식(12)과 같이 SVR 예측 함수을 구현하였다(5)(6).
3. 전력수요 예측 요소 선정
본 절에서는 전력수요 예측에 필요한 변수 선정과 데이터 전 처리과정을 설명한다. SVR 학습을 통한 전력수요 예측에 있어 적절한 학습 데이터 변수
선정은 예측 오차를 감소시키는 중요한 지표이다. 또한 단기적으로 기상요소는 전력수요에 매우 밀접한 관계를 갖는다. 특히 온도에 따라 냉·난방 부하사용에
영향을 미치기 때문에 온도는 전력수요 예측 정확도 향상에 매우 중요한 요소이므로 본 논문에서는 온도-전력수요와의 관계를 위주로 단기 전력수요 예측을
진행한다.
여기서 기상요소는 같은 시간대에서 지역별 차이를 보여주며 또한 지역마다 인구수에 따른 전력수요가 다르기 때문에 정확한 수요예측을 위해서는 대표 기상
요소를 선정해야한다. 참고문헌 (7)을 토대로 지역별 기상요소 가중치를 표 1과 같이 나타내었다.
Table 1. Weights for temperature of mapped regions
지역
|
서울
|
인천
|
수원
|
원주
|
가중치[%]
|
43.76
|
5.58
|
4.48
|
3.06
|
지역
|
대전
|
대구
|
광주
|
부산
|
가중치[%]
|
6.33
|
8.38
|
6.47
|
21.94
|
또한 기온뿐만 아니라 기상요소에 의한 전력수요 변화를 고려하기 위해 기상청에서 제공하는 데이터인 풍속, 습도, 강수량, 불쾌지수, 체감온도 등을 상관
분석을 통해 전력수요 예측 입력 변수로 선정한다. 이때 불쾌지수 및 체감온도는 기온, 풍속, 습도를 이용하여 다음과 같이 산출할 수 있다.
여기서, $DI$는 불쾌지수, $T$는 온도(℃), $RH$는 상대습도(%)를 의미하며 $ST$는 체감온도, $V$는 풍속($km/h$)를 의미한다.
따라서 위 식을 통해 산출한 불쾌지수, 체감온도와 기상청에서 제공하는 기상요소를 토대로 피어슨 상관분석을 이용하여 상관관계를 분석한다.
여기서 $\rho$는 피어슨 상관계수를 의미하며, a는 기상요소, b는 전력수요, $N$은 a,b 두 개의 독립적인 데이터 개수를 의미한다. 이때
$\rho$는 절대 값이 0 ~ 1 사이 값을 가지며 1 에 가까울수록 두 변수간의 상관성이 높은 것을 의미한다. 상관계수에 따른 기상요소 선정에
앞서 우리나라 전력수요는 계절에 따라 온도에 따른 전력수요 영향이 다르다. 때문에 정확한 예측을 위해 겨울-봄, 봄-여름, 여름-가을, 가을-겨울에
해당하는 계절 변화와 맞게 각 구간별 상관분석을 진행하며(8)(9), 2016 ~ 2018년 기상청 과거데이터를 기반으로 각 구간별 기상요소간의 상관관계 분석 결과는 아래 표 2와 같다.
Table 2. The correlation coefficient between power demand and weather elements
|
1 구간
|
2 구간
|
3 구간
|
4 구간
|
기온
|
-0.72
|
0.63
|
0.48
|
-0.81
|
습도
|
-0.23
|
0.29
|
0.387
|
-0.42
|
풍속
|
-0.21
|
-0.27
|
-0.09
|
0.1
|
강수량
|
-0.15
|
0.21
|
0.01
|
-0.01
|
체감온도
|
-0.85
|
0.66
|
0.23
|
-0.84
|
불쾌지수
|
-0.81
|
0.79
|
0.36
|
-0.82
|
표 2의 값은 각 변수들을 독립변수로 가정하여 전력수요와의 상관관계를 분석한 결과를 나타낸다. 전 구간에 대해서 기온은 높은 상관관계를 보여주고 있으며
3구간을 제외한 모든 구간에서 체감온도와 불쾌지수가 높은 상관관계를 보여주고 있다. 본 논문에서는 각 구간별로 기상요소의 상관계수 절대 값이 0.45이상일
경우 전력수요와의 상관관계가 높다고 판단하여 전력수요 예측에 필요한 변수로 선정한다.
학습 데이터 변수 선정 과정에 있어 전력수요는 계절뿐만 아니라 요일 및 시간에 대해서도 일정한 패턴을 보여주고 있다. (10)에서는 시간별 데이터를 변수로 선정할 경우, 24시간에 대한 예측 성능이 더 좋은 결과를 보여주고 있다. 따라서 전력수요의 패턴 주기성을 고려하기
위해 요일 및 시간별 데이터도 학습 데이터의 변수로 선정하여 연구를 진행하였다.
여기서 학습 시간 개선 및 예측 정확도 향상을 위해 식(16)과 같은 0 ~ 1사이 데이터 값을 가지는 정규화 작업을 진행하였다.
여기서 $PU_{i}^{y}$는 y년의 i번째 데이터에 대한 정규화 값을 의미하며 $x_{i}^{y}$는 y년 입력변수의 i번째 데이터, $\max(x_{i}^{y})\vert
_{\forall i}$, $\min(x_{i}^{y})\vert _{\forall i}$은 y년의 입력변수에서 모든 i개의 데이터 중 최댓값 및
최솟값을 의미한다.
이때 입력변수가 다른 연도일 경우, 예를 들어 2017, 2018년도 데이터를 이용하여 SVR을 학습시킬 경우 동일한 계절, 기상요소에 따른 전력수요
값은 다소 큰 차이를 보여줄 수 있다. 이는 연간 전력수요 증가율에 따른 오차로 실제 예측성능을 저하시킬 수 있다. 따라서 본 논문에서는 연도별 전력수요
증가율을 고려하기 위해 정규화 작업 또한 연도별로 진행하였다.
4. 사례연구
본 논문에서 제안한 기법의 성능을 검증하기 위한 실험 환경은Windows10(64bit), CPU i5-4570 3.2GHz(4CPUs), 8GB
RAM PC에서 수행하였으며, 파이썬(Python) 3.6기반을 이용하였다.
본 논문에서는 SVR을 이용하여 2017년 ~ 2018년 겨울철(11월 ~ 3월) 기상청 데이터 및 전력수요 데이터를 이용하여 평일의 전력수요예측을
수행하였다. 3장에서 주어진 지역별 가중치를 이용하여 대표 온도 및 기상요소를 선정하였으며 전력수요예측을 위한 입력변수는 표 3과 같다.
Table 3. Input data for power demand forecasting
Column 1
|
Column 2
|
Column 3
|
연도
|
날짜
|
시간
|
Column 4
|
Column 5
|
기상요소
|
과거 전력수요량
|
SVR 모델 성능 개선를 위해 하이퍼파라미터(Hyper parameter)값인 $C$와 $\gamma$ 을 조정하면서 k겹 교차검증을 실시하였다.
이때 $C$ : 0.01 ~ 1000, $\gamma$ : 0.01 ~ 100 범위의 모든 경우를 통해 SVR 모델을 평가하고 최적의 $C$, $\gamma$
값을 선정하며 이때 $C$ : 0.3, $\gamma$ : 7.2 로 선정하였다. 또한 제안한 예측모델 성능을 평가하기 위해 지수평활 기법과 비교하여
예측 성능을 평가하였다.
Table 4. Prediction error result of SVR and exponential smoothing
|
MAPE[%]
|
RMSE
|
SVR
|
3.8097
|
0.0622
|
지수평활기법
|
5.6532
|
0.0727
|
마지막으로 본 논문에서는 제안한 기법의 성능을 평가를 위한 오차함수는 MAPE(Mean Absolute Percentage Error) 및 RMSE(Root
Mean Square Error)을 사용하였다.
여기서 N은 테스트데이터(Test Data)개수, $Load^{real}_{i}$은 i번째 실제 전력수요, $Load_{i}^{predict}$은
i번째 전력수요 예측 값을 의미한다. 제안한 알고리즘의 MAPE 및 RMSE 값은 3.8097%, 0.0622로, 지수평활법과 비교한 결과 MAPE는
1.843%, RMSE는 0.0105 만큼 개선되었다. 따라서 사례연구에서 SVR 기반 전력수요 예측모델이 성능이 우수함을 확인할 수 있다.
Fig. 2. Power demand forecasting using SVR and exponential smoothing
5. 결론 및 향후연구
본 논문에서는 기계학습 기법인 SVR의 단기 전력수요 예측 성능의 우수함을 입증하기 위해 시계열 기법인 지수평활기법 기반의 예측 모델로 비교분석하였다.
두 모델의 입력 데이터는 공공데이터를 활용했고 교차검증을 통한 적절한 파라미터 값($C,\:\gamma$)을 이용해 SVR 기반의 예측 모델과 지수평활기법
기반의 예측 모델을 구현했다. 사례연구 결과로부터 MAPE 값의 경우 지수평활기법 기반의 예측 모델은 오차가 5%가 넘는 반면 SVR 기반의 모델은
4% 미만이었다. 또 다른 평가지표인 RMSE 값의 경우에서도 SVR 기반의 예측이 보다 정확함을 알 수 있었다. 따라서 SVR 기반의 전력수요 예측
알고리즘이 좋은 성능을 보여주는 것을 확인할 수 있다.
3장에서 전력수요와 강수량간의 상관관계는 낮게 측정되었지만 앞으로 신재생 에너지 보급 증가로 인해 기상요소는 전력수요에 더욱 큰 영향을 끼칠 것이며
특히 강수량, 운량등 상관관계가 낮은 변수들도 중요한 요소가 될 것이다. 따라서 향후 다양한 변수들을 고려하고 많은 훈련용 데이터(Training
Data)를 확보 및 딥러닝 기반의 예측을 통해 더욱 높은 정확도의 예측 분석이 가능할 것으로 예상된다.
References
KPX, Feb. 2015., Development of Real-Time Load Forecasting Technique and A Study
on On-Line Load Forecasting Scheme
Kyong-Hwan Kim, Se-Won Jo, Rae-Jun Park, Kyuong-Bin Song, Jul. 2017, The Effect of
Small Photovoltaic Power Generations and Illumination Intensity in Short-Term Electric
Load Fore- casting, The Transactions of the Korean Institute of Electrical Engineers,
pp. 461-462
Mee Kyeong Kim, Chul Eui Hong, Jan. 2016, The Artificial Neural Network based Electric
Power Demand Forecast using a Season and Weather Informations, Journal of the Institute
of Electronics and Information Engineers, Vol. 53, No. 1, pp. 71-78
Ervin Ceperic, Vladimir Ceperic, Adrijan Baric, Nov. 2013, A Strategy for Short-Term
Load Forecasting by Support Vector Regression Machines, IEEE Transactions on Power
Systems, Vol. 28
B. J. Chen, M. W. Chang, C. J. Lin, Nov. 2004, Load forecasting using support vector
machines: A study on EUNITE competi- tion 2001, IEEE Transactions Power System, Vol.
19, No. 4, pp. 1821-1830
B. E. Turkay, D. Demren, 2011, Electrical load forecasting using support vector machines,
(ELECO) In 7th international conference on Electrical and Electronics Engineering,
pp. 49-53
Jong-Hun Lim, Si-Yeon Kim, Jeong-Do Park, Kyung-Bin Song, Jun. 2013, Representative
Temperature Assessment for Improvement of Short-Term Load Forecasting Accuracy, Journal
of the Korean Institute of Illuminating and Electrical Installation Engineer, Vol.
27, No. 6, pp. 39-43
Korea Power Exchange, 2015, Development of Real-Time Load Forecasting Technique and
A Study on On-Line Load Fore- casting Scheme
Korea Power Exchange, 2011, A Study on Short-term Load Fore- casting Technique and
its Application
Kyeong-Hwan Kim, Rae-Jun Park, Se-Won Jo, Kyung-Bin Song, Dec 2017, 24-Hour Load Forecasting
Algorithm Using Artificial Neural Network in Summer Weekdays, Journal of the Korean
Institute of Illuminating and Electrical Installation Engineers, Vol. 31, No. 12,
pp. 113-119
저자소개
He received the B.S. degree in Electrical energy engineering from Keimyung university,
Korea, in 2018. He is currently working toward his M.S. in Electronic and electrical
Engineering at Keimyung university.
E-mail :
obchan08@naver.com
He received the B.S. and M.S degrees from Hanyang university, Korea, in 2007 and 2018
respectively. He received the ph.D. degree at Hanyang university. Korea, in 2012.
He worked as a researcher in Georgia Institute of Technology, PSCAL from 2012 to 2013.
He is currently a professor in Keimyung university
E-mail :
energy@kmu.ac.kr