서동혁
(Dong-Hyeok Seo)
1iD
위영민
(Young-Min Wi)
2†iD
-
(Dept. of Energy Grid, Sangmyung University, Republic of Korea. E-mail : 202531024@sangmyung.kr)
-
(Dept. of Electrical Engineering, Sangmyung University, Republic of Korea. E-mail :
youngmin@smu.ac.kr)
Copyright © The Korean Institute of Electrical Engineers
Key Words
Real-Time Forecasting, Electricity Demand, Bi-LSTM, Training Strategy
1. 서 론
24년 3월부터 우리나라에서는 제주 지역을 대상으로 하루 전 시장, 실시간 시장, 예비력 시장으로 구성된 새로운 전력시장이 시범 운영되기 시작하였다.
하루 전 시장은 사전 입찰을 통해 다음 날의 정산 가격을 결정하며, 예비력 시장은 계통 안정성을 위한 추가 자원을 조달한다. 실시간 시장은 입찰이
아닌 계통 운영자의 수요예측에 기반하여 운영되며, 15분 단위로 예측 시점으로부터 75분 후의 전력수요를 산출하는 것이 특징이다. 이는 우리나라에서
처음 도입된 제도로, 그동안 주목받지 못했던 실시간 전력수요 예측의 중요성을 제도적으로 강조하게 된 계기라 할 수 있다. 향후 실시간 전력시장은 제주를
넘어 육지 계통으로 확대될 예정이므로, 실시간 전력수요 예측 모형의 개발은 시범 사업 차원을 넘어 국내 전체 전력시장 운영을 위한 필수 과제라 할
수 있다 [1].
이러한 제도적 변화와 더불어, 최근 기온 변동성 확대와 재생에너지 보급 확산으로 인해 전력수요 패턴의 변화가 심화하면서 예측의 어려움은 더 커지고
있다. 2024년 에너지수급동향에 따르면 신재생에너지 발전 비중이 처음으로 10%를 상회하였다 [2]. 따라서 전력 공급의 변동성과 간헐성을 보완하고, 새롭게 도입된 실시간 전력시장 환경에 대응하기 위해서는 정확한 실시간 전력수요 예측 연구가 필수적으로
요구된다.
국내외에서는 실시간 전력 수요 예측을 위해 다양한 기법이 제안되어 왔다. 초기 연구에서는 칼만필터 기반 예측 기법이 활용되었으며, 칼만필터는 잡음에
강하고 실시간 데이터 처리가 가능하다는 장점을 바탕으로 15분 단위로 최대 6시간 후의 전력 수요를 예측하였다 [3]. 해당 연구는 지수평활법 대비 높은 예측 정확도를 보였으나, 비선형 패턴이나 장기 의존성(Long-term dependency)을 충분히 반영하는
데에는 한계가 있었다.
이후 머신러닝 기반 기법이 도입되면서, XGBoost 알고리즘을 활용한 연구가 수행되었다 [4,
5,
6]. XGBoost는 빠른 학습 속도와 복잡한 비선형 패턴 학습에 강점을 보였으며, 칼만필터 대비 향상된 예측 성능을 입증하였다. 그러나 입력 변수
선택과 하이퍼파라미터 최적화에 따라 성능 편차가 크게 나타나는 한계가 있었다.
한편, 순환신경망(RNN) 계열 모델의 발전과 함께 LSTM 기반 예측 연구도 활발히 진행되었다 [7,
8]. LSTM 모델은 시계열 데이터에서 장기 의존성과 복잡한 패턴을 효과적으로 학습할 수 있어 다양한 분야에서 우수한 예측 성능을 보여 왔으며, 대규모·복잡
데이터에서도 안정적인 성능을 유지하고 기존 RNN 대비 장기 정보를 손실하지 않는 구조적 이점을 가진다. 반면, 모델 구조가 복잡해 하이퍼파라미터
최적화와 학습에 많은 시간과 연산 자원이 필요하고, 데이터가 부족한 경우 과적합이 발생하기 쉽다는 단점이 있다.
GRU는 LSTM과 유사한 구조를 가지면서도 파라미터 수가 적어 학습 속도가 빠르다는 장점이 있다 [9,
10,
11]. 해당 연구에서는 15분 단위로 향후 2시간 30분까지 예측을 수행하며, 실시간 예측 적용을 위한 입력 변수 구성을 탐색하였다. 다만, LSTM
대비 장기 시계열 패턴을 충분히 반영하기 어려운 제약이 존재한다.
또한, 군집화와 딥러닝을 결합한 Hybrid 기법도 시도되었다. Hybrid DTW-KMSOM 군집화와 LSTM을 결합한 연구에서는 [12], 유사한 패턴을 가지는 데이터를 사전 군집화한 뒤 이를 LSTM 입력으로 활용하여 예측 성능을 향상했다. 특히 기상 데이터와 전력수요 데이터의 상관성을
고려하여, 평일·주말·특수일의 이질적인 수요 패턴까지 반영함으로써 기존 모델보다 개선된 성능을 보였다. 그러나 군집화 과정의 복잡성과 추가적인 연산
부담으로 인해 실시간 예측 적용에는 한계가 존재한다.
본 연구에서는 Bi-LSTM 기반 실시간 전력수요 예측 모델을 대상으로 학습 전략 변수(학습 기간, 윈도우 크기, 재학습 빈도)가 예측 성능에 미치는
영향을 체계적으로 분석하고, 데이터 분포 변화에 지속적으로 적응할 수 있는 학습 전략 갱신 프레임워크를 포함한다. 이를 통해 최적의 학습 전략 조합을
도출하고, 예측 정확도와 학습 시간 간의 균형점을 제시함으로써 실시간 시장 적용 가능성을 검증한다.
논문의 구성은 다음과 같다. 제2장에서는 실시간 전력시장의 도입과 전력수요의 변화를 설명한다. 제3장에서는 Bi-LSTM 모델의 구조, 데이터 전처리
과정, 입력 변수 선정 방법을 기술한다. 제4장에서는 사례연구를 통해 다양한 학습 전략 조합을 비교·분석하고, 최적 조합을 도출한다. 마지막으로 제5장에서는
연구 결과를 요약하고 향후 연구 방향을 제시한다.
2. 실시간 전력시장 도입과 전력수요 변동성 변화
우리나라 전력시장은 2024년 제주 지역에서 하루 전·실시간·예비력 시장이 시범 운영되면서 새로운 국면에 진입하였다. 특히 실시간 시장은 그림 1과 같이 계통 운영자의 15분 단위 예측을 기반으로 75분 후의 전력수요를 산출하는 구조로, 기존 하루 전 중심의 시장 체계에서는 상대적으로 간과되었던
실시간 전력수요 예측의 중요성을 제도적으로 부각한 첫 사례라 할 수 있다. 향후 실시간 시장은 제주를 넘어 전국 계통으로 확대될 예정이므로, 특정
지역에 국한되지 않고 국내 전력 시스템 전체를 대상으로 적용할 수 있는 실시간 전력수요 예측 모형 개발이 요구된다.
그림 1. 실시간 수요예측 모델 알고리즘 시간대 개요
Fig. 1. Timeline Overview of the Real-Time Demand Forecasting Algorithm
이러한 제도적 변화는 기후변화로 인한 기온 변동성 확대와 재생에너지 보급 확산이라는 기술적·환경적 요인과 맞물려 그 필요성이 더 커지고 있다. 그림 2에서 4계절 모두 2023년은 2020년에 비해 수요의 변동 폭이 증가함을 볼 수 있다. 봄철과 겨울철에는 최저 수요는 감소하고 최대수요는 증가하여
변화에 따른 발전 계획 수립이 중요해짐을 알 수 있다. 그림 3은 5분 단위 수요 변화량을 나타낸 그래프이다. 겨울을 제외한 4계절 모두 수요 변화량이 증가하기 때문에 앞으로 발전량도 민감하게 따라가야 할 것이다.
위 그래프들을 통해 재생에너지 발전의 간헐성과 변동성은 계통 운영의 불확실성을 증가시키는 것을 알 수 있다. 이에 따라 예측 정확도뿐만 아니라 학습
시간과 계산 자원의 효율성까지 고려한 실시간 예측 체계가 필요하다. 제주에서 먼저 나타난 특성은 작은 계통과 높은 재생에너지 비중에 따른 불확실성이었지만,
이는 곧 전국 계통에서도 공통으로 마주하게 될 도전 과제다.
그림 2. 2020년, 2023년 계절별 전력수요 비교
Fig. 2. Comparison of Seasonal Power Demand for 2020 and 2023
그림 3. 2020년, 2023년 계절별 5분단위 전력수요 변화량 비교
Fig. 3. Comparison of Seasonal 5-minute Power Demand Ramp Rates for 2020 and 2023
기존 LSTM이나 GRU 기반의 신경망 연구들은 주로 입력 변수 선정과 하이퍼파라미터 최적화에 집중해 왔다. 그러나 실제 실시간 시장 운영에서는 모델
구조 못지않게 학습 전략 변수(최신 데이터 패턴을 얼마나 자주 반영할지를 결정하는 재학습 빈도, 한 번에 입력되는 데이터의 시간적 범위를 의미하는
윈도우 크기, 그리고 모델이 과거 패턴을 학습하는 데이터의 총기간인 학습 기간)가 예측 성능과 계산 효율성에 직접적인 영향을 미친다. 이들 변수는
예측 정확도(MAPE, RMSE)뿐 아니라 예측 가능 시간, 시장 참여 사업자의 운영 효율성과도 밀접히 연관된다.
선행 연구들 중에서, 순환 신경망 계열 모델, 특히 양방향의 시계열적 특징을 모두 학습할 수 있는 Bi-LSTM이 복잡한 전력수요 패턴 예측에서 높은
성능을 보여왔다 [13]. 그러나 Bi-LSTM의 잠재력을 최대한 활용하기 위해서는 모델 구조뿐만 아니라, 실시간 데이터의 흐름을 반영하는 학습 전략의 최적화가 필수적이다.
따라서 본 연구는 Bi-LSTM 기반 실시간 전력수요 예측 모델을 대상으로 학습 전략 변수의 영향을 체계적으로 분석하고, 국내 실시간 전력시장 환경에서
적용할 수 있는 최적의 학습 전략 조합을 도출하는 것을 목적으로 한다. 이를 통해 단순히 모델의 정확도 향상뿐만 아니라, 국내 전력시장 전반에 적용할
수 있는 실시간 수요예측 체계 구축에 기여하고자 한다. 또한 15분 단위가 아닌 5분 단위의 전력수요 예측을 시도함으로써 전력수요와 예측값 간의 변화량을
빠르게 파악하여 대응할 수 있는 모델을 구현할 것이다.
3. 실시간 전력수요 예측 알고리즘
3.1 LSTM(Long Short-Term Memory Networks) 구조
LSTM은 기존 RNN(Recurrent Neural Networks)의 기울기 사라짐 문제(Gradient Vanishing Problem)를 해결할
수 있게 셀 상태(Cell state)와 3개의 게이트(Forget, Input, Output)를 도입하여 정보의 흐름을 효과적으로 제어한다 [14]. 특정 시점 t에서의 LSTM 연산 과정은 다음과 같다. 여기서 $x_{t}$는 현재 시점의 입력, $h_{t-1}$은 이전 시점의 은닉 상태,
$C_{t}$는 셀 상태를 의미한다. $W$와 $b$는 각 게이트의 가중치 행렬과 편향 벡터이며, $\sigma$는 시그모이드 함수, $\tanh$는
하이퍼볼릭 탄젠트 함수, $*$는 원소별 곱셈(element-wise multiplication)을 나타낸다.
수식 (1)에서 Forget Gate는 이전 시점의 정보 중 어떤 것을 잊을지 결정한다. 다음으로 수식 (2), 수식 (3)에서 Input Gate는 현재 시점의 정보 중 어떤 값을 셀 상태에 저장할지 결정한다. 수식 (4)에서 이전 셀 상태($C_{t-1}$)와 두 게이트의 결과를 결합하여 현재 시점의 셀 상태($C_{t}$)를 업데이트한다. 수식 (5), 수식 (6)에서 마지막으로, Output Gate는 업데이트된 셀 상태로부터 어떤 정보를 다음 은닉 상태($h_{t}$)로 내보낼지 결정한다. 이러한 LSTM
모델은 뛰어난 성능으로 인하여 시계열 데이터 예측 문제에 많이 활용되고 있다.
3.2 Bi-LSTM 모델 구조
이번 연구의 실시간 전력수요예측 모델로 사용된 Bi-LSTM은 입력 시퀀스를 순방향과 역방향으로 각각 처리하는 두 개의 독립적인 레이어를 사용한다
[13,
15]. 이를 통해 각 시점의 입력에 대해 과거와 미래의 문맥 정보를 모두 고려할 수 있다. 따라서 단방향 LSTM에 비해 시간적 패턴 인식 능력이 향상된다.
그림 4. Bi-LSTM 구조
Fig. 4. Bi-LSTM Structure
Bi-LSTM 모델의 구조는 그림 4와 같이, 순방향 정보를 학습하는 Forward LSTM과 역방향 정보를 학습하는 Backward LSTM 구조가 있다. 각각의 LSTM 셀에서 추출한
정보를 병합(Concatenate)하여 최종으로 출력한다.
3.3 실시간 전력수요 예측 알고리즘 순서도
본 절에서는 그림 5의 순서도를 통해, 제안하는 Bi-LSTM 기반 실시간 전력수요 예측 알고리즘의 전체적인 프레임워크를 기술한다. 본 알고리즘의 핵심은 모델의 내부
하이퍼파라미터가 아닌, 예측 성능에 영향을 미치는 학습 전략 변수(학습 기간, 윈도우 크기, 재학습 빈도)를 최적화하는 데 있다.
그림 5. 실시간 전력수요 예측 알고리즘 순서도
Fig. 5. Flowchart of the Real-Time Electricity Demand Forecasting Algorithm
이러한 접근법은 크게 세 단계로 구성된다. 첫 번째는 예측 환경의 변화에 대응하기 위해, 모델이 고정된 성능에서 머무르지 않고 지속적으로 최신 데이터
패턴에 적응할 수 있는 ‘학습 전략 재설정’ 단계이다. 두 번째는 최적의 학습 전략을 탐색하는 '학습 전략 최적화' 단계이며, 세 번째는 도출된 최적의
전략을 기반으로 실시간 예측을 수행하는 '운영 모델 구축 및 예측' 단계이다.
4. 사례연구
4.1 실험 설계
본 논문에서는 5분 단위 수요예측을 시도하였다. 실시간 수요예측에서는 15분 단위로 예측을 시도하는데, 같은 포인트의 변화량을 파악할 때, 5분 단위가
더욱 빠르게 변화량을 파악할 수 있어서 대응이 빠르다는 장점이 있다. 5분 단위 전력수요 데이터는 공공데이터 포털에서 제공하는 육지와 제주가 합쳐진
2020년부터 2023년까지 4년 치 송전단 5분 단위 전력수요 데이터를 활용하였다. 결측치는 26시간 연속된 결측치를 제외하고서 전부 선형보간을
하였다. 5분 단위 기상 데이터는 2020년부터 2023년까지의 기상청 종관기상관측자료(ASOS)를 예보 데이터가 1시간 단위로 나오는 것을 고려하여
1시간 데이터를 5분 단위로 선형보간 하여 사용하였다. 그리고 피어슨 상관관계 분석과 변수 조합별 오차율 개선 경향을 통해서 입력변수를 선정했다.
그림 6. 전력수요와 기상변수 간 상관관계 분석
Fig. 6. Correlation Analysis between Power Demand and Weather Variables
표 1. 입력 변수 별 오차율
Table 1. Error rate per input variable
|
입력 변수 종류
|
MAPE(%)
|
|
기온
|
1.37
|
|
기온, 일사
|
1.26
|
|
기온, 강수량, 일사
|
1.50
|
|
기온, 강수량, 풍속, 습도, 일사
|
1.87
|
초기 분석 단계에서 전력수요와 주요 기상 변수 간의 피어슨 상관관계를 분석한 결과, 그림 6과 같이 변수 간의 뚜렷한 선형적 관계는 나타나지 않았다. 그러나 LSTM과 같은 비선형 모델은 변수 간의 복잡하고 비선형적인 패턴을 학습하므로,
선형 관계 지표만으로 최적의 입력 변수를 판단하는 데에는 한계가 있다. 이에 본 연구에서는 실제 예측 성능에 기반하여 최적의 변수 조합을 도출하고자,
입력 변수 조합별 오차율(MAPE) 비교 실험을 수행했다. 표 1에서 볼 수 있듯이, 기온과 일사량을 입력 변수로 사용했을 때 MAPE가 1.26%로 가장 낮았으며, 강수량이나 풍속 등 다른 변수를 추가했을 때는
오히려 오차율이 증가하는 경향을 보였다. 이러한 실증적 결과에 근거하여, 본 모델의 최종 입력 변수로는 기온과 일사량을 선정했다. 선정된 변수의 결측치
처리의 경우, 기온은 선형보간법을 적용하였고, 일사량은 태양 관측이 가능한 시간대(09시~18시)는 선형보간으로, 그 외 시간은 0으로 대체하여 데이터의
현실성을 반영했다.
표 2와 같이 우분투 22.04.5 LTS 환경에서 빠른 실험을 위해 V100 GPU를 2대 연결하여 실험을 진행하였다. 표 3과 같이 하이퍼파라미터를 고정하고 사례연구를 진행하였다. Bi-LSTM은 순방향, 역방향 학습이 이루어지기 때문에 층수를 1개로 두었고 입력 변수의
갯수를 고려하여 유닛수를 정하였고 성능 대비 시간을 고려해 나머지 하이퍼파라미터를 정하였다.
LSTM 모델은 신경망 모델로 학습에 오랜 시간이 소요되기 때문에 다양한 학습전략 탐구를 위해서 특수일이 적은 계절별 4주를 표 4와 같이 선정하였다.
표 2. 실험 환경
Table 2. Experimental Environment
|
실험환경
|
서버1
|
|
GPU
|
NVIDIA Tesla V100 32GB PCIe * 2
|
|
OS
|
Ubuntu 22.04.5 LTS
|
|
CUDA
|
Cuda compilation tools, release 11.8, V11.8.89
|
|
Python
|
3.10.12
|
|
Tensorflow
|
2.14.0
|
|
Numpy
|
1.23.5
|
표 3. LSTM 하이퍼파라미터 설정
Table 3. LSTM Hyperparameter Settings
|
파라미터
|
설정값
|
|
LSTM 유닛 수(Units)
|
24
|
|
LSTM 층 수(Layers)
|
1
|
|
학습률(Learning Rate)
|
0.001
|
|
손실함수(Loss Function)
|
MSE
|
|
조기종료(Early Stopping)
|
Patience = 5
|
|
배치 사이즈(Batch Size)
|
256
|
|
학습 횟수(Epochs)
|
200
|
표 4. 사례연구 기간 설정
Table 4. Case Study Period
|
계절
|
사례연구 기간
|
|
봄
|
2023-04-24 ~ 2023-04-30
|
|
여름
|
2023-07-24 ~ 2023-07-30
|
|
가을
|
2023-10-24 ~ 2023-10-29
|
|
겨울
|
2023-12-18 ~ 2023-12-24
|
그림 1과 같이 예측 대상 시점은 예측 수행 시점으로부터 15개 포인트 이후(75분 후) 단일 포인트로 설정하였다. 이는 실시간 시장에서 입찰 마감이 T
– 75분인 점을 고려하여 설정하였다 [1]. 예측 수행 시점 이전 1포인트까지 데이터 수집시간을 반영하여 대략 10분가량 여유를 두어 학습, 예측 윈도우를 설정하였다. 그리고 추가로 모델
학습 시 대략 30분 정도의 학습 시간이 필요한 점을 고려하여, 예측 수행 시점 1시간 전까지의 데이터만으로 학습을 진행하였다.
4.4 실시간 전력수요예측 사례연구
Bi-LSTM 모델 학습 시 모델 내부의 하이퍼파라미터 이외에 모델의 학습 기간, 학습 윈도우 크기, 재학습 빈도 같은 학습 전략 선정이 예측 정확도에
큰 영향을 미친다. 여기서 학습 기간은 학습에 사용되는 데이터의 총 기간을 뜻하고 윈도우 크기는 모델의 입력 사이즈를 의미한다. 재학습 빈도는 모델이
최신 데이터를 학습하기 위해 얼마만큼의 기간마다 학습할 것인지를 나타내는 파라미터이다. Bi-LSTM 모델은 딥러닝 모델로 학습에 오랜 시간이 걸린다.
따라서 본 연구에서는 최적의 학습 전략 조합을 찾기 위해 다음과 같은 순차적 탐색을 진행하였다. 첫째, 기본 파라미터(재학습 빈도 3일, 윈도우 크기
1일)를 고정한 상태에서 최적의 학습 기간을 탐색한다. 둘째, 선정된 최적 학습 기간을 적용하여 윈도우 크기에 따른 성능 변화를 분석한다. 마지막으로,
최적의 학습 기간과 윈도우 크기를 고정한 후 재학습 빈도를 조절하며 최종 모델을 선정한다. 표 5와 같이 기본 모델을 학습 빈도 3일, 윈도우 크기 1일, 학습 기간 18개월로 고정하고 실험한 결과 MAPE는 0.98%가 나왔다.
표 5. 기본 Bi-LSTM 모델의 학습 전략 파라미터 결과
Table 5. Results of the Basic Bi-LSTM Model's Training Strategy Parameters
|
학습빈도
|
윈도우 크기
|
학습기간
|
75분 MAPE
|
실행시간
|
|
3일
|
288(1일)
|
18개월
|
0.98%
|
2시간 13분
|
먼저 학습 기간에 따른 오차율 분석을 진행하였다. 학습 기간은 모델의 학습 데이터 크기를 결정하는 중요한 부분이기 때문에 우선 실험을 진행하였다.
표 6에서 학습 기간이 24개월일 때가 전체 MAPE가 0.88% 전체 RMSE가 767.92로 가장 좋은 결과를 보여줬다. 이는 학습 기간이 길수록 모델
학습에 사용할 수 있는 데이터가 증가하여 성능이 향상되는 것으로 보인다. 다음으로 학습 기간을 24개월로 고정한 후 윈도우 크기를 7일부터 6시간까지
조절하여 오차율 분석을 실행하였다.
표 7에서 윈도우 크기가 288*7(7일)일 때가 전체 MAPE는 0.84, 전체 RMSE는 729.72로 가장 좋은 결과를 보였다. 이는 입력을 짧은
기간으로 학습하는 것보다 일주일 정도(요일 특성)의 긴 주기성을 학습하는 것이 오차율 개선에 도움을 준다고 볼 수 있다. 다음으로 윈도우 크기를 288*7(7일)로
고정하고 재학습 빈도를 7일부터 6시간까지 오차율을 분석하였다.
표 8에서 재학습 빈도가 3일과 12시간일 때, 전체 MAPE가 가장 낮게 나왔다. 전체 RMSE는 12시간일 때가 더 낮았지만, 학습을 6배 더 많이
하므로 필요한 컴퓨팅 자원이 6배 정도 더 많이 필요하고 들이는 시간 대비 RMSE가 큰 차이가 없으므로 최적 파라미터로 재학습 빈도 3일로 선정하였다.
최적의 파라미터 결과는 표 9와 같이 재학습 빈도 3일, 윈도우 크기 7일 학습 기간 24개월로 선정되었다.
표 6. 학습기간에 따른 오차율 결과
Table 6. Error Rate Results by Training Period
|
학습 기간
|
계절
|
MAPE(%)
|
전체 MAPE(%)
|
전체 RMSE(MW)
|
|
24개월
|
봄
|
1.26
|
0.88%
|
767.92
|
|
여름
|
0.87
|
|
가을
|
0.73
|
|
겨울
|
0.74
|
|
18개월
|
봄
|
1.32
|
0.88%
|
772.90
|
|
여름
|
0.78
|
|
가을
|
0.75
|
|
겨울
|
0.68
|
|
12개월
|
봄
|
1.74
|
1.11%
|
1008.15
|
|
여름
|
0.98
|
|
가을
|
0.78
|
|
겨울
|
0.93
|
|
6개월
|
봄
|
1.70
|
4.49%
|
5921.89
|
|
여름
|
4.70
|
|
가을
|
1.47
|
|
겨울
|
10.10
|
|
3개월
|
봄
|
1.76
|
2.57%
|
2378.90
|
|
여름
|
2.22
|
|
가을
|
2.59
|
|
겨울
|
3.73
|
|
1개월
|
봄
|
2.35
|
2.73%
|
2677.53
|
|
여름
|
2.43
|
|
가을
|
2.03
|
|
겨울
|
4.13
|
표 7. 윈도우 크기에 따른 오차율 결과
Table 7. Error Rate Results by Window Size
|
윈도우 크기
|
계절
|
MAPE
|
전체 MAPE(%)
|
전체 RMSE(MW)
|
|
288*7 (7일)
|
봄
|
1.06
|
0.84%
|
729.72
|
|
여름
|
0.80
|
|
가을
|
0.75
|
|
겨울
|
0.73
|
|
288*3 (3일)
|
봄
|
1.05
|
0.86%
|
741.02
|
|
여름
|
0.83
|
|
가을
|
0.80
|
|
겨울
|
0.76
|
|
288*2 (2일)
|
봄
|
1.38
|
0.95%
|
809.60
|
|
여름
|
0.86
|
|
가을
|
0.81
|
|
겨울
|
0.75
|
|
288*1 (1일)
|
봄
|
1.29
|
0.87%
|
762.22
|
|
여름
|
0.75
|
|
가을
|
0.74
|
|
겨울
|
0.72
|
|
144 (12시간)
|
봄
|
1.24
|
0.94%
|
779.99
|
|
여름
|
0.87
|
|
가을
|
0.88
|
|
겨울
|
0.75
|
|
77 (6시간)
|
봄
|
1.37
|
0.96%
|
815.12
|
|
여름
|
0.94
|
|
가을
|
0.78
|
|
겨울
|
0.76
|
표 9의 파라미터로 2023년에 4월, 7월, 10월, 12월 총 4달의 예측을 진행한 결과를 추가 분석하였다. 4개월의 계절별 MAPE와 전체 MAPE,
RMSE는 표 10과 같다.
표 8. 재학습 빈도에 따른 오차율 결과
Table 8. Error Rate Results by Retraining Frequency
|
재학습 빈도
|
계절
|
MAPE
|
전체 MAPE(%)
|
전체 RMSE(MW)
|
|
7일
|
봄
|
1.13
|
0.86%
|
738.498
|
|
여름
|
0.75
|
|
가을
|
0.80
|
|
겨울
|
0.75
|
|
3일
|
봄
|
1.09
|
0.84%
|
741.422
|
|
여름
|
0.78
|
|
가을
|
0.70
|
|
겨울
|
0.80
|
|
2일
|
봄
|
1.10
|
0.875%
|
794.597
|
|
여름
|
0.81
|
|
가을
|
0.73
|
|
겨울
|
0.87
|
|
1일
|
봄
|
1.13
|
0.87%
|
758.093
|
|
여름
|
0.80
|
|
가을
|
0.74
|
|
겨울
|
0.80
|
|
12시간
|
봄
|
1.13
|
0.84%
|
739.223
|
|
여름
|
0.81
|
|
가을
|
0.70
|
|
겨울
|
0.73
|
|
6시간
|
봄
|
1.13
|
0.873%
|
755.920
|
|
여름
|
0.82
|
|
가을
|
0.74
|
|
겨울
|
0.80
|
표 9. 최적의 학습전략 파라미터 모델 결과
Table 9. Results for the Model with Optimal Training Strategy Parameters
|
계절
|
재학습 빈도
|
윈도우 크기
|
학습 기간
|
75분 MAPE
|
실행 시간
|
|
전체
|
3일
|
288*7 (7일)
|
24개월
|
0.84%
|
20시간 5분
|
표 10. 최적의 학습전략 파라미터의 4계절 예측 결과
Table 10. Four-Season Forecasting Results with Optimal Training Strategy Parameters
|
계절
|
MAPE(%)
|
전체 MAPE(%)
|
전체 RMSE(MW)
|
|
봄(4월)
|
1.08
|
0.95%
|
827.664
|
|
여름(7월)
|
0.94
|
|
가을(10월)
|
0.95
|
|
겨울(12월)
|
0.86
|
4.5 실시간 전력수요예측 사례연구 결과분석
사례연구 결과, Bi-LSTM 모델의 최적의 학습 전략은 재학습 빈도 3일, 윈도우 크기 7일, 학습 기간 24개월로 나타났다. 학습 기간은 길수록
신경망 모델의 학습에 유리한 것으로 나타났고 윈도우 크기는 일주일의 경향을 한 번에 보는 7일이 유리한 것으로 보인다. 다만 재학습 빈도 같은 경우
전체 MAPE는 12시간과 3일마다 학습하는 경우가 같았고 전체 RMSE는 3일보다 12시간마다 학습하는 것이 적게 나왔는데, 이는 계통 운영자 관점에서
전략적으로 선택할 수 있는 지점이다. 12시간마다 학습하는 모델은 한번 학습에 9.8시간이 걸려 실제로 매번 학습하기에는 어렵지만 전체 RMSE가
더 낮다. 3일마다 학습하는 모델은 학습에 1.6시간이 걸려 학습이 빠르지만, 전체 RMSE는 높다. 본 연구에서는 3일마다 선택하는 모델이 빠르게
학습과 예측을 반복해야 하는 실시간 전력수요예측 모델에서 경제성이 있다고 판단하였다. 3일마다 학습하는 모델은 최신 데이터 변동성과 장기적 데이터의
안정성을 고려한 균형점으로 판단된다.
그림 7. 계절별 요일 MAPE 비교
Fig. 7. Comparison of MAPE by Day of the Week for Each Season
그림 7은 계절별 요일 오차율을 나타낸 그래프이다. 봄철 오차율이 유독 높은데, 봄은 일조량이 풍부해 BTM 태양광의 발전량이 높은 시기 중 하나이다. 하지만
냉난방 수요는 적어 전력 소비가 적다. 그림 5와 같이 봄철 수요의 크기가 작기 때문에 비교적 오차율이 더 크게 나온 것으로 보인다. 또한 봄철을 제외한 월요일이 오차율이 크게 나온 것으로 확인되는데,
이는 평일과 주말을 나눈 원 핫 인코딩 때문으로 생각된다. 추후 연구에서는 월요일을 별도의 범주로 처리하거나, 공휴일 다음 날의 패턴을 반영하는 라벨링을
통해 예측 성능을 개선할 수 있을 것으로 판단된다.
그림 8. 계절별 시간대 MAPE 변화
Fig. 8. MAPE Variation by Time of Day for Each Season
그림 8은 계절별 시간대 MAPE를 나타낸 그래프이다. 주로 태양이 뜨는 시간대인 8시부터 18시까지 오차율이 높아지는 것을 알 수 있다. BTM 태양광의
변동성 때문에 오차율이 증가한 것으로 보인다. 반면 일사량이 없는 새벽 시간대에는 오차율이 작은 것을 볼 수 있다.
그림 9에서는 4월 1일부터 4월 2일 18시까지의 5분 단위 실제값과 예측값을 보여준다. 예측값이 실제값보다 큰 것을 볼 수 있는데, 특히 7시부터 13시까지
감소하는 경향이 있다. 이러한 과대 예측은 모델이 과거의 정보를 바탕으로 미래를 예측하기 때문에 발생하는 자연스러운 현상일 수 있다. 향후 연구에서는
이러한 패턴이 일정하게 반복됨에 따라 오차 보정 모델을 추가하거나, Attention 메커니즘을 도입하여 특정 시점의 정보에 가중치를 부여함으로써
지연 현상을 개선하는 방안을 모색할 계획이다.
그림 9. 4월 1일 ~ 4월 2일 실제값, 예측값 그래프
Fig. 9. Graph of Actual vs. Predicted Values(April 1st – April 2nd)
그림 10. 계절별 실제값, 예측값 램프율 비교 박스플롯
Fig. 10. Boxplot Comparison of Actual vs. Predicted Ramp Rates for Each Season
그림 11. 재학습 트리거 적용한 예측 결과
Fig. 11. Forecasting Results with a Retraining Trigger
그림 10은 실제값과 예측값의 5분 단위 변화량을 나타낸 박스플롯이다. 전체적으로 보면 실제값에 비해서 예측값은 변화량이 낮은 것을 볼 수 있는데, 이는 모델이
안정적인 학습을 위해서 변화량을 낮춘 것으로 판단할 수 있다. 봄철의 경우 실제 수요 변화량의 사분위수 범위(IQR)가 평균 180MW/5min인
반면, 예측값의 IQR은 150MW/5min 수준으로 낮게 나타났다. 이는 MSE 손실함수가 큰 오차에 강한 페널티를 부여하여, 모델이 급격한 변화를
예측하기보다 평균적인 패턴에 수렴하도록 학습되었기 때문으로 분석된다. 추후 MAE 등 이상치에 덜 민감한 다른 손실함수를 적용한다면 예측값의 변화량이
낮은 문제를 해결할 가능성이 있다.
표 11. 재학습 트리거 적용 예측 결과
Table 11. Forecasting Results with a Retraining Trigger
|
트리거 여부
|
트리거 방법
|
MAPE(%)
|
RMSE(MW)
|
|
X
|
없음
|
1.50%
|
1140.24
|
|
O
|
6pt이상 오차율 증가시
|
1.15%
|
902.26
|
그림 11은 학습 전략 재설정 단계의 재학습 트리거를 적용 시 예측 성능의 향상을 그래프로 표현한 것이다. 표 5의 기본 학습전략으로 예측하고 6포인트(30분) 이상 오차율이 증가하면 학습전략을 다시 결정하여 예측하여 오차를 비교해 보았다. 기간은 기존 예측에서
오차가 컸던 봄철‘2023-04-24~2023-04-30’로 테스트해 보았다.
실험 결과 4월 24일 11:55분에 6포인트 이상 오차율이 증가하여 트리거가 작동하였다. 표 11에서 작동하기 전의 전체 오차율 1.50%에서 트리거가 발생하여 스위칭 된 결과 전체 오차율은 1.15%로 개선됨을 확인할 수 있다.
5. 결 론
본 연구는 Bi-LSTM 모델에서 학습전략의 최적화를 통하여 오차율을 감소시킬 수 있었다. 재학습 빈도, 윈도우 크기, 학습 기간의 파라미터를 탐색해
보며 최적의 조합을 찾을 수 있었다. 최적의 조합으로 재학습 빈도 3일, 윈도우 크기 7일, 학습 기간 24개월이 선정되었고 학습 시간은 약 1.6시간으로
충분히 실시간 시장과 계통 운영에서 사용할 수 있는 시간이다. 이처럼 모델의 내부 하이퍼파라미터 최적화뿐만 아니라 모델의 학습전략 또한 예측 성능에
영향을 미치는 중요한 요소이며, 계통 운영자로서는 오차율뿐만 아닌 학습 시간 또한 중요한 요소이기 때문에 모델 구현 시 고려해야 할 문제임을 확인할
수 있었다. 그러나 최적의 학습 전략을 도출했음에도 불구하고, 봄철의 높은 오차율, 월요일의 예측 오차, 예측값의 변동성 저하와 같은 한계점을 발견했다.
이는 각각 BTM 태양광, 주말-평일 전환 패턴, MSE 손실 함수의 특성에 기인한 것으로 분석되며, 향후 연구에서는 이상치에 강건한 MAE 손실
함수 적용이나 요일 패턴을 세분화하는 피처 엔지니어링을 통해 개선할 계획이다.
Acknowledgements
본 연구는 2025학년도 상명대학교 교내연구비를 지원받아 수행하였음 (2025-A000-0209)
References
2024, The 11th Basic Plan for Electricity Supply and Demand (2024-2038)

2024, 2024 Energy Supply and Demand Trends

H. W. Jung, 2014, Very Short-Term Electric Load Forecasting Using The Kalman Filter
Algorithm, Master's thesis

K. M. Song, 2024, XGBoost-based Very Short Term Load Forecasting Algorithm, Master's
thesis

X. Liao, N. Cao, L. Ma, X. Kang, 2019, Research on short-term load forecasting using
XGBoost based on similar days, pp. 675-678

Y. Han, Y. Liu, J. Jhu, 2018, Short-term power load forecasting based on clustering
and XGBoost method, pp. 259-262

W. Kong, Z. Y. Dong, B. Huang, F. Luo, Y. Xu, 2019, Short-term residential load forecasting
based on LSTM recurrent neural network, IEEE Transactions on Smart Grid, Vol. 10,
No. 1, pp. 841-851

S. Muzaffar, Z. Chen, S. T. Khang, M. A. Q. Khan, 2019, Short-Term Load Forecasts
Using LSTM Networks, Energy Procedia, Vol. 158, pp. 2922-2927

T. G. Kim, K. M. Song, S. M. Cho, S. G. Yoon, K. B. Song, 2025, GRU-based Real Time
Very Short Term Load Forecasting Algorithm, pp. 111-102

J. Zheng, X. Chen, K. Yu, L. Gan, Y. Wang, K. Wang, 2018, Short-term power load
forecasting of residential community based on GRU neural network, pp. 154-159

K. Ke, H. Sun, C. Zhang, C. Brown, 2019, Short-term electrical load forecasting method
based on stacked auto-encoding and GRU neural network, Evolutionary Intelligence,
Vol. 12, pp. 385-394

H. S. Park, 2025, Enhancing Real-Time Power Demand Forecasting Using Hybrid DTW-KMSOM
Clustering and LSTM, Master's thesis

S. J. Ko, H. Y. Yun, D. M. Shin, 2018, Electronic Demand Data Prediction using Bidirectional
Long Short Term Memory Networks, Journal of Software Assessment and Valuation, Vol.
14, No. 1, pp. 33-40

S. Hochreiter, J. Schmidhuber, 1997, Long short-term memory, Neural computation, Vol.
9, No. 8, pp. 1735-1780

M. Schuster, K. K. Paliwal, 1997, Bidirectional recurrent neural networks, IEEE transactions
on Signal Processing, Vol. 45, No. 11, pp. 2673-2681

D. H. Seo, S. Y. Kim, Y. M. Wi, 2025, Enhancing Real-Time Power Demand Forecasting
Accuracy through Analysis of Training Strategies for Bi-LSTM Models, pp. 921-922

저자소개
Dong-Hyeok Seo received the Bachelor degree major in Electrical Engineering from Sangmyung
University, South Korea, in 2025. He is currently pursuing Master degree in Department
of Energy Grid Engineering, Sangmyung University, South Korea.
He received his Ph.D. degree in Electrical Engineering from Korea University, Seoul,
Korea, in 2013. From 2013 to 2014, he worked at the Korea Electrotechnology Research
Institute (KERI), Korea. From 2015 to 2022, he was a faculty in the School of Electrical
and Electronic Engineering, Gwangju University, Gwangju, Korea. He is currently an
assistant professor in the Department of Electrical Engineering, Sangmyung University,
Seoul, Korea.