• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical and Electronic Engineering, Kumoh National Institute of Technology, Republic of Korea and Department of Aeronautic, Mechanical, and Electronic Convergence Engineering, Kumoh National Institute of Technology. E-mail : auk33@naver.com)



Gross load estimation, Net load, Behind-the-meter, Photovoltaic generation, Intelligent control

1. 서 론

최근 전 세계적으로 탄소 중립 기조가 강화되면서 재생에너지의 활용이 빠르게 확대되고 있다 [1]. 그러나 분산형 자원의 급격한 확산은 재생에너지의 간헐성 및 변동성에 의해서 전압 안정성 문제나 수급 불균형 등 계통 운영상의 어려움을 야기하고 있다.

한편, 다수의 분산형 태양광(photovoltaic, PV) 발전 시스템은 계량기 뒤편(Behind-The-Meter, BTM)에 설치되어 전력 수요에 포함되지 않으므로 계통 운영자가 이를 직접적으로 관측하지 못하는 경우가 많다 [2]. 그 결과, 변전소에서 계측되는 순부하는 총부하와 BTM PV 발전량이 혼합된 형태로 나타나게 되며, 이는 총부하 추정 과정에 큰 불확실성을 야기해 계통 운영 및 관리에 어려움을 초래한다. 총부하 추정의 불확실성은 단순히 예측 오차의 증가를 의미하는 것이 아니라, 계통 운영 측면에서 심각한 문제를 유발할 수 있다. 특히 총부하를 과소 추정하는 경우 실제 전력 수요보다 낮게 예측되어 발전기 출력이나 운영 스케줄링이 부족하게 수립될 수 있으며, 이는 순간적인 공급 부족을 야기하여 전력 수급 불안정으로 이어진다. 반대로 총부하를 과대 추정할 경우 불필요한 예비력 확보나 발전기 과투입으로 인한 비효율적인 운영이 발생할 수 있다. 이처럼 총부하 추정의 불확실성은 전력 수요 예측의 정확도를 저하시켜 계통의 안정적 운영과 경제적 효율성 모두에 부정적인 영향을 끼친다.

이러한 배경에서, 순부하로부터 BTM PV 발전량을 분리하려는 다양한 접근이 제안되어 왔다. [3]에서는 맑은 하늘 발전 모델과 날씨-태양광 효율과 결합하여 BTM PV 발전량을 추정하였다. [4]에서는 BTM PV 발전량 추정을 위한 물리적 모델과 총부하 추정을 위한 혼합 은닉 마르코프 모델을 학습하기 위한 반복 알고리즘이 제안되었다. 그러나 이러한 연구들은 PV 시스템 사양에 의존하며, PV 설치 위치가 다를 경우 부정확한 결과가 도출될 수 있다.

이와 관련하여 물리적 모델이나 PV 시스템 사양이 필요하지 않은 데이터 기반 방법이 연구되었다. [5]에서는 실시간 PV 발전량 모니터링을 위한 상황적 감독 소스 분리 방법이 제안되었다. [6]에서는 연합 학습 기반 베이지안 신경망을 사용하여 커뮤니티 수준의 BTM PV 발전량을 추정하는 방법을 제안하였다. 그러나 상기 데이터 기반 방법은 BTM PV 발전량의 실제 데이터가 필요하므로 실제 데이터가 없는 경우에 사용될 수 없다. National Grid에서는 실시간 DER 데이터 공유를 위한 인프라를 점진적으로 개발하고 있지만 이러한 기능이 아직 완전히 확립되지 않았으며 [7], 이러한 관행은 여전히 제한적이며 많은 지역에서 체계적으로 구현되지 않고 있다 [8].

한편, [9][10]에서는 스마트 미터 계량 인프라를 활용한 방법들이 제안되었다. [9]에서는 스마트 미터 데이터만을 사용하여 BTM PV 발전량을 추정하는 게임 이론적 데이터 기반 방법을 제안하였다. [10]에서는 스마트 미터를 이용하여 PV 보유/비보유 집단으로 나누고, 보유 집단의 총부하를 추정한 뒤 순부하에서 BTM PV 발전을 분리하였다. 그러나 이러한 연구들은 인프라 구축 및 운영 비용에 있어 경제적이지 않으며, 스마트미터의 보급률이 낮은 계통에서는 적용이 제한적일 수 있다. 따라서 접근성 높은 데이터만으로 구현이 용이하고 준수한 성능을 갖춘 방법론이 필요하다.

한편, 인공지능, 특히 인공신경망 분야 연구가 최근 활발히 진행되면서 이를 부하 추정에 적용하고자하는 연구사례가 증가하는 추세다. 순환 신경망 기반의 LSTM(Long Short-Term Memory) [11]은 시계열 데이터의 장기적 의존성을 학습하는 데 강점을 가지며, 특히 전력 부하나 PV 발전량처럼 시간적 맥락에 민감한 데이터를 효과적으로 처리할 수 있다. 더 나아가, BiLSTM (Bidirectional LSTM)은 순방향과 역방향의 정보를 동시에 학습함으로써 시계열의 과거와 미래 맥락을 모두 반영할 수 있어, 단방향 LSTM 한계를 극복할 수 있다 [12]. 한편, 최근 시계열 예측 분야에서는 DLinear(Decomposition Linear) 모델이 입력 신호를 추세와 계절 성분으로 분해한 뒤 이를 단순한 선형 구조로 처리하는 방식으로, 경량 모델임에도 경쟁력 있는 예측 성능을 보이는 것으로 보고되었다 [13]. 그러나 DLinear는 선형 구조에 기반하기 때문에 급격한 비선형 변동성이나 복잡한 잡음 패턴을 반영하는 데에는 한계가 있다.

본 연구에서는 이러한 배경을 바탕으로, DLinear의 시계열 분해 기법과 BiLSTM의 비선형 학습 능력을 결합한 하이브리드 총부하 추정 모델(DLinear–BiLSTM)을 제안한다. DLinear의 분해 모듈을 통해 입력 신호를 추세 및 계절 성분으로 나눈 뒤, 분해된 시계열 성분을 BiLSTM의 입력으로 사용하여, 시계열의 비선형적 변동을 학습할 수 있도록 설계하였다. 또한 순부하만으로는 총부하 추정에 한계가 있으므로, 본 연구는 기상, 날짜, 지역과 같은 외인 변수를 모델 학습에 반영하였다. 이를 통해 단일 모델의 한계를 보완하고, 고변동 특성을 가진 전력 수요 및 PV 발전량 예측에서 높은 정확도를 달성하는 것을 목표로 하였다.

본 연구에서는 제안한 DLinear–BiLSTM 하이브리드 모델의 총부하 추정 성능을 검증하기 위해 실제 1년간 측정된 변전소 순부하 데이터와 변전소 인근에서 측정된 BTM PV 발전 데이터를 활용하여 학습 및 평가를 수행하였다. 검증 결과, 제안된 모델은 다양한 Baseline 모델들과 비교하여 MAE(Mean absolute error)와 MSE(Mean square error) 모두에서 우수한 성능을 나타냈으며, 여러 지역을 대상으로 수행한 평가에서도 모든 지역에서 일관된 성능 향상이 확인되었다. 또한 입력 변수 조합별 실험을 통해 기상, 날짜, 지역 정보의 통합적 활용이 총부하 추정 정확도 향상에 중요한 역할을 함을 검증하였다. 또한 Proposed 모델과 Baseline 모델의 계산 복잡도 및 학습 효율을 비교하고, Paired t-test를 통해 성능 차이가 통계적으로 유의함을 검증하였다. 본 연구의 주요 기여는 다음과 같다.

  • DLinear 분해와 BiLSTM 학습을 결합하여 입력 데이터의 추세, 계절 성분을 분리하고, 양방향 맥락 기반의 비선형 변동성을 학습할 수 있는 구조를 제안한다.

  • 추가 인프라(PV 시스템 사양, BTM PV 데이터, GHI, 스마트미터)에 의존하지 않는 접근 법을 제안한다. 앞서 언급되었던 정보를 수집하는 것이 전력망 운영자에게 어려움을 초래하거나 추가 비용을 발생시킬 수 있기 때문에 본 접근법의 실행 가능성을 크게 향상 시킬 수 있다.

  • 본 접근법은 순부하 데이터와 접근성이 용이한 기상 데이터와 날짜, 지역 변수에만 의존하여 총부하를 추정한다. 이러한 접근 법은 일반적으로 전력망 운영자가 이용할 수 있으므로 매우 실용적이다.

본 논문의 구성은 다음과 같다. 2절에서는 BTM PV 발전량 분리 문제를 공식화 한다. 3절에서는 가용된 데이터셋과 변수 전처리 과정을 설명하고, 4절에서는 제안하는 방법론을 설명한다. 5절에서는 실험 및 성능 비교 결과를 제시한다. 마지막으로 6절에서는 결론 및 향후 연구 방향을 논의한다.

2. 문제 정의

변전소에서 측정되는 순부하는 총부하와 BTM PV 발전량의 합으로 정의되며, 다음과 같이 표현된다.

(1)
$P_{net}(t)=P_{grossload}(t)+P_{pv}(t).$

여기서 $P_{net}(t)$은 변전소에서 측정된 순부하 데이터를 나타낸다. $P_{grossload}(t)$는 총부하, $P_{pv}(t)$는 시간 $t\in[t_{1}, t_{2}, \cdots, t_{T}]$ 에서의 PV 발전량을 의미한다. 본 연구에서는 변전소 단위에서 $P_{net}(t)$을 직접 측정할 수 있으나, $P_{grossload}(t)$와 $P_{pv}(t)$는 배전망 운영자가 직접 측정할 수 없다고 가정한다. 여기에서 PV 발전량의 영향을 포함하는 $P_{net}(t)$만으로는 $P_{grossload}(t)$를 추정하기 어렵다. PV 발전량은 기상 조건, 계절적 요인, 지역 특성에 따라 달라진다. 따라서 총부하를 정확히 추정하기 위해서는 순부하 외에도 PV 발전량에 영향을 주는 보조 정보가 필요하다. 이에 따라 본 연구에서는 접근성이 용이한 기상 데이터(일사량, 기온, 강수량, 적설량)와 날짜 및 지역 특성과 같은 외인 변수를 활용 한 총부하 추정 모델을 제안하고 성능을 검증하고자 한다.

3. 입력 데이터

본 연구에서 활용한 데이터셋은 2021년 1월 1일부터 12월 31일 까지 1년간 수집된 시간 단위 시계열 데이터이며, 총 8760개의 시점을 포함한다. 입력 변수는 총 10개, 출력 변수는 1개로 구성되며(표 1 참조), 이중 순부하는 예측 대상인 총부하와 가장 밀접한 관련이 있는 주요 변수이며, 하루 단위의 순부하와 총부하 데이터 예시는 그림 1에 제시되어 있다.

그림 1. 가용 데이터(순부하 및 총부하)

Fig. 1. Available data(Net load and Gross load)

../../Resources/kiee/KIEE.2026.75.2.266/fig1.png

나머지 변수들은 부하 변동성과 PV 발전량에 영향을 미치는 외인 변수로 활용된다. 각 데이터 항목은 다음과 같다:

1) 총부하: 총부하는 BTM PV 설비가 설치되지 않은 배전망의 변전소에서 측정되었으며, 예측 대상 데이터로 활용된다.

2) 순부하: 순부하 데이터를 구축하기 위해, 총부하가 측정된 지역과 동일한 기간 동안 해당 지역의 BTM PV 발전량 데이터를 합산하여 순부하 데이터를 산출하였다.

3) 외인 변수: 외인 변수는 기상, 날짜 지역변수가 포함된다. 기상 변수는 일사량(Solar radiation), 기온(Temperature), 강수량(Precipitation), 적설량(Snowfall) 등이 포함되며, 이는 총부하가 측정된 지역과 동일하거나 인접한 지역의 기상청 자동기상관측시스템을 통해 수집된 관측 데이터를 활용하였다. 일사량은 지표면에 도달하는 태양 복사 에너지의 세기를 의하며, 단위는 $[MJ/m^{2}]$이다. 본 연구에서는 총부하와 PV 발전량이측정된 지점의 일사량 데이터를 직접 확보할 수 없었기 때문에, 공간적 편차를 보완하기 위해 인접한 두 기상관측소의 관측값을 모두 활용하였다. 이를 각각 Solar radiation 1과 Solar radiation 2로 정의하였다. 기온은 대기온을 의미하며, 강수량과 적설량은 각각 자동 우량계 및 눈 판을 통해 관측된 누적 강수 깊이[mm]와 적설 깊이[cm]를 의미한다. 날짜 정보로는 요일(Day of Week), 일(Day), 월(Month)이 포함되며, 지역 정보는 각 지역을 구분하기 위한 식별자(Region)로 구성된다.

표 1. 입력 데이터 및 예측 대상 데이터

Table 1. Input data and target variable

No Data Type
1 Net Load Input
2 Solar radiation 1 Input
3 Solar radiation 2 Input
4 Temp Input
5 Precipitation Input
6 Snowfall Input
7 Day of the week Input
8 Day Input
9 Month Input
10 Region Input
11 Gross Load Output

그림 2. 기상 변수와 PV 발전량 간의 상관관계

Fig. 2. Correlation between Weather Variables and PV

../../Resources/kiee/KIEE.2026.75.2.266/fig2.png

3.1 외인 변수의 활용 및 상관관계 분석

본 연구에서는 순부하만으로는 총부하를 추정하기 어렵다는 점을 고려하여, PV 발전량에 영향을 줄 수 있는 외인 변수를 포함하였다. PV 발전량과 외인 변수 간의 상관관계 분석을 위해 피어슨 상관분석을 수행하였다.

그림 2에 제시된 결과에 따르면, 쉽게 예측이 가능한 부분이지만, PV 발전량과 일사량의 상관계수는 0.89로 매우 높은 상관관계를 나타냄을 확인할 수 있다. 이는 태양광 발전이 태양 복사 에너지에 대한 직접 의존성을 반영한다. 반면 PV 발전량과 기온 간의 상관계수는 0.29으로 약한 양의 상관관계를 보였고, 강수량, 적설량과의 상관계수는 거의 0에 근접하여 단순 상관 차원에서는 PV 발전량에 대한 직접적 영향이 제한적임을 확인하였다.

그림 3. PV 발전량과 기상 변수 간의 산점도 (a) 일사량, (b) 기온, (c) 적설, (d) 강수량

Fig. 3. Scatter plots of PV generation versus weather variables: (a) solar radiation, (b) air temperature, (c) snowfall and (d) precipitation

../../Resources/kiee/KIEE.2026.75.2.266/fig3.png

본 연구에서는 상기 상관분석과 함께 물리적 요인까지 고려하여 변수를 선정하였다. 이를 구체적으로 확인하기 위하여 그림 3(a)-(d)에서는 PV 발전량과 일사량, 적설량, 기온, 강수량 간의 산점도를 제시하였다.

그림 3(a)는 일사량과 PV 발전량 간의 관계를 나타낸다. 일사량이 증가할수록 PV 발전량이 대체로 함께 증가하는 경향이 관찰되었다. 이는 상관분석에서 확인된 바와 같이 PV 발전이 일사량에 의해 직접적으로 결정된다는 물리적 특성을 잘 보여준다. 그림 3(b)는 기온과 PV 발전량 간의 관계를 나타낸다. 기온이 –10℃ 이하인 시점에서는 발전량이 거의 기록되지 않았는데, 동절기의 낮은 일사량 및 적설량이 원인으로 추정된다.

그림 3(c)그림 3(d)는 각각 적설량과 강수량이 PV 발전량 간의 관계를 보여준다. 적설량이 일정 수준 이상 누적될 경우 발전량은 급격히 0으로 수렴하는 패턴이 나타났다. 이는 모듈 표면이 눈으로 덮여 일사량 유입이 차단된 결과로, 기존 문헌에서도 보고된 바 있다 [14]. 적설량이 소량 존재하는 경우에 일부 발전이 유지된 점은, 눈 입자에 의해 산란된 확산광이 태양광 발전에 기여했을 가능성이 있다.

한편, 전반적으로 강수량이 증가할수록 발전량은 감소하는 경향을 보였다. 그러나 소량 혹은 극단적으로 높은 강수량 구간에서도 일부 발전이 관찰되었는데, 이는 확산광 효과 또는 강우로 인한 모듈 표면 세정, 냉각 효과가 부분적으로 작용한 결과일 수 있다.

따라서 외인 변수의 통계적 상관성뿐만 아니라, 물리적 요인까지 고려하여 변수를 선정할 필요성이 있음을 알 수 있다. 특히, 적설량과 강수량은 단순 상관계수 차원에서는 PV 발전량과 약한 관련성을 보이지만, 극단적 기상 조건이나 특수 상황에서 예외적 발전 패턴을 설명하는 데 참고할 수 있는 보조 변수로 활용될 수 있다.

3.2 데이터 전처리 및 정규화

본 연구에서는 기상, 날짜, 지역 특성을 포함한 시계열 데이터에 대해서 다음과 같은 전처리를 수행하였다.

1) 데이터 신뢰성 확보를 위해 순부하 시계열 내 비정상적인 평탄 구간과 미 계측치를 제거하였다. 시간 단위 일별 시계열에 대해 길이 Q 시간의 슬라이딩 윈도우를 적용하였으며, 윈도우 내부에서 연속한 시점간 변화량의 절댓값 평균이 다음 조건을 만족할 경우 해당 일을 이상치로 판단하였다:

(2)
$\dfrac{1}{Q-1}\sum_{k=0}^{Q-2}| x_{t+k+1}-x_{t+k} | <1\times 10^{-5}.$

실제 전력 부하는 야간, 저변동 구간에서도 일정한 변동성이 존재하므로, 장시간 동안 동일한 값이 지속되는 평탄 구간은 센서 오류나 데이터 동결 등으로 인해 발생하는 이상 패턴으로 간주할 수 있다 [15]. 본 연구에서는 Q = 5 시간 기준으로 적용하였다.

2) 날짜 관련 변수의 주기성 보존을 위해 위치 임베딩(Position Embedding)을 적용하였다. '일(day)', '월(month)', '요일(day of week)'는 순서형 정수가 아니라 주기적 범주이므로, 각 변수를 크기가 1인 이차원 단위 백터로 변환하였다. 즉, 일, 월, 요일에 대해 각각 다음과 같이 정의하였다:

(3)
$D =\left[\begin{aligned}\cos(2\pi\cdot\dfrac{day}{31})\\ \sin(2\pi\cdot\dfrac{day}{31})\end{aligned}\right], \\ M =\left[\begin{aligned}\cos(2\pi\cdot\dfrac{month}{12})\\ \sin(2\pi\cdot\dfrac{month}{12})\end{aligned}\right],\\ W =\left[\begin{aligned}\cos(2\pi\cdot\dfrac{day of week}{7})\\ \sin(2\pi\cdot\dfrac{day of week}{7})\end{aligned}\right].$

위치 임베딩을 적용함으로써 모델은 날짜변수의 순환성과 연속성을 동시에 인지하며, 단순 정수형 표현에서는 놓치기 쉬운 시간적 인접성과 계절성 패턴을 학습할 수 있다.

3) 모델 입력의 스케일 차이를 줄이기 위해 연속형 (입력 1-6, 10)은 학습 데이터의 평균과 표준편차를 이용하여 표준화 과정을 적용하였다. 변환은 다음과 같이 정의된다.

(4)
$X_{no}=\dfrac{X-\mu}{\sigma}.$

여기서 $X$는 원본 데이터, $\mu$는 평균, $\sigma$는 표준편차를 의미한다. 이를 통해 모든 입출력 데이터를 평균 0, 분산 1의 정규 분포로 변환한다.

4) 본 연구에서는 총 N개의 지역에 대한 부하 데이터를 사용하였으며, 모델이 지역 간의 차이를 인식할 수 있도록 각 지역에 고유한 상수 값을 부여하였고, 마찬가지로 0〜1사이의 값으로 정규화를 진행하였다.

4. 제안하는 방법론

전력 수요와 태양광 발전량 시계열은 추세적 변화, 주기적 패턴, 비선형적 변동이 동시에 나타나는 복합 구조를 가진다. 이러한 특성을 효과적으로 반영하기 위해 본 연구에서는 시계열 분해 기반의 DLinear와 비선형 의존성을 학습할 수 있는 BiLSTM을 결합한 하이브리드 모델을 제안한다.

본 연구에서 제안하는 DLinear-BiLSTM 모델의 전체 구조는 그림 4에 제시되어있다. 먼저, 순부하 및 기상 변수 입력 시계열 $X$는 DLinear의 분해 방법을 통해 추세 성분$(X_{t})$과 계절 성분$(X_{s})$으로 구분된다. 이 과정은 다음과 같이 정의된다.

(5)
$X_{t}= Avg Pool(Padding(X)), \\X_{s}=X-X_{t}.$

여기서 $X_{t}$는 이동평균(average pooling)연산을 통해 장기적 경향을 반영하는 추세 성분이며, $X_{s}$는 원 데이터에서 추세 성분을 제거하여 단기적 경향을 반영하는 계절 성분이다. 이와 같은 분해 기반 접근법은 [16]에서도 시계열을 저주파(추세)와 고주파(계절) 성분으로 분리한 뒤 각 성분을 개별적으로 학습하고 재 결합하여 예측 성능을 향상시키는 방식으로 활용된 바 있으며, 이는 본 연구에서 적용한 분해 기반 모듈과도 개념적으로 유사한 접근법이다.

본 연구에서는 DLinear의 분해 모듈만을 비학습 전처리 단계로 사용하며, DLinear 예측기나 학습 가능한 파라미터는 포함되지 않는다. 분해된 두 시계열 성분($X_{t}, X_{s}$)을 각 BiLSTM에 입력하여 네트워크 내에서 병렬적으로 입력, 학습하는 구조이다.

BiLSTM은 순방향과 역방향의 LSTM 계층을 동시에 학습시켜 시계열의 전후 맥락 정보를 모두 반영한다. 단방향 LSTM은 과거 정보에만 의존하기 때문에 특정 시점 패턴에 과적합하거나 급격한 변동을 과소 추정할 수 있다. 반면 BiLSTM은 전후 정보를 통합해 전후 맥락을 함께 활용하므로 단방향 LSTM의 한계를 완화하며, 전력 부하 예측 사례에서도 RNN/LSTM/GRU 대비 더 좋은 성능을 보여주기도 하였다 [17]. 각 BiLSTM의 출력은 Dense(ReLU)와 Dropout 계층을 거쳐 특징 백터로 변환되며, 두 성분은 벡터 합으로 결합하여 다음과 같이 나타낼 수 있다.

(6)
$h=h_{t}+h_{s}.$

여기서 $h_{t}$와 $h_{s}$는 각각 추세 성분 $X_{t}$와 계절 성분 $X_{s}$을 BiLSTM에 입력하여 얻은 은닉 상태 백터를 의미한다.

그림 4. DLinear BiLSTM 하이브리드 모델 구조

Fig. 4. Architecture of the hybrid DLinear–BiLSTM model

../../Resources/kiee/KIEE.2026.75.2.266/fig4.png

날짜(일, 월, 요일)와 지역 정보는 각각 별도의 Dense 계층을 거쳐 특징 벡터로 변환된다. 이후 이 벡터들은 BiLSTM에서 추출된 시계열 특징 $h$들과 결합(Concatenate)되어, 최종 Dense 계층을 거쳐 최종 예측 값이 산출된다.

5. 실험 결과

5.1 실험 설정

실험에 사용된 입력 데이터는 총 14600개의 일별 샘플(40개 지역 $\times$ 365일)중 미계측 데이터를 제외한 14390개로 구성되고, 이중에서 평탄 구간 기반 이상치 제거(Q = 5 기준) 결과 199개(1.38%)가 추가로 제외되어, 최종 14191 개의샘플을 학습 및 평가에 활용하였다. 각 샘플은 해당 일자의 24시간 시계열 값을 포함한다. 이 외 학습에 사용된 하이퍼 파라미터는 표 2에 나타나 있다. 제안된 모델의 예측 정확도를 정략적으로 평가하기 위하여 아래와 같이 MAE와 MSE를 정의한다.

(7)
$MAE =\dfrac{1}{n}\sum_{i=1}^{n}| y_{pred_{i}}-y_{true_{i}} |,$
(8)
$MSE =\dfrac{1}{n}\sum_{i=1}^{n}(y_{pred_{i}}-y_{true_{i}})^{2}.$

여기서 $n$은 예측 구간의 데이터 수, $y_{true_{i}}$는 실제 전력 수요 값, $y_{pred_{i}}$는 모델이 예측한 전력의 수요 값이다. MAE는 실제, 예측 값의 절대 오차 평균으로, 통계적으로는 전체 예측 구간의 평균 오차 크기, 물리적으로는 시간별 부하 예측치가 총부하와 얼마나 근접한지를 나타낸다. MSE는 오차 제곱 평균으로 큰 오차에 더 민감하며, 통계적으로는 예측 오차의 분산적 특성, 물리적으로는 부하 예측치외 총부하 간의 불일치 영향을 강조하여 평가하는 지표이다.

표 2. 모델 학습에 사용된 하이퍼파라미터

Table 2. Hyperparameters used for model training

Hyper parameter value
Look back window 24
Learning rate $(\eta)$ $10^{-2}/10^{-3}/10^{-4}$
Dropout $(r)$ 0 / 0.1 / 0.2
Optimizer Adam
Loss function MAE
Epochs 300
Batch size 32
Train/ Validation/ Test data rate 0.7/ 0.1/ 0.2

5.2 입력 조합에 따른 성능 분석

본 절에서는 입력 변수 조합이 총부하 추정 성능에 미치는 영향을 분석하였다. 이를 위해 표 1에서 정의된 입력 변수들을 조합하여 총 8가지 입력 변수 조합(Configuration 1–8)을 구성하고, 제안한 모델을 각각 학습하여 성능을 비교하였다. 표 3은 각 입력 조합에 따른 예측 성능을 나타낸다.

모든 외인 변수를 포함한 Configuration 1은 MAE 3.88⨯10-3, MSE 5.70⨯10-3로 가장 우수한 성능을 기록하였다. 반면, 기상 변수를 제외한 Configuration 8은 MAE 4.86⨯10-3, MSE 10.10⨯10-3로 가장 낮은 성능을 보였다. 이는 기상 요인뿐 아니라 날짜와 지역 요인까지 함께 고려하는 것이 총부하 추정에 실질적으로 기여함을 시사한다.

예를 들어, 일사량은 PV의 단기 변동을 직접적으로 나타내고, 기온의 기여는 수요와 공급 양측에서 동시에 나타난다. 수요 측면에서는 기온 변화가 냉, 난방 수요와 직접적으로 연계 되어 총부하 변동을 설명하며, 이는 계절적 추세 성분 변화로 이어진다. 공급 측면에서는 기온 변화가 PV 모듈의 효율을 변화시켜 동일한 일사 조건에서도 발전량이 변동하며 [18], 일사량만으로 설명되지 않는 PV 출력 변동에 기여한다. 강수량, 적설량은 간헐적이지만 이벤트성 패턴을 보완한다. 날짜와 지역 변수는 시간적, 공간적 맥락에 기여하였다. 결론적으로 외인 변수 전반을 통합적으로 고려하는 것이 총부하 추정의 정확도를 향상시키는 데 가장 효과적임을 확인하였다.

그림 5는 Configuration 1 기반의 시간단위 일별 총부하 예측 결과를 나타낸다. 각 그래프는 동일한 하루에 대해 모델의 예측값과 총부하를 시계열 형태로 비교한 것이다.(a)는 예측 성능이 가장 우수했던 best case, (b)는 상대적으로 오차가 컸던 worst case를 각각 보여준다. 검은 실선은 실제 총부하, 빨간색 실선은 예측 부하, 파란 점선은 순부하 패턴을 의미한다. (a)의 경우 예측 곡선이 실제 부하와 거의 일치하여 일 변동 패턴을 정확히 재현하며, (b)의 경우 낮 시간에 일부 오차가 존재하나 전체적인 부하 추세를 안정적으로 예측하고 있음을 확인할 수 있다.

표 3. 입력 구성(Configuration 1〜8)별 예측 성능

Table 3. Prediction performance across input configurations(Configurations 1〜8)

Configuration Inputs MAE $(\times 10^{-3})$ MSE $(\times 10^{-3})$
1 ALL 3.881 0.057
2 1, 2, 3, 7, 8, 9, 10 4.439 0.072
3 1, 2, 3, 4, 7, 8, 9, 10 4.189 0.063
4 1, 2, 3, 5, 6, 7, 8, 9, 10 4.504 0.068
5 1, 4, 7, 8, 9, 10 4.261 0.068
6 1, 2, 3, 4, 5, 6 4.260 0.063
7 1, 5, 6, 7, 8, 9, 10 4.613 0.082
8 1, 7, 8, 9, 10 4.866 0.101

그림 5. 하루 단위 총부하 추정 결과

Fig. 5. Daily gross load estimation results

../../Resources/kiee/KIEE.2026.75.2.266/fig5.png

5.3 제안한 모델의 최적화 실험

표 4는 Configuration 1을 고정한 상태에서 학습률 $\eta^{\in}${$10^{-2}, 10^{-3}, 10^{-4}$}로 그리드 탐색한 결과이다. 다른 설정은 표 2와 동일하게 유지하였다. 실험 결과, $\eta =10^{-3}$에서 MAE 3.881⨯10-3, MSE 0.057⨯10-3로 최저 오차를 기록하였다. 학습률이 너무 크거나 작을경우 오차가 급증하였다. 이후 모든 실험에서 $\eta =10^{-3}$을 기본 값으로 사용한다.

표 4. 제안 모델의 학습률 최적화 실험 결과

Table 4. Learning-rate optimization results for the proposed model

Learning rate MAE $(\times 10^{-3})$ MSE $(\times 10^{-3})$
0.01 7.089 0.113
0.001 3.881 0.057
0.0001 7.770 0.233

표 5는 드롭아웃 확률 $r^{\in}${$0, 0.1, 0.2$}을 변화시키며 나머지 설정일 동일하게 유지한 결과이다. 드롭아웃이 낮을수록 성능이 개선되는 경향을 보였고, $r=0$에서 MAE 3.881⨯10-3, MSE 0.057⨯10-3로 최저치를 달성하였다. 이후 모든 실험에서는 $r=0$을 채택하였다.

표 5. 제안 모델의 드롭아웃률 실험 결과

Table 5. Dropout-rate experiments for the proposed model

Dropout MAE $(\times 10^{-3})$ MSE $(\times 10^{-3})$
0 3.881 0.057
0.1 5.849 0.101
0.2 6.268 0.096

5.4 제안되는 모델의 복잡성과 기존 모델들과 성능 비교

본 연구에서는 제안된 모델의 성능을 검증하기 위해 기존의 다양한 Baseline 모델들과 비교 실험을 수행하였다. 비교를 위한 Baseline 모델들은 iTransformer [20], Autoformer [21], FEDformer [22], Transformer [23], TSMixer [24], DLinear [13], BiLSTM [12]을 포함한다. 제안 모델의 설계 타당성을 입증하기 위해 파라미터 수(Parameters), 연산량(FLOPs), 에포크당 학습시간(Train time/Epoch), MAE, MSE를 종합적으로 평가하였다. 모든 모델은 동일한 입력 변수 구성과 동일한 학습, 검증프로토콜(데이터 분할 포함)하에서 공정하게 평가되었다.

표 6. 기존 모델과 제안 모델 간의 계산 복잡도 및 학습 효율 비교

Table 6. Comparison of model complexity and computational efficiency across baseline models and the Proposed model

Model Parameters $(\times 10^{6})$ FLOPs $(\times 10^{6})$ Train time/Epoch (s/epoch)
iTransformer 0.087 0.447 0.26
Autoformer 0.154 1.632 0.48
FEDformer 0.252 1.337 1.45
Transformer 0.149 3.192 0.44
TSMixer 0.033 0.167 0.13
DLinear 0.018 0.023 0.11
BiLSTM 0.069 0.032 0.10
Proposed 1.015 0.600 0.51

표 7. 기존 모델들과 제안 모델의 예측 성능 비교

Table 7. Comparison prediction performance among baseline models and the proposed model

Model MAE $(\times 10^{-3})$ MSE $(\times 10^{-3})$
iTransformer 7.583 0.131
Autoformer 16.443 0.621
FEDformer 17.396 0.691
Transformer 5.697 0.069
TSMixer 6.856 0.109
DLinear 8.942 0.251
BiLSTM 4.441 0.068
Proposed 3.881 0.057

성능 지표는 표 6표 7에 제시되어 있으며, Parameters는 학습 가능한 가중치의 총 개수를 의미하며, 모델의 구조적 복잡도를 나타낸다. FLOPs는 한번의 순전파를 수행하는 데 필요한 계산량을 의미한다. Train time/Epoch(s/epoch)는 한 epoch를 학습하는 데 소요되는 평균 시간을 초 단위로 나타내며, 모델의 학습 효율을 평가하는 지표이다. 제안된 모델은 BiLSTM 단일 모델 $0.069\times 10^{6}$에 비해 파라미터 수는 $1.015\times 10^{6}$으로 다소 증가하였으나, FLOPs $0.6\times 10^{6}$ 및 에포크당 학습기간 0.51 s/epoch은 여전히 낮게 나타났다. 이는 제안된 구조가 계산 복잡도를 과도하게 증가시키지 않으면서도 예측 성능을 향상시켰음을 의미한다. 특히 MAE와 MSE가 각각 $3.881\times 10^{-3}$와 $0.057\times 10^{-3}$로 모든 비교 모델 중 가장 낮게 나타나, 정확도와 효율성 간의 균형이 우수함을 보인다.

한편, Transformer 계열 모델(Autoformer, FEDformer, iTransformer, Transformer등)은 제안된 모델보다 파라미터 수가 적음에도 불구하고, 학습 시간이 상대적으로 길게 나타났다. 이는 [19]에서 지적된 바와 같이, Self-Attention 메커니즘으로 인한 계산량 증가하기 때문이다. 반면, 제안된 모델은 DLinear의 분해 모듈과 BiLSTM의 학습 구조를 결합함으로 성능 대비 연산 효율성이 개선 됨을 확인할 수 있다.

5.5 지역별 일반화 성능 분석

본 절에서는 제안 모델의 일반화 성능을 평가하기 위해 Baseline 모델들에 대해 임의의 지역별 성능 비교를 수행하였다. 그림 6은 지역 간의 특성 차이를 시각적으로 확인하기 위해, 임의로 선정한 지역(11, 21, 31)의 순부하 및 총부하에 대해 시간대별 mean 및 min–max 프로파일을 제시한다. 그림 6(a)–(b)는 지역 11의 순부하와 총부하 패턴을 나타내며, 시간대별 부하 수준과 변동성이 다른 지역과 뚜렷하게 구별됨을 확인할 수 있다. 그림 6(c)–(d), (e)–(f)는 각각 지역 21과 31의 프로파일로, 지역별로 부하 형태, 변동성, 최대, 최소 부하 구간 등이 크게 다름을 보여준다.

그림 6. 지역별 순부하 및 총부하의 시간대별 패턴(평균값 및 최소-최대 범위 표시)

Fig. 6. Hourly net and gross load patterns across regions (mean and min–max range)

../../Resources/kiee/KIEE.2026.75.2.266/fig6.png

본 연구에서는 제안 모델의 일반화 성능을 평가하기 위해, 서로 다른 부하 특성을 가진 세 지역(Region 11, 21, 31)을 대상으로 Baseline 모델과의 예측 오차(MAE, MSE)를 비교하였다(표 8). 분석 결과, 제안 모델은 각 지역에서 가장 우수한 Baseline 모델(BiLSTM)보다 MAE 기준 약 9 ~ 22%, MSE 기준 약 28 ~ 42% 낮은 오차를 보였다. 또한 가장 성능이 낮은 Baseline 모델(FEDformer)과 비교할 경우, 지역별 MAE는 약 72 ~ 86%, MSE는 92 ~ 98%까지 감소하여 상대적으로도 매우 큰 성능 향상을 확인할 수 있었다. 이러한 결과는 Proposed 모델이 지역별로 상이한 부하 특성에도 불구하고 안정적인 예측 성능을 유지하며, 다양한 배전선로 환경에서 높은 일반화 능력을 갖추고 있음을 정량적으로 입증한다.

표 8. 지역별 모델 간의 성능 평가

Table 8. Regional Performance Comparison of Models

Region Model MAE $(\times 10^{-3})$ MSE $(\times 10^{-3})$
11 iTransformer 7.659 0.102
Autoformer 22.774 1.522
FEDformer 23.36 1.723
Transformer 5.083 0.054
TSMixer 7.392 0.115
DLinear 12.464 1.027
BiLSTM 4.755 0.05
Proposed 3.696 0.035
21 iTransformer 6.5 0.072
Autoformer 19.645 0.708
FEDformer 21.775 0.795
Transformer 4.995 0.046
TSMixer 6.905 0.083
DLinear 9.326 0.152
BiLSTM 3.86 0.031
Proposed 3.049 0.018
31 iTransformer 5.784 0.057
Autoformer 11.105 0.203
FEDformer 11.462 0.235
Transformer 4.758 0.04
TSMixer 5.493 0.052
DLinear 7.753 0.101
BiLSTM 3.471 0.025
Proposed 3.142 0.018

5.6 통계적 유의성 분석

본 절에서는 제안되는 모델의 통계적 유의성을 평가하기위해 Proposed와 Baseline 모델들 간의 Paired t-test를 수행하였다. 표 9는 임의로 선정한 지역(11, 21, 31)의 동일 날짜 단위에서 Proposed 모델과 Baseline 모델의 일별 MSE를 쌍으로 구성하여 계산한 Paired t-test 결과를 나타낸다. 본 연구에서 사용한 t-test는 날짜 $i$ 에서의 MSE 차이 $d_{i}$를 이용하여 전체 $n$일에 대한 평균차이 $\overline{d}$, 표준편차 $s_{d}$, 그리고 다음의 검정 통계량을 산출하였다:

(9)
$d_{i}=MSE_{i}^{(P)}-MSE_{i}^{(B)}, \overline{d}=\dfrac{1}{n}\sum_{i=0}^{n}d_{i},$
(10)
$s_{d}=\sqrt{\dfrac{1}{n-1}\sum_{i=0}^{n}(d_{i}-\overline{d})^{2}}, t =\dfrac{\overline{d}}{s_{d}/\sqrt{n}}.$

여기서 $d_{i}$은 Proposed 모델과 Baseline 모델 간의 일별 MSE 차이를 의미하며, $d_{i}<0$은 Proposed 모델의 오차가 Baseline 모델보다 더 낮음을 의미한다. t-통계량은 두 모델 간의 평균 차이가 통계적으로 유의한지 판단하는 기준이 되며, 절대값이 클수록 두 모델 간의 차이가 뚜렷함을 나타낸다. p-value는 자유도 $n-1$을 갖는 t-분포의 누적함수 분포 $F_{t}(\bullet)$를 이용하여 다음과 같이 계산하였다.

(11)
$p=2[1-F_{t}(| t | | n-1)].$

여기서 p-value는 두 모델 간의 관측된 차이가 우연히 발생할 확률을 의미하며, 일반적으로 $p<0.05$이면 통계적으로 유의미한 차이가 있다고 판단한다. 따라서 p-value가 작을수록 Proposed 모델의 우수성이 통계적으로 신뢰할 수 있음을 의미한다.

표 9의 결과는 세 개의 모든 지역에서 t-통계량 값이 음수로 나타났으며, 이는 정의된 차이에 따라 Proposed 모델의 일별 MSE가 Baseline 모델보다 일관되게 더 낮다는 방향성을 의미한다. p-value 또한 대부분 0 또는 0 이하의 극도로 작은 값으로 계산되었다. 이는 두 모델 간의 차이가 우연히 발생했을 가능성이 사실상 없으므로 제안된 모델이 다양한 부하 환경에서 재현성 있는 성능 향상을 제공함을 검증하였다.

표 9. 지역별 Proposed 모델과 Baseline 모델 간의 일별 MSE에 대한 Paired t-test 통계적 유의성 평가

Table 9. Paired t-test assessing the statistical significance of daily MSE differences between the Proposed model and Baseline models across regions

Region Proposed Baseline t-stat p-value
11 Proposed iTransformer -47.574 0
Autoformer -13.485 1.303 $(\times 10^{-40})$
FEDformer -14.377 8.534 $(\times 10^{-46})$
Transformer -14.291 2.752 $(\times 10^{-45})$
TSMixer -28.983 1.284 $(\times 10^{-168})$
DLinear -9.434 6.311 $(\times 10^{-21})$
BiLSTM -14.631 2.513 $(\times 10^{-47})$
21 Proposed iTransformer -78.098 0
Autoformer -88.051 0
FEDformer -54.868 0
Transformer -63.925 0
TSMixer -91.267 0
DLinear -88.918 0
BiLSTM -42.572 0
31 Proposed iTransformer -62.6 0
Autoformer -69.077 0
FEDformer -58.351 0
Transformer -85.193 0
TSMixer -77.135 0
DLinear -69.165 0
BiLSTM -20.583 0

6. Conclusion

본 연구에서는 BTM PV 발전량을 직접 관측할 수 없는 배전계통 환경에서, 변전소 순부하와 접근성이 높은 외인 변수(기상, 날짜, 지역)를 활용하여 총부하를 추정하는 DLinear–BiLSTM 하이브리드 모델을 제안하였다. 제안된 모델은 DLinear 기반의 1차 시계열 분해를 통해 추세, 계절 성분을 분리하고, BiLSTM 구조를 통해 전후 시간 맥락을 반영한 비선형 패턴을 학습하도록 설계되었다. 본 연구에서는 다양한 입력 변수 조합 비교, 모델 최적화 분석, Baseline 모델과의 성능 비교를 수행하여 제안 모델의 효과를 검증하였다. 입력 변수 분석 결과, 기상, 날짜, 지역 정보를 통합적으로 반영할 때 오차가 가장 크게 감소하였고, 지역별 성능 비교에서도 임의의 지역에서 Baseline 모델 대비 일관된 정확도 향상을 확인하였다. 또한 Paired t-test 분석을 통해 성능 개선이 통계적으로 유의함을 입증하였다. 제안된 접근법은 추가 계측 인프라나 PV 설비 정보를 필요로 하지 않아, BTM PV 데이터가 부족한 실제 배전망 운영 환경에서도 적용 가능성이 높다. 향후 연구는 레이블 부재 환경을 가정하여, 비지도 학습 프레임워크로 확장할 예정이다.

Acknowledgements

This research was supported by the Gyeongsangbuk-do RISE(Regional Innovation System & Education) project (Regional Growth Innovation LAB unit).

References

1 
M. M. Haque, P. Wolfs, 2016, A review of high PV penetrations is lvdistribution networks: present status, impacts and mitigation measures, Renew. Sustain. Energy Rev, Vol. 62, pp. 1195-1208DOI
2 
A. Dey, B. Chakraborty, S. Dalai, K. Bhattacharya, 2022, Insights and new practices for advanced metering infrastructure and smart energy metering framework in smart grid-a case study, pp. 323-326DOI
3 
D. Chen, D. Irwin, 2018, Sundance: black-box behind-the-meter solar disaggregation, pp. 45-55DOI
4 
K. Pu, Y. Zhao, 2023, An unsupervised similarity-based method for estimating behind-the-meter solar generation, pp. 1-5DOI
5 
E. C. Kara, C. M. Roberts, M. Tabone, L. Alvarez, D. S. Callaway, E. M. Stewart, 2018, Disaggregating solar generation from feeder-level measurements, Sustainable Energy, Grids and Networks, Vol. 13, pp. 112-121DOI
6 
J. Lin, J. Ma, J. Zhu, 2022, A privacy-preserving federated learning method for probabilistic community-level behind-the-meter solar generation disaggregation, IEEE Trans. Smart Grid, Vol. 13, No. 1, pp. 268-279DOI
7 
2023, 2023 distributed system implementation plan (DSIP) updateGoogle Search
8 
N. Balakumar, L. Kristov, M. McDonnell, M. Paterson, 2024, Distribution system operator (DSO) initial studyGoogle Search
9 
F. Bu, K. Dehghanpour, Y. Yuan, Z. Wang, Y. Zhang, 2020, A data-driven game-theoretic approach for behind-the-meter PV generation disaggregation, IEEE Trans. Power Syst., Vol. 35, No. 4, pp. 3133-3144DOI
10 
F. Bu, R. Cheng, Z. Wang, 2023, A two-layer approach for estimating behind-the-meter PV generation using smart meter data, IEEE Trans. Power Syst., Vol. 38, No. 1, pp. 885-896DOI
11 
S. Hochreiter, J. Schmidhuber, 1997, Long short-term memory, Neural Computation, Vol. 9, No. 8, pp. 1735-1780DOI
12 
A. Graves, J. Schmidhuber, 2005, Framewise phoneme classification with bidirectional LSTM and other neural network architectures, Neural Networks, Vol. 18, No. 5–6, pp. 602-610DOI
13 
A. Zeng, M. Chen, L. Zhang, Q. Xu, 2023, Are transformers effective for time series forecasting?, pp. 11121-11128DOI
14 
D. Dahlioui, M. B. Øgaard, A. G. Imenes, 2025, Snow impact on PV performance: assessing the zero-output challenge in cold areas, Renew. Sustain. Energy Rev., Vol. 213DOI
15 
M. Yue, T. Hong, J. Wang, 2019, Descriptive analytics-based anomaly detection for cybersecure load forecasting, IEEE Transactions on Smart Grid, Vol. 10, No. 6, pp. 5964-5974DOI
16 
K. Li, L. Wu, L. Fi, D. Wang, 2023, A TCN-based hybrid forecasting framework for hours-ahead utility-scale PV forecasting, IEEE Transactions on Sustainable Energy, Vol. 14, No. 4, pp. 2195-2207DOI
17 
C. Pavlatos, E. Makris, G. Fotis, V. Vita, V. Mladenov, 2023, Enhancing electrical load prediction using a bidirectional LSTM neural network, Electronics, Vol. 12, No. 22DOI
18 
S. Dubey, J. N. Sarvaiya, B. Seshadri, 2013, Temperature dependent photovoltaic (PV) efficiency and its effect on PV production in the world—A review, Energy Proc., Vol. 33, pp. 311-321DOI
19 
M.-H. Guo, 2023, Beyond Self-Attention: External Attention Using Two Linear Layers for Visual Tasks, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 45, pp. 5436-5447DOI
20 
Y. Liu, 2024, iTransformer: Inverted Transformers are effective for time series forecastingDOI
21 
H. Wu, 2021, Autoformer: Decomposition transformers with auto-correlation for long-term series forecastingDOI
22 
T. Zhou, 2022, FEDformer: Frequency enhanced decomposed transformer for long-term series forecastingDOI
23 
A. Vaswani, 2017, Attention is all you needDOI
24 
V. Ekambaram, 2023, TSMixer: Lightweight MLP-Mixer model for multivariate time series forecastingDOI

저자소개

현동호(Dong-Ho Hyun)
../../Resources/kiee/KIEE.2026.75.2.266/au1.png

received the B.S. degree in electronic engineering from the Kumoh National Institute of Technology, Gumi, South Korea, in 2024, where he is currently pursuing the M.S. degree in electronic engineering. His current research interests include power system analysis, data analysis, and learning methods.

반재필(Jae-pil Ban)
../../Resources/kiee/KIEE.2026.75.2.266/au2.png

received the Ph.D.degree in electrical engineering from Pohang University of Science and Technology, Pohang, South Korea, in 2020. From August 2020 to August 2021, he was a postdoctoral researcher at Pohang University of Science and Technology. Since 2021, he has been an Assistant Professor with the Kumoh National Institute of Technology. His research interests include robust and optimal control, hybrid systems, power system control, applications of reinforcement learning, and power system state and line parameter estimation.