• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical Engineering, Kangwon National University, Korea.)
  2. (Dept. of Electrical and Electronic Engineering, Kangwon National University, Korea.)



TSK fuzzy logic model, Multiple fuzzy predictors, interpolation and trend analysis, Segmented data, K-means clustering

1. 서 론

다양한 산업 분야와 경제 분야 및 민간 분야 등에서 전기 에너지의 사용은 불가피하고, 특히 전기 에너지는 다른 에너지로의 변환이 쉬울 뿐 아니라 변환 과정에서도 공해가 거의 없는 청정에너지이므로 전력산업은 지속적인 성장세를 보여주고 있다(1-2). 하지만, 주요 생산 방식인 화석연료 발전과 원자력 발전의 경우 탄소배출량(온실가스)의 증가 및 방사성 피폭이나 폐기물의 관리 등에서 해결해야 할 어려운 문제점을 안고 있다. 물론 풍력이나 태양광과 같은 신재생 에너지의 활용이 대한이 될 수는 있으나, 우리나라의 경우 국토의 크기나 계절적 변화로 인해 에너지 수급이나 경제성면에서 불확실성이 매우 높을 수밖에 없으며, 올해와 같이 폭염일이 기록적일 경우 전기에너지 소비의 급속한 증가에 따른 원활한 공급을 위해선 아직 화석연료와 원자력에 전적으로 의존할 수밖에 없는 구조를 나타낸다. 결국 제한적 발전 방식으로 급변하는 수요에 대한 원활한 전력공급을 위해선 공급에 대한 예측을 통해 생산된 전기 에너지를 효과적으로 분배하여 사용함으로써 불필요한 낭비를 줄이고 적절한 예비율을 통해 예기치 못한 정전사고에 대비할 수 있도록 하는 것이 이상적일 것이다.

전력부하의 예측 모형으로는 크게 통계적 기법을 이용한 모형과 지능형 기법을 이용한 모형으로 구분할 수 있으며, 통계적 예측 모델로 가장 빈번히 사용되는 자기회귀 누적 이동평균(ARIMA: Box-Jenkins model)을 Byung-Hoon et al.(3) 및 Hyun-Woo et al.(4)은 국내 전력 부하 예측 모형의 설계에 적용하여 좋은 예측 결과를 얻었다. 지능형 모형에는 대표적으로 퍼지논리시스템(FIS: Fuzzy logic system), 인공신경망(ANN: Artificial neural networks), 및 유전알고리즘(GAs: Genetic algorithms)을 들 수 있으며, Jagadish H.(5)와 Danladi et al. (6)은 장기 전력부하 예측을 위해 퍼지논리시스템을 적용, Che-Chiang et al.(7)과 Mohsen et al.(8)은 단기 부하 예측에 인공신경망을 적용, Ping-Feng et al.(9)와 Jagjeet et al.(10)은 인공신경망에 SVM(Support vector machine)을 결합하여 전력부하 예측에서 우수한 예측 결과를 얻었다. 또한, 우리는 논문 (11)에서 보간데이터를 이용한 퍼지 논리시스템과 인공신경망의 상호보완적 결합을 통해 국내 일별 최대전력 부하 예측을 수행할 수 있는 설계법을 다루었다. 하지만 기존의 연구 (11)은 비록 시스템의 성능은 우수하였지만, 하이브리드 구조에 따른 시스템의 복잡성을 야기하였으며, 사용된 국내 일별데이터가 특정 년도의 데이터로 국한되어 있어 국내 전력산업 동향을 반영하기에는 제한적 이였다.

따라서 본 논문에서는 예측시스템의 구조를 보다 효과적으로 단순화하면서도 국내 전력부하 특성을 충분히 반영할 수 있도록 전력부하 데이터의 특성에 따라 각각에 상응하는 적합한 퍼지 예측기가 독립적으로 운영되는 다수의 퍼지 예측기의 병렬 결합형 설계법을 다룬다. 각각의 독립된 퍼지 예측기의 설계를 위해선 원형의 전력 부하 데이터에 데이터의 속성이나 패턴 특성이 보다 명확히 드러날 수 있도록 보간데이터(11)를 삽입하고, 이들의 패턴 특성을 분석하여 3개의 세분화 그룹으로 분류한 후, 각 세분화 그룹에 분류된 데이터들을 사용한다.

퍼지 예측기의 기본 모델로는 TSK 퍼지 논리 모델(TSK fuzzy logic model)을 적용하여 시스템 운용 규칙의 애매성 취급과 통계적 기법인 선형회귀 모형의 이점을 동시에 취할 수 있도록 하였으며, 규칙기반 생성을 위한 퍼지 군집화에는 구조가 단순한 K-평균 군집화 기법(K-means clustering algorithm)을 적용하여 군집의 결정률을 높일 수 있도록 하고, 선형 회귀 모형의 규칙기반 형성에 필요한 각각의 모수 추정에는 최소 자승법(Least square method)을 이용하여 간단하면서도 효과적으로 추정이 될 수 있도록 한다(12-13). 또한 각각의 퍼지 예측기의 규칙기반 형성을 위한 퍼지 군집의 수는 3개의 병렬 구조 퍼지 예측기의 분산 효과를 고려하여 최소의 규칙기반으로 운용될 수 있도록 두 개의 퍼지 집합을 이용하며, 실제 예측을 수행하는 과정에서는 입력되는 전력데이터의 추세 분석을 통해 상응하는 퍼지 예측기만 독립적으로 예측을 수행하게 하여 정보의 중복에서 오는 오류나 예측의 복잡성을 완화할 수 있도록 한다. 마지막으로 2009년 2월부터 월별로 수집된 국내 최대전력 부하 데이터(14)를 이용하여 시스템을 검증함으로써 제안된 시스템 설계 방법의 타당성과 효용성의 검증 및 최근의 국내 전력부하 패턴을 고려할 수 있도록 한다.

2. 제안된 시스템의 구조와 개념

2.1 제안된 시스템의 구조

그림 1은 본 논문의 시스템 설계 과정과 예측을 수행하는 과정에 대한 전체 순서도를 보여준다.

그림. 1. 제안된 퍼지 예측 시스템의 전체 순서도

Fig. 1. The total flow chart of the proposed system

../../Resources/kiee/KIEE.2019.68.4.558/fig1.png

먼저 ①의 과정은 수집된 최대 전력 부하데이터에서 데이터에 포함된 추세 및 인접한 데이터간의 상관성을 높이기 위해 보간 데이터를 삽입하는 과정을 의미한다. 다음 ②의 과정은 보간 데이터가 삽입된 전체 데이터들 중에서 시스템 설계를 위한 훈련 데이터를 이용하여 병렬 형 TSK 퍼지 예측기를 설계하는 과정을 의미한다. 여기서 데이터의 추세 분석에는 입력 데이터의 전체 구간에 대하여 인접 데이터 간의 증가 및 감소량을 분석하고 이를 기반으로 임계값을 정한 후 데이터를 3개의 추세 변화로 구분하여 세분화하게 된다. 각각의 퍼지 예측기는 앞서 언급된 TSK 퍼지 논리 모델과 2개의 퍼지 집합 및 최소 자승법을 이용하여 각 세분화된 데이터 그룹에 적합한 형태로 설계된다. 이렇게 병렬 형 퍼지 예측 시스템의 설계가 완료되면, 전체 데이터를 이용하여 설계된 예측 시스템의 예측 성능을 평가하게 되며, ③은 이러한 과정을 나타내는 것으로 각각의 퍼지 예측기가 예측하는 시점이 다르므로 시점에 맞게 데이터를 정렬하는 과정과 정렬된 데이터로부터 원형의 전력데이터를 추출하는 과정을 거처 최종 예측결과를 얻는 과정을 나타낸다.

2.2 TSK 퍼지 규칙 기반 모델

TSK 퍼지 논리 모델은 1984년 T. Takagi, M. Sugeno 그리고 K. T. Kang에 의해 소개되었으며, $j$번째 퍼지 규칙은 식(1)와 같이 일반화되어 있다.

(1)

$R^{j} : I F x_{1}$ is $F_{1}^{j}$ and $x_{2}$ is $F_{2}^{j}$ and $\cdots$ and $x_{p}$ is $F_{p}^{j}$

$\quad T H E N y^{j}(\mathrm{x})=c_{0}^{j}+c_{1}^{j} x_{1}+c_{2}^{j} x_{2}+\cdots+c_{p}^{j} x_{p}$

여기서 $R^{j}$는 $j$번째 퍼지 규칙을 의미하고, $x$는 그 규칙에 해당하는 입력 값들이며, $F$는 각각의 입력이 만족하는 퍼지 집합의 소속 정도로 표현된다. 그리고 $y^{j}$는 $j$번째 퍼지 규칙의 국부 출력이며, $c$는 국부 출력을 얻기 위한 파라미터 값들로 주어진다.

TSK 퍼지 규칙 기반은 식(1)에서 알 수 있듯 입력 값들의 언어적 규칙을 표현하는 전반부(Antecedent part)와 이들의 추론과 회귀 모형을 이용하여 국부 출력을 산출하는 후반부(Consequent part)로 구성되어 진다. 전반부는 입력들이 각각의 퍼지 집합에 소속되는 정도(Degree of fuzzy membership)를 이용하여 규칙을 표현하므로 퍼지 군집 과정이 필요하며, 후반부는 입력에 상응하는 국부 출력을 얻기 위한 파라미터 추정이 요구된다. 본 논문에서는 이들 각각을 위해 K-평균 군집화 기법과 최소자승법을 사용한다.

3. 제안된 시스템 설계

제안된 시스템의 설계 과정은 크게 보간 데이터의 삽입, 데이터의 세분화, 병렬 형 TSK 퍼지 예측 시스템 설계과정으로 구성된다.

3.1 전력데이터의 보간

일반적으로 국내 최대 전력 부하 데이터는 산업 성장과정과 계절적 요인으로 추세성과 계절성을 포함하고 있으며, 이들을 세분화하여 분류할 경우 데이터의 양이 감소되어 시스템 설계 시 필요한 정보를 충분히 제공하지 못하거나 모수 추정에 부정확성을 초래하여 예측성능이 저하될 수 있다. 따라서 데이터의 세분화 과정을 위해선 충분한 양의 데이터가 요구되며, 이를 위해 본 논문에서는 이전 논문(11)에서 연구된 결과를 이용하여 각각의 최대 전력 부하 데이터 사이에 3개의 보간 데이터를 삽입하여 시스템을 설계 할 수 있도록 한다.

만약 $t$월에 관측된 최대 전력 부하 데이터를 $x_{t}$라 하고 다음 달에 관측된 최대 전력 부하 데이터를 $x_{t+1}$이라고 한다면, $t$월과 $t+1$월 사이에 삽입되는 보간 데이터는 식(2)와 같이 정의되어 진다.

(2)
$\begin{aligned} i x_{t}^{1} =\operatorname{mean}\left[x_{t}, \operatorname{mean}\left[x_{t}, x_{t+1}\right]\right] \\ i x_{t}^{2} =\operatorname{mean}\left[x_{t}, x_{t+1}\right] \\ i x_{t}^{3} =\operatorname{mean}\left[\operatorname{mean}\left[x_{t}, x_{t+1}\right], x_{t+1}\right] \end{aligned}$

여기서 $ix_{t}^{1}$, $ix_{t}^{2}$, 및 $ix_{t}^{3}$는 $t$월과 $t+1$월 사이에 삽입되는 첫 번째, 두 번째, 및 세 번째 보간 데이터를 의미한다.

식(2)에 의해 생성된 모든 보간데이터를 원형의 데이터에 삽입하면 시스템 설계를 위한 전체 데이터 구조는 식(3)과 같은 형태로 표현된다.

(3)

$x_{1}, i x_{1}^{1}, i x_{1}^{2}, i x_{1}^{3}, x_{2}, i x_{2}^{1}, \cdots$

$\qquad x_{N-1}, i x_{N-1}^{1}, i x_{N-1}^{2}, i x_{N-1}^{3}, x_{N}$

여기서 $N$은 원형의 최대 전력 부하 데이터의 길이를 의미한다.

결국 원형의 최대 전력 부하 데이터의 길이 $N$은 보간데이터로 인해 $N+(N-1)\times 3$으로 증가되므로 인접한 데이터 상호간의 상관성이나 추세와 같은 시스템 설계에 요구되는 유용한 정보를 충분히 제공할 수 있게 된다.

3.2 전력데이터의 세분화

식(3)의 전력 부하 데이터를 세분화하기 위해선 먼저 식(1)의 TSK 퍼지 논리 모델의 전반부와 후반부 회귀모형의 모수 추정을 위한 적절한 입력데이터의 개수를 정의하여야 한다. 입력 데이터의 개수는 규칙기반을 구성하는 퍼지 규칙들의 개수와 추정되는 모수의 정확성, 그리고 출력의 위한 추론 과정의 복잡성과 밀접한 관계를 가지며, 본 논문에서는 기존 논문들(7,13)에서와 같이 3개의 입력 데이터를 기반으로 예측 값을 얻는 회귀모형을 이용한다. 따라서 식(3)의 주어진 데이터를 제안된 TSK 퍼지 논리 모델에 적용하기 위해 입출력 쌍의 행렬 구조로 표현하면 다음과 같이 표현될 수 있다.

(4)
X = [ x 1 i x 1 1 i x 1 2 i x 1 3 i x 1 1 i x 1 2 i x 1 3 x 2 x t 1 i x t 2 i x t 3 x t + 1 x N - 1 x N - 1 2 x N - 1 3 x N ]

식(4)를 데이터의 형태로 치환하여 표현하면 다음과 같이 표현할 수 있다.

(5)
D = [ d 1 d 2 d 3 d 4 d 2 d 3 d 4 d 5 d i d i + 1 d i + 2 d i + 3 d 4 N - 6 d 4 N - 5 d 4 N - 4 d 4 N - 3 ]

여기서 $d_{4N-3}$은 원형의 데이터 $x_{1},\: x_{2},\:\cdots ,\:x_{N}$에 대하여 각각의 데이터 사이에 3개의 보간 데이터가 삽입되었으므로 치환된 데이터에 의해 늘어난 길이로 표현된 데이터 $d_{1},\: d_{2},\:\cdots ,\: d_{N+(N-1)\times 3}$을 의미한다.

식(5)와 같이 데이터의 구조가 완성되면, 데이터의 추세를 분석하여 세분화 하는 과정을 거치게 된다. 여기서 식(5)의 1~3열의 모든 데이터가 TSK 퍼지 논리 모델의 회귀모형 식을 위한 3개의 입력데이터가 되며, 4열의 모든 데이터는 국부 출력 값을 의미하므로(또는 예측되어야 할 값) 추세 분석을 위해선 입력 데이터들만 요구된다.

입력데이터의 추세 분석에는 입력 데이터 쌍의 전체 구간을 기준으로 입력 데이터 쌍내의 데이터 상호간의 변화량을 다음과 같이 분석한다.

(6)
\begin{align*} c_{1}^{k}=\dfrac{d_{(k,\:2)}-d_{(k,\:1)}}{\left | d_{(k,\:3)}-d_{(k,\:1)}\right |},\: c_{2}^{k}=\dfrac{d_{(k,\:3)}-d_{(k,\:2)}}{\left | d_{(k,\:3)}-d_{(k,\:1)}\right |},\:\\ \\ where k=[1,\:4N-6] \end{align*}

여기서 $c_{1}^{k}$는 식(5)의 $k$번째 행의 입력데이터에 대하여 입력데이터의 전체 구간의 절대 값에 대하여 첫 번째 입력데이터와 두 번째 입력데이터사이의 추세변화(기울기의 형태)를 분석하는 과정이다.

식(6)의 분석과정 종료 후 데이터 군의 세분화를 위한 경계 값은 다음과 같이 정의 된다.

(7)

c p 1 = mean ( c 1 a l l ) , c p 2 = mean ( c 2 a l l )

where a l l = 1 : 4 N - 6

여기서 $cp$는 세분화 임계값(critical point)을 의미하며, 식(7)식(6)에서 분석된 모든 값들에 대한 평균을 임계 값으로 정의한다는 것을 의미한다.

마지막으로 임계값을 기준으로 다음과 같이 3개의 세분화된 데이터 그룹을 생성하게 된다.

(8)

for k = 1 : 4 N - 6

if c 1 k > c p 1 and c 2 k > c p 2

data set k = segmented group1

elseif c 1 k < c p 1 and c 2 k < c p 2

data set k = segmented group 2

else

data set k = segmented group3

end

여기서 $data set^{k}$는 $k$번째 입력 데이터 쌍을 의미하고 $segmented$ $group$은 각 입력데이터 쌍을 세분화하여 구성하게 되는 집단을 의미한다.

3.3 병렬 형 TSK 퍼지 예측 시스템 설계

식(1)의 각각의 퍼지 예측기 설계에 사용되는 TSK 퍼지 논리 모델은 본 논문에서 3개의 입력 데이터와, 각 예측기의 출력 값을 추론하는 퍼지 규칙의 수를 최소화하기 위한 각 2개의 퍼지집합으로 인해 다음과 같이 수정된다.

(9)
\begin{align*} R^{sg,\:j}:\mrm{if}d_{i}^{sg}is F_{[1,\:2]}^{sg,\:j}\mrm{and}d_{i+1}^{sg}is F_{[1,\:2]}^{sg,\:j}\mrm{and}d_{i+2}^{sg}is F_{[1,\:2]}^{sg,\:j} _{_}_{_}\\ THEN d_{i+3}^{sg,\:j}(\mrm{x})= c_{0}^{sg,\:j}+c_{1}^{sg,\:j}d_{i}+c_{2}^{sg,\:j}d_{i+1}+ c_{p}^{sg,\:j}d_{i+2} \end{align*}

여기서 $sg$는 3개의 세분화된 그룹 중 하나를 의미한다. 따라서 $R^{sg,\:j}$는 $sg$번째 그룹에 분류된 입력 데이터들로 설계되는 퍼지 예측기의 $j$번째 규칙을 의미하고 $d_{i}^{sg}$는 그 세분화 그룹의 $i$번째 입력을 의미한다. 또한 $F_{[1,\:2]}^{sg,\:j}$는 $sg$번째 세분화 그룹의 $j$번째 퍼지 규칙에 대하여 입력이 만족하는 두 개 중 하나의 퍼지집합을 의미한다. 마지막으로 $c^{sg,\:j}$는 $sg$번째 세분화 그룹의 $j$번째 퍼지규칙을 만족하는 입력들로부터 추정되어야 할 모수를 의미한다.

각 예측기의 퍼지 집합들의 중심은 구조가 단순하면서도 성능이 양호한 K-평균 군집화 기법을 적용하며, 다음과 같은 절차를 따른다. 먼저 $sg$번째 퍼지 예측기 설계에 사용된 모든 입력 데이터 집합을 $D^{sg}$라 하면, $sg$번째 퍼지 예측기의 초기 퍼지집합의 중심은 3개의 입력 데이터 군에 대하여 평균과, 최소 및 최대값을 이용하여 다음과 같이 정의된다.

(10)
\begin{align*} Z_{\in ial(1)}^{sg}=[z_{\in ial(1)}^{sg,\:1}z_{\in ial(1)}^{sg,\:2}z_{\in ial(1)}^{sg,\:3}]_{_}_{_}\\ Z_{\in ial(2)}^{sg}=[z_{\in ial(2)}^{sg,\:1}z_{\in ial(2)}^{sg,\:2}z_{\in ial(2)}^{sg,\:3}] \end{align*} \begin{align*} where_{_}\\ z_{\in ial(1)}^{sg,\:1}=mean[\min(D^{sg}(:,\:1)),\: mean(D^{sg}(:,\:1))] \end{align*} $z_{\in ial(1)}^{sg,\:2}=mean[\min(D^{sg}(:,\:2)),\: mean(D^{sg}(:,\:2))]$ $z_{\in ial(1)}^{sg,\:3}=mean[\min(D^{sg}(:,\:3)),\: mean(D^{sg}(:,\:3))]$ \begin{align*} z_{\in ial(2)}^{sg,\:1}=mean[\max(D^{sg}(:,\:1)),\: mean(D^{sg}(:,\:1))]_{_}_{_}\\ z_{\in ial(2)}^{sg,\:2}=mean[\max(D^{sg}(:,\:2)),\: mean(D^{sg}(:,\:2))]_{_}_{_}\\ z_{\in ial(2)}^{sg,\:3}=mean[\max(D^{sg}(:,\:3)),\: mean(D^{sg}(:,\:3))]\\ \end{align*}

여기서 $mean(D^{sg}(:,\:1))$는 $sg$번째 입력데이터 쌍들에서 첫 번째 열의 모든 데이터들에 대한 평균을 의미하며, 나머지도 같은 형태의 의미로 해석될 수 있다.

이렇게 초기 두 개의 퍼지집합의 중심이 설정되면, $sg$번째 퍼지 예측기의 입력 데이터들은 상응하는 예측기의 초기 중심들과의 유클리드 거리(Euclidean distance)를 계산하여 가까운 중심의 퍼지집합으로 포함되는 과정과 군집화된 데이터들의 평균으로 퍼지 집합 중심을 갱신하는 과정을 거치게 되며, 다음 조건을 만족할 때까지 반복 수행된다.

(11)
| Z i + 1 s g - Z i s g Z i s g | < 1 0 -4

여기서 $Z_{i+1}^{sg}$는 갱신된 중심을 의미하고 $Z_{i}^{sg}$는 갱신 전의 중심을 의미한다.

위와 같이 퍼지 집합의 분할이 완료되면, 각각의 퍼지 예측기는 3개의 입력과 2개의 퍼지 집합을 이용하므로 최대 8개의 퍼지 규칙과 이들의 점화 강도를 이용하여 추론을 수행하게 된다.

식(12)는 각 규칙의 점화강도 연산을 위해 본 논문에서 사용한 삼각형 소속함수를 보여준다.

(12)

if d i g g < z ( 1 ) s g or d i s g > z ( 2 ) s g

μ L s g ( d i s g ) = 1 or μ R s g ( d i s g ) = 1

elseif d i s g z ( 1 ) s g and d i s g z ( 2 ) s g

μ L s g ( d i s g ) = | d i s g - z ( 2 ) s g | | z ( 2 ) s g - z ( 1 ) s g |

μ R s g ( d i s g ) = | d i s g - z ( 1 ) s g | | z ( 2 ) s g - z ( 1 ) s g |

end

여기서 $\mu_{L}^{sg}$는 $sg$번째 예측기의 $i$번째 입력 데이터 $d_{i}^{sg}$가 첫 번째 퍼지집합을 만족하는 소속 정도를 의미하고 $\mu_{R}^{sg}$는 같은 데이터가 두 번째 퍼지 집합을 만족하는 소속 정도를 의미한다.

식(9)의 $sg$번째 퍼지 예측기의 $j$번째 퍼지 규칙을 만족하는 입력데이터쌍이 $n$개라면 후반부 회귀식은 다음과 같은 연립방정식 형태로 표현 가능할 것이다.

(13)
\begin{align*} \begin{aligned}\begin{aligned} d_{i+3}^{sg,\:j}(1)=c_{o}^{sg,\:j}+c_{1}^{sg,\:j}d_{i}^{sg,\:j}(1)+c_{2}^{sg,\:j}d_{i+1}^{sg,\:j}(1)+c_{3}^{sg,\:j}d_{i+2}^{sg,\:j}(1) \\ \vdots\qquad\qquad\vdots\qquad\qquad\vdots\qquad\qquad\quad\vdots\qquad\qquad\quad\vdots\qquad\qquad \end{aligned} \\\begin{aligned}\begin{aligned}d_{i+3}^{sg,\:j}(q)=c_{o}^{sg,\:j}+c_{1}^{sg,\:j}d_{i}^{sg,\:j}(q)+ c_{2}^{sg,\:j}d_{i+1}^{sg,\:j}(q) + c_{3}^{sg,\:j}d_{i+2}^{sg,\:j}(q) \\ \vdots\qquad\qquad\vdots\qquad\qquad\vdots\qquad\qquad\quad\vdots\qquad\qquad\quad\vdots\qquad\qquad \end{aligned} \\ d_{i+3}^{sg,\:j}(n)=c_{o}^{sg,\:j}+c_{1}^{sg,\:j}d_{i}^{sg,\:j}(n)+c_{2}^{sg,\:j}d_{i+1}^{sg,\:j}(n)+c_{3}^{sg,\:j}d_{i+2}^{sg,\:j}(n)\end{aligned}\end{aligned} \end{align*}

여기서 $d_{i+3}^{sg,\:j}(q)$는 $sg$번째 예측기 설계에 사용된 모든 입력데이터들 중 $j$번째 퍼지 규칙을 만족한 $n$개의 입력데이터 쌍들 중 $q$번째 입력데이터 쌍의 4열값으로 모수 추정을 위한 국부 출력값을 의미한다. 또한 우항의 $d^{sg,\:j}(q)$는 나머지 세 개의 입력 데이터를 의미하고 $c^{sg,\:j}$는 이 입력들과 국부 출력으로부터 추정되는 모수들을 의미한다.

식(13)의 연립방정식은 다음과 같이 행렬과 벡터로 표현할 수 있다.

(14)
$D_{output}^{sg,\:j}=D_{\in put}^{sg,\:j}C^{sg,\:j}$

여기서 $D_{output}^{sg,\:j}=[d_{i+3}^{sg,\:j}(1)\cdots d_{i+3}^{sg,\:j}(q)\cdots d_{i+3}^{sg,\:j}(n)]^{T}$이고, $C^{sg,\:j}=$$[c_{0}^{sg,\:j}c_{1}^{sg,\:j}c_{2}^{sg,\:j}c_{3}^{sg,\:j}]^{T}$를 의미한다. 또한 $D_{\in put}^{sg,\:j}$는 다음과 같이 표현된다.

(15)
$D_{\in put}^{sg,\:j}=\left[ \begin{array}{cccc}{1} & {d_{i}^{s g, j}(1)} & {d_{i+1}^{s, j}(1)} & {d_{i+2}^{s g, j}(1)} \\ {\vdots} & {\vdots} & {\vdots} & {\vdots} \\ {1} & {d_{i}^{s g, j}(q)} & {d_{i+1}^{s, j}(q)} & {d_{i+2}^{s g, j}(q)} \\ {\vdots} & {\vdots} & {\vdots} & {\vdots} \\ {1} & {d_{i}^{s g, j}(n)} & {d_{i+1}^{s g, j}(n)} & {d_{i+2}^{s g, j}(n)}\end{array}\right]$

그러므로 식(14)의 모수 벡터 $C^{sg,\:j}$는 최소자승법에 의해 다음과 같이 추정될 수 있다.

(16)
$\hat C^{sg,\:j}=[(D_{\in put}^{sg,\:j})^{T}D_{\in put}^{sg,\:j}]^{-1}(D_{\in put}^{sg,\:j})^{T}D_{output}^{sg,\:j}$

식(16)의 최소자승법에 의해 추정되는 모수들은 실제 출력 값 $D_{output}^{sg,\:j}$과 추정된 모수에 의해 연산된 시스템의 예측 값 $\hat D_{output}^{sg,\:j}=D_{\in put}^{sg,\:j}\hat C^{sg,\:j}$사이에서 다음의 오차 제곱함수 $E^{j}$를 최소화 할 수 있는 형태로 유도되어 진다.

(17)
$E^{j}=(D_{output}^{sg,\:j}-\hat D_{output}^{sg,\:j})^{T}(D_{output}^{sg,\:j}-\hat D_{output}^{sg,\:j})$

위와 같은 과정들은 각각의 예측기의 모든 규칙의 모수 추정에 동일하게 적용된다.

마지막으로 위와 같이 추정된 모수들을 이용한 예측 국부 출력과 규칙의 전반부에서 연산된 규칙의 점화 강도를 이용하여 시스템의 최종 출력을 얻게 된다. 하나의 입력 데이터 쌍은 여러 개의 퍼지규칙을 만족할 수 있으며, 만약 $sg$번째 예측기의 $q$번째 입력 데이터 쌍이 $M$개의 퍼지 규칙을 만족하였다면, 이 입력데이터 쌍으로부터 예측기는 다음과 같이 최종 출력을 유도하게 된다.

(18)
$\hat d_{i+4}^{sg}(q)= \dfrac{\sum_{j=1}^{M}f^{sg,\:j}" "\hat c_{0}^{sg,\:j}+\hat c_{1}^{sg,\:j}d_{i}^{sg}(q)+\hat c_{2}^{sg,\:j}d_{i+1}^{sg}(q)+\hat c_{3}^{sg,\:j}d_{i+3}^{sg}(q)}{\sum_{j=1}^{M}f^{sg,\:j}}$

여기서 $f^{sg,\:j}$는 $sg$번째 예측기의 $j$번째 규칙이 점화되는 강도로 minimum연산을 통해 다음과 같이 얻어진다.

(19)
$f^{sg,\:j}=\min[\mu^{sg,\:j}(d_{i}^{sg})\mu^{sg,\:j}(d_{i+1}^{sg})\mu^{sg,\:j}(d_{i+2}^{sg})]$

위와 같은 과정을 통해 모든 데이터에 대하여 예측을 수행한 후, 길이가 변화된 보간데이터를 원형의 데이터로 복원하는 것이 요구되며, 식(20)은 원형의 데이터에 상응하는 예측 데이터를 추출하는 과정을 보여준다.

(20)
$\hat x_{t}=\hat d_{3*(t-1)+t}, \: \quad where \quad t=[2,\:N]$

4. 시뮬레이션

시스템의 성능검증을 위해 본 논문에선 2009년 2월부터 2018년 2월까지 수집된 월별 최대 전력부하 데이터(KEPCO: 전력통계 속보)(14)를 이용하였으며, 총 109개의 데이터로 구성된 데이터 중 2015년 12월까지 83개의 최대 전력 부하 데이터를 시스템 설계용 학습데이터로, 나머지 2018년 2월까지의 데이터를 시스템 검증용 데이터로 사용하였다. 그림 1은 각 세분화 그룹 내의 데이터들에 대한 K-평균 군집 알고리즘의 수행결과를 보여준다.

그림. 2. 각 예측기의 K-평균 군집화 과정

Fig. 2. K-means clustering algorithm for each predictor

../../Resources/kiee/KIEE.2019.68.4.558/fig2.png

그림 2의 a)는 세분화 그룹 1에 분류된 데이터에 대한 K-평균 군집의 결과로, 7회에 수렴하였음을 알 수 있다. 그림 b)는 세분화 그룹 2의 결과로 비교적 적은 양의 데이터로 인해 수렴이 빠르게 진행되었음을 알 수 있다. 마지막으로 그림 c)는 그룹 3의 결과로 a)와 같이 7회에 군집이 종료되었으며, 모든 그림에서 보여지 듯 초기 군집의 중심이 이동되면서 동조되는 것을 알 수 있다. 이러한 중심의 수렴은 식(12)에 의해 각 입력들의 적합한 소속 정도를 표현하게 함으로써 규칙의 점화강도를 결정짓는 중요한 역할을 수행하게 된다.

그림 3은 세분화된 데이터들을 이용하여 설계된 각 예측기들이 예측을 수행한 결과를 보여준다.

그림. 3. 각 예측기들의 예측 결과

Fig. 3. Forecasting results of each predictor

../../Resources/kiee/KIEE.2019.68.4.558/fig3.png

그림 3에서 검은색의 -*선은 실제 최대 전력 세분화 데이터를 의미하고 빨간색의 –o선은 각 예측기의 예측 결과를 의미한다. 또한 세로 점선은 학습구간과 검증구간에 대한 경계를 나타낸다. 그림 3을 살펴보면 식(6)~ (8)을 통해 세분화된 데이터의 구조를 좀 더 명확히 알 수 있다. 첫 번째 세분화된 데이터의 구조는 그림 a)에서 볼 수 있듯 학습구간이나 검증구간 모두에서 대부분 지속적인 증가 추세를 띄는 데이터들로 구성되어 있으며, 그림 c)는 지속적인 감소추세, 그리고 그림 b)는 증가와 감소가 혼재하는 데이터로 구성되어 있음을 알 수 있다. 또한 각 세분화 그룹 내의 유사패턴 데이터를 이용하여 예측기 설계를 위한 규칙기반과 모수를 추정함으로써 학습구간이나 검증구간 모두에서 비교적 정확한 예측이 수행되었음을 알 수 있다. 결국, 이러한 결과는 제안된 논문의 세분화 과정과 독립된 예측기 설계의 타당성을 보여주는 것으로 간주할 수 있다.

표 1은 세분화 과정에 따른 데이터의 수와 설계된 각 예측기들의 구동 빈도를 보여준다.

표 1. 세분화 데이터 수 및 예측기 구동빈도

Table 1. The number of segmented data and frequency rates of each predictor

Index

Data

total

learning

verifying

learning

frequence rate(%)

verifying

frequence rate(%)

sg data 1

189

144

45

43.7689

44.5544

sg data 2

51

38

13

11.5501

12.8713

sg data 3

190

147

43

44.6808

42.5742

OI data

430

329

101

learning

data/329

verifying

data/101

*sg data: segmented data

*OI data: Original Interploation data

표 1을 살펴보면 세 번째 예측기의 구동빈도가 학습구간에서 가장 높은 빈도를 나타났으나 검증구간에서는 첫 번째 예측기의 구동빈도가 가장 높게 나타났음을 알 수 있다. 또한, 첫 번째 예측기 및 두 번째 예측기의 구동 빈도가 학습구간보다 검증구간에서 증가하였음을 알 수 있으며, 이는 검증구간의 데이터 패턴이 세 번째 세분화 데이터 패턴은 감소하고 첫 번째와 두 번째 세분화 데이터 패턴은 증가하였음을 보여주는 결과로 간주할 수 있다.

그림. 4. 제안된 예측 시스템의 최종 예측 결과

Fig. 4. Final Forecasting results of the proposed prediction system

../../Resources/kiee/KIEE.2019.68.4.558/fig4.png

그림 4그림 3의 각 예측기의 예측 결과들을 원형의 시점으로 정렬한 결과와 실제 데이터 길이로 추출한 최종 결과를 보여준다. 또한 성능 비교를 위해선 논문 (11)의 퍼지 예측기 설계 방법에 본 논문에서 인용한 전력부하 데이터를 적용한 결과와 제안된 방법에 의한 예측결과를 비교하였다. 그림 4의 a)에서 검은색은 보간된 최대 전력 부하 데이터 원형, 붉은색은 논문 (11)에서 보간 데이터만을 이용하여 퍼지 예측시스템을 설계한 후 예측을 수행한 결과, 파란색은 세분화 과정을 거친 제안된 예측 시스템의 예측 결과, 마지막으로 세로 점선은 학습구간과 검증구간의 경계를 나타낸다. 그림 상으로 볼 경우 보간 데이터를 이용하여 예측을 수행한 결과나 보간 데이터를 세분화 과정을 통해 분할하고 예측을 수행한 결과나 모두 원형의 최대 전력 부하 데이터를 매우 근접하게 예측하고 있음을 알 수 있으며, 이는 보간 데이터를 이용하는 방법과 세분화 과정을 적용한 방법 모두 예측의 정확성을 높일 수 있음을 보여주는 결과로 간주할 수 있다.

제안된 예측 시스템의 보다 정확한 예측 성능 분석을 위해 학습구간과 검증구간의 MRE(Mean Rative Error:%)와 RMSE(Root Mean Square Error)를 각각 분석하였으며, 아래의 표 2는 분석 결과들을 보여 준다.

표 2. 제안된 퍼지 예측 시스템의 성능 분석

Table 2. Performance analysis of the proposed fuzzy forecasting system

System

Index

Used interpolated data only

Used interpolated and segmented data

learning

verifying

learning

verifying

MRE(%)

1.1146

1.2455

1.0999

1.2296

RMSE

1.0058*e4

7.5018*e3

9.7765*e3

7.3512*e3

e3=1,000

표 2의 결과와 그림 3의 결과를 살펴 볼 때, 원형의 전력 부하 데이터에 보간 데이터를 삽입하고 세분화 과정 없이 예측을 수행한 경우에도 학습 구간과 검증 구간 모두에서, MRE 및 RMSE 성능 지표는 비교적 정확한 예측을 수행했음을 보여 준다. 하지만, 제안된 예측시스템의 경우 표 2에서 나타나듯 보간 데이터만을 사용한 경우보다 더 정확한 예측을 수행했음을 알 수 있다. 이는 논문 (11)의 인공 신경망을 구현하여 퍼지시스템과 상호 보완적 병렬 결합을 통해 예측 성능을 개선했던 방법보다 제안된 시스템이 비교적 단순한 구조에서도 효과적으로 예측성능을 개선할 수 있음을 보여주는 결과로 간주할 수 있다.

5. 결 론

본 논문은 국내 월별 최대 전력 부하 데이터를 예측하는 예측 시스템의 설계 법을 다루었다. 시스템 설계 방법으로 정보의 결핍을 보완하기 위해 보간 데이터를 삽입하고, 데이터의 추세를 분석하여 세분화 한 후 데이터에 적합한 퍼지 예측기를 병렬로 설계하여 예측을 수행하였다. 결과를 살펴보면, 보간 데이터만을 삽입하여 예측기를 설계한 경우에도 MRE가 학습구간과 검증구간에서 각각 1.1146% 및 1.2455%로 매우 양호한 예측을 수행할 수 있었지만, 데이터의 세분화 후 각각의 예측기를 설계하여 병렬로 운용한 결과 MRE가 1.0999% 및 1.2296%로 더욱 개선되었음을 알 수 있다. 결국 두 경우의 분석 결과는, 보간 데이터의 사용, 그리고 예측기 설계를 위해 사용된 TSK 퍼지 논리 모델과 K-평균 군집화 및 최소자승법들이 모두 예측 시스템 설계에 효과적 이였음을 보여주는 것으로 간주할 수 있으며, 더욱이 추세 분석을 통한 세분화 과정과 병렬 형 예측기 운용 구조는 예측의 정확성을 보다 높일 수 있음을 보여준다. 따라서 제안된 예측시스템의 설계 방법은 최대 전력 부하 데이터의 예측뿐만 아니라 다양한 패턴을 포함한 시계열 예측 분야에 충분히 적용 가능할 것으로 판단되고, 더욱이 최근까지의 국내 전력부하 예측의 기초 자료로 활용될 수 있을 것으로 생각된다.

추후에는 데이터의 세분화 과정에 원형의 전력부하 데이터뿐만 아니라, 일반, 가정, 산업분야 등 다양한 분야의 전력 데이터와의 추세 및 상관성을 분석하여 활용한다면 보다 정확한 예측을 수행할 수 있는 예측 시스템의 설계가 가능할 것으로 판단된다.

감사의 글

본 연구는 2017년도 강원대학교 대학회계 학술연구비로 연구하였음.(관리번호-620170045)

References

1 
C. M. Pereira, N. N. Almeida, M. L. F. Velloso, 2015, Fuzzy modeling to forecast an electric load time series, Procedia Computer Science, Vol. 55, pp. 395-404DOI
2 
H. H. Steinherz, C. E. Pedreira, R. C. Souza, 2001, Neural networks for short-term load forecasting: A review and evaluation, IEEE Trans. on Power Systems, Vol. 16, No. 1, pp. 44-55DOI
3 
B. H. Ahn, H. R. Choi, H. C. Lee, 2015, Regional Long- Term/Mid-Term Load Forecasting using SARIMA in South Korea, Journal of the Korea Academia- Industrial Cooperation Society, Vol. 16, No. 12, pp. 8576-8584DOI
4 
H. W. Jung, K. B. Song, 2014, Daily Maximum Electric Load Forecasting for the Next 4 Weeks for Power System Maintenance and Operation, The Transactions of the Korean Institute of Electrical Engineers, Vol. 63, pp. 1497-1502DOI
5 
J. H. Puiar, 2010, Fuzzy Ideology based Long Term Load Forecasting, World Academy of Science, Engineering and Technology, Vol. 40, pp. 640-645Google Search
6 
D. Ali, M. Yohanna, M. I. Puwu, B. M. Garkida, 2016, Long- term load forecast modelling using a fuzzy logic approach, Pacific Science Review A: Natural Science and Engineering, Vol. 18, pp. 123-127DOI
7 
C. C. Hsu, C. Y. Chen, 2003, Regional load forecasting in Taiwan-applications of artificial neural networks, Energy Conversion and Management, Vol. 44, pp. 1941-1949DOI
8 
M. Hayati, Y. Shirvany, 2007, Artificial Neural Network Approach for Short Term Load Forecasting for Illam Region, IJECSE, Vol. 1, No. 2, pp. 121-125Google Search
9 
P. F. Pai, W. C. Hong, 2005, Support vector machines with simulated annealing algorithms in electricity load forecasting, Energy Conversion and Management, Vol. 46, pp. 2669-2688DOI
10 
J. Dhillon, S. A. Rahman, S. U. Ahmad, M. J. Hossain, 2016, Peak Electricity Load Forecasting Using Online Support Vector Regression, 2016 IEEE Canadian Conference on Electrical and Computer Engineering, pp. 1-5DOI
11 
Y. K. Bang, J. H. Kim, C. H. Lee, 2017, Daily Peak Electric Load Forecasting Using Neural Network and Fuzzy System, The Transactions of the Korean Institute of Electrical Engineers, Vol. 67, No. 1, pp. 96-102Google Search
12 
J. M. Mendal, 2001, Uncertain Rule-based Fuzzy Logic System: Introduction and New Directions, Prentice- Hall, Upper Saddle River, Nj 07458Google Search
13 
Y. K. Bang, C. H. Lee, 2011, Fuzzy Time Series Prediction using Hierarchical Clustering Algorithms, Expert Systems with Applications, Vol. 38, pp. 4312-4325DOI
14 
https://home.kepco.co.kr/kepco/main.doGoogle Search

저자소개

방영근 (Young-Keun Bang)
../../Resources/kiee/KIEE.2019.68.4.558/au1.png

1974년 4월 7일생.

2003년 강원대학교 전기공학과 졸업(석사).

2010년 강원대학교 전기전자공학과 졸업(박사).

E-mail: b2y2c1@kangwon.ac.kr

이철희 (Chul-Heui Lee)
../../Resources/kiee/KIEE.2019.68.4.558/au2.png

1959년 7월 4일생.

1985년 서울대학교 전기공학과 졸업(석사).

1989년 서울대학교 전기공학과 졸업(박사).

현재 강원대학교 전기전자공학과 교수.

E-mail: chlee@kangwon.ac.kr

박하용 (Ha-Yong Park)
../../Resources/kiee/KIEE.2019.68.4.558/au3.png

1956년 5월 2일생.

1981년 동국대학교 전기공학과 졸업(석사).

2001년 숭실대학교 전기공학과 졸업(박사).

현재 강원대학교 전기공학과 교수.

E-mail: hivol5652@kangwon.ac.kr