방영근
(Young-Keun Bang)
1
이철희
(Chul-Heui Lee)
†
-
(Dept. of Electrical Engineering, Kangwon National University, Korea .)
Copyright © The Korean Institute of Electrical Engineers(KIEE)
Key words
nonstationary time series, nonlinear time series, rate of change of moving average, TSK FPS, CBKM
1. 서 론
사회가 복잡해지고 기술이 발달함에 따라 인간의 생활 및 경제 활동과 관련된 다양한 데이터들이 수없이 쏟아지고 있으며, 다루어져야 할 데이터들의 특성
또한 복잡하고 정교한 형태를 보인다. 그중 시계열 데이터는 시간에 따라 일정한 간격으로 대상을 관측하고 기록한 자료로, 이러한 과거 자료를 분석하여
미래에 발생할 현상들을 비교적 정확히 예측할 수만 있다면, 효율적이고 전략적으로 대비하고 계획을 수립할 수 있게 된다. 예를 들어, 전력 분야에서
단․장기 전력 부하(수요)나 최대 전력 소비량, 연간 전력생산량 등의 정량 지표를 예측할 때나, 경제 분야에서 주가지수 변동, 환율 변동 등을 예측할
때 이용되고 있으며, 그 외에도 태양의 흑점 변동에 따른 통신 장애 대처 방안 수립, 기후 변화에 따른 재난 대책 수립 등에도 활용된다.
시계열 예측에서는 기본적으로 미래에 발생할 현상이 과거의 현상에 종속적이라는 전제하에 일관적 패턴, 규칙성, 변동 추이 등 데이터에 내재된 특성을
잘 기술할 수 있는 모델을 수립하게 된다. 그런데 ARMA (Auto-regressive moving average)나 ARIMA (Auto-regressive
integrated moving average)와 같은 선형 회귀모델은 널리 활용되는 고전적 기법이긴 하지만 데이터들의 복잡한 구조에 기인한 강한
비선형적 특성이나 데이터가 담고 있는 정보의 불확실성을 취급하기에는 어려움과 한계가 있다(1,2). 이러한 수학적 모델을 이용한 고전적 기법의 문제점들을 극복하고자, 근래에는 퍼지 이론과 신경망 등과 같은 유연 계산(soft computing)
기법을 적용하는 연구들이 활발하며, 수학적 모델들에 비해서 데이터의 불확실성과 비선형 특성을 적절하게 취급할 수 있고 학습을 통해 데이터 속성을 잘
반영할 수 있어 상당한 성과를 내고 있다(3-6).
특히, 퍼지 시스템은 복잡한 구조를 포함한 데이터들을 취급하는 문제들에서 까다로운 수학적 전개와 분석 기법 대신에 언어적 규칙기반의 추론 과정을 이용하기에
접근이 비교적 쉬울 뿐만 아니라 데이터 내에 내재된 특성들을 충분히 잘 기술할 수 있어 비정상(nonstationary) 및 비선형 시계열 예측에
매우 유용한 도구로 활용되고 있다(7). 그중에서도 Takagi와 Sugeno에 의해 제안된 TSK 퍼지 시스템은 언어적 표현과 수학적 모형을 조합한 규칙의 구조로, 규칙의 전건부에는
퍼지 집합을 이용하여 불확실성을 포함한 데이터의 특성을 묘사할 수 있도록 하고, 후건부에는 전건부의 동작 영역에 적합한 수식 모델을 사용하여 규칙별로
최적화된 결과를 산출할 수 있도록 구성된다 (8). 따라서 대상에 대한 지식의 언어적 애매함과 고전적 (선형) 회귀모델의 이점을 동시에 취할 수 있어 시계열 예측을 비롯한 다양한 분야에 응용되고
있다. TSK 퍼지 시스템의 성능은 규칙 전건부가 데이터의 속성을 제대로 대표할 수 있는 능력과 후건부 수식 모델의 파라미터 추정의 정확성에 따라
차이가 나게 된다. 규칙의 전건부를 생성하기 위해서는 데이터들을 군집화하여 입력 공간을 퍼지분할 하는데, KM(K-means), CM(C-means),
GKM(genetic K-means) 등의 군집화 기법이 널리 활용되고 있으며, 규칙의 후건부의 파라미터 추정에는 오차 역전파 알고리즘을 이용한 신경회로망이나
최소자승법 등이 주로 사용된다(9,10).
입력 공간 퍼지분할에서 퍼지 집합의 수를 증가시켜 생성되는 퍼지 규칙의 수를 늘리게 되면 데이터(발생 시스템)의 특성을 묘사하는 기술 능력은 우수해지지만,
퍼지 규칙이 많아질수록 연산을 비롯해 시스템의 복잡성이 초래된다. 반면에 퍼지 집합 수가 너무 적으면 규칙에 데이터의 특성을 충분히 반영하지 못하는
문제가 발생한다. 또한, 군집화에 의한 입력 공간 퍼지분할은 지속적인 증가/감소 추세를 보이는 시계열 데이터에 대해서는 원형 데이터의 추세성이 제거되지
않는 한 일정 시점 이후에는 작동하는 규칙이 한쪽으로 편향되는 결과를 불러오게 된다.
이러한 문제를 해결하기 위해 우리는 이전 연구(11,12)에서 차분 데이터를 사용하여 극복하려고 노력한 바 있다. 일반적으로 차분 데이터들은 원형 데이터에 비해 통계적 특성이 좀 더 안정된 경향을 띨 뿐만
아니라, 지속적 증가/감소와 같은 데이터의 추세성으로 인한 문제도 회피할 수 있어 예측 시스템 구현에 더 효과적으로 이용될 수 있다. 하지만 데이터에
내재된 패턴이나 규칙성 등의 속성들을 가장 잘 포착해낼 수 있는 최적의 차분 간격을 식별해내기가 쉽지 않으며, 차분 간격이 길어질수록 예측 시스템
설계에 사용될 데이터의 양이 줄어드는 문제점을 안고 있다. 이를 해결하기 위하여 우리는 1차 차분 데이터들로만 구성된 여러 개의 모델을 병렬로 수립하여
활용하는 방법을 제안하였는데, 이 또한 다중 모델 사용으로 인한 구조적 복잡성이 부담으로 나타났다(11,12).
본 논문에서는 이동평균의 변화율(RCMA: Rate of change of moving average)을 TSK 퍼지 예측기(TSK FPS: TSK
fuzzy prediction system) 입력으로 사용하는 방법을 제안하였다. 이동평균(MA: Moving average)은 고유의 저역 통과
필터(LPF: Low pass filter) 성질에 의해 시계열의 비정상성 또는 비선형성 때문에 나타날 수 있는 데이터의 급격하거나 심한 기복을 완화하여
일차적으로 통계적 특성을 안정화시켜 주고, 이들의 변화율은 추세성을 제거하여 데이터의 규칙 편중 현상을 극복할 수 있게 한다. 그 결과 다순 차분데이터의
사용보다 비교적 적은 수의 규칙기반으로도 양호한 예측 성능을 얻을 수 있어, 퍼지 예측기의 설계 과정을 쉽고 효율적으로 만들어주는 이점도 생긴다.
TSK 퍼지 예측기의 전건부 입력 공간 퍼지분할에는 KM(K-means) 기법에서 유사도 지표로 사용하는 벡터 거리(Euclidean distance)
대신 상호상관계수(cross correlat- ion coefficient)로 대체한 상관 기반 k-평균 군집화(CBKM: Correlation based
K-means clustering)를 적용하여 데이터 특성에 더욱 부합되는 규칙을 생성할 수 있도록 하였다(14). 그리고 후건부 선형 회귀모델 파라미터 추정은 최적해를 제공하는 최소자승법을 사용하였다. 제안된 방법의 유효성을 검증하기 위하여 대표적인 비정상
시계열과 비선형 시계열 사례에 대해 각각 시뮬레이션을 수행하여 제안된 방법이 매우 우수한 성능을 보임을 입증하였다.
2. 데이터의 전처리 및 후처리
본 논문에서 제안하는 이동평균 변화율 기반 데이터 전처리에 의한 퍼지 시계열 예측 시스템의 전체적인 구조는 그림 1과 같다.
그림. 1. 제안된 퍼지 시계열 예측 시스템의 구조
Fig. 1. The structure of the proposed fuzzy prediction system
그림 1에서 보듯이 원 시계열 데이터를 전처리하여 퍼지 예측기의 입력을 생성하며, 이때 전처리 방법으로는 이동평균 변화율을 사용한다. 퍼지 예측기의 설계
및 예측 동작에는 이렇게 전처리된 이동평균 변화율이 사용되며, 퍼지 예측기의 출력 또한 이동평균 변화율의 예측값이 나온다. 그러므로 시계열 예측값을
출력으로 내기 위해서는 퍼지 예측기 출력 데이터에 대한 후처리 과정이 필요하다. 이 절에서는 데이터 전처리와 후처리 과정에 대해 설명하고, 다음 절에서는
퍼지 예측기의 설계를 다룰 것이다.
2.1 이동평균 변화율(RCMA) 기반 데이터 전처리
시간에 따라 데이터의 통계적 특성이 변동하는 비정상 시계열이나 데이터값의 변동이 심하거나 특이한 비선형 시계열의 경우, 예측 시스템 설계에 원형(original)
데이터를 직접 사용하게 되면, 대체로 데이터 간의 낮은 상관성 및 비선형 특성 등으로 인해 대상 시계열의 패턴이나 규칙성을 잘 기술할 수 있는 모델을
수립하기가 쉽지 않다. TSK 퍼지 모델을 사용하더라도 다음의 문제들로 인해 우수한 성능의 예측 시스템을 구현하기가 힘들다. 우선, 퍼지 규칙 전건부
구성을 위한 입력 공간 퍼지분할 과정에서 다른 특성/추세에 의한 데이터들임에도 불구하고 구분되지 못하고 같은 범주로 분류되는 경우가 발생하게 되어,
그 결과 다른 규칙으로 분리되지 않은 채 후건부 선형 (회귀모델) 수식의 파라미터 추정이 이루어짐으로써 속성 기술의 부정확성이 유발된다. 다음으로는,
데이터에 특정한 추세성이 존재하면, 실제 예측 시에는 설계된 규칙기반의 한쪽으로만 편중되어 동작하는 현상이 나타날 것이다. 예를 들어, 지속적인 증가
추세성을 가진 데이터의 경우, 설계 과정에서 초기의 데이터들로부터 생성된 규칙들은 실제 예측에서는 거의 동작하지 않는 무의미한 규칙이 될 것이고,
가장 뒤쪽의 데이터들에 의한 규칙들만 예측에 활용될 것이다. 규칙기반이 추세성뿐만 아니라 데이터에 내재된 다른 속성들도 반영한 결과임을 고려할 때,
극히 일부의 규칙들만 편중적으로 활용되는 것은 당연히 예측 성능을 저하시키는 결과를 가져오게 된다. 그뿐만 아니라 궁극적으로 어느 시점 이후에는 직전의
데이터들에 의한 새로운 규칙을 추가하지 않으면 예측 자체를 수행할 수 없게 될 것이다.
이러한 문제점을 극복하는 대안으로 차분 데이터의 사용을 생각할 수 있다. 차분 데이터는 변화가 급격하거나 심한 비정상 시계열 또는 지속적인 증가 및
감소 추세의 시계열에 대해 원형 데이터보다는 평균, 분산과 같은 통계적 특성이 좀 더 안정적이며, 일정 부분 추세성이 제거되어 군집화로 인해 초래될
수 있는 작동 규칙의 편중 현상을 경감할 수 있게 된다(11,12). 하지만 원형 데이터의 내재적 특성을 잘 드러내면서 통계적 특성의 안정화를 보장할 수 있는 차분 간격의 선정을 위한 분석이 필요하고 과 차분으로
야기되는 데이터의 양의 부족(즉 차분 간격이 증가되면 될수록 데이터의 양은 감소) 등의 단점이 발생한다.
본 논문에서는 데이터의 이동평균이 가지는 저역 통과 필터링 성질에 의한 시계열의 비정상성 또는 비선형성으로 야기될 수 있는 데이터 기복의 완화와 통계적
특성의 안정화 효과를 이용하고, 이들의 변화율을 통해 편향된 추세성 등으로 인한 데이터의 규칙 편중 현상을 극복할 수 있도록 데이터 이동평균의 (상대)
증가율을 TSK 퍼지 예측기 입력으로 사용함으로써 앞선 문제점들을 극복할 수 있도록 한다.
먼저 입력 데이터 생성을 위한 원형 시계열 데이터의 이동평균 변화율 기반 전처리 과정은 다음과 같이 이루어진다. 퍼지 예측기 설계에 사용되는 N개의
학습(훈련) 데이터가 x(1),x(2),x(3),⋯,x(N)이라고 하면, 이들의 i번째 이동평균 데이터 m(i)는
다음과 같이 얻을 수 있다.
식 (1)로 생성되는 {m(i)}들은 이동평균의 저역 통과 필터 특성으로 인해 원 시계열의 본질적인 속성은 유지하면서도 급격한 변동이나 악성(ill-conditioned)
데이터와 같은 특이값들의 영향을 축소함으로써 통계량을 안정화하는 효과를 가져온다. 하지만, 원 시계열이 지속적인 증가/감소와 같은 추세성을 띠는 경우
이는 여전히 남아있어서 m(i)의 크기는 점진적으로 증가/감소하게 될 것이며 규칙의 편중 현상을 초래하여 시스템의 예측 성능을 떨어뜨리는 원인이
될 것이다. 데이터에서 추세성을 제거하는 효과적인 방법으로 차분과 같이 인접 데이터 사이의 값의 변화량을 이용할 수 있지만, 변화량 자체도 가질 수
있는 값의 범위가 넓을 수가 있으므로, 변화량 대신에 (상대적인) 변화율을 사용하게 되면 [-1, 1] 구간에 값이 분포하게 되어 보다 효율적인 퍼지
규칙기반 생성이 가능해질 것이다. 따라서 본 논문에서는 다음과 같이 이동평균 데이터의 증가율을 퍼지 예측기의 입력으로 사용한다.
식 (1)의 이동평균으로 통계적 특성이 안정화된 데다 식(2)와 같이 변화율로 추세성까지 제거된 {d(i)}를 원 시계열 데이터 대신 퍼지 예측기의 입력으로 사용하게 되면, 비교적 적은 수의 단순한 규칙기반으로도
양호한 예측 성능을 얻을 수 있으며, 따라서 퍼지 예측기의 설계도 덜 까다롭고 효율적으로 이루어질 수 있다.
2.2 예측 출력 생성을 위한 데이터 후처리
퍼지 예측기에 의한 출력은 원 시계열 {x(i)}의 예측값이 아니라 이동평균 변화율 {d(i)}의 예측값 {ˆd(i)}이다.
그러므로 이로부터 다시 원 시계열의 예측값으로 되돌리는 과정이 필요한데, 이는 2.1절에서 설명한 전처리 과정의 역동작이라 할 수 있다. 식(2)로부터
식 (3)을 x(i+1)에 대해 정리하면 다음의 관계를 얻는다.
따라서 제안된 시계열 예측 시스템의 예측 출력 ˆx(i+1)은 퍼지 예측기의 출력 ˆd(i)로부터 다음과 같이 구할 수 있다.
3. TSK 퍼지 예측기(TSK FPS) 설계
시계열 예측의 중추 역할을 담당하는 퍼지 예측기에는 TSK 퍼지 모델을 채택하였다. TSK 퍼지 모델은 아래의 식(6)에서 보듯이 규칙 전건부는 언어적 표현을, 후건부에는 회귀모델과 같은 수식 표현을 사용함으로써 두 표현의 이점을 동시에 도모할 수 있는 장점을 지닌다(10).
여기서, xi는 입력 변수, p는 입력 개수, Fi는 입력에 대해 언어변수로 정의되는 퍼지 집합, yj는 j번째
규칙 Rj에 의한 (국부) 출력, 그리고 ci는 후건부 수식의 파라미터이다.
TSK 퍼지 규칙기반 구축의 첫 단계는 입력 개수의 선정인데, 이는 주어진 문제의 특성이나 상관도 분석 또는 구조 식별 기법 등을 활용하여 결정할
수 있다(8,13). 입력 개수가 많으면 규칙의 시스템 특성 기술 능력이나 정밀도가 높아질 수 있지만, 규칙의 수가 늘어날 뿐만 아니라 후건부 파라미터 추정 정확도를
보장하기 위해 더 많은 양의 설계(훈련) 데이터가 필요하게 되므로 적절한 선정이 요구된다. 기존 연구들과 마찬가지로, 본 논문의 시뮬레이션에서는 특성
기술 정밀도와 구조적 복잡성 사이의 적절한 절충점으로 입력 개수를 3개로 결정하였다. 입력 개수가 정해지고 나면, 식(6)의 퍼지 규칙이 시스템 특성을 잘 묘사할 수 있도록 데이터의 특성에 맞게 입력 공간을 분할한 후 전건부 입력 변수에 대한 퍼지 집합을 정의하고 후건부
출력 결정 수식의 파라미터를 추정해야 한다. 본 논문에서는 입력 공간 분할에는 상관 기반 k-평균 군집화 기법을 적용하였으며, 후건부의 파라미터 추정에는
최소자승법을 사용하였다.
3.1 상관성 기반 K-평균 군집화(CBKM)에 의한 입력 공간 분할
설계되어야 할 퍼지 예측기의 입력과 출력은 원 시계열이 아니라 식(2)의 {d(i)}이므로 식(6)의 TSK 퍼지 규칙은 다음과 같이 다시 쓸 수 있다.
식 (7)에서 보면, p개의 입력은 같은 시계열에서 단지 시간순으로 연속된 데이터이므로 서로 독립적이지 않으며 입력쌍 Di=[d(i−1),d(i−2),⋯,d(i−p)]으로 묶여 d(i)에 사상되므로 입력쌍 Di=[d(i−1),d(i−2),⋯,d(i−p)]을
묶음으로 취급하여 입력 공간을 분할하는 것이 타당할 것이다. 입력 공간 분할에는 군집화 기법을 이용하는 것이 일반적인데, k-평균 군집화가 구조의
단순성으로 인해 널리 사용되고 있다(13-15). 본 논문에서는 k-평균 군집화에서 유사도 지표로 사용하는 벡터 거리 대신 군집 중심과 입력쌍과의 상호상관계수로 대체한 상관 기반 k-평균 군집화를
적용하였다.
임의의 l번째 군집의 중심을 Zl=[zl(1),zl(2),⋯,zl(p)]라고 하자. 군집 중심
Zl은 다음과 같이 그 군집에 속하는 것으로 분류된 nl개의 입력쌍의 평균으로 구해진다.
군집 중심 Zl의 자기상관(auto-correlation) CZl, 입력쌍 Di의 자기상관 CDi,
그리고 Zl과 Di의 상호상관 CZlDi는 다음과 같이 정의된다.
여기서 ˉzl은 군집 중심 Zl의 원소값들의 평균, ˉdi은 입력쌍 Di의 원소값들의 평균이며
다음과 같이 계산된다.
식 (9)와 (10)으로부터 군집 중심 Zl와 입력쌍 Di의 상호상관계수 ρZlDi는 다음과 같이 구해진다.
입력쌍 Di에 대해 식(12)를 이용하여 각각의 군집 중심과의 상호상관계수를 계산하여 가장 큰 값을 지니는, 다시 말해 상관성이 가장 높은 군집으로 분류하게 되며, 이 과정을
모든 입력쌍에 대해 수행한다. 모든 입력쌍에 대한 분류가 완료되면, 각 군집별로 식(8)을 이용해 새로운 군집 중심을 계산하여 갱신하고 이에 대해 식(12)로 상호상관계수를 다시 계산하여 분류하는 작업을 다음의 종료 조건이 만족될 때까지 반복하게 된다.
여기서 Zjl는 j번째 분류 반복으로 구해진 군집 중심이며, Vth는 군집화를 종료하기 위한 임계치이다. 식(13)은 군집 중심의 변동 정도가 VTh 이하이면 더 이상의 갱신이 불필요한 정도로 분류가 완성되었다고 본다는 의미이다. 예측기 입력인 이동평균
변화율 {d(i)}이 [−1,1] 구간에 존재하는 작은 값이므로 VTh는 문제에서 요구되는 분류 엄밀도를 고려하여 적당한
작은 값으로 잡으면 되는데, 본 논문의 시뮬레이션 예에서는 10−4을 사용하였다.
이상과 같은 방법으로 군집화가 완료되면, 구해진 각 군집의 중심들이 식(7)의 퍼지 규칙 전건부 입력 변수들에 대한 퍼지 집합들의 중심(소속 함수값이 1)이 된다. 예를 들어 군집(퍼지 집합)의 수가 M개라고 하면, 첫
번째 입력 변수 d(i−1)에 대한 M개의 퍼지 집합의 중심값들은 z1(1), z2(1), ⋯, zM(1)이고,
k번째 입력 변수 d(i−k)에 대한 퍼지 집합의 중심값들은 z1(k),z2(k),⋯,zM(k)가
된다. 이 퍼지 집합의 중심값들은 데이터의 특성에 맞게 군집화 과정을 거쳐 구해진 것이므로, 등간격이 아닐뿐더러 입력 변수마다 값이 다르다. 그러므로
가우시안 함수를 이용하여 퍼지 집합에 대한 소속함수를 정의할 경우 좌우 대칭이 아닌 LR 표현을 적용하는 것이 더 적합할 것이다. k번째 입력
변수 d(i−k)에 대한 퍼지 집합의 중심값 z1(k),⋯,zM(k)을 값이 작은 것부터 순서대로 재정렬한 것을
zk,1zk,2⋯,zkM이라고 하자. j번째 퍼지 집합에 대한 소속함수 μkj(d(i−k))는
다음과 같이 정의한다.
여기서 dkj는 군집 중심 zkj을 갖는 군집으로 분류된 모든 입력쌍의 k번째 원소값을 나타낸다. 식(14)의 소속함수는 LR 표현을 위해 가우시안 함수가 통상 사용하는 공분산 대신 좌측(L) 표현에서는 군집 내의 최소값을, 우측(R) 표현에서는 군집 내의
최댓값으로 대체한 것이다. 왜냐하면, 군집화가 데이터 특성에 맞추어 이루어진 것이므로 이를 최대한 반영한 형태로 소속함수를 정의하고자 한 것이다.
3.2 퍼지 규칙 후건부 파라미터 추정
식 (7)의 퍼지 규칙의 전건부에 대한 설계가 끝나면, 후건부 회귀 모델(선형 수식)의 파라미터를 추정해야 규칙기반이 완성된다. 입력 변수가 p개, 각
변수마다 정의된 퍼지 집합이 M개라고 하면, 총 가능한 규칙은 Mp개가 되고 각각의 규칙에 대해 p+1개의 파라미터를 추정해야 한다.
파라미터 추정은 각 규칙을 만족시키는 학습 데이터의 입출력쌍들을 이용해서 수행되어야 하는데, 식(14)으로 정의된 소속함수가 가우시안 함수이므로 어떤 입력쌍이라도 모든 퍼지 집합에 대해 소속 함수값이 0이 되지는 않는다. 따라서 아주 조금이라도 모든
규칙을 만족시킨다. 그 결과 각 규칙의 파라미터 추정이 똑같이 모든 입출력쌍을 이용하게 되어 모든 규칙의 파라미터 추정값이 같게 되는 모순이 발생한다.
이의 해결 방안으로, 입력쌍이 규칙의 전건부를 만족시키는 적합도(또는 규칙 점화 수준(firing level))가 α 이상인 입출력쌍만으로
그 규칙의 파라미터를 추정하면 될 것이다. α는 규칙의 모호성(fuzziness)을 얼마나 엄격하게 규정할 것인가와 파라미터 추정 정확도를
위한 데이터 개수 등을 고려하여 적당히 선택하면 된다. α를 크게 잡을수록 규칙의 모호성은 감소하지만, 그 규칙에 속하는 입출력쌍의 수도
대체로 적어지게 된다. 일반적으로 규칙의 모호성과 관련해서는 α=0.5 전후의 값을, 파라미터 추정 정확도를 위해서는 3(p+1)개
정도의 입력쌍이 확보될 수 있는 수준으로 선정하는 것이 바람직한데, 두 요구 조건이 상충할 때는 적절히 절충하여 선택해야 한다. 필요하다면, 일부
규칙에는 다른 α 값을 사용할 수도 있을 것이다. 만약 어떤 규칙에 속하는 입출력쌍이 매우 적으면 유효한 파라미터 추정이 힘들므로 그
규칙을 제거하는 것이 낫다.
전건부 적합도는 입력 변수들의 소속함수 값 중 최솟값이므로 우선 모든 입력 변수들의 소속함수 값이 α 이상인 입출력쌍을 추려내야 한다.
j번째 규칙에 대해 조건을 만족하는 입출력쌍의 개수가 Nj라고 하면, 이들에 대한 규칙의 후건부는 다음과 같이 쓸 수 있다.
여기서 dj0,i는 j번째 규칙을 만족한다고 간주된 입출력쌍들 중 i번째 입출력쌍의 출력이고, djk,i는
i번째 입출력쌍의 k번째 입력 변수값이다. 식(15)을 행렬 벡터 형태로 표현하면 다음과 같이 된다.
Yj=XjCj
식 (16)에 대해 파라미터 Cj의 최적해는 최소자승법을 적용하여 다음과 같이 얻을 수 있다.
이렇게 추정된 후건부 회귀모델의 파라미터는 데이터에 최적화된 결과이다.
3.3 비퍼지화에 의한 예측기 출력
학습 데이터로부터 규칙 후건부 파라미터가 추정되었으면 퍼지 예측기의 규칙기반 구축이 완료된 것이다. 따라서 입력쌍을 이용하여 예측 출력을 구할 수
있다. 그런데 하나의 입력쌍이 여러 개의 규칙을 중복하여 만족시키므로, 각 퍼지 규칙으로부터 얻어진 퍼지 출력들을 조합하여 비퍼지화를 수행함으로써
퍼지 수(집합)가 아닌 일반(crisp) 값으로 변환해야 한다. TSK 퍼지 모델에 대한 비퍼지화 과정은 일반적으로 최소화 연산에 의한 규칙 점화
수준과 무게 중심법(COG: center of gravity)을 이용하여 수행된다(8).
i번째 입력쌍 Di가 j번째 TSK 퍼지 규칙을 만족하는 정도를 점화 수준(또는 적합도)이라고 하며, 다음과 같이 퍼지 규칙 전건부에
대한 각 입력 변수의 소속 함수값 중에 가장 작은 것으로 정의한다(9).
그러면, 입력쌍 Di에 대한 퍼지 출력은 퍼지 규칙 후건부 수식에 의해 계산된 값 ˆdj(i)가 식(18)의 점화 수준 fj(Di)를 소속함수 값으로 갖는 퍼지 수 (ˆdj(i),fj(Di))로 주어진다.
만약 입력쌍 Di가 m개의 퍼지 규칙을 만족시킨다면, 각 규칙의 퍼지 출력으로부터 아래와 같이 무게중심법에 의해 비퍼지화된 퍼지 예측기
출력 ˆd(i)을 구하면 된다.
식 (19)에 의해 구해진 퍼지 예측기의 출력은 이동평균 변화율에 대한 예측값이지 실제 시계열에 대한 예측값은 아니다. 그러므로 실제 시계열에 대한 예측값은
2.2절에서 설명한 바와 같이 식(5)를 이용하여 구하여야만 한다.
4. 컴퓨터 시뮬레이션 및 검토
제안된 시스템의 성능을 검증하기 위한 컴퓨터 시뮬레이션에는 2개의 다른 특성(비선형과 비정상성)을 갖는 시계열 데이터를 이용하였다. 두 경우 모두
입력 변수 3개, 군집(퍼지 집합) 2개로 설정하여 최대 생성 규칙이 8개 이하가 되게 함으로써 적은 수의 규칙으로도 성능이 우수한 예측이 가능함을
보였다. 또한, 성능 평가는 다른 논문들에서 제안된 방법들과의 비교를 위해 같은 길이의 학습(훈련) 구간과 예측 구간을 사용하여 시뮬레이션하였으며,
동일한 성능 지수로 평가하였다.
Case 1) 비선형 시계열 : Mackey-Glass 시계열
Mackey-Glass 시계열(MG)은 혼돈 비선형 시계열 예측에 자주 이용되는 데이터로 다음과 같이 정의되는 수식으로부터 발생된다(1).
이들 중에서 시뮬레이션에 사용된 것은 x(124)에서부터 x(1123)까지 1000개이며, 그 중 500개는 퍼지 예측기 설계를 위한 학습
데이터로, 나머지는 성능 검증과 비교를 위한 예측 데이터로 사용하였다. 성능 지수는 다음과 같이 정의되는 RMSE(root mean squared
error)를 사용하였다.
다음의 그림 2는 Mackey-Glass 시계열의 원형 데이터와 이에 대한 이동평균 데이터, 그림 3은 전처리 과정에 의해 생성된 이동평균 변화율 데이터와 상관 기반 k-평균 군집화(CBKM) 과정을 통해 두 개의 군집으로 분류된 데이터 패턴을 보여준다.
그림 2에서 볼 수 있듯이, 원형 시계열에 비해 이동평균 데이터의 변화가 훨씬 완만하고 안정적인 경향을 띠며, 그림 3의 a)의 이동평균 변화율 데이터에서는 추세성이 제거되어 0을 중심으로 값의 변화가 이루어지고 있음을 볼 수 있다.
그림. 2. 원형 Mackey-Glass 시계열과 이동평균 데이터
Fig. 2. The original MG data and its MA data
그림. 3. 이동평균 변화율 데이터와 CBKM에 의한 데이터 패턴
Fig. 3. RCMA data and data pattern after CBKM
그림 4는 설계된 퍼지 예측기에 의한 이동평균 변화율의 예측 결과 및 원형의 Mackey-Glass 시계열의 예측 결과로, 파란색은 실제 데이터이고 빨간색은
예측 결과를 나타내며 예측 결과가 잘 일치하고 있음을 보여준다.
표 1은 제안된 시스템의 예측 성능과 다른 논문의 방식(14,15)들과의 성능 비교표로써 제안된 방식이 다른 방법들에 비해 비교적 적은 수의 규칙으로도 매우 우수한 성능으로 비선형 시계열 데이터를 예측하였음을 보여주고
있다.
그림. 4. 이동평균 변화율 및 원형의 데이터 예측 결과(MG)
Fig. 4. Prediction result for RCMA and original data(MG)
표 1 다른 방식들과의 성능 비교
Table 1 Comparative results between our method and other methods
Case 2) 비정상 시계열 : 호주 분기별 전력 생산량
호주의 분기별 전력생산량(AQEP: Australian quarterly electricity production) 데이터(16)는 총 155개의 데이터로 구성되어 있으며, 이들 중 70개의 데이터를 퍼지 예측기 설계를 위한 학습 데이터로 사용하고 나머지 데이터를 성능 검증을
위한 예측 데이터로 사용하였다. 또한, 성능 지수로는 다음의 MRE(mean relative error)를 사용하였다.
그림 a)는 이동평균 변화율 데이터와 설계된 퍼지 예측기에 의한 예측 결과를 나타낸 것으로, 이동평균 변화율 데이터로 변환한 결과 변량이 감소하고 지속적인
증가 추세성이 제거된 것을 알 수 있다. 따라서 초기에 생성된 규칙기반 내에 모든 데이터의 특성을 반영할 수 있게 될 것이다. 그림 5의 b)는 호주 전력생산량 데이터와 제안된 시스템을 이용한 예측 결과를 나타낸것이다. 이 시계열 데이터는 가파른 증가 추세성을 지니고 있는데, 좋은 예측
결과를 보인다.
그림. 5. 이동평균 변화율 및 원형의 예측 결과(AQEP)
Fig. 5. Prediction result for RCMA and original data(AQEP)
그림 6은 초기 및 후기 부분(85~115 및 125 이후)을 확대하여 나타낸 것으로, 실제 데이터(파란색)와 예측 결과(빨간색)가 거의 중복되어 있음을
볼 수 있으며, 이는 제안된 예측 시스템이 매우 효과적임을 보여주는 결과라고 할 수 있다. 다음의 표 2는 다른 논문들의 방식(11,17)과 제안된 시스템의 성능 비교표로 제안된 기법이 이 경우에도 다른 방법들보다 우수한 예측 성능을 보인다.
그림. 6. 예측 결과의 초기와 후기 확대 모양
Fig. 6. Enlarging forms of the early and latter parts
표 2. 다른 방식들과의 성능 비교
Table 2. Comparative results between our method and other methods
5. 결 론
본 논문에서는 시계열 예측을 위한 이동평균 변화율 기반의 퍼지 예측 시스템을 설계하였으며, 대표적인 비선형 시계열과 비정상 시계열 데이터에 적용해
성능을 검증하였다. 제안된 시스템은 시계열 데이터에 대한 전처리 과정(이동평균 변화율 데이터 생성)과 후처리 과정(원형 시계열 예측값으로 환원)을
통해 데이터의 통계적 특성을 안정화시키고 추세성 및 규칙의 편중 현상을 극복할 수 있도록 하였다. 또한, TSK 퍼지 예측기의 전건부 입력 공간 퍼지분할에는
입력쌍 묶음에 대해 상관 기반 k-평균 군집화를 적용함으로써 데이터 특성에 더욱 잘 부합되는 규칙을 생성할 수 있도록 하였고 규칙 후건부 선형 회귀모델
파라미터 추정에는 최적해를 제공하는 최소자승법을 사용하였는데, 규칙에 대한 점화 수준 α를 조정하여 그 규칙에 속하는 입출력쌍의 수를
선택할 수 있도록 함으로써 데이터 속성에 더 잘 부합하고 정확도 높은 추정이 가능하도록 하였다. 마지막으로 제안된 방법의 유효성 검증을 위해 대표적인
비정상 시계열과 비선형 시계열 사례에 대해 각각 시뮬레이션을 수행하였으며, 입력 변수 3개, 군집(퍼지 집합) 2개로 설정하여 최대 생성 규칙이 8개
이하가 되게 함으로써 적은 수의 규칙으로도 성능이 우수한 예측이 가능함을 보이고, 타 연구의 결과들과 성능을 비교하여 제안된 방법의 유용성을 입증하였다.
이러한 결과들을 비추어볼 때, 제안된 방법은 복잡한 특성을 내포한 비정상 또는 비선형 데이터들을 다루는 다양한 분야에서 정보의 추출이나 제어 등에
응용될 수 있을 것으로 기대된다.
Acknowledgements
본 연구는 한국전력공사의 2016년 선정 기초연구개발과제 연구비에 의해 지원되었음. (과제번호: R17XA05-36)
References
G. Janazcek, L. Swift, 1993, Time Series Forecasting, Simulation, Simulation, Applications,
Ellis Horwood

B. H. Ahn, H. R. Choi, H. C. LEE, 2015, Regional Long- Term Load Forecasting using
SARIMA in South Korea, Journal of the Korea Academia-Industrial cooperation Society,
Vol. 16, No. 12, pp. 8576-8584

M. Hayati, Y. Shirvany, 2007, Artificial Neural Network Approach for Short Term Load
Forecasting for Illam Region, IJECSE, Vol. 1, No. 2, pp. 121-125

H. S. Hwang, J. S. Oh, 2009, Time Series Sock Prices Prediction Based On Fuzzy Model,
Journal of The Korean Institute of Intelligent Systems, Vol. 16, pp. 589-694

O. Valenzuela, I. Rojas, F. Rojas, H. Pomares, L. J. Herrera, A. Guillen, L, Marquez,
M. Pasadas, 2008, Hybridization of Intelligent techniques and ARIMA models for time
series prediction, Fuzzy Sets and Systems, Vol. 159, pp. 821-845

P. Mandal, T. Senjyu, T. Funabashi, 2006, Neural networks approach to forecast several
hour ahead electricity prices and loads in deregulated market, Energy Conversion and
Management, Vol. 47, No. 15-16, pp. 2128-2142

J. M. Mendel, 2001, Uncertain Rule-based Fuzzy Logic System: Introduction and New
Directions, Prentice-Hall, Upper Saddle River, Nj

C. S. Ting, 2006, Stability analysis and design of Takagi-Sugeno fuzzy system, Information
Science, Vol. 176, pp. 2817-2845

G. Mahalakshmi, S. Sridevi, S. Rajaram, 2016, A Survey on Forecasting of Time Series
Data, in Proc. of 2016 International Conference on Computing Technologies and Intelligent
Data Engineering, pp. 1-8

T. Velmurugan, T. Santhanam, 2010, Design of Multiple Model Fuzzy Predictors using
Preprocessing and its Application, European Journal of Scientific Research, Vol. 46,
No. 3, pp. 320-330

Y. K. Bang, C. H. Lee, 2011, Fuzzy Time Series Prediction using Hierarchical Clustering
Algorithms, Exports Systems with Applications, Vol. 38, pp. 4312-4325

Y. K. Bang, C. H. Lee, 2009, Design of Multiple Model Fuzzy Predictors using Preprocessing
and its Application, Trans. KIEE, Vol. 58, No. 1, pp. 178-180

M. Sugeno, G. T. Kang, 1988, Structure Identification of Fuzzy Model, Fuzzy Sets and
Systems, Vol. 28, pp. 15-33

L. X. Wang, J. M. Mendel, 1992, Generating fuzzy rules from numerical data, with applications,
IEEE Trans. on Systems, Man, and Cybern., Vol. 22, No. 6, pp. 1414-1427

D. J. Kim, C. H. Kim, 1997, Forecasting Time Series with Genetic Fuzzy Predictor Ensemble,
IEEE Trans. on Fuzzy Systems, Vol. 5, pp. 523-535

https://datamarket.com/data/set/22pv.

Y. S. Joo, 2003, Fuzzy System Modeling Using Genetic Algorithm and Rough Set Theory,
M. S. Thesis, Dept. of Electrical and Electronic Eng., Kangwon Univ., Korea

저자소개
2003년 강원대(삼척) 전기공학과 졸업(석사).
2010년 강원대(춘천) 전기전자공학과 졸업(박사)
E-mail: b2y2c1@hanmail.net
1985년 서울대학교 전기공학과 졸업(석사).
1989년 서울대학교 전기공학과 졸업(박사).
현재 강원대학교 전기전자공학과 교수
E-mail: chlee@kangwon.ac.kr