Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers

  1. (Digital Solution Laboratory, KEPRI, Korea)
  2. (Safety & Security Department, Korea Electric Power Corporation(KEPCO), Korea)
  3. (Department of Energy Systems, Ajou University, Korea)



Natural Disaster, Typhoon, Power System Facilities, Damage Prediction, Artificial Neural Network, AI

1. 서 론

최근 전 세계적으로 폭염, 가뭄, 집중호우와 같은 기후 변화로 인한 이상기상 현상이 자주 발생하고 있다. 국내에서도 기상청의 기후보고서에 따르면 우리나라 6대 도시의 평균기온이 100년간 1.7℃가 상승하였다. 이는 전 지구 평균 상승폭인 0.75℃의 2배가 넘는다. 강수량은 19% 증가하였으며, 해수면은 8cm 이상 상승하였다. 이러한 기후변화의 결과들은 재난의 강도를 증가시킨다. 전력설비 관리 측면에서도 태풍, 호우, 한파, 폭염 같은 자연재난에 의한 전력설비 피해가 점점 증가하고 있으며[1], 자연재난에 대한 빠른 대응과 피해를 최소화하기 위해 재난에 대한 설비피해 예측 기술의 개발이 요구된다.

국외에서도 재난 현상으로 인한 전력시스템 피해의 심각성을 인지하고 재난 현상 발생에 따른 전력시스템 대응 방안에 대한 연구를 진행하고 있다. 특히, 허리케인 Sandy나 Katrina와 같은 치명적인 상황은 안정적인 전력공급에 큰 영향을 미쳐 사회 경제적 시스템에 막대한 손실을 초래하였으며, 미국 전기회사는 재난에 관한 여러 프로젝트를 진행 중에 있다. North American Electric Reliability Corporation(NREL)에서는 허리케인 Sandy에 관한 분석 보고서를 발표하였다[2][3].

유럽연합은 2014년부터 2017년까지 15개의 기관이 참여한 RAIN(Risk Analysis of Infrastructure Networks in Response to Extreme Weather) 프로젝트를 통해 재난 모의실험 프로그램을 개발하여 재난 발생 시 피해상황을 예측하고 신속한 복구를 위해 전력시스템에 활용하는 연구를 하였다. RAIN 프로젝트는 1) 시스템 취약점 & 위험 식별 2) 육상 및 교통 인프라에 대한 취약점 3) 에너지 및 통신 인프라에 대한 취약점의 3가지 범위에서 수행되었다[4].

IBM T.J Watson Research Center에서는 빅데이터를 분석하기 위해 특정 시공간 통계 모델을 사용하였다. 특히 2003년 유럽에서 발생한 폭염과 같은 재난을 모델링하기 위해 공간-시간 데이터로부터 인과 관계를 추론하는 방법을 개발하였다. 또한 배전시스템에 폭풍과 같은 재난이 미치는 영향을 조사하고 계층적 포아송 회귀 모델을 사용하여 예측하였다[5].

미국의 The Connecticut Light and Power company(CL&P)는 폭풍 발생 시 고장 발생과 범위를 확률론적으로 결정하기 위해 두 개의 선형 모델을 결합(Logistic 과 Gamma 회귀 모델)하여 재난피해를 예측하는 연구를 하였다[6].

본 논문에서는 6가지 재난 유형인 태풍, 강풍, 호우, 폭설, 한파, 폭염에 대하여 전력설비별 고장건수와 설비고장으로 인한 정전가구수를 예측하기 위한 알고리즘 개발 과정을 기술하고 있다. 2장에서는 알고리즘 개발에 필요한 기상 데이터와 전력설비 고장 데이터를 분석하고, 피어슨 상관관계 분석 기법을 활용하여 입력 데이터 선정에 대한 과정을 기술한다. 3장에서는 재난피해 예측을 위한 인공신경망(Artificial Neural Network, ANN) 모델을 개발하는 과정을 기술하며, 4장에서는 개발한 ANN 모델과 선형회귀분석(Linear Regression Analysis, REG) 모델의 예측결과를 비교하여 평가하고, 실제 태풍 ‘솔릭’에 대한 예측 결과를 기술하고 있다. 마지막으로 5장에서는 향후 재난피해 예측 알고리즘의 정확도 향상을 위한 후속 연구방향을 제시하고 있다.

2. 데이터 수집 및 상관관계 분석

재난피해 예측 모델은 기계학습(Machine Learning, ML)법을 사용하여 개발한다. 예측 모델이 학습하기 위해 학습 입력데이터 세트가 필요하며, 이는 기상특보가 발생했던 기간의 {과거기상데이터(풍속, 호우, 온도 등), 고장데이터(고장건수, 정전고객수)}로 구성된다. 또한 학습된 모델을 이용하여 예측하기 위해서는 예측입력데이터 세트가 필요하며, 이는 기상특보가 발령된 지역의 {미래기상데이터(풍속, 호우, 온도 등)}으로 구성된다. 본 논문에서는 이와 같은 학습 입력데이터 세트와 예측 입력데이터 세트를 구축하고 분석하기 위해 2007년 부터 2018년 까지의 국민안전처에서 제공하는 “기상특보 데이터”, 기상청에서 제공하는 “기상관측 데이터”, “동네예보 데이터”, 그리고 전력회사의 “전력설비 고장데이터”를 수집하였으며, 알고리즘의 입력으로 유효한 데이터를 선정하기 위해 설비고장에 영향력이 있는 기상요인(온도, 강우량, 풍속 등)에 대한 상관관계를 분석하였다.

2.1 자연재난에 따른 전력설비 고장 영향 인자 분석 및 데이터 수집

2.1.1 국민안전처 기상특보 데이터

국민안전처는 태풍, 강풍, 호우, 폭설, 한파, 폭염에 대하여 경보/주의보의 형태로 발령 기간과 대상지역이 포함하는 기상특보를 발표한다. 피해지역과 피해규모 및 피해시간에 대한 학습과 예측을 위해 “기상특보 데이터”를 활용하였다.

2.1.2 기상청 기상관측 데이터

학습 입력데이터 세트를 구성하는 과거 기상데이터는 기상청의 기상관측시스템(Automatic Weather System, AWS)에서 수집하였다. 기상관측 데이터는 관측일시, 지점(경위도 및 고도), 날씨, 기온, 풍향, 풍속, 강우량, 적설량, 습도 등을 포함하고 있으며, 본 연구에서는 기상청의 1시간 기상관측 데이터를 활용하였다.

2.1.3 기상청 동네예보 데이터

예측에 사용되는 미래 기상데이터는 기상청의 동네예보 데이터를 활용하여 수집한다. 동네예보 데이터는 예측일시, 지점(동/읍/면), 날씨, 기온, 풍향, 풍속, 강우량, 적설량, 습도 등을 포함하고 있다. 동네예보 데이터는 그림 1과 같이 3시간 단위로 예보된다.

그림. 1. 기상청 동네예보 사례(May 28, 2018, 빛가람동)

Fig. 1. A case of the KMA's (May 28, 2018, Bitgaram-dong)

../../Resources/kiee/KIEE.2019.68.9.1085/fig1.png

본 연구에서는 기상청의 3시간 단위 예보를 예측 입력데이터로 사용하기 위하여, 1시간 기상관측 데이터를 그에 상응하는 3시간 단위로 변경하는 전처리 작업을 수행하였다. 전처리 작업은 3시간 단위의 시간간격 윈도우를 1시간 단위로 슬라이딩 이동하는 방식(0시-3시, 1시-4시, ... ,23시-익일2시)을 사용하였다. 표 1과 같은 1시간 단위의 풍속데이터를 이용하여 표 2와 같은 3시간 윈도우를 활용하여 3시간 단위의 평균풍속을 구하였고, 이를 통해 예측 입력데이터와 같은 3시간 단위의 학습 입력데이터를 구축하였다.

표 1. 0시~24시 AWS 풍속 데이터 측정 사례

Table 1. Measurement of AWS wind speed data between 0 and 24 hours

시간대

(h)

1시간

평균풍속(m/s)

시간대

(h)

1시간

평균풍속(m/s)

0-1

5

12-13

5

1-2

5

13-14

3

2-3

10

14-15

3

3-4

15

15-16

2

4-5

15

16-17

1

5-6

15

17-18

1

6-7

15

18-19

1

7-8

10

19-20

1

8-9

10

20-21

1

9-10

5

21-22

0

10-11

5

22-23

0

11-12

5

23-00

0

표 2. 3시간 단위 학습 입력데이터 선정 : 하루(24시간)를 3시간 단위 24개 윈도우로 구분함

Table 2. Selection of 3 hour learning input data: 24 hours divided into 24 windows per 3 hours

시간대(h)

3시간

평균풍속

(m/s)

특보수준

데이터선정

0-3

6.7

-

1-4

10

-

2-5

13.3

주의보

선정(주의보)

3-6

15

경보

선정(경보)

4-7

15

경보

선정(경보)

5-8

13.3

주의보

선정(주의보)

6-9

11.7

주의보

선정(주의보)

7-10

8.3

-

11-14

4.3

-

2.2 전력설비 고장 데이터 분석

표 3. 자연재난으로 인한 전력설비의 고장 발생(2007~2018) 현황

Table 3. Status of power facility failures due to natural disasters(2007-2018)

전력설비

자연재난(건)

전체고장

(건)

태풍

강풍

호우

변압기

166

39

87

292

18,746

전선

2,790

1,080

809

4,679

20,472

개폐기

80

28

37

145

7,693

애자

149

51

39

239

7,628

피뢰기

177

78

54

309

16,973

전주

254

116

260

630

2,065

COS

342

191

98

631

6,120

3,958

1,583

1,384

6,925

79,697

위의 전처리 과정을 통해 기상재해 종류 및 발생시각을 파악하고 설비고장 시각과 비교함으로써 그 고장의 원인을 매칭하였다. 그 결과는 표 3과 같다.

2.3. 기상과 설비고장 데이터 상관관계 분석

2.3.1 상관관계 분석 개요

본 연구에서는 예측모델 출력(전력설비 고장건수, 정전고객수)에 영향을 미치는 주요 입력변수(기상 요소) 선정을 위해 피어슨 상관관계 분석법을 사용하였고, 기상 요소는 평균 기온, 최소 온도, 최대 온도, 평균 강수량, 최소 강수량, 최대 강수량, 평균 풍속, 최소 풍속, 최대 풍속, 평균 풍향, 최소 풍향, 최대 풍향을 사용하였다. 피어슨 상관계수는 다음 방정식으로 계산할 수 있다.

(1)
$R_{m}=\dfrac{n\times(\sum X_{n}Y)-(\sum X_{m)}\times(\sum Y)}{\sqrt{(n\times\sum X_{m}^{2})\times(\sum X_{m})^{2}\times(n\times\sum Y^{2})-(\sum Y)^{2}}}$

수식(1)에서 $R_{m}$은 기상 데이터 m에 대한 피어슨 상관계수를 나타낸다. $n$은 데이터 수이며, $X_{m}$은 기상 데이터이다. $Y$는 전력설비 고장 수를 나타낸다.

피어슨 상관계수($R_{m}$)은 $-1$과 $1$사이의 값을 갖는다. 입력변수를 선정하기 위해서는 임계값이 필요하며 이는 $0$과 $1$ 사이의 범위여야 한다. 본 연구에서는 기본 임계값을 $0.2$로 적용하였다. 전력설비는 기상 악화 상황에서도 정상으로 운영될 수 있도록 강화된 설계 기준에 따라 관리되는 관계로 자연재난 상황에서도 고장이 드물게 발생하기 때문에 일반적으로 $0.5$보다 낮은 $0.2$를 적용할 수 있다.

2.3.2 상관관계 분석 결과

표 4. 태풍재난에 대한 고압배전설비(고장, 정전고객수)와 기상요소 사이의 상관관계 분석 결과(서귀포지역)

Table 4. Correlation analysis results between distribution facilities failure and meteorological factors for typhoon(Seogwipo area)

구분

평균

온도

최소

온도

최대

온도

평균

풍속

최소

풍속

최대

풍속

평균

풍향

최소

풍향

최대

풍향

평균

강수량

최소

강수량

전주

고장건수

-0.060

-0.115

-0.037

0.275

0.170

0.274

0.012

-0.037

-0.013

0.303

0.098

정전고객수

-0.058

-0.058

-0.034

0.244

0.196

0.245

0.028

-0.030

0.005

0.321

0.092

전선

고장건수

-0.037

-0.156

-0.045

0.561

0.332

0.542

-0.108

0.015

-0.196

0.447

0.371

정전고객수

-0.057

-0.158

-0.061

0.547

0.340

0.525

-0.086

0.008

-0.162

0.480

0.467

애자

고장건수

-0.027

-0.058

-0.034

0.244

0.194

0.245

0.028

-0.030

0.005

0.321

0.092

정전고객수

-0.040

-0.002

-0.028

0.044

-0.00

0.074

0.028

0.089

0.011

-0.027

-0.020

피뢰기

고장건수

-0.026

-0.241

-0.021

0.391

0.130

0.365

-0.023

-0.016

-0.131

0.183

0.221

정전고객수

0.012

-0.214

-0.006

0.356

0.077

0.330

-0.077

-0.024

-0.156

0.158

0.234

CoS

고장건수

-0.120

-0.143

-0.078

0.398

0.262

0.399

0.023

-0.009

-0.057

0.439

0.320

정전고객수

-0.016

-0.081

-0.007

0.339

0.198

0.337

-0.083

0.030

-0.162

0.305

0.209

변압기

고장건수

-0.006

-0.134

-0.006

0.371

0.181

0.352

-0.059

0.014

-0.162

0.188

0.182

정전고객수

-0.005

-0.075

0.002

0.363

0.234

0.342

-0.028

0.045

-0.137

0.154

0.135

표 4는 태풍 발생 시 제주지역 서귀포지사의 기상요소와 배전설비 고장에 대한 상관분석 결과를 보여준다. 상관계수의 절대 값이 0.2 이상인 경우는 표 4에 음영으로 표시하였다. 상관계수가 0.2 이상인 경우 두 변수는 약한 선형관계 이상임을 나타낸다. 해당 표에서 전주 고장에 대해서는 평균강수량이 0.303으로 가장 큰 상관계수를 가지는 것을 볼 수 있다. 즉, 전주 고장은 평균강수량이 가장 큰 영향을 미칠 것으로 예상된다. 전주 고장으로 인한 정전고객수의 경우도 마찬가지로 평균강수량이 가장 큰 상관계수를 가진다.

상관계수가 기준치를 초과하는 기상요소들은 해당 지역의 인공신경망 기계학습 알고리즘의 학습과 예측과정에서 입력 요소로 사용된다. 예를 들어 전선의 고장을 학습·예측하는 경우에는 기상요소에서 {평균풍속, 최소풍속, 최대풍속, 평균강수량, 최소강수량, 최대강수량}을 사용하며, CoS의 고장건수와 정전고객수를 학습·예측하는 경우에는 전선과 다르게 {최소풍속}이 제외된 {평균풍속, 최대풍속, 평균강수량, 최소강수량, 최대강수량}을 기상요소의 입력으로 사용한다.

3. 재난피해 예측 알고리즘 개발 및 평가

3.1 개발 모델 개요

3.1.1 인공신경망(Artificial Neural Network, ANN) 모델

ANN은 인간 또는 동물의 두뇌를 만드는 생물학적 신경 네트워크에서 영감을 얻은 컴퓨터 시스템이다. ANN은 데이터와 그 상관관계를 학습하여 결과를 추정한다. 비선형적인 종속성을 해결하고 데이터 세트에 포함된 노이즈를 제거하기 위해서 데이터를 학습한다. ANN은 뉴런이라 불리는 연결 단위 모음으로 구성된다. 하나의 기본 뉴런은 최소한 입력, 출력 및 가중 입력을 출력에 매핑하는 활성화 함수가 있어야한다. 이 기능을 활성화 기능 또는 전달 기능이라고 한다. 본 연구에서는 활성화함수로 softplus 함수를 사용하였다. 또한, 전력설비 고장 예측과 같은 선형 예측을 위해 ANN은 다중 입력 및 활성화 함수 및 단일 출력으로 구성할 수 있다. 그림 2는 ANN의 구조를 보여준다.

그림. 2. ANN 구조

Fig. 2. ANN Structure

../../Resources/kiee/KIEE.2019.68.9.1085/fig2.png

본 연구에서는 일반적으로 가장 많은 분야에서 사용되는 Gradient descent를 사용하여 비용 함수를 최소화하였다.

ANN 모델 개발 과정에서 결정해야하는 세 가지 설정이 있다. 이 설정은 히든 레이어의 노드 수, 정규화 파라미터($\lambda$) 및 임의 초기화 파라미터($\epsilon$)이다. 본 연구에서 얻어진 ANN 설정 집합 중 히든 레이어는 3개의 노드로 설정하였다. 히든 레이어를 4개 이상으로 증가시키는 경우 기계 학습 시간과 예측 시간이 증가되었으며, 테스트 데이터 집합을 대상으로 Test Error의 정확도가 낮아지는 현상이 발생하였다. 초기화 파라미터($\epsilon$), 정규화 파라미터($\lambda$)는 지수적으로 증가하는 값을 사용하여 결정한다. 지수적으로 증가하는 값은 수식(2)수식(3)을 사용하여 계산한다. ANN 모델 기계학습 과정에서 초기화 파라미터($\epsilon$), 정규화 파라미터($\lambda$)는 지역별, 설비별 학습 과정에서 아래의 값들 중에서 최적의 값으로 자동으로 선정하여 관리한다.

(2)
\begin{align*} \epsilon & =\left\{0.01\times\left\{2^{0},\: 2^{1},\: 2^{2},\: 2^{3},\: 2^{4},\: 2^{5},\: 2^{6},\: 2^{7}\right\}\right\}\\ & =\{0.01,\: 0.02,\: 0.04,\: 0.08,\: 0.16,\: 0.64,\: 1.28\} \end{align*}

(3)
\begin{align*} \lambda & =\left(0.01\times\left(e^{0},\: e^{1},\: e^{2},\: e^{3},\: e^{4},\: e^{5},\: e^{6},\: e^{7}\right\}\right\}\\ & =\{0.01,\: 0.03,\: 0.07,\: 0.2,\: 0.5,\: 1.5,\: 4,\: 11\} \end{align*}

3.1.2 비교 평가를 위한 선형회귀분석(Linear Regression Analysis, REG) 모델

비교를 위한 REG 모델은 주어진 데이터 집합 {$y_{i},\: x_{i},\: ...,\: x_{ip}$}에 대해, 종속 변수 $y_{i}$와 p 개의 독립변수 $x_{i}$ 사이의 선형관계를 모델링 한다. REG 모델은 수식 다음과 같은 형태를 갖는다.

(4)
\begin{align*} y_{i}=\beta_{1}x_{i1}+\cdots +\beta_{p}x_{ip}+e_{i}=X_{i}^{T}\beta +e_{i},\:\\ \\ i=1,\:...,\:n \end{align*}

수식(4)에서 $\beta_{i}$는 각 독립변수의 계수이며, $p$는 선형회귀로 추정되는 모수의 개수이다. T는 전치를 의미하며 $X_{i}^{T}\beta$는 $X_{i}$와 $\beta$의 내적을 의미한다. $e_{i}$는 오차항으로 관찰되지 않은 확률변수이며 종속변수와 독립변수사이에 오차를 의미한다. 본 연구에서 독립변수는 해당 재난 발생 시의 날씨변수들을 사용하였고 예측변수는 각 설비에 대한 고장건수 및 정전고객수를 적용하였다. 최소제곱법은 가장 단순하고 많이 쓰이는 추정 방법이다. 이는 개념적으로 단순하고, 계산이 간단하다. 최소제곱법 추정은 일반적으로 실험이나 관측치에 적용하고자 할 때 사용한다. 최소제곱법은 오차의 제곱의 합을 최소화하는 기법으로, 추정하고자 하는 파라미터 β에 대한 표현식을 수식(5)와 같이 구할 수 있다.

(5)
$\hat\beta =(X^{T}X)^{-1}X^{T}y$

3.2 재난피해 예측 모델 개발

기상 정보는 여러 기상관측센터에서 수집되는 반면 전력설비 고장정보는 한전지사에서 관리하고 있다. 하나의 지사 영역 내에 여러 기상관측센터가 존재하기 때문에 모든 AWS에서 수집한 기상 정보를 반영할 필요가 있다. 이를 위해 입력변수로 기상 변수의 평균값, 최솟값, 최댓값을 사용하였으며, 기상 변수 사용에 따라 평균값만을 사용한 평균모델, 최소 및 최댓값만을 사용한 극한모델, 모든 기상 변수를 사용한 통합모델을 각각 개발하고 검증하였다. 실험 결과 평균모델, 극한모델, 통합모델 중에서 기상 변수의 평균값을 적용한 평균모델의 정확도가 가장 우수하였다.

그림 3은 기상관측센터와 지사관리 영역의 예시를 보여준다. 타원은 기상청의 기상관측센터(AWS)를 나타내며 검정색 점선은 사업소영역을 나타낸다. 파란색 실선은 기상청 동네예보 구역을 의미한다.

그림. 3. 기상관측센터 및 사업소 영역 구성 사례

Fig. 3. A case of AWS and branch office composition

../../Resources/kiee/KIEE.2019.68.9.1085/fig3.png

본 논문의 재난피해 예측 알고리즘은 지역(지사) 단위로 학습과 예측을 수행한다. 그림 3과 같이 서대전지역의 학습 단계에서는 AWS 101에서 104까지 4개의 AWS 데이터와 서대전지사에서 발생한 전력설비 피해 정보를 이용한 학습 입력데이터 세트를 활용한다. 예측 단계에서는 동네예보 데이터인 도마동, 괴정동, 변동, 대흥동, 문화동의 5개 예보데이터를 이용하여 예측 입력데이터 세트를 활용한다. 같은 방식으로 대덕유성지역의 학습에는 AWS 201에서 203까지 3개의 기상관측데이터와 대덕유성지사에서 발생한 전력설비 피해 정보를 이용한 학습 입력데이터 세트를 활용하며, 예측 단계에서는 동네예보 데이터인 전민동, 문지동, 관평동의 3개 예보데이터를 이용하여 예측 입력데이터 세트를 활용한다.

여기서, 지역(지사)단위보다 큰 지역(전국 또는 특별시, 도 영역)의 넓은 지역을 대상으로 하는 광범위한 영역에 대한 학습과 예측은 지역별 특성을 정확히 반영하는데 한계가 있기 때문에 낮은 예측 정확도를 나타낸다. 본 논문에서는 이를 해결하기 위해 넓은 지역을 좁은 지역으로 한정하는 지역 단위의 알고리즘을 개발하였으며, 제주지역 서귀포지사를 대상으로 알고리즘 개발·검증·적용 결과를 기술한다.

예측 알고리즘은 기본적으로 ANN 모델로 개발하였으며 REG 모델과 비교 검증하였다. 알고리즘 개발을 위한 주요 데이터는 그림 4와 같은 형태로 구성된 통합 데이터베이스이다. 예측 알고리즘은 재난특보 지역의 동네예보를 입력데이터로 각 전력 설비의 고장 수를 예측한다.

그림. 4. 통합 데이터베이스 구성도

Fig. 4. Unified Database Configuration

../../Resources/kiee/KIEE.2019.68.9.1085/fig4.png

그림 4에서 “X”로 표시한 입력변수는 통합 데이터베이스의 기상 변수이다. 이 기상 변수는 평균 온도, 최소 온도, 최대 온도, 최대 풍속, 평균 풍속 및 최대 풍향, 평균 강수량, 최소 강수량, 최대 강수량, 평균 적설량, 최소 적설량, 최대 적설량이다. 반면, “Y”로 표시한 출력 데이터는 통합 데이터베이스의 전력 설비 고장 수 및 정전고객수이다. 레코드는 재난 현상 발생 일을 나타낸다.

통합 데이터베이스는 기상 데이터 (기상청 제공), 전력 설비 데이터베이스 및 고장 데이터베이스로 구성한다. 재난 현상의 각 유형은 태풍, 폭염, 한파, 호우, 강풍, 폭설로 각각의 데이터베이스가 존재한다. 따라서 각 유형의 재난 현상에 대해 재난피해 예측 알고리즘을 개발하여 각 전력 설비의 고장 수를 예측한다. 그림 5는 전제 재난피해 예측 알고리즘의 구성 및 동작 흐름을 보여준다.

그림. 5. 재난피해 예측 알고리즘 동작 흐름도

Fig. 5. Operational flow chart of the algorithms for prediction

../../Resources/kiee/KIEE.2019.68.9.1085/fig5.png

재난피해 예측을 위해 알고리즘은 통합 데이터베이스에서 데이터 검색을 시작한다. 이때 새로운 학습 입력데이터가 있는 경우 새로운 학습을 통해 신규 모델을 개발하거나, 개발된 모델을 사용하는 두 방식중 하나를 선택하여 수행한다. 학습된 모델은 ANN 파라미터{$\Theta^{(1)}$(기상요소), $\Theta^{(2)}$(정전고장수, 정전고객수)}, 피쳐 스케일링 파라미터{p1(기상요소 보정), p2(정전피해 보정)}, 그리고 새로운 ANN 설정(노드 수, 임의 초기화 파라미터($\epsilon$), 정규화 파라미터($\lambda$)로 구성된다. 선형회귀분석 모델도 마찬가지로 각각의 파라미터와 설정 값을 모델에 저장한다.

4. 시뮬레이션 및 평가

4.1 재난피해 예측 알고리즘 시뮬레이션 및 성능 최적화

개발한 재난피해 예측 알고리즘의 성능 최적화를 위해 실제 데이터를 사용하여 시뮬레이션을 수행하였다. 알고리즘은 설비 고장 수, 설비 고장에 따른 정전고객수를 예측하기 위해 사용한다. 시뮬레이션을 위해 훈련 데이터, 교차검증 데이터, 테스트 데이터 세 가지 데이터 집합을 구성한다. 훈련 데이터(교차검증 데이터 포함)는 전체 데이터의 80%, 테스트 데이터는 나머지 20%를 사용한다. 각 모델의 파라미터는 각 재난 유형 및 각 전력 설비 유형에 따라 최적화된 값을 사용한다. 또한, 예측 정확도 평가를 위해 평균 절대 오차(Mean Absolute Error, MAE)를 사용한다. MAE 방정식은 다음과 같다.

(6)
$MAE=\dfrac{\sum_{i=1}^{m}\left | Y_{i}-H_{i}\right |}{m}$

수식(6)에서, MAE는 평균 절대 오차, m은 데이터 수, $Y_{i}$는 실제 데이터, $H_{i}$ 예측한 출력을 나타낸다.

4.1.1 시뮬레이션 데이터

본 논문에서는 6가지 재난 중 태풍에 대해서 수행한 재난피해 예측 알고리즘 개발 결과를 기술하였다.

태풍 시뮬레이션은 태풍이 일어났을 때의 상황으로 정의한다. 태풍의 기간은 수 시간에서 수 일 동안 발생할 수 있으며 태풍 시 가장 중요한 요소는 풍속과 강수량이다. 날씨변수에 대해서는 기상 변수의 평균값만 사용하는 평균모델을 적용하였다.

학습 입력데이터 집합은 태풍이 발생했던 기간의 고장데이터와 날씨데이터를 통합데이터베이스에서 받아 사용한다. 각각의 전력지사에 따라 모델을 개발하며 해당 지사는 고유의 통합 데이터베이스를 갖는다. 예측에 사용한 데이터 집합은 두 가지로 분류된다.

첫 번째 데이터 집합은 훈련 데이터로 모델 개발에 사용된다. 본 논문에서는 2007년부터 2017년까지 우리나라에 영향을 미친 29개 태풍중에 2007년부터 2016년 중반까지의 28개를 데이터를 학습에 사용하였다. 두 번째 데이터 집합은 테스트 데이터 집합으로 모델을 검증하기 위해 사용한다. 본 연구에서는 제주시 서귀포지사를 대상으로 2016년 10월의 태풍 ‘차바’ 데이터를 테스트 데이터 집합으로 활용하였다.

표 5와 같이 본 시뮬레이션에서 모델 개발에 사용하는 훈련 데이터는 255개이다. 교차검증(Cross Validation) 데이터는 2015-07-11 15:00 ~ 2017-07-04 15:00 이며 63개이다. 테스트 데이터는 태풍 ‘차바’(2016-10-04 15:00 ~ 2016-10-05 15:00)에 대한 9개로서 예측 정확도 평가에 사용하였다. 모델은 배전시스템의 경우 전주, 애자, 전선, 피뢰기, CoS, 변압기의 총 6가지 설비에 대해 개발하였다. 그러나 실제로 태풍 기간에 모든 설비가 고장나는 것이 아니며 고장 발생이 거의 없는 경우가 많아 태풍 ‘차바’ 발생 기간 동안에 고장이 발생한 설비인 전선과 CoS의 시뮬레이션 결과만을 첨부하였다.

표 5. 서귀포 지사 기계학습 데이터 수

Table 5. Number of machine learning data for Seogwipo branch offics

서귀포지사

데이터 수

훈련 데이터(Train Data)

255

교차검증 데이터(CV Data)

63

테스트 데이터(Test Data)

9

4.1.2 ANN 모델 검증결과

그림 6은 태풍 ‘차바’로 인해 발생한 전선 고장건수와 전선 고장으로 인해 발생한 정전고객수에 대한 ANN과 REG을 적용한 모델 검증 결과를 보여준다. 그림 6의 왼쪽 그래프는 전선 고장건수에 대한 실제고장(실선), ANN 예측결과(대쉬 점선), 그리고 REG 예측결과(점선)를 보여준다. 오른쪽 그래프는 전선 고장으로 인한 정전고객수에 대한 예측 결과를 실제 정전고객수, ANN, REG 모델로 예측한 결과를 동시에 보여준다.

그림. 6-1. 태풍 ‘차바’로 인한 전선피해 예측 검증결과

Fig. 6-1. The analysis of line damage caused by Typhoon Chaba

../../Resources/kiee/KIEE.2019.68.9.1085/fig6_1.png

그림. 6-2. 태풍 ‘차바’로 인한 전선고장 정전고객수 예측 검증결과

Fig. 6-2. The analysis of the # of households(caused by line damage)

../../Resources/kiee/KIEE.2019.68.9.1085/fig6_2.png

‘차바’로 인해 실제 발생한 전선 고장과 그로 인한 정전고객수에 대하여 ANN, REG 모델 모두 실제와 유사한 예측을 수행하는 것을 알 수 있다. ANN 알고리즘으로 예측한 결과치가 실제와 비슷한 패턴을 그리는 것을 볼 수 있다. 각 그래프에서 ‘x’축은 태풍 ‘차바’가 영향을 미치는 시작시간(2016-10-04 15:00) 부터 종료시간(2016-10-05 15:00) 까지를 3시간 간격으로 나타내고 있으며, 좌・우측 그래프의 ‘y’축은 각각 전선 고장건수(건)와 전선고장으로 인한 정전고객수를 나타낸다.

그림. 7-1. 태풍 ‘차바’로 인한 CoS 피해 예측 검증결과

Fig. 7-1. The analysis of CoS damage caused by Typhoon Chaba

../../Resources/kiee/KIEE.2019.68.9.1085/fig7_1.png

그림. 7-2. 태풍 ‘차바’로 인한 CoS 고장 정전고객수 예측 검증결과

Fig. 7-2. The analysis of the # of households(caused by CoS damage)

../../Resources/kiee/KIEE.2019.68.9.1085/fig7_2.png

그림 7은 태풍 ‘차바’로 발생한 CoS 고장건수와 CoS 고장으로 인해 발생한 정전고객수에 대한 ANN과 REG을 적용한 모델 검증 결과를 보여준다. 그림 7의 왼쪽 그래프는 CoS 고장건수에 대한 실제고장(실선), ANN 예측결과(대쉬 점선), 그리고 REG 예측결과(점선)를 보여준다. 오른쪽 그래프는 CoS 고장으로 인한 정전고객수에 대한 예측 결과를 실제 정전고객수, ANN, REG 모델로 예측한 결과를 동시에 보여준다. 그러나 정전고객의 경우에는 발생 시간을 정확히 예측하지는 못하였다. 정전고객수 발생 패턴을 시간축을 기준으로 이동하면 예측치가 실제 값을 따라가는 것을 볼 수 있으며 예측한 정전고객수가 실제와 비슷한 것을 볼 수 있다. 이러한 원인은 전력설비 중 CoS 고장발생의 빈도가 전선의 고장발생 빈도에 비해 낮게 나타나고, 상대적으로 적은 수의 학습 입력데이터로 기계학습을 수행하였기 때문으로 분석하였다.

4.1.3 MAE 활용 예측 정확도 평가

표 6은 ANN 모델과 REG 모델을 적용한 전선, COS에 관한 MAE 값을 요약한 것이다. MAE는 그 값이 0에 가까울 수록 모델의 정확도가 좋음을 나타낸다. 이는 모델이 고장인 경우와 그렇지 않은 경우를 잘 구분함을 보여준다. 서귀포지사의 2016년 태풍 ‘차바’에 대해서 평가한 결과로는 전선 피해와 전선 고장으로 인한 정전고객수 분야는 ANN 모델이 REG 모델에 비해 다소 오차율이 적었으며, CoS 피해건수는 REG 모델이 ANN 모델에 비해 우수한 것으로 평가되었으나, CoS로 인한 정전고객수에 대한 예측정확도는 ANN알고리즘이 보다 우수한 것으로 평가되었다. 다만, 학습 입력데이터와 테스트 데이터 모두 전반적으로 CoS의 피해건수가 전선의 피해건수보다 적었기 때문에 학습 입력데이터가 많은 전선에 대한 평가 결과가 CoS에 대한 평가 결과보다 정확도가 좀 더 우수하다고 분석하였다.

표 6. MAE 활용 모델 정확도 평가 결과

Table 6. Results of accuracy evaluation using MAE

구분

MAE

전선고장

정전고객수 (전선고장)

CoS고장

정전고객수 (CoS고장)

REG

0.190

631.2222

0.0476

49.2857

ANN

0.127

429.0476

0.0476

28.4286

4.2 태풍 솔릭에 대한 피해 예측 결과

2018년 태풍 ‘솔릭’이 서귀포 지사에 내습한 기간은 2018-08-22 15:00 ~ 2018-08-24 12:00이며, 내습 기간동안 동네 예보 발효 건수는 3시간 단위의 16개이며, 이 16개의 동네 예보를 입력으로 실제 태풍 내습 이전에 수행된 예측과 실제 고장결과를 비교하였다. ‘솔릭’으로 인해 서귀포지사에서는 총 16개의 예측 기간 동안 9개의 기간에서 고장이 발생하였으며, 전선 이외의 다른 설비피해는 발생하지 않았다.

그림. 8. 전선을 대상으로 한 피해 예측 결과(2018년 태풍‘솔릭’)

Fig. 8. Prediction Result for the line damage (2018 Typhoon 'SOULIC')

../../Resources/kiee/KIEE.2019.68.9.1085/fig8.png

ANN과 REG 모델 적용 결과는 그림 8과 같다. 각 그래프에서 ‘x’축은 태풍 ‘솔릭’이 영향을 미치는 시작시간(2018-08-22 15:00) 부터 종료시간(2018-08-24 12:00) 까지를 3시간 간격으로 나타내고 있으며, ‘y’축은 전선 고장건수(건)와 전선고장으로 인한 정전고객수를 나타낸다. 예측에서 고장이 발생(미발생)한다고 판정한 경우와 실제 고장이 발생(미발생)한 경우 그 결과를 성공으로 판정하였다. 표 7과 같이 ANN 모델은 16개 시간대에 대하여 9개 시간대의 고장 발생 여부를 판별하는데 성공하였다. MAE를 적용한 정확도는 1.25로 측정되었다. REG 모델도 ANN 모델과 마찬가지로 16개 시간대에 대하여 9개 시간대의 고장 발생 여부를 판별하는데 성공하였으며, MAE를 적용한 예측 정확도는 1.75로 측정되었다.

표 7. 시간대별 실제 고장 및 알고리즘의 고장 예측 결과(2018년 태풍‘솔릭’)

Table 7. Results of Comparision actual failure with prediction (2018 Typhoon 'SOULIC')

시간대

실제

REG

ANN

예측

결과

예측

결과

2018-08-22 15:00

0

3

0

2

0

2018-08-22 18:00

1

3

성공

2

성공

2018-08-22 21:00

2

6

성공

3

성공

2018-08-23 0:00

0

6

0

3

0

2018-08-23 3:00

5

7

성공

3

성공

2018-08-23 6:00

6

5

성공

2

성공

2018-08-23 9:00

2

4

성공

2

성공

2018-08-23 12:00

3

5

성공

2

성공

2018-08-23 15:00

2

2

성공

1

성공

2018-08-23 18:00

2

2

성공

1

성공

2018-08-23 21:00

0

2

0

1

0

2018-08-24 0:00

0

1

0

1

0

2018-08-24 3:00

0

1

0

1

0

2018-08-24 6:00

0

1

0

1

0

2018-08-24 9:00

0

1

0

0

성공

2018-08-24 12:00

0

0

성공

0

성공

표 8. 피해 예측 정확도 비교(2018년 태풍‘솔릭’)

Table 8. Comparison of the predicted damage MAE(2018 Typhoon 'SOULIC')

구분

성공수(건)/전체수(건)

MAE(고장건수)

REG

9/16

1.75

ANN

9/16

1.25

두 알고리즘 모두 동일한 입력인 서귀포지사의 동네예보 기상 요소(강우량, 풍속)를 입력으로 예측을 수행하였다. 두 알고리즘 모두 고장발생에 대한 판별은 9건씩으로 같은 결과를 나타냈으며, 예측 정확도를 나타내는 MAE 값에 있어서는 ANN 알고리즘이 REG 알고리즘에 비해 우수함을 확인할 수 있었다.

5. 결 론

본 논문에서는 ANN을 이용하여 재난피해 예측 모델을 개발하고 REG 기법과 비교하여 제안된 알고리즘의 정확도를 평가하였다. 피어슨 상관관계 분석 기법으로 예측 모델 알고리즘에서 사용될 입력 변수를 선정하였으며, 교차 검증 방법을 활용하여 히든 레이어 수, 초기화 파라미터 및 정규화 파라미터를 최적화 하였으며, 이때 최적 파라미터를 찾는 방법으로는 gradient descent 방법을 적용하였다.

알고리즘의 검증에 사용하는 데이터는 통합 데이터베이스를 구축하여 사용한다. 이 통합 데이터베이스는 재난 특보에 해당하는 기상조건을 추출하여 구축한다. 알고리즘 개발 및 검증을 위하여 데이터를 두 가지 데이터 집합으로 구분한다. 첫 번째 데이터 집합은 재난피해 예측 모델을 개발하는데 사용하는 훈련 데이터 집합과 교차검증 데이터 집합이며, 두 번째 데이터 집합은 예측결과를 검증하기 위한 테스트 데이터 집합이다. 정확도 검증은 개발 모델을 적용하여 테스트 데이터 집합의 설비고장 건수와 비교를 통하여 검증하였으며, MAE를 사용하여 예측 정확도를 평가하였다. 본 논문에서는 6개 재난 유형에 대한 예측 모델을 설계하는 과정을 기술하였으며, 제주 서귀포지역의 태풍 재난을 대상으로 개발된 ANN 알고리즘을 REG 방식과 비교 분석하였다. 2016년 태풍 ‘차바’에 대한 전선 고장발생 예측의 경우 ANN의 MAE가 0.127로 REG의 MAE인 0.190 보다 낮은 값을 가지므로 ANN이 보다 정확하게 예측함을 확인하였으며, CoS 고장으로 인한 정전고객수의 경우에도 역시 ANN의 MAE가 낮은 값을 보였다. 또한, 2018년 태풍 ‘솔릭’을 대상으로 수행한 실제 예측수행 결과도 ANN이 고장건수의 MAE가 1.25로 REG 1.75 보다 낮음을 확인하였다. 이를 통해 ANN의 예측 정확도가 REG 방식보다 우수함을 확인하였다.

향후 전력설비 고장 유발 요인인 설비제원, 노후도 등 설비의 추가적 특성을 고려하고, 날로 발전하는 인공지능 기술을 추가적으로 접목함으로써 예측 정확도가 보다 우수한 알고리즘 개발을 위한 연구가 필요하다.

References

1 
Executive Office of the President, 2013, Council of Economic Advisers, Economic Benefits of Increasing Electric Grid Resilience to Weather Outages, The CouncilGoogle Search
2 
D. T. Ton, W.-T. P. Wang, April 2015, A more resilient grid: The US department of energy joins with stakeholders in an R&D plan, IEEE Power and Energy Magazine, Vol. 13, No. 3, pp. 26-34DOI
3 
NERC, Jan. 2014, Hurricane Sandy Event Analysis ReportGoogle Search
4 
http://rain-project.eu/, RAIN Project Consortium, European UnionGoogle Search
5 
Hongfei Li, Sep. 2010, http://researcher.watson.ibm.com/files/us-egaioni/HongfeiLi-IBMworkshop.pptGoogle Search
6 
D. W. Wanik, 2012, Weather-Based Damage Prediction Models for Electric Distribution Networks, Master’s Thesis, University of ConnecticutGoogle Search

저자소개

최민희(Min-Hee Choi)
../../Resources/kiee/KIEE.2019.68.9.1085/au1.png

He received his M.S. Degree from University of Seoul.

He has worked in Korea Electric Power Research Institute(KEPRI) as a researcher for 10 years.

His research interests include SW Engineering for power system stability and power quality.

정남준(Nam-Joon Jung)
../../Resources/kiee/KIEE.2019.68.9.1085/au2.png

He received his Ph.D. from Hanbat University.

He has worked in Korea Electric Power Research Institute (KEPRI) as a researcher for 24 years.

He is presently a Chief Researcher of Software Platform Laboratory.

His research interests include Smart Grid and SW Engineering.

이규철(Kyu-Chul Lee)
../../Resources/kiee/KIEE.2019.68.9.1085/au3.png

He received B.S. Degree from Korea University.

He has worked in Korea Electric Power Corporation (KEPCO) for 36 years as a General Manager of Safety and Security Department.

His research interests include Disaster Management and HSSE.

정재성(Jae-Sung Jeong)
../../Resources/kiee/KIEE.2019.68.9.1085/au4.png

He received B.S. degree in electrical engineering from Chungnam National University, Korea; M.S. degree in electrical engineering from North Carolina State University, Raleigh, NC; Ph.D. degree in electrical engineering from Virginia Tech, Blacksburg, VA.

He is currently a faculty member in the Department of Energy Systems Research at Ajou University, Korea.

His research interests include the development and deployment of renewable and sustainable energy technologies.

서인용(In-Yong Seo)
../../Resources/kiee/KIEE.2019.68.9.1085/au5.png

He received the B.S. and M.S. degree in Electrical Engineering from Sungkyunkwan University and Busan National University in 1984 and 1989, respectively.

He received his Ph.D. in Electrical Engineering from Brown University, United States, in 2003.

He is a vice president of Korea Electric Power Research Institute(KEPRI).

His current research interests are digital solutions in energy new industry and modeling of Complex System.