Mobile QR Code QR CODE : Korean Journal of Air-Conditioning and Refrigeration Engineering
Korean Journal of Air-Conditioning and Refrigeration Engineering

Korean Journal of Air-Conditioning and Refrigeration Engineering

ISO Journal TitleKorean J. Air-Cond. Refrig. Eng.
  • Open Access, Monthly
Open Access Monthly
  • ISSN : 1229-6422 (Print)
  • ISSN : 2465-7611 (Online)

  1. 중앙대학교 건축공학과 박사과정, (Ph.D. Course, Graduate School, Department of Architectural Engineering, Chung-Ang University, Seoul, 06974, Korea)
  2. 중앙대학교 건축학부 교수 (Professor, School of Architecture and Building Science, Chung-Ang University, Seoul, 06974, Korea)



인공지능, 인공신경망, 에너지효율, 의료건물
Artificial intelligence, Artificial Neural Network, Energy efficiency, Healthcare Building

기호설명

1. 서 론

지구온난화 현상과 지속적인 난개발로 인해 발생하는 이상기후 현상은 어제 오늘 일이 아니며 인류의 심각한 위기로 대두되고 있다. 특히, 지구 온난화의 주범으로 지목되고 있는 탄소의 발생을 줄이기 위해 전세계가 다각적인 노력을 하고 있는 실정이다. 2011 Building Energy Data Book의 자료에 따르면 미국 총에너지 사용량의 41%가 건물 에너지로 사용되고 있으며, 이는 산업, 교통 등의 다른 분야보다도 건축분야에서의 에너지 소비를 줄이는 접근이 사회 경제적 문제를 고려할 때 에너지 문제를 해결하기 위한 가장 효율적인 접근이라 말하고 있다.(1) 이에 건물 에너지 절감하는 방안과 친환경 에너지 사용에 대한 관심이 증가하고 있는게 현실이다. 2000년 이후 우리나라 경우도 건물의 에너지 사용량은 지속적으로 증가 추세를 보이고 있다. 2013년도 기준으로 건물별 에너지 사용 현황을 살펴보면, 아파트의 에너지 사용량비중은 17.7%, 상용은 15.8%, 학교는 14.6%, 병원은 12.1%를 차지한다. 또한, 건물 에너지원 사용현황을 살펴보면, 전기 사용량 비중이 지속적으로 증가하는 가운데, 특히 병원의 전기 사용 비중은 46.9%로 전기 사용에 대한 의존도가 높은 편이다.(2)

현재 효율적으로 에너지를 절감할 수 있는 방안으로 ICT(Information & Communication Technology)활용과 인공지능(AI, Artificial intelligence)에 대한 관심이 높아지고 있다. 인공지능의 적용은 환경 설비 분야에서 가장 활발하게 연구되고 있으며, 주로 건물 에너지 최적화 및 공조 시스템 제어에 활용되어 쾌적한 건물 환경 조성을 위한 기술로 사용되는 것으로 분석되었다. 이는 기존의 건물 환경제어보다 진보된 제어방법이며, 특히 건물 부하 및 온열 환경 예측을 바탕으로 공조시스템의 최적 운전하는 관점에서 매우 효과적인 방법이다.(3)

본 연구에서는 인공지능 모델들의 예측 정확도를 비교하고 최적화된 모델을 활용하여 건물 에너지 효율에 인공지능 모델 기초 연구를 목적으로 한다.

2. 연구범위 및 방법

본 연구에서는 헬스케어 건물 대상으로 냉·난방 에너지 소비량과 시간별 부하 패턴을 분석하고 가장 널리 사용되고 있는 머신러닝 기반 모델들과 고급 딥러닝 기반 모델들의 성능을 비교 평가하여 에너지 효율 예측을 위한 최적의 모델을 제안하였다. MLR, SVM, ANN 등 대표적인 예측 모델을 수치 해석 및 프로그래밍 소프트웨어인 MATLAB(Matrix Laboratory)과 R프로그래밍을 통해 연구하였고, ASHRAE(4)의 Great Building Energy PredictorⅢ 오픈 데이터를 바탕으로 대상 건물인 헬스케어 건물을 이용하여 2016년부터 2017년까지 일별 에너지 소비 값과 설비 분야 구성 요소에 따른 에너지 소비 영향도 분석을 진행하였다. 이후 출력 값과의 상관관계분석을 통해 입력변수를 선정하여 학습을 실시하였으며 예측된 에너지사용량과 실제 건물의 에너지 사용량을 비교하여 최적화된 모델을 개발하였다

2.1 ASHRAE 데이터

ASHRAE(4)의 Great Building Energy PredictorⅢ데이터는 Building_metadata(primary_use, square_feet, year_built, floor_count)와 weather_data(air_temperature, cloud_coverage, precip_depth_1_hr, sea_level_pressur, wind_speed, timestamp)로 구성되어 있다. 상관분석을 위해 ASHRAE(4)에서 수집된 1000여 개의 건물 중 헬스케어 부문 30만여 개의 데이터 셋을 이용, 예측 모델에 선별된 환경 변수를 선택하여 166,799개의 데이터를 선별하였다. 선별된 데이터는 건물 면적, 공기 온부, 구름양, 해수면 압력, 바람 속도, 일일 시간이며, 결측치를 제외한 항목별 94,179개의 데이터를 예측모델 분석에 활용하였다. Fig. 1은 헬스케어 건물들의 일년간 평균 에너지 소비량을 보여 주며, 6월 말부터 8월 말까지의 에너지 소비량이 가장 많다.

Fig. 1 A year's worth of measurements (2016~2017)
../../Resources/sarek/KJACR.2022.34.7.336/fig1.png

2.2 상관분석

에너지 효율 예측 모델 연구에 앞서 사전 연구로 변수간 상관관계 분석을 실시하였다. R 프로그래밍의 ‘corrgram’ 패키지를 이용하여 ASHRAE(4)에서 제공해 주는 데이터 변수간의 상관관계를 살펴보았다. 피어슨 상관 계수(Pearson Correlation Coefficient, PCC)란 두 변수 X와 Y 간의 선형 상관관계를 계량화한 수치다. 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관관계, 0은 선형 상관관계 없음, -1은 완벽한 음의 선형 상관관계를 의미한다. 일반적으로 상관관계는 피어슨 상관관계를 의미하는 상관 계수이다. Fig. 2에서 에너지 소비량과 가장 높은 상관도를 보이는 것이 ‘건물 면적(square_feet)’으로 상관 계수 값이 0.77이었다. 이는 건물의 냉난방 소비량이 건물의 크기와 비례하기 때문이기에 에너지 효율 모델 적용에 있어서 신중해야 한다. 공기온도(air_temperature)와 구름양(cloud_coverage)의 음의 상관 관계 값이 -0.25, 바람속도(wind_speed)와 해수면 압력(sea_level_pressur)이 -0.22, 일일시간(timestamp)이 0.20의 상관관계가 있음을 살펴보았다. 무엇보다도 에너지 소비량과 가장 높은 상관도를 보이는 건물면적을 제외한 환경 요인들은 피어슨 상관 계수가 0.05보다 작게 나타났다. 이는 ASHRAE(4) 데이터의 환경 변수들을 이용한 에너지 효율 예측 모델이 매우 제한 적일 수 있다는 것을 보여준다. 이러한 사전 상관분석을 통해, 예측 모델에 사용할 환경 변수를 다음과 같이 결정하였다(건물 면적, 공기 온부, 구름량, 해수면 압력, 바람 속도, 일일 시간).

Fig. 2 Correlation analysis (Helathcare building of ASHRAE)
../../Resources/sarek/KJACR.2022.34.7.336/fig2.png

2.3 예측 모델 비교

본 연구에서는 대표적인 예측 모델로 다중 선형 회귀(Multiple Linear Regression, MLR) 모델과 머신러닝 고급 모델 중 하나인 서포트 벡터 머신(Support Vector Machine, SVM) 모델을 사용하였고, 이와 함께 최근에 활용도가 높아지고 있는 인공지능 기반 모델인 인공신경망(Artificial Neural Network, ANN) 모델을 비교 평가하여 에너지 효율 예측을 위한 최적의 모델을 제안하였다.

2.3.1 다중 선형 회귀(Multiple Linear Regression, MLR)

다중 선형 회귀(MLR) 모델을 예측 분야에 있어, 가장 기본적인 방법으로서 수치형 데이터를 모델링하기 위해 가장 많이 사용된다.(5, 6) 과거의 모델을 기준으로 하여 미래의 모델을 예측하기 위해 사용되는 패턴을 식별한다. 거의 모든 유형의 데이터에 적용 가능하고, 속성과 결과 간 관계의 견고성과 크기를 추정할 수 있다는 장점이 있다.

2.3.2 서포트 벡터 머신(Support Vector Machine, SVM)

서포트 벡터 머신(SVM)은 기계학습 분야 중에서 가장 널리 사용되는 모델중 하나로, 주어진 데이터의 결정 경계(Decision Boundary), 즉 분류를 위한 기준 선을 정의하여 예측하는 방법이다. SVM은 벡터공간을 통해 계산이 이루어지는 서로 다른 성향을 갖는 특성의 구분 경계가 서포트 벡터에 의해 결정된 때 마진이 가장 큰 값을 갖도록 하는 방식이다.(7)

2.3.3 인공신경망(Artificial Neural Network, ANN)

인공신경망(ANN)은 생물학적 뉴런을 기반으로 한 인공 뉴런을 통해, 복잡 한 계산이 이루어질 때의 상호작용을 계산 모델로 구현한 것으로서 딥러닝의 핵심 역할을 하고 있다.(8) 개별 인공 뉴런들이 모여 거대한 네트워크를 구성하는 구조를 가지고 있는 ANN은 데이터의 패턴과 관계를 탐지하여 지식을 수집하고 프로그래밍이 아닌 경험을 통해 학습이 이루어진다. 규모가 크고 복잡한 문제를 처리 할 수 있다.

Fig. 3 Artificial neural network (ANN)
../../Resources/sarek/KJACR.2022.34.7.336/fig3.png

2.4 모델 성능 검증 방법

예측 모델 성능 평가를 위해 K-fold 교차 검증을 실시하였고, 평균제곱근 오차(RMSE, Root Mean Square Error)와 결정계수(R-squared, coefficient of determination) 지표들을 이용하여 모델 평가를 실시하였다.

2.4.1 K-fold 교차 검증

K-fold 교차검증은 가장 일반적이고 많이 사용되며 강력한 교차 검증 방법 중 하나이며, 말 그대로 데이터 셋을 K개의 다른 데이터 셋을 구성하고 모델을 각 학습하는 방법으로 K번 검증하는 방법이다. K-fold에서 K는 우리가 지정할 수 있다. 위의 Fig. 4에서는 K를 5로 지정하였고 전체 데이터를 임의로 1/5로 나누어서 validation set을 한 번씩 번갈아가면서 데이터 셋을 구성한다. 각 데이터를 학습하고 validation으로 평가를 한 다음 5개의 결과에 대해 평균을 내어 최종 성능을 구한다. 이런 식으로 데이터를 구성한다면 우선 모델 평가부분에서 고정된 validation set이 아니기 때문에 조금 더 신뢰성 있는 결과를 얻을 수 있다. 또한, CV(Cross Validation)를 사용하는 가장 큰 이유는 하이퍼파라미터 튜닝인데, ​하나의 validation set을 잘 맞추기 위한 튜닝이 아니라 다른 validation set을 잘 맞추기 위한 튜닝을 하기 때문에 과적합을 피하는 학습을 할 수 있는 것이다. K는 우리가 직접 지정할 수 있지만 통상적으로 5, 10으로 많이 사용하며, 중요한 것은 K가 적어질수록 bias는 커질 것이고 K가 커진다면 variance가 커진다. 또한 K가 크다면 시간도 많이 걸릴 것이다. K-fold cross-validation 의 최종 test error는 CV⒦로 나타내며, 수식으로 나타내면 다음 식(1)과 같다.

Fig. 4 K-fold cross validation
../../Resources/sarek/KJACR.2022.34.7.336/fig4.png
(1)
$CV_{(k)}=\dfrac{1}{K}\sum_{K=1}^{K}MSE_{k}$

2.4.2 성능 평가 지표

예측 모델들의 성능 평가를 위해 RMSE와 R-squared를 사용하였다. 평균제곱근 오차는 식(2)와 같이 정의된다.

(2)
RMSE = $\sqrt{\dfrac{1}{{n}}\sum_{{i}=1}^{{n}}\left({y}_{{i}}-\hat{{y}}_{{i}}\right)^{2}}$

결정계수는 분산기반 예측 성능 평가지표로서 회귀분석. 통계적 분석에서 많이 쓰이는 개념으로 0일수록 상관관계가 적고 1일수록 상관관계가 높은 것이 특징이다. 수식은 식(3)과 같이 주어진다.

(3)
$R^{2}=1-\dfrac{\sum_{i=1}^{n}\left(y_{i}-\hat{y_{i}}\right)^{2}}{\sum_{i=1}^{n}\left(y_{i}-\overline{y_{i}}\right)^{2}}$

3. 에너지 효율 예측 모델 비교

3.1 모델 성능 비교

K-fold 교차 검증을 통해 MLR와 SVM 그리고 ANN 모델의 성능을 함께 비교 분석하였다. Fig. 5는 3개 모델들의 RMSE 오차값을 보여준다. RMSE 오차는 값이 적을수록 모델 성능의 에러가 적음을 의미한다. ANN 모델의 경우 RMSE 값(평균 153.2)을 보이며 가장 좋은 성능을 보였다. 그러나 교차 검증을 통한 RMSE 값의 변화가 매우 큰 것을 보였기에, 하이퍼파라미터 최적화가 필요했다. 다른 두 모델의 평균 RMSE 값은 SVM (198.9), MLR(197.3)으로 매우 높게 나타났기에 ANN보다 모델 오차가 큰 것을 확인하였다. Fig. 6은 K-fold 교차 검증의 R-squared 값을 보여주며, RMSE와 같은 결과를 보여주었다. R-squared는 예측 성능 평가지표로 0보다 1일수록 상관관계가 높은 것으로 본다. ANN 모델의 평균모델의 R-squared 값은 (0.74)로 가장 높게 나타나며 가장 좋은 성능을 보여주었고, SVM (0.56), MLR (0.55) 순으로 나타났다. 이 결과들은 인공지능 기반 모델인 ANN 모델의 예측 정확도가 높음을 보여주었다. 그러나 이와 동시에 다른 모델들에 비해 상대적으로 넓은 범위의 모델 정확도를 보였기에 ANN 모델의 하이퍼파라미터 연구가 필요한 것을 보여준다.

Fig. 5 RMSE of prediction models from K-fold CV
../../Resources/sarek/KJACR.2022.34.7.336/fig5.png
Fig. 6 R-squared of prediction models from K-fold CV
../../Resources/sarek/KJACR.2022.34.7.336/fig6.png

3.2 인공지능 모델 하이퍼파라미터 최적화

ANN 모델의 성능은 하이퍼파라미터(Hyperparameter)에 따라 결과값에 큰 영향을 준다. 하이퍼파라미터란 최적의 훈련모델을 구현하기 위해 모델에 설정하는 변수로 학습률(Learning Rate), 배치 크기(batch Size), 훈련 반복 횟수(Epochs), 가중치 초기화(Weight Initialization)등을 결정 할 수 있다. 하이퍼파라미터 최적화의 핵심은 ‘최적값’이 존재하는 범위를 찾는 일이다. 범위를 줄이기 위해 대략적 범위를 먼저 설정하고 그 범위 내에서 무작위로 하이퍼파라미터 값을 고르고 그 값으로 정확성을 평가한다. 위 작업을 여러 번 반복하면서 하이퍼파라미터의 최적값 범위를 좁혀서 최적화한다. Table 1은 하이퍼파라미터에 따른 R-squared 값을 보여준다. 히든 레이어의 층수는 1개~3개를 실험하였고, 각 층마다 레이어 수는 50개부터 50개씩 늘려나가면서 200~300개까지 늘리며 모델을 비교하였다. 활성 함수의 경우, 하이퍼볼릭 탄젠트(Tanh)와 시그모이드(Sigmoid) 함수가 경사(ReLU) 함수 보다 높은 성능을 보였기에, Sigmoid 함수를 적용하였다(Tanh 함수의 결과값도 sigmoid 함수의 결과값과 거의 차이가 없었다). 일반화 성능(regulization strength, Lambda)은 0.1로 정하였다. Fig. 7은 하이퍼 파라미터의 모델 복잡도(층수 X 레이어수의 로그 스케일)에 따른 ANN 인공지능 모델의 예측 결과(RMSE, R-squared)를 보여준다. 모델 복잡도가 2.5 근처에서 모델의 성능이 급격히 증가(R-squared 0.9 이상)하였고, 그 이후에는 복잡도가 아무리 증가하더라도 모델의 성능은 크게 개선되지 않는 것을 발견하였다. 또한 히든레이어의 개수가 많은 것보다는 히든레이어의 층수를 많게 하는 것이 더욱 효과적인 것을 하이퍼 파라미터 분석을 통해서 알 수 있었다. Fig. 8은 ANN의 하이퍼 파라미터를 최적화한 모델로 예측한 에너지 소비량과 실제 에너지 소비량의 차이를 보여준다. 평균 제곱근 편차는 (92.35)로 매우 낮은(R-squared 값 0.91) 값으로 매우 좋은 성능을 보여주었다. 이는 MLR 분석의 결과 RMSE(197.0)와 비교하였을 때 매우 높은 예측 정확도를 나타낸다.

Fig. 7 Hyper parameter optimization for ANN
../../Resources/sarek/KJACR.2022.34.7.336/fig7.png
Fig. 8 Response plot of Artificial Neural Network (ANN) for validation/test data
../../Resources/sarek/KJACR.2022.34.7.336/fig8.png
Table 1 Hyper parameter optimization for ANN

Number of fully connected layers

first layer size/ second layer size/ third layer size

RMSE

MAE

MSE

R-squared

Time(sec)

1

25/-/-

136.19

92.40

18548

0.80

77.52

50/-/-

133.96

90.32

17946

0.80

231.65

100/-/-

133.13

90.41

17723

0.80

693.50

200/-/-

127.02

83.35

16134

0.82

1913.40

300/-/-

125.81

82.07

15828

0.83

3071.80

2

25/25/-

106.36

62.77

11313

0.88

405.73

50/50/-

92.35

53.62

8529

0.91

887.67

100/100/-

86.74

50.08

7523

0.92

3959.80

200/100/-

89.55

51.74

8019

0.91

4075.60

200/200/-

81.63

46.72

6663

0.93

5866.00

3

25/25/25

107.02

61.36

11453

0.87

609.68

50/50/50

87.49

47.80

7654

0.92

1337.50

100/100/100

85.12

46.07

7245

0.92

4332.10

200/100/200

76.47

40.17

5847

0.94

7047.30

200/200/200

75.00

39.54

5625

0.94

10223.00

4. 결 론

본 연구는 인공지능 모델의 예측 정확도를 비교하고 최적화된 모델을 활용하여 건물 에너지 효율 예측 모델 연구를 목적으로 하였다. 대상 건물인 헬스케어 건물을 이용하여 일별 에너지 소비값과 설비 분야 구성 요소에 따른 에너지 소비 영향도 분석을 진행하여, 예측된 에너지사용량과 실제 건물의 에너지 사용량을 비교하여 최적화된 모델을 제시하였다. 그 결과를 요약하면 다음과 같다.

(1) 먼저 데이터 변수간의 상관관계 분석결과 에너지 소비량과 가장 높은 상관도를 보이는 것이 건물 면적으로 피어스만 상관계수 값이 (0.77)이었다. 이는 건물의 냉난방 소비량이 건물의 크기와 비례하기 때문이기에 에너지 효율 모델 적용에 있어서 신중해야 한다는 결과로 이는 데이터의 환경 변수들을 이용한 에너지 효율 예측 모델이 매우 제한 적일 수 있다는 것을 보여준다.

(2) 다중 선형 회귀(Multiple Linear Regression, MLR)과 서포트 벡터 머신(Support Vector Machine, SVM), 인공신경망(Artificial Neural Network, ANN) 모델의 성능을 비교 분석하였다. ANN 모델의 경우 평균제곱근 오차(RMSE, Root Mean Square Error) 값이 평균 (153.2)를 보이며 가장 좋은 성능을 보였다. 그러나 교차 검증을 통한 모델 성능의 예측 정확도의 변화가 매우 큰 것을 보였기에 하이퍼파라미터 최적화가 필요했다.

(3) ANN 모델의 성능은 하이퍼파라미터에 따라 결과 값에 큰 영향을 준다. 최적화된 하이퍼파라미터는 ANN 모델을 통해 예측된 에너지 소비량과 실제 에너지 소비량의 차이를 보이며 MLR 분석의 결과 RMES (197.0)과 비교하였을 때, 매우 높은 예측 정확도를 나타낸다.

본 연구를 통해 에너지 효율 예측을 위한 인공지능 모델 적용 가능성이 높음을 확인할 수 있었다. 그러나 하이파파라미터에 따른 모델 정확도의 차이가 크므로 하이퍼파라미터 최적화 연구가 함께 이루어져야 한다. 또한 본 연구는 탄소 배출량의 상당부분을 차지하는 건축분야에서 헬스케어 건물 대상으로만 예측 모델을 검증 하였기에 다른 부문의 에너지 효율 예측 연구는 추가적으로 확인할 필요성이 있다. 향후 에너지 절감하는 방안으로 본 연구와 같은 분석 방법이 더 현실적인 방안으로 제시하기 위한 인공지능 모델 기술 개발 및 에너지 예측 정확도 확보에 참고 자료로 사용될 수 있을 것이다.

References

1 
Shim J. H., Yoon S. H., 2014, An Analysis of Yearly Heating and Cooling Load According to the Length-to-Width and Orientation in Large Hospital Ward Area, The Research Institute of Construction and Environment, Cheongwoon University, Vol. 9, No. 1, pp. 96-103Google Search
2 
Kim J. M., Cho J. H., Kim B., 2016, Correlation Between Meteorological Factors and Hospital Power Consumption, Digital Convergence Research, Vol. 14, No. 6, pp. 457-466DOI
3 
Kang I. S., Yang Y. K., Park J. C., 2017, Development of Predictive Model for Air-conditioning System Operation Based on Artificial Neural Network, Journal of the Korean Society of Facilities Engineering's academic presentation, Vol. 2017, No. 6, pp. 545-548Google Search
4 
American Society of Heating, Refrigerating and Air-Conditioning Engineers, Inc.Google Search
5 
Andrews D. F., 1974, A robust method for multiple linear regression, Technometrics, Vol. 16, No. 4, pp. 523-531DOI
6 
Brown S. H., 2009, Multiple linear regression analysis: a matrix approach with MATLAB, Alabama Journal of Mathematics, Vol. 34, pp. 1-3URL
7 
Dong B., Cao C., Lee S. E., 2005, Applying support vector machines to predict building energy consumption in tropical region, Energy and Buildings, Vol. 37, No. 5, pp. 545-553DOI
8 
Agatonovic-Kustrin S., Beresford R., 2000, Basic concepts of artificial neural network (ANN) modeling and its application in pharmaceutical research, Journal of pharmaceutical and biomedical analysis, Vol. 22, No. 5, pp. 717-727DOI