전재범
(Jae Beom Jeon)
1
김영일
(Young Il Kim)
2†
-
서울과학기술대학교 일반대학원 석사과정 대학원생
(Master’s Degree Candidate, Graduate School, Seoul National University of Science &
Technology, Seoul 01811, Korea)
-
서울과학기술대학교 건축학부 교수
(Professor, School of Architecture, Seoul National University of Science & Technology,
Seoul 01811, Korea)
Copyright © 2016, Society of Air-Conditioning and Refrigeration Engineers of Korea
키워드
건물에너지관리시스템, 코사인 유사도, 정규화된 평균 제곱근 오차, 데이터 복원, 외기 엔탈피
Key words
BEMS, Cosine similarity, CV-RMSE, Data restoration, Outdoor air enthalpy
1. 서 론
건물의 에너지 소비 절감을 위해 BEMS와 제로에너지건축물 의무 대상이 점차 확대되고 있다. 2020년부터는 공공 건물 1,000 ㎡ 이상, 2023년부터는
공공 건물 500 ㎡ 이상, 2025년부터는 민간 건물 1,000 ㎡ 이상으로 적용 대상이 넓어지고 있으며, 이에 따라 측정되는 건물에너지 데이터의
신뢰성도 중요해지고 있다. 에너지 절감을 위한 효과적인 전략 수립을 위해서는 1~5년간의 용도별 에너지 데이터 수집이 필수적이다. 건물에너지 측정
대상은 열원기기, 열매체 운송설비, 실내외 환경 등 다양하며, 통신 방법도 RS232, TCP, Web API 등 여러 가지가 있다. 그러나 통신
불량, 계측기 오류, 데이터 수집 PC 고장, 시스템 업데이트 등으로 인해 데이터 기록이 일시적으로 중단되는 경우가 발생한다. 통합된 안정적 프로토콜이
구축되어 있고, 계측기가 실시간으로 수집한 데이터를 자체적으로 저장한 후 통신 상태가 원활해지면 이를 복구하는 시스템은 통신 불량에 대한 해결책이
될 수 있다. 그러나 이 시스템은 비용이 많이 소요되며, 계측기 오류가 발생할 경우 데이터 손실을 완전히 방지하기는 어렵다.
필연적으로 발생하는 데이터 수집 시 누락되는 데이터 문제를 해결하기 위해 다양한 데이터 복구 방법들이 연구되고 있으며, 최근 딥러닝 기술의 발전으로
이를 구현하기에 적합한 환경이 조성되었다. 데이터 손실이 발생하면, 일반적으로 선형보간법을 사용하여 손실 시작과 끝 시점을 선형으로 가정하여 복원한다.
그러나 이 방법은 주간, 야간, 평일, 휴일, 실내외 조건 등의 특성이 반영되지 않아 실제 소비량과 차이가 나는 단점이 있으므로 에너지 사용 패턴을
분석하고 에너지절약 전략을 수립하는 데 어려움이 따른다. 한국에너지공단 건물에너지관리시스템(BEMS)(1) 설치 및 운영 규정에 따르면, 5$\sim$10%의 에너지 절감을 목표로 하고 있으며, 이를 달성하기 위한 에너지 절감량 확인의 기준이 되는 베이스라인
모델에서 수집되는 데이터는 중요한 역할을 한다.
건물의 냉난방 에너지는 외기의 온도와 습도를 동시에 고려한 엔탈피에 크게 영향을 받는다.(2) 업무용 건물의 에너지 사용량을 용도별로 냉방, 난방, 급탕, 환기, 조명, 운송, 기타로 나누어 분석한 결과, 여름철에는 전체 에너지의 50%가
냉방에, 겨울철에는 20~25%가 난방에 사용되는 것으로 나타났다. 이러한 특성을 바탕으로, 데이터 손실이 발생한 날과 외기 엔탈피 변화가 가장 유사한
날을 찾아 해당 날의 전력소비량 데이터 변화 패턴을 이용하여 손실된 전력소비량 데이터를 복원하는 방법을 제안한다. 외기 엔탈피 유사도를 산출하기 위해
하루 24시간 동안의 엔탈피 변화를 24개의 배열로 저장한 후, 이를 방향과 크기가 있는 벡터로 변환하고, 분실된 기간의 하루 엔탈피 변화 벡터와
과거 10주 기간의 벡터를 내적(Dot product) 계산한 코사인 유사값을 비교하여 이 중 값이 가장 큰 기간의 전력소비량 패턴을 이용하여 분실된
전력소비량 데이터를 복원한다. 손실된 날이 평일인 경우, 과거 평일 중 하루 외기 엔탈피 패턴이 가장 비슷한 날을 찾아 시간대별 전력소비량 비율을
활용하여 데이터를 복원한다.
2. 연구방법
연구에 사용된 데이터는 2021년 12월에 BEMS를 설치하여 2022년에 공공기관 최초로 BEMS 1등급 인증을 받은 건물에서 수집되었다. 건물은
지하 4층, 지상 33층, 연면적 68,553.98 ㎡이며 사무실 용도이다. 냉방은 터보냉동기, 지열원 열펌프, 빙축열 시스템, 난방은 지역난방을
사용한다. 각 측에 설치된 공기조화기에 의해 실내의 냉방, 난방 및 환기를 수행한다.
에너지 절감 활동을 검증하기 위한 베이스라인 모델은 한국에너지공단의 건물에너지관리시스템 설치확인 업무운영규정(KS F 1800-2:2021 준용)에
따른 절차를 기반으로 수립하였다. 계절을 세 구간으로 나누어 에너지사용량 베이스라인을 수립한 결과, 온도와 습도의 조합에서 결정계수(R2)가 0.8~0.89로
나타났다. 베이스라인 모델을 수립하는 과정에서 손실된 데이터는 복원하도록 규정하고 있다. 본 연구에서는 실제 값과의 오차를 최소화하면서 복원 과정을
검증하고 계산할 수 있는 모델을 개발하고자 하였다. 온도, 상대습도, 절대습도, 엔탈피를 독립변수로 다중회귀분석을 수행한 결과, 온도와 상대습도의
조합이 결정계수 값이 가장 높은 것으로 나타났다. 온도와 상대습도의 조합은 결정계수 값이 높고 CV-RMSE 값도 3% 미만으로 낮았으나, 계절에
따라 편차가 발생하는 문제가 있었다. 엔탈피는 온도와 상대습도에 비해 결정계수 값은 약간 낮았지만, 계절에 따른 편차가 적고 독립변수가 2개에서 1개로
줄어드는 편리함도 있었다. 한국에너지공단은 2021년 개정된 건물에너지관리시스템 설치확인 기준에서 에너지 절감 목표를 5~10%로 설정하고 있다.
이에 따라, 5%의 에너지 절감을 달성하기 위해 베이스라인 오차를 5% 이내로 줄이는 것을 목표로 연구를 진행하였다. 베이스라인 모델의 정확성을 검증하기
위해, 에너지 절감 활동이 없는 기준 기간과 비교 기간을 선정하여 두 기간의 에너지 사용량을 비교하였다. 이론적으로 정확한 베이스라인 모델이라면 오차는
0%에 수렴해야 한다. 본 연구에서는 오차를 5% 이내로 줄이는 것을 목표로 하였으나 결과는 목표한 수치에 미치지 못하였다.
온도, 습도의 센서는 건물 외부 냉난방기 실외기 위치 인근에 설치하였다. Table 1은 시간별로 저장된 외기의 온도, 습도, 엔탈피의 한 사례를 보여준다. 본 연구에 앞서 외기 엔탈피와 건물 전체 전력소비량과의 상관관계를 검토한 결과
결정계수(R2)는 0.789로 외기엔탈피와 전력소비량은 높은 상관관계가 있음을 확인하였다.
Table 1 Hourly outdoor temperature, humidity and enthalpy
Date, hour
|
Outdoor temperature [℃]
|
Outdoor relative humidity [%]
|
Enthalpy [kJ/kg]
|
2022-08-06 1H
|
23.3
|
84.0
|
84.36
|
2022-08-06 2H
|
28.1
|
85.0
|
83.92
|
2022-08-06 3H
|
27.9
|
85.0
|
83.03
|
2022-08-06 4H
|
27.8
|
86.0
|
83.03
|
2022-08-06 5H
|
27.7
|
86.0
|
82.59
|
2022-08-06 6H
|
27.4
|
87.0
|
81.70
|
2022-08-06 7H
|
27.4
|
88.0
|
82.13
|
2022-08-06 8H
|
27.5
|
87.0
|
82.14
|
2022-08-06 9H
|
28.2
|
86.0
|
84.82
|
2022-08-06 10H
|
28.8
|
81.0
|
85.21
|
...
|
...
|
Omitted
|
...
|
2022-08-06 24H
|
28.5
|
88.0
|
87.09
|
누적 전력소비량 데이터(Fig. 1)는 1분 단위로 측정되어 Database에 저장된다. 시작과 끝 값의 차이 Interval1=T2-T1를 계산하여 1시간 동안의 전력소비량을 산출하였다(Fig. 2, Fig. 3). 온도와 습도는 해당 시간대의 마지막 값 Interval1=T2을 사용한다(Fig. 3). 외기 엔탈피 값은 f-Chart software의 EES(Engineering Equation Solver) 프로그램의 수식을 Python,
MS-SQL으로 구현하여 계산하였다. Python은 머신러닝 등 각종 수치해석 및 상용프로그램을 개발하기 위한 소프트웨어 개발 툴, MS-SQL은
마이크로소프트사에서 개발한 Database 프로그램이다(실험에 설치된 온도계는 소수점 한자리이고, 습도는 소수점 없는 정수형 장비를 사용하였다).
본 연구에서 사용된 전력소비량 데이터는 실험 건물의 메인 전력량을 1분 간격으로 수집한 것이다. 수집된 전력소비량 누적값은 시간 차이를 계산하여 시간별
전력소비량으로 변환되었다. Fig. 1은 시간에 따른 전력소비량 누적값을 나타내고 있으며 시간이 지남에 따라 전력소비량이 증가하는 모습을 확인할 수 있다. 이를 1시간 단위로 분할하면
Fig. 2와 같이 하루 동안의 시간별 전력소비량으로 표현할 수 있다.
시간별 전력소비량을 외부 온도와의 상관도를 계산한 결과, 다중회귀 분석에서는 [온도, 상대습도, 절대습도, 엔탈피] 조합이 상관계수(R2)가 가장
높게 나타났다. 단순회귀 분석을 통해 온도, 상대습도, 절대습도, 엔탈피를 각각 분석한 결과, 엔탈피가 여름뿐만 아니라 중간기와 겨울을 포함하여 가장
높은 상관도를 보였다. 이러한 분석 결과에 입각하여, 엔탈피 변화 패턴이 가장 유사한 날을 찾아 분실된 전력소비량 데이터를 복원하였다.
데이터가 손실된 구간이 감지되면 해당 일자의 24시간의 온도 변화와 그 시점부터 과거 10주간의 온도 변화를 Database에서 추출하여 24개의
array를 만든다. 프로그램은 실시간으로 손실구간을 감지하고 있어 사건 발생 이후의 값은 사용하지 않고 과거 데이터를 이용한다. 코사인 유사도 알고리즘을
이용하여 손실된 날짜와의 유사도 값을 계산하여 가장 유사도가 높은 날의 전력 소비량 변화 패턴을 활용하여 손실된 데이터를 복원한다. 이러한 방법으로
복원된 전력 데이터를 실제 측정된 전력 데이터와 비교하여 정확성을 검증하였다.
Fig. 1 Accumulated electric power consumption
Fig. 2 Electric power consumption calculated on
3. 실험 결과와 복원데이터 비교
3.1 코사인 유사도
코사인 유사도는(3) 두 집단의 벡터가 방향과 힘의 어느 정도 유사한지 알아보는 수학적 모델이다. 딥러닝 분야에서 문서의 유사도를 비교할 때 단어를 숫자로 변화하여 문서를
숫자의 조합의 흐름으로 만들어 코사인 유사도로 문서 유사도를 찾거나 행열로 벡터를 정렬한 후 코사인 유사도를 이용하여 변화추정(4)을 하는 등 입체적 비교도 가능하다. 인스타그램의 좋아요, 주로 보는 영상 등의 패턴을 읽어 비슷한 유형의 게시물을 제공하는데 활용하기도 한다.(5,6) BEMS 보고서에 모델 식, 결정계수, 표준오차, CV-RSME를 제시하게 되어 있다. 따라서 결과 도출 과정과 결과를 해석할 수 있는 화이트박스
모델을 이용하였다.
코사인 유사도 정의는 식(1)과 같다. 본 연구에서는 이러한 개념에서 힌트를 얻어, 데이터 복원 방법에 코사인 유사도를 적용하였다. 코사인 유사도는 두 벡터가 얼마나 유사한지를
측정하는 방법으로, 그 값이 1이면 두 벡터가 동일함을 의미하고, 0이면 두 벡터가 서로 직교하여 전혀 일치하지 않음을 의미한다. 반대로, 값이 -1이면
두 벡터가 정반대 방향임을 의미한다.
예를 들어 벡터 $\vec{A}$ = [4,5,2], $\vec{B}$ = [4,4,3]를 고려한다. 내적 계산 $\vec{A}\cdot\vec{B}$
값은 42, $| A |$, $| B |$ 크기는 각각 6.7082, 6.4031로 계산된다. 따라서 코사인 유사도 값은 0.98이므로 두 벡터는
유사도가 높다.
엔탈피는 온도와 습도가 동시에 고려할 수 있는 장점이 있으므로 Table 2는 2024년 여름철 여러 날의 외기 온도와 습도로 계산된 엔탈피(kJ/kg)를 표시하였다. 2024년 8월 6일을 기준으로 4개의 날에 대하여 코사인
유사도 값을 계산하였고, 아울러 엔탈피의 최댓값, 평균, 표준편차도 나타내었다. 엔탈피 평균값, 표준편차, 최고값이 유사한 날짜를 찾아 누락된 데이터를
복원할 수도 있으나 이 방법으로 복원된 데이터는 오차가 많다. Table 2에서 확인할 수 있듯이 2024년 8월 6일과 코사인 유사도 값이 가장 비슷한 날은 2024년 8월 1일이다. Fig. 4는 여러 날의 외기 엔탈피 변화를 보여 주고 있다. 8월 1일의 엔탈피 변화 패턴이 복원 대상 날짜인 8월 6일과 가장 유사함을 알 수 있다.
Table 2 Comparison of cosine similarity
Hour
|
2024-06-17
Enthalpy(kJ/kg)
|
2024-06-28
Enthalpy(kJ/kg)
|
2024-08-01
Enthalpy(kJ/kg)
|
2024-08-05
Enthalpy(kJ/kg)
|
2024-08-06
(Baseline date)
|
01:00
|
47.74
|
78.52
|
76.77
|
80.4
|
84.36
|
02:00
|
45.98
|
78.52
|
76.77
|
80.4
|
83.92
|
03:00
|
46.25
|
77.68
|
76.77
|
80.4
|
83.03
|
04:00
|
45.32
|
77.27
|
77.19
|
79.97
|
83.03
|
05:00
|
44.98
|
76.95
|
76.77
|
80.83
|
82.59
|
06:00
|
44.38
|
75.35
|
76.35
|
81.26
|
81.7
|
07:00
|
44.63
|
76.51
|
76.72
|
81.26
|
82.13
|
...
|
...
|
omitted
|
...
|
...
|
...
|
21:00
|
61.1
|
78.23
|
79.79
|
76.55
|
89.43
|
23:00
|
63.75
|
77
|
78.12
|
77.76
|
88.5
|
23:00
|
62.35
|
76.99
|
77.96
|
84.28
|
88.03
|
24:00
|
62.72
|
76.18
|
77.96
|
84.33
|
87.09
|
Maximum
|
63.75
|
78.95
|
94.49
|
89.69
|
92.26
|
Average
|
55.17
|
77.41
|
81.26
|
81.82
|
86.55
|
Standard deviation
|
7.26
|
1.36
|
5.16
|
2.88
|
3.32
|
Cosine similarity
|
0.9954
|
0.9984
|
0.9987
|
0.9986
|
1.0000
|
Fig. 4 Variation of outdoor air enthalpy.
3.2 데이터 복원 순서도
손실되었거나 특이점이 발생한 데이터는 Fig. 5의 순서도에 따라 복원한다.
1) Loss point detection : 데이터가 이전값과 비교하여 10% 이상 차이를 나타내면 신호가 발생하게 하였다. 이번 연구에서 10%는
2년의 데이터를 학습한 결과 제안된 값이다. 측정된 데이터에 따라 이 값은 변경될 수 있다.
2) 코사인 유사도 알고리즘을 활용하여 복원이 필요한 날짜와 유사한 엔탈피 변화를 보이는 날짜를 검색한다. Python 코딩 : return value
= date.
3) 계절은 3유형으로 분류한다: 여름 [7월, 8월, 9월], 겨울 [12월, 1월, 2월], 간절기 [3월, 4월, 5월, 6월, 10월, 11월].
또한, 휴일과 평일로 구분하여 해당 계절 구간과 평일/휴일 여부를 고려한 후, 그 구간에 해당하는 일자 중에서 가장 유사한 값을 찾는다.
3) Reconstruction : 유사한 날의 실제 전력소비량 데이터의 실제 측정값을 활용하여 이 비율대로 손실된 구간의 데이터를 복원한다.
4) Validation : 복원한 데이터를 실제 측정된 값과 비교하여 CV-RMSE 값으로 복원 데이터의 정확성을 확인한다.
정상적으로 측정된 2024-08-06의 데이터 중 08:00-19:00 구간을 삭제하여 위에 제시한 방법으로 복원하고 복원된 데이터와 측정된 원본
데이터를 비교하였다. 외기 엔탈피 변화 패턴 비교 결과, 2024-08-01 날짜와 가장 유사하여 전력소비량 비율대로 데이터를 복원하여 Table
3에 나타내었다. 실제 측정된 값과 비교 결과, 코사인 유사도를 이용한 복원 방법과 선형보간법을 이용하여 복원한 방법의 CV-RSME는 각각 3.1%,
7.1%로 코사인 유사도를 이용한 복원 방법이 누락된 데이터를 더 정확하게 복원하였다. 표의 데이터를 차트로 나타낸 Fig. 6을 확인해보면 패턴이 복원된 데이터와 선형으로 이어진 데이터의 비교를 할 수 있다.
Fig. 5 Data restoration flow chart.
Fig. 6 Comparison of the lost data restoration.
Table 3 Restoration results of the lost data of Aug. 6, 2024
Time [hour]
|
2024-08-06 Wednesday
|
Restored data by cosine similarity
|
Restored data by linear assumption
|
2024-08-01 Thursday
|
Electric power measurement
[kWh]
|
Intentional data deletion
|
Electric power consumption [kWh]
|
Percentage
[%]
|
03:00
|
534.0
|
534.0
|
534.0
|
|
536.0
|
|
04:00
|
532.0
|
532.0
|
532.0
|
|
524.0
|
|
05:00
|
514.0
|
514.0
|
514.0
|
|
512.0
|
|
06:00
|
570.0
|
570.0
|
570.0
|
|
568.0
|
|
07:00
|
730.0
|
730.0
|
730.0
|
|
670.0
|
|
08:00
|
1224.0
|
0
|
1173.0
|
1430.7
|
1158.0
|
6.8
|
09:00
|
1458.0
|
0
|
1519.5
|
1430.7
|
1500.0
|
8.9
|
10:00
|
1520.0
|
0
|
1543.8
|
1430.7
|
1524.0
|
9.0
|
11:00
|
1492.0
|
0
|
1515.4
|
1430.7
|
1496.0
|
8.8
|
12:00
|
1392.0
|
0
|
1479.0
|
1430.7
|
1460.0
|
8.6
|
13:00
|
1498.0
|
0
|
1428.3
|
1430.7
|
1410.0
|
8.3
|
14:00
|
1502.0
|
0
|
1503.3
|
1430.7
|
1484.0
|
8.8
|
15:00
|
1470.0
|
0
|
1489.1
|
1430.7
|
1470.0
|
8.7
|
16:00
|
1480.0
|
0
|
1479.0
|
1430.7
|
1460.0
|
8.6
|
17:00
|
1484.0
|
0
|
1470.8
|
1430.7
|
1452.0
|
8.6
|
18:00
|
1442.0
|
0
|
1410.1
|
1430.7
|
1392.0
|
8.2
|
19:00
|
1206.0
|
17168.0
|
1156.8
|
1430.7
|
1142.0
|
6.7
|
...
|
...
|
...
|
Omitted
|
|
...
|
...
|
23:00
|
582.0
|
582.0
|
582.0
|
|
621.0
|
|
CV-RMSE
|
|
|
3.1%
|
7.1%
|
|
|
4. 결 론
BEMS를 적용한 건물에서 에너지 사용량을 절감하기 위해서는 전력, 가스, 물의 소비량 데이터를 1년 동안 시간별로 측정하고 분석하여 최적의 에너지
절약 방법을 찾아야 한다. 이를 위해 시간별 전력소비량 데이터의 신뢰성과 연속성을 확보하는 것이 필수적이다. 그러나 통신 불량이나 측정 시스템의 오류로
인해 데이터가 누락되거나 정상 범위를 벗어나는 경우가 빈번하게 발생한다. 이런 경우 데이터를 복원해야 하지만, 기존에 일반적으로 사용되는 선형보간법은
외기 조건, 시간대별 변동, 평일과 휴일의 차이를 반영하지 못해 실제 측정된 데이터와 차이를 보인다. 본 연구에서는 이를 해결하기 위해 건물에너지
소비 중 50%를 차지하는 냉난방에너지가 외기 조건에 크게 좌우된다는 점에 주목하여 분실되었거나 정상적인 범위를 벗어난 건물의 전력소비량 데이터를
외기 엔탈피 변화 패턴을 이용하여 복원하는 방법을 제안하였다. 복원 결과 기존 선형보간법에 비하여 오차가 크게 감소함을 확인하였다.
(1) 본 연구에서는 냉난방 에너지가 외기 조건 크게 좌우된다는 점을 활용하여, 외기의 온도와 습도가 동시에 고려된 엔탈피 변화 패턴이 전력소비량
데이터가 분실된 날과 가장 유사한 날을 찾아, 해당 날의 에너지 소비 비율을 활용하여 분실된 데이터를 복원하는 방법을 제안하였다. 엔탈피는 온도와
상대습도 대비 계절에 따른 편차가 적고 독립변수가 2개에서 1개로 줄어드는 편리함도 있다.
(2) 하루 24시간 동안의 외기 변화 유사도를 찾는 방법은 외기의 온도와 습도의 2개의 상태량을 하나의 상태량인 엔탈피로 변환하여 시간별 엔탈피를
벡터 변환한 후 데이터가 누락된 날과 그 날을 기준으로 과거 100일 이내의 모든 날과 내적 곱셈하는 코사인 유사도(Cosine similarity)를
적용하여 이 중 가장 큰 값이 나타내는 날을 택하여 시간별 전력소비량 비율을 적용하여 전력소비량 데이터를 복원하였다.
(3) 엔탈피 변화 패턴에 대해 코사인 유사도를 이용하여 시간별 전력소비량 데이터를 복원하여 실제 측정값과 비교한 결과, CV-RSME 값은 3.1%로,
일반적인 선형 보간법 7.1% 보다 정확성이 크게 향상됨을 확인하였다.
본 연구에서 제안한 외기 엔탈피 기반 코사인 유사도 방법의 신뢰성을 검증하기 위해, 본 연구에서 사용된 사무실 건물 외에도 다양한 용도의 건물에서
추가 검증이 필요하다. 또한 전력소비량뿐만 아니라 물 및 가스 소비량에 대해서도 검증이 이루어져야 한다.