최원준
(Wonjun Choi)
1†
이상원
(Sangwon Lee)
2
(Max Langtry)
3
(Ruchi Choudhary)
4
-
전남대학교 건축학부 부교수
(Associate Professor, School of Architecture, Chonnam National University, Gwangju,
686, Korea)
-
Dartwork 기술연구소 기술책임자
(Chief Technology Officer, Dartwork, Seoul, 07503, Korea)
-
University of Cambridge Department of Engineering 대학원생
(Graduate Student, Department of Engineering, University of Cambridge, Cambridge, CB2
1PZ, UK)
-
University of Cambridge Department of Engineering 교수
(Professor, Department of Engineering, University of Cambridge, Cambridge, CB2 1PZ,
UK)
Copyright © 2016, Society of Air-Conditioning and Refrigeration Engineers of Korea
키워드
심층 학습, 에너지 요구량 예측, 표현벡터, 전이학습, 비지도 대조학습
Key words
Deep learning, Energy demand forecasting, Representation vector, Transfer learning, Unsupervised contrastive learning
1. 연구배경 및 목적
에너지 수요의 단기 예측은 에너지 수요와 공급 간의 시간적 일치가 중요한 재생에너지 시스템의 운전 최적화를 통한 에너지 효율 개선에 중요한 역할을
한다. 에너지 수요를 정확히 예측하기 위해 관련 역학을 수학적․물리적으로 구현하는 것은 복잡하고 난해하다. 이에 비해 머신러닝과 같은 데이터 기반
접근법은 입력변수와 출력변수 간의 관계를 효과적으로 매핑한다. 머신러닝은 모델 구축의 용이성, 예측의 신속성, 우수한 예측 정확성으로 주목받고 있으며,
특히 시계열 예측 성능 개선을 위한 다양한 모델 아키텍처 개발이 활발히 진행되고 있다.(1-3)
건축 분야에서는 각 건물의 고유 특성(재료, 형태, 용도, 에너지 시스템, 운영 스케줄, 미기후 등)으로 인해 범용적인 머신러닝 모델의 개발 및 활용이
제한적이다. 이는 언어 처리나 컴퓨터 비전 분야에서 범용 모델이 널리 활용되는 것과 대조적인 분야 특성이다. 건물 에너지 수요 예측 모델은 특정 건물에
맞춰 개발되는 것이 일반적이며, 이는 해당 건물의 특성을 완전히 반영하는 데이터를 필요로 한다. 그러나 이러한 데이터는 대상 건물의 완공 후나 센서
네트워크를 설치한 후에야 수집 가능하다. 머신러닝 모델의 예측 성능은 훈련 데이터의 양에 크게 의존하기 때문에, 특정 건물로부터 데이터 수집을 시작해
모델을 구축하고 안정화하기까지 상당한 시간과 비용이 소요된다.(1)
건축 분야에서 개별 건물 맞춤형 모델 구축의 데이터 부족 문제, 모델 구축에 필요한 시간 및 비용 문제를 해결하기 위한 대안으로 전이학습이 활용된다.
전이학습은 다른 도메인에서 학습된 지식을 활용하여 목표 작업의 성능을 향상시키는 기술이다. 건축 분야에서는 다른 건물의 데이터를 활용하여 목표 건물의
예측 성능을 개선하는 데 사용되며, 이를 통해 더 나은 초기 성능과 최종 수렴 성능을 확보할 수 있다.(4,5)
효과적인 전이학습을 위해서는 목표 건물과 유사한 시간적 특성을 지닌 소스 데이터가 필요하다. 그러나 다양한 건물 데이터 중 어떤 건물의 데이터가 예측
대상 건물의 모델 학습에 적합한지를 인간이 판단하는 것은 주관적이고 편향될 가능성이 크다. 특히, 건물의 메타데이터가 제거된 익명화된 데이터나 다변수
시계열 데이터의 유사도를 인간이 판단하는 것은 매우 어렵다. 비지도 학습 기반의 머신러닝 인코더를 활용하여 시계열 데이터를 자동으로 분석하고 유사도를
계산하는 접근법은 전술한 한계를 극복할 수 있는 대안이 된다.
본 연구에서는 비지도 학습 기반의 시계열 표현벡터 추출 인코더인 TS2Vec(6)을 활용하여 시계열 유사도 판별법을 개발하고 이를 시연한다. 이 방법은 시계열 데이터를 중요한 특징들로 압축한 표현벡터(Representation
vector)로 변환하며, 이 표현벡터들을 비교함으로써 두 데이터셋이 얼마나 유사한지를 계산할 수 있다. 영국 케임브리지(Cambridge) 지역의
익명화된 건물 전력 사용량 데이터셋(7)을 활용해 실험을 진행했다. 개발된 방법론은 시계열 데이터셋 전체 구간에 대한 평균적 유사도 판별이 아니라, 임의로 설정한 타임 윈도우를 순차적으로
이동시키며 데이터셋 전체를 구간별로 상세하게 판별할 수 있는 점에서 차별화된다. 결과에 대한 정성적이면서도 직관적인 판별 용이성을 확보하기 위해 주성분
분석(이하 PCA: Principal component analysis)을 적용하여, 다차원 표현벡터를 차원 축소해 시각화하는 방법을 개발했으며,
정량적 비교는 코사인 유사도에 기반하여 수행된다.
본 연구는 TS2Vec을 활용한 시계열 인코딩 실험을 통해 시계열 데이터셋의 유사도를 구간별로 상세하게 판별할 수 있음을 보여준다. 이를 통해 시계열
데이터의 표현벡터 추출 및 활용에 대한 새로운 통찰을 제공하고, 전이학습을 포함한 다양한 응용 분야에서 시계열 데이터 활용의 효율성을 제고할 수 있다.
2. 사용 데이터 정보
2.1 Cambridge University Estate 건물 에너지 사용량 데이터셋
본 연구는 영국 케임브리지 지역 건물들의 과거 전기 사용량 데이터셋을 사용했다.(7) 이 데이터셋은 다양한 용도의 건물(강의실, 사무실, 실험실, 박물관 등) 120동에 대한 2000년부터 2023년까지 24년간의 시간 단위 전기
사용량 데이터를 포함한다. 데이터에는 전력사용량 외에도 기상 데이터, 전력 가격, 탄소 집약도(Carbon intensity) 정보가 포함되어 있다.
본 연구에서는 데이터가 부족한 전이학습의 상황을 가정하여 2009년의 데이터만 활용한다. 데이터가 추출된 건물 정보는 완전 익명화되어 임의의 번호로
제공된다.
전기 사용량 데이터는 각 건물에 설치된 스마트 미터를 통해 수집되었으며, 조명, 플러그 부하, 장비 등에 의한 총 전력 사용을 기록한 것이다. 단,
공조장치에 의한 전력 사용량은 포함되지 않은 건물도 존재하기에 공조에 의한 계절성이 확연히 드러나지 않는 건물이 다수 존재한다. 기상 데이터는 기상청
MIDAS(Met Office Integrated Data Archive System) 데이터셋(8)과Renewables.ninja 모델(9,10)로부터 수집되었으며, 모든 건물이 케임브리지 시내에 위치하기 때문에 동일한 기상 데이터가 모든 건물에 적용된다.
2.2 데이터 전처리
시계열 인코더의 학습을 위한 데이터 전처리에는 각 피처의 특성을 고려하여 다양한 정규화(Normalization) 방법이 적용되었다. Table 1에 사용한 논타깃, 타깃 피처 및 정규화 방법을 정리했다. 기상 관련 피처의 경우, 평균이나 표준편차를 사용하지 않고 해당 피처의 최댓값으로 나누어
정규화했다. 예를 들어, 상단이 명확한 상대습도는 100%로 나누어 정규화했다. 타깃 피처인 전력 사용량은 $(x-q_{50})/(q_{95}-q_{25})$을
이용한 백분위 기반 정규화 방법을 사용했다. 여기서 $x$는 정규화 대상 피처 값이고, $q$는 2009년 1년간의 데이터를 기반으로 계산된 백분위수이다.
이 과정에서 분모의 하한값으로는 25 퍼센타일을, 상한값으로는 95 퍼센타일을 사용했다. 분모의 상한에 75 퍼센타일이 아닌 95 퍼센타일을 사용한
이유는 전력 사용 데이터의 시간적 특성을 고려했기 때문이다. 전력 사용량의 기저 수요는 비교적 안정적이지만, 피크는 일시적인 수요 급증에 의해 통계적
군집을 크게 벗어나는 경향이 있다. 이런 데이터에 최소-최대 정규화를 적용하면 간헐적으로 발생하는 피크 값에 과도하게 민감하게 반응할 위험이 있다.
Table 1 Feature information and normalization method
Feature type
|
Feature [unit]
|
Feature transform method
|
Nontarget
|
Cosine converted month [-]
|
$\cos(2\pi x/12)$
|
Nontarget
|
Sine converted month [-]
|
$\sin(2\pi x/12)$
|
Nontarget
|
Cosine converted hour [-]
|
$\cos(2\pi x/24)$
|
Nontarget
|
Sine converted hour [-]
|
$\sin(2\pi x/24)$
|
Nontarget
|
Day type index (0 to 6) [-]
|
$x/6$
|
Nontarget
|
Outdoor dry-bulb temperature [°C]
|
$x/50$
|
Nontarget
|
Relative humidity [%]
|
$x/100$
|
Nontarget
|
Direct solar irradiance [W/m2]
|
$x/1000$
|
Nontarget
|
Diffuse solar irradiance [W/m2]
|
$x/400$
|
Nontarget
|
Global solar irradiance [W/m2]
|
$x/1000$
|
Target
|
Building electricity usage [kWh]
|
$(x-q_{50})/(q_{95}-q_{25})$
|
3. 시계열 인코더 모델
3.1 TS2Vec 인코더
시계열 데이터는 시간에 따른 패턴과 주기성을 가지므로, 이를 고려한 특별한 분석 방법이 필요하다. 복잡한 시간적 구조와 다차원성으로 인해 단순한 수치
비교만으로는 시계열 데이터를 효과적으로 분석하기 어렵다. 이러한 한계를 극복하기 위해, 기계학습 기반 인코더를 활용하여 시계열 데이터를 고차원 표현벡터(Representation vector)로 압축하는 방법이 개발되고 있다. 표현벡터는 시계열의 핵심 특성을 압축한 것으로, 데이터의 중요 정보를 유지하면서도
효율적인 비교를 가능하게 한다. 기계학습 인코더를 통해 데이터의 패턴을 자동으로 학습하면 다양한 시계열 데이터의 특성을 일관된 기준으로 비교 및 분류할
수 있다. 이 접근법은 시계열 데이터의 복잡성을 효과적으로 다룰 수 있어, 시계열을 다루는 모든 분야에서 활용 가능하다.
시계열용 인코더는 이미지 데이터에 널리 사용되는 오토인코더와 달리, 시계열 데이터의 고유한 특성을 고려한 구조를 가져야 한다. 주기성, 트렌드, 다중
피처 간 상호작용, 시간적 맥락 등을 종합적으로 반영해야 더 정교한 표현벡터를 생성할 수 있기 때문이다. 이를 통해 데이터의 스케일이나 특성 파악에
불필요한 외부 변수를 배제하고, 본질적인 시간적 패턴에 기반한 유사도 분석이 가능해진다.
본 연구에서는 비지도 대조 학습 기반의 TS2Vec(6) 인코더를 활용하여 시계열 정보를 표현벡터로 압축하고, 이를 활용해 시계열 데이터 간의 유사성을 측정했다. 이 프레임워크에 대한 개념도는 Fig. 1과 같다. 이 연구에서 사용한 TS2Vec은 시계열 내 맥락을 이해할 수 있도록 설계된 대조 학습(Contrastive learning) 기반으로
훈련된다. 또한, 팽창 합성곱 신경망(Dilated convolutional neural network)(11)을 활용한 경량화된 구조로 인해 학습과 인코딩을 빠르게 수행할 수 있다. 다양한 인코더 중 TS2Vec을 선택한 결정적인 이유는 다음과 같다.
(1) 다양한 시간 해상도 및 임의의 시간 윈도우에 대해 표현벡터 생성 가능: 시계열 데이터는 개별 데이터 값의 타임스탬프(Timestamp) 정보뿐만
아니라 24시간, 일주일, 월, 분기 등 다양한 시간 스케일의 트렌드를 포함한다. 목적에 따라 인코더는 이러한 다양한 시간적 특성을 고려하는 표현벡터를
생성해야 한다.
(2) 단일 인코더로 다양한 시간 스케일을 처리 가능: 인코더 사용 실효성을 극대화하기 위해서는 시간 스케일의 변화별로 맞춤형 모델을 학습시키는 대신,
하나의 인코더로 다양한 시간 스케일에 대한 표현벡터를 생성할 수 있어야 한다. 즉, 인코더의 학습법과 구조가 다양한 시간 스케일에 대한 해석 능력을
내재해야 한다.
(3) 멀티 피처(Multi-feature) 데이터의 통합 처리 능력: 시계열 데이터셋은 여러 피처로 구성되며, 피처 간의 시간적 상호작용이 발생할
수 있다. 따라서 각 피처를 따로 인코딩하는 것이 아닌 전체 피처 셋을 통합하여 고려하는 인코딩 방식이 요구된다.
Fig. 1 Time-series similarity determination framework using a time-series encoder.
3.2 TS2Vec의 학습
TS2Vec의 학습 과정에서 시계열 데이터의 각 피처마다 개별적인 정규화(Table 1)를 적용하여 피처의 스케일 정보를 포함하지 않은 데이터를 사용한 인코딩을 수행했다. 이 개별적 피처 정규화는 피처 간 상대적 크기 차이로 인한 피처
혹은 건물의 구분을 방지하기 위함이다. 예를 들어, 에너지 사용량의 시간적 패턴 유사성을 분석할 때, 모든 건물의 데이터를 동일한 기준값으로 정규화하면
건물 간 상대적 크기 차이가 유지되어 표현벡터 추출 시 구분 가능한 정보로 작용할 수 있다. 그러나 데이터의 시간적 역학관계와 패턴만을 파악하는 목적에서는
이러한 크기 차이에 의한 구분은 바람직하지 않다. 따라서 각 건물의 시계열 데이터를 건물별로 그리고 피처별로 독립적인 정규화를 실시하여 상대적 크기
정보를 제거하고, 순수하게 시간적 패턴에 기반한 표현벡터를 생성하도록 했다.
모델의 하이퍼파라미터는 TS2Vec 문헌에서 제시된 기본값을 사용했으며, 이는 Table 2에 요약되어 있다. 모델의 학습은 충분한 수렴을 위해 총 3,000회의 모델 파라미터 업데이트를 수행하였으며 학습데이터로는 86개 빌딩의 2009년
시계열을 사용했다. 시계열 데이터셋에 포함된 피처는 Table 1에 명시되어 있다.
Table 2 Hyperparameters of TS2Vec encoder
Hyperparameter
|
Value
|
Description
|
hidden_dim
|
64
|
Size of hidden layer used in dilated convolutional neural network
|
output_dim
|
320
|
Size of representation vector
|
depth
|
10
|
Number of hidden layers
|
learning_rate
|
0.001
|
Learning rate for model training
|
batch_size
|
16
|
Batch size for model training
|
4. 실험 디자인
4.1 시연용 데이터셋 선정
TS2Vec 인코더로 시계열 유사도를 판별하는 과정을 효과적으로 보여주기 위해 3개 건물의 데이터셋을 무작위로 선택하여 표현벡터를 추출하고 유사도를
분석했다. 선택된 데이터가 다음 시나리오를 만족하는 만족하는 케이스를 선택하여 섹션 5에 시연 결과를 제시한다.
- 데이터셋 1(레퍼런스 데이터): 학습을 통해 예측하려는 대상 건물의 시계열 데이터로, 실제 적용할 때 데이터가 부족하다고 가정한다.
- 데이터셋 2(주요 소스 데이터): 예측 대상의 학습에 유용하게 사용할 수 있는 소스 데이터로, 대부분의 구간에서 레퍼런스 시계열과 유사도가 높으나
특정 구간에서 유사도가 낮아진다.
- 데이터셋 3(보조 소스 데이터): 데이터셋 2와 비교해서 상대적으로 레퍼런스 시계열과 유사도가 낮으나 특정 구간에서 레퍼런스 시계열과 높은 유사도를
가지기에 부분적으로 활용할 수 있다.
4.2 결과 분석법
본 연구의 목적은 TS2Vec 인코더를 통해 생성된 표현 벡터 간 코사인 유사도를 계산하여, 시계열 간 유사도를 효과적으로 판별할 수 있음을 입증하는
데 있다. 또한, 전체 시계열의 평균적 특성 대신 특정 타임 윈도우의 표현벡터를 선택적으로 추출함으로써 다양한 시간 스케일에 대한 유사도 비교가 가능하며,
이를 통해 특정 구간의 시계열 데이터를 목적에 맞게 활용할 수 있음을 보여준다. 결과 분석 과정은 다음과 같다:
1) 시계열 데이터 시각화를 통해 패턴을 육안으로 확인한다. 본 연구에서는 에너지 사용량만 시각화하지만 멀티 피처 시계열을 다루는 경우 육안으로 데이터의
시간적 패턴을 식별할 수 없음을 인지해야 한다.
2) 목적에 맞게 타임 윈도우 길이를 설정하고 TS2Vec 인코더를 사용해 슬라이딩 윈도우 방식으로 각 건물 데이터의 표현벡터를 추출한다. 본 연구에서
설정한 타임 윈도우의 최소는 24시간, 최대는 28일이다.
3) 레퍼런스 데이터셋으로부터 추출한 표현벡터에 2차원 PCA를 적용하고 여기서 얻어진 주축을 다른 소스 데이터셋의 PCA 시각화에 적용한다. 이를
통해 데이터셋 간의 상대적 특성을 정성적으로 확인할 수 있다.
4) 건물 데이터셋 표현벡터 간의 코사인 유사도 계산 및 시각화를 통해 정량적으로 유사도를 분석한다. 이를 통해 어떤 구간에서 레퍼런스 시계열과 유사한지
파악하고 전이학습에 활용할 구간을 결정할 수 있다.
5) 국소 구간별 시계열과 유사도와 시계열을 함께 시각화하여 단일 피처의 경우 TS2Vec을 통해 학습된 표현벡터가 인간의 직관과 유사한 결과를 도출함을
확인한다.
5. 결 과
섹션 4.1에서 설명한 데이터셋 1~3에 상응하는 건물 번호는 각각 B27, B110, B55이다. Table 1의 백분위 정규화를 적용한 세 건물의 전력 사용량 데이터는 Fig. 2와 같다. 세 건물의 데이터셋은 동일한 기상데이터가 포함되어 있기에 표현벡터 추출에 영향이 미미할 것으로 판단하여 시각화는 생략한다.
Fig. 3은 B27 데이터셋을 이용해 타임 윈도우를 7일, 14일, 28일로 설정하여 추출한 표현벡터에 2차원의 PCA를 적용한 결과의 예시이다. 설정한 타임
윈도우의 크기에 따라 PCA 그래프의 형상 특성이 현저하게 달라짐을 확인할 수 있다. 타임 윈도우가 상대적으로 짧은 7일의 윈도우는 단기적 변동과
노이즈 특성을 포착하여 복잡하고 불규칙한 형태의 곡선을 얻는다. 반면에 타임 윈도우가 길어질수록 단기적 특성이 점차 감소하고 장기적인 트렌드와 계절적
패턴을 포착하여 부드러운 곡선 형태의 PCA 그래프를 얻는다. 본 연구의 목적인 서로 다른 시계열 데이터 간의 상대적 유사도를 정성적으로 비교․분석하기
위해서는 28일의 타임 윈도우가 가장 적합하다고 판단했다. 따라서, 이후의 PCA에는 28일 윈도우로 추출한 표현 벡터를 사용한다.
Fig. 2 Normalized electricity usage of three buildings (B27, B110, and B55).
Fig. 3 Effect of time window size on PCA representation of building energy datasets.
(a) window size of 7 days, (b) window size of 14 days, and (c) window size of 28 days.
Fig. 4(a)는 28일 타임 윈도우를 사용하여 추출한 표현벡터에 대한 PCA 결과를 시각화한 것이다. 상대적 비교의 용이성을 위해 PCA의 주축은 레퍼런스 데이터인
B27의 표현벡터만을 이용해 계산되었다. 구체적으로, B27 표현벡터 데이터의 분산을 최대화하는 2개의 주성분 축을 결정한 뒤, 동일한 주성분 축을
B110과 B55의 차원 축소에도 적용했다. 이러한 접근 방식은 B110과 B55의 표현벡터에 대해 분산이 최대화되는 축은 아닐 수 있으나, 레퍼런스인
B27의 표현벡터에서 도출된 주축을 기준으로 차원 축소 및 시각화를 수행함으로써 데이터셋 간의 정성적 비교를 가능하게 한다.
PCA 그래프를 통해 전반적으로 B110이 B55보다 B27에 더 유사한 데이터 특성을 갖는 것을 확인할 수 있다. 특히 겨울철에는 B110과 B27
간의 유사성이 가장 높게 나타나는 반면, 여름철에는 두 데이터 간의 거리가 상대적으로 멀어지는 경향이 관찰된다. 세 건물 모두 PCA 그래프가 닫힌
원형에 가까운 형태를 나타내고 있어, 연간 주기성이 뚜렷한 전력 사용 패턴을 가지고 있음을 알 수 있다.
Fig. 4(b)는 7일의 타임 윈도우를 설정해 추출한 세 건물의 320차원 × 8760시간 표현벡터를 이용하여, B27을 기준으로 B110과 B55 각각의 320차원
표현벡터 간의 코사인 유사도를 타임스텝별로 계산한 결과를 보여준다. 이 분석은 서로 다른 건물 데이터셋 간의 정량적 유사도를 정량화한다. PCA를
통해 비교한 결과와 마찬가지로, 대부분의 기간에 B110은 B55보다 B27과의 유사도가 높다. 그러나 0.5년과 0.9년 부근에서는 B55가 B110보다
B27과 더 높은 유사도를 나타내며, 이는 PCA 그래프에서도 확인할 수 있다.
Fig. 4의 해석에서 유의해야 할 점은 PCA와 코사인 유사도 분석에 사용된 타임 윈도우 크기의 차이이다. PCA는 정성적 비교를 위해 28일 타임 윈도우로
추출한 표현 벡터를 사용한 반면, 코사인 유사도 분석은 더 세밀하고 정량적인 비교를 위해 7일 타임 윈도우로 추출한 표현 벡터를 사용했다. 이로 인해
두 그래프에서 관찰되는 유사도 특성에 일부 차이가 발생한다.
Fig. 4 Time series data similarity analysis. (a) PCA plots of three buildings (B27,
B110, and B55) and (b) cosine similarity of two source building datasets (B110 and
B55) against the reference building dataset (B27).
Fig. 5 Comparison of electricity usage patterns across three building datasets from
0.2 to 0.25 year. (a) Normalized electricity usage for B27, B110, and B55. (b) Cosine
similarity between two source building datasets (B110 and B55) and the reference building
dataset (B27). Cosine similarity was calculated using representation vectors derived
from a 24-hour time window.
Fig. 6 Comparison of electricity usage patterns across three building datasets from
0.50 to 0.55 year. (a) Normalized electricity usage for B27, B110, and B55. (b) Cosine
similarity between two source building datasets (B110 and B55) and the reference building
dataset (B27). Cosine similarity was calculated using representation vectors derived
from a 24-hour time window.
Fig. 4(b)의 7일 타임 윈도우를 활용한 코사인 유사도 결과에 기반해 B110과 B55의 B27에 대한 유사도 특성이 달라지는 특징적인 두 구간(0.20~0.25년,
0.50~0.55년)을 선택해 정규화된 전력 사용량 데이터 및 코사인 유사도를 Fig. 5와 Fig. 6에 표시했다. 정규화된 전력 사용량 데이터가 시간 단위 데이터이기 때문에, 추출할 수 있는 가장 작은 주기는 하루 단위이다. 따라서 이 주기성을 포착하기
위해 그래프에 표현한 코사인 유사도는 24시간 타임 윈도우를 이용해 추출한 표현벡터에 기반한다.
Fig. 5는 0.20~0.25년 기간 동안 세 건물 데이터셋(B27, B110, B55)의 정규화된 전기 사용량 패턴과 유사도를 보여준다. 이 그래프는 Fig. 3에서 확인했던 28일 타임 윈도우로 추출한 표현벡터 기반 PCA 결과 및 7일 타임 윈도우로 추출한 표현벡터 기반 코사인 유사도 결과에서 확인했던
사실을 더욱 구체적으로 입증한다. Fig. 5(a)에서 B110의 전기 사용 패턴이 기준 건물인 B27과 잘 일치하는 반면, B55는 상대적으로 낮은 유사도를 보여준다. 이는 B110이 B27과 유사한
용도나 운영 특성을 가질 가능성을 시사한다. Fig. 5(b)의 코사인 유사도 분석은 이러한 관찰을 정량적으로 뒷받침한다. B110의 유사도가 전 기간에 걸쳐 0.9 이상으로 유지되는 반면, B55의 유사도는
더 낮고 변동 폭이 크다. 이는 B110이 B27과 더 일관된 유사성을 가짐을 보여준다. 이러한 결과는 B27을 대상으로 에너지 사용 예측이나 관리
전략 수립을 위한 데이터 기반 모델을 개발할 때 B110 데이터의 활용 가치가 더 높음을 시사한다.
Fig. 6은 0.5년에서 0.55년 구간의 세 건물의 정규화된 전기 사용량과 유사도를 보여준다. 앞선 분석에서 전체적으로 B110이 B27과 더 유사하나 이
기간에는 B55가 B110보다 B27에 대해 더 높은 유사도를 나타낸다. 대상 건물 정보가 익명화 되었기에 이런 거동의 원인을 정확히 파악할 수는
없으나, 이는 건물 에너지 사용에 영향을 미치는 다양한 요인(계절적 변화, 특별 이벤트, 운영 변경 등)에 의해 일반적인 패턴을 따르지 않는 예외적인
구간이 존재할 수 있음을 보여준다. 따라서 이런 구간에서는 선별적 소스 데이터셋 활용이 필요함을 시사한다.
6. 논 의
본 연구에서 제안하는 비지도 대조학습 기반 시계열 인코더를 활용한 표현벡터 추출 및 이를 활용한 소스 건물 데이터의 유사도 판별 결과는 데이터 기반
모델링과 전이학습 적용에 중요한 시사점을 제공한다. 본 연구 결과로부터 기대할 수 있는 주요 논의점은 다음과 같다.
(1) 데이터셋 전역의 유사도 분석 가능: 데이터 전체 기간의 평균적 유사도를 판별하는 방법이 아니라 무빙 윈도우 방식으로 데이터셋 전역의 유사도
변화를 세밀히 분석하는 것을 통해 타깃 데이터와 유사도가 높은 소스 데이터셋 구간을 정확히 식별할 수 있다.
(2) 전이학습을 위한 동적 소스 데이터 선택: 예측 또는 분석하고자 하는 시간 구간에 따라 가장 유사한 소스 데이터셋을 동적으로 선택할 수 있다.
또한 전이학습 과정에서 시간에 따른 유사도 변화를 반영하여 학습 가중치를 동적으로 조정하는 방법을 적용하면 더 나은 모델 성능을 기대할 수 있다.
(3) 예측 시간 윈도우에 맞춘 전이학습 데이터 선택 및 모델 개발: 단기(24시간), 중기(일주일), 장기(월간 이상) 예측을 위해 서로 다른 시간
윈도우로 추출한 표현벡터 및 그로부터 판별한 유사도에 기반하여 예측 윈도우 크기에 따라 가장 적합한 소스 데이터셋을 선택하는 방식의 머신러닝 모델
개발이 가능할 것이다.
7. 결 론
본 연구는 건물 에너지 수요 예측을 위한 머신러닝 모델 개발에 있어 데이터 부족 문제와 개별 건물 맞춤형 모델 구축의 높은 비용 문제를 해결하기 위한
새로운 방법론을 제시했다. 비지도 대조학습 시계열 인코더인 TS2Vec을 활용해 추출한 표현벡터 기반의 시계열 유사도 판별법을 개발하고, 이를 영국
케임브리지 지역의 익명화된 건물 전력 사용량 데이터셋에 적용하여 그 효과를 입증했다. 주요 연구 결과는 다음과 같다.
(1) 동적 유사도 분석: 개발된 방법론은 시계열 데이터의 전체 구간에 대한 평균적 유사도 판별을 넘어, 시간 해상도 및 판별 기준 시간 윈도우를
유연하게 조정하여 유사도가 높은 특정 데이터 구간을 식별할 수 있다.
(2) 정성적, 정량적 판별을 위한 시각화 기법: 주성분 분석을 적용하여 다차원 표현벡터를 차원 축소해 시각화하는 방식은 복잡한 시계열 데이터의 유사성을
정성적이지만 직관적으로 이해하고 분석할 수 있게 함을 보였다. 또한 서로 다른 데이터셋으로부터 추출한 표현벡터 간의 코사인 유사도 시계열을 통해 정량적
판별이 가능함을 보였다.
(3) 전이학습 성능 개선: 본 연구에서 개발된 방법은 목표 건물과 가장 유사한 시간적 특성을 지닌 소스 데이터를 자동으로 식별할 수 있게 함으로써,
전이학습의 성능을 크게 향상시킬 수 있는 가능성을 제시했다.
본 연구 결과는 건물 에너지 수요 예측을 위한 머신러닝 모델 개발에 있어 직면하는 데이터 부족 문제와 개별 건물 맞춤형 모델 구축의 높은 비용 문제를
해결하는 데 기여할 수 있을 것이다.
후 기
이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구이며 이에 감사를 표합니다(No. RS-2023-00277318).
References
Choi, W. and Lee, S., 2023, Performance evaluation of deep learning architectures
for load and temperature forecasting under dataset size constraints and seasonality,
Energy and Buildings, Vol. 288, 113027.

Langtry, M., Wichitwechkarn, V., Ward, R., Zhuang, C., Kreitmair, M. J., Makasis,
N., Xuereb Conti, Z., and Choudhary, R., 2024, Impact of data for forecasting on performance
of model predictive control in buildings with smart energy storage, Energy and Buildings,
Vol. 320, 114605.

Choi, W. and Lee, S., 2023, Interpretable deep learning model for load and temperature
forecasting: Depending on encoding length, models may be cheating on wrong answers,
Energy and Buildings, Vol. 297, 113410.

Fan, C., Sun, Y., Xiao, F., Ma, J., Lee, D., Wang, J., and Tseng, Y. C., 2020, Statistical
investigations of transfer learning-based methodology for short-term building energy
predictions, Applied Energy, Vol. 262, 114499.

Pinto, G., Wang, Z., Roy, A., Hong, T., and Capozzoli, A., 2022, Transfer learning
for smart buildings: A critical review of algorithms, applications, and future perspectives,
Advances in Applied Energy, Vol. 5, 100084.

Yue, Z., Wang, Y., Duan, J., Yang, T., Huang, C., Tong, Y., and Xu, B., 2022, TS2Vec:
Towards Universal Representation of Time Series, The Association for the Advancement
of Artificial Intelligence, Vol. 36, No. 8, pp. 8980-8987.

Langtry, M. and Choudhary, R., 2024, Cambridge University Estates building energy
usage archive, Zenodo, https://doi.org/10.5281/zenodo.10955332.

Met Office, 2022, MIDAS open: UK hourly weather observation data, v202207, NERC EDS
Centre for Environmental Data Analysis, https://doi.org/10.5285/6180fb7ed76a442eb1b8f3f152fd08d7.

Pfenninger, S. and Staffell, I., 2016, Long-term patterns of European PV output using
30 years of validated hourly reanalysis and satellite data, Energy, Vol. 114, pp.
1251-1265.

Staffell, I. and Pfenninger, S., 2016, Using bias-corrected reanalysis to simulate
current and future wind power output, Energy, Vol. 114, pp. 1224-1239.

Yu, F. and Koltun, V., 2016, Multi-scale context aggregation by dilated convolutions,
arXiv, https://doi.org/10.48550/arXiv.1511.07122.
