김지형
(Ji-Hyoung Kim)
1
김선인
(Seon-In Kim)
2
박영준
(Young-Joon Park)
2
김덕우
(Deuk-Woo Kim)
3
김의종
(Eui-Jong Kim)
4†
-
인하대학교 건축공학과 학생연구원
(Undergraduate student, Department of Architectural Engineering, Inha University, 00
Inha-ro, 2222, Korea)
-
인하대학교 건축공학과 박사과정
(Graduate student, Department of Architectural Engineering, Inha University, 100 Inha-ro,
1, Korea)
-
한국건설기술연구원 건축에너지연구소 수석연구원
(Senior Research Engineer, Department of Building Energy Research, Korea Institute
of Civil Engineering and Building Technology, Korea)
-
인하대학교 건축학부 교수
(Professor, Department of Architectural Engineering, Inha University, 100 Inha-ro,
22212, Korea)
Copyright © 2016, Society of Air-Conditioning and Refrigeration Engineers of Korea
키워드
건물에너지, 공공데이터, 공동주택, 다중회귀모델
Key words
Building energy, Housing public data, Multifamily housing, Multiple regression model
기호설명
EUI :
단위면적당 1차 에너지 소요량 [kWh/m2․yr]
R2 :
회귀식의 결정계수
SED :
시간에 따른 에너지 사용 용도 분리 방법
VIF :
분산팽창지수
1. 서 론
1.1 연구의 배경 및 목적
전 세계적으로 지구온난화로 인한 이상기후 등의 문제가 대두됨에 따라 파리국제협약 이후 각국은 탄소 중립을 위한 다각적인 연구가 진행되고 있으며 관련
정책을 시행하고 있다. 국내 또한 국제적 흐름에 맞춰 탄소 중립을 위해 ‘2030 국가 온실가스 감축 목표’와 ‘2050 장기 저탄소 발전전략’을
제시하고 이를 위한 「탄소 중립․녹색성장 기본법」을 제정하여 대응하고 있다. 현재 탄소 중립은 단순한 온실가스 감축을 넘어, 국제적 관계 유지, 경제
성장 등을 위한 중요한 과제로 인식되고 있다.
2018년 기준, 가정․상업 부문(건물부문)의 온실가스 직접배출량은 국가 총배출량의 7.2%에 달하며 전력 사용 등을 고려한 간접배출량을 포함한다면
전체의 24.6%로 상당 부분을 차지한다.(1) 정부는 이러한 건물부문 온실가스 배출량을 감소시키기 위해 다양한 정책을 추진하고 있다. 특히, 「도시․국토 저탄소화」를 탄소 중립을 위한 10대
과제 중 하나로 선정하였으며 2030년까지 2018년 대비 32.8% 저감을 목표로 하고 있다. 탄소배출 저감 목표치를 달성하기 위해 시행중인 대표적인
사업으로 ‘건물 에너지효율등급 인증제도’, ‘제로에너지 건축물 의무화’, ‘그린 리모델링 활성화’와 같이 건물에너지 성능 향상을 위한 사업이 있다.
현재 국내에서는 건물 에너지효율을 평가하기 위해 건축 도면을 기반으로 단위면적당 1차 에너지 소요량인 EUI(Energy usage intensity:
kWh/m2․yr)를 산출하고 이에 따라 인증 등급을 부여하고 있다. 하지만 인증제도에서 활용되는 EUI는 건물의 이론적인 에너지성능을 바탕으로 산출되어
일반적으로 실제 에너지 사용량과 오차가 존재한다.(2) 이는 건물의 실제 운영 현황 및 환경 조건 등을 반영할 수 없어 발생하는 문제로 기존 건물의 에너지 소비 현황을 분석하기 위해서는 실제 에너지 사용량을
대상으로 하는 평가체계가 필요하다.
미국의 대표적인 에너지 사용량 평가체계인 Energy Star에서는 실제 에너지 사용량을 기반으로 대상 건물의 에너지효율을 평가하며 대상 건물의 용도(병원,
의료 사무실, 다세대 주택, 호텔 등)를 고려한 평가가 가능하다.
하지만 직접 조사된 건물 정보를 기반으로 평가가 진행되기 때문에, 전국단위 평가가 제한적이며 사용자의 개인 정보 보안과 같은 문제가 발생할 수 있다.
또한, 전체 에너지 사용량에 대한 EUI를 기준으로 회귀모델을 구축하기 때문에, 모델의 설명력을 의미하는 결정계수(R2) 값이 전체적으로 낮게 나타나며 냉방, 난방, 기저 등 에너지 용도별 사용 수준을 명확히 파악하기 어려워, 구체적인 에너지 절약 가이드라인이나 정책
제안에 한계가 있다. 예를 들어, Table 1의 Multifamily housing의 평가 결과는 R2 값이 약 0.23으로 상대적으로 낮은 편이다.(3)
Table 1 Energy Star regression results (Multifamily housing)
Summary
|
Building type
|
Multifamily housing
|
Dependent variable
|
Source EUI (kBtu/ft2)
|
Number of observations
|
322
|
R2-value
|
0.2298
|
따라서, 본 연구에서는 접근성과 활용성이 높은 공공데이터를 활용한 각 에너지 용도별 벤치마킹(Benchmarking) 모델을 개발하여 건물에너지 소비성능을
평가할 수 있는 기준을 마련하고자 한다. 공공데이터는 국가 및 공공기관 DB에서 쉽게 수집 가능하며 이를 통해 간접적으로 에너지 사용량에 영향을 주는
비에너지 데이터를 파악할 수 있다. 연구의 대상으로는 서울시 공동주택 중, 아파트로 선정하였다. 국토교통부에 따르면, 2023년 기준 건물부문 에너지
사용량의 약 56.6%가 주거용 건물에서 발생하며 그중 아파트가 61.9%로 대부분을 차지하고 있어 평가체계 마련의 중요성이 크다고 판단된다.
1.2 연구의 방법 및 절차
본 연구에서는 주거용 건축물 중 아파트의 에너지 사용량 평가 기준 마련을 위해 공공데이터를 활용하여 다중회귀모델을 개발하였다. 연구 진행 과정 데이터
전처리, 군집화, 회귀모델 개발 순으로 진행되며 Fig. 1과 같다.
1.2.1 데이터 전처리
건축데이터 민간개방 시스템과 K-apt(공동주택관리정보시스템)에서 서울 지역 아파트를 대상으로 데이터를 수집한 후 전처리 과정을 수행하였다. 공공데이터의
특성상 다수의 결측치와 오류 값을 포함하고 있으며, 데이터 관리 주체에 따라 데이터의 종류, 명칭, 범위, 단위 등이 상이하다. 이러한 특성으로 인해
수집된 데이터에서 이상치를 포함하는 표본을 제거하고, 동일 단지에 대한 여러 정보를 결합하기 위해 매칭 과정을 진행하였다. 또한, 단지의 에너지 사용량은
계량기별로 측정되어 합산되기 때문에, 각 에너지 용도별 벤치마킹 모델을 개발하기 위해 에너지 사용 데이터를 용도별(난방, 냉방, 기저)로 분리하였다.
1.2.2 군집화
단지별 에너지 사용량을 보다 정확하게 평가하기 위해 공통적인 특성을 가진 단지들을 군집화하였다. 이를 위해 난방 방식과 주민공동시설 규모를 기준으로
에너지 소비 패턴에 영향을 미치는 건물의 운영적 요인을 통제하고 각 군집 별로 객관적인 평가를 진행할 수 있도록 분석 대상 단지들을 분류하였다.
1.2.3 회귀모델 개발
전처리한 데이터와 용도별 에너지 사용량과의 연관성을 분석하여 영향 인자를 선정하고 상관관계 분석, 다중공선성(Multicollinearity) 분석을
통해 최종적인 독립변수를 결정하였다. 결정된 독립변수를 적용하여 에너지 사용 용도별, 군집별 회귀모델을 개발하였으며 결정계수(R2), CVRMSE와 같은 정량적인 수치를 통해 모델의 성능을 평가하였다.
2. 데이터 처리 과정
2.1 공공데이터 수집
공공데이터는 공공기관이 생성하고 관리하는 데이터베이스 및 전자 파일을 말하며, 모든 국민에게 개방되어 있어 수집 및 활용이 용이하다. 공공데이터는
방대하고 다양한 정보를 포함하고 있으므로, 연구 목적에 맞는 데이터를 선별하여 사용하는 것이 중요하다. 건축물과 관련된 공공데이터는 크게 건물의 용도와
관계없이 동일한 항목에 대해 수집되는 공통 데이터와 특정 용도에 한해 수집되는 용도 특화 데이터로 나눌 수 있다. 본 연구에서는 아파트와 관련된 데이터를
선별하여 사용하였으며 공통 데이터로는 「건축물대장」과 「건물에너지」 데이터를, 용도 특화 데이터로는 「K-apt」, 「개별공시지가 정보」를 활용하였다.
사용된 공공데이터의 세부 사항은 Table 2에 요약되어 있다. 「건축물대장」과 「건물에너지」 데이터는 건축데이터 민간개방 시스템에서 제공되며, 「건축물대장」은 총괄표제부, 표제부, 층별개요,
전유공용면적 등으로 구성된다. 이 중 총괄표제부는 수집된 데이터를 단일 단지로 매칭하기 위한 기준으로 사용되었다. 「건물에너지」 데이터는 단지 단위의
계량기에서 측정된 에너지 사용량을 전기, 가스, 지역난방 등 에너지원별로 구분하여 제공하며, 코로나19 팬데믹으로 인한 생활 방식 변화의 영향을 배제하기
위해 2018년도 데이터를 활용하였다. 「K-apt」와 「개별공시지가 정보」는 공동주택과 관련된 정보를 제공한다. 「K-apt」는 건축물대장에 포함된
정보 외에도 난방 방식, 주민공동시설 정보, CCTV 대수, 경비․청소․급수 방식 등의 자료를 추가로 제공한다. 「개별공시지가 정보」는 부동산 시세를
바탕으로 매년 공시된 개별공시지가를 제공하며, 공동주택 가격(2022년 12월 기준)은 단지별로 평균하여 활용하였다
Table 2 Public data
Category
|
Entry
|
Building register
|
Recap title legister
|
Building registry PK
|
Gross floor area (m2)
|
Floor area ratio (%)
|
Number of households
|
Number of sub buildings
|
Area of sub buildings (m2)
|
Total parking spaces
|
Floor summary
|
Floor information
|
Floor area (m2)
|
Private and shared areas
|
Shared area (m2)
|
Household area (m2)
|
Building energy data
|
Electrical energy (kWh/month)
|
Gas energy (kWh/month)
|
K-apt data
|
Complex code
|
Number of households
|
Heating type
|
Total parking spaces
|
Number of CCTVs
|
Number of elevators
|
Individual publicly announced price information
|
Apartment price (average, total)
|
Number of exclusive units
|
2.2 공공데이터 전처리
아파트 관련 데이터는 크게 비에너지 데이터와 에너지 사용량 데이터로 나눌 수 있다. 비에너지 데이터는 건축물의 에너지 사용 수준에 간접적으로 영향을
미치는 요인들로, 앞서 건축물대장, K-apt, 개별공시지가 정보에서 수집된 데이터들이 이에 해당한다. 이러한 비에너지 데이터는 관리주체에 따라 명칭,
관리번호, 종류 등이 서로 다르다. 때문에, 에너지 사용량 데이터와 연결하기 위해서는 각 단지의 정보를 일치시킬 필요가 있다.
서로 다른 위계의 비에너지 데이터를 매칭하기 위해서는 공통으로 참조할 수 있는 동일한 데이터 항목이 필요하다. 건축물대장의 총괄표제부, 표제부, 전유공용면적
등의 데이터는 단지를 고유하게 식별할 수 있는 총괄표제부 PK(Primary key)와 연결되어 있어, 이를 기준으로 매칭하였다. 반면, 고유 단지
코드로 식별되는 K-apt 데이터의 경우, 법정동 주소를 활용하여 총괄표제부 PK와 매칭하였다. 매칭 과정에서 건축물대장과 K-apt에 모두 포함되는
데이터(세대수, 층수, 주차대수 등)가 불일치하는 단지는 부동산 정보 사이트를 통해 수정하였으며 수정 불가능한 데이터일 경우 건축물대장의 데이터를
사용하였다. 이를 통해 표본 손실을 최소화하고 분석 결과의 신뢰성을 높이고자 하였다.
건물에너지 데이터는 에너지원별(전기, 가스)로 나뉘며, 사용 용도에 대한 구분 없이 함께 계측된다. 이러한 이유로, 실제 계측된 에너지 데이터를 사용하는
평가 방법에서는 용도 구분 없이 전체 에너지 사용량을 대상으로 평가를 진행한다. 그러나 이 접근 방식은 용도별 에너지 소비수준의 분석이 불가하여 과소비
원인을 파악하기에 어려움이 있다. 따라서, 시간에 따라 주된 에너지 사용 용도가 전환되는 특징을 활용한 에너지 용도 분리 방법론인 SED(Simplified
weather-sensitive energy disaggregation approach)를 적용하여 난방, 냉방, 기저로 분리된 에너지 사용량을 사용하였다.
SED는 Fig. 2와 같이 에너지 사용량이 가장 낮은 월을 기저로 가정하여 이를 기준으로 겨울철을 난방, 여름철을 냉방 에너지로 구분한다.(4) 이를 통해 조명, 기기, 급탕과 같이 건물 외부 요인에 영향도가 적고 연중 사용량이 비교적 일정한 기저 에너지, 계절 변화에 따른 특정 기간(여름,
겨울)에 집중되는 냉방, 난방 에너지를 분류할 수 있다.
Fig. 2 Simplified weather-sensitive energy disaggregation approach.
SED의 적용으로 용도가 분리된 각 에너지원의 사용량을 단지 단위의 연간 냉방, 난방, 기저 사용량으로 합산하기 위해서는 단위 및 1차 에너지 환산계수의
적용이 필요하다. 용도별 합산과정에서 Table 3의 기준을 사용하여 에너지원별 단위 및 1차 에너지 환산계수를 적용한 뒤 사용량의 단위를 kWh로 통일하여 합산하였다.
최종적으로 데이터 간의 매칭 및 에너지 사용량의 용도 분리 과정을 거친 후, 결측치가 없는 단지를 분석 표본으로 선정하였다. 비에너지 데이터는 수집된
항목이 없거나 매칭이 불가능한 단지를 제외하였고, 에너지 데이터는 월별 사용량이 온전히 계측되지 않은 단지를 제외하였다. 위 전처리 과정을 통해 서울특별시의
‘유형별 공동주택관리 현황’에 따른 전체 3627단지 표본 중 최종적으로 942개의 표본을 확보하였다.(5) 이러한 전처리 과정을 통해 군집 특성을 충분히 반영한 표본을 선정하고, 이를 바탕으로 평가 기준 모델의 적합성을 향상시키고자 하였다.
Table 3 Energy conversion factor
Energy source
|
Unit
|
kWh factor
|
Primary energy factors
|
Electricity
|
kWh
|
1
|
2.75
|
MWh
|
1000
|
Gas
|
MJ
|
0.2776
|
1.1
|
3. 군집화
3.1 난방 방식에 따른 분류
서울특별시의 ‘유형별 공동주택관리 현황’에 따르면 서울시에는 4,275단지의 공동주택이 위치하며, 아파트는 3,627단지로 각각의 규모, 갖추고 있는
시설 등이 상이하다. 따라서, 주거용 건축물의 객관적이고 정확한 에너지 사용량 평가체계 마련을 위해서는 공통적 특성을 갖는 단지를 분류하고 군집 별
평가가 이루어질 필요가 있다.
첫 번째로 난방 방식에 따라 단지를 분류하였다. 난방 방식은 크게 개별난방, 중앙난방, 지역난방 방식이 있다. 개별난방은 각 세대에 보일러를 개별적으로
설치하여 난방을 공급하는 방식이며 중앙난방은 단지 내 기계실의 보일러를 가동해 각 세대에 난방을 중앙식으로 공급하는 방식이다. 지역난방은 열병합 발전소에서부터
단지 내 기계실에 설치된 열교환기를 거쳐 각 세대로 난방이 공급된다.(6) 이처럼 난방 방식에 따라 공급 방법, 계측(Metering) 범위와 단위 등이 다르고 사용자의 자율적 운전이 제한되기도 하여 난방 방식 간에 에너지
사용량의 차이가 클 것이라 예상된다. 따라서 객관적인 에너지 사용량 평가체계를 위해 난방 방식으로 군집화를 진행하였다. Fig. 3과 같이, 전처리를 거친 서울시 아파트 단지 942개의 표본 중 개별난방을 사용하는 단지는 703개, 중앙난방은 62개, 지역난방은 165개, 그
외 기타 방식은 12개이다. 개별난방 단지 외 다른 난방 방식의 표본은 그 수가 적으며 회귀모델이 해당 표본에서만 설명력이 높은 과적합(Overfitting)이
나타날 수 있다. 이는 평가 대상을 확대하였을 때 해당 군집 분류기준에 적합하여도 에너지 사용량 예측 정확도가 낮아지는 문제가 발생할 수 있다. 따라서,
본 연구에서는 표본 수가 가장 많아 상대적으로 과적합의 위험도가 적은 개별난방 방식 아파트를 대상으로 하였으며 표본 수가 개별난방 방식 다음으로 많은
지역난방 방식의 경우 추후 연구를 통해 진행하고자 한다.
Fig. 3 Classification by heating method.
3.2 주민공동시설에 따른 분류
두 번째로 아파트 단지 내의 주민공동시설 유형으로 분류하였다. 주민공동시설이란 「주택건설기준 등에 관한 규정」에 따라 해당 공동주택의 거주자가 공동으로
사용하거나 거주자의 생활을 지원하는 시설을 의미한다. 1991년 「주택건설기준 등에 관한 규칙」, 「주택건설기준 등에 관한 규정」이 제정되고 1999년
9월 29일 이를 일부 개정하며 주민공동시설이 처음 정의되었다. 시대적 변화에 따라 단지 내 시설의 중요성이 높아지며 최근 2022년까지 규칙은 36차례,
규정은 110차례 변경되었고 그 종류는 더욱 다양해지고 구체화 되었다.(7)
Table 4와 같이 단지 내 주민공동시설은 「주택건설기준 등에 관한 규정」에 의해 그 종류가 정의되어 있으며 단지 내의 세대수에 따라 의무적인 설치 기준이 존재한다.
하지만 2022년 이전에 준공한 아파트 단지는 적용된 기준이 달라 위 기준에 부합하지 않는 경우도 다수 존재한다. 따라서 주민공동시설 설치 기준을
단순화하여 단지 내의 주민공동시설에 따라 4가지 군집(A, B, C, D)으로 분류하였다. 군집 분류기준과 각 군집의 표본 수는 Table 5와 같다.
Table 4 Standards for the installation of community facilities
Number of households
|
Community facilities
|
Over 150 households
|
Senior center
|
Children's playground
|
Over 300 households
|
Senior center
|
Children's playground
|
Childcare center
|
Over 500 households
|
Senior center
|
Children's playground
|
Childcare center
|
Community sports facility
|
Library
|
Together care center
|
Other types of community facilities
|
Community education facility / reading room / Youth training facility /
Residents' meeting room / Community resting facility / Shared parenting space
|
Table 5 Classification by community facilities
Group
|
Community facilities
|
Sample size
|
A
|
-
|
45
|
B
|
Senior center
|
451
|
Children's playground
|
C
|
Senior center
|
134
|
Children's playground
|
Childcare center
|
D
|
Senior center
|
73
|
Children's playground
|
Childcare center
|
Community sports facility or Library or Others
|
4. 회귀모델 개발
4.1 독립변수 결정
4.1.1 후보군 선정
다중회귀모델은 에너지 사용량에 영향을 주는 변수를 독립변수로 결정하여 예측값과 실제값의 차이를 정량적으로 나타내 그 설명력을 판단하는 모델이다. 건축물에서의
에너지 사용은 건물의 규모, 형태, 면적, 창호, 외피, 재실자 특성 등 다양한 요인들의 복합적인 영향을 받으며 에너지 용도별로 영향 요인들이 상이하다.(8) 따라서, 회귀모델의 설명력을 높이기 위해서는 기저, 냉방, 난방 에너지를 구분하여 각각의 용도에 적절한 독립변수를 선정해야 하며 동시에 독립변수
간의 간섭을 의미하는 다중공선성(Multicollinearity)으로 인한 모델의 설명력 저하를 검토하는 작업이 필요하다.
회귀모델을 구성하기 위해 기저, 냉방, 난방 에너지별로 독립변수 후보군 선정하였다. 독립변수 후보군은 첫 번째로 결측 및 오류 데이터가 없는 항목을
대상으로 하며 기저, 냉방, 난방 에너지 변화에 영향을 줄 것이라 판단되는 인자들을 후보군으로 선정하였다.
4.1.2 상관관계 분석
독립변수 후보군 중 실제 미치는 영향의 정도를 정량적으로 파악해 영향도가 큰 변수들을 선택하여 회귀모델의 독립변수로 사용해야 한다. 영향력을 파악하기
위해 대표적인 통계기법인 Heat map 상관관계 분석을 진행하였으며 에너지 사용량은 2018년도 기준 데이터를 사용하였다. Heat map 분석은
두 변수 간의 선형적인 관계를 의미하는 상관계수를 계산하여 그림으로 나타내는 방법이다. 상관계수는 절댓값 0~1까지의 수치로 나타나며 1에 가까울수록
영향도가 높은 것을 의미한다.(9)
독립변수 후보는 아래 Table 6과 같이 연면적, 부속건축물면적, 세대수 등 8가지이다. Fig. 4와 같이 에너지 사용량과 각 독립변수 후보의 상관계수를 계산하여 보편적인 변수 선택 기준인 상관계수 0.5 이상의 값을 가지는 후보를 선별하였다.
최종적인 Heat map 상관관계 분석 결과는 Table 6의 Variables 열에 정리되었다.
Fig. 4 Heat map correlation analysis.
Table 6 Correlation analysis results
Group
|
Potential Independent variables
|
Energy use
|
Variables
(Correlation analysis results ≥ 0.5)
|
|
A
|
Gross floor area (m2): X1
Area of sub buildings (m2): X2
Number of households: X3
Total parking spaces: X4
Number of elevators: X5
Year of occupancy approval: X6
Average apartment price: X7
Number of CCTVs*: X8
*Excluding cooling&heating
|
Base
|
X1, X2, X3, X4, X5, X8
|
|
Cooling
|
X1, X2, X4, X5, X7
|
|
Heating
|
X1, X2, X3, X4, X5, X7
|
|
B
|
Base
|
X1, X2, X3, X4, X5, X8
|
|
Cooling
|
X1, X2, X3, X4, X5
|
|
Heating
|
X1, X2, X3, X4, X5
|
|
C
|
Base
|
X3, X4, X5, X8
|
|
Cooling
|
X3, X4, X5
|
|
Heating
|
X3, X4, X5
|
|
D
|
Base
|
X1, X3, X4, X5, X8
|
|
Cooling
|
X1, X3, X4, X5
|
|
Heating
|
X1, X3, X4, X5
|
|
4.1.3 다중공선성 분석
다중회귀모델에서 독립변수 간의 간섭을 의미하는 다중공선성은 모델의 회귀계수의 불확실성을 증대시켜 결과적으로 독립변수의 신뢰도 및 회귀모델의 설명력을
저하시키는 결과를 일으킬 수 있다.(10) 때문에, 다중회귀모델 구축 과정에서 독립변수 간의 다중공선성을 세심하게 검토할 필요성이 있다. 다중공선성을 확인할 수 있는 대표적인 방법으로는 분산팽창지수(Variance
Inflation Factor, VIF) 분석이 있다. VIF 계산 방법은 다음 식(1)과 같으며 R2는 식(2)와 같다.
VIF 분석으로 나타나는 다중공선성의 결과 판단에 대해서는 다양한 시각이 존재하지만, VIF가 5~10 이상일 경우 독립변수 간의 간섭으로 인한 신뢰도
저하를 의심하는 것이 일반적이다.(11,12) 따라서, Heat map 상관관계 분석을 통해 추려낸 독립변수 후보들에 대해 VIF 분석을 진행하여 5 이상의 값을 가지는 변수를 제거하였다. 만약
5 이상의 값을 가지는 변수가 2개 이상일 경우, 더 큰 값을 가지는 변수를 제거한 후, VIF를 재계산하여 검토하였으며 모든 변수가 5 미만의 값을
가질 때까지 변수 제거 과정을 반복하였다.
4.2 군집별 회귀모델
위 4.1 장에서 상관관계 분석, 다중공선성 분석을 통해 최종적으로 선정된 독립변수를 사용하여 군집별 기저, 냉방, 난방 에너지 사용량을 예측하기
위한 다중회귀모델을 도출하였다. 독립변수는 모델별로 2~3개가 사용되었으며 모델의 차수는 2차로 모두 동일하다. 각 군집별 다중회귀모델의 그래프는
Fig. 5와 같으며, 사용된 독립변수, R2, CVRMSE는 Table 7과 같다.
Fig. 5 Multiple regression model.
다중회귀모델 분석 결과, 주민공동시설에 따른 네 가지 군집 중 B 군집의 회귀모델이 평균 R2 값 0.82로 가장 높았으며 다음으로 A, D, C 군집 순으로 나타났다. 특히, C 군집은 평균 R2 값이 0.59로 가장 낮았으며, 이는 C 군집 표본들의 특성을 대표할 수 있는 데이터의 부족으로 판단된다. 따라서, 추가적인 공공데이터 수집과 군집
분류기준에 대한 검토가 필요할 것으로 사료된다. 각 군집의 기저 에너지 사용량은 냉난방 에너지 사용량에 비해 전체적으로 높은 R2 값을 보였다. 이 결과는 날씨나 계절 변화에 크게 영향을 받지 않으며, 비교적 일정한 에너지 소비 패턴을 보이는 기저 에너지 사용량의 특성 때문으로
보인다.
본 연구와 Energy Star 모델의 주요한 차이점은 에너지 용도(기저, 냉방, 난방)별로 회귀식을 도출한 것, 공공데이터 중 비에너지 데이터를
보다 적극적으로 활용한 것, 그리고 회귀식의 정확도를 높이기 위해 유의미한 독립변수를 선별한 것이다. 특히, 국내 단지형 공동주택의 특성상 단지 내의
세대간 생활 방식이 유사한 주거 문화가 반영되어 에너지 사용량에 대한 일관된 회귀 경향을 만들어낸 것으로 판단된다. 하지만, Energy Star는
총 에너지 사용량을 EUI로 분석하는 반면, 본 연구는 면적 변수를 모델에 포함하며 설명력이 더 높아졌을 가능성이 있으며, 이에 대한 추가적인 분석이
필요하다.
Table 7 Multiple regression model results
Group
|
Energy use
|
Independent variables
|
R2
|
CVRMSE (%)
|
A
|
Base
|
X2, X3, X8
|
0.80
|
54.33
|
Cooling
|
X1, X2, X7
|
0.89
|
45.31
|
Heating
|
X2, X3, X7
|
0.66
|
72.44
|
Average
|
-
|
0.78
|
57.36
|
B
|
Base
|
X2, X3, X5
|
0.89
|
30.97
|
Cooling
|
X2, X3, X5
|
0.80
|
41.70
|
Heating
|
X2, X3, X5
|
0.78
|
45.41
|
Average
|
-
|
0.82
|
39.36
|
C
|
Base
|
X3, X5, X8
|
0.66
|
42.75
|
Cooling
|
X3, X5
|
0.56
|
49.90
|
Heating
|
X3, X5
|
0.54
|
45.20
|
Average
|
-
|
0.59
|
45.95
|
D
|
Base
|
X1, X5, X8
|
0.71
|
41.70
|
Cooling
|
X1, X5
|
0.67
|
47.16
|
Heating
|
X1, X5
|
0.66
|
39.73
|
Average
|
-
|
0.68
|
42.86
|
5. 결 론
본 연구에서는 서울시 아파트 단지를 대상으로 공공데이터를 활용한 에너지 소비 성능 평가 모델을 개발하였다. 데이터 전처리 과정에서 결측값이 없는 단지를
선별하고 에너지 사용량을 용도별로 분리하여 보다 정확한 분석을 수행하였다. 또한, 난방 방식과 주민공동시설 규모를 기준으로 단지를 군집화하여 에너지
소비 패턴에 영향을 미치는 운영적 요인을 통제하였다.
회귀모델 개발 과정에서는 전처리된 비에너지 데이터와 에너지 사용량 간의 관계를 분석하여 최적의 독립변수를 선정하고, 이를 바탕으로 군집별 및 용도별
회귀모델을 구축하였다. 전체적으로 기존 Energy Star에서 사용된 모델에 비해 모델의 설명력이 높게 나타났다. 이는 모델 개발 방법론의 차이뿐
아니라 국내 공동주택의 물리적 특성 및 유사한 사용자 패턴에 따른 결과로 보인다.
회귀모델 구축을 통해 아파트 에너지 사용량 평가의 기초 자료를 제공하고, 아파트 단지의 에너지 효율성 개선, 에너지 사용량 저감 유도 등의 정책 수립에
기여할 것으로 기대된다. 또한, 공공데이터 활용의 중요성을 강조하며, 향후 다양한 유형의 주거 건축물에 대한 에너지 사용 분석을 확대할 필요가 있다.
하지만 공공데이터 전처리 과정에서 결측 및 이상치 제거에 따른 3627단지에서 942단지로의 표본 수 감소는 벤치마킹 모델이 전체 아파트 단지를 대표하지
못하는 문제를 야기할 수 있다. 또한, 에너지 사용 용도에 따른 회귀모델을 살펴보면, 기저 에너지 회귀모델과 비교하여 냉방, 난방 에너지 회귀모델의
R2 값이 전반적으로 낮은 수치로 나타났다. 계절 에너지인 냉방, 난방 에너지는 기상데이터, 냉방도일(Cooling degree day), 난방도일(Heating
degree day)과 밀접한 연관성을 가지지만 본 연구에서는 이를 반영하지 않아 설명력이 저하된 것으로 판단된다.
추후 연구에서는 본 연구 결과를 바탕으로 한계점을 개선하며 평가체계를 구체화하고자 한다. 개선할 사항은 다음과 같다.
(1) 결측 및 이상치 데이터 처리: 본 연구에서는 공공데이터의 결측 및 이상치 데이터를 제거함으로써 전체 데이터의 품질을 향상시켰다. 하지만, 전체
표본 중 약 74%가 제거되며 벤치마킹 모델이 추후의 전체 평가 대상을 대표하지 못하고 그에 따라 평가 기준의 신뢰성이 의심될 수 있다. 따라서,
결측 및 이상치를 단순 제거하는 방법 이외에 통계기법을 활용한 대푯값 사용, 보간법에 따른 결측치 수정 및 보완 등의 추가적인 방법이 필요하다고 판단된다.
(2) 군집 세분화 및 공공데이터 확대: 3장의 군집화 과정에서 난방 방식 및 주민 공동 시설의 규모를 군집화 기준으로 사용하였으나, 설명력이 낮았던
군집에 대해서는 추가적인 군집기준 수립이 필요하다. 이를 위해 활용 가능한 공공데이터의 확대가 요구되며, 다양한 에너지 소비 패턴을 반영할 수 있는
지역별 건축물 특성 데이터, 인구 통계 정보, 및 사회경제적 변수를 포함한 데이터베이스를 검토할 예정이다.
(3) 지역 및 연도별 모델 검증: 지역 및 연도에 따라 상이한 기후조건으로 인해 본 연구에서는 2018년 서울 지역을 대상으로 시범적으로 분석을
진행하였다. 전국의 공동주택을 대상으로 일반화된 벤치마킹 모델을 개발하기 위해서는 기후조건 변화에 따른 검증이 필요하며, 특히 냉방 및 난방 에너지
모델에는 기후적 변인을 고려해야 한다.
후 기
이 성과는 2023년도 정부(국토교통부)의 재원으로 국토교통과학기술진흥원의 지원을 받아 수행된 연구입니다(RS-2023-00244769).
References
Son, I., & Kim, D. K., 2022, Analysis of Greenhouse Gas Reduction Effect of Green
Remodeling Project: Focusing on Policy Effect, Korean Energy Economic Review, Vol.
21, No. 2, pp. 133-160.
Kim, D. W., Yoon, S. H., & Park, C. S., 2014, Simple energy benchmarking for existing
office buildings, Journal of the Architectural Institute of Korea Planning & Design,
Vol. 30, No. 9, pp. 223-233.
EnergyStar, 2018, ENERGY STAR Score for Multifamily Housing in the United States,
https://www.energystar.gov/sites/default/files/tools/Multifamily_August_2018_EN_508.pdf(assessed
30th. Sep. 2024).
Kim, D. W., Ahn, K. U., Shin, H., & Lee, S. E., 2022, Simplified weather-related building
energy disaggregation and change-point regression: Heating and cooling energy use
perspective, Buildings, Vol. 12, No. 10, p. 1717.
Seoul, 2023, Status of Apartment Management (by Type), https://data.seoul.go.kr/dataList/11045/S/2/datasetView.do.
Lee, B. J., Chung, D. Y., Lee, S., & Hong, H., 2003, Survey on energy consumption
according to heating methods in apartment houses, In Proceedings of the SAREK Winter
Annual Conference, p. 118.
Bang, S. H., & Kim, D. N., 2022, Changes and Implications of Public Facilities as
Infrastructure, Journal of the Architectural Institute of Korea, Vol. 38, No. 10,
pp. 187-196.
Lee, K. H., & Chae, C. U., 2008, Estimation model of the energy consumption under
the building exterior conditions in the apartment housing—focused on the maintenance
stage, J. Archit. Inst. Korea Plan, Vol. 24, pp. 85-92.
Han, S. H., & Jang, H. S., 2023, Acquisition and Analysis of Environmental Data for
Smart Farm, The Journal of Korea Institute of Information, Electronics, and Communication
Technology, Vol. 16, No. 3, pp. 130-137.
Ryu, S. K., 2008, Effects of Multicollinearity in logit model, Journal of Korean Society
of Transportation, Vol. 26, No. 1, pp. 113-126.
Han, S. J., Kim, Y. O., & Oh, S. M., 2008, Relationship between pedestrian network
and pedestrian volume using connectivity, Journal of Korean Society of Transportation,
Vol. 26, No. 1, pp. 137-144.
Cohen, J., Cohen, P., West, S. G., & Aiken, L. S., 2013, Applied multiple regression/correlation
analysis for the behavioral sciences, Routledge.