Mobile QR Code QR CODE : Korean Journal of Air-Conditioning and Refrigeration Engineering
Korean Journal of Air-Conditioning and Refrigeration Engineering

Korean Journal of Air-Conditioning and Refrigeration Engineering

ISO Journal TitleKorean J. Air-Cond. Refrig. Eng.
  • Open Access, Monthly
Open Access Monthly
  • ISSN : 1229-6422 (Print)
  • ISSN : 2465-7611 (Online)

  1. 경희대학교 기계공학과 석사과정 ( Graduate Student, Department of Mechanical Engineering, Kyung Hee University, Yongin, 17104, Korea )
  2. 경희대학교 기계공학과 교수 ( Professor, Department of Mechanical Engineering, Kyung Hee University, Yongin, 17104, Korea )
  3. 경희대학교 기계공학과 학술연구교수 ( R&D Professor, Department of Mechanical Engineering, Kyung Hee University, Yongin, 17104, Korea )



Particulate matter(미세먼지), School building status(학교 건축 현황), Python(파이썬), Classfication scheme(분류체계), Code system(코드체계), Standardization(표준화)

1. 서 론

학교 미세먼지는 적정 설비 설치 부재, 지속적인 운영 및 관리의 어려움, 초기비용투자 및 유지관리비용 지원 미흡 등의 문제에 직면하고 있으며 현실을 감안한 에너지비용을 최소화하는 미세먼지 관리 맞춤형 통합시스템 개발이 필요한 실정이다. 그 통합시스템의 기초가 되는 학교 건물은 건축 연한에 따라 벽체 및 창호에 대한 건물 성능(Building Performance)이 상이하며, 특히 건물의 노후화에 따라 기밀성능이 저하될 것으로 예상한다. 외기 미세먼지 농도 변화에 따른 학교 실내 미세먼지 농도 변화를 시간별로 예측할 수 있는 방법을 개발하여 학교 실내 미세먼지 유출입 원인을 찾고 기여도를 분석하며, 학교 실내 미세먼지 문제 해결방법을 위한 기반기술을 개발하는 데 목적이 있다. 또한, 기존 학교 건물의 연령, 용도, 평면구성, 환기방식의 학교 건물 DB를 구축하여 미세먼지 관리 맞춤형 통합시스템 개발에 학교 건물 DB 기초자료가 필요하다.

이와 관련된 선행연구로서 Han et al.(1)은 학교 건물 범주화를 위하여 학교 유형, 지역, 외부 환경, 내부 환경, 학교 건축 현황, 건물 인증 현황 및 기타 사항의 7가지 범주화와 그에 따른 여러 세부 항목으로 분류하였다. Kim(2)은 데이터를 순서대로 배치하였을 때 그 고유의 속성마다 숫자로 코드를 부여하고 데이터를 큰 틀로 나누고 그 세부적인 사항을 배치하는 연구 방법을 제시하였다. Koo et al.(3)은 학교 건물의 건축 환경 분류 및 실내공기 환경에는 외부 대기의 영향도 있지만, 교실 내부에 존재하는 오염원으로 인한 영향이 크다는 사실을 확인하였다. 건물 내 미세먼지가 건물 기밀성능과 관련이 있으므로 위 선행연구를 바탕으로 건물 내부 환경의 문과 창호에 대한 세부적인 분류를 적용한다. Kim(4)은 식품 성분표 데이터를 대분류 후 소분류 하여 데이터에 코드번호를 부여하여 식품 성분을 찾기 쉽게 하였다. 이는 세부 항목 내 복합적인 정보를 포함하고 있으면 부분적으로 숫자 코드화를 할 때 적용한다. Kang and Im(5)은 제품코드를 단순 순번이 아니라 업무의 효율성을 위하여 나눈 기호 등의 코드인 유의미 코드를 사용하고, 부자재같이 종류가 많은 코드는 순번 같은 식별 코드인 무의미 코드를 사용하여야 하는 점을 연구하였다. Kim et al.(6)은 분류체계를 만들 때는 후에 삭제나 추가가 될 것을 고려하여야 한다고 정리되어 있다. Song and Lee(7)은 데이터 분석 시 데이터 수집과 분석 및 코드 설계 작업이 동시에 이루어져야 한다고 연구하였다. 그 외에 공공기관의 DB 표준화 지침을 적용한 DB 표준 코드가 있는 경우, DB 표준 코드를 활용하여 코드체계를 확립한다.(8) 이러한 기존 연구에서는 학교 건물을 특성별로 분류하거나 다른 분야에서 코드체계를 구축하는 방법은 제시하였다. 그러나 기존 학교 관련 연구에서는 건물 기밀 성능 등의 내․외부 요인에 대하여 정리된 데이터와 이를 코드체계로 분류한 연구가 부족한 상황이다. 이러한 이유로 학교 건물 특성을 요소별로 분류하여 체계화하는 학교 건물 DB 구축 및 코드체계 표준화의 수행이 필요하다.

따라서 본 연구에서는 학교 건물의 기밀성능, 미세먼지 등의 측정에 앞서 2019년도 에너지 절약계획서 관련 건축 허가 도서를 바탕으로 1,000개의 학교를 선정하고, 선정된 학교 건물을 학교 유형, 지역, 외부 환경, 내부 환경, 학교 건축 현황, 건물 인증 현황 및 기타 사항의 7가지의 범주와 그에 따른 38개의 세부 항목 선정으로 기본 DB를 구축한다. 또한, 학교 건물 DB 구축 후 코드체계 표준화를 통하여 학교 건물 DB를 단순화하고 이러한 빅데이터를 활용하는 방안을 Python 프로그램을 활용하여 제시하고자 한다.

2. 학교 건물 DB 구축

2.1 학교 건물 DB 구축 개요

Table 1 School Building Categorization Classification

Type Classification

Detailed Classification

1. School Type

1.1 School Name, 1.2 School Type, 1.3 Building Purpose

2. Area

2.1 School Address

3. External Environment

3.1 Nearby Area, 3.2 Adjacent Road, 3.3 Altitude, 3.4 Meteorological Station Location, 3.5 Roof Finish Materials, 3.6 Exterior Wall Finish Materials, 3.7 Floor Finish Materials

4. Internal Environment

4.1 Air Conditioning Method, 4.2 Ventilator, 4.3 Entrance Location, 4.4 Main Gate,

4.5 Stairs and Hallway Section, 4.6 Classroom or Gym Location,

4.7 Classroom or Gym Door, 4.8 Classroom or Gym Window, 4.9 Ceiling Finish Materials

5. School Building Status

5.1 Construction Range, 5.2 Construction Year, 5.3 Land Area, 5.4 Total Area,

5.5 Total Floors, 5.6 Overall Building Layout, 5.7 Number of Floors, 5.8 Classroom Area, 5.9 Classroom Drawings, 5.10 Classroom Capacity, 5.11 Gym Area, 5.12 Gym Drawings, 5.13 Gym Capacity

6. Building Certification Status

6.1 Green Building Certification, 6.2 Building Energy Efficiency Rating, 6.3 Energy Conservation Plan

7. Et Cetera

7.1 Secured Drawings, 7.2 Education Support Office

본 연구의 대상은 2019년도 에너지 절약계획서 관련 건축 허가 도서를 접수순으로 선정된 1,000개의 데이터이다. 선정된 학교 건물을 School Type(학교 유형), Area(지역), External Environment(외부 환경), Internal Environment(내부 환경), School Building Status(학교 건축 현황), Building Certification Status(건물 인증 현황) 및 Et Cetera(기타 사항)의 7가지의 범주와 그에 따른 38개의 세부 항목 선정으로 기본 DB를 구축한다(Table 1 참고).

2.2 School Type(학교 유형)

School Name(학교명)은 학교 이름을 순서대로 입력한다. School Type(학교 유형)은 유치원부터 특수학교까지 학교 유형별로 분류하여 입력한다. Building Purpose(건물용도)는 일반 교실은 교실로 분류하고, 특별교실 중 활동량이 많은 다목적강당은 따로 분류한다. 주로 학생들이 재실하는 공간인 교실과 다목적강당을 중심으로, 나머지 부분은 용도에 따라 분류한다. 급식실과 기숙사도 학생들의 활동량과 재실 시간이 있는 공간이기 때문에 유형 안에 포함한다. 나머지 시청각실, 음악실, 미술실 등은 특별교실로 분류한다.

2.3 Area(지역)

School Address(주소)는 학교 건물의 소재지 주소를 시군구 순으로 입력한다. 추후 코드 표준화 작업 시 시군구 까지의 정보만 사용하기 때문에 도로명 주소와 지번 주소를 혼용하여 입력한다.

2.4 External Environment(외부 환경)

Nearby Area(인근 지역)는 인근 500 m 이내에 고속도로, 항만, 산단, 시장, 주거, 철도, 공원과 산 순서로 포함된 사항만 분류하여서 입력한다. Adjacent Road(인접 도로 폭)는 건물 외부의 인접 도로 중에서 가장 넓은 도로의 폭을 인도를 포함하여서 입력하고 도로의 방향과 함께 입력한다. Altitude(해발고도)는 해당 주소지의 위도, 경도 값을 통하여 고도 값을 추출하여 입력한다. Meteorological Station Location(기상관측소 위치)은 해당 학교 좌표와 가장 가까운 기상관측소의 위도, 경도 값의 좌표를 찾아 직선거리 값을 입력한다. Roof Finish Materials(지붕 마감재)는 지붕의 형태별로 경사 지붕, 박공지붕, 아치 지붕, 평지붕 및 여러 동으로 구성된 건물의 경우 해당하는 복합지붕의 크게 5가지로 분류하고 재료의 종류를 같이 입력한다. Exterior Wall Finish Materials(외벽 마감재)는 외벽의 재료를 밖에서부터 안쪽 순서로 입력한다. Floor Finish Materials(바닥 마감재)는 지붕과 외벽과 마찬가지로 도면에 해당하는 바닥의 재료를 입력한다.

2.5 Internal Environment(내부 환경)

Air Conditioning Method(공조 방식)는 EHP, GHP, 보일러, 바닥 난방 그리고 지열 순서로 포함된 사항을 분류 하여서 입력한다. Ventilator(환기장치)는 전열교환기, 급배기팬, 배기팬 그리고 급기팬 순서로 포함된 사항을 분류하여서 입력한다. 세부적으로 구분하기 위하여 필터와 센서의 종류를 구분하여서 입력한다. Entrance Location(건물 현관 위치)은 건물 현관은 건물의 형태에 따라 지하 1층, 1층 및 2층에 주로 위치하여 있으므로 동서 남북의 방향과 중앙 또는 측면에 위치하여 있는지를 구분하여서 층, 방향, 위치 순서로 입력한다. Main Gate (건물 주 출입문)는 건물 현관에 위치하여 있는 건물 주 출입문의 재료와 종류를 입력한다. Stairs and Hallway Section(계단실과 복도 구분)은 계단실의 구획 여부와 방화문 및 방화 셔터 여부로 분류하여서 입력한다. Classroom or Gym Location(교실 및 체육관의 위치)은 방향을 입력한다. Classroom or Gym Door and Window(교실 및 체육관의 문과 창호)는 건물 주 출입문과 같이 재료와 종류를 입력한다. Ceiling Finish Materials(천장 마감재)는 건물 내부 천장 마감재의 재료를 입력한다.

2.6 School Building Status(학교 건축 현황)

Construction Range(신축/증축/증․개축)는 건축 인허가 시의 현황을 입력한다. Construction Year(건축 연도)는 개교 연도와 증․개축한 연도를 분류하여서 입력한다. Land Area and Total Area(대지면적과 연면적)는 각각의 면적을 입력한다. Total Floors and Number of Floors(전체 층수와 해당 건물 층수)는 지하층과 지상층의 순서로 구분하여서 입력한다. Overall Building Layout(전체 건물 배치 형태)은 건물의 배치 형태를 일자형, ㄴ자형, ㄷ자형, ㅁ자형과 앞의 배치 형태가 2가지 이상 복합된 복합형으로 구분하여서 입력한다. Classroom and Gym Area(교실과 체육관 단위면적)는 도면을 바탕으로 면적을 입력한다. Classroom and Gym Drawings(교실과 체육관 도면)는 도면의 자료 여부를 입력한다. Classroom and Gym Capacity(교실과 체육관 수용인원)는 단위 면적을 바탕으로 한 수용인원을 입력한다. 도면상에 도시되어 있지 않으면 교실은 면적에서 1.9를 나누고, 체육관은 면적에서 4.6을 나눈다.(9)

2.7 Building Certification Status(건물 인증 현황)

Green Building Certification(녹색 건축 인증), Building Energy Efficiency Rating(건축물 에너지효율등급), Energy Conservation Plan(에너지 절약계획서)은 해당 사항의 등급 또는 점수를 입력한다. 에너지 절약계획서는 의무 사항일 경우 의무 사항이라고 표기한다.

2.8 Et Cetera(기타 사항)

Secured Drawings(도서 확보)는 앞서 학교 건축 현황에 나왔던 도면의 여부 개수를 입력한다. Education Support Office(해당 교육지원청)는 학교 주소에 따른 교육지원청을 입력한다.

3. 코드체계 표준화

3.1 코드체계 표준화 개요

앞서 구축된 DB를 단순화하기 위하여 코드 표준화 작업을 한다. 공공기관의 DB 표준화 지침을 적용한 DB 표준 코드를 활용하고 각각의 데이터별로 코드체계를 확립한다.(8) 제품 코드같이 단순 순번이 아니라 업무의 효율성을 위하여 나눈 기호 등의 코드는 유의미 코드로 보고 순별과 같이 종류가 많은 코드는 무의미 코드를 활용한다.(5) 만들어진 코드체계를 정리하여 Code Book을 생성한다.

3.2 School Type(학교 유형)

School Name(학교명)은 데이터 순서대로 0001부터 1000까지 순차적으로 부여한다. 세부 유형이 38개소가 되기 때문에 학교명을 쉽게 구분하기 위하여 무의미 코드 숫자 순차로 나열한다. School Type(학교 유형)은 유치원 부터 특수학교에 이르기까지 영문 첫 글자를 코드로 부여한다. 기타 사항은 영문 마지막 글자인 Z로 부여한다. Building Purpose(건물 용도)는 교실부터 시청각실에 이르기까지 영문 첫 글자를 코드로 부여한다. 기타 사항은 Z로 부여한다(Fig. 1 참조).

3.3 Area(지역)

School Address(주소)는 학교 건물의 소재지 주소를 시군구 순으로 입력된 데이터를 바탕으로 행정 표준 코드 관리 시스템에 의한 도로명 주소의 시군구까지 구분된 코드를 사용한다(Fig. 1 참조).(10)

Fig. 1 School type and area.
../../Resources/sarek/KJACR.2021.33.2.043/fig1.png

Fig. 2 External environment.
../../Resources/sarek/KJACR.2021.33.2.043/fig2.png

3.4 External Environment(외부 환경)

Nearby Area(인근 지역)는 경우의 수가 영문과 숫자만으로 분류하기 어려운 점이 있으므로 2가지 모두를 사용하여 코드를 부여한다. 고속도로(A0~), 항만(B0~), 산단(C0~), 시장(D0~), 주거(E0~), 철도(F0~), 공원(G0)과 산(H0) 순서로 부여한다. Adjacent Road(인접 도로 폭)는 건물 외부의 인접 도로 중에서 가장 넓은 도로, 도로의 폭이 같다면 정문 방향의 도로를 코드화한다. 방향은 영문으로, 도로 폭은 숫자로 구분하여서 코드를 부여 한다. Altitude(해발고도)는 구글 어스를 통한 검색으로 국내 해발고도의 최대 결괏값이 761.15 m이므로 최댓값을 700 m 이상으로 두고 100 m 단위로 나누어서 분류하고, 개수가 10가지를 넘지 않기 때문에 숫자로 순차적인 코드를 부여한다. Meteorological Station Location(기상관측소 위치)은 해당 학교 좌표와 가장 가까운 기상관측소 좌표의 직선거리를 1 km 이내부터 9 km 초과까지 구분하여 코드를 부여한다. Roof Finish Materials(지붕 마감재)는 지붕의 형태별로 경사 지붕, 박공지붕, 아치 지붕, 평지붕 및 복합지붕의 크게 5가지로 분류하고 재료의 종류를 4~5종류로 나눠서 구분한다. 지붕의 유형은 영문 첫 글자를 코드로 부여하고 재료의 종류는 숫자 코드로 부여한다. Exterior Wall Finish Materials(외벽 마감재)는 여러 개의 데이터 중 가장 앞에 있는 재료로 분류한다. 가장 밖의 벽을 벽돌, 패널, 석재, 목재 및 콘크리트로 분류하여서 코드를 부여한다. 가장 안의 벽을 벽돌, 패널, 목재, 콘크리트(페인트) 및 벽지로 분류하여서 코드를 부여한다. 자료 없음은 영문 마지막 글자인 Z로 부여한다. Floor Finish Materials(바닥 마감재)는 목재, 석재, PVC, 타일 및 매트로 분류하여서 코드를 부여한다. 자료 없음은 영문 마지막 글자인 Z로 부여한다(Fig. 2 참조).

3.5 Internal Environment(내부 환경)

Fig. 3에 따르면 Air Conditioning Method(공조 방식)는 분류의 개수가 추후 더 추가될 수 있어서 숫자보다 개수가 많은 영문 순차로 코드를 부여한다. Ventilator(환기장치)는 급배기팬, 배기팬 및 필터별 전열교환기의 순서로 분류하고 숫자 순차로 코드를 부여한다. Entrance Location(건물 현관 위치)은 층/방향/위치의 세 자리의 코드로 부여하는 것은 자칫 전체 코드의 자릿수가 길어질 수 있으므로 영문 순차로 코드를 부여한다. Main Gate(건물 주 출입문)의 재료는 강화유리, 스테인리스, 알루미늄, 철재 및 플라스틱으로 재료를 분류하여 영문 첫 자 코드를 부여한다. 자료 없음은 Z의 코드를 부여한다. 문의 사양은 여닫이문, 미닫이문, 스윙 도어, 여닫이문 및 미닫이문으로 분류하여 숫자 코드를 부여한다. 자료 없음은 0의 코드를 부여한다. Stairs and Hallway Section(계단실과 복도 구분)은 계단실이 없는 것부터 계단실이 오픈되어 있고 방화문 및 방화 셔터가 있는 것까지 숫자 순차대로 코드를 부여한다. Classroom or Gym Location(교실 및 체육관의 위치)은 자료 없음부터 남향/ 북향까지 숫자 순차대로 코드를 부여한다. Classroom or Gym Door(교실 및 체육관의 문)의 재료는 목재, 철재, 알루미늄, 스테인리스, 플라스틱, 수지 및 강화유리로 분류하여서 영문 첫 자의 코드를 부여한다. 자료 없음은 Z의 코드를 부여한다. 문의 사양은 여닫이문, 미닫이문, 여닫이문 및 미닫이문으로 분류하여서 숫자 코드를 부여한다. 자료 없음은 0의 코드를 부여한다. Classroom or Gym Window(교실 및 체육관의 창호)의 재료는 목재, 철재, 알루미늄, 스테인리스, 플라스틱 및 수지로 분류하여서 영문 첫 자의 코드를 부여한다. 자료 없음은 Z의 코드를 부여한다. 창호의 사양은 고정창, 미서기단창, 미서기다중창 및 여닫이창으로 분류하여서 숫자 코드를 부여한다. 자료 없음은 0의 코드를 부여한다. Ceiling Finish Materials(천장 마감재)는 금속, 흡음재, 석고보드, 수지, 페인트, 불연, 텍스, 벽지 및 마감 없음의 영문 첫 자로 코드를 부여한다. 자료 없음은 Z의 코드를 부여한다.

Fig. 3 Internal environment.

../../Resources/sarek/KJACR.2021.33.2.043/fig3-1.png

../../Resources/sarek/KJACR.2021.33.2.043/fig3-2.png

3.6 School Building Status(학교 건축 현황)

Fig. 4에 따르면 Construction Range(신축/증축/증․개축)는 신축부터 증․개축에 이르기까지 영문 첫 글자를 코드로 부여한다. Construction Year(건축 연도)는 1920년대 이전부터 영문 순차로 부여한다. 신축과 증ㆍ개축을 구분하기 위하여 뒤의 영문 코드는 신축은 Z 코드로, 증ㆍ개축은 그 연도에 해당하는 코드로 부여한다. Land Area(대지면적)는 최초 데이터 200개소에 의거하여 10,000~30,000 ㎡ 사이가 가장 많이 분포되어 있고 그 앞과 뒤는 적기 때문에 앞뒤로 한 가지의 분류를 더 만들고 5,000 ㎡ 단위로 분류한다. 숫자 순차로 코드를 부여하고, 자료 없음은 0의 코드를 부여한다. Total Area(연면적)는 700 ㎡를 기준으로 잡고, 700~3,000 ㎡ 사이는 500 ㎡ 단위로 분류하고 그 이상은 5,000 ㎡, 10,000 ㎡ 로 분류한다. 숫자 순차로 코드를 부여하고, 자료 없음은 0의 코드를 부여한다. Total Floors and Number of Floors(전체 층수와 해당 건물 층수)는 지하층을 앞에 지상층을 뒤에 써서 코드화한다. 자료 없음은 00의 코드를 부여한다. Overall Building Layout(전체 건물 배치 형태)는 일자형부터 복합형까지 영문 순차로 코드를 부여한다. 자료 없음은 Z의 코드를 부여한다. Classroom Area(교실 단위면적)는 50 ㎡ 단위로 분류하여서 숫자 순차 코드를 부여한다. 자료 없음은 0의 코드를 부여한다. Classroom and Gym Drawings(교실과 체육관 도면)는 도면이 있으면 0, 도면이 없으면 1의 숫자 코드를 부여한다. Classroom Capacity(교실 수용인원)는 20명 단위로 분류하여서 숫자 순차 코드를 부여한다. 도면 및 데이터에 도시되어 있지 않지만, 면적이 표기되어 있으면 재실 인원 계산에 의한 면적에서 1.9를 나눠서 수용인원을 계산한다. 자료 없음은 0의 코드를 부여한다. Gym Area(체육관 단위면적)는 200 ㎡ 단위로 분류 하여서 숫자 순차 코드를 부여한다. 자료 없음은 0의 코드를 부여한다. Gym Capacity(체육관 수용인원)는 50명 단위로 분류하여서 숫자 순차 코드를 부여한다. 도면 및 데이터에 도시되어 있지 않지만, 면적이 표기되어 있으면 재실 인원 계산에 의한 면적에서 4.6을 나눠서 수용인원을 계산한다. 자료 없음은 0의 코드를 부여한다.

Fig. 4 School building status.

../../Resources/sarek/KJACR.2021.33.2.043/fig4-1.png

../../Resources/sarek/KJACR.2021.33.2.043/fig4-2.png

3.7 Building Certification Status(건물 인증 현황)

Fig. 5 왼쪽에 따르면 Green Building Certification(녹색 건축 인증)은 최우수(그린 1등급), 우수(그린 2등급), 우량(그린 3등급) 그리고 일반(그린 4등급)까지 4가지의 등급으로 분류한다. 등급 없음은 0의 코드를 부여한다. Building Energy Efficiency Rating(건축물 에너지효율등급)은 1+++등급, 1++등급, 1+등급, 1등급, 2등급, 3등급 및 4등급까지 숫자 순차로 코드를 부여한다. 실제 건축물 에너지효율등급은 하위 등급(7등급)까지 존재하지만 학교 건물은 주로 1~3등급이 산정되기 때문에 코드상에서는 생략한다. 등급 없음은 0의 코드를 부여한다. Energy Conservation Plan(에너지 절약계획서)은 90점대부터 20점대까지 숫자 순차로 코드를 부여한다. 의무 사항은 0의 코드를 부여한다.

3.8 Et Cetera(기타 사항)

Fig. 5 오른쪽에 따르면 Secured Drawings(도서 확보)는 앞서 학교 건축 현황에 나왔던 도면의 여부를 나타내며 도면이 없는 경우 0, 도면이 교실과 다목적강당 중 하나만 있는 경우 1, 도면이 교실과 다목적강당 둘 다 있는 경우 2로 분류하여 코드를 부여한다. Education Support Office(해당 교육지원청)는 행정 표준 코드 관리 시스템에 의한 교육지원청 기관 코드를 그대로 사용한다. 교육지원청 코드가 유의미한 숫자 4자리와 무의미한 숫자인 0의 3자리로 이루어져 있으나 본 논문에서도 유의미한 숫자 코드만 사용하는 것이 아니라 기관 코드를 준수하였다.(10)

4. 학교 건물 DB 및 코드체계 활용방안

4.1 프로그래밍 툴 활용

현재 데이터는 38개 항목에 대한 1,000개 이상, 총 38,000의 데이터로 규모가 방대하다. 이를 단순히 데이터 정리를 위한 Excel과 같은 프로그램으로 원하는 조건의 데이터를 출력하기엔 매우 비효율적이다. 이를 효율적으로 활용하기 위한 빅데이터를 출력하는 프로그램은 R, Spark, KNIME, Xplenty, Tableau 그리고 Python 등이 있다. 그중 Python은 다른 프로그래밍 툴보다 문법이 쉬워 학습용으로 좋고 실사용률과 생산성이 높다. 무료로 이용할 수 있으며 많은 패키지(Library)를 구비하고 있어 최근 빅데이터 활용과 인공지능(머신러닝, 딥러닝 등) 개발에 많이 활용되고 있다. 이러한 이유로 본 연구에서는 Python을 기반으로 원하는 조건의 데이터를 보다 효율적으로 출력하기 위하여 데이터 처리를 위한 Pandas Library 및 시각화를 위한 Matplotlib Library 등을 사용한다.

Fig. 5 Building certification status and et cetera.
../../Resources/sarek/KJACR.2021.33.2.043/fig5.png

4.2 Excel을 활용한 DB 활용방안

Excel로 구성된 본 연구의 데이터를 Excel의 그래프 기능 등을 활용하여 원하는 데이터를 출력하는 방안이 있다. 문자열의 많은 양의 데이터로 구성되어 있으므로 Excel Sheet를 그대로 사용하기는 어려움이 있고 필터 기능을 활용하여 원하는 데이터를 분류한 후 그래프를 만들기 위한 조건의 표를 별도로 만들어서 결괏값을 출력한다. Fig. 6에 따라 지역별로 가장 많은 학교를 학교 유형별로 분류하여 시각화한다. Fig. 7에 따라 학교 유형별로 가장 많은 지역을 지역별로 분류하여 시각화한다.

Excel의 그래프 기능을 활용하면 해당 학교 데이터를 자세하게 알 수 있고, 각각의 세부 항목들을 원하는 부분만 선택할 수 있다. 이 경우에는 코드 표준화된 부분을 활용하는 것보다 DB 정리된 부분을 활용하는 것이 더 용이하다. 학교 데이터가 추가되면 다시 처음부터 필터 기능을 활용하여 별도의 표에 추가하여야 한다는 점과 지역별 분류 시 시군구 단위로 나누어져 있는 부분을 일일이 확인하여 시 단위로 구분하여야 하는 부분은 정확성이 떨어지고 시간이 소요된다는 점은 미흡한 부분으로 보인다.

Fig. 6 Number of schools by school type for excel.
../../Resources/sarek/KJACR.2021.33.2.043/fig6.png

Fig. 7 Number of schools by area for excel.
../../Resources/sarek/KJACR.2021.33.2.043/fig7.png

4.3 Python을 활용한 DB 활용방안

본 연구의 데이터는 크게 학교 유형, 지역, 외부 환경 등 총 7가지의 범주로 분류할 수 있다. 또한, 각각의 범주는 적게는 1~3개, 많게는 10개 이상의 세부 조건으로 나뉜다. 이때 각각의 7가지의 범주 내의 세부 부류를 한 개씩 선택할 수 있으며, 원하지 않을 시엔 선택하지 않을 수 있다. 학교 유형부터 기타 사항까지 순차적으로 진행하게 되며 해당 조건에 맞는 학교 코드를 출력한다.

데이터 시트의 처리를 위하여 기본적으로 Pandas Library를 사용한다. Excel Sheet를 그대로 사용하여 원하는 조건을 입력으로 받아 조건을 만족하는 인덱스를 누적하여 저장한 뒤, 해당 인덱스의 학교 코드를 출력한다. 또한, 7개의 큰 부류의 세부 부류를 선택하였을 때 바로 출력하거나 다음 조건으로 넘어갈 수 있다. 한 번 출력하면 처음부터 다시 조건을 설정하거나 프로그램을 종료한다. 처리된 데이터 시트를 시각화하기 위하여 Matplotlib Library를 사용한다.

Matplotlib Library에서는 선택된 데이터 중 가장 많은 3가지를 선별하여 그래프로 나타낸다. Fig. 8에 따라 학교 유형의 세부 부류를 선택하지 않을 시, 다른 조건에 맞는 학교를 학교 유형으로 분류하여 시각화한다. Fig. 9에 따라 지역별 부류를 선택하지 않을 시, 다른 조건에 맞는 학교를 지역별로 분류하여 시각화한다.

Fig. 8 Number of schools by school type for python.
../../Resources/sarek/KJACR.2021.33.2.043/fig8.png

Fig. 9 Number of schools by area for python.
../../Resources/sarek/KJACR.2021.33.2.043/fig9.png

4.4 Excel과 Python DB 활용방안 비교

Excel에서는 그래프를 통해 데이터를 출력할 수도 있고 그래프에 다양한 서식이 있고 수정이 용이하지만 DB 구축된 Excel Sheet를 그대로 사용하는 방식이 아니라 원하는 데이터를 따로 추출하여 그래프를 출력하는 방식이기 때문에 데이터의 범위가 넓어질수록 반영이 어렵고 정확성이 떨어진다는 단점이 있다.

Python을 기반으로 데이터 출력은 현재 해당하는 학교의 이름과 주소만 나오게끔 설정이 되어있어서 자세한 정보를 보기 힘든 점이 있다. 하지만 그래프를 쉽게 얻을 수 있는 점과 한번 코딩을 프로그래밍 해두면 약간의 수정만으로 현재보다 데이터가 더 쌓여도 동일한 방식으로 데이터를 출력할 수 있는 장점이 있다. 따라서 현재 가지고 있는 학교 데이터뿐만 아니라 앞으로 추가될 데이터를 반영하여 활용하기 위하여 Python을 활용하는 방안을 제시한다.

이러한 시각화된 활용방안이 외기 미세먼지 농도 변화에 따른 학교 실내 미세먼지 농도 변화를 시간별로 예측할 수 있는 방법을 개발하여 학교 실내 미세먼지 유출입 원인을 찾고 기여도를 분석하며, 학교 실내 미세먼지 문제 해결방법을 위한 기반기술을 개발하는 기초자료로 활용이 예상된다.

5. 결 론

본 연구에서는 학교 건물 미세먼지와 내ㆍ외부 요인의 상관관계에서 중요할 것으로 예측한 기밀 성능 외의 여러 항목을 포함하여 학교 건물의 데이터를 유형별로 분류하고 간단하게 보기 위한 목적과 코딩을 위한 목적으로 DB 구축 및 코드 표준화를 구축하였다. 영문 첫 글자를 코드로 부여하는 편이 숫자보다는 직관적이므로 학교 유형, 건물용도, 외벽, 바닥, 천장 등은 유의미한 코드로 부여하였다. 학교명, 해발고도, 기상관측소 위치, 대지면적, 연면적 등은 영문 코드보다 좀 더 간단한 숫자 순차 코드로 부여하였다. 국가 기관에서 사용되는 코드가 있는 주소 및 교육지원청 코드는 인용하였다.

빅데이터 활용방안 측면에서는 현재 7가지의 부류에서 각각의 세부 부류를 선택하여 최대 7가지의 조건에 따른 데이터를 출력할 수 있다. 하지만 적게는 1~3개, 많게는 10개 이상의 세부 부류를 가진 항목들에 대하여 한 개의 조건이 아닌 한 개 이상의 조건에 따른 데이터를 출력할 수 있어야 한다. 이에 따라 조건 횟수 및 조건 선택에 제한이 없게끔 하여야 한다. 또한, 현재 학교 유형의 세부 부류를 선택하지 않거나 지역 부류를 선택하지 않을 때 학교 유형 또는 지역으로 분류하여 시각화한다. 시각화하는 항목들을 따로 지정 및 선택할 수 없는 단점을 보완하여, 사용자가 선택하는 조건에 따라 시각화할 수 있도록 프로그래밍한다. 그래프뿐만 아니라 측정 데이터와 결합하여 실시간으로 시각화할 수 있는 방안으로 프로그래밍할 수도 있다.

추후 연구과제는 최근 다양하게 활용되고 DB 활용 접근성 면에서 우수한 QR코드 방식을 적용한 학교 건물 DB 구축 체계에 관한 연구가 필요하다. 또한, 학교 건물 침기 및 침착 계수를 현장 측정한 자료와 취합하여 각 학교별 침기 전달 미세먼지 영향 분석과 이를 활용한 지원 대책 마련 자료로 활용하고 미세먼지 관리 맞춤형 통합시스템 개발에 기초자료로 기여할 것으로 예상한다.

후 기

이 연구는 2020년도 정부(과학기술정보통신부, 교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구입니다(No. 2019M3E7A1113079).

References

1 
Han H., Oh H., Koo J., Min J., 2020, A Study on the Construction of Building Information Database for School Particulate Matter Management Technology Development, Proceedings of SAREK Summer Annual Conference, pp. 298-299DOI
2 
Kim S., 2009, A Study on the Standardization of Code System for the Joint Use of Realty Information, Journal of the Korean Cadaster Information Association, Vol. 11, No. 1, pp. 149-165DOI
3 
Koo J., Bae S., Kim G., 2007, Architectural Implementation of the Indoor Air Quality in the Elementary School Classroom, KIEAE Journal, Vol. 7, No. 1, pp. 15-22DOI
4 
Kim S., 1994, New Food Code Numbering for Calculation of Nutritive Value, JKFN Journal, Vol. 23, No. 5, pp. 774-783DOI
5 
Kang M., Im I., 2010, A Study on the Item Code Standardization of Automobile Industry, Journal of Digital Convergence, Vol. 8, No. 4, pp. 73-82DOI
6 
Kim D., Lee S., Choi. D., 2005, A Classification Model Supporting Dynamic Features of Product Databases, KTSDE Journal, Vol. 12, No. 1, pp. 165-178DOI
7 
Song S., Lee E., 1997, A Study on the Standardization of Code Representation for Telecommunications Network, Korean Institute of Communication Sciences Public Presentation and Discussion, pp. 478-484DOI
8 
Ministry of the Interior and Safety, 2019, Guidelines for Standardizing Databases in Public Institutions, 2019-20DOI
9 
Narional Fire Agency, 2020, Enforcement Decree of the Fire Protection Facility Act.DOI
10 
https://www.code.go.kr/index.do.Google Search