Mobile QR Code QR CODE : Korean Journal of Air-Conditioning and Refrigeration Engineering
Korean Journal of Air-Conditioning and Refrigeration Engineering

Korean Journal of Air-Conditioning and Refrigeration Engineering

ISO Journal TitleKorean J. Air-Cond. Refrig. Eng.
  • Open Access, Monthly
Open Access Monthly
  • ISSN : 1229-6422 (Print)
  • ISSN : 2465-7611 (Online)

  1. 한국건설생활환경시험연구원, 에너지환경사업본부 선임기술원 (Senior Research Engineer, Energy & Environment Business Division, KCL(Korea Conformity Laboratories), Jincheon, 27872, Korea)
  2. 한국건설생활환경시험연구원, 에너지환경사업본부 주임기술원 (Junior Research Engineer, Energy & Environment Business Division, KCL(Korea Conformity Laboratories), Jincheon, 27872, Korea)
  3. 한국건설생활환경시험연구원, 에너지환경사업본부 연구원 (Research Engineer, Energy & Environment Business Division, KCL(Korea Conformity Laboratories), Jincheon, 27872, Korea)



데이터센터(Data center), 열관리(Thermal management), 공기분배성능(Air distribution performance), 성능평가지표(Evaluation metrics), IT환경 모니터링(IT environment monitoring)

기호설명

C : 상수 [0.34]
n : 공기 유입구 수량
m : 풍량 [m3/h]
mn : Negative pressure에 의한 풍량 [m3/h]
mc : CRAH/C 유닛 급기량 [m3/h]
mbp : 유실(by-pass) 공기량 [m3/h]
mf : IT서버룸 공급 공기풍량 [m3/h]
mr : 재순환[re-circulation] 공기량 [m3/h]
ms : IT서버 유입 공기량 [m3/h]
mh : IT서버 배출 공기량 [m3/h]
Q : 총열량 [W]
ΨVR : Volume region의 엑서지 감소율 [W]
ΨAE : Airspace의 엑서지 감소율 [W]
Rsys : 공조시스템의 열전달 저항
Rnm : 공기 순환이 없는 조건의 열전달 저항
Tx : (x)서버의 공기 유입구 평균온도 [℃]
Tc : CRAC/H 유닛 급기온도 [℃]
Tf : IT서버룸 공급 공기온도 [℃]
Tr : 재순환 공기온도 [℃]
Ts : IT서버 유입 공기온도 [℃]
Th : IT서버 배출 공기온도 [℃]
TRA : 환기공기온도 [℃]-가중평균
TSA : 급기공기온도 [℃]-가중평균
△TEquip : IT장비 통과 후 상승온도 [℃]-가중평균
TREF : CRAC/H 유닛 급기온도 [℃]
T r : IT서버의 유입 공기온도 [℃]
T O U T r : IT서버의 배출 공기온도 [℃]
TMax-rec : 최대 권장 실내온도 ASHRAE 기준 [25℃]
TMax-allow : 최대 허용 실내온도 ASHRAE 기준 [32℃]
TMin-rec : 최소 권장 실내온도 ASHRAE 기준 [18℃]
TMin-allow : 최소 허용 실내온도 ASHRAE 기준 [15℃]

1. 연구배경 및 목적

데이터센터는 수많은 서버와 IT장비들로 이루어져있다. 빅데이터와 클라우드의 대중화에 맞추어 데이터센터는 공공과 개인영역에서 중요한 역할을 해오고 있다. 데이터센터에서의 막대한 데이터 처리량은 결과적으로 많은 열 발열을 일으키는 전력 밀도증가로 이어져 왔다. 보안과 IT장비의 안정적인 환경유지를 위해 연중 운전되는 공조·냉각시스템은 엄청난 양의 에너지소비를 야기 시킨다. 공조 시스템은 전체 데이터센터 에너지 소비의 평균 40%를 차지한다.(1) 데이터센터는 그 동안 PUE(Power Usage Effectiveness)를 낮추는 데 집착해 왔다. 2007년부터 Green Grid의 PUE 측정법(2)은 데이터센터의 필수 요소였지만 모든 사항을 만족시키는 접근 방식은 아니다. 데이터센터의 PUE 에너지 효율성은 해당 지역의 기후, IT운영환경, 건축계획 등 다양한 변수가 작용한다. 여러 가지 시나리오가 측정 기준의 단점으로 표출될 수 있다. 즉 IT환경 조건(특히, 실내온도 조건)을 어느 정도의 수준으로 운영하는가에 따라서 동일한 데이터센터의 조건에서 PUE는 크게 차이가 발생할 수 있다. 그리고 비 IT부문의 대부분의 에너지를 사용하는 공조·냉각시스템의 효율관리도 데이터센터의 에너지 종합효율을 증가시키는 데 매우 주요한 요소 중에 하나이다. 데이터센터의 공조·냉각시스템에서의 에너지 소비량의 급격한 증가는 시설의 운영 측면에서 에너지 절약에 대한 지속적인 요구가 발생하고 있다. 즉, 에너지 절감을 위한 시스템의 효율성 향상이 필요하다. 그러나 IT장비의 신뢰성을 위해 발열제거의 냉각을 위한 필요이상의 낮은 온도 또는 과도한 양의 냉각공기공급은 막대한 에너지 낭비로 이어진다. 이러한 이유로, 데이터센터의 열관리는 IT장비의 원활할 운전과 공조·냉각시스템의 에너지 소비량 절감을 동시에 달성하기 위한 효과적인 방법이다. 데이터센터에서의 공기분배는 복잡하고 다양한 요소로부터 영향을 받고 데이터센터 특성에 따라 각기 다르다. 데이터센터의 설계절차 및 방법은 대부분 설계기준(index based)에 따라서 설계하는 것이 보편적이다. 즉, 요구되는 목표를 및 성능을 달성하기 위해서 설계지침에서 정한 방법, 조합 및 설비 단위성능 등을 선정하여 획일적이고 융통성이 없는 결과물이 산출되는 경우가 많다. 이에 반하여, 성능위주(performance based)설계는 요구되는 목표에 가장 적합한 수단을 사용하여 가장 적은 비용으로 요구되는 성능을 만족시키는 것이다. 따라서 기존의 설계방법에 비하여 설계의 유통성 측면에서 설계자의 선택권이 보다 많아지게 된다. 본 연구는 성능위주 데이터 센터의 IT환경 및 에너지사용 특성을 반영한 공조·냉각시스템의 운영 효율을 측정/분석하기 위한 평가지표 및 모니터링 방법과 프로세스 제시가 주된 목적이다. 이를 위해, 문헌조사와 IT장비의 공조·냉각효율 평가 방법 조사를 통해 데이터센터의 특수성을 반영한 정량적인 기존의 평가지표를 분석하였고 관리대상 선정과 구성요소에 대한 측정요소 및 모니터링 기준을 정립하였다. 또한, 최종적으로는 현장측정 및 운영 데이터 분석결과를 비교하여 상호 연계성을 도출하는 기반을 구축하는 것이다.

2. 이론적 고찰

Fig. 1과 같이 데이터센터의 공조·냉각시스템은 전체의 전력흐름에서 기계실과 상면(white space)에서 냉동기 및 CRAC/H(Computer Room Air Conditioning/Handling) 유닛을 가동하면서 에너지를 소비한다. 그 중에서 IT 장비의 환경조건과 냉각을 위한 공기분배 효율은 IT장비가 설치되는(grey areas를 제외한) 상면공간에서 직접적으로 연계가 된다.(3) 데이터센터의 공조·냉각시스템 효율분석을 위한 IT환경 요소는 습도를 제외한 온도 및 기류에 국한하였다. 습도는 데이터센터 환경기준에 중요한 요소이다.

Fig. 1. Overview of a typical data center power distribution system.
../../Resources/sarek/KJACR.2018.30.12.620/fig1.png

통상적인 외기냉방을 적용하지 않은 데이터센터의 공조·냉각시스템은 IT서버 보호를 위해 외기를 처리하여 공급하며 냉각을 위해 실내공기를 계속 순환시키기 때문에 외기에 의한 습도변화요인은 없으며, 실내에 직접적으로 사람이 거주하지 않기 때문에 잠열발생이 없어 습도에 대한 분석은 고려하지 않았다. 그리고 공조 효율은 여러 가지 가능한 공기분배 방식을 고려하여 최적의 시스템을 설계해야한다. 일반적으로 데이터센터를 관리하고 있는 지표들은 열량변화 및 IT서버룸의 온도에 치중하고 있다. 데이터센터에서 공조·냉각시스템의 주요 목적은 IT장비를 위한 충분한 열 환경 제공을 위한 것이다. Fig. 2는 보통 데이터센터에서 기류분배의 계통을 보여준다. 냉각된 공기는 CRAC/H 유닛으로부터 공급되고 IT장비에 의해 방출된 열 제거를 위해 바닥 하부를 통과한 cold aisle로 흘러들어가게 된다. IT서버의 내장된 팬들은 발열제거를 위해 냉기를 흡입하게 된다. 발열을 제거하고 배출된 공기가 hot aisle로 이동하는 동안 냉각공기가 서버랙을 통과하면서 발열을 제거한다. 이것은 어떠한 에너지 손실 없이 이상적인 공조·냉각 프로세스이다. 그러나 IT장비의 운영으로 인한 영향과 열관리의 낮은 공조·냉각효율을 포함한 실제 운영에서 세 가지 공기 혼합 과정이 있다. 비가역성 현상은 이러한 혼합을 포함하고 IT서버 인입구에 공조·냉각공기가 도달하기 전 냉각 에너지의 양은 줄어들게 된다.

Fig. 2. General classification of data center spaces : ballroom, hot/cold aisles, and grey areas.
../../Resources/sarek/KJACR.2018.30.12.620/fig2.png

데이터센터 열관리 관련 지표들은 지난 몇 년 동안 다수가 제안되어 왔다. SHI(Supply Heat Index)와 RHI(Return Heat Index)는 Sharma et al.(4)에 의해 제안되었다. 이 두 지표는 공조·냉각공기 유동의 효율성 활용과 공조·냉각 경로안의 재순환 정도를 평가하는 기준을 제시하였다. 그러나 SHI와 RHI는 IT장비단위(rack level)에서 사용되었을 때 항상 효과적이지 않은 공간단위(room level)의 지표이다. 공단단위 평가 지표인 β는 공조·냉각공기의 재순환 발생과 문제점을 극복을 위한 과열현상에 대한 정보를 제공한다. 또한 RCI (Rack Cooling Index)는 IT 장비를 위한 공조·냉각 성능측정을 위해 Herrlin(5)에 의해 제안되었다. RCI는 온도의 상한 및 하한에 따라 RCIHi와 RCILo로 나뉜다. RCI는 몇몇 가이드라인에 의해 IT장비에서의 열성능 평가를 하는 rack level 지표로서 매우 중요하게 고려되고 있다. Herrlin(6)은 또한 재순환과 by-pass현상을 설명하기위해 RTI(Return Temperature Index)를 제안하였다. RTI는 이상적인 조건은 공조·냉각 공급과 활용이 100% 일치되어야 한다. RTI의 지표가 100% 이하는 공조·냉각공기가 활용 없이 바로 CRAC/H 유닛에 돌아오는 by-pass 값을 나타낸다. 지표가 100% 이상은 공조·냉각공기의 재순환 현상을 나타나낸다. Tozer et al.(7)은 데이터센터의 공조·냉각공기분배를 설명을 위한 지표들을 열전달 매체와 열평형 방정식에 기반 하여 제안하였다. 여기에는 NP (Negative Pressure), BP(Bypass)와 R(Recirculation)의 세 가지 공기 혼합과정의 비율을 측정한다. BAL(Balance)은 CRAC/H에 의해 공급된 공조·냉각공기와 rack에 요구량의 차이를 설명한다. 또 다른 지표인 CI(Capture Index)는 열전달 매체 유량에 기반한 지표는 Vangilder(8)에 의해 소개되었다. CI는 구역(local)단위 지표로 냉각의 유로가 될 수 있는 송풍기나 냉각유닛에 의한 공기분배효율을 측정하기 위한 것이다. 대부분의 과거 언급되었던 지표에 기반하여 Cho et al.(9)은 데이터센터에서 열관리의 평균효율 평가기준을 만들었다. 이 평가 기준은 RCI, RTI, SHI 및 RHI를 포함하여 각각의 우선순위를 통한 종합적인 평가기준을 제시하였다. 앞에서 언급한 성능 지표들은 공급냉각의 열량에 초점에 맞춘 열역학 제1법칙을 기초로 제안되었다. 일부 연구자들은 데이터 센터의 공조·냉각시스템을 분석하기 위해 열역학 제2법칙과의 연계성을 고려하였다. Shah et al.(10)은 선행연구에서 데이터 센터 열환경의 엑서지(exergy) 효율을 분석하기 위한 합리적인 방법으로 엑서지 손실을 보여주었다. Fakhim et al.(11)은 데이터센터의 공조·냉각 비효율을 발생시키는 비가역성을 수치화 하기위해 열역학 제2법칙 평가와 연관 시켰다. 열역학 제2법칙에 기초한 Exergetic Performance Metric(EPM)은 4개 공간 (cold aisle, hot aisle, 천장부분, rack과 CARC/H 사이 부분)에서 혼합된 공기의 양을 평가하기 위해 제안 되었다. 낮은 EPM은 냉각시스템의 향상된 성능을 말한다. 반면에, Qian et al.(12)은 엔트란시(entransy) 분석 방법은 데이터센터 열관리를 설명할 때 적합하다는 것을 알아내었다. 또한 냉각시스템에서 공기혼합의 영향을 평가하기 위해 Air Mixing Index(AMI), 엔트란시 기반 지표를 설명하였다. 새로운 엑서지 개념의 평가지표는 기존 평가시스템을 보완한 것이다.

데이터센터의 운영자와 설계자들을 위해 모든 평가지표는 각기 다른 형태의 열 환경에 적용하기 위함이다. 따라서 기류영역은 일반적인 데이터센터의 공기분배 시스템 조사를 위한 대상으로써 선택되었다. 공기영역의 엑서지 손실은 에너지 효율뿐만 아니라 혼합공기의 영향 판단을 위한 세부사항이 확인되어야 한다. 혼합공기의 비가역성에 대한 조사는 구성요소와 위치를 반영하고 있다.

3. 데이터센터 공조·냉각효율 평가

3.1 데이터센터 공조효율 평가방법

데이터센터의 공조효율을 평가할 수 있는 주요 지표는 Table 1과 같다. 이들 지표들은 열역학 제1법칙과 제2법에 기반한 방법으로 구분할 수 있다. 열역학 제1법칙에 근거한 지표들은 대부분 단위 rack level을 위한 것과 room level의 공조공기 분포의 단순한 역학관계의 문제를 위해서만 사용되었다.

Table 1. Existing evaluation metrics of data center thermal management

Metrics

Information

Air distribution

Containment

Thermodynamics

Theory

Level

Rating

H/F

R/F

Cold

Hot

SHI

Recirculation degree in air mixing

the First Law

Room

Level

Target

0

Good

< 0.2

RHI

Cooling effect of cold air supply

the First Law

Room

Level

Target

0

Good

> 0.8

RCILo

Rack cooling condition according to cold threshold values

the First Law

Room

Level

Ideal

100%

Good

96%

Acceptable

91%~95%

Poor

90%

RCIHi

Rack cooling condition

according to hot threshold values

the First Law

Room

Level

Ideal

100%

Good

96%

Acceptable

91%~95%

Poor

90%

RTI

Extend of bypass and recirculation

the First Law

Room

Level

Re-circulation

> 100%

By-pass

< 100%

Acceptable

> 100±5% >

Poor

< 100±30% <

β

Recirculation and over heating extent

the First Law

Room

Level

Target

0

NP

Extend of negative pressure

airflow into under floor

X

the First Law

Room

Level

-

BP

Extend of bypass airflow with data center

X

the First Law

Room

Level

Ideal

0

Good

< 0.05

Acceptable

0.05~0.2

R

Extend of recirculation airflow in cold aisles

X

the First Law

Room

Level

Target

0

Good

< 0.2

BAL

Difference between cooling

air supplied and demand

X

the First Law

Room

Level

Ideal

1

Good

< 0.85

CI

Airflow ingested by local component

the First Law

Room

Level

Target

0

EMP

Irreversibility quantities in the airspace volumes with the tile-based area

X

the Second Law

Room

Level

Target

0

AMI

Effects of air mixing on the data center cooling

X

the Second Law

Room

Level

Target

0

3.1.1 SHI(Supply Heat Index)/RHI(Return Heat Index)

공기냉각식 IT장비는 장비로 인입되는 공기의 온도에 가장 큰 영향을 받는다. SHI와 RHI는 무차원 지표로 고온의 IT장비 배출공기와 저온의 공조공기의 혼합량을 나타낸다. 기본개념은 Fig. 3과 같다. Q는 데이터센터 내의 IT서버들을 통과하여 상승된 총 열량을 나타내며, 식(1), 식(2)와 같이 IT서버로 공급되는 공기와 서버를 통과하여 발열을 제거하고 온도가 상승한 공기의 풍량과 온도차를 기준으로 열량을 산출한다. 식(4)의 δQ는 CRAH/C 유닛에서 공급되는 공기가 서버를 통과하기 전의 엔탈피 상승량을 의미한다.

Fig. 3. Control volumes for calculation of SHI/RHI for a typical data center rack.
../../Resources/sarek/KJACR.2018.30.12.620/fig3.png

../../Resources/sarek/KJACR.2018.30.12.620/tb1.png

(1)
S H I = [ δ Q Q + δ Q ]

(2)
R H I = [ Q Q + δ Q ]

(3)
Q = j i m i , j r C p [ ( T O U T r ) i , j - ( T r ) i , j ]

(4)
δ Q = j i m i , j r C p [ ( T r ) i , j - T R E F ]

3.1.2 RCI(Rack Cooling Index)

현재 국내외의 대규모 데이터센터는 대부분 class 1 이상의 기준으로 계획되고 있다. RCI는 서버룸의 설계 기준 또는 지침에서 허용하는 온도범위를 기준으로 공조효율을 판단하는 지표이다. Fig. 4는 ASHRAE에서 정의하는 class 1기준으로 IT서버로 공급되는 권장온도범위와 허용온도범위를 보여준다.(13) 권장온도를 초과하는 범위와 미달하는 범위의 비율을 산출하여 RCIHi와 RCILo의 지표를 구할 수 있다. 식(5), 식(6)은 RCI의 연산식을 보여준다. 공조효율과는 별도로 IT장비의 보호측면에서 RCI는 권장온도보다 초과하여 높게 유지되는 것이 보다 큰 위험성을 갖는다. 따라서 RCILo 보다는 RCIHi가 데이터센터의 위험성과 효율성을 평가하는 지표가 된다. Table 1과 같이 RCI의 등급은 91% 이상 유지될 때를 효율성이 있다고 평가한다.

Fig. 4. Definition of total over-temperature and total under-temperature (ASHRAE TC 9.9, 2015).
../../Resources/sarek/KJACR.2018.30.12.620/fig4.png

(5)
R C I H I = [ 1 - ( T x - T M a x - r e c ) T x > T M a x - r e c ( T M a x - a l l o w - T M a x - r e c ) × n ]

(6)
R C I L O = [ 1 - ( T M i n - r e c - T x ) T x < T M i n - r e c ( T M i n - r e c - T M i n - a l l o w ) × n ]

3.1.3 RTI(Return Temperature Index)

IT서버룸의 공조방식은 CRAH/C 유닛에서 토출되는 모든 공기가 IT서버로 유입되고 발열을 제거하고 온도가 상승된 공기를 다시 CRAH/C유닛으로 환기하는 것이다. 그러나 현실은 Fig. 2와 같이 공기의 재순환(re- circulation), 혼합(mixing) 또는 유실(by-pass) 등 공기의 흐름을 방해하는 요소들로 인하여 공조효율이 저하되고 국지적으로 온도가 상승하는 악순환이 발생한다. 개방된 건축공간에서는 RCI는 급기온도의 상승률을 판단할 수 있는데 이는 에너지 페널티에 해당된다. 반면에 RTI는 공조·냉각시스템의 에너지 성능을 측정할 수 있는데, CRAH/C 유닛의 급기와 환기의 온도상승과 IT장비를 통과 하여 발열을 제거한 후의 온도상승의 비율을 평가의 척도로 보고 있으며 연산식은 식(7)과 같다. CRAH/C 유닛으로의 돌아오는 잠재적인 고온의 리턴공기는 IT장비를 통과하여 온도가 상승하였기 때문이며 이러한 현상을 고려하여 RTI의 표준을 설정하여야 한다. Table 1에서와 같이 평가는 100%를 기준으로 이상이면 IT장비의 배기공기가 인입구로 재순환이 90% 이하면 CRAH/C 유닛의 공급공기가 IT장비로 통과하지 못하고 다시 환기되는 공기유실이 발생하는 것으로 판단한다.

(7)
R T I = [ T R A - T S A Δ T E q u i p ]

3.1.4 NP(Negative Pressure Ratio)

CRAC/H 유닛에서 냉각된 공기가 IT서버 발열량을 얼마나 효율적으로 줄일 수 있는지의 판단여부는 냉각된 공기의 공급풍량 및 온도를 기준으로 산출하게 되며, IT서버룸의 에너지성능 평가에 이용되는 공기흐름의 계통은 Fig. 5에 나타내었다. NP는 공조·냉각공기의 취출구 인근, 바닥공조는 이중마루(Raised Floor : R/F) 타일 주변 및 CRAC/H 주변부에서 빠른 공기의 흐름에 의해 발생하는 국부적인 음압을 말한다. 이 음압에 의한 공기의 흐름은 서버실과 이중마루 플래넘 주변에서 서버실의 공기를 이중마루 공간으로 유도하도록 작용되며 CRAC/H 유닛의 공기분배 효율을 감소시킨다. CRAC/H 유닛의 공급량 대비 음압에 의해 발생하는 손실량의 비율은 식(8)과 같다.

Fig. 5. Data center air flow paths-temperature and mass flowrate.
../../Resources/sarek/KJACR.2018.30.12.620/fig5.png

(8)
N P = m n m c = T f - T c T r - T f

3.1.5 BP(By-Pass Ratio)

IT서버룸에 급기되는 공기 중 IT서버로 공급되지 않고 유실되는 공기의 비율을 뜻하는 BP는 식(9)와 같이 나타내며, BP를 통해 서버룸에 공급된 공기가 서버에 얼마나 효율적으로 전달되는지를 판단할 수 있다.

(9)
B P = m b p m f = T h - T r T h - T f

3.1.6 R(Re-circulation Ratio)

R은 서버를 통과한 공기가 CRAC/H 유닛으로 들어가는 풍량과 주변과 혼합되어 재순환되는 공기 양의 비율을 나타낸다. 식(10)에서 IT서버룸 공기의 흐름이 원활하게 이루어지고 있는지 여부와 hot aisle과 cold aisle 측 공기의 혼합으로 발생되는 국부적인 온도정체 현상을 판단할 수 있다.

(10)
R = m r m s = T s - T f T h - T f

3.1.7 BAL(Balance Ratio)

BAL은 발열의 원인인 IT서버와 공조의 주체인 CRAC/H 유닛 사이의 공기순환 비율을 나타낸 지표이다 (식(11) 참조).

(11)
B A L = m c m s = T h - T s T r - T c

3.1.8 CI(Capture index)

온도를 기반으로 산출할 수 있는 위 지표들과 다르게 CI는 공기의 흐름을 기반으로 하는 지표이다. 식(12), 식(13)은 cold aisle의 CI는 토출구를 통해 공급된 CRAC/H의 공급 풍량 중 서버로 인입된 공기의 비율을 나타내며, hot aisle의 CI는 서버로부터 토출된 공기량 중 CRAC/H로 인입된 공기의 비율을 나타낸다.

(12)
C I c o l d - a s i l e = m h m f

(13)
C I h o t - a s i l e = m c m s

3.1.9 EPM(Exergetic Performance Metric)/AMI(Air mixing index)

EPM와 AMI는 데이터센터의 공조·냉각시스템을 에너지단위의 정량적인 분석을 통해 비효율성을 검증하는 방식을 이용한다. 데이터센터의 공조·냉각의 비효율 문제해결 관점에서 두 가지 지표는 데이터센터의 에너지 효율과 열관리를 동시에 평가하기 위해 열역학 제2법칙에 기반한 지표를 제시하였다. EPM은 바닥공조는 이중마루로 구성된 공조공간에서 비가역성 엔트로피를 이르는 말이다. 기류와 온도를 이용하여 에너지효율을 판단하는 데이터센터에서 AMI를 이용하여 엑서지 단위를 기반으로 공기분배 효율의 최적화 여부를 판단할 수 있다. IT서버룸 내 원활한 공기의 흐름은 공조·냉각시스템의 열전달 저항을 최소화 할 수 있으며, 공기의 혼합, 재순환 및 유실 등의 발생은 공조시스템의 전체적인 효율을 저감시키게 된다.

(14)
E P M = Ψ V R Ψ A E

(15)
A M I = R s y s - R n m R s y s

열역학 제2법칙 기반 평가지표는 rack level의 정보를 사용한 구역 에너지와 room level에서만 적용되었다. EMP는 이중바닥 공간을 포함하지 않은 상태에서 엑서지 손실이지만 공기 혼합의 위치에 대해서만 분석하였다. AMI는 위치를 나타낼 수는 없지만 혼합 공기의 구성 요소들만을 나타낸다. 따라서 이 두 가지 지표는 학술적인 의미는 있지만 직접적으로 데이터센터 열관리에 적용하기 위한 기준으로는 보완해야할 부분이 많다.

3.2 데이터센터 공조효율 측정 및 모니터링 방법

3.2.1 공조·냉각시스템 단위구역 설정

에너지 효율성을 위한 IT서버룸의 공조효율 측정 및 모니터링은 에너지절약적인 데이터센터 운영에 중요한 요소이다.

Fig. 6과 같이, IT서버룸 환경 측정 및 모니터링은 hot/cold aisle 구역으로 구분된 하나의 단위구역을 설정하여 효율저하의 문제를 감지하고 해결하는 데 사용할 수 있는 공조·냉각시스템 성능 가시화 map을 제공할 수 있다. 데이터센터 공조 에너지 성능에 대한 합리적인 map을 구현하려면 많은 측정점이 필요하다. 이는 여러 위치와 level에서 데이터센터의 온도, 습도 및 전력과 같은 IT환경 매개변수를 측정하는 세부적인 모니터링 방식이다. 모니터링 목적은 효율지표의 기능을 사용하여 평가의 견고성을 향상시키는 것이다. 이 프로세스는 데이터센터 운영을 정확하게 이해하고 데이터센터에서 공조효율을 관리, 평가하며 실질적인 PUE를 계산하는 데 도움이 된다. 데이터센터의 운영단계에서 앞에서 제시한 공조효율 지표를 연산하기 위해 다음과 같이 측정 level을 구분하여 측정점 설치위치를 제안할 수 있다.

Fig. 6. A unit module of IT server room for environmental monitoring.
../../Resources/sarek/KJACR.2018.30.12.620/fig6.png

3.2.2 IT서버 level(Rack Thermal Node)

IT서버 level 측정점은 랙(rack)의 공기 흡입구와 배기구에 설치된 센서로부터 데이터를 수집하고 온도 및 습도 데이터를 노드로 전송한다. 온도노드가 추가적인 노드가 필요 없이 센서로부터 상대습도 데이터를 수집하는 것이 바람직하고, ±0.5 이하의 정확도가 필요하다. 각 데이터 릴리스 사이의 시간은 5분을 초과하지 않도록 한다. 기본구역 내 설치되는 측정점은 Fig. 7과 같이, 서버랙의 상/중/하부 및 CRAC/H 유닛의 거리별로 최소 36개소가 필요하다.

Fig. 7. IT environmental monitoring points for rack thermal node(rack level).
../../Resources/sarek/KJACR.2018.30.12.620/fig7.png

3.2.3 서버룸 level(SA/RA Thermal Node)

서버룸 level 측정점은 CRAC/H 유닛으로부터 냉각된 공기가 실내로 공급되는 취출구(SA diffuser) 및 서버의 발열을 제거하고 CRAC/H 유닛으로 되돌아가는 환기구(RA grille)에 설치된 센서로부터 데이터를 수집하고 온도 및 습도 데이터를 노드로 전송한다.

서버룸 level 측정은 실질적으로 서버발열 제거에 사용되는 CRAH/C 유닛으로부터 냉각된 공기가 공급되는 이동경로를 통하여 손실 또는 획득되는 요소 및 에너지량을 산출하는 목적을 갖는다. 단위구역내의 설치되는 측정점은 CRAC/H 유닛의 거리별로 최소 바닥취출 디퓨저 3개소 및 천장환기구 3개소(Fig. 8)가 필요하다.

Fig. 8. IT environmental monitoring points for SA/RA thermal node(room level).
../../Resources/sarek/KJACR.2018.30.12.620/fig8.png

3.2.4 CRAH/C level(CRAC/H Thermal Node)

Fig. 9와 같이, 각 CRAC/H 유닛에는 2개의 온․습도 노드가 있으며, 하나는 급기공기(SA)이고 다른 하나는 환기공기(RA)이다. 환기공기에 대해서는 여러 개의 센서(보통 0.9 m×2.4 m 구역 내 설치)를 사용하면 더 정확한 온도 측정값을 얻을 수 있지만 선택 사항이다.

Fig. 9. IT environmental monitoring points for CRAC/H thermal node(equipment level).
../../Resources/sarek/KJACR.2018.30.12.620/fig9.png

4. 결 론

본 연구의 목적은 고밀도 데이터센터에 공조·냉각시스템의 효율 향상과 평가를 위한 합리적인 성능지표를 활용하기 위한 것이다. 데이터센터 성능위주 설계 및 운영관리를 위한 공조·냉각시스템 성능 평가방법 및 모니터링 방법을 중심으로 조사하였다. 연구결과를 요약하면 다음과 같다.

(1) 데이터센터 공조·냉각시스템 효율의 관리대상은 IT장비, CRAH/C 및 공조·냉각을 위한 대상공간이 모두 포함된다. 따라서 평가 대상은 크게 rack level과 room level로 구분한다.

(2) 공조·냉각시스템 효율평가는 IT장비의 발열을 효과적으로 제거하기 위한 공급과 사용된 에너지의 양, IT 운영환경의 적합성을 위한 온도/습도 운영범위가 평가요소가 되며, 세부적인 측정위치는 IT서버를 기준으로 공조공간 CRAH/C까지 확장하여 정의하였다.

(3) 데이터센터의 운영자와 설계자들을 위해 모든 성능평가지표는 각기 다른 형태의 열 환경에 활용 가능한 참고 기준으로 사용될 수 있다. 이들 지표들은 열역학 제1법칙과 제2법에 기반한 방법으로 구분할 수 있다. 열역학 제1법칙에 근거한 지표들은 대부분 단위 rack level을 위한 것과 room level의 공조공기 분포의 단순한 역학관계의 문제를 위해서만 사용되었다.

(4) 열역학 제2법칙 기반 평가지표는 rack level의 정보를 사용한 구역 에너지와 room level에서만 적용되었다. 공조·냉각 프로세스의 일부 공간을 포함하지 않은 상태에서 엑서지 손실과 공기 혼합의 위치에 대해서만 효율을 분석하였기 때문에 학술적인 의미는 있지만 직접적으로 데이터센터 열관리에 적용하기 위한 기준으로는 보완해야할 부분이 많다.

(5) IT 환경 측정요소 및 모니터링 기준은 기본적으로 성능평가지표를 도출할 수 있는 요소이며, IT서버 level, 서버룸 level 그리고 CRAH/C level로 구분하여 측정위치 등을 설정하였다.

(6) 에너지 효율성을 위한 IT서버룸의 공조효율 측정 및 모니터링은 에너지절약적인 데이터센터 운영에 중요한 요소이다. 모니터링은 효율지표의 기능을 사용하여 평가의 견고성을 향상시키고 데이터센터 운영을 정확하게 이해하고 데이터센터에서 공조효율을 관리, 평가하며 실질적인 PUE를 계산하는 데 도움이 된다.

공조·냉각효율 측정 및 모니터링 방법은 데이터센터의 용도, 구성, IT장비의 전력밀도와 건축구조 및 공조방식에 따라 일반화하기 어려운 점이 있다. 그러나 데이터센터 산업은 많은 부문에서 표준화가 되었거나 진행되고 있기 때문에 공통적인 요소를 도출하고 검증한다면 충분히 포괄적으로 활용이 가능하다고 판단된다. 따라서 평가지표의 영향요소를 기준으로 성능을 제시할 수 있는 측정요소를 측정하여 어느 정도 일반화를 확보할 수 있다. 데이터센터 설계단계에서 IT서버룸의 구성에 따른 공조효율을 미리 평가하여 설계에 반영하는 것이 건립 후 운영 중에 투입되는 막대한 에너지 비용을 방지할 수 있는 가장 중요한 선행업무이다. 고밀도 데이터센터의 공조·냉각 에너지를 저감하기 위해 측정과 모니터링 기법을 활용한 IT서버룸의 공조효율에 영향을 주는 운영요소와 각각의 영향도 및 종합적이고 객관적인 성능평가를 통한 성능위주 엔지니어링이 가능할 것으로 사료된다.

후 기

본 논문은 2018년도 산업통상자원부 재원으로 한국에너지기술평가원(KETEP)의 연구비 지원을 받아 수행한 연구과제 결과의 일부임(과제번호 : 20182010600010).

References

1 
Cho J., Lim T., Kim B. S., 2012, Viability of datacenter cooling systems for energy efficiency in temperate or subtropical regions: Case study, Energy and Buildings, Vol. 55, pp. 189-197DOI
2 
Avelar V., Azevedo D., French A., 2012, PUETM : a comprehensive examination of the metric, White paper #49, The Green Grid Technical CommitteeGoogle Search
3 
ASHRAE , 2016, ANSI/ASHRAE Standard 90.4-2016 : Energy Standard for Data Centers, American Society of Heating, Refrigerating and Air-Conditioning Engineers, Inc., Atlanta, GAGoogle Search
4 
Sharma R. K., Bash C. E., Patel C. D., 2002, Dimensionless Parameters for Evaluation of Thermal Design and Performance of Large scale Data Centers, American Institute of Aeronautics and Astronautics(AIAA), pp. 3091-3101DOI
5 
Herrlin M. K., 2005, Rack cooling effectiveness in data centers and telecom central offices : the rack cooling index (RCI), ASHRAE Transactions Vol. 111(Part 2), pp. 725-731Google Search
6 
Herrlin M. K., 2007, Improved data center energy efficiency and thermal performance by advanced airflow analysis, in : Proceedings of Digital Power Forum 2007, pp. 10-12Google Search
7 
Tozer R., Kurkjian C., Salim M., 2009, Air management metrics in data centers, ASHRAE Transactions, Vol. 115, pp. 63-70Google Search
8 
Vangilder J. W., Shrivastava S. K., 2007, Capture index : An airflow-based rack cooling performance metric, ASHRAE Transactions, Vol. 113, pp. 126-136Google Search
9 
Cho J., Yang J., Park W., 2014, Evaluation of air distribution system’s airflow performance for cooling energy savings in high-density data centers, Energy and Buildings, Vol. 68, pp. 270-279DOI
10 
Shah A. J., Carey V. P., Bash C. E., Patel C. D., 2005, Exergy-based optimization strategies for multi-component data center thermal management, in : proceedings of international electronic packaging technical conference and exhibition (IPACK 2005), pp. 205-213Google Search
11 
Fakhim B., Srinarayana N., Behnia M., Armfield S. W., 2002, Exergy-based performance metrics to evaluate irreversibility in data centre environment airspace, in: proceedings of 7th International Conference on Computational Fluid DynamicsGoogle Search
12 
Qian X., Zhen L., Li Z., 2015, Entransy and energy analyses of airflow organization in data centers, International Journal of Heat and Mass Transfer, Vol. 81, pp. 252-259DOI
13 
ASHRAE TC 9.9 , 2015, Thermal Guideline for Data Processing Environments, American Society of Heating, Refrigerating and Air-Conditioning Engineers, Inc., Atlanta, GAGoogle Search